CN103403798B - 声音识别装置及导航装置 - Google Patents

声音识别装置及导航装置 Download PDF

Info

Publication number
CN103403798B
CN103403798B CN201180068906.1A CN201180068906A CN103403798B CN 103403798 B CN103403798 B CN 103403798B CN 201180068906 A CN201180068906 A CN 201180068906A CN 103403798 B CN103403798 B CN 103403798B
Authority
CN
China
Prior art keywords
voice recognition
sound
vehicle
control portion
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201180068906.1A
Other languages
English (en)
Other versions
CN103403798A (zh
Inventor
丸田裕三
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN103403798A publication Critical patent/CN103403798A/zh
Application granted granted Critical
Publication of CN103403798B publication Critical patent/CN103403798B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Navigation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

一种声音识别装置包括:车辆状态检测部(7),该车辆状态检测部(7)对搭载声音识别装置(100)的车辆的车辆状态进行检测;识别参数设定部(10),该识别参数设定部(10)对声响数据匹配部(5)识别被输入到麦克风(1)中的声音时的识别参数进行设定,其中,所述声响数据匹配部(5)将经过音响分析部(3)转换后的音响特征量与保存在识别词典保存部(4)中的识别词典进行对照,从而对输入到麦克风(1)中的声音进行识别;以及控制部(9),该控制部(9)在由车辆状态检测部(7)所检测出的车辆状态满足规定条件时,指示识别参数设定部(10)来改变识别参数。

Description

声音识别装置及导航装置
技术领域
本发明涉及一种根据使用环境来进行声音识别的声音识别装置以及搭载有该装置的导航装置。
背景技术
以往提出有根据声音识别装置的使用环境来对用于声音识别的阈值等进行调整的技术。例如,在专利文献1中提出了如下的声音识别装置:将车辆的当前车速与基准值相比较,来判断周围是处于安静环境下还是处于噪声环境下,并基于该判断结果来改变用于在安静环境下及噪声环境下对声音的区间进行检测的阈值(检测水平),将噪声环境下的阈值设定得比安静环境下的阈值要大,由此解决了对音频声音的残差分量的水平变动或微小的声音等反应敏感而导致声音区间的误检测的问题。
现有技术文献
专利文献
专利文献1:日本专利特开2002-41073号公报
发明内容
发明所要解决的技术问题
然而,在上述专利文献1中,仅基于说话人的声音以及噪声的信息来设定用于对声音的区间进行检测的阈值,因此存在如下问题:阈值的设定未必适用于声音识别装置的使用环境,从而无法得到正确的识别结果。
本发明为了解决上述问题而完成,其目的在于,得到一种将表示说话人的声音及噪声以外的声音识别装置的使用环境的信息也考虑在内、以对用于声音识别的阈值进行调整的声音识别装置。
解决技术问题所采用的技术方案
本发明所涉及的声音识别装置包括:车辆状态检测部,该车辆状态检测部对搭载该声音识别装置的车辆的车辆状态进行检测;音频输出检测部,该音频输出检测部对从音频装置输出的声音信号的音量进行检测,所述音频装置设置在搭载有声音识别装置的车辆内;增益设定部,该增益设定部对集音部的声音获取增益进行设定;识别参数设定部,该识别参数设定部对声响对照部识别被输入到集音部中的声音时的识别参数进行设定,其中,所述声响对照部将经过声响分析部转换后的声响特征量与保存在识别词典保存部中的识别词典进行对照,从而对输入到集音部中的声音进行识别;以及控制部,该控制部在由车辆状态检测部所检测出的车辆状态以及由所述音频输出检测部所检测出的声音信号的音量满足规定条件时,指示识别参数设定部来改变识别参数。
发明效果
根据本发明,能够根据用户的驾驶状况来设定用于声音识别的阈值,从而能够提高声音识别性能。
附图说明
图1是表示实施方式1所涉及的声音识别装置的结构的框图。
图2是表示实施方式1所涉及的声音识别装置的参数表的一个示例的图。
图3是表示实施方式1所涉及的声音识别装置的动作的流程图。
图4是表示实施方式1所涉及的声音识别装置的数据获取处理以及识别参数设定处理的说明图。
图5是表示实施方式2所涉及的声音识别装置的结构的框图。
图6是表示实施方式2所涉及的声音识别装置的动作的流程图。
图7是表示实施方式3所涉及的声音识别装置的结构的框图。
图8是表示实施方式3所涉及的声音识别装置的动作的流程图。
图9是表示使用了实施方式3所涉及的声音识别装置的导航装置的结构的框图。
实施方式
下面,为了对本发明进行更加详细的说明,参照附图对本发明的实施方式进行说明。
实施方式1
图1是表示本发明的实施方式1所涉及的声音识别装置的结构的框图。
实施方式1的声音识别装置100包括:麦克风1、声音处理部2、声响分析部3、识别词典保存部4、声响数据匹配部5、增益设定部6、车辆状态检测部7、识别参数保存部8、控制部9、以及识别参数设定部10。
麦克风1获取所输入的声音。声音处理部2将利用麦克风1所获取的模拟信号的声音转换成数字信号。声响分析部3对经声音处理部2转换成数字信号的声音信号进行分析,并将声响特征转换成以时间序列表示的声响特征数据。识别词典保存部4保存有将识别词汇与声响特征数据相对应的识别词典。声响数据匹配部5将声响特征数据与识别词典相对照,从而输出最确切的声音识别结果。增益设定部6对输入到麦克风1中的音量进行调整。车辆状态检测部7与车辆网络(未图示)相连,获取车辆的车速或方向盘旋转角度等车辆信息。另外,车辆状态检测部7包括保存所获取到的车辆信息的存储部7a。识别参数保存部8保存有参数表,该参数表对识别参数的种类和值进行定义。此外,在后面对参数表进行详细叙述。
控制部9参照由车辆状态检测部7所获取到的车辆信息,来判断车辆处于正常运行状态还是异常运行状态。这里,正常运行状态是指车速稳定、未进行紧急的方向盘操作等的状态。具体而言,是指以固定的速度在高速公路上行驶的情况等。另一方面,异常运行状态是指频繁地对车辆进行加减速, 或者大幅度地旋转方向盘的情况等。具体而言,是指车辆进入路口、左转或右转的情况等。控制部9保存有对车辆信息、例如车速或方向盘旋转角度的阈值进行设定的判断表,基于由车辆状态检测部7所获取到的车辆信息是否在阈值以上来判断车辆处于正常运行状态还是异常运行状态。另外,控制部9参照保存在识别参数保存部8中的参数表来获取与车辆的运行状态相对应的参数值。
识别参数设定部10将由控制部9所获取到的参数值设定到声响数据匹配部5中。作为所设定的识别参数,例如对用于检测说话声音开始的声音功率阈值、或用于检测说话结束的无声时间(超时时间)等进行设定。
下面,对识别参数进行详细的说明。
识别参数是为了提高声音识别的识别精度而设定或更改的数值或数值的组合。作为识别参数设定部10对声响数据匹配部5所设定的识别参数,例如有用于检测说话声音开始的声音功率阈值、或用于检测说话结束的无声时间(超时时间)、在声音识别处理过程中应保持的最大单词数、通过语言模型和声响模型来对各得分的平衡进行调整的加权数等。
图2是表示实施方式1所涉及的声音识别装置的参数表的一个示例的图。
参数表中,对于上述声音功率检测阈值、超时时间以及麦克风增益值等各识别参数,保存有车辆处于正常运行状态时所设定的值、以及车辆处于异常运行状态时所设定的值。
在使用图2的参数表的情况下,例如在控制部9中判断为车辆处于正常运行状态的情况下,将声音功率检测阈值设定为40dB,在判断为车辆处于异常运行状态的情况下,将声音功率检测阈值设定为60dB。另外,在车辆处于正常运行状态的情况下,将超时时间设定为3秒这一较短的值,在车辆处于异常运行状态的情况下,将超时时间设定为8秒等较长的值。此外,可以适当地对图2所示的识别参数的种类以及各参数值进行改变。
接下来,参照图3及图4,对声音识别装置100的动作进行说明。图3是表示实施方式1所涉及的声音识别装置的动作的流程图,图4是表示车辆信息的获取以及超时时间的说明图。此外,在图3的流程图中,示出了以下结构:即,对作为车辆信息而获取到的车速的时间变化进行分析,在判断为突然起动或突然加速较多的情况下,判断为用户正专注于驾驶,将向麦克风1输入声音的超时时间设定得较长。
车辆状态检测部7利用车内网络持续获得车辆的车速,并将所获取到的车速信息存储到存储部7a中(步骤ST1)。图4中的A表示在步骤ST1中获取车辆的车速。
另一方面,控制部9经由操作输入部(未图示)等来判断用户是否输入了声音识别开始指示(步骤ST2)。在未输入声音识别开始指示的情况下(步骤ST2:否),返回到步骤ST1的处理。另一方面,在输入了声音识别开始指示的情况下(步骤ST2:是),控制部9从存储在车辆状态检测部7的存储部7a中的车速信息中获取规定时间内的车速信息,并判断所获取到的车速信息的变化是否在阈值以上(步骤ST3)。这里,利用图4对由控制部9所获取到的规定时间内的车辆信息进行说明。图4中,地点O是输入声音识别开始指示的地点,期间B是从地点O倒退规定时间(例如5秒)后的期间,获取该期间B的车速信息,用于判断车速信息的变化是否在阈值以上。
在车速的变化在阈值以上时(步骤ST3:是),判断为车辆处于突然起动、突然停止、或突然加速的异常运行状态,参照参数表来获取处于异常运行状态时的超时时间的参数值,并通知识别参数设定部10(步骤ST4)。识别参数设定部10将步骤ST4中通知到的处于异常运行状态下的参数值设定为声响数据匹配部5的超时时间(步骤ST5)。步骤ST5的超时时间是图4中的C,预测用户正专注于驾驶操作、到发声之前需要一定的时间,并将超时时间设定为较长的8秒。
在车速的变化小于阈值的情况下(步骤ST3:否),控制部9进一步获取存储在车辆状态检测部7的存储部7a中的车速信息,并判断车速的变化小于阈值的状态是否持续了规定时间以上(步骤ST6)。在步骤ST6中,在对车速的变化小于阈值的状态持续了规定时间以上的判断中,使用图4的期间D的车速信息。在车速的变化小于阈值的状态未持续规定时间以上时(步骤ST6:否),判断为车辆还未恢复到正常运行状态,并前进至步骤ST4。
另一方面,在车速的变化小于阈值的状态持续了规定时间以上时(步骤ST6:是),判断为车辆恢复到正常运行状态,控制部9参照参数表来获取处于正常运行状态时的超时时间的参数值,并通知识别参数设定部10(步骤ST7)。识别参数设定部10将步骤ST7中所通知的处于正常运行状态下的参数值设定为声响数据匹配部5的超时时间(步骤ST8)。步骤ST8的超时时间是图4中的期间E,预测用户将在短时间内发声,并将超时时间设定为较短的3秒。
接下来,麦克风1获取由用户发出的命令所指定的声音(步骤ST9)。声音处理部2将在步骤ST9中所获取到的声音进行数字化(步骤ST10),声响分析部3对在步骤ST10中经数字化后的声音信号进行分析,并将该声音信号转换成声响特征数据(步骤ST11)。声响数据匹配部5使用在步骤ST5或步骤ST8中所设定的参数值,并将在步骤ST11中经转换后的声响特征数据与识别词典进行对照,来计算出最确切的识别结果,作为声音识别结果来输出(步骤ST12),由此结束处理。
此外,在图3的流程图中示出了对声响数据匹配部5设定超时时间的结构,但也可以采用以下结构:即,在上述结构的基础上,使识别参数设定部10输出停止信号,以指示声音处理部2在所设定的超时时间内停止获取模拟信号,从而停止获取声音信号。由此,能够减小声音识别装置100的功耗。
如上所述,根据本实施方式1,采用包括识别参数保存部8以及控制部9的结构,因此,能根据用户的运行状况来改变超时时间,即使在用户正专注于驾驶操作而要一定时间后才会说话的情况下,也能够不超时地进行声音识别处理,其中,所述参数保存部8保存有根据车辆处于正常运行状态还是异常运行状态而设定有不同的设定值的参数表,所述控制部9在车速的时间变化在阈值以上时,判断为车辆处于异常运行状态,从参数表中获取异常运行状态下的声音识别的超时时间,并通过识别参数设定部10对声响数据匹配部5进行设定。
另外,根据该实施方式1,由于具有以下结构:即,在车速的变化小于阈值的状态持续了规定时间以上时,控制部9判断为车辆处于正常运行状态,并设定处于正常运行状态下的超时时间,因此,能够将在将声音识别的超时时间设定得较长时所可能产生的噪声的误检测以及误识别抑制到最小程度,从而能抑制识别性能变差。
此外,可以对上述实施方式1中示出的期间B至期间D的时间作适当改变。另外,以各期间的开始地点作为输入了声音识别开始指示的地点O进行了说明,但是也可以对该各个期间的开始地点作适当改变。
实施方式2
如今,一般在车辆内设置声音装置,在收听音频(音乐)的同时进行驾驶动作。由此,在播放音频的情况下,用户根据说话之前的音频的输出音量来改变说话声音的大小。例如,在音频的输出音量较大时,用户倾向于用更大的声音来说话。因此,在该实施方式2中,将示出以下结构:即,即使在音频的输出音量较大、用户用比通常更大的声音来说话的情况下,也能维持声音识别性能。
图5是表示本发明的实施方式2所涉及的声音识别装置的结构的框图。
图5中,包括音频输出检测部11,以替代图1所示的车辆状态检测部7。此外,在下面对与实施方式1所涉及的声音识别装置的结构要素相同或相当的部分标注与在实施方式1中使用的标号相同的标号,并省略或简化说明。
音频输出检测部11检测出来自设置在车内的音频装置(未图示)的音频的输出音量,并作为音量信息输出至控制部9。此外,作为从音频中获取音量信息的结构,可以直接从所连接的音频装置中获取音量值等信息,也可以利用不同于麦克风1的麦克风(未图示)来收集在车内所播放的音频,并计算出音量信息。另外,音频输出检测部11包括保存所获取到的音量信息的存储部11a。
控制部9参照由音频输出检测部11所检测到的音量信息,来判断车辆处于正常运行状态还是异常运行状态。该实施方式2中的正常运行状态是指音频的输出音量小于阈值、且不影响用户的说话音量的状态。另一方面,异常运行状态是指音频的输出音量在阈值以上、且影响到用户的说话音量的状态。控制部9具有对音频的输出音量的阈值进行了设定的判断表,基于由音频输出检测部11所检测到的音量信息是否在阈值以上来判断车辆处于正常运行状态还是异常运行状态。另外,控制部9参照保存在识别参数保存部8中的参数表,来获取与车辆的运行状态相对应的参数值。增益设定部6将由控制部9所获取到的参数值设定到麦克风1中。作为所设定的识别参数,例如可以是麦克风1的麦克风增益值等。
以上述实施方式1中示出的图2的参数表为例,对麦克风增益值进行说明。在判断为车辆处于正常运行状态(在音频的输出音量小于阈值时)的情况下,将麦克风增益设定为10dB,在车辆处于异常运行状态的情况下(在音频的输出音量在阈值以上时),根据刚要输入声音识别开始指示前的音频的输出音量,将麦克风增益设定为较小的值。具体而言,在先前的音频的输出音量为60dBA的情况下,将麦克风增益值设定为5dB。另外,在先前的音频 的输出音量为更大的100dBA的情况下,能够判断用户的说话声会进一步变大,因此,将麦克风增益值设定为3dB。
接下来,参照图6所示的流程图对实施方式2所涉及的声音识别装置的动作进行说明。此外,对与实施方式1所涉及的声音识别装置相同的步骤标注与在图3中所使用的标号相同的标号,并省略或简化说明。
另外,在图6的流程图中,示出了以下结构:即,在检测出音频的输出音量、并且该输出音量较大时,判断用户会用较大的声音来说话,从而减小设定于增益设定部6的麦克风增益值。
另外,在用户输入声音识别开始指示之前或输入之后,为了排除音频的输出声音的影响以维持声音识别性能,一般使音频进行静音(中止),但也可以例如利用噪声消除等已知技术来进行声音识别,而不将音频设定成静音。此外,在图6的流程图中,以将音频设定成静音的情况为例进行说明。这基于以下倾向:无论是否将音频设定成静音,在先前的音频输出音量较大的情况下,用户都会用更大的声音来说话。
音频输出检测部11对车内的音频的输出音量进行检测,将所检测出的输出音量信息存储到存储部11a中(步骤ST21)。另一方面,控制部9判断是否输入了声音识别开始指示以及静音的设定指示(步骤ST22)。在未输入声音识别开始指示以及静音的设定指示的情况下(步骤ST22:否),返回到步骤ST21的处理。另一方面,在输入了声音识别开始指示以及静音设定指示的情况下(步骤ST22:是),控制部9在存储于音频输出检测部11的存储部11a中的输出音量中、判断出刚要输入声音识别开始指示之前的输出音量是否在阈值以上(步骤ST23)。
在刚要输入声音识别开始指示之前的输出音量在阈值以上的情况下(步骤ST23:是),判断为车辆处于异常运行状态,参照参数表来获取与刚要输入静音设定指示之前的输出音量相对应的麦克风增益值,并通知增益设定部6 (步骤ST24)。增益设定部6将步骤ST24中通知的处于异常运行状态下的参数值设定为麦克风1的麦克风增益(例如5dB)(步骤ST25)。
在刚要输入声音识别开始指示之前的输出音量小于阈值的情况下(步骤ST23:否),进一步判断输出音量小于阈值的状态是否持续了规定时间以上(步骤ST26)。在输出音量小于阈值的状态未持续规定时间以上时(步骤ST26:否),判断为用户有可能仍然在受音频的输出音量影响的状态下说话,并前进至步骤ST24的处理。
另一方面,在输出音量小于阈值的状态持续了规定时间以上时(步骤ST26:是),判断为用户在未受到音频的输出音量影响的状态下说话,控制部9参照参数表来获取处于正常运行状态下的麦克风增益值,并通知增益设定部6(步骤ST27)。增益设定部6将步骤ST27中通知的处于正常运行状态下的参数值设定为麦克风1的麦克风增益(例如10dB)(步骤ST28)。之后的处理与实施方式1中示出的步骤ST9至步骤ST12的处理相同。
此外,在上述步骤ST26中判断输出音量小于阈值的状态是否持续了规定时间以上时的判断时间是例如在实施方式1的图4中所示出的期间D、即从输入了声音识别开始指示的地点O倒退规定期间后的期间。此外,从地点O倒退的时间可以作适当改变。
如上所述,根据本实施方式2,采用包括识别参数保存部8以及控制部9的结构,因此,即使当用户在受到音频的输出音量影响的状态下说话时,也能够将增益保持为恰当的值,从而能够抑制识别性能的下降,其中,所述参数保存部8保存有根据车辆处于正常运行状态还是处于异常运行状态来设定不同的设定值的参数表,所述控制部9在音频的输出音量在阈值以上时判断为车辆处于异常运行状态,从参数表中获取异常运行状态下的麦克风增益值,并通过增益设定部6对麦克风1的麦克风增益进行设定。
此外,在上述实施方式2中,示出了基于音频的输出音量来设定麦克风增益的结构,但也可以采用以下结构:即,对从音频装置中输出的音频进行频率分析,基于具有接近于人声的频率的输出信号的输出强度来设定麦克风增益值。由此,只要对影响用户说话且具有接近于人声的频率的音频信号的信号强度进行确认即可,从而能高效地抑制识别性能的下降。
此外,在上述实施方式2中,示出了在输入声音识别开始指示的前后、将音频设定成静音的结构的示例,但在不设定成静音的情况下,也可以通过如下结构来进行声音识别处理。例如,在车辆的驾驶座附近以及副驾驶座附近设置两个集音单元(未图示)。由于音频在车内均匀地播放,因此,音频将输入到两个集音单元中。另一方面,驾驶员的说话声仅输入至驾驶座附近的集音单元。因此,将输入至两个集音单元中的声音进行差分后得到的声音作为驾驶员的说话声,以用于声音识别处理中。此外,也可以利用不同的方法来区别音频与用户的说话声音。
实施方式3
上述实施方式1及实施方式2中,示出了根据车辆状态或音频的输出音量来设定识别参数的值的结构,在本实施方式3中,示出了根据车辆状态来停止声音识别处理的结构。
图7是表示实施方式3所涉及的声音识别装置的结构的框图。图7中,包括声音识别停止处理部12,以替代图1中所示的识别参数设定部10。此外,在下面对与实施方式1所涉及的声音识别装置的结构要素相同或相当的部分标注与在实施方式1中所使用的标号相同的标号,并省略或简化说明。
车辆状态检测部7除了检测出实施方式1中示出的车速以外,还检测出方向盘的旋转角度、方向盘的旋转速度、转向灯的开启/关闭状态、以及根据使用了GPS信号的当前位置信息而得到的车辆的前进方向和进入路口等的车辆状态。此外,使用了GPS信号的当前位置信息可以在车辆状态检测部7内计算得出,也可以从外部获取得到。控制部9基于车辆状态检测部7的检测 结果,判断是否处于用户应专心驾驶的情况,在判断为处于应专心驾驶的情况时,输出停止声音识别的指示。声音识别停止处理部12基于从控制部9所输入的停止声音识别的指示,对声音处理部2、声响分析部3以及声响数据匹配部5输出停止信号,从而停止与声音识别相关的处理。此外,还通过外部扬声器(未图示)或外部显示器(未图示)来发出表示停止进行声音识别的意思的声音输出或显示输出。
接下来,参照图8的流程图对实施方式3所涉及的声音识别装置100的动作进行说明。此外,在图8的流程图中,示出以下情况的示例:即,将方向盘的旋转角度作为车辆信息来进行检测,并且在该方向盘的旋转角度较大的情况下,判断用户应当专心于方向盘操作,从而停止声音识别处理。
车辆状态检测部7利用车内网络持续地获得车辆的方向盘旋转角度,并将所获取到的旋转角度信息存储到存储器部7a中(步骤ST31)。
另一方面,控制部9判断是否输入了声音识别开始指示(步骤ST32)。在未输入声音识别开始指示的情况下(步骤ST32:否),返回到步骤ST31的处理。另一方面,在输入了声音识别开始指示的情况下(步骤ST32:是),控制部9判断在存储于车辆状态检测部7的存储部7a中的方向盘旋转角度中、输入了声音识别开始指示的时刻的方向盘旋转角度是否在阈值以上(步骤ST33)。
在方向盘旋转角度在阈值以上的情况下(步骤ST33:是),控制部9判断为车辆正行驶于弯道等、从而应当专心于方向盘操作,并对声音识别停止处理部12输出停止声音识别的指示(步骤ST34)。声音识别停止处理部12根据在步骤ST34中输入的停止指示,对声音处理部2、声响分析部3以及声响数据匹配部5输出停止信号,从而停止与声音识别相关的处理,并且从外部的扬声器(未图示)输出例如“现在无法使用声音识别。请专心驾驶。”这样的应答消息,或者将该应答消息显示于显示器(未图示)(步骤ST35)。
在方向盘旋转角度小于阈值的情况下(步骤ST33:否),控制部9进一步获取存储在车辆状态检测部7的存储部7a中的方向盘旋转角度,并判断方向盘旋转角度小于阈值的状态是否持续了规定时间以上(步骤ST36)。在方向盘旋转角度小于阈值的车辆状态未持续规定时间以上时(步骤ST36:否),判断为还未脱离应专心于方向盘操作的状态,并前进至步骤ST34的处理。另一方面,在方向盘旋转角度小于阈值的车辆状态持续了规定时间以上时(步骤ST36:是),判断为已脱离应专心于方向盘操作的状态,并前进至步骤ST9的处理。步骤ST9之后的处理与实施方式1相同。
此外,在上述步骤ST34以及ST35中示出了停止与声音识别相关的处理、并输出应答消息的结构,但也可以采用以下结构:即,控制部9使声音识别开始指示的操作输入的接收动作无效,并进一步将表示无效的意思通知到声音识别停止处理部12,声音识别停止处理部12显示警告、或发出警报声。
另外,在上述步骤ST36中判断为方向盘旋转角度小于阈值的车辆状态是否持续了规定时间以上时的时间是例如实施方式1的图4中所示出的期间D,即从输入了声音识别开始指示的地点O倒退规定期间后的期间。此外,从地点O倒退的时间可以作适当改变。
另外,在上述图8的流程图中示出了以下结构:即,作为车辆信息对方向盘的旋转角度进行检测,在旋转角度较大的情况下,判断为车辆的前进方向有较大的变化,从而停止与声音识别相关的处理,但也可以基于方向盘的旋转角度以外的各种车辆信息来对声音识别处理的实施或停止进行控制。
具体而言,可以将方向盘的旋转速度作为车辆信息来进行检测,在从输入声音识别开始指示起倒退规定期间后的期间的旋转速度的平均速度比阈值大时,判断为车辆的前进方向有较大的变化,从而停止与声音识别相关的处理。另外,根据转向灯的开启/关闭状态也同样能够掌握车辆的前进方向的变化。基于转向灯有无点亮动作或转向灯动作声等,来对转向灯的开启/关闭状 态进行检测。另外,在使用GPS信号来获取车辆的前进方向、并且过去的一定期间的前进方向与当前的前进方向之间的差值在一定值以上时,判断为车辆的前进方向有较大的变化,从而停止与声音识别相关的处理。
另外,也可以利用已知的白线检测法,根据在车道变更等时所产生的、道路上的白线的延伸方向与车辆的前进方向之间的差异,来掌握车辆的前进方向的变化,或者利用进入已知的路口的检测方法来判断车辆进入路口,从而掌握车辆的前进方向的变化。此外,还可以参照地图信息等来判断进入路口。地图信息可以存储在设置于声音识别装置100内的存储区域(未图示),也可以从外部装置获取。另外,也可以将上述的方向盘的旋转角度、方向盘的旋转速度、转向灯的开启/关闭状态、车辆的前进方向的变化以及车辆进入路口的信号进行组合,来使控制部9对车辆的前进方向的变化进行判断。
如上所述,根据本实施方式3,包括:控制部9,该控制部9基于由车辆状态检测部7检测出的车辆状态,来判断是否处于用户应当专心驾驶的状况,并输出停止声音识别的指示;以及声音识别停止处理部12,该声音识别停止处理部12基于从控制部9所输出的停止声音识别的指示来输出停止信号,因此,能根据用户的驾驶状况来停止声音识别处理。由此,能够进行确保用户安全驾驶的声音识别处理。
此外,在上述实施方式3中示出了根据车辆状态来停止声音识别的开始的结构,但也可以采用以下结构:即,即使在麦克风1、声音处理部2、声响分析部3以及声响数据匹配部5中正在进行声音识别处理,也能够基于车辆状态来停止声音识别处理。
此外,在上述实施方式3中,示出了车辆状态检测部7获取车辆状态的结构,但也可以对车辆状态检测部7设置视频分析单元(未图示),从而使该视频分析单元对由设置于外部的摄像头等所获取到的视频进行分析,计算 出经分析后的视频的变化率,当视频的变化率在阈值以上的情况下,判断为车辆的前进方向会发生较大的变化。另外,也可以采用以下结构:即,在所分析的视频中出现了特定的标识(特定的图像)时,判断为车辆会有较大的变化。
另外,如图9所示,也可以构成搭载有声音识别装置100的导航装置200。此外,图9中,示出了使用具有实施方式3所示结构的声音识别装置100的框图,但也可以使用实施方式1及实施方式2中示出的声音识别装置100来构成导航装置200。
导航装置200包括声音识别装置100,并且还包括:位置信息获取部21,该位置信息获取部21获取本车的当前位置,以起到导航功能;地图数据存储部22,该地图数据存储部22存储地图数据;路径引导部23,该路径引导部23使用当前位置及地图数据来进行路径搜索,以生成路径引导信息;以及输出部24,该输出部24显示所生成的路径引导信息,或者利用声音将该路径引导信息提示给用户。
在用户对目的地或经由地进行声音输入的情况下,声音识别装置100使麦克风1获取该声音输入以作为说话声,并通过上述实施方式1至实施方式3中示出的任意一个声音识别处理来进行声音识别,并将声音识别结果输出至路径引导部23。路径引导部23基于所输入的声音识别结果,进一步利用从位置信息获取部21所输入的本车位置信息以及存储在地图数据存储部22中的地图数据来进行路径搜索,并从输出部24输出路径引导信息。
另外,也可以采用以下结构:即,在将声音识别装置100搭载到导航装置200的情况下,从位置信息获取部21中获取当前位置信息,并对车辆的前进方向、进入路口等的车辆状态进行检测。同样地,也可以采用以下结构:即,参照存储在地图数据存储部22中的地图数据,判断本车进入路口。
由此,通过将声音识别装置100搭载到导航装置上,从而能够利用由与车辆的运行状态相适应的声音识别处理而得到的声音识别结果,来进行路径 引导,从而能够提供一种帮助用户安全驾驶的导航装置。另外,还能够利用识别性能较高的识别结果来进行路径搜索。
此外,本申请发明可以在该发明的范围内对各实施方式进行自由组合,或对各实施方式的任意构成要素进行变形,或在各实施方式中省略任意的构成要素。
工业上的实用性
本发明所涉及的声音识别装置能够用于提高移动体内的声音识别处理的识别精度,并且还能用于帮助用户安全驾驶。
标号说明
1麦克风
2声音处理部
3声响分析部
4识别词典保存部
5声响数据匹配部
6增益设定部
7车辆状态检测部
8识别参数保存部
9控制部
10识别参数设定部
11音频输出检测部
12声音识别停止处理部
7a,11a存储部
21位置信息获取部
22地图数据存储部
23路径引导部
24输出部
100声音识别装置
200导航装置

Claims (17)

1.一种声音识别装置,包括:
集音部,该集音部获取所输入的声音;
声音处理部,该声音处理部对由所述集音部获取到的声音进行数字信号处理;
声响分析部,该声响分析部对经所述声音处理部处理后的声音信号进行声响分析,并将声响特征转换成以时间序列表示的声响特征量;
识别词典,该识别词典记载有经所述声响分析部转换后的声响特征量与识别词汇之间的对应关系;以及
声响对照部,该声响对照部将所述声响特征量与所述识别词典进行对照,以识别出输入至所述集音部中的声音,
所述声音识别装置的特征在于,包括:
车辆状态检测部,该车辆状态检测部对搭载所述声音识别装置的车辆的车辆状态进行检测;
音频输出检测部,该音频输出检测部对从音频装置输出的声音信号的音量进行检测,所述音频装置设置在搭载有所述声音识别装置的车辆内;
增益设定部,该增益设定部对所述集音部的声音获取增益进行设定;
识别参数设定部,该识别参数设定部对所述声响对照部识别被输入至所述集音部中的声音时的识别参数进行设定;以及
控制部,该控制部在由所述车辆状态检测部所检测出的车辆状态或由所述音频输出检测部所检测出的声音信号的音量从接收到指示开始声音识别处理的操作输入的时刻起持续了倒退规定时间的期间而满足规定条件的情况下,指示所述识别参数设定部来改变识别参数。
2.一种声音识别装置,包括:
集音部,该集音部获取所输入的声音;
声音处理部,该声音处理部对由所述集音部获取到的声音进行数字信号处理;
声响分析部,该声响分析部对经所述声音处理部处理后的声音信号进行声响分析,并将声响特征转换成以时间序列表示的声响特征量;
识别词典,该识别词典记载有经所述声响分析部转换后的声响特征量与识别词汇之间的对应关系;以及
声响对照部,该声响对照部将所述声响特征量与所述识别词典进行对照,以识别出输入至所述集音部中的声音,
所述声音识别装置的特征在于,包括:
车辆状态检测部,该车辆状态检测部对搭载所述声音识别装置的车辆的车辆状态进行检测;
音频输出检测部,该音频输出检测部对从音频装置输出的声音信号的音量进行检测,所述音频装置设置在搭载有所述声音识别装置的车辆内;
增益设定部,该增益设定部对所述集音部的声音获取增益进行设定;
识别参数设定部,该识别参数设定部对由所述声响对照部识别输入至所述集音部中的声音时的识别参数进行设定;
声音识别停止处理部,该声音识别停止处理部在收到停止声音识别处理的指示时,使所述声音处理部、所述声响分析部以及所述声响对照部之中的至少一个的声音识别处理停止;以及
控制部,该控制部在由所述车辆状态检测部所检测出的车辆状态或由所述音频输出检测部所检测出的声音信号的音量从接收到指示开始声音识别处理的操作输入的时刻起持续了倒退规定时间的期间而满足规定条件的情况下,指示所述识别参数设定部来改变识别参数,或者指示所述声音识别停止处理部来停止声音识别处理。
3.如权利要求1或2所述的声音识别装置,其特征在于,
在车速的变化小于阈值、且从接收到所述操作输入的时刻起倒退规定时间的期间所述车速的变化持续小于阈值的情况下,所述控制部将所述识别参数恢复至规定值。
4.如权利要求2所述声音识别装置,其特征在于,
所述控制部在所述车辆状态不满足规定的条件、且从接收到声音识别开始处理的操作输入的时刻起倒退规定时间的期间持续地不满足所述规定条件的情况下,解除停止所述声音识别处理的指示。
5.如权利要求3所述声音识别装置,其特征在于,
在所述声音信号的音量小于阈值、且从接收到所述操作输入的时刻起倒退规定时间的期间所述声音信号的音量持续小于阈值的情况下,所述控制部使所述声音获取增益恢复成规定值。
6.如权利要求1或2所述的声音识别装置,其特征在于,
所述车辆状态检测部检测所述车辆的车速,
若所述控制部接收到指示声音识别处理开始的操作输入,则在从接收到该操作输入的时刻起倒退规定时间的期间所述车辆状态检测部所检测出的车速的变化在阈值以上的情况下,指示所述识别参数设定部来改变识别参数。
7.如权利要求1或2所述的声音识别装置,其特征在于,
所述控制部在车速的变化在阈值以上的情况下,将所述识别参数之中的、检测声音输入结束的超时时间设定成比规定值要长的值。
8.如权利要求1或2所述的声音识别装置,其特征在于,
在所述音频输出检测部所检测出的声音信号的音量在阈值以上的情况下,所述控制部对所述增益设定部发出指示,以将声音获取增益设定成比规定值要小的值。
9.如权利要求1或2所述的声音识别装置,其特征在于,
若所述控制部接收到指示声音识别处理开始的操作输入,则判断刚要接收该操作输入之前的声音信号的音量是否在阈值以上。
10.如权利要求2所述声音识别装置,其特征在于,
所述车辆状态检测部检测所述车辆的方向盘的旋转角度或旋转速度,
在由所述车辆状态检测部所获取到的方向盘的旋转角度或旋转速度在阈值以上的情况下,所述控制部指示停止声音识别处理。
11.如权利要求2所述声音识别装置,其特征在于,
所述车辆状态检测部获取所述车辆的转向灯的点亮信息,
在所述转向灯点亮的情况下,所述控制部指示停止声音识别处理。
12.如权利要求2所述声音识别装置,其特征在于,
所述车辆状态检测部获取所述车辆的前进方向信息,
所述控制部参照由所述车辆状态检测部所获取到的前进方向信息,在过去的车辆的前进方向与当前的车辆的前进方向之间的差异在阈值以上的情况下,指示停止声音识别处理。
13.如权利要求2所述声音识别装置,其特征在于,
所述车辆状态检测部获取所述车辆的前进方向信息以及道路上的白线信息,
所述控制部参照由所述车辆状态检测部所获取到的前进方向信息以及白线信息,在车辆的前进方向与白线的延伸方向之间的差异在阈值以上的情况下,指示停止声音识别处理。
14.如权利要求2所述声音识别装置,其特征在于,
所述控制部参照地图信息以及所述车辆的当前位置信息,在所述车辆正在进入路口的情况下,指示停止声音识别处理。
15.如权利要求2所述声音识别装置,其特征在于,
所述控制部在对所述声音识别停止处理部指示停止声音识别处理的情况下,使指示声音识别开始的操作输入的接收动作无效。
16.如权利要求15所述声音识别装置,其特征在于,
所述声音识别停止处理部通过显示或声音来通知所述控制部使指示声音识别开始的操作输入的接收动作无效的意思。
17.一种导航装置,其特征在于,
所述导航装置搭载有如权利要求1或2所述的声音识别装置,并且还包括:
位置信息获取部,该位置信息获取部获取所述车辆的当前位置;
地图数据存储部,该地图数据存储部存储地图数据;
路径引导部,该路径引导部基于在所述声音识别装置中经声音识别处理后的声音输入信息,并使用保存在所述地图数据存储部中的地图数据以及由所述位置信息获取部所获取到的所述车辆的当前位置,来引导所述车辆的路径;以及
输出部,该输出部对所述路径引导部的路径引导进行显示或声音输出。
CN201180068906.1A 2011-04-08 2011-04-08 声音识别装置及导航装置 Expired - Fee Related CN103403798B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/002103 WO2012137263A1 (ja) 2011-04-08 2011-04-08 音声認識装置およびナビゲーション装置

Publications (2)

Publication Number Publication Date
CN103403798A CN103403798A (zh) 2013-11-20
CN103403798B true CN103403798B (zh) 2016-09-28

Family

ID=46968705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180068906.1A Expired - Fee Related CN103403798B (zh) 2011-04-08 2011-04-08 声音识别装置及导航装置

Country Status (5)

Country Link
US (1) US9230538B2 (zh)
JP (1) JP5709980B2 (zh)
CN (1) CN103403798B (zh)
DE (1) DE112011105136B4 (zh)
WO (1) WO2012137263A1 (zh)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9886794B2 (en) 2012-06-05 2018-02-06 Apple Inc. Problem reporting in maps
US9230556B2 (en) 2012-06-05 2016-01-05 Apple Inc. Voice instructions during navigation
US8965696B2 (en) 2012-06-05 2015-02-24 Apple Inc. Providing navigation instructions while operating navigation application in background
US9997069B2 (en) 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US9482296B2 (en) 2012-06-05 2016-11-01 Apple Inc. Rendering road signs during navigation
US20130321400A1 (en) 2012-06-05 2013-12-05 Apple Inc. 3D Map Views for 3D Maps
US9418672B2 (en) 2012-06-05 2016-08-16 Apple Inc. Navigation application with adaptive instruction text
CN103871401B (zh) * 2012-12-10 2016-12-28 联想(北京)有限公司 一种语音识别的方法及电子设备
JP2015018146A (ja) * 2013-07-12 2015-01-29 株式会社Nttドコモ 機能管理システム及び機能管理方法
CN104345649B (zh) * 2013-08-09 2017-08-04 晨星半导体股份有限公司 应用于声控装置的控制器与相关方法
US9469247B2 (en) * 2013-11-21 2016-10-18 Harman International Industries, Incorporated Using external sounds to alert vehicle occupants of external events and mask in-car conversations
DE102013021861A1 (de) * 2013-12-20 2015-06-25 GM Global Technology Operations LLC (n. d. Ges. d. Staates Delaware) Verfahren zum Betrieb eines Kraftfahrzeuges mit einer Spracheingabevorrichtung, Kraftfahrzeug
KR101621778B1 (ko) 2014-01-24 2016-05-17 숭실대학교산학협력단 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기
KR101621774B1 (ko) 2014-01-24 2016-05-19 숭실대학교산학협력단 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기
US9916844B2 (en) 2014-01-28 2018-03-13 Foundation Of Soongsil University-Industry Cooperation Method for determining alcohol consumption, and recording medium and terminal for carrying out same
JP6427755B2 (ja) * 2014-02-24 2018-11-28 パナソニックIpマネジメント株式会社 データ入力装置、データ入力方法、プログラム及び車載機
KR101621797B1 (ko) 2014-03-28 2016-05-17 숭실대학교산학협력단 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치
KR101569343B1 (ko) * 2014-03-28 2015-11-30 숭실대학교산학협력단 차신호 고주파 신호의 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치
KR101621780B1 (ko) 2014-03-28 2016-05-17 숭실대학교산학협력단 차신호 주파수 프레임 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치
US9826135B2 (en) * 2014-03-31 2017-11-21 Sony Corporation Information processing method, control device, recording device, information processing system and program
JP2015215433A (ja) * 2014-05-09 2015-12-03 株式会社ナビタイムジャパン 情報提供システム、端末装置、情報提供サーバ、情報提供方法、および、プログラム
DE102014009689A1 (de) * 2014-06-30 2015-12-31 Airbus Operations Gmbh Intelligentes Soundsystem/-modul zur Kabinenkommunikation
JP6011584B2 (ja) * 2014-07-08 2016-10-19 トヨタ自動車株式会社 音声認識装置及び音声認識システム
CN106486127A (zh) * 2015-08-25 2017-03-08 中兴通讯股份有限公司 一种语音识别参数自动调整的方法、装置及移动终端
KR102444061B1 (ko) * 2015-11-02 2022-09-16 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
DE102016204315A1 (de) 2016-03-16 2017-09-21 Bayerische Motoren Werke Aktiengesellschaft Fortbewegungsmittel, System und Verfahren zur Anpassung einer Länge einer erlaubten Sprechpause im Rahmen einer Spracheingabe
CN109479172B (zh) * 2016-04-21 2021-06-29 惠普发展公司,有限责任合伙企业 电子设备麦克风监听模式
JP6725933B2 (ja) * 2016-05-14 2020-07-22 株式会社ユピテル システム及びプログラム
FR3056813B1 (fr) * 2016-09-29 2019-11-08 Dolphin Integration Circuit audio et procede de detection d'activite
CN106525070B (zh) * 2016-10-31 2019-07-19 成都路行通信息技术有限公司 一种汽车运动状态的检测方法和系统
US10580405B1 (en) * 2016-12-27 2020-03-03 Amazon Technologies, Inc. Voice control of remote device
US10276161B2 (en) * 2016-12-27 2019-04-30 Google Llc Contextual hotwords
KR102350306B1 (ko) * 2017-04-18 2022-01-13 엘지전자 주식회사 차량 내 음성 제어 방법
DE102017207038A1 (de) * 2017-04-26 2018-10-31 Bayerische Motoren Werke Aktiengesellschaft Spracheingabe bei einem Kraftfahrzeug
CN108364663A (zh) * 2018-01-02 2018-08-03 山东浪潮商用系统有限公司 一种自动录制人声的方法及模块
JP6753637B2 (ja) * 2018-02-06 2020-09-09 三菱電機株式会社 車両用音制御装置及び車両用音制御方法
TWI672690B (zh) * 2018-03-21 2019-09-21 塞席爾商元鼎音訊股份有限公司 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置
US10490207B1 (en) * 2018-05-11 2019-11-26 GM Global Technology Operations LLC Automated speech recognition using a dynamically adjustable listening timeout
US10468026B1 (en) * 2018-08-17 2019-11-05 Century Interactive Company, LLC Dynamic protection of personal information in audio recordings
JP2020085953A (ja) * 2018-11-16 2020-06-04 トヨタ自動車株式会社 音声認識支援装置及び音声認識支援プログラム
JP2020170101A (ja) * 2019-04-04 2020-10-15 日本電信電話株式会社 音量調整装置、その方法、およびプログラム
CN110217242A (zh) * 2019-04-25 2019-09-10 深圳航天科创智能科技有限公司 一种汽车导航语音识别方法及系统
CN110415710B (zh) * 2019-08-06 2022-05-31 大众问问(北京)信息科技有限公司 车载语音交互系统的参数调整方法、装置、设备及介质
CN112542164B (zh) * 2019-09-19 2024-01-26 中车时代电动汽车股份有限公司 一种车辆方向盘的语音控制方法、装置、设备及存储介质
CN111081243A (zh) * 2019-12-20 2020-04-28 大众问问(北京)信息科技有限公司 一种反馈方式调整方法、装置及设备
CN111580775B (zh) * 2020-04-28 2024-03-05 北京小米松果电子有限公司 信息控制方法及装置、存储介质
US20220028381A1 (en) * 2020-07-27 2022-01-27 Samsung Electronics Co., Ltd. Electronic device and operation method thereof
KR20220013799A (ko) * 2020-07-27 2022-02-04 삼성전자주식회사 전자 장치 및 전자 장치의 동작 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201611572U (zh) * 2009-09-29 2010-10-20 北京爱国者存储科技有限责任公司 一种带有自动增益功能的录音笔

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3119510B2 (ja) 1991-10-28 2000-12-25 株式会社リコー 音声認識装置
JPH08297497A (ja) * 1995-04-27 1996-11-12 Fujitsu Ten Ltd 車両用音声処理装置
JPH09329458A (ja) * 1996-06-12 1997-12-22 Toyota Central Res & Dev Lab Inc 車載用情報音読装置
US6744882B1 (en) 1996-07-23 2004-06-01 Qualcomm Inc. Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
US6259892B1 (en) * 1997-09-19 2001-07-10 Richard J. Helferich Pager transceiver and methods for performing action on information at desired times
JPH11342808A (ja) * 1998-06-04 1999-12-14 Toyota Motor Corp 音声入力機能付きの車両用方向指示器
KR100742140B1 (ko) * 1999-03-30 2007-07-24 퀄컴 인코포레이티드 이동전화 스피커와 마이크로폰 이득을 자동으로 조정하는방법 및 장치
US6434527B1 (en) * 1999-05-17 2002-08-13 Microsoft Corporation Signalling and controlling the status of an automatic speech recognition system for use in handsfree conversational dialogue
JP4400951B2 (ja) * 1999-05-27 2010-01-20 富士通テン株式会社 車載用音声認識装置、及び車載用音声認識制御方法
JP4002030B2 (ja) * 1999-06-11 2007-10-31 富士通テン株式会社 車載用情報提供装置及び音声認識装置
JP2002041073A (ja) 2000-07-31 2002-02-08 Alpine Electronics Inc 音声認識装置
JP3925056B2 (ja) * 2000-08-11 2007-06-06 三菱自動車工業株式会社 車両用音声操作装置
JP4259054B2 (ja) 2002-07-10 2009-04-30 株式会社エクォス・リサーチ 車載装置
JP2004198832A (ja) 2002-12-19 2004-07-15 Nissan Motor Co Ltd 音声認識装置
JP4497834B2 (ja) * 2003-04-28 2010-07-07 パイオニア株式会社 音声認識装置及び音声認識方法並びに音声認識用プログラム及び情報記録媒体
JP4026543B2 (ja) 2003-05-26 2007-12-26 日産自動車株式会社 車両用情報提供方法および車両用情報提供装置
US6889189B2 (en) * 2003-09-26 2005-05-03 Matsushita Electric Industrial Co., Ltd. Speech recognizer performance in car and home applications utilizing novel multiple microphone configurations
JP4429691B2 (ja) * 2003-11-07 2010-03-10 クラリオン株式会社 車載用音響装置、車載用音響装置の制御方法、車載用音響装置の制御プログラム、及び記録媒体
DE102005014447B4 (de) * 2004-03-31 2011-04-28 Honda Motor Co., Ltd. Simulationsvorrichtung
JP4469645B2 (ja) 2004-03-31 2010-05-26 本田技研工業株式会社 二輪車シミュレーション装置
JP4469644B2 (ja) 2004-03-31 2010-05-26 本田技研工業株式会社 自転車シミュレーション装置
JP2006195302A (ja) * 2005-01-17 2006-07-27 Honda Motor Co Ltd 音声認識システム及びこの音声認識システムを備える車両
JP4804052B2 (ja) * 2005-07-08 2011-10-26 アルパイン株式会社 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
CN101326571B (zh) * 2005-12-07 2012-05-23 三菱电机株式会社 声音识别装置
DE112006002989T5 (de) 2005-12-14 2009-02-19 Mitsubishi Electric Corp. Spracherkennungsvorrichtung
JP2008064885A (ja) * 2006-09-05 2008-03-21 Honda Motor Co Ltd 音声認識装置、音声認識方法、及び音声認識プログラム
JP4471128B2 (ja) * 2006-11-22 2010-06-02 セイコーエプソン株式会社 半導体集積回路装置、電子機器
US8140325B2 (en) 2007-01-04 2012-03-20 International Business Machines Corporation Systems and methods for intelligent control of microphones for speech recognition applications
JP4854630B2 (ja) * 2007-09-13 2012-01-18 富士通株式会社 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム
JP4466718B2 (ja) * 2007-11-01 2010-05-26 トヨタ自動車株式会社 走行軌跡生成方法及び走行軌跡生成装置
US9302630B2 (en) * 2007-11-13 2016-04-05 Tk Holdings Inc. System and method for receiving audible input in a vehicle
JP5916054B2 (ja) * 2011-06-22 2016-05-11 クラリオン株式会社 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム
JP5831308B2 (ja) * 2012-03-13 2015-12-09 アイシン・エィ・ダブリュ株式会社 移動体位置検出システム、移動体位置検出装置、移動体位置検出方法及びコンピュータプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201611572U (zh) * 2009-09-29 2010-10-20 北京爱国者存储科技有限责任公司 一种带有自动增益功能的录音笔

Also Published As

Publication number Publication date
CN103403798A (zh) 2013-11-20
JPWO2012137263A1 (ja) 2014-07-28
US20130253933A1 (en) 2013-09-26
US9230538B2 (en) 2016-01-05
WO2012137263A1 (ja) 2012-10-11
DE112011105136B4 (de) 2018-12-13
DE112011105136T5 (de) 2014-02-06
JP5709980B2 (ja) 2015-04-30

Similar Documents

Publication Publication Date Title
CN103403798B (zh) 声音识别装置及导航装置
US20180204572A1 (en) Dialog device and dialog method
KR20180130672A (ko) 상황 기반 대화 개시 장치, 시스템, 차량 및 방법
CN101689366B (zh) 声音识别装置
WO2015061712A1 (en) Systems and methods for collecting and transmitting telematics data from a mobile device
JP6173477B2 (ja) ナビゲーション用サーバ、ナビゲーションシステムおよびナビゲーション方法
JP4357867B2 (ja) 音声認識装置、音声認識方法、並びに、音声認識プログラムおよびそれを記録した記録媒体
JP6612707B2 (ja) 情報提供装置
US9311930B2 (en) Audio based system and method for in-vehicle context classification
CN112397065A (zh) 语音交互方法、装置、计算机可读存储介质及电子设备
CN109102801A (zh) 语音识别方法和语音识别装置
CN106931989A (zh) 一种智能调节导航音量的方法及其导航装置
JP6677126B2 (ja) 車両用対話制御装置
JP2000118260A (ja) 車両用乗員対話装置
JP5029433B2 (ja) 車両用飲酒運転防止装置
KR101619257B1 (ko) 운전자 감성 제어 장치 및 그 방법
JP7039872B2 (ja) 車両の走行記録装置及び閲覧装置
JP3384165B2 (ja) 音声認識装置
US11580958B2 (en) Method and device for recognizing speech in vehicle
JP2009098217A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識方法、音声認識プログラム、および記録媒体
Sathyanarayana et al. Leveraging speech-active regions towards active safety in vehicles
JP2004272048A (ja) 運転者状態判定装置、および運転者状態判定装置用プログラム
JP2010039073A (ja) 音声認識装置
JP2008026464A (ja) 車両用音声認識装置
CN117542028A (zh) 驾驶行为的检测方法、装置、车辆及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160928

CF01 Termination of patent right due to non-payment of annual fee