CN110033773B - 用于车辆的语音识别方法、装置、系统、设备以及车辆 - Google Patents

用于车辆的语音识别方法、装置、系统、设备以及车辆 Download PDF

Info

Publication number
CN110033773B
CN110033773B CN201811527235.0A CN201811527235A CN110033773B CN 110033773 B CN110033773 B CN 110033773B CN 201811527235 A CN201811527235 A CN 201811527235A CN 110033773 B CN110033773 B CN 110033773B
Authority
CN
China
Prior art keywords
voice
equipment
user
voice information
awakening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811527235.0A
Other languages
English (en)
Other versions
CN110033773A (zh
Inventor
陈颖瑞
李天舒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIO Holding Co Ltd
Original Assignee
NIO Anhui Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIO Anhui Holding Co Ltd filed Critical NIO Anhui Holding Co Ltd
Priority to CN201811527235.0A priority Critical patent/CN110033773B/zh
Publication of CN110033773A publication Critical patent/CN110033773A/zh
Application granted granted Critical
Publication of CN110033773B publication Critical patent/CN110033773B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information

Abstract

本发明属于车辆技术领域,具体提供了一种用于车辆的语音识别方法、装置、系统、设备以及车辆,旨在解决现有技术无法在有其他用户语音干扰的情况下准确识别出交互人语音的问题。为此目的,本发明提供的用于车辆的语音识别方法包括检测车辆内唤醒智能语音设备用户的位置信息;增大位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;通过调整收音增益值后的定向收音设备获取唤醒智能语音设备用户的输入语音信息并且根据所获取的语音信息进行语音识别。基于上述步骤,本发明提供的方法具有降低非唤醒智能语音设备用户语音对唤醒智能语音设备用户语音的干扰,提高在复杂环境下语音识别准确率的有益效果。

Description

用于车辆的语音识别方法、装置、系统、设备以及车辆
技术领域
本发明属于车辆技术领域,具体涉及一种用于车辆的语音识别方法、装置、系统、设备以及车辆。
背景技术
随着车辆技术的发展,车辆已经成为人们生活中必不可少的一部分,车内场景也成为人们生活中的一个重要场所。随着人们对车辆的要求越来越高,人们不只是希望能够安全驾驶,在保证安全驾驶的前提下,人们同样希望拥有良好的驾驶体验。语音交互技术作为一种方便快捷的技术手段,能够很好地提高行车安全,在汽车上得到了广泛的应用。
用户可以通过语音与智能语音设备进行交互,控制智能语音设备执行相应的操作,但是在与智能语音设备进行交互时,车内可能同时有其他人在进行交谈,谈话的内容可能被录入,从而导致交互被干扰的尴尬场景。现有的语音交互方法大都关注单人在车内进行语音交互的场景,对于多人在车内交谈导致交互被干扰的场景则没有对应的解决方案。因此,如何提出一种准确识别交互人的语音并且消除其他用户的干扰语音的解决方案是本领域技术人员目前需要解决的问题。
发明内容
为了解决现有技术中的上述问题,即为了解决现有技术无法在有其他用户语音干扰的情况下准确识别出交互人语音的问题,本发明提供了一种用于车辆的语音识别方法,所述车辆包括多个定向收音设备,所述语音识别方法包括:
检测所述车辆内唤醒智能语音设备用户的位置信息;
增大所述位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;
通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。
可选的,在所述用于车辆的语音识别方法中,“检测所述车辆内唤醒智能语音设备用户的位置信息”的步骤包括:
判断是否检测到预设的智能语音设备的唤醒语音信息,
若检测到所述唤醒语音信息,则启动所述车辆内预设的声源定位装置并且根据所述唤醒语音信息检测唤醒智能语音设备用户的位置信息。
可选的,在所述用于车辆的语音识别方法中,“通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息”的步骤包括:
判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息,
若检测到所述非唤醒智能语音设备用户输入的语音信息,则根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿,以便消除所述非唤醒智能语音设备用户输入的语音信息。
可选的,在所述用于车辆的语音识别方法中,“判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息”的步骤包括:
获取唤醒语音信息对应的第一声纹信息;
判断每个所述定向收音设备是否采集到与所述第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。
可选的,在所述用于车辆的语音识别方法中,“根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿”的步骤包括:
根据所述非唤醒智能语音设备用户的声纹信息识别每个所述定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;
在每个所述定向收音设备采集到的语音信息上叠加与所述非唤醒智能语音设备用户输入的语音信息对应的反向声波。
可选的,在所述用于车辆的语音识别方法中,“通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别”的步骤包括:
根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;
将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;
其中,所述音频相位偏移是根据预设的用户位置与每个所述定向收音设备之间的距离预先获取的。
可选的,在所述用于车辆的语音识别方法中,“将进行相位补偿后的语音信息进行叠加”的步骤包括:
根据下式所示的方法将进行相位补偿后的语音信息进行叠加:
Figure BDA0001904763230000031
其中,其中,所述Mi表示当所述位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,所述αi是所述第i个定向收音设备的收音增益值;
所述Δpii是第i个用户位置与所述第i个定向收音设备之间的音频相位偏移,所述Δpji是所述第i个定向收音设备与第j个用户位置之间的音频相位偏移,所述n是所述车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;
当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。
本发明的第二方面还提供了一种用于车辆的语音识别系统,所述车辆包括多个定向收音设备,所述语音识别系统包括:
位置检测模块,配置为检测所述车辆内唤醒智能语音设备用户的位置信息;
增益调整模块,配置为增大所述位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;
语音识别模块,配置为通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。
可选的,在所述用于车辆的语音识别系统中,所述位置检测模块进一步配置为执行如下操作:
判断是否检测到预设的智能语音设备的唤醒语音信息,
若检测到所述唤醒语音信息,则启动所述车辆内预设的声源定位装置并且根据所述唤醒语音信息检测唤醒智能语音设备用户的位置信息。
可选的,在所述用于车辆的语音识别系统中,所述增益调整模块还包括用户检测单元和干扰补偿单元,
所述用户检测单元配置为判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息,
所述干扰补偿单元配置为若检测到所述非唤醒智能语音设备用户输入的语音信息,则根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿,以便消除所述非唤醒智能语音设备用户输入的语音信息。
可选的,在所述用于车辆的语音识别系统中,所述用户检测单元进一步配置为执行如下操作:
获取唤醒语音信息对应的第一声纹信息;
判断每个所述定向收音设备是否采集到与所述第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。
可选的,在所述用于车辆的语音识别系统中,所述干扰补偿单元进一步配置为执行如下操作:
根据所述非唤醒智能语音设备用户的声纹信息识别每个所述定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;
在每个所述定向收音设备采集到的语音信息上叠加与所述非唤醒智能语音设备用户输入的语音信息对应的反向声波。
可选的,在所述用于车辆的语音识别系统中,所述语音识别模块进一步配置为执行如下操作:
根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;
将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;
其中,所述音频相位偏移是根据预设的用户位置与每个所述定向收音设备之间的距离预先获取的。
可选的,在所述用于车辆的语音识别系统中,所述干扰补偿模块还配置为执行以下操作:
根据下式所示的方法将补偿后的语音信息进行叠加:
Figure BDA0001904763230000051
其中,所述Mi表示当所述位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,所述αi是所述第i个定向收音设备的收音增益值;
所述Δpii是第i个用户位置与所述第i个定向收音设备之间的音频相位偏移,所述Δpji是所述第i个定向收音设备与第j个用户位置之间的音频相位偏移,所述n是所述车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;
当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。
本发明的第三方面还提供了一种智能语音设备,所述智能语音设备包括上述所述的用于车辆的语音识别系统。
本发明的第四方面还提供了一种车辆,所述车辆包括上述所述的智能语音设备。
本发明的第五方面还提供了一种存储装置,其中存储有多条程序,所述程序适于由处理器加载以执行上述所述的用于车辆的语音识别方法。
本发明的第六方面还提供了一种控制装置,包括处理器和存储设备;所述存储设备,适于存储多条程序;所述程序适于由所述处理器加载以执行上述所述的用于车辆的语音识别方法。
与最接近的现有技术相比,上述技术方案至少具有如下有益效果:
1、本发明提供的用于车辆的语音识别方法主要包括以下步骤:检测车辆内唤醒智能语音设备用户的位置信息;增大位置信息对应的定向收音设备的收音增益并且减小其他定向收音设备的收音增益值;根据调整收音增益值后的定向收音设备获取唤醒智能语音设备用户的输入语音信息并且根据所获取的语音信息进行语音识别。基于上述步骤,本发明提供的用于车辆的语音识别方法可以通过增大唤醒智能语音设备用户对应的定向收音设备的收音增益值来提高该定向收音设备采集唤醒智能语音设备用户输入语音的敏感度,并且减小其他定向收音设备的收音增益值,减小非唤醒智能语音设备用户的语音输入,降低非唤醒智能语音设备用户语音对唤醒智能语音设备用户语音的干扰,提高语音识别的效果。
2、本发明提供的用于车辆的语音识别方法还可以对每个定向收音设备采集到的非唤醒智能语音设备用户的语音信息进行音频干扰补偿和相位补偿,以便消除非唤醒智能语音设备用户输入的语音信息。基于上述步骤,本发明提供的用于车辆的语音识别方法可以综合每个定向收音设备采集到的唤醒智能语音设备用户的语音信息,并且消除非唤醒智能语音设备用户输入的语音信息,提高了在复杂环境下对唤醒智能语音设备用户的语音识别准确率。
方案1、一种用于车辆的语音识别方法,其特征在于,所述车辆包括多个定向收音设备,所述语音识别方法包括:
检测所述车辆内唤醒智能语音设备用户的位置信息;
增大所述位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;
通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。
方案2、根据方案1所述的用于车辆的语音识别方法,其特征在于,“检测所述车辆内唤醒智能语音设备用户的位置信息”的步骤包括:
判断是否检测到预设的智能语音设备的唤醒语音信息,
若检测到所述唤醒语音信息,则启动所述车辆内预设的声源定位装置并且根据所述唤醒语音信息检测唤醒智能语音设备用户的位置信息。
方案3、根据方案1所述的用于车辆的语音识别方法,其特征在于,“通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息”的步骤包括:
判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息,
若检测到所述非唤醒智能语音设备用户输入的语音信息,则根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿,以便消除所述非唤醒智能语音设备用户输入的语音信息。
方案4、根据方案3所述的用于车辆的语音识别方法,其特征在于,“判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息”的步骤包括:
获取唤醒语音信息对应的第一声纹信息;
判断每个所述定向收音设备是否采集到与所述第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。
方案5、根据方案3所述的用于车辆的语音识别方法,其特征在于,“根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿”的步骤包括:
根据所述非唤醒智能语音设备用户的声纹信息识别每个所述定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;
在每个所述定向收音设备采集到的语音信息上叠加与所述非唤醒智能语音设备用户输入的语音信息对应的反向声波。
方案6、根据方案1所述的用于车辆的语音识别方法,其特征在于,“通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别”的步骤包括:
根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;
将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;
其中,所述音频相位偏移是根据预设的用户位置与每个所述定向收音设备之间的距离预先获取的。
方案7、根据方案6所述的用于车辆的语音识别方法,其特征在于,“将进行相位补偿后的语音信息进行叠加”的步骤包括:
根据下式所示的方法将进行相位补偿后的语音信息进行叠加:
Figure BDA0001904763230000081
其中,所述Mi表示当所述位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,所述αi是所述第i个定向收音设备的收音增益值;
所述Δpii是第i个用户位置与所述第i个定向收音设备之间的音频相位偏移,所述Δpji是所述第i个定向收音设备与第j个用户位置之间的音频相位偏移,所述n是所述车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;
当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。
方案8、一种用于车辆的语音识别系统,其特征在于,所述车辆包括多个定向收音设备,所述语音识别系统包括:
位置检测模块,配置为检测所述车辆内唤醒智能语音设备用户的位置信息;
增益调整模块,配置为增大所述位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;
语音识别模块,配置为通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。
方案9、根据方案8所述的用于车辆的语音识别系统,其特征在于,所述位置检测模块进一步配置为执行如下操作:
判断是否检测到预设的智能语音设备的唤醒语音信息,
若检测到所述唤醒语音信息,则启动所述车辆内预设的声源定位装置并且根据所述唤醒语音信息检测唤醒智能语音设备用户的位置信息。
方案10、根据方案8所述的用于车辆的语音识别系统,其特征在于,所述增益调整模块还包括用户检测单元和干扰补偿单元,
所述用户检测单元配置为判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息,
所述干扰补偿单元配置为若检测到所述非唤醒智能语音设备用户输入的语音信息,则根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿,以便消除所述非唤醒智能语音设备用户输入的语音信息。
方案11、根据方案10所述的用于车辆的语音识别系统,其特征在于,所述用户检测单元进一步配置为执行如下操作:
获取唤醒语音信息对应的第一声纹信息;
判断每个所述定向收音设备是否采集到与所述第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。
方案12、根据方案10所述的用于车辆的语音识别系统,其特征在于,所述干扰补偿单元进一步配置为执行如下操作:
根据所述非唤醒智能语音设备用户的声纹信息识别每个所述定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;
在每个所述定向收音设备采集到的语音信息上叠加与所述非唤醒智能语音设备用户输入的语音信息对应的反向声波。
方案13、根据方案8所述的用于车辆的语音识别系统,其特征在于,所述语音识别模块进一步配置为执行如下操作:
根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;
将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;
其中,所述音频相位偏移是根据预设的用户位置与每个所述定向收音设备之间的距离预先获取的。
方案14、根据方案13所述的用于车辆的语音识别系统,其特征在于,所述语音识别模块还配置为执行如下操作:
根据下式所示的方法将进行相位补偿后的语音信息进行叠加:
Figure BDA0001904763230000101
其中,所述Mi表示当所述位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,所述αi是所述第i个定向收音设备的收音增益值;
所述Δpii是第i个用户位置与所述第i个定向收音设备之间的音频相位偏移,所述Δpji是所述第i个定向收音设备与第j个用户位置之间的音频相位偏移,所述n是所述车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;
当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。
方案15、一种智能语音设备,其特征在于,所述智能语音设备包括方案8至14中任一项所述的用于车辆的语音识别系统。
方案16、一种车辆,其特征在于,所述车辆包括方案15所述的智能语音设备。
方案17、一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载以执行方案1至7中任一项所述的用于车辆的语音识别方法。
方案18、一种控制装置,包括处理器和存储设备;所述存储设备,适于存储多条程序;其特征在于,所述程序适于由所述处理器加载以执行方案1至7中任一项所述的用于车辆的语音识别方法。
附图说明
图1为本发明一种实施例的用于车辆的语音识别方法的主要步骤示意图;
图2为本发明一种实施例的将相位补偿后的语音信息进行叠加的示意框图;
图3为本发明一种实施例的用于车辆的语音识别系统的主要结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
参阅附图1,图1示例性地示出了本实施例中用于车辆的语音识别方法的主要步骤。如图1所示,本实施例中用于车辆的语音识别方法包括下述步骤:
步骤S101:检测车辆内唤醒智能语音设备用户的位置信息。
在本实施例中,智能语音设备可以搭载能够实现特定功能的操控系统,在某些情况下,可能直接指代该操控系统的控制器。智能语音设备可以获取车辆内用户的语音信息,需要说明的是,本发明的保护范围不局限于这一具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员应该清楚的是,智能语音设备可以是车载娱乐显示系统,还可以是车载中控系统以及车载计算机系统等,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
在实际应用中,语音交互作为一种方便快捷的技术,可以很好地提高行车安全,用户可以直接通过语音控制车辆的某些功能。为了避免用户在行车过程中误触发语音交互,可以在智能语音设备中预设唤醒关键词,当智能语音设备接收到包含唤醒关键词的唤醒语音信息时才与用户进行语音交互。当智能语音设备被用户唤醒后,智能语音设备可以启动在车辆内预设的声源定位装置并且根据唤醒语音信息检测唤醒智能语音设备用户的位置信息,判断唤醒智能语音设备用户在车内的具体位置。其中,声源定位装置可以采用多种声源定位算法,声源定位算法可以包括但不限于基于时延估计的算法、基于高分辨率谱估计的算法以及基于稀疏表示的算法等等。
步骤S102:增大唤醒智能语音设备用户的位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值。
得到唤醒智能语音设备用户的位置信息后,为了能够更好地获取唤醒智能语音设备用户输入的语音信息,可以增大唤醒智能语音设备用户的位置信息对应的定向收音设备的收音增益值来提高该定向收音设备采集唤醒智能语音设备用户输入语音的敏感度。
其中,收音增益值能够体现定向收音设备的灵敏度,例如,提高收音增益值能够在用户输入的语音音量较低,或者录音距离较远时,也能够得到符合要求的语音信息。为了描述简洁,将“唤醒智能语音设备用户的位置信息对应的定向收音设备”简称为“目标定向收音设备”,将车辆内目标定向收音设备以外的定向收音设备简称为“非目标定向收音设备”。具体地,用户进行语音交互时往往是面向前方的,可以设定用户面向行车方向对应的定向收音设备为目标定向收音设备,定向收音设备是获取在一定空间范围内语音信息的声音获取设备,定向收音设备的位置可以取决于车辆中座椅的位置,定向收音设备的数量也可以根据实际需要进行调整,在本发明实施例中,定向收音设备可以为麦克风阵列。
在实际应用中,唤醒智能语音设备用户在进行语音交互时,除了目标定向收音设备会获取唤醒智能语音设备用户的语音信息外,非目标定向收音设备也会获取其语音信息,为了提高语音识别效果,可以减小非目标定向收音设备的收音增益值。
步骤S103:判断是否检测到车辆内非唤醒智能语音设备用户输入的语音信息,若检测到非唤醒智能语音设备用户输入的语音信息,则执行步骤S104;若没有到非唤醒智能语音设备用户输入的语音信息,则执行步骤S105。
在实际应用中,车辆内往往存在多个用户,唤醒智能语音设备用户在进行语音交互时,其他用户也可能同时在进行交谈,而定向收音设备也会采集非唤醒智能语音设备用户的语音信息,非唤醒智能语音设备用户的语音信息有可能会对唤醒智能语音设备用户的语音交互造成干扰。此外,如何区分具体是哪个用户输入的语音信息,对后续排除非唤醒智能语音设备用户的语音信息对唤醒智能语音设备用户的语音信息的干扰十分重要。
具体地,“判断是否检测到车辆内非唤醒智能语音设备用户输入的语音信息”的步骤可以包括:
获取唤醒语音信息对应的第一声纹信息;
判断每个定向收音设备是否采集到与第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。
每个用户的语音信息均有对应的声纹信息,根据唤醒智能语音设备用户输入的唤醒语音信息可以获取其对应的声纹信息,通过判断每个定向收音设备是否采集到与第一声纹信息不同的声纹信息,可以判定车辆内是否存在非唤醒智能语音设备用户,若采集到,则说明存在非唤醒智能语音设备用户。
步骤S104:根据非唤醒智能语音设备用户输入的语音信息对每个定向收音设备采集到的语音信息进行音频干扰补偿。
每个定向收音设备均会采集到车辆内每个用户的语音信息,因此需要排除非唤醒智能语音设备用户的语音信息对唤醒智能语音设备用户的语音信息的干扰。例如,在实际应用中,唤醒智能语音设备用户与智能语音设备进行交互时,语音信息内容为“打开空调”,与此同时,非唤醒智能语音设备用户的语音信息内容为“播放音乐”,为了提高语音识别的准确率,可以对每个定向收音设备采集到的语音信息进行音频干扰补偿,其具体步骤可以包括:
根据非唤醒智能语音设备用户的声纹信息识别每个定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;
在每个定向收音设备采集到的语音信息上叠加与非唤醒智能语音设备用户输入的语音信息对应的反向声波。
具体地,以车内用户数量为4人、用户分别为A、B、C、D、唤醒智能语音设备用户为A、定向收音设备的数量为1个为例进行说明。定向收音设备能够采集到4位用户的语音信息,分别获取用户B、C、D的声纹信息,根据用户B、C、D的声纹信息,识别出定向收音设备采集到的语音信息中,具体哪条语音信息是用户B的,哪条语音信息是用户C的,以及哪条语音信息是用户D的,得到每个非唤醒智能语音设备用户对应的语音信息后,叠加与该语音信息对应的反向声波,消除非唤醒智能语音设备用户对应的语音信息。因此,当非唤醒智能语音设备用户的语音信息内容为“播放音乐”时,可以通过对定向收音设备采集到的语音信息进行音频干扰补偿,消除其对唤醒智能语音设备用户的语音信息的干扰。
步骤S105:通过调整收音增益值后的定向收音设备获取唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。
具体地,“通过调整收音增益值后的定向收音设备获取唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别”的步骤可以包括:
根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;
将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;
其中,音频相位偏移是根据预设的用户位置与每个定向收音设备之间的距离预先获取的。
由于在车内不同位置说话,语音到达不同定向收音设备的时间不同,同一个用户的语音在不同定向收音设备上产生的语音波形不同,目标定向收音设备采集到的语音信息与非目标定向收音设备采集到的语音信息之间存在音频相位偏移。目标定向收音设备和非目标定向收音设备均能够获取唤醒智能语音设备用户的语音信息,为了充分利用每个定向收音设备获取的唤醒智能语音设备用户的语音信息,可以根据音频相位偏移对相应的定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿,从而消除信号延时。
将每个定向收音设备采集到语音信息对应的波形进行相位补偿后,将语音信息进行叠加并且根据叠加结果进行语音识别,可以提高语音识别的效果。具体地,可以根据如公式(1)所示的方法将补偿后的语音信息进行叠加:
Figure BDA0001904763230000151
其中,Mi表示当位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,αi是第i个定向收音设备的收音增益值;
Δpii是第i个用户位置与第i个定向收音设备之间的音频相位偏移,Δpji是第i个定向收音设备与第j个用户位置之间的音频相位偏移,n是车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;
当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。
具体地,以车内用户数量为4人、用户分别为A、B、C、D、定向收音设备的数量为4个以及唤醒智能语音设备用户为A为例进行说明。参阅附图2,图2示例性地示出了本实施例中将相位补偿后的语音信息进行叠加的示意框图。
每一个定向收音设备均可以获取车内用户的语音信息,以第一个定向收音设备为例,第一个定向收音设备可以获取到用户A、B、C、D的语音信息,则唤醒用户为A时,第一个定向收音设备语音信息叠加的结果如公式(2)所示:
M1=α1·((m1+Δp11)+(m2+Δp21)+(m3+Δp31)+(m4+Δp41)) (2)
同理,第二个定向收音设备语音信息叠加的结果如公式(3)所示:
M2=α2·((m2+Δp22)+(m1+Δp12)+(m3+Δp32)+(m4+Δp42)) (3)
第三个定向收音设备语音信息叠加的结果如公式(4)所示:
M3=α3·((m3+Δp33)+(m1+Δp13)+(m2+Δp23)+(m4+Δp43)) (4)
第四个定向收音设备语音信息叠加的结果如公式(5)所示:
M4=α4·((m4+Δp44)+(m1+Δp14)+(m2+Δp24)+(m3+Δp34)) (5)
上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述,但是本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时(并行)执行或以颠倒的次序执行,这些简单的变化都在本发明的保护范围之内。
基于上述方法实施例,本发明还提供了一种用于车辆的语音识别系统。下面结合附图,对该用于车辆的语音识别系统进行说明。
参阅附图3,图3示例性地给出了本实施例中用于车辆的语音识别系统的主要结构。如图3所示,本实施例的用于车辆的语音识别系统主要包括位置检测模块1、增益调整模块2以及语音识别模块3。
位置检测模块1,配置为检测车辆内唤醒智能语音设备用户的位置信息;
增益调整模块2,配置为增大位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;
语音识别模块3,配置为通过调整收音增益值后的定向收音设备获取唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。
在本发明实施例的一个优选实施方案中,位置检测模块1进一步配置为执行如下操作:
判断是否检测到预设的智能语音设备的唤醒语音信息,
若检测到唤醒语音信息,则启动车辆内预设的声源定位装置并且根据唤醒语音信息检测唤醒智能语音设备用户的位置信息。
在本发明实施例的一个优选实施方案中,增益调整模块2还包括用户检测单元和干扰补偿单元,
用户检测单元配置为判断是否检测到车辆内非唤醒智能语音设备用户输入的语音信息,
干扰补偿单元配置为若检测到非唤醒智能语音设备用户输入的语音信息,则根据非唤醒智能语音设备用户输入的语音信息对每个定向收音设备采集到的语音信息进行音频干扰补偿,以便消除非唤醒智能语音设备用户输入的语音信息。
在本发明实施例的一个优选实施方案中,用户检测单元进一步配置为执行如下操作:
获取唤醒语音信息对应的第一声纹信息;
判断每个定向收音设备是否采集到与第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。
在本发明实施例的一个优选实施方案中,干扰补偿单元进一步配置为执行如下操作:
根据非唤醒智能语音设备用户的声纹信息识别每个定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;
在每个定向收音设备采集到的语音信息上叠加与非唤醒智能语音设备用户输入的语音信息对应的反向声波。
在本发明实施例的一个优选实施方案中,语音识别模块3进一步配置为执行如下操作:
根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;
将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;
其中,音频相位偏移是根据预设的用户位置与每个定向收音设备之间的距离预先获取的。
在本发明实施例的一个优选实施方案中,语音识别模块3还配置为执行如下操作:
根据公式(1)所示的方法将进行相位补偿后的语音信息进行叠加。
进一步地,基于上述系统实施例,本发明还提供了一种智能语音设备,该智能语音设备可以包括上述系统实施例所述的用于车辆的语音识别系统。
再进一步地,基于上述智能语音设备实施例,本发明还提供了一种车辆,该车辆可以包括上述智能语音设备实施例所述的智能语音设备。
再进一步地,基于上述方法实施例,本发明还提供了一种存储装置,其中存储有多条程序,该程序可以适于由处理器加载以执行上述方法实施例所述的用于车辆的语音识别方法。
再进一步地,基于上述方法实施例,本发明还提供了一种控制装置,其可以包括处理器、存储设备;存储设备可以适于存储多条程序,该程序可以适于由处理器加载以执行上述方法实施例所述的用于车辆的语音识别方法。
所属技术领域的技术人员可以清楚地了解到,为了描述的方便和简洁,本发明系统、智能语音设备、车辆以及装置实施例的具体工作过程以及相关说明,可以参考前述方法实施例中的对应过程,且与上述方法具有相同的有益效果,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (14)

1.一种用于车辆的语音识别方法,其特征在于,所述车辆包括多个定向收音设备,所述语音识别方法包括:
检测所述车辆内唤醒智能语音设备用户的位置信息;
增大所述位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;
通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别;其中,“通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别”的步骤包括:
根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;
将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;
其中,所述音频相位偏移是根据预设的用户位置与每个所述定向收音设备之间的距离预先获取的;
其中,“将进行相位补偿后的语音信息进行叠加”的步骤包括:
根据下式所示的方法将进行相位补偿后的语音信息进行叠加:
Figure FDA0003125749740000011
其中,所述Mi表示当所述位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,所述αi是所述第i个定向收音设备的收音增益值;
所述Δpii是第i个用户位置与所述第i个定向收音设备之间的音频相位偏移,所述Δpji是所述第i个定向收音设备与第j个用户位置之间的音频相位偏移,所述n是所述车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;
当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。
2.根据权利要求1所述的用于车辆的语音识别方法,其特征在于,“检测所述车辆内唤醒智能语音设备用户的位置信息”的步骤包括:
判断是否检测到预设的智能语音设备的唤醒语音信息,
若检测到所述唤醒语音信息,则启动所述车辆内预设的声源定位装置并且根据所述唤醒语音信息检测唤醒智能语音设备用户的位置信息。
3.根据权利要求1所述的用于车辆的语音识别方法,其特征在于,“通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息”的步骤包括:
判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息,
若检测到所述非唤醒智能语音设备用户输入的语音信息,则根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿,以便消除所述非唤醒智能语音设备用户输入的语音信息。
4.根据权利要求3所述的用于车辆的语音识别方法,其特征在于,“判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息”的步骤包括:
获取唤醒语音信息对应的第一声纹信息;
判断每个所述定向收音设备是否采集到与所述第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。
5.根据权利要求3所述的用于车辆的语音识别方法,其特征在于,“根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿”的步骤包括:
根据所述非唤醒智能语音设备用户的声纹信息识别每个所述定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;
在每个所述定向收音设备采集到的语音信息上叠加与所述非唤醒智能语音设备用户输入的语音信息对应的反向声波。
6.一种用于车辆的语音识别系统,其特征在于,所述车辆包括多个定向收音设备,所述语音识别系统包括:
位置检测模块,配置为检测所述车辆内唤醒智能语音设备用户的位置信息;
增益调整模块,配置为增大所述位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;
语音识别模块,配置为通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别;所述语音识别模块进一步配置为执行如下操作:
根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;
将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;
其中,所述音频相位偏移是根据预设的用户位置与每个所述定向收音设备之间的距离预先获取的;
所述语音识别模块还配置为执行如下操作:
根据下式所示的方法将进行相位补偿后的语音信息进行叠加:
Figure FDA0003125749740000031
其中,所述Mi表示当所述位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,所述αi是所述第i个定向收音设备的收音增益值;
所述Δpii是第i个用户位置与所述第i个定向收音设备之间的音频相位偏移,所述Δpji是所述第i个定向收音设备与第j个用户位置之间的音频相位偏移,所述n是所述车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;
当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。
7.根据权利要求6所述的用于车辆的语音识别系统,其特征在于,所述位置检测模块进一步配置为执行如下操作:
判断是否检测到预设的智能语音设备的唤醒语音信息,
若检测到所述唤醒语音信息,则启动所述车辆内预设的声源定位装置并且根据所述唤醒语音信息检测唤醒智能语音设备用户的位置信息。
8.根据权利要求6所述的用于车辆的语音识别系统,其特征在于,所述增益调整模块还包括用户检测单元和干扰补偿单元,
所述用户检测单元配置为判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息,
所述干扰补偿单元配置为若检测到所述非唤醒智能语音设备用户输入的语音信息,则根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿,以便消除所述非唤醒智能语音设备用户输入的语音信息。
9.根据权利要求8所述的用于车辆的语音识别系统,其特征在于,所述用户检测单元进一步配置为执行如下操作:
获取唤醒语音信息对应的第一声纹信息;
判断每个所述定向收音设备是否采集到与所述第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。
10.根据权利要求8所述的用于车辆的语音识别系统,其特征在于,所述干扰补偿单元进一步配置为执行如下操作:
根据所述非唤醒智能语音设备用户的声纹信息识别每个所述定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;
在每个所述定向收音设备采集到的语音信息上叠加与所述非唤醒智能语音设备用户输入的语音信息对应的反向声波。
11.一种智能语音设备,其特征在于,所述智能语音设备包括权利要求6至10中任一项所述的用于车辆的语音识别系统。
12.一种车辆,其特征在于,所述车辆包括权利要求11所述的智能语音设备。
13.一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载以执行权利要求1至5中任一项所述的用于车辆的语音识别方法。
14.一种控制装置,包括处理器和存储设备;所述存储设备,适于存储多条程序;其特征在于,所述程序适于由所述处理器加载以执行权利要求1至5中任一项所述的用于车辆的语音识别方法。
CN201811527235.0A 2018-12-13 2018-12-13 用于车辆的语音识别方法、装置、系统、设备以及车辆 Active CN110033773B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811527235.0A CN110033773B (zh) 2018-12-13 2018-12-13 用于车辆的语音识别方法、装置、系统、设备以及车辆

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811527235.0A CN110033773B (zh) 2018-12-13 2018-12-13 用于车辆的语音识别方法、装置、系统、设备以及车辆

Publications (2)

Publication Number Publication Date
CN110033773A CN110033773A (zh) 2019-07-19
CN110033773B true CN110033773B (zh) 2021-09-14

Family

ID=67235335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811527235.0A Active CN110033773B (zh) 2018-12-13 2018-12-13 用于车辆的语音识别方法、装置、系统、设备以及车辆

Country Status (1)

Country Link
CN (1) CN110033773B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288997B (zh) * 2019-07-22 2021-04-16 苏州思必驰信息科技有限公司 用于声学组网的设备唤醒方法及系统
FR3103618B1 (fr) * 2019-11-21 2021-10-22 Psa Automobiles Sa Dispositif pour mettre en œuvre un assistant personnel virtuel dans un véhicule automobile avec contrôle par la voix d’un utilisateur, et véhicule automobile l’incorporant
CN112802468B (zh) * 2020-12-24 2023-07-11 合创汽车科技有限公司 汽车智能终端的交互方法、装置、计算机设备和存储介质
CN113658580A (zh) * 2021-06-24 2021-11-16 大众问问(北京)信息科技有限公司 语音提示方法、装置、计算机设备和存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1606773A (zh) * 2001-12-19 2005-04-13 西门子公司 抑制周期性干扰信号的方法和装置
CN101848288A (zh) * 2010-04-19 2010-09-29 北京东微世纪科技有限公司 一种麦克风的模拟降噪系统及方法
CN102054481A (zh) * 2009-10-30 2011-05-11 大陆汽车有限责任公司 用于激活和/或进行语音对话的装置、系统和方法
CN102118667A (zh) * 2009-12-31 2011-07-06 歌尔声学股份有限公司 非封闭式耳塞型耳机及其受话端语音增强装置及方法
CN102324237A (zh) * 2011-05-30 2012-01-18 深圳市华新微声学技术有限公司 麦克风阵列语音波束形成方法、语音信号处理装置及系统
US20130332165A1 (en) * 2012-06-06 2013-12-12 Qualcomm Incorporated Method and systems having improved speech recognition
CN106356067A (zh) * 2016-08-25 2017-01-25 乐视控股(北京)有限公司 录音方法、装置及终端
WO2017064839A1 (ja) * 2015-10-16 2017-04-20 パナソニックIpマネジメント株式会社 双方向会話補助装置及び双方向会話補助方法
CN106601245A (zh) * 2016-12-15 2017-04-26 北京塞宾科技有限公司 一种车载智能音频装置及音频处理方法
CN106653041A (zh) * 2017-01-17 2017-05-10 北京地平线信息技术有限公司 音频信号处理设备、方法和电子设备
CN106782585A (zh) * 2017-01-26 2017-05-31 芋头科技(杭州)有限公司 一种基于麦克风阵列的拾音方法及系统
CN106878281A (zh) * 2017-01-11 2017-06-20 上海蔚来汽车有限公司 基于混合音频的车内定位装置、方法和车内设备控制系统
CN107146614A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音信号处理方法、装置及电子设备
WO2018053465A1 (en) * 2016-09-19 2018-03-22 Amazon Technologies, Inc. Speech-based audio indicators
CN108062949A (zh) * 2017-12-11 2018-05-22 广州朗国电子科技有限公司 语音控制跑步机的方法及装置
CN108399916A (zh) * 2018-01-08 2018-08-14 蔚来汽车有限公司 车载智能语音交互系统和方法、处理装置和存储装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3434215B2 (ja) * 1998-02-20 2003-08-04 日本電信電話株式会社 収音装置,音声認識装置,これらの方法、及びプログラム記録媒体
JP5156260B2 (ja) * 2007-04-27 2013-03-06 ニュアンス コミュニケーションズ,インコーポレイテッド 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム
US8351999B2 (en) * 2007-06-19 2013-01-08 Stealthwear, Inc. Wireless headset switching system
KR20110106715A (ko) * 2010-03-23 2011-09-29 삼성전자주식회사 후방 잡음 제거 장치 및 방법
CN102819009B (zh) * 2012-08-10 2014-10-01 香港生产力促进局 用于汽车的驾驶者声源定位系统及方法
CN107465986A (zh) * 2016-06-03 2017-12-12 法拉第未来公司 使用多个麦克风检测和隔离车辆中的音频的方法和装置

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1606773A (zh) * 2001-12-19 2005-04-13 西门子公司 抑制周期性干扰信号的方法和装置
CN102054481A (zh) * 2009-10-30 2011-05-11 大陆汽车有限责任公司 用于激活和/或进行语音对话的装置、系统和方法
CN102118667A (zh) * 2009-12-31 2011-07-06 歌尔声学股份有限公司 非封闭式耳塞型耳机及其受话端语音增强装置及方法
CN101848288A (zh) * 2010-04-19 2010-09-29 北京东微世纪科技有限公司 一种麦克风的模拟降噪系统及方法
CN102324237A (zh) * 2011-05-30 2012-01-18 深圳市华新微声学技术有限公司 麦克风阵列语音波束形成方法、语音信号处理装置及系统
US20130332165A1 (en) * 2012-06-06 2013-12-12 Qualcomm Incorporated Method and systems having improved speech recognition
WO2017064839A1 (ja) * 2015-10-16 2017-04-20 パナソニックIpマネジメント株式会社 双方向会話補助装置及び双方向会話補助方法
CN106356067A (zh) * 2016-08-25 2017-01-25 乐视控股(北京)有限公司 录音方法、装置及终端
WO2018053465A1 (en) * 2016-09-19 2018-03-22 Amazon Technologies, Inc. Speech-based audio indicators
CN106601245A (zh) * 2016-12-15 2017-04-26 北京塞宾科技有限公司 一种车载智能音频装置及音频处理方法
CN106878281A (zh) * 2017-01-11 2017-06-20 上海蔚来汽车有限公司 基于混合音频的车内定位装置、方法和车内设备控制系统
CN106653041A (zh) * 2017-01-17 2017-05-10 北京地平线信息技术有限公司 音频信号处理设备、方法和电子设备
CN106782585A (zh) * 2017-01-26 2017-05-31 芋头科技(杭州)有限公司 一种基于麦克风阵列的拾音方法及系统
CN107146614A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音信号处理方法、装置及电子设备
CN108062949A (zh) * 2017-12-11 2018-05-22 广州朗国电子科技有限公司 语音控制跑步机的方法及装置
CN108399916A (zh) * 2018-01-08 2018-08-14 蔚来汽车有限公司 车载智能语音交互系统和方法、处理装置和存储装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《Adaptive microphone array processing for high-performance speech recognition in car environment》;Jungpyo Hong et al.;《IEEE Transactions on Consumer Electronics》;20110228;全文 *
《Performance of fixed in-car microphone array beamformer under variations in car noise》;Vladimir Tourbabin et al.;《IEEE 2017 Hands-free Speech Communications and Microphone Arrays (HSCMA)》;20171231;全文 *
《车载多媒体语音降噪识别系统设计》;吴世杰;《机电工程技术》;20180930(第9期);全文 *

Also Published As

Publication number Publication date
CN110033773A (zh) 2019-07-19

Similar Documents

Publication Publication Date Title
CN110033773B (zh) 用于车辆的语音识别方法、装置、系统、设备以及车辆
CN110556103B (zh) 音频信号处理方法、装置、系统、设备和存储介质
US11676581B2 (en) Method and apparatus for evaluating trigger phrase enrollment
CN109767769B (zh) 一种语音识别方法、装置、存储介质及空调
EP3274988B1 (en) Controlling electronic device based on direction of speech
US20150039310A1 (en) Method and Apparatus for Mitigating False Accepts of Trigger Phrases
WO2017011672A1 (en) Detecting the location of a phone using rf wireless and ultrasonic signals
US10629226B1 (en) Acoustic signal processing with voice activity detector having processor in an idle state
CN109509465B (zh) 语音信号的处理方法、组件、设备及介质
CN110673096B (zh) 语音定位方法和装置、计算机可读存储介质、电子设备
DE112015004522T5 (de) Akustische Vorrichtung mit niedrigem Leistungsverbrauch und Verfahren für den Betrieb
CN108538280A (zh) 一种汽车主动降噪系统、方法及移动终端
CN112562742B (zh) 语音处理方法和装置
CN112309395A (zh) 人机对话方法、装置、机器人、计算机设备和存储介质
CN110970020A (zh) 一种利用声纹提取有效语音信号的方法
CN110689887B (zh) 音频校验方法、装置、存储介质及电子设备
CN109256145A (zh) 基于终端的音频处理方法、装置、终端和可读存储介质
CN113053402A (zh) 一种语音处理方法、装置和车辆
CN111599366A (zh) 一种车载多音区语音处理的方法和相关装置
CN115331672B (zh) 设备控制方法、装置、电子设备及存储介质
CN113270108B (zh) 语音活动检测方法、装置、电子设备及介质
CN114598963A (zh) 语音处理的方法、装置、计算机可读存储介质及电子设备
CN112286357A (zh) 一种行车人机交互方法及系统
CN115862598A (zh) 语音识别方法、装置、存储介质及电子设备
CN116030809A (zh) 车载智能语音交互的唤醒方法、装置及车辆

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200904

Address after: Susong Road West and Shenzhen Road North, Hefei Economic and Technological Development Zone, Anhui Province

Applicant after: Weilai (Anhui) Holding Co., Ltd

Address before: 30 Floor of Yihe Building, No. 1 Kangle Plaza, Central, Hong Kong, China

Applicant before: NIO NEXTEV Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant