CN115083404A - 一种车载语音降噪方法、装置、电子设备及存储介质 - Google Patents
一种车载语音降噪方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115083404A CN115083404A CN202210474577.0A CN202210474577A CN115083404A CN 115083404 A CN115083404 A CN 115083404A CN 202210474577 A CN202210474577 A CN 202210474577A CN 115083404 A CN115083404 A CN 115083404A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- noise reduction
- voice data
- mounted voice
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 159
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 230000001605 fetal effect Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 abstract description 20
- 230000000694 effects Effects 0.000 abstract description 19
- 230000007613 environmental effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本发明实施例公开了一种车载语音降噪方法、装置、电子设备及存储介质。所述车载语音降噪方法,包括:获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据;获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据;根据目标车载语音数据控制车载语音系统。本发明实施例的技术方案能够提升噪声滤除效果,准确识别车载环境中的语音,提高用户体验。
Description
技术领域
本发明实施例涉及汽车电子应用技术领域,尤其涉及一种车载语音降噪方法、装置、电子设备及存储介质。
背景技术
车载语音识别在实际生活中的应用已经越来越普遍。由于车内麦克风不仅收取人声,还会收集环境音(如车载音响娱乐系统所播放的媒体音及环境噪音等)。在语音识别过程中需要对车载设备本身发声单元发出的声音信号及环境噪声进行消除,保留有效的语音指令信号。
目前,语音降噪方案主要用于消除车载音响娱乐系统所播放的媒体音以及幅值较低的基础噪音,对高幅值环境噪音的消除能力明显不足,也即存在高幅值环境噪音时,噪声滤除效果较差。
发明内容
本发明实施例提供一种车载语音降噪方法、装置、电子设备及存储介质,能够提升噪声滤除效果,准确识别车载环境中的语音,提高用户体验。
第一方面,本发明实施例提供了一种车载语音降噪方法,包括:
获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据;
获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据;
根据目标车载语音数据控制车载语音系统。
第二方面,本发明实施例还提供了一种车载语音降噪装置,包括:
待降噪车载语音数据模块,用于获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据;
目标车载语音数据获取模块,用于获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据;
车载语音系统控制模块,用于根据目标车载语音数据控制车载语音系统。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的车载语音降噪方法。
第四方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的车载语音降噪方法。
本实施例的技术方案,通过获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据,进而获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据,从而根据目标车载语音数据控制车载语音系统。通过对车载音频数据进行初次降噪处理,可以提升待降噪车载语音数据中的语音的辨识度,利用车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,可以进一步滤除待降噪车载语音数据中的高幅值噪音,得到具有语音最佳识别效果的目标车载语音数据,实现目标车载语音数据对车载语音系统的准确控制,解决了现有语音降噪方案噪声滤除效果较差的问题,能够提升噪声滤除效果,准确识别车载环境中的语音,提高用户体验。
附图说明
图1是本发明实施例一提供的一种车载语音降噪方法的流程图;
图2是本发明实施例二提供的一种车载语音降噪方法的流程图;
图3是本发明实施例二提供的一种车载语音降噪方法的算法流程图;
图4是本发明实施例二提供的一种音频波形对比示意图;
图5是本发明实施例二提供的一种车外环境音频数据和待降噪车载语音数据对应的音频波形的示意图;
图6是本发明实施例二提供的一种差分后音频的波形图;
图7是本发明实施例三提供的一种车载语音降噪装置的示意图;
图8为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1是本发明实施例一提供的一种车载语音降噪方法的流程图,本实施例可适用于准确识别车载环境中语音的情况,该方法可以由车载语音降噪装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在电子设备中。该电子设备可以是车载终端设备等,本发明实施例并不对执行车载语音降噪方法的电子设备的类型进行限定。相应的,如图1所示,该方法包括如下操作:
S110、获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据。
其中,车载音频数据可以是车内安装的声音采集装置采集的音频数据,也即车内环境中存在的声音的音频数据。初次降噪处理可以是对车载音频数据进行的首次降噪处理,用于去除车载音频数据中由车载系统播放的音频以及车内的环境噪音产生的音频数据。待降噪车载语音数据可以是车载音频数据完成初次降噪处理后的音频数据,用于进行再次降噪处理。
在本发明实施例中,可以通过车内安装的声音采集装置采集声音信号,并对声音信号转换为所需形式的信号(如电信号等),得到车载音频数据,进一步对车载音频数据进行初次降噪处理,以去除车载音频数据中由车载系统播放的音频以及车内的环境噪音产生的音频数据,得到待降噪车载语音数据。
S120、获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据。
其中,车外环境音频数据可以是车外安装的声音采集装置采集的音频数据,也即车外环境产生的音频数据。目标车载语音数据可以是根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到的语音数据。
在本发明实施例中,可以通过车外安装的声音采集装置采集声音信号,并对声音信号转换为所需形式的信号,得到车外环境音频数据,进而利用车外环境音频数据,滤除待降噪车载语音数据中由车外环境噪音产生的音频数据,实现对待降噪车载语音数据的再次降噪处理,得到目标车载语音数据。由于车外环境噪音一般为高幅值噪音,也即车外环境音频数据包括高幅值噪音产生的音频数据,利用车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,可以实现对高幅值环境噪音匹配的音频数据的滤除,提高噪声滤除效果。
S130、根据目标车载语音数据控制车载语音系统。
其中,车载语音系统可以是根据语音信号控制车载功能模块动作的系统。车载功能模块可以是车载系统中根据车载语音系统的控制指令进行动作的模块。如车载系统中的空调系统、音频播放器以及照明装置等。
在本发明实施例中,可以将目标车载语音数据发送至车载语音系统,进而根据目标车载语音数据控制车载语音系统向车载功能模块发送控制指令。
可选的,车载语音系统可以将目标车载语音数据与预先配置的标准语音或标准文本进行比对,如果目标车载语音数据与预先配置的标准语音或标准文本匹配成功,则根据与目标车载语音数据匹配标准语音或标准文本向车载功能模块发送控制指令。标准语音可以是车载语音系统能够识别的全部语音样本。标准文本可以是与标准语音对应的文本。
本实施例的技术方案,通过获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据,进而获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据,从而根据目标车载语音数据控制车载语音系统。通过对车载音频数据进行初次降噪处理,可以提升待降噪车载语音数据中的语音的辨识度,利用车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,可以进一步滤除待降噪车载语音数据中的高幅值噪音,得到具有语音最佳识别效果的目标车载语音数据,实现目标车载语音数据对车载语音系统的准确控制,解决了现有语音降噪方案噪声滤除效果较差的问题,能够提升噪声滤除效果,准确识别车载环境中的语音,提高用户体验。
实施例二
图2是本发明实施例二提供的一种车载语音降噪方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,给出了获取车外环境音频数据的具体的可选的实施方式,如图2所示,本发明实施例的方法具体包括:
S210、获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据。
S220、获取车外环境音频数据。
在本发明的一个可选实施例中,S220具体可以包括:
S221、在确定待降噪车载语音数据为目标波形时,确定车辆工况状态。
其中,目标波形可以是在一定预设时长内的连续波形,为非人声波形。预设时长可以根据实际降噪需要进行设置,如5s、3s或者2s等。车辆工况状态可以是车辆的运行状态。可选的,车辆工况状态可以包括但不限于车窗状态以及车速范围等。
在本发明实施例中,可以先确定与待降噪车载语音数据匹配的波形,进而判断与待降噪车载语音数据匹配的波形是否为目标波形。如果与待降噪车载语音数据匹配的波形为目标波形,则可以确定待降噪车载语音数据中存在非人声波形,需要对待降噪车载语音数据再次进行降噪处理,并进一步确定当前车辆的车辆工况状态,以根据当前车辆的车辆工况状态确定降噪处理策略。如果与待降噪车载语音数据匹配的波形并非目标波形,即待降噪车载语音数据中不存在非人声波形,则无需进一步确定车辆工况状态,也不需要对待降噪车载语音数据再次进行降噪处理。
S222、在确定车辆工况状态为目标车辆工况状态时,开启车外麦克风。
其中,车外麦克风可以是车外安装的声音采集装置。目标车辆工况状态可以是导致待降噪车载语音数据需要进行再次降噪处理才能识别人声的车辆工况状态。示例性的,目标车辆工况状态可以包括但不限于车窗打开状态和/或当前车速超过预设车速范围等。
在本发明实施例中,可以进一步确认当前车辆的车辆工况状态是否为目标车辆工况状态。如果当前车辆的车辆工况状态为目标车辆工况状态,则唤醒当前车辆的车外麦克风,以使当前车辆的车外麦克风处于工作状态。如果当前的车辆工况状态并非目标车辆工况状态,则车外麦克风仍保持休眠状态,以节约电能。
S223、通过车外麦克风获取车外环境音频数据。
在本发明实施例中,若当前车辆的车外麦克风处于唤醒状态,则通过车外麦克风获取车外环境音频数据。
其中,车外环境音频数据可以包括:胎噪音频数据、风噪音频数据以及发动机噪声中的至少一种。胎噪音频数据可以是车外环境音频数据中由车胎摩擦产生的音频数据。风噪音频数据可以是车外环境音频数据中由车外风声产生的音频数据。发动机噪声可以是车外环境音频数据中由当前车辆发动机产生的音频数据。
S230、根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据。
在本发明的一个可选实施例中,根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据,可以包括:获取音频分辨间隔;根据音频分辨间隔内的车外环境音频数据以及待降噪车载语音数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据。
其中,音频分辨间隔可以是与语音匹配的一个文本单词不被拆分的最小时长。示例性的,音频分辨间隔可以是10s等。
在本发明实施例中,可以根据声音采集装置的音频分辨率设置音频分辨间隔,进而获取相同音频分辨间隔内的车外环境音频数据以及待降噪车载语音数据,利用位于相同音频分辨间隔内的车外环境音频数据对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据。
在本发明的一个可选实施例中,根据音频分辨间隔内的车外环境音频数据以及待降噪车载语音数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据,可以包括:根据当前时刻以及音频分辨间隔,确定目标车外环境音频数据以及目标待降噪车载语音数据;确定目标车外环境音频数据与目标待降噪车载语音数据的差分计算结果;根据差分计算结果,确定目标车载语音数据。
其中,目标车外环境音频数据和目标待降噪车载语音数据处于相同音频分辨间隔,当前时刻之前产生的车外环境音频数据为目标车外环境音频数据,当前时刻之后产生的待降噪车载语音数据为目标待降噪车载语音数据。差分计算结果可以是目标车外环境音频数据与目标待降噪车载语音数据进行波形差分处理的结果。
在本发明实施例中,可以根据当前时刻以及音频分辨率间隔,获取目标车外环境音频数据以及目标待降噪车载语音数据,进而将目标车外环境音频数据对应波形作为减数,并将目标待降噪车载语音数据对应波形作为被减数,对两个波形进行差分计算,得到差分计算结果,进一步将与差分计算结果对应的音频数据作为目标车载语音数据。
可选的,当前时刻可以位于目标车外环境音频数据和目标待降噪车载语音数据所在音频分辨间隔的中间二分之一的范围、三分之一的范围或者四分之一的范围内。示例性的,假设当前时刻为11时20分20秒,目标车外环境音频数据和目标待降噪车载语音数据所在音频分辨间隔可以是11时20分17秒-11时20分27秒,或者11时20分15秒-11时20分25秒等。本发明实施例并不对当前时刻,在目标车外环境音频数据和目标待降噪车载语音数据所在音频分辨间隔的具体时间范围进行限定。
在本发明的一个可选实施例中,根据当前时刻以及音频分辨间隔,确定目标车外环境音频数据以及目标待降噪车载语音数据,可以包括:根据音频分辨间隔,确定第一音频分辨差分间隔以及第二音频分辨差分间隔;将当前时刻之前的第一音频分辨差分间隔内的车外环境音频数据,作为目标车外环境音频数据;将当前时刻之后的第二音频分辨差分间隔内的待降噪车载语音数据,作为目标待降噪车载语音数据。
其中,第一音频分辨差分间隔对应的时长可以是音频分辨间隔对应时长的小数倍。示例性的,音频分辨差分间隔可以是0.5s或者0.3s等。第一音频分辨差分间隔对应的时长,与第二音频分辨差分间隔对应时长之和可以是音频分辨间隔的整数倍。
在本发明实施例中,可以按照实际的去噪需要以及音频分辨间隔,确定第一音频分辨差分间隔以及第二音频分辨差分间隔,进而将当前时刻之前的第一音频分辨差分间隔内的车外环境音频数据,作为目标车外环境音频数据,并将当前时刻之后的第二音频分辨差分间隔内的待降噪车载语音数据,作为目标待降噪车载语音数据。
在本发明的一个可选实施例中,根据当前时刻以及音频分辨间隔,确定目标车外环境音频数据以及目标待降噪车载语音数据,可以包括:根据音频分辨间隔,确定第一音频分辨差分间隔以及第二音频分辨差分间隔;根据当前时刻之前的第一音频分辨差分间隔内的车外环境音频数据,确定车外环境音频均衡数据,并将外环境音频均衡数据作为目标车外环境音频数据;将当前时刻之后的第二音频分辨差分间隔目标倍数内的待降噪车载语音数据,作为目标待降噪车载语音数据。
其中,车外环境音频均衡数据可以是当前时刻之前的第一音频分辨差分间隔内的车外环境音频数据的数据均值。目标倍数可以是预先设置的大于0的整数。
在本发明实施例中,在确定第一音频分辨差分间隔以及第二音频分辨差分间隔之后,可以获取当前时刻之前的第一音频分辨差分间隔内的车外环境音频数据,并计算第一音频分辨差分间隔内的车外环境音频数据的数据均值,得到车外环境音频均衡数据,进而将外环境音频均衡数据作为目标车外环境音频数据,进一步将当前时刻之后的第二音频分辨差分间隔目标倍数内的待降噪车载语音数据,作为目标待降噪车载语音数据。
S240、根据目标车载语音数据控制车载语音系统。
图3是本发明实施例二提供的一种车载语音降噪方法的算法流程图,如图3所示,可以利用麦克风进行收音,得到包括人声以及环境音(车载系统播放的音频以及车内的环境噪音等)的车载音频数据,并进行车载音频数据基础降噪(初次降噪处理),得到降噪后的音频波形(与待降噪车载语音数据匹配的音频波形),从而判断降噪后的音频波形是否为目标波形,若该音频波形并非目标波形,则将待降噪车载语音数据发送至语音识别模块,以通过语音识别模块识别待降噪车载语音数据中的人声。若该音频波形为目标波形,则判断当前车辆的车窗/车速是否处于目标车辆工况状态,如果当前车辆并非处于目标车辆工况状态,则将待降噪车载语音数据发送至语音识别模块。示例性的,风噪与(风噪+人声)的音频波形对比情况可以参见图4。
如果该音频波形为目标波形,且当前车辆处于目标车辆工况状态(车窗开启和/或车速较高),则可以确定待降噪车载语音数据中包括较大的车外环境噪音,进而启用车外麦克风录音,获取车外环境音频数据,取当前时刻为n。因与车外环境音频数据对应的车外环境噪音如胎噪、风噪及发动机噪音等具有较为连续稳定的特性,在极短时间内变化极小,又因为基础降噪后所得音频已消除车内媒体音,则此时的音频(待降噪车载语音数据)为人声与胎噪、风噪及发动机噪音叠加所得。进一步,将音频分辨间隔设置为10s,将当前时刻前5ms的车外环境音频数据,与当前时刻后5ms的待降噪车载语音数据进行实时差分相减运算,即将(n-5ms)-(n)时间段的车外环境音频数据,与(n)-(n+5ms)时间段内待降噪车载语音数据进行差分相减运算。分别与车外环境音频数据和待降噪车载语音数据对应的音频波形可以参见图5。
待降噪车载语音数据为包含胎噪、风噪等噪音以及人声的音频,减去车外麦克风录制仅包含胎噪、风噪等噪音的音频,所得差分后音频(目标车载语音数据)仅包括人声,差分后音频的波形图可参见图6。将差分后音频实时发送至语音识别模块进行语义识别,此时用户在车内唤醒语音可具有较高的唤醒率和识别率。
本实施例的技术方案,通过获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据,进而在确定待降噪车载语音数据为目标波形时,确定车辆工况状态,并在确定车辆工况状态为目标车辆工况状态时,开启车外麦克风,从而通过车外麦克风获取车外环境音频数据,进一步根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据,从而根据目标车载语音数据控制车载语音系统。在本方案中,当待降噪车载语音数据为目标波形且目标车辆工况状态时,通过车外麦克风获取车外环境音频数据,可以保证极端工况下车载语音系统正常使用。而通过对车载音频数据进行初次降噪处理,可以提升待降噪车载语音数据中的语音的辨识度,利用车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,可以进一步滤除待降噪车载语音数据中的高幅值噪音,得到具有语音最佳识别效果的目标车载语音数据,实现目标车载语音数据对车载语音系统的准确控制,解决了现有语音降噪方案噪声滤除效果较差的问题,能够提升噪声滤除效果,准确识别车载环境中的语音,提高用户体验。
需要说明的是,以上各实施例中各技术特征之间的任意排列组合也属于本发明的保护范围。
实施例三
图7是本发明实施例三提供的一种车载语音降噪装置的示意图,如图7所示,所述装置包括:待降噪车载语音数据模块310、目标车载语音数据获取模块320以及车载语音系统控制模块330,其中:
待降噪车载语音数据模块310,用于获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据;
目标车载语音数据获取模块320,用于获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据;
车载语音系统控制模块330,用于根据目标车载语音数据控制车载语音系统。
本实施例的技术方案,通过获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据,进而获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据,从而根据目标车载语音数据控制车载语音系统。通过对车载音频数据进行初次降噪处理,可以提升待降噪车载语音数据中的语音的辨识度,利用车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,可以进一步滤除待降噪车载语音数据中的高幅值噪音,得到具有语音最佳识别效果的目标车载语音数据,实现目标车载语音数据对车载语音系统的准确控制,解决了现有语音降噪方案噪声滤除效果较差的问题,能够提升噪声滤除效果,准确识别车载环境中的语音,提高用户体验。
可选的,目标车载语音数据获取模块320,具体用于在确定所述待降噪车载语音数据为目标波形时,确定车辆工况状态;在确定车辆工况状态为目标车辆工况状态时,开启车外麦克风;通过所述车外麦克风获取所述车外环境音频数据。
可选的,目标车载语音数据获取模块320,具体用于获取音频分辨间隔;根据所述音频分辨间隔内的所述车外环境音频数据以及所述待降噪车载语音数据,对所述待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据。
可选的,目标车载语音数据获取模块320,具体用于根据当前时刻以及所述音频分辨间隔,确定目标车外环境音频数据以及目标待降噪车载语音数据;确定所述目标车外环境音频数据与所述目标待降噪车载语音数据的差分计算结果;根据所述差分计算结果,确定所述目标车载语音数据。
可选的,目标车载语音数据获取模块320,具体用于根据所述音频分辨间隔,确定第一音频分辨差分间隔以及第二音频分辨差分间隔;将所述当前时刻之前的第一音频分辨差分间隔内的车外环境音频数据,作为所述目标车外环境音频数据;将所述当前时刻之后的第二音频分辨差分间隔内的待降噪车载语音数据,作为所述目标待降噪车载语音数据。
可选的,目标车载语音数据获取模块320,具体用于根据所述音频分辨间隔,确定第一音频分辨差分间隔以及第二音频分辨差分间隔;根据所述当前时刻之前的第一音频分辨差分间隔内的车外环境音频数据,确定车外环境音频均衡数据,并将所述外环境音频均衡数据作为所述目标车外环境音频数据;将所述当前时刻之后的第二音频分辨差分间隔目标倍数内的待降噪车载语音数据,作为所述目标待降噪车载语音数据。
所述车外环境音频数据包括:胎噪音频数据、风噪音频数据以及发动机噪声中的至少一种。
上述车载语音降噪装置可执行本发明任意实施例所提供的车载语音降噪方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的车载语音降噪方法。
由于上述所介绍的车载语音降噪装置为可以执行本发明实施例中的车载语音降噪方法的装置,故而基于本发明实施例中所介绍的车载语音降噪方法,本领域所属技术人员能够了解本实施例的车载语音降噪装置的具体实施方式以及其各种变化形式,所以在此对于该车载语音降噪装置如何实现本发明实施例中的车载语音降噪方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中车载语音降噪方法所采用的装置,都属于本申请所欲保护的范围。
实施例四
图8为本发明实施例四提供的一种电子设备的结构示意图。图8示出了适于用来实现本发明实施方式的电子设备412的框图。图8显示的电子设备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备412以通用计算设备的形式表现。电子设备412的组件可以包括但不限于:一个或者多个处理器416,存储装置428,连接不同系统组件(包括存储装置428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
电子设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备412访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置428可以包括易失性存储器形式的计算机系统可读介质,例如RAM(Random Access Memory,随机存取存储器)430和/或高速缓存存储器432。电子设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储装置428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块426的程序436,可以存储在例如存储装置428中,这样的程序模块426包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块426通常执行本发明所描述的实施例中的功能和/或方法。
电子设备412也可以与一个或多个外部设备414(例如键盘、指向设备、摄像头、显示器424等)通信,还可与一个或者多个使得用户能与该电子设备412交互的设备通信,和/或与使得该电子设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过I/O接口422进行。并且,电子设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网WideArea Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器420通过总线418与电子设备412的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备412使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器416通过运行存储在存储装置428中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的车载语音降噪方法:获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据;获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据;根据目标车载语音数据控制车载语音系统。
本实施例的技术方案,通过获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据,进而获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据,从而根据目标车载语音数据控制车载语音系统。通过对车载音频数据进行初次降噪处理,可以提升待降噪车载语音数据中的语音的辨识度,利用车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,可以进一步滤除待降噪车载语音数据中的高幅值噪音,得到具有语音最佳识别效果的目标车载语音数据,实现目标车载语音数据对车载语音系统的准确控制,解决了现有语音降噪方案噪声滤除效果较差的问题,能够提升噪声滤除效果,准确识别车载环境中的语音,提高用户体验。
实施例五
本发明实施例五还提供一种存储计算机程序的计算机存储介质,所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的车载语音降噪方法:获取车载音频数据,并对车载音频数据进行初次降噪处理,得到待降噪车载语音数据;获取车外环境音频数据,并根据车外环境音频数据,对待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据;根据目标车载语音数据控制车载语音系统。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ReadOnly Memory,ROM)、可擦式可编程只读存储器((Erasable Programmable Read OnlyMemory,EPROM)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种车载语音降噪方法,其特征在于,包括:
获取车载音频数据,并对所述车载音频数据进行初次降噪处理,得到待降噪车载语音数据;
获取车外环境音频数据,并根据所述车外环境音频数据,对所述待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据;
根据所述目标车载语音数据控制车载语音系统。
2.根据权利要求1所述的方法,其特征在于,获取车外环境音频数据,包括:
在确定所述待降噪车载语音数据为目标波形时,确定车辆工况状态;
在确定车辆工况状态为目标车辆工况状态时,开启车外麦克风;
通过所述车外麦克风获取所述车外环境音频数据。
3.根据权利要求1所述的方法,其特征在于,根据所述车外环境音频数据,对所述待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据,包括:
获取音频分辨间隔;
根据所述音频分辨间隔内的所述车外环境音频数据以及所述待降噪车载语音数据,对所述待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据。
4.根据权利要求3所述的方法,其特征在于,根据所述音频分辨间隔内的所述车外环境音频数据以及所述待降噪车载语音数据,对所述待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据,包括:
根据当前时刻以及所述音频分辨间隔,确定目标车外环境音频数据以及目标待降噪车载语音数据;
确定所述目标车外环境音频数据与所述目标待降噪车载语音数据的差分计算结果;
根据所述差分计算结果,确定所述目标车载语音数据。
5.根据权利要求4所述的方法,其特征在于,根据当前时刻以及所述音频分辨间隔,确定目标车外环境音频数据以及目标待降噪车载语音数据,包括:
根据所述音频分辨间隔,确定第一音频分辨差分间隔以及第二音频分辨差分间隔;
将所述当前时刻之前的第一音频分辨差分间隔内的车外环境音频数据,作为所述目标车外环境音频数据;
将所述当前时刻之后的第二音频分辨差分间隔内的待降噪车载语音数据,作为所述目标待降噪车载语音数据。
6.根据权利要求4所述的方法,其特征在于,根据当前时刻以及所述音频分辨间隔,确定目标车外环境音频数据以及目标待降噪车载语音数据,包括:
根据所述音频分辨间隔,确定第一音频分辨差分间隔以及第二音频分辨差分间隔;
根据所述当前时刻之前的第一音频分辨差分间隔内的车外环境音频数据,确定车外环境音频均衡数据,并将所述外环境音频均衡数据作为所述目标车外环境音频数据;
将所述当前时刻之后的第二音频分辨差分间隔目标倍数内的待降噪车载语音数据,作为所述目标待降噪车载语音数据。
7.根据权利要求2所述的方法,其特征在于,所述车外环境音频数据包括:胎噪音频数据、风噪音频数据以及发动机噪声中的至少一种。
8.一种车载语音降噪装置,其特征在于,包括:
待降噪车载语音数据模块,用于获取车载音频数据,并对所述车载音频数据进行初次降噪处理,得到待降噪车载语音数据;
目标车载语音数据获取模块,用于获取车外环境音频数据,并根据所述车外环境音频数据,对所述待降噪车载语音数据再次进行降噪处理,得到目标车载语音数据;
车载语音系统控制模块,用于根据所述目标车载语音数据控制车载语音系统。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的车载语音降噪方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的车载语音降噪方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210474577.0A CN115083404A (zh) | 2022-04-29 | 2022-04-29 | 一种车载语音降噪方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210474577.0A CN115083404A (zh) | 2022-04-29 | 2022-04-29 | 一种车载语音降噪方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115083404A true CN115083404A (zh) | 2022-09-20 |
Family
ID=83246635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210474577.0A Pending CN115083404A (zh) | 2022-04-29 | 2022-04-29 | 一种车载语音降噪方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115083404A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108022596A (zh) * | 2017-11-28 | 2018-05-11 | 湖南海翼电子商务股份有限公司 | 语音信号处理方法及车载电子设备 |
WO2019061292A1 (zh) * | 2017-09-29 | 2019-04-04 | 深圳传音通讯有限公司 | 一种终端降噪方法及终端 |
CN111477206A (zh) * | 2020-04-16 | 2020-07-31 | 北京百度网讯科技有限公司 | 用于车载环境的降噪方法、装置、电子设备及存储介质 |
CN112259113A (zh) * | 2020-09-30 | 2021-01-22 | 清华大学苏州汽车研究院(相城) | 一种提高车内语音识别准确率的前处理系统及其控制方法 |
US20210210093A1 (en) * | 2020-01-03 | 2021-07-08 | Baidu Online Network Technology (Beijing) Co., Ltd. | Smart audio device, calling method for audio device, electronic device and computer readable medium |
CN215818513U (zh) * | 2021-06-29 | 2022-02-11 | 重庆长安汽车股份有限公司 | 主动降噪控制及语音识别复用麦克风系统 |
CN114333808A (zh) * | 2021-12-31 | 2022-04-12 | 深圳市巨鼎医疗股份有限公司 | 一种自助终端的交互方法、智能终端以及存储介质 |
-
2022
- 2022-04-29 CN CN202210474577.0A patent/CN115083404A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019061292A1 (zh) * | 2017-09-29 | 2019-04-04 | 深圳传音通讯有限公司 | 一种终端降噪方法及终端 |
CN108022596A (zh) * | 2017-11-28 | 2018-05-11 | 湖南海翼电子商务股份有限公司 | 语音信号处理方法及车载电子设备 |
US20210210093A1 (en) * | 2020-01-03 | 2021-07-08 | Baidu Online Network Technology (Beijing) Co., Ltd. | Smart audio device, calling method for audio device, electronic device and computer readable medium |
CN111477206A (zh) * | 2020-04-16 | 2020-07-31 | 北京百度网讯科技有限公司 | 用于车载环境的降噪方法、装置、电子设备及存储介质 |
CN112259113A (zh) * | 2020-09-30 | 2021-01-22 | 清华大学苏州汽车研究院(相城) | 一种提高车内语音识别准确率的前处理系统及其控制方法 |
CN215818513U (zh) * | 2021-06-29 | 2022-02-11 | 重庆长安汽车股份有限公司 | 主动降噪控制及语音识别复用麦克风系统 |
CN114333808A (zh) * | 2021-12-31 | 2022-04-12 | 深圳市巨鼎医疗股份有限公司 | 一种自助终端的交互方法、智能终端以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9418674B2 (en) | Method and system for using vehicle sound information to enhance audio prompting | |
US9934780B2 (en) | Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch | |
US9263040B2 (en) | Method and system for using sound related vehicle information to enhance speech recognition | |
CN102999161B (zh) | 一种语音唤醒模块的实现方法及应用 | |
CN107910013B (zh) | 一种语音信号的输出处理方法及装置 | |
CN108335694B (zh) | 远场环境噪声处理方法、装置、设备和存储介质 | |
CN205354646U (zh) | 一种应用于车载设备的智能语音识别系统 | |
CN110460921A (zh) | 一种拾音控制方法、装置、车辆和存储介质 | |
CN112435682B (zh) | 车辆降噪系统、方法、装置、车辆及存储介质 | |
CN112397065A (zh) | 语音交互方法、装置、计算机可读存储介质及电子设备 | |
CN112509584A (zh) | 声源位置确定方法、装置和电子设备 | |
CN210489237U (zh) | 一种车载智能终端语音控制系统 | |
CN112053701A (zh) | 拾音控制方法、装置、系统、设备和介质 | |
CN110689887B (zh) | 音频校验方法、装置、存储介质及电子设备 | |
CN113643704A (zh) | 车机语音系统的测试方法、上位机、系统和存储介质 | |
CN111785298A (zh) | 声学性能测试方法及装置、电子设备、计算机可读介质 | |
CN111816199A (zh) | 一种汽车智能座舱的环境音控制方法与系统 | |
CN113053402A (zh) | 一种语音处理方法、装置和车辆 | |
CN115083404A (zh) | 一种车载语音降噪方法、装置、电子设备及存储介质 | |
CN112927688A (zh) | 用于车辆的语音交互方法及系统 | |
Krishnamurthy et al. | Car noise verification and applications | |
CN114882879A (zh) | 音频降噪方法、确定映射信息的方法、装置及电子设备 | |
CN112003666B (zh) | 车载收音机控制方法、装置、设备及存储介质 | |
CN109273003A (zh) | 用于行车记录仪的语音控制方法及系统 | |
CN112712799B (zh) | 一种误触发语音信息的获取方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |