CN110875051B - 语音降噪装置和车辆以及语音降噪方法和存储介质 - Google Patents

语音降噪装置和车辆以及语音降噪方法和存储介质 Download PDF

Info

Publication number
CN110875051B
CN110875051B CN201811013593.XA CN201811013593A CN110875051B CN 110875051 B CN110875051 B CN 110875051B CN 201811013593 A CN201811013593 A CN 201811013593A CN 110875051 B CN110875051 B CN 110875051B
Authority
CN
China
Prior art keywords
voice
noise reduction
vehicle
module
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811013593.XA
Other languages
English (en)
Other versions
CN110875051A (zh
Inventor
吴世杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BYD Co Ltd
Original Assignee
BYD Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BYD Co Ltd filed Critical BYD Co Ltd
Priority to CN201811013593.XA priority Critical patent/CN110875051B/zh
Publication of CN110875051A publication Critical patent/CN110875051A/zh
Application granted granted Critical
Publication of CN110875051B publication Critical patent/CN110875051B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了语音降噪装置和车辆以及语音降噪方法和存储介质,其中,语音降噪装置包括语音采集阵列和降噪处理模块,其中,语音采集阵列安装在车内,语音采集阵列包括至少一个第一语音采集模块和至少一个第二语音采集模块,第一语音采集模块比第二语音采集模块更邻近车外;降噪处理模块用于根据第一语音采集模块和第二语音采集模块采集的语音信号识别语音源区,在语音源区包括车外和车内时,启动降噪模式,在降噪模式下,对第二语音采集模块采集的语音信号进行降噪处理。本发明的语音降噪装置和车辆以及方法,可以提高语音输出的清晰度,保证语音通话或语音控制的效果。

Description

语音降噪装置和车辆以及语音降噪方法和存储介质
技术领域
本发明属于车辆技术领域,尤其涉及一种语音降噪装置,以及包括该语音降噪装置的车辆和语音降噪方法、存储介质。
背景技术
随着车辆电子产品技术的发展,用户对车辆电子产品的附加要求也越来越高。例如,车载语音降噪及语音识别控制的应用愈来愈被提上日程,但是,常规车载语音通话在车速较快或复杂路况时,通话语音不够清楚,因而,语音识别的控制也会失效,车辆在行驶时,车辆的语音通话或语音识别控制都会受行车环境影响。
在相关技术中,通常通过在车载MIC上增加一个有源电路来放大处理输出信号,但效果并不好,由于车辆行驶时容易受到环境影响,无法输出清晰有效的语音信号,因而,在复杂的行车环境中使用语音电话或语音识别控制的效果不理想。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的第一个目的在于提出一种语音降噪装置,该语音降噪装置,可以对语音信号进行降噪处理,提高输出语音的清晰度。
本发明的第二个目的在于提出一种车辆。
本发明的第三个目的在提出一种语音降噪方法。
本发明的第四个目的在于提出一种存储介质。
为了达到上述第一个目的,本发明第一方面实施例的语音降噪装置,包括:语音采集阵列,所述语音采集阵列安装在车内,所述语音采集阵列包括至少一个第一语音采集模块和至少一个第二语音采集模块,所述第一语音采集模块比所述第二语音采集模块更邻近车外;降噪处理模块,所述降噪处理模块用于根据所述第一语音采集模块和所述第二语音采集模块采集的语音信号识别语音源区,在所述语音源区包括车外和车内时,启动降噪模式,在所述降噪模式下,对所述第二语音采集模块采集的语音信号进行降噪处理。
根据本发明实施例的语音降噪装置,通过语音采集阵列,替代相关技术中的驻极体MIC,基于语音采集模块的位置设置,可以判断环境噪音,并在存在环境噪音时,对车内人员的语音信号进行降噪处理,从而,可以提高语音信号的清晰度,保证车辆语音通话或语音控制的效果。
为了达到上述第二个目的,本发明第二方面实施例的车辆,包括第一方面实施例的语音降噪装置和控制装置,所述控制装置用于根据所述语音降噪装置输出的语音信号对车载执行元件进行控制。
根据本发明实施例的车辆,通过采用上面第一方面实施例的语音降噪装置,可以提高语音输出的清晰度,保证车载语音通话或语音控制的效果。
为了达到上述第三个目的,本发明第三方面实施例的语音降噪方法,应用于语音降噪装置,所述语音降噪装置包括语音采集阵列,所述语音采集阵列安装在车内,所述语音采集阵列包括至少一个第一语音采集模块和至少一个第二语音采集模块,所述第一语音采集模块比所述第二语音采集模块更邻近车外,所述语音降噪方法包括:根据所述第一语音采集模块和所述第二语音采集模块采集的语音信号识别语音源区;在所述语音源区包括车外和车内时,启动降噪模式;在所述降噪模式下,对所述第二语音采集模块采集的语音信号进行降噪处理。
根据本发明实施例的语音降噪方法,基于语音采集阵列采集语音信号,可以识别环境噪音,并在存在环境噪音的影响时,对语音信号进行降噪处理,可以提高语音信号的清晰度,保证语音通话或语音控制的效果。
为了达到上述第四个目的,本发明第四方面实施例的非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第三方面实施例所述的语音降噪方法。
根据本发明实施例的非临时性计算机可读存储介质,通过存储可实现第三方面实施例的语音降噪方法的计算机程序,为该语音降噪方法的实现提供支持。
附图说明
图1是根据本发明的一个实施例的语音降噪装置的框图;
图2是根据本发明的一个实施例的声频应用范围的示意图;
图3是根据本发明的一个实施例的识别人声特征信息的示意图;
图4是根据本发明的一个实施例的语音采集阵列的设置示意图;
图5是根据本发明的一个实施例的语音降噪装置及其连接示意图;
图6是根据本发明的一个实施例的语音降噪装置的工作过程的示意图;
图7是根据本发明的一个实施例的车辆的框图;
图8是根据本发明的一个实施例的语音降噪方法的流程图;
图9是根据本发明的一个实施例的语音降噪方法的流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参照附图描述根据本发明第一方面实施例的语音降噪装置。
图1是根据本发明的一个实施例的语音降噪装置的框图,如图1所示,本发明实施例的语音降噪装置100包括语音采集阵列10和降噪处理模块20。
其中,语音采集阵列10安装在车内,语音采集阵列10包括至少一个第一语音采集模块11和至少一个第二语音采集模块12,第一语音采集模块11比第二语音采集模块12更邻近车外。由于语音采集模块位置的差异以及声波的传播特性,对于同一声源,第一语音采集模块11和第二语音采集模块12接收到的时间会有所不同。
降噪处理模块20用于根据第一语音采集模块11和第二语音采集模块12采集的语音信号识别语音源区,在语音源区包括车外和车内时,启动降噪模式,在降噪模式下,对第二语音采集模块12采集的语音信号进行降噪处理。
具体地,由于第一语音采集模块11和第二语音采集模块12设置位置的差异,对于车外的声源发出的声音,将先到达第一语音采集模块11,而对于车内的声源发出的声音,将先到达第二语音采集模块12,降噪处理模块20根据第一语音采集模块11和第二语音采集模块12采集语音信号的时间差异,即可判断语音源区在车内或车外。在判断声源包括车内和车外时,即言,既有车外的环境噪音又有车内人员的语音信号时,为了避免环境噪音对车内人员的语音信号的影响,启动降噪模式。并且,由于第二语音采集模块12采集的语音信号主要包括人员的语音,在降噪模式下,对第二语音采集模块12采集的语音信号进行降噪处理。例如,提高人声信号、滤除背景信号、降低环境噪音等,从而,对于存在环境噪音的情况例如车速较快或复杂路况,可以获得较清晰的语音信号,保证语音通话或语音控制的效果。
根据本发明实施例的语音降噪装置100,通过语音采集阵列,替代相关技术中的驻极体MIC,基于语音采集模块的位置设置,可以判断环境噪音,并在存在环境噪音时,对车内人员的语音信号进行降噪处理,从而,可以提高语音信号的清晰度,保证车辆语音通话或语音控制的效果。
具体来说,在识别语音源区时,由于第一语音采集模块11相较于第二语音采集模块12的位置更加靠近于车外,对于不同区域的声源发出的语音,两者接收到信号的时间有所差异,降噪处理模块20根据声波达到不同位置的语音采集模块的时间来判断,例如,对于同一声源的语音信号,在到达第一语音采集模块11的时间小于到达第二语音采集模块的时间时,确定语音源区在车外,或者,在到达第二语音采集模块12的时间小于达到第一语音采集模块11的时间时,确定语音源区在车内。当判断语音源区包括车内和车外时,认为在较复杂的行车环境下进行语音通话或语音控制,则进行降噪处理。
在一些实施例中,在进行降噪处理时,降噪处理模块20具体用于,对第二语音采集模块12采集的语音信号进行频带过滤以获得人声频带语音信号,并将人声频带语音信号进行识别以获得有效的人声特征信息和背景信息,提高该有效的人声特征信息的幅度并降低背景信息的幅度。
具体来说,如图2所示为根据本发明的一个实施例的声频应用示意图,其中,不同事物的声频范是不同的,人的语音声频范围与其他事物声频范围不同,在复杂环境下,语音采集模块采集的语音信号包括环境中的各种语音信号。在进行降噪处理时,锁定人声频带语音信号,例如提取频域在300HZ-2KHZ内的语音信号,其他发声频带的信号全部过滤掉,重点提升300HZ-2KHZ的语音信号,并将该频带的人声频带语音信号进行语音和声纹识别,以提取其中的有效的人声特征信息,例如“你好,小迪,打开空调”等设定语音特征信息,其他的语音信息可以作为背景信息,以及,提高有效的人声特征信息的幅度并降低背景信息的幅度,以进一步提高清晰度。将降噪处理后的语音信号通过I2C输出编码指令发送至车辆的控制装置例如MCU(Microcontroller Unit,微控制单元),或者,经降噪算法还原为差分或单端的音频电压有效值输出至MCU,唤醒MCU后,MCU可以根据编码指令控制相应车载元件进行响应,实现语音通话或语音控制,可以保证语音效果。
图3为根据本发明的一个实施例的识别人声特征信息过程的示意图,如图3所示,声源0-20KHZ的语音信号进入语音采集模块MIC,并通过降噪处理模块20例如FM1388’sA21直接识别人声特征信息,并进行模拟数字信号转换,其中,识别的时间窗口可以设定为1-20毫米之间,对于上方图示为模拟信息的示意图示和追踪时刻图示,以及通过模式识别和追踪,在t0、t1、t2完成识别,并转换为I2S(Inter—IC Sound,集成电路内部音频总线)音频格式输出。
进一步地,在一些实施例中,在进行降噪处理时,降噪处理模块20对提取的有效的人声特征信息进行音效提升,例如对高音或低音的补偿,具体地取决于调试效果,从而可以进一步提高车载设备输出语音的效果。
对于车内人员为多个的情况,如果不止一个人员发出语音信号,可以通过设定优先级,在最优先级位置的人员发出语音时,其他位置发出的语音将是无效的。具体地,在实施例中,在降噪处理之前,控制装置20根据第二语音采集模块12采集的语音信号判断语音发出位置,并根据优先级设置和语音发出位置确定有效的第二语音采集模块12采集的语音信号。例如,对于设置一个第二语音采集模块12的情况,可以设置在靠近主驾驶位的位置,则第二语音采集模块12主要采集主驾驶位置的语音信号,即驾驶员发出的语音信号有效;再例如,对于设置多个第二语音采集模块12的情况,根据接收到语音信号的时间差异,可以判断语音发出位置,如果设置主驾驶位置为最高优先级,则在驾驶员发出的语音信号有效时,其他人员发出的语音信号将是无效的,即对于其他人员发出的语音信号将不进行降噪和相应控制的响应,避免误操作或其他干扰语音。
在本发明的实施例中,语音采集阵列10可以布局在柔性电路板上,从而语音采集模块可以不限定在平面上。具体地,可以通过柔性电路板联接在主板上,主板上可以设置降噪处理模块20和车辆的控制装置例如MCU,降噪处理模块20对语音采集模块采集的语音信号进行识别和判断,并在启动降噪模式下对车内人员的语音信号进行降噪处理,以输出清晰的语音信号,车辆的MCU可以根据语音信号执行相关请求,控制车载设备进行响应,例如打开或调节车载空调,或者控制多媒体或者进行语音传输等,从而可以实现更加清晰的语音通话或语音控制。
在本发明的实施例中,设置一个第一语音采集模块11和一个语音采集模块12,通过位置布置,可以识别车外环境噪音和车内人员的语音信号,同样地,也可以设置多个第一语音采集模块11和第二语音采集模块12,根据语音信号接收时间的差异,可以识别更加准确的语音发出位置。在本发明的实施例中,语音采集模块可以采用高灵敏度的数字半导体MIC,属于MEMS器件,相较于驻极体MIC,占用空间小。
在一些实施例中,语音采集阵列10包括一个第一语音采集模块11和两个第二语音采集模块12,如图4所示,第一语音采集模块11和两个第二语音采集模块12形成L型分布,例如,第一语音采集模块11,称为DMIC1,设置在靠近车外,一个第二语音采集模块12,例如称为MIC2,设置在主副驾驶位置附近,另一个第二语音采集模块12,例如称为DMIC3,设置在靠近主驾驶位置,其中,DMIC1与DMIC2相距70mm,DMIC2与DMIC3相距40mm,距离的设置以可以灵敏地识别接收到语音信号的时间差异为宜。
图5是根据本发明的一个实施例的语音降噪装置及其连接关系的示意图,如图5所示,包括一个第一语音采集模块DMIC1、第二语音采集模块DMIC2和第二语音采集模块DMIC3、降噪处理模块20、车辆的控制装置MCU、电源和存储芯片,以及其他外围电路和附加元器件例如有源晶振、无缘晶振、测试接口、连接器、数据通讯I2C(Inter-IntegratedCircuit,内部整合电路)、CAN(Controller Area Network,控制器局域网络)和SPI(SerialPeripheral Interface,串行外设接口)。其中,第一语音采集模块DMIC1、第二语音采集模块DMIC2和第二语音采集模块DMIC3可以布局在柔性电路板上,降噪处理模块20和MCU设置在主板上,柔性电路板连接主板,以及各器件连接的载体可以为印刷电路板PCB(PrintedCircuit Board,印制电路板),经贴片贴合可以成为一个PCBA(Printed Circuit Board+Assembly)。
作为示例,在车辆以较快速度行驶时,例如以图4中所示方向前行,语音采集阵列10输出的PDM格式信号传输至降噪处理模块20,降噪处理模块20进行语音识别和降噪处理,当语音信号到达第一语音采集模块DMIC1的时间比达到第二语音采集模块DMIC2和第二语音采集模块DMIC3的时间时,认为语音源区在车外,也就是存在环境噪音,在车内人员进行语音通话或语音控制时,为了避免环境噪音的影响,降噪处理模块20对车内人员的语音信号进行降噪处理。进而,可以根据声波到达第二语音采集模块DMIC2和第二语音采集模块DMIC3的时间差异来区分是主驾驶位置人员发出的语音信号还是副驾驶位置人员发出的语音信号,以对车内语音源区进行定位,并根据优先级设置来对优先级最高的位置的语音信号进行频带过滤、特征信息识别以及幅度提升等降噪处理,提高语音输出的清晰度,并将降噪后的语音信号通过I2C方式或SPI传输处车载MCU,MCU通过CAN传输相应指令至对应的执行元器件,以实现语音通话或语音控制。
或者,如果语音信号达到第二语音采集模块DMIC3时间小于达到第二语音采集模块DMIC2的时间小于第一语音采集模块DMIC1的时间,则认为语音源区在车内的驾驶员发出,环境噪音对语音输出影响不大,则可以开启EQ(Equali sation,均等化)模式,即对第二语音采集模块DMIC3采集的语音信号进行增益放大,提升其音效,例如对其进行高音或低音补偿,具体地可以根据调试效果进行补偿。
图6是根据本发明的一个实施例的语音降噪装置的工作过程的示意图,在上电初始化之后,语音采集阵列10采集语音信号,获得语音采集信号,在有环境噪音影响时,可以对语音采集信号进行语音降噪,在音效不良时,可以提升音效例如回音消音,并将处理后的语音信号传输至车载MCU,进行语音唤醒,以控制对应执行元件响应,实现语音通话或语音控制等。
概括来说,本发明实施例的语音降噪装置100,通过语音采集阵列10来采集环境噪音以及语音信号,并根据声波达到语音采集模块的时间差异来确定语音源区,进而识别存在环境噪音时,进行语音降噪处理,通过降噪处理模块20对语音信号进行模数转换、数字信号算法处理、语音识别和降噪,使得车外的环境噪音衰减无穷大,而使得车内语音信号增益放大,大小可以根据实际调试设定各种类型车厢的特定参数,转换为I2S音频格式传输至车载MCU,可以大大提高复杂环境下的语音效果。例如,车辆总调度中心呼叫一辆车,在嘈杂的环境中驾驶员传输的语音信号通过降噪处理,总调度中心人员可以清晰地听到驾驶员的语音信号,从而更加通畅地调度车辆。
基于第一方面实施例的语音降噪装置,下面参照附图描述根据本发明第二方面实施例的车辆。
图7是根据本发明实施例的车辆的框图,如图7所示,本发明实施例的车辆1000包括第一方面实施例的语音降噪装置100和控制装置200,其中,语音降噪装置100的工作过程参照上面第一方面实施例的说明,控制装置200用于根据语音降噪装置100输出的语音信号对车载执行元件进行控制,从而实现语音通话或语音控制。
根据本发明实施例的车辆1000,通过采用上面第一方面实施例的语音降噪装置100,可以提高语音输出的清晰度,保证车载语音通话或语音控制的效果。
下面参照附图描述根据本发明第三方面实施例的语音降噪方法。其中,本发明实施例的语音降噪方法可以应用于语音降噪装置,语音降噪装置包括语音采集阵列,语音采集阵列安装在车内,语音采集阵列包括至少一个第一语音采集模块和至少一个第二语音采集模块,第一语音采集模块比第二语音采集模块更邻近车外。
图8是根据本发明的一个实施例的语音降噪方法的流程图,如图8所示,本发明实施例的语音降噪方法包括:
S1,根据第一语音采集模块和第二语音采集模块采集的语音信号识别语音源区。
在一些实施例中,对于同一声源的语音信号,在到达第一语音采集模块的时间小于到达第二语音采集模块的时间时,确定语音源区在车外;或者,在到达第二语音采集模块的时间小于达到第一语音采集模块的时间时,确定语音源区在车内。简言之,可以根据语音采集模块位置的不同和声波传输的特性,根据接收语音信号的时间差异,来判断语音源区。
S2,在语音源区包括车外和车内时,启动降噪模式。
具体地,在语音源区包括车外和车内时,即在输出语音时,存在环境噪音影响,为了降低环境噪音的干扰,可以启动降噪模式。
S3,在降噪模式下,对第二语音采集模块采集的语音信号进行降噪处理。
具体地,对第二语音采集模块采集的语音信号进行频带过滤以获得人声频带语音信号;将人声频带语音信号进行语音识别以获得有效的人声特征信息和背景信息;以及,提高有效的人声特征信息的幅度并降低背景信息的幅度,从而,可以提高语音输出的清晰度。
进一步地,还可以对有效的人声特征信息进行音效提升,例如进行高音或低音补偿,进一步提高语音输出的清晰度。
根据本发明实施例的语音降噪方法,基于语音采集阵列采集语音信号,可以识别环境噪音,并在存在环境噪音的影响时,对语音信号进行降噪处理,可以提高语音信号的清晰度,保证语音通话或语音控制的效果。
在本发明实施例中,在对语音信号进行降噪处理之前还包括:根据第二语音采集模块采集的语音信号判断语音发出位置;根据优先级设置和语音发出位置确定有效的第二语音采集模块采集的语音信号,进而对有效的语音信号进行降噪处理。例如设定主驾驶位置发出的语音信号的优先级最高,则在主驾驶位置人员发出语音时,其他位置发出的语音信号将是无效的,避免误操作或其他干扰语音。
举例说明,如图4和5所示,以设置L型的三个DMIC为例,图9是根据本发明的一个实施例的语音降噪方法的流程图,如图9所示,具体包括:
S100,上电初始化,语音降噪模式开机自检成功。
S110,开启DMIC1、DMIC2和DMIC3。
S120,判断是否检测到语音特征信息,例如,是否识别到“你好,小迪,打开空调”或者“小迪,调整空调温度为26度”等。如果是进入步骤S130,否则继续本步骤。
S130,检测是否开启降噪模式,如果是,进入步骤S140,否则进入步骤S160。
S140,使得环境噪音衰减无穷大,自动调整有效语音特征信息的语音信号增益放大。
S150,转换为I2S格式或差分信号格式输出语音。
S160,对DMIC3采集的语音信号进行增益放大,开启EQ模式,即进行音效提升例如高音或低音补偿,具体取决于调试效果。
总的来说,本发明实施例的语音降噪方法,基于语音采集阵列,在存在环境噪音时,对语音信号进行降噪处理,可以提高输出语音的清晰度,保证语音通话或语音控制的效果。
基于上面第三方面实施例的语音降噪方法,本发明第四方面实施例提出的非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第三方面实施例的语音降噪方法。
根据本发明实施例的非临时性计算机可读存储介质,通过存储可实现第三方面实施例的语音降噪方法的计算机程序,为该语音降噪方法的实现提供支持。
需要说明的是,在本说明书的描述中,流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种语音降噪装置,其特征在于,所述语音降噪装置包括:
语音采集阵列,所述语音采集阵列安装在车内,所述语音采集阵列包括至少一个第一语音采集模块和至少一个第二语音采集模块,所述第一语音采集模块比所述第二语音采集模块更邻近车外;
降噪处理模块,所述降噪处理模块用于根据所述第一语音采集模块和所述第二语音采集模块采集的语音信号识别语音源区,在所述语音源区包括车外和车内时,启动降噪模式,在所述降噪模式下,对所述第二语音采集模块采集的语音信号进行降噪处理;
其中,所述降噪处理模块在对所述第二语音采集模块采集的语音信号进行降噪处理时具体用于,对所述第二语音采集模块采集的语音信号进行频带过滤以获得人声频带语音信号,并将所述人声频带语音信号进行识别以获得有效的人声特征信息和背景信息,提高所述有效的人声特征信息的幅度并降低所述背景信息的幅度;
所述降噪处理模块在根据所述第一语音采集模块和所述第二语音采集模块采集的语音信号识别语音源区时具体用于,对于同一声源的语音信号,在到达第一语音采集模块的时间小于到达第二语音采集模块的时间时,确定所述语音源区在车外,或者,在到达所述第二语音采集模块的时间小于达到所述第一语音采集模块的时间时,确定所述语音源区在车内。
2.根据权利要求1所述的语音降噪装置,其特征在于,所述降噪处理模块在对所述第二语音采集模块采集的语音信号进行降噪处理时还用于,对所述有效的人声特征信息进行音效提升。
3.根据权利要求1-2任一项所述的语音降噪装置,其特征在于,所述降噪处理模块在对所述第二语音采集模块采集的语音信号进行降噪处理之前还用于,根据所述第二语音采集模块采集的语音信号判断语音发出位置,并根据优先级设置和所述语音发出位置确定有效的所述第二语音采集模块采集的语音信号。
4.根据权利要求1所述的语音降噪装置,其特征在于,所述语音采集阵列布局在柔性电路板上。
5.根据权利要求1或4所述的语音降噪装置,其特征在于,所述语音采集阵列包括一个所述第一语音采集模块和两个所述第二语音采集模块,其中,所述第一语音采集模块和两个所述第二语音采集模块形成L型分布。
6.一种车辆,其特征在于,所述车辆包括如权利要求1-5任一项所述的语音降噪装置和控制装置,所述控制装置用于根据所述语音降噪装置输出的语音信号对车载执行元件进行控制。
7.一种语音降噪方法,其特征在于,应用于语音降噪装置,所述语音降噪装置包括语音采集阵列,所述语音采集阵列安装在车内,所述语音采集阵列包括至少一个第一语音采集模块和至少一个第二语音采集模块,所述第一语音采集模块比所述第二语音采集模块更邻近车外,所述语音降噪方法包括:
根据所述第一语音采集模块和所述第二语音采集模块采集的语音信号识别语音源区;
在所述语音源区包括车外和车内时,启动降噪模式;
在所述降噪模式下,对所述第二语音采集模块采集的语音信号进行降噪处理;
其中,对所述第二语音采集模块采集的语音信号进行降噪处理具体包括:对所述第二语音采集模块采集的语音信号进行频带过滤以获得人声频带语音信号;将所述人声频带语音信号进行语音识别以获得有效的人声特征信息和背景信息;提高所述有效的人声特征信息的幅度并降低所述背景信息的幅度;
所述根据所述第一语音采集模块和所述第二语音采集模块采集的语音信号识别语音源区具体包括:对于同一声源的语音信号,在到达第一语音采集模块的时间小于到达第二语音采集模块的时间时,确定所述语音源区在车外;或者,在到达所述第二语音采集模块的时间小于达到所述第一语音采集模块的时间时,确定所述语音源区在车内。
8.根据权利要求7所述的语音降噪方法,其特征在于,对所述第二语音采集模块采集的语音信号进行降噪处理还包括:对所述有效的人声特征信息进行音效提升。
9.根据权利要求7-8任一项所述的语音降噪方法,其特征在于,在对所述第二语音采集模块采集的语音信号进行降噪处理之前还包括:
根据所述第二语音采集模块采集的语音信号判断语音发出位置;
根据优先级设置和所述语音发出位置确定有效的所述第二语音采集模块采集的语音信号。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求7-9中任一所述的语音降噪方法。
CN201811013593.XA 2018-08-31 2018-08-31 语音降噪装置和车辆以及语音降噪方法和存储介质 Active CN110875051B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811013593.XA CN110875051B (zh) 2018-08-31 2018-08-31 语音降噪装置和车辆以及语音降噪方法和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811013593.XA CN110875051B (zh) 2018-08-31 2018-08-31 语音降噪装置和车辆以及语音降噪方法和存储介质

Publications (2)

Publication Number Publication Date
CN110875051A CN110875051A (zh) 2020-03-10
CN110875051B true CN110875051B (zh) 2022-09-09

Family

ID=69715858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811013593.XA Active CN110875051B (zh) 2018-08-31 2018-08-31 语音降噪装置和车辆以及语音降噪方法和存储介质

Country Status (1)

Country Link
CN (1) CN110875051B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112141834A (zh) * 2020-10-26 2020-12-29 华中科技大学同济医学院附属协和医院 一种电梯的语音控制系统及控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819009A (zh) * 2012-08-10 2012-12-12 汽车零部件研究及发展中心有限公司 用于汽车的驾驶者声源定位系统及方法
CN104908645A (zh) * 2015-06-08 2015-09-16 上海斐讯数据通信技术有限公司 一种行车辅助驾驶系统及其工作方法
CN105263088A (zh) * 2015-10-21 2016-01-20 莆田市云驰新能源汽车研究院有限公司 一种汽车降噪方法及系统
CN107481730A (zh) * 2016-10-14 2017-12-15 宝沃汽车(中国)有限公司 汽车拾音系统的降噪方法及系统
CN207433446U (zh) * 2017-11-22 2018-06-01 长沙联远电子科技有限公司 用于工程车辆高噪音环境下的语音控制装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9837102B2 (en) * 2014-07-02 2017-12-05 Microsoft Technology Licensing, Llc User environment aware acoustic noise reduction

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819009A (zh) * 2012-08-10 2012-12-12 汽车零部件研究及发展中心有限公司 用于汽车的驾驶者声源定位系统及方法
CN104908645A (zh) * 2015-06-08 2015-09-16 上海斐讯数据通信技术有限公司 一种行车辅助驾驶系统及其工作方法
CN105263088A (zh) * 2015-10-21 2016-01-20 莆田市云驰新能源汽车研究院有限公司 一种汽车降噪方法及系统
CN107481730A (zh) * 2016-10-14 2017-12-15 宝沃汽车(中国)有限公司 汽车拾音系统的降噪方法及系统
CN207433446U (zh) * 2017-11-22 2018-06-01 长沙联远电子科技有限公司 用于工程车辆高噪音环境下的语音控制装置

Also Published As

Publication number Publication date
CN110875051A (zh) 2020-03-10

Similar Documents

Publication Publication Date Title
US9978355B2 (en) System and method for acoustic management
CN107093429B (zh) 主动降噪方法、系统及汽车
US8724822B2 (en) Noisy environment communication enhancement system
US6937980B2 (en) Speech recognition using microphone antenna array
KR101210313B1 (ko) 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법
US8285545B2 (en) Voice command acquisition system and method
US8218397B2 (en) Audio source proximity estimation using sensor array for noise reduction
CN107910013B (zh) 一种语音信号的输出处理方法及装置
CN113630708B (zh) 耳机麦克风异常检测的方法、装置、耳机套件及存储介质
CN112435682A (zh) 车辆降噪系统、方法、装置、车辆及存储介质
CN108574906B (zh) 用于汽车的声音处理方法、系统和汽车
CN111696539A (zh) 对内部通话主动降噪的语音交互系统及车辆
CN110875051B (zh) 语音降噪装置和车辆以及语音降噪方法和存储介质
JP2012203122A (ja) 音声選択装置並びにそれを使用したメディア機器およびハンズフリー通話装置
JP2008070878A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
CN116158090A (zh) 用于抑制回声的音频信号处理方法和系统
WO2022052691A1 (zh) 基于多设备的语音处理方法、介质、电子设备及系统
CN105719656A (zh) 车载语音识别系统
JP2008070877A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
CN112147780A (zh) 车载抬头显示装置、控制系统、控制方法、存储介质
JP2009015209A (ja) 音声明瞭度改善システム及び音声明瞭度改善方法
CN115331672B (zh) 设备控制方法、装置、电子设备及存储介质
WO2023149015A1 (ja) 音声処理装置、音声処理方法、音声処理プログラム、および音声処理システム
CN213988291U (zh) 车载回音消噪电路
JPH02244098A (ja) 音声信号処理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant