骨传导耳机降噪方法、装置、电子设备及存储介质
技术领域
本发明涉及特种通信器材领域,特别是一种骨传导耳机降噪方法、装置、电子设备及存储介质。
背景技术
在日常的消防作业过程中,救援人员和执勤人员与指挥系统的信息及时交流是一个问题,现有技术中提出了采用骨传导耳机来解决指挥系统与救援人员和执勤人员之间的及时交流的问题。由于骨传导耳机的特性,利用脸部骨头传递的振动信号来传动声音,所以能够在嘈杂的环境中听到比一般耳机更加清楚的声音,并且由于骨传导耳机的佩戴方式,不会堵塞耳膜接收外接的声波,所以不会影响使用者听到来自周围的声音,使得消防员能够在在火场中根据周围的环境变化迅速的作出判断,避免受到伤害。骨传导耳机包括骨传导喇叭和骨传导麦克风,虽然骨传导耳机对空气中的声波有着良好的降噪效果,当骨传导耳机的骨传导麦克风在使用过程中因外力触碰耳机本体导致振动产生的不规则频率振动,从而使骨传导麦克风的声音中出了人声外还夹杂着噪声并传输出去,使声音的接受方不能听到清晰的人声,甚至噪声完全覆盖了原有的人声,从而导致不能正常的判断传递过来的信息,不能及时下达指令和不能及时沟通,导致错失救援机会。
发明内容
本发明目的在于解决上述技术问题,提供一种骨传导耳机降噪方法、装置、电子设备及存储介质。本发明的方法、装置、电子设备及存储介质,基于现有技术中的听觉场景分析理论CASA和AI深度学习技术,帮助骨传导麦克风因为外壳被接触碰撞而产生的噪音进行降噪,从而提高骨传导耳机通话质量。
为了达到上述目的,本发明的技术方案有:
一种骨传导耳机降噪方法,所述方法基于听觉场景分析理论CASA和深度学习技术,所述方法包括以下步骤:
接收原始声音信号输入;
从原始声音信号中分离部分声音信号;
基于噪音训练得到的神经网络模型,将所述部分声音信号与神经网络模型中学习过的噪音信号对比,判断相同或相似标记为噪音,反之标记为人声;
抑制或过滤掉标记为噪音的所述部分声音信号。
根据本发明的一种骨传导耳机降噪方法,采用传统的骨传导耳机声音信号处理技术,对骨传导麦克风收录的声音进行信号处理,并且基于听觉场景分析理论CASA和深度学习技术,提出了一种针对骨传导麦克风特有的噪音的降噪出来方法;骨传导麦克风本身不会被外界声音干扰,具备将强的降噪功能,但对于骨传导耳机与外界的接触或碰撞之后所产生的噪音任然会被骨传导麦克风收录,如果将噪音也连带着发送出去,会使得接收声音的人员无法听清声音中传递的信息,导致错误其中的关键信息而对现场事态进行误判,下达错误的指令;基于听觉场景分析理论CASA和深度学习技术的长期噪音训练得到的神经网络模型,取收录的原始声音信号的中部分声音信号,分批次的与神经网络模型中学习过的噪音信号对比,如果判断该部分声音信号与神经网络模型中曾经学习过的噪音信号相同或相近似,就标记为噪音,之后将标记为噪音的部分声音信号作抑制或过滤处理,实现对骨传导耳机的降噪。
进一步的,所述方法还包括:
所述原始声音信号为复杂混合声源中接收的声音信号。
再进一步的,所述方法还包括:
所述部分声音信号为从复杂混合声源中分离的单一声源的声音信号。
接收到的复杂混合声源的声音信号中包含了噪音的声音信号,并将其按照声源进行分离,再进行判断该部分声音信号与神经网络模型中曾经学习过的噪音信号相同或相近似,从而实现骨传导耳机的降噪。
所述方法还包括:
将所述单一声源的声音信号输入所述神经网络模型的函数中,得出判断结果,判断相同或相似标记为噪音,反之标记为人声。
所述方法还包括:
通过通信模块将所述标记为人声的部分声音信号输出。
所述方法还包括:
设定相似度阈值,将所述部分声音信号分批次与神经网络模型中学习过的噪音信号对比,得出部分声音信号与噪音信号的相似度,相似度大于相似度阈值则判断为噪音,反之则判断为人声。
一种骨传导耳机降噪装置,包括:
接收模块,用于接收原始声音信号输入;
分离模块,用于从原始声音信号中分离部分声音信号;
对比模块,用于通过将所述部分声音信号与噪音训练得到的神经网络模型中学习过的噪音信号对比,判断相同或相似标记为噪音,反之标记为人声;
降噪模块,用于抑制或过滤掉标记为噪音的所述部分声音信号。
一种电子设备,其包括处理器、存储介质以及计算机程序,所述计算机程序存储于存储介质中,所述计算机程序被处理器执行时实现上述的骨传导耳机降噪方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的骨传导耳机降噪方法。
附图说明
图1为本发明的骨传导耳机降噪方法的实施例一的流程图;
图2为本发明的骨传导耳机降噪方法的实施例二的流程图。
具体实施方式
结合附图说明本发明的一种骨传导耳机降噪方法、装置、电子设备及存储介质进行详细的描述,以对本发明的保护范围进行解释和说明。
实施例一
结合图1,一种骨传导耳机降噪方法,所述方法基于听觉场景分析理论CASA和深度学习技术,所述方法包括以下步骤:
接收原始声音信号输入。
骨传导耳机包括骨传导麦克风,当佩戴好所述骨传导耳机后,骨传导麦克风能够根据人体说话时面部骨头的振动收录声音,并按照传统信号处理方法处理成原始声音信号。听觉场景分析理论CASA是基于现有技术中声音处理技术,尤其是哈尔滨工业大学所研究的基于计算听觉场景分析(CASA)的声音的前端处理技术,人的听觉系统能够在噪声环境中区分并跟踪自己感兴趣的语音信号,即使多种声音同时存在也能“听取”所需要的内容。听觉场景分析(CASA)正是在这一听觉生理现象上提出的理论。CASA模拟人耳的神经听觉系统,对语音信号的处理更接近于人对混合声音信号的听觉感知过程。因此可以用来将噪声从语音信号中分离出来,得到比较纯的语音信号,实际上是在语音识别过程中加入一个前端处理,从而达到提高含噪声语音识别的准确率。利用CASA进行语音增强的重点是选择合适的特征来分离目标语音和背景噪音,可用的特征包括语谱能量、基因频率和信道互相关特征阈值。
深度学习技术是机器学习中一种基于对数据进行表征学习的方法。观测值(例如噪音声波的频率、幅度变化)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。经过听觉场景分析理论CASA前端处理的噪音,经过深度学习技术,计算机模仿人类听觉信号的处理过程进行建模,录取骨传导麦克风在现实环境中能接触的噪音,把噪音集成在一起,通过专进行长时间学习和对比形成一个特定的神经网络模型。
从原始声音信号中分离部分声音信号。
将原始声音信号按照一定的规律分离成多个部分声音信号,分别进行噪音的对比和判断。
基于噪音训练得到的神经网络模型,将所述部分声音信号与神经网络模型中学习过的噪音信号对比,判断相同或相似标记为噪音,反之标记为人声。
抑制或过滤掉标记为噪音的所述部分声音信号。实现骨传导麦克风的降噪功能。
根据本发明的一种骨传导耳机降噪方法,采用传统的骨传导耳机声音信号处理技术,对骨传导麦克风收录的声音进行信号处理,并且基于听觉场景分析理论CASA和深度学习技术,提出了一种针对骨传导麦克风特有的噪音的降噪出来方法;骨传导麦克风本身不会被外界声音干扰,具备将强的降噪功能,但对于骨传导耳机与外界的接触或碰撞之后所产生的噪音任然会被骨传导麦克风收录,如果将噪音也连带着发送出去,会使得接收声音的人员无法听清声音中传递的信息,导致错误其中的关键信息而对现场事态进行误判,下达错误的指令;基于听觉场景分析理论CASA和深度学习技术的长期噪音训练得到的神经网络模型,取收录的原始声音信号的中部分声音信号,分批次的与神经网络模型中学习过的噪音信号对比,如果判断该部分声音信号与神经网络模型中曾经学习过的噪音信号相同或相近似,就标记为噪音,之后将标记为噪音的部分声音信号作抑制或过滤处理,实现对骨传导耳机的降噪。
所述方法还包括:
通过通信模块将所述标记为人声的部分声音信号输出。所述通信模块为蓝牙模块,所述骨传导耳机通过蓝牙模块连接到其他的蓝牙装置,如肩咪等对讲机,通过对讲机发送给远程指挥端,或者直接通过骨传导耳机发送给远程指挥端。
所述方法还包括:
设定相似度阈值,将所述部分声音信号分批次与神经网络模型中学习过的噪音信号对比,得出部分声音信号与噪音信号的相似度,相似度大于相似度阈值则判断为噪音,反之则判断为人声。
实施例二
如图2所示,在实施例一所述的骨传导耳机降噪方法的基础上,进一步的明确了其所接受的原始声音信号为复杂混合声源中接收的声音信号。具体步骤如下:
一种骨传导耳机降噪方法,所述方法基于听觉场景分析理论CASA和深度学习技术,所述方法包括以下步骤:
接收复杂混合声源的声音信号输入;
从复杂混合声源的声音信号中分离的单一声源的声音信号;
基于噪音训练得到的神经网络模型,将所述单一声源的声音信号分批次与神经网络模型中学习过的噪音信号对比,判断相同或相似标记为噪音,反之标记为人声;
抑制或过滤掉标记为噪音的所述部分声音信号。
神经网络模型是经过长时间训练形成,其对应的算法都是经过上万小时的训练,所以该算法具有较强的鲁棒性,不受限于声源方向,通过提取不同的噪声源学习通过长时间的学习对比,实时分离人声和环噪音,抑制稳态和动态噪声。
也就是说,利用听觉场景分析理论CASA和深度学习技术,基于提前获取了骨传导麦克风所处的环境中会产生的各种除人声因为的噪音,然后收集这些噪音进行深度学习,形成的神经网络模型,再将复杂混合声源的声音信号中分离的单一声源的声音信号输入到这个神经网络模型的函数中,得出判断结果,判断相同或相似标记为噪音,反之标记为人声。
实施例三
一种骨传导耳机降噪装置,包括:
接收模块,用于接收原始声音信号输入;
分离模块,用于从原始声音信号中分离部分声音信号;
对比模块,用于通过将所述部分声音信号与噪音训练得到的神经网络模型中学习过的噪音信号对比,判断相同或相似标记为噪音,反之标记为人声;
降噪模块,用于抑制或过滤掉标记为噪音的所述部分声音信号。
实施例四
一种电子设备,其包括处理器、存储介质以及计算机程序,所述计算机程序存储于存储介质中,所述计算机程序被处理器执行时实现上述的骨传导耳机降噪方法。计算机设备中处理器的数量可以是一个或多个;电子设备中的处理器、存储器、输入装置和输出装置可以通过总线或其他方式连接。
实施例五
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的骨传导耳机降噪方法。该方法包括上述实施例一至实施例二所述的骨传导耳机降噪方法。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的基于骨传导耳机降噪方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台电子设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述骨传导耳机降噪装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
根据上述说明书的揭示和教导,本发明所属领域的技术人员还可以对上述实施方式进行变更和修改。因此,本发明并不局限于上面揭示和描述的具体实施方式,对本发明的一些修改和变更也应当落入本发明的权利要求的保护范围内。此外,尽管本说明书中使用了一些特定的术语,但这些术语只是为了方便说明,并不对本发明构成任何限制。