一种基于骨传导技术的无线对讲降噪耳罩及降噪方法
技术领域
本发明属于无线对讲领域,涉及一种基于骨传导技术的无线对讲降噪耳罩及降噪方法。
背景技术
随着无线射频技术的不断发展,便携式通讯设备的发展及使用也日益普遍。但是在特殊场景及环境下,尤其是在背景噪声比较大的场景下,如:战场环境、火灾现场以及隧道施工环境等,普通的通讯设备就很难发挥到作用。然而在抢险救灾或特殊作业时,保持通讯的畅通良好是十分重要的,现有的用于抢险救灾或特殊作业的便携式通讯设备中,为了避免通过空气传播的噪音对通话质量的影响,会采用基于骨传导技术的设备模块,骨传导振子可以使得声波与神经之间通过人体骨头传播,因此可以降低环境噪音对使用者的影响。
现有基于骨传导技术的通讯设备一般采用与肩咪或者对讲机有线连接的方式来实现通话,这样的使用方式会给特殊场景下使用者的动作带来影响。基于骨传导技术的设备无法避免与人体骨骼和衣物摩擦产生摩擦声,在风声比较大的环境中会受到气流的影响产生风噪声,也会因为自激而产生串扰噪音,这些都是非平稳的噪声。骨传导麦克风在采集语音信号的同时不可避免的也会采集到这些非平稳的噪声,带噪声的语音信号通过无限射频方式传递给接受者,由于噪声的存在,使得声音的接收方不能听到清晰的人声,从而导致不能正常判断传递过来的信息,不能及时下达指令和不能及时沟通,导致错失最佳的动作时机。
发明内容
本发明的目的在于针对上述现有技术中基于骨传导技术的通讯设备容易受噪声干扰的问题,提供一种基于骨传导技术的无线对讲降噪耳罩及降噪方法,使用者可以获取高质量的语音信息,又可以通过耳罩的物理降噪特性对使用者的听觉系统进行防护。
为了实现上述目的,本发明有如下的技术方案:
一种基于骨传导技术的无线对讲降噪耳罩,包括主控模块以及分别与主控模块相连的电源模块、拾音模块、降噪模块、通讯模块、播放模块、存储模块、耳罩模块;
所述电源模块能够在主控模块的控制下为其它模块供电;所述拾音模块由骨传导麦克风组成,用于采集使用者说话时的语音信号,并将该信号转换成电信号通过主控模块传递给降噪模块,降噪模块用于对拾音模块采集到的带噪语音信号进行降噪处理,降噪后的语音信号通过主控模块传递给通讯模块;通讯模块由发射单元、接收单元和天线单元组成,发射单元通过天线单元发送降噪模块处理后的语音信号,接收单元用于接收发射单元所发射过来的语音信号;播放模块由骨传导振子组成,骨传导振子通过颅骨的振动将通讯模块所接收到的语音信号传入使用者的内耳;所述存储模块用于存储语音数据;耳罩模块具有封装集成各个模块的腔体,耳罩模块的降噪特性对使用者的听觉进行防护。
在本发明基于骨传导技术的无线对讲降噪耳罩一种优选实施例中,所述的存储模块记录使用者在紧急情况下的语音信息,所存储的语音数据既包括使用者自身的语音信息,又包括来自其他使用者所传递过来的语音信息。
在本发明基于骨传导技术的无线对讲降噪耳罩一种优选实施例中,所述的降噪模块采用基于单通道降噪技术的非负稀疏编码降噪算法,利用非负矩阵分解算法的非负特性,并结合稀疏编码的稀疏性,通过倍增算法来更新稀疏矩阵,通过投影梯度下降法来更新特征基矩阵,最后利用收敛后所得到的稀疏矩阵和特征基矩阵估计出降噪后的语音信号。
本发明同时提供一种基于骨传导技术的无线对讲降噪方法,包括以下步骤:
S1、选用一组和含噪语音信号x(t)具有相同统计特性的纯噪声信号,通过非负稀疏编码降噪算法学习规则计算噪声信号的基向量An;
S2、获取更新需要的语音基向量As和稀疏系数Ss;
X为含噪语音信号x(t)变换后的频域信号,得到如下关系式:
上式中的下标s和n代表语音信号和噪声信号,将噪声信号的基向量An带入到含噪语音信号x(t)进行非负稀疏编码降噪算法学习规则计算,当评价函数的收敛速度趋向稳定时,则得到更新需要的语音基向量As和稀疏系数Ss;
S3、语音信号还原,把降噪算法处理后的语音信号进行输出:
把降噪算法处理后的频域信号
结合相位信息并进行短时傅里叶逆变换,重叠求和后得到最终所期望降噪后的时域信号
在本发明基于骨传导技术的无线对讲降噪方法一种优选实施例中,所述的非负稀疏编码降噪算法学习规则是将非负矩阵分解算法和稀疏编码结合起来所得到的。
在本发明基于骨传导技术的无线对讲降噪方法一种优选实施例中,非负矩阵分解算法为,对于任意给定的一个大小为n×m的非负矩阵V,非负矩阵分解算法能够寻找到一个大小为n×r的非负矩阵W和一个大小为r×m的非负矩阵H,使得下式满足:
V=WH
分解前后的矩阵中仅包含非负的元素,原矩阵V中的任一个列向量解释为对W=[w1,w2,…wr]中所有列向量的加权和,式中r的值选择使(n+m)r<n×m,所得到的WH是V中数据的压缩形式,权重系数为H=[h1,h2,…hm]中对应列向量中的元素。
在本发明基于骨传导技术的无线对讲降噪方法一种优选实施例中,稀疏编码为,对于系数矩阵A和编码矩阵S满足下式:
X≈AS
系数矩阵A为基向量,编码矩阵S为稀疏分量,A和S都为非负矩阵,这里对编码矩阵S进行稀疏控制,引入一个评价函数来衡量矩阵分解后的误差:
上式的约束条件为:λ>0;对于任意的ij:Xij≥0,基向量Aij≥0,稀疏Sij≥0;对于任意的系数i:‖ai‖=1,ai表示A的第i列列向量;上式中‖X-AS‖2表示矩阵的重构误差:‖X-AS‖2=∑ij[Xij-(AS)ij]2,其中i和j分别表示为行和列;Sij表示稀疏系数矩阵S的第i行和第j列的元素;参数λ表明了稀疏性和数据准确重构之间的折中关系;
如何度量S的稀疏性则取决于惩罚函数f(·)具体形式,选取f(·)函数的形式为:f(s)=|s|=s(s≥0),因此,得到评价函数表达式为:
评价函数COST(A,S)是关于S项为二次的,当Sij≥0时,S是一个凸集合,存在最优的局部最小值;S迭代过程的更新规则如下:
St+1==St.*{(ATX)./(ATASt+λ)}
其中.*和./分别表示矩阵的点乘和点除操作,t为当前所处理的矩阵时间帧,t+1为下一时间帧;上标T表示矩阵转置,S是非负的,它的更新规则是通过简单的乘以一个非负因子(ATX)./(ATASt+λ)来得到的,只要S的初始值全部选择正值,S的迭代过程对任意要求的精度都能够保证达到全局最小值。
在本发明基于骨传导技术的无线对讲降噪方法一种优选实施例中,系数矩阵A使用标准的梯度下降算法来进行优化,达到其更新规则为:
其中μ为步长,β为学习速率;t为当前所处理的矩阵时间帧,t+1为下一时间帧;上标T表示矩阵转置;令At+1中的负值都为零,并限制‖At+1‖=1;在使用梯度下降算法进行基向量A的更新时,遵循投影满足非负性和范数约束的最近点规则。
在本发明基于骨传导技术的无线对讲降噪方法一种优选实施例中,骨传导麦克风所采集到的信号为x(t),该信号中的非平稳加性噪声为n(t),假设纯净的语音信号为s(t),则得到表达式:
x(t)=s(t)+n(t)
x(t)经过短时傅立叶变换得到:
X=|STFT{x(t)}|。
相较于现有技术,本发明基于骨传导技术的无线对讲降噪耳罩,能够帮助骨传导麦克风采集到的含有非平稳噪声的语音信号进行降噪处理,提升通讯中的话语质量和话语清晰度。拾音模块由骨传导麦克风组成,骨传导麦克风可以利用人讲话时引起的头颈部骨骼的轻微振动来把声音信号收集起来转为电信号,播放模块由骨传导振子组成,骨传导振子是基于骨传导技术的扬声器振子,通过颅骨的振动将通讯模块接收单元所接收到的语音信号传入使用者的内耳。基于全双工多通道对讲技术使得本发明耳罩一方面可以解放使用者的双手,减少线材对对使用者动作的干扰,另一方面可以加强使用者之间的沟通,满足多人之间协同配合进行工作的需要;基于耳罩模块的物理降噪性能可以对使用者的听觉系统进行防护。
进一步的,本发明的降噪模块采用基于单通道降噪技术的非负稀疏编码降噪算法,利用非负矩阵分解算法的非负特性,并结合稀疏编码的稀疏性,通过倍增算法来更新稀疏矩阵,通过投影梯度下降法来更新特征基矩阵,最后利用收敛后所得到的稀疏矩阵和特征基矩阵估计出降噪后的语音信号,能够针对化应用于语音通信的非稳定噪声,降噪效果好。
相较于现有技术,本发明基于骨传导技术的无线对讲降噪方法,使用了非负稀疏编码降噪算法学习规则计算噪声信号的基向量,由于骨传导技术借助头颈部骨骼的轻微振动来进行声音信号的采集和播放,因此在特殊场景下空气中的声波噪声对骨传导通讯设备基本没有影响,但骨传导麦克风易受到摩擦声、风噪声以及自激噪声等非平稳噪声的影响,这使得语音信号的质量和可懂度变得很差。非负稀疏编码降噪算法的核心是非负矩阵分解,表示形式具有很直观的语义解释,求解方法具有收敛速度快、左右非负矩阵存储空间小的特点,它能将高维的数据矩阵降维处理,适合处理大规模数据。但非负矩阵算法也有自身的局限性,非负矩阵不适合过完整的表示,过完整的意思是有限范围的空间维数被编码分解之后比输入空间的有效维数大,这个问题通过稀疏编码解决。获取到更新需要的语音基向量和稀疏系数之后,将语音信号还原,把降噪算法处理后的频域信号结合相位信息并进行短时傅里叶逆变换,重叠求和后得到最终所期望降噪后的时域信号进行输出。该方法能对骨传导麦克风所采集到的含有非平稳噪声的语音信号进行降噪处理,有效提升通讯过程的话语质量和话语清晰度。
附图说明
图1本发明无线对讲降噪耳罩的结构框图;
图2本发明两个无线对讲降噪耳罩之间交互示意图;
图3本发明耳罩模块的封装方式示意图;
图4本发明基于骨传导技术的无线对讲降噪方法流程图;
附图中:1-电源模块;2-拾音模块;3-降噪模块;4-通讯模块;5-播放模块;6-存储模块;7-耳罩模块;8-主控模块。
具体实施方式
下面结合附图对本发明做进一步的详细说明。
参见图1,本发明基于骨传导技术的无线对讲降噪耳罩包括电源模块1、拾音模块2、降噪模块3、通讯模块4、播放模块5、存储模块6、耳罩模块7以及主控模块8。
电源模块1为整个对讲降噪耳罩系统的正常工作提供电源;可以通过主控模块8控制电源模块1是否给对讲降噪耳罩系统供电;
拾音模块2由基于骨传导技术的麦克风即骨传导麦克风组成,可以利用人讲话时引起的头颈部骨骼的轻微振动来把声音信号收集起来转为电信号。在本实施例中,该模块主要用于采集使用者说话时的语音信号,并将该信号转换成电信号通过主控模块8传递给降噪模块3;
降噪模块3主要用于对拾音模块2所采集到的带噪语音信号进行降噪算法处理,在本发明的实施例中,所使用的降噪算法是基于单通道降噪技术的非负稀疏编码降噪算法。该降噪算法利用非负矩阵分解算法的非负特性,并结合稀疏编码的稀疏性,通过倍增算法来更新稀疏矩阵,通过投影梯度下降法来更新特征基矩阵;最后利用收敛后所得到的稀疏矩阵和特征基矩阵估计出降噪后的语音信号,并把该语音信号通过主控模块8传递给通讯模块4的发射单元,发射单元通过天线单元把降噪后的语音数据发送出去。
通讯模块4主要由发射单元、接收单元和天线单元组成。其中,通讯模块4的发射单元用于发送降噪模3处理后的语音信号,通讯模块4的接收单元用于接收发射单元所发射过来的语音信号。参见图2,第一对讲降噪耳罩的通讯模块4的发射单元通过天线单元发送第一对讲降噪耳罩的降噪模块3处理后的语音信号,第二对讲降噪耳罩的通信模块4的接收单元通过天线单元接收第一对讲降噪耳罩所发射过来的语音信号,并把该语音信号的数据通过主控模块8传递给第二对讲降噪耳罩的播放模块5。同理,第一对讲降噪耳罩的通讯模块4的接收单元也会通过天线单元接收到第二对讲降噪耳罩的通讯模块4的发射单元通过天线单元所发送的语音信号,并把该信号通过主控模块8传递给第一对讲降噪耳罩的播放模块5。借助通讯模块4便能够实现第一对讲降噪耳罩和对第二讲降噪耳罩之间的对讲工能。
播放模块5要由基于骨传导技术的扬声器振子即骨传导振子组成。骨传导振子通过颅骨的振动将通讯模块4的接收单元所接收到的语音信号传入使用者的内耳,使用者借助骨传导振子便可听到语音信号的信息和内容;
存储模块6主要用于存储语音数据,记录使用者在紧急情况下的语音信息;该模块所存储的语音数据既有使用者自身的语音信息,又有来自其他使用者所传递过来的语音信息。
耳罩模块7由物理降噪材质组成。耳罩模块7主要两个作用:第一,对各个模块进行封装集成,把上述的各个模块封装在腔体内,第二,利用降噪特性对使用者的听觉系统进行防护。如图3所示,本发明实施例中的左耳罩封装播放模块5,右耳罩封装拾音模块2以及主控模块8、降噪模块3、电源模块1、通讯模块4的发射单元和接收单元、存储模块6,同时在右耳罩外壳上设置指示灯、电源按键、音量键+、音量键-、天线以及充电口。
主控模块8主要用于对其他模块:电源模块1、拾音模块2、降噪模块3、通讯模块4、播放模块5、存储模块6和耳罩模块7进行命令控制和交互,协调各个模块进行配合工作。
本发明把骨传导技术、单通道降噪技术、全双工对讲技术和耳罩物理降噪性能结合在一起,实现在特殊场景下具有降噪性能和防护功能的多人对讲耳罩。基于骨传导技术的麦克风可以利用人讲话时引起的头颈部骨骼的轻微振动来把声音信号收集起来转为电信号,这种特殊的麦克风称为骨传导麦克风;基于骨传导技术的扬声器可以通过头颈部骨骼的轻微振动将声音传入内耳,这种特殊的扬声器称为骨传导振子。由于骨传导技术借助头颈部骨骼的轻微振动来进行声音信号的采集和播放,在特殊场景下空气中的声波噪声对骨传导通讯设备基本没有影响,因此适于在嘈杂、强背景噪声等特殊场景中语音对讲。尽管骨传导通讯设备在嘈杂、强背景噪声等特殊场景能够进行语音对讲,但由于骨传导麦克风易受到摩擦声、风噪声以及自激噪声等非平稳噪声的影响,使得语音信号的质量和可懂度变得很差,为了提高通讯设备中的语音质量,本发明采用基于语音通信的非稳定噪声单通道降噪技术—非负稀疏编码降噪算法对骨传导麦克风所采集到的信号进行处理,该处理过程在降噪模块中进行。
非负稀疏编码降噪算法的核心原理是非负矩阵分解(NMF)算法。非负矩阵算法分解的基本思想可以简单的描述为:对于任意给定的一个大小为n×m的非负矩阵V,非负矩阵算法能够寻找到一个大小为n×r的非负矩阵W和一个大小为r×m的非负矩阵H,使下式满足:
V=WH
由于分解前后的矩阵中仅包含非负的元素,因此,原矩阵V中的任一个列向量解释为对W=[w1,w2,…wr]中所有列向量(称为基向量)的加权和,式中r的值选择应确保(n+m)r<n×m,所得到的WH才是V中数据的压缩形式,权重系数为H=[h1,h2,…hm]中对应列向量中的元素。这种基于基向量组合的表示形式具有很直观的语义解释,符合“局部构成整体”的思维方式。非负矩阵算法提供了基于简单迭代的求解W、H的方法,求解方法具有收敛速度快、左右非负矩阵存储空间小的特点,它能将高维的数据矩阵降维处理,适合处理大规模数据。
非负矩阵算法也有自身的局限性,虽然使用非负矩阵分解方法时的非负约束已经表示在数据上加强了一些稀疏性,但在算法中却没有定量的地控制过度的稀疏性,即非负矩阵不适合过完整的表示,过完整的意思是有限范围的空间维数被编码分解之后比输入空间的有效维数大。这个问题可以通过稀疏编码(Sparse Coding)来解决。
本发明非负稀疏编码降噪算法是将非负矩阵分解算法和稀疏编码结合起来所得到的。
非负稀疏编码算法的思想是分解信号矩阵,如下式所示:
X≈AS
其中,A为系数矩阵即基向量,S为编码矩阵即稀疏分量,A和S都为非负矩阵,这里对编码矩阵S进行稀疏控制,根据稀疏规则,它的大部分元素值为零,使系数矩阵A能更加有源特殊性。基向量A表示X的特征向量,考虑到最小重构误差,非负稀疏编码算法在矩阵分解过程中会再引入一个评价函数来衡量矩阵分解后的误差,表达式如下:
上式的约束条件为:λ>0;对于任意的ij:Xij≥0,基向量Aij≥0,稀疏Sij≥0;对于任意的系数i:‖ai‖=1,ai表示A的第i列列向量;上式中‖X-AS‖2表示矩阵的重构误差:‖X-AS‖2=∑ij[Xij-(AS)ij]2,其中i和j分别表示为行和列;Sij表示稀疏系数矩阵S的第i行和第j列的元素;参数λ表明了稀疏性和数据准确重构之间的折中关系;
如何度量S的稀疏性则取决于惩罚函数f(·)具体形式,本发明选取f(·)函数的形式为:f(s)=|s|=s(s≥0),因此,得到评价函数表达式为:
评价函数COST(A,S)是关于S项为二次的,当Sij≥0时,S是一个凸集合,存在最优的局部最小值;S迭代过程的更新规则如下:
St+1=St.*{(ATX)./(ATASt+λ)}
其中.*和./分别表示矩阵的点乘和点除操作,t为当前所处理的矩阵时间帧,t+1为下一时间帧;上标T表示矩阵转置,S是非负的,它的更新规则是通过简单的乘以一个非负因子(ATX)./(ATASt+λ)来得到的,只要S的初始值全部选择正值,S的迭代过程对任意要求的精度都能够保证达到全局最小值。
系数矩阵A使用标准的梯度下降算法来进行优化,达到其更新规则为:
其中μ为步长,β为学习速率;t为当前所处理的矩阵时间帧,t+1为下一时间帧;上标T表示矩阵转置;令At+1中的负值都为零,并限制‖At+1‖=1;在使用梯度下降算法进行基向量A的更新时,遵循投影满足非负性和范数约束的最近点规则。
本发明中对讲通讯设备中骨传导麦克风所采集到的信号为x(t),该信号中的非平稳加性噪声为n(t),假设纯净的语音信号为s(t),则得到表达式:
x(t)=s(t)+n(t)
x(t)经过短时傅立叶变换得到:
X=|STFT{x(t)}|。
参见图4,利用非负稀疏编码降噪算法对x(t)进行降噪处理,本发明基于骨传导技术的无线对讲降噪方法包括以下步骤:
S1、选用一组和含噪语音信号x(t)具有相同统计特性的纯噪声信号,通过非负稀疏编码降噪算法学习规则计算噪声信号的基向量An;
S2、获取更新需要的语音基向量As和稀疏系数Ss;
X为含噪语音信号x(t)变换后的频域信号,得到如下关系式:
上式中的下标s和n代表语音信号和噪声信号,可以看出,A矩阵的纵列顺序可以随着S的行相对的改变,所以需要通过上述预先建立的噪声模型系数矩阵An来决定。将噪声信号的基向量An带入到含噪语音信号x(t)进行非负稀疏编码降噪算法学习规则计算,当评价函数的收敛速度趋向稳定时,则得到更新需要的语音基向量As和稀疏系数Ss;
S3、语音信号还原,把降噪算法处理后的语音信号进行输出:
把降噪算法处理后的频域信号
结合相位信息并进行短时傅里叶逆变换,重叠求和后得到最终所期望降噪后的时域信号
信号
为降噪算法处理后的语音信号,该语音信号是第一对讲降噪耳罩所需要发送出去的信号,第二对讲降噪耳罩接收到第一对讲降噪耳罩所发送过来的语音信号
并通过骨传导振子进行播放。其中的发送和接收操作是在通讯模块中完成的。
以上所述仅仅是本发明的较佳实施例,并不用以对本发明的技术方案进行任何限制,本领域技术人员应当理解的是,在不脱离本发明精神和原则的前提下,该技术方案还可以进行若干简单的修改和替换,这些修改和替换也均属于权利要求书所涵盖的保护范围之内。