CN111726723B - 一种基于骨传导技术的无线对讲降噪耳罩及降噪方法 - Google Patents

一种基于骨传导技术的无线对讲降噪耳罩及降噪方法 Download PDF

Info

Publication number
CN111726723B
CN111726723B CN202010581462.2A CN202010581462A CN111726723B CN 111726723 B CN111726723 B CN 111726723B CN 202010581462 A CN202010581462 A CN 202010581462A CN 111726723 B CN111726723 B CN 111726723B
Authority
CN
China
Prior art keywords
noise reduction
module
matrix
noise
earmuff
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010581462.2A
Other languages
English (en)
Other versions
CN111726723A (zh
Inventor
陈龙
何小龙
陈静
白柱
刘琢珅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenggeng Intelligent Technology Xi'an Research Institute Co ltd
Fifth Engineering Co Ltd of China Railway First Engineering Group Co Ltd
Original Assignee
Shenggeng Intelligent Technology Xi'an Research Institute Co ltd
Fifth Engineering Co Ltd of China Railway First Engineering Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenggeng Intelligent Technology Xi'an Research Institute Co ltd, Fifth Engineering Co Ltd of China Railway First Engineering Group Co Ltd filed Critical Shenggeng Intelligent Technology Xi'an Research Institute Co ltd
Priority to CN202010581462.2A priority Critical patent/CN111726723B/zh
Publication of CN111726723A publication Critical patent/CN111726723A/zh
Application granted granted Critical
Publication of CN111726723B publication Critical patent/CN111726723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/3827Portable transceivers
    • H04B1/385Transceivers carried on the body, e.g. in helmets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/3827Portable transceivers
    • H04B1/385Transceivers carried on the body, e.g. in helmets
    • H04B2001/3872Transceivers carried on the body, e.g. in helmets with extendable microphones or earphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/10Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/01Hearing devices using active noise cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/13Hearing devices using bone conduction transducers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

一种基于骨传导技术的无线对讲降噪耳罩及降噪方法,降噪耳罩包括主控模块以及分别与主控模块相连的电源模块、拾音模块、降噪模块、通讯模块、播放模块、存储模块、耳罩模块,拾音模块由骨传导麦克风组成,降噪模块用于对拾音模块采集到的带噪语音信号进行降噪处理,播放模块由骨传导振子组成。降噪方法包括选用一组和含噪语音信号具有相同统计特性的纯噪声信号,通过非负稀疏编码降噪算法学习规则计算噪声信号的基向量;获取更新需要的语音基向量和稀疏系数;语音信号还原,把降噪算法处理后的语音信号进行输出。本发明能获取高质量的语音信息,通过耳罩的物理降噪特性对使用者的听觉系统进行防护。

Description

一种基于骨传导技术的无线对讲降噪耳罩及降噪方法
技术领域
本发明属于无线对讲领域,涉及一种基于骨传导技术的无线对讲降噪耳罩及降噪方法。
背景技术
随着无线射频技术的不断发展,便携式通讯设备的发展及使用也日益普遍。但是在特殊场景及环境下,尤其是在背景噪声比较大的场景下,如:战场环境、火灾现场以及隧道施工环境等,普通的通讯设备就很难发挥到作用。然而在抢险救灾或特殊作业时,保持通讯的畅通良好是十分重要的,现有的用于抢险救灾或特殊作业的便携式通讯设备中,为了避免通过空气传播的噪音对通话质量的影响,会采用基于骨传导技术的设备模块,骨传导振子可以使得声波与神经之间通过人体骨头传播,因此可以降低环境噪音对使用者的影响。
现有基于骨传导技术的通讯设备一般采用与肩咪或者对讲机有线连接的方式来实现通话,这样的使用方式会给特殊场景下使用者的动作带来影响。基于骨传导技术的设备无法避免与人体骨骼和衣物摩擦产生摩擦声,在风声比较大的环境中会受到气流的影响产生风噪声,也会因为自激而产生串扰噪音,这些都是非平稳的噪声。骨传导麦克风在采集语音信号的同时不可避免的也会采集到这些非平稳的噪声,带噪声的语音信号通过无限射频方式传递给接受者,由于噪声的存在,使得声音的接收方不能听到清晰的人声,从而导致不能正常判断传递过来的信息,不能及时下达指令和不能及时沟通,导致错失最佳的动作时机。
发明内容
本发明的目的在于针对上述现有技术中基于骨传导技术的通讯设备容易受噪声干扰的问题,提供一种基于骨传导技术的无线对讲降噪耳罩及降噪方法,使用者可以获取高质量的语音信息,又可以通过耳罩的物理降噪特性对使用者的听觉系统进行防护。
为了实现上述目的,本发明有如下的技术方案:
一种基于骨传导技术的无线对讲降噪耳罩,包括主控模块以及分别与主控模块相连的电源模块、拾音模块、降噪模块、通讯模块、播放模块、存储模块、耳罩模块;
所述电源模块能够在主控模块的控制下为其它模块供电;所述拾音模块由骨传导麦克风组成,用于采集使用者说话时的语音信号,并将该信号转换成电信号通过主控模块传递给降噪模块,降噪模块用于对拾音模块采集到的带噪语音信号进行降噪处理,降噪后的语音信号通过主控模块传递给通讯模块;通讯模块由发射单元、接收单元和天线单元组成,发射单元通过天线单元发送降噪模块处理后的语音信号,接收单元用于接收发射单元所发射过来的语音信号;播放模块由骨传导振子组成,骨传导振子通过颅骨的振动将通讯模块所接收到的语音信号传入使用者的内耳;所述存储模块用于存储语音数据;耳罩模块具有封装集成各个模块的腔体,耳罩模块的降噪特性对使用者的听觉进行防护。
在本发明基于骨传导技术的无线对讲降噪耳罩一种优选实施例中,所述的存储模块记录使用者在紧急情况下的语音信息,所存储的语音数据既包括使用者自身的语音信息,又包括来自其他使用者所传递过来的语音信息。
在本发明基于骨传导技术的无线对讲降噪耳罩一种优选实施例中,所述的降噪模块采用基于单通道降噪技术的非负稀疏编码降噪算法,利用非负矩阵分解算法的非负特性,并结合稀疏编码的稀疏性,通过倍增算法来更新稀疏矩阵,通过投影梯度下降法来更新特征基矩阵,最后利用收敛后所得到的稀疏矩阵和特征基矩阵估计出降噪后的语音信号。
本发明同时提供一种基于骨传导技术的无线对讲降噪方法,包括以下步骤:
S1、选用一组和含噪语音信号x(t)具有相同统计特性的纯噪声信号,通过非负稀疏编码降噪算法学习规则计算噪声信号的基向量An
S2、获取更新需要的语音基向量As和稀疏系数Ss
X为含噪语音信号x(t)变换后的频域信号,得到如下关系式:
Figure BDA0002553323400000031
上式中的下标s和n代表语音信号和噪声信号,将噪声信号的基向量An带入到含噪语音信号x(t)进行非负稀疏编码降噪算法学习规则计算,当评价函数的收敛速度趋向稳定时,则得到更新需要的语音基向量As和稀疏系数Ss
S3、语音信号还原,把降噪算法处理后的语音信号进行输出:
Figure BDA0002553323400000032
把降噪算法处理后的频域信号
Figure BDA0002553323400000033
结合相位信息并进行短时傅里叶逆变换,重叠求和后得到最终所期望降噪后的时域信号
Figure BDA0002553323400000034
在本发明基于骨传导技术的无线对讲降噪方法一种优选实施例中,所述的非负稀疏编码降噪算法学习规则是将非负矩阵分解算法和稀疏编码结合起来所得到的。
在本发明基于骨传导技术的无线对讲降噪方法一种优选实施例中,非负矩阵分解算法为,对于任意给定的一个大小为n×m的非负矩阵V,非负矩阵分解算法能够寻找到一个大小为n×r的非负矩阵W和一个大小为r×m的非负矩阵H,使得下式满足:
V=WH
分解前后的矩阵中仅包含非负的元素,原矩阵V中的任一个列向量解释为对W=[w1,w2,…wr]中所有列向量的加权和,式中r的值选择使(n+m)r<n×m,所得到的WH是V中数据的压缩形式,权重系数为H=[h1,h2,…hm]中对应列向量中的元素。
在本发明基于骨传导技术的无线对讲降噪方法一种优选实施例中,稀疏编码为,对于系数矩阵A和编码矩阵S满足下式:
X≈AS
系数矩阵A为基向量,编码矩阵S为稀疏分量,A和S都为非负矩阵,这里对编码矩阵S进行稀疏控制,引入一个评价函数来衡量矩阵分解后的误差:
Figure BDA0002553323400000041
上式的约束条件为:λ>0;对于任意的ij:Xij≥0,基向量Aij≥0,稀疏Sij≥0;对于任意的系数i:‖ai‖=1,ai表示A的第i列列向量;上式中‖X-AS‖2表示矩阵的重构误差:‖X-AS‖2=∑ij[Xij-(AS)ij]2,其中i和j分别表示为行和列;Sij表示稀疏系数矩阵S的第i行和第j列的元素;参数λ表明了稀疏性和数据准确重构之间的折中关系;
如何度量S的稀疏性则取决于惩罚函数f(·)具体形式,选取f(·)函数的形式为:f(s)=|s|=s(s≥0),因此,得到评价函数表达式为:
Figure BDA0002553323400000042
评价函数COST(A,S)是关于S项为二次的,当Sij≥0时,S是一个凸集合,存在最优的局部最小值;S迭代过程的更新规则如下:
St+1==St.*{(ATX)./(ATASt+λ)}
其中.*和./分别表示矩阵的点乘和点除操作,t为当前所处理的矩阵时间帧,t+1为下一时间帧;上标T表示矩阵转置,S是非负的,它的更新规则是通过简单的乘以一个非负因子(ATX)./(ATASt+λ)来得到的,只要S的初始值全部选择正值,S的迭代过程对任意要求的精度都能够保证达到全局最小值。
在本发明基于骨传导技术的无线对讲降噪方法一种优选实施例中,系数矩阵A使用标准的梯度下降算法来进行优化,达到其更新规则为:
Figure BDA0002553323400000043
其中μ为步长,β为学习速率;t为当前所处理的矩阵时间帧,t+1为下一时间帧;上标T表示矩阵转置;令At+1中的负值都为零,并限制‖At+1‖=1;在使用梯度下降算法进行基向量A的更新时,遵循投影满足非负性和范数约束的最近点规则。
在本发明基于骨传导技术的无线对讲降噪方法一种优选实施例中,骨传导麦克风所采集到的信号为x(t),该信号中的非平稳加性噪声为n(t),假设纯净的语音信号为s(t),则得到表达式:
x(t)=s(t)+n(t)
x(t)经过短时傅立叶变换得到:
X=|STFT{x(t)}|。
相较于现有技术,本发明基于骨传导技术的无线对讲降噪耳罩,能够帮助骨传导麦克风采集到的含有非平稳噪声的语音信号进行降噪处理,提升通讯中的话语质量和话语清晰度。拾音模块由骨传导麦克风组成,骨传导麦克风可以利用人讲话时引起的头颈部骨骼的轻微振动来把声音信号收集起来转为电信号,播放模块由骨传导振子组成,骨传导振子是基于骨传导技术的扬声器振子,通过颅骨的振动将通讯模块接收单元所接收到的语音信号传入使用者的内耳。基于全双工多通道对讲技术使得本发明耳罩一方面可以解放使用者的双手,减少线材对对使用者动作的干扰,另一方面可以加强使用者之间的沟通,满足多人之间协同配合进行工作的需要;基于耳罩模块的物理降噪性能可以对使用者的听觉系统进行防护。
进一步的,本发明的降噪模块采用基于单通道降噪技术的非负稀疏编码降噪算法,利用非负矩阵分解算法的非负特性,并结合稀疏编码的稀疏性,通过倍增算法来更新稀疏矩阵,通过投影梯度下降法来更新特征基矩阵,最后利用收敛后所得到的稀疏矩阵和特征基矩阵估计出降噪后的语音信号,能够针对化应用于语音通信的非稳定噪声,降噪效果好。
相较于现有技术,本发明基于骨传导技术的无线对讲降噪方法,使用了非负稀疏编码降噪算法学习规则计算噪声信号的基向量,由于骨传导技术借助头颈部骨骼的轻微振动来进行声音信号的采集和播放,因此在特殊场景下空气中的声波噪声对骨传导通讯设备基本没有影响,但骨传导麦克风易受到摩擦声、风噪声以及自激噪声等非平稳噪声的影响,这使得语音信号的质量和可懂度变得很差。非负稀疏编码降噪算法的核心是非负矩阵分解,表示形式具有很直观的语义解释,求解方法具有收敛速度快、左右非负矩阵存储空间小的特点,它能将高维的数据矩阵降维处理,适合处理大规模数据。但非负矩阵算法也有自身的局限性,非负矩阵不适合过完整的表示,过完整的意思是有限范围的空间维数被编码分解之后比输入空间的有效维数大,这个问题通过稀疏编码解决。获取到更新需要的语音基向量和稀疏系数之后,将语音信号还原,把降噪算法处理后的频域信号结合相位信息并进行短时傅里叶逆变换,重叠求和后得到最终所期望降噪后的时域信号进行输出。该方法能对骨传导麦克风所采集到的含有非平稳噪声的语音信号进行降噪处理,有效提升通讯过程的话语质量和话语清晰度。
附图说明
图1本发明无线对讲降噪耳罩的结构框图;
图2本发明两个无线对讲降噪耳罩之间交互示意图;
图3本发明耳罩模块的封装方式示意图;
图4本发明基于骨传导技术的无线对讲降噪方法流程图;
附图中:1-电源模块;2-拾音模块;3-降噪模块;4-通讯模块;5-播放模块;6-存储模块;7-耳罩模块;8-主控模块。
具体实施方式
下面结合附图对本发明做进一步的详细说明。
参见图1,本发明基于骨传导技术的无线对讲降噪耳罩包括电源模块1、拾音模块2、降噪模块3、通讯模块4、播放模块5、存储模块6、耳罩模块7以及主控模块8。
电源模块1为整个对讲降噪耳罩系统的正常工作提供电源;可以通过主控模块8控制电源模块1是否给对讲降噪耳罩系统供电;
拾音模块2由基于骨传导技术的麦克风即骨传导麦克风组成,可以利用人讲话时引起的头颈部骨骼的轻微振动来把声音信号收集起来转为电信号。在本实施例中,该模块主要用于采集使用者说话时的语音信号,并将该信号转换成电信号通过主控模块8传递给降噪模块3;
降噪模块3主要用于对拾音模块2所采集到的带噪语音信号进行降噪算法处理,在本发明的实施例中,所使用的降噪算法是基于单通道降噪技术的非负稀疏编码降噪算法。该降噪算法利用非负矩阵分解算法的非负特性,并结合稀疏编码的稀疏性,通过倍增算法来更新稀疏矩阵,通过投影梯度下降法来更新特征基矩阵;最后利用收敛后所得到的稀疏矩阵和特征基矩阵估计出降噪后的语音信号,并把该语音信号通过主控模块8传递给通讯模块4的发射单元,发射单元通过天线单元把降噪后的语音数据发送出去。
通讯模块4主要由发射单元、接收单元和天线单元组成。其中,通讯模块4的发射单元用于发送降噪模3处理后的语音信号,通讯模块4的接收单元用于接收发射单元所发射过来的语音信号。参见图2,第一对讲降噪耳罩的通讯模块4的发射单元通过天线单元发送第一对讲降噪耳罩的降噪模块3处理后的语音信号,第二对讲降噪耳罩的通信模块4的接收单元通过天线单元接收第一对讲降噪耳罩所发射过来的语音信号,并把该语音信号的数据通过主控模块8传递给第二对讲降噪耳罩的播放模块5。同理,第一对讲降噪耳罩的通讯模块4的接收单元也会通过天线单元接收到第二对讲降噪耳罩的通讯模块4的发射单元通过天线单元所发送的语音信号,并把该信号通过主控模块8传递给第一对讲降噪耳罩的播放模块5。借助通讯模块4便能够实现第一对讲降噪耳罩和对第二讲降噪耳罩之间的对讲工能。
播放模块5要由基于骨传导技术的扬声器振子即骨传导振子组成。骨传导振子通过颅骨的振动将通讯模块4的接收单元所接收到的语音信号传入使用者的内耳,使用者借助骨传导振子便可听到语音信号的信息和内容;
存储模块6主要用于存储语音数据,记录使用者在紧急情况下的语音信息;该模块所存储的语音数据既有使用者自身的语音信息,又有来自其他使用者所传递过来的语音信息。
耳罩模块7由物理降噪材质组成。耳罩模块7主要两个作用:第一,对各个模块进行封装集成,把上述的各个模块封装在腔体内,第二,利用降噪特性对使用者的听觉系统进行防护。如图3所示,本发明实施例中的左耳罩封装播放模块5,右耳罩封装拾音模块2以及主控模块8、降噪模块3、电源模块1、通讯模块4的发射单元和接收单元、存储模块6,同时在右耳罩外壳上设置指示灯、电源按键、音量键+、音量键-、天线以及充电口。
主控模块8主要用于对其他模块:电源模块1、拾音模块2、降噪模块3、通讯模块4、播放模块5、存储模块6和耳罩模块7进行命令控制和交互,协调各个模块进行配合工作。
本发明把骨传导技术、单通道降噪技术、全双工对讲技术和耳罩物理降噪性能结合在一起,实现在特殊场景下具有降噪性能和防护功能的多人对讲耳罩。基于骨传导技术的麦克风可以利用人讲话时引起的头颈部骨骼的轻微振动来把声音信号收集起来转为电信号,这种特殊的麦克风称为骨传导麦克风;基于骨传导技术的扬声器可以通过头颈部骨骼的轻微振动将声音传入内耳,这种特殊的扬声器称为骨传导振子。由于骨传导技术借助头颈部骨骼的轻微振动来进行声音信号的采集和播放,在特殊场景下空气中的声波噪声对骨传导通讯设备基本没有影响,因此适于在嘈杂、强背景噪声等特殊场景中语音对讲。尽管骨传导通讯设备在嘈杂、强背景噪声等特殊场景能够进行语音对讲,但由于骨传导麦克风易受到摩擦声、风噪声以及自激噪声等非平稳噪声的影响,使得语音信号的质量和可懂度变得很差,为了提高通讯设备中的语音质量,本发明采用基于语音通信的非稳定噪声单通道降噪技术—非负稀疏编码降噪算法对骨传导麦克风所采集到的信号进行处理,该处理过程在降噪模块中进行。
非负稀疏编码降噪算法的核心原理是非负矩阵分解(NMF)算法。非负矩阵算法分解的基本思想可以简单的描述为:对于任意给定的一个大小为n×m的非负矩阵V,非负矩阵算法能够寻找到一个大小为n×r的非负矩阵W和一个大小为r×m的非负矩阵H,使下式满足:
V=WH
由于分解前后的矩阵中仅包含非负的元素,因此,原矩阵V中的任一个列向量解释为对W=[w1,w2,…wr]中所有列向量(称为基向量)的加权和,式中r的值选择应确保(n+m)r<n×m,所得到的WH才是V中数据的压缩形式,权重系数为H=[h1,h2,…hm]中对应列向量中的元素。这种基于基向量组合的表示形式具有很直观的语义解释,符合“局部构成整体”的思维方式。非负矩阵算法提供了基于简单迭代的求解W、H的方法,求解方法具有收敛速度快、左右非负矩阵存储空间小的特点,它能将高维的数据矩阵降维处理,适合处理大规模数据。
非负矩阵算法也有自身的局限性,虽然使用非负矩阵分解方法时的非负约束已经表示在数据上加强了一些稀疏性,但在算法中却没有定量的地控制过度的稀疏性,即非负矩阵不适合过完整的表示,过完整的意思是有限范围的空间维数被编码分解之后比输入空间的有效维数大。这个问题可以通过稀疏编码(Sparse Coding)来解决。
本发明非负稀疏编码降噪算法是将非负矩阵分解算法和稀疏编码结合起来所得到的。
非负稀疏编码算法的思想是分解信号矩阵,如下式所示:
X≈AS
其中,A为系数矩阵即基向量,S为编码矩阵即稀疏分量,A和S都为非负矩阵,这里对编码矩阵S进行稀疏控制,根据稀疏规则,它的大部分元素值为零,使系数矩阵A能更加有源特殊性。基向量A表示X的特征向量,考虑到最小重构误差,非负稀疏编码算法在矩阵分解过程中会再引入一个评价函数来衡量矩阵分解后的误差,表达式如下:
Figure BDA0002553323400000091
上式的约束条件为:λ>0;对于任意的ij:Xij≥0,基向量Aij≥0,稀疏Sij≥0;对于任意的系数i:‖ai‖=1,ai表示A的第i列列向量;上式中‖X-AS‖2表示矩阵的重构误差:‖X-AS‖2=∑ij[Xij-(AS)ij]2,其中i和j分别表示为行和列;Sij表示稀疏系数矩阵S的第i行和第j列的元素;参数λ表明了稀疏性和数据准确重构之间的折中关系;
如何度量S的稀疏性则取决于惩罚函数f(·)具体形式,本发明选取f(·)函数的形式为:f(s)=|s|=s(s≥0),因此,得到评价函数表达式为:
Figure BDA0002553323400000101
评价函数COST(A,S)是关于S项为二次的,当Sij≥0时,S是一个凸集合,存在最优的局部最小值;S迭代过程的更新规则如下:
St+1=St.*{(ATX)./(ATASt+λ)}
其中.*和./分别表示矩阵的点乘和点除操作,t为当前所处理的矩阵时间帧,t+1为下一时间帧;上标T表示矩阵转置,S是非负的,它的更新规则是通过简单的乘以一个非负因子(ATX)./(ATASt+λ)来得到的,只要S的初始值全部选择正值,S的迭代过程对任意要求的精度都能够保证达到全局最小值。
系数矩阵A使用标准的梯度下降算法来进行优化,达到其更新规则为:
Figure BDA0002553323400000102
其中μ为步长,β为学习速率;t为当前所处理的矩阵时间帧,t+1为下一时间帧;上标T表示矩阵转置;令At+1中的负值都为零,并限制‖At+1‖=1;在使用梯度下降算法进行基向量A的更新时,遵循投影满足非负性和范数约束的最近点规则。
本发明中对讲通讯设备中骨传导麦克风所采集到的信号为x(t),该信号中的非平稳加性噪声为n(t),假设纯净的语音信号为s(t),则得到表达式:
x(t)=s(t)+n(t)
x(t)经过短时傅立叶变换得到:
X=|STFT{x(t)}|。
参见图4,利用非负稀疏编码降噪算法对x(t)进行降噪处理,本发明基于骨传导技术的无线对讲降噪方法包括以下步骤:
S1、选用一组和含噪语音信号x(t)具有相同统计特性的纯噪声信号,通过非负稀疏编码降噪算法学习规则计算噪声信号的基向量An
S2、获取更新需要的语音基向量As和稀疏系数Ss
X为含噪语音信号x(t)变换后的频域信号,得到如下关系式:
Figure BDA0002553323400000111
上式中的下标s和n代表语音信号和噪声信号,可以看出,A矩阵的纵列顺序可以随着S的行相对的改变,所以需要通过上述预先建立的噪声模型系数矩阵An来决定。将噪声信号的基向量An带入到含噪语音信号x(t)进行非负稀疏编码降噪算法学习规则计算,当评价函数的收敛速度趋向稳定时,则得到更新需要的语音基向量As和稀疏系数Ss
S3、语音信号还原,把降噪算法处理后的语音信号进行输出:
Figure BDA0002553323400000112
把降噪算法处理后的频域信号
Figure BDA0002553323400000113
结合相位信息并进行短时傅里叶逆变换,重叠求和后得到最终所期望降噪后的时域信号
Figure BDA0002553323400000114
信号
Figure BDA0002553323400000115
为降噪算法处理后的语音信号,该语音信号是第一对讲降噪耳罩所需要发送出去的信号,第二对讲降噪耳罩接收到第一对讲降噪耳罩所发送过来的语音信号
Figure BDA0002553323400000116
并通过骨传导振子进行播放。其中的发送和接收操作是在通讯模块中完成的。
以上所述仅仅是本发明的较佳实施例,并不用以对本发明的技术方案进行任何限制,本领域技术人员应当理解的是,在不脱离本发明精神和原则的前提下,该技术方案还可以进行若干简单的修改和替换,这些修改和替换也均属于权利要求书所涵盖的保护范围之内。

Claims (4)

1.一种基于骨传导技术的无线对讲降噪方法,其特征在于,包括以下步骤:
S1、选用一组和含噪语音信号x(t)具有相同统计特性的纯噪声信号,通过非负稀疏编码降噪算法学习规则计算噪声信号的基向量An
S2、获取更新需要的语音基向量As和稀疏系数Ss
X为含噪语音信号x(t)变换后的频域信号,得到如下关系式:
Figure FDA0003596871760000011
上式中的下标s和n代表语音信号和噪声信号,将噪声信号的基向量An带入到含噪语音信号x(t)进行非负稀疏编码降噪算法学习规则计算,当评价函数的收敛速度趋向稳定时,则得到更新需要的语音基向量As和稀疏系数Ss
S3、语音信号还原,把降噪算法处理后的语音信号进行输出:
Figure FDA0003596871760000012
把降噪算法处理后的频域信号
Figure FDA0003596871760000013
结合相位信息并进行短时傅里叶逆变换,重叠求和后得到最终所期望降噪后的时域信号
Figure FDA0003596871760000014
最终所期望降噪后的时域信号
Figure FDA0003596871760000015
也是第一对讲降噪耳罩所需要发送出去的语音信号,第二对讲降噪耳罩接收到第一对讲降噪耳罩所发送过来的语音信号;
所述的非负稀疏编码降噪算法学习规则是将非负矩阵分解算法和稀疏编码结合起来所得到的;
非负矩阵分解算法为,对于任意给定的一个大小为n×m的非负矩阵V,非负矩阵分解算法能够寻找到一个大小为n×r的非负矩阵W和一个大小为r×m的非负矩阵H,使得下式满足:
V=WH
分解前后的矩阵中仅包含非负的元素,原矩阵V中的任一个列向量解释为对W=[w1,w2,...wr]中所有列向量的加权和,式中r的值选择使(n+m)r<n×m,所得到的WH是V 中数据的压缩形式,权重系数为H=[h1,h2,...hm]中对应列向量中的元素;
稀疏编码为,对于系数矩阵A和编码矩阵S满足下式:
X≈AS
系数矩阵A为基向量,编码矩阵S为稀疏分量,A和S都为非负矩阵,这里对编码矩阵S进行稀疏控制,引入一个评价函数来衡量矩阵分解后的误差:
Figure FDA0003596871760000021
上式的约束条件为:λ>0;对于任意的ij:Xij≥0,基向量Aij≥0,稀疏Sij≥0;对于任意的系数i:||ai||=1,ai表示A的第i列列向量;上式中||X-AS||2表示矩阵的重构误差:||X-AS||2=∑ij[Xij-(AS)ij]2,其中i和j分别表示为行和列;Sij表示稀疏系数矩阵S的第i行和第j列的元素;参数λ表明了稀疏性和数据准确重构之间的折中关系;
如何度量S的稀疏性则取决于惩罚函数f(·)具体形式,选取f(·)函数的形式为:f(s)=|s|=s(s≥0),因此,得到评价函数表达式为:
Figure FDA0003596871760000022
评价函数COST(A,S)是关于S项为二次的,当Sij≥0时,S是一个凸集合,存在最优的局部最小值;S迭代过程的更新规则如下:
St+1=St.*{(ATX)./(ATASt+λ)}
其中.*和./分别表示矩阵的点乘和点除操作,t为当前所处理的矩阵时间帧,t+1为下一时间帧;上标T表示矩阵转置,S是非负的,它的更新规则是通过简单的乘以一个非负因子(ATX)./(ATASt+λ)来得到的,只要S的初始值全部选择正值,S的迭代过程对任意要求的精度都能够保证达到全局最小值;
系数矩阵A使用标准的梯度下降算法来进行优化,达到其更新规则为:
Figure FDA0003596871760000031
其中μ为步长,β为学习速率;t为当前所处理的矩阵时间帧,t+1为下一时间帧;上标T表示矩阵转置;令At+1中的负值都为零,并限制||At+1||=1;在使用梯度下降算法进行基向量A的更新时,遵循投影满足非负性和范数约束的最近点规则。
2.根据权利要求1所述基于骨传导技术的无线对讲降噪方法,其特征在于:
骨传导麦克风所采集到的信号为x(t),该信号中的非平稳加性噪声为n(t),假设纯净的语音信号为s(t),则得到表达式:
x(t)=s(t)+n(t)
x(t)经过短时傅里 叶变换得到:
X=|STFT{x(t)}|。
3.一种基于骨传导技术的无线对讲降噪耳罩,其特征在于,用于实现如权利要求1或2所述基于骨传导技术的无线对讲降噪方法,包括主控模块(8)以及分别与主控模块(8)相连的电源模块(1)、拾音模块(2)、降噪模块(3)、通讯模块(4)、播放模块(5)、存储模块(6)、耳罩模块(7);所述电源模块(1)能够在主控模块(8)的控制下为其它模块供电;所述拾音模块(2)由骨传导麦克风组成,用于采集使用者说话时的语音信号,并将该信号转换成电信号通过主控模块(8)传递给降噪模块(3),降噪模块(3)用于对拾音模块(2)采集到的带噪语音信号进行降噪处理,降噪后的语音信号通过主控模块(8)传递给通讯模块(4);通讯模块(4)由发射单元、接收单元和天线单元组成,发射单元通过天线单元发送降噪模块处理后的语音信号,接收单元用于接收发射单元所发射过来的语音信号;播放模块(5)由骨传导振子组成,骨传导振子通过颅骨的振动将通讯模块(4)所接收到的语音信号传入使用者的内耳;所述存储模块(6)用于存储语音数据;耳罩模块(7)具有封装集成各个模块的腔体,耳罩模块(7)的降噪特性对使用者的听觉进行防护;所述耳罩模块(7)的左耳罩封装播放模块(5),右耳罩封装拾音模块(2)以及主控模块(8)、降噪模块(3)、电源模块(1)、通讯模块(4)的发射单元和接收单元、存储模块(6),同时在右耳罩外壳上设置指示灯、电源按键、音量键+、音量键-、天线以及充电口;所述的降噪模块(3)采用基于单通道降噪技术的非负稀疏编码降噪算法,利用非负矩阵分解算法的非负特性,并结合稀疏编码的稀疏性,通过倍增算法来更新稀疏矩阵,通过投影梯度下降法来更新特征基矩阵,最后利用收敛后所得到的稀疏矩阵和特征基矩阵估计出降噪后的语音信号。
4.根据权利要求3所述基于骨传导技术的无线对讲降噪耳罩,其特征在于:
所述的存储模块(6)记录使用者在紧急情况下的语音信息,所存储的语音数据既包括使用者自身的语音信息,又包括来自其他使用者所传递过来的语音信息。
CN202010581462.2A 2020-06-23 2020-06-23 一种基于骨传导技术的无线对讲降噪耳罩及降噪方法 Active CN111726723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010581462.2A CN111726723B (zh) 2020-06-23 2020-06-23 一种基于骨传导技术的无线对讲降噪耳罩及降噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010581462.2A CN111726723B (zh) 2020-06-23 2020-06-23 一种基于骨传导技术的无线对讲降噪耳罩及降噪方法

Publications (2)

Publication Number Publication Date
CN111726723A CN111726723A (zh) 2020-09-29
CN111726723B true CN111726723B (zh) 2022-06-07

Family

ID=72568414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010581462.2A Active CN111726723B (zh) 2020-06-23 2020-06-23 一种基于骨传导技术的无线对讲降噪耳罩及降噪方法

Country Status (1)

Country Link
CN (1) CN111726723B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106597439A (zh) * 2016-12-12 2017-04-26 电子科技大学 一种基于增量学习的合成孔径雷达目标识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5315506B2 (ja) * 2006-03-22 2013-10-16 ボーン・トーン・コミュニケイションズ・リミテッド 骨伝導音伝播のための方法及びシステム
CN105957537B (zh) * 2016-06-20 2019-10-08 安徽大学 一种基于l1/2稀疏约束卷积非负矩阵分解的语音去噪方法和系统
CN106162405A (zh) * 2016-07-27 2016-11-23 努比亚技术有限公司 降噪装置、耳机及降噪方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106597439A (zh) * 2016-12-12 2017-04-26 电子科技大学 一种基于增量学习的合成孔径雷达目标识别方法

Also Published As

Publication number Publication date
CN111726723A (zh) 2020-09-29

Similar Documents

Publication Publication Date Title
EP4033784A1 (en) A hearing device comprising a recurrent neural network and a method of processing an audio signal
CN110740412B (zh) 包括语音存在概率估计器的听力装置
EP2882204B1 (en) Hearing aid device for hands free communication
CN111292759A (zh) 一种基于神经网络的立体声回声消除方法及系统
US11696079B2 (en) Hearing device comprising a recurrent neural network and a method of processing an audio signal
US20160111078A1 (en) Apparatus, system and method of controlling noise within a noise-controlled volume
WO2022135340A1 (zh) 一种主动降噪的方法、设备及系统
CN103026738A (zh) 助听器系统中信号处理的方法和助听器系统
CN116030823B (zh) 一种语音信号处理方法、装置、计算机设备及存储介质
JP2022531363A (ja) 骨伝導センサを備える聴覚機器
CN112005300B (zh) 语音信号的处理方法和移动设备
CN115474121A (zh) 主动降噪方法、装置、芯片、耳机及存储介质
CN112399301A (zh) 耳机及降噪方法
Halkosaari et al. Directivity of artificial and human speech
US20240205615A1 (en) Hearing device comprising a speech intelligibility estimator
CN111726723B (zh) 一种基于骨传导技术的无线对讲降噪耳罩及降噪方法
CN108540912A (zh) 听力设备、方法和听力系统
CN107251134B (zh) 在噪声受控体积内控制噪声的装置、系统和方法
Miyahara et al. A hearing device with an adaptive noise canceller for noise-robust voice input
US11871190B2 (en) Separating space-time signals with moving and asynchronous arrays
CN117275446B (zh) 一种基于声音事件检测的交互式有源噪声控制系统及方法
US11812224B2 (en) Hearing device comprising a delayless adaptive filter
CN116895284B (zh) 自适应声掩蔽方法、装置、设备及可读存储介质
CN117896469B (zh) 音频分享方法、装置、计算机设备和存储介质
US20230206941A1 (en) Audio system, audio device, and method for speaker extraction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210126

Address after: 710075 area a and area C, 12 / F, building 5, digital China Science and Technology Park, No. 20, Zhangba Street office, Yanta District, Xi'an City, Shaanxi Province

Applicant after: Shenggeng Intelligent Technology (Xi'an) Research Institute Co.,Ltd.

Applicant after: THE FIFTH ENGINEERING CO., LTD. OF CHINA RAILWAY FIRST ENGINEERING Group

Address before: 710075 area a and area C, 12 / F, building 5, digital China Science and Technology Park, No. 20, Zhangba Street office, Yanta District, Xi'an City, Shaanxi Province

Applicant before: Shenggeng Intelligent Technology (Xi'an) Research Institute Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant