CN111261182A - 适用于人工耳蜗的风噪抑制方法及其系统 - Google Patents

适用于人工耳蜗的风噪抑制方法及其系统 Download PDF

Info

Publication number
CN111261182A
CN111261182A CN202010375597.3A CN202010375597A CN111261182A CN 111261182 A CN111261182 A CN 111261182A CN 202010375597 A CN202010375597 A CN 202010375597A CN 111261182 A CN111261182 A CN 111261182A
Authority
CN
China
Prior art keywords
wind noise
frequency
value
band
peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010375597.3A
Other languages
English (en)
Other versions
CN111261182B (zh
Inventor
蔡宜庭
樊伟
刘新东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Lishengte Medical Technology Co ltd
Original Assignee
Shanghai Lishengte Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Lishengte Medical Technology Co ltd filed Critical Shanghai Lishengte Medical Technology Co ltd
Priority to CN202010375597.3A priority Critical patent/CN111261182B/zh
Publication of CN111261182A publication Critical patent/CN111261182A/zh
Application granted granted Critical
Publication of CN111261182B publication Critical patent/CN111261182B/zh
Priority to PCT/CN2021/081522 priority patent/WO2021223518A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明公开了一种适用于人工耳蜗的风噪抑制方法及其系统,该风噪抑制方法包括如下步骤:1、将数字信号分割成信号帧;2、首先将信号帧转换成初始频域信号,其次计算能量谱,再次探测风噪特征并进行是否含有风噪的判断,最后更新风噪探测数值;3、设定初始值及风噪阈值,通过风噪探测数值判断是否开启风噪状态;4、通过舒适水平值和能量谱进行抑制风噪用的增益计算,对初始频域信号施加增益获得新频域信号;将新频域信号变换到新时域信号,获得降噪后的声音信号帧。该风噪抑制方法及其系统通过实时探测风噪进而对声音信号进行风噪抑制处理,提高了在风噪环境下声音信号中语音的清晰度、识别率,从而改善了使用者的使用体验。

Description

适用于人工耳蜗的风噪抑制方法及其系统
技术领域
本发明涉及一种风噪抑制方法及其系统,尤其涉及一种适用于人工耳蜗的风噪抑制方法及其系统。
背景技术
风噪源于起风时气流与麦克风振膜之间的碰撞,空气湍流中含有气压波动,触碰到麦克风时,这股波动便会被麦克风转换为电流信号的波动,因此风噪对麦克风的收入信息影响非常大,能够重度干扰人工耳蜗使用者对言语的识别。为了提高人工耳蜗的用户体验,风噪抑制功能是不可或缺的,市面上有很多风噪抑制方法,但是绝大部分方法都无法直接应用于人工耳蜗上。首先,人工耳蜗的语音处理器一般置于使用者的耳背,机体轻小是重点,无法进行硬件上的抗风噪改装;其次,风噪抑制只是人工耳蜗语音处理器功能的一小部分,大部分运算空间及时间需要留给其它功能,例如言语策略、电极脉冲安排和其它语音增强功能(包括未来应需求所新增的功能),这一系列功能都必须实时完成。许多应用于手机以及耳机上的风噪抑制方法在人工耳蜗上计算量过高并不理想。因此,开发一个计算量要求低但是又有效的风噪抑制方法很重要。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种适用于人工耳蜗的风噪抑制方法及其系统,其能对声音信号进行动态风噪抑制处理。
为实现上述目的,本发明提供了一种适用于人工耳蜗的风噪抑制方法,其包括如下步骤:(A)将输入的数字信号分割成信号帧;(B)首先,通过WOLA分析滤波器组将信号帧从初始时域信号转换成初始频域信号,其次,计算初始频域信号各频带的能量值,得到能量谱,再次,探测初始频域信号的风噪特征并进行是否含有风噪的判断,最后,风噪特征的判断结果构成风噪探测数值,并且不同风噪特征的判断结果以不同的幅度更新风噪探测数值;(C)设定初始值及风噪阈值,当风噪探测数值从初始值增涨至风噪阈值,不再增涨,此时开启风噪状态,当风噪探测数值从风噪阈值降低至初始值时,不再降低,此时关闭风噪状态,以此周而往复;(D)将能量谱转为dB值;计算能量谱的中心频率区域的平均能量值作为舒适水平值;设定风噪频率,将低于风噪频率的频带进行分组;计算每个频带组的最小能量值;利用舒适水平值与每个频带组最小能量值之间的差获得与频带组数量相同的dB增益,并转为线性增益;每个低于风噪频率的频带分配其所属频带组的对应的线性增益,高于风噪频率的频带则分配增益1,各频带都获得对应的最终增益;对初始频域信号各频带施加对应的最终增益,获得新频域信号;通过WOLA分析的反向操作WOLA合成函数将新频域信号变换到新时域信号,获得风噪抑制后的信号帧。
在步骤B中,风噪特征包括低频能量比,子带频谱质心及其谐波特征三种中的任意几种。
风噪特征还包括初始时域信号的过零率。进一步,设定过零率阈值,当过零率小于过零率阈值时,判断当下信号帧含有风噪,反之为无风噪。
低频能量比的判断方法:设定低频能量比阈值,当低频能量比大于低频能量比阈值时,判断当下信号帧含有风噪,反之为无风噪。
子带频谱质心的判断方法:设定子带频谱质心阈值,当子带频谱质心小于子带频谱质心阈值时,判断当下信号帧含有风噪,反之为无风噪。
谐波特征的判断方法:从频带1-5中找出峰值最大的基频峰,然后自基频峰开始至频带20搜索峰点,每个频带频宽为62.5Hz,当发生以下任一情况时,则判断为无风噪:找不到基频峰;自基频峰至频带20搜索峰点时有超过2个峰值大于四分之一基频峰值的峰点;自基频峰至频带20搜索峰点时,有峰值大于两倍基频峰值的峰点。
在步骤D中,当一个频带组的线性增益被发现小于前一个频带组的线性增益时,使用前一个频带组的线性增益。
在步骤D中,如果计算频带组最小能量值时,发现数值较舒适水平值小,则停止当下及剩余频带组的增益计算。
本发明还提供了一种适用于人工耳蜗的风噪抑制系统,其包括分帧程序模块,风噪探测程序模块,风噪判断程序模块,及其风噪抑制程序模块,其中,该分帧程序模块对数字信号进行分帧处理,该风噪探测程序模块进行风噪探测处理,其包括WOLA分析程序模块,能量谱计算程序模块,风噪特征探测程序模块及其更新风噪探测数值程序模块,该风噪判断程序模块进行风噪判断处理,该风噪抑制程序模块进行风噪抑制处理,其包括增益计算程序模块,增益施加程序模块及其WOLA合成程序模块。
本发明适用于人工耳蜗的风噪抑制方法及其系统通过实时探测风噪特征进而对声音信号进行动态风噪抑制处理,提高了在风噪环境下声音信号中语音的清晰度、识别率,从而改善了使用者的使用体验,而且可适用于低功耗的处理器,应用场景广泛。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明适用于人工耳蜗的风噪抑制方法的流程图。
图2是本发明风噪探测的流程图。
图3是本发明风噪抑制的流程图。
图4是信号帧含有风噪时的能量分布示意图。
图5是信号帧无风噪时的能量分布示意图。
图6是本发明风噪抑制效果能量分布示意图。
具体实施方式
如图1所示,本发明提供了一种适用于人工耳蜗的风噪抑制方法,其包括分帧,风噪探测,风噪判断及其风噪抑制四个步骤。
分帧:将输入的数字信号分割成信号帧,以利于后续的分析和处理。
如图2所示,风噪探测包括WOLA(Weighted Overlap and Add)分析,能量谱计算,风噪特征探测及其更新风噪探测数值四个步骤。
WOLA分析:通过WOLA分析滤波器组将信号帧从初始时域信号转换成初始频域信号,其中,WOLA分析滤波器组是DFT(Discrete Fourier Transform)滤波器组的高效实现方式,可将声音信号分解为从0到频率Fs/2不同频率的窄带信号,获得信号帧频谱的数据,适合对音频信号进行快速处理。
能量谱计算:计算初始频域信号各频带的能量值,去除复数,得到相应的能量分布,即能量谱。
风噪特征探测:探测初始频域信号的风噪特征并进行是否含有风噪的判断,其中,风噪特征为能对信号帧是否含有风噪进行区别的特征,比如初始频域信号的低频能量比(Low-to-high-frequency energy ratio)、子带频谱质心(Spectral Sub-band Centroid)及其谐波特征。
低频能量比是指在能量谱中,低频区域对高频区域的能量比值,因为风噪低频信息含量高,所以当低频能量比大于低频能量比阈值时,判断当下信号帧含有风噪,低频能量比阈值的数值可根据实际情况设定。含有风噪时信号低频部分肯定是偏大的,而信号低频部分偏大时,风噪却不一定存在,所以用低频能量比做风噪探测时,大多情况下漏判率低,但是误判率高。
子带频谱质心是指选取频谱中的一个局部频率范围,在范围内根据各频率能量值计算频率质心的位置,质心的频率代表了信号帧的能量在选取频率范围内集中的位置,和计算一个物体质心的位置一个道理,只是这里计算的是信号帧的能量集中在一个频率范围内的位置。即使是在低频范围中,风噪的频率重心也会偏向更低处,所以当子带频谱质心小于子带频谱质心阈值时,判断当下信号帧含有风噪,该方法误判率以及漏判率相对平衡。
不同于人类的语音,风噪基本上最多只会有一个幅度很小的谐振峰,而基频峰也只处于小于300Hz的位置,所以通过谐波现象就能判断有无风噪。如果能在能量谱上追踪到多个峰值相较于基频峰算大的谐振峰,则代表当下信号帧极大可能是没有被风噪干扰的纯净语音信号。图4及图5中,N为风噪能量分布,S为纯净语音信号能量分布,信号帧能量分布X=S+N。如图4所示,此信号帧能量分布X仅有一个谐振峰,其含有风噪;相对的,如图5所示,此信号帧能量分布含X有多个幅度大的谐振峰,其无风噪。因为谐波现象明显时, 风噪基本是不会存在的,所以用谐波特征作为风噪探测指标时,真负率(True negative rate)较高,真负率指实际无风噪然后判断出无风噪的几率。
进一步,初始时域信号的特征也可用于风噪特征探测,比如过零率,过零率是指一定时间内信号变换正负符号的比率。过零率会受信号频谱幅度值最高的几个频带影响,如果幅度值比较高的几个频带都处于高频区,则信号会产生高过零率;相反,如果幅度值比较高的几个频带都处于低频区,则信号会产生低过零率。因为风噪属于低频信号,信号帧的过零率越低,则越有可能是风噪。当过零率大于过零率阈值时,判断为无风噪。根据所设定的过零率阈值,其漏判率和误判率会有所变动,一般低漏判率会导致高误判率,而低误判率会导致高漏判率。
更新风噪探测数值:风噪探测数值由风噪特征构成,不同探测方法取得的风噪特征有不同的优势与劣势,例如:过零率在误判率低的情况下,漏判率会较高,这种情况下如果判断结果为 “含有风噪”,则现实 “含有风噪” 的几率很大;谐波特征是真负率高,这种情况下如果判断结果为“无风噪”,则现实 “无风噪” 的几率很大,为了在保证低漏判率的同时降低误判率,不同风噪特征的判断结果以不同的幅度更新风噪探测数值,风噪特征在每一次做出判断的同时,会对风噪探测数值进行相应的递增以及递减,即判断含有风噪则递增,判断无风噪则递减,且误判率低的风噪特征设较大递增数值,漏判率低的风噪特征设较大递减数值。
风噪判断:因为风有时会渐弱、背景噪声有时会干扰、加上以上探测方法不可能100% 准确,所以就算一直身处在一个风噪环境中,肯定会有一些信号帧不会被判断为含有风噪,相反,就算在无风噪环境下,也有个别的信号帧可能会被判断为含有风噪,所以,仅仅进行逐帧的独立判断会导致判断结果太零散,造成风噪抑制开关切换太频繁,引起不舒适感,故,设定初始值及风噪阈值,初始值与风噪阈值的设定将时间因素纳入判断方法中,并以此进行稳定的环境状态判断,当风噪探测数值从初始值增涨至风噪阈值,不再增涨,此时开启风噪状态,即进入下一步对信号帧进行风噪抑制处理,当风噪探测数值从风噪阈值降低至初始值时,不再降低,此时关闭风噪状态,即停止对信号帧进行风噪处理,以此周而往复,其中,初始值设为0。
不同于一般的“风噪探测数值大于所设阈值即为含有风噪,风噪探测数值小于所设阈值即无风噪”的手法,这里加入了“环境状态”。刚开始,系统会判断当下为无风噪状态,而风噪探测数值为0。在关闭风噪状态下,每个信号帧都会被判为无风噪,风噪探测数值需要增长到风噪阈值才会开启风噪状态;在开启风噪状态下,每个信号帧都会被判为含有风噪,风噪探测数值需要回到0才会回到关闭风噪状态。风噪探测数值会被限制在0至风噪阈值的范围内。这样做能保证风噪抑制的开关切换之间有一定的缓冲和判断时间,有效回避了风噪抑制开关频繁切换的情况
如图3所示,风噪抑制包括增益计算,增益施加,及其WOLA合成三个步骤。
增益计算:因为风噪的频率不会很高,所以设定一个风噪频率,只对低于风噪频率的频带进行处理,其余的频带增益皆设为1,计算当下信号帧中纯净语音的能量估值当做舒适水平值,然后将低于风噪频率的频带按照顺序分组,再将各频带以组为单位衰减(即同一组的频带衰减力度相同)。
舒适水平值是指当下语音信号如果不受风噪影响,本应会有的平均能量值。因为纯净语音信号的响度是根据人工耳蜗使用者的处境随时变化的,所以设定固定的舒适水平值并不理想。因为高于风噪频率以上的部分基本没有被风噪影响,所以舒适水平值可以用当下信号帧高于风噪频率以上的频带的平均能量值计算,为了节省运算量,可选取纯净语音信号集中的频带的平均能量值进行计算。
将频带分组有两个好处:第一,保留一定的低频言语信息,即保留低频区域的峰点和局部变化趋势,如果增益计算是针对单个频带的,则最终每个频带的能量值都会被降至舒适水平值附近,频谱上低频区域所有的峰点都会被消除,因此,这里将频带分组,邻近的频带会被分至同一组,而增益的计算变成以组为单位,虽然每一组频带的整体能量水平会被降至舒适水平值附近,但是只要是同一组内的频带,衰减力度都相同,这样做能够维持组内频带之间的能量差值,也成功保留了各个峰点;第二,节省运算量,以组为单位进行增益计算可以减少dB转线性等运算的数量。
增益的计算步骤如下:
1、将能量谱转为dB值;
2、计算能量谱的中心频率区域的平均能量值作为舒适水平值,其中,中心频率区域为纯净语音信号集中的频带,范围为3000Hz-4000Hz。
3、设定风噪频率,将低于风噪频率的频带进行分组;
4、计算每个频带组的最小能量值。
5、利用舒适水平值与每个频带组最小能量值之间的差获得与频带组数量相同的dB增益,并转为线性增益。
6、分配增益至所有频带,每个低于风噪频率的频带分配其所属频带组的对应的线性增益,高于风噪频率的频带则分配增益1,各频带都获得对应的最终增益。
在步骤5中,考虑到风噪频谱呈衰退趋势,需要确保对频带进行衰减时,频带数越高,衰减力度越低。为了排除不符合此趋势的变数,当一个频带组的线性增益被发现小于前一个频带组的线性增益时,丢弃当下线性增益,使用前一个频带组的线性增益。另外,因为风噪不一定会达到风噪频率,所以如果计算频带组最小能量值时,发现数值较舒适水平值小,则停止当下及剩余频带组的增益计算,节省运算量。
增益施加:对初始频域信号各频带施加对应的最终增益,获得新频域信号。
WOLA合成:通过WOLA分析的反向操作WOLA合成函数将新频域信号变换到新时域信号,获得风噪抑制后的信号帧。
以声音信号频率Fs=16kHz为例,进一步说明该适用于人工耳蜗的风噪抑制方法。
分帧:将信号进行分帧,帧长为64,即一帧为4ms。
WOLA分析:
将初始时域信号转换为从0到Fs/2 = 8000Hz不同频率的窄带信号,获得128个初始频域信号,每个频带频宽为8000/128=62.5Hz:
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
,K为频带数(即FFT点数,设为256,但有效频带数为FFT点数/2=128), M为降采样因子,设为与信号帧帧长相同,为64,n为信号帧,h为分析原型滤波器,每个信号 帧输出一组初始频域信号X(k),k=1…128。
能量谱计算:
计算初始频域信号的能量谱:
Figure DEST_PATH_IMAGE006
风噪特征提取:
低频能量比:
Figure DEST_PATH_IMAGE008
,
其中,K为最高频带数128,将低频区域的高截止频带B设为16,高截止频率Fs/2/K*B=1000Hz,即低频区域与高频区域的分界点,低频能量比阈值设为40,当低频能量比LHFR大于低频能量比阈值时,判断当下信号帧含有风噪,反之为无风噪;
子带频谱质心:
Figure DEST_PATH_IMAGE010
其中,KS为频谱低频局部的高截止频带,当子带频谱质心SLC小于子带频谱质心阈值
Figure DEST_PATH_IMAGE012
时,判断当下信号帧含有风噪,反之为无风噪,一般来说,若考虑信号帧中频率范围 在0-3000Hz的频谱部分,风噪的频率重心大多小于300 Hz,此时,
Figure DEST_PATH_IMAGE014
,
其中,Fs为信号采样率,K为最高频带数;
谐波特征:从代表前300Hz的5个频带中提取基频峰,并从该基频峰处开始,直到频带20处,记录有几个幅度大于(基频峰值/4)的峰点,当符合条件的峰点数大于2时,判断当下信号帧为纯语音信号,无风噪,另外,当前5个频带中找不到基频峰时,或者在搜索峰点的过程中,有谐振峰的峰值高于(基频峰值*2),也判断当下信号帧无风噪,反之则判断为含有风噪,具体步骤如下:
从频带1-5中找出峰值最大的基频峰,然后自基频峰开始至频带20搜索峰点,当发生以下任一情况时,则判断为无风噪:a、找不到基频峰;b、自基频峰至频带20搜索峰点时有超过2个峰值大于(基频峰值/4)的峰点;c、自基频峰至频带20搜索峰点时,有峰值大于(基频峰值*2)的峰点。
过零率:
Figure DEST_PATH_IMAGE016
其中,L为每帧信号长度,过零率阈值设为0.1,以达到漏判率和误判率的相对平衡。
更新风噪探测数值:以选取低频能量比和谐波特征作为风噪特征为例,当低频能 量比判断为含有风噪时,使风噪探测数值DS递增数值4,反之则递减数值5;当谐波特征判断 为含有风噪时,使风噪探测数值DS递增数值2,反之则递减数值4,将风噪阈值
Figure DEST_PATH_IMAGE018
设为 700,确保风噪探测数值DS处于0-700的范围内。
风噪判断:根据风噪探测数值DS进行最终的风噪判断,当风噪探测数值DS增涨至700时,开启风噪状态,即进入下一步;当风噪探测数值DS降低至0时,关闭风噪状态,当风噪状态处于开启时,对信号帧进行风噪抑制处理;当风噪状态处于关闭时,不对信号帧进行风噪抑制处理,初始时默认关闭风噪状态。
增益计算:
1、对能量谱E(k)取对数,获得以dB为单位的能量谱
Figure DEST_PATH_IMAGE020
,风噪频率设为3000Hz,故先 对前3000Hz的频带计算增益,能量谱
Figure DEST_PATH_IMAGE021
的计算至频带48即可停止:
Figure DEST_PATH_IMAGE023
2、再计算
Figure 655468DEST_PATH_IMAGE021
的中心频率区域的平均能量值作为舒适水平值SCL,中心频率区域范 围为3000Hz-3500Hz,即频带49至频带56:
Figure DEST_PATH_IMAGE025
3、将前3000Hz的频带1-48按照4个分成一组的模式,即频带1-4分成一组,后面类推,分成m=12个组;
4、计算每个频带组的最小能量值:
Figure DEST_PATH_IMAGE027
5、利用舒适水平值SCL与每个频带组最小能量值之间的差获得与频带组数量相同的dB增益,并转为线性增益:
Figure DEST_PATH_IMAGE029
6、分配增益至所有频带,每个低于3000Hz的频带分配其所属频带组的对应的线性增益,剩下的频带49-128则填入增益1,各频带获得对应的最终增益。
如图6所示,X为初始能量分布曲线,Y为X根据以上步骤,低频频带组最小能量值被降至舒适水平值C附近后的新能量分布曲线。
增益施加:对初始频域信号各频带施加对应的最终增益,获得新频域信号:
Figure DEST_PATH_IMAGE031
WOLA合成:将新频域信号Y(k)变换到新时域信号,获得风噪抑制后的信号帧。
一种使用该风噪抑制方法的系统,包括分帧程序模块,风噪探测程序模块,风噪判断程序模块,及其风噪抑制程序模块,其中,该分帧程序模块对数字信号进行分帧处理,该风噪探测程序模块进行风噪探测处理,具体为WOLA分析处理、能量谱计算处理、风噪特征探测处理及其更新风噪探测数值处理,该风噪判断程序模块进行风噪判断处理,该风噪抑制程序模块进行风噪抑制处理,具体为增益计算处理、增益施加处理及其WOLA合成处理,WOLA分析处理、能量谱计算处理、增益施加处理及其WOLA合成处理均可由可配置信号处理加速器完成,分帧处理、风噪特征探测处理、更新风噪探测数值处理、风噪判断处理及其增益计算处理均可由数字信号处理器完成,两个处理器各司其职、相互配合,降低单个处理器的计算负载,提高了运算效率。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求 书所确定的保护范围内。

Claims (10)

1.一种适用于人工耳蜗的风噪抑制方法,其包括如下步骤:(A)将输入的数字信号分割成信号帧;(B)首先,通过WOLA分析滤波器组将信号帧从初始时域信号转换成初始频域信号,其次,计算初始频域信号各频带的能量值,得到能量谱,再次,探测初始频域信号的风噪特征并进行是否含有风噪的判断,最后,风噪特征的判断结果构成风噪探测数值,并且不同风噪特征的判断结果以不同的幅度更新风噪探测数值;(C)设定初始值及风噪阈值,当风噪探测数值从初始值增涨至风噪阈值,不再增涨,此时开启风噪状态,当风噪探测数值从风噪阈值降低至初始值时,不再降低,此时关闭风噪状态,以此周而往复;(D)将能量谱转为dB值;计算能量谱的中心频率区域的平均能量值作为舒适水平值;设定风噪频率,将低于风噪频率的频带进行分组;计算每个频带组的最小能量值;利用舒适水平值与每个频带组最小能量值之间的差获得与频带组数量相同的dB增益,并转为线性增益;每个低于风噪频率的频带分配其所属频带组的对应的线性增益,高于风噪频率的频带则分配增益1,各频带都获得对应的最终增益;对初始频域信号各频带施加对应的最终增益,获得新频域信号;通过WOLA分析的反向操作WOLA合成函数将新频域信号变换到新时域信号,获得风噪抑制后的信号帧。
2.如权利要求1所述的风噪抑制方法,其特征在于:在步骤B中,风噪特征包括低频能量比,子带频谱质心及其谐波特征三种中的任意几种。
3.如权利要求2所述的风噪抑制方法,其特征在于:风噪特征还包括初始时域信号的过零率。
4.如权利要求3所述的风噪抑制方法,其特征在于:设定过零率阈值,当过零率小于过零率阈值时,判断当下信号帧含有风噪,反之为无风噪。
5.如权利要求2所述的风噪抑制方法,其特征在于:低频能量比的判断方法:设定低频能量比阈值,当低频能量比大于低频能量比阈值时,判断当下信号帧含有风噪,反之为无风噪。
6.如权利要求2所述的风噪抑制方法,其特征在于:子带频谱质心的判断方法:设定子带频谱质心阈值,当子带频谱质心小于子带频谱质心阈值时,判断当下信号帧含有风噪,反之为无风噪。
7.如权利要求2所述的风噪抑制方法,其特征在于:谐波特征的判断方法:从频带1-5中找出峰值最大的基频峰,然后自基频峰开始至频带20搜索峰点,每个频带频宽为62.5Hz,当发生以下任一情况时,则判断为无风噪:找不到基频峰;自基频峰至频带20搜索峰点时有超过2个峰值大于四分之一基频峰值的峰点;自基频峰至频带20搜索峰点时,有峰值大于两倍基频峰值的峰点。
8.如权利要求1所述的风噪抑制方法,其特征在于:在步骤D中,当一个频带组的线性增益被发现小于前一个频带组的线性增益时,使用前一个频带组的线性增益。
9.如权利要求1所述的风噪抑制方法,其特征在于:在步骤D中,如果计算频带组最小能量值时,发现数值较舒适水平值小,则停止当下及剩余频带组的增益计算。
10.一种适用于人工耳蜗的风噪抑制系统,其特征在于:包括分帧程序模块,风噪探测程序模块,风噪判断程序模块,及其风噪抑制程序模块,其中,该分帧程序模块对数字信号进行分帧处理,该风噪探测程序模块进行风噪探测处理,其包括WOLA分析程序模块,能量谱计算程序模块,风噪特征探测程序模块及其更新风噪探测数值程序模块,该风噪判断程序模块进行风噪判断处理,该风噪抑制程序模块进行风噪抑制处理,其包括增益计算程序模块,增益施加程序模块及其WOLA合成程序模块。
CN202010375597.3A 2020-05-07 2020-05-07 适用于人工耳蜗的风噪抑制方法及其系统 Active CN111261182B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010375597.3A CN111261182B (zh) 2020-05-07 2020-05-07 适用于人工耳蜗的风噪抑制方法及其系统
PCT/CN2021/081522 WO2021223518A1 (zh) 2020-05-07 2021-03-18 适用于人工耳蜗的风噪抑制方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010375597.3A CN111261182B (zh) 2020-05-07 2020-05-07 适用于人工耳蜗的风噪抑制方法及其系统

Publications (2)

Publication Number Publication Date
CN111261182A true CN111261182A (zh) 2020-06-09
CN111261182B CN111261182B (zh) 2020-10-23

Family

ID=70951700

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010375597.3A Active CN111261182B (zh) 2020-05-07 2020-05-07 适用于人工耳蜗的风噪抑制方法及其系统

Country Status (2)

Country Link
CN (1) CN111261182B (zh)
WO (1) WO2021223518A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112233688A (zh) * 2020-09-24 2021-01-15 北京声智科技有限公司 音频降噪方法、装置、设备及介质
CN112283898A (zh) * 2020-10-22 2021-01-29 佛山市顺德区美的电子科技有限公司 风噪控制方法、装置、移动式空调及计算机可读存储介质
CN112700789A (zh) * 2021-03-24 2021-04-23 深圳市中科蓝讯科技股份有限公司 一种噪声检测方法、非易失性可读存储介质及电子设备
CN113611320A (zh) * 2021-04-07 2021-11-05 珠海市杰理科技股份有限公司 风噪抑制方法、装置、音频设备及系统
WO2021223518A1 (zh) * 2020-05-07 2021-11-11 上海力声特医学科技有限公司 适用于人工耳蜗的风噪抑制方法及其系统
CN114264365A (zh) * 2021-12-14 2022-04-01 歌尔科技有限公司 风噪检测方法、装置、终端设备及存储介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030198357A1 (en) * 2001-08-07 2003-10-23 Todd Schneider Sound intelligibility enhancement using a psychoacoustic model and an oversampled filterbank
CA2437477A1 (en) * 2002-08-16 2004-02-16 Dspfactory Ltd. Method and system for processing subband signals using adaptive filters
US20040078199A1 (en) * 2002-08-20 2004-04-22 Hanoh Kremer Method for auditory based noise reduction and an apparatus for auditory based noise reduction
CN1530928A (zh) * 2003-02-21 2004-09-22 哈曼贝克自动系统-威美科公司 抑制风噪声的系统
CN1689072A (zh) * 2002-08-16 2005-10-26 数字信号处理工厂有限公司 使用自适应滤波器处理子带信号的方法和系统
EP1638010A2 (en) * 2004-09-15 2006-03-22 Emma Mixed Signal C.V. Method and system for physiological signal processing
CN101901602A (zh) * 2010-07-09 2010-12-01 中国科学院声学研究所 一种利用受损听力的听阈进行降噪的方法
CN102256200A (zh) * 2010-05-19 2011-11-23 上海聪维声学技术有限公司 全数字助听器的基于wola滤波器组的信号处理方法
CN103871421A (zh) * 2014-03-21 2014-06-18 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与系统
CN104040627A (zh) * 2011-12-22 2014-09-10 欧胜软件方案公司 用于风噪声检测的方法和设备
CN104637489A (zh) * 2015-01-21 2015-05-20 华为技术有限公司 声音信号处理的方法和装置
CN105118515A (zh) * 2015-07-03 2015-12-02 中国科学院上海微系统与信息技术研究所 一种基于麦克风阵列的风噪声检测方法
CN105931649A (zh) * 2016-03-31 2016-09-07 欧仕达听力科技(厦门)有限公司 基于频谱分析的超低时延音频处理方法与系统
CN107103901A (zh) * 2017-04-03 2017-08-29 浙江诺尔康神经电子科技股份有限公司 人工耳蜗声音场景识别系统和方法
CN109859768A (zh) * 2019-03-12 2019-06-07 上海力声特医学科技有限公司 人工耳蜗语音增强方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103219012B (zh) * 2013-04-23 2015-05-13 中国人民解放军总后勤部军需装备研究所 一种基于声源距离的双麦克风噪声消除方法及装置
CN103778920B (zh) * 2014-02-12 2016-03-09 北京工业大学 数字助听器中语音增强和频响补偿相融合方法
CN111261182B (zh) * 2020-05-07 2020-10-23 上海力声特医学科技有限公司 适用于人工耳蜗的风噪抑制方法及其系统

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030198357A1 (en) * 2001-08-07 2003-10-23 Todd Schneider Sound intelligibility enhancement using a psychoacoustic model and an oversampled filterbank
CA2437477A1 (en) * 2002-08-16 2004-02-16 Dspfactory Ltd. Method and system for processing subband signals using adaptive filters
CN1689072A (zh) * 2002-08-16 2005-10-26 数字信号处理工厂有限公司 使用自适应滤波器处理子带信号的方法和系统
US20040078199A1 (en) * 2002-08-20 2004-04-22 Hanoh Kremer Method for auditory based noise reduction and an apparatus for auditory based noise reduction
CN1530928A (zh) * 2003-02-21 2004-09-22 哈曼贝克自动系统-威美科公司 抑制风噪声的系统
EP1638010A2 (en) * 2004-09-15 2006-03-22 Emma Mixed Signal C.V. Method and system for physiological signal processing
CN102256200A (zh) * 2010-05-19 2011-11-23 上海聪维声学技术有限公司 全数字助听器的基于wola滤波器组的信号处理方法
CN101901602A (zh) * 2010-07-09 2010-12-01 中国科学院声学研究所 一种利用受损听力的听阈进行降噪的方法
CN104040627A (zh) * 2011-12-22 2014-09-10 欧胜软件方案公司 用于风噪声检测的方法和设备
CN103871421A (zh) * 2014-03-21 2014-06-18 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与系统
CN104637489A (zh) * 2015-01-21 2015-05-20 华为技术有限公司 声音信号处理的方法和装置
CN105118515A (zh) * 2015-07-03 2015-12-02 中国科学院上海微系统与信息技术研究所 一种基于麦克风阵列的风噪声检测方法
CN105931649A (zh) * 2016-03-31 2016-09-07 欧仕达听力科技(厦门)有限公司 基于频谱分析的超低时延音频处理方法与系统
CN107103901A (zh) * 2017-04-03 2017-08-29 浙江诺尔康神经电子科技股份有限公司 人工耳蜗声音场景识别系统和方法
CN109859768A (zh) * 2019-03-12 2019-06-07 上海力声特医学科技有限公司 人工耳蜗语音增强方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KARSTEN VANDBORG SØRENSEN ET AL.: "Speech Enhancement with Natural Sounding Residual Noise Based on Connected Time-Frequency Speech Presence Regions", 《JOURNAL ON APPLIED SIGNAL PROCESSING》 *
崔杰 等: "一种用于数字助听器的WOLA滤波器组的设计准则", 《应用声学》 *
梁维谦 等: "一种改善言语清晰度的子带自适应降噪算法", 《清华大学学报(自然科学版)》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021223518A1 (zh) * 2020-05-07 2021-11-11 上海力声特医学科技有限公司 适用于人工耳蜗的风噪抑制方法及其系统
CN112233688A (zh) * 2020-09-24 2021-01-15 北京声智科技有限公司 音频降噪方法、装置、设备及介质
CN112283898A (zh) * 2020-10-22 2021-01-29 佛山市顺德区美的电子科技有限公司 风噪控制方法、装置、移动式空调及计算机可读存储介质
CN112700789A (zh) * 2021-03-24 2021-04-23 深圳市中科蓝讯科技股份有限公司 一种噪声检测方法、非易失性可读存储介质及电子设备
CN113611320A (zh) * 2021-04-07 2021-11-05 珠海市杰理科技股份有限公司 风噪抑制方法、装置、音频设备及系统
CN113611320B (zh) * 2021-04-07 2023-07-04 珠海市杰理科技股份有限公司 风噪抑制方法、装置、音频设备及系统
CN114264365A (zh) * 2021-12-14 2022-04-01 歌尔科技有限公司 风噪检测方法、装置、终端设备及存储介质
CN114264365B (zh) * 2021-12-14 2024-04-30 歌尔科技有限公司 风噪检测方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
CN111261182B (zh) 2020-10-23
WO2021223518A1 (zh) 2021-11-11

Similar Documents

Publication Publication Date Title
CN111261182B (zh) 适用于人工耳蜗的风噪抑制方法及其系统
CN108831499B (zh) 利用语音存在概率的语音增强方法
CN105741849B (zh) 数字助听器中融合相位估计与人耳听觉特性的语音增强方法
CN109036460B (zh) 基于多模型神经网络的语音处理方法和装置
CN109767783A (zh) 语音增强方法、装置、设备及存储介质
CN109961799A (zh) 一种基于迭代维纳滤波的助听器多通道语音增强算法
CN113160845A (zh) 基于语音存在概率和听觉掩蔽效应的语音增强算法
EP1706864A2 (en) Computationally efficient background noise suppressor for speech coding and speech recognition
EP2191466A1 (en) Speech enhancement with voice clarity
WO2021114545A1 (zh) 一种声音增强方法及声音增强系统
CN104021798B (zh) 用于通过具有可变频谱增益和可动态调制的硬度的算法对音频信号隔音的方法
EP3074975A1 (en) Method of operating a hearing aid system and a hearing aid system
CN116129926A (zh) 智能设备自然语言交互信息处理方法
CN106448696A (zh) 一种基于背景噪声估计自适应高通滤波语音降噪方法
CN113593590A (zh) 一种语音中瞬态噪声的抑制方法
CN111968651A (zh) 一种基于wt的声纹识别方法及系统
WO2020024787A1 (zh) 音乐噪声抑制方法及装置
CN110211598A (zh) 智能语音降噪通信方法及装置
CN111477246B (zh) 语音处理方法、装置及智能终端
CN117037825A (zh) 一种自适应滤波与多窗谱估计谱减联合降噪方法
CN116168719A (zh) 一种基于语境分析的声音增益调节方法及系统
CN110933235B (zh) 一种基于机器学习的智能呼叫系统中的噪声识别方法
CN111491245B (zh) 基于循环神经网络的数字助听器声场识别算法及实现方法
CN114882898A (zh) 多通道语音信号增强方法和装置及计算机设备和存储介质
CN114822573A (zh) 语音增强方法、装置、耳机设备以及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant