CN116320947A - 一种应用于助听器的频域双通道语音增强方法 - Google Patents

一种应用于助听器的频域双通道语音增强方法 Download PDF

Info

Publication number
CN116320947A
CN116320947A CN202310554246.2A CN202310554246A CN116320947A CN 116320947 A CN116320947 A CN 116320947A CN 202310554246 A CN202310554246 A CN 202310554246A CN 116320947 A CN116320947 A CN 116320947A
Authority
CN
China
Prior art keywords
signal
reference signal
frame
frequency domain
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310554246.2A
Other languages
English (en)
Other versions
CN116320947B (zh
Inventor
李鹏
张威
李子豪
朱尚文
邵文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Acosound Technology Co ltd
Institute of Acoustics CAS
Original Assignee
Acosound Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Acosound Technology Co ltd filed Critical Acosound Technology Co ltd
Priority to CN202310554246.2A priority Critical patent/CN116320947B/zh
Publication of CN116320947A publication Critical patent/CN116320947A/zh
Application granted granted Critical
Publication of CN116320947B publication Critical patent/CN116320947B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/49Reducing the effects of electromagnetic noise on the functioning of hearing aids, by, e.g. shielding, signal processing adaptation, selective (de)activation of electronic parts in hearing aid
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/01Noise reduction using microphones having different directional characteristics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurosurgery (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提出了一种应用于助听器的频域双通道语音增强方法,在频域GSC框架上对BM部分及ANC部分进行改进,利用FBF部分输出的语音参考信号与BM部分输出的噪声参考信号的频域相关性区分语音帧与含有较多噪声成分的信号帧,以选择合适的阻塞矩阵,并在频域NLMS基础上进行改进。本发明将相关性较大的信号帧视为含有较多噪声成分的信号帧,选择较大的更新步长,加快算法收敛,反之则视为语音帧,选择较小的步长,减小算法稳态误差。通过实验,本发明输出信干比和短时客观可懂度相较于传统方法和对比方法都有一定提升,并且具有比较好的鲁棒性。

Description

一种应用于助听器的频域双通道语音增强方法
技术领域
本发明属于数字助听器技术领域,具体涉及一种应用于助听器的频域双通道语音增强方法。
背景技术
基于双全向传声器阵列的传统频域GSC结构可以用图1表示,其方法流程描述如下:
假设前后传声器匹配且间距为d,声速以符号c来表示, 则前后传声器接收到的信号为语音与噪声经过混响后得到的混合信号
Figure SMS_1
,将时域信号分帧加窗,利用短时傅里叶变换(Short-Time Fourier Transform, STFT)将每一帧输入信号转换到频域,得到的频域信号/>
Figure SMS_2
,k表示频率点数,l表示帧数:
Figure SMS_3
其中,
Figure SMS_5
与/>
Figure SMS_8
分别为纯净的语音信号和方向性的干扰噪声,二者的时域表示为/>
Figure SMS_11
和/>
Figure SMS_6
。/>
Figure SMS_9
与/>
Figure SMS_12
为语音源到两个传声器的传输函数,/>
Figure SMS_13
Figure SMS_4
为方向性干扰噪声到两个传声器的传输函数。/>
Figure SMS_7
与/>
Figure SMS_10
为两个传声器中不相关的本底噪声,通常情况下很小。
语音信号从声源至两传声器的传递函数可以分为两部分,
Figure SMS_14
等号右边第一项为直达声传递函数,主要产生时延,第二项是房间混响的传递函数,本文用
Figure SMS_15
表示语音信号到达两个传声器的时延,则发/>
Figure SMS_16
,假设语音信号与两传声器连线夹角为/>
Figure SMS_17
,则/>
Figure SMS_18
两通道信号经过FBF部分后得到语音参考信号
Figure SMS_19
,经过BM部分抵消语音信号后得到噪声参考信号/>
Figure SMS_20
,可表示为:
Figure SMS_21
其中,
Figure SMS_22
为FBF部分的权矢量,/>
Figure SMS_23
为BM部分的权矢量,将式(1)和式(2)带入上式可得:
Figure SMS_24
其中
Figure SMS_27
和/>
Figure SMS_28
表示前后传声器接收到的语音信号的混响成分,由于混响声的方向不定,产生的时延也与直达声不同,因此,/>
Figure SMS_31
中的混响成分无法完全保留,
Figure SMS_26
中的混响成分无法完全衰减,但总体上/>
Figure SMS_30
中的混响成分相较于/>
Figure SMS_33
更少。
Figure SMS_34
和/>
Figure SMS_25
为前后传声器接收到的干扰噪声,在二元阵中,FBF部分对非相关噪声有一定的抑制,但这种抑制效果很有限。由推导可知,/>
Figure SMS_29
中保留了直达语音成分,对混响语音和干扰噪声略有抑制,因此将其视为语音参考信号,/>
Figure SMS_32
中的主要成分为干扰噪声,将其视为噪声参考信号。
令每一帧的语音参考信号
Figure SMS_35
和每一帧的噪声参考信号/>
Figure SMS_36
分别表示/>
Figure SMS_37
Figure SMS_38
在所有k的取值上构成的行向量,则二者经过自适应的噪声抵消后可以得到增强后的信号/>
Figure SMS_39
,其经过短时傅里叶逆变换(Inverse Short-Time Fourier Transform,ISTFT)得到系统的最终输出/>
Figure SMS_40
,ANC的权向量通过自适应方法确定。
发明内容
在助听器的日常使用环境中,干扰噪声与期望语音往往来自不同的方向,因此为了降低干扰噪声对助听器性能的影响,本发明设计一种具有指向性的语音增强方法,即应用自适应的多通道语音增强技术,以实现在复杂环境中实现指向模式的动态调整,提高助听器的消噪性能。
本发明提供一种应用于助听器的频域双通道语音增强方法,利用前后传声器接收语音与干扰经过混响后得到的混合信号,将时域信号分帧加窗,利用短时傅里叶变换将每一帧输入信号转换到频域,得到的频域信号
Figure SMS_43
,其中k表示频率点数,l表示帧数;两通道信号经过FBF部分后得到语音参考信号,/>
Figure SMS_44
,其中
Figure SMS_46
为FBF部分的权矢量;经过可选择的BM部分抵消语音信号后得到噪声参考信号,/>
Figure SMS_42
其中,B(k)为BM部分的权向量,其初始值设为
Figure SMS_45
,其中,/>
Figure SMS_47
表示语音信号到达两个传声器的时延;k表示频率点数,B(k)的实时值根据信号的相关性变化进行选择;令每一帧的语音参考信号和每一帧的噪声参考信号分别表示语音参考信号和噪声参考信号在所有的频率点数取值上构成的行向量/>
Figure SMS_48
Figure SMS_41
,根据二者的相关性进行变步长的自适应噪声抵消后得到增强后的信号,经过短时傅里叶逆变换得到最终输出;计算相关性前对语音参考信号进行信号补偿,以提升噪声部分的相关性;设置相关系数阈值,并认为相关系数小于相关系数阈值时,补偿后的语音参考信号与噪声参考信号的相关度较低,将其视为语音帧,否则为含有较多干扰成分的信号帧。
进一步的,还包括应用于ANC部分的变步长NLMS算法,策略为在噪声段选择较大的更新步长,进行权系数更新,加快滤波收敛速度,而在语音段选择较小的步长,不进行权系数更新,使算法输出与语音参考信号具有较小的稳态误差。
进一步的,所述信号补偿为令
Figure SMS_51
,以提升噪声部分的相关性,式中的/>
Figure SMS_53
为每一帧的语音参考信号,表示两通道信号经过FBF部分后得到语音参考信号在所有的频率点数取值上构成的行向量;/>
Figure SMS_55
为每一帧的噪声参考信号,表示两通道信号经过BM部分抵消语音信号后得到噪声参考信号在所有的频率点数取值上构成的行向量;/>
Figure SMS_50
为一常数;令/>
Figure SMS_52
表示第l帧的相关系数,其为/>
Figure SMS_54
与/>
Figure SMS_56
相关函数的归一化,且/>
Figure SMS_49
,则其用公式可以表示为:
Figure SMS_57
其中:
Figure SMS_58
其中:
Figure SMS_61
为一小于1的常数,/>
Figure SMS_63
是/>
Figure SMS_65
与/>
Figure SMS_60
互相关函数的平滑值,/>
Figure SMS_62
是/>
Figure SMS_64
自相关函数的平滑值,/>
Figure SMS_66
是/>
Figure SMS_59
自相关函数的平滑值。
进一步的,所述相关系数阈值
Figure SMS_67
,并认为/>
Figure SMS_68
时/>
Figure SMS_69
与/>
Figure SMS_70
的相关度较低,将其视为语音帧,否则为含有较多噪声成分的信号帧:
Figure SMS_71
进一步的,当
Figure SMS_72
Figure SMS_73
其中,/>
Figure SMS_74
表示/>
Figure SMS_75
在所有k的取值上构成的行向量;/>
Figure SMS_76
为BM部分的权矢量;/>
Figure SMS_77
为将时域信号分帧加窗利用短时傅里叶变换将每一帧输入信号转换到频域得到的频域信号;/>
Figure SMS_78
表示语音信号到达两个传声器的时延;
Figure SMS_79
表示频率点数。
进一步的,步长调整过程为:
Figure SMS_82
;其中, />
Figure SMS_84
表示自适应滤波器的权向量,/>
Figure SMS_88
表示第l帧的相关系数,/>
Figure SMS_81
,/>
Figure SMS_85
表示生成对角矩阵,/>
Figure SMS_86
表示转置,/>
Figure SMS_89
表示共轭转置,/>
Figure SMS_80
为一小于1的常数;/>
Figure SMS_83
为噪声参考信号经过自适应滤波器的输出信号;/>
Figure SMS_87
为语音参考信号和噪声参考信号能量和的平滑值。
本发明还提供一种助听器,其包括计算机程序,用于实现所述的应用于助听器的频域双通道语音增强方法。
有益效果:
与现有技术相比,本发明的应用于数字助听器的双全向传声器双通道语音增强方法,具有如下优点:
第一,由于语音的入射方位角未知,因此在传统GSC算法中
Figure SMS_90
被固定在0°,导致在系统时延估计不准确时,BM输出的语音泄露严重,影响后续的算法性能,因此,本发明提出了一种BM的改进方法,以减小时延估计不准确而产生的语音泄露。
第二,本发明将相关性较大的信号帧视为含有较多噪声成分的信号帧,选择较大的更新步长,加快系统收敛,反之则视为语音帧,选择较小的步长,减小系统稳态误差。
第三,通过实验,本发明的应用于数字助听器的双全向传声器双通道语音增强方法,输出信干比和短时客观可懂度相较于传统方法和对比方法都有一定提升,并且具有比较好的鲁棒性。
附图说明
图1 传统频域GSC结构图;
图2 改进的频域GSC结构图。
具体实施方式
下面结合实施例对本发明作更进一步的说明。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例的技术方案进行清楚、完整的描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
实施例
如图2所示,假设前后传声器匹配且间距为
Figure SMS_91
,声速以符号/>
Figure SMS_92
来表示,则前后传声器接收到的信号为语音与噪声经过混响后得到的混合信号/>
Figure SMS_93
,将时域信号分帧加窗,利用短时傅里叶变换(Short-Time Fourier Transform, STFT)将每一帧输入信号转换到频域,得到的频域信号/>
Figure SMS_94
,k表示频率点数,l表示帧数:
Figure SMS_95
其中,
Figure SMS_98
与/>
Figure SMS_101
分别为纯净的语音信号和方向性的干扰噪声,二者的时域表示为/>
Figure SMS_104
和/>
Figure SMS_97
。/>
Figure SMS_100
与/>
Figure SMS_103
为语音源到两个传声器的传输函数,/>
Figure SMS_105
Figure SMS_96
为方向性干扰噪声到两个传声器的传输函数。/>
Figure SMS_99
与/>
Figure SMS_102
为两个传声器中不相关的本底噪声,通常情况下很小。
语音信号从声源至两传声器的传递函数可以分为两部分,
Figure SMS_106
等号右边第一项为直达声传递函数,主要产生时延,第二项是房间混响的传递函数,本文用
Figure SMS_107
表示语音信号到达两个传声器的时延,则发/>
Figure SMS_108
,假设语音信号与两传声器连线夹角为/>
Figure SMS_109
,则/>
Figure SMS_110
两通道信号经过FBF部分后得到语音参考信号
Figure SMS_111
,经过BM部分抵消语音信号后得到噪声参考信号/>
Figure SMS_112
,可表示为:
Figure SMS_113
其中,
Figure SMS_114
为FBF部分的权矢量,/>
Figure SMS_115
为BM部分的权矢量,将式(1)和式(2)带入上式可得:
Figure SMS_116
其中
Figure SMS_119
和/>
Figure SMS_122
表示前后传声器接收到的语音信号的混响成分,由于混响声的方向不定,产生的时延也与直达声不同,因此,/>
Figure SMS_125
中的混响成分无法完全保留,
Figure SMS_118
中的混响成分无法完全衰减,但总体上/>
Figure SMS_120
中的混响成分相较于/>
Figure SMS_123
更少。
Figure SMS_126
和/>
Figure SMS_117
为前后传声器接收到的干扰噪声,在二元阵中,FBF部分对非相关噪声有一定的抑制,但这种抑制效果很有限。由推导可知,/>
Figure SMS_121
中保留了直达语音成分,对混响语音和干扰噪声略有抑制,因此将其视为语音参考信号,/>
Figure SMS_124
中的主要成分为干扰噪声,将其视为噪声参考信号。
令每一帧的语音参考信号
Figure SMS_127
和每一帧的噪声参考信号/>
Figure SMS_128
分别表示/>
Figure SMS_129
Figure SMS_130
在所有k的取值上构成的行向量,则二者经过自适应的噪声抵消后可以得到增强后的信号/>
Figure SMS_131
,其经过短时傅里叶逆变换(Inverse Short-Time Fourier Transform,ISTFT)得到系统的最终输出/>
Figure SMS_132
,ANC的权向量通过自适应方法确定。
计算相关性前对语音参考信号进行信号补偿,以提升噪声部分的相关性;设置相关系数阈值,并认为相关系数小于相关系数阈值时,补偿后的语音参考信号与噪声参考信号的相关度较低,将其视为语音帧,否则为含有较多干扰成分的信号帧。
实施例
基于双传声器阵列的传统GSC结构不能主动调整波束方向,且其采用的是固定步长的NLMS,因此该方法具有一定的提升空间。为了提升助听器指向性增强系统的消噪性能,对传统频域GSC做了一定改进,主要包含对BM部分的改进和对ANC的改进。
由于FBF结构在双传声器阵列当中对于相干噪声的消减能力远不如其在多传声器阵列中的表现,因此本文基于现实假设FBF部分的噪声泄露比BM部分的语音泄露更严重,即
Figure SMS_133
中所含的噪声成分更多,/>
Figure SMS_134
中所包含的语音成分更少,考虑到语音参考信号/>
Figure SMS_135
与噪声参考信号/>
Figure SMS_136
均由传声器接收到的带噪信号中获得,因此,在整段信号中,不含语音成分的信号帧具有更高的相关性,而含有语音成分的信号帧相关性更低,因此本文运用此相关性策略进行BM部分与ANC部分的改进。
为了防止方向性干扰噪声在FBF与BM部分的处理当中损失一部分相关性,本文首先进行了信号补偿,令
Figure SMS_137
,以提升噪声部分的相关性,式中/>
Figure SMS_138
的为一常数。令/>
Figure SMS_139
表示第l帧的相关系数,其为/>
Figure SMS_140
与/>
Figure SMS_141
相关函数的归一化,且/>
Figure SMS_142
,则其用公式可以表示为:
Figure SMS_143
其中:
Figure SMS_144
其中:
Figure SMS_147
为一小于1的常数, />
Figure SMS_149
是/>
Figure SMS_151
与/>
Figure SMS_146
互相关函数的平滑值,/>
Figure SMS_148
Figure SMS_150
自相关函数的平滑值,/>
Figure SMS_152
是/>
Figure SMS_145
自相关函数的平滑值。
本方法引入了一个相关系数阈值
Figure SMS_153
,并认为/>
Figure SMS_154
时/>
Figure SMS_155
与/>
Figure SMS_156
的相关度较低,将其视为语音帧,否则为含有较多噪声成分的信号帧:
Figure SMS_157
实施例
由于语音的入射方位角未知,因此在传统GSC算法中
Figure SMS_158
被固定在0°,导致在系统时延估计不准确时,BM输出的语音泄露严重,影响后续的算法性能,因此,本文提出了一种BM的改进方法,以减小时延估计不准确而产生的语音泄露。
具体方法描述如下,由于语音泄露的产生通常在高信噪比下更明显,且此时语音成分的功率相较于噪声功率更大,因此结合4.2.3节提出的相关性策略,当
Figure SMS_159
时:
Figure SMS_160
Figure SMS_161
其中,
Figure SMS_162
表示/>
Figure SMS_163
在所有的取值上构成的行向量,式(15)中右式为左式的计算条件,即当右式成立时计算左式。
需要说明的是,应用于单耳助听器的传声器阵列间距很近,传声器之间所产生的时延较小,因此本文提出的方法可以取得较好的效果,若传声器阵列间距较大,则本文方法并不适用。
实施例4
应用于ANC部分的变步长NLMS算法的总体策略为,在噪声段选择较大的更新步长,进行权系数更新,加快滤波收敛速度,而在语音段选择较小的步长,不进行权系数更新,使系统输出与语音参考信号具有较小的稳态误差。根据分析,相关性可以满足系统在噪声段具有较高的更新步长和更快的收敛速度,而在语音段具有更小更新步长和稳态误差。
现有技术中对自适应步长的分母部分做了如下改进,其使得
Figure SMS_164
,初步降低算法失调,本文运用了类似的方法,并利用改进后的结果进行自适应噪声抵消,在此基础上结合式(13)进行步长调整,
Figure SMS_165
Figure SMS_166
Figure SMS_167
Figure SMS_168
其中,
Figure SMS_171
表示自适应滤波器的权向量,/>
Figure SMS_173
,/>
Figure SMS_175
表示生成对角矩阵,/>
Figure SMS_170
表示转置,/>
Figure SMS_172
表示共轭转置,/>
Figure SMS_174
,其中为一小于1的常数;/>
Figure SMS_176
为噪声参考信号经过自适应滤波器的输出信号;/>
Figure SMS_169
为语音参考信号和噪声参考信号能量和的平滑值。
最后应说明的是:以上所述仅为本发明的优先实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。需要说明的是,在本文中,术语“包括”、“包含”或者其他任何其他变体意在涵盖非排他性地包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者还是包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施条例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (7)

1.一种应用于助听器的频域双通道语音增强方法,其特征在于:利用前后传声器接收语音与干扰经过混响后得到的混合信号,将时域信号分帧加窗,利用短时傅里叶变换将每一帧输入信号转换到频域,得到的频域信号
Figure QLYQS_2
,其中k表示频率点数,l表示帧数;两通道信号经过FBF部分后得到语音参考信号,/>
Figure QLYQS_5
,其中
Figure QLYQS_7
为FBF部分的权矢量;经过可选择的BM部分抵消语音信号后得到噪声参考信号,/>
Figure QLYQS_3
其中,B(k)为BM部分的权向量,其初始值设为
Figure QLYQS_4
,其中,/>
Figure QLYQS_6
表示语音信号到达两个传声器的时延;k表示频率点数,B(k)的实时值根据信号的相关性变化进行选择;令每一帧的语音参考信号和每一帧的噪声参考信号分别表示语音参考信号和噪声参考信号在所有的频率点数取值上构成的行向量/>
Figure QLYQS_8
Figure QLYQS_1
,根据二者的相关性进行变步长的自适应噪声抵消后得到增强后的信号,经过短时傅里叶逆变换得到最终输出;计算相关性前对语音参考信号进行信号补偿,以提升噪声部分的相关性;设置相关系数阈值,并认为相关系数小于相关系数阈值时,补偿后的语音参考信号与噪声参考信号的相关度较低,将其视为语音帧,否则为含有较多干扰成分的信号帧。
2.根据权利要求1所述的一种应用于助听器的频域双通道语音增强方法,其特征在于:还包括应用于ANC部分的变步长NLMS算法,策略为在噪声段选择较大的更新步长,进行权系数更新,加快滤波收敛速度,而在语音段选择较小的步长,不进行权系数更新,使算法输出与语音参考信号具有较小的稳态误差。
3.根据权利要求1所述的一种应用于助听器的频域双通道语音增强方法,其特征在于:所述信号补偿为令
Figure QLYQS_10
,以提升噪声部分的相关性,式中的/>
Figure QLYQS_13
为每一帧的语音参考信号,表示两通道信号经过FBF部分后得到语音参考信号在所有的频率点数取值上构成的行向量;/>
Figure QLYQS_15
为每一帧的噪声参考信号,表示两通道信号经过BM部分抵消语音信号后得到噪声参考信号在所有的频率点数取值上构成的行向量;/>
Figure QLYQS_11
为一常数;令/>
Figure QLYQS_12
表示第l帧的相关系数,其为/>
Figure QLYQS_14
与/>
Figure QLYQS_16
相关函数的归一化,且/>
Figure QLYQS_9
,则其用公式可以表示为:
Figure QLYQS_17
其中:
Figure QLYQS_18
其中:
Figure QLYQS_20
为一小于1的常数,/>
Figure QLYQS_23
是/>
Figure QLYQS_25
与/>
Figure QLYQS_21
互相关函数的平滑值,/>
Figure QLYQS_22
是/>
Figure QLYQS_24
自相关函数的平滑值,/>
Figure QLYQS_26
是/>
Figure QLYQS_19
自相关函数的平滑值。
4.根据权利要求2所述的一种应用于助听器的频域双通道语音增强方法,其特征在于:所述相关系数阈值
Figure QLYQS_27
,并认为/>
Figure QLYQS_28
时/>
Figure QLYQS_29
与/>
Figure QLYQS_30
的相关度较低,将其视为语音帧,否则为含有较多噪声成分的信号帧:
Figure QLYQS_31
5.根据权利要求3所述的一种应用于助听器的频域双通道语音增强方法,其特征在于:当
Figure QLYQS_32
Figure QLYQS_33
其中,/>
Figure QLYQS_34
表示/>
Figure QLYQS_35
在所有k的取值上构成的行向量;/>
Figure QLYQS_36
为BM部分的权矢量;/>
Figure QLYQS_37
为将时域信号分帧加窗利用短时傅里叶变换将每一帧输入信号转换到频域得到的频域信号;/>
Figure QLYQS_38
表示语音信号到达两个传声器的时延;/>
Figure QLYQS_39
表示频率点数。
6.根据权利要求2所述的一种应用于助听器的频域双通道语音增强方法,其特征在于:步长调整过程为:
Figure QLYQS_41
;其中, />
Figure QLYQS_45
表示自适应滤波器的权向量,/>
Figure QLYQS_48
表示第l帧的相关系数,/>
Figure QLYQS_42
,/>
Figure QLYQS_44
表示生成对角矩阵,/>
Figure QLYQS_47
表示转置,/>
Figure QLYQS_49
表示共轭转置,/>
Figure QLYQS_40
为一小于1的常数;/>
Figure QLYQS_43
为噪声参考信号经过自适应滤波器的输出信号;/>
Figure QLYQS_46
为语音参考信号和噪声参考信号能量和的平滑值。
7.一种助听器,其特征在于:包括计算机程序,用于实现如权利要求1所述的一种应用于助听器的频域双通道语音增强方法。
CN202310554246.2A 2023-05-17 2023-05-17 一种应用于助听器的频域双通道语音增强方法 Active CN116320947B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310554246.2A CN116320947B (zh) 2023-05-17 2023-05-17 一种应用于助听器的频域双通道语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310554246.2A CN116320947B (zh) 2023-05-17 2023-05-17 一种应用于助听器的频域双通道语音增强方法

Publications (2)

Publication Number Publication Date
CN116320947A true CN116320947A (zh) 2023-06-23
CN116320947B CN116320947B (zh) 2023-09-01

Family

ID=86781841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310554246.2A Active CN116320947B (zh) 2023-05-17 2023-05-17 一种应用于助听器的频域双通道语音增强方法

Country Status (1)

Country Link
CN (1) CN116320947B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509552A (zh) * 2011-10-21 2012-06-20 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
CN102664023A (zh) * 2012-04-26 2012-09-12 南京邮电大学 一种麦克风阵列语音增强的优化方法
CN104835503A (zh) * 2015-05-06 2015-08-12 南京信息工程大学 一种改进gsc自适应语音增强方法
US20150318001A1 (en) * 2014-05-04 2015-11-05 Yang Gao Stepsize Determination of Adaptive Filter For Cancelling Voice Portion by Combing Open-Loop and Closed-Loop Approaches
US20170092256A1 (en) * 2015-09-30 2017-03-30 Cirrus Logic International Semiconductor Ltd. Adaptive block matrix using pre-whitening for adaptive beam forming
CN111341340A (zh) * 2020-02-28 2020-06-26 重庆邮电大学 基于相干性和能量比的鲁棒gsc方法
CN115346548A (zh) * 2022-07-25 2022-11-15 中国科学院上海微系统与信息技术研究所 一种广义旁瓣抵消器及语音增强方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509552A (zh) * 2011-10-21 2012-06-20 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
CN102664023A (zh) * 2012-04-26 2012-09-12 南京邮电大学 一种麦克风阵列语音增强的优化方法
US20150318001A1 (en) * 2014-05-04 2015-11-05 Yang Gao Stepsize Determination of Adaptive Filter For Cancelling Voice Portion by Combing Open-Loop and Closed-Loop Approaches
CN104835503A (zh) * 2015-05-06 2015-08-12 南京信息工程大学 一种改进gsc自适应语音增强方法
US20170092256A1 (en) * 2015-09-30 2017-03-30 Cirrus Logic International Semiconductor Ltd. Adaptive block matrix using pre-whitening for adaptive beam forming
CN111341340A (zh) * 2020-02-28 2020-06-26 重庆邮电大学 基于相干性和能量比的鲁棒gsc方法
CN115346548A (zh) * 2022-07-25 2022-11-15 中国科学院上海微系统与信息技术研究所 一种广义旁瓣抵消器及语音增强方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
QINYUN YANG ET AL: "A New Frequency-Domain Adaptive Blocking Matrix Design for Generalized Sidelobe Cancellation", 2020 15TH IEEE INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING (ICSP) *
SHMULIK MARKOVICH ET AL: "Multichannel Eigenspace Beamforming in a Reverberant Noisy Environment With Multiple Interfering Speech Signals", IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, vol. 17, no. 6, XP011263241, DOI: 10.1109/TASL.2009.2016395 *
李斌;张玲华;: "一种广义旁瓣抵消器结构的语音增强改进算法", 数据采集与处理, no. 02 *
杨立春;钱沄涛;: "基于相干性滤波器的广义旁瓣抵消器麦克风小阵列语音增强方法", 电子与信息学报, no. 12 *
黄斌;: "稳键的自适应空间波束形成语音增强算法研究", 计算机仿真, no. 12 *

Also Published As

Publication number Publication date
CN116320947B (zh) 2023-09-01

Similar Documents

Publication Publication Date Title
JP5573517B2 (ja) 雑音除去装置および雑音除去方法
US7386135B2 (en) Cardioid beam with a desired null based acoustic devices, systems and methods
CN105869651B (zh) 基于噪声混合相干性的双通道波束形成语音增强方法
CN110856072B (zh) 一种耳机通话降噪方法及耳机
CN106875938B (zh) 一种改进的非线性自适应语音端点检测方法
CN112331226B (zh) 一种针对主动降噪系统的语音增强系统及方法
CN110830870A (zh) 一种基于传声器技术的耳机佩戴者语音活动检测系统
CN112530451A (zh) 基于去噪自编码器的语音增强方法
Priyanka A review on adaptive beamforming techniques for speech enhancement
Schwartz et al. Nested generalized sidelobe canceller for joint dereverberation and noise reduction
CN113362846A (zh) 一种基于广义旁瓣相消结构的语音增强方法
Xu et al. Adaptive speech enhancement algorithm based on first-order differential microphone array
Aroudi et al. Cognitive-driven convolutional beamforming using EEG-based auditory attention decoding
CN116320947B (zh) 一种应用于助听器的频域双通道语音增强方法
Priyanka et al. Adaptive Beamforming Using Zelinski-TSNR Multichannel Postfilter for Speech Enhancement
Yu et al. Speech enhancement based on the generalized sidelobe cancellation and spectral subtraction for a microphone array
CN114724574A (zh) 一种期望声源方向可调的双麦克风降噪方法
CN112435681A (zh) 一种基于声聚焦和麦克风阵列波束形成的语音增强方法
As’ad et al. Robust minimum variance distortionless response beamformer based on target activity detection in binaural hearing aid applications
As' ad et al. Binaural beamforming with spatial cues preservation for hearing aids in real-life complex acoustic environments
CN113329288B (zh) 一种基于陷波技术的蓝牙耳机降噪方法
Choi et al. A two-channel minimum mean-square error log-spectral amplitude estimator for speech enhancement
Trong An Improved Implementation of GSC Filter
Lotter et al. A stereo input-output superdirective beamformer for dual channel noise reduction.
Deshpande et al. Multi-microphone speech dereverberation using spatial filtering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Chen Xinyi

Inventor after: Cui Jie

Inventor after: Li Hua

Inventor after: Li Peng

Inventor after: Zhang Wei

Inventor after: Li Zihao

Inventor after: Shao Wen

Inventor after: Zhu Shangwen

Inventor before: Li Peng

Inventor before: Zhang Wei

Inventor before: Li Zihao

Inventor before: Zhu Shangwen

Inventor before: Shao Wen

CB03 Change of inventor or designer information
TR01 Transfer of patent right

Effective date of registration: 20240104

Address after: 311121 401, Building 2, No. 1390, Cangxing Street, Cangqian Street, Yuhang District, Hangzhou City, Zhejiang Province

Patentee after: ACOSOUND TECHNOLOGY Co.,Ltd.

Patentee after: INSTITUTE OF ACOUSTICS, CHINESE ACADEMY OF SCIENCES

Address before: 311100 401, Building 2, Digital health Town, No. 1390, Cangxing Street, Cangqian Street, Yuhang District, Hangzhou, Zhejiang

Patentee before: ACOSOUND TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right