CN114401168B - 适用复杂强噪声环境下短波莫尔斯信号的语音增强方法 - Google Patents

适用复杂强噪声环境下短波莫尔斯信号的语音增强方法 Download PDF

Info

Publication number
CN114401168B
CN114401168B CN202111552780.7A CN202111552780A CN114401168B CN 114401168 B CN114401168 B CN 114401168B CN 202111552780 A CN202111552780 A CN 202111552780A CN 114401168 B CN114401168 B CN 114401168B
Authority
CN
China
Prior art keywords
signal
voice
noise
speech
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111552780.7A
Other languages
English (en)
Other versions
CN114401168A (zh
Inventor
师聪雨
李仲茂
龚龙辉
赵波
马利涛
邱昕
冷永清
周崟灏
荆有波
赵俊超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Zhongke Integrated Circuit And System Application Research Institute
Original Assignee
Zhengzhou Zhongke Integrated Circuit And System Application Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Zhongke Integrated Circuit And System Application Research Institute filed Critical Zhengzhou Zhongke Integrated Circuit And System Application Research Institute
Priority to CN202111552780.7A priority Critical patent/CN114401168B/zh
Publication of CN114401168A publication Critical patent/CN114401168A/zh
Application granted granted Critical
Publication of CN114401168B publication Critical patent/CN114401168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L15/00Apparatus or local circuits for transmitting or receiving dot-and-dash codes, e.g. Morse code
    • H04L15/24Apparatus or circuits at the receiving end
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Noise Elimination (AREA)

Abstract

一种适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,包括语音预处理阶段、语音增强阶段和语音质量评估阶段,具体包括以下步骤:A、语音预处理阶段;B、语音增强阶段;C、语音质量评估阶段;本发明能够在强噪声背景下尽可能的提取纯净的语音信号,从而减少噪声的干扰,减少收听人的听觉疲劳,改善语音质量,提高语音可懂度,尽可能地恢复短波莫尔斯信号所传递的信息,达到提高短波莫尔斯信号的识别率和抗干扰能力的目的,有显著的社会和经济效益。

Description

适用复杂强噪声环境下短波莫尔斯信号的语音增强方法
技术领域
本发明涉及通信技术领域,特别是涉及数字语音信号处理中的语音增强方法的一种适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法。
背景技术
在卫星通信、光纤通信和移动通信技术广泛运用的今天,短波通信作为通信领域的重要手段之一仍被大量使用,尤其是在军事战略和战术通信领域占据着举足轻重的地位。然而,由于电离环境的复杂性和电离层的时变性,短波信号在空中传播过程时往往伴随着严重的噪声干扰,这给短波电报的识别造成了极大的困难。
语音增强是指当语音信号被各类噪声干扰甚至淹没后,从背景噪声中提取有用的语音信号且抑制、降低噪声干扰的技术。由于噪声是随机的,完全去除噪声从而提取纯净语音是不可能的,对于语音增强算法的研究方向也各有不同。目前国内外学者对于语音增强算法研究的重点各有不同,主要研究的有参数法、非参数法、统计法、小波变换法以及Kalman滤波法等其他方法。每种方法都有其优缺点,其中,参数法依赖于语音生成模型和需要提取的模型参数,非参数法不需要估计语音模型的参数且计算简单,统计法需建立模型库和训练获取统计参数。谱减算法虽然对语音信号有明显的降噪效果,但是在降噪的过程中会引入一种具有节奏感的残留噪声,又称为音乐噪声。音乐噪声容易使人耳产生疲惫感,且无法通过多次重复使用谱减法来消除音乐噪声。维纳滤波法虽然能够实现音乐噪声的抑制,但是在强噪声背景下的估计误差较大且计算量较高;小波变换法利用信号在不同尺度上自相似性重构增强后的语音,但是实现复杂度较高;最小均方(LMS)算法由于其计算复杂度低,在平稳环境种收敛性好;Kalman滤波法在滤波开始阶段存在较大的抖动,自适应能力和实时性差,那么,如何从复杂的噪声环境中提取相对较为纯净的音频信号即高效的语音增强处理,是目前短波通信领域亟待解决的关键问题。
发明内容
针对上述情况,为克服现有技术之缺陷,本发明之目的就是提供一种适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,可有效解决短波通信中由于多普勒频移、多径时延或天气变化等因素引起的信号不稳定甚至失真,而目前不能从复杂的噪声环境中提取相对较为纯净的音频的问题。
为实现上述目的,本发明解决的技术方案是,一种适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,包括语音预处理阶段、语音增强阶段和语音质量评估阶段,具体包括以下步骤:
A、语音预处理阶段:
A1、从短波接收机采集的语音信号中挑选具有代表性的带噪语音信号样本;
A2、对带噪语音信号样本进行低通滤波处理,滤除高于3500Hz的噪声;
A3、对滤波后的带噪语音信号样本进行分帧、加窗处理;
A4、分帧、加窗处理后的带噪语音信号样本同时进行快速傅里叶变换和噪声帧判决处理,快速傅里叶变换将每一帧的数据通过快速傅里叶变换转换到频域,获取相位信息,噪声谱估计是通过对非语音帧的相应谱做平均得到,则对进行快速傅里叶变换的带噪语音信号样本进行噪声帧判决处理,若噪声帧判决处理检测是噪声帧,则更新噪声谱;若检测不是噪声帧,则不更新噪声谱;
B、语音增强阶段:
B1、使用谱减法对步骤A4中经快速傅里叶变换后的语音信号的幅度谱和噪声谱进行初次估计;
B2、将步骤B1初次估计后的带噪语音信号样本进行傅里叶逆变换,得到带噪语音信号样本的初次时域估计值;
B3、将带噪语音信号的初次时域估计值输入LMS自适应滤波器中,进行LMS自适应滤波算法,并初始化迭代次数、权向量、期望响应的估计和估计误差等参数;
B4、对LMS自适应滤波器中的权向量、期望响应的估计和估计误差的参数进行迭代更新,若不是最大迭代次数,则返回步骤A4,若为最后一帧,即LMS自适应滤波器迭代更新直至最大迭代次数,算法终止,并输出对带噪语音信号的二次估计值,即最终增强语音信号;
C、语音质量评估阶段:
C1、对增强语音信号进行综合语音质量评估,并输出综合语音质量数据。
本发明能够在强噪声背景下尽可能的提取纯净的语音信号,从而减少噪声的干扰,减少收听人的听觉疲劳,改善语音质量,提高语音可懂度,尽可能地恢复短波莫尔斯信号所传递的信息,达到提高短波莫尔斯信号的识别率和抗干扰能力的目的,有显著的社会和经济效益。
附图说明
图1是本发明方法流程图。
图2是本发明谱减算法原理图。
图3是本发明LMS自适应滤波算法原理图。
图4是本发明与其他语音增强算法的比较波形图(其中a为单一法,b为结合法)。
图5是本发明与其他语音增强算法的比较语谱图(其中a为单一法,b为结合法)。
图6是本发明与其他语音增强算法的综合语音质量指标得分在相同的带噪语音样本的条件下,在不同信噪比(SNR)时的对比折线图。
图7是本发明与其他语音增强算法的综合语音质量指标得分对比柱状图(在SNR=5的条件下,处理不同带噪语言信号样本时)。
具体实施方式
以下结合附图和具体情况对本发明的具体实施方式作详细说明。
结合附图给出,一种适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,包括语音预处理阶段、语音增强阶段和语音质量评估阶段,具体包括以下步骤:
A、语音预处理阶段:
A1、从短波接收机采集的语音信号中挑选具有代表性的带噪语音信号样本;
将带噪语音信号样本记为y(n),考虑到短波莫尔斯信号的传输环境,干扰噪声一般为短波通信中的电台噪声、背景噪声以及传输噪声等,则可假设短波信号传输中的噪声加性的、局部平稳的且噪声与纯净语音相互统计独立的。短波信号的离散带噪语音时域模型记为:
y(n)=x(n)+μ(n) 式1
其中,x(n)表示纯净信号,μ(n)表示均值为零的噪声信号,且与x(n)互不相关;
A2、对带噪语音信号样本进行低通滤波处理,滤除高于3500Hz的噪声;
对带噪语音信号样本进行低通滤波处理,滤除高于3500Hz的噪声,将经过步骤A2低通滤波更新后的信号表示为y(n);
A3、对滤波后的带噪语音信号样本进行分帧、加窗处理;
A4、分帧、加窗处理后的带噪语音信号样本同时进行快速傅里叶变换和噪声帧判决处理,快速傅里叶变换将每一帧的数据通过快速傅里叶变换转换到频域,获取相位信息,噪声谱估计是通过对非语音帧的相应谱做平均得到,则对进行快速傅里叶变换的带噪语音信号样本进行噪声帧判决处理,若噪声帧判决处理检测是噪声帧,则更新噪声谱;若检测不是噪声帧,则不更新噪声谱;
对低通滤波后的带噪语音信号样本y(n)进行分帧、加窗和快速(离散时间)傅里叶变换,将每一帧的数据y(n)做快速傅里叶变换,得其频域表达式为:
Y(ω)=X(ω)+M(ω) 式2
其中,X(ω)、M(ω)、Y(ω)分别代表频域的纯净信号、噪声信号和带噪信号。
B、语音增强阶段:
B1、使用谱减法对步骤A4中经快速傅里叶变换后的语音信号的幅度谱和噪声谱进行初次估计;谱减法为幅值谱减法或者功率谱减法,使用谱减法对语音信号和噪声进行初次估计,当可以较易获取信号相位信息时,采用幅值谱减法估计带噪语音信号,带噪信号Y(ω)极坐标形式表示为:
其中,|Y(ω)|表示幅度谱,是φy(ω)混合信号的相位谱,同样地,噪声谱表示为:
则可得纯净信号幅度谱估计的表达式为:
其中“^”表示“估计”的谱或相关参数,是在无语音活动时对噪声幅度谱的估计。当在信号的相位信息难以获取的场景下,采用功率谱减法来估计纯净语言信号,对式2的两边同时做共轭相乘后,得:
其中,和X(ω)M*(ω)通过对/>和E{X(ω)M*(ω)}的近似获得,E{}表示求期望运算,又由式1可知,μ(n)均值为零且与x(n)互不相关,则E{X(ω)M*(ω)}简化为零,因此,纯净信号的功率谱估计可表示为:
式5简化为:
其中,λ是幅值谱的指数,当λ=1表示幅值谱减法,当λ=2表示功率谱减法。当λ=1/4可模拟人耳的感受。值得注意的是,噪声谱估计一般通过对非语音帧的相应谱做平均得到,因此需要设置一个有声/无声的判决模块来判决每一帧是否含噪;
B2、将步骤B1初次估计后的带噪语音信号样本进行傅里叶逆变换,得到带噪语音信号样本的初次时域估计值;
通过谱减法获得语音幅度谱的初次计后,再结合对混合信号相位信息的傅里叶逆变换,得到对带噪语音信号样本的初次时域估计值B3、将带噪语音信号的初次时域估计值输入LMS自适应滤波器中,进行LMS自适应滤波算法,并初始化迭代次数、权向量、期望响应的估计和估计误差等参数;
对LMS自适应滤波器相关参数进行初始化处理,具体地,对LMS滤波器权向量w(n)、期望响应d(n)和估计误差e(n)进行初始化,并设置迭代次数的最大值N和滤波器的权系数β。B4、对LMS自适应滤波器中的权向量、期望响应的估计和估计误差等参数进行迭代更新,若不是最大迭代次数,则返回步骤A4,若为最后一帧,即LMS自适应滤波器迭代更新直至最大迭代次数,算法终止,并输出对带噪语音信号的二次估计值,即最终增强语音信号;
将对带噪信号的初次估计值输入LMS自适应滤波器中,并对权向量w(n)、期望响应d(n)和估计误差e(n)进行迭代更新,在n时刻抽头输入向量为:
其中,L是LMS自适应滤波器的阶数,即抽头数,在每一次迭代更新过程中,进行以下数据更新,其中,滤波器输出:
估计误差:
权向量:
令n=n+1并检测n是否等于最大迭代次数N,若是,则输出对带噪语音信号的二次估计值并进行下一步,否则返回步骤A4,进行数据更新,/>即为最终输出估计值。
C、语音质量评估阶段:
C1、对增强语音信号进行综合语音质量评估,并输出综合语音质量评估数据;
对增强语音信号进行综合语音质量评估,并输出综合语音质量评估指标得分Covl
所述的综合语音质量评估是基于多元线性回归分析法,并根据客观语音质量测度与主观语音质量评价之间的相关度,选用三个客观测度—感知语音质量测量法(PESQ)、对数似然比(LLR)、加权谱斜率(WSS),对三者进行加权求和后,建立综合语音质量评价指标:
Covl=1.594+0.8055*PESQ-0.512*LLR-0.007*WSS 式13
该指标为一个1~5分的评估分,分数越高代表语音质量和可懂度越高;
其中,PESQ是通过估计原始语音和增强语音的总体响度误差来评估语音质量,PESQ得分是通过平均扰动值D和平均非对称扰动值A的线性加权求和而得,具体计算公式为:
PESQ=4.5-0.1*D-0.0309*A 式14;
PESQ得分范围为-0.5~4.5,得分越高表示语音质量越好;
LLR是一种基于线性预测编码(LPC)的语音质量评价指标,其计算公式为:
其中,a和b分别代表带噪语音和增强语音的线性预测系数向量,R代表带噪语音的自相关矩阵;LLR是一种频谱距离度量,表示带噪信号和增强信号之间的不匹配度,LLR值越小代表两者之间的差距越小,即增强语音质量越好;
WSS距离代表语音信号每个频带谱斜率之间的加权差距,是以分贝计算相邻谱幅度之间差异,计算公式为:
其中W(j,m)代表第m帧的第j频带中带噪语言权重和增强语音权重的均值,N为语音信号的帧数,频带数K=25,R(j,m)和S(j,m)分别代表第m帧的第j频带的带噪语言和增强语音的谱斜度。
本发明在具体使用时,能够在强噪声背景下尽可能的提取纯净的语音信号,从而减少噪声的干扰,效果非常好,下面结合附图和实施例,对本发明实施例中的技术方案进行详细、完整地描述。
本实施例以短波电台采集短波莫尔斯信号为例来进行实验说明,本实施例中所提及的带噪语音均转化为.m4a格式的语音信号,采样率为48kHz。短波电台的发射端位于北京市朝阳区,短波电台的接收端位于郑州市高新区,发射端与接收端距离约700公里,短波莫尔斯信号的采集时间为2021年11月22日至27日下午五点左右。
一种适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,包括语音预处理阶段、语音增强阶段和语音质量评估阶段,如图1所示。
A1、从短波接收机采集的语音信号中挑选具有代表性的带噪语音信号样本;
本发明中所研究的信号为短波接收机采集的语音信号,信号中所包含的噪声主要为短波通信中的电台噪声、背景噪声以及传输噪声等,因此假设短波信号传输中的噪声加性的、局部平稳的且噪声与纯净语音相互统计独立的,则短波信号的离散带噪语音时域模型记为:
y(n)=x(n)+μ(n) 式1(编号同上一致,下同)
其中,x(n)表示纯净信号,μ(n)表示均值为零的噪声信号,且与x(n)互不相关,y(n)表示包含噪声的混合信号;
A2、对带噪语音信号样本进行低通滤波处理,滤除高于3500Hz的噪声,将经过步骤A2低通滤波更新后的信号仍表示为y(n);
A3、对滤波后的带噪语音信号样本进行分帧、加窗处理;
A4、分帧、加窗处理后的带噪语音信号样本同时进行快速傅里叶变换和噪声帧判决处理,快速傅里叶变换(FFT)将每一帧的数据通过FFT变换转换到频域;即对式1两边同时做离散时间傅里叶变换,可得其频域表达式:
Y(ω)=X(ω)+M(ω) 式2
其中,X(ω)、M(ω)、Y(ω)分别代表频域的纯净信号、噪声信号和带噪信号;
B1、使用幅值谱减法对语音信号的幅度谱和噪声谱进行初次估计;
将带噪信号Y(ω)的极坐标的形式表示为:
其中,|Y(ω)|表示幅度谱,是φy(ω)混合信号的相位谱。同样地,噪声谱可表示为:
由于噪声的幅度谱是未知的,则由无语音活动时的平均幅度谱的估计代替,噪声相位也可由混合语言的相位代替,则可得纯净信号幅度谱估计的表达式为:
其中“^”表示“估计”的谱或相关参数,是在无语音活动时对噪声幅度谱的估计;
图2为谱减法的算法原理框图,此处令λ=1表示采用幅值谱减法;
B2、将步骤B1初次估计后的带噪语音信号样本进行傅里叶逆变换,得到带噪语音信号样本的初次时域估计值
通过谱减法获得语音幅度谱的初次估计后,再结合对混合信号相位信息的傅里叶逆变换即可得到对语音信号时域的估计;
B3、将带噪语音信号的初次估计值输入LMS自适应滤波器中,并初始化迭代次数、权向量、期望响应的估计和估计误差等参数;
将带噪语音信号的初次估计值x(n)输入LMS自适应滤波器中,如图4所示。对权向量、期望响应的估计和估计误差进行初始化。令权向量w(n)=0、估计误差e(n)=0,并设置迭代次数的最大值N和滤波器的权系数β;
B4、对LMS自适应滤波器中的权向量、期望响应的估计和估计误差等参数进行迭代更新;
在每一次迭代过程中,分别对权向量w(n)、期望响应d(n)的估计和估计误差e(n)进行更新,其对应的更新公式为:
其中,和/>是LMS自适应滤波器的输入和输出,β为滤波器的权系数,在n时刻抽头输入向量为:
其中,L是LMS自适应滤波器的阶数,即抽头数,假设LMS自适应滤波器和阶数L为一个足够大的常量;
C1、LMS自适应滤波器迭代更新直至最大迭代次数时算法终止,并输出对带噪语音信号的二次估计值,即增强语音信号;
令n=n+1,当n等于最大迭代次数N时算法终止,否则返回步骤A4,当迭代终止后,输出对带噪语音信号的二次增强估计值,即增强语音信号
LMS自适应滤波算法的原理图如图3所示。
C2、对增强语音信号进行综合语音质量评估,并输出综合语音质量评估得分Covl
本发明所采用的综合语音质量评估算法是选用了与主观语音质量评价相关度较高的三个客观测度—PESQ、LLR、WSS加权求和而得,计算公式为:
Covl=1.594+0.8055*PESQ-0.512*LLR-0.007*WSS 式13
该指标为一个1~5分的评估分,分数越高代表语音质量和可懂度越高;
其中,PESQ得分是通过平均扰动值D和平均非对称扰动值A的线性加权求和而得,具体计算公式为:
PESQ=4.5-0.1*D-0.0309*A 式14
PESQ得分范围为-0.5~4.5,得分越高表示语音质量越好;
LLR是一种基于线性预测编码的语音质量评价指标,其计算公式为:
其中,a和b分别代表带噪语音和增强语音的线性预测系数向量,R代表带噪语音的自相关矩阵。WSS距离代表语音信号每个频带谱斜率之间的加权差距,是以分贝计算相邻谱幅度之间差异的,计算公式为:
其中,W(j,m)代表第m帧的第j频带中带噪语言权重和增强语音权重的均值,N为语音信号的帧数,频带数K=25,R(j,m)和S(j,m)分别代表第m帧的第j频带的带噪语言和增强语音的谱斜度。
本发明最终公布的综合型语音增强方法及系统适用于在强噪声背景下对短波莫尔斯信号语音增强处理,经处理后的语音呈现出更好的语音质量和更高的可懂度,且实现复杂度并未显著增加。
为了验证本发明所提出的综合型语音增强方法的可靠性和复杂度,同时还仿真了其他传统的语音增强算法,以便进行对比分析。所选用的单一语音增强方法为谱减法、维纳滤波法和LMS自适应滤波法;所对比的结合型语音增强方法有谱减法与维纳滤波相结合法、维纳滤波与LMS自适应滤波相结合法。
实验中的带噪语音信号长度均为2000ms,采样频率均为48kHz。实验结果分为仿真分析和客观评价两部分,仿真分析是指在MATLAB 2020a仿真平台上对带噪语音信号进行语音增强处理,并对比分析其前后的时域幅值图和语谱图结果,客观评价是指对比分析不同信噪比条件下语音增强后信号的综合语音质量评价指标的得分情况。
如图4和图5所示,分别比较了本发明所提结合型语音算法与单一型语音增强方法和其他结合型语音增强方法的波形图、语谱图。
由图4可以明显地观察到,相对于图4(a)中的单一法,图4(b)中的结合法处理后的信号效果明显较好;由图5可以看出,图5(a)中的谱减法、维纳滤波法以及图5(b)中谱减法与维纳滤波相结合法处理后的语音信号均具有明显的白噪声和音乐噪声的残留,图5(a)中的LMS自适应滤波法虽然性能较好但是有明显的失真片段,维纳滤波与LMS自适应滤波相结合法以及本发明所提出的综合型语音增强算法性能表现良好。
如图6所示,在相同带噪语音样本的条件下,对比了信噪比取值从-10到20时,本发明所提结合型语音增强算法相对于其他语音增强算法的综合语音质量指标得分情况。由图可知,在不同信噪比条件下,LMS自适应滤波法均得分最高,本发明所提出算法均得分次之且优于维纳滤波与LMS自适应滤波相结合法。
如图7所示,在相同信噪比的条件下,对比了处理不同带噪语音样本时,本发明所提结合型语音增强算法相对于其他语音增强算法的综合语音质量指标得分情况。由图可知,相对于维纳滤波与LMS自适应滤波相结合法,在处理不同的带噪语音样本时,本发明所提出算法的综合语音质量评价指标得分均较高。
综上所述,本发明所提结合型语音算法的无论是相对于单一法还是结合法,均表现出较大的优越性,语音增强效果和语音质量的提高明显,且适用的噪声环境更为广泛,十分适用于对短波莫尔斯信号的语音增强处理。
本发明方法经多次不同对象的测试,均取得了与实施例相同或相近似的结果,表明方法稳定、可靠,这里不再一一赘述。
本发明能够在强噪声背景下尽可能的提取纯净的语音信号,从而减少噪声的干扰,与现有技术相比,有以下有益技术效果:
1、本发明最终公布的结合型语音增强算法相对于传统单一语音增强算法和其他结合语音增强法,均表现出较大的优越性,经本发明所提算法处理后的语音信号的质量和可懂度均得到显著的提高;
2、本发明实现过程简单,适用于强噪声背景下语音信号的增强处理,且性能表现良好;
3、本发明适用于对短波莫尔斯语音信号的语音增强处理,且适用的噪声环境广泛,减少收听人的听觉疲劳,改善语音质量,提高语音可懂度,尽可能地恢复短波莫尔斯信号所传递的信息,达到提高短波莫尔斯信号的识别率和抗干扰能力的目的,有显著的社会和经济效益。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
上述仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出更动或者修饰为等同变化的等效实施例,均落在本发明的保护范围内。

Claims (7)

1.一种适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,其特征在于,包括语音预处理阶段、语音增强阶段和语音质量评估阶段,具体包括以下步骤:
A、语音预处理阶段:
A1、从短波接收机采集的语音信号中挑选具有代表性的带噪语音信号样本;
所述的步骤A1中,将带噪语音信号样本记为y(n),短波信号的离散带噪语音时域模型记为:
y(n)=x(n)+μ(n) 式1
其中,x(n)表示纯净信号,μ(n)表示均值为零的噪声信号,且与x(n)互不相关;
A2、对带噪语音信号样本进行低通滤波处理,滤除高于3500Hz的噪声;
A3、对滤波后的带噪语音信号样本进行分帧、加窗处理;
A4、分帧、加窗处理后的带噪语音信号样本同时进行快速傅里叶变换和噪声帧判决处理,快速傅里叶变换将每一帧的数据通过快速傅里叶变换转换到频域,获取相位信息,噪声谱估计是通过对非语音帧的相应谱做平均得到,则对进行快速傅里叶变换的带噪语音信号样本进行噪声帧判决处理,若噪声帧判决处理检测是噪声帧,则更新噪声谱;若检测不是噪声帧,则不更新噪声谱;
所述的步骤A3和A4中对低通滤波后的带噪语音信号样本y(n)进行分帧、加窗和快速傅里叶变换,将每一帧的数据y(n)做快速傅里叶变换,得其频域表达式为:
Y(ω)=X(ω)+M(ω) 式2
其中,X(ω)、M(ω)、Y(ω)分别代表频域的纯净信号、噪声信号和带噪信号;
B、语音增强阶段:
B1、使用谱减法对步骤A4中经快速傅里叶变换后的语音信号的幅度谱和噪声谱进行初次估计;所述的步骤B1中谱减法为幅值谱减法或者功率谱减法,使用谱减法对语音信号和噪声进行初次估计,当能获取信号相位信息时,采用幅值谱减法估计带噪语音信号,带噪信号Y(ω)极坐标形式表示为:
其中,|Y(ω)|表示幅度谱,是φy(ω)混合信号的相位谱,同样地,噪声谱表示为:
则可得纯净信号幅度谱估计的表达式为:
其中“^”表示“估计”的谱或相关参数,是在无语音活动时对噪声幅度谱的估计;当在信号的相位信息难以获取的场景下,采用功率谱减法来估计纯净语言信号,对式2的两边同时做共轭相乘后,得:
其中,和X(ω)M*(ω)通过对/>和E{X(ω)M*(ω)}的近似获得,E{·}表示求期望运算,又由式1可知,μ(n)均值为零且与x(n)互不相关,则E{X(ω)M*(ω)}简化为零,因此,纯净信号的功率谱估计可表示为:
式5简化为:
其中,λ是幅值谱的指数,当λ=1表示幅值谱减法,当λ=2表示功率谱减法;
B2、将步骤B1初次估计后的带噪语音信号样本进行傅里叶逆变换,得到带噪语音信号样本的初次时域估计值;
B3、将带噪语音信号的初次时域估计值输入LMS自适应滤波器中,进行LMS自适应滤波算法,并初始化迭代次数、权向量、期望响应的估计和估计误差等参数;
B4、对LMS自适应滤波器中的权向量、期望响应的估计和估计误差的参数进行迭代更新,若不是最大迭代次数,则返回步骤A4,若为最后一帧,即LMS自适应滤波器迭代更新直至最大迭代次数,算法终止,并输出对带噪语音信号的二次估计值,即最终增强语音信号;
C、语音质量评估阶段:
C1、对增强语音信号进行综合语音质量评估,并输出综合语音质量数据。
2.根据权利要求1所述的适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,其特征在于,所述的步骤A2中,对带噪语音信号样本进行低通滤波处理,滤除高于3500Hz的噪声,将经过步骤A2低通滤波更新后的信号表示为y(n)。
3.根据权利要求1所述的适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,其特征在于,所述的步骤B2中通过谱减法获得语音幅度谱的初次计后,再结合对混合信号相位信息的傅里叶逆变换,得对带噪语音信号样本的初次时域估计值
4.根据权利要求1所述的适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,其特征在于,所述的步骤B3中对LMS自适应滤波器相关参数进行初始化处理,具体地,对LMS滤波器权向量w(n)、期望响应d(n)和估计误差e(n)进行初始化,并设置迭代次数的最大值N和滤波器的权系数β。
5.根据权利要求1所述的适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,其特征在于,所述的步骤B4中将对带噪信号的初次估计值输入LMS自适应滤波器中,并对权向量w(n)、期望响应d(n)和估计误差e(n)进行迭代更新,在n时刻抽头输入向量为:
其中,L是LMS自适应滤波器的阶数,即抽头数,在每一次迭代更新过程中,进行以下数据更新,其中,滤波器输出:
估计误差:
权向量:
其中:β为滤波器的权系数;
令n=n+1并检测n是否等于最大迭代次数N,若是,则输出对带噪语音信号的二次估计值并进行下一步,否则返回步骤A4,进行数据更新,/>即为最终输出估计值。
6.根据权利要求1所述的适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,其特征在于,所述的步骤C1中对增强语音信号进行综合语音质量评估,并输出综合语音质量评估指标得分Covl
7.根据权利要求6所述的适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法,其特征在于,所述的综合语音质量评估是基于多元线性回归分析法,选用三个客观测度—感知语音质量测量法、对数似然比、加权谱斜率,对三者进行加权求和后,建立综合语音质量评价指标:
Covl=1.594+0.8055*PESQ-0.512*LLR-0.007*WSS 式13
该指标为一个1~5分的评估分,分数越高代表语音质量和可懂度越高;
其中,感知语音质量测量法是通过估计原始语音和增强语音的总体响度误差来评估语音质量,感知语音质量测量法得分是通过平均扰动值D和平均非对称扰动值A的线性加权求和而得,具体计算公式为:
PESQ=4.5-0.1*D-0.0309*A 式14;
感知语音质量测量法得分范围为-0.5~4.5,得分越高表示语音质量越好;
对数似然比是一种基于线性预测编码的语音质量评价指标,其计算公式为:
其中,a和b分别代表带噪语音和增强语音的线性预测系数向量,R代表带噪语音的自相关矩阵;对数似然比是一种频谱距离度量,表示带噪信号和增强信号之间的不匹配度,对数似然比值越小代表两者之间的差距越小,即增强语音质量越好;
加权谱斜率距离代表语音信号每个频带谱斜率之间的加权差距,是以分贝计算相邻谱幅度之间差异,计算公式为:
其中W(j,m)代表第m帧的第j频带中带噪语言权重和增强语音权重的均值,N为语音信号的帧数,频带数K=25,R(j,m)和S(j,m)分别代表第m帧的第j频带的带噪语言和增强语音的谱斜度。
CN202111552780.7A 2021-12-17 2021-12-17 适用复杂强噪声环境下短波莫尔斯信号的语音增强方法 Active CN114401168B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111552780.7A CN114401168B (zh) 2021-12-17 2021-12-17 适用复杂强噪声环境下短波莫尔斯信号的语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111552780.7A CN114401168B (zh) 2021-12-17 2021-12-17 适用复杂强噪声环境下短波莫尔斯信号的语音增强方法

Publications (2)

Publication Number Publication Date
CN114401168A CN114401168A (zh) 2022-04-26
CN114401168B true CN114401168B (zh) 2023-11-03

Family

ID=81228005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111552780.7A Active CN114401168B (zh) 2021-12-17 2021-12-17 适用复杂强噪声环境下短波莫尔斯信号的语音增强方法

Country Status (1)

Country Link
CN (1) CN114401168B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361892A (zh) * 2014-09-18 2015-02-18 电子科技大学 一种干扰信号与语音调制信号混叠的窄带干扰识别方法
CN109147759A (zh) * 2018-10-09 2019-01-04 电子科技大学 一种基于打分算法的短波话音信号分集合并接收方法
CN109325586A (zh) * 2018-12-05 2019-02-12 北京航空航天大学合肥创新研究院 基于组合目标函数的深度神经网络系统
CN110782912A (zh) * 2019-10-10 2020-02-11 安克创新科技股份有限公司 音源的控制方法以及扬声设备
CN113673158A (zh) * 2021-08-19 2021-11-19 西北工业大学 适用于强干扰环境下的波束域变分贝叶斯方位估计方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7526428B2 (en) * 2003-10-06 2009-04-28 Harris Corporation System and method for noise cancellation with noise ramp tracking

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361892A (zh) * 2014-09-18 2015-02-18 电子科技大学 一种干扰信号与语音调制信号混叠的窄带干扰识别方法
CN109147759A (zh) * 2018-10-09 2019-01-04 电子科技大学 一种基于打分算法的短波话音信号分集合并接收方法
CN109325586A (zh) * 2018-12-05 2019-02-12 北京航空航天大学合肥创新研究院 基于组合目标函数的深度神经网络系统
CN110782912A (zh) * 2019-10-10 2020-02-11 安克创新科技股份有限公司 音源的控制方法以及扬声设备
CN113673158A (zh) * 2021-08-19 2021-11-19 西北工业大学 适用于强干扰环境下的波束域变分贝叶斯方位估计方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Review of Microwave Filter Designs based on CMRC;Wen Fu等;《2020 IEEE MTT-S International Wireless Symposium (IWS)》;全文 *
噪声背景下短波莫尔斯信号的自动检测和识别研究;何立刚;《中国优秀硕士论文电子期刊网》;全文 *
基于卡尔曼滤波的短波等幅报降噪技术研究;李仲春;《中国优秀硕士论文电子期刊网》;全文 *
超宽带锥形电感特性研究;李仲茂等;《电子学报》;全文 *

Also Published As

Publication number Publication date
CN114401168A (zh) 2022-04-26

Similar Documents

Publication Publication Date Title
CN110867181B (zh) 基于scnn和tcnn联合估计的多目标语音增强方法
CN108447495B (zh) 一种基于综合特征集的深度学习语音增强方法
CN105513605B (zh) 手机麦克风的语音增强系统和语音增强方法
CN110428849B (zh) 一种基于生成对抗网络的语音增强方法
CN112735456B (zh) 一种基于dnn-clstm网络的语音增强方法
CN103413547B (zh) 一种室内混响消除的方法
CN111292762A (zh) 一种基于深度学习的单通道语音分离方法
CN103440869A (zh) 一种音频混响的抑制装置及其抑制方法
CN107316648A (zh) 一种基于有色噪声的语音增强方法
CN112700786B (zh) 语音增强方法、装置、电子设备和存储介质
Daqrouq et al. An investigation of speech enhancement using wavelet filtering method
CN111192598A (zh) 一种跳变连接深度神经网络的语音增强方法
CN104658543A (zh) 一种室内混响消除的方法
KR100655953B1 (ko) 웨이블릿 패킷 변환을 이용한 음성 처리 시스템 및 그 방법
CN112634926B (zh) 一种基于卷积神经网络的短波信道语音抗衰落辅助增强方法
CN112133322A (zh) 一种基于噪声分类优化imcra算法的语音增强方法
WO2019232833A1 (zh) 语音区分方法、装置、计算机设备及存储介质
CN111899750B (zh) 联合耳蜗语音特征和跳变深层神经网络的语音增强算法
CN110808057A (zh) 一种基于约束朴素生成对抗网络的语音增强方法
CN112185405B (zh) 一种基于差分运算和联合字典学习的骨导语音增强方法
CN112634927A (zh) 一种短波信道语音增强方法
CN103971697B (zh) 基于非局部均值滤波的语音增强方法
CN114401168B (zh) 适用复杂强噪声环境下短波莫尔斯信号的语音增强方法
Schröter et al. CLC: complex linear coding for the DNS 2020 challenge
Rao et al. Speech enhancement using sub-band cross-correlation compensated Wiener filter combined with harmonic regeneration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant