CN114420153A - 音质调整方法、装置、设备及存储介质 - Google Patents

音质调整方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114420153A
CN114420153A CN202111497099.7A CN202111497099A CN114420153A CN 114420153 A CN114420153 A CN 114420153A CN 202111497099 A CN202111497099 A CN 202111497099A CN 114420153 A CN114420153 A CN 114420153A
Authority
CN
China
Prior art keywords
target
signal
parameter
frequency band
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111497099.7A
Other languages
English (en)
Inventor
胡小辉
罗斌
陈延庆
王斌斌
李明华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tendzone Intelligent Technology Co ltd
Original Assignee
Shenzhen Tendzone Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tendzone Intelligent Technology Co ltd filed Critical Shenzhen Tendzone Intelligent Technology Co ltd
Priority to CN202111497099.7A priority Critical patent/CN114420153A/zh
Publication of CN114420153A publication Critical patent/CN114420153A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及音频传输技术领域,尤其涉及一种音质调整方法、装置、设备及存储介质。本发明通过处理初始声音信号,获得目标频带信号的目标子带参数,并将所述目标频带信号通过预设频带参数计算模型进行参数计算,以获得准确的目标子带能量参数,通过目标子带参数与目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,有效的对初始声音信号的各个子带进行信号滤波,以减少初始声音信号进行扩音时的反馈现象,避免了麦克风进行拾音扩音时,会存在扩音反馈,导致音频清晰度下降,严重影响用户的听感的技术问题,增强了麦克风进行扩音的音质效果。

Description

音质调整方法、装置、设备及存储介质
技术领域
本发明涉及音频传输技术领域,尤其涉及一种音质调整方法、装置、设备及存储介质。
背景技术
在传统教室音频扩声时,一般采用头戴式有线麦克风进行拾音,再通过扩音器进行扩音,但是有一个弊端就是需要长时间戴在头上,还需将一个发送设备挂在腰间。需要定期充电,用户体验较差。随着科技的发展,现在有推出全向麦克风、定向麦克风或者阵列麦克风进行本地扩声,上述的麦克风都是高灵敏度的,拾音距离远,所以非常容易产生反馈,从而使得扩声音质有声音拖尾和金属音等现象,混响较重,导致清晰度下降,严重影响用户的听感。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种音质调整,旨在解决现有技术中麦克风进行拾音扩音时,会存在扩音反馈,导致音频清晰度下降,严重影响用户的听感的技术问题。
为实现上述目的,本发明提供了一种音质调整方法,所述方法包括以下步骤:
获取初始声音信号;
根据所述初始声音信号确定目标频带信号,并提取所述目标频带信号的目标子带参数;
根据所述目标频带信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数;
基于所述目标子带参数与所述目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,获得目标声音信号。
可选地,所述基于所述目标子带参数与所述目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,获得目标声音信号,包括:
获取期望信号,并获取所述期望信号对应的期望信号;
根据所述目标子带参数、所述目标子带能量参数及所述期望信号更新预设滤波模型中的滤波模型系数,获得目标滤波模型;
将所述目标频带信号通过所述目标滤波模型进行信号滤波,获得目标声音信号。
可选地,所述根据所述目标子带参数、所述目标子带能量参数及所述期望信号更新预设滤波模型中的滤波模型系数,获得目标滤波模型,包括:
获取当前环境信息,并基于所述当前环境信息确定对应的声衰减系数;
根据所述声衰减系数、所述目标子带能量参数及所述目标子带参数确定收敛因子参数;
基于所述收敛因子参数确定抽头权向量;
根据所述收敛因子参数、所述期望信号及所述抽头权向量更新预设滤波模型中的滤波模型系数,获得目标滤波模型。
可选地,所述根据所述声衰减系数、所述目标子带能量参数及所述目标子带参数确定收敛因子参数,包括:
提取所述目标子带参数中的子频带数量值;
根据所述声衰减系数确定声衰减权重;
基于所述目标子带能量参数与所述子频带数量值获得目标频带能量权重;
基于所述声衰减权重、所述目标频带能量权重及所述目标子带参数确定收敛因子参数。
可选地,所述基于所述声衰减权重、所述目标频带能量权重及所述目标子带参数确定收敛因子参数,包括:
基于所述声衰减权重和所述目标频带能量权重确定目标频带自适应因子;
根据所述目标频带自适应因子与所述目标子带参数进行数据处理,获得收敛因子参数。
可选地,所述根据所述目标频带信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数,包括:
将所述目标频带信号进行信号滤波,获得滤波信号;
将所述滤波信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数,所述目标子带能量参数包括:目标频带能量值与目标频带能量权重系数。
可选地,所述将所述滤波信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数,包括:
提取所述滤波信号的帧长度数据;
基于所述帧长度数据通过预设频带参数计算模型对所述滤波信号进行参数计算,获得所述滤波信号对应的目标浮点值;
根据所述目标浮点值与所述帧长度数据确定目标子带能量参数,并根据所述目标子带能量参数进行数据处理,获得目标频带能量权重系数。
此外,为实现上述目的,本发明还提出一种音质调整装置,所述音质调整装置包括:
信号获取模块,用于获取初始声音信号;
参数获取模块,用于根据所述初始声音信号确定目标频带信号,并提取目标频带信号的目标子带参数;
参数计算模块,用于根据所述目标频带信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数;
信号滤波模块,用于基于所述目标子带参数与所述目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,获得目标声音信号。
此外,为实现上述目的,本发明还提出一种音质调整设备,所述音质调整设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音质调整程序,所述音质调整程序配置为实现如上文所述的音质调整方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有音质调整程序,所述音质调整程序被处理器执行时实现如上文所述的音质调整方法的步骤。
本发明通过获取初始声音信号,根据所述初始声音信号确定目标频带信号,并提取所述目标频带信号的目标子带参数,根据所述目标频带信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数,基于所述目标子带参数与所述目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,获得目标声音信号。与现有技术相比,本发明通过处理初始声音信号,获得目标频带信号的目标子带参数,并将所述目标频带信号通过预设频带参数计算模型进行参数计算,以获得准确的目标子带能量参数,通过目标子带参数与目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,有效的对初始声音信号的各个子带进行信号滤波,以减少初始声音信号进行扩音时的反馈现象,避免了麦克风进行拾音扩音时,会存在扩音反馈,导致音频清晰度下降,严重影响用户的听感的技术问题,增强了麦克风进行扩音的音质效果。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的音质调整设备的结构示意图;
图2为本发明音质调整方法第一实施例的流程示意图;
图3为本发明音质调整方法第二实施例的流程示意图;
图4为本发明音质调整装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的音质调整设备结构示意图。
如图1所示,该音质调整设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对音质调整设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及音质调整程序。
在图1所示的音质调整设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明音质调整设备中的处理器1001、存储器1005可以设置在音质调整设备中,所述音质调整设备通过处理器1001调用存储器1005中存储的音质调整程序,并执行本发明实施例提供的音质调整方法。
本发明实施例提供了一种音质调整方法,参照图2,图2为本发明一种音质调整方法第一实施例的流程示意图。
本实施例中,所述音质调整方法包括以下步骤:
步骤S10:获取初始声音信号。
需要说明的是,本实施例的执行主体为音质调整设备,其中,所述音质调整设备可以是具有数据处理及数据传输的设备,还可以是控制计算机、移动手机及平板电脑等电子设备,本实施例对此不做具体限制,在本实施例中及下述实施例中,将会以控制计算机为例进行说明。
可以理解的是,初始声音信号可以是由声音采集设备采集到的声音信号,其中,所述声音采集设备可以是麦克风或者声音采集卡等,本实施例对此不作具体限制,在本实施例中,将会以高敏麦克风为例进行说明。
此外,所述初始声音信号的信号传输方式,即对于初始声音信号的传输可以是通过有线电缆进行传输,还可以是通过无线蓝牙等无线通信的方式进行传输,本实施例对此不作具体限制。
步骤S20:根据所述初始声音信号确定目标频带信号,并提取所述目标频带信号的目标子带参数。
需要说明的是,目标频带信号用于计算目标频带的能量参数,以使目标高频声音信号处于合适的收敛速度,例如:由于声音信号在传播过程中高频信号明显衰减得快,低频信号衰减得慢,通过调整后,可以使得高频信号衰减速度变慢,低频信号衰减速度变快。
此外,目标频带信号可以通过对初始声音信号按照频段带宽进行划分,获得不同中心频率的频带声音信号,参考表1,可以按照表1中的中心频率及频带带宽对初始声音信号按照频段带宽进行划分。
Figure BDA0003399569090000061
表1:倍频程参数表
值得说明的是,所述目标子带参数可以是目标频带信号的频带信号带宽、频带信号分辨率及采样率等,还可以是将所述初始声音信号进行拆分后的子带数量等,本实施例对此不做具体限制。
步骤S30:根据所述目标频带信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数。
可以理解的是,预设频带参数计算模型用于计算所述目标频带信号的频带能量及频带能量占权频带能量的权重系数,并将所述目标频带信号的频带能量及频带能量占权频带能量的权重系数记为目标子带能量参数进行存储。
值得说明的是,在计算目标子带能量参数时,可以通过滤波器获得对初始声音信号进行滤波,此外,由于再对初始声音信号进行频带划分时,由于划分出来的目标频带信号的中心频率不同,在设置滤波器的参数时,需要根据不同目标频带信号的中心频率设置滤波器参数,在本实施例中,对初始声音信号进行滤波的滤波器可以采用一个低通滤波器与一个高通滤波器进行组合,以获得一个带通滤波器,提高滤波器滤波的效率。
步骤S40:基于所述目标子带参数与所述目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,获得目标声音信号。
需要说明的是,预设滤波模型用于基于所述目标子带参数与所述目标子带能量参数对目标频带信号进行收敛因子调整,并将调整收敛因子后的目标频带信号进行线性衔接变化,获得目标声音信号,其中所述目标声音信号可以为降低衰减速度后的高频信号或者增加衰减速度后的低频信号进行线性衔接后的声音信号,本实施例对此不作具体限制。
在具体实施中,通过针对不同频带信号的频带能量参数与频带参数通过自适应滤波进行调整不同频带对应的目标频带自适应因子的衰减速度,使得输出的声音信号的高频信号与低频信号可以同时存在,以达到减少实际应用过程中的反馈现象。
本实施例通过获取初始声音信号,根据所述初始声音信号确定目标频带信号,并提取所述目标频带信号的目标子带参数,根据所述目标频带信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数,基于所述目标子带参数与所述目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,获得目标声音信号。本实施例通过处理初始声音信号,获得目标频带信号的目标子带参数,并将所述目标频带信号通过预设频带参数计算模型进行参数计算,以获得准确的目标子带能量参数,通过目标子带参数与目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,有效的对初始声音信号的各个子带进行信号滤波,以减少初始声音信号进行扩音时的反馈现象,避免了麦克风进行拾音扩音时,会存在扩音反馈,导致音频清晰度下降,严重影响用户的听感的技术问题,增强了麦克风进行扩音的音质效果。
参考图3,图3为本发明一种音质调整方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S30,包括:
步骤S301:将所述目标频带信号进行信号滤波,获得滤波信号。
需要说明的是,在本实施例中,通过预先设置滤波器以使对目标频带信号进行信号滤波,其中,所述预设滤波器采用一个低通与一个高通组成一个带通滤波器,例如:在实际操作中,以一个10HZ的高通滤波与一个10000HZ的低通滤波,组成一个带通滤波器,筛选出频率范围在10HZ-10000HZ之间的声音信号。
步骤S302:将所述滤波信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数,所述目标子带能量参数包括:目标频带能量值与目标频带能量权重系数。
可以理解的是,对于滤波信号进行参数计算以获得频带能量及频带能量占权频带能量的权重系数,并将所述目标频带信号的频带能量及频带能量占权频带能量的权重系数记为目标子带能量参数进行存储。
进一步地,为了准确求取频带能量以及频带能量权重系数,所述步骤S302,包括:
提取所述滤波信号的帧长度数据;
基于所述帧长度数据通过预设频带参数计算模型对所述滤波信号进行参数计算,获得所述滤波信号对应的目标浮点值,所述目标浮点值可以是归一化浮点值。
根据所述目标浮点值与所述帧长度数据确定目标子带能量参数,并根据所述目标子带能量参数进行数据处理,获得目标频带能量权重系数。
值得说明的是,帧长度数据可以是预设时间段内的采样点数量,在实际操作中,以48000Hz采样率,用256点作为帧长度为例,在1秒内,存在有187个帧
在实际过程中,为了减少数据误差的影响,需要采用双二阶滤波器计算信号滤波后的归一化浮点值,以减少计算频带能量的误差,获取信号滤波后的归一化浮点值得具体公式为:
Figure BDA0003399569090000081
其中,所述a0、a1、a2与b0、b1、b2在高通与低通滤波器的参数数据,且在高通与低通滤波器中有不同的取值。
易于理解的是,在获得信号滤波后的归一化浮点值后,根据获得的帧长度数据与信号滤波后的归一化浮点值获得频带能量的具体公式为:
Figure BDA0003399569090000082
其中,len为帧长度数据,xi为采样后的滤波信号的归一化浮点值。
此外,基于频带能量获取频带能量权重系数的具体公式为:
Figure BDA0003399569090000091
其中Lrmsi是第i个倍频程频带的能量值,N为频带数量。
在本实施例中,所述步骤S40,包括:
步骤S401:获取期望信号。
需要说明的是,期望信号可以是将初始声音信号进行一定的延时后获得的信号,将延时输入后的声音信号作为期望响应信号通过滤波器系数更新方程进行更新滤波器的系数。
此外,为了更好的对信号进行滤波,还需要根据不同的频段信号更新滤波器系数以辨别不同作用于滤波器的冲激响应,在进行滤波器系数的更新时,可以采用归一化最小均方值(Normalized Least Mean Square,NLMS)的方式计算出更新后的滤波器系数,在实际操作中,对于一个长度为N的NLMS滤波器,其滤波器的系数迭代更新公式为:
Figure BDA0003399569090000092
其中,e为误差信号、d为期望信号、y为估计信号。
易于理解的是,所述误差信号为期望信号与估计信号之差,所述估计信号可以是滤波器的输出信号,根据所述期望信号与滤波器的估计信号获得误差信号以更新滤波器的系数。
步骤S402:根据所述目标子带参数、所述目标子带能量参数及所述期望信号更新预设滤波模型中的滤波模型系数,获得目标滤波模型。
需要说明的是,更新预设滤波模型中的滤波模型系数可以通过目标子带参数、所述目标子带能量参数及所述期望信号进行更新,其具体公式为:
Figure BDA0003399569090000093
其中,u为收敛因子,取值范围为0<u<1,w为滤波器抽头权向量,本实施例需要动态调整的系数为u。
进一步地,为了获得抽头权向量以及收敛因子,所述步骤S402,包括:
获取当前环境信息,并基于所述当前环境信息确定对应的声衰减系数;
根据所述声衰减系数、所述目标子带能量参数及所述目标子带参数确定收敛因子参数;
基于所述收敛因子参数确定抽头权向量;
根据所述收敛因子参数、所述期望信号及所述抽头权向量更新预设滤波模型中的滤波模型系数,获得目标滤波模型。
值得说明的是,声衰减系数可以通过综合备品带噪声的大气衰减系数结合各种环境条件取平均值,其中,大气衰减系数可以通过当前环境在预设大气衰减系数表中查询获取,参考表2,可以获得预设大气声衰减表。
Figure BDA0003399569090000101
表2:大气声衰减系数表
在具体实现中,根据当前环境信息在预设大气声衰减系数表中进行查询对应频带的大气声衰减系数平均值,例如:63Hz—0.13、125Hz—0.4、250Hz—1.1、500Hz—2.51kHz—5.43、2kHz—13.1、3kHz—37.92、8kHz—111。
进一步地,为了获取收敛因子,还需要提取所述目标子带参数中的子频带数量值,根据所述声衰减系数确定声衰减权重,基于所述目标子带能量参数与所述子频带数量值获得目标频带能量权重,基于所述声衰减权重、所述目标频带能量权重及所述目标子带参数确定收敛因子参数。
所述获取声衰减权重的具体公式为:
ρi=log10(98.2*αi)
其中,ρ为声衰减权重,α为大气衰减系数平均值,i为目标频带对应的频带信息。
在具体实现中,在本实施例中,当中心频率63Hz的声衰减系数p1=1.106,ps=4.037,可见8kHz高频段声衰减系数是63Hz低频段的约四倍。
所述获取倍频程频带能量权重系数因子的具体公式为:
φi=1+0.3*(λi*N-1)
其中,φ为频带能量权重;
进一步地,获得声衰减权重和所述目标频带能量权重后,还可以通过声衰减权重和所述目标频带能量权重去获取目标频带自适应因子来确定收敛因子,因此,基于所述声衰减权重、所述目标频带能量权重及所述目标子带参数确定收敛因子参数的步骤,包括:基于所述声衰减权重和所述目标频带能量权重确定目标频带自适应因子,根据所述目标频带自适应因子与所述目标子带参数进行数据处理,获得收敛因子参数。
根据声衰减权重和目标频带能量权重确定目标频带自适应因子的具体公式为:
γi=0.001*φii
其中,φ为频带能量权重,ρ为声衰减权重。
步骤S403:将所述目标频带信号通过所述目标滤波模型进行信号滤波,获得目标声音信号。
应当理解的是,在对目标频带信号通过所述目标滤波模型进行信号滤波时,可以使用快速傅里叶变换(fast Fourier transform,FFT)滤波对每一个频带信号进行滤波,还可以为其他具有滤波功能的模块进行滤波处理,本实施例对此不作具体限制。
进一步地,获得声衰减权重和所述目标频带能量权重后,还可以通过声衰减权重和所述目标频带能量权重去获取目标频带自适应因子来确定收敛因子,因此,基于所述声衰减权重、所述目标频带能量权重及所述目标子带参数确定收敛因子参数的步骤,包括:基于所述声衰减权重和所述目标频带能量权重确定目标频带自适应因子,根据所述目标频带自适应因子与所述目标子带参数进行数据处理,获得收敛因子参数。
在具体实现中,在完成子带滤波之后,还可以将8段子带权重系数进行推广至全频带系数,以获得收敛因子的准确系数,获取收敛因子的具体公式为:
Figure BDA0003399569090000121
Figure BDA0003399569090000122
其中,其中Fs为采样率,FL为FFT长度,Ff为FFT的分辨率。Bi为每个频带的宽度,Fj对应其所属频带区域的相对索引,u为频点的收敛因子。Floor向下取整运算。
在具体实施中,获取收敛因子后,将所述收敛因子带入NLMS公式中,以求得更新的抽头权向量,以使滤波器进行信号滤波,输出目标声音信号。
本实施例通过处理初始声音信号,获得目标频带信号的目标子带参数,并将所述目标频带信号通过滤波器进行信号滤波后,将滤波后的信号通过预设频带参数计算模型进行参数计算,可以清除噪音信号,以获得目标频带信号对应的准确目标子带能量参数,并提取目标子带能量参数中的期望信号,通过目标子带参数与目标子带能量参数更新预设滤波模型中的滤波模型系数,获得目标滤波模型,可以实时更新滤波模型的系数,以实现准确的信号滤波,通过目标滤波模型对所述目标频带信号进行信号滤波,有效的对初始声音信号的各个子带进行信号滤波,以减少初始声音信号进行扩音时的反馈现象,避免了麦克风进行拾音扩音时,会存在扩音反馈,导致音频清晰度下降,严重影响用户的听感的技术问题,增强了麦克风进行扩音的音质效果。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有音质调整程序,所述音质调整程序被处理器执行时实现如上文所述的音质调整方法的步骤。
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
参照图4,图4为本发明音质调整装置第一实施例的结构框图。
如图4所示,本发明实施例提出的音质调整装置包括:
信号获取模块10,用于获取初始声音信号。
参数获取模块20,用于根据所述初始声音信号确定目标频带信号,并提取目标频带信号的目标子带参数。
参数计算模块30,用于根据所述目标频带信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数。
信号滤波模块40,用于基于所述目标子带参数与所述目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,获得目标声音信号。
本实施例通过处理初始声音信号,获得目标频带信号的目标子带参数,并将所述目标频带信号通过预设频带参数计算模型进行参数计算,以获得准确的目标子带能量参数,通过目标子带参数与目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,有效的对初始声音信号的各个子带进行信号滤波,以减少初始声音信号进行扩音时的反馈现象,避免了麦克风进行拾音扩音时,会存在扩音反馈,导致音频清晰度下降,严重影响用户的听感的技术问题,增强了麦克风进行扩音的音质效果。
在一实施例中,所述信号滤波模块40,还用于从所述目标频带信号中提取期望信号,并获取所述期望信号对应的期望信号;根据所述目标子带参数、所述目标子带能量参数及所述期望信号更新预设滤波模型中的滤波模型系数,获得目标滤波模型;将所述目标频带信号通过所述目标滤波模型进行信号滤波,获得目标声音信号。
在一实施例中,所述信号滤波模块40,还用于获取当前环境信息,并基于所述当前环境信息确定对应的声衰减系数;根据所述声衰减系数、所述目标子带能量参数及所述目标子带参数确定收敛因子参数;基于所述收敛因子参数确定抽头权向量;根据所述收敛因子参数、所述期望信号及所述抽头权向量更新预设滤波模型中的滤波模型系数,获得目标滤波模型。
在一实施例中,所述信号滤波模块40,还用于提取所述目标子带参数中的子频带数量值;根据所述声衰减系数确定声衰减权重;基于所述目标子带能量参数与所述子频带数量值获得目标频带能量权重;基于所述声衰减权重、所述目标频带能量权重及所述目标子带参数确定收敛因子参数。
在一实施例中,所述信号滤波模块40,还用于基于所述声衰减权重和所述目标频带能量权重确定目标频带自适应因子;根据所述目标频带自适应因子与所述目标子带参数进行数据处理,获得收敛因子参数。
在一实施例中,所述参数计算模块30,还用于将所述目标频带信号进行信号滤波,获得滤波信号;将所述滤波信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数,所述目标子带能量参数包括:目标频带能量值与目标频带能量权重系数。
在一实施例中,所述参数计算模块30,还用于提取所述滤波信号的帧长度数据;基于所述帧长度数据通过预设频带参数计算模型对所述滤波信号进行参数计算,获得所述滤波信号对应的目标浮点值;根据所述目标浮点值与所述帧长度数据确定目标子带能量参数,并根据所述目标子带能量参数进行数据处理,获得目标频带能量权重系数。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的音质调整方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种音质调整方法,其特征在于,所述音质调整方法包括:
获取初始声音信号;
根据所述初始声音信号确定目标频带信号,并提取所述目标频带信号的目标子带参数;
根据所述目标频带信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数;
基于所述目标子带参数与所述目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,获得目标声音信号。
2.如权利要求1所述的音质调整方法,其特征在于,所述基于所述目标子带参数与所述目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,获得目标声音信号,包括:
获取期望信号;
根据所述目标子带参数、所述目标子带能量参数及所述期望信号更新预设滤波模型中的滤波模型系数,获得目标滤波模型;
将所述目标频带信号通过所述目标滤波模型进行信号滤波,获得目标声音信号。
3.如权利要求2所述的音质调整方法,其特征在于,所述根据所述目标子带参数、所述目标子带能量参数及所述期望信号更新预设滤波模型中的滤波模型系数,获得目标滤波模型,包括:
获取当前环境信息,并基于所述当前环境信息确定对应的声衰减系数;
根据所述声衰减系数、所述目标子带能量参数及所述目标子带参数确定收敛因子参数;
基于所述收敛因子参数确定抽头权向量;
根据所述收敛因子参数、所述期望信号及所述抽头权向量更新预设滤波模型中的滤波模型系数,获得目标滤波模型。
4.如权利要求3所述的音质调整方法,其特征在于,所述根据所述声衰减系数、所述目标子带能量参数确定收敛因子参数,包括:
提取所述目标子带参数中的子频带数量值;
根据所述声衰减系数确定声衰减权重;
基于所述目标子带能量参数与所述子频带数量值获得目标频带能量权重;
基于所述声衰减权重、所述目标频带能量权重确定收敛因子参数。
5.如权利要求4所述的音质调整方法,其特征在于,所述基于所述声衰减权重、所述目标频带能量权重确定收敛因子参数,包括:
基于所述声衰减权重和所述目标频带能量权重确定目标频带自适应因子;
根据所述目标频带自适应因子与所述目标子带参数进行数据处理,获得收敛因子参数。
6.如权利要求1-5任一项所述的音质调整方法,其特征在于,所述根据所述目标频带信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数,包括:
将所述目标频带信号进行信号滤波,获得滤波信号;
将所述滤波信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数,所述目标子带能量参数包括:目标频带能量值与目标频带能量权重系数。
7.如权利要求6所述的音质调整方法,其特征在于,所述将所述滤波信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数,包括:
提取所述滤波信号的帧长度数据;
基于所述帧长度数据通过预设频带参数计算模型对所述滤波信号进行参数计算,获得所述滤波信号对应的目标浮点值;
根据所述目标浮点值与所述帧长度数据确定目标子带能量参数,并根据所述目标子带能量参数进行数据处理,获得目标频带能量权重系数。
8.一种音质调整装置,其特征在于,所述音质调整装置包括:
信号获取模块,用于获取初始声音信号;
参数获取模块,用于根据所述初始声音信号确定目标频带信号,并提取目标频带信号的目标子带参数;
参数计算模块,用于根据所述目标频带信号通过预设频带参数计算模型进行参数计算,获得目标子带能量参数;
信号滤波模块,用于基于所述目标子带参数与所述目标子带能量参数通过预设滤波模型对所述目标频带信号进行信号滤波,获得目标声音信号。
9.一种音质调整设备,其特征在于,所述音质调整设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音质调整程序,所述音质调整程序配置为实现如权利要求1至7中任一项所述的音质调整方法。
10.一种存储介质,其特征在于,所述存储介质上存储有音质调整程序,所述音质调整程序被处理器执行时实现如权利要求1至7任一项所述的音质调整方法。
CN202111497099.7A 2021-12-08 2021-12-08 音质调整方法、装置、设备及存储介质 Pending CN114420153A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111497099.7A CN114420153A (zh) 2021-12-08 2021-12-08 音质调整方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111497099.7A CN114420153A (zh) 2021-12-08 2021-12-08 音质调整方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114420153A true CN114420153A (zh) 2022-04-29

Family

ID=81264749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111497099.7A Pending CN114420153A (zh) 2021-12-08 2021-12-08 音质调整方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114420153A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117153192A (zh) * 2023-10-30 2023-12-01 科大讯飞(苏州)科技有限公司 音频增强方法、装置、电子设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117153192A (zh) * 2023-10-30 2023-12-01 科大讯飞(苏州)科技有限公司 音频增强方法、装置、电子设备和存储介质
CN117153192B (zh) * 2023-10-30 2024-02-20 科大讯飞(苏州)科技有限公司 音频增强方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN107945815B (zh) 语音信号降噪方法及设备
US8238569B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
CN109845288B (zh) 用于麦克风之间的输出信号均衡的方法和装置
US20070088544A1 (en) Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
CN106063293B (zh) 自动声均衡的方法和系统
JP2003534570A (ja) 適応ビームフォーマーにおいてノイズを抑制する方法
JP2002541753A (ja) 固定フィルタを用いた時間領域スペクトラル減算による信号雑音の低減
CN112565981B (zh) 啸叫抑制方法、装置、助听器及存储介质
CN111063366A (zh) 降低噪声的方法、装置、电子设备及可读存储介质
CN110248300B (zh) 一种基于自主学习的啸叫抑制方法及扩声系统
KR102040986B1 (ko) 두 개의 마이크로폰을 포함하는 휴대단말에서의 잡음제거방법 및 장치
WO2022256577A1 (en) A method of speech enhancement and a mobile computing device implementing the method
CN110931007A (zh) 语音识别方法及系统
CN114420153A (zh) 音质调整方法、装置、设备及存储介质
CN112802490B (zh) 一种基于传声器阵列的波束形成方法和装置
CN110447239B (zh) 拾音装置及拾音方法
CN112735370B (zh) 一种语音信号处理方法、装置、电子设备和存储介质
CN110808058B (zh) 语音增强方法、装置、设备及可读存储介质
CN112997249B (zh) 语音处理方法、装置、存储介质及电子设备
US11483646B1 (en) Beamforming using filter coefficients corresponding to virtual microphones
JP6314475B2 (ja) 音声信号処理装置及びプログラム
CN113205824B (zh) 声音信号处理方法、装置、存储介质、芯片及相关设备
CN111370017B (zh) 一种语音增强方法、装置、系统
CN112866877A (zh) 扬声器控制方法、扬声器控制装置、电子设备和存储介质
CN114724576B (zh) 一种啸叫检测中的门限实时更新方法、装置以及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination