CN115376537A

CN115376537A - 信号处理方法、装置、电子设备及介质

Info

Publication number: CN115376537A
Application number: CN202210910782.7A
Authority: CN
Inventors: 刘哲
Original assignee: Goertek Techology Co Ltd
Current assignee: Goertek Techology Co Ltd
Priority date: 2022-07-29
Filing date: 2022-07-29
Publication date: 2022-11-22

Abstract

本公开提供了一种信号处理方法、装置、电子设备及介质，获取目标语音信号；基于谱减法对所述目标语音信号进行降噪处理，获得第一语音信号；基于自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号。

Description

信号处理方法、装置、电子设备及介质

技术领域

本公开实施例涉及智能设备技术领域，更具体地，涉及一种信号处理方法、一种信号处理装置、一种电子设备、及一种计算机可读存储介质。

背景技术

现有技术中，在语音降噪算法中，谱减法易于实现，且计算量小，可以获得较高信噪比的语音信号，因此被广泛应用于语音降噪算法中，然而，谱减法会引入新的噪声干扰问题，从而导致语音信号产生一定程度的失真，降低语音质量。

发明内容

本公开实施例的一个目的是提供一种信号处理的新的技术方案。

根据本公开实施例的第一方面，提供一种信号处理方法，所述方法包括：

获取目标语音信号；

基于谱减法对所述目标语音信号进行降噪处理，获得第一语音信号；

基于自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号。

可选地，所述基于自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号，包括：

根据设定阶段的第一语音信号，对所述自适应滤波器的参数进行更新，以使得所述自适应滤波器达到最优滤波，得到更新后的自适应滤波器；

基于更新后的自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号。

可选地，所述基于谱减法对所述目标语音信号进行降噪处理，获得第一语音信号，包括：

将所述目标语音信号切分为多帧语音信号；

对所述多帧语音信号中的每帧语音信号进行傅里叶变换，得到与每帧语音信号对应的频域信号；

从所述每帧语音信号对应的频域信号中，去除噪声信号对应的频域信号，得到第一频域信号；

对所述第一频域信号进行反傅里叶变换，得到所述第一语音信号。

可选地，所述从所述每帧语音信号对应的频域信号中，去除噪声信号对应的频域信号，得到第一频域信号，包括：

对所述每帧语音信号对应的频域信号进行噪声估计，得到第二频域信号；

获取每帧所述语音信号对应的频域信号的幅值和相角；

根据所述第二频域信号、每帧所述语音信号对应的频域信号的幅值和相角，得到所述第一频域信号。

根据本公开实施例的第二方面，提供了一种信号处理装置，所述装置包括：

获取模块，用于获取目标语音信号；

第一处理模块，用于基于谱减法对所述目标语音信号进行降噪处理，获得第一语音信号；

第二处理模块，用于基于自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号。

可选地，所述第二处理模块，具体用于：

可选地，所述第一处理模块，具体用于：

将所述目标语音信号切分为多帧语音信号；

可选地，所述第一处理模块，具体用于：

获取每帧所述语音信号对应的频域信号的幅值和相角；

根据本公开实施例的第三方面，提供了一种电子设备，所述电子设备包括：

存储器，用于存储可执行的计算机指令；

处理器，用于根据所述可执行的计算机指令的控制，执行根据以上第一方面所述的信号处理方法。

根据本公开的第四方面，提供了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令被处理器运行时执行以上第一方面所述的信号处理方法。

本公开实施例的一个有益效果在于，其在获取目标语音信号之后，会先基于谱减法对目标语音信号进行降噪处理，以获得第一语音信号，并进一步基于自适应滤波器对第一语音信号进行自适应滤波，进而获得第二语音信号。即，其针对于基本谱减法所引入新的噪声干扰问题，采用自适应滤波器与普减法相结合，基于自适应滤波器能够去除谱减法所引入的噪声干扰，消除了谱减法产生的额外噪声，进而提高语音质量。

通过以下参照附图对本说明书的示例性实施例的详细描述，本说明书的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本说明书的实施例，并且连同其说明一起用于解释本说明书的原理。

图1是根据本公开实施例的电子设备的硬件配置示意图；

图2是根据本公开实施例的信号处理方法的流程示意图；

图3是根据本公开实施例的自适应滤波器和谱减法结合示意图；

图4是根据本公开实施例的自适应滤波器的原理示意图；

图5是根据本公开实施例的信号处理装置的原理框图；

图6是根据本公开实施例的电子设备的原理框图。

具体实施方式

现在将参照附图来详细描述本公开的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开实施例的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

<硬件配置>

图1是根据本公开实施例的电子设备1000的硬件配置的框图，该电子设备1000可以是具有语音通话功能的设备，该电子设备1000例如可以是耳机，例如耳机可以为主动降噪耳机。

在一个实施例中，如图1所示，电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。

其中，处理器1100可以包括但不限于中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括各种总线接口，例如串行总线接口(包括USB接口)、并行总线接口等。通信装置1400例如能够进行有线或无线通信。显示装置1500例如是液晶显示屏、LED显示屏、触摸显示屏等。输入装置1600例如包括触摸屏、键盘、手柄等。耳机1000可以通过扬声器1700输出音频信息，可以通过麦克风1800采集音频信息。

本领域技术人员应当理解，尽管在图1中示出了电子设备1000的多个装置，但是，本说明书实施例的电子设备1000可以仅涉及其中的部分装置，也可以还包含其他装置，在此不做限定。

本实施例中，电子设备1000的存储器1200用于存储指令，该指令用于控制处理器1100进行操作以实施或者支持实施根据任意实施例的信号处理方法。技术人员可以根据本说明书所公开方案设计指令。指令如何控制处理器进行操作，这是本领域公知，故在此不再详细描述。

在上述描述中，技术人员可以根据本公开所提供的方案设计指令。指令如何控制处理器进行操作，这是本领域公知，故在此不再详细描述。

图1所示的耳机仅是解释性的，并且决不是为了要限制本公开、其应用或用途。

<方法实施例>

图2示出了本公开的一个实施例的信号处理方法，信号处理方法例如可以由如图1所示的电子设备1000实施，该电子设备1000可以是具有语音通话功能的设备，该电子设备1000例如可以是耳机。

如图2所示，本实施例中的信号处理方法可以包括如下步骤S2100～步骤S2300：

步骤S2100，获取目标语音信号。

目标语音信号可以是电子设备的麦克风所拾取的信号。以电子设备为耳机为例，可以理解的是，耳机的麦克风所拾取的语音信号中通常会包括有噪声信号，从而导致所拾取的语音信号并不是纯净的语音。其中，该噪声信号例如可以包括从传输介质中引入的噪音，也可以包括耳机自身硬件因素产生的噪音等，本实施例对此不做赘述。

在执行步骤S2100获取目标语音信号之后，进入：

步骤S2200，基于谱减法对所述目标语音信号进行降噪处理，获得第一语音信号。

其中，谱减法为用带噪声的频谱减去噪声信号的频谱以得到纯净的语音。

在一个具体地实施例中，本步骤S2200中基于谱减法对所述目标语音信号进行降噪处理，获得第一语音信号可以进一步包括如下步骤S2210～步骤S2240：

步骤S2210，将所述目标语音信号切分为多帧语音信号。

本步骤S2210中，参照图3所示，可以对所获取的目标语音信号x(n)经过加窗和分帧处理，得到多帧语音信号，其中，多帧语音信号中包括第i帧语音信号x_i(m)。

其中，分帧时的每一帧的帧长例如可以是7.5ms，即每7.5ms为一帧语音信号。

可以理解的是，当16kHz采样率时，(一秒采集16000个点)，每一帧语音信号的帧长为7.5ms，每一帧语音信号中包括120个点，即满足120/16000＝7.5ms。虽然一般的硬件平台均为16kHz，当然，也不排除有其他采样率如48kHz等。本步骤S2210中，关于如何对目标语音信号x(n)经过加窗和分帧处理以得到多帧语音信号属于现有技术，本实施例不做详细赘述。

步骤S2220，对所述多帧语音信号中的每帧语音信号进行傅里叶变换，得到与每帧语音信号对应的频域信号。

其中，傅里叶变换可以是快速傅里叶变换(Fast Fourier Transform，FFT)，傅里叶变换用于将一个时域信号变换为对应的频域信号，该频域信号即为该时域信号的频谱。

本步骤S2220中，参照图3所示，可以对第i帧语音信号x_i(m)进行快速傅里叶变换FFT，得到第i帧语音信号x_i(m)对应的频域信号X_i(k)。

步骤S2230，从所述每帧语音信号对应的频域信号中，去除噪声信号对应的频域信号，得到第一频域信号。

在一个具体地实施例中，本步骤S2230中从所述每帧语音信号对应的频域信号中，去除噪声信号对应的频域信号，得到第一频域信号可以进一步包括如下步骤S2231～步骤S2233：

步骤S2231，对所述每帧语音信号对应的频域信号进行噪声估计，得到第二频域信号。

本步骤S2231中，参照图3所示，已知噪声的时长可以为IS，对应的帧数为NIS，则对每帧语音信号对应的频域信号进行噪声估计，则噪声估计信号即第二频域信号为：

其中，X_i(k)表示第i帧语音信号对应的频域信号，NIS表示存在噪声的语音信号的帧数。

步骤S2231，获取每帧所述语音信号对应的频域信号的幅值和相角。

本步骤S2231中，参照图3所示，可以计算每帧语音信号的幅值|X_i(k)|。

本步骤S2231中，参照图3所示，可以根据如下公式(2)计算第i帧语音信号对应的频域信号的相角：

其中，Im(X_i(k))表示X_i(k)的虚部，Re(X_i(k))表示X_i(k)的实部。

步骤S2233，根据所述第二频域信号、每帧所述语音信号对应的频域信号的幅值和相角，得到所述第一频域信号。

第一频域信号即为用带噪声的频谱减去噪声信号的频谱所得到频谱。

本步骤S2233中，参照如下公式(3)，其为谱减计算公式：

其中，a为过减因子常量，b为增益补偿因子常量。

可以理解的是，在根据谱减计算公式计算得到

之后，便可获得

其中，

为第一频域信号的幅值。

本步骤S2233中，参照图3所示，由于语音信号对于本身的相角信息不敏感，在此，可以将进行谱减公式计算之前的相角信息直接用到进行谱减公式之后的信息中，也就是可以将第i帧语音信号对应的相角

作为对应的第一频域信号的相角。

步骤S2240，对所述第一频域信号进行反傅里叶变换，得到所述第一语音信号。

本步骤S2240中，对第一频域信号进行快速傅里叶反变换((Inverse FastFourier Transform，IFFT)，即对以上幅值

和相角Xⁱ _angle(k)进行IFFT变换，便可得到谱减法之后的语音信号即第二语音信号。

在执行步骤S2200基于谱减法对所述目标语音信号进行降噪处理，获得第一语音信号之后，进入：

步骤S2300，基于自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号。

本实施例中，由于进行谱减法处理后得到的第一语音信号中引入了新的噪声信号，在此，其在基本谱减法的基础上增加一个自适应滤波器，基于自适应滤波器对第一语音信号进行自适应滤波，以去除谱减法所引入的噪声干扰，提高语音质量。

可以理解的是，参照图4所示的自适应滤波器的基本原理，n为时间变量，y(n)为经过自适应滤波器之后的系统输出信号y(n)，d(n)为期望响应，误差信号为e(n)。自适应滤波器的算法核心是根据前段语音信号的噪声特性更新自适应滤波器的参数，通过不停的迭代使得自适应滤波器能够达到最优滤波。

本实施例中，本步骤S2300基于自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号可以进一步包括如下步骤S2310～步骤S2320：

步骤S2310，根据设定阶段的第一语音信号，对所述自适应滤波器的参数进行更新，以使得所述自适应滤波器达到最优滤波，得到更新后的自适应滤波器。

其中，设定阶段的第一语音信号通常是指：第一语音信号中没有语音仅有噪声的信号。

步骤S2320，基于更新后的自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号。

参照图3，进行自适应滤波得到第二语音信号

该第二语音信号

为纯净的语音信号。

根据以上步骤S2310～步骤S2320，针对基本谱减法所引入新的噪声干扰问题，采用自适应滤波器根据无声段引入噪声的特性(没有语音仅有噪声的语音信号)，进一步自适应调整自适应滤波器的参数，从而消除基本谱减法带来的新的噪声干扰，实现最优滤波。

根据本申请实施例，其在获取目标语音信号之后，会先基于谱减法对目标语音信号进行降噪处理，以获得第一语音信号，并进一步基于自适应滤波器对第一语音信号进行自适应滤波，进而获得第二语音信号。即，其针对于基本谱减法所引入新的噪声干扰问题，采用自适应滤波器与普减法相结合，基于自适应滤波器能够去除谱减法所引入的噪声干扰，消除了谱减法产生的额外噪声，进而提高语音质量。

<装置实施例>

图5是根据一个实施例的信号处理装置的结构示意图。如图5所示，该信号处理装置500包括获取模块510、第一处理模块520和第二处理模块530。

获取模块510，用于获取目标语音信号。

第一处理模块520，用于基于谱减法对所述目标语音信号进行降噪处理，获得第一语音信号。

第二处理模块530，用于基于自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号。

在一个实施例中，所述第二处理模块530，具体用于：根据设定阶段的第一语音信号，对所述自适应滤波器的参数进行更新，以使得所述自适应滤波器达到最优滤波，得到更新后的自适应滤波器；基于更新后的自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号。

在一个实施例中，所述第一处理模块520，具体用于：将所述目标语音信号切分为多帧语音信号；对所述多帧语音信号中的每帧语音信号进行傅里叶变换，得到与每帧语音信号对应的频域信号；从所述每帧语音信号对应的频域信号中，去除噪声信号对应的频域信号，得到第一频域信号；对所述第一频域信号进行反傅里叶变换，得到所述第一语音信号。

在一个实施例中，所述第一处理模块520，具体用于：对所述每帧语音信号对应的频域信号进行噪声估计，得到第二频域信号；获取每帧所述语音信号对应的频域信号的幅值和相角；根据所述第二频域信号、每帧所述语音信号对应的频域信号的幅值和相角，得到所述第一频域信号。

根据本公开实施例，其在获取目标语音信号之后，会先基于谱减法对目标语音信号进行降噪处理，以获得第一语音信号，并进一步基于自适应滤波器对第一语音信号进行自适应滤波，进而获得第二语音信号。即，其针对于基本谱减法所引入新的噪声干扰问题，采用自适应滤波器与普减法相结合，基于自适应滤波器能够去除谱减法所引入的噪声干扰，消除了谱减法产生的额外噪声，进而提高语音质量。

<设备实施例>

图6是根据一个实施例的电子设备的硬件结构示意图。如图6所示，该电子设备600包括处理器610和存储器620。

该存储器620可以用于存储可执行的计算机指令。

该处理器610可以用于根据所述可执行的计算机指令的控制，执行根据本公开方法实施例所述的信号处理方法。

该电子设备600可以是如图1所示的电子设备1000，也可以是具备其他硬件结构的设备，在此不做限定。

在另外的实施例中，该电子设备600可以包括以上信号处理装置500。

在一个实施例中，以上信号处理装置500的各模块可以通过处理器610运行存储器620中存储的计算机指令实现。

<计算机可读存储介质>

本公开实施例还提供了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令被处理器运行时执行本公开实施例提供的信号处理方法。

本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是，通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。

以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本公开的范围由所附权利要求来限定。

Claims

1.一种信号处理方法，其特征在于，所述方法包括：

获取目标语音信号；

2.根据权利要求1所述的方法，其特征在于，所述基于自适应滤波器对所述第一语音信号进行自适应滤波，获得第二语音信号，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于谱减法对所述目标语音信号进行降噪处理，获得第一语音信号，包括：

将所述目标语音信号切分为多帧语音信号；

4.根据权利要求3所述的方法，其特征在于，所述从所述每帧语音信号对应的频域信号中，去除噪声信号对应的频域信号，得到第一频域信号，包括：

获取每帧所述语音信号对应的频域信号的幅值和相角；

5.一种信号处理装置，其特征在于，所述装置包括：

获取模块，用于获取目标语音信号；

6.根据权利要求5所述的装置，其特征在于，所述第二处理模块，具体用于：

7.根据权利要求5所述的装置，其特征在于，所述第一处理模块，具体用于：

将所述目标语音信号切分为多帧语音信号；

8.根据权利要求7所述的装置，其特征在于，所述第一处理模块，具体用于：

获取每帧所述语音信号对应的频域信号的幅值和相角；

9.一种电子设备，其特征在于，所述电子设备包括：

存储器，用于存储可执行的计算机指令；

处理器，用于根据所述可执行的计算机指令的控制，执行根据权利要求1-4中任意一项所述的信号处理方法。

10.一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令被处理器运行时执行权利要求1-4中任意一项所述的信号处理方法。