CN114387983A - 一种噪声抑制参数处理方法、装置及计算机设备 - Google Patents

一种噪声抑制参数处理方法、装置及计算机设备 Download PDF

Info

Publication number
CN114387983A
CN114387983A CN202011133182.1A CN202011133182A CN114387983A CN 114387983 A CN114387983 A CN 114387983A CN 202011133182 A CN202011133182 A CN 202011133182A CN 114387983 A CN114387983 A CN 114387983A
Authority
CN
China
Prior art keywords
noise suppression
current frame
suppression factor
time domain
smoothing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011133182.1A
Other languages
English (en)
Inventor
刘溪
杨晓霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen Mobvoi Beijing Information Technology Co Ltd
Original Assignee
Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen Mobvoi Beijing Information Technology Co Ltd filed Critical Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority to CN202011133182.1A priority Critical patent/CN114387983A/zh
Publication of CN114387983A publication Critical patent/CN114387983A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)

Abstract

本发明实施例公开了一种噪声抑制参数处理方法、装置及计算机设备,包括:获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子;根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子;对所述时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子。本发明实施例的技术方案实现能够提高噪声抑制参数的准确性和可靠性,进而提高语音信号的噪声抑制效果。

Description

一种噪声抑制参数处理方法、装置及计算机设备
技术领域
本发明实施例涉及语音处理技术领域,尤其涉及一种噪声抑制参数处理方法、装置、计算机设备及存储介质。
背景技术
在语音信号处理流程中,噪声抑制处理能够有效消除语音信号中的语音交互环境噪声,实现流畅而清晰的语音交互体验,也是目前针对语音信号进程语音增强处理的主要技术手段。
目前,用于噪声抑制处理的噪声抑制参数,如噪声抑制因子等,需要根据语音信号每一帧每一个频点的信号功率谱与噪声功率谱计算获取。因此。现有的噪声抑制参数在语音信号的每一帧的每一个频点上是相互独立的。
发明人在实现本发明的过程中,发现现有技术存在如下缺陷:独立计算各帧各频点的噪声抑制参数会导致某些时刻某些频点上的噪声抑制较为严重,进而语音失真较大;或者,还会导致在某些时刻某些频点上的噪声抑制程度不够,进而噪声残留异常突出。
发明内容
本发明实施例提供一种噪声抑制参数处理方法、装置、计算机设备及存储介质,以提高噪声抑制参数的准确性和可靠性,进而提高语音信号的噪声抑制效果。
第一方面,本发明实施例提供了一种噪声抑制参数处理方法,包括:
获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子;
根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子;
对所述时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子。
第二方面,本发明实施例还提供了一种噪声抑制参数处理装置,包括:
噪声抑制因子获取模块,用于获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子;
时域当前帧噪声抑制因子获取模块,用于根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子;
目标当前帧噪声抑制因子获取模块,用于对所述时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子。
第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的噪声抑制参数处理方法。
第四方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的噪声抑制参数处理方法。
本发明实施例通过根据获取的前一帧噪声抑制因子对获取的当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子,以对时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子,解决现有噪声抑制参数处理方法存在的噪声抑制参数的准确性和可靠性较低等问题,以提高噪声抑制参数的准确性和可靠性,进而提高语音信号的噪声抑制效果。
附图说明
图1是本发明实施例一提供的一种噪声抑制参数处理方法的流程图;
图2是本发明实施例二提供的一种噪声抑制参数处理方法的流程图;
图3是本发明实施例三提供的一种噪声抑制参数处理装置的示意图;
图4为本发明实施例四提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
本发明实施例的说明书和权利要求书及附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
实施例一
图1是本发明实施例一提供的一种噪声抑制参数处理方法的流程图,本实施例可适用于获取准确性和可靠性更高的噪声抑制参数的情况,该方法可以由噪声抑制参数处理装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在计算机设备中。相应的,如图1所示,该方法包括如下操作:
S110、获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子。
其中,当前帧待处理语音信号可以是语音信号中当前需要进行噪声抑制处理的一帧语音信号。前一帧已处理语音信号可以是当前帧待处理语音信号的前一帧语音信号,该帧语音信号已经完成对噪声抑制参数的处理。可选的,噪声抑制参数可以包括噪声抑制因子。当前帧噪声抑制因子可以是当前帧待处理语音信号对应的噪声抑制因子,该噪声抑制因子需要进一步处理以保证其准确性和可靠性。前一帧噪声抑制因子可以是前一帧已处理语音信号对应的噪声抑制因子,该噪声抑制因子已经处理完成,其准确性和可靠性较高。可以理解的是,对于一帧语音信号来说,每一帧语音信号的每一个频点均对应一个噪声抑制因子。也即,当前帧噪声抑制因子和前一帧噪声抑制因子均可以包括多个噪声抑制因子,每个噪声抑制因子与频点相对应。
在本发明实施例中,考虑到已经处理完成的噪声抑制因子的准确性和可靠性较高,因此可以参考相邻已处理的语音信号的噪声抑制因子,对每一帧语音信号的噪声抑制因子进行处理。也即,可以利用相邻两帧的语音信号的噪声抑制因子对未处理的噪声抑制因子进行处理。相应的,可以获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子,并利用前一帧已处理语音信号的前一帧噪声抑制因子对当前帧待处理语音信号的当前帧噪声抑制因子进行处理。基于前后帧的噪声抑制因子,可以对当前帧每一个频点上的噪声抑制因子进行处理。
S120、根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子。
其中,时域当前帧噪声抑制因子可以是当前帧噪声抑制因子进行时域平滑处理后得到的噪声抑制因子。时域平滑处理也即基于时间轴的平滑处理
可选的,可以利用前一帧噪声抑制因子对当前帧噪声抑制因子在时间轴上进行平滑处理,得到时域当前帧噪声抑制因子。
S130、对所述时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子。
其中,目标当前帧噪声抑制因子可以是最终处理完成的噪声抑制因子。频域平滑处理也即在频域范围内对噪声抑制因子进行平滑处理。
相应的,在对当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子,可以继续对获取的时域当前帧噪声抑制因子在频域范围内进行平滑处理,得到最终的目标当前帧噪声抑制因子。
由此可见,本发明实施例分别基于时域和频域对当前帧噪声抑制因子进行平滑处理,可以使得降噪处理之后的语音信号无论从时域还是从频域都无明显失真,从而可以提高噪声抑制参数的准确性和可靠性,进而可以提高语音信号的噪声抑制效果。
本发明实施例通过根据获取的前一帧噪声抑制因子对获取的当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子,以对时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子,解决现有噪声抑制参数处理方法存在的噪声抑制参数的准确性和可靠性较低等问题,以提高噪声抑制参数的准确性和可靠性,进而提高语音信号的噪声抑制效果。
实施例二
图2是本发明实施例二提供的一种噪声抑制参数处理方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,给出了根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子,以及,对所述时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子的具体可选的实施方式。相应的,如图2所示,本实施例的方法可以包括:
S210、获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子。
S220、根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子。
在本发明的一个可选实施例中,所述根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,可以包括:基于如下公式对所述当前帧噪声抑制因子进行时域平滑处理:
Figure BDA0002735813060000071
其中,Gi,j表示所述时域当前帧第j个频点噪声抑制因子,
Figure BDA0002735813060000072
表示当前帧第j个频点的噪声抑制因子,α表示平滑系数,可选的,α的取值范围可以为[0.5,1],本发明实施例并不对α的具体数值进行限定。Gi-1,j表示时域前一帧第j个频点的噪声抑制因子。所谓时域前一帧第j个频点的噪声抑制因子也即前一帧已处理语音信号的前一帧第j个频点的噪声抑制因子。
在本发明实施例中,可以基于帧与帧之间的关系,得到各帧语音信号在时间轴上的噪声抑制平滑结果。由降噪算法得到当前帧第j个频点上的噪声抑制因子为
Figure BDA0002735813060000074
利用前一帧噪声抑制因子Gi-1,j
Figure BDA0002735813060000075
进行时域平滑处理之后的降噪因子为Gi,j。需要说明的是,噪声抑制因子的数值越大,其对语音信号中噪声的抑制作用越弱;噪声抑制因子的数值越小,其对语音信号中噪声的抑制作用越强。相应的,由公式
Figure BDA0002735813060000073
可以看出,通过对比当前帧第j个频点的噪声抑制因子与时域前一帧第j个频点的噪声抑制因子之间的大小关系,可以避免某一频点对应的噪声抑制因子变化过大导致抑制作用较弱,导致语音突变严重的问题。
S230、对所述时域当前帧噪声抑制因子进行异常凸起平滑处理和/或跨频点平滑处理。
其中,异常凸起平滑处理可以是对噪声抑制因子的异常凸起进行平滑处理。跨频点平滑处理可以是在频域轴上对噪声抑制因子进行平滑处理。
在本发明实施例中,可以从不同角度对时域当前帧噪声抑制因子在频域范围内进行平滑处理。可选的,可以采用异常凸起平滑处理和/或跨频点平滑处理对时域当前帧噪声抑制因子在频域范围内进行平滑处理。
相应的,S230具体可以包括下述操作:
S231、对所述时域当前帧噪声抑制因子进行异常凸起检测。
其中,异常凸起检测也即检测噪声抑制因子的数值是否过小引起语音信号对应的频点凸起的问题。
可以理解的是,如果噪声抑制因子的数值较大,则对语音信号的抑制作用较弱,相对应频点上的语音信号就会出现频点凸起的现象。也即,当噪声抑制因子出现异常凸起(数值较大)时,相对应频点上的语音信号也会随之出现频点凸起。由于受降噪算法性能的限制,各个频点处的噪声抑制因子并非完全准确,有时会受到一些外部因素影响导致噪声抑制因子在某个频点处突然变大,而其相邻频点处的噪声抑制因子较小。这种情况往往导致降噪之后的音乐噪声加重。因此,需要对时域当前帧噪声抑制因子进行异常凸起检测,以检测当前帧噪声抑制因子中各个频点处的噪声抑制因子是否存在异常凸起。
在本发明的一个可选实施例中,所述对所述时域当前帧噪声抑制因子进行异常凸起检测,可以包括:基于如下公式对所述时域当前帧噪声抑制因子进行异常凸起检测:
Figure BDA0002735813060000081
其中,φi,j表示所述异常凸起检测结果,ν表示异常凸起检测门限阈值,可选的,ν的数值可以取5,本发明实施例并不对ν的具体数值进行限定。Gi,j-1表示时域当前帧第j-1个频点的噪声抑制因子,Gi,j+1表示时域当前帧第j+1个频点的噪声抑制因子。
上述进行异常凸起检测的公式中,φi,j=1即为时域当前帧第j个频点上的噪声抑制因子存在异常凸起。
S232、在根据异常凸起检测结果确定所述时域当前帧噪声抑制因子存在异常凸起的情况下,对所述时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理,得到第一频域当前帧噪声抑制因子。
其中,第一频域当前帧噪声抑制因子也即对时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理后得到的噪声抑制因子。
相应的,如果根据异常凸起检测结果确定时域当前帧噪声抑制因子存在异常凸起,则可以对时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理,得到第一频域当前帧噪声抑制因子。需要说明的是,如果仅采用异常凸起平滑处理对时域当前帧噪声抑制因子在频域范围内进行平滑处理,则得到的第一频域当前帧噪声抑制因子也即目标当前帧噪声抑制因子。
在本发明的一个可选实施例中,所述对所述时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理,可以包括:根据中值滤波方法基于如下公式对所述时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理:
Figure BDA0002735813060000091
其中,
Figure BDA0002735813060000092
表示所述第一频域处理噪声抑制因子。
S233、采用平滑窗方式对所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子进行跨频点平滑处理,得到所述目标当前帧噪声抑制因子。
相应的,对时域处理噪声抑制因子进行跨频点平滑处理时,可以采用平滑窗方式对时域当前帧噪声抑制因子或第一频域当前帧噪声抑制因子进行跨频点平滑处理。也即,可以选择异常凸起平滑处理或跨频点平滑处理单独对时域当前帧噪声抑制因子进行在频域范围内进行平滑处理,也还可以在对时域当前帧噪声抑制因子首先进行异常凸起平滑处理得到第一频域当前帧噪声抑制因子之后,再对第一频域当前帧噪声抑制因子进行跨频点平滑处理,本发明实施例并不对时域当前帧噪声抑制因子在频域范围内的平滑处理方式进行限定。
在本发明的一个可选实施例中,所述采用平滑窗方式对所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子进行跨频点平滑处理,可以包括:基于如下公式对所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子进行跨频点平滑处理,得到第二频域当前帧噪声抑制因子:
Figure BDA0002735813060000101
其中,
Figure BDA0002735813060000102
表示所述第二频域当前帧噪声抑制因子,L表示平滑窗长度,可选的,L的数值可以取3、5或7等,本发明实施例并不对L的具体数值进行限定。
Figure BDA0002735813060000103
表示所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子;
Figure BDA0002735813060000104
Figure BDA0002735813060000105
Figure BDA0002735813060000106
其中,第二频域当前帧噪声抑制因子也即对时域当前帧噪声抑制因子或第一频域当前帧噪声抑制因子进行跨频点平滑处理后得到的噪声抑制因子。
由于上述公式是对时域当前帧噪声抑制因子或第一频域当前帧噪声抑制因子的对数值进行平滑处理,因此得到第二频域当前帧噪声抑制因子后,需要基于公式:
Figure BDA0002735813060000107
对第二频域当前帧噪声抑制因子进行数值转换,得到目标当前帧噪声抑制因子
Figure BDA0002735813060000108
另外还需说明的是,如果不利用对数值而直接对时域当前帧噪声抑制因子或第一频域当前帧噪声抑制因子进行跨频点平滑处理,则可以基于公式
Figure BDA0002735813060000111
直接对时域当前帧噪声抑制因子或第一频域当前帧噪声抑制因子进行跨频点平滑处理,得到目标当前帧噪声抑制因子
Figure BDA0002735813060000112
需要说明的是,图2仅是一种实现方式的示意图,S231-S232和S233之间并不只是先后顺序关系。可以先实施S231-S232,再实施S233,还可以两者择一实施。也即,本发明实施例可以将S231-S233组成一个实施例执行一种频域平滑处理方法,还可以将S231-S232和S233分别组成两个实施例执行一种频域平滑处理方法。
由上述技术方案可知,本发明实施例所提供的噪声抑制参数处理方法实现了基于语音信号帧与帧之间的联系对噪声抑制因子进行处理,而非独立计算每一帧每一个频点处的噪声抑制因子,可以避免噪声抑制因子过小或突然异常变大的问题,通过结合时域和频域对噪声抑制因子进行平滑处理,从而避免在时间轴和频域轴上噪声抑制出现明显起伏变化,改善了语音失真度,并降低了音乐噪声。
本发明实施例通过根据获取的前一帧噪声抑制因子对获取的当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子,以对时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子,解决现有噪声抑制参数处理方法存在的噪声抑制参数的准确性和可靠性较低等问题,以提高噪声抑制参数的准确性和可靠性,可有效改善语音过度抑制和噪声异常凸起等现象,进而提高语音信号的噪声抑制效果。
需要说明的是,以上各实施例中各技术特征之间的任意排列组合也属于本发明的保护范围。
实施例三
图3是本发明实施例三提供的一种噪声抑制参数处理装置的示意图,如图3所示,所述装置包括:噪声抑制因子获取模块310、时域当前帧噪声抑制因子获取模块320以及目标当前帧噪声抑制因子获取模块330,其中:
噪声抑制因子获取模块310,用于获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子;
时域当前帧噪声抑制因子获取模块320,用于根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子;
目标当前帧噪声抑制因子获取模块330,用于对所述时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子。
本发明实施例通过根据获取的前一帧噪声抑制因子对获取的当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子,以对时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子,解决现有噪声抑制参数处理方法存在的噪声抑制参数的准确性和可靠性较低等问题,以提高噪声抑制参数的准确性和可靠性,进而提高语音信号的噪声抑制效果。
可选的,时域当前帧噪声抑制因子获取模块320具体用于:基于如下公式对所述当前帧噪声抑制因子进行时域平滑处理:
Figure BDA0002735813060000121
其中,Gi,j表示所述时域当前帧第j个频点噪声抑制因子,
Figure BDA0002735813060000122
表示当前帧第j个频点的噪声抑制因子,α表示平滑系数,Gi-1,j表示时域前一帧第j个频点的噪声抑制因子。
可选的,目标当前帧噪声抑制因子获取模块330具体用于:对所述时域当前帧噪声抑制因子进行异常凸起平滑处理和/或跨频点平滑处理。
可选的,目标当前帧噪声抑制因子获取模块330具体用于:对所述时域当前帧噪声抑制因子进行异常凸起检测;在根据异常凸起检测结果确定所述时域当前帧噪声抑制因子存在异常凸起的情况下,对所述时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理,得到第一频域当前帧噪声抑制因子。
可选的,目标当前帧噪声抑制因子获取模块330具体用于:基于如下公式对所述时域当前帧噪声抑制因子进行异常凸起检测:
Figure BDA0002735813060000131
其中,φi,j表示所述异常凸起检测结果,ν表示异常凸起检测门限阈值,Gi,j-1表示时域当前帧第j-1个频点的噪声抑制因子,Gi,j+1表示时域当前帧第j+1个频点的噪声抑制因子。
可选的,目标当前帧噪声抑制因子获取模块330具体用于:根据中值滤波方法基于如下公式对所述时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理:
Figure BDA0002735813060000132
其中,
Figure BDA0002735813060000133
表示所述第一频域处理噪声抑制因子。
可选的,目标噪声抑制因子获取模块330具体用于:采用平滑窗方式对所述第一频域处理噪声抑制因子的对数值进行频域轴平滑处理,得到所述目标噪声抑制因子。
可选的,目标噪声抑制因子获取模块330具体用于:基于如下公式对所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子进行跨频点平滑处理,得到第二频域当前帧噪声抑制因子:
Figure BDA0002735813060000141
基于公式:
Figure BDA0002735813060000142
对所述第二频域当前帧噪声抑制因子进行数值转换,得到所述目标当前帧噪声抑制因子;
其中,
Figure BDA0002735813060000143
表示所述第二频域当前帧噪声抑制因子,L表示平滑窗长度,
Figure BDA0002735813060000144
表示所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子,
Figure BDA0002735813060000145
Figure BDA0002735813060000146
Figure BDA0002735813060000147
Figure BDA0002735813060000148
表示所述目标当前帧噪声抑制因子。
上述噪声抑制参数处理装置可执行本发明任意实施例所提供的噪声抑制参数处理方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的噪声抑制参数处理方法。
由于上述所介绍的噪声抑制参数处理装置为可以执行本发明实施例中的噪声抑制参数处理方法的装置,故而基于本发明实施例中所介绍的噪声抑制参数处理方法,本领域所属技术人员能够了解本实施例的噪声抑制参数处理装置的具体实施方式以及其各种变化形式,所以在此对于该噪声抑制参数处理装置如何实现本发明实施例中的噪声抑制参数处理方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中噪声抑制参数处理方法所采用的装置,都属于本申请所欲保护的范围。
实施例四
图4为本发明实施例四提供的一种计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的计算机设备412的框图。图4显示的计算机设备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。计算机设备412典型的是承担语音处理功能的终端设备。
如图4所示,计算机设备412以通用计算设备的形式表现。计算机设备412的组件可以包括但不限于:一个或者多个处理器416,存储装置428,连接不同系统组件(包括存储装置428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备412访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置428可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)430和/或高速缓存存储器432。计算机设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储装置428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块426的程序436,可以存储在例如存储装置428中,这样的程序模块426包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块426通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备412也可以与一个或多个外部设备414(例如键盘、指向设备、摄像头、显示器424等)通信,还可与一个或者多个使得用户能与该计算机设备412交互的设备通信,和/或与使得该计算机设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output,I/O)接口422进行。并且,计算机设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器420通过总线418与计算机设备412的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备412使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arraysof Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器416通过运行存储在存储装置428中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的噪声抑制参数处理方法。
也即,所述处理单元执行所述程序时实现:获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子;根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子;对所述时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子。
实施例五
本发明实施例六还提供一种存储计算机程序的计算机存储介质,所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的噪声抑制参数处理方法:获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子;根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子;对所述时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ReadOnly Memory,ROM)、可擦式可编程只读存储器((Erasable Programmable Read OnlyMemory,EPROM)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (17)

1.一种噪声抑制参数处理方法,其特征在于,包括:
获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子;
根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子;
对所述时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子。
2.根据权利要求1所述的方法,其特征在于,所述根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,包括:
基于如下公式对所述当前帧噪声抑制因子进行时域平滑处理:
Figure FDA0002735813050000011
其中,Gi,j表示所述时域当前帧第j个频点噪声抑制因子,
Figure FDA0002735813050000012
表示当前帧第j个频点的噪声抑制因子,α表示平滑系数,Gi-1,j表示时域前一帧第j个频点的噪声抑制因子。
3.根据权利要求1所述的方法,其特征在于,所述对所述时域当前帧噪声抑制因子进行频域平滑处理,包括:
对所述时域当前帧噪声抑制因子进行异常凸起平滑处理和/或跨频点平滑处理。
4.根据权利要求3所述的方法,其特征在于,所述对所述时域当前帧噪声抑制因子进行异常凸起平滑处理和/或跨频点平滑处理,包括:
对所述时域当前帧噪声抑制因子进行异常凸起检测;
在根据异常凸起检测结果确定所述时域当前帧噪声抑制因子存在异常凸起的情况下,对所述时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理,得到第一频域当前帧噪声抑制因子。
5.根据权利要求4所述的方法,其特征在于,所述对所述时域当前帧噪声抑制因子进行异常凸起检测,包括:
基于如下公式对所述时域当前帧噪声抑制因子进行异常凸起检测:
Figure FDA0002735813050000021
其中,φi,j表示所述异常凸起检测结果,ν表示异常凸起检测门限阈值,Gi,j-1表示时域当前帧第j-1个频点的噪声抑制因子,Gi,j+1表示时域当前帧第j+1个频点的噪声抑制因子。
6.根据权利要求4所述的方法,其特征在于,所述对所述时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理,包括:
根据中值滤波方法基于如下公式对所述时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理:
Figure FDA0002735813050000022
其中,
Figure FDA0002735813050000023
表示所述第一频域处理噪声抑制因子。
7.根据权利要求4所述的方法,其特征在于,所述对所述时域处理噪声抑制因子进行跨频点平滑处理,包括:
采用平滑窗方式对所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子进行跨频点平滑处理,得到所述目标当前帧噪声抑制因子。
8.根据权利要求7所述的方法,其特征在于,所述采用平滑窗方式对所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子进行跨频点平滑处理,包括:
基于如下公式对所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子进行跨频点平滑处理,得到第二频域当前帧噪声抑制因子:
Figure FDA0002735813050000031
基于公式:
Figure FDA0002735813050000032
对所述第二频域当前帧噪声抑制因子进行数值转换,得到所述目标当前帧噪声抑制因子;
其中,
Figure FDA0002735813050000033
表示所述第二频域当前帧噪声抑制因子,L表示平滑窗长度,
Figure FDA0002735813050000034
表示所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子,
Figure FDA0002735813050000035
Figure FDA0002735813050000036
Figure FDA0002735813050000037
Figure FDA0002735813050000038
表示所述目标当前帧噪声抑制因子。
9.一种噪声抑制参数处理装置,其特征在于,包括:
噪声抑制因子获取模块,用于获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子;
时域当前帧噪声抑制因子获取模块,用于根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理,得到时域当前帧噪声抑制因子;
目标当前帧噪声抑制因子获取模块,用于对所述时域当前帧噪声抑制因子进行频域平滑处理,得到目标当前帧噪声抑制因子。
10.根据权利要求9所述的装置,其特征在于,所述时域当前帧噪声抑制因子获取模块具体用于:
基于如下公式对所述当前帧噪声抑制因子进行时域平滑处理:
Figure FDA0002735813050000039
其中,Gi,j表示所述时域当前帧第j个频点噪声抑制因子,
Figure FDA00027358130500000310
表示当前帧第j个频点的噪声抑制因子,α表示平滑系数,Gi-1,j表示时域前一帧第j个频点的噪声抑制因子。
11.根据权利要求9所述的装置,其特征在于,所述目标当前帧噪声抑制因子获取模块具体用于:
对所述时域当前帧噪声抑制因子进行异常凸起平滑处理和/或跨频点平滑处理。
12.根据权利要求11所述的装置,其特征在于,所述目标当前帧噪声抑制因子获取模块具体用于:
对所述时域当前帧噪声抑制因子进行异常凸起检测;
在根据异常凸起检测结果确定所述时域当前帧噪声抑制因子存在异常凸起的情况下,对所述时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理,得到第一频域当前帧噪声抑制因子。
13.根据权利要求12所述的装置,其特征在于,所述目标当前帧噪声抑制因子获取模块具体用于:
基于如下公式对所述时域当前帧噪声抑制因子进行异常凸起检测:
Figure FDA0002735813050000041
其中,φi,j表示所述异常凸起检测结果,ν表示异常凸起检测门限阈值,Gi,j-1表示时域当前帧第j-1个频点的噪声抑制因子,Gi,j+1表示时域当前帧第j+1个频点的噪声抑制因子。
14.根据权利要求12所述的装置,其特征在于,所述目标当前帧噪声抑制因子获取模块具体用于:
根据中值滤波方法基于如下公式对所述时域当前帧噪声抑制因子的异常凸起进行异常凸起平滑处理:
Figure FDA0002735813050000051
其中,
Figure FDA0002735813050000052
表示所述第一频域处理噪声抑制因子。
15.根据权利要求12所述的装置,其特征在于,所述目标噪声抑制因子获取模块具体用于:
采用平滑窗方式对所述第一频域处理噪声抑制因子的对数值进行频域轴平滑处理,得到所述目标噪声抑制因子。
16.根据权利要求15所述的装置,其特征在于,所述目标噪声抑制因子获取模块具体用于:
基于如下公式对所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子进行跨频点平滑处理,得到第二频域当前帧噪声抑制因子:
Figure FDA0002735813050000053
基于公式:
Figure FDA0002735813050000054
对所述第二频域当前帧噪声抑制因子进行数值转换,得到所述目标当前帧噪声抑制因子;
其中,
Figure FDA0002735813050000055
表示所述第二频域当前帧噪声抑制因子,L表示平滑窗长度,
Figure FDA0002735813050000056
表示所述时域当前帧噪声抑制因子或所述第一频域当前帧噪声抑制因子,
Figure FDA0002735813050000057
Figure FDA0002735813050000058
Figure FDA0002735813050000059
Figure FDA00027358130500000510
表示所述目标当前帧噪声抑制因子。
17.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的噪声抑制参数处理方法。
CN202011133182.1A 2020-10-21 2020-10-21 一种噪声抑制参数处理方法、装置及计算机设备 Pending CN114387983A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011133182.1A CN114387983A (zh) 2020-10-21 2020-10-21 一种噪声抑制参数处理方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011133182.1A CN114387983A (zh) 2020-10-21 2020-10-21 一种噪声抑制参数处理方法、装置及计算机设备

Publications (1)

Publication Number Publication Date
CN114387983A true CN114387983A (zh) 2022-04-22

Family

ID=81192891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011133182.1A Pending CN114387983A (zh) 2020-10-21 2020-10-21 一种噪声抑制参数处理方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN114387983A (zh)

Similar Documents

Publication Publication Date Title
US20210327448A1 (en) Speech noise reduction method and apparatus, computing device, and computer-readable storage medium
CN108615535B (zh) 语音增强方法、装置、智能语音设备和计算机设备
CN108335694B (zh) 远场环境噪声处理方法、装置、设备和存储介质
CN107240396B (zh) 说话人自适应方法、装置、设备及存储介质
CN111048118B (zh) 一种语音信号处理方法、装置及终端
CN110970051A (zh) 语音数据采集方法、终端及可读存储介质
US20220084535A1 (en) Reduced latency streaming dynamic noise suppression using convolutional neural networks
CN110992975B (zh) 一种语音信号处理方法、装置及终端
CN113780163A (zh) 一种页面加载时间的检测方法、装置、电子设备及介质
CN111048096B (zh) 一种语音信号处理方法、装置及终端
CN117332211A (zh) 一种局部放电信号去噪方法、系统、电子设备及介质
CN114387983A (zh) 一种噪声抑制参数处理方法、装置及计算机设备
KR102556815B1 (ko) 전자 장치 및 이의 제어 방법
CN113205824B (zh) 声音信号处理方法、装置、存储介质、芯片及相关设备
CN116072108A (zh) 模型生成方法、语音识别方法、装置、介质及设备
CN113763975B (zh) 一种语音信号处理方法、装置及终端
CN114220430A (zh) 多音区语音交互方法、装置、设备以及存储介质
CN114241036A (zh) 透明带边界的确定方法、装置、电子设备及存储介质
US11790931B2 (en) Voice activity detection using zero crossing detection
US20220130405A1 (en) Low Complexity Voice Activity Detection Algorithm
CN110619339B (zh) 一种目标检测方法与装置
CN107515564B (zh) 镜面的显示模式的控制方法、装置、设备及存储介质
WO2022093705A1 (en) Low complexity voice activity detection algorithm
CN112735458A (zh) 噪声估计方法、降噪方法及电子设备
CN115910094A (zh) 音频帧处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination