CN112420066B - 降噪方法、装置、计算机设备和计算机可读存储介质 - Google Patents

降噪方法、装置、计算机设备和计算机可读存储介质 Download PDF

Info

Publication number
CN112420066B
CN112420066B CN202011222203.7A CN202011222203A CN112420066B CN 112420066 B CN112420066 B CN 112420066B CN 202011222203 A CN202011222203 A CN 202011222203A CN 112420066 B CN112420066 B CN 112420066B
Authority
CN
China
Prior art keywords
target
noise
voice signal
component
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011222203.7A
Other languages
English (en)
Other versions
CN112420066A (zh
Inventor
周鉴星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zowee Technology Co Ltd
Original Assignee
Shenzhen Zowee Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zowee Technology Co Ltd filed Critical Shenzhen Zowee Technology Co Ltd
Priority to CN202011222203.7A priority Critical patent/CN112420066B/zh
Publication of CN112420066A publication Critical patent/CN112420066A/zh
Application granted granted Critical
Publication of CN112420066B publication Critical patent/CN112420066B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/10Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请涉及一种降噪方法、装置、计算机设备和计算机可读存储介质,属于降噪技术领域。所述方法包括:获取待降噪的目标语音信号;对所述目标语音信号进行模式分解,得到目标模式分量;获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量;计算所述目标模式分量与所述候选噪声环境对应的模板模式分量的分量相关性;根据所述候选噪声环境对应的分量相关性从所述候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境;根据所述目标噪声环境对应的滤波参数对所述目标语音信号进行降噪处理,得到降噪后的目标语音信号。采用本方法能够提高降噪水平。

Description

降噪方法、装置、计算机设备和计算机可读存储介质
技术领域
本申请涉及降噪技术领域,特别是涉及一种降噪方法、装置、计算机设备和计算机可读存储介质。
背景技术
随着科学技术的发展,消费性电子产品例如耳机的应用也越来越广泛。耳机是应用较为广泛的消费性电子产品之一。耳机的应用场合较为广泛,例如,咖啡厅、电影院、马路、地铁等。根据耳机的应用场合不同,耳机所处于的环境噪声也不同,对噪声处理的要求也不同。
然而,目前的降噪方法,无法根据不同环境对噪声进行自动调整,降噪水平较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高降噪水平的降噪方法、装置、计算机设备和计算机可读存储介质,能根据不同的目标语音信号进行有针对性的、准确的降噪,提高目标语音信号的降噪水平。
为解决上述问题,本申请一实施例提供一种降噪方法,所述方法包括:
获取待降噪的目标语音信号;
对所述目标语音信号进行模式分解,得到目标模式分量;
获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量;
计算所述目标模式分量与所述候选噪声环境对应的模板模式分量的分量相关性;
根据所述候选噪声环境对应的分量相关性从所述候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境;
根据所述目标噪声环境对应的滤波参数对所述目标语音信号进行降噪处理,得到降噪后的目标语音信号。
在其中一个实施例中,所述对所述目标语音信号进行模式分解,得到目标模式分量包括:
将所述目标语音信号作为待处理的当前语音信号,获取当前语音信号中的第一特征点序列以及第二特征点序列;
对所述第一特征点序列进行曲线拟合,得到第一噪声曲线,对所述第二特征点序列进行曲线拟合,得到第二噪声曲线;
根据所述第一噪声曲线以及所述第二噪声曲线进行模式分解,得到目标模式分量。
在其中一个实施例中,所述根据所述第一噪声曲线以及所述第二噪声曲线进行模式分解,得到目标模式分量包括:
根据所述第一噪声曲线以及所述第二噪声曲线进行模式分解,得到目标模式分量;
根据所述第一噪声曲线与所述目标模式分量的差值得到误差语音信号,将所述误差语音信号作为更新后的当前语音信号,返回获取当前语音信号中的第一特征点序列以及第二特征点序列的步骤,直至满足停止条件,得到按照模式分解顺序排列的目标模式分量序列;
所述计算所述目标模式分量与所述候选噪声环境对应的模板模式分量的分量相关性包括:
将所述目标模式分量序列中的目标模式分量与所述候选噪声环境对应的模板模式分量序列中,对应模式分解顺序的模板模式分量进行相关性计算,得到所述目标模式分量与所述模板模式分量的分量相关性;
所述根据所述候选噪声环境对应的分量相关性从所述候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境包括:
获取所述候选噪声环境对应的模板模式分量序列中,与所述目标模式分量的相关性大于预设阈值的模板模式分量的数量;
从所述候选噪声环境集合中,获取所述数量满足数量条件的候选噪声环境,作为目标噪声环境,所述数量条件包括所述数量大于等于数量阈值或者所述数量所占的比例大于等于比例阈值的至少一个。
在其中一个实施例中,所述停止条件包括返回次数大于等于次数阈值或者所述误差语音信号的变化幅度小于预设阈值。
在其中一个实施例中,还包括:所述获取当前语音信号中的第一特征点序列以及第二特征点序列,包括:
将所述当前语音信号分割成多段子语音信号;
获取所述子语音信号中的多个极大值以及多个极小值;
将所述多个极大值按照信号时间进行排序,得到第一特征点序列;
将所述多个极小值按照信号时间进行排序,得到第二特征点序列。
在其中一个实施例中,还包括:所述计算所述目标模式分量与所述候选噪声环境对应的模板模式分量的分量相关性包括:
获取所述目标模式分量与所述模板模式分量的协方差;
获取所述目标模式分量对应的第一离散幅度值,以及获取所述模板模式分量的第二离散幅度值;
根据所述第一离散幅度值以及所述第二离散幅度值计算得到幅度影响值;
将所述协方差以及所述幅度影响值,得到所述目标模式分量与所述候选噪声环境对应的模板模式分量的分量相关性。
在其中一个实施例中,还包括:所述根据所述目标噪声环境对应的滤波参数对所述目标语音信号进行降噪处理,得到降噪后的目标语音信号包括:
获得所述目标语音信号的目标变化幅度;
根据所述目标变化幅度对所述目标噪声环境对应的滤波参数进行调整,得到目标滤波参数;所述目标滤波参数和所述幅度正相关;
根据所述目标滤波参数对所述目标语音信号进行处理,得到降噪后的目标语音信号。
为解决上述问题,本申请另一实施例提供一种降噪装置,所述装置包括:
目标语音信号获取模块,用于获取待降噪的目标语音信号;
目标模式分量获取模块,用于对所述目标语音信号进行模式分解,得到目标模式分量;
模板模式分量获取模块,用于获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量;
分量相关性计算模块,用于计算所述目标模式分量与所述候选噪声环境对应的模板模式分量的分量相关性;
目标噪声环境获取模块,用于根据所述候选噪声环境对应的分量相关性从所述候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境;
降噪后的目标语音信号获取模块,用于根据所述目标噪声环境对应的滤波参数对所述目标语音信号进行降噪处理,得到降噪后的目标语音信号。
为解决上述问题,本申请实施例另一实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待降噪的目标语音信号;
对所述目标语音信号进行模式分解,得到目标模式分量;
获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量;
计算所述目标模式分量与所述候选噪声环境对应的模板模式分量的分量相关性;
根据所述候选噪声环境对应的分量相关性从所述候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境;
根据所述目标噪声环境对应的滤波参数对所述目标语音信号进行降噪处理,得到降噪后的目标语音信号。
为解决上述问题,本申请另一实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待降噪的目标语音信号;
对所述目标语音信号进行模式分解,得到目标模式分量;
获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量;
计算所述目标模式分量与所述候选噪声环境对应的模板模式分量的分量相关性;
根据所述候选噪声环境对应的分量相关性从所述候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境;
根据所述目标噪声环境对应的滤波参数对所述目标语音信号进行降噪处理,得到降噪后的目标语音信号。
上述降噪方法、装置、计算机设备和计算机可读存储介质,通过对目标语音信号进行模式分解得到目标模式分量,对目标模式分量与各个候选噪声环境对应的模板模式分量之间计算分量相关性,能够获取到目标模式分量和模板模式分量之间的接近程度,以便于得出目标语音信号与候选噪声环境中的噪声的接近程度。当某个噪声环境满足相关性条件时,将该噪声环境作为与目标语音信号接近的目标噪声环境;再根据目标噪声环境对应的滤波参数对上述目标语音信号进行降噪处理,因目标语音信号和目标噪声环境之间的相关性关系,便于根据不同的目标语音信号进行有针对性的、准确的降噪,提高目标语音信号的降噪水平。
附图说明
图1为一个实施例中降噪方法的应用环境图;
图2为一个实施例中降噪方法的流程示意图;
图3为一个实施例中得到目标模式分量步骤的流程示意图;
图4为另一个实施例中降噪方法的流程示意图;
图5为一个实施例中计算分量相关性步骤的流程示意图;
图6为一个实施例中得到降噪后的目标语音信号步骤的流程示意图;
图7为一个实施例中降噪装置的结构框图;
图8为一个实施例中计算机设备的内部结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的一种降噪方法,可以应用于如图1所示的应用环境中。包括耳机102与麦克风104。其中,耳机102与麦克风104进行通信。通过麦克风104获取待降噪的目标语音信号,并将待降噪的目标语音信号传输给耳机102,耳机102的中央处理器对目标语音信号进行模式分解,得到目标模式分量后,将目标模式分量与耳机102的存储器中存储的候选噪声环境集合中的,各个候选噪声环境对应的模板模式分量进行分量相关性计算,选取出与目标模式分量满足分量相关性条件的模板模式分量对应的候选噪声环境,作为目标噪声环境;并根据目标噪声环境中的滤波参数对目标语音信号进行降噪处理,得到降噪后的目标语音信号。其中,耳机102可以但不限于是各种有线耳机或无线耳机,麦克风104可以是有线麦克风或无线麦克风;麦克风104可以独立于耳机102单独实现语音信号采集功能并传输给耳机的设备;也可以是耳机102自带的,来实现语音信号采集的其他采集设备。
在一个实施例中,如图2所示,提供了一种降噪方法,以该方法应用于图1中的耳机为例进行说明,包括以下步骤:
步骤202,获取待降噪的目标语音信号。
其中,语音信号是指采集得到的表示语音的信号,由于环境的影响,语音信号包括噪声。噪声是指对语音信号形成干扰的无用的语音信号;降噪是指将带有噪声的语音信号中的噪声减少;目标语音信号是指需要进行降噪的语音信号。
具体地,在对语音信号进行降噪之前,需要先获取到待降噪的目标语音信号。例如,通过耳机相对应的麦克风对语音信号进行采集,并将采集到的语音信号作为待降噪的目标语音信号传输给耳机中的中央处理器,以使得中央处理器能够对目标语音信号进行下一步处理。
在一个实施例中,可以通过耳机自带的麦克风直接对语音信号进行采集,也可以通过耳机外置的麦克风对语音信号进行采集,并通过有线或者无线传输方式将采集到的语音信号传输给耳机中的中央处理器,以使得中央处理器能够对目标语音信号进行下一步处理。
步骤204,对目标语音信号进行模式分解,得到目标模式分量。
其中,模式分解是指将目标语音信号分解成平稳、具有时间尺度的目标语音信号;目标模式分量可以是指目标语音信号经过一次或者多次模式分解形成的目标模式分量,目标模式分量中可以是多个,例如可以为目标语音信号每一次模式分解得到的模式分量。
具体的,当耳机中的中央处理器接收到麦克风传输过来的目标语音信号之后,对此目标语音信号可以进行多次模式分解,得到多个每次分解得到的模式分量,作为目标模式分量。
在一个实施例中,当耳机中的中央处理器接收到麦克风传输过来的目标语音信号之后,可以采用经验模态分解的方法对目标语音信号进行模式分解,将得到的各个模式分量,组成目标模式分量。
步骤206,获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量。
其中,模板模式分量是指作为目标模式分量比对样本的模式分量,模板模式分量是对从所对应的环境中采集得到的模板语音信号进行模式分解得到的,例如对于噪声环境A,可以在该噪声环境中进行语音采集,表示该环境的语音信号的模板,得到模板语音信号,对此模板语音信号进行模式分解得到的模式分量,作为该噪声环境对应的模板模式分量。
具体的,耳机的存储器中存储有模板模式分量,不同的噪声环境对应不同的模板模式分量,以便于作为目标模式分量参考样本。
在一个实施例中,模板模式分量可以为多个,形成一个噪声环境对应的模式分量序列,这些模式分量序列可以是经过试验所得到的,处在某个噪声环境中的语音信号经过模式分解得到的多个有时间顺序的模式分量,以便于作为确定目标模式分量所对应的噪声环境时,所参考的样本。
步骤208,计算目标模式分量与候选噪声环境对应的模板模式分量的分量相关性。
其中,分量相关性是指目标模式分量和模板模式分量之间的关联程度。目标模式分量和模板模式分量的分量相关性越大,则表示目标模式分量和模板模式分量的关联程度越高;反之,目标模式分量和模板模式分量的分量相关性越小,则表示目标模式分量和模板模式分量的关联程度越低。
具体的,相关性可以通过目标模式分量和模板模式分量之间的数学关系计算得到;这种数学关系可以是线性数学关系,也可以是非线性数学关系。
在一个实施例中,可以通过目标模式分量和模板模式分量之间的相关系数来表示两者的相关性。例如,使用V表示目标模式分量和模板模式分量之间相关系数,X表示目标模式分量,Y表示模板模式分量,Cov(X,Y)表示目标模式分量和模板模式分量之间的协方差,D(X)表示目标模式分量的方差,D(Y)表示模板模式分量的方差,则目标模式分量和模板模式分量之间相关系数V可以表示为公式V=Cov(X,Y)/(D(X)*D(Y))^0.5。
步骤210,根据候选噪声环境对应的分量相关性从候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境。
具体的,在耳机中中央处理器计算得到目标模式分量和模板模式分量之间的相关性之后,会得到多个候选噪声环境对应的分量相关性,每个分量相关性对应一个噪声环境。为了筛选出与目标模式分量最接近的模板模式分量对应的噪声环境,设置了一个相关性条件;当满足此相关性条件时,将满足此相关性条件的模板模式分量对应的噪声环境作为目标噪声环境。
在一个实施例中,相关性条件可以是一个范围阈值,当候选模式分量和模板模式分量之间的相关性落在此范围阈值内,则判断为该候选模式分量和模板模式分量之间满足相关性条件;反之,则候选模式分量和模板模式分量之间不满足相关性条件。
在一个实施例中,相关性条件可以是一个固定阈值,当候选模式分量和模板模式分量之间的相关性大于或者等于此固定阈值时,则判断为该候选模式分量和模板模式分量之间满足相关性条件;反之,则不满足相关性条件,阈值可以通过多次试验或者经验所得。
步骤212,根据目标噪声环境对应的滤波参数对目标语音信号进行降噪处理,得到降噪后的目标语音信号。
其中,滤波参数是指对目标噪声环境中的噪声进行降噪所使用的参数。
具体的,在通过目标模式分量和模板模式分量之间的相关性确定之后,选取出满足相关性条件的候选噪声环境,作为目标噪声环境。在耳机的存储器中存储有此目标噪声环境对应的,适用于此目标噪声环境的滤波参数;由于目标语音信号对应的目标模式分量与此目标噪声环境对应的模板模式分量之间满足相关性条件,因此目标语音信号和目标噪声环境中存在的语音信号是最接近的两个语音信号,因此,能够对目标噪声环境起到降噪作用的滤波参数,同样适用于目标语音信号,可以对目标语音信号起到降噪作用。
在一个实施例中,在通过目标模式分量和模板模式分量之间的相关性确定之后,如果目标模式分量和模板模式分量之间不满足相关性条件,则使用普通噪声环境的滤波参数。其中的普通噪声环境是指适用于一般语音信号或者在实际应用中占比比较高的噪声环境。
上述降噪方法中,通过对目标语音信号进行模式分解得到目标模式分量,对目标模式分量与各个候选噪声环境对应的模板模式分量之间计算分量相关性,能够获取到目标模式分量和模板模式分量之间的接近程度,以便于得出目标语音信号与候选噪声环境中的噪声环境的接近程度。当某个噪声环境满足相关性条件时,将该噪声环境作为与目标语音信号最接近的目标噪声环境;再根据目标噪声环境对应的滤波参数对上述目标语音信号进行降噪处理,因目标语音信号和目标噪声环境之间的相关性关系,便于根据不同的目标语音信号进行有针对性的、准确的降噪,提高目标语音信号的降噪水平。
在一个实施例中,如图3所示,对目标语音信号进行模式分解,得到目标模式分量包括:
步骤302,将目标语音信号作为待处理的当前语音信号,获取当前语音信号中的第一特征点序列以及第二特征点序列。
其中,第一特征点序列是指从获取的当前语音信号上选取的,离散的特征点按照信号时间顺序排列所形成的特征点序列;同样的,第二特征点序列也是指从获取的当前语音信号上选取的,离散的特征点按照信号时间顺序排列所形成的特征点序列。
具体的,第一特征点序列和第二特征点序列可以包括多个特征类型,可以通过其中的一个特征类型区分开第一特征点序列和第二特征点序列。特征类型至少包括了当前语音信号的平均值、当前语音信号的拐点、当前语音信号的极值。
在一个实施例中,第一特征点序列和第二特征点序列通过极值来区分,第一特征点序列可以是在当前语音信号上选取具有不同时间点的离散的极大值的特征点组成的序列,相对应的第二特征点序列可以是在当前语音信号上选取具有不同时间点的离散的极小值的特征点组成的序列;当第一特征点序列是极小值组成的序列时,相应的,第二特征点是极大值组成的序列。
步骤304,对第一特征点序列进行曲线拟合,得到第一噪声曲线,对第二特征点序列进行曲线拟合,得到第二噪声曲线。
其中,曲线拟合是指使用适当的曲线对特征点序列进行拟合,形成拟合曲线。
在一个实施例中,可以通过三次曲线拟合方式对第一特征点序列或者第二特征点序列进行曲线拟合,具体为,通过三次曲线拟合公式y=ax^3+bx^2+cx+d,在第一特征点序列中选取处于特征点序列中的前四个特征点进行拟合,其他特征点以此类推,得到第一噪声曲线;同理,可以得到第二噪声曲线。
步骤306,根据第一噪声曲线以及第二噪声曲线进行模式分解,得到目标模式分量。
具体的,在得到第一噪声曲线和第二噪声曲线之后,对上述两条噪声曲线进行平均值计算,将两条曲线的平均值作为目标模式分量IMF(Intrinsic Mode Function)。
本实施例中,通过获取当前语音信号中的第一特征点序列以及第二特征点序列,并且分别通过第一特征点序列和第二特征点序列得到相应的噪声曲线,通过两条噪声曲线得到两条曲线的平均值曲线,将此平均值曲线作为目标模式分量,能够达到将当前语音信号转换成平稳的语音信号的目的。
在一个实施例中,根据第一噪声曲线以及第二噪声曲线进行模式分解,得到目标模式分量包括:
根据第一噪声曲线以及第二噪声曲线进行模式分解,得到目标模式分量;
根据第一噪声曲线与目标模式分量的差值得到误差语音信号,将误差语音信号作为更新后的当前语音信号,返回获取当前语音信号中的第一特征点序列以及第二特征点序列的步骤,直至满足停止条件,得到按照模式分解顺序排列的目标模式分量序列;
具体的,在得到目标模式分量之后,并将第一噪声曲线与目标模式分量的差值作为误差语音信号,并将此误差语音信号作为更新后的当前语音信号,继续执行上述步骤获取当前语音信号中的第一特征点序列以及第二特征点序列及以后步骤,当满足停止条件时,得到目标模式分量序列。此目标模式分量序列是按照模式分解顺序进行的。例如,把每次得到的目标模式分量表示为IMF,目标模式分量为IMF1,循环执行步骤后依次得到第二模式分量为IMF2、第三模式分量为IMF3等,这些模式分量根据分解顺序形成目标模式分量序列,成目标模式分量序列表示为{IMF1,IMF2,IMF3……IMFn}。假设,第一噪声曲线可以表示为X,误差信号可以表示为C,误差信号通过C=X-IMF求得,第一次获得的模式分量为IMF1,则得到的误差信号为C1=X-IMF1,第二次获得模式分量时将误差信号C1作为当前语音信号,得到C2=C1-IMF2,第三次获得模式分量时将误差信号C2作为第二次的语音信号,得到第三次的误差信号C3=C2-IMF3,以此类推,得到第n次的误差信号Cn=Cn-1-IMFn,当Cn满足循环的停止条件时,得到目标模式分量序列{IMF1,IMF2,IMF3……IMFn}。
计算目标模式分量与候选噪声环境对应的模板模式分量的分量相关性包括:
将目标模式分量序列中的目标模式分量与候选噪声环境对应的模板模式分量序列中,对应模式分解顺序的模板模式分量进行相关性计算,得到目标模式分量与模板模式分量的分量相关性;
具体的,在获取到目标模式分量序列{IMF1,IMF2,IMF3……IMFn}之后,需要将序列中的每个模式分量与候选噪声环境对应的模板模式分量序列中每个模板模式分量进行相关性计算。
在一个实施例中,目标模式分量序列{IMF1,IMF2,IMF3……IMFn}和候选噪声环境对应的模板模式分量序列是一一对应的。例如,目标模式分量序列中通过三次模式分解得到三个模式分量,这三个模式分量组成目标模式分量序列,模板模式分量序列也存在通过三次模式分解得到的三个模式分量,将模式分解顺序相对应的模式分量分别计算相关性,得到相关性结果,提高相关性结果可靠性。例如,目标模式分量序列中的IMF1与模板模式分量序列第一次模式分解得到的模式分量进行比较,目标模式分量序列中的IMF2与模板模式分量序列第二次模式分解得到的模式分量进行比较,以此类推。
根据候选噪声环境对应的分量相关性从候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境包括:
获取候选噪声环境对应的模板模式分量序列中,与目标模式分量的相关性大于预设阈值的模板模式分量的数量;
其中,预设阈值是指相关性判断的临界值,大于此临界值表示目标模式分量序列和模板模式分量序列具有相关性,小于此临界值表示目标模式分量序列和模板模式分量序列不具有相关性。
具体的,目标模式分量序列中的每个模式分量与模板模式分量序列中每个模式分量分别进行相关性计算之后,获取到模板模式分量序列中,与目标模式分量的相关性大于预设阈值的模板模式分量的数量。
从候选噪声环境集合中,获取数量满足数量条件的候选噪声环境,作为目标噪声环境。
在一个实施例中,在模板模式分量序列中的模板模式分量与目标模式分量序列之间相关性大于相关性预设阈值的模板模式分量的数量越多,证明该模板模式分量序列越接近于目标模式分量序列,目标语音信号越接近于与模板模式分量序列所对应的噪声环境。每个噪声环境对应一个模板模式分量序列,则可以从候选噪声环境集合中,获取到满足模板模式分量数量条件的候选噪声环境,作为目标噪声环境。
在一个实施例中,数量条件可以是大于等于数量阈值。例如,假设数量阈值为3,而目标模式分量序列中,与模板模式分量序列中的模板模式分量的相关性大于分量相关性阈值的数量为5,5大于3,则此模板模式分量序列对应的候选噪声环境作为目标噪声环境。
在一个实施例中,数量条件可以是数量所占的比例大于等于比例阈值。例如,一个模板模式分量序列中的模板模式分量与目标模式分量相关性大于相关性阈值所占的比例超过2/3,将此模板模式分量序列对应的噪声环境作为目标噪声环境。
本实施例中,通过设置预设阈值,能够达到通过目标模式分量与模板模式分量之间分量相关性确定目标噪声环境。
在一个实施例中,停止条件包括返回次数大于等于次数阈值或者误差语音信号的变化幅度小于预设阈值。
其中,次数阈值是指执行模式分解步骤循环的最大次数。
具体的,在根据第一噪声曲线以及第二噪声曲线进行模式分解,得到目标模式分量的过程中,需要循环执行模式分解步骤,为了提高分解的效率和分解的准确性,需要对执行过程设置一个停止条件。
在一个实施例中,停止条件可以是返回次数大于等于次数阈值,当执行返回次数大于等于次数阈值时,停止执行模式分解步骤。例如,当返回5次时,停止执行模式分解步骤。
在一个实施例中,停止条件可以是误差语音信号的变化幅度小于预设阈值。假设误差语音信号的幅度用C表示,幅度的预设阈值用R表示,当C的绝对值小于R时,停止执行模式分解步骤,其中R满足0<R<1。
在一个实施例中,如图4所示,获取当前语音信号中的第一特征点序列以及第二特征点序列包括:
步骤402,将当前语音信号分割成多段子语音信号。
具体的,语音信号为模拟信号,将此模拟信号可以分割成多段语音信号,以便于对每段进行单独取值。
步骤404,获取子语音信号中的多个极大值以及多个极小值。
具体的,将当前语音信号分割成多段子语音信号之后,在每段子语音信号上都会有极大值和极小值,从而形成了多个极大值以及多个极小值。
步骤406,将多个极大值按照信号时间进行排序,得到第一特征点序列。
具体的,语音信号为时域信号,在对语音信号分段时,相当于截取了不同时间段的语音信号,所获得的每段语音信号上的多个极大值是不同时间点的值,将不同时间点的极大值按照时间排序,得到第一特征点序列。
步骤408,将多个极小值按照信号时间进行排序,得到第二特征点序列。
具体的,将当前语音信号分割成多段子语音信号之后,所获得的每段语音信号上的多个极小值是不同时间点的值,将不同时间点的极小值按照时间排序,得到第二特征点序列。
本实施例中,通过获取每个语音信号上的极大值点按照时间进行排序形成第一特征点序列,通过获取每个语音信号上的极小值点按照时间进行排序形成第二特征点序列,能够使得到的目标模式分量能够反映语音信号真实的特征,提高了降噪水平。
在一个实施例中,如图5所示,计算目标模式分量与候选噪声环境对应的模板模式分量的分量相关性包括:
步骤502,获取目标模式分量与模板模式分量的协方差。
具体的,目标模式分量可以表示为X,模板模式分量表示为Y,获取X和Y的协方差,可以体现目标模式分量和模板模式分量的整体误差。
在一些实施例中,目标模式分量与模板模式分量的协方差可以表示为Cov(X,Y)=E[(X-[X])(Y-[Y])]=E[XY]-2E[Y][X]+E[X][Y]=E[XY]-E[X][Y],其中E[X]为X的期望值,E[Y]是Y的期望值,如果X和Y是独立的,则协方差值为0。
步骤504,获取目标模式分量对应的第一离散幅度值,以及获取模板模式分量的第二离散幅度值。
具体的,目标模式分量对于其平均的目标模式分量存在一定的离散幅度值,同时,模板模式分量也存在与其平均的模板模式分量的第二离散幅度值。
在一个实施例中,可以利用方差表示目标模式分量对于其平均的目标模式分量的离散程度。例如目标模式分量的方差为D(X),模板模式分量为D(Y)。
步骤506,根据第一离散幅度值以及第二离散幅度值计算得到幅度影响值。
其中,幅度影响值是指目标模式分量的离散幅度值和模板模式分量离散幅度值共同形成的幅度影响值。
具体的,可以通过第一离散幅度值的绝对值和第二离散幅度值的绝对值相加计算得到幅度影响值,也可以通过第一离散幅度值和第二离散幅度值直接进行乘积计算得到幅度影响值。
在一个实施例中,可以通过将上述目标模式分量的方差为D(X),模板模式分量为D(Y)进行乘积,并且开方得到幅度影响值,幅度影响值可表示为:δ=D(X)*D(Y)^0.5。
步骤508,将协方差以及幅度影响值,得到目标模式分量与候选噪声环境对应的模板模式分量的分量相关性。
具体的,协方差可以体现出目标模式分量和模板模式分量整体的相关性,协方差越大证明目标模式分量和模板模式分量整体的相关性越大;幅度影响值越大证明目标模式分量或者模板模式分量的离散程度,离散程度越大证明对整体相关性的影响最大。
在一个实施例中,可以将协方差作为与相关性成正相关关系的参数,将幅度影响值作为与相关性成负相关关系的参数,以便于尽可能的降低目标模式分量或者模板模式分量的离散程度对相关性的影响。例如,可以将分量相关性表示为V,V=Cov(X,Y)/δ。
其中,Cov(X,Y)=E[(X-[X])(Y-[Y])]=E[XY]-2E[Y][X]+E[X][Y]=E[XY]-E[X][Y],δ=D(X)*D(Y)^0.5。
本实施例中,通过目标模式分量与模板模式分量的协方差以及幅度影响值计算得到分量相关性,能够达到使计算出的分量相关性尽可能的可靠,以便于后续根据分量相关性选取出合适的目标噪声环境。
在一个实施例中,如图6所示,根据目标噪声环境对应的滤波参数对目标语音信号进行降噪处理,得到降噪后的目标语音信号包括:
步骤602,获得目标语音信号的目标变化幅度。
其中,变化幅度是指语音信号幅度变化的大小。
具体的,通过麦克风采集得到目标语音信号,目标语音信号越大,其幅度越大。随着采集到的目标语音信号的大小,幅度也在不断变化。
步骤604,根据目标变化幅度对目标噪声环境对应的滤波参数进行调整,得到目标滤波参数;
具体的,目标滤波参数和幅度正相关,目标变化幅度越大,所需要对目标噪声环境对应的滤波参数调整的越大。
在一个实施例中,正相关可以是线性正相关,也可以是非线性正相关。例如,目标滤波参数与目标变化幅度为线性正相关,当幅度变化时,相应的调整滤波参数。例如,通过目标幅度变化比例进行相应的目标滤波参数的调整,麦克风在采集语音信号时,假设,目标幅度为B,目标滤波参数表示为C,语音信号的幅度B为50时对应的目标滤波参数C为20,语音信号的幅度B从50变为了100时,目标幅度变化比例为100/50=2,此时需要将目标滤波参数C相应的调整为2*C,也即调整为40。
步骤606,根据目标滤波参数对目标语音信号进行处理,得到降噪后的目标语音信号。
具体的,目标语音信号的降噪是通过调节滤波参数实现的,利用确定好的目标滤波参数对目标语音信号进行处理,从而能够得到降噪后的目标语音信号。
本实施例中,通过获取目标语音信号的变化幅度,并根据幅度与滤波参数的正相关关系,调整目标语音信号的变化幅度之后相对应的滤波参数,并通过滤波参数对目标语音信号进行处理,得到降噪后的目标语音信号。
应该理解的是,虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种降噪装置700,包括:目标语音信号获取模块702、目标模式分量获取模块704、模板模式分量获取模块706、分量相关性计算模块708、目标噪声环境获取模块710和降噪后的目标语音信号获取模块712,其中:
目标语音信号获取模块702,用于获取待降噪的目标语音信号;
目标模式分量获取模块704,用于对目标语音信号进行模式分解,得到目标模式分量;
模板模式分量获取模块706,用于获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量;
分量相关性计算模块708,用于计算目标模式分量与候选噪声环境对应的模板模式分量的分量相关性;
目标噪声环境获取模块710,用于根据候选噪声环境对应的分量相关性从候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境;
降噪后的目标语音信号获取模块712,用于根据目标噪声环境对应的滤波参数对目标语音信号进行降噪处理,得到降噪后的目标语音信号。
在一个实施例中,目标模式分量获取模块704包括:第一特征点序列以及第二特征点序列获取单元、第一噪声曲线以及第二噪声曲线获取单元和目标模式分量获取单元,其中:
第一特征点序列以及第二特征点序列获取单元用于将目标语音信号作为待处理的当前语音信号,获取当前语音信号中的第一特征点序列以及第二特征点序列;
第一噪声曲线以及第二噪声曲线获取单元用于对第一特征点序列进行曲线拟合,得到第一噪声曲线,对第二特征点序列进行曲线拟合,得到第二噪声曲线;
目标模式分量获取单元用于根据第一噪声曲线以及第二噪声曲线进行模式分解,得到目标模式分量。
在一个实施例中,目标模式分量获取单元还用于根据第一噪声曲线以及第二噪声曲线进行模式分解,得到目标模式分量;
根据第一噪声曲线与目标模式分量的差值得到误差语音信号,将误差语音信号作为更新后的当前语音信号,返回获取当前语音信号中的第一特征点序列以及第二特征点序列的步骤,直至满足停止条件,得到按照模式分解顺序排列的目标模式分量序列;
分量相关性计算模块还用于将目标模式分量序列中的目标模式分量与候选噪声环境对应的模板模式分量序列中,对应模式分解顺序的模板模式分量进行相关性计算,得到目标模式分量与模板模式分量的分量相关性;
目标噪声环境获取模块710还用于获取候选噪声环境对应的模板模式分量序列中,与目标模式分量的相关性大于预设阈值的模板模式分量的数量;
从候选噪声环境集合中,获取数量满足数量条件的候选噪声环境,作为目标噪声环境,数量条件包括数量大于等于数量阈值或者数量所占的比例大于等于比例阈值的至少一个。
在一个实施例中,第一特征点序列以及第二特征点序列获取单元还用于:
将当前语音信号分割成多段子语音信号;
获取子语音信号中的多个极大值以及多个极小值;
将多个极大值按照信号时间进行排序,得到第一特征点序列;
将多个极小值按照信号时间进行排序,得到第二特征点序列。
在一个实施例中,分量相关性计算模块708包括:协方差获取单元、第一离散幅度值和第二离散幅度值获取单元、幅度影响值计算单元和分量相关性获取单元,其中:
协方差获取单元用于获取目标模式分量与模板模式分量的协方差;
第一离散幅度值和第二离散幅度值获取单元用于获取目标模式分量对应的第一离散幅度值,以及获取模板模式分量的第二离散幅度值;
幅度影响值计算单元用于根据第一离散幅度值以及第二离散幅度值计算得到幅度影响值;
分量相关性获取单元用于将协方差以及幅度影响值,得到目标模式分量与候选噪声环境对应的模板模式分量的分量相关性。
在一个实施例中,降噪后的目标语音信号获取模块712包括:目标变化幅度获取单元、目标滤波参数获取单元和降噪后的目标语音信号获取单元,其中:
目标变化幅度获取单元用于获得目标语音信号的目标变化幅度;
目标滤波参数获取单元用于根据目标变化幅度对目标噪声环境对应的滤波参数进行调整,得到目标滤波参数;目标滤波参数和幅度正相关;
目标语音信号获取单元用于根据目标滤波参数对目标语音信号进行处理,得到降噪后的目标语音信号。
关于装置的具体限定可以参见上文中对于降噪方法的限定,在此不再赘述。上述降噪装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是计算机,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储降噪数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种降噪方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待降噪的目标语音信号;
对目标语音信号进行模式分解,得到目标模式分量;
获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量;
计算目标模式分量与候选噪声环境对应的模板模式分量的分量相关性;
根据候选噪声环境对应的分量相关性从候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境;
根据目标噪声环境对应的滤波参数对目标语音信号进行降噪处理,得到降噪后的目标语音信号。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将目标语音信号作为待处理的当前语音信号,获取当前语音信号中的第一特征点序列以及第二特征点序列;
对第一特征点序列进行曲线拟合,得到第一噪声曲线,对第二特征点序列进行曲线拟合,得到第二噪声曲线;
根据第一噪声曲线以及第二噪声曲线进行模式分解,得到目标模式分量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据第一噪声曲线以及第二噪声曲线进行模式分解,得到目标模式分量;
根据第一噪声曲线与目标模式分量的差值得到误差语音信号,将误差语音信号作为更新后的当前语音信号,返回获取当前语音信号中的第一特征点序列以及第二特征点序列的步骤,直至满足停止条件,得到按照模式分解顺序排列的目标模式分量序列;
将目标模式分量序列中的目标模式分量与候选噪声环境对应的模板模式分量序列中,对应模式分解顺序的模板模式分量进行相关性计算,得到目标模式分量与模板模式分量的分量相关性;
获取候选噪声环境对应的模板模式分量序列中,与目标模式分量的相关性大于预设阈值的模板模式分量的数量;
从候选噪声环境集合中,获取数量满足数量条件的候选噪声环境,作为目标噪声环境,数量条件包括数量大于等于数量阈值或者数量所占的比例大于等于比例阈值的至少一个。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将当前语音信号分割成多段子语音信号;
获取子语音信号中的多个极大值以及多个极小值;
将多个极大值按照信号时间进行排序,得到第一特征点序列;
将多个极小值按照信号时间进行排序,得到第二特征点序列。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取目标模式分量与模板模式分量的协方差;
获取目标模式分量对应的第一离散幅度值,以及获取模板模式分量的第二离散幅度值;
根据第一离散幅度值以及第二离散幅度值计算得到幅度影响值;
将协方差以及幅度影响值,得到目标模式分量与候选噪声环境对应的模板模式分量的分量相关性。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获得目标语音信号的目标变化幅度;
根据目标变化幅度对目标噪声环境对应的滤波参数进行调整,得到目标滤波参数;目标滤波参数和幅度正相关;
根据目标滤波参数对目标语音信号进行处理,得到降噪后的目标语音信号。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待降噪的目标语音信号;
对目标语音信号进行模式分解,得到目标模式分量;
获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量;
计算目标模式分量与候选噪声环境对应的模板模式分量的分量相关性;
根据候选噪声环境对应的分量相关性从候选噪声环境集合中选取满足相关性条件的候选噪声环境,作为目标噪声环境;
根据目标噪声环境对应的滤波参数对目标语音信号进行降噪处理,得到降噪后的目标语音信号。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将目标语音信号作为待处理的当前语音信号,获取当前语音信号中的第一特征点序列以及第二特征点序列;
对第一特征点序列进行曲线拟合,得到第一噪声曲线,对第二特征点序列进行曲线拟合,得到第二噪声曲线;
根据第一噪声曲线以及第二噪声曲线进行模式分解,得到目标模式分量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据第一噪声曲线以及第二噪声曲线进行模式分解,得到目标模式分量;
根据第一噪声曲线与目标模式分量的差值得到误差语音信号,将误差语音信号作为更新后的当前语音信号,返回获取当前语音信号中的第一特征点序列以及第二特征点序列的步骤,直至满足停止条件,得到按照模式分解顺序排列的目标模式分量序列;
将目标模式分量序列中的目标模式分量与候选噪声环境对应的模板模式分量序列中,对应模式分解顺序的模板模式分量进行相关性计算,得到目标模式分量与模板模式分量的分量相关性;
获取候选噪声环境对应的模板模式分量序列中,与所述目标模式分量的相关性大于预设阈值的模板模式分量的数量;
从所述候选噪声环境集合中,获取所述数量满足数量条件的候选噪声环境,作为目标噪声环境,所述数量条件包括所述数量大于等于数量阈值或者所述数量所占的比例大于等于比例阈值的至少一个。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将当前语音信号分割成多段子语音信号;
获取子语音信号中的多个极大值以及多个极小值;
将多个极大值按照信号时间进行排序,得到第一特征点序列;
将多个极小值按照信号时间进行排序,得到第二特征点序列。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取目标模式分量与模板模式分量的协方差;
获取目标模式分量对应的第一离散幅度值,以及获取模板模式分量的第二离散幅度值;
根据第一离散幅度值以及第二离散幅度值计算得到幅度影响值;
将协方差以及幅度影响值,得到目标模式分量与候选噪声环境对应的模板模式分量的分量相关性。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获得目标语音信号的目标变化幅度;
根据目标变化幅度对目标噪声环境对应的滤波参数进行调整,得到目标滤波参数;目标滤波参数和幅度正相关;
根据目标滤波参数对目标语音信号进行处理,得到降噪后的目标语音信号。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种降噪方法,其特征在于,所述方法包括:
获取待降噪的目标语音信号;
将所述目标语音信号作为待处理的当前语音信号,获取当前语音信号中的第一特征点序列以及第二特征点序列;对所述第一特征点序列进行曲线拟合,得到第一噪声曲线,对所述第二特征点序列进行曲线拟合,得到第二噪声曲线;根据所述第一噪声曲线以及所述第二噪声曲线进行模式分解,得到目标模式分量;根据所述第一噪声曲线与所述目标模式分量的差值得到误差语音信号,将所述误差语音信号作为更新后的当前语音信号,返回获取当前语音信号中的第一特征点序列以及第二特征点序列的步骤,直至满足停止条件,得到按照模式分解顺序排列的目标模式分量序列;
获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量;
将所述目标模式分量序列中的目标模式分量与所述候选噪声环境对应的模板模式分量序列中,对应模式分解顺序的模板模式分量进行相关性计算,得到所述目标模式分量与所述模板模式分量的分量相关性;
获取所述候选噪声环境对应的模板模式分量序列中,与所述目标模式分量的相关性大于预设阈值的模板模式分量的数量;从所述候选噪声环境集合中,获取所述数量满足数量条件的候选噪声环境,作为目标噪声环境,所述数量条件包括所述数量大于等于数量阈值或者所述数量所占的比例大于等于比例阈值的至少一个;
根据所述目标噪声环境对应的滤波参数对所述目标语音信号进行降噪处理,得到降噪后的目标语音信号。
2.根据权利要求1所述的方法,其特征在于,所述停止条件包括返回次数大于等于次数阈值或者所述误差语音信号的变化幅度小于预设阈值。
3.根据权利要求1所述的方法,其特征在于,所述获取当前语音信号中的第一特征点序列以及第二特征点序列,包括:
将所述当前语音信号分割成多段子语音信号;
获取所述子语音信号中的多个极大值以及多个极小值;
将所述多个极大值按照信号时间进行排序,得到第一特征点序列;
将所述多个极小值按照信号时间进行排序,得到第二特征点序列。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标模式分量与所述模板模式分量的协方差;
获取所述目标模式分量对应的第一离散幅度值,以及获取所述模板模式分量的第二离散幅度值;
根据所述第一离散幅度值以及所述第二离散幅度值计算得到幅度影响值;
根据所述协方差以及所述幅度影响值,得到所述目标模式分量与所述候选噪声环境对应的模板模式分量的分量相关性。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标噪声环境对应的滤波参数对所述目标语音信号进行降噪处理,得到降噪后的目标语音信号包括:
获得所述目标语音信号的目标变化幅度;
根据所述目标变化幅度对所述目标噪声环境对应的滤波参数进行调整,得到目标滤波参数;所述目标滤波参数和所述幅度正相关;
根据所述目标滤波参数对所述目标语音信号进行处理,得到降噪后的目标语音信号。
6.根据权利要求1所述的方法,其特征在于,所述分量相关性是指所述目标模式分量和所述模板模式分量之间的关联程度。
7.根据权利要求1所述的方法,其特征在于,所述第一特征点序列与所述第二特征点序列均是指从获取的当前语音信号上选取的,离散的特征点按照信号时间顺序排列所形成的特征点序列。
8.一种降噪装置,其特征在于,所述装置包括:
目标语音信号获取模块,用于获取待降噪的目标语音信号;
目标模式分量获取模块,用于将所述目标语音信号作为待处理的当前语音信号,获取当前语音信号中的第一特征点序列以及第二特征点序列;对所述第一特征点序列进行曲线拟合,得到第一噪声曲线,对所述第二特征点序列进行曲线拟合,得到第二噪声曲线;根据所述第一噪声曲线以及所述第二噪声曲线进行模式分解,得到目标模式分量;根据所述第一噪声曲线与所述目标模式分量的差值得到误差语音信号,将所述误差语音信号作为更新后的当前语音信号,返回获取当前语音信号中的第一特征点序列以及第二特征点序列的步骤,直至满足停止条件,得到按照模式分解顺序排列的目标模式分量序列;
模板模式分量获取模块,用于获取候选噪声环境集合中,各个候选噪声环境对应的模板模式分量;
分量相关性计算模块,用于将所述目标模式分量序列中的目标模式分量与所述候选噪声环境对应的模板模式分量序列中,对应模式分解顺序的模板模式分量进行相关性计算,得到所述目标模式分量与所述模板模式分量的分量相关性;
目标噪声环境获取模块,用于获取所述候选噪声环境对应的模板模式分量序列中,与所述目标模式分量的相关性大于预设阈值的模板模式分量的数量;从所述候选噪声环境集合中,获取所述数量满足数量条件的候选噪声环境,作为目标噪声环境,所述数量条件包括所述数量大于等于数量阈值或者所述数量所占的比例大于等于比例阈值的至少一个;
降噪后的目标语音信号获取模块,用于根据所述目标噪声环境对应的滤波参数对所述目标语音信号进行降噪处理,得到降噪后的目标语音信号。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202011222203.7A 2020-11-05 2020-11-05 降噪方法、装置、计算机设备和计算机可读存储介质 Active CN112420066B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011222203.7A CN112420066B (zh) 2020-11-05 2020-11-05 降噪方法、装置、计算机设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011222203.7A CN112420066B (zh) 2020-11-05 2020-11-05 降噪方法、装置、计算机设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN112420066A CN112420066A (zh) 2021-02-26
CN112420066B true CN112420066B (zh) 2024-05-14

Family

ID=74826924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011222203.7A Active CN112420066B (zh) 2020-11-05 2020-11-05 降噪方法、装置、计算机设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112420066B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116343812B (zh) * 2023-04-13 2023-10-20 广州讯飞易听说网络科技有限公司 一种语音处理方法
CN116828354B (zh) * 2023-08-30 2023-11-07 深圳市智纬科技有限公司 一种用于领夹无线麦克风的收音质量优化方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106098080A (zh) * 2016-06-01 2016-11-09 南方科技大学 一种噪声环境下言语识别阈的确定方法及装置
CN108682429A (zh) * 2018-05-29 2018-10-19 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
CN108882092A (zh) * 2018-07-03 2018-11-23 歌尔智能科技有限公司 一种耳机降噪方法及反馈降噪系统
CN109410975A (zh) * 2018-10-31 2019-03-01 歌尔科技有限公司 一种语音降噪方法、设备及存储介质
CN110010117A (zh) * 2019-04-11 2019-07-12 湖北大学 一种语音主动降噪的方法及装置
WO2019227588A1 (zh) * 2018-05-29 2019-12-05 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
CN111128215A (zh) * 2019-12-24 2020-05-08 声耕智能科技(西安)研究院有限公司 一种单通道实时降噪方法及系统
CN111787149A (zh) * 2020-06-23 2020-10-16 上海传英信息技术有限公司 一种降噪处理方法、系统和计算机储存介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102348151B (zh) * 2011-09-10 2015-07-29 歌尔声学股份有限公司 噪声消除系统和方法、智能控制方法和装置、通信设备
CN104602163B (zh) * 2014-12-31 2017-12-01 歌尔股份有限公司 主动降噪耳机及应用于该耳机的降噪控制方法和系统
US10045110B2 (en) * 2016-07-06 2018-08-07 Bragi GmbH Selective sound field environment processing system and method
US10706868B2 (en) * 2017-09-06 2020-07-07 Realwear, Inc. Multi-mode noise cancellation for voice detection
US11049509B2 (en) * 2019-03-06 2021-06-29 Plantronics, Inc. Voice signal enhancement for head-worn audio devices

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106098080A (zh) * 2016-06-01 2016-11-09 南方科技大学 一种噪声环境下言语识别阈的确定方法及装置
CN108682429A (zh) * 2018-05-29 2018-10-19 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
WO2019227588A1 (zh) * 2018-05-29 2019-12-05 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
CN108882092A (zh) * 2018-07-03 2018-11-23 歌尔智能科技有限公司 一种耳机降噪方法及反馈降噪系统
CN109410975A (zh) * 2018-10-31 2019-03-01 歌尔科技有限公司 一种语音降噪方法、设备及存储介质
CN110010117A (zh) * 2019-04-11 2019-07-12 湖北大学 一种语音主动降噪的方法及装置
CN111128215A (zh) * 2019-12-24 2020-05-08 声耕智能科技(西安)研究院有限公司 一种单通道实时降噪方法及系统
CN111787149A (zh) * 2020-06-23 2020-10-16 上海传英信息技术有限公司 一种降噪处理方法、系统和计算机储存介质

Also Published As

Publication number Publication date
CN112420066A (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
CN109643554B (zh) 自适应语音增强方法和电子设备
CN112420066B (zh) 降噪方法、装置、计算机设备和计算机可读存储介质
Weyrich et al. Wavelet shrinkage and generalized cross validation for image denoising
Gazor et al. Speech probability distribution
JP2019533194A (ja) ブラインド信号分離方法、構成及び音声制御システム、並びに電器アセンブリ
CN112037806B (zh) 一种检测风噪的方法和检测风噪声的设备
CN109074814B (zh) 一种噪声检测方法及终端设备
CN110556125B (zh) 基于语音信号的特征提取方法、设备及计算机存储介质
WO2014143447A1 (en) Voice recognition configuration selector and method of operation therefor
CN108111353B (zh) 预付卡剩余流量预测方法、网络终端和存储介质
CN112652320A (zh) 声源定位方法和装置、计算机可读存储介质、电子设备
CN115278496A (zh) 用于麦克风阵列测量的稀疏声源辨识方法、系统
CN113642710A (zh) 一种网络模型的量化方法、装置、设备和存储介质
CN112820310B (zh) 一种来波方向估计方法及装置
CN111402918A (zh) 一种音频处理方法、装置、设备及存储介质
CN108445452B (zh) 改进的频域srp声源方位估计方法
CN110556128A (zh) 一种语音活动性检测方法、设备及计算机可读存储介质
CN113299284B (zh) 一种基于自适应滤波的语音识别装置、方法、设备及介质
CN113362853B (zh) 一种基于lstm网络emd端点效应抑制方法
CN115830048A (zh) 图像边缘检测方法、装置及相关设备
CN110491408B (zh) 一种基于稀疏元分析的音乐信号欠定混叠盲分离方法
Takata Identification of linear 1-dof system based on the maximum likelihood estimation using the analytical solution of Fokker-Planck equation
CN110727913B (zh) 基于信号相关矩阵的信号模型阶数估计方法
Eldwaik et al. Mitigating wind noise in outdoor microphone signals using a singular spectral subspace method
CN117690421B (zh) 降噪识别联合网络的语音识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220127

Address after: 518051 Building 5, xilipingshan private enterprise science and Technology Industrial Park, Nanshan District, Shenzhen City, Guangdong Province

Applicant after: SHENZHEN ZOWEE TECHNOLOGY Co.,Ltd.

Address before: 518051 Building 5, xilipingshan private enterprise science and Technology Industrial Park, Nanshan District, Shenzhen City, Guangdong Province

Applicant before: SHENZHEN ZOWEE TECHNOLOGY Co.,Ltd.

Applicant before: Yisheng (Xiamen) Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant