一种信号处理方法、装置及计算机可读存储介质
技术领域
本发明属于信号处理领域,具体涉及一种信号处理方法、装置及计算机可读存储介质。
背景技术
噪声信号是信号采集设备或传输设备所在的电子环境和物理化学环境(自然环境)所造成的干扰信号。事实上,噪声无处不在,且高通或低通滤波无法将含噪信号中的噪声信号轻易滤除。因此当对获取含噪信号进行信号处理时,由于其包含无用的噪声信号,会影响信号处理效果。
传统方法中,为了消除噪音信号对信号处理结果所带来的不利影响,通常采用:(1)对指定频率范围内的信号作增强或抑制处理,例如,事先已知存在频率范围为70~80Hz的环境噪音,就对该频率范围内的含噪信号进行抑制处理;(2)依照经验修改信号处理过程中阈值参数以适应含噪信号。然而,如采用方法(1),由于不同的含噪信号中的噪声信号的影响程度不同,不同的含噪信号即使在进行除噪后也会具有不同的可信度,仍然会对信号处理造成不利影响;如采用方法(2),难以找到合适的阈值,需要大量尝试操作。
上述可信度也即噪声信号对含噪信号的影响程度,例如,若含噪信号中噪声信号占比过高或频率相近,难以区分噪声信号的信息与非噪声信号的信息,进一步从含噪信号中提取出的信号特征偏离实际的有用信息,这种情况下,对含噪信号进行后续的信号处理得到的处理结果也会具有较低的可信度。
发明内容
针对上述信号中所包含的噪声信号对后续的信号处理所带来的不利影响,为了减少噪声信号所导致的信号处理效果变差的问题,提出了一种信号处理方法和装置,其能基于信号本身的可信度对信号处理过程进行调整,从而降低噪声信号的影响。
依据本发明的第一方面,提供了一种信号处理方法,其特征在于,包括:
获取输入信号,对上述输入信号执行第一处理以获取上述输入信号对应的频域信号;
基于预设的参考信号对上述频域信号执行可信度运算以获取上述频域信号的可信度;
根据上述可信度对上述频域信号执行第二处理。
可选地,其中,基于预设的参考信号对上述频域信号执行可信度运算以获取上述频域信号的可信度包括:
对上述频域信号执行分频处理,从而得到在频域上互不重叠的多个分频信号,上述预设的参考信号包含与上述多个分频信号一一对应的多个分频参考信号;
根据上述多个分频信号中的每一个分频信号以及上述多个分频参考信号中与上述每一个分频信号相对应的分频参考信号,执行可信度计算,从而得到上述每一个分频信号的可信度因子;
根据上述每一个分频信号的可信度因子获取上述可信度。
可选地,其中,根据上述多个分频信号中的每一个分频信号以及上述多个分频参考信号中与上述每一个分频信号相对应的分频参考信号,执行可信度计算进一步包括:
获取上述多个分频信号中的第一分频信号的信号强度信息;
获取上述多个分频参考信号中与上述第一分频信号相对应的第一分频参考信号的信号强度信息;
计算上述第一分频参考信号与上述第一分频信号之间的信号强度比值,将上述信号强度比值作为上述第一分频信号的第一可信度因子。
可选地,其中,根据上述多个分频信号中的每一个分频信号以及上述多个分频参考信号中与上述每一个分频信号相对应的分频参考信号,执行可信度计算进一步包括:
向经过预先训练的神经网络模型输入上述多个分频信号中的第二分频信号,以及输入上述多个分频参考信号中对应于上述第二分频信号的第二参考信号;
上述神经网络模型执行卷积运算,并输出上述第二分频信号的第二可信度因子。
可选地,其中,根据上述多个分频信号中的每一个分频信号与上述多个分频参考信号中相对应的分频参考信号执行可信度计算包括:
向经过预先训练的神经网络模型输入:上述多个分频信号中的第三分频信号、上述多个分频参考信号中对应于上述第三分频信号的第三参考信号、上述多个分频信号中的第四分频信号、上述多个分频参考信号中对应于上述第四分频信号的第四参考信号;
上述神经网络模型执行卷积运算,并输出上述第三分频信号的第三可信度因子;
其中,上述第三分频信号与上述第四分频信号具有预设关联关系。
可选地,其中,上述预设关联关系包括:
上述第三分频信号包含上述第四分频信号的谐波信号。
可选地,其中,还包括:
根据预设时间内采集的多个输入信号在多个预设频段的信号强度信息,获取上述多个分频参考信号中的每一个分频参考信号。
可选地,其中,根据上述可信度对上述频域信号执行第二处理包括:
基于上述多个可信度因子为每一个分频信号设置第一系数,根据上述第一系数调整上述第二处理中每一个分频信号的权值参数;
根据调整后的上述第二处理中每一个分频信号的权值参数,对上述频域信号执行第二处理。
可选地,其中,根据上述可信度对上述频域信号执行第二处理包括:
基于上述多个可信度因子为每一个分频信号设置第二系数,根据上述第二系数对上述频域信号执行分频段的上述第二处理。
可选地,其中,上述第二处理不同于上述第一处理且包括以下一项或多项:
信号识别处理、信号滤波处理、信号增益处理、信号降噪处理。
根据本发明的第二方面,提出一种信号处理装置,其特征在于,包括:
第一处理单元,用于获取输入信号,对上述输入信号执行第一处理以获取上述输入信号对应的频域信号;
可信度计算单元,用于基于预设的参考信号对上述频域信号执行可信度运算以获取上述频域信号的可信度;
第二处理单元,用于根据上述可信度对上述频域信号执行第二处理。
可选地,其中,上述可信度计算单元进一步用于:
对上述频域信号执行分频处理,从而得到在频域上互不重叠的多个分频信号,上述预设的参考信号包含与上述多个分频信号一一对应的多个分频参考信号;
根据上述多个分频信号中的每一个分频信号以及上述多个分频参考信号中与上述每一个分频信号相对应的分频参考信号,执行可信度计算,从而得到上述每一个分频信号的可信度因子;
根据上述每一个分频信号的可信度因子获取上述可信度。
可选地,其中,上述可信度计算单元进一步用于:
获取上述多个分频信号中的第一分频信号的信号强度信息;
获取上述多个分频参考信号中与上述第一分频信号相对应的第一分频参考信号的信号强度信息;
计算上述第一分频参考信号与上述第一分频信号之间的信号强度比值,将上述信号强度比值作为上述第一分频信号的第一可信度因子。
可选地,其中,上述可信度计算单元进一步用于:
向经过预先训练的神经网络模型输入上述多个分频信号中的第二分频信号,以及输入上述多个分频参考信号中对应于上述第二分频信号的第二参考信号;
上述神经网络模型执行卷积运算,并输出上述第二分频信号的第二可信度因子。
可选地,其中,上述可信度计算单元进一步用于:
向经过预先训练的神经网络模型输入:上述多个分频信号中的第三分频信号、上述多个分频参考信号中对应于上述第三分频信号的第三参考信号、上述多个分频信号中的第四分频信号、上述多个分频参考信号中对应于上述第四分频信号的第四参考信号;
上述神经网络模型执行卷积运算,并输出上述第三分频信号的第三可信度因子;
其中,上述第三分频信号与上述第四分频信号具有预设关联关系。
可选地,其中,上述预设关联关系包括:
上述第三分频信号包含上述第四分频信号的谐波信号。
可选地,其中,上述装置还包括参考信号获取单元,用于:
根据预设时间内采集的多个输入信号在多个预设频段的信号强度信息,获取上述多个分频参考信号中的每一个分频参考信号。
可选地,其中,上述第二处理单元用于:
基于上述多个可信度因子为每一个分频信号设置第一系数,根据上述第一系数调整上述第二处理中每一个分频信号的权值参数;
根据调整后的上述第二处理中每一个分频信号的权值参数,对上述频域信号执行第二处理。
可选地,其中,上述第二处理单元用于:
基于上述多个可信度因子为每一个分频信号设置第二系数,根据上述第二系数对上述频域信号执行分频段的上述第二处理。
可选地,其中,上述第二处理单元具体用于:
信号识别处理、信号滤波处理、信号增益处理、信号降噪处理。
根据本发明的又一方面,还提供了一种计算机可读存储介质,其上存储有计算机指令,其特征在于,上述计算机指令被处理器执行时实现如上上述的方法。
本发明实施例提供的信号处理方法和装置,利用以上技术方案,能够获取输入的信号的可信度,并能根据该信号自身的可信度对信号进行预设的信号处理操作,进一步可以在一定程度上克服上述输入信号由于噪声信号而导致的信号失真问题,最终获取更加接近真实值的信号处理效果。
应当理解,上述说明仅是本发明技术方案的概述,以便能够更清楚地了解本发明的技术手段,从而可依照说明书的内容予以实施。为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举说明本发明的具体实施方式。
附图说明
通过阅读下文的示例性实施例的详细描述,本领域普通技术人员将明白本文所述的有点和益处以及其他优点和益处。附图仅用于示出示例性实施例的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的标号表示相同的部件。在附图中:
图1为根据本发明一实施例的信号处理方法的流程示意图;
图2为根据本发明另一实施例的信号处理方法的流程示意图;
图3为根据本发明一实施例的不同频率范围的频谱能量的示意图;
图4为根据本发明一实施例的历史输入的分频信号的频谱示意图;
图5为根据本发明一实施例的信号处理装置的示意图;
图6为根据本发明一实施例的可读存储介质的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在本发明中,应理解,诸如“包括”或“具有”等术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不旨在排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。
信号处理(signal processing):信号处理是对各种类型的电信号,按各种预期的目的及要求进行加工过程的统称。所谓"信号处理",就是要把记录在某种媒体上的信号进行处理,以便抽取出有用信息的过程,它是对信号进行提取、变换、分析、综合等处理过程的统称。信号处理最基本的内容有变换、滤波、调制、解调、检测以及谱分析和估计等。变换诸如类型的傅里叶变换、正弦变换、余弦变换、沃尔什变换等;滤波包括髙通滤波、低通滤波、带通滤波、维纳滤波、卡尔曼滤波、线性滤波、非线性滤波以及自适应滤波等;谱分析与谱估计为信号的复杂分析过程,近些年来还会引入神经网络等数学模型进行多维信号分析以获取有用信息。
分贝(dB):音量的单位。
另外还需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图1示出了根据本发明一实施例的信号处理方法的流程示意图,下面结合图1具体描述本发明实施例所提供的信号处理方法:
S101:获取输入信号,对上述输入信号执行第一处理以获取上述输入信号对应的频域信号;
S102:基于预设的参考信号对上述频域信号执行可信度运算以获取上述频域信号的可信度;
S103:根据上述可信度对上述频域信号执行第二处理。
具体地,在上述S101中,上述输入信号可以为当前帧的音频信号,上述第一处理可以包括快速傅里叶变换(FFT)处理,目的在于将原始输入的当前帧的音频信号从时域信号转换为频域信号。可选地,上述第一处理也可以是其它可以将时域信号转换为频域信号的信号处理操作。
具体地,在上述S102中,上述预设的参考信号也即预设的底噪信号,其具体可以根据预设时间区间内历史输入的音频信号(例如,当前帧的音频信号之前所获取的10帧音频信号)获得。
具体地,在上述S103中,上述第二处理可以是能够对上述信号执行的多种信号处理操作中的任意一种或多种,例如,信号识别处理、信号滤波处理、信号增益处理等。
以下结合音频信号的处理方法对本发明实施例进行详细描述。
值得注意的是,本发明实施例对上述信号的类型不作具体限定,其可以是各种信号,例如从麦克风获取的音频信号,或者从图像采集装置获取的图像信号,也可以是其他类似的信号数据;本发明实施例以音频信号为例进行描述,但是不限于此。
本领域技术人员可以理解的是,音频信号的采集环境中往往存在混合有多种噪音的底噪信号,该多种噪音的来源可以是各类电器的运行噪音、持续的警报噪音或汽车发动机的运行噪音等。上述噪音本身可以在一段时间内稳定于固定的频率范围内,且具有稳定的音频能量,例如,电脑运行噪音的频率范围一般处于500~1000Hz,音频大小为40~50dB;抽油烟机声的频率范围处于200~750Hz,音频大小为50~60dB;电吹风声的频率范围为1000~3000Hz,音频大小处于90dB左右,因此可以获知底噪的特质包括:(1)频率范围不同,噪音分布情况也不同;(2)频率范围不同,底噪信号的能量强度也不同;(3)底噪信号是动态变化的,且不同频率范围的底噪的动态变化过程是不同的。因此本发明实施例通过将原始输入的时域信号转换为频域信号之后,进一步基于频域信号执行可信度的计算。
进一步地,由于不同频率范围的底噪信号强度大小不同,那么经过降噪处理后的音频信号在不同频率范围的音频信号的可信度也是不同的。例如,A环境与B环境中在某一频率范围内的底噪强度不同,那么即使向两个环境中输入相同的音频,底噪强度越大,对采集的音频信号的干扰程度就越大,相应地获取的音频信号的可信度就越低。本发明实施例中通过引入信号可信度这一参数,能够对后续的多种信号处理进行调整,本领域技术人员可以理解的是,上述调整也可以解释为校正。以获取更为准确的信号处理结果。然而传统信号处理技术中并没有引入信号可信度这一参数,只是机械地进行除噪,进一步可能导致信号处理的效果变差。
接下来以语音识别处理为例进一步描述本发明实施例中根据上述可信度对上述频域信号执行第二处理的技术方案,本领域技术人员可以理解的是,一段包含完整信息的音频信号通常包括多帧音频信号,而在识别过程中是对每一帧音频信号进行单独识别,若某一帧音频信号的强度变弱时,受到底噪的干扰就变大,可信度降低,进一步当对该帧音频信号以及模板信号进行相似度计算时所获取的相似度值的准确性也会相应降低。因此,本发明实施例可以根据信号的可信度值对后续的语音识别处理进行调整以提高信号识别处理的准确度。例如,若一帧音频信号的可信度低于一定阈值时,可以舍弃该帧信号,或者降低该帧音频信号在识别的整体判别过程中的权值。
本发明实施例的基本思路在于:当想要对输入信号进行预设信号处理时,首先对该输入信号进行分析,获知该输入信号的可信度,其中,输入信号受底噪影响程度越大,可信度就越低。进一步地,根据该信号自身的可信度去执行该预设信号处理,也即根据该信号自身的可信度对原有的预设信号处理操作进行调整,获得调整后的信号处理效果。其中,上述调整具体可以是通过调参、调整信号处理流程等方式执行。本领域技术人员可以理解的是,上述调整也可以解释为校正,具体是指能够在一定程度上克服上述输入信号由于噪声信号而导致的信号失真问题,最终获取更加接近真实值的信号处理结果。
图2示出了本发明提供的另一个信号处理方法的流程示意图,结合图1,本实施例进一步对如何基于预设的参考信号对上述频域信号执行可信度运算以获取上述频域信号的可信度进行示例性说明,如图2所示,包括如下步骤:
S201:对上述频域信号执行分频处理,从而得到在频域上互不重叠的多个分频信号;
其中,上述预设的参考信号包含与上述多个分频信号一一对应的多个分频参考信号;
S202:根据上述多个分频信号中的每一个分频信号以及上述多个分频参考信号中与上述每一个分频信号相对应的分频参考信号,执行可信度计算,从而得到上述每一个分频信号的可信度因子;
S203:根据上述每一个分频信号的可信度因子获取上述可信度。
例如,在上述S201中,可以按照10Hz的频率范围宽度为频域划分单位,对全频域的信号进行分频处理。
具体地,在上述S202中,可以根据与上述分频处理相同的分频规则对参考信号执行相应的分频处理以获得频域上互不重叠的多个分频参考信号,上述多个分频参考信号与上述多个分频信号一一对应。
具体地,在上述S203中,分频处理中所设定的每组频率范围的宽度越小,则每个分频信号中的信息量会越少,可信度因子也越多,最终获得的可信度就越准确;相应地,如果所设定的每组频率范围的宽度越小,则可信度计算的运算量也就越大,因此,可以根据实际情况控制上述分频处理,本申请对此不做限制。
如上文中所描述的底噪的特质可知,处于不同频率范围的信号具有不同能量强度的底噪信号。此外,底噪信号是动态变化的,而且处于不同频率范围的底噪的动态变化情况也是不同的。然而在传统的信号处理过程中,一般只能针对某一段或几段预先指定的频率范围内的音频信号进行差别化处理。
例如,以对一帧信号执行降噪处理为例,传统的信号处理过程中通常只对环境中所存在的已知底噪(比如,经过分析获知环境中存在350Hz~400Hz的稳定底噪)进行针对性地降噪,而无法全面且动态地获知环境中的底噪分布情况。而本发明实施例通过对信号执行分频处理,并对该信号进行分频段的增强或抑制处理(比如,可以在分析之后对350Hz~360Hz的频域信号进行第一降噪,对360Hz~370Hz的频域信号进行第二降噪,对370Hz~380Hz的频域信号进行第三降噪等等),可以针对每一个分频信号执行自适应的进行降噪处理。
本发明实施例中,对信号的处理并非采用对信号进行整体处理的方式,而是先根据频率范围对音频信号进行分组,并对不同频率范围的信号进行独立且自适应的处理,从而可以获取包含有多个可信度因子的可信度。
在一实施例中,在执行上述S202:根据上述多个分频信号中的每一个分频信号以及上述多个分频参考信号中与上述每一个分频信号相对应的分频参考信号,执行可信度计算时,可选地,可以采用如下方式:
(1)获取上述多个分频信号中的第一分频信号的信号强度信息;
(2)获取上述多个分频参考信号中与上述第一分频信号相对应的第一分频参考信号的信号强度信息;
(3)计算上述第一分频参考信号与上述第一分频信号之间的信号强度比值,将上述信号强度比值作为上述第一分频信号的第一可信度因子。
例如,图3示出了频域信号与参考信号的一个示例,其中A指的是上述频域信号,B指的是上述参考信号,信号①为频段为300Hz~310Hz的分频信号,信号②为频段为300Hz~310Hz的分频参考信号,信号③为频段为150Hz~160Hz的分频信号,信号④为频段为150Hz~160Hz的分频参考信号,信号⑤为频段为70Hz~80Hz的分频信号,信号⑥为频段为70Hz~80Hz的分频参考信号。
假设信号①为第一分频信号,信号强度信息为E1,信号②为第一分频参考信号,信号强度信息为e1,那么,可以根据下列函数公式计算第一分频信号的可信度因子K1:
K1=(E1-e1)/E1
相应地,可以根据上述公式计算出当前帧音频信号在每一个频率范围内的可信度因子,在此不再赘述。
上述根据函数公式计算可信度的技术方案中,对函数的类型不做限制,任何可以计算底噪对信号的干扰程度的函数公式均可以被采用,可以是线性函数,也可以是非线性函数,本发明实施例以上述函数公式为例进行描述,但不限于此。
在另一实施例中,在执行上述S202:根据上述多个分频信号中的每一个分频信号以及上述多个分频参考信号中与上述每一个分频信号相对应的分频参考信号,执行可信度计算时,可选地,可以采用神经网络进行可信度计算,具体包括:
(1)向经过预先训练的神经网络模型输入上述多个分频信号中的第二分频信号,以及输入上述多个分频参考信号中对应于上述第二分频信号的第二参考信号;
(2)在上述向经过预先训练的神经网络模型输入上述多个分频信号中的第二分频信号,以及输入上述多个分频参考信号中对应于上述第二分频信号的第二参考信号这一输入步骤完成之后,上述神经网络模型执行卷积运算,并输出上述第二分频信号的第二可信度因子。
其中,在上述执行可信度计算之前,需要预先构建神经网络模型,并对该神经网络模型进行训练。
例如,图3示出了频域信号与参考信号的一个示例,其中A指的是上述频域信号,B指的是上述参考信号,信号①为频段为300Hz~310Hz的分频信号,信号②为频段为300Hz~310Hz的分频参考信号,信号③为频段为150Hz~160Hz的分频信号,信号④为频段为150Hz~160Hz的分频参考信号,信号⑤为频段为70Hz~80Hz的分频信号,信号⑥为频段为70Hz~80Hz的分频参考信号。通过向上述神经网络模型中输入信号①与信号②,即可获得信号①的可信度因子;向上述神经网络模型中输入信号③与信号④,即可获得信号③的可信度因子;向上述神经网络模型中输入信号⑤与信号⑥,即可获得信号⑤的可信度因子。
利用以上技术方案,可以通过神经网络这一复杂运算模型获得更为准确的信号可信度,进一步达到更好的信号处理效果。
在另一实施例中,在执行上述S202:根据上述多个分频信号中的每一个分频信号以及上述多个分频参考信号中与上述每一个分频信号相对应的分频参考信号,执行可信度计算时,可选地,可以采用神经网络进行可信度计算,具体包括:
(1)向经过预先训练的神经网络模型输入:上述多个分频信号中的第三分频信号、上述多个分频参考信号中对应于上述第三分频信号的第三参考信号、上述多个分频信号中的第四分频信号、上述多个分频参考信号中对应于上述第四分频信号的第四参考信号;
(2)在上述输入步骤完成之后,神经网络模型执行卷积运算,并输出上述第三分频信号的第三可信度因子;
具体地,在上述执行可信度计算之前,需要预先构建卷积神经网络模型,并对该卷积神经网络模型进行训练。
其中,上述第三分频信号与上述第四分频信号具有关联关系。
例如,图3示出了频域信号与参考信号的一个示例,其中A指的是上述频域信号,B指的是上述参考信号,信号①为频段为300Hz~310Hz的分频信号,信号②为频段为300Hz~310Hz的分频参考信号,信号③为频段为150Hz~160Hz的分频信号,信号④为频段为150Hz~160Hz的分频参考信号,信号⑤为频段为70Hz~80Hz的分频信号,信号⑥为频段为70Hz~80Hz的分频参考信号。
由于150~160Hz频率范围、70~80Hz频率范围与300~310Hz频率范围具有预设关联关系,因此向神经网络模型输入处于300~310Hz频率范围内的信号①、信号②,以及处于150~160Hz频率范围内的信号③、信号④,以及处于70~80Hz频率范围内的信号⑤、信号⑥,经过运算后输出分频信号①的可信度因子。
利用以上技术方案,可以获得更为准确的信号可信度,进一步达到更好的信号处理效果。
具体地,上述关联关系可以包括:上述第三分频信号包含上述第三分频信号的谐波信号。
本领域技术人员可以理解的是,在输出信号比输入信号多出的额外谐波部分,谐波信号与实际输入信号叠加后输出的信号就不单纯是与输入信号完全相同的成分,而是包括了谐波成分的信号。因此,包含有谐波成分的信号的可信度进一步下降。例如:输入的200Hz音频信号一般会在400Hz、600Hz等高频率处产生谐波信号,进而污染400Hz、600Hz等高频信号。本发明实施例在计算一分频信号的可信度因子时,不仅考虑其信号本身,还考虑到了其他低频信号对该分频信号所造成的信号污染,其中,分频信号中包含的谐波信号成分越多,可信度就越低。例如:当计算400Hz左右的音频信号的可信度时,不仅要向神经网络模型中输入400Hz附近的频率范围的信号,还可以输入200Hz、100Hz等可能会对400Hz频率处信号造成污染的频率范围处的音频信号以及其各自对应的参考信号。
相应地,神经网络模型的训练阶段中也需要针对上述谐波信号的关联关系输入具有谐波信号关联关系的多个输入值,以训练出能够适应于上述技术方案的神经网络模型。
基于图1与图2的信号处理方法,本申请的一些实施例还提供了该信号处理方法的一些具体实施方案,以及扩展方案,下面进行说明。
在一实施例中,本发明实施例提供的信号处理方法进一步可以包括:
根据预设时间内采集的多个输入信号在多个预设频段的信号强度信息,获取上述多个分频参考信号中的每一个分频参考信号。
本领域技术人员可以理解的是,噪声信号可以在较长时间维持在固定的频率范围,并保持稳定的信号能量强度,而非噪音信号(例如,音频信号)的信号频率以及信号强度则是不断动态变化的,基于此差别,本发明实施例可以根据历史输入信号设置每一个分频参考信号,并将其组合成为参考信号。
例如,可以选取当前帧信号的前50帧频域信号,针对于每个分频信号,建立时间-能量的信号图谱,如图4所示,从图4中可以直观分析出分频信号②的波动程度,在第30~35帧时信号强度出现了较大程度的波动,在其余时间内的信号强度均保持平稳,由此可以求取保持平稳信号强度的信号强度均值作为分频参考信号②的信号强度值,并进一步获取所有的分频参考信号。
本发明实施例通过根据历史输入信号获取参考信号的每一个分频参考信号的技术方案,一是可以对频域信号进行自适应降噪,二是可以获得准确度更高的可信度,进一步提高了信号处理的效果。
在一实施例中,上述第二处理不同于上述第一处理且包括以下一项或多项:
信号识别处理、信号滤波处理、信号增益处理、信号降噪处理。
具体地,第二处理可以包括对信号本身进行的处理,例如信号增益处理,降噪处理等,还可以包括根据信号输出其他信息的处理,包括信号识别等。
以下结合应用于音频信号的信号识别处理过程对本发明实施例进行详细描述。
信号识别处理通常包括如下步骤:对待测信号(也即输入信号)与预先训练好的多个模板信号进行相似度比较,选取具有最大相似度的模板信号以实现匹配。本领域技术人员可以理解的是,在待测信号与预先训练好的多个模板信号进行相似度比较过程中,由于不同的分频信号的可信度不同,若采用传统的相似度运算方法,由于忽略了分频信号之间的可信度因子差异,可能会导致待测信号与多个模板信号中的每一个模板信号之间的相似度值不准确,进一步造成误识别。因此,本发明实施例可以通过上述获取的每个分频信号的可信度因子校正所获取音频相似度值。
例如,当分频信号⑦的可信度因子为a,分频信号⑧的可信度因子为b,可以根据该可信度因子分别为分频信号⑦与分频信号⑧设置权值,进一步将上述权值与相应的相似度分量经过加权组合获取的最终的相似度值。
又例如,也可以采用神经网络模型计算上述相似度,本发明实施例可以将每个分频信号的可信度因子作为一组频域特征参数输入至神经网络中以优化计算。
在一实施例中,进一步对如何根据上述可信度对上述频域信号执行第二处理进行示例性说明,具体包括:
(1)基于上述多个可信度因子为每一个分频信号设置第一系数,根据上述第一系数调整上述第二处理中每一个分频信号的权值参数;
(2)根据调整后的上述第二处理中每一个分频信号的权值参数,对上述频域信号执行第二处理。
具体地,对音频信号的信号识别处理过程中,通过在对每个分频信号与相对应的分频模板信号进行匹配后得到相似度值,将根据分频信号的可信度因子分别设置权值参数,将上述相似度值与对应的权值参数加权组合后获得最终的相似度值,也即通过可信度调整了上述相似度。本领域技术人员可以理解的是,上述调整也可以解释为校正。例如,当分频信号⑦的可信度因子为a,分频信号⑧的可信度因子为b,可以根据该可信度因子分别为分频信号⑦与分频信号⑧设置权值,进一步将上述权值与相应的相似度分量经过加权组合,获取最终的相似度值。
在一实施例中,进一步对如何根据上述可信度对上述频域信号执行第二处理进行示例性说明,具体包括:
基于上述多个可信度因子为每一个分频信号设置第二系数,根据上述第二系数对上述频域信号执行分频段的上述第二处理。
例如,在音频信号的增益处理过程中,可以根据各频率范围的可信度因子对音频信号,使得该增益处理过程不再如传统方式那样根据单一系数对一帧音频信号进行全局扩放或全局缩小,而是根据每一个分频信号所对应的可信度因子对音频信号的每一个频率范围执行自适应的扩放或缩小。
图5示出了本发明实施例提供的信号处理装置500,下面结合图5详细描述用于实现上述信号处理方法的信号处理装置500,该信号处理装置500包括:
第一处理单元501,用于获取输入信号,对上述输入信号执行第一处理以获取上述输入信号对应的频域信号;
可信度计算单元502,用于基于预设的参考信号对上述频域信号执行可信度运算以获取上述频域信号的可信度;
第二处理单元503,用于根据上述可信度对上述频域信号执行第二处理。
具体地,在对上述第一处理单元501的描述中,上述输入信号可以为当前帧的音频信号,上述第一处理可以包括快速傅里叶变换(FFT)处理,目的在于将原始输入的当前帧的音频信号从时域信号转换为频域信号。可选地,上述第一处理也可以是其它可以将时域信号转换为频域信号的信号处理操作。
具体地,在对上述可信度计算单元502的描述中,上述预设的参考信号也即预设的底噪信号,其具体可以根据预设时间区间内历史输入的音频信号(例如,当前帧的音频信号之前所获取的10帧音频信号)获得。
具体地,在对第二处理单元503的描述中,上述第二处理可以是能够对上述信号执行的多种信号处理操作中的任意一种或多种,例如,信号识别处理、信号滤波处理、信号增益处理等。
以下结合音频信号的处理方法对本发明实施例进行详细描述。
值得注意的是,本发明实施例对上述信号的类型不作具体限定,其可以是各种信号,例如从麦克风获取的音频信号,或者从图像采集装置获取的图像信号,也可以是其他类似的信号数据;本发明实施例以音频信号为例进行描述,但是不限于此。
本领域技术人员可以理解的是,音频信号的采集环境中往往存在混合有多种噪音的底噪信号,该多种噪音的来源可以是各类电器的运行噪音、持续的警报噪音或汽车发动机的运行噪音等。上述噪音本身可以在一段时间内稳定于固定的频率范围内,且具有稳定的音频能量,例如,电脑运行噪音的频率范围一般处于500~1000Hz,音频大小为40~50dB;抽油烟机声的频率范围处于200~750Hz,音频大小为50~60dB;电吹风声的频率范围为1000~3000Hz,音频大小处于90dB左右,因此可以获知底噪的特质包括:(1)频率范围不同,噪音分布情况也不同;(2)频率范围不同,底噪信号的能量强度也不同;(3)底噪信号是动态变化的,且不同频率范围的底噪的动态变化过程是不同的。因此本发明实施例通过将原始输入的时域信号转换为频域信号之后,进一步基于频域信号执行可信度的计算。
进一步地,由于不同频率范围的底噪信号强度大小不同,那么经过降噪处理后的音频信号在不同频率范围的音频信号的可信度也是不同的。例如,A环境与B环境中在某一频率范围内的底噪强度不同,那么即使向两个环境中输入相同的音频,底噪强度越大,对采集的音频信号的干扰程度就越大,相应地获取的音频信号的可信度就越低。本发明实施例中通过引入信号可信度这一参数,能够对后续的多种信号处理进行调整,以获取更为准确的信号处理结果。本领域技术人员可以理解的是,上述调整也可以解释为校正。然而传统信号处理技术中并没有引入信号可信度这一参数,只是机械地进行除噪,进一步可能导致信号处理的效果变差。
接下来以语音识别处理为例进一步描述本发明实施例中根据上述可信度对上述频域信号执行第二处理的技术方案,本领域技术人员可以理解的是,一段包含完整信息的音频信号通常包括多帧音频信号,而在识别过程中是对每一帧音频信号进行单独识别,若某一帧音频信号的强度变弱时,受到底噪的干扰就变大,可信度降低,进一步当对该帧音频信号以及模板信号进行相似度计算时所获取的相似度值的准确性也会相应降低。因此,本发明实施例可以根据信号的可信度值对后续的语音识别处理进行调整以提高信号识别处理的准确度。本领域技术人员可以理解的是,上述调整也可以解释为校正。例如,若一帧音频信号的可信度低于一定阈值时,可以舍弃该帧信号,或者降低该帧音频信号在识别的整体判别过程中的权值。
本发明实施例的基本思路在于:当想要对输入信号进行预设信号处理时,首先对该输入信号进行分析,获知该输入信号的可信度,其中,输入信号受底噪影响程度越大,可信度就越低。进一步地,根据该信号自身的可信度去执行该预设信号处理,也即根据该信号自身的可信度对原有的预设信号处理操作进行调整,获得调整后的信号处理效果。其中,上述调整具体可以是通过调参、调整信号处理流程等方式执行,本领域技术人员可以理解的是,上述调整也可以解释为校正,具体是指能够在一定程度上克服上述输入信号由于噪声信号而导致的信号失真问题,最终获取更加接近真实值的信号处理结果。
可选地,其中,上述可信度计算单元进一步用于:
对上述频域信号执行分频处理,从而得到在频域上互不重叠的多个分频信号,上述预设的参考信号包含与上述多个分频信号一一对应的多个分频参考信号;
根据上述多个分频信号中的每一个分频信号以及上述多个分频参考信号中与上述每一个分频信号相对应的分频参考信号,执行可信度计算,从而得到上述每一个分频信号的可信度因子;
根据上述每一个分频信号的可信度因子获取上述可信度。
可选地,其中,上述可信度计算单元进一步用于:
获取上述多个分频信号中的第一分频信号的信号强度信息;
获取上述多个分频参考信号中与上述第一分频信号相对应的第一分频参考信号的信号强度信息;
计算上述第一分频参考信号与上述第一分频信号之间的信号强度比值,将上述信号强度比值作为上述第一分频信号的第一可信度因子。
可选地,其中,上述可信度计算单元进一步用于:
向经过预先训练的神经网络模型输入上述多个分频信号中的第二分频信号,以及输入上述多个分频参考信号中对应于上述第二分频信号的第二参考信号;
上述神经网络模型执行卷积运算,并输出上述第二分频信号的第二可信度因子。
可选地,其中,上述可信度计算单元进一步用于:
向经过预先训练的神经网络模型输入:上述多个分频信号中的第三分频信号、上述多个分频参考信号中对应于上述第三分频信号的第三参考信号、上述多个分频信号中的第四分频信号、上述多个分频参考信号中对应于上述第四分频信号的第四参考信号;
上述神经网络模型执行卷积运算,并输出上述第三分频信号的第三可信度因子;
其中,上述第三分频信号与上述第四分频信号具有预设关联关系。
可选地,其中,上述预设关联关系包括:
上述第三分频信号包含上述第四分频信号的谐波信号。
可选地,其中,上述装置还包括参考信号获取单元,用于:
根据预设时间内采集的多个输入信号在多个预设频段的信号强度信息,获取上述多个分频参考信号中的每一个分频参考信号。
可选地,其中,上述第二处理单元用于:
基于上述多个可信度因子为每一个分频信号设置第一系数,根据上述第一系数调整上述第二处理中每一个分频信号的权值参数;
根据调整后的上述第二处理中每一个分频信号的权值参数,对上述频域信号执行第二处理。
可选地,其中,上述第二处理单元用于:
基于上述多个可信度因子为每一个分频信号设置第二系数,根据上述第二系数对上述频域信号执行分频段的上述第二处理。
可选地,其中,上述第二处理单元具体用于:
信号识别处理、信号滤波处理、信号增益处理、信号降噪处理。
根据本发明的又一实施例,还提供了一种计算机可读存储介质。如图6所示,示出了根据本发明一实施例的计算机可读存储介质60的示意图,该计算机可读存储介质上存储有计算机指令,该计算机指令被处理器执行时实现如上上述的信号处理方法。该计算机可读存储介质60可以采用便携式紧凑盘只读存储器(CD-ROM)。然而,本发明的计算机可读存储介质60不限于此,在本文件中,计算机可读存储介质可以是任何包含或存储计算机指令的有形介质。
利用以上技术方案,能够获取输入的信号的可信度,并在对信号执行指定信号处理过程中,根据该信号自身的可信度去执行指定信号处理操作,进一步可以在一定程度上克服上述输入信号由于噪声信号而导致的信号失真问题,最终获取更加接近真实值的信号处理效果。
附图中的流程图和框图,图示了按照本公开各种实施例的方法、装置和计算机可读存储介质的可能实现的体系架构、功能和操作。应当注意,流程图中的每个方框所表示的步骤未必按照标号所示的顺序进行,有时可以基本并行地执行,有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的硬件来实现,或者可以用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。
通过以上对实施例的描述,本领域的技术人员可以清楚地了解到各实施例可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分上述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。