CN109801642A - 降采样方法及装置 - Google Patents
降采样方法及装置 Download PDFInfo
- Publication number
- CN109801642A CN109801642A CN201811554059.XA CN201811554059A CN109801642A CN 109801642 A CN109801642 A CN 109801642A CN 201811554059 A CN201811554059 A CN 201811554059A CN 109801642 A CN109801642 A CN 109801642A
- Authority
- CN
- China
- Prior art keywords
- sampled
- signal
- sample rate
- original sound
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Filters That Use Time-Delay Elements (AREA)
Abstract
本发明实施例提供一种降采样方法及装置,麦克风等设备根据用户的发音采集到的原始声音信号发送给电子设备,电子设备根据原始声音信号的采样率和语音设备引擎的采样率,构建FIR滤波器,然后利用FIR滤波器对原始声音信号进行处理,得到滤波后的信号,对滤波后的信号进行降采样,得到降采样后的信号从而完成降采样。该过程中,电子设备根据原始声音信号的采样率和语音识别引擎的采样率,构建FIR滤波器,该FIR滤波器的运算量小,且电子设备先利用该FIR滤波器对原始声音信号进行滤波,然后对滤波后的声音信号进行降采样,因此,能够保证降采样后的信号的质量的同时,保证降采样速率。
Description
技术领域
本发明实施例涉及信号处理技术领域,尤其涉及一种降采样方法及装置。
背景技术
声音信号处理过程中,经常需要对原始的声音信号进行降采样处理。例如,数字麦克风的采样频率通常为48000Hz,但是语音识别算法默认的语音采样率是16000Hz。因此,在将数字麦克风采集到的声音信号传输给语音识别引擎之前,需要对声音信号进行降采样处理。
常见的降采样方法包括基于简单抽样的降采样方法和基于低通滤波器的降采样方法。基于简单抽样的降采样方法中,每N个采样点抽取1个采样点。例如,N=2时,每隔1个采样点就抽取1个采样点;N=3时,每隔2个采样点就抽取1个采样点;N=4时,每隔3个采样点就抽取1个采样点。该种方式中,会降低原始声音信号的采样率。例如,N=2时,相当于将原始声音信号的采样率降低了一半,会出现严重的频率泄露问题,导致降采样后的声音信号的质量差。基于低通滤波器的降采样方法中,利用高阶的无线脉冲响应(infiniteimpulse response,IIR)滤波器对原始的声音信号进行滤波,过滤掉不需要的频段。然后,对经过过滤处理的声音信号进行抽样。该种方式中,IIR滤波器的运算耗时比较大,若IIR滤波器是通过软件实现的滤波器,则IIR滤波器对原始的声音信号进行滤波处理耗费的时间更长。
上述两种降采样方法中,均无法做到避免频率泄露问题的同时,保证降采样速率。
发明内容
本发明提供一种降采样方法及装置,降采样过程中,保证降采样后的信号的质量的同时,保证降采样速率。
第一方面,本发明实施例提供一种降采样方法,包括:
根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器,所述语音识别引擎用于识别所述原始声音信号;
利用所述FIR滤波器对所述原始声音信号进行卷积处理,得到滤波后的信号;
对所述滤波后的信号进行降采样,得到降采样后的信号。
一种可行的实现方式中,所述对所述滤波后的信号进行降采样,得到降采样后的信号之后,还包括:
对所述降采样后的信号进行线性预测系数LPC滤波,得到增强信号。
一种可行的实现方式中,所述对所述降采样后的信号进行线性预测系数LPC滤波,得到增强信号,包括:
根据所述降采样后的信号,确定M阶的LPC系数,M≥1且为整数;
根据所述M阶的LPC系数,构建LPC滤波器;
利用所述LPC滤波器,对所述降采样后的信号进行LPC滤波,得到所述增强信号。
一种可行的实现方式中,所述根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器,包括:
构建所述FIR滤波器的滤波函数;
根据所述滤波函数,构建所述FIR滤波器。
一种可行的实现方式中,所述构建所述FIR滤波器的滤波函数,包括:
根据所述语音识别引擎的采样率和所述原始声音信号的采样率,确定降采样倍率;
根据所述降采样倍率,构建所述滤波函数。
一种可行的实现方式中,所述滤波函数为三角窗函数。
一种可行的实现方式中,所述对所述滤波后的信号进行降采样,得到降采样后的信号之后,还包括:
向所述语音识别引擎发送所述降采样后的信号。
第二方面,本发明实施例提供一种降采样装置,包括:
构建模块,用于根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器,所述语音识别引擎用于识别所述原始声音信号;
第一滤波模块,用于利用所述FIR滤波器对所述原始声音信号进行卷积处理,得到滤波后的信号;
降采样模块,用于对所述滤波后的信号进行降采样,得到降采样后的信号。
一种可行的实现方式中,上述的装置还包括:
第二滤波模块,用于在所述降采样模块对所述滤波后的信号进行降采样,得到降采样后的信号之后,对所述降采样后的信号进行线性预测系数LPC滤波,得到增强信号。
一种可行的实现方式中,所述第二滤波模块,用于根据所述降采样后的信号,确定M阶的LPC系数,M≥1且为整数;根据所述M阶的LPC系数,构建LPC滤波器;利用所述LPC滤波器,对所述降采样后的信号进行LPC滤波,得到所述增强信号。
一种可行的实现方式中,所述构建模块,用于根据所述语音识别引擎的采样率和所述原始声音信号的采样率,构建所述FIR滤波器的滤波函数;根据所述滤波函数,构建所述FIR滤波器。
一种可行的实现方式中,所述构建模块,在根据所述语音识别引擎的采样率和所述原始声音信号的采样率,构建所述FIR滤波器的滤波函数时,根据所述语音识别引擎的采样率和所述原始声音信号的采样率,确定降采样倍率;根据所述降采样倍率,构建所述滤波函数。
一种可行的实现方式中,所述滤波函数为三角窗函数。
一种可行的实现方式中,上述的装置还包括:
发送模块,用于在所述降采样模块对所述滤波后的信号进行降采样,得到降采样后的信号之后,向所述语音识别引擎发送所述降采样后的信号。
第三方面,本发明实施例提供一种将采样置,包括处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上第一方面或第一方面的各种可行的实现方式所述的方法。
第四方面,本发明实施例提供一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如上第一方面或第一方面的各种可行的实现方式所述的方法。
第五方面,本发明实施例提供一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行如上第一方面或第一方面的各种可行的实现方式所述的方法。
本发明实施例提供的降采样方法及装置,麦克风等设备根据用户的发音采集到的原始声音信号发送给电子设备,电子设备根据原始声音信号的采样率和语音设备引擎的采样率,构建FIR滤波器,然后利用FIR滤波器对原始声音信号进行处理,得到滤波后的信号,对滤波后的信号进行降采样,得到降采样后的信号从而完成降采样。该过程中,电子设备根据原始声音信号的采样率和语音识别引擎的采样率,构建FIR滤波器,该FIR滤波器的运算量小,且电子设备先利用该FIR滤波器对原始声音信号进行滤波,然后对滤波后的声音信号进行降采样,因此,能够保证降采样后的信号的质量的同时,保证降采样速率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的降采样方法的运行环境示意图;
图2是本发明实施例提供的一种降采样方法的流程图;
图3为本发明实施例提供的一种降采样装置的结构示意图;
图4为本发明实施例提供的另一种降采样装置的结构示意图;
图5为本发明实施例提供的又一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
语音识别过程中,通过数字麦克风等收录发音者的发出的声音得到声音信号,由数字麦克风见将声音信号发送给语音识别装置,由语音识别装置对该声音信号进行识别,并将识别结果文字化,即将识别结果转换成文本;或者,将识别结果转换成命令。其中,语音识别装置上设置有语音识别引擎,该语音识别引擎对声音信号进行采样,得到采样后的信号,并对采样后的信号进行识别。
通常情况下,数字麦克风等设备的采样率与语音识别引擎的采样率不同,数字麦克风的采样率高于语音识别引擎的采样率。例如,数字麦克风的采用率为48000Hz,而语音识别引擎的采样率为16000Hz;再如,数字麦克风的采样率为44100Hz,而语音识别引擎的采样率为14700Hz;又如,数字麦克风的采样率为96000Hz,而语音识别引擎的采样率为16000Hz。因此,再将数字麦克风采集的原始的声音信号发送给语音识别引擎之前,需要对该原始的声音信号进行降采样,以使得语音识别引擎接收到的声音信号能够与自身的采样率适配。
常见的降采样方法包括如下两种方法:方法一、基于简单抽样的降采样方法,该方法中,每隔N-1个采样点,抽取1个采样点,即每N个采样点中抽取一个采样点。例如,N=2时,每隔1个采样点就抽取1个采样点;N=3时,每隔2个采样点就抽取1个采样点;N=4时,每隔3个采样点就抽取1个采样点。该种方式中,会降低原始声音信号的采样率降低N分之一。例如,N=2时,相当于将原始声音信号的采样率降低了一半,N=3时,相当于将原始的声音信号的采样率降低三分之一,此时,会出现严重的频率泄露问题,导致降采样后的声音信号的质量差。从信号处理的角度进行理论分析可知:方法一中,通过直接的N抽1的操作,会让原始声音信号高频的N分之一的信号混叠到其他部分。
方法二、基于低通滤波器的降采样方法。该方法中,利用IIR滤波器对原始的声音信号进行滤波,过滤掉原始声音信号中不需要的频段。然后,对经过过滤处理的声音信号进行抽样。该种方式中,IIR滤波器的运算耗时比较大,尤其是在IIR滤波器通过软件实现时,则IIR滤波器对原始的声音信号进行滤波处理耗费的时间更长。
综合上述可知:上述的方法一降采样速率较高,但是降采样后的信号的质量较差;上述的方法二虽然可以一定程度上保障降采样后的信号的质量,但是降采样速度慢。也就是说,上述两种降采样方法中,均无法做到避免频率泄露问题的同时,保证降采样速率。
有鉴于此,本发明实施例提供一种降采样方法及装置,保证降采样后的信号的质量的同时,保证降采样速率。
图1是本发明实施例提供的降采样方法的运行环境示意图。请参照图1,录音设备对用户发出的声音进行采集,得到原始声音信号,将该原始声音信号发送给降采样装置,由将采样装置对该原始声音信号进行降采样处理,得到降采样后的信号。然后,降采样装置将该降采样后的信号发送给语音识别引擎,由语音识别引擎对该降采样后的信号进行语音识别,将降采样后的信号转换成文本;或者,将降采样后的信号转化成命令。其中,降采样装置可以独立设置,如独立设置在一个电子设备上,语音识别引擎可以设置在服务器上,此时,电子设备与麦克风、电子设备与语音识别引擎之间分别建立网络连接。降采样装置也可以集成在麦克风或语音识别引擎上。当降采样装置集成在麦克风上时,或者,当降采样装置集成在语音设备引擎上时,麦克风与语音识别引擎之间建立网络连接。下面,以降采样装置独立设置在电子设备上为例,对本发明实施例所述的降采样方法进行详细描述。示例性的,可参见图2。
图2是本发明实施例提供的一种降采样方法的流程图。本实施例的执行主体是降采样装置,该装置可以通过软件、硬件或者软硬件结合的方式实现,该装置可以是电子设备的部分或者全部,也可以是电子设备的部分或全部。本实施以该降采样方法应用于电子设备为例进行说明,本实施例包括:
101、根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器,所述语音识别引擎用于识别所述原始声音信号。
本发明实施例中,原始声音信号是麦克风等对发音者的发音进行采集得到的。
本步骤中,电子设备根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应(finite impulse response,FIR)滤波器。例如,电子设备上设置有硬件实现的FIR滤波器,电子设备根据原始声音信号的采样率和语音识别引擎的采样率,初始化该FIR滤波器;再如,电子设备根据原始声音信号的采样率和语音识别引擎的采样率,构建软件实现的FIR滤波器。其中,FIR滤波器的机选了比IIR滤波器的计算量小一倍,性能更加稳定。
102、利用所述FIR滤波器对所述原始声音信号进行卷积处理,得到滤波后的信号。
本步骤中,电子设备利用步骤101中构建出的FIR滤波器对原始声音信号进行滤波,例如,对原始声音信号进行卷积处理,得到滤波后的信号。
103、对所述滤波后的信号进行降采样,得到降采样后的信号。
本步骤中,电子设备对滤波后的信号进行降采样处理,得到降采样后的信号。
本发明实施例提供的降采样方法,麦克风等设备根据用户的发音采集到的原始声音信号发送给电子设备,电子设备根据原始声音信号的采样率和语音设备引擎的采样率,构建FIR滤波器,然后利用FIR滤波器对原始声音信号进行处理,得到滤波后的信号,对滤波后的信号进行降采样,得到降采样后的信号从而完成降采样。该过程中,电子设备根据原始声音信号的采样率和语音识别引擎的采样率,构建FIR滤波器,该FIR滤波器的运算量小,且电子设备先利用该FIR滤波器对原始声音信号进行滤波,然后对滤波后的声音信号进行降采样,因此,能够保证降采样后的信号的质量的同时,保证降采样速率。
上述实施例中,电子设备对滤波后的信号进行降采样,得到降采样后的信号,该降采样后的信号的衰减特性发生变化。因此,需要对降采样后的信号进行增强处理。下面,对本发明实施例中,如何对降采样后的信号进行增强处理进行详细说明。
一种可行的实现方式中,电子设备对所述滤波后的信号进行降采样,得到降采样后的信号之后,对所述降采样后的信号进行线性预测系数LPC滤波,得到增强信号。
示例性的,电子设备根据降采样后的信号,确定M阶的线性预测编码(linearpredictive coding,LPC)系数,M≥1且为整数,例如,构建8阶的LPC系数;再如,构建16阶的LPC系数,本发明实施例并不限制。然后,根据M阶的LPC系数,构建LPC滤波器,利用该LPC滤波器,对所述降采样后的信号进行LPC滤波,得到所述增强信号。
本实施例中,根据降采样后的信号构建LPC滤波器,并利用该LPC滤波器对降采样后的信号进行LPC滤波。也就是说,本发明实施例中,先利用FIR滤波器对原始信号进行滤波,得到滤波后的信号,然后对滤波后的信号进行降采样处理,得到降采样后的信号,最后利用LPC滤波器对降采样后的信号进行滤波,得到增强信号,保证降采样后的信号的质量、降采样速率的同时,保证降采样后的信号的质量。
下面,对上述实施例中,电子设备如何根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器进行详细说明。
一种可行的实现方式中,电子设备根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器时,构建所述FIR滤波器的滤波函数;根据所述滤波函数,构建所述FIR滤波器。
示例性的,电子设备首先根据所述语音识别引擎的采样率和所述原始声音信号的采样率,确定降采样倍率,该降采样倍率记为N。例如,数字麦克风的采用率为48000Hz,语音识别引擎的采样率为16000Hz,则确定降采样倍率为N=3;再如,数字麦克风的采样率为44100Hz,而语音识别引擎的采样率为22050Hz,则确定降采样倍率N=2;又如,数字麦克风的采样率为96000Hz,而语音识别引擎的采样率为16000Hz,则确定降采样倍率N=6。
电子设备确定出降采样倍率后,根据所述降采样倍率,构建所述滤波函数,该滤波函数例如为三角窗函数。
例如,降采样倍率N=2时,则滤波函数为:
h(t)=1/4;
h(t-1)=2/4;
h(t-2)=1/4;
再如,降采样倍率N=3时,则滤波函数为:
h(t)=1/9;
h(t-1)=2/9;
h(t-2)=3/9;
h(t-3)=2/9;
h(t-4)=1/9;
又如,降采样倍率N=4时,则滤波函数为:
h(t)=1/16;
h(t-1)=2/16;
h(t-2)=3/16;
h(t-3)=4/16;
h(t-4)=3/16;
h(t-5)=2/16;
h(t-6)=1/16。
需要说明的是,上述实施例中,均是以原始信号的采样率与语音识别引擎的采样率的比值为整数为例对降采样倍率进行详细说明的。然而,本发明实施例并不限制,当原始信号的采样率与语音识别引擎的采样率的比值不为整数时,可以对该比值取整,从而得到降采样倍率。
本发明实施例中,构建出FIR滤波器后,利用该FIR滤波器对原始声音信号x(t)进行滤波,得到滤波后的信号y(t),然后,对该滤波后的信号y(t)进行降采样,得到降采样后的信号c(t),c(t)=x(N×t),N为降采样倍率。最后,对降采样后的信号c(t)进行LPC滤波,得到增强后的信号p(t)。其中,增强后的信号p(t)的谐波结构最明显,降采样后的信号c(t)的谐波结构次之,原始声音信号x(t)的谐波结构最差。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
图3为本发明实施例提供的一种降采样装置的结构示意图,该降采样装置可以通过软件和/或硬件的方式实现。如图3所示,该降采样装置100包括:
构建模块11,用于根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器,所述语音识别引擎用于识别所述原始声音信号;
第一滤波模块12,用于利用所述FIR滤波器对所述原始声音信号进行卷积处理,得到滤波后的信号;
降采样模块13,用于对所述滤波后的信号进行降采样,得到降采样后的信号。
本发明实施例提供的降采样装置,麦克风等设备根据用户的发音采集到的原始声音信号发送给电子设备,电子设备根据原始声音信号的采样率和语音设备引擎的采样率,构建FIR滤波器,然后利用FIR滤波器对原始声音信号进行处理,得到滤波后的信号,对滤波后的信号进行降采样,得到降采样后的信号从而完成降采样。该过程中,电子设备根据原始声音信号的采样率和语音识别引擎的采样率,构建FIR滤波器,该FIR滤波器的运算量小,且电子设备先利用该FIR滤波器对原始声音信号进行滤波,然后对滤波后的声音信号进行降采样,因此,能够保证降采样后的信号的质量的同时,保证降采样速率。
图4为本发明实施例提供的另一种降采样装置的结构示意图,该降采样装置在上述图4的基础上,进一步的,还包括:
第二滤波模块14,用于在所述降采样模块13对所述滤波后的信号进行降采样,得到降采样后的信号之后,对所述降采样后的信号进行线性预测系数LPC滤波,得到增强信号。
一种可行的设计中,所述第二滤波模块14,用于根据所述降采样后的信号,确定M阶的LPC系数,M≥1且为整数;根据所述M阶的LPC系数,构建LPC滤波器;利用所述LPC滤波器,对所述降采样后的信号进行LPC滤波,得到所述增强信号。
一种可行的设计中,所述构建模块11,用于根据所述语音识别引擎的采样率和所述原始声音信号的采样率,构建所述FIR滤波器的滤波函数;根据所述滤波函数,构建所述FIR滤波器。
一种可行的设计中,所述构建模块11,在根据所述语音识别引擎的采样率和所述原始声音信号的采样率,构建所述FIR滤波器的滤波函数时,根据所述语音识别引擎的采样率和所述原始声音信号的采样率,确定降采样倍率;根据所述降采样倍率,构建所述滤波函数。
一种可行的设计中,所述滤波函数为三角窗函数。
再请参照图4,本实施例所述的降采样装置还包括:
发送模块15,用于在所述降采样模块13对所述滤波后的信号进行降采样,得到降采样后的信号之后,向所述语音识别引擎发送所述降采样后的信号。
图5为本发明实施例提供的又一种电子设备的结构示意图。如图5所示,该电子设备200包括:
至少一个处理器21和存储器22;
所述存储器22存储计算机执行指令;
所述至少一个处理器21执行所述存储器22存储的计算机执行指令,使得所述至少一个处理器21执行如下步骤:
根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器,所述语音识别引擎用于识别所述原始声音信号;
利用所述FIR滤波器对所述原始声音信号进行卷积处理,得到滤波后的信号;
对所述滤波后的信号进行降采样,得到降采样后的信号。
一种可行的设计中,所述对所述滤波后的信号进行降采样,得到降采样后的信号之后,还包括:
对所述降采样后的信号进行线性预测系数LPC滤波,得到增强信号。
一种可行的设计中,所述对所述降采样后的信号进行线性预测系数LPC滤波,得到增强信号,包括:
根据所述降采样后的信号,确定M阶的LPC系数,M≥1且为整数;
根据所述M阶的LPC系数,构建LPC滤波器;
利用所述LPC滤波器,对所述降采样后的信号进行LPC滤波,得到所述增强信号。
一种可行的设计中,所述根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器,包括:
根据所述语音识别引擎的采样率和所述原始声音信号的采样率,构建所述FIR滤波器的滤波函数;
根据所述滤波函数,构建所述FIR滤波器。
一种可行的设计中,所述根据所述语音识别引擎的采样率和所述原始声音信号的采样率,构建所述FIR滤波器的滤波函数,包括:
根据所述语音识别引擎的采样率和所述原始声音信号的采样率,确定降采样倍率;
根据所述降采样倍率,构建所述滤波函数。
一种可行的设计中,所述滤波函数为三角窗函数。
一种可行的设计中,所述对所述滤波后的信号进行降采样,得到降采样后的信号之后,还包括:
向所述语音识别引擎发送所述降采样后的信号
可选地,该电子设备200还包括通信部件23。其中,处理器21、存储器22以及通信部件23可以通过总线24连接。
本发明实施例还提供一种存储介质,所述存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上所述的降采样方法。
本发明实施例还提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如上述降采样方法。
在上述的实施例中,应该理解到,所描述的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(central processing unit,CPU),还可以是其他通用处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(industry standard architecture,ISA)总线、外部设备互连(peripheral component,PCI)总线或扩展工业标准体系结构(extendedIndustry standard architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本发明附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(application specific integrated circuits,ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于终端或服务器中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
本文中的术语“多个”是指两个或两个以上。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种降采样方法,其特征在于,包括:
根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器,所述语音识别引擎用于识别所述原始声音信号;
利用所述FIR滤波器对所述原始声音信号进行卷积处理,得到滤波后的信号;
对所述滤波后的信号进行降采样,得到降采样后的信号。
2.根据权利要求1所述的方法,其特征在于,所述对所述滤波后的信号进行降采样,得到降采样后的信号之后,还包括:
对所述降采样后的信号进行线性预测系数LPC滤波,得到增强信号。
3.根据权利要求2所述的方法,其特征在于,所述对所述降采样后的信号进行线性预测系数LPC滤波,得到增强信号,包括:
根据所述降采样后的信号,确定M阶的LPC系数,M≥1且为整数;
根据所述M阶的LPC系数,构建LPC滤波器;
利用所述LPC滤波器,对所述降采样后的信号进行LPC滤波,得到所述增强信号。
4.根据权利要求1~3任一项所述的方法,其特征在于,所述根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器,包括:
根据所述语音识别引擎的采样率和所述原始声音信号的采样率,构建所述FIR滤波器的滤波函数;
根据所述滤波函数,构建所述FIR滤波器。
5.根据权利要求4所述的方法,其特征在于,所述根据所述语音识别引擎的采样率和所述原始声音信号的采样率,构建所述FIR滤波器的滤波函数,包括:
根据所述语音识别引擎的采样率和所述原始声音信号的采样率,确定降采样倍率;
根据所述降采样倍率,构建所述滤波函数。
6.根据权利要求5所述的方法,其特征在于,所述滤波函数为三角窗函数。
7.根据权利要求1~3任一项所述的方法,其特征在于,所述对所述滤波后的信号进行降采样,得到降采样后的信号之后,还包括:
向所述语音识别引擎发送所述降采样后的信号。
8.一种降采样装置,其特征在于,包括:
构建模块,用于根据原始声音信号的采样率和语音识别引擎的采样率,构建有限冲激响应FIR滤波器,所述语音识别引擎用于识别所述原始声音信号;
第一滤波模块,用于利用所述FIR滤波器对所述原始声音信号进行卷积处理,得到滤波后的信号;
降采样模块,用于对所述滤波后的信号进行降采样,得到降采样后的信号。
9.一种计算机设备,包括处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上述权利要求1-7任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811554059.XA CN109801642A (zh) | 2018-12-18 | 2018-12-18 | 降采样方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811554059.XA CN109801642A (zh) | 2018-12-18 | 2018-12-18 | 降采样方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109801642A true CN109801642A (zh) | 2019-05-24 |
Family
ID=66557153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811554059.XA Pending CN109801642A (zh) | 2018-12-18 | 2018-12-18 | 降采样方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109801642A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111402908A (zh) * | 2020-03-30 | 2020-07-10 | Oppo广东移动通信有限公司 | 语音处理方法、装置、电子设备和存储介质 |
CN113409802A (zh) * | 2020-10-29 | 2021-09-17 | 腾讯科技(深圳)有限公司 | 语音信号的增强处理方法、装置、设备及存储介质 |
CN114374912A (zh) * | 2021-12-10 | 2022-04-19 | 北京百度网讯科技有限公司 | 语音输入的方法、装置、电子设备和介质 |
CN117459065A (zh) * | 2023-12-26 | 2024-01-26 | 深圳市九天睿芯科技有限公司 | Pdm信号转换为pcm信号的方法、装置及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1925323A (zh) * | 2005-08-30 | 2007-03-07 | 冲电气工业株式会社 | 采样率转换方法及其电路 |
CN101320560A (zh) * | 2008-07-01 | 2008-12-10 | 上海大学 | 语音识别系统应用采样速率转化提高识别率的方法 |
CN103907287A (zh) * | 2011-10-25 | 2014-07-02 | Actiwave公司 | 异步采样率转换器 |
CN107251009A (zh) * | 2014-10-03 | 2017-10-13 | Dts(英属维尔京群岛)有限公司 | 用于可变采样速率的数字音频滤波器 |
CN207926605U (zh) * | 2018-01-12 | 2018-09-28 | 深圳市嵘兴实业发展有限公司 | 一种多路无线电信号监测装置 |
-
2018
- 2018-12-18 CN CN201811554059.XA patent/CN109801642A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1925323A (zh) * | 2005-08-30 | 2007-03-07 | 冲电气工业株式会社 | 采样率转换方法及其电路 |
CN101320560A (zh) * | 2008-07-01 | 2008-12-10 | 上海大学 | 语音识别系统应用采样速率转化提高识别率的方法 |
CN103907287A (zh) * | 2011-10-25 | 2014-07-02 | Actiwave公司 | 异步采样率转换器 |
CN107251009A (zh) * | 2014-10-03 | 2017-10-13 | Dts(英属维尔京群岛)有限公司 | 用于可变采样速率的数字音频滤波器 |
CN207926605U (zh) * | 2018-01-12 | 2018-09-28 | 深圳市嵘兴实业发展有限公司 | 一种多路无线电信号监测装置 |
Non-Patent Citations (1)
Title |
---|
张宪敏: "∑△ADC中降采样滤波器的设计与验证", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111402908A (zh) * | 2020-03-30 | 2020-07-10 | Oppo广东移动通信有限公司 | 语音处理方法、装置、电子设备和存储介质 |
CN113409802A (zh) * | 2020-10-29 | 2021-09-17 | 腾讯科技(深圳)有限公司 | 语音信号的增强处理方法、装置、设备及存储介质 |
CN113409802B (zh) * | 2020-10-29 | 2023-09-15 | 腾讯科技(深圳)有限公司 | 语音信号的增强处理方法、装置、设备及存储介质 |
CN114374912A (zh) * | 2021-12-10 | 2022-04-19 | 北京百度网讯科技有限公司 | 语音输入的方法、装置、电子设备和介质 |
CN117459065A (zh) * | 2023-12-26 | 2024-01-26 | 深圳市九天睿芯科技有限公司 | Pdm信号转换为pcm信号的方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109801642A (zh) | 降采样方法及装置 | |
CN107481731B (zh) | 一种语音数据增强方法及系统 | |
US20160004574A1 (en) | Method and apparatus for accelerating system running | |
CN110444202B (zh) | 复合语音识别方法、装置、设备及计算机可读存储介质 | |
CN112687263B (zh) | 语音识别神经网络模型及其训练方法、语音识别方法 | |
CN106254782A (zh) | 图像处理方法及装置和相机 | |
US11182447B2 (en) | Customized display of emotionally filtered social media content | |
US10314544B2 (en) | Method, apparatus and computer program for activity sensor data processing | |
CN110502357A (zh) | 一种栈回溯方法、装置、介质和设备 | |
CN110287810B (zh) | 车门动作检测方法、装置和计算机可读存储介质 | |
WO2022017096A1 (zh) | 屏幕录制方法、电子设备及计算机可读存储介质 | |
CN112149615A (zh) | 人脸活体检测方法、装置、介质及电子设备 | |
CN110519680A (zh) | 音频器件测试方法及装置 | |
CN114913325B (zh) | 语义分割方法、装置及计算机程序产品 | |
CN109640068A (zh) | 视频帧的信息预测方法、装置、设备以及存储介质 | |
CN114187922A (zh) | 一种音频检测方法、装置及终端设备 | |
AU2023254966A1 (en) | Method and system for receiving a debt payment | |
JP7288062B2 (ja) | 情報を出力するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
CN112801882B (zh) | 图像处理方法及装置、存储介质和电子设备 | |
CN116959469A (zh) | 语音增强模型的训练方法、装置、电子设备和存储介质 | |
CN114710173B (zh) | 一种干扰信号过滤方法、装置、电子设备和存储介质 | |
CN111784320A (zh) | 数据的关联方法、装置和电子设备 | |
CN113205824B (zh) | 声音信号处理方法、装置、存储介质、芯片及相关设备 | |
CN114171038B (zh) | 语音降噪方法、装置、设备及存储介质 | |
CN114550731A (zh) | 一种音频识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |