CN110021305B - 一种音频滤波方法、音频滤波装置及可穿戴设备 - Google Patents
一种音频滤波方法、音频滤波装置及可穿戴设备 Download PDFInfo
- Publication number
- CN110021305B CN110021305B CN201910042161.XA CN201910042161A CN110021305B CN 110021305 B CN110021305 B CN 110021305B CN 201910042161 A CN201910042161 A CN 201910042161A CN 110021305 B CN110021305 B CN 110021305B
- Authority
- CN
- China
- Prior art keywords
- frequency
- frequency band
- characteristic data
- frequency spectrum
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001914 filtration Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000001228 spectrum Methods 0.000 claims abstract description 103
- 230000005236 sound signal Effects 0.000 claims abstract description 61
- 238000012545 processing Methods 0.000 claims abstract description 27
- 230000003595 spectral effect Effects 0.000 claims description 58
- 238000004590 computer program Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 12
- 239000012634 fragment Substances 0.000 claims description 7
- 230000009191 jumping Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- VZUGBLTVBZJZOE-KRWDZBQOSA-N n-[3-[(4s)-2-amino-1,4-dimethyl-6-oxo-5h-pyrimidin-4-yl]phenyl]-5-chloropyrimidine-2-carboxamide Chemical compound N1=C(N)N(C)C(=O)C[C@@]1(C)C1=CC=CC(NC(=O)C=2N=CC(Cl)=CN=2)=C1 VZUGBLTVBZJZOE-KRWDZBQOSA-N 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供了一种音频滤波方法、音频滤波装置及可穿戴设备,所述音频滤波方法用于处理可穿戴设备录制的原始音频文件,所述音频滤波方法包括以下步骤:S101:对所述原始音频文件进行快速傅里叶变换,得到频谱特征数据;S102:去除所述频谱特征数据中次声频率及超声频率对应的频谱特征;S103:确定有效音频信号频带,去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据;S104:对所述去除噪声后的频谱特征数据进行傅里叶反变换,得到滤波后的音频文件。上述技术方案实施后,实现了在可穿戴设备上对原始录音文件进行滤波处理,去除噪声,提升音频音质效果。
Description
技术领域
本发明涉及音频处理技术领域,尤其涉及一种音频滤波方法、音频滤波装置及可穿戴设备,用于处理可穿戴设备录制的原始音频文件。
背景技术
可穿戴设备包括智能手表、佩戴式电话、智能手环、智能耳机等可穿戴于人体上的电子设备,能够实现服务于人体的各种功能。大部分可穿戴设备具备人机交互功能,例如对人的声音进行录音并记录。然而,在录音的过程中,不可避免地会受到外部环境或者电子电路上的噪声干扰,影响音频文件的记录效果。
因此,需要在可穿戴设备上实现对录制的原始音频文件进行滤波,降低噪声对录音效果的影响。
发明内容
为了克服现有技术缺陷,本发明的目的在于提供一种音频滤波方法、音频滤波装置及可穿戴设备,用于对可穿戴设备录制的原始音频文件进行滤波处理。
本发明公开了一种音频滤波方法,用于处理可穿戴设备录制的原始音频文件,所述音频滤波方法包括以下步骤:
S101:对所述原始音频文件进行快速傅里叶变换,得到频谱特征数据;
S102:去除所述频谱特征数据中次声频率及超声频率对应的频谱特征;
S103:确定有效音频信号频带,去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据;
S104:对所述去除噪声后的频谱特征数据进行傅里叶反变换,得到滤波后的音频文件。
优选地,步骤S103进一步包括以下步骤:
S103-1:以一预设的起始频率开始,按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量,直至频带窗的数量达到一预设数量阈值;
S103-2:判断步骤S103-1中各频带窗内的频谱能量是否相等或近似相等;
S103-3:当步骤S103-1中各频带窗内的频谱能量不相等且不近似相等时,将起始频率累加一个频带窗的频带范围,得到新的起始频率,跳转至步骤S103-1;
S103-4:当步骤S103-1中各频带窗内的频谱能量相等或近似相等时,将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带;
S103-5:去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据。
优选地,步骤103-1中,起始频率为20Hz。
优选地,步骤S101之前,所述音频滤波方法还包括以下步骤:
S100:对所述原始音频文件进行分窗处理,得到一组音频文件片段;
步骤S104之后,所述音频滤波方法还包括以下步骤:
S105:重复步骤S101至步骤S104对每一音频文件片段进行处理,直至所有音频文件片段完成滤波,再对滤波后的所有音频文件片段进行组合,得到滤波后的音频文件。
优选地,步骤S103与步骤S104之间,所述音频滤波方法还包括以下步骤:
S103’:对去除噪声后的频谱特征数据增加均衡器处理。
优选地,步骤S103中,通过设置对应有效音频信号频带的带通滤波器来去除噪声。
本发明还公开了一种音频滤波装置,用于处理可穿戴设备录制的原始音频文件,所述滤波装置包括:
傅里叶变换模块,对所述原始音频文件进行快速傅里叶变换,得到频谱特征数据;
第一去噪模块,与所述傅里叶变换模块连接,去除所述频谱特征数据中次声频率及超声频率对应的频谱特征;
第二去噪模块,与所述第一去噪模块连接,确定有效音频信号频带,去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据;
傅里叶反变换模块,与所述第二去噪模块连接,对所述去除噪声后的频谱特征数据进行傅里叶反变换,得到滤波后的音频文件。
本发明还公开了一种可穿戴设备,所述可穿戴设备包括处理器、存储器及录音装置,所述存储器内存储有计算机程序,所述录音装置用于录制原始音频文件,所述计算机程序被处理器执行时实现以下步骤:
S107:对所述原始音频文件进行快速傅里叶变换,得到频谱特征数据;
S108:去除所述频谱特征数据中次声频率及超声频率对应的频谱特征;
S109:确定有效音频信号频带,去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据;
S110:对所述去除噪声后的频谱特征数据进行傅里叶反变换,得到滤波后的音频文件。
优选地,步骤S109进一步包括以下步骤:
S109-1:以一预设的起始频率开始,按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量,直至频带窗的数量达到一预设数量阈值;
S109-2:判断步骤S109-1中各频带窗内的频谱能量是否相等或近似相等;
S109-3:当步骤S109-1中各频带窗内的频谱能量不相等且不近似相等时,将起始频率累加一个频带窗的频带范围,得到新的起始频率,跳转至步骤S109-1;
S109-4:当步骤S109-1中各频带窗内的频谱能量相等或近似相等时,将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带;
S109-5:去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据。
优选地,步骤109-1中,起始频率为20Hz。
优选地,步骤S107之前,所述计算机程序还包括以下步骤:
S106:对所述原始音频文件进行分窗处理,得到一组音频文件片段;
步骤S110之后,所述计算机程序还包括以下步骤:
S111:重复步骤S107至步骤S110对每一音频文件片段进行处理,直至所有音频文件片段完成滤波,再对滤波后的所有音频文件片段进行组合,得到滤波后的音频文件。
优选地,步骤S109与步骤S110之间,所述计算机程序还包括以下步骤:
S109’:对去除噪声后的频谱特征数据增加均衡器处理。
优选地,步骤S109中,通过设置对应有效音频信号频带的带通滤波器来去除噪声。
采用了上述技术方案后,与现有技术相比,具有以下有益效果:
1.实现了在可穿戴设备上对原始录音文件进行滤波处理,去除噪声,提升音频音质效果;
2.采用数字滤波,节省硬件成本。
附图说明
图1为符合本发明一优选实施例中音频滤波方法的流程示意图;
图2为图1中步骤S103的具体流程示意图;
图3为符合本发明一优选实施例中音频滤波装置的结构框图;
图4为图1中步骤S101执行前后的时域及频域分析图;
图5为图4中低频部分的频域分析图;
图6为图2中步骤S103-1的效果示意图。
附图标记:
100-音频滤波装置、110-傅里叶变换模块、120-第一去噪模块、130-第二去噪模块、140-傅里叶反变换模块。
具体实施方式
以下结合附图与具体实施例进一步阐述本发明的优点。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
参阅图1,为符合本发明一优选实施例中音频滤波方法的流程示意图,所述音频滤波方法用于处理可穿戴设备录制的原始音频文件,包括以下步骤:
S100:对所述原始音频文件进行分窗处理,得到一组音频文件片段。
原始音频文件即一段录音的录音文件,往往会比较长,例如几十秒甚至是几分钟,因此需要对原始音频文件进行分窗处理,分割为多个窗口,即一组较短的音频文件片段,每次仅对一个音频文件片段进行处理。本实施例中,采用非矩形加窗,例如汉明窗,窗口长度一般为10毫秒至30毫秒,每个窗之间的帧移一般为二分之一的窗口时长。具体地,汉明窗的函数为:
其中,α=0.46,N为采样序列长度。分窗处理后,能够减小计算量并提高时域分辨率。在其他实施例中,若原始音频文件较短,可直接进入步骤S101进行处理。
S101:对所述音频文件片段进行快速傅里叶变换,得到频谱特征数据。
傅里叶变换是通信领域的基础算法,能够将时域的信号转换到频域进行处理。为了便于计算机进行处理,常使用离散快速傅里叶变换(FFT)对音频文件片段进行处理,得到针对改音频文件片段的频谱特征数据,即本领域常见的频谱特性图。离散快速傅里叶变换的公式如下:
其中,N为采样序列长度,0≤k≤N-1。本实施例中,可选取一段儿歌作为原始音频文件,读取样本长度为N=3741695,采样频率FS=22050HZ,故经过FFT变换后可分析频率范围为(0-11025Hz),即遵循了采样定理,采样频率至少为分析频率的2倍。本步骤执行前后,音频文件的时域信号和频域信号详见图4。
S102:去除所述频谱特征数据中次声频率及超声频率对应的频谱特征。
人耳的听觉范围为20Hz-20KHz,即人仅能听到上述频率范围内的声音,低于上述频率范围下限20Hz的声音频率即为次声频率,高于上述频率范围上限20KHz的即为超声频率。本步骤对所述频谱特征数据中次声频率及超声频率对应的频谱特征进行去除操作,具体地,将上述频率对应的FFT系数置零即可。本实施例中,上述儿歌音频文件的分析频率范围为0-11025Hz,故仅需对次声频率进行FFT系数置零操作即可,即次声部分FFT系数置零后放大频谱图如图5。如果分析频域范围内包含>20KHz的超声频率信号,则处理方式为
S103:确定有效音频信号频带,去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据。
本步骤为音频滤波的关键步骤,其理论基础在于人发出的声音主要集中在低频段,超过某个频率阈值后,更高频率的音频信号可确定为白噪声。白噪声(white noise)是指功率谱密度在整个频域内是常数的噪声,即所有频率具有相同能量密度的随机噪声称为白噪声。利用上述理论,只需找出频谱特征数据中区分音频信号和高频白噪声信号的临界点即可,人的声音的起始频率至该临界点之间的频带范围即为有效音频信号频带,本步骤只需去除有效音频信号频带以外的频带的频谱特征即可,例如令有效音频信号频带之外的频带的FFT系数为零。有效音频信号频带的确定可以根据多次实验的结果进行测定,也就是获取经验参数,例如以20Hz作为有效音频信号频带的下限频率,以10KHz作为有效音频信号频带的上限频率。
还可以通过查找算法寻找有效音频信号频带的上限频率,详见图2,本步骤进一步包括以下步骤:
S103-1:以一预设的起始频率开始,按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量,直至频带窗的数量达到一预设数量阈值。
所述起始频率为开始查找算法的起始点,可以将有效音频信号频带的起始频点作为起始频率,例如20Hz。本步骤可设置一频带窗,频带窗的范围可以是100Hz,则频带窗内有约个点。本步骤中,须按照频率递增的方向选取多个频带范围相等的频带窗,而后统计每个频带窗内的频谱能量,详见图6。选取频带窗的数量须达到一预设的数量阈值,例如选取10个频带窗,则可覆盖1KHz的计算范围。频谱能量的计算则是本领域的公知技术,不再赘述。
S103-2:判断步骤S103-1中各频带窗内的频谱能量是否相等或近似相等。
本步骤执行判断操作,判断上述步骤S103-1中各频带窗内的频谱能量是否相等或近似相等。判断各频带窗内的频谱能量是否相等较为简单,只需判断各频谱能量的数值是否相等即可。考虑到白噪声的能量分布会存在误差,因此有近似相等的说法。具体地,可先求得各频带窗的频谱能量的平均值,而后判断是否每一个频带窗的频谱能量与平均值的偏差小于一偏差阈值,若满足均小于所述偏差阈值,则可视为各频带窗的频谱能量近似相等。也可采用方差来进行近似相等的判断,即计算各频带窗内频谱能量的方差,若该方差小于一方差阈值,则判定各频谱能量近似相等。
S103-3:当步骤S103-1中各频带窗内的频谱能量不相等且不近似相等时,将起始频率累加一个频带窗的频带范围,得到新的起始频率,跳转至步骤S103-1。
当步骤S103-2判断不成立时,即步骤S103-1中各频带窗内的频谱能量不相等且不近似相等时,意味着各频带窗的频谱能量不符合白噪声的判定标准,起始频率的位置仍处于有效音频信号频带内,需要将各频带窗的位置向高频方向迁移,即本步骤的执行内容。本步骤将起始频率累加一个频带窗的频带范围,得到新的起始频率,而后跳转至步骤S103-1,重新进行各频带窗的频谱能量统计。考虑到有效音频信号频带与白噪声的临界频点会比较高频,步骤S103-1至S103-3可能会循环执行多次方能找到上述临界点。
S103-4:当步骤S103-1中各频带窗内的频谱能量相等或近似相等时,将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带。
当步骤S103-2判断不成立时,即步骤S103-1中各频带窗内的频谱能量相等或近似相等时,意味着各频带窗的频谱能量符合白噪声的判定标准,本步骤将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带。例如,经过步骤S103-1至S103-3的迭代查找,当起始频率为10KHz时,计算得到各频带窗的频谱能量相等或近似相等,则表示10KHz为白噪声的频带临界点,那么20Hz与10KHz之间的频带范围即有效音频信号频带。
S103-5:去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据。
本步骤在步骤S103-4的基础上执行滤波操作,即去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据。例如,若有效音频信号频带为20Hz与10KHz,那么就须去除人耳听觉范围内除上述有效音频信号频带以外的其他频带的频谱特征,即10KHz与20KHz之间的频带的频谱特征,之后的频谱特征数据即去除噪声后洁净的音频信号数据。去除相关频带的频谱特征,可以选择将上述频带对应的FFT系数置零,也可考虑使用通过设置对应有效音频信号频带的带通滤波器来去除噪声,例如有效音频信号频带为20Hz与10KHz,则设置相应带宽的带通滤波器即可,而20Hz以内的频段也不是人耳的听觉范围,也可考虑采用10KHz的低通滤波器实现滤波。
S104:对所述去除噪声后的频谱特征数据进行傅里叶反变换,得到滤波后的音频文件片段。
去除噪声后的频谱特征数据还需转换为时域信号方能进行后续的音频播放操作,因此本步骤对去除噪声后的频谱特征数据进行离散快速傅里叶反变换,即可得到滤波后的音频文件片段。离散快速傅里叶反变换的公式如下:
S105:重复步骤S101至步骤S104对每一音频文件片段进行处理,直至所有音频文件片段完成滤波,再对滤波后的所有音频文件片段进行组合,得到滤波后的音频文件。
由于原始的音频文件是一个完整的文件,因此进行滤波操作后还需要将各音频文件片段整合在一起。重复步骤S101至步骤S104时,需要进行移帧操作,也就是每个窗口都是一帧,每处理好一帧则移至下一帧进行处理。
进一步地,为了获得更好地音效,步骤S103与步骤S104之间,所述音频滤波方法还包括以下步骤:
S103’:对去除噪声后的频谱特征数据增加均衡器处理。
均衡器通过算法来实现,此方法和相机的美颜功能相似,需根据需求实施。例如调整低音部分强度(40-150Hz),使声音丰满柔和;适当加强中低音(150-500Hz),此部分是人所发出声音的主要频段,可避免人声软而无力,适当加强可使人声变得浑厚有力。均衡器的具体实现是本领域的公知技术,本领域技术人员能够将该技术应用于本步骤中。
参阅图3,为符合本发明一优选实施例中音频滤波装置的结构框图,所述音频滤波装置100用于处理可穿戴设备录制的原始音频文件,包括:
-傅里叶变换模块110
傅里叶变换模块110内封装有离散快速傅里叶变换算法(FFT),能够将时域的原始音频文件数据转换为频域的频谱特征数据,即本领域常见的频谱特性图,以便在频域对音频数据进行分析处理。
-第一去噪模块120
所述第一去噪模块120与所述傅里叶变换模块110连接,去除所述频谱特征数据中次声频率及超声频率对应的频谱特征,减少音频信号中的次声噪声及超声噪声的干扰。具体地,将上述次声频率及超声频率对应的FFT系数置零即可。
-第二去噪模块130
所述第二去噪模块130与所述第一去噪模块120连接,确定频谱特征数据中的有效音频信号频带,去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据。所述第二去噪模块130根据白噪声的原理来确定有效音频信号频带,以一预设的起始频率开始,按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量,若各频带窗内的频谱能量相等或近似相等,则起始频率即为有效音频信号频带的上限频率,否则,则向高频方向推移上述频带窗,重新统计各频带窗内的频谱能量,如此往复,直至各频带窗内的频谱能量相等或近似相等。
-傅里叶反变换模块140
所述傅里叶反变换模块140与所述第二去噪模块130连接,对所述去除噪声后的频谱特征数据进行傅里叶反变换,得到滤波后的音频文件。这样就能将频域的音频数据重新变换为时域,以便后续的播放操作。
本发明还公开了一种可穿戴设备,所述可穿戴设备包括处理器、存储器及录音装置,所述存储器内存储有计算机程序,所述录音装置用于录制原始音频文件,所述计算机程序被处理器执行时实现以下步骤:
S107:对所述原始音频文件进行快速傅里叶变换,得到频谱特征数据;
S108:去除所述频谱特征数据中次声频率及超声频率对应的频谱特征;
S109:确定有效音频信号频带,去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据;
S110:对所述去除噪声后的频谱特征数据进行傅里叶反变换,得到滤波后的音频文件。
进一步地,步骤S109进一步包括以下步骤:
S109-1:以一预设的起始频率开始,按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量,直至频带窗的数量达到一预设数量阈值;
S109-2:判断步骤S109-1中各频带窗内的频谱能量是否相等或近似相等;
S109-3:当步骤S109-1中各频带窗内的频谱能量不相等且不近似相等时,将起始频率累加一个频带窗的频带范围,得到新的起始频率,跳转至步骤S109-1;
S109-4:当步骤S109-1中各频带窗内的频谱能量相等或近似相等时,将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带;
S109-5:去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据。
进一步地,步骤109-1中,起始频率为20Hz。
进一步地,步骤S107之前,所述计算机程序还包括以下步骤:
S106:对所述原始音频文件进行分窗处理,得到一组音频文件片段;
步骤S110之后,所述计算机程序还包括以下步骤:
S111:重复步骤S107至步骤S110对每一音频文件片段进行处理,直至所有音频文件片段完成滤波,再对滤波后的所有音频文件片段进行组合,得到滤波后的音频文件。
进一步地,步骤S109与步骤S110之间,所述计算机程序还包括以下步骤:
S109’:对去除噪声后的频谱特征数据增加均衡器处理。
可选地,步骤S109中,通过设置对应有效音频信号频带的带通滤波器来去除噪声。
上述计算机程序的方法步骤与本发明中的音频滤波方法的实现方式一致,不再赘述。
应当注意的是,本发明的实施例有较佳的实施性,且并非对本发明作任何形式的限制,任何熟悉该领域的技术人员可能利用上述揭示的技术内容变更或修饰为等同的有效实施例,但凡未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何修改或等同变化及修饰,均仍属于本发明技术方案的范围内。
Claims (11)
1.一种音频滤波方法,用于处理可穿戴设备录制的原始音频文件,其特征在于,所述音频滤波方法包括以下步骤:
S101:对所述原始音频文件进行快速傅里叶变换,得到频谱特征数据;
S102:去除所述频谱特征数据中次声频率及超声频率对应的频谱特征;
S103:确定有效音频信号频带,去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据;
S104:对所述去除噪声后的频谱特征数据进行傅里叶反变换,得到滤波后的音频文件;
步骤S103进一步包括以下步骤:
S103-1:以一预设的起始频率开始,按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量,直至频带窗的数量达到一预设数量阈值;S103-2:判断步骤S103-1中各频带窗内的频谱能量是否相等或近似相等;
S103-3:当步骤S103-1中各频带窗内的频谱能量不相等且不近似相等时,将起始频率累加一个频带窗的频带范围,得到新的起始频率,跳转至步骤S103-1;
S103-4:当步骤S103-1中各频带窗内的频谱能量相等或近似相等时,将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带;
S103-5:去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据。
2.如权利要求1所述的音频滤波方法,其特征在于,
步骤103-1中,起始频率为20Hz。
3.如权利要求1-2任一项所述的音频滤波方法,其特征在于,
步骤S101之前,所述音频滤波方法还包括以下步骤:
S100:对所述原始音频文件进行分窗处理,得到一组音频文件片段;
步骤S104之后,所述音频滤波方法还包括以下步骤:
S105:重复步骤S101至步骤S104对每一音频文件片段进行处理,直至所有音频文件片段完成滤波,再对滤波后的所有音频文件片段进行组合,得到滤波后的音频文件。
4.如权利要求1-2任一项所述的音频滤波方法,其特征在于,
步骤S103与步骤S104之间,所述音频滤波方法还包括以下步骤:
S103’:对去除噪声后的频谱特征数据增加均衡器处理。
5.如权利要求1-2任一项所述的音频滤波方法,其特征在于,
步骤S103中,通过设置对应有效音频信号频带的带通滤波器来去除噪声。
6.一种音频滤波装置,用于处理可穿戴设备录制的原始音频文件,其特征在于,所述滤波装置包括:
傅里叶变换模块,对所述原始音频文件进行快速傅里叶变换,得到频谱特征数据;
第一去噪模块,与所述傅里叶变换模块连接,去除所述频谱特征数据中次声频率及超声频率对应的频谱特征;
第二去噪模块,与所述第一去噪模块连接,确定有效音频信号频带,去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据;
傅里叶反变换模块,与所述第二去噪模块连接,对所述去除噪声后的频谱特征数据进行傅里叶反变换,得到滤波后的音频文件;
其中,所述第二去噪模块以一预设的起始频率开始,按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量,直至频带窗的数量达到一预设数量阈值,并判断所述各频带窗内的频谱能量是否相等或近似相等,在当步骤S103-1中各频带窗内的频谱能量不相等且不近似相等时,将起始频率累加一个频带窗的频带范围,得到新的起始频率,并以所述新的起始频率开始,按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量,直至频带窗的数量达到一预设数量阈值,当各频带窗内的频谱能量相等或近似相等时,将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带。
7.一种可穿戴设备,所述可穿戴设备包括处理器、存储器及录音装置,所述存储器内存储有计算机程序,所述录音装置用于录制原始音频文件,其特征在于,所述计算机程序被处理器执行时实现以下步骤:
S107:对所述原始音频文件进行快速傅里叶变换,得到频谱特征数据;
S108:去除所述频谱特征数据中次声频率及超声频率对应的频谱特征;
S109:确定有效音频信号频带,去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据;
S110:对所述去除噪声后的频谱特征数据进行傅里叶反变换,得到滤波后的音频文件;步骤S109进一步包括以下步骤:
S109-1:以一预设的起始频率开始,按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量,直至频带窗的数量达到一预设数量阈值;S109-2:判断步骤S109-1中各频带窗内的频谱能量是否相等或近似相等;
S109-3:当步骤S109-1中各频带窗内的频谱能量不相等且不近似相等时,将起始频率累加一个频带窗的频带范围,得到新的起始频率,跳转至步骤S109-1;
S109-4:当步骤S109-1中各频带窗内的频谱能量相等或近似相等时,将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带;
S109-5:去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征,得到去除噪声后的频谱特征数据。
8.如权利要求7所述的可穿戴设备,其特征在于,
步骤109-1中,起始频率为20Hz。
9.如权利要求7-8任一项所述的可穿戴设备,其特征在于,
步骤S107之前,所述计算机程序还包括以下步骤:
S106:对所述原始音频文件进行分窗处理,得到一组音频文件片段;
步骤S110之后,所述计算机程序还包括以下步骤:
S111:重复步骤S107至步骤S110对每一音频文件片段进行处理,直至所有音频文件片段完成滤波,再对滤波后的所有音频文件片段进行组合,得到滤波后的音频文件。
10.如权利要求7-8任一项所述的可穿戴设备,其特征在于,
步骤S109与步骤S110之间,所述计算机程序还包括以下步骤:
S109’:对去除噪声后的频谱特征数据增加均衡器处理。
11.如权利要求7-8任一项所述的可穿戴设备,其特征在于,
步骤S109中,通过设置对应有效音频信号频带的带通滤波器来去除噪声。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910042161.XA CN110021305B (zh) | 2019-01-16 | 2019-01-16 | 一种音频滤波方法、音频滤波装置及可穿戴设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910042161.XA CN110021305B (zh) | 2019-01-16 | 2019-01-16 | 一种音频滤波方法、音频滤波装置及可穿戴设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110021305A CN110021305A (zh) | 2019-07-16 |
CN110021305B true CN110021305B (zh) | 2021-08-20 |
Family
ID=67188833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910042161.XA Active CN110021305B (zh) | 2019-01-16 | 2019-01-16 | 一种音频滤波方法、音频滤波装置及可穿戴设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110021305B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898080B (zh) * | 2020-08-20 | 2024-05-03 | 拉扎斯网络科技(上海)有限公司 | 数据序列去噪方法、装置、电子设备及计算机存储介质 |
CN112951262B (zh) * | 2021-02-24 | 2023-03-10 | 北京小米松果电子有限公司 | 音频录制方法及装置、电子设备及存储介质 |
CN115050384A (zh) * | 2022-05-10 | 2022-09-13 | 广东职业技术学院 | 一种户外直播中背景音降噪方法、设备和系统 |
CN116366169B (zh) * | 2023-06-01 | 2023-10-24 | 浙江大学 | 超声波信道建模方法、电子设备及存储介质 |
CN117574063B (zh) * | 2024-01-17 | 2024-04-16 | 北京雪迪龙科技股份有限公司 | 一种基于傅里叶变换的光谱降噪方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599274A (zh) * | 2009-06-26 | 2009-12-09 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
CN101872616A (zh) * | 2009-04-22 | 2010-10-27 | 索尼株式会社 | 端点检测方法以及使用该方法的系统 |
CN104966518A (zh) * | 2015-03-02 | 2015-10-07 | 腾讯科技(深圳)有限公司 | 一种音乐文件的音质检测方法及装置 |
CN106098077A (zh) * | 2016-07-28 | 2016-11-09 | 浙江诺尔康神经电子科技股份有限公司 | 一种带降噪的人工耳蜗言语处理系统及方法 |
CN106098076A (zh) * | 2016-06-06 | 2016-11-09 | 成都启英泰伦科技有限公司 | 一种基于动态噪声估计时频域自适应语音检测方法 |
CN109215665A (zh) * | 2018-07-20 | 2019-01-15 | 广东工业大学 | 一种基于3d卷积神经网络的声纹识别方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2226794B1 (en) * | 2009-03-06 | 2017-11-08 | Harman Becker Automotive Systems GmbH | Background noise estimation |
CN101968957B (zh) * | 2010-10-28 | 2012-02-01 | 哈尔滨工程大学 | 一种噪声条件下的语音检测方法 |
CN104103278A (zh) * | 2013-04-02 | 2014-10-15 | 北京千橡网景科技发展有限公司 | 一种实时语音去噪的方法和设备 |
KR20150032390A (ko) * | 2013-09-16 | 2015-03-26 | 삼성전자주식회사 | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 |
JP2016038513A (ja) * | 2014-08-08 | 2016-03-22 | 富士通株式会社 | 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム |
CN107331386B (zh) * | 2017-06-26 | 2020-07-21 | 上海智臻智能网络科技股份有限公司 | 音频信号的端点检测方法、装置、处理系统及计算机设备 |
CN107833579B (zh) * | 2017-10-30 | 2021-06-11 | 广州酷狗计算机科技有限公司 | 噪声消除方法、装置及计算机可读存储介质 |
-
2019
- 2019-01-16 CN CN201910042161.XA patent/CN110021305B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101872616A (zh) * | 2009-04-22 | 2010-10-27 | 索尼株式会社 | 端点检测方法以及使用该方法的系统 |
CN101599274A (zh) * | 2009-06-26 | 2009-12-09 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
CN104966518A (zh) * | 2015-03-02 | 2015-10-07 | 腾讯科技(深圳)有限公司 | 一种音乐文件的音质检测方法及装置 |
CN106098076A (zh) * | 2016-06-06 | 2016-11-09 | 成都启英泰伦科技有限公司 | 一种基于动态噪声估计时频域自适应语音检测方法 |
CN106098077A (zh) * | 2016-07-28 | 2016-11-09 | 浙江诺尔康神经电子科技股份有限公司 | 一种带降噪的人工耳蜗言语处理系统及方法 |
CN109215665A (zh) * | 2018-07-20 | 2019-01-15 | 广东工业大学 | 一种基于3d卷积神经网络的声纹识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110021305A (zh) | 2019-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110021305B (zh) | 一种音频滤波方法、音频滤波装置及可穿戴设备 | |
JP4640461B2 (ja) | 音量調整装置およびプログラム | |
CN101430882B (zh) | 一种抑制风噪声的方法及装置 | |
CN109493877B (zh) | 一种助听装置的语音增强方法和装置 | |
CN112562627B (zh) | 前馈滤波器设计方法、主动降噪方法、系统及电子设备 | |
CN108305637B (zh) | 耳机语音处理方法、终端设备及存储介质 | |
CN105530565B (zh) | 自动声音均衡装置 | |
CN104103278A (zh) | 一种实时语音去噪的方法和设备 | |
JP2002541753A (ja) | 固定フィルタを用いた時間領域スペクトラル減算による信号雑音の低減 | |
CN104681038A (zh) | 音频信号质量检测方法及装置 | |
CN104637489A (zh) | 声音信号处理的方法和装置 | |
CN113286214A (zh) | 耳机信号处理方法、装置和耳机 | |
CN113593612B (zh) | 语音信号处理方法、设备、介质及计算机程序产品 | |
JP2014513320A (ja) | オーディオ信号におけるドミナント周波数を減衰する方法及び装置 | |
JP2004341339A (ja) | 雑音抑圧装置 | |
CN106797517B (zh) | 用于净化音频信号的多耳mmse分析技术 | |
EP2230664B1 (en) | Method and apparatus for attenuating noise in an input signal | |
CN112312258B (zh) | 一种具有听力防护及听力补偿的智能耳机 | |
CN116884429A (zh) | 一种基于信号增强的音频处理方法 | |
CN101625870B (zh) | Ans方法和装置、提高监控系统音频质量的方法和系统 | |
EP3456067B1 (en) | Noise detection and noise reduction | |
KR101173980B1 (ko) | 음성통신 기반 잡음 제거 시스템 및 그 방법 | |
CN116528099A (zh) | 音频信号处理方法及装置、耳机设备、存储介质 | |
JPH08223677A (ja) | 送話器 | |
CN116782084A (zh) | 音频信号处理方法及装置、耳机、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |