CN203552694U - 基于mfcc的电台识别装置 - Google Patents

基于mfcc的电台识别装置 Download PDF

Info

Publication number
CN203552694U
CN203552694U CN201320621087.5U CN201320621087U CN203552694U CN 203552694 U CN203552694 U CN 203552694U CN 201320621087 U CN201320621087 U CN 201320621087U CN 203552694 U CN203552694 U CN 203552694U
Authority
CN
China
Prior art keywords
identification device
mfcc
device based
radio transmitter
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201320621087.5U
Other languages
English (en)
Inventor
王文秀
周云霞
周靖凯
曹冬建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Institute of Technology
Original Assignee
Nanjing Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Institute of Technology filed Critical Nanjing Institute of Technology
Priority to CN201320621087.5U priority Critical patent/CN203552694U/zh
Application granted granted Critical
Publication of CN203552694U publication Critical patent/CN203552694U/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Transmitters (AREA)

Abstract

本实用新型提供一种基于MFCC的电台识别装置,依次包括预处理模块、DFT/FFT分析器、MEL频率滤波器、Log对数能量处理模块和DCT求倒谱模块,所述电台识别装置还具有包含BP神经网络语音模型库的BP神经网络训练系统,将通过DCT求倒谱模块处理所获得的频谱与BP神经网络语音模型库中的语音特征参数进行比较。由于语音比其他形式的交互方具有更多的优势,因此用这项技术作为背景音为信息安全也提供了稳定的保障。

Description

基于MFCC的电台识别装置
技术领域
本实用新型属于音频处理领域,具体来说涉及一种基于MFCC的电台识别装置。
背景技术
MFCC语音识别实际上是一种语音参数比对过程。
1952年,成功实现少数识别;1960年,成功研究第一个计算机语音识别系统。经过几十年的发展,语音识别技术的应用及产品化方面出现很大的进展,效果较好。目前,人们仍然在对DARPA计划进行研究。
在目前,BP(Back Propagation)神经网络是应用最广泛的神经网络模型之一。BP网络能学习和存储大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。
MATLAB广受用户欢迎,除内部函数外,所有MATLAB工具包和主包文件都是可读可修改的,用户通过对源程序的修改或加入自己编写程序就可以构造新的专用工具包。到了20世纪90年代,MATLAB已经是国际的标准计算软件。
使用这几项技术实现电台识别功能,可以为电台识别结果带来很大的保障。
实用新型内容
本实用新型通过实现以上所述的三种技术的巧妙融合使用,实现语音的清晰识别,进而实现电台识别功能。本实用新型采用如下技术方案:
一种基于MFCC的电台识别装置,依次包括预处理模块、DFT/FFT分析器、MEL频率滤波器、Log对数能量处理模块和DCT求倒谱模块,其特征在于,所述电台识别装置还具有BP神经网络训练系统,BP神经网络训练系统具有BP神经网络语音模型库,通过DCT求倒谱模块处理所获得的频谱与BP神经网络训练系统中BP神经网络语音模型库中的语音特征参数进行比较。
所述比较可以采用多种方式来进行,但优选地,比较是采用MATLAB仿真装置来进行。
进一步,BP神经网络训练系统还具有量化与采样装置。
优选地,预处理模块包括预加重电路、分帧和加窗系统。
有益效果:
本实用新型采用了基于MFCC+BP神经网络的识别方法,开始先使用同一录音设备对不同电台(包括中央和地方)进行录音,准备素材及格式转换后使用MATLAB读取所录的音频文件,再对每个文件进行MFCC特征参数提取,接着训练有代表性的音频文件,建立BP神经网络录音设备模型库,最后选取所录的语音与BP神经网络模型库做对比,最终判定测试语音来自哪个电台。由于语音比其他形式的交互方法具有更多的优势,因此采用这项技术作为背景音为信息安全也提供了稳定的保障。
附图说明
图1为基于MFCC的电台识别装置的结构示意图。
具体实施方式
下面结合附图对本实用新型的技术方案进行详细说明:
如图1所示,本实用新型的基于MFCC的电台识别装置,包括预处理模块、DFT/FFT分析器、MEL频率滤波器、Log对数能量处理模块和DCT求倒谱模块,另外还具有BP神经网络训练系统,在BP神经网络训练系统中通过量化与采样建立BP神经网络语音模型库,将在先步骤中进行MFCC特征参数提取获得的参数与BP神经网络训练系统中BP神经网络语音模型库中的语音特征参数进行比较,获得判断。其中预处理模块包括预加重电路、分帧和加窗系统。在比较时,主要采用MATLAB仿真来判断方案的正确性,从而获得准确有效的结果。
综上所述,相比于现有技术,本实用新型的优点在于在已有技术基础上对用途的拓展:每个电台其独特的声道特性和频率特点使其信息具有区别于其电台的特征,这是电台识别的基本依据。因为电台信号的声音可调至很高,人声可嵌入,不易被听取,这样一来,对窃听等形式的信息获取干扰较大,信息保密性较好,因此,电台语音信号分析将是非常有意义的事情。
上面结合附图对本实用新型的实施方式作了详细的说明,但是本实用新型不限于上述实施方式,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本实用新型宗旨的前提下做出各种变化。

Claims (4)

1. 一种基于MFCC的电台识别装置,依次包括预处理模块、DFT/FFT分析器、MEL频率滤波器、Log对数能量处理模块和DCT求倒谱模块,其特征在于,所述电台识别装置还具有BP神经网络训练系统,BP神经网络训练系统具有BP神经网络语音模型库,将通过DCT求倒谱模块处理所获得的频谱与BP神经网络训练系统中BP神经网络语音模型库中的语音特征参数进行比较。
2. 如权利要求1所述的基于MFCC的电台识别装置,其特征在于,比较是采用MATLAB仿真装置来进行。
3. 如权利要求1或2所述的基于MFCC的电台识别装置,其特征在于,BP神经网络训练系统还具有量化与采样装置。
4. 如权利要求1或2所述的基于MFCC的电台识别装置,其特征在于,预处理模块包括预加重电路、分帧和加窗系统。
CN201320621087.5U 2013-10-10 2013-10-10 基于mfcc的电台识别装置 Expired - Fee Related CN203552694U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201320621087.5U CN203552694U (zh) 2013-10-10 2013-10-10 基于mfcc的电台识别装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201320621087.5U CN203552694U (zh) 2013-10-10 2013-10-10 基于mfcc的电台识别装置

Publications (1)

Publication Number Publication Date
CN203552694U true CN203552694U (zh) 2014-04-16

Family

ID=50470775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201320621087.5U Expired - Fee Related CN203552694U (zh) 2013-10-10 2013-10-10 基于mfcc的电台识别装置

Country Status (1)

Country Link
CN (1) CN203552694U (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108847244A (zh) * 2018-08-22 2018-11-20 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于mfcc和改进bp神经网络的声纹识别方法及系统
CN109979436A (zh) * 2019-04-12 2019-07-05 南京工程学院 一种基于频谱自适应法的bp神经网络语音识别系统及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108847244A (zh) * 2018-08-22 2018-11-20 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于mfcc和改进bp神经网络的声纹识别方法及系统
CN109979436A (zh) * 2019-04-12 2019-07-05 南京工程学院 一种基于频谱自适应法的bp神经网络语音识别系统及方法
CN109979436B (zh) * 2019-04-12 2020-11-13 南京工程学院 一种基于频谱自适应法的bp神经网络语音识别系统及方法

Similar Documents

Publication Publication Date Title
DE102018010463B3 (de) Tragbare Vorrichtung, computerlesbares Speicherungsmedium, Verfahren und Einrichtung für energieeffiziente und leistungsarme verteilte automatische Spracherkennung
US9542938B2 (en) Scene recognition method, device and mobile terminal based on ambient sound
CN102436812B (zh) 会议记录装置及利用该装置对会议进行记录的方法
CN103440862B (zh) 一种语音与音乐合成的方法、装置以及设备
CN103971689B (zh) 一种音频识别方法及装置
CN104916289A (zh) 行车噪声环境下快速声学事件的检测方法
CN103377647B (zh) 一种基于音视频信息的自动音乐记谱方法及系统
CN107393542A (zh) 一种基于双通道神经网络的鸟类物种识别方法
Shah et al. Iot based urban noise monitoring in deep learning using historical reports
CN102881284A (zh) 非特定人语音情感识别方法及系统
CN104992712B (zh) 能识别音乐自动成谱的方法
CN104123930A (zh) 喉音识别方法及装置
CN104538034A (zh) 一种语音识别方法及系统
CN108206027A (zh) 一种音频质量评价方法及系统
CN112102846B (zh) 音频处理方法、装置、电子设备以及存储介质
CN106548786A (zh) 一种音频数据的检测方法及系统
CN203552694U (zh) 基于mfcc的电台识别装置
CN106653020A (zh) 一种基于深度学习的智慧视听设备多业务控制方法及系统
CN105989846A (zh) 一种多通道语音信号同步方法及装置
Zhang et al. Fault diagnosis method based on MFCC fusion and SVM
CN106033671A (zh) 确定声道间时间差参数的方法和装置
CN116825123B (zh) 一种基于音频推送的音质优化方法及系统
Huang et al. FM broadcast monitoring using artificial intelligence
CN202590338U (zh) 一种带有语音功能的手柄
CN108010533A (zh) 音频数据码率的自动识别方法和装置

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140416

Termination date: 20141010

EXPY Termination of patent right or utility model