CN105679313A - 一种音频识别报警系统及方法 - Google Patents
一种音频识别报警系统及方法 Download PDFInfo
- Publication number
- CN105679313A CN105679313A CN201610237587.7A CN201610237587A CN105679313A CN 105679313 A CN105679313 A CN 105679313A CN 201610237587 A CN201610237587 A CN 201610237587A CN 105679313 A CN105679313 A CN 105679313A
- Authority
- CN
- China
- Prior art keywords
- data
- audio
- voice
- print database
- voice print
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 230000001755 vocal effect Effects 0.000 claims abstract description 23
- 238000006243 chemical reaction Methods 0.000 claims abstract description 20
- 238000001514 detection method Methods 0.000 claims abstract description 19
- 238000004458 analytical method Methods 0.000 claims abstract description 15
- 239000000284 extract Substances 0.000 claims abstract description 11
- 206010039740 Screaming Diseases 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 16
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000004088 simulation Methods 0.000 claims description 4
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000007613 environmental effect Effects 0.000 abstract description 3
- 238000012360 testing method Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 206010008190 Cerebrovascular accident Diseases 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Alarm Systems (AREA)
Abstract
本发明涉及一种音频识别报警系统及方法,包括:采集模块采集音频数据;第一音频匹配模块对音频数据依次进行模数转换、初次特征选取和分析,生成第一声纹数据,将第一声纹数据与设定声纹数据通过一级匹配模型进行初次匹配,提取初次匹配成功的音频数据;第二音频匹配模块对初次匹配成功的音频数据进行二次特征选取和分析,生成第二声纹数据,将第二成声纹数据与设定声纹数据通过二级匹配模型进行二次匹配,匹配成功则生成报警数据;报警模块根据报警数据进行报警。相对现有技术,本发明能采集检测出环境音中异常的尖叫、惨叫声,尖叫、惨叫声检测精度高,并能进行报警。
Description
技术领域
本发明涉及安防技术领域,特别涉及一种音频识别报警系统及方法。
背景技术
生活环境中在一些偶发的事件中(如抢劫等),人受到惊吓瞬间,由于事件的突发性及受到惊吓,往往会手足无措,但出于本能往往会条件性的尖叫呼喊声,而本发明技术应用音频声纹检测技术及时的拾取加以识别,并输出信号来对事件进行及时的处理。
发明内容
本发明所要解决的技术问题是提供一种能采集检测出环境音中异常的尖叫、惨叫声,尖叫、惨叫声检测精度高,并能进行报警的音频识别报警系统及方法。
本发明解决上述技术问题的技术方案如下:一种音频识别报警系统,包括:
采集模块,用于采集音频数据;
第一音频匹配模块,用于对音频数据依次进行模数转换、初次特征选取和分析,生成第一声纹数据,将第一声纹数据与设定声纹数据通过一级匹配模型进行初次匹配,提取初次匹配成功的音频数据;
第二音频匹配模块,用于对初次匹配成功的音频数据进行二次特征选取和分析,生成第二声纹数据,将第二成声纹数据与设定声纹数据通过二级匹配模型进行二次匹配,匹配成功则生成报警数据;
报警模块,用于根据报警数据进行报警。
本发明的有益效果是:第一音频匹配模块对音频数据进行初步的匹配,将不匹配的音频数据进行过滤掉,匹配的音频数据传送至第二音频匹配模块进行二次匹配,匹配成功后通过报警模块进行报警;通过两次音频数据匹配,能有效提升声音检测的精准度;再者通过采集模块、第一音频匹配模块、第二音频匹配模块和报警模块的协调运作,能采集检测出环境音中异常的尖叫、惨叫声,并能进行报警。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,还包括黑白名单训练模块,所述黑白名单训练模块用于采集第二声纹数据,对第二声纹数据进行筛选和分析,将符合尖叫音频标准的第二声纹数据录入白名单,将不符合尖叫音频标准的第二声纹数据录入黑名单,并将白名单内的第二声纹数据输入所述第二音频匹配模块内作为设定声纹数据。
采用上述进一步方案的有益效果是:黑白名单训练模块能有效录入音频数据,并进行筛选分析,并将筛选出的音频数据作为设定声纹数据,第二音频匹配模块根据设定声纹数据进行匹配,能有效提高数据处理的精确度,从而实现精准识别尖叫求救声,进行报警。
进一步,所述第一音频匹配模块包括模数转换单元、第一声纹数据单元和第一数据匹配单元,所述模数转换单元将音频模拟数据转换成音频数字数据;所述第一声纹数据单元用于将模数转换后的音频数据进行初次特征选取和分析,生成第一声纹数据;第一数据匹配单元用于将第一声纹数据与尖叫声纹数据通过一级匹配模型进行初次匹配,提取初次匹配成功的音频数据。
采用上述进一步方案的有益效果是:通过模数转换单元、第一声纹数据单元和第一数据匹配单元的协调运作,能有效实现对采集的音频数据进行一次匹配过滤,提升识别尖叫求救声的精准度。
进一步,所述第二音频匹配模块包括数据接收单元、第二声纹数据单元、第二数据匹配单元和数据返回单元,所述数据接收单元用于采集初次匹配成功的音频信号;所述第二声纹数据单元用于将初次匹配成功的音频数据进行二次特征选取和分析,生成第二声纹数据;所述第二数据匹配单元用于将第二成声纹数据与尖叫声纹数据通过二级匹配模型进行二次匹配,当二次匹配成功时,生成警报信号;所述数据返回单元用于将报警数据通过所述第一音频匹配模块传输至报警模块。
采用上述进一步方案的有益效果是:通过数据接收单元、第二声纹数据单元、第二数据匹配单元和数据返回单元的协调运作,能有效实现对音频数据的二次检测识别,提高对尖叫声的精准识别,提升报警的准确度。
进一步,所述一级匹配模型和二级匹配模型均包括高斯混合模型,高斯混合模型具体为:
式中,为GMM模型的参数集;o为K维的声学特征矢量;i为隐状态号,也就是高斯分量的序号,M阶GMM就有M个隐状态;c为第f个分量的混合权值,其值对应为隐状态i的先验概率。
采用上述进一步方案的有益效果是:高斯混合模型能有效对音频信号进行数据处理,便于音频数据的匹配识别,提升匹配精度。
进一步,所述第一音频匹配模块与所述第二音频匹配模块通过网络进行数据传输。
采用上述进一步方案的有益效果是:可以实现第一音频匹配模块和第二音频匹配模块进行远距离传输,扩大了适用范围。
进一步,还包括声音强度检测模块,所述声音强度检测模块用于对采集音频数据进行声音强度检测,当声音强度超过设定标准,将采集音频数据传输至第一音频匹配模块。
采用上述进一步方案的有益效果是:声音强度检测模块能对声音小的一些杂音进行过滤,消除干扰,保证音频资料两次匹配的精准度。
本发明解决上述技术问题的另一技术方案如下:一种尖叫音频识别方法,包括
采集音频数据,第一音频匹配模块对音频数据依次进行模数转换、初次特征选取和分析,生成第一声纹数据,将第一声纹数据与设定声纹数据通过一级匹配模型进行初次匹配,提取初次匹配成功的音频数据;
对初次匹配成功的音频数据进行二次特征选取和分析,生成第二声纹数据,将第二成声纹数据与设定声纹数据通过二级匹配模型进行二次匹配,匹配成功则生成报警数据,根据报警数据进行报警。
本发明的有益效果是:第一音频匹配模块对音频数据进行初步的匹配,将不匹配的音频数据进行过滤掉,匹配的音频数据传送至第二音频匹配模块进行二次匹配,匹配成功后通过报警模块进行报警;通过两次音频数据匹配,能有效提升声音检测的精准度;再者通过采集模块、第一音频匹配模块、第二音频匹配模块和报警模块的协调运作,能采集检测出环境音中异常的尖叫、惨叫声,并能进行报警。
附图说明
图1为本发明一种音频识别报警系统的模块框图;
图2为本发明一种音频识别报警系统的流程图。
附图中,各标号所代表的部件列表如下:
1、采集模块;
2、第一音频匹配模块,21、模数转换单元,22、第一声纹数据单元,23、第一数据匹配单元;
3、第二音频匹配模块,31、数据接收单元,32、第二声纹数据单元,33、第二数据匹配单元,34、数据返回单元;
4、报警模块,5、黑白名单训练模块,6、声音强度检测模块。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种音频识别报警系统,包括:
采集模块1,用于采集音频数据;
第一音频匹配模块2,用于对音频数据依次进行模数转换、初次特征选取和分析,生成第一声纹数据,将第一声纹数据与设定声纹数据通过一级匹配模型进行初次匹配,提取初次匹配成功的音频数据;
第二音频匹配模块3,用于对初次匹配成功的音频数据进行二次特征选取和分析,生成第二声纹数据,将第二成声纹数据与设定声纹数据通过二级匹配模型进行二次匹配,匹配成功则生成报警数据;
报警模块4,用于根据报警数据进行报警。
优选的,还包括黑白名单训练模块5,所述黑白名单训练模块5用于采集第二声纹数据,对第二声纹数据进行筛选和分析,将符合尖叫音频标准的第二声纹数据录入白名单,将不符合尖叫音频标准的第二声纹数据录入黑名单,并将白名单内的第二声纹数据输入所述第二音频匹配模块3内作为设定声纹数据;黑白名单训练模块5能有效录入音频数据,并进行筛选分析,并将筛选出的音频数据作为设定声纹数据,第二音频匹配模块3根据设定声纹数据进行匹配,能有效提高数据处理的精确度,从而实现精准识别尖叫求救声,进行报警。
优选的,所述第一音频匹配模块2包括模数转换单元21、第一声纹数据单元22和第一数据匹配单元23,所述模数转换单元21将音频模拟数据转换成音频数字数据;所述第一声纹数据单元22用于将模数转换后的音频数据进行初次特征选取和分析,生成第一声纹数据;第一数据匹配单元23用于将第一声纹数据与尖叫声纹数据通过一级匹配模型进行初次匹配,提取初次匹配成功的音频数据;通过模数转换单元21、第一声纹数据单元22和第一数据匹配单元23的协调运作,能有效实现对采集的音频数据进行一次匹配过滤,提升识别尖叫、惨叫求救声的精准度。
优选的,所述第二音频匹配模块3包括数据接收单元31、第二声纹数据单元32、第二数据匹配单元33和数据返回单元34,所述数据接收单元31用于采集初次匹配成功的音频信号;所述第二声纹数据单元32用于将初次匹配成功的音频数据进行二次特征选取和分析,生成第二声纹数据;所述第二数据匹配单元33用于将第二成声纹数据与尖叫声纹数据通过二级匹配模型进行二次匹配,当二次匹配成功时,生成警报信号;所述数据返回单元34用于将报警数据通过所述第一音频匹配模块2传输至报警模块4;通过数据接收单元31、第二声纹数据单元32、第二数据匹配单元33和数据返回单元34的协调运作,能有效实现对音频数据的二次检测识别,提高对尖叫声的精准识别,提升报警的准确度。
优选的,所述一级匹配模型和二级匹配模型均包括高斯混合模型,高斯混合模型具体为:
式中,为GMM模型的参数集;o为K维的声学特征矢量;i为隐状态号,也就是高斯分量的序号,M阶GMM就有M个隐状态;c为第f个分量的混合权值,其值对应为隐状态i的先验概率。
式中的)为高斯混合分量,是的简写形式,对应隐状态i的观察概率密度函数,一般采用K维单高斯分布函数,如下式所示
式中,为均值矢量:∑i为协方差矩阵,i=1,2,…,M。因此该公式可以理解为,M阶GMM是用M个单高斯分布的线性组合来描述,即GMM参数2可由各均值矢量、协方差矩阵及混合分量的权值组成,表示
如下三元组的形式
(1)
式中,协方差矩阵∑i.可以取普通矩阵,也可以取对角阵。由于取对角阵时算法简单,并且性能也很好,所以常取对角阵,即
(2)
式中为GMM第i分量所对应的特征矢量的第k维分量的方差。将式(2)代入式(1)得
将GMM应用于音频识别的直观解释是:每个音频的音频声学特征空间可以用一些声学的特征类来表示,这些声学特征类代表一些广义上的音素,并且能够反映音频的声道形状。每个声学特征类的频谱可以用一个高斯密度函数来描述,即第i个声学特征类的频谱,可以用混合高斯密度函数的第i个高斯分量的均值和方差来表示。但是所有的测试音频和训练音频都没有事先作出标注,即不知道第f个声学特征类能生成哪些特征矢量,也不知道提取的特征矢量分量属于哪些声学特征类中。从这些隐性的声学类里提取的特征矢量(假定特征矢量相互独立)的密度函数就是一个混合高斯密度函数。
不考虑GMM与声音分类的联系,可以对GMM有另一种解释,它是概率密度函数的一种函数表达式。GMM作为高斯概率密度函数的一个线性组合,只要有足够多数目的混合分量,就可以逼近任意一种密度函数。音频特征通常有着平滑的概率密度函数,因此有限数目的高斯密度函数就足以对音频特征的密度函数形成平滑逼近。通过适当地选择GMM的均值、协方差和概率权重,就可以完成对一个概率密度函数的建模。
为音频建立GMM模型,实际上就是通过训练,估计GMM模型的参数,常用的方法是最大似然的估计方法。最大似然估计的目的是在给定训练矢量集的情况下,寻找合适的模型参数,使GMM模型的似然函数值最大。训练时,首先要对模型训练参数进行初始化,一种方法是从训练数据中任取M组数据与M个高斯分量相对应,每组含有相同矢量个数,求其均值和方差作为初始均值和方差,并让各分量具有相同的混合权值;另一种方法是采用K均值。
聚类算法将训练数据聚成M类,然后每一类对应一高斯分量,以每类均值和方差作为对应高斯分量的初始均值和方差,混合权值等于类内数据的数量与数据总量的比值。混合数M的选择与具体的应用有关,一般应由实验来确定。
在基于GMM的尖叫识别系统中;一般说来,与测试音频同类的目标模型得分高的帧要多于其它非目标模型。但通过观察发现由于音频的各项特征的长时间变动或者噪声等干扰的影响,某些测试帧对于非目标模型的得分反而大于目标模型的得分,称为破坏帧,且个别破坏帧对于非目标模型的得分还可能极高,而对于目标模型的得分极低。无形之中,非目标模型的得分被拉近甚至可能超过目标模型引起误判,从而设想将每帧对各模型的得分进行加权,加权后的结果再由贝叶斯定理对加权结果得分进行判定。
实验音频数据取自普通实验室环境及模拟应用环境。录取多种音频数据。作为基础训练用。录音采样频率为8KHz。量化精度为16bit。音频经过预处理之后,取帧宽为256点(39ms),帧移为128点(19.5ms),分两级建模,一级提取11阶的MFCC及其一阶倒谱及1阶的短时过零率作为特征参数矢量,GMM混合数取13;二级提取11阶的MFCC及其一阶倒谱及10阶的帧短时谱及1阶的短时过零率作为特征参数矢量。GMM混合数取38。建模的时间长度为2s。一级匹配模型用来快速的对数据进行分离提高分析速度,二级匹配模型则对数据进行更细化的分析,加强数据分析的准确性。
优选的,所述第一音频匹配模块2与所述第二音频匹配模块3通过网络进行数据传输;可以实现第一音频匹配模块2和第二音频匹配模块3进行远距离传输,扩大了适用范围。
优选的,还包括声音强度检测模块6,所述声音强度检测模块6用于对采集音频数据进行声音强度检测,当声音强度超过设定标准,将采集音频数据传输至第一音频匹配模块2;声音强度检测模块6能对声音小的一些杂音进行过滤,消除干扰,保证音频资料两次匹配的精准度。
如图2所示,一种尖叫音频识别方法,包括
采集音频数据,第一音频匹配模块对音频数据依次进行模数转换、初次特征选取和分析,生成第一声纹数据,将第一声纹数据与设定声纹数据通过一级匹配模型进行初次匹配,提取初次匹配成功的音频数据;
对初次匹配成功的音频数据进行二次特征选取和分析,生成第二声纹数据,将第二成声纹数据与设定声纹数据通过二级匹配模型进行二次匹配,匹配成功则生成报警数据,根据报警数据进行报警。
实施本技术方案,环境音频由采集模块1实时采集,经过第一音频匹配模块2初步的模数转换及声纹匹配判断,分离出疑似尖叫呼喊声数据,对于采集到的尖叫呼喊声通过网络传输到PC机的第二音频匹配模块3进行二次判断,PC机收到网络数据后,将进一步的对数据进行细化分析并将结果返回给第一音频匹配模块2;这里第二音频匹配模块3通过多层分级数学模型数据匹配分析,有效的降低了数据的误判率,同时经过黑白名单的建立,经过持续的数据筛选让数据处理不断的得到优化改善,让应用效果更加的理想,更加的符合实质环境下的应用。
在上述实施例中,所述的尖叫是一个广义的概念,但凡是人在紧急、惊恐、疼痛的状况下发出的足以触发报警的尖叫声、惨叫声、危急状况下的呼喊声都称之为尖叫。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种音频识别报警系统,其特征在于,包括:
采集模块(1),用于采集音频数据;
第一音频匹配模块(2),用于对音频数据依次进行模数转换、初次特征选取和分析,生成第一声纹数据,将第一声纹数据与设定声纹数据通过一级匹配模型进行初次匹配,提取初次匹配成功的音频数据;
第二音频匹配模块(3),用于对初次匹配成功的音频数据进行二次特征选取和分析,生成第二声纹数据,将第二成声纹数据与设定声纹数据通过二级匹配模型进行二次匹配,匹配成功则生成报警数据;
报警模块(4),用于根据报警数据进行报警。
2.根据权利要求1所述一种音频识别报警系统,其特征在于,还包括黑白名单训练模块(5),所述黑白名单训练模块(5)用于采集第二声纹数据,对第二声纹数据进行筛选和分析,将符合尖叫音频标准的第二声纹数据录入白名单,将不符合尖叫音频标准的第二声纹数据录入黑名单,并将白名单内的第二声纹数据输入所述第二音频匹配模块(3)内作为设定声纹数据。
3.根据权利要求1所述一种音频识别报警系统,其特征在于,所述第一音频匹配模块(2)包括模数转换单元(21)、第一声纹数据单元(22)和第一数据匹配单元(23),所述模数转换单元(21)将音频模拟数据转换成音频数字数据;所述第一声纹数据单元(22)用于将模数转换后的音频数据进行初次特征选取和分析,生成第一声纹数据;第一数据匹配单元(23)用于将第一声纹数据与尖叫声纹数据通过一级匹配模型进行初次匹配,提取初次匹配成功的音频数据。
4.根据权利要求3所述一种音频识别报警系统,其特征在于,所述第二音频匹配模块(3)包括数据接收单元(31)、第二声纹数据单元(32)、第二数据匹配单元(33)和数据返回单元(34),所述数据接收单元(31)用于采集初次匹配成功的音频信号;所述第二声纹数据单元(32)用于将初次匹配成功的音频数据进行二次特征选取和分析,生成第二声纹数据;所述第二数据匹配单元(33)用于将第二成声纹数据与尖叫声纹数据通过二级匹配模型进行二次匹配,当二次匹配成功时,生成警报信号;所述数据返回单元(34)用于将报警数据通过所述第一音频匹配模块(2)传输至报警模块(4)。
5.根据权利要求1所述一种音频识别报警系统,其特征在于,所述一级匹配模型和二级匹配模型均包括高斯混合模型,高斯混合模型具体为:
式中,为GMM模型的参数集;o为K维的声学特征矢量;i为隐状态号,也就是高斯分量的序号,M阶GMM就有M个隐状态;c为第f个分量的混合权值,其值对应为隐状态i的先验概率。
6.根据权利要求1所述一种音频识别报警系统,其特征在于,所述第一音频匹配模块(2)与所述第二音频匹配模块(3)通过网络进行数据传输。
7.根据权利要求1至6任一项所述一种音频识别报警系统,其特征在于,还包括声音强度检测模块(6),所述声音强度检测模块(6)用于对采集音频数据进行声音强度检测,当声音强度超过设定标准,将采集音频数据传输至第一音频匹配模块(2)。
8.一种尖叫音频识别方法,其特征在于:包括
采集音频数据,第一音频匹配模块对音频数据依次进行模数转换、初次特征选取和分析,生成第一声纹数据,将第一声纹数据与设定声纹数据通过一级匹配模型进行初次匹配,提取初次匹配成功的音频数据;
对初次匹配成功的音频数据进行二次特征选取和分析,生成第二声纹数据,将第二成声纹数据与设定声纹数据通过二级匹配模型进行二次匹配,匹配成功则生成报警数据,根据报警数据进行报警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610237587.7A CN105679313A (zh) | 2016-04-15 | 2016-04-15 | 一种音频识别报警系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610237587.7A CN105679313A (zh) | 2016-04-15 | 2016-04-15 | 一种音频识别报警系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105679313A true CN105679313A (zh) | 2016-06-15 |
Family
ID=56309969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610237587.7A Pending CN105679313A (zh) | 2016-04-15 | 2016-04-15 | 一种音频识别报警系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105679313A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107742517A (zh) * | 2017-10-10 | 2018-02-27 | 广东中星电子有限公司 | 一种对异常声音的检测方法及装置 |
CN108010270A (zh) * | 2016-10-31 | 2018-05-08 | 芜湖美的厨卫电器制造有限公司 | 浴室内的跌倒提示方法、浴室系统、智能浴室镜及服务器 |
CN108449580A (zh) * | 2018-04-13 | 2018-08-24 | 任阿毛 | 基于音频成分分析的现场监控系统 |
CN108460938A (zh) * | 2018-04-28 | 2018-08-28 | 广东电网有限责任公司 | 基于监控信号识别提醒功能的震动手环 |
CN108694958A (zh) * | 2018-04-26 | 2018-10-23 | 广州国音科技有限公司 | 一种安防报警方法及装置 |
CN108766439A (zh) * | 2018-04-27 | 2018-11-06 | 广州国音科技有限公司 | 一种基于声纹识别的监控方法及装置 |
CN108983684A (zh) * | 2017-05-31 | 2018-12-11 | 贺州思通信息技术有限公司 | 一种基于声音识别的车床安全控制系统 |
WO2018228280A1 (zh) * | 2017-06-12 | 2018-12-20 | 杭州海康威视数字技术股份有限公司 | 一种通知信息的输出方法、服务器及监控系统 |
CN110675878A (zh) * | 2019-09-23 | 2020-01-10 | 金瓜子科技发展(北京)有限公司 | 一种车商识别的方法、装置、存储介质及电子设备 |
CN111275909A (zh) * | 2018-12-04 | 2020-06-12 | 阿里巴巴集团控股有限公司 | 一种安防预警方法及装置 |
CN111784947A (zh) * | 2020-07-10 | 2020-10-16 | 上海茂声智能科技有限公司 | 一种基于图像与声纹的主动预警方法、系统和设备 |
CN111933109A (zh) * | 2020-07-24 | 2020-11-13 | 南京烽火星空通信发展有限公司 | 一种音频监测方法及系统 |
CN112312084A (zh) * | 2020-10-16 | 2021-02-02 | 李小丽 | 一种智能影像监控系统 |
CN113012684A (zh) * | 2021-03-04 | 2021-06-22 | 电子科技大学 | 一种基于语音分割的合成语音检测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101067930A (zh) * | 2007-06-07 | 2007-11-07 | 深圳先进技术研究院 | 一种智能音频辨识系统及辨识方法 |
CN102148032A (zh) * | 2010-12-03 | 2011-08-10 | 北京声迅电子有限公司 | 应用于atm机的异常声音检测方法及系统 |
CN102522082A (zh) * | 2011-12-27 | 2012-06-27 | 重庆大学 | 一种公共场所异常声音的识别与定位方法 |
CN102881099A (zh) * | 2012-09-25 | 2013-01-16 | 北京声迅电子股份有限公司 | 应用于atm机的防盗报警方法及装置 |
CN103021421A (zh) * | 2012-12-24 | 2013-04-03 | 天津大学 | 用于枪声的多级筛选检测识别方法 |
CN103971702A (zh) * | 2013-08-01 | 2014-08-06 | 哈尔滨理工大学 | 声音监控方法、装置及系统 |
CN105427533A (zh) * | 2015-12-24 | 2016-03-23 | 华南理工大学 | 一种识别儿童哭叫声的可穿戴监护器及方法 |
CN105452822A (zh) * | 2013-06-05 | 2016-03-30 | 三星电子株式会社 | 声事件检测装置和操作其的方法 |
CN206021508U (zh) * | 2016-08-31 | 2017-03-15 | 福建新恒通智能科技有限公司 | 一种音频识别报警系统 |
-
2016
- 2016-04-15 CN CN201610237587.7A patent/CN105679313A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101067930A (zh) * | 2007-06-07 | 2007-11-07 | 深圳先进技术研究院 | 一种智能音频辨识系统及辨识方法 |
CN102148032A (zh) * | 2010-12-03 | 2011-08-10 | 北京声迅电子有限公司 | 应用于atm机的异常声音检测方法及系统 |
CN102522082A (zh) * | 2011-12-27 | 2012-06-27 | 重庆大学 | 一种公共场所异常声音的识别与定位方法 |
CN102881099A (zh) * | 2012-09-25 | 2013-01-16 | 北京声迅电子股份有限公司 | 应用于atm机的防盗报警方法及装置 |
CN103021421A (zh) * | 2012-12-24 | 2013-04-03 | 天津大学 | 用于枪声的多级筛选检测识别方法 |
CN105452822A (zh) * | 2013-06-05 | 2016-03-30 | 三星电子株式会社 | 声事件检测装置和操作其的方法 |
CN103971702A (zh) * | 2013-08-01 | 2014-08-06 | 哈尔滨理工大学 | 声音监控方法、装置及系统 |
CN105427533A (zh) * | 2015-12-24 | 2016-03-23 | 华南理工大学 | 一种识别儿童哭叫声的可穿戴监护器及方法 |
CN206021508U (zh) * | 2016-08-31 | 2017-03-15 | 福建新恒通智能科技有限公司 | 一种音频识别报警系统 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108010270A (zh) * | 2016-10-31 | 2018-05-08 | 芜湖美的厨卫电器制造有限公司 | 浴室内的跌倒提示方法、浴室系统、智能浴室镜及服务器 |
CN108983684A (zh) * | 2017-05-31 | 2018-12-11 | 贺州思通信息技术有限公司 | 一种基于声音识别的车床安全控制系统 |
WO2018228280A1 (zh) * | 2017-06-12 | 2018-12-20 | 杭州海康威视数字技术股份有限公司 | 一种通知信息的输出方法、服务器及监控系统 |
US11275628B2 (en) | 2017-06-12 | 2022-03-15 | Hangzhou Hikvision Digital Technology Co., Ltd. | Notification information output method, server and monitoring system |
CN107742517A (zh) * | 2017-10-10 | 2018-02-27 | 广东中星电子有限公司 | 一种对异常声音的检测方法及装置 |
CN108449580A (zh) * | 2018-04-13 | 2018-08-24 | 任阿毛 | 基于音频成分分析的现场监控系统 |
CN108694958A (zh) * | 2018-04-26 | 2018-10-23 | 广州国音科技有限公司 | 一种安防报警方法及装置 |
CN108694958B (zh) * | 2018-04-26 | 2020-11-13 | 广州国音科技有限公司 | 一种安防报警方法及装置 |
CN108766439A (zh) * | 2018-04-27 | 2018-11-06 | 广州国音科技有限公司 | 一种基于声纹识别的监控方法及装置 |
CN108460938A (zh) * | 2018-04-28 | 2018-08-28 | 广东电网有限责任公司 | 基于监控信号识别提醒功能的震动手环 |
CN111275909B (zh) * | 2018-12-04 | 2021-12-28 | 阿里巴巴集团控股有限公司 | 一种安防预警方法及装置 |
CN111275909A (zh) * | 2018-12-04 | 2020-06-12 | 阿里巴巴集团控股有限公司 | 一种安防预警方法及装置 |
CN110675878A (zh) * | 2019-09-23 | 2020-01-10 | 金瓜子科技发展(北京)有限公司 | 一种车商识别的方法、装置、存储介质及电子设备 |
CN111784947A (zh) * | 2020-07-10 | 2020-10-16 | 上海茂声智能科技有限公司 | 一种基于图像与声纹的主动预警方法、系统和设备 |
CN111933109A (zh) * | 2020-07-24 | 2020-11-13 | 南京烽火星空通信发展有限公司 | 一种音频监测方法及系统 |
CN112312084A (zh) * | 2020-10-16 | 2021-02-02 | 李小丽 | 一种智能影像监控系统 |
CN113012684A (zh) * | 2021-03-04 | 2021-06-22 | 电子科技大学 | 一种基于语音分割的合成语音检测方法 |
CN113012684B (zh) * | 2021-03-04 | 2022-05-31 | 电子科技大学 | 一种基于语音分割的合成语音检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105679313A (zh) | 一种音频识别报警系统及方法 | |
CN111181939B (zh) | 一种基于集成学习的网络入侵检测方法及装置 | |
CN110189769B (zh) | 基于多个卷积神经网络模型结合的异常声音检测方法 | |
CN107290741B (zh) | 基于加权联合距离时频变换的室内人体姿态识别方法 | |
CN110120218B (zh) | 基于gmm-hmm的高速公路大型车辆识别方法 | |
CN102163427B (zh) | 一种基于环境模型的音频异常事件检测方法 | |
CN110047506B (zh) | 一种基于卷积神经网络和多核学习svm的关键音频检测方法 | |
CN110133610A (zh) | 基于时变距离-多普勒图的超宽带雷达动作识别方法 | |
CN106847293A (zh) | 设施养殖羊应激行为的声信号监测方法 | |
CN110349597B (zh) | 一种语音检测方法及装置 | |
CN109347872A (zh) | 一种基于模糊度和集成学习的网络入侵检测方法 | |
CN109473119B (zh) | 一种声学目标事件监控方法 | |
CN106250848A (zh) | 一种基于多模型融合的单类水声目标识别方法 | |
CN108806694A (zh) | 一种基于声音识别的教学考勤方法 | |
Himawan et al. | Deep Learning Techniques for Koala Activity Detection. | |
CN114220458B (zh) | 基于阵列水听器的声音识别方法和装置 | |
CN113707175B (zh) | 基于特征分解分类器与自适应后处理的声学事件检测系统 | |
CN108831506A (zh) | 基于gmm-bic的数字音频篡改点检测方法及系统 | |
Nakajima et al. | DNN-based environmental sound recognition with real-recorded and artificially-mixed training data | |
CN115240651A (zh) | 一种基于特征融合的陆空通话说话人角色识别方法及装置 | |
CN113640768A (zh) | 一种基于小波变换的低分辨雷达目标识别方法 | |
CN112528774A (zh) | 一种复杂电磁环境下未知雷达信号智能分选系统及方法 | |
Smailov et al. | A novel deep CNN-RNN approach for real-time impulsive sound detection to detect dangerous events | |
Xiao et al. | AMResNet: An automatic recognition model of bird sounds in real environment | |
Ling | An acoustic model for English speech recognition based on deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160615 |