CN101494049A - 一种用于音频监控系统中的音频特征参数的提取方法 - Google Patents

一种用于音频监控系统中的音频特征参数的提取方法 Download PDF

Info

Publication number
CN101494049A
CN101494049A CNA2009100794471A CN200910079447A CN101494049A CN 101494049 A CN101494049 A CN 101494049A CN A2009100794471 A CNA2009100794471 A CN A2009100794471A CN 200910079447 A CN200910079447 A CN 200910079447A CN 101494049 A CN101494049 A CN 101494049A
Authority
CN
China
Prior art keywords
audio
short
data frame
frequency
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009100794471A
Other languages
English (en)
Other versions
CN101494049B (zh
Inventor
马华东
李祺
黄千
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN2009100794471A priority Critical patent/CN101494049B/zh
Publication of CN101494049A publication Critical patent/CN101494049A/zh
Application granted granted Critical
Publication of CN101494049B publication Critical patent/CN101494049B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种用于音频监控系统中的音频特征参数的提取方法,操作步骤如下:(1)按照设定的短时间的时长对音频采样信号序列进行分帧而将其划分为音频数据帧序列;(2)分别对该音频数据帧序列中的每个音频数据帧实时提取该帧的短时能量、短时过零率和短时信息熵;(3)对音频数据帧序列进行分段而将其划分为音频短段序列;并在上述参数基础上,提取综合每个音频短段内的所有音频数据帧的时域和频域特征、并充分考虑其前后两个时刻之间音频差异的特征参数:音频短段时频差,用于音频监控系统。本发明能克服现有技术缺陷,有效应对各种不同类型的背景噪声,及时发现音频信号中可能出现的异常事件,正确作出判断,为适时采取告警等其它各种安全技术措施奠定基础。

Description

一种用于音频监控系统中的音频特征参数的提取方法
技术领域
本发明涉及一种新的多媒体信息及其提取方法,确切地说,涉及一种用于音频监控系统中的音频特征参数的提取方法,属于多媒体信息的音频监控系统中的音频信号分析及其应用的信息安全技术领域。
背景技术
随着人民群众安全意识的提高,监控系统越来越受到人们的重视,并被广泛地应用于银行、商场、学校、办公大楼、以及家居安全的防范系统中。另外,多媒体技术的不断发展,使得视、音频信息在人们的工作、文体、娱乐和日常生活中起着日益重要的作用。例如,视频监控系统已经广泛应用于当前许多公共场合的安全系统中,该系统通过前端摄像系统对设定的区域进行监控,并将其采集到的视频信号传送到监控中心,由监控中心的服务器自动进行实时分析而发现异常事件,或者由人员监控发现异常事件并立即进行处理。然而,视频监控系统也有很多不足和局限之处。首先,摄像机很容易受到光线照明的影响,在光照等条件发生变化时很容易出现误判;尤其是办公楼熄灯以后,摄像机通常就无法正常工作,而保持正常照明又会造成能源浪费。另外,对于某些特殊事件,如在公共场所发出尖叫或异常声响等,音频信号的检测效果要明显优于视频信号。这是因为在音频监控系统中,人们通常不需要准确判断声音的类别。例如,在办公楼内,不需要取区分枪声和玻璃破碎声,只要能够确定这是在特定场景下不应该发出的异常声音即可。因此,目前在国内外都广泛开展了针对音频异常事件的监控及检测技术的研究。
现在,有些科技人员利用隐马尔科夫模型对语音、乐音等基本音频事件进行建模,并根据最大似然值对输入的音频信号进行分类。然而,在音频监控系统中,人们最关心的是事件的“异常性”,而不是事件的种类。例如,在安静的办公楼内,只要检测到尖叫声或枪声都是异常事件的征兆,而不需要对这两种不同的声响进行区分。
有些研发人员针对不同的应用场景展开探讨和设计。例如,针对办公楼的特定工作环境,对其中的音频能量、过零率等低层音频特征参数进行统计和分析,并根据统计结果设定不同时间段内的门限值。一旦这些音频特征参数超出相应的门限时,就认为发生了异常事件。然而,如果只使用音频能量、过零率等时域音频信号特征参数只能检测到少数的异常事件,不能满足实际应用需求。
还有部分科技人员对正常事件中的例如语音、脚步声等的音频能量、过零率等特征参数进行总结和分析后,再实时采集这些音频信号,并将其与相关的这些特征参数进行实时对比,当检测到的音频信号与正常事件的特征参数的相似度小于设定值时,就判定为异常事件。然而,由于采集到的各种特征参数之间具有很大的重叠性(例如:语音和乐音的过零率基本无法区分出来),于是在复杂环境下很难做到准确的检测。
所以,如何利用音频特征参数来监控异常事件的发生与否,以及如何提取相关的音频特征参数仍然是业内科技人员关注的热点课题。
发明内容
有鉴于此,本发明的目的是提供一种用于音频监控系统中的音频特征参数的提取方法,以便较好地解决传统音频监控方法在选取音频特征参数上的缺陷;本发明首创并提取的音频特征参数是音频短段时频差,它的特点是将时域和频域的音频特征参数相互结合为一体,既能发挥其各自长处,又可在一定程度上规避各自缺点,从而能够有效地应对各种不同类型的背景噪声,对某个设定时段的音频中可能出现的异常事件及时作出正确判断,为适时采取告警等其它各种安全技术措施奠定基础。
为了达到上述目的,本发明提供了一种用于音频监控系统中的音频特征参数的提取方法,其特征在于,所述方法包括下述操作步骤:
(1)按照设定的短时间的时长对音频采样信号序列进行分帧处理,将该音频采样信号序列划分为音频数据帧序列,其中每个短时间段为一个音频数据帧;
(2)分别对所述音频数据帧序列中的每个音频数据帧实时提取该帧的短时能量、短时过零率和短时信息熵三个基本音频特征参数;
(3)对音频数据帧序列进行分段处理,将该音频帧序列划分为音频短段序列;并在上述三个音频特征参数的基础上,计算并提取综合每个音频短段内的所有音频数据帧的时域特征和频域特征、并充分考虑其当前时刻与前一时刻之间差异的音频特征参数,即音频短段时频差,用于音频监控系统,及时发现音频异常事件。
所述步骤(1)中的设定的短时间的时长范围是30ms-50ms。
所述音频数据帧的短时能量是反映该音频数据帧在单位时间内的时域强度特征参数,每个音频数据帧的短时能量是该帧内所有音频采样值的平方和,即第i帧的短时能量是: E i = Σ n = 1 N S n 2 , 式中,自然数i是音频数据帧的序号,自然数n是第i个音频数据帧中的音频采样值的序号,其最大值是N,Sn是第n个采样的取样值;
所述音频数据帧的短时过零率是在某种程度上反映该音频数据帧中的音频信号的时域频率特征参数,第i帧的短时过零率是在该i个音频数据帧中的音频信号穿过零值、即坐标横轴的次数: Z i = 1 2 Σ n = 1 N | sgn ( S n ) - sgn ( S n - 1 ) | ; 式中,sgn()为符号函数,音频采样值Sn为正数的符号函数是1,音频采样值Sn为负数和0的符号函数都是-1,即: sgn ( S n ) = 1 , S n > 0 - 1 , S n ≤ 0 ;
所述信息熵是频域的重要音频参数,用于反应音频信号所传达的信息量的大小;所述短时信息熵是每个音频数据帧的信息熵。
所述短时信息熵的计算方法如下:
(21)利用傅里叶变换FFT对每个音频数据帧的信号进行由时域向频域的转换,分别得到设定的各个频率的频谱能量;
(22)分别计算每个音频数据帧中所述各个频率的出现概率,即第j个频率fj的出现概率pj的计算公式为: p j = s ( f j ) Σ c = 1 Q s ( f c ) , 式中,s(fj)是第j个频率fj的频谱能量,自然数c是该音频数据帧中设定的各频率的序号,其最大值为Q;
(23)分别计算每个音频数据帧中音频信号的短时信息熵,即第i帧的短时信息熵的计算公式为: H i = Σ j = 1 X p j × log p j , 式中,自然数j是该第i个音频数据帧中计算短时信息熵过程中所选取的各频率的序号,其最大值是x。
所述步骤(21)中,在对音频数据帧的信号进行由时域向频域的转换处理时,设定的各个频率是0HZ、100HZ、200HZ、300HZ、......、至5000HZ。
所述步骤(3)进一步包括下列操作步骤:
(31)对音频帧序列进行分段处理:按照设定短时间段的时长所包括的音频数据帧的数量对所述音频数据帧序列进行分段,其中每个设定时长中的多个音频数据帧组成一个音频短段;
(32)分别计算每个音频短段中的所有音频数据帧的短时能量、短时过零率和短时信息熵的平均值,并分别定义为该音频短段的短段能量: E k = Σ m = 1 M E m , 短段过零率 Z ‾ k = Σ m = 1 M Z m 和短段短时信息熵 H ‾ k = Σ m = 1 M H m ; 其中,自然数k是音频短段的序号,自然数m是第k个音频短段中的音频数据帧的序号,其最大值是M;
(33)分别计算每个音频短段的音频短段时频差,即第k个音频短段的音频短段时频差<short-TF>k的计算公式为:
Figure A20091007944700086
,并设置其中第一个音频短段,即当k=1时,
Figure A20091007944700087
所述步骤(31)中,设定短时间段的时长所包括的音频数据帧是50帧。
本发明的重要创新点是提出一种适用于音频监控系统的新的音频特征参数——音频短段时频差,该参数的特点是同时将时域音频特征参数(短时能量和短时过零率)和频域的音频特征参数(短时信息熵)兼容在一起,既能够发挥其各自长处,又可在一定程度上分别规避其缺点,从而能够有效地应对各种不同类型的背景噪声。另外,现有的音频参数大都只着重于衡量音频信号在某个特定时刻所呈现的特性,而本发明的音频短段时频差的另一特点是在提取过程中充分考虑了前一时刻与当前时刻的音频特征的差异或区别,能够更好地发现音频信号的突变点,有效区分“正常”音频信号与“异常”音频信号,从而对不同时段的音频信号中可能出现的异常事件及时作出正确判断,为适时采取告警等安全技术措施奠定基础。
再者,本发明提取音频短段时频差的方法操作步骤简单、容易,信号处理所需要的计算量也非常简单、时延很小,能够应用于实时监控系统中。因此,本发明具有很好的推广应用前景。
附图说明
图1是本发明一种用于音频监控系统中的音频特征参数的提取方法操作步骤流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图和实施例的试验情况对本发明作进一步的详细描述。
参见图1,介绍本发明一种用于音频监控系统中的音频特征参数的提取方法的具体操作步骤:
步骤1、按照设定的短时间的时长(例如30ms-50ms)对音频采样信号序列进行分帧处理,将该音频采样信号序列划分为音频数据帧序列,其中每个短时间段为一个音频数据帧。分帧操作后,原始音频采样信号序列就表示为一个音频数据帧序列。
步骤2、分别对该音频数据帧序列中的每个音频数据帧实时提取该帧的短时能量、短时过零率和短时信息熵三个基本音频特征参数。其中:
音频数据帧的短时能量是反映该音频数据帧在单位时间内的时域强度特征参数,每个音频数据帧的短时能量定义为该帧内所有音频采样值的平方和,例如,第i帧的短时能量是: E i = &Sigma; n = 1 N S n 2 , 式中,自然数i是音频数据帧的序号,自然数n是第i个音频数据帧中的音频采样值的序号,其最大值是N,Sn是第n个采样的取样值。
音频数据帧的短时过零率是在某种程度上反映该音频数据帧中的音频信号的时域频率特征参数,第i帧的短时过零率是在该i个音频数据帧中的音频信号穿过坐标横轴(即零值点)的次数,即 Z i = 1 2 &Sigma; n = 1 N | sgn ( S n ) - sgn ( S n - 1 ) | ; 式中,sgn()为符号函数,音频采样值Sn为正数的符号函数是1,音频采样值Sn为负数和0的符号函数都是-1,即: sgn ( S n ) = 1 , S n > 0 - 1 , S n &le; 0 .
众所周知,音频信号的感知过程与人类听觉系统具有频谱分析功能是紧密相关的。因此,对音频信号进行频谱分析,是认识音频信号和处理音频信号的重要方法。音频信号作为一种典型的非平稳信号,它的非平稳性是由发音器官的物理运动过程的不平稳性而产生的,但是,由此可假定其频域信号也是短时平稳的。
信息熵是频域的重要音频参数,用于反应音频信号所传达的信息量的大小。信息熵在语音编解码中经常被使用,J.L.Shen首次将该参数应用于语音端点检测技术中。本发明方法也要对每个音频数据帧都计算其信息熵,即短时信息熵。该短时信息熵的计算方法如下:
(A)利用傅里叶变换(FFT)对每个音频数据帧的信号进行由时域向频域的转换,分别得到设定的各个频率的频谱能量。通常,在该音频信号转换过程中,设定的各个频率是0HZ、100HZ、200HZ、300HZ、......、至5000HZ的频谱。
(B)分别计算每个音频数据帧中上述各个频率的出现概率,即按照下述公式计算第j个频率fj的出现概率pj为: p j = s ( f j ) &Sigma; c = 1 Q s ( f c ) , 式中,s(fj)是第j个频率fj的频谱能量,自然数c是该音频数据帧中设定的各频率的序号,其最大值为Q。
(C)分别计算每个音频数据帧中音频信号的短时信息熵,即按照下述公式计算第i帧的短时信息熵Hi H i = &Sigma; j = 1 X p j &times; log p j , 式中,自然数j是该第i个音频数据帧中计算短时信息熵过程中所选取的各频率的序号,其最大值是x。
步骤3、对音频数据帧序列进行分段处理,将该音频帧序列划分为音频短段序列;并在上述三个音频特征参数的基础上,计算并提取综合每个音频短段内的所有音频数据帧的时域特征和频域特征、并充分考虑其当前时刻与前一时刻之间差异的音频特征参数,即音频短段时频差,记做:short-TF,用于音频监控系统,及时发现音频异常事件。该步骤包括下列操作内容:
(1)对音频帧序列进行分段:按照设定短时间段的时长所包括的音频数据帧的数量(通常设定短时间段的时长包括50帧)对所述音频数据帧序列进行分段,其中每个设定时长中的多个音频数据帧组成一个音频短段。
(2)分别计算每个音频短段中的所有音频数据帧的短时能量、短时过零率和短时信息熵的平均值,并分别定义为:
该音频短段的短段能量: E &OverBar; k = &Sigma; m = 1 M E m , 短段过零率 Z &OverBar; k = &Sigma; m = 1 M Z m , 短段短时信息熵 H &OverBar; k = &Sigma; m = 1 M H m ; 式中,自然数k是音频短段的序号,自然数m是第k个音频短段中的音频数据帧的序号,其最大值是M。
(3)分别计算每个音频短段的音频短段时频差,即第k个音频短段的音频短段时频差<short-TF>k的计算公式为:
Figure A20091007944700116
,并设置其中第一个音频短段,即当k=1时,
Figure A20091007944700121
。这里得到的各个音频短段的音频短段时频差<short-TF>k就可以直接用于音频监控系统。
本发明方法已经作了实施试验,计算机仿真的实施例的试验是成功的,实现了发明目的。

Claims (7)

1、一种用于音频监控系统中的音频特征参数的提取方法,其特征在于,所述方法包括下述操作步骤:
(1)按照设定的短时间的时长对音频采样信号序列进行分帧处理,将该音频采样信号序列划分为音频数据帧序列,其中每个短时间段为一个音频数据帧;
(2)分别对所述音频数据帧序列中的每个音频数据帧实时提取该帧的短时能量、短时过零率和短时信息熵三个基本音频特征参数;
(3)对音频数据帧序列进行分段处理,将该音频帧序列划分为音频短段序列;并在上述三个音频特征参数的基础上,计算并提取综合每个音频短段内的所有音频数据帧的时域特征和频域特征、并充分考虑其当前时刻与前一时刻之间差异的音频特征参数,即音频短段时频差,用于音频监控系统,及时发现音频异常事件。
2、根据权利要求1所述的方法,其特征在于:所述步骤(1)中的设定的短时间的时长范围是30ms-50ms。
3、根据权利要求1所述的方法,其特征在于:所述音频数据帧的短时能量是反映该音频数据帧在单位时间内的时域强度特征参数,每个音频数据帧的短时能量是该帧内所有音频采样值的平方和,即第i帧的短时能量是: E i = &Sigma; n = 1 N S n 2 , 式中,自然数i是音频数据帧的序号,自然数n是第i个音频数据帧中的音频采样值的序号,其最大值是N,Sn是第n个采样的取样值;
所述音频数据帧的短时过零率是在某种程度上反映该音频数据帧中的音频信号的时域频率特征参数,第i帧的短时过零率是在该i个音频数据帧中的音频信号穿过零值、即坐标横轴的次数: Z i = 1 2 &Sigma; n = 1 N | sgn ( S n ) - sgn ( S n - 1 ) | ; 式中,sgn()为符号函数,音频采样值Sn为正数的符号函数是1,音频采样值Sn为负数和0的符号函数都是-1,即: sgn ( S n ) = 1 , S n > 0 - 1 , S n &le; 0 ;
所述信息熵是频域的重要音频参数,用于反应音频信号所传达的信息量的大小;所述短时信息熵是每个音频数据帧的信息熵。
4、根据权利要求3所述的方法,其特征在于:所述短时信息熵的计算方法如下:
(21)利用傅里叶变换FFT对每个音频数据帧的信号进行由时域向频域的转换,分别得到设定的各个频率的频谱能量;
(22)分别计算每个音频数据帧中所述各个频率的出现概率,即第j个频率fj的出现概率pj的计算公式为: p j = s ( f j ) &Sigma; c = 1 Q s ( f c ) , 式中,s(fj)是第j个频率fj的频谱能量,自然数c是该音频数据帧中设定的各频率的序号,其最大值为Q;
(23)分别计算每个音频数据帧中音频信号的短时信息熵,即第i帧的短时信息熵的计算公式为: H i = &Sigma; j = 1 X p j &times; log p j , 式中,自然数j是该第i个音频数据帧中计算短时信息熵过程中所选取的各频率的序号,其最大值是X。
5、根据权利要求4所述的方法,其特征在于:所述步骤(21)中,在对音频数据帧的信号进行由时域向频域的转换处理时,设定的各个频率是0HZ、100HZ、200HZ、300HZ、......、至5000HZ。
6、根据权利要求1所述的方法,其特征在于:所述步骤(3)进一步包括下列操作步骤:
(31)对音频帧序列进行分段处理:按照设定短时间段的时长所包括的音频数据帧的数量对所述音频数据帧序列进行分段,其中每个设定时长中的多个音频数据帧组成一个音频短段;
(32)分别计算每个音频短段中的所有音频数据帧的短时能量、短时过零率和短时信息熵的平均值,并分别定义为该音频短段的短段能量: E &OverBar; k = &Sigma; m = 1 M E m 、短段过零率 Z &OverBar; k = &Sigma; m = 1 M Z m 和短段短时信息熵 H &OverBar; k = &Sigma; m = 1 M H m ; 其中,自然数k是音频短段的序号,自然数m是第k个音频短段中的音频数据帧的序号,其最大值是M;
(33)分别计算每个音频短段的音频短段时频差,即第k个音频短段的音频短段时频差<short-TF>k的计算公式为:
Figure A2009100794470004C1
,并设置其中第一个音频短段,即当k=1时,
Figure A2009100794470004C2
7、根据权利要求6所述的方法,其特征在于:所述步骤(31)中,设定短时间段的时长所包括的音频数据帧是50帧。
CN2009100794471A 2009-03-11 2009-03-11 一种用于音频监控系统中的音频特征参数的提取方法 Expired - Fee Related CN101494049B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100794471A CN101494049B (zh) 2009-03-11 2009-03-11 一种用于音频监控系统中的音频特征参数的提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100794471A CN101494049B (zh) 2009-03-11 2009-03-11 一种用于音频监控系统中的音频特征参数的提取方法

Publications (2)

Publication Number Publication Date
CN101494049A true CN101494049A (zh) 2009-07-29
CN101494049B CN101494049B (zh) 2011-07-27

Family

ID=40924604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100794471A Expired - Fee Related CN101494049B (zh) 2009-03-11 2009-03-11 一种用于音频监控系统中的音频特征参数的提取方法

Country Status (1)

Country Link
CN (1) CN101494049B (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101882439A (zh) * 2010-06-10 2010-11-10 复旦大学 一种基于Zernike矩的压缩域音频指纹方法
CN102163427A (zh) * 2010-12-20 2011-08-24 北京邮电大学 一种基于环境模型的音频异常事件检测方法
CN102201230A (zh) * 2011-06-15 2011-09-28 天津大学 一种突发事件语音检测方法
CN102411594A (zh) * 2010-09-25 2012-04-11 中国移动通信集团湖南有限公司 一种获取信息的方法及装置
CN102486920A (zh) * 2010-12-06 2012-06-06 索尼公司 音频事件检测方法和装置
CN102610228A (zh) * 2011-01-19 2012-07-25 上海弘视通信技术有限公司 音频异常事件检测系统及其标定方法
CN102056026B (zh) * 2009-11-06 2013-04-03 中国移动通信集团设计院有限公司 音视频同步检测方法及其系统、语音检测方法及其系统
CN103873852A (zh) * 2012-12-11 2014-06-18 上海文广互动电视有限公司 多模态并行的视频质量故障检测方法及装置
CN104992537A (zh) * 2015-06-26 2015-10-21 北京航天易联科技发展有限公司 一种信号处理方法和装置
CN105227763A (zh) * 2015-08-31 2016-01-06 武汉工程大学 一种在智能移动设备上实现的乐器音频实时分割方法
CN106653055A (zh) * 2016-10-20 2017-05-10 北京创新伙伴教育科技有限公司 在线英语口语评估系统
CN106887241A (zh) * 2016-10-12 2017-06-23 阿里巴巴集团控股有限公司 一种语音信号检测方法与装置
CN107045870A (zh) * 2017-05-23 2017-08-15 南京理工大学 一种基于特征值编码的语音信号端点检测方法
CN107086036A (zh) * 2017-04-19 2017-08-22 杭州派尼澳电子科技有限公司 一种高速公路隧道安全监控方法
CN107548007A (zh) * 2016-06-23 2018-01-05 杭州海康威视数字技术股份有限公司 一种音频信号采集设备的检测方法及装置
CN107845385A (zh) * 2016-09-19 2018-03-27 南宁富桂精密工业有限公司 信息隐藏的编解码方法及系统
WO2018068639A1 (zh) * 2016-10-14 2018-04-19 腾讯科技(深圳)有限公司 数据恢复方法、装置和存储介质
CN108389575A (zh) * 2018-01-11 2018-08-10 苏州思必驰信息科技有限公司 音频数据识别方法及系统
CN108492837A (zh) * 2018-03-23 2018-09-04 腾讯音乐娱乐科技(深圳)有限公司 音频突发白噪声的检测方法、装置及存储介质
CN108831508A (zh) * 2018-06-13 2018-11-16 百度在线网络技术(北京)有限公司 语音活动检测方法、装置和设备
CN109192198A (zh) * 2018-09-06 2019-01-11 北京邮电大学 一种基于声波感知的文本输入方法
CN109287046A (zh) * 2018-09-30 2019-01-29 北京经纬恒润科技有限公司 一种氛围灯控制方法、装置和系统
CN113112990A (zh) * 2021-03-04 2021-07-13 昆明理工大学 一种基于频谱包络图的可变时长语音的语种识别方法
CN113205799A (zh) * 2021-03-24 2021-08-03 合肥佳讯科技有限公司 一种基于声音识别的告警处理方法
CN113362850A (zh) * 2020-03-03 2021-09-07 杭州海康威视数字技术股份有限公司 音频信号采集设备的检测方法、设备和存储介质
CN113571091A (zh) * 2021-06-30 2021-10-29 青岛海尔科技有限公司 用于监控的音频突变检测方法、装置及家用电器
CN113613125A (zh) * 2021-04-26 2021-11-05 珠海市杰理科技股份有限公司 音频同步控制方法、装置及音频设备、系统
CN116166935A (zh) * 2023-04-26 2023-05-26 中铁第一勘察设计院集团有限公司 面向铁路通信的多源背景信号识别方法及装置
CN116242612A (zh) * 2023-01-09 2023-06-09 广东海洋大学 一种故障诊断方法、装置、介质及设备

Cited By (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102056026B (zh) * 2009-11-06 2013-04-03 中国移动通信集团设计院有限公司 音视频同步检测方法及其系统、语音检测方法及其系统
CN101882439A (zh) * 2010-06-10 2010-11-10 复旦大学 一种基于Zernike矩的压缩域音频指纹方法
CN102411594B (zh) * 2010-09-25 2013-06-26 中国移动通信集团湖南有限公司 一种获取信息的方法及装置
CN102411594A (zh) * 2010-09-25 2012-04-11 中国移动通信集团湖南有限公司 一种获取信息的方法及装置
CN102486920A (zh) * 2010-12-06 2012-06-06 索尼公司 音频事件检测方法和装置
CN102163427B (zh) * 2010-12-20 2012-09-12 北京邮电大学 一种基于环境模型的音频异常事件检测方法
CN102163427A (zh) * 2010-12-20 2011-08-24 北京邮电大学 一种基于环境模型的音频异常事件检测方法
CN102610228A (zh) * 2011-01-19 2012-07-25 上海弘视通信技术有限公司 音频异常事件检测系统及其标定方法
CN102610228B (zh) * 2011-01-19 2014-01-22 上海弘视通信技术有限公司 音频异常事件检测系统及其标定方法
CN102201230B (zh) * 2011-06-15 2012-08-22 天津大学 一种突发事件语音检测方法
CN102201230A (zh) * 2011-06-15 2011-09-28 天津大学 一种突发事件语音检测方法
CN103873852A (zh) * 2012-12-11 2014-06-18 上海文广互动电视有限公司 多模态并行的视频质量故障检测方法及装置
CN104992537A (zh) * 2015-06-26 2015-10-21 北京航天易联科技发展有限公司 一种信号处理方法和装置
CN104992537B (zh) * 2015-06-26 2018-02-09 北京航天易联科技发展有限公司 一种信号处理方法和装置
CN105227763A (zh) * 2015-08-31 2016-01-06 武汉工程大学 一种在智能移动设备上实现的乐器音频实时分割方法
CN105227763B (zh) * 2015-08-31 2018-03-20 武汉工程大学 一种在智能移动设备上实现的乐器音频实时分割方法
CN107548007A (zh) * 2016-06-23 2018-01-05 杭州海康威视数字技术股份有限公司 一种音频信号采集设备的检测方法及装置
CN107548007B (zh) * 2016-06-23 2020-02-04 杭州海康威视数字技术股份有限公司 一种音频信号采集设备的检测方法及装置
CN107845385B (zh) * 2016-09-19 2021-07-13 南宁富桂精密工业有限公司 信息隐藏的编解码方法及系统
CN107845385A (zh) * 2016-09-19 2018-03-27 南宁富桂精密工业有限公司 信息隐藏的编解码方法及系统
US10236004B2 (en) 2016-09-19 2019-03-19 Nanning Fugui Precision Industrial Co., Ltd. Data encoding and decoding method and system
CN106887241A (zh) * 2016-10-12 2017-06-23 阿里巴巴集团控股有限公司 一种语音信号检测方法与装置
WO2018068636A1 (zh) * 2016-10-12 2018-04-19 阿里巴巴集团控股有限公司 一种语音信号检测方法与装置
US10706874B2 (en) 2016-10-12 2020-07-07 Alibaba Group Holding Limited Voice signal detection method and apparatus
WO2018068639A1 (zh) * 2016-10-14 2018-04-19 腾讯科技(深圳)有限公司 数据恢复方法、装置和存储介质
CN106653055A (zh) * 2016-10-20 2017-05-10 北京创新伙伴教育科技有限公司 在线英语口语评估系统
CN107086036A (zh) * 2017-04-19 2017-08-22 杭州派尼澳电子科技有限公司 一种高速公路隧道安全监控方法
CN107045870A (zh) * 2017-05-23 2017-08-15 南京理工大学 一种基于特征值编码的语音信号端点检测方法
CN108389575A (zh) * 2018-01-11 2018-08-10 苏州思必驰信息科技有限公司 音频数据识别方法及系统
CN108389575B (zh) * 2018-01-11 2020-06-26 苏州思必驰信息科技有限公司 音频数据识别方法及系统
CN108492837A (zh) * 2018-03-23 2018-09-04 腾讯音乐娱乐科技(深圳)有限公司 音频突发白噪声的检测方法、装置及存储介质
CN108492837B (zh) * 2018-03-23 2020-10-13 腾讯音乐娱乐科技(深圳)有限公司 音频突发白噪声的检测方法、装置及存储介质
CN108831508A (zh) * 2018-06-13 2018-11-16 百度在线网络技术(北京)有限公司 语音活动检测方法、装置和设备
CN109192198B (zh) * 2018-09-06 2020-08-07 北京邮电大学 一种基于声波感知的文本输入方法
US11322142B2 (en) 2018-09-06 2022-05-03 Beijing University Of Posts And Telecommunications Acoustic sensing-based text input method
CN109192198A (zh) * 2018-09-06 2019-01-11 北京邮电大学 一种基于声波感知的文本输入方法
CN109287046A (zh) * 2018-09-30 2019-01-29 北京经纬恒润科技有限公司 一种氛围灯控制方法、装置和系统
CN113362850A (zh) * 2020-03-03 2021-09-07 杭州海康威视数字技术股份有限公司 音频信号采集设备的检测方法、设备和存储介质
CN113362850B (zh) * 2020-03-03 2024-05-28 杭州海康威视数字技术股份有限公司 音频信号采集设备的检测方法、设备和存储介质
CN113112990A (zh) * 2021-03-04 2021-07-13 昆明理工大学 一种基于频谱包络图的可变时长语音的语种识别方法
CN113205799A (zh) * 2021-03-24 2021-08-03 合肥佳讯科技有限公司 一种基于声音识别的告警处理方法
CN113613125A (zh) * 2021-04-26 2021-11-05 珠海市杰理科技股份有限公司 音频同步控制方法、装置及音频设备、系统
CN113571091B (zh) * 2021-06-30 2024-04-19 青岛海尔科技有限公司 用于监控的音频突变检测方法、装置及家用电器
CN113571091A (zh) * 2021-06-30 2021-10-29 青岛海尔科技有限公司 用于监控的音频突变检测方法、装置及家用电器
CN116242612A (zh) * 2023-01-09 2023-06-09 广东海洋大学 一种故障诊断方法、装置、介质及设备
CN116242612B (zh) * 2023-01-09 2023-11-21 广东海洋大学 一种故障诊断方法、装置、介质及设备
CN116166935A (zh) * 2023-04-26 2023-05-26 中铁第一勘察设计院集团有限公司 面向铁路通信的多源背景信号识别方法及装置
CN116166935B (zh) * 2023-04-26 2023-08-25 中铁第一勘察设计院集团有限公司 面向铁路通信的多源背景信号识别方法及装置

Also Published As

Publication number Publication date
CN101494049B (zh) 2011-07-27

Similar Documents

Publication Publication Date Title
CN101494049B (zh) 一种用于音频监控系统中的音频特征参数的提取方法
CN102163427B (zh) 一种基于环境模型的音频异常事件检测方法
CN109357749A (zh) 一种基于dnn算法的电力设备音频信号分析方法
CN109616140B (zh) 一种异常声音分析系统
CN102426835B (zh) 一种基于支持向量机模型的开关柜局部放电信号识别方法
CN107393555B (zh) 一种低信噪比异常声音信号的检测系统及检测方法
Huang et al. Scream detection for home applications
CN103198838A (zh) 一种用于嵌入式系统的异常声音监控方法和监控装置
CN110335617A (zh) 一种变电站中的噪音分析方法
CN108172242B (zh) 一种改进的蓝牙智能云音箱语音交互端点检测方法
CN106205606A (zh) 一种基于语音识别的动态定位监控方法及系统
CN102014278A (zh) 一种基于语音识别技术的智能视频监控方法
CN107274911A (zh) 一种基于声音特征的相似度分析方法
CN102148032A (zh) 应用于atm机的异常声音检测方法及系统
CN113566948A (zh) 机器人化煤机故障音频识别及诊断方法
CN105118511A (zh) 一种雷声识别方法
Kim et al. Hierarchical approach for abnormal acoustic event classification in an elevator
CN106548786A (zh) 一种音频数据的检测方法及系统
KR101250668B1 (ko) Gmm을 이용한 응급 단어 인식 방법
CN113823293A (zh) 一种基于语音增强的说话人识别方法及系统
CN112016470A (zh) 基于声音信号和振动信号的有载分接开关故障识别方法
Junkai et al. Coal-rock interface recognition based on MFCC and neural network
CN109994129A (zh) 语音处理系统、方法和设备
CN114093385A (zh) 一种无人机检测方法及装置
CN106448700B (zh) 一种尖锐声音检测方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110727

Termination date: 20120311