CN109102798A - 一种装修事件检测方法、装置、计算机设备及介质 - Google Patents

一种装修事件检测方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN109102798A
CN109102798A CN201810694069.7A CN201810694069A CN109102798A CN 109102798 A CN109102798 A CN 109102798A CN 201810694069 A CN201810694069 A CN 201810694069A CN 109102798 A CN109102798 A CN 109102798A
Authority
CN
China
Prior art keywords
finishing
sound
microphone
rescnn
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810694069.7A
Other languages
English (en)
Inventor
叶志坚
李稀敏
肖龙源
蔡振华
刘晓葳
谭玉坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Kuaishangtong Technology Corp ltd
Original Assignee
Xiamen Kuaishangtong Technology Corp ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Kuaishangtong Technology Corp ltd filed Critical Xiamen Kuaishangtong Technology Corp ltd
Priority to CN201810694069.7A priority Critical patent/CN109102798A/zh
Publication of CN109102798A publication Critical patent/CN109102798A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种装修事件检测方法、装置、计算机设备及介质,所述方法包括麦克风或麦克风阵列实时采集声音获取待检测的声音信息;提取声音信息的声学特征;构建ResCNN神经网络模型;将所述声学特征输入所述ResCNN神经网络模型,获得装修声概率p;将所述装修声概率p与真实的结果进行比较,构造交叉熵损失函数;根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练;利用训练好的ResCNN神经网络模型进行装修声预测,若判断为装修声,则根据麦克风的设备编号识别装修事件发生的位置。本发明可有效地判断是否发生装修及识别装修地,通过联合ResCNN神经网络架构和交叉熵损失函数,不但提高装修声识别率,精确地识别某段声音是否为装修声,而且减小整个模型大小。

Description

一种装修事件检测方法、装置、计算机设备及介质
技术领域
本发明涉及装修领域,具体涉及一种装修事件检测方法、装置、计算机设备及介质。
背景技术
营造良好的家居生活,装修是其中一个重要的环节。人们根据自己的喜好去对雇用装修公司来对房屋进行装修,装修成自己喜欢的风格,以提升房屋的美感以及自己居住的舒适感。然而,装修的同时会影响到邻居休息,导致因为社区装修而发生很多的争吵事件。为了避免这一情况的再次发生,现在很多小区有明确规定时间段进行房屋装修,但并不是所有的装修公司都会按照小区规定的时间进行装修,有些装修公司会因为赶进度悄悄装修,进而影响到楼层近的居民的休息。为了防止不正当的装修行为造成扰民的影响,有必要对装修事件进行监测。
发明内容
本发明的目的在于对非装修期间的装修行为进行有效、精准地定位,以便及时制止装修行为,避免装修噪声扰民。鉴于此,本发明提供一种装修事件检测方法及装置,通过音频事件检测以及声源定位技术,及时检测到具体是哪个房间在进行装修,并能通知物业及时去处理。
为此,本发明提供的一种装修事件检测方法,包括如下步骤:
步骤一,通过麦克风或麦克风阵列实时采集声音获取待检测的声音信息;
步骤二,从所述声音信息提取声音信息的声学特征;
步骤三,构建ResCNN神经网络模型;
步骤四,将所述声学特征输入所述ResCNN神经网络模型,获得装修声预测概率p;
步骤五,将所述装修声预测概率p与真实的结果进行比较,构造交叉熵损失函数;
步骤六,根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练;
步骤七,利用训练好的ResCNN神经网络模型进行装修声预测,判断装修声预测概率p是否大于等于设定阈值,若是则所述声音信息判断为装修声,若概率p小于设定阈值,则所述声音信息判断为非装修声。
进一步的,所述提取声音信息的声学特征过程包括将时域信号转换成时域-频域信息。在发明实施例中,优选地,采用短时傅里叶变换和梅尔频率倒谱系数将时域信号转换成时域-频域信息。
优选的,步骤四后,还将所述装修声预测概率p进行softmax分类(1-p,p),即概率p为0~1的二分类。
在本发明实施例中,按照如下构建ResCNN神经网络模型,卷积网络核的层数为16层:
第1层使用5×5的卷积核,通道数为64,步长为2;
3-8层为3个ResBlock残差块,卷积核为3×3,通道数为64,步长为1;
第9层使用5×5的卷积核,通道数为128,步长为2;
10-15层为3个ResBlock残差块,卷积核为3×3,通道数为128,步长为1;
接着在时间轴方向上做平均;
第16层为全连接层,输出节点数为512。
进一步的,所述构造交叉熵损失函数具体为:每一批训练样本包含M段声音样本,将预测的结果和真实的结果做比较构造一个交叉熵损失函数L,所述交叉熵损失函数公式为如下:
其中,yi为第i段声音的真实的结果,为第i段声音的预测的结果,M表示声音样本数量,M为正整数且M≥1。
为了更快地收敛,本发明还在根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练后,还利用随机梯度下降算法进行神经网络训练。
在本发明实施例中,利用训练好的ResCNN神经网络模型进行装修声预测,具体为,判断装修声预测概率p是否大于等于设定阈值,若是则所述声音信息判断为装修声,若概率p小于设定阈值,则所述声音信息判断为非装修声。
在本发明一实施例中,优选地,所述的设定阈值为0.5。
在本发明实施例中,进一步的,所述麦克风或麦克风阵列设置在楼层,用于实时采集楼层或房间的声音;麦克风或麦克风阵列的每个麦克风对应有设备编号,所述麦克风的设备编号对应有位置信息;
步骤一中,在正常装修期间外,通过麦克风或麦克风阵列实时采集声音获取待检测的声音信息以及待检测的声音信息所对应的麦克风的设备编号;
若利用训练好的ResCNN神经网络模型进行装修声预测判断所述声音信息判断为装修声,获取所述声音信息的麦克风的设备编号,并根据麦克风的设备编号获取装修发生地的位置信息。
进一步的,每个麦克风的设备编号绑定有楼层信息和/或房号信息;
若利用训练好的ResCNN神经网络模型进行装修声预测判断所述声音信息判断为装修声,获取所述声音信息的麦克风的设备编号,并根据麦克风的设备编号查找对应的楼层信息或房间信息,并发送提醒消息反馈至物业管理中心。
本发明另一实施例中,还提供了所述装修事件检测装置包括麦克风或麦克风陈列、计算机设备,所述麦克风或麦克风陈列用户实时获取环境的声音并发送至计算机设备,所述计算机设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述的装修事件检测方法。
本发明另一实施例中,还提供了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述的装修事件检测方法。
另外,本发明另一实施例中,还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被处理器执行时实现上述的装修事件检测方法。
本发明提供的装修事件检测方法、计算机设备及介质,与现有技术相比,本发明有效、精准地识别是否发生装修行为,并根据麦克风或麦克风阵列定位装修行为发生地,并可以监测在非装修期间的装修行为,一旦识别装修声,则立即反馈至物业管理中心或管理员进行处理,可以有效避免装修噪声扰民,本发明方法是通过联合上述ResCNN深度神经网络架构和交叉熵损失函数,不但可以提高声音的装修声识别率,精确的识别某段装修声,而且减小整个模型大小。
附图说明
此处所说明的附图用来提供对发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1本发明实施例1提供了一种装修事件检测方法的流程示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明第一实施例提供了一种装修事件检测方法,如附图1所示,包括如下步骤:
步骤一,通过麦克风或麦克风阵列实时采集声音获取待检测的声音信息;
步骤二,从所述声音信息提取声音信息的声学特征;所述提取声音信息的声学特征过程包括将时域信号转换成时域-频域信息,在在发明实施例中,优选地,采用短时傅里叶变换和梅尔频率倒谱系数将时域信号转换成时域-频域信息。需要说明的是,本发明从所述声音信息提取声音信息的声学特征还可以采用其它方式进行,不限于本发明所指的优选方式。
步骤三,构建ResCNN神经网络模型;
其中,按照如下构建ResCNN神经网络模型,卷积网络核的层数为16层:
第1层使用5×5的卷积核,通道数为64,步长为2;
3-8层为3个ResBlock残差块,卷积核为3×3,通道数为64,步长为1;
第9层使用5×5的卷积核,通道数为128,步长为2;
10-15层为3个ResBlock残差块,卷积核为3×3,通道数为128,步长为1;
接着在时间轴方向上做平均;
第16层为全连接层,输出节点数为512。
步骤四,将所述声学特征输入所述ResCNN神经网络模型,获得装修声预测概率p;
步骤五,将所述装修声预测概率p与真实的结果进行比较,构造交叉熵损失函数;
步骤六,根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练;
进一步的,所述构造交叉熵损失函数具体为:每一批训练样本包含M段声音样本,将预测的结果和真实的结果做比较构造一个交叉熵损失函数L,所述交叉熵损失函数公式为如下:
其中,yi为第i段声音的真实的结果,为第i段声音的预测的结果,M表示声音样本数量,M为正整数且M≥1。需要说明的是,yi为第i段声音信息的真实装修声音为0或者为1;为第i句话装修声预测的概率p介于0和1之间。
步骤七,利用训练好的ResCNN神经网络模型进行装修声预测,判断装修声预测概率p是否大于等于设定阈值,若是则所述声音信息判断为装修声,若概率p小于设定阈值,则所述声音信息判断为非装修声。
softmax函数经常用于解决分类问题,其值对应于判别为该类的概率,所有值加起来刚好等于1。优选的,步骤四后,还将所述预测装修声概率p进行softmax分类(1-p,p),即概率p为0~1的二分类。
进一步的,为了更快地收敛,本发明还在根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练后,还利用随机梯度下降算法进行神经网络训练。作为本发明优选实施例,采用随机梯度下降算法(StochasticGradientDescent,简称SGD)能有效避免冗余计算,消耗时间更短。当然本领域技术人员还可以采用其它算法。
在本发明实施例中,利用训练好的ResCNN神经网络模型进行预测装修声预测,具体为,判断预测装修声概率p是否大于等于设定阈值,若是则所述声音信息判断为装修声音,若概率p小于设定阈值,则所述声音信息判断为非装修声音。优选地,所述的设定阈值为0.5。
待检测的声音是装修声音或者非装修声音,将该段声音经该神经网络训练出来得到的是0或1的一个判别结果,如果为1为装修声音,则0就是非装修声音。
训练的时候,首先人为地给声音打上标签,并与神经网络预测的结果进行对比,如果神经网络预测结果是装修声音,事实上该段声音是非装修声音或则会产生一个误差,该误差为损失函数,然后经过随机梯度算法SGD或者其他的类似算法来训练,如果输出结果和标签不一致则继续训练,直到输出结果和标签的一致,之后就可以用这个训练完的神经网络架构去进行是否装修声音预测。
需要说明的是,本发明中,在神经网络中,将声音判别结果为装修声音的设置为1,相应的非装修声音的设置为0,则当预测结果为1为装修声音,预测结果为0为非装修声音。也可以将声音将判别结果为非装修声音设置为1,将装修声音的设置为0。
本发明方法不仅用于对装修事件检测,判断待测声音是否为装修声音,在本发明还提供了另一实施例可定位的装修事件检测方法,还可以定位装修声音的位置信息。采用麦克风阵列声源定位的方法,识别装修事件发生位置或具体房间信息,具体实现方式与上述第一实施例的一种装修事件检测方法近似。区别之处在于,所述麦克风或麦克风阵列设置在楼层,用于实时采集楼层或房间的声音;麦克风或麦克风阵列的每个麦克风对应有设备编号,所述麦克风的设备编号对应有位置信息;步骤一中,在正常装修期间外,通过麦克风或麦克风阵列实时采集声音获取待检测的声音信息以及待检测的声音信息所对应的麦克风的设备编号;若利用训练好的ResCNN神经网络模型进行装修声预测判断所述声音信息判断为装修声,获取所述声音信息的麦克风的设备编号,并根据麦克风的设备编号获取装修发生地的位置信息。其他步骤与上述实施例相同,本发明在此不再赘述。
进一步的,上述可定位的装修事件检测方法,每个麦克风的设备编号绑定有楼层信息和/或房号信息;若利用训练好的ResCNN神经网络模型进行装修声预测判断所述声音信息判断为装修声,获取所述声音信息的麦克风的设备编号,并根据麦克风的设备编号查找对应的楼层信息或房间信息,并发送提醒消息反馈至物业管理中心。
相应的,本发明另一实施例中,还提供了所述装修事件检测装置包括麦克风或麦克风陈列、计算机设备,所述麦克风或麦克风陈列用户实时获取环境的声音并发送至计算机设备,所述计算机设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储了麦克风的设备编码及其对应的位置信息;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行装修事件检测方法,所述装修事件检测方法为第一实施例相同,本发明在此不再赘述。需要说明的是,在本发明中,麦克风或麦克风阵列设置在楼层的公共区域,如楼房有N层,每层有M个房间,则可以设定N*M阵列个麦克风。当然为了考虑成本的情况,也可以多个房间对应一个麦克风;当每个套房的面积较大,也可以一个套房设置多个麦克风,增加监测的准确性。
本发明另一实施例中,还提供了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储了麦克风的设备编码及其对应的位置信息;所述的位置信息可以为具体位置信息,也可以包含楼层和房号信息;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行装修事件检测方法,所述装修事件检测方法为第一实施例相同,本发明在此不再赘述。
另外,本发明另一实施例中,还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被处理器执行时实现装修事件检测方法,所述装修事件检测方法为第一实施例相同,本发明在此不再赘述。
上述说明描述了本发明的优选实施例,但应当理解本发明并非局限于上述实施例,且不应看作对其他实施例的排除。通过本发明的启示,本领域技术人员结合公知或现有技术、知识所进行的改动也应视为在本发明的保护范围内。

Claims (10)

1.一种装修事件检测方法,其特征在于,包括如下步骤:
步骤一,通过麦克风或麦克风阵列实时采集声音获取待检测的声音信息;
步骤二,从所述声音信息提取声音信息的声学特征;
步骤三,构建ResCNN神经网络模型;
步骤四,将所述声学特征输入所述ResCNN神经网络模型,获得装修声预测概率p;
步骤五,将所述装修声预测概率p与真实的结果进行比较,构造交叉熵损失函数;
步骤六,根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练;
步骤七,利用训练好的ResCNN神经网络模型进行装修声预测,判断装修声预测概率p是否大于等于设定阈值,若是则所述声音信息判断为装修声,若概率p小于设定阈值,则所述声音信息判断为非装修声。
2.根据权利要求1所述的装修事件检测方法,其特征在于,
所述麦克风或麦克风阵列设置在楼层,用于实时采集楼层或房间的声音;麦克风或麦克风阵列的每个麦克风对应有设备编号,所述麦克风的设备编号对应有位置信息;
步骤一中,在正常装修期间外,通过麦克风或麦克风阵列实时采集声音获取待检测的声音信息以及待检测的声音信息所对应的麦克风的设备编号;
若利用训练好的ResCNN神经网络模型进行装修声预测判断所述声音信息判断为装修声,获取所述声音信息的麦克风的设备编号,并根据麦克风的设备编号获取装修发生地的位置信息。
3.根据权利要求2所述的装修事件检测方法,其特征在于,
每个麦克风的设备编号绑定有楼层信息和/或房号信息;
若利用训练好的ResCNN神经网络模型进行装修声预测判断所述声音信息判断为装修声,获取所述声音信息的麦克风的设备编号,并根据麦克风的设备编号查找对应的楼层信息或房间信息,并发送提醒消息反馈至物业管理中心。
4.根据权利要求1所述的装修事件检测方法,其特征在于,
步骤四后,还将所述装修声预测概率p进行softmax分类(1-p,p),即概率p为0~1的二分类。
5.根据权利要求1所述的装修事件检测方法,其特征在于,
所述构造交叉熵损失函数具体为:每一批训练样本包含M段声音样本,将预测的结果和真实的结果做比较构造一个交叉熵损失函数L,所述交叉熵损失函数公式为如下:
其中,yi为第i段声音的真实的结果,为第i段声音的预测的结果,M表示声音样本数量,M为正整数且M≥1。
6.根据权利要求1所述的装修事件检测方法,其特征在于,
根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练后,还利用随机梯度下降算法进行神经网络训练。
7.根据权利要求1所述的装修事件检测方法,其特征在于,
按照如下构建ResCNN神经网络模型,卷积网络核的层数为16层:
第1层使用5×5的卷积核,通道数为64,步长为2;
3-8层为3个ResBlock残差块,卷积核为3×3,通道数为64,步长为1;
第9层使用5×5的卷积核,通道数为128,步长为2;
10-15层为3个ResBlock残差块,卷积核为3×3,通道数为128,步长为1;
接着在时间轴方向上做平均;
第16层为全连接层,输出节点数为512。
8.一种装修事件检测装置,其特征在于,
所述装修事件检测装置包括麦克风或麦克风陈列、计算机设备,
所述麦克风或麦克风陈列用户实时获取环境的声音并发送至计算机设备,所述计算机设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-7中任一项所述的装修事件检测方法。
9.一种计算机设备,其特征在于,
所述计算机设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-7中任一项所述的装修事件检测方法。
10.一种非暂态计算机可读存储介质,其特征在于,
所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被处理器执行时实现如权利要求1-7任一项所述的装修事件检测方法。
CN201810694069.7A 2018-06-29 2018-06-29 一种装修事件检测方法、装置、计算机设备及介质 Pending CN109102798A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810694069.7A CN109102798A (zh) 2018-06-29 2018-06-29 一种装修事件检测方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810694069.7A CN109102798A (zh) 2018-06-29 2018-06-29 一种装修事件检测方法、装置、计算机设备及介质

Publications (1)

Publication Number Publication Date
CN109102798A true CN109102798A (zh) 2018-12-28

Family

ID=64845411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810694069.7A Pending CN109102798A (zh) 2018-06-29 2018-06-29 一种装修事件检测方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN109102798A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070895A (zh) * 2019-03-11 2019-07-30 江苏大学 一种基于监督变分编码器因素分解的混合声音事件检测方法
CN111540382A (zh) * 2020-07-10 2020-08-14 北京海天瑞声科技股份有限公司 基于线性预测残差负熵的语音音质度量评价方法及装置
CN112349298A (zh) * 2019-08-09 2021-02-09 阿里巴巴集团控股有限公司 声音事件识别方法、装置、设备和存储介质
CN114627891A (zh) * 2022-05-16 2022-06-14 山东捷瑞信息技术产业研究院有限公司 一种动圈扬声器质量检测方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105575394A (zh) * 2016-01-04 2016-05-11 北京时代瑞朗科技有限公司 基于全局变化空间及深度学习混合建模的声纹识别方法
CN205562029U (zh) * 2016-02-22 2016-09-07 深圳市胜家网络科技集团有限公司 基于互联网的噪音检测系统
CN105956597A (zh) * 2016-05-04 2016-09-21 浙江大学 一种基于卷积神经网络的双目立体匹配方法
US20170084269A1 (en) * 2015-09-17 2017-03-23 Panasonic Intellectual Property Management Co., Ltd. Subject estimation system for estimating subject of dialog
CN106846803A (zh) * 2017-02-08 2017-06-13 广西交通科学研究院有限公司 基于音频的交通事件检测装置及方法
CN107086036A (zh) * 2017-04-19 2017-08-22 杭州派尼澳电子科技有限公司 一种高速公路隧道安全监控方法
CN107221320A (zh) * 2017-05-19 2017-09-29 百度在线网络技术(北京)有限公司 训练声学特征提取模型的方法、装置、设备和计算机存储介质
CN107545890A (zh) * 2017-08-31 2018-01-05 桂林电子科技大学 一种声音事件识别方法
CN108108768A (zh) * 2017-12-29 2018-06-01 清华大学 基于卷积神经网络的光伏玻璃缺陷分类方法及装置
CN108171701A (zh) * 2018-01-15 2018-06-15 复旦大学 基于u网络和对抗学习的显著性检测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170084269A1 (en) * 2015-09-17 2017-03-23 Panasonic Intellectual Property Management Co., Ltd. Subject estimation system for estimating subject of dialog
CN105575394A (zh) * 2016-01-04 2016-05-11 北京时代瑞朗科技有限公司 基于全局变化空间及深度学习混合建模的声纹识别方法
CN205562029U (zh) * 2016-02-22 2016-09-07 深圳市胜家网络科技集团有限公司 基于互联网的噪音检测系统
CN105956597A (zh) * 2016-05-04 2016-09-21 浙江大学 一种基于卷积神经网络的双目立体匹配方法
CN106846803A (zh) * 2017-02-08 2017-06-13 广西交通科学研究院有限公司 基于音频的交通事件检测装置及方法
CN107086036A (zh) * 2017-04-19 2017-08-22 杭州派尼澳电子科技有限公司 一种高速公路隧道安全监控方法
CN107221320A (zh) * 2017-05-19 2017-09-29 百度在线网络技术(北京)有限公司 训练声学特征提取模型的方法、装置、设备和计算机存储介质
CN107545890A (zh) * 2017-08-31 2018-01-05 桂林电子科技大学 一种声音事件识别方法
CN108108768A (zh) * 2017-12-29 2018-06-01 清华大学 基于卷积神经网络的光伏玻璃缺陷分类方法及装置
CN108171701A (zh) * 2018-01-15 2018-06-15 复旦大学 基于u网络和对抗学习的显著性检测方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070895A (zh) * 2019-03-11 2019-07-30 江苏大学 一种基于监督变分编码器因素分解的混合声音事件检测方法
CN112349298A (zh) * 2019-08-09 2021-02-09 阿里巴巴集团控股有限公司 声音事件识别方法、装置、设备和存储介质
CN111540382A (zh) * 2020-07-10 2020-08-14 北京海天瑞声科技股份有限公司 基于线性预测残差负熵的语音音质度量评价方法及装置
CN111540382B (zh) * 2020-07-10 2020-10-16 北京海天瑞声科技股份有限公司 基于线性预测残差负熵的语音音质度量评价方法及装置
CN114627891A (zh) * 2022-05-16 2022-06-14 山东捷瑞信息技术产业研究院有限公司 一种动圈扬声器质量检测方法和装置

Similar Documents

Publication Publication Date Title
CN109102798A (zh) 一种装修事件检测方法、装置、计算机设备及介质
CN110189769B (zh) 基于多个卷积神经网络模型结合的异常声音检测方法
CN104903954B (zh) 使用基于人工神经网络的亚语音单位区分的说话人验证及识别
CN106778841A (zh) 异常用电检测模型的建立方法
CN109431507A (zh) 基于深度学习的咳嗽疾病识别方法及装置
CN103971690A (zh) 一种声纹识别方法和装置
US20140161270A1 (en) Room identification using acoustic features in a recording
KR20110013390A (ko) 신호판정방법, 신호판정장치, 프로그램, 신호판정시스템
CN103559881A (zh) 语种无关的关键词识别方法及系统
CN109147817B (zh) 一种基于变异受限玻尔兹曼机的去噪音频特征提取方法
Andrei et al. Detecting Overlapped Speech on Short Timeframes Using Deep Learning.
CN103730114A (zh) 一种基于联合因子分析模型的移动设备声纹识别方法
CN105679313A (zh) 一种音频识别报警系统及方法
CN106062871A (zh) 使用所选择的群组样本子集来训练分类器
US20180308501A1 (en) Multi speaker attribution using personal grammar detection
Sethi et al. Soundscapes predict species occurrence in tropical forests
Hollosi et al. Enhancing wireless sensor networks with acoustic sensing technology: use cases, applications & experiments
CN107993664A (zh) 一种基于竞争神经网络的鲁棒说话人识别方法
Xia et al. Frame-Wise Dynamic Threshold Based Polyphonic Acoustic Event Detection.
CN112836937A (zh) 基于熵权与bp神经网络技术的洪涝灾害损失评估方法
CN103871405A (zh) 一种amr音频的鉴定方法
CN113569944B (zh) 一种异常用户识别方法、装置、电子设备及存储介质
Whitehill et al. Whosecough: In-the-wild cougher verification using multitask learning
Chung et al. Identification of a city‟ s soundscape using soundwalks
CN106251861A (zh) 一种基于场景建模的公共场所异常声音检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181228