CN109102798A

CN109102798A - 一种装修事件检测方法、装置、计算机设备及介质

Info

Publication number: CN109102798A
Application number: CN201810694069.7A
Authority: CN
Inventors: 叶志坚; 李稀敏; 肖龙源; 蔡振华; 刘晓葳; 谭玉坤
Original assignee: Xiamen Kuaishangtong Technology Corp ltd
Current assignee: Xiamen Kuaishangtong Technology Corp ltd
Priority date: 2018-06-29
Filing date: 2018-06-29
Publication date: 2018-12-28

Abstract

本发明公开了一种装修事件检测方法、装置、计算机设备及介质，所述方法包括麦克风或麦克风阵列实时采集声音获取待检测的声音信息；提取声音信息的声学特征；构建ResCNN神经网络模型；将所述声学特征输入所述ResCNN神经网络模型，获得装修声概率p；将所述装修声概率p与真实的结果进行比较，构造交叉熵损失函数；根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练；利用训练好的ResCNN神经网络模型进行装修声预测，若判断为装修声，则根据麦克风的设备编号识别装修事件发生的位置。本发明可有效地判断是否发生装修及识别装修地，通过联合ResCNN神经网络架构和交叉熵损失函数，不但提高装修声识别率，精确地识别某段声音是否为装修声，而且减小整个模型大小。

Description

一种装修事件检测方法、装置、计算机设备及介质

技术领域

本发明涉及装修领域，具体涉及一种装修事件检测方法、装置、计算机设备及介质。

背景技术

营造良好的家居生活，装修是其中一个重要的环节。人们根据自己的喜好去对雇用装修公司来对房屋进行装修，装修成自己喜欢的风格，以提升房屋的美感以及自己居住的舒适感。然而，装修的同时会影响到邻居休息，导致因为社区装修而发生很多的争吵事件。为了避免这一情况的再次发生，现在很多小区有明确规定时间段进行房屋装修，但并不是所有的装修公司都会按照小区规定的时间进行装修，有些装修公司会因为赶进度悄悄装修，进而影响到楼层近的居民的休息。为了防止不正当的装修行为造成扰民的影响，有必要对装修事件进行监测。

发明内容

本发明的目的在于对非装修期间的装修行为进行有效、精准地定位，以便及时制止装修行为，避免装修噪声扰民。鉴于此，本发明提供一种装修事件检测方法及装置，通过音频事件检测以及声源定位技术，及时检测到具体是哪个房间在进行装修，并能通知物业及时去处理。

为此，本发明提供的一种装修事件检测方法，包括如下步骤：

步骤一，通过麦克风或麦克风阵列实时采集声音获取待检测的声音信息；

步骤二，从所述声音信息提取声音信息的声学特征；

步骤三，构建ResCNN神经网络模型；

步骤四，将所述声学特征输入所述ResCNN神经网络模型，获得装修声预测概率p；

步骤五，将所述装修声预测概率p与真实的结果进行比较，构造交叉熵损失函数；

步骤六，根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练；

步骤七，利用训练好的ResCNN神经网络模型进行装修声预测，判断装修声预测概率p是否大于等于设定阈值，若是则所述声音信息判断为装修声，若概率p小于设定阈值，则所述声音信息判断为非装修声。

进一步的，所述提取声音信息的声学特征过程包括将时域信号转换成时域-频域信息。在发明实施例中，优选地，采用短时傅里叶变换和梅尔频率倒谱系数将时域信号转换成时域-频域信息。

优选的，步骤四后，还将所述装修声预测概率p进行softmax分类(1-p，p)，即概率p为0～1的二分类。

在本发明实施例中，按照如下构建ResCNN神经网络模型，卷积网络核的层数为16层：

第1层使用5×5的卷积核，通道数为64，步长为2；

3-8层为3个ResBlock残差块，卷积核为3×3，通道数为64，步长为1；

第9层使用5×5的卷积核，通道数为128，步长为2；

10-15层为3个ResBlock残差块，卷积核为3×3，通道数为128，步长为1；

接着在时间轴方向上做平均；

第16层为全连接层，输出节点数为512。

进一步的，所述构造交叉熵损失函数具体为：每一批训练样本包含M段声音样本，将预测的结果和真实的结果做比较构造一个交叉熵损失函数L，所述交叉熵损失函数公式为如下：

其中，y_i为第i段声音的真实的结果，为第i段声音的预测的结果，M表示声音样本数量，M为正整数且M≥1。

为了更快地收敛，本发明还在根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练后，还利用随机梯度下降算法进行神经网络训练。

在本发明实施例中，利用训练好的ResCNN神经网络模型进行装修声预测，具体为，判断装修声预测概率p是否大于等于设定阈值，若是则所述声音信息判断为装修声，若概率p小于设定阈值，则所述声音信息判断为非装修声。

在本发明一实施例中，优选地，所述的设定阈值为0.5。

在本发明实施例中，进一步的，所述麦克风或麦克风阵列设置在楼层，用于实时采集楼层或房间的声音；麦克风或麦克风阵列的每个麦克风对应有设备编号，所述麦克风的设备编号对应有位置信息；

步骤一中，在正常装修期间外，通过麦克风或麦克风阵列实时采集声音获取待检测的声音信息以及待检测的声音信息所对应的麦克风的设备编号；

若利用训练好的ResCNN神经网络模型进行装修声预测判断所述声音信息判断为装修声，获取所述声音信息的麦克风的设备编号，并根据麦克风的设备编号获取装修发生地的位置信息。

进一步的，每个麦克风的设备编号绑定有楼层信息和/或房号信息；

若利用训练好的ResCNN神经网络模型进行装修声预测判断所述声音信息判断为装修声，获取所述声音信息的麦克风的设备编号，并根据麦克风的设备编号查找对应的楼层信息或房间信息，并发送提醒消息反馈至物业管理中心。

本发明另一实施例中，还提供了所述装修事件检测装置包括麦克风或麦克风陈列、计算机设备，所述麦克风或麦克风陈列用户实时获取环境的声音并发送至计算机设备，所述计算机设备包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行上述的装修事件检测方法。

本发明另一实施例中，还提供了一种计算机设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行上述的装修事件检测方法。

另外，本发明另一实施例中，还提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令被处理器执行时实现上述的装修事件检测方法。

本发明提供的装修事件检测方法、计算机设备及介质，与现有技术相比，本发明有效、精准地识别是否发生装修行为，并根据麦克风或麦克风阵列定位装修行为发生地，并可以监测在非装修期间的装修行为，一旦识别装修声，则立即反馈至物业管理中心或管理员进行处理，可以有效避免装修噪声扰民，本发明方法是通过联合上述ResCNN深度神经网络架构和交叉熵损失函数，不但可以提高声音的装修声识别率，精确的识别某段装修声，而且减小整个模型大小。

附图说明

此处所说明的附图用来提供对发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1本发明实施例1提供了一种装修事件检测方法的流程示意图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白，以下结合附图和实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本发明第一实施例提供了一种装修事件检测方法，如附图1所示，包括如下步骤：

步骤二，从所述声音信息提取声音信息的声学特征；所述提取声音信息的声学特征过程包括将时域信号转换成时域-频域信息，在在发明实施例中，优选地，采用短时傅里叶变换和梅尔频率倒谱系数将时域信号转换成时域-频域信息。需要说明的是，本发明从所述声音信息提取声音信息的声学特征还可以采用其它方式进行，不限于本发明所指的优选方式。

步骤三，构建ResCNN神经网络模型；

其中，按照如下构建ResCNN神经网络模型，卷积网络核的层数为16层：

第1层使用5×5的卷积核，通道数为64，步长为2；

第9层使用5×5的卷积核，通道数为128，步长为2；

接着在时间轴方向上做平均；

第16层为全连接层，输出节点数为512。

其中，y_i为第i段声音的真实的结果，为第i段声音的预测的结果，M表示声音样本数量，M为正整数且M≥1。需要说明的是，y_i为第i段声音信息的真实装修声音为0或者为1；为第i句话装修声预测的概率p介于0和1之间。

softmax函数经常用于解决分类问题，其值对应于判别为该类的概率，所有值加起来刚好等于1。优选的，步骤四后，还将所述预测装修声概率p进行softmax分类(1-p，p)，即概率p为0～1的二分类。

进一步的，为了更快地收敛，本发明还在根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练后，还利用随机梯度下降算法进行神经网络训练。作为本发明优选实施例，采用随机梯度下降算法(StochasticGradientDescent，简称SGD)能有效避免冗余计算，消耗时间更短。当然本领域技术人员还可以采用其它算法。

在本发明实施例中，利用训练好的ResCNN神经网络模型进行预测装修声预测，具体为，判断预测装修声概率p是否大于等于设定阈值，若是则所述声音信息判断为装修声音，若概率p小于设定阈值，则所述声音信息判断为非装修声音。优选地，所述的设定阈值为0.5。

待检测的声音是装修声音或者非装修声音，将该段声音经该神经网络训练出来得到的是0或1的一个判别结果，如果为1为装修声音，则0就是非装修声音。

训练的时候，首先人为地给声音打上标签，并与神经网络预测的结果进行对比，如果神经网络预测结果是装修声音，事实上该段声音是非装修声音或则会产生一个误差，该误差为损失函数，然后经过随机梯度算法SGD或者其他的类似算法来训练，如果输出结果和标签不一致则继续训练，直到输出结果和标签的一致，之后就可以用这个训练完的神经网络架构去进行是否装修声音预测。

需要说明的是，本发明中，在神经网络中，将声音判别结果为装修声音的设置为1，相应的非装修声音的设置为0，则当预测结果为1为装修声音，预测结果为0为非装修声音。也可以将声音将判别结果为非装修声音设置为1，将装修声音的设置为0。

本发明方法不仅用于对装修事件检测，判断待测声音是否为装修声音，在本发明还提供了另一实施例可定位的装修事件检测方法，还可以定位装修声音的位置信息。采用麦克风阵列声源定位的方法，识别装修事件发生位置或具体房间信息，具体实现方式与上述第一实施例的一种装修事件检测方法近似。区别之处在于，所述麦克风或麦克风阵列设置在楼层，用于实时采集楼层或房间的声音；麦克风或麦克风阵列的每个麦克风对应有设备编号，所述麦克风的设备编号对应有位置信息；步骤一中，在正常装修期间外，通过麦克风或麦克风阵列实时采集声音获取待检测的声音信息以及待检测的声音信息所对应的麦克风的设备编号；若利用训练好的ResCNN神经网络模型进行装修声预测判断所述声音信息判断为装修声，获取所述声音信息的麦克风的设备编号，并根据麦克风的设备编号获取装修发生地的位置信息。其他步骤与上述实施例相同，本发明在此不再赘述。

进一步的，上述可定位的装修事件检测方法，每个麦克风的设备编号绑定有楼层信息和/或房号信息；若利用训练好的ResCNN神经网络模型进行装修声预测判断所述声音信息判断为装修声，获取所述声音信息的麦克风的设备编号，并根据麦克风的设备编号查找对应的楼层信息或房间信息，并发送提醒消息反馈至物业管理中心。

相应的，本发明另一实施例中，还提供了所述装修事件检测装置包括麦克风或麦克风陈列、计算机设备，所述麦克风或麦克风陈列用户实时获取环境的声音并发送至计算机设备，所述计算机设备包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储了麦克风的设备编码及其对应的位置信息；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行装修事件检测方法，所述装修事件检测方法为第一实施例相同，本发明在此不再赘述。需要说明的是，在本发明中，麦克风或麦克风阵列设置在楼层的公共区域，如楼房有N层，每层有M个房间，则可以设定N*M阵列个麦克风。当然为了考虑成本的情况，也可以多个房间对应一个麦克风；当每个套房的面积较大，也可以一个套房设置多个麦克风，增加监测的准确性。

本发明另一实施例中，还提供了一种计算机设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储了麦克风的设备编码及其对应的位置信息；所述的位置信息可以为具体位置信息，也可以包含楼层和房号信息；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行装修事件检测方法，所述装修事件检测方法为第一实施例相同，本发明在此不再赘述。

另外，本发明另一实施例中，还提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令被处理器执行时实现装修事件检测方法，所述装修事件检测方法为第一实施例相同，本发明在此不再赘述。

上述说明描述了本发明的优选实施例，但应当理解本发明并非局限于上述实施例，且不应看作对其他实施例的排除。通过本发明的启示，本领域技术人员结合公知或现有技术、知识所进行的改动也应视为在本发明的保护范围内。

Claims

1.一种装修事件检测方法，其特征在于，包括如下步骤：

步骤二，从所述声音信息提取声音信息的声学特征；

步骤三，构建ResCNN神经网络模型；

2.根据权利要求1所述的装修事件检测方法，其特征在于，

所述麦克风或麦克风阵列设置在楼层，用于实时采集楼层或房间的声音；麦克风或麦克风阵列的每个麦克风对应有设备编号，所述麦克风的设备编号对应有位置信息；

3.根据权利要求2所述的装修事件检测方法，其特征在于，

每个麦克风的设备编号绑定有楼层信息和/或房号信息；

4.根据权利要求1所述的装修事件检测方法，其特征在于，

步骤四后，还将所述装修声预测概率p进行softmax分类(1-p，p)，即概率p为0～1的二分类。

5.根据权利要求1所述的装修事件检测方法，其特征在于，

所述构造交叉熵损失函数具体为：每一批训练样本包含M段声音样本，将预测的结果和真实的结果做比较构造一个交叉熵损失函数L，所述交叉熵损失函数公式为如下：

6.根据权利要求1所述的装修事件检测方法，其特征在于，

根据所述交叉熵损失函数对所述ResCNN神经网络模型进行训练后，还利用随机梯度下降算法进行神经网络训练。

7.根据权利要求1所述的装修事件检测方法，其特征在于，

按照如下构建ResCNN神经网络模型，卷积网络核的层数为16层：

第1层使用5×5的卷积核，通道数为64，步长为2；

第9层使用5×5的卷积核，通道数为128，步长为2；

接着在时间轴方向上做平均；

第16层为全连接层，输出节点数为512。

8.一种装修事件检测装置，其特征在于，

所述装修事件检测装置包括麦克风或麦克风陈列、计算机设备，

所述麦克风或麦克风陈列用户实时获取环境的声音并发送至计算机设备，所述计算机设备包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行权利要求1-7中任一项所述的装修事件检测方法。

9.一种计算机设备，其特征在于，

所述计算机设备包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行权利要求1-7中任一项所述的装修事件检测方法。

10.一种非暂态计算机可读存储介质，其特征在于，

所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令被处理器执行时实现如权利要求1-7任一项所述的装修事件检测方法。