CN114550395B

CN114550395B - 声音报警检测方法及设备

Info

Publication number: CN114550395B
Application number: CN202210455293.7A
Authority: CN
Inventors: 张明; 杜文强; 关磊
Original assignee: Changzhou Fenyinta Technology Co ltd
Current assignee: Changzhou Fenyinta Technology Co ltd
Priority date: 2022-04-28
Filing date: 2022-04-28
Publication date: 2022-07-19
Anticipated expiration: 2042-04-28
Also published as: CN114550395A

Abstract

本申请涉及一种声音报警检测方法及设备，方法包括：获取待检测声音数据，对待检测声音数据进行预处理，得到处理后声音数据。计算处理后声音数据中各信号的自相关函数值。基于预设的窗函数，对处理后声音数据中各信号的自相关函数值进行滑窗，得到处理后声音数据中通过滑窗的信号个数，在信号个数处于预设范围值时，进行报警。由于本申请中的预设范围值根据周期性敲击声得到的，无语言能力者可以选择进行周期性的敲击生成待检测声音数据，在待检测声音数据通过滑窗的信号个数处于预设范围值时，判断待检测声音数据为周期性敲击声，此时达到报警条件，进行报警。本申请中还通过自相关函数检测声音的周期规律，从而屏蔽各种噪声，降低误报警率。

Description

声音报警检测方法及设备

技术领域

本申请涉及智能安防技术领域，尤其涉及一种声音报警检测方法及设备。

背景技术

声音报警具有广泛的应用场景，比如在应用到智能安防领域时，在卧室、卫生间等不方便安装摄像头的地方，可以安装声音报警器做为监控，通过语音识别的方式，报警人通过喊出设定的报警敏感词，触发报警装置。但是一些丧失语音能力的人（如不能发音的老人或脑梗患者）无法通过声音报警，现有技术中的声音报警器无法顾及到无语言能力者。

发明内容

为至少在一定程度上克服相关技术中的声音报警器只能识别设定的报警敏感词，无法顾及到无语言能力者的问题，本申请提供一种声音报警检测方法及设备。

本申请的方案如下：

根据本申请实施例的第一方面，提供一种声音报警检测方法，包括：

获取待检测声音数据；

对所述待检测声音数据进行预处理，得到处理后声音数据；

计算所述处理后声音数据中各信号的自相关函数值；

基于预设的窗函数，对所述处理后声音数据中各信号的自相关函数值进行滑窗，得到所述处理后声音数据中通过滑窗的信号个数；

在所述信号个数处于预设范围值时，进行报警；其中，所述预设范围值是根据周期性敲击声得到的。

优选的，在本申请一种可实现的方式中，所述对所述待检测声音数据进行预处理，包括：

基于预设特征提取方法对所述待检测声音数据进行特征提取。

优选的，在本申请一种可实现的方式中，所述预设特征提取方法为Mel频率倒谱系数（Mel Frequency Cepstrum Coefficient,MFCC）或Fbank或CQCC。

优选的，在本申请一种可实现的方式中，所述特征包括多个维度。

优选的，在本申请一种可实现的方式中，所述对所述待检测声音数据进行预处理，还包括：

在多个维度的所述特征中选取符合预设要求的多个子带特征。

将多个所述子带特征进行特征融合。

优选的，在本申请一种可实现的方式中，所述将多个所述子带特征进行特征融合，包括：

将多个所述子带特征进行相加取均值。

根据本申请实施例的第二方面，提供一种声音报警检测设备，包括：

处理器、拾音器和报警器；

所述处理器分别连接所述拾音器和所述报警器；

所述拾音器用于获取待检测声音数据并将所述声音数据发送到所述处理器；

所述处理器用于对所述待检测声音数据进行预处理，得到处理后声音数据；计算所述处理后声音数据中各信号的自相关函数值；基于预设的窗函数，对所述处理后声音数据中各信号的自相关函数值进行滑窗，得到所述处理后声音数据中通过滑窗的信号个数；在所述信号个数处于预设范围值时，控制所述报警器进行报警；其中，所述预设范围值是根据周期性敲击声得到的。

本申请提供的技术方案可以包括以下有益效果：本申请中的声音报警检测方法，包括：获取待检测声音数据，对待检测声音数据进行预处理，得到处理后声音数据。计算处理后声音数据中各信号的自相关函数值。基于预设的窗函数，对处理后声音数据中各信号的自相关函数值进行滑窗，得到处理后声音数据中通过滑窗的信号个数，在信号个数处于预设范围值时，进行报警。由于本申请中的预设范围值根据周期性敲击声得到的，无语言能力者可以选择进行周期性的敲击生成待检测声音数据，在待检测声音数据通过滑窗的信号个数处于预设范围值时，判断待检测声音数据为周期性敲击声，此时达到报警条件，进行报警。本申请中还通过自相关函数检测声音的周期规律，从而屏蔽如电视声、日常聊天声等各种噪声，降低误报警率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1是本申请一个实施例提供的一种声音报警检测方法的流程示意图；

图2是本申请另一个实施例提供的一种声音报警检测方法的流程示意图；

图3是本申请一个实施例提供的一种声音报警检测设备的结构示意图。

附图标记：处理器-21；拾音器-22；报警器-23。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

一种声音报警检测方法，参照图1，包括：

S11：获取待检测声音数据；

本实施例中，可以在卧室、卫生间等不方便安装摄像头的地方，安装拾音器来采集待检测声音数据。

待检测声音数据可能为电视声、日常聊天声等杂音，也可能为无语言能力者发出的报警声音数据。

S12：对待检测声音数据进行预处理，得到处理后声音数据；

对待检测声音数据进行预处理，参照图2，包括：

S121：基于预设特征提取方法对待检测声音数据进行特征提取；

本实施例中，可以但不限于采用MFCC或Fbank或CQCC方法对待检测声音数据进行特征提取。

MFCC或Fbank或CQCC等声音特征提取方法均为成熟的现有技术，此处不做赘述。

本实施例中，通过预设特征提取方法提取待检测声音数据中多个维度的特征。

S122：在多个维度的特征中选取符合预设要求的多个子带特征；

举例说明：如包括13维度的MFCC特征，本实施例中可取符合预设要求的第二维度和第三维度特征作为子带特征。

S123：将多个子带特征进行特征融合。

特征融合具有多种，本实施例中可以但不限于将多个子带特征进行相加取均值进行特征融合。

本实施例中，通过将多个子带特征进行特征融合从而去除扰动，增加模型鲁棒性。

S13：计算处理后声音数据中各信号的自相关函数值；

S14：基于预设的窗函数，对处理后声音数据中各信号的自相关函数值进行滑窗，得到处理后声音数据中通过滑窗的信号个数；

对于计算得到的自相关函数值，通过设定特定长的窗函数，对处理后声音数据中各信号的自相关函数值进行滑窗，统计处理后声音数据中通过滑窗的信号个数。

具体的，判断统计处理后声音数据中每个信号的自相关函数值是否大于预设阈值a，处理后声音数据中每有一个大于预设阈值a的信号，进行一次计数，统计最后的计数n。

S15：在信号个数处于预设范围值时，进行报警；其中，预设范围值是根据周期性敲击声得到的。

在计数n处于预设范围值m时，判断待检测声音数据为周期性敲击声，而非其他周期性声音，进行报警。

本实施例中的声音报警检测方法，包括：获取待检测声音数据，对待检测声音数据进行预处理，得到处理后声音数据。计算处理后声音数据中各信号的自相关函数值。基于预设的窗函数，对处理后声音数据中各信号的自相关函数值进行滑窗，得到处理后声音数据中通过滑窗的信号个数，在信号个数处于预设范围值时，进行报警。由于本实施例中的预设范围值根据周期性敲击声得到的，无语言能力者可以选择进行周期性的敲击生成待检测声音数据，在待检测声音数据通过滑窗的信号个数处于预设范围值时，判断待检测声音数据为周期性敲击声，此时达到报警条件，进行报警。本申请中还通过自相关函数检测声音的周期规律，从而屏蔽如电视声、日常聊天声等各种噪声，降低误报警率。

一种声音报警检测设备，参照图3，包括：

处理器21、拾音器22和报警器23；

处理器21分别连接拾音器和报警器；

拾音器22用于获取待检测声音数据并将声音数据发送到处理器21；

处理器21用于对待检测声音数据进行预处理，得到处理后声音数据；计算处理后声音数据中各信号的自相关函数值；基于预设的窗函数，对处理后声音数据中各信号的自相关函数值进行滑窗，得到处理后声音数据中通过滑窗的信号个数；在信号个数处于预设范围值时，控制报警器23进行报警；其中，预设范围值是根据周期性敲击声得到的。

本实施例中的拾音器22可以但不限于为麦克风。

本实施例中的报警器23可以但不限于为声光报警器。

可以理解的是，上述各实施例中相同或相似部分可以相互参考，在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是，在本申请的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本申请的描述中，除非另有说明，“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种声音报警检测方法，其特征在于，包括：

获取待检测声音数据；

对所述待检测声音数据进行预处理，得到处理后声音数据；包括：基于预设特征提取方法对所述待检测声音数据进行特征提取，特征包括多个维度，在多个维度的所述特征中选取符合预设要求的多个子带特征，将多个所述子带特征进行特征融合；

计算所述处理后声音数据中各信号的自相关函数值；

2.根据权利要求1所述的方法，其特征在于，所述预设特征提取方法为MFCC或Fbank或CQCC。

3.根据权利要求1所述的方法，其特征在于，所述将多个所述子带特征进行特征融合，包括：

将多个所述子带特征进行相加取均值。

4.一种声音报警检测设备，其特征在于，包括：

处理器、拾音器和报警器；

所述处理器分别连接所述拾音器和所述报警器；

所述处理器用于对所述待检测声音数据进行预处理，得到处理后声音数据；计算所述处理后声音数据中各信号的自相关函数值；基于预设的窗函数，对所述处理后声音数据中各信号的自相关函数值进行滑窗，得到所述处理后声音数据中通过滑窗的信号个数；在所述信号个数处于预设范围值时，控制所述报警器进行报警；其中，所述预设范围值是根据周期性敲击声得到的；

其中，所述对所述待检测声音数据进行预处理包括：基于预设特征提取方法对所述待检测声音数据进行特征提取，特征包括多个维度，在多个维度的所述特征中选取符合预设要求的多个子带特征，将多个所述子带特征进行特征融合。