CN110460809A

CN110460809A - 一种婴儿哭声侦测方法、装置及智能摄像头设备

Info

Publication number: CN110460809A
Application number: CN201910606006.6A
Authority: CN
Inventors: 刘建材; 孙国勇; 缪理宾; 李康; 林加卫
Original assignee: Suning Intelligent Terminal Co Ltd
Current assignee: Suning Intelligent Terminal Co Ltd
Priority date: 2019-07-05
Filing date: 2019-07-05
Publication date: 2019-11-15

Abstract

本发明公开了一种婴儿哭声侦测方法、装置及智能摄像头设备，属于智能摄像头设备领域，方法包括：获取实时采集的环境声音，判断环境声音中是否有异常声音；当有异常声音时，通过摄像头采集异常声音所在区域的当前图像；判断当前图像中是否存在人体运动和/或哭泣表情的人脸；当当前图像中存在人体运动和/或哭泣表情的人脸时，连续N次判断异常声音所在区域的实时声音是否为婴儿哭声，N大于等于1；若连续N次都判断出当前声音为婴儿哭声时，则以告警的方式通知预设的客户端。本发明实施例提供的技术方案可以有效提高哭声检测的准确率和效率。

Description

一种婴儿哭声侦测方法、装置及智能摄像头设备

技术领域

本发明涉及智能摄像头设备领域，特别涉及一种婴儿哭声侦测方法、装置及智能摄像头设备。

背景技术

近年来随着互联网技术的发展，市场上一些厂家纷纷推出了解决用户痛点的新一代智能家用摄像头。新一代摄像头通常会具有人脸识别、声音识别、运动检测、云台转动、红外拍夜间摄等功能，但由于成本及相关技术的限制，很多功能往往是单独使用，更多的是营销噱头，实用效果并不佳。

哭声侦测功能可以解决父母关心孩子的需求，现有技术的方案主要分为在线和离线两种方案。

方案一：设备端使用离线声音识别算法，通过检测儿童哭声的特殊频率实现对哭声的识别，但此方案受环境影响较大，当儿童哭声时长较短或环境中有其他声音影响时，准确率较低。

方案二：设备端采用在线平台方案，将声音上传到云端，通过云端大数据哭声模型分析计算将结果反馈回终端，虽然此方案检测准确率较高，但此方案依赖于设备联网，在设备外网不通的情况下无法使用，效率较低，并且采用平台方案通常成本较高。

发明内容

针对上述现有技术中存在的问题，本发明提供了一种婴儿哭声侦测方法、装置及智能摄像头设备，可以有效提高哭声检测的准确率和效率。

根据本发明的一个实施例，提供了一种婴儿哭声侦测方法，应用于智能摄像头设备中，所述方法包括：

获取实时采集的环境声音，判断所述环境声音中是否有异常声音；

当有异常声音时，通过摄像头采集所述异常声音所在区域的当前图像；

判断所述当前图像中是否存在人体运动和/或哭泣表情的人脸；

当所述当前图像中存在人体运动和/或哭泣表情的人脸时，连续N次判断所述异常声音所在区域的实时声音是否为婴儿哭声，N大于等于1；

若连续N次都判断出所述当前声音为婴儿哭声时，则以告警的方式通知预设的客户端。

进一步地，所述异常声音为婴儿哭声。

进一步地，所述当有异常声音时，通过摄像头采集所述异常声音所在区域的当前图像，包括：

控制云台将摄像头转向所述异常声音所在区域；

通过所述摄像头对所述异常声音所在区域进行拍摄采集所述当前图像。

进一步地，所述通过所述摄像头对所述异常声音所在区域进行拍摄采集所述当前图像，包括：

检测当前环境亮度是否低于预设亮度阈值；

当检测所述当前环境亮度低于所述预设亮度阈值时，则开启所述摄像头的红外拍摄功能对所述异常声音所在区域进行拍摄采集所述当前图像。

进一步地，所述判断所述当前图像中是否存在人体运动，包括：

对所述当前图像进行人形检测和运动检测，判断所述当前图像中是否存在人体运动；

所述判断所述当前图像中是否存在哭泣表情的人脸，包括：

检测所述当前图像中是否存在人脸；

若所述当前图像包含人脸，则识别所述人脸的表情是否为哭泣表情。

进一步地，所述方法还包括：

当所述当前图像不存在人体运动以及哭泣表情的人脸时，连续M次判断所述异常声音所在区域的实时声音是否为婴儿哭声，其中，M大于N；

当判断出所述当前声音为婴儿哭声的次数大于预设次数时，则以告警的方式通知所述客户端。

根据本发明的另一个实施例，提供了一种婴儿哭声侦测装置，应用于智能摄像头设备中，所述装置包括：

声音获取模块，用于获取实时采集的环境声音；

第一判断模块，用于判断所述环境声音中是否有异常声音；

图像获取模块，用于当有异常声音时，通过摄像头采集所述异常声音所在区域的当前图像；

第二判断模块，用于判断所述当前图像中是否存在人体运动和/或哭泣表情的人脸；

所述第一判断模块，还用于当所述当前图像中存在人体运动和/或哭泣表情的人脸时，连续N次判断所述异常声音所在区域的实时声音是否为婴儿哭声，N大于等于1；

告警通知模块，用于若所述第一判断模块连续N次都判断出所述当前声音为婴儿哭声时，则以告警的方式通知预设的客户端。

进一步地，所述异常声音为婴儿哭声。

进一步地，所述图像获取模块具体用于：

控制云台将摄像头转向所述异常声音所在区域；

进一步地，所述图像获取模块具体还用于：

检测当前环境亮度是否低于预设亮度阈值；

进一步地，所述第二判断模块包括：

人形运动检测单元，用于对所述当前图像进行人形检测和运动检测，判断所述当前图像中是否存在人体运动；

人脸识别单元，用于检测所述当前图像中是否存在人脸，若所述当前图像包含人脸，则识别所述人脸的表情是否为哭泣表情。

进一步地，所述第一判断模块具体还用于：

所述告警通知模块具体还用于：

当所述第一判断模块判断出所述当前声音为婴儿哭声的次数大于预设次数时，则以告警的方式通知所述客户端。

根据本发明的又一个实施例，提供了一种智能摄像头设备，包括摄像头、云台；

还包括处理器和存储有机器可执行指令的机器可读存储介质，通过读取并执行机器可读存储介质中的机器可执行指令，所述处理器可执行如上述实施例所述的婴儿哭声侦测方法。

本发明实施例提供一种婴儿哭声侦测方法、装置及智能摄像头设备，通过判断实时采集的环境声音中是否有异常声音，当有异常声音时，通过摄像头采集异常声音所在区域的当前图像，判断当前图像中是否存在人体运动和/或哭泣表情的人脸，当当前图像中存在人体运动和/或哭泣表情的人脸时，连续N次判断异常声音所在区域的实时声音是否为婴儿哭声，N大于等于1，若连续N次都判断出当前声音为婴儿哭声时，则以告警的方式通知预设的客户端。本发明在整个婴儿哭声检测过程不再依赖于某一个单一算法，而是通过算法组合的方式实现婴儿哭声检测，在不提高现有产品成本和大幅增加算法复杂度的基础上能够提高哭声侦测的准确率；另外，通过使用离线方式的声音识别算法，能够提高婴儿哭声检测效率，避免了因使用在线平台导致的产品成本大幅提高及检测效率的下降等问题，提高了用户体验。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一个实施例提供的婴儿哭声侦测方法的流程图；

图2为本发明一个实施例提供的婴儿哭声侦测装置的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，除非上下文明确要求，否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义；也就是说，是“包括但不限于”的含义。

此外，在本发明的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

实施例一

本发明实施例提供了一种婴儿哭声侦测方法，该方法可以由设置在智能摄像头设备内的婴儿哭声侦测装置来执行，该装置可以采用软件/硬件的方式实现，其中，智能摄像头设备可以安装在婴儿房间内，如图1所示，该方法可以包括：

步骤101，获取实时采集的环境声音，判断环境声音中是否有异常声音。

这里，环境声音是指婴儿房间内的周围环境的声音。

具体地，该过程可以包括：

智能摄像头设备获取麦克风阵列实时采集的环境声音，其中，麦克风阵列中的不同麦克风采集房间内不同方位的环境声音，麦克风阵列设置在智能摄像头设备上；智能摄像头设备对各个麦克风采集到的环境声音进行检测，判断环境声音是否满足异常条件，若满足，则确定该环境声音为异常声音。

其中，异常条件为环境声音的音量超过预设音量和/或环境声音的频率处于哭声频率的范围。

进一步地，为使得智能摄像头更有针对性地进行哭声侦测，当判断出环境声音中的异常声音为婴儿哭声时，才执行步骤102，否则继续重复执行步骤101。

其中，判断环境声音中的异常声音是否为婴儿哭声，可以包括：

对异常声音进行采样抽取出多个声音帧，将多个声音帧中的每一声音帧分别与预设的哭声频率段进行比较，判断该声音帧是否为哭声帧，当有超过预设帧数的声音帧为哭声帧时，则确定异常声音为婴儿哭声，否则，确定异常声音不是婴儿哭声。

需要说明的是，当环境声音中未包含异常声音时，则继续重复执行步骤101。

步骤102，当有异常声音时，通过摄像头采集异常声音所在区域的当前图像。

具体地，控制云台将摄像头转向异常声音所在区域，通过摄像头对异常声音所在区域进行拍摄采集当前图像。

本实施例中，智能摄像头设备可以控制电机驱动云台将摄像头转向出现异常声音的区域，并通过摄像头进行拍摄采集该区域内的当前图像。

其中，通过摄像头对异常声音所在区域进行拍摄采集当前图像，该过程可以包括：

检测当前环境亮度是否低于预设亮度阈值，当检测当前环境亮度低于预设亮度阈值时，则开启摄像头的红外拍摄功能对异常声音所在区域进行拍摄采集当前图像。

本实施例中，智能摄像头设备可以通过光线检测模块获得摄像头周围的光线强度，判断该当前环境亮度是否低于预设亮度阈值，若低于预设亮度阈值，则开启摄像头的红外拍摄功能对异常声音所在区域进行拍摄采集包括多帧图像的当前图像。其中，光线检测模块可以是光线传感器或摄像感光元器件，光线传感器或摄像感光元器件(例如，CCD和CMOS)均具有检测周边环境光线亮度的功能。

步骤103，判断当前图像中是否存在人体运动和/或哭泣表情的人脸。

其中，判断当前图像中是否存在人体运动，该过程可以包括：

对当前图像进行人形检测和运动检测，判断当前图像中是否存在人体运动。

本实施例中，智能摄像头设备可以基于SVM的人形识别算法检测当前图像中是否存在人形，并根据基于时间差分的运动检测算法检测当前图像中的物体是否移动。

其中，判断当前图像中是否存在哭泣表情的人脸，包括：

检测当前图像中是否存在人脸，若当前图像包含人脸，则识别人脸的表情是否为哭泣表情。

本实施例中，可以采用基于模板的人脸识别算法进行检测当前图像中是否人脸，当检测到当前图像包含人脸时，对人脸的五官进行轮廓线提取，获得五官轮廓线，根据五官轮廓线识别人脸的表情是否为哭泣表情。其中，五官轮廓线中包括眼部、鼻部和嘴部的轮廓线。

在实际应用中，为了避免婴儿周围可能有遮挡物而影响到婴儿哭声侦测的准确性，当当前图像中不存在人体运动以及哭泣表情的人脸时，可以以预设间隔时间连续两次执行步骤103，其中预设间隔时间可以为1s。

步骤104，当当前图像中存在人体运动和/或哭泣表情的人脸时，连续N次判断异常声音所在区域的实时声音是否为婴儿哭声，N大于等于1。

其中，N次判断的间隔时间可以设置相同时间，例如均设置为1s。N优选取值为2，即连续两次判断异常声音所在区域的实时声音是否为婴儿哭声，可以理解的是，每一次所判断的异常声音所在区域的实时声音并不是同一个声音，而是在不同时间点所采集到的异常声音所在区域的声音。

其中，判断异常声音所在区域的实时声音是否为婴儿哭声，该过程可以包括：

对异常声音所在区域的实时声音进行采样抽取出多个声音帧，将多个声音帧中的每一声音帧分别与预设的哭声频率段进行比较，判断该声音帧是否为哭声帧，当有超过预设帧数的声音帧为哭声帧时，则确定异常声音所在区域的实时声音为婴儿哭声，否则，确定异常声音所在区域的实时声音不是婴儿哭声。

步骤105，若连续N次都判断出当前声音为婴儿哭声时，则以告警的方式通知预设的客户端。

本实施例中，智能摄像头设备当连续N次都判断出当前声音为婴儿哭声时，可以通过摄像头录制婴儿哭声文件并推送到预设的客户端，例如婴儿父母的手机上。

进一步地，本发明实施例提供的方法还可以包括：

当当前图像不存在人体运动以及哭泣表情的人脸时，连续M次判断异常声音所在区域的实时声音是否为婴儿哭声，当判断出当前声音为婴儿哭声的次数大于预设次数时，则以告警的方式通知预设的客户端，其中，M大于N。

本实施例中，M优选取值为6，预设次数优选取值为5，即当当前图像不存在人体运动以及哭泣表情的人脸时，连续6次判断异常声音所在区域的实时声音是否为婴儿哭声，当其中5次判断出异常声音所在区域的实时声音为婴儿哭声时，则录制婴儿哭声文件并推送到婴儿父母的手机上。

本发明实施例提供的婴儿哭声侦测方法，在整个婴儿哭声检测过程不再依赖于某一个单一算法，而是通过算法组合的方式实现婴儿哭声检测，在不提高现有产品成本和大幅增加算法复杂度的基础上能够提高哭声侦测的准确率；另外，通过使用离线方式的声音识别算法，能够提高婴儿哭声检测效率，避免了因使用在线平台导致的产品成本大幅提高及检测效率的下降等问题，提高了用户体验。

实施例二

作为对上述实施例中的婴儿哭声侦测方法的实现，本发明实施例还提供一种婴儿哭声侦测装置，应用于智能摄像头设备中，参照图2所示，图2是本发明实施例提供的一种婴儿哭声侦测装置的结构示意图，装置包括：

声音获取模块21，用于获取实时采集的环境声音；

第一判断模块22，用于判断环境声音中是否有异常声音；

图像获取模块23，用于当有异常声音时，通过摄像头采集异常声音所在区域的当前图像；

第二判断模块24，用于判断当前图像中是否存在人体运动和/或哭泣表情的人脸；

第一判断模块22，还用于当当前图像中存在人体运动和/或哭泣表情的人脸时，连续N次判断异常声音所在区域的实时声音是否为婴儿哭声，N大于等于1；

告警通知模块25，用于若第一判断模块22连续N次都判断出当前声音为婴儿哭声时，则以告警的方式通知预设的客户端。

优选地，异常声音为婴儿哭声。

进一步地，图像获取模块23具体用于：

控制云台将摄像头转向异常声音所在区域；

通过摄像头对异常声音所在区域进行拍摄采集当前图像。

进一步地，图像获取模块23具体还用于：

检测当前环境亮度是否低于预设亮度阈值；

当检测当前环境亮度低于预设亮度阈值时，则开启摄像头的红外拍摄功能对异常声音所在区域进行拍摄采集当前图像。

进一步地，第二判断模块24包括：

人形运动检测单元，用于对当前图像进行人形检测和运动检测，判断当前图像中是否存在人体运动；

人脸识别单元，用于检测当前图像中是否存在人脸，若当前图像包含人脸，则识别人脸的表情是否为哭泣表情。

进一步地，第一判断模块22具体还用于：

当当前图像不存在人体运动以及哭泣表情的人脸时，连续M次判断异常声音所在区域的实时声音是否为婴儿哭声，其中，M大于N；

告警通知模块25具体还用于：

当第一判断模块22判断出当前声音为婴儿哭声的次数大于预设次数时，则以告警的方式通知客户端。

本发明实施例提供的婴儿哭声侦测装置，与本发明实施例所提供的婴儿哭声侦测方法属于同一发明构思，可执行本发明实施例所提供的婴儿哭声侦测方法，具备执行婴儿哭声侦测方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明实施例提供的婴儿哭声侦测方法，此处不再加以赘述。

此外，本发明实施例还提供了一种智能摄像头设备，包括摄像头、云台；

本领域内的技术人员应明白，本发明实施例中的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例中是参照根据本发明实施例中实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例中的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例中范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种婴儿哭声侦测方法，其特征在于，应用于智能摄像头设备中，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述异常声音为婴儿哭声。

3.根据权利要求1或2所述的方法，其特征在于，所述当有异常声音时，通过摄像头采集所述异常声音所在区域的当前图像，包括：

控制云台将摄像头转向所述异常声音所在区域；

4.根据权利要求3所述的方法，其特征在于，所述通过所述摄像头对所述异常声音所在区域进行拍摄采集所述当前图像，包括：

检测当前环境亮度是否低于预设亮度阈值；

5.根据权利要求1或2所述的方法，其特征在于，所述判断所述当前图像中是否存在人体运动，包括：

所述判断所述当前图像中是否存在哭泣表情的人脸，包括：

检测所述当前图像中是否存在人脸；

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

7.一种婴儿哭声侦测装置，其特征在于，应用于智能摄像头设备中，所述装置包括：

声音获取模块，用于获取实时采集的环境声音；

第一判断模块，用于判断所述环境声音中是否有异常声音；

告警通知模块，用于若连续N次都判断出所述当前声音为婴儿哭声时，则以告警的方式通知预设的客户端。

8.根据权利要求7所述的装置，其特征在于，所述异常声音为婴儿哭声。

9.根据权利要求7或8所述的装置，其特征在于，所述第一判断模块具体还用于：

10.一种智能摄像头设备，其特征在于，包括摄像头、云台；

还包括处理器和存储有机器可执行指令的机器可读存储介质，通过读取并执行机器可读存储介质中的机器可执行指令，所述处理器可执行如权利要求1至6任一项所述的婴儿哭声侦测方法。