WO2018133874A1

WO2018133874A1 - 一种发送报警消息的方法和装置

Info

Publication number: WO2018133874A1
Application number: PCT/CN2018/073775
Authority: WO
Inventors: 童昊浩; 童俊艳; 任烨
Original assignee: 杭州海康威视数字技术股份有限公司
Priority date: 2017-01-23
Filing date: 2018-01-23
Publication date: 2018-07-26
Also published as: CN108345819B; EP3572974B1; EP3572974A1; US11386698B2; US20210319211A1; CN108345819A; EP3572974A4

Abstract

一种发送报警消息的方法和装置，属于计算机技术领域。所述方法包括：获取摄像设备拍摄的检测图像(201)；基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域(202)；根据人脸图像区域和头肩图像区域的检测结果，在所述检测图像中确定目标检测区域(203)；根据预设的通电话判定算法模型，检测所述目标检测区域的图像对应的人物通电话状态信息，如果所述人物通电话状态信息为通电话，则向服务器发送第一报警消息(204)。采用该方法，可以使安保人员及时获知可能存在受到欺骗的用户，并进行处理，避免用户的财产受到损失。

Description

一种发送报警消息的方法和装置

本申请要求于2017年01月23日提交国家知识产权局、申请号为201710050732.5、发明名称为“一种发送报警消息的方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，特别涉及一种发送报警消息的方法和装置。

背景技术

随着金融、通信行业的快速发展，电信诈骗在中国发展蔓延，出现频率越来越高。电信诈骗主要指犯罪分子利用电话致电移动终端的使用者，诱骗其至ATM(Automatic Teller Machine,自动出纳机)进行金融交易，并利用移动电话控制其操作，从而谋取利益。

为了避免电信诈骗给人们造成损失，目前，银行在ATM周围都会配备一些安保人员，安保人员会观察在ATM上办理业务的用户，如果安保人员判断该用户可能是被诈骗分子控制的用户，则对该用户进行提醒，并在必要时对其交易进行干涉。这样，可以在一定程度上阻止用户上当受骗，避免用户的财产受到损失。

在实现本申请的过程中，发明人发现相关技术至少存在以下问题：

安保人员的观察能力有限，尤其是在银行中的人较多时，无法注意到每一个受到欺骗的用户，导致用户的财产受到损失。

发明内容

为了解决相关技术的问题，本申请实施例提供了一种发送报警消息的方法。所述技术方案如下：

第一方面，提供了一种发送报警消息的方法，所述方法包括：

获取摄像设备拍摄的检测图像；

在所述检测图像中确定目标检测区域；

根据预设的通电话判定算法模型，检测所述目标检测区域的图像对应的人物通电话状态信息，如果所述人物通电话状态信息为通电话，则向服务器发送第一报警消息。

可选的，所述在所述检测图像中确定目标检测区域，包括：

基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域；

根据人脸图像区域和头肩图像区域的检测结果，在所述检测图像中确定目标检测区域。

可选的，所述根据人脸图像区域和头肩图像区域的检测结果，在所述检测图像中确定目标检测区域，包括：

如果检测到人脸图像区域和头肩图像区域，则根据预先存储的人脸图像区域、头肩图像区域和检测区域的位置关系，在所述检测图像中确定目标检测区域；

如果检测到人脸图像区域，未检测到头肩图像区域，则对检测到的人脸图像区域进行放大处理，将放大处理后的人脸图像区域作为目标检测区域；

如果检测到头肩图像区域，未检测到人脸图像区域，则对检测到的头肩图像区域进行缩小处理，将缩小处理后的头肩图像区域作为目标检测区域。

这样，提供了在不同情况下确定目标检测区域的实现方式，提高了目标检测区域的检出率。

可选的，所述方法还包括：

获取预先存储的多个训练样本，所述训练样本包括图像样本，及所述图像样本中的人脸图像区域和/或头肩图像区域；

基于所述多个训练样本，对预设的第一初始算法模型进行训练，得到所述人脸和头肩检测算法模型。

这样，提供了一种训练人脸和头肩检测算法模型的实现方式。

可选的，所述方法还包括：

获取预先存储的多个训练样本，所述训练样本包括图像样本，及所述图像样本对应的人物通电话状态信息；

基于所述多个训练样本，对预设的第二初始算法模型进行训练，得到所述通电话判定算法模型。

这样，提供了一种训练通电话判定算法模型的实现方式。

可选的，所述基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域，包括：

基于预设的人脸和头肩检测算法模型，在所述检测图像中确定人脸图像待定区域和头肩图像待定区域，并确定所述人脸图像待定区域对应的置信度和所述头肩图像待定区域对应的置信度；

根据预先存储的位置信息和权重的对应关系，确定所述人脸图像待定区域对应的权值，以及所述头肩图像待定区域对应的权值；

如果所述人脸图像待定区域对应的置信度大于预设的第一置信度阈值，且所述人脸图像待定区域对应的权值大于预设的第一权值阈值，则将所述人脸图像待定区域作为人脸图像区域；

如果所述头肩图像待定区域对应的置信度大于预设的第二置信度阈值，且所述头肩图像待定区域对应的权值大于预设的第二权值阈值，则将所述头肩图像待定区域作为头肩图像区域。

这样，结合位置信息来确定人脸图像区域和头肩图像区域，可以提高确定人脸图像区域和头肩图像区域的准确度。

可选的，所述方法还包括：

确定当前检测到的人脸图像区域和/或头肩图像区域，与当前时间最接近的上一帧检测图像中的人脸图像区域和/或头肩图像区域的相似度；

所述向服务器发送第一报警消息之前，还包括：

如果所述相似度不满足预设相似度条件，则执行向服务器发送第一报警消息的步骤。

这样，可以避免对同一对象重复发送报警消息。

可选的，所述方法还包括：

获取语音输入设备检测到的语音信息；

如果所述语音信息包含预设的关键词，则向所述服务器发送第二报警消息。

这样，可以根据语音信息来发送报警消息，可以实现多级报警，安保人员则可以根据不同的报警消息进行不同的处理，如关注或去现场查看等，从而可以提高用户体验。

可选的，所述基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域之前，还包括：

如果达到预设的检测触发条件，则执行基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域的步骤；

所述预设的检测触发条件至少包括：

在所述检测图像中检测到人物活动信息；或者，

接收到目标设备发送的操作通知消息；或者，

接收到传感设备发送的对象检测通知。

可选的，所述方法还包括：

确定当前检测到的人脸图像区域和/或头肩图像区域，与预设时长内获取到的各帧检测图像中的人脸图像区域和/或头肩图像区域的各相似度；

所述向服务器发送第一报警消息之前，还包括：

如果得到的各相似度均不满足预设相似度条件，则执行向服务器发送第一报警消息的步骤。

第二方面，提供了一种发送报警消息的装置，所述装置包括：

第一获取模块，用于获取摄像设备拍摄的检测图像；

第一确定模块，用于在所述检测图像中确定目标检测区域；

第一发送模块，用于根据预设的通电话判定算法模型，检测所述目标检测区域的图像对应的人物通电话状态信息，如果所述人物通电话状态信息为通电话，则向服务器发送第一报警消息。

可选的，所述装置还包括：

检测模块，用于基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域；

所述第一确定模块，用于：根据人脸图像区域和头肩图像区域的检测结果，在所述检测图像中确定目标检测区域。

可选的，所述第一确定模块，用于：

可选的，所述装置还包括：

第二获取模块，用于获取预先存储的多个训练样本，所述训练样本包括图像样本，及所述图像样本中的人脸图像区域和/或头肩图像区域；

第一训练模块，用于基于所述多个训练样本，对预设的第一初始算法模型进行训练，得到所述人脸和头肩检测算法模型。

可选的，所述装置还包括：

第三获取模块，用于获取预先存储的多个训练样本，所述训练样本包括图像样本，及所述图像样本对应的人物通电话状态信息；

第二训练模块，用于基于所述多个训练样本，对预设的第二初始算法模型进行训练，得到所述通电话判定算法模型。

可选的，所述检测模块，包括：

第一确定子模块，用于基于预设的人脸和头肩检测算法模型，在所述检测图像中确定人脸图像待定区域和头肩图像待定区域，并确定所述人脸图像待定区域对应的置信度和所述头肩图像待定区域对应的置信度；

第二确定子模块，用于根据预先存储的位置信息和权重的对应关系，确定所述人脸图像待定区域对应的权值，以及所述头肩图像待定区域对应的权值；

所述第二确定子模块，还用于如果所述人脸图像待定区域对应的置信度大于预设的第一置信度阈值，且所述人脸图像待定区域对应的权值大于预设的第一权值阈值，则将所述人脸图像待定区域作为人脸图像区域；

所述第二确定子模块，还用于如果所述头肩图像待定区域对应的置信度大于预设的第二置信度阈值，且所述头肩图像待定区域对应的权值大于预设的第二权值阈值，则将所述头肩图像待定区域作为头肩图像区域。

可选的，所述装置还包括：

第二确定模块，用于确定当前检测到的人脸图像区域和/或头肩图像区域，与当前时间最接近的上一帧检测图像中的人脸图像区域和/或头肩图像区域的相似度；

所述第一发送模块，用于：

可选的，所述装置还包括：

第四获取模块，用于获取语音输入设备检测到的语音信息；

第二发送模块，用于如果所述语音信息包含预设的关键词，则向所述服务器发送第二报警消息。

可选的，所述装置还包括：

第三确定模块，用于如果达到预设的检测触发条件，则执行基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域的步骤；

所述预设的检测触发条件至少包括：

在所述检测图像中检测到人物活动信息；或者，

接收到目标设备发送的操作通知消息；或者，

接收到传感设备发送的对象检测通知。

可选的，所述第一确定模块，还用于：

所述第一发送模块，还用于：

第三方面，提供了一种计算机可读存储介质，所述存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的方法步骤。

第四方面，提供了一种终端，所述终端包括：

一个或多个处理器；和

存储器；

所述存储器存储有一个或多个程序，所述一个或多个程序被配置成由所述一个或多个处理器执行，所述一个或多个程序包含用于进行如第一方面所述的方法步骤的指令。

本申请实施例提供的技术方案带来的有益效果是：

本申请实施例中，终端获取到摄像设备拍摄的检测图像后，可以在检测图像中确定目标检测区域，根据预设的通电话判定算法模型，检测目标检测区域的图像对应的人物通电话状态信息，如果人物通电话状态信息为通电话，则向服务器发送第一报警消息，这样，可以及时的识别出用户是否在打电话，并可以在检测到打电话时，及时发送报警消息，以使安保人员及时获知可能存在受到欺骗的用户，并进行处理，避免用户的财产受到损失。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1a是本申请实施例提供的一种系统框架图；

图1b是本申请实施例提供的一种发送报警消息的方法流程图；

图2是本申请实施例提供的一种发送报警消息的方法流程图；

图3a、图3b、图3c是本申请实施例提供的一种检测结果的示意图；

图4a、图4b、图4c是本申请实施例提供的目标检测区域的示意图；

图5是本申请实施例提供的一种界面显示示意图；

图6是本申请实施例提供的一种发送报警消息的装置结构示意图；

图7是本申请实施例提供的一种发送报警消息的装置结构示意图；

图8是本申请实施例提供的一种发送报警消息的装置结构示意图；

图9是本申请实施例提供的一种发送报警消息的装置结构示意图；

图10是本申请实施例提供的一种发送报警消息的装置结构示意图；

图11是本申请实施例提供的一种发送报警消息的装置结构示意图；

图12是本申请实施例提供的一种发送报警消息的装置结构示意图；

图13是本申请实施例提供的一种发送报警消息的装置结构示意图；

图14是本申请实施例提供的一种终端的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请实施例提供了一种发送报警消息的方法，该方法的执行主体可以是终端，也可以是服务器。本实施例以执行主体为终端为例进行说明，其他情况与之类似。该终端可以是具有数据处理功能的终端，如计算机。该终端可以分别与摄像设备和某报警平台的后台服务器连接。其中，摄像设备可以安装在用于办理资金业务的设备(如ATM)上，也可以安装在用于办理资金业务的设备周围。摄像设备可以进行图像拍摄，并可以将拍摄到的图像(即检测图像)实时发送给终端，终端接收到检测图像后，可以对检测图像进行分析，从而识别检测图像中的人物是否在打电话，如果是，则可以向报警平台的服务器发送报警消息。服务器则在接收到报警消息后，向安保人员的终端(如监控终端)发送警报提示信息，以提示安保人员进行处理，避免用户的财产受到损失。如图1a所示，为本实施例提供的系统框架图，其中包括摄像设备、终端和服务器。

终端可以包括收发器、处理器和存储器。收发器可以用于接收摄像设备拍摄的检测图像；处理器可以为CPU(Central Processing Unit，中央处理单元)等，可以基于预设的人脸和头肩检测算法模型，在检测图像中检测人脸图像区域和头肩图像区域，然后根据人脸图像区域和头肩图像区域的检测结果，在检测图像中确定目标检测区域，进而根据预设的通电话判定算法模型，检测目标检测区域的图像对应的人物通电话状态信息，如果人物通电话状态信息为通电话，则可以控制收发器向服务器发送第一报警消息；存储器可以为RAM(Random Access Memory，随机存取存储器)、Flash(闪存)等，可以用于存储接收到的数据、处理过程所需的数据、处理过程中生成的数据等，如检测图像、人脸和头肩检测算法模型、以及通电话判定算法模型等。另外，该终端还可以包括蓝牙和电源等部件。

下面将结合具体实施方式，以办理资金业务的设备为ATM为例，对图1b所示的处理流程进行详细的说明，内容如下：

步骤101，获取摄像设备拍摄的检测图像。

在实施中，ATM周围的摄像设备在开机状态下，可以执行图像拍摄处理，并可以将拍摄到的图像(即检测图像)实时发送给终端，终端则可以接收摄像设备发送的检测图像，并可以对检测图像进行存储。另外，摄像设备还可以将其对应的ATM的标识发送给终端，终端则可以将检测图像与该ATM的标识进行对应的存储。

步骤102，在检测图像中确定目标检测区域。

在实施中，终端获取到摄像设备拍摄的检测图像后，可以在获取到的检测图像中，确定用于确定人物通电话状态信息的目标检测区域。

步骤103，根据预设的通电话判定算法模型，检测目标检测区域的图像对应的人物通电话状态信息，如果人物通电话状态信息为通电话，则向服务器发送第一报警消息。

在实施中，终端中可以存储有预设的通电话判定算法模型，该通电话判定算法模型可以是通过训练得到的。终端确定出目标检测区域后，可以根据预设的通电话判定算法模型，检测目标检测区域的图像对应的人物通电话状态信息。其中，人物通电话状态信息可以包括通电话和不通电话。终端可以统计预设时长内人物通电话状态信息为通电话的检测图像的帧数，如果该帧数大于预设阈值，则可以向服务器发送报警消息(可称为第一报警消息)，也即如果人物通电话状态信息为通电话、且预设时长内检测到的人物通电话状态为通电话的检测图像的帧数大于预设阈值，则可以向服务器发送报警消息。或者，终端也可以统计预设时长内人物通电话状态信息为通电话的检测图像的帧数，如果该帧数在预设时长内获取到的检测图像中的总帧数中所占的比例大于预设比例阈值，则可以向服务器发送第一报警消息，也即如果人物通电话状态信息为通电话、且预设时长内检测到的人物通电话状态为通电话的检测图像的帧数在预设时长内获取到的检测图像中的总帧数中所占的比例大于预设比例阈值，则可以向服务器发送第一报警消息。

第一报警消息中可以携带有ATM的标识。服务器接收到第一报警消息后，可以向安保人员的终端发送携带有ATM的标识的第一警报通知消息，用于提醒安保人员对正在使用目标设备(其中，目标设备为ATM的标识对应的设备)的用户进行关注。

下面将结合具体实施方式，以办理资金业务的设备为ATM为例，对图2所示的处理流程进行详细的说明，内容可以如下：

步骤201，获取摄像设备拍摄的检测图像。

步骤202，基于预设的人脸和头肩检测算法模型，在检测图像中检测人脸图像区域和头肩图像区域。

在实施中，终端中可以存储预设的人脸和头肩检测算法模型，该人脸和头肩检测算法模型可以是预先通过训练得到的。终端获取到检测图像后，可以在获取到的检测图像中检测人脸图像区域和头肩图像区域。具体的，可以根据检测图像中各像素点的像素值(如red通道值、green通道值和blue通道值)，以及人脸和头肩检测算法模型，在检测图像中，确定可能是人脸图像的区域(可称为人脸图像待定区域)，以及可能是头肩图像的区域(可称为头肩图像待定区域)，并可以确定人脸图像待定区域对应的置信度，以及头肩图像待定区域对应的置信度。其中，置信度可以用于反映检测到的图像为人脸图像(或头肩图像)的概率。终端中还可以存储有人脸图像区域对应的第一置信度阈值，以及头肩图像区域对应的第二置信度阈值。第一置信度阈值可以与第二置信度阈值相同，也可以与第二置信度阈值不同。

确定出人脸图像待定区域对应的置信度、头肩图像待定区域对应的置信度、第一置信度阈值和第二置信度阈值后，终端可以分别将人脸图像待定区域对应的置信度与第一置信度阈值进行比较，将头肩图像待定区域对应的置信度与第二置信度阈值进行比较，如果终端判定检测到的人脸图像待定区域对应的置信度大于或等于第一置信度阈值，则可以将该人脸图像待定区域作为人脸图像区域，否则，判定该人脸图像待定区域不是人脸图像区域。如果终端判定检测到的头肩图像待定区域对应的置信度大于或等于第二置信度阈值，则可以将该头肩图像待定区域作为头肩图像区域，否则，判定该头肩图像待定区域不是头肩图像区域。

可选的，人脸和头肩检测算法模型可能会存在误差，因此，可以根据检测到的人脸图像区域和/或头肩图像区域的位置信息，对检测结果进行筛选，相应的处理过程可以如下：基于预设的人脸和头肩检测算法模型，在检测图像中确定人脸图像待定区域和头肩图像待定区域，并确定人脸图像待定区域对应的置信度和头肩图像待定区域对应的置信度；根据预先存储的位置信息和权重的对应关系，确定人脸图像待定区域对应的权值，以及头肩图像待定区域对应的权值；如果人脸图像待定区域对应的置信度大于预设的第一置信度阈值，且人脸图像待定区域对应的权值大于预设的第一权值阈值，则将人脸图像待定区域作为人脸图像区域；如果头肩图像待定区域对应的置信度大于预设的第二置信度阈值，且头肩图像待定区域对应的权值大于预设的第二权值阈值，则将头肩图像待定区域作为头肩图像区域。

在实施中，终端可以基于预设的人脸和头肩检测算法模型，在检测图像中确定人脸图像待定区域和头肩图像待定区域，并确定人脸图像待定区域对应的置信度和头肩图像待定区域对应的置信度，具体过程与上述类似，不再赘述。确定出人脸图像待定区域和头肩图像待定区域后，终端可以基于人脸和头肩检测算法模型，确定人脸图像待定区域的位置信息和头肩图像待定区域的位置信息。终端中可以预先存储有位置信息与权值的对应关系，该对应关系可以包括人脸图像待定区域的位置信息与权值的对应关系，以及头肩图像待定区域的位置信息与权值的对应关系。确定出人脸图像待定区域的位置信息和头肩图像待定区域的位置信息后，终端可以从上述对应关系中，获取检测到的人脸图像待定区域的位置信息对应的权值，以及检测到的头肩图像待定区域的位置信息对应的权值。其中，权值可以用于反映检测到的人脸图像待定区域(或头肩图像待定区域)的重要程度。其中，如果人脸图像待定区域(或头肩图像待定区域)的位置信息为检测图像中的中间位置，则对应的权值较高，如果人脸图像待定区域(或头肩图像待定区域)的位置信息为检测图像中的边缘位置，则对应的权值较低。终端中还可以存储有人脸图像区域对应的第一权值阈值，以及头肩图像区域对应的第二权值阈值。第一权值阈值可以与第二权值阈值相同，也可以与第二权值阈值不同。

对于人脸图像待定区域，确定出人脸图像待定区域对应的置信度、第一置信度阈值后，终端可以将人脸图像待定区域对应的置信度与第一置信度阈值进行比较，如果终端判定检测到的人脸图像待定区域对应的置信度小于第一置信度阈值，则可以判定该人脸图像待定区域不是人脸图像区域，如果终端判定检测到的人脸图像待定区域对应的置信度大于或等于第一置信度阈值，则终端可以进一步将人脸图像待定区域对应的权值与第一权值阈值进行比较，如果该人脸图像待定区域对应的权值大于或等于第一权值阈值，则可将该人脸图像待定区域作为人脸图像区域；否则，可以判定该人脸图像待定区域不是人脸图像区域。对于头肩待定区域，确定出头肩图像待定区域对应的置信度、第二置信度阈值后，终端可以将头肩图像待定区域对应的置信度与第二置信度阈值进行比较，如果终端判定检测到的头肩图像待定区域对应的置信度小于第二置信度阈值，则可以判定该头肩图像待定区域不是头肩图像区域，如果终端判定检测到的头肩图像待定区域对应的置信度大于或等于第二置信度阈值，则终端可以进一步将头肩图像待定区域对应的权值与第二权值阈值进行比较，如果该头肩图像待定区域对应的权值大于或等于第二权值阈值，则可以将该头肩图像待定区域作为头肩图像区域，否则，判定该头肩图像待定区域不是头肩图像区域。这样，可以有效的避免误检的情况，提高检测人脸图像区域和头肩图像区域的准确度。

可选的，获取到检测图像后，终端首先可以检测ATM周围是否有人，此种情况下，终端可以在检测到有人时执行步骤202的处理，相应的处理过程可以如下：如果达到预设的检测触发条件，则执行基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域的步骤。

在实施中，预设的检测触发条件可以是多种多样的。本实施例提供了几种可行的处理方式：

方式一、终端可以在检测图像中检测到人物活动信息时，执行步骤202的处理。

在实施中，终端可以获取某ATM的摄像设备拍摄到的检测图像，然后可以根据检测图像建立对应的背景模型，并且，终端还可以根据检测图像，周期性的更新背景模型。后续终端每获取到一帧检测图像，终端可以将检测图像与背景模型进行对比，确定前景图像，并可以对前景图像进行二值化，生成二值前景图像，根据二值前景图像，判断检测图像中是否存在人物。另外，终端除了根据前景图像判断检测图像中是否存在人物，还可以通过判断检测图像中的运动区域的大小判断ATM周围是否有人。具体的，获取到该检测图像后，终端可以获取当前获取的检测图像的上一帧检测图像，进而，可以根据相邻两帧检测图像中各像素点的灰度值，计算相邻两帧检测图像中，相同位置的像素点的灰度值的差值(可称为差异度)。得到各像素点的差异度后，终端可以在各像素点中，确定差异度大于预设阈值的像素点，得到该检测图像的运动区域。如果终端在预设时长内的检测图像中，均检测到前景图像，且检测图像中的运动区域均大于预设阈值，则可以判定ATM周围有人。

方式二、终端可以在接收到目标设备发送的操作通知消息时，执行步骤202的处理。

其中，目标设备可以是用于办理资金业务的设备，如ATM。

在实施中，用户在目标设备中进行操作时，目标设备可以检测到用户输入的指令，然后可以向终端发送操作通知消息，操作通知消息中可以携带有目标设备的设备标识，相应的，终端可以接收目标设备发送的操作通知消息。终端获取到检测图像后，可以判断是否接收到目标设备发送的操作通知消息，如果接收到该操作通知消息，则终端可以执行步骤202的处理。

方式三、终端可以在接收到传感设备发送的对象检测通知时，执行步骤202的处理。

在实施中，ATM周围，或ATM中可以配置有传感器(如红外传感器)，当用户靠近ATM时，该传感器可以检测到相应的检测信号，然后可以向终端发送对象检测通知，对象检测通知中可以携带有目标设备的设备标识，相应的，终端可以接收传感设备发送的对象检测通知。终端获取到检测图像后，可以判断是否接收到传感设备发送的对象检测通知，如果终端接收到该对象检测通知后，则终端可以执行步骤202的处理。

可选的，人脸和头肩检测算法模型可以是预先训练得到的，相应的，训练人脸和头肩检测算法模型的处理过程可以如下：获取预先存储的多个训练样本，训练样本包括图像样本，及图像样本中的人脸图像区域和/或头肩图像区域；基于多个训练样本，对预设的第一初始算法模型进行训练，得到人脸和头肩检测算法模型。

在实施中，终端可以采用高性能的深度学习网络架构(如faster-rcnn)和高效的ZF(Matthew D.Zeiler and Rob Fergus)改进型网络模型来训练人脸和头肩检测器。训练样本可以包括训练正样本和训练负样本。其中，训练正样本可以包括图像样本，及图像样本中的人脸图像区域和/或头肩图像区域，图像样本可以是不同角度下的人脸图像和头肩图像；人脸图像区域和/或头肩图像区域可以是用人脸图像区域和/或头肩图像区域的坐标信息表示的。训练负样本可以包括图像样本，以及图像样本中非人脸和头肩的区域。终端可以基于多个训练样本，以及预设的训练算法，对预设的第一初始算法模型进行训练，得到人脸和头肩检测算法模型。基于深度学习技术训练出的人脸和头肩检测算法模型的目标检出率和检准率均有大幅提升。

步骤203，根据人脸图像区域和头肩图像区域的检测结果，在检测图像中确定目标检测区域。

在实施中，终端在检测图像中进行人脸图像区域和头肩图像区域的检测后，可能检测到人脸图像区域和头肩图像区域，如图3a所示，也可能只检测到人脸图像区域，或只检测到头肩图像区域，如图3b、图3c所示。终端对人脸图像区域和头肩图像区域进行检测后，终端可以基于得到的检测结果，确定检测图像中的目标检测区域。

可选的，基于检测结果的不同，终端在检测图像中确定目标检测区域的方式也不同，相应的，步骤203的处理过程可以如下：如果检测到人脸图像区域和头肩图像区域，则根据预先存储的人脸图像区域、头肩图像区域和检测区域的位置关系，在检测图像中确定目标检测区域；如果检测到人脸图像区域，未检测到头肩图像区域，则对检测到的人脸图像区域进行放大处理，将放大处理后的人脸图像区域作为目标检测区域；如果检测到头肩图像区域，未检测到人脸图像区域，则对检测到的头肩图像区域进行缩小处理，将缩小处理后的头肩图像区域作为目标检测区域。

在实施中，如果终端检测到人脸图像区域和头肩图像区域，则可以根据预先存储的人脸图像区域、头肩图像区域和检测区域的位置关系，以及确定出的人脸图像区域、头肩图像区域，在检测图像中确定目标检测区域。例如，可以确定人脸图像区域中的人眼位置，以及头肩图像区域中的脖颈位置，然后可以在人眼位置以下、脖颈位置以上的区域中，确定目标检测区域，如图4a所示，目标检测区域可以为长方形区域。

如果终端只检测到人脸图像区域，未检测到头肩图像区域，则可以根据预设的放大系数，在检测图像中对人脸图像区域进行放大处理，将放大处理后的人脸图像区域作为目标检测区域，其中，人脸图像区域的宽度对应的放大系数，可以大于人脸图像区域的长度对应的放大系数，如图4b所示。也就是说，目标检测区域是检测图像中的包含人脸图像区域的区域。

如果终端只检测到头肩图像区域，未检测到人脸图像区域，则可以根据预设的缩小系数，在检测图像中对检测到的头肩图像区域进行缩小处理，将缩小处理后的头肩图像区域作为目标检测区域，其中，头肩图像区域的宽度对应的缩小系数，可以小于人脸图像区域的长度对应的缩小系数，如图4c所示。另外，如果未检测到人脸图像区域和头肩图像区域，则终端可以不进行处理。也就是说，目标检测区域是头肩图像区域中的区域。

步骤204，根据预设的通电话判定算法模型，检测目标检测区域的图像对应的人物通电话状态信息，如果人物通电话状态信息为通电话，则向服务器发送第一报警消息。

在实施中，终端中可以存储有预设的通电话判定算法模型，该通电话判定算法模型可以是通过训练得到的。终端确定目标检测区域后，可以根据预设的通电话判定算法模型，检测目标检测区域的图像对应的人物通电话状态信息。其中，人物通电话状态信息可以包括通电话和不通电话。终端可以统计预设时长内人物通电话状态信息为通电话的检测图像的帧数，如果该帧数大于预设阈值，则可以向服务器发送报警消息(可称为第一报警消息)，也即如果人物通电话状态信息为通电话、且预设时长内检测到的人物通电话状态为通电话的检测图像的帧数大于预设阈值，则可以向服务器发送报警消息。或者，终端也可以统计预设时长内人物通电话状态信息为通电话的检测图像的帧数，如果该帧数在预设时长内获取到的检测图像中的总帧数中所占的比例大于预设比例阈值，则可以向服务器发送第一报警消息，也即如果人物通电话状态信息为通电话、且预设时长内检测到的人物通电话状态为通电话的检测图像的帧数在预设时长内获取到的检测图像中的总帧数中所占的比例大于预设比例阈值，则可以向服务器发送第一报警消息。

第一报警消息中可以携带有ATM的标识。服务器接收到第一报警消息后，可以向安保人员的终端发送携带有ATM的标识的第一警报通知消息，用于提醒安保人员对正在使用目标设备(其中，目标设备为ATM的标识对应的设备)的用户进行关注。终端还可以根据检测到的人脸图像区域或头肩图像区域，在检测图像中添加标记图像，用于圈定检测图像中的人物。如果人物通电话状态信息为通电话，则终端可以将添加有标记图像的检测图像发送给服务器，服务器则可以将添加有标记图像的检测图像发送给安保人员的终端，以便于安保人员查找相应的用户，如图5所示，也就是说，第一报警消息中还可以携带有添加有标记图像的检测图像，相应的，第一警报通知消息中还可以携带有添加有标记图像的检测图像。另外，终端在发送第一报警消息的同时，还可以通过语音播报设备，输出预设的防诈骗语音信息，以及时提醒该用户防止上当受骗。

可选的，终端训练通电话判定算法模型的处理过程可以如下：获取预先存储的多个训练样本，训练样本包括图像样本，及图像样本对应的人物通电话状态信息；基于多个训练样本，对预设的第二初始算法模型进行训练，得到通电话判定算法模型。

在实施中，终端可以采用深度学习网络改进型模型(如googlenet-loss1)来训练通电话判定算法模型。训练样本可以包括训练正样本和训练负样本。其中，训练正样本中的图像样本可以是包含通电话的人物的图像，图像样本可以是不同姿态打电话的图像，如左手打电话、右手打电话、反手打电话、脸和肩夹住电话等不同姿态，即训练正样本对应的人物通电话状态信息可以为通电话。训练负样本可以是不包含通电话的人物的图像，即训练负样本对应的人物通电话状态信息可以为不通电话。终端中可以预设存储有第二初始算法模型，其中，第二初始算法模型中可以包含待定参数，终端可以根据预先存储的多个训练样本，对预设的第二初始算法模型进行训练，得到待定参数的训练值，即可以得到通电话判定算法模型。基于深度学习技术的训练得到的通电话判定算法模型的检测准确率相比传统方法(如SVM)有较大提升，能排除因头发、眼睛等干扰造成的误检。

可选的，可以结合语音识别技术来识别可能受到欺骗的用户，相应的处理过程可以如下：获取语音输入设备检测到的语音信息；如果语音信息包含预设的关键词，则向服务器发送第二报警消息。

在实施中，语音输入设备可以安装在ATM上，也可以安装在ATM周围。当与ATM的距离在一定范围内的某人发出声音时，语音输入设备可以检测到相应的语音信息，并可以将检测到的语音信息发送给终端，相应的，终端可以接收语音输入设备发送的语音信息。终端接收到语音信号后，可以通过基于预先存储的语音识别算法，来判定该语音信息中是否包括预设的关键词，如卡号、转账等。其中，语音识别算法可以是终端采用相关技术中的语音识别算法模型训练得到的。例如，终端可以根据相关技术中MFCC声纹特征和HMM隐马尔可夫模型对电信诈骗中常出现的敏感词汇(即关键词)进行建模，并可以提取数据库中的声音文件的声纹特征，然后可以建立每个关键词对应的HMM模型，进而可以利用MFCC声纹特征对每一个HMM模型训练，得到语音识别算法。

如果终端通过语音识别算法，识别出语音信息中包含预设的关键词，则可以向服务器发送报警消息(可称为第二报警消息)。服务器接收到该第二报警消息后，可以向安保人员的终端发送携带有目标设备标识的第二警报通知消息，用于提醒安保人员对正在使用目标设备的用户进行交易干涉，以及时阻止用户向诈骗分子转账。

可选的，终端还可以对检测到的人物进行持续跟踪，以避免重复发送报警消息，相应的处理过程可以如下：确定当前检测到的人脸图像区域和/或头肩图像区域，与当前时间最接近的上一帧检测图像中的人脸图像区域和/或头肩图像区域的相似度；如果相似度不满足预设相似度条件，则执行向服务器发送第一报警消息的步骤。

在实施中，终端检测到人脸图像区域和/或头肩图像区域后，可以确定当前检测到的人脸图像区域和/或头肩图像区域，与当前时间最接近的上一帧检测图像中的人脸图像区域和/或头肩图像区域的相似度。具体的，检测到人脸图像区域和/或头肩图像区域后，终端可以生成人脸图像区域和/或头肩图像区域对应的目标框。以人脸图像区域对应的目标框为例，确定出目标框后，终端可以确定该目标框的属性信息，其中，该属性信息可以包括目标框内像素点的灰度值、目标框的尺寸信息和目标框的位置信息，进而，可以将当前接收到的检测图像中的目标框的属性信息，与当前时间最接近的上一帧检测图像中的目标框的属性信息进行对比，确定二者的相似度，该相似度可以作为当前检测到的人脸图像区域，与当前时间最接近的上一帧检测图像中的人脸图像区域的相似度。

例如，可以计算目标框内像素点的差值的平均值，得到灰度差异度；可以计算尺寸比值，得到尺寸差异度；还可以根据坐标信息，计算位置差异度。如果灰度差异度小于预设的第一差异度阈值，且尺寸差异度小于预设的第二差异度阈值，且位置差异度小于预设的第三差异度阈值，则可以判定二者的相似度为高，否则，可以判定二者的相似度为低。

确定出相似度后，如果终端判定相似度为低，则说明当前检测图像中的用户可能与上一帧检测图像中的用户不相同，终端可以执行向服务器发送第一报警消息的步骤，也即检测到目标检测区域的图像对应的人物通电话状态信息后，如果人物通电话状态信息为通电话，且确定出的上述相似度不满足预设相似度条件，则执行向服务器发送第一报警消息的步骤。如果终端判定相似度为高，则说明当前检测图像中的用户可能与上一帧图像中的用户相同，基于上述处理，终端已向服务器发送对应该用户的报警消息，因此，无需再次向服务器发送报警消息，从而可以避免对于同一用户反复报警的情况。

在实际中，可以优先用人脸图像区域对应的目标框进行判断，如果未检测到人脸图像区域，则可以用头肩图像区域对应的目标框进行判断，具体的处理过程与上述类似，不再赘述。

需要说明的是，上文的标记图像可以为终端生成的目标框图像，如果终端在上一帧检测图像中检测到人脸图像区域和/或头肩图像区域，而在当前的检测图像中未检测到人脸图像区域和/或头肩图像区域，可以将上一帧检测图像对应的目标框图像，添加到当前的检测图像中，以便安保人员的终端进行显示，如果终端在连续的预设数目帧检测图像中，都未检测到人脸图像区域和/或头肩图像区域，则可以停止在检测图像中添加目标框图像。在实际中，人脸和头肩检测算法模型存在检测误差，会导致检测结果不是连续的，相应的，目标框图像的显示也不是连续的，这样，安保人员看到的检测图像中的目标框图像会是时有时无，甚至闪烁的，而基于本处理，可以提高显示目标框图像的连续性，能有效的提高用户体验。

可选的，为防止预设时长内针对同一用户重复发送报警消息，相应的处理过程可以如下：确定当前检测到的人脸图像区域和/或头肩图像区域，与预设时长内获取到的各帧检测图像中的人脸图像区域和/或头肩图像区域的各相似度；如果得到的各相似度均不满足预设相似度条件，则执行向服务器发送第一报警消息的步骤。

在实施中，检测出当前获取到的检测图像中的人脸图像区域和/或头肩图像区域后，终端可以获取预设时长内获取到的各帧检测图像中的人脸图像区域和/或头肩图像区域，进而，可以按照上述方式，确定当前获取到的检测图像中的人脸图像区域和/或头肩图像区域，与预设时长内获取到的各帧检测图像中的人脸图像区域和/或头肩图像区域的各个相似度，如果得到的各个相似度均不满足预设相似度条件(此种情况说明当前检测图像中的用户可能与预设时长内获取到的其他帧检测图像中用户不同)，则终端可以执行向服务器发送第一报警消息的步骤，也即检测到目标检测区域的图像对应的人物通电话状态信息后，如果人物通电话状态信息为通电话，且确定出的上述各个相似度均不满足预设相似度条件，则执行向服务器发送第一报警消息的步骤。如果得到的各相似度中存在满足预设相似度条件的相似度(此种情况说明，当前检测图像中的用户可能与预设时长内获取到的其他帧检测图像中的某用户是同一用户)，则基于上述处理，终端已向服务器发送对应该用户的报警消息，因此，无需再次向服务器发送报警消息，从而可以避免对于同一用户反复报警的情况。

基于相同的技术构思，本申请实施例还提供了一种发送报警消息的装置，如图6所示，该装置包括：

第一获取模块610，用于获取摄像设备拍摄的检测图像；

第一确定模块620，用于在所述检测图像中确定目标检测区域；

第一发送模块630，用于根据预设的通电话判定算法模型，检测所述目标检测区域的图像对应的人物通电话状态信息，如果所述人物通电话状态信息为通电话，则向服务器发送第一报警消息。

可选的，如图7所示，所述装置还包括：

检测模块640，用于基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域；

所述第一确定模块620，用于：根据人脸图像区域和头肩图像区域的检测结果，在所述检测图像中确定目标检测区域。

可选的，所述第一确定模块620，用于：

可选的，如图8所示，所述装置还包括：

第二获取模块650，用于获取预先存储的多个训练样本，所述训练样本包括图像样本，及所述图像样本中的人脸图像区域和/或头肩图像区域；

第一训练模块660，用于基于所述多个训练样本，对预设的第一初始算法模型进行训练，得到所述人脸和头肩检测算法模型。

可选的，如图9所示，所述装置还包括：

第三获取模块670，用于获取预先存储的多个训练样本，所述训练样本包括图像样本，及所述图像样本对应的人物通电话状态信息；

第二训练模块680，用于基于所述多个训练样本，对预设的第二初始算法模型进行训练，得到所述通电话判定算法模型。

可选的，如图10所示，所述检测模块640，包括：

第一确定子模块641，用于基于预设的人脸和头肩检测算法模型，在所述检测图像中确定人脸图像待定区域和头肩图像待定区域，并确定所述人脸图像待定区域对应的置信度和所述头肩图像待定区域对应的置信度；

第二确定子模块642，用于根据预先存储的位置信息和权重的对应关系，确定所述人脸图像待定区域对应的权值，以及所述头肩图像待定区域对应的权值；

所述第二确定子模块642，还用于如果所述人脸图像待定区域对应的置信度大于预设的第一置信度阈值，且所述人脸图像待定区域对应的权值大于预设的第一权值阈值，则将所述人脸图像待定区域作为人脸图像区域；

所述第二确定子模块642，还用于如果所述头肩图像待定区域对应的置信度大于预设的第二置信度阈值，且所述头肩图像待定区域对应的权值大于预设的第二权值阈值，则将所述头肩图像待定区域作为头肩图像区域。

可选的，如图11所示，所述装置还包括：

第二确定模块690，用于确定当前检测到的人脸图像区域和/或头肩图像区域，与当前时间最接近的上一帧检测图像中的人脸图像区域和/或头肩图像区域的相似度；

所述第一发送模块630，用于：

可选的，如图12所示，所述装置还包括：

第四获取模块6100，用于获取语音输入设备检测到的语音信息；

第二发送模块6110，用于如果所述语音信息包含预设的关键词，则向所述服务器发送第二报警消息。

可选的，如图13所示，所述装置还包括：

第三确定模块6120，用于如果达到预设的检测触发条件，则执行基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域的步骤；

所述预设的检测触发条件至少包括：

在所述检测图像中检测到人物活动信息；或者，

接收到目标设备发送的操作通知消息；或者，

接收到传感设备发送的对象检测通知。

可选的，所述第一确定模块620，还用于：

所述第一发送模块630，还用于：

需要说明的是：上述实施例提供的发送报警消息的装置在发送报警消息时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的发送报警消息的装置与发送报警消息的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

请参考图14，其示出了本申请实施例所涉及的终端的结构示意图，该终端可以用于实施上述实施例中提供的发送报警消息的方法。具体来讲：

终端900可以包括RF(Radio Frequency，射频)电路110、包括有一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、WiFi(wireless fidelity，无线保真)模块170、包括有一个或者一个以上处理核心的处理器180、以及电源190等部件。本领域技术人员可以理解，图14中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

RF电路110可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，交由一个或者一个以上处理器180处理；另外，将涉及上行的数据发送给基站。通常，RF电路110包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier，低噪声放大器)、双工器等。此外，RF电路110还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议，包括但不限于GSM(Global System of Mobile communication，全球移动通讯系统)、GPRS(General Packet Radio Service，通用分组无线服务)、CDMA(Code Division Multiple Access，码分多址)、WCDMA(Wideband Code Division Multiple Access,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(Short Messaging Service，短消息服务)等。

存储器120可用于存储软件程序以及模块，处理器180通过运行存储在存储器120的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端900的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器120可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器120还可以包括存储器控制器，以提供处理器180和输入单元130对存储器120的访问。

输入单元130可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地，输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131，也称为触摸显示屏或者触控板，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器180，并能接收处理器180发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131，输入单元130还可以包括其他输入设备132。具体地，其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端900的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141，可选的，可以采用LCD(Liquid Crystal Display，液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的，触敏表面131可覆盖显示面板141，当触敏表面131检测到在其上或附近的触摸操作后，传送给处理器180以确定触摸事件的类型，随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图14中，触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能，但是在某些实施例中，可以将触敏表面131与显示面板141集成而实现输入和输出功能。

终端900还可包括至少一种传感器150，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板141的亮度，接近传感器可在终端900移动到耳边时，关闭显示面板141和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于终端900还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路160、扬声器161，传声器162可提供用户与终端900之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号，传输到扬声器161，由扬声器161转换为声音信号输出；另一方面，传声器162将收集的声音信号转换为电信号，由音频电路160接收后转换为音频数据，再将音频数据输出处理器180处理后，经RF电路110以发送给比如另一终端，或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔，以提供外设耳机与终端900的通信。

WiFi属于短距离无线传输技术，终端900通过WiFi模块170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图14示出了WiFi模块170，但是可以理解的是，其并不属于终端900的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器180是终端900的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器120内的软件程序和/或模块，以及调用存储在存储器120内的数据，执行终端900的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器180可包括一个或多个处理核心；优选的，处理器180可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器180中。

终端900还包括给各个部件供电的电源190(比如电池)，优选的，电源可以通过电源管理系统与处理器180逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管未示出，终端900还可以包括摄像头、蓝牙模块等，在此不再赘述。具体在本实施例中，终端900的显示单元是触摸屏显示器，终端900还包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行包含该终端用于执行上述发送报警消息的方法的指令。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种发送报警消息的方法，其特征在于，所述方法包括：

获取摄像设备拍摄的检测图像；

在所述检测图像中确定目标检测区域；

根据预设的通电话判定算法模型，检测所述目标检测区域的图像对应的人物通电话状态信息，如果所述人物通电话状态信息为通电话，则向服务器发送第一报警消息。
根据权利要求1所述的方法，其特征在于，所述在所述检测图像中确定目标检测区域，包括：

基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域；

根据人脸图像区域和头肩图像区域的检测结果，在所述检测图像中确定目标检测区域。
根据权利要求2所述的方法，其特征在于，所述根据人脸图像区域和头肩图像区域的检测结果，在所述检测图像中确定目标检测区域，包括：

如果检测到人脸图像区域和头肩图像区域，则根据预先存储的人脸图像区域、头肩图像区域和检测区域的位置关系，在所述检测图像中确定目标检测区域；

如果检测到人脸图像区域，未检测到头肩图像区域，则对检测到的人脸图像区域进行放大处理，将放大处理后的人脸图像区域作为目标检测区域；

如果检测到头肩图像区域，未检测到人脸图像区域，则对检测到的头肩图像区域进行缩小处理，将缩小处理后的头肩图像区域作为目标检测区域。
根据权利要求2所述的方法，其特征在于，所述方法还包括：

获取预先存储的多个训练样本，所述训练样本包括图像样本，及所述图像样本中的人脸图像区域和/或头肩图像区域；

基于所述多个训练样本，对预设的第一初始算法模型进行训练，得到所述人脸和头肩检测算法模型。
根据权利要求2所述的方法，其特征在于，所述基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域，包括：

基于预设的人脸和头肩检测算法模型，在所述检测图像中确定人脸图像待定区域和头肩图像待定区域，并确定所述人脸图像待定区域对应的置信度和所述头肩图像待定区域对应的置信度；

根据预先存储的位置信息和权重的对应关系，确定所述人脸图像待定区域对应的权值，以及所述头肩图像待定区域对应的权值；

如果所述人脸图像待定区域对应的置信度大于预设的第一置信度阈值，且所述人脸图像待定区域对应的权值大于预设的第一权值阈值，则将所述人脸图像待定区域作为人脸图像区域；

如果所述头肩图像待定区域对应的置信度大于预设的第二置信度阈值，且所述头肩图像待定区域对应的权值大于预设的第二权值阈值，则将所述头肩图像待定区域作为头肩图像区域。
根据权利要求2所述的方法，其特征在于，所述方法还包括：

确定当前检测到的人脸图像区域和/或头肩图像区域，与当前时间最接近的上一帧检测图像中的人脸图像区域和/或头肩图像区域的相似度；

所述向服务器发送第一报警消息之前，还包括：

如果所述相似度不满足预设相似度条件，则执行向服务器发送第一报警消息的步骤。
根据权利要求2所述的方法，其特征在于，所述基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域之前，还包括：

如果达到预设的检测触发条件，则执行基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域的步骤；

所述预设的检测触发条件至少包括：

在所述检测图像中检测到人物活动信息；或者，

接收到目标设备发送的操作通知消息；或者，

接收到传感设备发送的对象检测通知。
根据权利要求2所述的方法，其特征在于，所述方法还包括：

确定当前检测到的人脸图像区域和/或头肩图像区域，与预设时长内获取到的各帧检测图像中的人脸图像区域和/或头肩图像区域的各相似度；

所述向服务器发送第一报警消息之前，还包括：

如果得到的各相似度均不满足预设相似度条件，则执行向服务器发送第一报警消息的步骤。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取预先存储的多个训练样本，所述训练样本包括图像样本，及所述图像样本对应的人物通电话状态信息；

基于所述多个训练样本，对预设的第二初始算法模型进行训练，得到所述通电话判定算法模型。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取语音输入设备检测到的语音信息；

如果所述语音信息包含预设的关键词，则向所述服务器发送第二报警消息。
一种发送报警消息的装置，其特征在于，所述装置包括：

第一获取模块，用于获取摄像设备拍摄的检测图像；

第一确定模块，用于在所述检测图像中确定目标检测区域；

第一发送模块，用于根据预设的通电话判定算法模型，检测所述目标检测区域的图像对应的人物通电话状态信息，如果所述人物通电话状态信息为通电话，则向服务器发送第一报警消息。
根据权利要求11所述的装置，其特征在于，所述装置还包括：

检测模块，用于基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域；

所述第一确定模块，用于：根据人脸图像区域和头肩图像区域的检测结果，在所述检测图像中确定目标检测区域。
根据权利要求12所述的装置，其特征在于，所述第一确定模块，用于：

如果检测到人脸图像区域和头肩图像区域，则根据预先存储的人脸图像区域、头肩图像区域和检测区域的位置关系，在所述检测图像中确定目标检测区域；

如果检测到人脸图像区域，未检测到头肩图像区域，则对检测到的人脸图像区域进行放大处理，将放大处理后的人脸图像区域作为目标检测区域；

如果检测到头肩图像区域，未检测到人脸图像区域，则对检测到的头肩图像区域进行缩小处理，将缩小处理后的头肩图像区域作为目标检测区域。
根据权利要求12所述的装置，其特征在于，所述装置还包括：

第二获取模块，用于获取预先存储的多个训练样本，所述训练样本包括图像样本，及所述图像样本中的人脸图像区域和/或头肩图像区域；

第一训练模块，用于基于所述多个训练样本，对预设的第一初始算法模型进行训练，得到所述人脸和头肩检测算法模型。
根据权利要求12所述的装置，其特征在于，所述检测模块，包括：

第一确定子模块，用于基于预设的人脸和头肩检测算法模型，在所述检测图像中确定人脸图像待定区域和头肩图像待定区域，并确定所述人脸图像待定区域对应的置信度和所述头肩图像待定区域对应的置信度；

第二确定子模块，用于根据预先存储的位置信息和权重的对应关系，确定所述人脸图像待定区域对应的权值，以及所述头肩图像待定区域对应的权值；

所述第二确定子模块，还用于如果所述人脸图像待定区域对应的置信度大于预设的第一置信度阈值，且所述人脸图像待定区域对应的权值大于预设的第一权值阈值，则将所述人脸图像待定区域作为人脸图像区域；

所述第二确定子模块，还用于如果所述头肩图像待定区域对应的置信度大于预设的第二置信度阈值，且所述头肩图像待定区域对应的权值大于预设的第二权值阈值，则将所述头肩图像待定区域作为头肩图像区域。
根据权利要求12所述的装置，其特征在于，所述装置还包括：

第二确定模块，用于确定当前检测到的人脸图像区域和/或头肩图像区域，与当前时间最接近的上一帧检测图像中的人脸图像区域和/或头肩图像区域的相似度；

所述第一发送模块，用于：

如果所述相似度不满足预设相似度条件，则执行向服务器发送第一报警消息的步骤。
根据权利要求12所述的装置，其特征在于，所述装置还包括：

第三确定模块，用于如果达到预设的检测触发条件，则执行基于预设的人脸和头肩检测算法模型，在所述检测图像中检测人脸图像区域和头肩图像区域的步骤；

所述预设的检测触发条件至少包括：

在所述检测图像中检测到人物活动信息；或者，

接收到目标设备发送的操作通知消息；或者，

接收到传感设备发送的对象检测通知。
根据权利要求12所述的装置，其特征在于，所述第一确定模块，还用于：

确定当前检测到的人脸图像区域和/或头肩图像区域，与预设时长内获取到的各帧检测图像中的人脸图像区域和/或头肩图像区域的各相似度；

所述第一发送模块，还用于：

如果得到的各相似度均不满足预设相似度条件，则执行向服务器发送第一报警消息的步骤。
根据权利要求11所述的装置，其特征在于，所述装置还包括：

第三获取模块，用于获取预先存储的多个训练样本，所述训练样本包括图像样本，及所述图像样本对应的人物通电话状态信息；

第二训练模块，用于基于所述多个训练样本，对预设的第二初始算法模型进行训练，得到所述通电话判定算法模型。
根据权利要求11所述的装置，其特征在于，所述装置还包括：

第四获取模块，用于获取语音输入设备检测到的语音信息；

第二发送模块，用于如果所述语音信息包含预设的关键词，则向所述服务器发送第二报警消息。
一种计算机可读存储介质，其特征在于，所述存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-10任一所述的方法步骤。
一种终端，其特征在于，所述终端包括：

一个或多个处理器；和

存储器；

所述存储器存储有一个或多个程序，所述一个或多个程序被配置成由所述一个或多个处理器执行，所述一个或多个程序包含用于进行如权利要求1-10任一所述的方法步骤的指令。