WO2019128304A1

WO2019128304A1 - 人体跌倒检测方法和装置

Info

Publication number: WO2019128304A1
Application number: PCT/CN2018/104734
Authority: WO
Inventors: 谢阳阳
Original assignee: 南京阿凡达机器人科技有限公司
Priority date: 2017-12-29
Filing date: 2018-09-08
Publication date: 2019-07-04
Also published as: CN108090458A; CN108090458B

Abstract

一种人体跌倒检测方法和装置，其中，该方法包括：获取目标图像（S11）；通过目标检测网络，对目标图像进行人体检测，以确定目标图像是否为包含人体的图像（S12）；在确定目标图像为包含人体的图像的情况下，通过卷积神经网络，对目标图像进行跌倒识别，以确定目标图像中的人体是否处于跌倒状态（S13），由于该方法通过获取单帧的目标图像而不是视频流进行分析处理，并利用基于目标检测算法的目标检测网络识别出包含有人体的图像，再通过基于分类算法的卷积神经网络对目标图像中的人体状态进行分类识别，以识别目标图像中人体的状态，从而解决了现有方法的识别人体跌倒准确度差、效率低的技术问题，达到精确、高效地识别出跌倒状态的技术效果。

Description

人体跌倒检测方法和装置

本申请要求2017年12月29日提交的申请号为：201711468689.0、发明名称为“人体跌倒检测方法和装置”的中国专利申请的优先权，其全部内容合并在此。

技术领域

本申请涉及人体检测技术领域，特别涉及一种人体跌倒检测方法和装置。

背景技术

随着社会老龄化趋势的日益严重，人们越来越关注老人的日常生活安全。例如，希望可以及时检测老人独自在家时是否发生跌倒等意外。因此，现实生活中，如何有效、准确地检测是否发生跌倒，以便及时地对老人进行救助成为一个重要的问题。

目前为了检测跌倒，现有的方法大多是事先在人体活动区域内布设多个摄像头，以采集视频流数据，再通过分析视频流数据中人体变化情况来判断人体是否发生跌倒。上述方法具体实施时，由于需要对视频流数据进行处理、分析，工作量大、效率低。此外，通过分析人体变化情况判断人体是否发生跌倒判断过程较为复杂，误差相对较大。综上可知，现有方法具体实施时，往往存在识别跌倒准确度差、误差大、效率低的技术问题。

针对上述问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种人体跌倒检测方法和装置，以解决现有方法中存在的识别跌倒准确度差、误差大、效率低的技术问题，达到准确、高效地识别出跌倒状态的技术效果。

本申请实施例提供了一种人体跌倒检测方法，包括：

获取目标图像；

通过目标检测网络，对所述目标图像进行人体检测，以确定所述目标图像是否为包含人体的图像；

在确定所述目标图像为包含人体的图像的情况下，通过卷积神经网络，对所述目标图像进行跌倒识别，以确定所述目标图像中的人体是否处于跌倒状态。

在一个实施方式中，所述获取目标图像，包括：

采集目标区域中的声音信息；

根据所述声音信息，确定目标方位；

根据所述目标方位，移动摄像头，以获取所述目标图像。

在一个实施方式中，按照以下方式建立所述目标检测网络：

获取人体图像样本数据，其中，所述人体图像样本数据包括多个包含人体状态的图像；

标注所述人体图像样本数据的图像中的人体区域；

利用标注后的人体图像样本数据进行训练，以得到基于目标检测算法的目标检测网络。

在一个实施方式中，所述人体状态包括：人体站着的状态、人体坐着的状态、人体躺着的状态、人体蹲着的状态、人体倾斜着的状态、人体趴着的状态。

在一个实施方式中，在确定所述目标图像为不包含人体的图像的情况下，所述方法还包括：重新获取目标图像。

在一个实施方式中，按照以下方式建立所述卷积神经网络：

从所述人体图像样本数据中提取符合要求的图像作为预处理样本数据；

根据所述预处理样本数据的图像中的人体状态，将所述预处理样本数据中的图像划分正样本数据和负样本数据，其中，所述正样本数据中的图像包括以下至少之一：包含有人体站着的状态的图像、包含有人体坐着的状态的图像、包含有人体蹲着的状态的图像、包含有人体倾斜着的状态的图像；所述负样本数据中的图像包括以下至少之一：包含有人体躺着的状态的图像、包含有人体趴着的状态的图像；

利用所述正样本数据、所述负样本数据进行训练，以建立用于识别人体状态类型的所述卷积神经网络。

在一个实施方式中，所述符合要求的图像包括：人体区域的占图比大于80％的图像。

本申请实施例还提供了一种人体跌倒检测装置，包括：

获取模块，用于获取目标图像；

人体检测模块，用于通过目标检测网络，对所述目标图像进行人体检测，以确定所述目标图像是否为包含人体的图像；

跌倒识别模块，用于在确定所述目标图像为包含人体的图像的情况下，通过卷积神经网络，对所述目标图像进行跌倒识别，以确定所述目标图像中的人体是否处于跌倒状态。

在一个实施方式中，所述获取模块包括：

声音采集器，用于采集目标区域中的声音信息；

定位器，用于根据所述声音信息，确定目标方位；

移动装置和摄像头，其中，所述摄像头设于所述移动装置上，所述移动装置用于根据所述目标方位，移动所述摄像头，所述摄像头用于获取目标图像。

在一个实施方式中，所述装置还包括报警模块，用于在确定目标图像中的人体处于跌倒状态的情况下发出警报，和/或，发送警示信息。

在本申请实施例中，通过获取单帧的目标图像而不是视频流进行分析处理，并利用基于目标检测算法的目标检测网络先识别出包含有人体的图像，再通过基于分类算法的卷积神经网络对目标图像中的人体状态进行分类识别，以识别出目标图像中人体的具体状态，从而解决了现有方法中存在的识别跌倒准确度差、误差大、效率低的技术问题，达到了精确、高效地识别出跌倒状态的技术效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是根据本申请实施方式提供的人体跌倒检测方法的处理流程示意图；

图2是根据本申请实施方式提供的人体跌倒检测装置的组成结构示意图；

图3是基于本申请实施方式提供的人体跌倒检测方法的电子设备组成结构示意图；

图4是在一个场景示例中应用本申请实施方式提供的人体跌倒检测方法和装置设计的人体跌倒检测机器人的组成结构示意图；

图5是在一个场景示例中应用人体跌倒检测机器人进行人体跌倒检测的流程示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

考虑到现有方法具体实施时大多是采集视频流数据，并对视频流数据进行分析、处理，由于要分析的数据量大，导致占用资源多，且效率低。此外，现有方法大多是通过分析人体变化检测人体是否跌倒，这种识别方式本身较为复杂、精度较差，容易出现误差。综上可知，现有方法具体实施时往往存在识别跌倒准确度差、效率低的技术问题。针对产生上述技术问题的根本原因，本申请考虑可以获取单帧的图像数据，而不是视频流数据进行具体的分析，以有效的降低数据处理量；此外，针对图像数据的特点和优势，通过分析图像中的人体状态而不是人体变化来判断人体是否发生跌倒，解决了现有方法中存在的识别跌倒准确度差、误差大、效率低的技术问题，达到了精确、高效地识别出跌倒状态的技术效果。

基于上述思考思路，本申请实施例提供了一种人体跌倒检测方法。具体请参阅图1所示的根据本申请实施方式提供的人体跌倒检测方法的处理流程示意图。本申请实施例提供的人体跌倒检测方法，具体实施时，可以包括以下步骤。

S11：获取目标图像。

在本实施方式中，为了降低计算量，减少对计算资源的占用，具体实施时，可以获取单帧的目标图像，而不是现有方法采集的视频流，进行后续具体分析、处理。相较于视频流，对于单帧的目标图像后续分析、处理时只要对单独一帧图像进行分析、检测、识别，如此，可以有效地减少计算量、降低计算成本，提高识别速度。

在一个实施方式中，为了进一步减少后续人体检测阶段的工作量，避免为了获取包含人体的图像，多次进行图像获取，在获取目标图像的过程中，具体实施时，可以尽量优先获取有效图像作为目标图像。其中，上述有效图像具体可以理解为是包含人体的图像。相应的，可以将不包含人体的图像理解为无效图像。如此，可以避免为了获取后续可以使用的包含人体的图像，多次重复进行目标图像的获取，有助于提高了处理效率。

在一个实施方式中，为了能高效地获取上述有效图像，上述获取目标图像，具体实施时，可以包括以下内容：

S11-1：采集目标区域中的声音信息；

S11-2：根据所述声音信息，确定目标方位；

S11-3：根据所述目标方位，移动摄像头，以获取所述目标图像。

在本实施方式中，上述目标方位具体可以是声音来源的方向。上述方向具有较大的概率存在人员运动。因此，在上述目标方位，相对于其他方位，具有更大地概率获取到包含人体的图像，即有效图像。

在本实施方式中，具体实施时，可以采用麦克风阵列作为声音采集器采集目标区域中的声音信息；并通过定位器根据所采集的声音信息，确定声音来源的方向，将上述声音来源的方向确定为上述目标方位。当然，需要说明的是，上述所列举的麦克风阵列只是为了更好地说明本申请实施方式。具体实施时，也可以根据具体情况，选择使用其他合适的声音采集器。

在本实施方式中，具体实施时，上述摄像头具体可以是设置在移动装置上，即摄像头是可以移动不是固定设置目标区域内的。例如，可以将摄像头设置在由滑轮和电机组成的移动装置上。如此，摄像头可以通过移动装置灵活地在目标区域内进行移动，从而可以有效地扩大采集目标图像的区域范围，实现在更大的检测范围中获取更多的目标图像。即本申请实施例使用摄像头的方式不同于现有方法中使用摄像头的方式。具体的，现有方法中使用摄像头时是将摄像头固定设置在目标区域中某个固定位置上，以采集视频流数据。按照现有方法中使用摄像头的方式单个摄像头所能检测的范围有限，为了提高总的检测范围则需要在目标区域的多个位置分别布设摄像头。如此，又会增加实施成本。而本申请实施例中提供的使用摄像头的方式，则是将摄像头设置在移动装置上，进而可以根据情况，通过移动装置实时地移动摄像头以获取目标区域中不同位置的目标图像，从而可以利用一个或少量的摄像头实现对较大范围内的目标图像的获取，降低了实施成本。同时，由于摄像头可以移动，可以根据人体的具体情况调整摄像头与人体的角度和距离，从而可以获取质量更高的目标图像，以便后续可以更加准确地进行跌倒识别。当然，需要说明的是，上述所列举的移动装置只是为了更好地说明本申请实施方式。具体实施时，也可以根据具体情况和精度要求选择使用其他可移动结构作为移动装置，例如可移动机器人、遥控车等等，以便可以灵活地移动摄像头的位置。对此，本申请不作限定。

在本实施方式中，具体实施时，可以先通过麦克风阵列采集目标区域中的声音信息；通过定位器确定声音的来源方向，并将该方向作为有可能存在人员活动的方向，即目标方位；再通过移动装置，根据所确定的目标方位，将摄像头移动到声音的来源位置，从而可以通过普通的摄像头获取到质量相对较高的有效图像。

S12：通过目标检测网络，对所述目标图像进行人体检测，以确定所述目标图像是否为包含人体的图像。

在本实施方式中，在获取到目标图像后先要对目标图像进行人体检测，以确定所要分析的目标图像是否为包含人体的图像，即有效图像。以便后续可以仅对有效图像进行下一步的跌倒识别。将不包含人体的图像作为无效图像，不进行下一步的跌倒识别。从而可以通过事先排除不包含人体的图像，避免对不包含人体的图像进行无意义的跌倒识别，降低了跌倒识别的数据处理量，进一步提高了处理速率。

在一个实施方式中，具体实施时，可以在确定所述目标图像为不包含人体的图像的情况下，重新获取目标图像，以便对目标区域中的可能存在人员活动的区域进行实时监测。

在一个实施方式中，考虑到所获取的、待分析的数据是单帧的图像，考虑到图像分析的具体特点，为了能够快速、准确地确定出目标图像是否为包含人体的图像。具体实施时，可以通过基于目标检测算法的目标检测网络对所获取的目标图像进行人体检测，以确定目标图像是否为包含人体的图像。

在一个实施方式中，可以在步骤S12执行之前，预先通过以下方式建立上述用于进行人体检测的目标检测网络：

S1：收集人体图像样本数据，所述人体图像样本数据包括不同状态下的人体图像；

S2：在所述人体图像样本数据中标注人体区域；

S3：利用标注后的人体图像样本数据进行训练，以得到基于目标检测算法的目标检测网络。

在本实施方式中，上述目标检测算法具体可以是一种基于深度学习的检测算法，也称为SSD(SingleShotMultiBoxDetector)算法。该算法的核心是在在特征图上采用卷积核来预测一系列defaultboundingboxes的类别分数、偏移量，进而可以快速、准确地检测出待检测的目标图像是否是包含人体的有效图像。

在本实施方式中，为了配合后续的跌倒识别，要求所述人体图像样本数据具体可以包括不同状态下人体状态的多个图像。

在一个实施方式中，为了能够全面地考虑到多种不同的人体状态状况，上述人体状态具体可以包括：人体站着的状态、人体坐着的状态、人体躺着的状态、人体蹲着的状态、人体倾斜着的状态、人体趴着的状态等等。如此，具体实施时，可以通过目标检测算法对多种包含不同的人体状态的图像进行学习，以便可以建立能够同时检测、识别多种包含不同的人体状态的图像。

在本实施方式中，具体实施时，可以利用SSD目标检测网络在人体图像样本数据的图像中标定出人体区域，以便后续可以进行与人体区域特征识别相关的训练。

在一个实施方式中，在利用标注后的人体图像样本数据进行训练之前，可以先构建SSD目标检测网络，即相当于目标检测的初始模型。具体实施时，可以在tensorflow框架上构建上述SSD目标检测网络，并以inception_v2作为为特征提取器。

在一个实施方式中，上述利用标注后的人体图像样本数据进行训练，以得到基于目标检测算法的目标检测网络，具体实施时，可以包括以下内容：利用标注后的人体图像样本数据作为输入数据，对上述SSD目标检测网络，即目标检测的初始模型进行训练，以得到训练好的目标检测网络；再根据人体图像样本数据和精度要求，对上述训练好的目标检测网络进行调整优化，以获得用于人体检测的SSD网络，即所述基于目标检测算法的目标检测网络。

S13：在确定所述目标图像为包含人体的图像的情况下，通过卷积神经网络，对所述目标图像进行跌倒识别，以确定所述目标图像中的人体是否处于跌倒状态。

在一个实施方式中，为了能够快速、准确地从包含人体的图像中识别出人体状态所对应的人体状态，例如，分辨出人体处于跌倒状态，或者没有处于跌倒状态，可以采用卷积神经网络对目标图像进行跌倒识别，以确定目标图像中的人体是否处于跌倒状态。

在本实施方式中，具体实施时，考虑到图像分类算法(CNN)相关思想，可以将训练好的卷积神经网络作为跌倒识别模型，将确定包含人体的目标图像作为输入数据，通过上述跌倒识别模型识别出上述目标图像中的人体是否处于跌倒状态，从而可以根据单帧图像判断人体是否发生跌倒。

在一个实施方式中，具体实施时，可以在进行S13之前预先通过以下方式建立识别跌倒精度较高、识别速度较快的卷积神经网络：

S1：获取人体图像样本数据，其中，所述人体图像样本数据包括不同状态下的人体图像；

S2：从所述人体图像样本数据中提取符合要求的图像作为预处理样本数据；

S3：根据所述预处理样本数据的图像中的人体状态，将所述预处理样本数据中的图像划分正样本数据和负样本数据，其中，所述正样本数据中的图像包括以下至少之一：包含有人体站着的状态的图像、包含有人体坐着的状态的图像、包含有人体蹲着的状态的图像、包含有人体倾斜着的状态的图像；所述负样本数据中的图像包括以下至少之一：包含有人体躺着的状态的图像、包含有人体趴着的状态的图像；

S4：利用所述正样本数据、所述负样本数据进行训练，以建立用于识别人体状态类型的所述卷积神经网络。

在一个实施方式中，考虑到为了建立较为精确的基于目标检测算法的目标检测网络，上述人体图像样本数据中就已经包括了多个包含人体状态的图像。因此，在本实施方式中，可以基于人体图像样本数据提取符合要求的图像，作为预处理样本数据。

在本实施方式中，在获得预处理样本数据后，需要先根据跌倒和非跌倒两种状态，对预处理样本数据中的图像进行分类。具体的，可以将预处理样本数据中表征非跌倒的图像，包括：包含有人体站着的状态的图像、包含有人体坐着的状态的图像、包含有人体蹲着的状态的图像、包含有人体倾斜着的状态的图像等图像划分为正样本数据，即正图像数据集。将预处理样本数据中表征跌倒的图像，包括：包含有人体躺着的状态的图像、包含有人体趴着的状态的图像等图像划分为负样本数据，即负图像数据集。如此，后续可以针对人体的跌倒状态和人体的非跌倒两种状态的识别，利用对应的上述两种样本数据进行具体的训练学习，以建立识别精度较高的卷积神经网络。

在一个实施方式中，利用所述正样本数据、所述负样本数据进行训练，以建立用于识别人体状态类型的所述卷积神经网络，具体实施时，可以包括以下内容：构建初始的卷积神经网络；利用上述正样本数据和负样本数据作为输入数据对上述初始的卷积神经网络进行关于人体的跌倒状态和人体的非跌倒状态的识别训练，以到识别精度较高、识别速度较快的卷积神经网络。进而可以利用该卷积神经网络准确地识别出目标图像中的人体状态对应的是否是人体的跌倒状态。如果识别得到的目标图像中的人体状态对应于人体的跌倒状态，则可以判断人体处于跌倒状态；如果识别得到的目标图像中的人体状态对应于人体的非跌倒状态，则可以判断人体没有处于跌倒状态。

在一个实施方式中，在建立上述卷积神经网络的过程中，具体实施时，还可以包括以下内容：

S1：获取不包含人体的图像样本数据；

S2：利用所述不包含人体的图像样本数据，对所述卷积神经网络进行误检测训练。

在本实施方式中，通过上述误检测训练，可以先识别出并过滤掉不包含人体的目标图像，提高卷积神经网络在进行跌倒检测时的处理效率。

在本申请实施例中，相较于现有技术，通过获取单帧的目标图像而不是视频流进行分析处理，并利用基于目标检测算法的目标检测网络先识别出包含有人体的图像，再通过基于分类算法的卷积神经网络对目标图像中的人体状态进行分类识别，以识别出目标图像中人体的具体状态，从而解决了现有方法中存在的识别跌倒准确度差、误差大、效率低的技术问题，达到了精确、高效地识别出跌倒状态的技术效果。

在一个实施方式中，为了能够从人体图像样本数据中提取适用进行跌倒识别训练的预处理样本数据，所述符合要求的图像具体可以包括：人体区域的占图比大于80％的图像。如此，可以从人体图像样本数据中提取适用跌倒识别训练的样本数据，避免了重新采集进行跌倒识别的样本数据，降低了训练成本，提高了学习效率。

在一个实施方式中，上述初始的卷积神经网络具体可以是inception_v3网络。其中，上述inception_v3网络具体是一种适用于图像识别的卷积神经网络。当然，需要说明的是，上述所列举的卷积神经网络只是为了更好地说明本申请实施方式。具体实施时，也可以根据具体情况和识别的具体特征选择使用其他合适的卷积神经网络。对此，本申请不作限定。

在一个实施方式中，在利用所述正样本数据、所述负样本数据进行训练，以建立用于识别人体状态类型的所述卷积神经网络之前，所述方法还包括，根据初始的卷积神经网络，对所述正样本数据、负样本数据中的图像进行预处理，以使得所述正样本数据、负样本数据中的图像与初始的卷积神经网络相匹配。具体的，例如，在初始的卷积神经网络为inception_v3网络，上述预处理具体可以包括：对所述正样本数据、负样本数据中的图像进行图像变换到指定尺寸，例如，变换到299×299像素点的大小。

在一个实施方式中，进一步考虑到在利用卷积神经网络进行跌倒识别时，实际上只需要区分两种类型，即人体的跌倒状态和人体的非跌倒状态。因此，根据卷积神经网络所要分类识别的复杂程度，兼顾为了提高处理效率，减少对计算资源的占用和浪费，在建立初始的卷积神经网络时，可以先对所述卷积神经网络进行简化改进。其中，上述简化改进具体可以包括：减少卷积神经网络的层数，和/或，减少卷积神经网络的卷积核个数。即可以通过单独减少卷积神经网络的层数，或者单独减少卷积神经网络的卷积核个数，或者同时少卷积神经网络的层数和减少卷积神经网络的卷积核个数对上述卷积神经网络进行简化改进，从而可以达到兼顾识别精度的同时，减少对计算资源的占用，提高处理效率。

在一个实施方式中，在卷积神经网络为inception_v3网络的情况下，上述对inception_v3网络的简化改进具体可以包括：将inception_v3网络的层数由11层(或结构)删减为6层或5层，和/或，删减inception_v3网络中的卷积核个数，进而可以得到简化的卷积神经网络。

在一个实施方式中，上述简化的卷积神经网络具体实施时可以按照以下方式建立：

S1：对已有的inception_V3网络进行简化处理。

在本实施方式中，具体的，可以删除inception_V3网络最后5个inception结构，得到简化后的inception_v3网络。

S2：使用预处理的样本数据训练进简化后的inception_v3网络，得到可用于跌倒检测的参数模型Fa1。

S3：依次将简化后的inception_v3网络的所有卷积层的卷积核个数减少为原有的三分之二，同时修改参数模型Fa1，使其适应于减少卷积核个数后的网络。

S4：继续使用预处理的样本数据对修改后的参数模型Fa1进行训练，并对修改后的Fa1进行微调，得到可用于跌倒检测的参数模型Fa2。

S5：校验上述参数模型Fa2，根据校验结果对上述参数模型Fa2按照S4所包括的训练和微调操作进行调整，以得到简化的卷积神经网络。

在本实施方式中，上述校验具体可以包括：比较卷积核减少后与减少前的网络跌倒检测的准确率，若跌倒检测的准确率没有出现明显下降，则可以继续上述的减少卷积核，并进行相应的训练和微调的操作，以得到更加精简的卷积神经网络；若跌倒检测的准确率出现明显下降，则可以停止训练和微调的操作，并确定上一次的网络和参数模型用于跌倒检测，即作为用于跌倒检测的卷积神经网络。

在一个实施方式中，确定目标图像中的人体处于跌倒状态后，可以判断目标区域中的人体发生跌倒，进而可以发出警报，以提示目标区域中有人跌倒。其中，上述发出警报具体可以包括通过蜂鸣器发出警报声以提醒有人跌倒；也可以通过通讯设备向目标区域的负责人或者周边的医护人员发送报警信息(例如，警报短信)，请求及时医治等等。当然，上述所列举的多种发出警报的方式只是为了更好地说明本申请实施方式。具体实施时，也可以根据具体情况选择其他合适的发出警报的方式进行报警。对此，本申请不作限定。

从以上的描述中，可以看出，本申请实施例提供的人体跌倒检测方法，通过获取单帧的目标图像而不是视频流进行分析处理，并利用基于目标检测算法的目标检测网络先识别出包含有人体的图像，再通过基于分类算法的卷积神经网络对目标图像中的人体状态进行分类识别，以识别出目标图像中人体的具体状态，从而解决了现有方法中存在的识别跌倒准确度差、误差大、效率低的技术问题，达到了精确、高效地识别出跌倒状态的技术效果；又通过采集声音信息以确定目标方位，并根据目标方位移动摄像头以采集有效的目标图像，有效地扩大了跌倒检测的检测范围，提高了获取有效目标图像的准确度，提高了检测效果，改善了用户体验；还通过获取包含多种人体状态的图像作为样本数据，以建立目标检测网络、卷积神经网络，提高了根据单帧图像识别人体跌倒的精度；还通过根据所要识别的状态类型的复杂度，对卷积神经网络进行了相应的简化改进，提高了实施效率、降低了对运算资源的占用。

基于同一发明构思，本发明实施例中还提供了一种人体跌倒检测装置，如下面的实施例所述。由于人体跌倒检测装置解决问题的原理与人体跌倒检测方法相似，因此装置的实施可以参见人体跌倒检测方法的实施，重复之处不再赘述。以下所使用的，术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。请参阅图2，是本申请实施例提供的人体跌倒检测装置的一种组成结构示意图，该装置具体可以包括：获取模块21、人体检测模块22、跌倒识别模块23，下面对该结构进行具体说明。

获取模块21，具体可以用于获取目标图像；

人体检测模块22，具体可以用于通过目标检测网络，对所述目标图像进行人体检测，以确定所述目标图像是否为包含人体的图像；

跌倒识别模块23，具体可以用于在确定所述目标图像为包含人体的图像的情况下，通过卷积神经网络，对所述目标图像进行跌倒识别，以确定所述目标图像中的人体是否处于跌倒状态。

在本实施方式中，需要说明的是上述人体跌倒检测装置具体可以是一种能够实现人体跌倒检测的人体跌倒检测机器人。上述人体跌倒检测机器人具体可以应用于家庭、医院、商场等多种场所，以实时检测上述场所，及时发现场所中的人员跌倒，以便及时地进行报警，及时进行相关救助。

在一个实施方式中，为了能够扩大检测范围，高效地获取有效目标图像，所述获取模块21具体可以包括以下结构单元：

声音采集器，具体可以用于采集目标区域中的声音信息；

定位器，具体可以用于根据所述声音信息，确定目标方位；

移动装置和摄像头，其中，所述摄像头具体可以设于所述移动装置上，所述移动装置具体可以用于根据所述目标方位，移动所述摄像头，所述摄像头具体可以用于获取目标图像。

在本实施方式中，上述移动装置具体可以包括滑轮和电机。如此，具体实施时，可以通过带有滑轮和电机的移动装置，带动摄像头像目标方位移动，以更好地获取有效的目标图像。当然，需要说明的是，上述所列举的移动装置只是为了更好的说明本申请实施方式。具体实施时，上述移动装置也可以是其他类型的可移动设备，例如，可移动的机器人、遥控汽车等等。对此，本申请不作限定。

在本实施方式中，上述有效的目标图像具体可以是包含有人体的图像。通过可以上述移动装置，可以根据目标方位移动摄像头，尽可能地获取有效目标图像，从而可以减少人体检测模块22的工作量，提高工作效率。

在一个实施方式中，为了在检测到人体跌倒后及时进行报警以对跌倒人员进行及时救治，所述装置具体还可以包括报警模块，用于发出警报。

在一个实施方式中，上述报警模块具体可以包括蜂鸣器，如此，所述报警模块具体实施时，可以通过蜂鸣器在确定目标图像中的认为处于跌倒状态的情况下发出警报。

在一个实施方式中，上述报警模块具体还可以包括信号发送器等通讯设备，如此，所述报警模块具体实施时，可以通过信号发送器等通讯设备在确定目标图像中的认为处于跌倒状态的情况下向相关负责人(例如监护人或者商场保安)或者周边医护人员发送报警信息，以提示相关负责人或者周边医护人员有人跌倒，尽快救治。

在一个实施方式中，所述装置具体还可以包括目标检测网络建立模块，目标检测网络建立模块具体实施时可以按照以下程序执行：获取人体图像样本数据，其中，所述人体图像样本数据包括多个包含人体状态的图像；标注所述人体图像样本数据的图像中的人体区域；利用标注后的人体图像样本数据进行训练，以得到基于目标检测算法的目标检测网络。

在一个实施方式中，所述人体状态具体可以包括：人体站着的状态、人体坐着的状态、人体躺着的状态、人体蹲着的状态、人体倾斜着的状态、人体趴着的状态等。当然，需要说明的是，上述所列举的人体状态只是为了更好地说明本申请实施方式。具体实施时，也可以根据具体情况和要求，引入除上述所列举的状态以外的其他状态作为人体状态。对此，本申请不作限定。

在一个实施方式中，上述人体检测模块22与获取模块21相连，具体实施时，人体检测模块22可以在确定所述目标图像为不包含人体的图像的情况下，发送信息至获取模块21，通过获取模块21重新获取目标图像。

在一个实施方式中，所述装置具体还可以包括卷积神经网络建立模块，用于建立用于识别人体状态类型的卷积神经网络，其中，所述卷积神经网络建立模块具体可以包括：

获取单元，具体可以用于获取人体图像样本数据，其中，所述人体图像样本数据包括多个包含人体状态的图像；

提取单元，具体可以用于从所述人体图像样本数据中提取符合要求的图像作为预处理样本数据；

划分单元，具体可以用于根据所述预处理样本数据的图像中的人体状态，将所述预处理样本数据中的图像划分正样本数据和负样本数据，其中，所述正样本数据中的图像包括以下至少之一：包含有人体站着的状态的图像、包含有人体坐着的状态的图像、包含有人体蹲着的状态的图像、包含有人体倾斜着的状态的图像；所述负样本数据中的图像包括以下至少之一：包含有人体躺着的状态的图像、包含有人体趴着的状态的图像；

建立单元，具体可以用于利用所述正样本数据、所述负样本数据进行训练，以建立用于识别人体状态类型的卷积神经网络。

在一个实施方式中，所述卷积神经网络建立模块具体还可以包括：

误检测训练单元，具体可以用于获取不包含人体的图像样本数据；并利用所述不包含人体的图像样本数据，对所述卷积神经网络进行误检测训练。

在本实施方式中，为了建立并训练出准确度更高的卷积神经网络，所述符合要求的图像具体可以包括：人体区域的占图比大于80％的图像等。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，上述实施方式阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。为了描述的方便，在本说明书中，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

此外，在本说明书中，诸如第一和第二这样的形容词仅可以用于将一个元素或动作与另一元素或动作进行区分，而不必要求或暗示任何实际的这种关系或顺序。在环境允许的情况下，参照元素或部件或步骤(等)不应解释为局限于仅元素、部件、或步骤中的一个，而可以是元素、部件、或步骤中的一个或多个等。

从以上的描述中，可以看出，本申请实施例提供的人体跌倒检测装置，通过获取单帧的目标图像而不是视频流进行分析处理，并先利用基于目标检测算法的目标检测网络识别出包含有人体的图像，再通过基于分类算法的卷积神经网络对目标图像中的人体状态进行分类，以识别出目标图像中人体的具体状态，从而解决了现有方法中存在的识别跌倒准确度差、效率低的技术问题，达到了精确、高效地识别出跌倒状态的技术效果；又通过采集声音信息以确定目标方位，并根据目标方位移动摄像头以采集有效的目标图像，有效地扩大了跌倒检测的检测范围，提高了获取有效目标图像的准确度，改善了检测效果。

本申请实施方式还提供了一种电子设备，具体可以参阅图3所示的基于本申请实施方式提供的人体跌倒检测方法的电子设备组成结构示意图，所述电子设备具体可以包括输入设备31、处理器32、存储器33。其中，所述输入设备31具体可以用于接收所获取的目标图像。所述处理器32具体可以用于通过目标检测网络，对所述目标图像进行人体检测，以确定所述目标图像是否为包含人体的图像；在确定所述目标图像为包含人体的图像的情况下，通过卷积神经网络，对所述目标图像进行跌倒识别，以确定所述目标图像中的人体是否处于跌倒状态。所述存储器33具体可以用于存储所述目标图像、所述目标检测网络、所述卷积神经网络，以及检测过程中产生的中间数据等。

在本实施方式中，所述输入设备具体可以是用户和计算机系统之间进行信息交换的主要装置之一。所述输入设备可以包括键盘、鼠标、摄像头、扫描仪、光笔、手写输入板、语音输入装置等；输入设备用于把原始数据和处理这些数的程序输入到计算机中。所述输入设备还可以获取接收其他模块、单元、设备传输过来的数据。所述处理器可以按任何适当的方式实现。例如，处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述存储器具体可以是现代信息技术中用于保存信息的记忆设备。所述存储器可以包括多个层次，在数字系统中，只要能保存二进制数据的都可以是存储器；在集成电路中，一个没有实物形式的具有存储功能的电路也叫存储器，如RAM、FIFO等；在系统中，具有实物形式的存储设备也叫存储器，如内存条、TF卡等。

在本实施方式中，该电子设备具体实现的功能和效果，可以与其它实施方式对照解释，在此不再赘述。

本说申请实施方式中还提供了一种基于人体跌倒检测方法的计算机存储介质，所述计算机存储介质存储有计算机程序指令，在所述计算机程序指令被执行时实现：获取目标图像；通过目标检测网络，对所述目标图像进行人体检测，以确定所述目标图像是否为包含人体的图像；在确定所述目标图像为包含人体的图像的情况下，通过卷积神经网络，对所述目标图像进行跌倒识别，以确定所述目标图像中的人体是否处于跌倒状态。

在本实施方式中，上述存储介质包括但不限于随机存取存储器(RandomAccessMemory,RAM)、只读存储器(Read-OnlyMemory,ROM)、缓存(Cache)、硬盘(HardDiskDrive,HDD)或者存储卡(MemoryCard)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的，用于进行网络连接通信的接口。

在本实施方式中，该计算机存储介质存储的程序指令具体实现的功能和效果，可以与其它实施方式对照解释，在此不再赘述。

在一个具体实施场景示例中，应用本申请提供人体跌倒检测方法和装置设计相应的人体跌倒检测机器人，并应用该人体跌倒检测机器人进行具体的人体跌倒检测。具体实施过程可以参阅以下内容。

在本实施方式中，上述人体跌倒检测检测机器人具体可以参阅图4所示的在一个场景示例中应用本申请实施方式提供的人体跌倒检测方法和装置设计的人体跌倒检测机器人的组成结构示意图。该机器人具体可以使用声源定位模块定位人体大致方位(即目标方位)，再利用摄像头采集数据(即目标图像)，通过深度学习算法实现基于单帧图像的人体跌倒检测。其中，所述跌倒检测机器人包括具体可以移动式机器人本体12、摄像头模块13、报警模块14(可选)、声源定位模块15(可选)、人体检测模块16和跌倒识别模块17等多个功能模块。

具体实施时，上述声源定位模块15具体可以用于判断人体大致方位，并利用摄像头模块13拍摄单帧图像，人体检测模块16和跌倒识别模块17具体可以用于根据拍摄的图像判断人是否跌倒，并将结果传输给可移动式机器人本体12；若跌倒则可移动式机器人本体12可以通过控制报警模块14进行报警。

其中，所述的可移动式机器人本体12至少包括：机器人主体、电机和滑轮等结构。所述的摄像头模块13具体可以用于采集单张图像，并送入人体检测模块16用以判断是否存在人体(即判断图像是否是包含人体的图像)。所述的报警模块14至少可以包含手机通信功能和110报警功能。如此，具体实施时，可以利用手机通信功能实现跌倒信息的发送和图片信息发送，通过110报警功能实现110报警以便及时救助。所述的声源定位模块15具体可以通过麦克风阵列判断声音的来源方向，用以方便的寻找人。所述的人体检测模块16具体可以通过深度学习中SSD目标检测算法实现人体检测。所述的跌倒识别模块17通过深度学习中卷积神经网络实现跌倒状态识别。

在本实施方式中，需要说明的是，上述人体跌倒检测机器人可以认为是一种具体的人体跌倒检测装置，其实施的主要原理同人体跌倒检测装置相同。

具体实施时，可以参阅图5所示的在一个场景示例中应用人体跌倒检测机器人进行人体跌倒检测的流程示意图，利用人体跌倒检测机器人进行人体跌倒检测。具体实施时，可以包括以下步骤：

S1：可选的，通过可移动式机器人结合声源定位模块寻找人的大致方向；

S2：通过摄像头模块采集单帧图像，并传入可移动式机器人；

S3：通过可移动式机器人本体将采集到的单帧图像传入人体检测模块；

S4：通过人体检测模块判断采集的图像中是否有人存在。如有，则继续5；若没有，则返回1；

S5：将检测到的人体区域送入跌倒识别模块，判断人体是否跌倒；

S6：将识别得到的结果信息传输到可移动式机器人本体；

S7：若跌倒，则继续8；若没有跌倒，则返回2；

S8：执行报警，将跌倒的信息和图像传输到连接的手机或者其他终端上。

在本实施方式中，上述人体检测模块是基于深度学习中SSD目标检测算法实现的。检测模块在进行图像检测之前，可以按照如下流程进行SSD算法训练：

S1：收集包含人体的人体图像样本数据(人占图片的比例不限)。因为需要检测人体区域，且需要检测任何状态下的人体，因此收集的图像数据具体可以包含不同状态下的人体，如站着、蹲着、躺着、倾斜着的人体。

S2：对收集到的人体图像样本数据进行标注。SSD目标检测网络在人体检测时会标定出人体的区域，因此在训练时需要先提供人体图像样本数据中人体的区域。

S3：构建SSD目标检测网络。具体实施时，可以在tensorflow框架上构建SSD目标检测网络，并以inception_v2为特征提取器。

S4：用处理好的人体图像样本数据训练SSD目标检测网络，并利用现有已经训练好的参数模型对其进行微调，得到用于人体检测的SSD网络(即目标检测网络)。

在本实施方式中，上述跌倒检测模块具体可以包括一种深度学习中的卷积神经网络。跌倒识别模块在进行图像识别之前，具体可以通过如下流程进行卷积神经网络训练：

S1：收集包含人体的预处理样本数据(人占图片的比例超过80％，即人体检测模块检测到的人体区域图片)。

S2：构建正负图像数据样本。正样本(即正样本数据)所包含所有非跌倒的人体图片，即人体状态为站着、端着、倾斜着等；负样本(即负样本数据)所包含的图片都是人跌倒后图片，即人体状态为躺着、趴着等。

S3：预处理图像数据样本中的图像。具体的，可以将所有的图像数据变换到指定大小，例如299×299像素点大小。

S4：构建卷积神经网络。具体的，上述跌倒识别模块可以采用inception_v3网络。

在本实施方式中，需要补充的是，针对跌倒识别的需求，通常使用的inception_v3的网路在计算资源上存在浪费。因此在构建inception_v3网络时，对其进行了简化修改，具体简化改进包括以下内容：

S4-1：在保证识别准确率的同时，减少inception结构，例如层数。达到简化了网络结构，提升了识别速度，节约了计算资源的效果。

S4-2：在保证识别准确率同时，减少卷积核个数。达到降低了网络大小，提升了识别速度，节约了计算资源的效果。

S5：将预处理后图片数据样本输入inception_v3网络进行训练，得到跌倒识别网络(即卷积神经网络)。

在本实施方式中，具体利用上述人体检测模块和跌倒检测模块进行人体跌倒检测时具体可以包括以下内容：

S1：将采集到的图片输入SSD目标检测网络，检测人体所在的区域，并将结果保存。

S2：将检测到的所有人体区域变换成指定大小，如299×299像素点大小。

S3：将S2中得到结果输入到得到的inception_v3模型中，以多线程的方式同时进行预测，给出识别结果。

S4：根据所述识别记过，显示跌倒检测结果，确定人体是否发生跌倒。

对上述人体跌倒检测机器人进行多次跌倒检测测试后，分析发现：上述人体跌倒检测机器人由于使用目标检测算法SSD和图像分类算法CNN，可以在复杂场景下，通过单帧图像实现较高精度的跌倒检测，并可以实施报警处理。克服的现有方法中人体检测不准确的问题；同时由于不需要通过对视频流的分析处理，仅以单帧图像就能实现跌倒检测，降低了计算量，提高了检测效率；并且以可移动式机器人为载体，可实现全方位的监控。

通过上述场景示例，验证了本申请实施例提供的人体跌倒检测方法和装置，通过获取单帧的目标图像而不是视频流进行分析处理，并先利用基于目标检测算法的目标检测网络识别出包含有人体的图像，再通过基于分类算法的卷积神经网络对目标图像中的人体状态进行分类，以识别出目标图像中人体的具体状态，确实解决了现有方法中存在的识别跌倒准确度差、效率低的技术问题，达到了精确、高效地识别出跌倒状态的技术效果。

尽管本申请内容中提到不同的具体实施例，但是，本申请并不局限于必须是行业标准或实施例所描述的情况等，某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、处理、输出、判断方式等的实施例，仍然可以属于本申请的可选实施方案范围之内。

虽然本申请提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或客户端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。

上述实施例阐明的装置或模块等，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，移动终端，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例采用递进的方式描述，各个实施例之间相同或相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

虽然通过实施例描绘了本申请，本领域普通技术人员知道，本申请有许多变形和变化而不脱离本申请的精神，希望所附的实施方式包括这些变形和变化而不脱离本申请。

Claims

一种人体跌倒检测方法，其特征在于，包括：

获取目标图像；

通过目标检测网络，对所述目标图像进行人体检测，以确定所述目标图像是否为包含人体的图像；

在确定所述目标图像为包含人体的图像的情况下，通过卷积神经网络，对所述目标图像进行跌倒识别，以确定所述目标图像中的人体是否处于跌倒状态。
根据权利要求1所述的方法，其特征在于，所述获取目标图像，包括：

采集目标区域中的声音信息；

根据所述声音信息，确定目标方位；

根据所述目标方位，移动摄像头，以获取所述目标图像。
根据权利要求1所述的方法，其特征在于，按照以下方式建立所述卷积神经网络：

获取人体图像样本数据，其中，所述人体图像样本数据包括多个包含人体状态的图像；

从所述人体图像样本数据中提取符合要求的图像作为预处理样本数据；

根据所述预处理样本数据的图像中的人体状态，将所述预处理样本数据中的图像划分正样本数据和负样本数据，其中，所述正样本数据中的图像包括以下至少之一：包含有人体站着的状态的图像、包含有人体坐着的状态的图像、包含有人体蹲着的状态的图像、包含有人体倾斜着的状态的图像；所述负样本数据中的图像包括以下至少之一：包含有人体躺着的状态的图像、包含有人体趴着的状态的图像；

利用所述正样本数据、所述负样本数据进行训练，以建立用于识别人体状态类型的卷积神经网络。
根据权利要求3所述的方法，其特征在于，建立所述卷积神经网络的过程中，所述方法还包括：

获取不包含人体的图像样本数据；

利用所述不包含人体的图像样本数据，对所述卷积神经网络进行误检测训练。
一种人体跌倒检测装置，其特征在于，包括：

获取模块，用于获取目标图像；

人体检测模块，用于通过目标检测网络，对所述目标图像进行人体检测，以确定所述目标图像是否为包含人体的图像；

跌倒识别模块，用于在确定所述目标图像为包含人体的图像的情况下，通过卷积神经网络，对所述目标图像进行跌倒识别，以确定所述目标图像中的人体是否处于跌倒状态。
根据权利要求5所述的装置，其特征在于，所述获取模块包括：

声音采集器，用于采集目标区域中的声音信息；

定位器，用于根据所述声音信息，确定目标方位；

移动装置和摄像头，其中，所述摄像头设于所述移动装置上，所述移动装置用于根据所述目标方位，移动所述摄像头；所述摄像头用于获取目标图像。
根据权利要求5所述的装置，其特征在于，所述装置还包括卷积神经网络建立模块，用于建立用于识别人体状态类型的卷积神经网络，其中，所述卷积神经网络建立模块包括：

获取单元，用于获取人体图像样本数据，其中，所述人体图像样本数据包括多个包含人体状态的图像；

提取单元，用于从所述人体图像样本数据中提取符合要求的图像作为预处理样本数据；

划分单元，用于根据所述预处理样本数据的图像中的人体状态，将所述预处理样本数据中的图像划分正样本数据和负样本数据，其中，所述正样本数据中的图像包括以下至少之一：包含有人体站着的状态的图像、包含有人体坐着的状态的图像、包含有人体蹲着的状态的图像、包含有人体倾斜着的状态的图像；所述负样本数据中的图像包括以下至少之一：包含有人体躺着的状态的图像、包含有人体趴着的状态的图像；

建立单元，用于利用所述正样本数据、所述负样本数据进行训练，以建立用于识别人体状态类型的卷积神经网络。
根据权利要求7所述的装置，其特征在于，所述卷积神经网络建立模块还包括：

误检测训练单元，用于获取不包含人体的图像样本数据；并利用所述不包含人体的图像样本数据，对所述卷积神经网络进行误检测训练。