CN117351420A

CN117351420A - 一种智能开关门检测方法

Info

Publication number: CN117351420A
Application number: CN202311349500.1A
Authority: CN
Inventors: 李德军; 陆建军; 王青朋
Original assignee: Jiangsu Sixingda Information Technology Co ltd
Current assignee: Jiangsu Sixingda Information Technology Co ltd
Priority date: 2023-10-18
Filing date: 2023-10-18
Publication date: 2024-01-05
Anticipated expiration: 2043-10-18
Also published as: CN117351420B

Abstract

本发明公开了一种智能开关门检测方法，包括以下步骤：步骤一：输入检测的图像并在网络中共提取三个特征层，其大小分别为13×13，26×26，52×52，这三个特征层用于与上采样后的其他特征层进行拼接或预测输出；步骤二：最底层的特征层13×13，在进行卷积处理后，分别用于预测输出，或经过卷积和上采样与26×26的特征图进行拼接，然后经过拼接后的特征图同样在进行卷积处理之后，用于预测输出以及通过卷积和上采样实现与52×52特征层的拼接。本发明能够监测门的状态，支持分布在不同的位置的八路摄像头对门的状态进行监测，能够对于关键事件进行保存30s视频，能够满足用户的需求进行个性化阈值设定。

Description

一种智能开关门检测方法

技术领域

本发明涉及开关门检测的技术领域，尤其涉及一种智能开关门检测方法。

背景技术

智能开关门检测系统是部署在边缘计算网关装置，主要功能：开关门检测。Resnet作为卷积神经网络的一个重要模型在各个领域被广泛应用，也因此衍生了各个改进模型。一般来说，理论上随着神经网络的层数不断增加，其特征提取的能力以及准确度也会不断提高，但实际上，对由单纯的卷积神经网络构成的深度网络来说，较多层数的网络的收敛表现反而会不如较少层数的网络。当网络的层数高达一定程度时，其准确率将会到达阈值，此时再添加新的网络层往往会带来相反的效果。

为了解决这个问题，Resnet提出了残差结构，本文对Yolov3的优化的主要体现在对残差结构进行改进，加入Mixup中的Beta函数，其能够更有效的获得图片特征，提高目标检测的准确度。

发明内容

本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊，而这种简化或省略不能用于限制本发明的范围。

鉴于上述现有智能开关门检测方法存在的问题，提出了本发明。

因此，本发明目的是提供一种智能开关门检测方法，其本发明能够监测门的状态，支持分布在不同的位置的八路摄像头对门的状态进行监测，能够对于关键事件进行保存30s视频，能够满足用户的需求进行个性化阈值设定。

为解决上述技术问题，本发明提供如下技术方案：一种智能开关门检测方法，包括以下步骤：

步骤一：输入检测的图像并在网络中共提取三个特征层，其大小分别为13×13，26×26，52×52，这三个特征层用于与上采样后的其他特征层进行拼接或预测输出；

步骤二：最底层的特征层13×13，在进行卷积处理后，分别用于预测输出，或经过卷积和上采样与26×26的特征图进行拼接，然后经过拼接后的特征图同样在进行卷积处理之后，用于预测输出以及通过卷积和上采样实现与52×52特征层的拼接，对该拼接后的特征层进行卷积处理之后进行预测输出；

步骤三：在网络模型的最后一层，融合三个预测输出，采用开关门检测模型算法实现对检测准确度进行提升并得到最终的检测结果。

作为本发明所述智能开关门检测方法的一种优选方案，其中：所述步骤一种的网络采用特征提取网络：Darknet53，该特征提取网络含有53个卷积层。

作为本发明所述智能开关门检测方法的一种优选方案，其中：所述步骤三中的开关门检测模型算法中每个单元格输出3个结果，每个结果对应一个先验框，目标检测框的结果需要结合先验框并通过计算得出目标边界框的坐标。

作为本发明所述智能开关门检测方法的一种优选方案，其中：所述开关门检测模型算法公式如下：

b_x＝σ(t_x)+c_x

b_y＝σ(t_y)+c_y

其中，c_x和c_y为先验框的中心在该特征图中的坐标，p_w和p_h为先验框的宽和高，(t_x,t_y)预测边界框中心偏移量，(b_x，b_y)为宽高缩放比为最终预测的目标边界框的在特征图中的中心坐标，b_w，b_h为最终预测的目标边界框的宽和高；σ(x)函数代表sigmoid函数用于预测偏移量缩放至0到1之间。

作为本发明所述智能开关门检测方法的一种优选方案，其中：所述目标检测公式计算后结合置信度与非极大值抑制对预测目标框进行筛选；完成目标边界框预测之后，在原始图像中会出现一个目标拥有多个预测框，此时先通过置信度判断该目标框中是否存在目标物体，然后通过目标框的位置坐标和置信度进行非极大值抑制，通过交并比IoU筛选出最终的目标边界框。

作为本发明所述智能开关门检测方法的一种优选方案，其中：所述函数算法中加入Beta函数，能够更有效的获得图片特征，提高目标检测的准确度，具体包括：

G(x)＝σF(x)+(1-σ)x

其中σ代表Beta函数。

作为本发明所述智能开关门检测方法的一种优选方案，其中：所述智能开关门检测方法运用了开关门检测系统，其包括host层和device层，所述host层采用八核处理器芯片，所述Device层内设置有加速模块并集成处理器，在端侧实现图像识别、图像分类。

作为本发明所述智能开关门检测方法的一种优选方案，其中：所述开关门检测系统首先通过opencv拉取视频流进行处理，之后通过socket将图片发送到device层种的加速模块，加速模块接收图片并将图片输入到开关门检测模型，最后将检测结果通过socket发送到host层。

本发明的有益效果：本发明能够监测门的状态，支持分布在不同的位置的八路摄像头对门的状态进行监测，能够对于关键事件进行保存30s视频，能够满足用户的需求进行个性化阈值设定。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。其中：

图1为本发明智能开关门检测方法的方法步骤结构示意图。

图2为本发明智能开关门检测方法的残差函数示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合说明书附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

其次，此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例，也不是单独的或选择性的与其他实施例互相排斥的实施例。

再其次，本发明结合示意图进行详细描述，在详述本发明实施例时，为便于说明，表示器件结构的剖面图会不依一般比例作局部放大，而且所述示意图只是示例，其在此不应限制本发明保护的范围。此外，在实际制作中应包含长度、宽度及深度的三维空间尺寸。

参照图1－图2，提供了一种智能开关门检测方法，其特征在于，包括以下步骤：

其中，所述步骤一种的网络采用特征提取网络：Darknet53，该特征提取网络含有53个卷积层；

其中，所述步骤三中的开关门检测模型算法中每个单元格输出3个结果，每个结果对应一个先验框，目标检测框的结果需要结合先验框并通过计算得出目标边界框的坐标，具体的，所述开关门检测模型算法公式如下：

b_x＝σ(t_x)+c_x

b_y＝σ(t_y)+c_y

其中，c_x和c_y为先验框的中心在该特征图中的坐标，p_w和p_h为先验框的宽和高，(t_x,t_y)预测边界框中心偏移量，(b_x，b_y)为宽高缩放比为最终预测的目标边界框的在特征图中的中心坐标，b_w，b_h为最终预测的目标边界框的宽和高；σ(x)函数代表sigmoid函数用于预测偏移量缩放至0到1之间，进一步的，所述目标检测公式计算后结合置信度与非极大值抑制对预测目标框进行筛选；完成目标边界框预测之后，在原始图像中会出现一个目标拥有多个预测框，此时先通过置信度判断该目标框中是否存在目标物体，然后通过目标框的位置坐标和置信度进行非极大值抑制，通过交并比IoU筛选出最终的目标边界框

其中，所述函数算法中加入Beta函数，能够更有效的获得图片特征，提高目标检测的准确度，具体包括：

G(x)＝σF(x)+(1-σ)x

其中σ代表Beta函数。

其中，所述智能开关门检测方法运用了开关门检测系统，其包括host层和device层，所述host层采用八核处理器芯片，所述Device层内设置有加速模块并集成处理器，在端侧实现图像识别、图像分类，所述开关门检测系统首先通过opencv拉取视频流进行处理，之后通过socket将图片发送到device层种的加速模块，加速模块接收图片并将图片输入到开关门检测模型，最后将检测结果通过socket发送到host层。

具体的，本发明是基于华为Atlas芯片的智能开关门检测系统实现分为两个部分：host、device。host使用Rk3588芯片，首先通过opencv拉取视频流进行处理，之后通过socket将图片发送到device华为Atlas200AI加速模块，华为Atlas200AI加速模块接收图片，将图片输入到开关门检测模型，最后将检测结果通过socket发送到host侧。

进一步的，host侧：

RK3588是新一代国产旗舰高性能64位八核处理器，采用8nm工艺，具有高算力、低功耗、超强多媒体、丰富数据接口等特点。

1.内置3DGPU，兼容OpenGLES1.1/2.0/3.2、OpenCL2.2和Vulkan1.2。带有MMU的特殊2D硬件引擎将最大限度地提高显示性能，并提供非常平稳的操作。

2.可支持32路1080P解码，内置多种功能强大的嵌入式硬件引擎，支持8K＠60fps的H.265和VP9解码器、8K＠30fps的H.264解码器和4K＠60fps的AV1解码器；支持8K30fps的H.264和H.265编码器，高质量JPEG编码器/解码器，专门的图像预处理器和后处理器。

3.内置的NPU算力最高可达6.0TOPs，三核结构，算力灵活分配。高算力NPU可支持INT4/INT8/INT16/FP16混合运算，其强大的兼容性，可以轻松转换基于TensorFlow/MXNet/PyTorch/Caffe等一系列框架的网络模型。

瑞芯微RK3588采用8nmLP工艺，基于四核Cortex－A76，四核Cortex－A55大小核CPU结构的64bit超高性能处理器，主频高达2.4GHz，性能强劲的RK3588可为各类AI应用场景带来极其优异的性能表现，和RK3399相比CPU性能提升了3倍；2D硬件引擎将最大限度地提高显示性能。

device侧：Device侧使用Atlas200AI加速模块

Atlas200AI加速模块集成了昇腾310AI处理器，可以在端侧实现图像识别、图像分类等，广泛用于智能摄像机、机器人、无人机等端侧AI场景。半张信用卡大小即可提供22TOPSINT8算力，支持20路高清视频实时分析(1080P25FPS)支持毫瓦级休眠、毫秒级唤醒，典型功耗仅5.5W，使能边缘AI应用。

应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种智能开关门检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的智能开关门检测方法，其特征在于：所述步骤一种的网络采用特征提取网络：Darknet53，该特征提取网络含有53个卷积层。

3.根据权利要求2所述的智能开关门检测方法，其特征在于：所述步骤三中的开关门检测模型算法中每个单元格输出3个结果，每个结果对应一个先验框，目标检测框的结果需要结合先验框并通过计算得出目标边界框的坐标。

4.根据权利要求3所述的智能开关门检测方法，其特征在于：所述开关门检测模型算法公式如下：

b_x＝σ(t_x)+c_x

b_y＝σ(t_y)+c_y

5.根据权利要求4所述的智能开关门检测方法，其特征在于：所述目标检测公式计算后结合置信度与非极大值抑制对预测目标框进行筛选；完成目标边界框预测之后，在原始图像中会出现一个目标拥有多个预测框，此时先通过置信度判断该目标框中是否存在目标物体，然后通过目标框的位置坐标和置信度进行非极大值抑制，通过交并比IoU筛选出最终的目标边界框。

6.根据权利要求5所述的智能开关门检测方法，其特征在于：所述函数算法中加入Beta函数，能够更有效的获得图片特征，提高目标检测的准确度，具体包括：

G(x)＝σF(x)+(1-σ)x

其中σ代表Beta函数。

7.根据权利要求1所述的智能开关门检测方法，其特征在于：所述智能开关门检测方法运用了开关门检测系统，其包括host层和device层，所述host层采用八核处理器芯片，所述Device层内设置有加速模块并集成处理器，在端侧实现图像识别、图像分类。

8.根据权利要求7所述的智能开关门检测方法，其特征在于：所述开关门检测系统首先通过opencv拉取视频流进行处理，之后通过socket将图片发送到device层种的加速模块，加速模块接收图片并将图片输入到开关门检测模型，最后将检测结果通过socket发送到host层。