CN117058518B

CN117058518B - 基于yolo改进的深度学习目标检测方法、装置和计算机设备

Info

Publication number: CN117058518B
Application number: CN202310972082.5A
Authority: CN
Inventors: 王志明; 钟枚汕; 李鹏; 田兵; 韦杰; 刘胜荣; 尹旭; 林跃欢; 聂少雄; 张佳明; 张伟勋; 马俭
Original assignee: Southern Power Grid Digital Grid Research Institute Co Ltd
Current assignee: Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date: 2023-08-03
Filing date: 2023-08-03
Publication date: 2024-05-03
Anticipated expiration: 2043-08-03
Also published as: CN117058518A

Abstract

本申请涉及一种基于YOLO改进的深度学习目标检测方法、目标检测装置、服务器和存储介质。所述方法包括：获取对当前场景内的待检测对象进行拍摄所形成的图像；将图像输入预训练的YOLO模型，通过YOLO模型对图像中的待检测对象进行分类，得到分类结果；第一类对象为当前场景内的固定物体对象，第二类对象为当前场景内的活动物体对象；在图像中的第一类对象和第二类对象之间的距离满足预设条件的情况下，获取第二类对象在所述图像中的位置信息和形状信息；基于第二类对象的位置信息和形状信息，对第二类对象进行目标检测；其中，目标检测用于确定第二类对象的身份信息。采用本方法能够提升对检测对象进行目标检测的准确性和保证关于检测对象使用的安全性。

Description

基于YOLO改进的深度学习目标检测方法、装置和计算机设备

技术领域

本申请涉及智能检测技术领域，特别是涉及一种基于YOLO改进的深度学习目标检测方法、装置和计算机设备。

背景技术

输电线路是电力系统的组成部分，用于承担输送和分配电能的任务，输电线路的安全关乎着人们的工作生活质量，故而需要实时检查在输电线路的附近是否有物体的距离过近，以防止物体触电或者线路损坏的事故。

在传统的物体检测方式中，一般是直接检测输电线与其他外来物体之间的距离，并在该距离小于预设距离时，通过连接于输电线路的报警器进行报警警告。

然而，在实际操作中对其他外来物体的检测效果不佳，常常不能及时的检测出在输电线路的附近出现了其他外来物体，导致物体检测的准确度较低。

发明内容

基于此，有必要针对上述技术问题，提供一种基于YOLO改进的深度学习目标检测方法、目标检测装置、服务器、计算机可读存储介质和计算机程序产品。

根据本公开实施例的第一方面，提供一种基于YOLO改进的深度学习目标检测方法，包括：

获取对当前场景内的待检测对象进行拍摄所形成的图像；

将所述图像输入预训练的YOLO模型，通过所述YOLO模型对所述图像中的待检测对象进行分类，得到分类结果；所述YOLO模型为一种深度学习模型，所述分类结果包括对所述待检测对象分类后的第一类对象和第二类对象；所述第一类对象为所述当前场景内的固定物体对象，所述第二类对象为所述当前场景内的活动物体对象；

在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设条件的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息；

基于所述第二类对象的位置信息和形状信息，对所述第二类对象进行目标检测；其中，所述目标检测用于确定第二类对象的身份信息。

在一示例性实施例中，所述方法还包括：

在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设条件的情况下，基于所述第二类对象的位置信息，确定与所述第二类对象距离最近的警报装置；

向所述警报装置发出报警指令，以指示所述警报装置发出报警信号。

在一示例性实施例中，在所述对所述第二类对象进行目标检测之后，还包括：

基于所述第二类对象的身份信息，确定与所述第二类对象相互绑定的终端设备；

向所述终端设备发出报警指令，以指示所述终端设备发出报警信号。

在一示例性实施例中，所述在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设条件的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息，包括：

基于预设的比例尺确定所述图像中的所述第一类对象和所述第二类对象之间的连线距离；

在所述连线距离小于预设阈值的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息。

在一示例性实施例中，所述第一类对象包括至少两个第一子类对象，以及所述第二类对象包括至少两个第二子类对象；

所述基于预设的比例尺确定所述图像中的所述第一类对象和所述第二类对象之间的连线距离，包括：

基于所述第一类对象中任意两个第一子类对象之间的距离，确定所述比例尺；

基于所述比例尺确定各所述第一子类对象分别与每一所述第二子类对象之间的连线距离。

在一示例性实施例中，所述基于所述第二类对象的位置信息和形状信息，对所述第二类对象进行目标检测，包括：

将所述第二类对象的位置信息与预设数据库中的参考对象的位置信息进行第一匹配，得到第一匹配结果；以及

将所述第二类对象的形状信息与所述数据库中的参考对象的形状信息进行第二匹配，得到第二匹配结果；

基于所述第一匹配结果和所述第二匹配结果，确定第二类对象的身份信息。

在一示例性实施例中，所述基于所述第一匹配结果和所述第二匹配结果，确定第二类对象的身份信息，包括：

基于所述第一匹配结果，确定匹配于所述第二类对象的第一参考对象集合；以及

基于所述第二匹配结果，确定匹配于所述第二类对象的第二参考对象集合；

将所述第一参考对象集合和所述第二参考对象集合之间的交集参考对象作为目标参考对象；

将所述目标参考对象的身份信息作为所述第二类对象的身份信息。

根据本公开实施例的第二方面，提供一种基于YOLO改进的深度学习目标检测装置，包括：

图像获取单元，被配置为执行获取对当前场景内的待检测对象进行拍摄所形成的图像；

对象分类单元，被配置为执行将所述图像输入预训练的YOLO模型，通过所述YOLO模型对所述图像中的待检测对象进行分类，得到分类结果；所述YOLO模型为一种改进的深度学习模型，所述分类结果包括对所述待检测对象分类后的第一类对象和第二类对象；所述第一类对象为所述当前场景内的固定物体对象，所述第二类对象为所述当前场景内的活动物体对象；

信息获取单元，被配置为执行在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设条件的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息；

目标检测单元，被配置为执行基于所述第二类对象的位置信息和形状信息，对所述第二类对象进行目标检测；其中，所述目标检测用于确定第二类对象的身份信息。

根据本公开实施例的第三方面，提供一种服务器，包括：

处理器；

用于存储所述处理器的可执行指令的存储器；

其中，所述处理器被配置为执行所述可执行指令，以实现如上述任一项所述的基于YOLO改进的深度学习目标检测方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，所述计算机可读存储介质中包括计算机程序，当所述计算机程序由服务器的处理器执行时，使得所述服务器能够执行如上述任一项所述的基于YOLO改进的深度学习目标检测方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，所述计算机程序产品中包括程序指令，所述程序指令被服务器的处理器执行时，使得所述服务器能够执行如上述任一项所述的基于YOLO改进的深度学习目标检测方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

该方法先通过获取对当前场景内的待检测对象进行拍摄所形成的图像；将图像输入预训练的YOLO模型，通过YOLO模型对图像中的待检测对象进行分类，得到分类结果；YOLO模型为一种深度学习模型，分类结果包括对待检测对象分类后的第一类对象和第二类对象；第一类对象为当前场景内的固定物体对象，第二类对象为当前场景内的活动物体对象；在图像中的第一类对象和第二类对象之间的距离满足预设条件的情况下，获取第二类对象在所述图像中的位置信息和形状信息；基于第二类对象的位置信息和形状信息，对所述第二类对象进行目标检测；其中，目标检测用于确定第二类对象的身份信息。这样，在一方面，利用预训练的YOLO模型来对图像中的待检测对象进行分类，以对分类的待检测对象进行目标检测，从而优化了目标检测方式的流程，降低了人力和物力的消化；在另一方面，通过区别于现有技术的方式，在图像中的第一类对象和第二类对象之间的距离满足预设条件的情况下，基于第二类对象的位置信息和形状信息，对第二类对象进行目标检测，能够有效提升对第二类对象进行目标检测的准确性，从而保证了检测对象使用的安全性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

图1是根据一示例性实施例示出的一种基于YOLO改进的深度学习目标检测方法的应用环境图；

图2是根据一示例性实施例示出的一种基于YOLO改进的深度学习目标检测方法的流程示意图；

图3是根据一示例性实施例示出的一种获取位置信息和形状信息步骤的流程示意图；

图4是根据一示例性实施例示出的一种对第二类对象进行目标检测步骤的流程示意图；

图5是根据另一示例性实施例示出的一种确定第二类对象的身份信息步骤的流程示意图；

图6是根据一示例性实施例示出的一种基于YOLO改进的深度学习目标检测装置的框图；

图7是根据一示例性实施例示出的一种基于YOLO改进的深度学习目标检测的服务器的框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，尽管多次采用术语“第一”、“第二”等来描述各种操作(或各种阈值或各种应用或各种指令或各种元件)等，不过这些操作(或阈值或应用或指令或元件)不应受这些术语的限制。这些术语只是用于区分一个操作(或阈值或应用或指令或元件)和另一个操作(或阈值或应用或指令或元件)。

本申请实施例提供的基于YOLO改进的深度学习目标检测方法，可以应用于如图1所示的应用环境中。其中，终端102通过通信网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上，也可以放在云上或其他网络服务器上。

在一些实施例中，参考图1，服务器104首先获取对当前场景内的待检测对象进行拍摄所形成的图像；然后，服务器104将所述图像输入预训练的YOLO模型，通过所述YOLO模型对所述图像中的待检测对象进行分类，得到分类结果；所述YOLO模型为一种深度学习模型，所述分类结果包括对所述待检测对象分类后的第一类对象和第二类对象；所述第一类对象为所述当前场景内的固定物体对象，所述第二类对象为所述当前场景内的活动物体对象；然后，服务器104在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设条件的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息；最后，服务器104基于所述第二类对象的位置信息和形状信息，对所述第二类对象进行目标检测；其中，所述目标检测用于确定第二类对象的身份信息。

在一些实施例中，终端102(如移动终端、固定终端)可以以各种形式来实施。其中，终端102可为包括诸如移动电话、智能电话、笔记本电脑、便携式手持式设备、个人数字助理(PDA，Personal Digital Assistant)、平板电脑(PAD)等等的移动终端，终端102也可以是自动柜员机(Automated Teller Machine，ATM)、自动一体机、数字TV、台式计算机、固式计算机等等的固定终端。

下面，假设终端102是固定终端。然而，本领域技术人员将理解的是，若有特别用于移动目的的操作或者元件，根据本申请公开的实施方式的构造也能够应用于移动类型的终端102。

在一些实施例中，服务器104运行的数据处理组件可以加载正在被执行的可以包括各种附加服务器应用和/或中间层应用中的任何一种，如包括HTTP(超文本传输协议)、FTP(文件传输协议)、CGI(通用网关界面)、RDBMS(关系型数据库管理系统)等。

在一些实施例中，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。服务器104可以适于运行提供前述公开中描述的终端102的一个或多个应用服务或软件组件。

在一些实施例中，APP或者客户端运行的操作系统可以包括各种版本的MicrosoftApple/>和/或Linux操作系统、各种商用或类/>操作系统(包括但不限于各种GNU/Linux操作系统、Google/>OS等)和/或移动操作系统，诸如/>Phone、/>OS、/>OS、/>OS操作系统，以及其它在线操作系统或者离线操作系统，在这里不做具体的限制。

在一些实施例中，如图2所示，提供了一种基于YOLO改进的深度学习目标检测方法，以该方法应用于图1中的服务器104为例进行说明，该方法包括以下步骤：

步骤S11，获取对当前场景内的待检测对象进行拍摄所形成的图像。

在一实施例中，当前场景为电力系统中输电线路所在的场景，在该场景中包括关于输电线路的相关物(如电线、电缆、转接头等)，也包括关于非输电线路的相关物(如维修机械物、施工机械物等杂物)。

在一实施例中，预先将摄像设备布置于输电线路的附近，使得摄像设备的监控范围涵盖输电线路，由此可以获得摄像设备对当前场景内的待检测对象进行拍摄所形成的图像。

其中，图像可以为彩色图形也可以为灰度图像。例如，图像为416×416×3的图像，其中416×416表示图像的宽度乘高度，3代表颜色空间的三个通道，分别是Red，Green，Blue，简称为R，G，B，故而416×416×3的图像为彩色图像

步骤S12：将图像输入预训练的YOLO模型，通过YOLO模型对图像中的待检测对象进行分类，得到分类结果。

在一实施例中，YOLO模型为一种深度学习模型。

在一实施例中，YOLO模型使用ImageNet数据集对模型的前20层卷积网络进行预训练，然后使用完整的网络，在PASCAL VOC数据集上进行对象识别和定位的训练，以及YOLO模型的最后一层采用线性激活函数，其它层都是采用Leaky ReLU作为激活函数。其中，在模型训练中分别采用了数据丢弃(drop out)和数据增强(data augmentation)来防止过拟合。

其中，数据丢弃是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。其原理为：通过将某神经元的输出设置为0，以达到使其失活的效果，消除网络中过分依赖某个神经元。而数据增强的理为：通过将某神经元的输出由小于1设置为1或者其他比输出值更高的设置值，以达到使其活性增强的效果，以增强网络对某个神经元的依赖性。

在一具体训练场景中，服务器先将图像的尺寸(resize)转换成448x448的大小，再送入到YOLO模型中进行训练，YOLO模型输出一个7x7x30的张量(tensor)。其中，张量表征图像中所有网格包含的对象(概率)、该对象可能的2个位置(bounding box)和可信程度(置信度)，最后采用NMS(Non-maximal suppression，非极大值抑制)算法选出最有可能是目标的结果，如此不断深度训练学习，直至准确度提高至预设值。

其中，YOLO模型由CBL网络、Res unit网络和ResX网络组成。CBL网络是YOLO模型结构中的最小组件，其由Conv+Bn+Leaky_relu激活函数三者组成。

其中，Res unit网络用于让网络可以构建的更深。

其中，ResX网络由一个CBL网络和X个残差组件构成，是YOLO模型结构中的的大组件，每个Res模块前面的CBL都起到下采样的作用，因此经过5次Res模块后，得到的特征图是416→208→104→52→26→13大小。

其中，每个ResX网络中包含1+2×X个卷积层，因此整个主干网络Backbone中一共包含1+(1+2×1)+(1+2×2)+(1+2×8)+(1+2×8)+(1+2×4)＝52，再加上一个FC全连接层，即可以组成一个Darknet53分类网络。

在一实施例中，YOLO模型对图像中的待检测对象进行分类，得到分类结果包括：步骤(1)YOLO模型采用K-means聚类得到针对输入图像的先验框尺寸；其中YOLO模型为每种尺度设定3种先验框，其总共聚类出9种尺寸的先验框；步骤(2)YOLO模型利用先验框预测对象类别，预测对象类别时可以使用softmax函数，也可以将softmax函数替换为一个1x1的卷积层+logistic激活函数的结构进行预测对象分类；步骤(3)YOLO模型通过darknet网络得到三种不同尺度的预测结果，每个尺度都对应N个通道，包含着预测的信息，每个网格每个尺寸的anchors的预测结果，由此获得目标检测结果，目标分别为目标A和目标B。

其中，目标检测结果是基于图像内容的情况下识别出目标A和目标B，即分类结果包括对待检测对象分类后的第一类对象(A类型目标集合)和第二类对象(B类型目标集合)。

在一实施例中，第一类对象为当前场景内的固定物体对象，即将A类型目标集合中的输电线路相关物作为固定物体对象。第二类对象为当前场景内的活动物体对象，即将B类型目标集合中的非输电线路相关物作为活动物体对象。

在一实施例中，第一类对象包括至少两个第一子类对象，以及第二类对象包括至少两个第二子类对象。具体地，固定物体对象的数量为多个，活动物体对象的数量也为多个。

步骤S13：在图像中的第一类对象和第二类对象之间的距离满足预设条件的情况下，获取第二类对象在图像中的位置信息和形状信息。

在一实施例中，位置信息为第二类对象在图像中的像素坐标以及与参考物在图像中的像素距离。其中，参考物为人工预设的物体，并被拍摄在图像中。

其中，预设条件为工程师预先设置的安全距离，即当图像中的第一类对象和第二类对象之间的距离小于安全距离的时候，可以认为第一类对象和第二类对象之间可能出现电路事故，则满足预设条件。

在一实施例中，若在图像中的第一类对象和第二类对象之间的距离满足预设条件的情况下，则服务器还将执行以下步骤：

步骤一：基于第二类对象的位置信息，确定与第二类对象距离最近的警报装置。

在一些实施例中，服务器基于第二类对象在图像中的位置信息确定第二类对象的实际地理位置，然后确定在整个输电线路中与第二类对象的实际地理位置最近的警报装置。

步骤二：向警报装置发出报警指令，以指示警报装置发出报警信号。

在一些实施例中，警报装置为工程师预先装配在输电线路中。在警报装置接收到报警指令后即发出报警信号，以提醒第二类对象中周边的工作人员或者其他人员。其中，报警信号包括如预设的报警灯、报警震动、报警音频等。

步骤S14：基于第二类对象的位置信息和形状信息，对第二类对象进行目标检测。

在一实施例中，目标检测用于确定第二类对象的身份信息。

在一些实施例中，目标检测包括：服务器基于第二类对象在图像中的位置信息确定第二类对象的实际地理位置，以及基于第二类对象在图像中的形状信息确定第二类对象的实际形状；然后，服务器根据第二类对象的实际地理位置和实际形状识别第二类对象的具体身份(如识别第二类对象为维修机械物、施工机械物等杂物)。

在一实施例中，服务器在对所述第二类对象进行目标检测之后，还包括以下步骤：

步骤一：基于第二类对象的身份信息，确定与第二类对象相互绑定的终端设备。

在一些实施例中，用于工程师维修或者检查电路的第二类对象预先绑定于一个电子设备，并与该电子设备保持通信连接。

步骤二：向终端设备发出报警指令，以指示终端设备发出报警信号。

在一些实施例中，在图像中的第一类对象和第二类对象之间的距离满足预设条件的情况下，服务器向电子设备发出报警指令，在电子装置接收到报警指令后即发出报警信号，以提醒第二类对象中周边的工作人员或者其他人员。其中，报警信号包括如预设的报警灯、报警震动、报警音频等。

上述的基于YOLO改进的深度学习目标检测过程中，服务器首先获取对当前场景内的待检测对象进行拍摄所形成的图像；将所述图像输入预训练的YOLO模型，通过所述YOLO模型对所述图像中的待检测对象进行分类，得到分类结果；所述YOLO模型为一种深度学习模型，所述分类结果包括对所述待检测对象分类后的第一类对象和第二类对象；所述第一类对象为所述当前场景内的固定物体对象，所述第二类对象为所述当前场景内的活动物体对象；在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设条件的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息；最后，基于所述第二类对象的位置信息和形状信息，对所述第二类对象进行目标检测；其中，所述目标检测用于确定第二类对象的身份信息。这样，在一方面，利用预训练的YOLO模型来对图像中的待检测对象进行分类，以对分类的待检测对象进行目标检测，从而优化了目标检测方式的流程，降低了人力和物力的消化；在另一方面，通过区别于现有技术的方式，在图像中的第一类对象和第二类对象之间的距离满足预设条件的情况下，基于第二类对象的位置信息和形状信息，对第二类对象进行目标检测，能够有效提升对第二类对象进行目标检测的准确性，从而保证了检测对象使用的安全性。

在一示例性实施例中，参阅图3，图3为本申请中获取位置信息和形状信息一实施例的流程示意图。在步骤S13中，服务器在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设条件的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息的过程，可以通过以下方式实现：

步骤S131，基于预设的比例尺确定图像中的所述第一类对象和第二类对象之间的连线距离。

在一实施例中，服务器确定图像中的第一类对象和第二类对象之间的连线距离，包括如下步骤：

步骤一：基于第一类对象中任意两个第一子类对象之间的距离，确定比例尺。

在一实施例中，工程师预先任意选择图像中的两个第一子类对象，然后服务器计算该两个第一类对象在图像中的像素距离，并将像素距离用作为距离参考的比例尺。

在一实施例中，工程师预先任意选择图像中的两个第一子类对象能够进行替换，且经过计算后的比例尺的大小为固定尺寸并且不可变化。

步骤二：基于比例尺确定各第一子类对象分别与每一第二子类对象之间的连线距离。

在一实施例中，服务器首先计算各第一子类对象分别与每一第二子类对象在图像中的像素距离，然后利用比例尺计算各第一子类对象分别与每一第二子类对象在图像中的像素距离，以得到连线距离。

步骤S132，在连线距离小于预设阈值的情况下，获取第二类对象在图像中的位置信息和形状信息。

在一实施例中，位置信息为第二类对象在输电线路中的实际位置坐标，即。服务器基于第二类对象在图像中的像素坐标和参考物的像素坐标，确定第二类对象在输电线路中的实际地理位置，其中，参考物为人工预设的物体，并被拍摄在图像中。

在一示例性实施例中，参阅图4，图4为本申请中对第二类对象进行目标检测一实施例的流程示意图。在步骤S14中，服务器基于所述第二类对象的位置信息和形状信息，对所述第二类对象进行目标检测的过程，可以执行以下方式：

步骤S141，将第二类对象的位置信息与预设数据库中的参考对象的位置信息进行第一匹配，得到第一匹配结果。

在一实施例中，预设数据库中存储有多个输电线路中的实际对象和对应的实际地理坐标，这些实际对象均为对应于第二类对象的参考对象。

步骤S142，将第二类对象的形状信息与数据库中的参考对象的形状信息进行第二匹配，得到第二匹配结果。

在一实施例中，预设数据库中存储有多个输电线路中的实际对象和对应的实际形状图像，这些实际对象均为对应于第二类对象的参考对象。

步骤S143，基于第一匹配结果和第二匹配结果，确定第二类对象的身份信息。

在一示例性实施例中，参阅图5，图5为本申请中确定第二类对象的身份信息一实施例的流程示意图。在步骤S142中，服务器基于所述第一匹配结果和所述第二匹配结果，确定第二类对象的身份信息的过程，可以执行以下方式：

步骤a1，基于第一匹配结果，确定匹配于第二类对象的第一参考对象集合。

在一实施例中，服务器将第二类对象的实际地理坐标与各参考对象的实际地理坐标进行匹配，以确定地理坐标匹配相同的第一类参考对象，即得到第一匹配结果。

步骤a2，基于第二匹配结果，确定匹配于第二类对象的第二参考对象集合。

在一实施例中，服务器将第二类对象的实际形状图像(即形状信息)与各参考对象的实际形状图像进行匹配，以确定形状图像匹配相同的第二类参考对象，即得到第二匹配结果。

步骤a3，将第一参考对象集合和第二参考对象集合之间的交集参考对象作为目标参考对象。

步骤a4，将目标参考对象的身份信息作为第二类对象的身份信息。

作为示例，在第一参考对象集合中包括有参考对象A、参考对象B和参考对象C，在第一参考对象集合中包括有参考对象D、参考对象E和参考对象C。服务器将两个集合中的交集对象，即参考对象C作为目标参考对象。

这样，在一方面，利用预训练的YOLO模型来对图像中的待检测对象进行分类，以对分类的待检测对象进行目标检测，从而优化了目标检测方式的流程，降低了人力和物力的消化；在另一方面，通过区别于现有技术的方式，在图像中的第一类对象和第二类对象之间的距离满足预设条件的情况下，基于第二类对象的位置信息和形状信息，对第二类对象进行目标检测，能够有效提升对第二类对象进行目标检测的准确性，从而保证了检测对象使用的安全性。

应该理解的是，虽然图2-图5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-图5中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

可以理解的是，本说明书中上述方法的各个实施例之间相同/相似的部分可互相参见，每个实施例重点说明的是与其他实施例的不同之处，相关之处参见其他方法实施例的说明即可。

图6是本申请实施例提供的一种基于YOLO改进的深度学习目标检测装置框图。参照图6，该基于YOLO改进的深度学习目标检测装置20包括：图像获取单元21、对象分类单元22、信息获取单元23和目标检测单元24。

其中，图像获取单元21，被配置为执行获取对当前场景内的待检测对象进行拍摄所形成的图像；

其中，对象分类单元22，被配置为执行将所述图像输入预训练的YOLO模型，通过所述YOLO模型对所述图像中的待检测对象进行分类，得到分类结果；所述YOLO模型为一种改进的深度学习模型，所述分类结果包括对所述待检测对象分类后的第一类对象和第二类对象；所述第一类对象为所述当前场景内的固定物体对象，所述第二类对象为所述当前场景内的活动物体对象；

其中，信息获取单元23，被配置为执行在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设条件的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息；

其中，目标检测单元24，被配置为执行基于所述第二类对象的位置信息和形状信息，对所述第二类对象进行目标检测；其中，所述目标检测用于确定第二类对象的身份信息。

在一示例性实施例中，所述方法还包括：

图7是本申请实施例提供的一种服务器30的框图。例如，服务器30可以为一种电子设备、电子组件或者服务器阵列等等。参照图7，服务器30包括处理器31，其进一步处理器31可以为处理器集合，其可以包括一个或多个处理器，以及服务器30包括由存储器32所代表的存储器资源，其中，存储器32上存储有计算机程序，例如应用程序。在存储器32中存储的计算机程序可以包括一个或一个以上的每一个对应于一组可执行指令的模块。此外，处理器31被配置为执行可执行指令时实现如上述的基于YOLO改进的深度学习目标检测方法。

在一些实施例中，服务器30为电子设备，该电子设备中的计算系统可以运行一个或多个操作系统，包括以上讨论的任何操作系统以及任何商用的服务器操作系统。该服务器30还可以运行各种附加服务器应用和/或中间层应用中的任何一种，包括HTTP(超文本传输协议)服务器、FTP(文件传输协议)服务器、CGI(通用网关界面)服务器、超级服务器、数据库服务器等。示例性数据库服务器包括但不限于可从(国际商业机器)等商购获得的数据库服务器。

在一些实施例中，处理器31通常控制服务器30的整体操作，诸如与显示、数据处理、数据通信和记录操作相关联的操作。处理器31可以包括一个或多个处理器组件来执行计算机程序，以完成上述的方法的全部或部分步骤。此外，处理器组件可以包括一个或多个模块，便于处理器组件和其他组件之间的交互。例如，处理器组件可以包括多媒体模块，以方便利用多媒体组件控制用户服务器30和处理器31之间的交互。

在一些实施例中，处理器31中的处理器组件还可以称为CPU(Central ProcessingUnit，中央处理单元)。处理器组件可能是一种电子芯片，具有信号的处理能力。处理器还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器组件等。另外，处理器组件可以由集成电路芯片共同实现。

在一些实施例中，存储器32被配置为存储各种类型的数据以支持在服务器30的操作。这些数据的示例包括用于在服务器30上操作的任何应用程序或方法的指令、采集数据、消息、图片、视频等。存储器32可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、快闪存储器、磁盘、光盘或石墨烯存储器。

在一些实施例中，存储器32可以为内存条、TF卡等，可以存储服务器30中的全部信息，包括输入的原始数据、计算机程序、中间运行结果和最终运行结果都保存在存储器32中。在一些实施例中，它根据处理器指定的位置存入和取出信息。在一些实施例中，有了存储器32，服务器30才有记忆功能，才能保证正常工作。在一些实施例中，服务器30的存储器32按用途可分为主存储器(内存)和辅助存储器(外存)，也有分为外部存储器和内部存储器的分类方法。外存通常是磁性介质或光盘等，能长期保存信息。内存指主板上的存储部件，用来存放当前正在执行的数据和程序，但仅用于暂时存放程序和数据，关闭电源或断电，数据会丢失。

在一些实施例中，服务器30还可以包括：电源组件33被配置为执行服务器30的电源管理，有线或无线网络接口34被配置为将服务器30连接到网络，和输入输出(I/O)接口35。服务器30可以操作基于存储在存储器32的操作系统，例如Windows Server，Mac OS X，Unix，Linux，FreeBSD或类似。

在一些实施例中，电源组件33为服务器30的各种组件提供电力。电源组件33可以包括电源管理系统，一个或多个电源，及其他与为服务器30生成、管理和分配电力相关联的组件。

在一些实施例中，有线或无线网络接口34被配置为便于服务器30和其他设备之间有线或无线方式的通信。服务器30可以接入基于通信标准的无线网络，如WiFi，运营商网络(如2G、3G、4G或5G)，或它们的组合。

在一些实施例中，有线或无线网络接口34经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，有线或无线网络接口34还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在一些实施例中，输入输出(I/O)接口35为处理器31和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

本申请实施例提供的一种计算机可读存储介质的框图。该计算机可读存储介质上存储有计算机程序，其中，计算机程序被处理器执行时实现如上述的基于YOLO改进的深度学习目标检测方法。

在本申请各个实施例中的各功能单元集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在计算机可读存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机可读存储介质在一个计算机程序中，包括若干指令用以使得一台服务器(可以是个人计算机，系统服务器，或者网络设备等)、电子设备(例如MP3、MP4等，也可以是手机、平板电脑、可穿戴设备等智能终端，也可以是台式电脑等)或者处理器(processor)以执行本申请各个实施方式方法的全部或部分步骤。

本申请实施例提供的一种计算机程序产品的框图。该计算机程序产品中包括程序指令，该程序指令可由服务器的处理器执行以实现如上述的基于YOLO改进的深度学习目标检测方法。

本领域内的技术人员应明白，本申请的实施例可提供有基于YOLO改进的深度学习目标检测方法、基于YOLO改进的深度学习目标检测装置20、服务器30、计算机可读存储介质或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机程序指令(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例中基于YOLO改进的深度学习目标检测方法、基于YOLO改进的深度学习目标检测装置20、服务器30、计算机可读存储介质或计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序产品实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序产品到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的程序指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序产品也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机程序产品中的程序指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的程序指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

需要说明的，上述的各种方法、装置、电子设备、计算机可读存储介质、计算机程序产品等根据方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照相关方法实施例的描述，在此不作一一赘述。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种基于YOLO改进的深度学习目标检测方法，其特征在于，所述方法包括：

获取对当前场景内的待检测对象进行拍摄所形成的图像；

在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设安全距离的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息；所述安全距离为工程师预先设置得到；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设安全距离的情况下，基于所述第二类对象的位置信息，确定与所述第二类对象距离最近的警报装置；

3.根据权利要求1所述的方法，其特征在于，在所述对所述第二类对象进行目标检测之后，还包括：

4.根据权利要求1所述的方法，其特征在于，所述在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设安全距离的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息，包括：

5.根据权利要求4所述的方法，其特征在于，所述第一类对象包括至少两个第一子类对象，以及所述第二类对象包括至少两个第二子类对象；

6.根据权利要求1所述的方法，其特征在于，所述基于所述第二类对象的位置信息和形状信息，对所述第二类对象进行目标检测，包括：

7.根据权利要求6所述的方法，其特征在于，所述基于所述第一匹配结果和所述第二匹配结果，确定第二类对象的身份信息，包括：

8.一种基于YOLO改进的深度学习目标检测装置，其特征在于，包括：

信息获取单元，被配置为执行在所述图像中的所述第一类对象和所述第二类对象之间的距离满足预设安全距离的情况下，获取所述第二类对象在所述图像中的位置信息和形状信息；所述安全距离为工程师预先设置得到；

9.一种计算机设备，其特征在于，包括：

处理器；

用于存储所述处理器的可执行指令的存储器；

其中，所述处理器被配置为执行所述可执行指令，以实现如权利要求1至7中任一项所述的基于YOLO改进的深度学习目标检测方法。

10.一种计算机可读存储介质，所述计算机可读存储介质中包括程序数据，其特征在于，当所述程序数据由计算机设备的处理器执行时，使得所述计算机设备能够执行如权利要求1至7中任一项所述的基于YOLO改进的深度学习目标检测方法。