CN111340843A

CN111340843A - 基于环境自适应和小样本学习的电力场景视频检测方法

Info

Publication number: CN111340843A
Application number: CN202010102755.8A
Authority: CN
Inventors: 聂礼强; 郑晓云; 战新刚; 姚一杨; 刘晓川; 刘萌
Original assignee: Shandong University; State Grid Zhejiang Electric Power Co Ltd; Quzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd; Zhiyang Innovation Technology Co Ltd
Current assignee: Shandong University; State Grid Zhejiang Electric Power Co Ltd; Quzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd; Zhiyang Innovation Technology Co Ltd
Priority date: 2020-02-19
Filing date: 2020-02-19
Publication date: 2020-06-26

Abstract

一种基于环境自适应和小样本学习的电力场景视频检测方法包括，运动检测：采用改进的广义高斯混合模型对监控视频进行环境自适应的运动检测，将检测到的运动目标用候选框标记出来；根据候选框进行相应的图像内容裁剪；将裁剪得到的“特写”图像作为下一环节目标检测的输入；接收目标检测的结果，进行可视化标示或警报；目标检测：对YOLOv3模型进行针对性调整；将所述“特写”图像输入改进后的YOLOv3模型进行目标检测，通过判断该对象是否为动物，来判定是否发生了动物入侵。本发明具有良好的实时性，准确性和鲁棒性，既可满足变电站动物入侵检测的实际需求，也进一步丰富了相关领域的研究。

Description

基于环境自适应和小样本学习的电力场景视频检测方法

技术领域

本发明公开一种基于环境自适应和小样本学习的电力场景视频检测方法，属于电力环境智能识别的技术领域。

背景技术

随着社会的发展，我国对电能的需求日益增大，促使电力设备的数量不断增长，因此加强对电力场景的安全监控，是保障电力安全稳定运行的主要预防措施。早期电力行业中的视频监控主要起到记录的作用，一般都是事故发生后再进行处理。近几年，电力行业的改革一直在推进，其中电力场景监控视频的检测技术也获得了较快的发展。以计算机视觉和深度学习为基础的视频检测方法，能从电力场景监控视频中智能分辨、识别和提取出异常信息，从而更及时地发现安全隐患，更科学地统筹管理。

电力行业中不同专业对于视频监控的检测有着不同的需求，如发电厂、变电站、输电线路、电力营业厅等，因为应用环境和业务性质不同，各专业对视频监控的检测具体要求也不同。

以变电站的动物入侵检测为例，在实际生活中，常规的变电站等均缺乏人工值守，并且离人类居住区存在一定距离。由于其周围环境适宜，也成为了动物栖息的理想场所。作为小样本的动物进入电力场景时，例如蛇鼠等动物进入主控室和高压室，会造成短路、设备绝缘破坏等电力事故。现阶段，变电站应对动物入侵的主要防范措施是施工封锁和设置挡板。由于防范任务的长期性、特殊性和复杂性，使得动物入侵造成的变电站跳闸短路等事故依然时有发生。因此，为了有效地提高防范力度以营造更加安全的变电站工作环境，构建动物入侵检测模型对其进行实时监测是十分必要的。

目前，常用的运动检测方法有以下几种：帧差法、光流法、背景差法和高斯混合模型(GMM)等，这些方法通常用来解决光照条件稳定且图像噪声微小环境下的运动检测问题。相较于上述应用环境，变电站监控环境更为复杂，其原因如下：1)由于变电站监控摄像头在室内和室外均有分布，使得监控视频光照条件不稳定；2)照明灯的开关和工作人员便携式照明设备的使用等行为造成监控视频画面的突变；3)室外环境中太阳光照的渐变，会引起监控视频内物体影子的渐变。所以，现有方法均不适用于变电站环境，致使变电站监控视频的运动检测十分具有挑战性。

中国专利文献CN110084166A公开一种基于深度学习的变电站烟火智能识别监测方法，通过针对变电站实际场景进行视频识别模型和图像识别模型的改进优化，紧接着融合两种改进之后的模型框架，尽可能多地避免二者的劣势，发挥出二者各自的优势，设计一种更加合理灵活的检测方法：平时利用图像识别模型进行监控。但是该文献中的识别监测方法难应用至环境条件多变的变电站领域以检测活体动物的入侵行为。

在变电站目标检测方面，由于入侵动物种类繁多，且动物在监控画面中不清晰或者占比太小，使其难以被识别，严重影响检测效率。另外，现有动物入侵的图片和视频数据相当稀缺，致使变电站动物目标检测相比于一般的目标检测任务面临更多的挑战。

由于变电站动物入侵场景的特殊性和复杂性，且相关的研究也少之又少，致使变电站运动检测和目标检测面临诸多困难。

发明内容

针对现有技术的不足，本发明公开一种基于环境自适应和小样本学习的电力场景视频检测方法。本发明旨在对复杂多变的变电站环境下各种动物的入侵进行实时检测。此外，本发明具有良好的实时性，准确性和鲁棒性，既可满足变电站动物入侵检测的实际需求，也进一步丰富了相关领域的研究。

专业术语解释：

运动检测：在视频图像序列中检测出发生空间位置变化的区域，并将运动目标从图像背景中提取出来。

目标检测：在数字图像中定位出感兴趣的目标物体的位置，并预测其类别信息。

小样本学习：机器学习模型在学习了一定类别的大量数据后，对于新的类别，只需要少量的样本就能快速学习。

特征融合：在基于深度学习的目标检测模型中，浅层的特征图中往往包含一些低级的特征，比如：物体的颜色和轮廓等；而深层的特征图则包含更加复杂的特征，如：建筑、车辆等语义信息。特征融合指将不同层次的特征图信息进行融合，来提高目标检测的精度。

环境自适应：当检测环境发生变化时，运动检测模型能够自动地调整相关参数来适应新的检测环境，以达到最好的检测效果。

实时性：在规定时间内，系统的响应速度达到实时效果。

本发明的技术方案如下：

基于环境自适应和小样本学习的电力场景视频检测方法，其特征在于，包括：

1)运动检测：

采用改进的广义高斯混合模型(GGMM)对监控视频进行环境自适应的运动检测，将检测到的运动目标用候选框标记出来；

同时，根据候选框进行相应的图像内容裁剪；

然后，将裁剪得到的“特写”图像作为下一环节目标检测的输入；

最后，接收目标检测的结果，进行可视化标示或警报。

2)目标检测：

首先，对YOLOv3模型进行针对性调整；

然后，将所述“特写”图像输入改进后的YOLOv3模型进行目标检测，通过判断该对象是否为动物，来判定是否发生了动物入侵。

根据本发明优选的，所述步骤1)中改进的广义高斯混合模型为：

其中，所述广义高斯混合模型简介：

一维广义高斯分布(GGD)的概率密度函数(PDF)为：

其中：Γ()是Gamma函数，

参数μ,δ²,λ分别为GGD的均值、方差和形状参数。形状参数越小，GGD密度函数衰减越快，形状越尖锐，拖尾越长。正因为形状参数的影响，使得GGD比GMM能更充分地描述样本。

使用三维GGD模型，对彩色图像的RGB三个通道分别进行建模，对于三维特征向量X＝(x₁,x₂,x₃)∈R³，其GGD分布定义如下：

其中μ＝(μ₁,μ₂,μ₃)，δ＝(δ₁,δ₂,δ₃)，λ＝(λ₁,λ₂,λ₃)分别为GGD的均值、方差和形状参数，λ_l≥1(l＝1,2,3)，λ决定了每一维GGD的PDF形状；

GGMM是由M个GGD混合组成的，其PDF为：

其中p_j为第j个GGD的权重，满足

参数Θ＝(ε₁,ε₂,ε₃,ε₄)，表示M个GGD的全部参数，其中ε₁＝(μ₁,μ₂,...,μ_M),ε₂＝(δ₁,δ₂,...,δ_M),ε₃＝(λ₁,λ₂,...,λ_M),ε₄＝(p₁,p₂,...,p_M)；p(x|μ_j,δ_j,λ_j)为第j个GGD的PDF。

本设计的优点在于：由于运动检测任务的数据大都处于多维空间中，所以需要构建多维GGD模型，进一步，为了保持每个维度的形状特性，本发明假设形状参数是相互独立的。

根据本发明优选的，所述参数Θ的估计方法包括：

为了实现运动检测的环境自适应性，采用迭代公式在线估计每个像素点的值，利用n时刻上估计的参数与n+1时刻的输入，计算n+1时刻的参数，过程如下：

其中：

β_n是学习速率，决定了背景更新的快慢；θ_j的更新代表了参数μ_j,δ_j,λ_j的更新。

根据本发明优选的，在GGD模型数量M为固定数量模型：3-5个中的任意一个数量。如果模型数量不固定，会增加每个像素点的计算复杂性，故采用固定数量的模型。

根据本发明优选的，其中，所得到的运动检测目标就是每个运动对象的“特写”；

背景更新：考虑每个像素点的值与任一GGD是否匹配，即当每个像素点的值与任一GGD的偏差小于某个阈值时，认为二者相匹配；否则，建立一个新的GGD，使其均值与新的像素点的值相等，从而实现背景的更新；

前景目标提取：将M个GGD按照以下标准进行排序：

p_j/||δ_j||(j＝1,2,...M)

选择前B个用于背景建模：

其中，T是设定的阈值，优选默认0.7，其他的M-B个分布用于前景的描述，从而将运动目标提取出来；一旦检测到运动目标，就将其截图传入目标检测环节，以满足实时性需求；

采用背景差法将当前帧与更新背景做差得到前景，以适应背景变化，从而更准确地检测出运动目标。

根据本发明优选的，在进行候选框标记之前，先对前景图像进行去除噪点处理，方法采用膨胀方法和/或腐蚀的方法。由于本方法前景目标中存在一些噪声，可能会导致运动检测时出现空洞和裂缝的情况，故采用膨胀和腐蚀的方法。

根据本发明优选的，在进行候选框标记之前，再对前景图像进行二值化处理：

将前景表示成RGB彩色图像，当三个同道中有一个值大于0时，将其二值化结果设为1。此处设计的原因在于，当背景与前景的像素值相近时，可能会出现前景被划分背景中的情形，造成空洞现象，因此选用二值化处理。

本发明所述的步骤1)中环境自适应运动检测算法能够很好地解决光照环境复杂多变情境下的运动检测需求，有效克服了光照的突变、渐变、背景扰动、噪声和阴影等对运动检测的限制。

根据本发明优选的，所述步骤2)目标检测包括：

2-1)训练数据的准备：

通过步骤1)所述的运动检测方法将所需的训练数据转换成动物的“特写”；在本发明中，所述运动检测的结果就是每个运动对象的“特写”，因此训练所需的原始数据就触手可得了，例如：可从图片网站爬取11种变电站常见的入侵动物(獾、鸟、猫、鸡、狗、蛙、猴、鼠、兔、浣熊、蛇)图片，进行人工标注，得到训练数据；

2-2)训练数据的预处理：

将每张原始图片的低色温/高色温、过曝/欠曝、过饱和/欠饱和副本重命名，作为新的训练数据，从而扩充训练集；

2-3)调整先验框：

先通过k-means聚类算法找到9个最合适的先验框；理论上，如果随机生成9个先验框，那么在训练过程中接近真实物体框的过程就会比较慢，因此本发明引入聚类算法找到9个最合适的先验框，以加快训练速度，同时提高识别精度；

2-4)YOLOv3模型在检测小物体时性能优异，但在处理大尺寸对象时，检测效果反而更差，这是由于在特征融合过程中，高维度特征信息被一定程度削弱导致的，本发明是对动物的“特写”图片进行识别，属于大尺度对象，故对特征融合过程做调整：

i)在Darknet-53网络基础上增加一次下采样(如图2所示)；

ii)同时，采用类FPN网络结构，从(7×7)尺度的特征图开始提取特征，并执行上采样；

iii)输出层从三层扩展为四层，最后取四个尺度(7×7,14×14,28×28,56×56)的特征图进行融合，从而调整特征金字塔结构，以获得更多的高维度特征信息；

2-5)训练改进后的YOLOv3目标检测模型；

2-6)将步骤1)得到运动目标图像输入到步骤2-5)训练好的YOLOv3模型中，YOLOv3模型输出图片中动物的位置、类别以及置信度。并将这些信息返回给第一个环节的最后一步，及时进行标示或警报，从而满足实时性需求。

综上，本发明要解决的技术问题

(1)针对运动检测精度较低的问题。复杂多变的变电站环境，比如：光照的突变和渐变、背景扰动、噪声和阴影等，会影响运动检测的精度。

(2)针对目标检测准确度低的问题。变电站监控摄像头与动物相隔较远，导致目标在图像中占比过小，使得成像不清晰，严重影响了目标检测的准确度。

(3)针对现有样本稀少的问题。大多数现有动物图片数据集都是动物的特写数据，与监控视频中动物占比极小的实际情况不符，不能用来训练变电站目标检测模型。此外，动物监控视频数据又极其稀缺，难以满足模型的训练需求。

本发明的有益效果如下：

本发明将环境自适应的运动检测技术和小样本学习目标检测技术相结合，实现对变电场进行实时的动物入侵检测。具体地，本发明通过环境自适应的运动检测算法，有效解决了在环境光照复杂多变的条件下运动检测准确率低的问题；针对性地调整YOLOv3模型，适应了变电站动物入侵任务的复杂性，能够在测试集上取得88.6％的准确率，并且鲁棒性强；将运动检测的结果作为目标检测的输入，解决了训练数据匮乏的问题，并满足了入侵检测的实时性需求。

本发明首次实现针对变电站的动物入侵检测，实现计算机视觉技术和深度学习技术在泛在电力物联网建设中的创新性融合，能有效提高变电场动物入侵防范工作的效率，减少电力事故的发生。利用这些优点，可将本专利视频检测方法的思想应用于其他电力场景，以广泛解决电力设备运行环境的智能分析，提升电力监控系统的智慧化水平，为电网管理起到减员增效的重要作用。

附图说明

图1是本发明所述检测方法的流程图；

图2是本发明中，在Darknet-53网络基础上增加一次下采样的示意图；

图3是本发明应用例1中的待识别图；

图4是本发明应用例1中运动检测的结果图；

图5是本发明应用例1对中图候选框内容进行动物识别的结果图；

图6是本发明应用例2对中图候选框内容进行动物识别的结果图；

图7是本发明应用例2的运动检测的结果图；

图8是本发明应用例2的运动检测的结果图，对图7的框选结果不做保存；

图9是本发明应用例3的待识别图；

图10是本发明应用例3的运动检测的结果图，包括人和狗；

图11是本发明应用例3对中图候选框内容进行动物识别的结果，只保留狗的候选框。

具体实施方式

下面结合实施例和说明书附图对本发明做详细的说明，但不限于此。

实施例、

将本发明基于环境自适应和小样本学习的电力场景视频检测方法应用于电力场景中对小动物入侵的检测，具体包括：

1)运动检测：

同时，根据候选框进行相应的图像内容裁剪；

最后，接收目标检测的结果，进行可视化标示或警报。

2)目标检测：

首先，对YOLOv3模型进行针对性调整；

所述步骤1)中改进的广义高斯混合模型为：

其中，所述广义高斯混合模型简介：

一维广义高斯分布(GGD)的概率密度函数(PDF)为：

其中：Γ()是Gamma函数，

GGMM是由M个GGD混合组成的，其PDF为：

其中p_j为第j个GGD的权重，满足

所述参数Θ的估计方法包括：

其中：

在GGD模型数量M为固定数量模型：3-5个中的任意一个数量。如果模型数量不固定，会增加每个像素点的计算复杂性，故采用固定数量的模型。

其中，所得到的运动检测目标就是每个运动对象的“特写”；

前景目标提取：将M个GGD按照以下标准进行排序：

p_j/||δ_j||(j＝1,2,...M)

选择前B个用于背景建模：

在进行候选框标记之前，先对前景图像进行去除噪点处理，方法采用膨胀方法和/或腐蚀的方法。由于本方法前景目标中存在一些噪声，可能会导致运动检测时出现空洞和裂缝的情况，故采用膨胀和腐蚀的方法。

在进行候选框标记之前，再对前景图像进行二值化处理：

步骤1)中环境自适应运动检测算法能够很好地解决光照环境复杂多变情境下的运动检测需求，有效克服了光照的突变、渐变、背景扰动、噪声和阴影等对运动检测的限制。

所述步骤2)目标检测包括：

2-1)训练数据的准备：

2-2)训练数据的预处理：

2-3)调整先验框：

i)在Darknet-53网络基础上增加一次下采样(如图2所示)；

2-5)训练改进后的YOLOv3目标检测模型；

应用例1、

如图3、4、5所示，按实施例所述方法对图3中的猴子进行识别，处理得到的结果如下：

监控视频内一只猴子坐立在变压箱上方，图3是待识别图，图4是运动检测的结果，图5是对中图候选框内容进行动物识别的结果，检测到了动物，故保留候选框。

应用例2、

如图6、7、8所示，按实施例所述方法对图6中的动物进行识别，处理得到的结果如下：

监控视频内容是变电站工人作业，图6是待识别图，图7是运动检测的结果，包括所有在运动的人，图8是对图7所有候选框进行动物识别的结果，所有候选框内都不存在动物，故都不保存。

应用例3、

如图9、10、11所示，

将实施例所述的方法应用于除电力场景以外的住宅监控时，监控视频内容是嫌疑偷狗贼偷狗的片段，图9是待识别图，图10是运动检测的结果，包括人和狗，图11是对中图候选框内容进行动物识别的结果，只在狗的候选框内检测到了动物，在人的候选框内没有检测到动物，故只保留狗的候选框。

综上，本发明所述方法在不同的场景中对小样本待测物具有非常高的识别度。

Claims

1.一种基于环境自适应和小样本学习的电力场景视频检测方法，其特征在于，包括：

1)运动检测：

采用改进的广义高斯混合模型对监控视频进行环境自适应的运动检测，将检测到的运动目标用候选框标记出来；

同时，根据候选框进行相应的图像内容裁剪；

最后，接收目标检测的结果，进行可视化标示或警报；

2)目标检测：

首先，对YOLOv3模型进行针对性调整；

2.根据权利要求1所述的一种基于环境自适应和小样本学习的电力场景视频检测方法，其特征在于，使用三维GGD模型，对彩色图像的RGB三个通道分别进行建模，对于三维特征向量X＝(x₁,x₂,x₃)∈R³，其GGD分布定义如下：

其中μ＝(μ₁,μ₂,μ₃)，δ＝(δ₁,δ₂,δ₃)，λ＝(λ₁,λ₂,λ₃)分别为GGD的均值、方差和形状参数，λ_l≥1(l＝1,2,3)；

GGMM是由M个GGD混合组成的，其PDF为：

其中p_j为第j个GGD的权重，满足

3.根据权利要求2所述的一种基于环境自适应和小样本学习的电力场景视频检测方法，其特征在于，所述参数Θ的估计方法包括：

采用迭代公式在线估计每个像素点的值，利用n时刻上估计的参数与n+1时刻的输入，计算n+1时刻的参数，过程如下：

其中：

4.根据权利要求2所述的一种基于环境自适应和小样本学习的电力场景视频检测方法，其特征在于，在GGD模型数量M为固定数量模型：3-5个中的任意一个数量。

5.根据权利要求1所述的一种基于环境自适应和小样本学习的电力场景视频检测方法，其特征在于，该检测方法还包括背景更新：

考虑每个像素点的值与任一GGD是否匹配，即当每个像素点的值与任一GGD的偏差小于某个阈值时，认为二者相匹配；否则，建立一个新的GGD，使其均值与新的像素点的值相等，从而实现背景的更新；

前景目标提取：将M个GGD按照以下标准进行排序：

p_j/||δ_j||(j＝1,2,...M)

选择前B个用于背景建模：

其中，T是设定的阈值，优选默认0.7，其他的M-B个分布用于前景的描述，从而将运动目标提取出来；一旦检测到运动目标，就将其截图传入目标检测环节；

采用背景差法将当前帧与更新背景做差得到前景。

6.根据权利要求1所述的一种基于环境自适应和小样本学习的电力场景视频检测方法，其特征在于，在进行候选框标记之前，先对前景图像进行去除噪点处理，方法采用膨胀方法和/或腐蚀的方法。

7.根据权利要求6所述的一种基于环境自适应和小样本学习的电力场景视频检测方法，其特征在于，在进行候选框标记之前，再对前景图像进行二值化处理：

将前景表示成RGB彩色图像，当三个同道中有一个值大于0时，将其二值化结果设为1。

8.根据权利要求1所述的一种基于环境自适应和小样本学习的电力场景视频检测方法，其特征在于，所述步骤2)目标检测包括：

2-1)训练数据的准备：

通过步骤1)所述的运动检测方法将所需的训练数据转换成动物的“特写”；

2-2)训练数据的预处理：

2-3)调整先验框：

先通过k-means聚类算法找到9个最合适的先验框；

2-4)对特征融合过程做调整：

i)在Darknet-53网络基础上增加一次下采样；

ii)同时，采用类FPN网络结构，从尺度的特征图开始提取特征，并执行上采样；

iii)输出层从三层扩展为四层，最后取四个尺度的特征图进行融合，从而调整特征金字塔结构，以获得更多的高维度特征信息；

2-5)训练改进后的YOLOv3目标检测模型；

2-6)将步骤1)得到运动目标图像输入到步骤2-5)训练好的YOLOv3模型中，YOLOv3模型输出图片中动物的位置、类别以及置信度。