CN110659628A

CN110659628A - 一种基于深度学习的煤矿监控视频解压缩方法及系统

Info

Publication number: CN110659628A
Application number: CN201910953370.XA
Authority: CN
Inventors: 尹青山; 李锐; 于治楼
Original assignee: Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Current assignee: Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Priority date: 2019-10-09
Filing date: 2019-10-09
Publication date: 2020-01-07

Abstract

本发明公开一种基于深度学习的煤矿监控视频解压缩方法及系统，涉及视频压缩技术领域，采用方案包括：将原始视频差分为图像帧，并选取一帧作为背景帧；基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来，并将工人所在的位置行成矩形框裁剪出来，将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中；从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组，把每一组覆盖到背景帧中；对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调，以将重构图像帧组合形成视频。本方法只获取关键信息，减少了冗余信息，可以提高视频的压缩率。

Description

一种基于深度学习的煤矿监控视频解压缩方法及系统

技术领域

本发明涉及视频压缩技术领域，具体的说是一种基于深度学习的煤矿监控视频解压缩方法及系统。

背景技术

煤矿井下环境复杂，危险点较多，安全生产工作进展缓慢，为了进一步提高安全生产工作的，适应新时期国家对煤矿安全生产的客观要求，众多矿井都开始布设矿用视频监控系统。由于煤矿井下存在瓦斯、煤尘等混合气体，存在着一定的爆炸风险，故而煤矿井下视频监控系统所配备的摄像仪必须通过煤安认证和防爆认证，外壳为不锈钢构造，密封性能良好，防腐防尘防水。由于煤矿井下环境的复杂性，对视频的传输提出了更高的要求，因此需要在保证视频质量的前提下，尽量的压缩视频的大小，以提高视频实时传输的效率，保证井下工人的安全。

基于深度学习的视频压缩方法对传统的H.264和H.265等传统视频压缩方法带了颠覆性的革命，使视频压缩技术得到飞速的发展，大大提高了视频的压缩效率。

发明内容

本发明针对目前技术发展的需求和不足之处，提供一种基于深度学习的煤矿监控视频解压缩方法及系统，其在保证原有视频质量的前提下能够进一步提高视频的压缩率，减少其他无关因素对视频的影响。

首先，本发明提供一种基于深度学习的煤矿监控视频解压缩方法，解决上述技术问题采用的技术方案如下：

一种基于深度学习的煤矿监控视频解压缩方法，该方法的实现过程包括：

S10、将原始视频差分为图像帧，并选取一帧作为背景帧；

S20、基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来，并将工人所在的位置行成矩形框裁剪出来，保存为图片，随后，将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中，完成所有帧图像的压缩；

S30、从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组，把每一组覆盖到背景帧中，完成所有帧图像的解码还原；

S40、对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调，以将解码还原的所有帧图像帧组合形成视频。

在步骤S10中，将原始视频差分为图像帧，并选取一帧作为背景帧，其操作具体为：

固定监控摄像头，使拍摄的背景保持不变；

获取原始视频；

将原始视频差分为图像帧；

选取一张没有运动物体的图像帧作为背景图片；

将背景图片存入链表的第一个位置。

在步骤S20中，所述目标检测算法为基于区域的卷积神经网络，包括Fast-RCNN，SSD，YOLO，目标检测算法用于检测出物体的种类，定位物体的位置。

在步骤S20中，将工人所在的位置行成矩形框裁剪出来保存为图片的过程中，将工人所在的位置作为感兴趣区域，将其他运动的物体作为非感兴趣区域对其滤除。

在步骤S40中，对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调，微调的方法为：

将矩形框图像的边缘和背景图像RGB颜色信息数值求均值，使两张图像之间的色彩平滑过渡，以便于将解码还原的所有帧图像帧组合形成视频。

其次，本发明提供一种基于深度学习的煤矿监控视频解压缩系统，解决上述技术问题采用的技术方案如下：

一种基于深度学习的煤矿监控视频解压缩系统，该系统包括：

视频拆分模块，用于将原始视频差分为图像帧，并选取一帧作为背景帧；

行人检测模块，基于深度学习的注意力机制和目标检测算法，用于将每一帧图像中的工人检测出来，并将工人所在的位置行成矩形框裁剪出来，保存为图片，随后，将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中，完成所有帧图像的压缩；

解码还原模块，用于从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组，把每一组覆盖到背景帧中，完成所有帧图像的解码还原；

图像帧微调模块，用于对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调，以将解码还原的所有帧图像帧组合形成视频。

具体的，所涉及视频拆分模块包括：

监控摄像子模块，用于拍摄图像并保持固定；

获取子模块，用于获取原始视频；

拆分子模块，用于将原始视频差分为图像帧

选取子模块，用于选取一张没有运动物体的图像帧作为背景图片；

存储子模块，用于将背景图片存入链表的第一个位置。

具体的，所涉及目标检测算法为基于区域的卷积神经网络，包括Fast-RCNN，SSD，YOLO，目标检测算法用于检测出物体的种类，定位物体的位置。

具体的，所涉及行人检测模块将工人所在的位置行成矩形框裁剪出来保存为图片的过程中，会将工人所在的位置作为感兴趣区域，同时，将其他运动的物体作为非感兴趣区域对其滤除。

具体的，所涉及图像帧微调模块对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调的具体方法为：

本发明的一种基于深度学习的煤矿监控视频解压缩方法及系统，与现有技术相比具有的有益效果是：

1)本发明基于深度学习的注意力机制和目标检测算法，根据煤矿井下工人安全状况监控的特点，通过只关注工人在煤矿井下的位置和行走轨迹，忽略其他运动的物体，对每一帧进行重构，减少了大量的冗余信息，提高了视频的压缩率，同时，还提高了煤矿的视频的传输速率，节省了大量的视频存储空间，减少了其他无关因素对视频的影响。

2)本发明基于注意力机制保留视频所包含图片帧中的感兴趣区域，筛除非感兴趣区域，从而只需要存储少量的图片，位置信息等数据，大大缩小了存储空间，以提高视频在传输过程中的效率。

附图说明

附图1是本发明实施例一的方法流程图；

附图2是本发明实施例二的连接框图。

附图中各标号信息表示：

1、视频拆分模块，2、行人检测模块，3、解码还原模块，4、图像帧微调模块；

5、监控摄像子模块，6、获取子模块，7、拆分子模块，

8、选取子模块，9、存储子模块。

具体实施方式

为使本发明的技术方案、解决的技术问题和技术效果更加清楚明白，以下结合具体实施例，对本发明的技术方案进行清楚、完整的描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。

实施例一：

结合附图1，本实施例提出一种基于深度学习的煤矿监控视频解压缩方法，该方法的实现过程包括：

S10、将原始视频差分为图像帧，并选取一帧作为背景帧；

在本实施例的步骤S10中，将原始视频差分为图像帧，并选取一帧作为背景帧，其操作具体为：

固定监控摄像头，使拍摄的背景保持不变；

获取原始视频；

将原始视频差分为图像帧；

选取一张没有运动物体的图像帧作为背景图片；

将背景图片存入链表的第一个位置。

在本实施例的步骤S20中，所述目标检测算法为基于区域的卷积神经网络，包括Fast-RCNN，SSD，YOLO，目标检测算法用于检测出物体的种类，定位物体的位置。

在本实施例的步骤S20中，将工人所在的位置行成矩形框裁剪出来保存为图片的过程中，将工人所在的位置作为感兴趣区域，将其他运动的物体作为非感兴趣区域对其滤除。

在本实施例的步骤S40中，对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调，微调的方法为：

本实施例基于深度学习的注意力机制和目标检测算法，根据煤矿井下工人安全状况监控的特点，通过只关注工人在煤矿井下的位置和行走轨迹，忽略其他运动的物体，对每一帧进行重构，减少了大量的冗余信息，提高了视频的压缩率，同时，还提高了煤矿的视频的传输速率，节省了大量的视频存储空间，减少了其他无关因素对视频的影响。

实施例二：

结合附图2，本实施例提出一种基于深度学习的煤矿监控视频解压缩系统，该系统包括：

视频拆分模块1，用于将原始视频差分为图像帧，并选取一帧作为背景帧；

行人检测模块2，基于深度学习的注意力机制和目标检测算法，用于将每一帧图像中的工人检测出来，并将工人所在的位置行成矩形框裁剪出来，保存为图片，随后，将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中，完成所有帧图像的压缩；

解码还原模块3，用于从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组，把每一组覆盖到背景帧中，完成所有帧图像的解码还原；

图像帧微调模块4，用于对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调，以将解码还原的所有帧图像帧组合形成视频。

在本实施例中，所涉及视频拆分模块1包括：

监控摄像子模块，用于拍摄图像并保持固定；

获取子模块，用于获取原始视频；

拆分子模块，用于将原始视频差分为图像帧

存储子模块，用于将背景图片存入链表的第一个位置。

在本实施例中，所涉及行人检测模块2将工人所在的位置行成矩形框裁剪出来保存为图片的过程中，会将工人所在的位置作为感兴趣区域，同时，将其他运动的物体作为非感兴趣区域对其滤除。

在本实施例中，所涉及图像帧微调模块4对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调的具体方法为：

本实施例基于视频拆分模块1将原始视频差分为图像帧，基于行人检测模块2将每一帧图像中的工人检测出来，并将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中，完成所有帧图像的压缩，基于解码还原模块3从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组，把每一组覆盖到背景帧中，完成所有帧图像的解码还原，基于图像帧微调模块4对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调，以将解码还原的所有帧图像帧组合形成视频，实现视频的高效压缩和传输，并节省大量的视频存储空间，减少其他无关因素对视频的影响。

综上可知，采用本发明的一种基于深度学习的煤矿监控视频解压缩方法及系统，基于深度学习的注意力机制和目标检测算法，只关注工人在煤矿井下的位置和行走轨迹，减少大量的冗余信息，提高视频的压缩率及传输速率。

以上应用具体个例对本发明的原理及实施方式进行了详细阐述，这些实施例只是用于帮助理解本发明的核心技术内容。基于本发明的上述具体实施例，本技术领域的技术人员在不脱离本发明原理的前提下，对本发明所作出的任何改进和修饰，皆应落入本发明的专利保护范围。

Claims

1.一种基于深度学习的煤矿监控视频解压缩方法，其特征在于,该方法的实现过程包括：

S10、将原始视频差分为图像帧，并选取一帧作为背景帧；

2.根据权利要求1所述的一种基于深度学习的煤矿监控视频解压缩方法，其特征在于，在步骤S10中，将原始视频差分为图像帧，并选取一帧作为背景帧，其操作具体为：

固定监控摄像头，使拍摄的背景保持不变；

获取原始视频；

将原始视频差分为图像帧；

选取一张没有运动物体的图像帧作为背景图片；

将背景图片存入链表的第一个位置。

3.根据权利要求1所述的一种基于深度学习的煤矿监控视频解压缩方法，其特征在于，在步骤S20中，所述目标检测算法为基于区域的卷积神经网络，包括Fast-RCNN，SSD，YOLO，目标检测算法用于检测出物体的种类，定位物体的位置。

4.根据权利要求3所述的一种基于深度学习的煤矿监控视频解压缩方法，其特征在于，在步骤S20中，将工人所在的位置行成矩形框裁剪出来保存为图片的过程中，将工人所在的位置作为感兴趣区域，将其他运动的物体作为非感兴趣区域对其滤除。

5.根据权利要求1所述的一种基于深度学习的煤矿监控视频解压缩方法，其特征在于，在步骤S40中，对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调，微调的方法为：

6.一种基于深度学习的煤矿监控视频解压缩系统，其特征在于,该系统包括：

7.根据权利要求6所述的一种基于深度学习的煤矿监控视频解压缩系统，其特征在于，所述视频拆分模块包括：

监控摄像子模块，用于拍摄图像并保持固定；

获取子模块，用于获取原始视频；

拆分子模块，用于将原始视频差分为图像帧

存储子模块，用于将背景图片存入链表的第一个位置。

8.根据权利要求6所述的一种基于深度学习的煤矿监控视频解压缩系统，其特征在于，所述目标检测算法为基于区域的卷积神经网络，包括Fast-RCNN，SSD，YOLO，目标检测算法用于检测出物体的种类，定位物体的位置。

9.根据权利要求8所述的一种基于深度学习的煤矿监控视频解压缩系统，其特征在于，所述行人检测模块将工人所在的位置行成矩形框裁剪出来保存为图片的过程中，会将工人所在的位置作为感兴趣区域，同时，将其他运动的物体作为非感兴趣区域对其滤除。

10.根据权利要求6所述的一种基于深度学习的煤矿监控视频解压缩系统，其特征在于，所述图像帧微调模块对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调的具体方法为：