CN110674778B

CN110674778B - 一种高分辨视频图像目标检测方法及装置

Info

Publication number: CN110674778B
Application number: CN201910942414.9A
Authority: CN
Inventors: 王扩; 张传金; 郑浩
Original assignee: ANHUI CREARO TECHNOLOGY CO LTD
Current assignee: ANHUI CREARO TECHNOLOGY CO LTD
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2023-05-16
Anticipated expiration: 2039-09-30
Also published as: CN110674778A

Abstract

本发明公开了一种高分辨视频图像目标检测方法及装置，该方法包括：实时获取所述视频图像；选取所述视频图像中的感兴趣区域图像；若选取所述视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像，则进行迭代处理后得到所需感兴趣区域图像；将实时获取所述视频图像和所需感兴趣区域图像分割成宽高相同的各个子区域图像；依次取出各个子区域图像并对各个子区域图像进行识别检测；若各个子区域图像中的至少两个子区域图像之间为重叠图像，则将至少两个子区域图像进行合并处理后得到最终图像，本发明通过对图像进行分割检测，减少模型检测时统一分辨率大小造成图像的形变。

Description

一种高分辨视频图像目标检测方法及装置

技术领域

本发明涉及图像目标检测技术设备技术领域，具体是一种高分辨视频图像目标检测方法及装置。

背景技术

在安防领域，随着视频监控越来越高清化，视频中比较小的目标也可以观察出来，在智能识别方面，传统的图像处理算法，识别率低，对复杂场景下的识别更是效果不佳，深度学习的发展，极大提高识别效果，可以应用到各种场景，以深度学习SSD和YOLO算法为代表，识别速度快，识别率高，但是SSD算法或者YOLO算法识别图像，必须对图片统一到合适的分辨率，使用SSD-300，需要图像缩放到300x300分辨率大小，使用SSD-500需要图像缩放到500x500分辨率大小，图像缩放会对要识别的目标产生形变，特别是对小目标的影响更大，会显著降低识别率，若是训练更高的分辨率模型，会使模型参数急剧增大，模型识别会占用大量内存空间，识别速度降低，对硬件要求高，如果对不同的分辨率视频，训练各自对应的识别模型，使工作量变的很大，加大维护管理难度。

发明内容

本发明的目的在于提供一种高分辨视频图像目标检测方法及装置，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种高分辨视频图像目标检测方法,该方法包括：

实时获取所述视频图像；

选取所述视频图像中的感兴趣区域图像；

若选取所述视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像，则进行迭代处理后得到所需感兴趣区域图像；

将实时获取所述视频图像和所需感兴趣区域图像分割成宽高相同的各个子区域图像；

依次取出各个子区域图像并对各个子区域图像进行识别检测；

若各个子区域图像中的至少两个子区域图像之间为重叠图像，则将至少两个子区域图像进行合并处理后得到最终图像。

作为本发明进一步的方案：选取所述视频图像中的感兴趣区域图像包括：

将获取到的当前视频图像与上一帧视频图像做帧间差分法后得到第一图像；

对第一图像进行腐蚀操作、膨胀操作和二值化操作后，若第一图像中区域图像的像素值大于预设图像像素值，则该区域为感兴趣区域图像。

作为本发明进一步的方案：若选取所述视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像，则进行迭代处理后得到所需感兴趣区域图像包括：

将选取的感兴趣区域图像与上一帧视频图像进行读取；

将选取的感兴趣区域图像与上一帧视频图像计算交并比值，若交并比值大于预设阈值，则选取所述视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像；

则对重叠图像进行选取所述视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像所述。

一种高分辨视频图像目标检测装置，该装置包括：

获取模块：实时获取所述视频图像；

选取模块：选取所述视频图像中的感兴趣区域图像；

确认模块：若选取所述视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像，则进行迭代处理后得到所需感兴趣区域图像；

分割模块：将实时获取所述视频图像和所需感兴趣区域图像分割成宽高相同的各个子区域图像；

检测模块：依次取出各个子区域图像并对各个子区域图像进行识别检测；

合并模块：若各个子区域图像中的至少两个子区域图像之间为重叠图像，则将至少两个子区域图像进行合并处理后得到最终图像。

作为本发明进一步的方案：所述选取模块包括：

处理单元：将获取到的当前视频图像与上一帧视频图像做帧间差分法后得到第一图像；

筛选单元：对第一图像进行腐蚀操作、膨胀操作和二值化操作后，若第一图像中区域图像的像素值大于预设图像像素值，则该区域为感兴趣区域图像。

作为本发明进一步的方案：所述确认模块包括:

读取单元：将选取的感兴趣区域图像与上一帧视频图像进行读取；

计算单元：将选取的感兴趣区域图像与上一帧视频图像计算交并比值，若交并比值大于预设阈值，则选取所述视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像；

确定单元：则对重叠图像进行选取所述视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像。

与现有技术相比，本发明的有益效果是：本发明通过对图像进行分割检测，减少模型检测时统一分辨率大小造成图像的形变，对小目标识别率不会降低，同时对感兴趣区域选取，实现图像实时检测，运行速度快，降低硬件计算要求，同时算法适用各种尺寸的图像，从cif到1080p 2k等分辨率都可以识别使用，不用针对不同的分辨率视频图像训练多个模型，减少大量工作。

附图说明

图1为一种高分辨视频图像目标检测方法的流程示意图；

图2为一种高分辨视频图像目标检测装置的示意图；

图3为一种高分辨视频图像目标检测装置中选取模块的示意图；

图4为一种高分辨视频图像目标检测装置中确认模块的示意图；

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-4

一种高分辨视频图像目标检测方法,该方法包括：

S101、实时获取视频图像；

S102、选取视频图像中的感兴趣区域图像；

选取视频图像中的感兴趣区域图像包括：

选取视频图像中的感兴趣区域图像的具体步骤如下：

(1)获取上一帧视频图像与当前视频图像做帧间差分法，得到图像frame_d。

(2)对图像frame_d做腐蚀操作，膨胀操作。

(3)对图像frame_d二值化操作,图像像素小于10，赋值为0

(4)计算图像frame_d最左方不为0像素的x坐标记为Ptx，计算图像最上方不为0像素的y坐标记为Pty，计算图像最右方不为0像素的x坐标记为Pbx，计算图像最下方不为0像素的x坐标记为Pby。

(5)根据(4)计算的值，由两个坐标点可以确定选取的区域范围，如下公式

Rect_roi＝R(Ptx,Pty,Pbx,Pby)

Rect_roi是最终选取的感兴趣区域。

S103、若选取视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像，则进行迭代处理后得到所需感兴趣区域图像；

若选取视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像，则进行迭代处理后得到所需感兴趣区域图像包括：

将选取的感兴趣区域图像与上一帧视频图像进行读取；

将选取的感兴趣区域图像与上一帧视频图像计算交并比值，若交并比值大于预设阈值，则选取视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像；

则对重叠图像进行选取视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像。

具体步骤如下：

(1)将上一帧视频图像的检测结果放入集合M中，集合M中所有区域框以自有的中心点宽高扩大两倍，并且把步骤S102的感兴趣区域Rect_roi区域框也放入集合M。

(2)将所有集合M中的框按照位置从左到右进行排序，依次读取目标框。

(3)遍历集合M中的框，分别与步骤(2)选取的目标框计算交并比，如果计算值大于0，则认为此框与r有重叠，遍历两个框中像素绝对坐标最小minX，minY值，与绝对坐标最大maxX，maxY值，由四个值，组成两个坐标(minX，minY)(maxX，maxY)生成新的框,放入集合M，同时移除计算的两个目标框。

(4)回到第(2)步进行迭代，直到集合M的元素遍历一遍。

(5)集合M中的目标区域，为所需要的所有感兴趣区域。

S104、将实时获取视频图像和所需感兴趣区域图像分割成宽高相同的各个子区域图像；

具体步骤如下：

(1)将实时获取视频图像和所需感兴趣区域图像需要分割成宽高相同的各个子区域，以width表示获取图像的宽度，以hieght表示获取图像的高度，计算分割出子区域的宽高数值

wn＝width/1000

hn＝hieght/1000

dw＝width/(wn+1)

dh＝hieght/(hn+1)

dw为子区域的宽，dh为子区域的高。

(2)对(1)得到的子区域宽dw,子区域的高dh，从原图像左上角原点(0,0)出发，对图像依次从左到右，从上到下,无重叠截取图子区域图像。

(3)对(1)得到的子区域宽dw,高dh，从原图像左上角(0，dw/2)坐标点出发，对图像依次从左到右，从上到下，无重叠截取图子区域图像。

(4)对(1)得到的子区域宽dw,高dh，从原图像左上角dh/2，0)坐标点出发，对图像依次从左到右，从上到下，无重叠截取图子区域图像。

(5)对(1)得到的子区域宽dw,高dh，从原图像左上角(dw/2，dh/2)坐标点出发，对图像依次从左到右，从上到下，无重叠截取图子区域图像。

(6)由(2),(3),(4),(5)以上步骤得到的子区域图像,放入集合L中，集合L包含所有需要被检测的图像。

S105、依次取出各个子区域图像并对各个子区域图像进行识别检测；

使用SSD-300算法检测各个子区域图像，

由步骤S104得到的集合L，依次取出图像，使用SSD-300算法模型识别目标，并且算出绝对坐标值和类别，存入集合H。

S106、若各个子区域图像中的至少两个子区域图像之间为重叠图像，则将至少两个子区域图像进行合并处理后得到最终图像。

具体步骤如下：

(1)使用计算得到的集合H；创建的集合M，初始化为空集。

(2)将所有集合H中的框进行排序，选出分数最高的框m，从集合H移到集合M；

(3)遍历集H中的框，分别与框m计算交并比，如果高于阈值0.4，则认为此框与m重叠，合并两个框。

(4)进行迭代，直到集合H为空，集合M中的框为最终结果。

一种高分辨视频图像目标检测装置，该装置包括：

获取模块：实时获取视频图像；

选取模块：选取视频图像中的感兴趣区域图像；

确认模块：若选取视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像，则进行迭代处理后得到所需感兴趣区域图像；

分割模块：将实时获取视频图像和所需感兴趣区域图像分割成宽高相同的各个子区域图像；

选取模块包括：

确认模块包括:

计算单元：将选取的感兴趣区域图像与上一帧视频图像计算交并比值，若交并比值大于预设阈值，则选取视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像；

确定单元：则对重叠图像进行选取视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像。

虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

故以上所述仅为本申请的较佳实施例，并非用来限定本申请的实施范围；即凡依本申请的权利要求范围所做的各种等同变换，均为本申请权利要求的保护范围。

Claims

1.一种高分辨视频图像目标检测方法,其特征在于，该方法包括：

实时获取所述视频图像；

选取所述视频图像中的感兴趣区域图像；

若各个子区域图像中的至少两个子区域图像之间为重叠图像，则将至少两个子区域图像进行合并处理后得到最终图像；

选取所述视频图像中的感兴趣区域图像包括：

对第一图像进行腐蚀操作、膨胀操作和二值化操作后，若第一图像中区域图像的像素值大于预设图像像素值，则该区域为感兴趣区域图像；

若选取所述视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像，则进行迭代处理后得到所需感兴趣区域图像包括：

将选取的感兴趣区域图像与上一帧视频图像进行读取；

则对重叠图像进行选取所述视频图像中的感兴趣区域图像与上一帧视频图像之间为重叠图像。

2.一种高分辨视频图像目标检测装置，其特征在于，该装置包括：

获取模块：实时获取所述视频图像；

选取模块：选取所述视频图像中的感兴趣区域图像；

合并模块：若各个子区域图像中的至少两个子区域图像之间为重叠图像，则将至少两个子区域图像进行合并处理后得到最终图像；

所述选取模块包括：

筛选单元：对第一图像进行腐蚀操作、膨胀操作和二值化操作后，若第一图像中区域图像的像素值大于预设图像像素值，则该区域为感兴趣区域图像；

所述确认模块包括: