CN112073684A

CN112073684A - 一种通用图像视频资源采集的方法

Info

Publication number: CN112073684A
Application number: CN202010840870.5A
Authority: CN
Inventors: 米积扬; 宋育千; 林帅
Original assignee: Inspur Software Technology Co Ltd
Current assignee: Inspur Software Technology Co Ltd
Priority date: 2020-08-20
Filing date: 2020-08-20
Publication date: 2020-12-11

Abstract

本发明公开一种通用图像视频资源采集的方法,涉及图像采集技术领域；采集服务客户端集成主流摄像头厂商提供的二次开发协议，用于采集图像，并利用通用标准UVC协议兼容UVC视频采集设备，提供视频采集预览及录像，利用深度学习模型进行图像人脸识别及比对，根据识别比对结果对采集到的图像使用OpenCV的图像角度倾斜矫正进行优化处理，通过基于HTTP和Socket的报文接口协议调用封装在SDK内对应函数，实现Http请求接口与服务端通信，根据需求调用对应方法实现图像视频资源的采集以及相关操作。

Description

一种通用图像视频资源采集的方法

技术领域

本发明公开一种采集的方法,涉及图像采集技术领域，具体地说是一种通用图像视频资源采集的方法。

背景技术

随着办税大厅以及其他单位对无纸化办公、实名信息采集、人证比对等信息化及大厅视频监控信息安全进程的推进，用各种UVC摄像头以及高拍仪设备的需求越来越多。比如说办税大厅会使用高拍仪扫描采集纳税人文件资料，使用USB摄像头采集人脸照片图像，使用高清监控摄像头采集大厅监控视频，文档图片和照片采集后，需要保存到相应程序的数据库，集成到办公流程中才能更好地促进办公效率，因此需要对图像视频采集设备进行二次开发，现有图像视频采集设备种类繁多，品牌各异对设备提供的二次开发标准不一，对图像处理要求高，无法跨平台，对视频设备开发利用非常不便。

发明内容

本发明针对现有技术的问题，提供一种通用图像视频资源采集的方法，对不同视频设备二次开发提供统一的方法获取视频采集设备图像视频资源，并提供了完善的图像视频处理服务。

本发明提出的具体方案是：

一种通用图像视频资源采集的方法，采集服务客户端集成主流摄像头厂商提供的二次开发协议，用于采集图像，

并利用通用标准UVC协议兼容UVC视频采集设备，提供视频采集预览及录像，

利用深度学习模型进行图像人脸识别及比对，根据识别比对结果对采集到的图像使用OpenCV的图像角度倾斜矫正进行优化处理，

通过基于HTTP和Socket的报文接口协议调用封装在SDK内对应函数，实现Http请求接口与服务端通信，根据需求调用对应方法实现图像视频资源的采集以及相关操作。

所述的一种通用图像视频资源采集的方法中利用深度学习模型使用mtcnn卷积神经网络的人脸检测算法进行图像中人脸矫正。

所述的一种通用图像视频资源采集的方法中利用inception-resnet网络进行图像特征提取并进行比对。

所述的一种通用图像视频资源采集的方法中还根据识别比对结果对采集到的图像进行锐化及降噪处理。

一种通用图像视频资源采集的系统，包括采集模块、兼容模块、识别比对模块、处理模块及通信模块，

采集模块采集服务客户端集成主流摄像头厂商提供的二次开发协议，用于采集图像，

兼容模块利用通用标准UVC协议兼容UVC视频采集设备，提供视频采集预览及录像，

识别比对模块利用深度学习模型进行图像人脸识别及比对，处理模块根据识别比对结果对采集到的图像使用OpenCV的图像角度倾斜矫正进行优化处理，

通信模块通过基于HTTP和Socket的报文接口协议调用封装在SDK内对应函数，实现Http请求接口与服务端通信，根据需求调用对应方法实现图像视频资源的采集以及相关操作。

所述的一种通用图像视频资源采集的系统中识别比对模块利用深度学习模型使用mtcnn卷积神经网络的人脸检测算法进行图像中人脸矫正。

所述的一种通用图像视频资源采集的系统中识别比对模块利用inception-resnet网络进行图像特征提取并进行比对。

所述的一种通用图像视频资源采集的系统中处理模块还根据识别比对结果对采集到的图像进行锐化及降噪处理。

本发明的有益之处是：

本发明提供一种通用图像视频资源采集的方法，由本地服务客户端集成主流摄像头厂商提供的二次开发协议，利用通用标准UVC协议兼容UVC视频采集设备，利用深度学习模型进行图像人脸识别及比对，根据识别比对结果对采集到的图像使用OpenCV的图像角度倾斜矫正进行优化处理，通过基于HTTP和Socket的报文接口协议调用封装在SDK内对应函数，实现Http请求接口与服务端通信，

实施本发明方法部署简单，调用方便，兼容性好，支持设备广泛，可兼容主流操作系统包括Windows系统Windows XP以上，Linux各发行版本，支持绝大多数主流浏览器包括IE6及以上版本，Chrome、360、Firefox、Edge等等，功能强大，提供各种图像视频处理服务。

附图说明

图1是本发明方法流程示意图。

图2是本发明系统应用框架示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明，以使本领域的技术人员可以更好地理解本发明并能予以实施，但所举实施例不作为对本发明的限定。

本发明提供一种通用图像视频资源采集的方法，采集服务客户端集成主流摄像头厂商提供的二次开发协议，用于采集图像，

在本发明方法的一个实施例中，本地视频采集服务客户端,集成了主流高清监控摄像头厂商比如海康大华提供的二次开发协议，兼容高清监控摄像头的常用调用，支持高清监控摄像头的视频预览，播放控制，云台控制，

利用通用标准UVC协议，现实了兼容各品牌型号下的UVC视频采集设备，可利用DirectShow流媒体处理的开发包，从支持WDM驱动模型的采集卡上捕获数据，并且进行相应的后期处理乃至存储到文件中，用DirectShow成熟框架，提供了常用的视频采集预览，录像保存功能，

利用深度学习模型使用mtcnn卷积神经网络的人脸检测算法进行图像中人脸矫正，并利用inception-resnet网络进行图像特征提取并进行比对，

根据识别比对结果对采集到的图像使用OpenCV基于基于仿射变换对图像角度倾斜矫正并使用轮廓查找+ROI提取去掉多余的边进行优化处理，

用户可通过符合协议的HTTP请求或者Socket连接与本地服务程序进行通信，调用服务提供的图像视频采集功能，

调用封装在lpc_sdk_core.js(简称SDK)内对应的函数，SDK使用ajax技术实现Http请求接口与服务端通信，引入lpc_sdk_core.js包，使用LPCSDK全局变量，调用对应函数，过程是首先调用LPCSDK.InitSDK初始化服务，LPCSDK.OpenDevice打开指定设备，openCamera打开摄像头，startPreview开始预览，closeCamera关闭摄像头等，根据自己需求调用对应方法实现图像视频资源的采集以及相关操作。

在上述实施例基础上，另一实施例具体说明了图像中人脸识别和比对的方式。

其中选用mtcnn人脸检测，把歪的人脸扭正，有利于特征提取，在一定程度上可以提高识别率，即通过mtcnn定位人脸并回归得到人脸五个点的坐标，两个眼睛坐标，鼻子坐标喝嘴巴两角坐标，通过五个坐标的位置，利用仿射变换算法进行人脸矫正，提高图像中人脸识别效率，

并使用inception-resnet网络，上训练预训练模型，加强识别效果，进行特征比对时，上一步提取了特征，可以提取128维特征向量，两个人脸分别提取128维特征向量，通过计算两个特征向量的余弦距离或者欧式距离，得出两个特征向量的相似度即两个人脸的相似度，就可以判断两个人脸是否是同一个人了，余弦距离是两个向量间的角度，可以归一化到0到1，越接近1，表示两个人脸越相似，欧式距离表示两个向量空间的距离，两个向量空间距离越近，表示两个人越相似，最小值为0。

本发明还提供一种通用图像视频资源采集的系统，包括采集模块、兼容模块、识别比对模块、处理模块及通信模块，

上述系统内的各模块之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

需要说明的是，上述各流程和系统结构图中不是所有的步骤和模块都是必须的，可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的，可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构，也可以是逻辑结构，即，有些模块可能由同一物理实体实现，或者，有些模块可能分由多个物理实体实现，或者，可以由多个独立设备中的某些部件共同实现。

以上所述实施例仅是为充分说明本发明而所举的较佳的实施例，本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换，均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims

1.一种通用图像视频资源采集的方法，其特征是采集服务客户端集成主流摄像头厂商提供的二次开发协议，用于采集图像，

2.根据权利要求1所述的一种通用图像视频资源采集的方法，其特征是利用深度学习模型使用mtcnn卷积神经网络的人脸检测算法进行图像中人脸矫正。

3.根据权利要求1或2所述的一种通用图像视频资源采集的方法，其特征是利用inception-resnet网络进行图像特征提取并进行比对。

4.根据权利要求3所述的一种通用图像视频资源采集的方法，其特征是还根据识别比对结果对采集到的图像进行锐化及降噪处理。

5.一种通用图像视频资源采集的系统，其特征是包括采集模块、兼容模块、识别比对模块、处理模块及通信模块，

6.根据权利要求1所述的一种通用图像视频资源采集的系统，其特征是识别比对模块利用深度学习模型使用mtcnn卷积神经网络的人脸检测算法进行图像中人脸矫正。

7.根据权利要求1或2所述的一种通用图像视频资源采集的系统，其特征是识别比对模块利用inception-resnet网络进行图像特征提取并进行比对。

8.根据权利要求3所述的一种通用图像视频资源采集的系统，其特征是处理模块还根据识别比对结果对采集到的图像进行锐化及降噪处理。