CN109145843A

CN109145843A - 一种卡口高清相机全车信息识别系统及方法

Info

Publication number: CN109145843A
Application number: CN201810998137.9A
Authority: CN
Inventors: 张涛
Original assignee: Shanghai Huizhou Intelligent Technology Co Ltd
Current assignee: Shanghai Huizhou Intelligent Technology Co Ltd
Priority date: 2018-08-29
Filing date: 2018-08-29
Publication date: 2019-01-04

Abstract

本发明属于计算机技术领域，具体涉及一种卡口高清相机全车信息识别系统，包括机：机动车检测模块，用于将视频图像输入训练好的网络模型，得到机动车图像以及车辆信息；人体关键点定位模块，用于将机动车图像输入训练好的定位模型，得到驾驶员的人体关键点信息；接打电话检测模块，用于基于人体关键点信息进行接打电话规则判断，从而确定驾驶员是否在打接电话；安全带检测模块，用于基于人体关键点进行主躯干识别，从机动车图像中提取出人体主躯干图像，根据人体主躯干图像判断驾驶员是否系有安全带。本发明解决了现有技术中人工查看效率低,工作量大的问题,同时集成多种功能的信息提取,提升了信息的利用率,扩大了卡口视频监控的服务范围。

Description

一种卡口高清相机全车信息识别系统及方法

技术领域

本发明属于计算机技术领域，具体涉及一种卡口高清相机全车信息识别系统及方法。

背景技术

卡口相机主要安装于公路收费站、交通和治安检查站,用来获取车辆信息,并对车辆违法信息进行实时监控。目前的车辆信息,主要通过人工查看视频的方法获取到,工作效率较低,每人最多同时处理1到2路视频,而且不能全面的判断出车辆中所有信息(如车辆品牌、车内行人是否打电话、是否系安全带等),大量视频的信息没有得到充分的利用,从而信息丢失,偶尔通过软件系统进行车牌识别,但功能十分单一,限制因素较多。

发明内容

本发明提供了一种卡口高清相机全车信息识别系统及方法，解决了现有技术中人工查看效率低,工作量大的问题,同时集成多种功能的信息提取,提升了信息的利用率,扩大了卡口视频监控的服务范围。

第一方面，本发明提供了一种卡口高清相机全车信息识别系统，包括机动车检测模块、人体关键点定位模块、接打电话检测模块和安全带检测模块；

所述机动车检测模块，用于将视频图像输入训练好的网络模型，通过网络模型对视频图像进行分析处理，从而输出得到机动车图像以及车辆信息；

所述人体关键点定位模块，用于将机动车图像输入训练好的定位模型，定位模型对机动车图像进行识别分析，从而得到驾驶员的人体关键点信息；

所述接打电话检测模块，用于基于人体关键点信息进行接打电话规则判断，从而确定驾驶员是否在打接电话；

所述安全带检测模块，用于基于人体关键点进行主躯干识别，从机动车图像中提取出人体主躯干图像，根据人体主躯干图像判断驾驶员是否系有安全带。

优选地，所述车辆信息包括车型、车身颜色、车标、车牌号码、车牌颜色和是否有遮阳板。

优选地，所述网络模型采用深度卷积神经网络，所述深度卷积神经网络在图像识别过程中包括：

深度卷积网特征提取的步骤；

小目标特征提取与检测的步骤；

大目标特征特征提取与检测的步骤；

多尺度检测结果融合的步骤。

优选地，所述深度卷积网特征提取的步骤包括：

A1，将机动车图像缩放到1056×640像素；

A2，对缩放后的图像以7×7的卷积核、步长2进行32次卷积，得到529×320的32通道的卷积特征图，对图上每个像素用C.ReLU激活函数模块处理，使卷积特征图通道数和尺寸不变；

A3，对上一步得到的卷积特征图，以3×3的卷积核、步长2做最大值池化，得到264×160的32通道的卷积特征图；

A4，对上一步得到的卷积特征图，以3×3的卷积核、步长1进行64次卷积，然后对卷积特征图上每个像素用C.ReLU激活函数模块处理；本步骤重复三次，得到264×160的64通道的卷积特征图；

A5，对上一步得到的卷积特征图，以3×3的卷积核、步长为2进行128次卷积，然后对特征图上每个像素用C.ReLU激活函数模块处理，得到132×80的128通道的卷积特征图；

A6，对上一步得到的卷积特征图，以3×3的卷积核、步长1进行128次卷积，然后对特征图上每个像素用C.ReLU激活函数模块处理；本步骤重复三次，得到132×80的128通道的卷积特征图；

A7，将上一步得到的卷积特征图，经过步长为2的改进版Inception处理，得到66×40的256通道的卷积特征图；

A8，将上一步得到的卷积特征图，经过三个步长为1、通道数不变的改进版Inception处理，得到66×40的256通道的卷积特征图；

A9，将上一步得到的卷积特征图，经过步长为2的改进版Inception处理，得到33×20的384通道的卷积特征图；

A10，将上一步得到的卷积特征图，经过步长为1、通道数不变的三个改进版Inception处理，得到33×20的384通道的卷积特征图。

优选地，所述小目标特征提取与检测的步骤包括：

B1，对A4中得到的卷积特征图下采样一倍，得到132×80的64通道的卷积特征图；

B2，对A8中得到的卷积特征图上采样一倍，得到132×80的256通道的卷积特征图；

B3，将B1、B2和A6中分别得到的卷积特征图，进行特征通道串联，得到132×80的448通道的卷积特征图；

B4，使用区域建议网产生兴趣区，将兴趣区对应到上一步得到的卷积特征图上，得到兴趣区特征；

B5，将上一步得到的兴趣区特征，经过两个全连接层，连接一个分类器和一个回归器；

B6，分类器预测结果和标定真值比较得到softmax损失函数，回归器预测结果和真值比较得到SmoothL1损失函数；用梯度下降法，最小化损失函数，得到预测结果。

优选地，所述大目标特征特征提取与检测的步骤包括：

C1，对A6中得到的卷积特征图下采样一倍，得到66×40的128通道的卷积特征图；

C2，对A10中得到的卷积特征图上采样一倍，得到66×40的384通道的卷积特征图；

C3，将C1、C2和A8中分别得到的卷积特征图，进行特征通道串联，得到66×40的768通道的卷积特征图；

C4，使用区域建议网产生兴趣区，将兴趣区对应到上一步得到的卷积特征图上，得到兴趣区特征；

C5，将上一步得到的兴趣区特征，经过两个全连接层，连接一个分类器和一个回归器；

C6，分类器预测结果和标定真值比较得到softmax损失函数，回归器预测结果和真值比较得到SmoothL1损失函数；用梯度下降法，最小化损失函数，得到预测结果。

优选地，所述多尺度检测结果融合的步骤包括：

将B6对小目标的预测结果和C6对大目标的预测结果进行融合输出，从而得到车辆信息。

优选地，所述定位模型的算法过程包括：

对输入的机动车图像进行特征提取，得到特征图；

对特征图进行分析得到初步关键点和关联信息；

得到初步关键点和关联信息后，使用全局图优化的方式，最终得到准确的人体关键点信息。

第二方面，本发明提供了一种卡口高清相机全车信息识别方法，适用于第一方面所述的卡口高清相机全车信息识别系统，包括以下步骤：

将视频图像输入训练好的网络模型，通过网络模型对视频图像进行分析处理，从而输出得到机动车图像以及车辆信息；

将机动车图像输入训练好的定位模型，定位模型对机动车图像进行识别分析，从而得到驾驶员的人体关键点信息；

基于人体关键点信息进行接打电话规则判断，从而确定驾驶员是否在打接电话；

基于人体关键点进行主躯干识别，从机动车图像中提取出人体主躯干图像，根据人体主躯干图像判断驾驶员是否系有安全带。

本发明的有益效果为：本发明解决了现有技术中人工查看效率低,工作量大的问题,同时集成多种功能的信息提取,提升了信息的利用率,扩大了卡口视频监控的服务范围。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中：

图1为本实施例中卡口高清相机全车信息识别系统的结构框图；

图2为本实施例中定位模型中深度神经网络算法的过程流程图；

图3为本实施例中定位模型中融合算法的过程流程图；

图4为本实施例中卡口高清相机全车信息识别方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，在本发明说明书和所附权利要求书中，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本发明说明书和所附权利要求书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

实施例一：

本实施例提供了一种卡口高清相机全车信息识别系统，如图1所示，包括但不限于机动车检测模块、人体关键点定位模块、接打电话检测模块和安全带检测模块；

本实施例的系统，在卡口交通监控视频中利用机器学习自动分析获取机动车的车辆信息以及驾驶人员的违法驾驶行为。所述车辆信息包括车型、车身颜色、车标、车牌号码、车牌颜色和是否有遮阳板，所述驾驶人员的违法驾驶行为包括行车过程中接打电话和未系安全带两种违法行为。本系统的工作模式为前后端协同工作，前端通过卡口现场相机获取视频图像，后端通过机器学习处理视频图像，从而实现对机动车车辆信息以及机动车驾驶员驾驶行为的实时监控。本实施例系统的检测采用GPU并行处理，可以同时完成多路数据的并行分析；自动化程度高，无需人工干预；准确度远远高于传统方法，处理结果具有高置信度。

本实施例的机动车检测模块包括：Region-Based CNN网络模型搭建、机动车样本制备、网络模型训练、网络模型测试。其中，网络框架采用faster-rcnn架构，基础网络采用resnet架构，参数文件大小为200m。样本制备过程采用监督学习模式，由人工标注提供先验信息；模型训练过程，基于深度学习计算库caffe进行优化，采用误差反向传播算法进行模型参数更新；模型测试过程同模型训练过程，没有参数更新。机动车检测模块的网络模型构建好后即可进行检测，将获取的视频图像输入网络模型，网络模型从视频图像中抓取出机动车图像，并对机动车图像进行车辆识别，从而得到机动车的车辆信息。

机动车检测模块中的所述网络模型采用深度卷积神经网络，所述深度卷积神经网络在图像识别过程中包括：

深度卷积网特征提取的步骤；

小目标特征提取与检测的步骤；

大目标特征特征提取与检测的步骤；

多尺度检测结果融合的步骤。

其中，所述深度卷积网特征提取的步骤包括：

A1，将机动车图像缩放到1056×640像素；

A7，将上一步得到的卷积特征图，经过步长为2的改进版Inception处理，得到66×40的256通道的卷积特征图；这里使用的改进版Inception模块是基于Inception v2模块，用3×3的卷积方式实现最大值池化，在Inception v2得到的卷积特征图后，加一个通道数不变、核为1×1的卷积层；

其中，所述小目标特征提取与检测的步骤包括：

其中，所述大目标特征特征提取与检测的步骤包括：

其中，所述多尺度检测结果融合的步骤包括：

本实施例的网络模型对图像的识别与现有方法相比，有以下改进点及有益效果：(1)将不同分辨率的卷积特征图，通过特征通道合并获得具有多分辨率描述能力的卷积特征；(2)使用了改进版的Inception模块，使得同一张特征图包含不同的特征，增强了特征多尺度描述能力；(3)在不同的采样倍率的特征图上产生兴趣区特征，分别进行目标检测，增强了网络对多分辨率、多尺度目标的检测能力，从而提高了检测结果的准确度。

本实施例的人体关键点定位模块，将机动车图像输入训练好的定位模型，定位模型对机动车图像进行识别分析，从而得到驾驶员的人体关键点信息。所述定位模型的算法过程包括：对输入的机动车图像进行特征提取，得到特征图；对特征图进行分析得到初步关键点和关联信息；得到初步关键点和关联信息后，使用全局图优化的方式，最终得到准确的人体关键点信息。

本实施例的定位模型中，如图2所示，原始的机动车图像经过深度神经网络得到特征图；如图3所示，将得到的特征图分别输入两个分支，每个分支都有t个阶段，两个分支分别回归Lt和St，之后把各个阶段的Li和Si进行融合，i为大于等于2、小于等于t的自然数，然后根据融合后的回归结果得到融合结果，融合结果即初步关键点位置和方向；然后用保留了初步关键点位置和方向的2D矢量场表示各关键点之间的关联信息；通过预测出的关键点沿着候选区域计算关键点之间的线积分，与肢体方向做对比，来表示这两个关键点连接后是肢体的可能性；根据置信度筛选和精化关键点，进一步提升关键点的准确性；更进一步，在得到关键节点以及边权之后，使用全局图优化的方法，最后准确的人体关键点信息。

本实施例的安全带检测模块，首先通过大量的监控视频并提取海量主躯干样本，再通过监督学习方式目视判读样本的标签，系了安全带记为1，未系记为0；在样本制备的基础上，再搭建分类卷积神经网络进行模型的搭建与训练；最终将训练所得的模型再用于是否系安全带的识别过程。在提取到人体关键点信息后，安全带检测模块根据左右肩膀以及腹部、左右手肘、左右手腕的点位信息截取获得人体主躯干图像，再对人体主躯干图像进行分析，从而判断是否系有安全带。本实施例的接打电话检测模块和安全带检测模块用的算法过程，与机动车检测模块的网络算法的过程类似。

综上所述，本实施例的系统利用深度学习算法对目标进行识别和检测，自动分析交通视频中车辆本身以及车辆中驾驶员的行为，解决了人工查看效率低,工作量大的问题,同时集成多种功能的信息提取,提升了信息的利用率,扩大了卡口视频监控的服务范围

实施例二：

本实施例提供了一种卡口高清相机全车信息识别方法，适用于实施例一所述的卡口高清相机全车信息识别系统，如图4所示，包括以下步骤：

S1，将视频图像输入训练好的网络模型，通过网络模型对视频图像进行分析处理，从而输出得到机动车图像以及车辆信息；

S2，将机动车图像输入训练好的定位模型，定位模型对机动车图像进行识别分析，从而得到驾驶员的人体关键点信息；

S3a,基于人体关键点信息进行接打电话规则判断，从而确定驾驶员是否在打接电话；

S3A,基于人体关键点进行主躯干识别，从机动车图像中提取出人体主躯干图像，根据人体主躯干图像判断驾驶员是否系有安全带。

本实施例的方法，在卡口交通监控视频中利用机器学习自动分析获取机动车的车辆信息以及驾驶人员的违法驾驶行为。所述车辆信息包括车型、车身颜色、车标、车牌号码、车牌颜色和是否有遮阳板，所述驾驶人员的违法驾驶行为包括行车过程中接打电话和未系安全带两种违法行为。本实施例方法的相关分析和具体算法见实施例一，在此不再赘述。

本实施例的方法，利用深度学习算法对目标进行识别和检测，自动分析交通视频中车辆本身以及车辆中驾驶员的行为，解决了人工查看效率低,工作量大的问题,同时集成多种功能的信息提取,提升了信息的利用率,扩大了卡口视频监控的服务范围

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中，应该理解到，所描述的系统和方法，可以通过其它的方式实现。例如，以上所描述的方法实施例和系统实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims

1.一种卡口高清相机全车信息识别系统，其特征在于，包括机动车检测模块、人体关键点定位模块、接打电话检测模块和安全带检测模块；

2.根据权利要求1所述的一种卡口高清相机全车信息识别系统，其特征在于，所述车辆信息包括车型、车身颜色、车标、车牌号码、车牌颜色和是否有遮阳板。

3.根据权利要求1所述的一种卡口高清相机全车信息识别系统，其特征在于，所述网络模型采用深度卷积神经网络，所述深度卷积神经网络在图像识别过程中包括：

深度卷积网特征提取的步骤；

小目标特征提取与检测的步骤；

大目标特征特征提取与检测的步骤；

多尺度检测结果融合的步骤。

4.根据权利要求3所述的一种卡口高清相机全车信息识别系统，其特征在于，所述深度卷积网特征提取的步骤包括：

A1，将机动车图像缩放到1056×640像素；

5.根据权利要求4所述的一种卡口高清相机全车信息识别系统，其特征在于，所述小目标特征提取与检测的步骤包括：

6.根据权利要求5所述的一种卡口高清相机全车信息识别系统，其特征在于，所述大目标特征特征提取与检测的步骤包括：

7.根据权利要求6所述的一种卡口高清相机全车信息识别系统，其特征在于，所述多尺度检测结果融合的步骤包括：

8.根据权利要求1所述的一种卡口高清相机全车信息识别系统，其特征在于，所述定位模型的算法过程包括：

对输入的机动车图像进行特征提取，得到特征图；

对特征图进行分析得到初步关键点和关联信息；

9.一种卡口高清相机全车信息识别方法，适用于权利要求1-8任一项所述的卡口高清相机全车信息识别系统，其特征在于，包括以下步骤：