CN113591591A

CN113591591A - 人工智能现场行为识别系统

Info

Publication number: CN113591591A
Application number: CN202110757519.4A
Authority: CN
Inventors: 许经浩; 刘春梅
Original assignee: Beijing Ruibo Zhongcheng Technology Co ltd
Current assignee: Beijing Ruibo Zhongcheng Technology Co ltd
Priority date: 2021-07-05
Filing date: 2021-07-05
Publication date: 2021-11-02

Abstract

本发明提供人工智能现场行为识别系统，包括视频采集模块、图像识别模块和图像检测模块，其中，视频采集模块用于采集目标区域的视频信息，将采集的图像传送到图像识别模块；图像识别模块收到视频采集模块采集的视频信息后，将视频识别成视频图片并对图片进行预处理；图像检测模块用于预处理后的图片，并对预处理后的图片进行处理分析。本发明的有益效果是：本发明通过对视频监控端获取的视频数据进行采样和分段，将视频转化成图片，并输入经训练的神经网络模型，减少人为设计特征，来提高行为识别准确率。现有的行为识别方法，受到光照条件各异、视角多样性、背景复杂等诸多因素的影响，识别的精确性和效率并不能完全满足相关行业的实用要求。

Description

人工智能现场行为识别系统

技术领域

本发明涉及现场行为识别领域，更具体地说涉及一种人工智能现场行为识别系统。

背景技术

目前，利用人工智能技术对社区监控视频进行自动检测，很多主体行为发生时，需要经过完整的一段过程，即需要完整的时序信息才能做出判断，如果把所有数据都经过计算，则计算量非常大，现有的行为识别方法，受到光照条件各异、视角多样性、背景复杂等诸多因素的影响，识别的精确性和效率并不能完全满足相关行业的实用要求。

发明内容

本发明克服了现有技术中的不足，提供了一种人工智能现场行为识别系统。

本发明的目的通过下述技术方案予以实现。

人工智能现场行为识别系统，包括视频采集模块、图像识别模块和图像检测模块，其中，

所述视频采集模块用于采集目标区域的视频信息，将采集的图像传送到所述图像识别模块；

所述图像识别模块收到所述视频采集模块采集的视频信息后，将所述视频识别成视频图片并对图片进行预处理；

所述图像检测模块用于所述预处理后的图片，并对所述预处理后的图片进行处理分析。

优选地，所述图像识别模块将所述视频识别成视频图片的方法为：从所述视频采集模块获取目标视频流数据，并通过循环读取的方式对所述目标视频流数据进行解码抽帧处理，得到对应的多帧视频图片作为待识别视频图片。

由上述任一方案优选的是，所述图像识别模块对图片进行预处理的方法为：所述图片预处理包括将图像缩放至固定尺寸、图像去均值与归一化处理，得到图像模型集。

由上述任一方案优选的是，所述图像检测模块对所述预处理后的图片进行处理分析的具体方法为：

步骤一，获取所述图像模型集，所述图像模型集包括多张图像；

步骤二，对所述待识别行为的区域进行图像增强处理；

步骤三，对所述步骤二中增强处理后的图像进行亮度调节，调节每张所述图像的目标区域的亮度，获得待识别行为的区域；

步骤四，将所述待识别行为的区域输入到预先训练完成的行为识别模型，得到行为识别结果。

由上述任一方案优选的是，所述步骤二中调节所述图像的前景的亮度，具体的方法为：

S1：在将每张所述图像的目标区域分割为前景和背景，并将所述背景标记为黑色，所述前景为包含待识别行为的区域；

S2：提取所有图像或者部分图像的所述目标区域的亮度信息，对所述亮度信息取平均值得到平均亮度信息；

S3：调节每张所述图像的目标区域的所有像素的亮度或者红色通道值，直至所述目标区域的平均亮度达到所述平均亮度信息对应的亮度。

由上述任一方案优选的是，所述步骤二中的图像增强处理包括：将图片缩放至固定尺寸、图像去均值与归一化处理，得到增强处理后的图片。

由上述任一方案优选的是，所述步骤四中的所述识别模型为深度神经网络，所述深度神经网络包括依次连接的卷积池化层、至少一个卷积块、卷积池化层、全连接层和输出层；所述卷积块包括依次连接的通道分割层、深度卷积层、压缩激活层和拼接层，所述通道分割层还与所述拼接层直接连接；所述拼接层之后还连接有通道拼接层。

本发明的有益效果为：

本发明通过对视频监控端获取的视频数据进行采样和分段，将视频转化成图片，并输入经训练的神经网络模型，减少人为设计特征，来提高行为识别准确率。现有的行为识别方法，受到光照条件各异、视角多样性、背景复杂等诸多因素的影响，识别的精确性和效率并不能完全满足相关行业的实用要求。

具体实施方式

下面通过具体的实施例对本发明的技术方案作进一步的说明。

所述图像识别模块将所述视频识别成视频图片的方法为：从所述视频采集模块获取目标视频流数据，并通过循环读取的方式对所述目标视频流数据进行解码抽帧处理，得到对应的多帧视频图片作为待识别视频图片。

所述图像识别模块对图片进行预处理的方法为：所述图片预处理包括将图像缩放至固定尺寸、图像去均值与归一化处理，得到图像模型集。

所述图像检测模块对所述预处理后的图片进行处理分析的具体方法为：

步骤二，对所述待识别行为的区域进行图像增强处理；

所述步骤二中调节所述图像的前景的亮度，具体的方法为：

S2：提取所有图像或者部分图像的所述目标区域的亮度信息，对所述亮度信息取平均值得到平均亮度信息；考虑到现实中光线条件不同，可以计算训练集对应于目标区域的平均亮度信息，用于后续基于该平均亮度信息进行亮度调整，从而进一步消除过度曝光或光线不足导致的行为识别准确度下降的问题。对训练集中图像的目标区域计算平均亮度信息，该平均亮度信息表示了多张图像的平均亮度水平，因此消除了环境过亮或过暗造成的影响，可以用于后续步骤中调整前景的亮度。例如，上述图像可以是YUV/YCbCr图像，在计算平均亮度信息时，可以提取训练集中所有图像或者部分图像的目标区域的亮度信息，并对亮度信息取平均值得到平均亮度信息；上述图像可以是RGB/IR图像，在计算平均亮度信息时，可以提取训练集中所有图像或者部分图像的目标区域的红色通道值，并对红色通道值取平均值得到平均亮度信息。

所述步骤二中的图像增强处理包括：将图片缩放至固定尺寸、图像去均值与归一化处理，得到增强处理后的图片。

步骤四，将所述待识别行为的区域输入到预先训练完成的行为识别模型，得到行为识别结果。所述步骤四中的所述识别模型为深度神经网络，所述深度神经网络包括依次连接的卷积池化层、至少一个卷积块、卷积池化层、全连接层和输出层；所述卷积块包括依次连接的通道分割层、深度卷积层、压缩激活层和拼接层，所述通道分割层还与所述拼接层直接连接；所述拼接层之后还连接有通道拼接层。

通过训练集对神经网络进行训练，在对训练集的预处理过程中，利用图像分割将背景置黑从而消除背景的影响，增强了对复杂场景识别的鲁棒性，可以应用在现实光线复杂的场景中，利用神经网络高维度的复杂建模能力，提高了识别准确率，同时避免了过度曝光或光线不足产生的准确度下降问题。

以上对本发明的一个实施例进行了详细说明，但所述内容仅为本发明的较佳实施例，不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等，均应仍归属于本发明的专利涵盖范围之内。

Claims

1.人工智能现场行为识别系统，其特征在于：包括视频采集模块、图像识别模块和图像检测模块，其中，

2.根据权利要求1所述的人工智能现场行为识别系统，其特征在于：所述图像识别模块将所述视频识别成视频图片的方法为：从所述视频采集模块获取目标视频流数据，并通过循环读取的方式对所述目标视频流数据进行解码抽帧处理，得到对应的多帧视频图片作为待识别视频图片。

3.根据权利要求2所述的人工智能现场行为识别系统，其特征在于：所述图像识别模块对图片进行预处理的方法为：所述图片预处理包括将图像缩放至固定尺寸、图像去均值与归一化处理，得到图像模型集。

4.根据权利要求3所述的人工智能现场行为识别系统，其特征在于：所述图像检测模块对所述预处理后的图片进行处理分析的具体方法为：

步骤二，对所述待识别行为的区域进行图像增强处理；

5.根据权利要求4所述的人工智能现场行为识别系统，其特征在于：所述步骤二中调节所述图像的前景的亮度，具体的方法为：

6.根据权利要求5所述的人工智能现场行为识别系统，其特征在于：所述步骤二中的图像增强处理包括：将图片缩放至固定尺寸、图像去均值与归一化处理，得到增强处理后的图片。

7.根据权利要求6所述的人工智能现场行为识别系统，其特征在于：所述步骤四中的所述识别模型为深度神经网络，所述深度神经网络包括依次连接的卷积池化层、至少一个卷积块、卷积池化层、全连接层和输出层；所述卷积块包括依次连接的通道分割层、深度卷积层、压缩激活层和拼接层，所述通道分割层还与所述拼接层直接连接；所述拼接层之后还连接有通道拼接层。