CN112232242A

CN112232242A - 基于人工智能的涉水识别方法及装置

Info

Publication number: CN112232242A
Application number: CN202011131767.XA
Authority: CN
Inventors: 夏润亮; 李涛; 王敏; 金锦; 朱敏; 刘启兴; 李斌; 俞彦; 杨无双; 冯兴凯; 李冰; 吴丹; 郝臻; 薛阳茹; 焦莉华
Original assignee: Yellow River Institute of Hydraulic Research
Current assignee: Yellow River Institute of Hydraulic Research
Priority date: 2020-10-21
Filing date: 2020-10-21
Publication date: 2021-01-15

Abstract

本发明涉及一种基于人工智能的涉水识别方法及装置，包括对神经网络进行训练，构建推理模型；获取视频并处理，得到待处理视频，将所述待处理视频输入到所述推理模型中；所述推理模型对所述待处理视频进行分析处理，识别涉水行为类别。本发明使用计算机视觉分析技术，分析广泛分布的摄像头采集的影像资料。对于水面漂浮物、封闭区域非法入侵、违法行为等主题进行自动识别，便于管理人员及时采取措施。

Description

基于人工智能的涉水识别方法及装置

技术领域

本发明属于人工智能技术领域，具体涉及一种基于人工智能的涉水识别方法及装置。

背景技术

在计算机科学中，人工智能(AI)有时被称为机器智能，是由机器展示的智能，与人类和动物展示的自然智能形成对比。通俗地说，“人工智能”一词用来描述模仿人类与其他人类思维相关联的“认知”功能的机器，如“学习”和“解决问题”。而在人工智能中计算机视觉是一门研究如何对数字视频或视频进行高层语义理解的交叉学科，它赋予机器“看”的智能，需要实现人的大脑中(主要是视觉皮层区)的视觉能力。

相关技术中，视频监控是安保和巡查一个不可或缺的组成部分。一般情况下，人工参照大批量长时间的视频录像去监控河湖漂浮物、涉河违法事件十分困难，也是一项非常乏味的任务。

发明内容

有鉴于此，本发明的目的在于克服现有技术的不足，提供一种基于人工智能的涉水识别方法及装置，以解决现有技术中监控河湖漂浮物、涉河违法事件十分困难的问题。

为实现以上目的，本发明采用如下技术方案：一种基于人工智能的涉水识别方法，包括：

对神经网络进行训练，构建推理模型；

获取视频并处理，得到待处理视频，将所述待处理视频输入到所述推理模型中；

所述推理模型对所述待处理视频进行分析处理，识别涉水行为类别。

进一步的，所述对神经网络进行预训练，构建推理模型，包括：

获取视频流，对所述视频流进行处理得到视频帧数据；

对所述视频帧数据进行类别标注后，输入神经网络进行训练；

训练至模型收敛，输出推理模型。

进一步的，所述对所述视频流进行处理得到视频帧数据，包括：

对视频进行16帧采样，包括：随机采样、连续采样、连续滑动采样。

进一步的，还包括：

对视频进行调整为新视频；所述调整包括：旋转、尺寸调整、颜色通道畸变、几何视频畸变、边界框注释中的像素畸变；

将所述新视频输入到所述推理模型中以更新所述推理模型。

进一步的，所述获取视频并处理，得到待处理视频，包括：

对所述视频尺寸调整至预设尺寸，将所述调整为预设尺寸的视频确定为待处理视频。

进一步的，所述推理模型对所述视频进行分析处理，包括：

对待处理视频进行处理得到待处理视频帧数据；

所述推理模型对所述待处理视频帧数据进行分析，得到RGB时序差异；

根据所述RGB时序差异识别涉水行为类别。

进一步的，涉水行为类别包括跑步、驻足、步行、指指点点、向湖内扔垃圾、游泳、打伞、爬栏杆。

进一步的，通过摄像头实时采集任务区域的视频。

本申请实施例提供一种基于人工智能的涉水识别装置，包括：

构建模块，用于对神经网络进行训练，构建推理模型；

处理模块，用于获取视频并处理，得到待处理视频，将所述待处理视频输入到所述推理模型中；

识别模块，用于所述推理模型对所述待处理视频进行分析处理，识别涉水行为类别。

获取视频流，对所述视频流进行处理得到视频帧数据；

训练至模型收敛，输出推理模型。

本发明采用以上技术方案，能够达到的有益效果包括：

本发明提供一种基于人工智能的涉水识别方法，本发明使用计算机视觉分析技术，分析广泛分布的摄像头采集的影像资料。对于水面漂浮物、封闭区域非法入侵、违法行为等主题进行自动识别，便于管理人员及时采取措施。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明基于人工智能的涉水识别方法的步骤示意图；

图2为本发明基于人工智能的涉水识别装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将对本发明的技术方案进行详细的描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式，都属于本发明所保护的范围。

下面结合附图介绍本申请实施例中提供的一个具体的基于人工智能的涉水识别方法。

如图1所示，本申请实施例中提供的基于人工智能的涉水识别方法包括：

S101，对神经网络进行训练，构建推理模型；

S102，获取视频并处理，得到待处理视频，将所述待处理视频输入到所述推理模型中；

S103，所述推理模型对所述待处理视频进行分析处理，识别涉水行为类别。

基于人工智能的涉水识别方法的工作原理为：首先对卷积神经网络进行训练，构建一个推理模型，推理模型能够根据输入的视频流输出涉水行为类别。当获取到视频后，先对视频进行格式或者大小上的处理，得到待处理视频，然后将待处理视频输入到推理模型中，推理模型对待处理视频进行解析，识别涉水行为类别。

一些实施例中，所述对神经网络进行预训练，构建推理模型，包括：

获取视频流，对所述视频流进行处理得到视频帧数据；

训练至模型收敛，输出推理模型。

可以理解的是，本申请需要先对视频流进行剪辑，去除冗余信息，为了保留更有判别性的特征，对数据进行更为细致的剪辑，由于大量视频读取操作、1920x1080视频帧操作消耗大量内存，导致运行缓慢，甚至运算超时。所以对所有数据进行预处理，将视频转为视频帧，将视频帧大小重新设置为320x240。

本申请中，由于大量视频读取操作、1920x1080视频帧操作消耗大量内存，导致运行缓慢，甚至运算超时。所以对所有数据进行预处理，将视频转为视频帧，将视频帧大小重新设置，减少运算量。

优选的，所述对所述视频流进行处理得到视频帧数据，包括：

具体的，本网络将16帧图像作为一个视频片段送入网络。对完整视频进行16帧采样时，有三种方式：(1)随机采样(数据大小为视频总数)；(2)连续采样(数据大小为视频总数)；(3)连续滑动采样(数据大小为所有视频生成的片段数)。

其中，随机采样是对送入网络的视频，随机采取16帧作为输入；连续采样是对每个视频连续采样，单次迭代对每个视频取样一次，下一轮迭代接着上一轮迭代每个视频结束位置进行采样；连续滑动采样是采取滑动取样方式，生成每个视频所有的片段，这种方式将根据起始帧和结束帧序号采样16帧图像，每一个视频片段之间可以有重叠也可以没有，可根据自身需求进行设置。

本申请在构建推理模型后，还包括：

将所述新视频输入到所述推理模型中以更新所述推理模型。

一些实施例中，所述获取视频并处理，得到待处理视频，包括：

同样的，本申请需要先对视频流进行剪辑，去除冗余信息，为了保留更有判别性的特征，对数据进行更为细致的剪辑，由于大量视频读取操作、1920x1080视频帧操作消耗大量内存，导致运行缓慢，甚至运算超时。所以对所有数据进行预处理，将视频转为视频帧，将视频帧大小重新设置为320x240。

优选的，所述推理模型对所述视频进行分析处理，包括：

对待处理视频进行处理得到待处理视频帧数据；

根据所述RGB时序差异识别涉水行为类别。

需要说明的是，本申请提供的推理模型的核心是一个三维卷积核，由于视频监控存在较固定的背景，因此有人员及物体进入画面时就变成了前景，三维卷积核是处理前景和背景之间产生的RGB时序差异，也就是处理空间上RGB变化信息和时序信息。从而，根据RGB时序差异识别涉水行为类别。

一些实施例中，所述涉水行为类别包括跑步、驻足、步行、指指点点、向湖内扔垃圾、游泳、打伞、爬栏杆。

其中，跑步、驻足、步行、指指点点、打伞等行为并没有涉水没有危险概率，而向湖内扔垃圾、游泳、爬栏杆等行为具有一定危险性，本申请的目的就是为了识别这些危险行为。

优选的，本申请中的视频是通过摄像头实时采集任务区域的视频。

如图2所示，本申请实施例提供一种基于人工智能的涉水识别装置，包括：

构建模块201，用于对神经网络进行训练，构建推理模型；

处理模块202，用于获取视频并处理，得到待处理视频，将所述待处理视频输入到所述推理模型中；

识别模块203，用于所述推理模型对所述待处理视频进行分析处理，识别涉水行为类别。

本申请实施例提供一种人工智能的涉水识别装置的工作原理是，构建模块301对神经网络进行训练，构建推理模型；处理模块302获取视频并处理，得到待处理视频，将所述待处理视频输入到所述推理模型中；识别模块303所述推理模型对所述待处理视频进行分析处理，识别涉水行为类别。

本申请实施例提供一种计算机设备，包括处理器，以及与处理器连接的存储器；

存储器用于存储计算机程序，计算机程序用于执行上述任一实施例提供的基于人工智能的涉水识别方法；

处理器用于调用并执行存储器中的计算机程序。

综上所述，本发明提供一种基于人工智能的涉水识别方法及装置，包括本发明涉及一种基于人工智能的涉水识别方法及装置，包括对神经网络进行训练，构建推理模型；获取视频并处理，得到待处理视频，将所述待处理视频输入到所述推理模型中；所述推理模型对所述待处理视频进行分析处理，识别涉水行为类别。本发明使用计算机视觉分析技术，分析广泛分布的摄像头采集的影像资料。对于水面漂浮物、封闭区域非法入侵、违法行为等主题进行自动识别，便于管理人员及时采取措施。

可以理解的是，上述提供的方法实施例与上述的装置实施例对应，相应的具体内容可以相互参考，在此不再赘述。

本领域内的技术人员应明白，本申请的实施例可提供为方法、装置、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令方法的制造品，该指令方法实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种基于人工智能的涉水识别方法，其特征在于，包括：

对神经网络进行训练，构建推理模型；

2.根据权利要求1所述的方法，其特征在于，所述对神经网络进行预训练，构建推理模型，包括：

获取视频流，对所述视频流进行处理得到视频帧数据；

训练至模型收敛，输出推理模型。

3.根据权利要求2所述的方法，其特征在于，所述对所述视频流进行处理得到视频帧数据，包括：

4.根据权利要求1所述的方法，其特征在于，还包括：

将所述新视频输入到所述推理模型中以更新所述推理模型。

5.根据权利要求1所述的方法，其特征在于，所述获取视频并处理，得到待处理视频，包括：

6.根据权利要求5所述的方法，其特征在于，所述推理模型对所述视频进行分析处理，包括：

对待处理视频进行处理得到待处理视频帧数据；

根据所述RGB时序差异识别涉水行为类别。

7.根据权利要求6所述的方法，其特征在于，

所述涉水行为类别包括跑步、驻足、步行、指指点点、向湖内扔垃圾、游泳、打伞、爬栏杆。

8.根据权利要求1所述的方法，其特征在于，

通过摄像头实时采集任务区域的视频。

9.一种基于人工智能的涉水识别装置，其特征在于，包括：

构建模块，用于对神经网络进行训练，构建推理模型；

10.根据权利要求9所述的装置，其特征在于，所述对神经网络进行预训练，构建推理模型，包括：

获取视频流，对所述视频流进行处理得到视频帧数据；

训练至模型收敛，输出推理模型。