CN114219781A

CN114219781A - 基于场景解耦的偷钓行为检测方法、装置及可读存储介质

Info

Publication number: CN114219781A
Application number: CN202111511322.9A
Authority: CN
Inventors: 李球; 胡玲静; 罗富章; 王和平; 张笑天; 李希; 欧阳一村
Original assignee: Maxvision Technology Corp
Current assignee: Maxvision Technology Corp
Priority date: 2021-12-06
Filing date: 2021-12-06
Publication date: 2022-03-22

Abstract

本申请公开一种基于场景解耦的偷钓行为检测方法，其包括：获取待检测图像F；对待检测图像F进行关于水域和钓鱼竿的语义分割，判断语义分割结果判断分割结果中是否同时存在水域和钓鱼竿两种对象；若存在水域和钓鱼竿两种对象，记属于钓鱼竿对象的所有像素点组成的坐标集合U1，并对待检测图像F进行人员目标检测，判断目标检测结果中是否存在人员目标；若目标检测检测出人员目标，记属于人员目标的所有像素的坐标集合U2；以及对坐标集合U1和坐标集合U2的交集运算，若交集不为空，则表示有人员偷钓行为并标记出偷钓人员。本申请还提供一种偷钓行为检测装置及计算机可读存储介质。

Description

基于场景解耦的偷钓行为检测方法、装置及可读存储介质

技术领域

本申请涉及图像处理领域，更具体地说，是基于场景解耦的偷钓行为检测方法、装置及计算机可读存储介质。

背景技术

生活中，很多公共场所(比如河流、湖泊等等)都是不允许进行垂钓行为的，但是总有一些人员违反这项规定。对于违规偷钓行为，目在现有的偷钓行为检测方法中，最常见的就是通过目标检测的手段来完成，总体上就是通过将人员手握钓竿看成一个整体作为检测目标，从而达到将偷钓人员检测出来的目的。

在前述方法中，一般都是将偷钓人员与钓竿所形成的矩形区域作为检测目标，由于钓竿的状态(长度、形状)复杂多变，这个矩形区域一般比较大，会引入非常多的干扰，容易将其它场景的人员误检为偷钓人员，由于将偷钓人员与钓竿作为整体目标，这就导致很难获得大量且多样性的训练数据，例如涉及偷钓人员的姿势和钓竿的形状等训练数据，从而导致检测准确率低。

发明内容

针对现有技术，本申请解决的技术问题是提供一种对水域、钓鱼竿和人员目标进行解耦以提高检测准确率的基于场景解耦的偷钓行为检测方法、装置及可读存储介质。

为解决上述技术问题，第一方面，本申请提供一种基于场景解耦的偷钓行为检测方法，其包括：

获取待检测图像F；

对待检测图像F进行关于水域和钓鱼竿的语义分割，判断语义分割结果判断分割结果中是否同时存在水域和钓鱼竿两种对象；

若存在水域和钓鱼竿两种对象，记属于钓鱼竿对象的所有像素点组成的坐标集合U1，并对待检测图像F进行人员目标检测，判断目标检测结果中是否存在人员目标；

若目标检测检测出人员目标，记属于人员目标的所有像素的坐标集合U2；以及，

对坐标集合U1和坐标集合U2的交集运算，若交集不为空，则表示有人员偷钓行为，输出并标记出坐标集合U2对应的人员目标。

在一种可能的实现方式中，对待检测图像进行关于水域和钓鱼竿的语义分割的步骤包括：

获取第一训练数据集；

对第一训练数据集中的每一图像数据进行关于水域和钓鱼竿的数据标注，根据数据标注结果生成单通道掩膜图像；

将数据标注后的数据集输入分割网络模型中进行训练获得语义分割模型；

利用所述语义分割模型对所述待检测图像F进行关于水域和钓鱼竿的语义分割，获得所述待检测图像F的关于背景、水域和钓鱼竿的数值矩阵；

其中，所述数值矩阵中的每一元素的值为0,1和2三个数字中的一个，0代表背景，1代表水域和2代表钓鱼竿。

在一种可能的实现方式中，对待检测图像进行人员目标检测的步骤包括：

获取第二训练数据集，对第二训练数据集进行预处理获得第三训练数据集；

对第三训练数据集进行关于人目标的数据标注；

将数据标注后的第三训练数据集输入深度学习模型中进行训练获得人员目标检测模型；

利用所述人员目标检测模型对所述待检测图像F进行人员目标检测，输出关于人员目标的矩形检测框；

记矩形检测框内的所有像素点的坐标组成坐标集合U2。

在一种可能的实现方式中，对第二训练数据集的进行预处理的步骤包括：

对第二训练数据集中的每一图像数据进行编号，获得图像数据集P＝{p₁,p₂,…p_n}；

对所述图像数据集P＝{p₁,p₂,…p_n}中的至少一图像数据进行图像平移和/或对所述图像数据集P＝{p₁,p₂,…p_n}中任意两个不同编号的图像数据进行图像融合；

将图像平移和图像融合的结果图像与所述第二训练数据集合并形成第三训练数据集。

在一种可能的实现方式中，对所述图像数据集P＝{p₁,p₂,…p_n}中的至少一图像数据进行图像平移为将该图像数据沿图像坐标系的X轴方向，或沿图像坐标系的Y轴方向，或者沿图像坐标系的X轴方向及Y轴方向平移；

对所述图像数据集P＝{p₁,p₂,…p_n}中任意两个不同编号的图像数据进行图像融合：将该两个不同编号的图像数据中其中一个图像数据进行缩小操作，将缩小后的图像数据融合至该两个不同编号的图像数据中另外一个图像数据中。

在一种可能的实现方式中，所述分割网络模型为BiSeNet分割网络。

在一种可能的实现方式中，所述深度学习模型为Yolov3目标检测模型。

在基于场景解耦的偷钓行为检测方法中，利于语义分割检测出水域和钓鱼竿，利用人员目标检测检测出人员，在通过对由钓鱼竿对象的像素点的坐标集合U1和由人员目标的像素点的坐标集合U2进行求交集运算，从而实现偷钓人员的检测，该偷钓行为检测方法将检测过程中的水域、钓鱼竿和人三个对象进行单独检测实现场景解耦，不再将人员和钓鱼竿作为整体检测，如此可以避免因检测区域过大带来不利干扰，从而提高检测准确率。同时，该偷钓行为检测方法先判断待检测图像是否水域和钓鱼竿，在同时存在水域和钓鱼竿的时再进行偷钓人员检测，如此避免盲目地进行偷钓人员的检测。

第二方面，本申请提供一种偷钓行为检测装置，其包括：

图像获取模块：用于获取待检测图像F；

语义分割模块：用于对待检测图像F进行关于水域和钓鱼竿的语义分割，且当语义分割模块同时分割出水域和钓鱼竿两种对象时，用于求得属于钓鱼竿对象的所有像素点组成的坐标集合U1；

人员目标检测：当所述待检测图像F中同时存在水域和钓鱼竿两种对象时，用于对待检测图像F进行人员目标检测且求得属于人员目标的所有像素的坐标集合U2；以及，

交集运算模块：用于对坐标集合U1和坐标集合U2的交集运算，且当交集不为空时标记出偷钓人员。

所述偷钓行为检测装置中，将检测过程中的水域、钓鱼竿和人三个对象进行单独检测实现场景解耦，不再将人员和钓鱼竿作为整体检测，如此可以避免因检测区域过大带来不利干扰，从而提高检测准确率。同时，该偷钓行为检测方法先判断待检测图像是否水域和钓鱼竿，在同时存在水域和钓鱼竿的时再进行偷钓人员检测，如此避免盲目地进行偷钓人员的检测。

第三方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时，实现所述基于场景解耦的偷钓行为检测方法。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的基于场景解耦的偷钓行为检测方法的流程图；

图2为本申请实施例的获取的待检测图像F的示意图；

图3为本申请实施例的对待检测图像F进行关于水域和钓鱼竿的语义分割的步骤流程图；

图4为本申请实施例的对图2进行关于水域和钓鱼竿的语义分割的结果图；

图5为本申请实施例的对待检测图像F进行人员目标检测的步骤流程图；

图6为本申请实施例的对图2进行人员目标检测的框选出的人员目标的结果图；

图7为本申请实施例的利用基于场景解耦的偷钓行为检测方法检测出的偷钓人员结果图；

图8为本申请实施例的偷钓行为检测装置的结构框图。

具体实施方式

为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

需要说明的是，当元件被称为“固定于”或“设置于”另一个元件，它可以直接在另一个元件上或者间接在该另一个元件上。当一个元件被称为是“连接于”另一个元件，它可以是直接连接到另一个元件或间接连接至该另一个元件上。

需要理解的是，术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

现结合附图对本申请的基于场景解耦的偷钓行为检测方法、装置及计算机可读存储介质进行具体说明。

一并参照图1，本申请实施例提供的基于场景解耦的偷钓行为检测方法包括如下步骤：

步骤S100：获取待检测图像F，一待检测图像F如图2所示。

步骤S200：对待检测图像F进行关于水域和钓鱼竿的语义分割。

步骤S300：判断语义分割结果判断分割结果中是否同时存在水域和钓鱼竿两种对象。若同时存在水域和钓鱼竿两种对象，则执行步骤S310：记属于钓鱼竿对象的所有像素点组成的坐标集合U1，并对待检测图像F进行人员目标检测；否者执行步骤S700。

步骤S400：判断目标检测结果中是否存在人员目标；

如存在人员目标，则执行步骤S410：记属于人员目标的所有像素的坐标集合U2；否者执行步骤S700。

步骤S500：对坐标集合U1和坐标集合U2的交集运算；

步骤S600：判断交集是否为空。若交集不为空，则执行步骤S610：表示有人员偷钓行为，输出并标记出坐标集合U2对应的人员目标；否者执行步骤S700。

步骤S700：未有人员进行偷钓行为。

参照图3，在所述步骤S200中，所述水域包括河流和湖泊，对待检测图像F进行关于水域和钓鱼竿的语义分割的步骤包括：

步骤S210：获取第一训练数据集；

步骤S220：对第一训练数据集中的每一图像数据进行关于水域和钓鱼竿的数据标注，根据数据标注结果生成单通道的掩膜图像；

步骤S230：将数据标注后的数据集输入分割网络模型中进行训练获得语义分割模型；

步骤S240：利用所述语义分割模型对所述待检测图像F进行关于水域和钓鱼竿的语义分割，获得所述待检测图像F的关于背景、水域和钓鱼竿的数值矩阵；

在上述步骤中，第一训练数据集的每一图像数据进行预处理获得的单通道的掩膜图像与原始图像数据的长宽一样，单通道的掩膜图像的每一像素点的像素值为0,1和2三个数字中的一个，0代表背景，1代表水域和2代表钓鱼竿；单通道的掩膜图像中的0,1和2作为语义分割标签。所述数值矩阵中的每一元素的值为0,1和2三个数字中的一个，0代表背景，1代表水域和2代表钓鱼竿。

在上述步骤中，分割网络模型为BiSeNet分割网络，图4为对图2进行进行关于水域和钓鱼竿的语义分割的结果。

在本实施例中，第一训练数据集包括正负样本，正样本为包含水域或钓鱼竿的图像数据，负样本为不包含水域和钓鱼竿的图像数据。在一实施例中，将第一训练数据集的部分图像数据进行不同角度旋转，并将角度旋转后的图像合并至第一训练数据集中；将第一训练数据集的部分图像数据进行图像属性变换，将亮度变化后的图像合并至第一训练数据集中，图像属性变换包括将图像数据的亮度变为原来的M倍，对比度变为原来的M倍，饱和度变为燕来的M倍,其中M的数值范围为0.6-1.4；如此可以增加训练数据集的多样性，以提高训练出的分割网络模型的精度和稳定性。

参照图5，在步骤S310中，对待检测图像进行人员目标检测的步骤包括：

步骤S311：获取第二训练数据集，对第二训练数据集进行预处理获得第三训练数据集；

步骤S312：对第三训练数据集进行关于人目标的数据标注；

步骤S313：将数据标注后的第三训练数据集输入深度学习模型中进行训练获得人员目标检测模型；

步骤S314：利用所述员目标检测模型对所述待检测图像F进行人员目标检测，输出关于人员目标的矩形检测框；

步骤S315：记矩形检测框内的所有像素点的坐标组成坐标集合U2。

在一实施例中，第一训练数据集包括正负样本，正样本为包含人目标的图像数据，负样本为不包含人目标的图像数据。

在一实施例中，对第二训练数据集进行预处理获得第三训练数据集的步骤具体为：对第二训练数据集中的每一图像数据进行编号，获得图像数据集P＝{p₁,p₂,…p_n}；对所述图像数据集P＝{p₁,p₂,…p_n}中的至少一图像数据进行图像平移和/或对所述图像数据集P＝{p₁,p₂,…p_n}中任意两个不同编号的图像数据进行图像融合；将图像平移和图像融合的结果图像与所述第二训练数据集合并形成第三训练数据集。如此可以增加训练数据集的多样性，以提高人员目标检测模型的泛化能力。

在一实施例中，所述深度学习模型为Yolov3目标检测模型。对图2进行步骤S310的人员目标检测结果如图6所示。

在上述实施例中，当语义分割结果中存在水域和钓鱼竿对象且人员目标检测是检测出人员目标时，对坐标集合U1和坐标集合U2的交集运算，即判断语义分割出的钓鱼竿对象的像素点是否落入矩形检测框内。

在步骤中S610中，当交集运算结果不为空时，表示有人员偷钓行为，输出并标记出坐标集合U2对应的人员目标即为：以矩形框框出与坐标集合U2对应的人员目标，且在矩形框上以“fishing”标记矩形框框出的与坐标集合U2对应的人员目标，故此表示矩形框框出的人员为偷钓人员，如图7所示。

参照图8，本申请实施例提供的应用所述基于场景解耦的偷钓行为检测方法的偷钓行为检测装置100包括图像获取模块11、语义分割模块12、人员目标检测13和交集运算模块14。图像获取模块11连接语义分割模块12和人员目标检测13，语义分割模块12和人员目标检测13相互连接，交集运算模块14连接语义分割模块12和人员目标检测13。

具体地，图像获取模块11用于获取待检测图像F。语义分割模块12用于对待检测图像F进行关于水域和钓鱼竿的语义分割，且当语义分割模块12同时分割出水域和钓鱼竿两种对象时用于求得属于钓鱼竿对象的所有像素点组成的坐标集合U1。当所述待检测图像F中同时存在水域和钓鱼竿两种对象时，人员目标检测13用于对待检测图像F进行人员目标检测13且用于求得属于人员目标的所有像素的坐标集合U2；交集运算模块14用于对坐标集合U1和坐标集合U2的交集运算，且当交集不为空时标记出偷钓人员。

在所述偷钓行为检测装置100中，将检测过程中的水域、钓鱼竿和人三个对象进行单独检测实现场景解耦，不再将人员和钓鱼竿作为整体检测，如此可以避免因检测区域过大带来不利干扰，从而提高检测准确率。同时，该偷钓行为检测方法先判断待检测图像是否水域和钓鱼竿，在同时存在水域和钓鱼竿的时再进行偷钓人员检测，如此避免盲目地进行偷钓人员的检测。

本申请实施例还提供计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时，实现所述基于场景解耦的偷钓行为检测方法。

所述可读存储介质可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述可读存储介质内的计算机程序和/或模块，以及调用存储在可读存储介质内的数据，实现所述计算机装置的各种功能。所述可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据手机的使用所创建的数据等。此外，可读存储介质可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(SmartMedia Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述计算机装置的控制中心，利用各种接口和线路连接整个计算机装置的各个部分。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本申请的保护范围之内。

Claims

1.一种基于场景解耦的偷钓行为检测方法，其特征在于，包括：

获取待检测图像F；

若目标检测检测出人员目标，记属于人员目标的所有像素的坐标集合U2；以及

对坐标集合U1和坐标集合U2的交集运算，若交集不为空，则表示有人员偷钓行为并标记出偷钓人员。

2.如权利要求1所述的偷钓行为检测方法，其特征在于，对待检测图像进行关于水域和钓鱼竿的语义分割的步骤包括：

获取第一训练数据集；

3.如权利要求1所述的基于场景解耦的偷钓行为检测方法，其特征在于，对待检测图像进行人员目标检测的步骤包括：

对第三训练数据集进行关于人目标的数据标注；

利用所述员目标检测模型对所述待检测图像F进行人员目标检测，输出关于人员目标的矩形检测框；

记矩形检测框内的所有像素点的坐标组成坐标集合U2。

4.如权利要求3所述的基于场景解耦的偷钓行为检测方法，其特征在于，对第二训练数据集的进行预处理的步骤包括：

5.如权利要求4所述的基于场景解耦的偷钓行为检测方法，其特征在于，对所述图像数据集P＝{p₁,p₂,…p_n}中的至少一图像数据进行图像平移为将该图像数据沿图像坐标系的X轴方向，或沿图像坐标系的Y轴方向，或者沿图像坐标系的X轴方向及Y轴方向平移；

6.如权利要求2所述的基于场景解耦的偷钓行为检测方法，其特征在于，所述分割网络模型为BiSeNet分割网络。

7.如权利要求3所述的基于场景解耦的偷钓行为检测方法，其特征在于，所述深度学习模型为Yolov3目标检测模型。

8.一种偷钓行为检测装置，其特征在于，包括：

图像获取模块：用于获取待检测图像F；

语义分割模块：用于对待检测图像F进行关于水域和钓鱼竿的语义分割，且当语义分割模块同时分割出水域和钓鱼竿两种对象时，求得属于钓鱼竿对象的所有像素点组成的坐标集合U1；

人员目标检测：当所述待检测图像F中同时存在水域和钓鱼竿两种对象时，用于并对待检测图像F进行人员目标检测，记属于人员目标的所有像素的坐标集合U2；以及

交集运算：用于对坐标集合U1和坐标集合U2的交集运算，且交集不为空时标记出偷钓人员。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时，实现权利要求1-7任一项所述的偷钓行为检测方法。