CN114219781A - 基于场景解耦的偷钓行为检测方法、装置及可读存储介质 - Google Patents
基于场景解耦的偷钓行为检测方法、装置及可读存储介质 Download PDFInfo
- Publication number
- CN114219781A CN114219781A CN202111511322.9A CN202111511322A CN114219781A CN 114219781 A CN114219781 A CN 114219781A CN 202111511322 A CN202111511322 A CN 202111511322A CN 114219781 A CN114219781 A CN 114219781A
- Authority
- CN
- China
- Prior art keywords
- image
- fishing
- detected
- fishing rod
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000001514 detection method Methods 0.000 claims abstract description 87
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 59
- 230000011218 segmentation Effects 0.000 claims abstract description 50
- 238000012549 training Methods 0.000 claims description 49
- 230000006399 behavior Effects 0.000 claims description 41
- 238000013519 translation Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000013136 deep learning model Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002411 adverse Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本申请公开一种基于场景解耦的偷钓行为检测方法,其包括:获取待检测图像F;对待检测图像F进行关于水域和钓鱼竿的语义分割,判断语义分割结果判断分割结果中是否同时存在水域和钓鱼竿两种对象;若存在水域和钓鱼竿两种对象,记属于钓鱼竿对象的所有像素点组成的坐标集合U1,并对待检测图像F进行人员目标检测,判断目标检测结果中是否存在人员目标;若目标检测检测出人员目标,记属于人员目标的所有像素的坐标集合U2;以及对坐标集合U1和坐标集合U2的交集运算,若交集不为空,则表示有人员偷钓行为并标记出偷钓人员。本申请还提供一种偷钓行为检测装置及计算机可读存储介质。
Description
技术领域
本申请涉及图像处理领域,更具体地说,是基于场景解耦的偷钓行为检测方法、装置及计算机可读存储介质。
背景技术
生活中,很多公共场所(比如河流、湖泊等等)都是不允许进行垂钓行为的,但是总有一些人员违反这项规定。对于违规偷钓行为,目在现有的偷钓行为检测方法中,最常见的就是通过目标检测的手段来完成,总体上就是通过将人员手握钓竿看成一个整体作为检测目标,从而达到将偷钓人员检测出来的目的。
在前述方法中,一般都是将偷钓人员与钓竿所形成的矩形区域作为检测目标,由于钓竿的状态(长度、形状)复杂多变,这个矩形区域一般比较大,会引入非常多的干扰,容易将其它场景的人员误检为偷钓人员,由于将偷钓人员与钓竿作为整体目标,这就导致很难获得大量且多样性的训练数据,例如涉及偷钓人员的姿势和钓竿的形状等训练数据,从而导致检测准确率低。
发明内容
针对现有技术,本申请解决的技术问题是提供一种对水域、钓鱼竿和人员目标进行解耦以提高检测准确率的基于场景解耦的偷钓行为检测方法、装置及可读存储介质。
为解决上述技术问题,第一方面,本申请提供一种基于场景解耦的偷钓行为检测方法,其包括:
获取待检测图像F;
对待检测图像F进行关于水域和钓鱼竿的语义分割,判断语义分割结果判断分割结果中是否同时存在水域和钓鱼竿两种对象;
若存在水域和钓鱼竿两种对象,记属于钓鱼竿对象的所有像素点组成的坐标集合U1,并对待检测图像F进行人员目标检测,判断目标检测结果中是否存在人员目标;
若目标检测检测出人员目标,记属于人员目标的所有像素的坐标集合U2;以及,
对坐标集合U1和坐标集合U2的交集运算,若交集不为空,则表示有人员偷钓行为,输出并标记出坐标集合U2对应的人员目标。
在一种可能的实现方式中,对待检测图像进行关于水域和钓鱼竿的语义分割的步骤包括:
获取第一训练数据集;
对第一训练数据集中的每一图像数据进行关于水域和钓鱼竿的数据标注,根据数据标注结果生成单通道掩膜图像;
将数据标注后的数据集输入分割网络模型中进行训练获得语义分割模型;
利用所述语义分割模型对所述待检测图像F进行关于水域和钓鱼竿的语义分割,获得所述待检测图像F的关于背景、水域和钓鱼竿的数值矩阵;
其中,所述数值矩阵中的每一元素的值为0,1和2三个数字中的一个,0代表背景,1代表水域和2代表钓鱼竿。
在一种可能的实现方式中,对待检测图像进行人员目标检测的步骤包括:
获取第二训练数据集,对第二训练数据集进行预处理获得第三训练数据集;
对第三训练数据集进行关于人目标的数据标注;
将数据标注后的第三训练数据集输入深度学习模型中进行训练获得人员目标检测模型;
利用所述人员目标检测模型对所述待检测图像F进行人员目标检测,输出关于人员目标的矩形检测框;
记矩形检测框内的所有像素点的坐标组成坐标集合U2。
在一种可能的实现方式中,对第二训练数据集的进行预处理的步骤包括:
对第二训练数据集中的每一图像数据进行编号,获得图像数据集P={p1,p2,…pn};
对所述图像数据集P={p1,p2,…pn}中的至少一图像数据进行图像平移和/或对所述图像数据集P={p1,p2,…pn}中任意两个不同编号的图像数据进行图像融合;
将图像平移和图像融合的结果图像与所述第二训练数据集合并形成第三训练数据集。
在一种可能的实现方式中,对所述图像数据集P={p1,p2,…pn}中的至少一图像数据进行图像平移为将该图像数据沿图像坐标系的X轴方向,或沿图像坐标系的Y轴方向,或者沿图像坐标系的X轴方向及Y轴方向平移;
对所述图像数据集P={p1,p2,…pn}中任意两个不同编号的图像数据进行图像融合:将该两个不同编号的图像数据中其中一个图像数据进行缩小操作,将缩小后的图像数据融合至该两个不同编号的图像数据中另外一个图像数据中。
在一种可能的实现方式中,所述分割网络模型为BiSeNet分割网络。
在一种可能的实现方式中,所述深度学习模型为Yolov3目标检测模型。
在基于场景解耦的偷钓行为检测方法中,利于语义分割检测出水域和钓鱼竿,利用人员目标检测检测出人员,在通过对由钓鱼竿对象的像素点的坐标集合U1和由人员目标的像素点的坐标集合U2进行求交集运算,从而实现偷钓人员的检测,该偷钓行为检测方法将检测过程中的水域、钓鱼竿和人三个对象进行单独检测实现场景解耦,不再将人员和钓鱼竿作为整体检测,如此可以避免因检测区域过大带来不利干扰,从而提高检测准确率。同时,该偷钓行为检测方法先判断待检测图像是否水域和钓鱼竿,在同时存在水域和钓鱼竿的时再进行偷钓人员检测,如此避免盲目地进行偷钓人员的检测。
第二方面,本申请提供一种偷钓行为检测装置,其包括:
图像获取模块:用于获取待检测图像F;
语义分割模块:用于对待检测图像F进行关于水域和钓鱼竿的语义分割,且当语义分割模块同时分割出水域和钓鱼竿两种对象时,用于求得属于钓鱼竿对象的所有像素点组成的坐标集合U1;
人员目标检测:当所述待检测图像F中同时存在水域和钓鱼竿两种对象时,用于对待检测图像F进行人员目标检测且求得属于人员目标的所有像素的坐标集合U2;以及,
交集运算模块:用于对坐标集合U1和坐标集合U2的交集运算,且当交集不为空时标记出偷钓人员。
所述偷钓行为检测装置中,将检测过程中的水域、钓鱼竿和人三个对象进行单独检测实现场景解耦,不再将人员和钓鱼竿作为整体检测,如此可以避免因检测区域过大带来不利干扰,从而提高检测准确率。同时,该偷钓行为检测方法先判断待检测图像是否水域和钓鱼竿,在同时存在水域和钓鱼竿的时再进行偷钓人员检测,如此避免盲目地进行偷钓人员的检测。
第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述基于场景解耦的偷钓行为检测方法。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的基于场景解耦的偷钓行为检测方法的流程图;
图2为本申请实施例的获取的待检测图像F的示意图;
图3为本申请实施例的对待检测图像F进行关于水域和钓鱼竿的语义分割的步骤流程图;
图4为本申请实施例的对图2进行关于水域和钓鱼竿的语义分割的结果图;
图5为本申请实施例的对待检测图像F进行人员目标检测的步骤流程图;
图6为本申请实施例的对图2进行人员目标检测的框选出的人员目标的结果图;
图7为本申请实施例的利用基于场景解耦的偷钓行为检测方法检测出的偷钓人员结果图;
图8为本申请实施例的偷钓行为检测装置的结构框图。
具体实施方式
为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,当元件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个元件上或者间接在该另一个元件上。当一个元件被称为是“连接于”另一个元件,它可以是直接连接到另一个元件或间接连接至该另一个元件上。
需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
现结合附图对本申请的基于场景解耦的偷钓行为检测方法、装置及计算机可读存储介质进行具体说明。
一并参照图1,本申请实施例提供的基于场景解耦的偷钓行为检测方法包括如下步骤:
步骤S100:获取待检测图像F,一待检测图像F如图2所示。
步骤S200:对待检测图像F进行关于水域和钓鱼竿的语义分割。
步骤S300:判断语义分割结果判断分割结果中是否同时存在水域和钓鱼竿两种对象。若同时存在水域和钓鱼竿两种对象,则执行步骤S310:记属于钓鱼竿对象的所有像素点组成的坐标集合U1,并对待检测图像F进行人员目标检测;否者执行步骤S700。
步骤S400:判断目标检测结果中是否存在人员目标;
如存在人员目标,则执行步骤S410:记属于人员目标的所有像素的坐标集合U2;否者执行步骤S700。
步骤S500:对坐标集合U1和坐标集合U2的交集运算;
步骤S600:判断交集是否为空。若交集不为空,则执行步骤S610:表示有人员偷钓行为,输出并标记出坐标集合U2对应的人员目标;否者执行步骤S700。
步骤S700:未有人员进行偷钓行为。
在基于场景解耦的偷钓行为检测方法中,利于语义分割检测出水域和钓鱼竿,利用人员目标检测检测出人员,在通过对由钓鱼竿对象的像素点的坐标集合U1和由人员目标的像素点的坐标集合U2进行求交集运算,从而实现偷钓人员的检测,该偷钓行为检测方法将检测过程中的水域、钓鱼竿和人三个对象进行单独检测实现场景解耦,不再将人员和钓鱼竿作为整体检测,如此可以避免因检测区域过大带来不利干扰,从而提高检测准确率。同时,该偷钓行为检测方法先判断待检测图像是否水域和钓鱼竿,在同时存在水域和钓鱼竿的时再进行偷钓人员检测,如此避免盲目地进行偷钓人员的检测。
参照图3,在所述步骤S200中,所述水域包括河流和湖泊,对待检测图像F进行关于水域和钓鱼竿的语义分割的步骤包括:
步骤S210:获取第一训练数据集;
步骤S220:对第一训练数据集中的每一图像数据进行关于水域和钓鱼竿的数据标注,根据数据标注结果生成单通道的掩膜图像;
步骤S230:将数据标注后的数据集输入分割网络模型中进行训练获得语义分割模型;
步骤S240:利用所述语义分割模型对所述待检测图像F进行关于水域和钓鱼竿的语义分割,获得所述待检测图像F的关于背景、水域和钓鱼竿的数值矩阵;
在上述步骤中,第一训练数据集的每一图像数据进行预处理获得的单通道的掩膜图像与原始图像数据的长宽一样,单通道的掩膜图像的每一像素点的像素值为0,1和2三个数字中的一个,0代表背景,1代表水域和2代表钓鱼竿;单通道的掩膜图像中的0,1和2作为语义分割标签。所述数值矩阵中的每一元素的值为0,1和2三个数字中的一个,0代表背景,1代表水域和2代表钓鱼竿。
在上述步骤中,分割网络模型为BiSeNet分割网络,图4为对图2进行进行关于水域和钓鱼竿的语义分割的结果。
在本实施例中,第一训练数据集包括正负样本,正样本为包含水域或钓鱼竿的图像数据,负样本为不包含水域和钓鱼竿的图像数据。在一实施例中,将第一训练数据集的部分图像数据进行不同角度旋转,并将角度旋转后的图像合并至第一训练数据集中;将第一训练数据集的部分图像数据进行图像属性变换,将亮度变化后的图像合并至第一训练数据集中,图像属性变换包括将图像数据的亮度变为原来的M倍,对比度变为原来的M倍,饱和度变为燕来的M倍,其中M的数值范围为0.6-1.4;如此可以增加训练数据集的多样性,以提高训练出的分割网络模型的精度和稳定性。
参照图5,在步骤S310中,对待检测图像进行人员目标检测的步骤包括:
步骤S311:获取第二训练数据集,对第二训练数据集进行预处理获得第三训练数据集;
步骤S312:对第三训练数据集进行关于人目标的数据标注;
步骤S313:将数据标注后的第三训练数据集输入深度学习模型中进行训练获得人员目标检测模型;
步骤S314:利用所述员目标检测模型对所述待检测图像F进行人员目标检测,输出关于人员目标的矩形检测框;
步骤S315:记矩形检测框内的所有像素点的坐标组成坐标集合U2。
在一实施例中,第一训练数据集包括正负样本,正样本为包含人目标的图像数据,负样本为不包含人目标的图像数据。
在一实施例中,对第二训练数据集进行预处理获得第三训练数据集的步骤具体为:对第二训练数据集中的每一图像数据进行编号,获得图像数据集P={p1,p2,…pn};对所述图像数据集P={p1,p2,…pn}中的至少一图像数据进行图像平移和/或对所述图像数据集P={p1,p2,…pn}中任意两个不同编号的图像数据进行图像融合;将图像平移和图像融合的结果图像与所述第二训练数据集合并形成第三训练数据集。如此可以增加训练数据集的多样性,以提高人员目标检测模型的泛化能力。
在一实施例中,所述深度学习模型为Yolov3目标检测模型。对图2进行步骤S310的人员目标检测结果如图6所示。
在上述实施例中,当语义分割结果中存在水域和钓鱼竿对象且人员目标检测是检测出人员目标时,对坐标集合U1和坐标集合U2的交集运算,即判断语义分割出的钓鱼竿对象的像素点是否落入矩形检测框内。
在步骤中S610中,当交集运算结果不为空时,表示有人员偷钓行为,输出并标记出坐标集合U2对应的人员目标即为:以矩形框框出与坐标集合U2对应的人员目标,且在矩形框上以“fishing”标记矩形框框出的与坐标集合U2对应的人员目标,故此表示矩形框框出的人员为偷钓人员,如图7所示。
参照图8,本申请实施例提供的应用所述基于场景解耦的偷钓行为检测方法的偷钓行为检测装置100包括图像获取模块11、语义分割模块12、人员目标检测13和交集运算模块14。图像获取模块11连接语义分割模块12和人员目标检测13,语义分割模块12和人员目标检测13相互连接,交集运算模块14连接语义分割模块12和人员目标检测13。
具体地,图像获取模块11用于获取待检测图像F。语义分割模块12用于对待检测图像F进行关于水域和钓鱼竿的语义分割,且当语义分割模块12同时分割出水域和钓鱼竿两种对象时用于求得属于钓鱼竿对象的所有像素点组成的坐标集合U1。当所述待检测图像F中同时存在水域和钓鱼竿两种对象时,人员目标检测13用于对待检测图像F进行人员目标检测13且用于求得属于人员目标的所有像素的坐标集合U2;交集运算模块14用于对坐标集合U1和坐标集合U2的交集运算,且当交集不为空时标记出偷钓人员。
在所述偷钓行为检测装置100中,将检测过程中的水域、钓鱼竿和人三个对象进行单独检测实现场景解耦,不再将人员和钓鱼竿作为整体检测,如此可以避免因检测区域过大带来不利干扰,从而提高检测准确率。同时,该偷钓行为检测方法先判断待检测图像是否水域和钓鱼竿,在同时存在水域和钓鱼竿的时再进行偷钓人员检测,如此避免盲目地进行偷钓人员的检测。
本申请实施例还提供计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述基于场景解耦的偷钓行为检测方法。
所述可读存储介质可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述可读存储介质内的计算机程序和/或模块,以及调用存储在可读存储介质内的数据,实现所述计算机装置的各种功能。所述可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据手机的使用所创建的数据等。此外,可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本申请的保护范围之内。
Claims (9)
1.一种基于场景解耦的偷钓行为检测方法,其特征在于,包括:
获取待检测图像F;
对待检测图像F进行关于水域和钓鱼竿的语义分割,判断语义分割结果判断分割结果中是否同时存在水域和钓鱼竿两种对象;
若存在水域和钓鱼竿两种对象,记属于钓鱼竿对象的所有像素点组成的坐标集合U1,并对待检测图像F进行人员目标检测,判断目标检测结果中是否存在人员目标;
若目标检测检测出人员目标,记属于人员目标的所有像素的坐标集合U2;以及
对坐标集合U1和坐标集合U2的交集运算,若交集不为空,则表示有人员偷钓行为并标记出偷钓人员。
2.如权利要求1所述的偷钓行为检测方法,其特征在于,对待检测图像进行关于水域和钓鱼竿的语义分割的步骤包括:
获取第一训练数据集;
对第一训练数据集中的每一图像数据进行关于水域和钓鱼竿的数据标注,根据数据标注结果生成单通道掩膜图像;
将数据标注后的数据集输入分割网络模型中进行训练获得语义分割模型;
利用所述语义分割模型对所述待检测图像F进行关于水域和钓鱼竿的语义分割,获得所述待检测图像F的关于背景、水域和钓鱼竿的数值矩阵;
其中,所述数值矩阵中的每一元素的值为0,1和2三个数字中的一个,0代表背景,1代表水域和2代表钓鱼竿。
3.如权利要求1所述的基于场景解耦的偷钓行为检测方法,其特征在于,对待检测图像进行人员目标检测的步骤包括:
获取第二训练数据集,对第二训练数据集进行预处理获得第三训练数据集;
对第三训练数据集进行关于人目标的数据标注;
将数据标注后的第三训练数据集输入深度学习模型中进行训练获得人员目标检测模型;
利用所述员目标检测模型对所述待检测图像F进行人员目标检测,输出关于人员目标的矩形检测框;
记矩形检测框内的所有像素点的坐标组成坐标集合U2。
4.如权利要求3所述的基于场景解耦的偷钓行为检测方法,其特征在于,对第二训练数据集的进行预处理的步骤包括:
对第二训练数据集中的每一图像数据进行编号,获得图像数据集P={p1,p2,…pn};
对所述图像数据集P={p1,p2,…pn}中的至少一图像数据进行图像平移和/或对所述图像数据集P={p1,p2,…pn}中任意两个不同编号的图像数据进行图像融合;
将图像平移和图像融合的结果图像与所述第二训练数据集合并形成第三训练数据集。
5.如权利要求4所述的基于场景解耦的偷钓行为检测方法,其特征在于,对所述图像数据集P={p1,p2,…pn}中的至少一图像数据进行图像平移为将该图像数据沿图像坐标系的X轴方向,或沿图像坐标系的Y轴方向,或者沿图像坐标系的X轴方向及Y轴方向平移;
对所述图像数据集P={p1,p2,…pn}中任意两个不同编号的图像数据进行图像融合:将该两个不同编号的图像数据中其中一个图像数据进行缩小操作,将缩小后的图像数据融合至该两个不同编号的图像数据中另外一个图像数据中。
6.如权利要求2所述的基于场景解耦的偷钓行为检测方法,其特征在于,所述分割网络模型为BiSeNet分割网络。
7.如权利要求3所述的基于场景解耦的偷钓行为检测方法,其特征在于,所述深度学习模型为Yolov3目标检测模型。
8.一种偷钓行为检测装置,其特征在于,包括:
图像获取模块:用于获取待检测图像F;
语义分割模块:用于对待检测图像F进行关于水域和钓鱼竿的语义分割,且当语义分割模块同时分割出水域和钓鱼竿两种对象时,求得属于钓鱼竿对象的所有像素点组成的坐标集合U1;
人员目标检测:当所述待检测图像F中同时存在水域和钓鱼竿两种对象时,用于并对待检测图像F进行人员目标检测,记属于人员目标的所有像素的坐标集合U2;以及
交集运算:用于对坐标集合U1和坐标集合U2的交集运算,且交集不为空时标记出偷钓人员。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-7任一项所述的偷钓行为检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111511322.9A CN114219781A (zh) | 2021-12-06 | 2021-12-06 | 基于场景解耦的偷钓行为检测方法、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111511322.9A CN114219781A (zh) | 2021-12-06 | 2021-12-06 | 基于场景解耦的偷钓行为检测方法、装置及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114219781A true CN114219781A (zh) | 2022-03-22 |
Family
ID=80701015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111511322.9A Pending CN114219781A (zh) | 2021-12-06 | 2021-12-06 | 基于场景解耦的偷钓行为检测方法、装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114219781A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115240278A (zh) * | 2022-09-23 | 2022-10-25 | 东莞先知大数据有限公司 | 钓鱼行为检测方法 |
CN115410280A (zh) * | 2022-11-03 | 2022-11-29 | 合肥中科类脑智能技术有限公司 | 一种基于人体朝向判断的钓鱼行为检测方法 |
-
2021
- 2021-12-06 CN CN202111511322.9A patent/CN114219781A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115240278A (zh) * | 2022-09-23 | 2022-10-25 | 东莞先知大数据有限公司 | 钓鱼行为检测方法 |
CN115240278B (zh) * | 2022-09-23 | 2023-01-06 | 东莞先知大数据有限公司 | 钓鱼行为检测方法 |
CN115410280A (zh) * | 2022-11-03 | 2022-11-29 | 合肥中科类脑智能技术有限公司 | 一种基于人体朝向判断的钓鱼行为检测方法 |
CN115410280B (zh) * | 2022-11-03 | 2023-06-16 | 合肥中科类脑智能技术有限公司 | 一种基于人体朝向判断的钓鱼行为检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Neumann et al. | Nightowls: A pedestrians at night dataset | |
CN114219781A (zh) | 基于场景解耦的偷钓行为检测方法、装置及可读存储介质 | |
CN102110235B (zh) | 嵌入式媒体标记符及生成和使用其的系统和方法 | |
US8849058B2 (en) | Systems and methods for image archaeology | |
CN110222572A (zh) | 跟踪方法、装置、电子设备及存储介质 | |
CN110781195B (zh) | 一种兴趣点信息更新的系统、方法和装置 | |
TW201248506A (en) | Two-dimentional optical indetification device with same gray level for quickly decoding and method for decoding the same | |
Luft et al. | Automatic content‐based georeferencing of historical topographic maps | |
CN111368698A (zh) | 主体识别方法、装置、电子设备及介质 | |
CN113592831B (zh) | 印刷误差的检测方法、装置和存储介质 | |
CN114565035A (zh) | 一种舌象分析方法、终端设备及存储介质 | |
EP3316173B1 (en) | System and method for cheque image data masking | |
CN112699704A (zh) | 一种条形码的检测方法、装置、设备、存储装置 | |
JP2010117870A (ja) | 包含型コードシンボル及びその読み出し方法、並びに閉領域包含型コードシンボル及びその読み出し方法、並びに、包含型コードシンボルが付された物品及び閉領域包含型コードシンボルが付された物品。 | |
CN111062385A (zh) | 一种用于图像文本信息检测的网络模型构建方法与系统 | |
CN111611986B (zh) | 一种基于手指交互的焦点文本提取和识别方法及系统 | |
CN112101139B (zh) | 人形检测方法、装置、设备及存储介质 | |
JP2015070598A (ja) | 識別コード読取システム及び方法 | |
CN113298122A (zh) | 目标检测方法、装置和电子设备 | |
CN113986094A (zh) | 一种地图标记方法、装置、终端及存储介质 | |
CN115830721B (zh) | 活体检测方法、装置、终端设备和可读存储介质 | |
CN111488930B (zh) | 分类网络的训练方法、目标检测方法、装置和电子设备 | |
CN116109891B (zh) | 图像数据扩增方法、装置、计算设备及存储介质 | |
CN111552755B (zh) | 三维地名标注的绘制方法、装置、设备及存储介质 | |
EP3440827A1 (fr) | Procede et systeme de separation de documents lors d'une numerisation par lot |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |