CN111797940A - 一种基于海洋搜救的图像识别方法及相关装置 - Google Patents
一种基于海洋搜救的图像识别方法及相关装置 Download PDFInfo
- Publication number
- CN111797940A CN111797940A CN202010698211.2A CN202010698211A CN111797940A CN 111797940 A CN111797940 A CN 111797940A CN 202010698211 A CN202010698211 A CN 202010698211A CN 111797940 A CN111797940 A CN 111797940A
- Authority
- CN
- China
- Prior art keywords
- normalization layer
- layer
- target
- yolo model
- shallow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 238000010606 normalization Methods 0.000 claims abstract description 112
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims abstract description 37
- 230000008569 process Effects 0.000 claims abstract description 27
- 230000004913 activation Effects 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 18
- 230000006870 function Effects 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 14
- 238000001514 detection method Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 1
- 230000009429 distress Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于海洋搜救的图像识别方法,包括获取目标海洋区域的目标图像;调用YOLO模型锁定目标图像中的待搜救目标;YOLO模型包括残差块,残差块包括浅层DBL组件,浅层DBL组件包括浅层卷积层、批处理规范化层、实例规范化层和激活函数层;批处理规范化层和实例规范化层均与浅层卷积层连接,批处理规范化层处理第一通道数的通道,实例规范化层处理第二通道数的通道。在YOLO模型残差块的浅层网络中插入实例规范化层,可以增强YOLO模型的特征描述能力,进而提高对待搜救目标识别的准确性。本发明还提供了一种装置、设备及存储介质,同样具有上述有益效果。
Description
技术领域
本发明涉及图像识别技术领域,特别是涉及一种基于海洋搜救的图像识别方法、一种基于海洋搜救的图像识别装置、一种基于海洋搜救的图像识别设备以及一种计算机可读存储介质。
背景技术
海上搜救是指国家或者部门针对海上事故等做出的搜寻、救援等工作。
面向我国南海应急搜救等重大需求,针对低纬度区低云、频雨、风浪等复杂条件下,海上目标应急搜救中存在的重点要素信息提取精度低、移动对象检测虚警率高、影像控制稀少等瓶颈问题和技术难点。海上搜救相比于陆地搜救有更多的不可预测性,因此它的难度也更大。由于海面非常辽阔,如果遇难地点不够明确的话,搜救起来范围不断扩大,会增大困难。同时,被搜救人在航空拍摄图像中占像元素少,若按照传统人工筛查图像方式,易造成遗漏且需要大量的时间开支。所以如何提供一种可以应用于海洋搜救的,准确率高的图像识别技术是本领域技术人员急需解决的问题。
发明内容
本发明的目的是提供一种基于海洋搜救的图像识别方法,具有较高的准确率;本发明的另一目的在于提供一种基于海洋搜救的图像识别装置、一种基于海洋搜救的图像识别设备以及一种计算机可读存储介质,具有较高的准确率。
为解决上述技术问题,本发明提供一种基于海洋搜救的图像识别方法,包括:
获取目标海洋区域的目标图像;
调用YOLO模型,将所述目标图像输入所述YOLO模型,以锁定所述目标图像中的待搜救目标;所述YOLO模型包括残差块,所述残差块包括浅层DBL组件,所述浅层DBL组件包括浅层卷积层、批处理规范化层、实例规范化层和激活函数层;所述批处理规范化层和所述实例规范化层均与所述浅层卷积层连接,所述批处理规范化层处理第一通道数的通道,所述实例规范化层处理第二通道数的通道;所述批处理规范化层和所述实例规范化层均与所述激活函数层连接。
可选的,所述YOLO模型为YOLOv3模型。
可选的,所述第一通道数与所述第二通道数相同。
可选的,所述第一通道数等于32,所述第二通道数等于32。
可选的,还包括:
获取原始数据集;
调用Kmeans++聚类模型对所述原始数据集进行聚类,生成对应所述原始数据集的种子点;
根据所述种子点生成锚点框;
根据所述锚点框与所述原始数据集对所述YOLO模型进行训练,生成待使用YOLO模型;
所述调用YOLO模型,将所述目标图像输入所述YOLO模型,以锁定所述目标图像中的待搜救目标包括:
调用所述待使用YOLO模型,将所述目标图像输入所述待使用YOLO模型,以锁定所述目标图像中的待搜救目标。
本发明还提供了一种基于海洋搜救的图像识别装置,包括:
获取模块:用于获取目标海洋区域的目标图像;
锁定模块:用于调用YOLO模型,将所述目标图像输入所述YOLO模型,以锁定所述目标图像中的待搜救目标;所述YOLO模型包括残差块,所述残差块包括浅层DBL组件,所述浅层DBL组件包括浅层卷积层、批处理规范化层、实例规范化层和激活函数层;所述批处理规范化层和所述实例规范化层均与所述浅层卷积层连接,所述批处理规范化层处理第一通道数的通道,所述实例规范化层处理第二通道数的通道;所述批处理规范化层和所述实例规范化层均与所述激活函数层连接。
可选的,所述YOLO模型为YOLOv3模型。
可选的,还包括:
数据集模块:用于获取原始数据集;
聚类模块:用于调用Kmeans++聚类模型对所述原始数据集进行聚类,生成对应所述原始数据集的种子点;
锚点框模块:用于根据所述种子点生成锚点框;
训练模块:用于根据所述锚点框与所述原始数据集对所述YOLO模型进行训练,生成待使用YOLO模型;
所述锁定模块具体用于:
调用所述待使用YOLO模型,将所述目标图像输入所述待使用YOLO模型,以锁定所述目标图像中的待搜救目标。
本发明还提供了一种基于海洋搜救的图像识别设备,所述设备包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序时实现如上述任一项所述基于海洋搜救的图像识别方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述基于海洋搜救的图像识别方法的步骤。
本发明所提供的一种基于海洋搜救的图像识别方法,包括获取目标海洋区域的目标图像;调用YOLO模型,将目标图像输入YOLO模型,以锁定目标图像中的待搜救目标;YOLO模型包括残差块,残差块包括浅层DBL组件,浅层DBL组件包括浅层卷积层、批处理规范化层、实例规范化层和激活函数层;批处理规范化层和实例规范化层均与浅层卷积层连接,批处理规范化层处理第一通道数的通道,实例规范化层处理第二通道数的通道;批处理规范化层和实例规范化层均与激活函数层连接。
在YOLO模型残差块的浅层网络中插入实例规范化层,使得实例规范化层与批处理规范化层均处理部分浅层卷积层的部分通道,可以保证在不影响YOLO模型分类效果的同时,同时保证了表征的多样性和内容信息的学习,从而增强YOLO模型的特征描述能力,进而提高对待搜救目标识别的准确性。
本发明还提供了一种基于海洋搜救的图像识别装置、一种基于海洋搜救的图像识别设备以及一种计算机可读存储介质,同样具有上述有益效果,在此不再进行赘述。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的一种基于海洋搜救的图像识别方法的流程图;
图2为YOLO模型的网络架构图;
图3为现有技术中DBL组件的结构示意图;
图4为现有技术中残差单元的结构示意图;
图5为现有技术中残差块的结构示意图;
图6为本发明实施例所提供的一种残差块的结构示意图;
图7为本发明实施例所提供的一种具体的基于海洋搜救的图像识别方法的流程图;
图8为本发明实施例所提供的一种基于海洋搜救的图像识别装置的结构框图;
图9为本发明实施例所提供的一种基于海洋搜救的图像识别设备的结构框图。
图中:1.浅层DBL组件、2.浅层卷积层、3.实例规范化层、4.批处理规范化层、5.激活函数层。
具体实施方式
本发明的核心是提供一种基于海洋搜救的图像识别方法。在现有技术中,通常是通过人工肉眼筛查各个目标海洋区域的图像。但是人工筛查的效率极低,且容易造成遗漏。
而本发明所提供的一种基于海洋搜救的图像识别方法,包括获取目标海洋区域的目标图像;调用YOLO模型,将目标图像输入YOLO模型,以锁定目标图像中的待搜救目标;YOLO模型包括残差块,残差块包括浅层DBL组件,浅层DBL组件包括浅层卷积层、批处理规范化层、实例规范化层和激活函数层;批处理规范化层和实例规范化层均与浅层卷积层连接,批处理规范化层处理第一通道数的通道,实例规范化层处理第二通道数的通道;批处理规范化层和实例规范化层均与激活函数层连接。
在YOLO模型残差块的浅层网络中插入实例规范化层,使得实例规范化层与批处理规范化层均处理部分浅层卷积层的部分通道,可以保证在不影响YOLO模型分类效果的同时,同时保证了表征的多样性和内容信息的学习,从而增强YOLO模型的特征描述能力,进而提高对待搜救目标识别的准确性。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1至图6,图1为本发明实施例所提供的一种基于海洋搜救的图像识别方法的流程图;图2为YOLO模型的网络架构图;图3为现有技术中DBL组件的结构示意图;图4为现有技术中残差单元的结构示意图;图5为现有技术中残差块的结构示意图;图6为本发明实施例所提供的一种残差块的结构示意图。
参见图1,在本发明实施例中,基于海洋搜救的图像识别方法包括:
S101:获取目标海洋区域的目标图像。
该目标图像即拍摄目标海洋区域的图像,有关目标图像具体获取的方式可以根据实际情况自行设定,在此不做具体限定。
S102:调用YOLO模型,将目标图像输入YOLO模型,以锁定目标图像中的待搜救目标。
在本发明实施例中,所述YOLO模型包括残差块,所述残差块包括浅层DBL组件1,所述浅层DBL组件1包括浅层卷积层2、批处理规范化层4、实例规范化层3和激活函数层5;所述批处理规范化层4和所述实例规范化层3均与所述浅层卷积层2连接,所述批处理规范化层4处理第一通道数的通道,所述实例规范化层3处理第二通道数的通道;所述批处理规范化层4和所述实例规范化层3均与所述激活函数层5连接。
YOLO模型即基于目标检测算法(YOLO算法)所建立的模型,在本发明实施例中通常使用YOLOv3模型作为该YOLO模型,而YOLOv3模型即基于YOLOv3算法所建立的模型,YOLOv3算法为第三代目标检测算法。在现阶段,YOLOv3的实现是基于端到端的思想,仅使用一个模型完成目标框检测及目标分类;同时,为了优化边框的位置,又加入了线性单元,用于调整目标框坐标,从而提高检测的准确率。YOLOv3算法首先需要按照特征图的尺度划分为S*S个网格,如果目标的中心落在某个网格内,则对应的网格负责检测该目标。每个网格预测B个边框,预测的各边框中包含5个预测值:x,y,w,h和置信度score。(x,y)为相对于网格边界的框中心点坐标,(w,h)为相对于整张图片的宽和高的比例,score为预测目标的可信程度。根据所得边框的参数,对目标进行分类;不管预测框B的数量,网络只为各网格预测物体种类。各边框的类别置信度得分为类别i出现在框中的概率,同时也表示这些预测框适合物体的程度。根据各边框的类别置信度得分在整张图片中锁定该类别。
YOLO模型,具体为YOLOv3模型使用了残差模型单元并借鉴了FPN(FeaturePyramid Network)多尺度预测思想,设计了特征金字塔网络架构。主网络Darknet-53的特征提取器包含53个卷积层,其网络架构如图2所示。其中,图2中的Convolutional层为卷积层,其为特征提取必要层,可以提高模型网络对图像的局部感知能力;Residual层为残差块,残差块由DBL组件和残差单元构成,残差块可以使模型网络深度相同条件下,拥有更少的网络参数以及更少的计算复杂度。有关现有技术中DBL组件的结构可以参见图3,有关现有技术中残差单元的结构可以参见图4,有关现有技术中残差块的结构可以参见图5。
其中,DBL组件由二维卷积(con2d层)、BN层、以及激活函数层,通常为非饱和激活函数层(Leaky relu层)构成,DBL组件为标准残差单元中的必备要素。BN(BatchNormalization)层即批处理规范化层,起到了加速网络收敛,提高训练稳定性的作用;Leaky relu层用于拟合任何函数;因此,DBL组件用于实现网络的加深及避免梯度消失及爆炸问题。但该残差结构仍然无法解决因光照强度变化造成的图片色度变化而识别不准确这一问题,无法应对海上搜救时天气变化剧烈的情况。
参见图6,在本发明实施例中,对于YOLO模型内的残差块的结构进行了改进,具体对残差块中的浅层DBL组件1,即残差块中位于最上层的1×1DBL组件进行修改,在该浅层DBL组件1中添加一与批处理规范化层4(BN层)并列的实例规范化层3(IN层),批处理规范化层4所应用的批处理规范化通过减少训练时的内部协变量偏移,可以提高学习率并加快收敛速度。它使用小批量的均值和方差对训练期间的每个特征通道进行归一化;在推理阶段,批处理规范化使用全局统计信息对特征进行归一化。因此,批处理规范化层4可以提高特征对图像内容的敏感度;实例规范化层3所应用的实例规范化使用单个样本的统计信息而不是小批量进行规范化功能。实例规范化可以在保留内容的同时改变图像外观,并且允许从内容中过滤出特定于实例的对比信息,提高对风格类变化的鲁棒性。需要说明的是,在本发明实施例中位于浅层DBL组件1中的卷积层即浅层卷积层2。
针对海洋应急搜救场景中存在的天气变化无常以及高检测准确率的需求,既需要提升特征对图像内容的敏感度,也需要提高对风格类变化的鲁棒性。而在上述浅层DBL组件1中,通过批处理规范化层4处理第一通道数的通道,并通过实例规范化层3处理第二通道数的通道,可以同时保证了表征的多样性和内容信息的学习。并且在本发明实施例中由于仅仅对浅层DBL组件1进行修改,不会因实例规范化层3提取的特征会降低样本间差异这一特点,影响YOLO模型的分类效果;同时保留浅层DBL组件1中的批处理规范化层4,可以保证内容相关信息可以顺利被传入残差块深层。
需要说明的是,在本发明实施例中仅仅对残差块中的浅层DBL组件1,即1×1DBL组件进行修改,并不会对深层DBL组件,即3×3DBL组件进行修改。而浅层卷积层2即浅层DBL组件1中的卷积层,激活函数层5与现有技术中的激活函数层相同。上述批处理规范化层4与实例规范化层3均处理部分浅层卷积层2的通道,且批处理规范化层4处理的通道与实例规范化层3层处理的通道不重叠。
具体的,在本发明实施例中,所述第一通道数与所述第二通道数通常相同。由于在浅层卷积层2的通道数通常为64,则上述第一通道数通常等于32,同理第二通道数通常等于32。当然,在本发明实施例中对于批处理规范化层4处理的通道数,以及实例规范化层3处理的通道数并不做具体限定,视具体情况而定。
本发明实施例所提供的一种基于海洋搜救的图像识别方法,包括获取目标海洋区域的目标图像;调用YOLO模型,将目标图像输入YOLO模型,以锁定目标图像中的待搜救目标;YOLO模型包括残差块,残差块包括浅层DBL组件1,浅层DBL组件1包括浅层卷积层2、批处理规范化层4、实例规范化层3和激活函数层5;批处理规范化层4和实例规范化层3均与浅层卷积层2连接,批处理规范化层4处理第一通道数的通道,实例规范化层3处理第二通道数的通道;批处理规范化层4和实例规范化层3均与激活函数层5连接。
在YOLO模型残差块的浅层网络中插入实例规范化层3,使得实例规范化层3与批处理规范化层4均处理部分浅层卷积层2的部分通道,可以保证在不影响YOLO模型分类效果的同时,同时保证了表征的多样性和内容信息的学习,从而增强YOLO模型的特征描述能力,进而提高对待搜救目标识别的准确性。
有关本发明所提供的一种基于海洋搜救的图像识别方法的具体内容将在下述发明实施例中做详细介绍。
请参考图7,图7为本发明实施例所提供的一种具体的基于海洋搜救的图像识别方法的流程图。
参见图7,在本发明实施例中,基于海洋搜救的图像识别方法包括:
S201:获取原始数据集。
所谓原始数据集即用于对YOLO模型进行训练的数据集,该原始数据集在本申请中通常为一系列海洋区域的图像,部分该图像中通常需要包括不同种类的目标事物,而YOLO模型需要从原始数据集中正确的识别出待搜救目标。
需要说明的是,在本步骤获取到原始数据集之后,通常需要对该袁术数据集进行标定。有关标定的具体内容可以根据实际情况自行设定,在此不做具体限定。
S202:调用Kmeans++聚类模型对原始数据集进行聚类,生成对应原始数据集的种子点。
Kmeans++聚类模型即基于Kmeans++算法所建立的聚类模型,在本步骤中Kmeans++算法具体会通过下述步骤对原始数据集进行聚类,生成对应原始数据集的种子点:
S1.从原始数据集中挑选随机点作为“种子点”,该种子点即聚类中心;
S2.对于每个种子点,计算其和最近的一个“种子点”的距离D(x)并保存在一个数组里,然后把这些距离加起来得到Sum(D(x));
S3.取一个落在Sum(D(x))中的随机值Random,然后用Random-=D(x),直到Random<=0,此时该随机值对应的点就是下一个“种子点”;
S4.重复S2和S3直到K个聚类中心,即种子点被选出来;
S5.遍历所有数据,将每个数据划分到最近的种子点上;
S6.计算每个聚类的平均值,并作为新的种子点;
S7.重复S5和S6直到K个种子点不在变化(达到收敛),或执行了足够多的迭代次数。
有关Kmeans++聚类模型的具体内容可以参考现有技术,在此不再进行赘述。
S203:根据种子点生成锚点框。
在本步骤中,需要根据上述种子点,即聚类中心,生成包含目标尺度特征的锚点框,以在后续步骤中应用到YOLO模型的训练,从而提高目标检测的准确率。
S204:根据锚点框与原始数据集对YOLO模型进行训练,生成待使用YOLO模型。
在本步骤之前,通常需要将标定后的原始数据集分为测试数据集和训练数据集,在本步骤会通过上述生成的锚点框,以及原始数据集对YOLO模型进行训练,以生成YOLO模型中各个参数对应海洋搜救任务所需的权重,并将该权重输入到YOLO模型,生成待使用YOLO模型。
S205:获取目标海洋区域的目标图像。
本步骤与上述发明实施例中S101基本一致,在本步骤中S205与上述S201至S204之间没有先后顺序,其具体操作流程视具体情况而定。
S206:调用待使用YOLO模型,将目标图像输入待使用YOLO模型,以锁定目标图像中的待搜救目标。
本步骤与上述S102基本类似,详细内容请参考上述发明实施例。在本步骤中,具体应用的YOLO模型为上述待使用YOLO模型,即通过Kmeans++聚类模型训练过的YOLO模型。
本发明实施例所提供的一种基于海洋搜救的图像识别方法,通过Kmeans++聚类模型对YOLO模型进行训练,可以明显提升目标检测的准确率。
下面对本发明实施例所提供的一种基于海洋搜救的图像识别装置进行介绍,下文描述的图像识别装置与上文描述的图像识别方法可相互对应参照。
请参考图8,图8为本发明实施例所提供的一种基于海洋搜救的图像识别装置的结构框图。
参见图8,在本发明实施例中,基于海洋搜救的图像识别装置可以包括:
获取模块100:用于获取目标海洋区域的目标图像。
锁定模块200:用于调用YOLO模型,将所述目标图像输入所述YOLO模型,以锁定所述目标图像中的待搜救目标;所述YOLO模型包括残差块,所述残差块包括浅层DBL组件,所述浅层DBL组件包括浅层卷积层、批处理规范化层、实例规范化层和激活函数层;所述批处理规范化层和所述实例规范化层均与所述浅层卷积层连接,所述批处理规范化层处理第一通道数的通道,所述实例规范化层处理第二通道数的通道;所述批处理规范化层和所述实例规范化层均与所述激活函数层连接。
作为优选的,在本发明实施例中,所述YOLO模型为YOLOv3模型。
作为优选的,在本发明实施例中,所述第一通道数与所述第二通道数相同。
作为优选的,在本发明实施例中,所述第一通道数等于32,所述第二通道数等于32。
作为优选的,在本发明实施例中,还包括:
数据集模块:用于获取原始数据集;
聚类模块:用于调用Kmeans++聚类模型对所述原始数据集进行聚类,生成对应所述原始数据集的种子点;
锚点框模块:用于根据所述种子点生成锚点框;
训练模块:用于根据所述锚点框与所述原始数据集对所述YOLO模型进行训练,生成待使用YOLO模型;
所述锁定模块具体用于:
调用所述待使用YOLO模型,将所述目标图像输入所述待使用YOLO模型,以锁定所述目标图像中的待搜救目标。
本实施例的基于海洋搜救的图像识别装置用于实现前述的基于海洋搜救的图像识别方法,因此图像识别装置中的具体实施方式可见前文中图像识别方法的实施例部分,例如,获取模块100,锁定模块200分别用于实现上述基于海洋搜救的图像识别方法中步骤S101以及S102,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
下面对本发明实施例提供的一种基于海洋搜救的图像识别设备进行介绍,下文描述的图像识别设备与上文描述的图像识别方法以及图像识别装置可相互对应参照。
请参考图9,图9为本发明实施例所提供的一种基于海洋搜救的图像识别设备的结构框图。
参照图9,该基于海洋搜救的图像识别设备可以包括处理器11和存储器12。
所述存储器12用于存储计算机程序;所述处理器11用于执行所述计算机程序时实现上述发明实施例中所述的基于海洋搜救的图像识别方法。
本实施例的图像识别设备中处理器11用于安装上述发明实施例中所述的基于海洋搜救的图像识别装置,同时处理器11与存储器12相结合可以实现上述任一发明实施例中所述的基于海洋搜救的图像识别方法。因此图像识别设备中的具体实施方式可见前文中的图像识别方法的实施例部分,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一发明实施例中所介绍的一种基于海洋搜救的图像识别方法。其余内容可以参照现有技术,在此不再进行展开描述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种基于海洋搜救的图像识别方法、一种基于海洋搜救的图像识别装置、一种基于海洋搜救的图像识别设备以及一种计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种基于海洋搜救的图像识别方法,其特征在于,包括:
获取目标海洋区域的目标图像;
调用YOLO模型,将所述目标图像输入所述YOLO模型,以锁定所述目标图像中的待搜救目标;所述YOLO模型包括残差块,所述残差块包括浅层DBL组件,所述浅层DBL组件包括浅层卷积层、批处理规范化层、实例规范化层和激活函数层;所述批处理规范化层和所述实例规范化层均与所述浅层卷积层连接,所述批处理规范化层处理第一通道数的通道,所述实例规范化层处理第二通道数的通道;所述批处理规范化层和所述实例规范化层均与所述激活函数层连接。
2.根据权利要求1所述的方法,其特征在于,所述YOLO模型为YOLOv3模型。
3.根据权利要求2所述的方法,其特征在于,所述第一通道数与所述第二通道数相同。
4.根据权利要求3所述的方法,其特征在于,所述第一通道数等于32,所述第二通道数等于32。
5.根据权利要求1至4任一项权利要求所述的方法,其特征在于,还包括:
获取原始数据集;
调用Kmeans++聚类模型对所述原始数据集进行聚类,生成对应所述原始数据集的种子点;
根据所述种子点生成锚点框;
根据所述锚点框与所述原始数据集对所述YOLO模型进行训练,生成待使用YOLO模型;
所述调用YOLO模型,将所述目标图像输入所述YOLO模型,以锁定所述目标图像中的待搜救目标包括:
调用所述待使用YOLO模型,将所述目标图像输入所述待使用YOLO模型,以锁定所述目标图像中的待搜救目标。
6.一种基于海洋搜救的图像识别装置,其特征在于,包括:
获取模块:用于获取目标海洋区域的目标图像;
锁定模块:用于调用YOLO模型,将所述目标图像输入所述YOLO模型,以锁定所述目标图像中的待搜救目标;所述YOLO模型包括残差块,所述残差块包括浅层DBL组件,所述浅层DBL组件包括浅层卷积层、批处理规范化层、实例规范化层和激活函数层;所述批处理规范化层和所述实例规范化层均与所述浅层卷积层连接,所述批处理规范化层处理第一通道数的通道,所述实例规范化层处理第二通道数的通道;所述批处理规范化层和所述实例规范化层均与所述激活函数层连接。
7.根据权利要求6所述的装置,其特征在于,所述YOLO模型为YOLOv3模型。
8.根据权利要求6或7所述的装置,其特征在于,还包括:
数据集模块:用于获取原始数据集;
聚类模块:用于调用Kmeans++聚类模型对所述原始数据集进行聚类,生成对应所述原始数据集的种子点;
锚点框模块:用于根据所述种子点生成锚点框;
训练模块:用于根据所述锚点框与所述原始数据集对所述YOLO模型进行训练,生成待使用YOLO模型;
所述锁定模块具体用于:
调用所述待使用YOLO模型,将所述目标图像输入所述待使用YOLO模型,以锁定所述目标图像中的待搜救目标。
9.一种基于海洋搜救的图像识别设备,其特征在于,所述设备包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序时实现如权利要求1至5任一项所述基于海洋搜救的图像识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于海洋搜救的图像识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010698211.2A CN111797940A (zh) | 2020-07-20 | 2020-07-20 | 一种基于海洋搜救的图像识别方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010698211.2A CN111797940A (zh) | 2020-07-20 | 2020-07-20 | 一种基于海洋搜救的图像识别方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111797940A true CN111797940A (zh) | 2020-10-20 |
Family
ID=72807070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010698211.2A Pending CN111797940A (zh) | 2020-07-20 | 2020-07-20 | 一种基于海洋搜救的图像识别方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111797940A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113313757A (zh) * | 2021-07-27 | 2021-08-27 | 广州市勤思网络科技有限公司 | 一种基于单目测距的船舱乘客安全预警算法 |
CN114677568A (zh) * | 2022-05-30 | 2022-06-28 | 山东极视角科技有限公司 | 一种基于神经网络的线性目标检测方法、模块及系统 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108805064A (zh) * | 2018-05-31 | 2018-11-13 | 中国农业大学 | 一种基于深度学习的鱼类定位检测和识别方法及系统 |
CN108960015A (zh) * | 2017-05-24 | 2018-12-07 | 优信拍(北京)信息科技有限公司 | 一种基于深度学习的车系自动识别方法及装置 |
CN109255286A (zh) * | 2018-07-21 | 2019-01-22 | 哈尔滨工业大学 | 一种基于yolo深度学习网络框架的无人机光学快速检测识别方法 |
CN109325504A (zh) * | 2018-09-07 | 2019-02-12 | 中国农业大学 | 一种水下海参识别方法及系统 |
CN109685152A (zh) * | 2018-12-29 | 2019-04-26 | 北京化工大学 | 一种基于dc-spp-yolo的图像目标检测方法 |
CN109740534A (zh) * | 2018-12-29 | 2019-05-10 | 北京旷视科技有限公司 | 图像处理方法、装置及处理设备 |
CN109859169A (zh) * | 2019-01-03 | 2019-06-07 | 重庆信息通信研究院 | 一种基于卷积神经网络的tft-lcd模组白印检测方法 |
CN109873990A (zh) * | 2019-03-13 | 2019-06-11 | 武汉大学 | 一种基于计算机视觉的矿山非法开采预警方法 |
CN110348304A (zh) * | 2019-06-06 | 2019-10-18 | 武汉理工大学 | 一种可搭载于无人机的海事遇险人员搜索系统以及目标识别方法 |
CN110516575A (zh) * | 2019-08-19 | 2019-11-29 | 上海交通大学 | 基于残差域富模型的gan生成图片检测方法及系统 |
CN110604597A (zh) * | 2019-09-09 | 2019-12-24 | 李胜利 | 基于超声四腔心切面智能获取胎儿心动周期图像的方法 |
CN111027605A (zh) * | 2019-11-28 | 2020-04-17 | 北京影谱科技股份有限公司 | 基于深度学习的细粒度图像识别方法和装置 |
CN111062429A (zh) * | 2019-12-12 | 2020-04-24 | 上海点泽智能科技有限公司 | 基于深度学习的厨师帽和口罩佩戴的检测方法 |
CN111160312A (zh) * | 2020-01-02 | 2020-05-15 | 重庆紫光华山智安科技有限公司 | 目标识别方法、装置和电子设备 |
CN111383455A (zh) * | 2020-03-11 | 2020-07-07 | 上海眼控科技股份有限公司 | 交通路口对象流量统计方法、装置、计算机设备和介质 |
-
2020
- 2020-07-20 CN CN202010698211.2A patent/CN111797940A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108960015A (zh) * | 2017-05-24 | 2018-12-07 | 优信拍(北京)信息科技有限公司 | 一种基于深度学习的车系自动识别方法及装置 |
CN108805064A (zh) * | 2018-05-31 | 2018-11-13 | 中国农业大学 | 一种基于深度学习的鱼类定位检测和识别方法及系统 |
CN109255286A (zh) * | 2018-07-21 | 2019-01-22 | 哈尔滨工业大学 | 一种基于yolo深度学习网络框架的无人机光学快速检测识别方法 |
CN109325504A (zh) * | 2018-09-07 | 2019-02-12 | 中国农业大学 | 一种水下海参识别方法及系统 |
CN109685152A (zh) * | 2018-12-29 | 2019-04-26 | 北京化工大学 | 一种基于dc-spp-yolo的图像目标检测方法 |
CN109740534A (zh) * | 2018-12-29 | 2019-05-10 | 北京旷视科技有限公司 | 图像处理方法、装置及处理设备 |
CN109859169A (zh) * | 2019-01-03 | 2019-06-07 | 重庆信息通信研究院 | 一种基于卷积神经网络的tft-lcd模组白印检测方法 |
CN109873990A (zh) * | 2019-03-13 | 2019-06-11 | 武汉大学 | 一种基于计算机视觉的矿山非法开采预警方法 |
CN110348304A (zh) * | 2019-06-06 | 2019-10-18 | 武汉理工大学 | 一种可搭载于无人机的海事遇险人员搜索系统以及目标识别方法 |
CN110516575A (zh) * | 2019-08-19 | 2019-11-29 | 上海交通大学 | 基于残差域富模型的gan生成图片检测方法及系统 |
CN110604597A (zh) * | 2019-09-09 | 2019-12-24 | 李胜利 | 基于超声四腔心切面智能获取胎儿心动周期图像的方法 |
CN111027605A (zh) * | 2019-11-28 | 2020-04-17 | 北京影谱科技股份有限公司 | 基于深度学习的细粒度图像识别方法和装置 |
CN111062429A (zh) * | 2019-12-12 | 2020-04-24 | 上海点泽智能科技有限公司 | 基于深度学习的厨师帽和口罩佩戴的检测方法 |
CN111160312A (zh) * | 2020-01-02 | 2020-05-15 | 重庆紫光华山智安科技有限公司 | 目标识别方法、装置和电子设备 |
CN111383455A (zh) * | 2020-03-11 | 2020-07-07 | 上海眼控科技股份有限公司 | 交通路口对象流量统计方法、装置、计算机设备和介质 |
Non-Patent Citations (1)
Title |
---|
XINGANG PAN等: "Two at Once: Enhancing Learning and Generalization Capacities via IBN-Net", ECCV * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113313757A (zh) * | 2021-07-27 | 2021-08-27 | 广州市勤思网络科技有限公司 | 一种基于单目测距的船舱乘客安全预警算法 |
CN114677568A (zh) * | 2022-05-30 | 2022-06-28 | 山东极视角科技有限公司 | 一种基于神经网络的线性目标检测方法、模块及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108460382B (zh) | 基于深度学习单步检测器的光学遥感图像舰船检测方法 | |
CN111860236B (zh) | 一种基于迁移学习的小样本遥感目标检测方法及系统 | |
CN111079739B (zh) | 一种多尺度注意力特征检测方法 | |
CN111914924B (zh) | 一种快速舰船目标检测方法、存储介质及计算设备 | |
CN111401387B (zh) | 异常样本构建方法、装置、计算机设备和存储介质 | |
CN110866926B (zh) | 一种红外遥感图像快速精细海陆分割方法 | |
CN111091095A (zh) | 一种遥感图像中船只目标的检测方法 | |
CN111274964B (zh) | 一种基于无人机视觉显著性分析水面污染物的检测方法 | |
CN114972918B (zh) | 基于集成学习与ais数据的遥感图像舰船目标识别方法 | |
CN115359366A (zh) | 基于参数优化的遥感图像目标检测方法 | |
CN113486819A (zh) | 一种基于YOLOv4算法的船舶目标检测方法 | |
CN111797940A (zh) | 一种基于海洋搜救的图像识别方法及相关装置 | |
CN115272876A (zh) | 一种基于深度学习的遥感图像船舶目标检测方法 | |
CN113487600A (zh) | 一种特征增强尺度自适应感知船舶检测方法 | |
CN116469020A (zh) | 一种基于多尺度和高斯Wasserstein距离的无人机图像目标检测方法 | |
CN110826485B (zh) | 一种遥感影像的目标检测方法及系统 | |
CN114565824B (zh) | 基于全卷积网络的单阶段旋转舰船检测方法 | |
CN112270285A (zh) | 一种基于稀疏表示和胶囊网络的sar图像变化检测方法 | |
CN115082781A (zh) | 一种舰船图像检测方法、装置以及存储介质 | |
CN111209919A (zh) | 一种海上船舶显著性检测方法及系统 | |
CN104881670B (zh) | 一种用于sar方位角估计的快速目标提取方法 | |
CN113988222A (zh) | 一种基于Faster-RCNN的森林火灾检测与识别方法 | |
CN111368865A (zh) | 遥感影像储油罐检测方法、装置、可读存储介质及设备 | |
CN117218545A (zh) | 基于LBP特征与改进Yolov5的雷达图像检测方法 | |
CN107230201B (zh) | 基于样本自标定elm的在轨sar图像变化检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201020 |
|
RJ01 | Rejection of invention patent application after publication |