CN114663769A - 一种基于YOLO v5的水果识别方法 - Google Patents

一种基于YOLO v5的水果识别方法 Download PDF

Info

Publication number
CN114663769A
CN114663769A CN202210362789.XA CN202210362789A CN114663769A CN 114663769 A CN114663769 A CN 114663769A CN 202210362789 A CN202210362789 A CN 202210362789A CN 114663769 A CN114663769 A CN 114663769A
Authority
CN
China
Prior art keywords
module
convolution
model
characteristic
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210362789.XA
Other languages
English (en)
Other versions
CN114663769B (zh
Inventor
郭健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202210362789.XA priority Critical patent/CN114663769B/zh
Publication of CN114663769A publication Critical patent/CN114663769A/zh
Application granted granted Critical
Publication of CN114663769B publication Critical patent/CN114663769B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明涉及一种基于YOLO v5的水果识别方法。本发明将SKnet与残差模块相结合设计新的模块替换YOLO v5中的残差模块,同时使用空洞卷积降低模型复杂度,实现超市中水果的自动识别。本发明对预测框的聚类分析使模型针对水果形状更好的进行预测;改进的YOLOv5特征提取网络,针对市面上大部分水果进行特征提取,针对不同通道,分配不同的特征权重,降低重要特征在传递过程中的损失,提高针对水果的识别率。

Description

一种基于YOLO v5的水果识别方法
技术领域
本发明属于计算机视觉技术领域,涉及一种基于YOLO v5的水果识别方法。
背景技术
目前国内众多超市水果售卖流程复杂且枯燥,需要大量人工成本,并且在人流高峰时期售卖压力很大。同时疫情期间,增大了公共场所人员接触风险,对防疫不利。因此对水果的智能化结算显得十分重要,使用水果智能称结算成为解决方法之一。这要求智能称可以完全代替人眼对水果进行识别,即需要识别出待识别区域的水果种类。
由于水果种类很多,并且每个大类中还有很多小分类,其外观形状相似,这很大程度上增加了水果识别的难度,导致水果种类的识别率降低,且处理速度变慢。目前大多数的水果种类识别方式都是,通过人工称重,并打印条形码标签,贴上标签,最后通过扫描条形码进行识别结算。这很不方便,并且不环保。同时由于是人工识别,长时间并且单调的工作很可能造成疲倦,导致工作的出错率提高。
近年来,随着计算机视觉与目标检测的快速发展,许多的目标检测算法可以很好的完成目标检测任务,目标检测的关键步骤是定位目标,以及目标分类。目前YOLO v5在目标检测领域具有很好的表现。但是在智能称识别中,由于摄像头距离是固定的,水果大小,形状都相对单一,因此对模型对特定通道的关注十分的重要。然而YOLO v5的特征提取,并没有对重要的通道进行重点关注,以及所有卷积操作都采用标准卷积,增加了模型计算量,因此存在很多改进的方面。
发明内容
本发明的目的就是提供一种基于YOLO v5的水果识别方法。将SKnet与残差模块相结合设计新的模块替换YOLO v5中的残差模块,同时使用空洞卷积降低模型复杂度,实现超市中水果的自动识别。
本发明包括以下步骤:
步骤一、水果图像收集:利用相机对超市水果进行视频拍摄,其中每次拍摄单品种水果,方便后续打标等处理。
步骤二、视频采样图片:对拍摄的视频进行间隔采样,获得图片。
步骤三、图像标注以及数据集划分:对获得的图片标注图中物体边界框位置和类别,然后将数据集划分为训练集、验证集、测试集,其比例为8:1:1。
步骤四、图像数据增强:对训练集图像进行预处理,旋转、裁剪,增加训练集图片数量,以提高模型的泛化能力。
步骤五、对真实框聚类分析设计先验框:首先对所有真实框进行划分,严格按照大中小面积划分,其中大目标定义为像素面积大于96*96,中目标定义为像素面积大于32*32并小于96*96,小目标定义为像素面积小于32*32。再分别对大中小真实框进行K-means聚类,得到大中小三个先验框的大小。
K-means聚类包括以下步骤:在数据集中确定聚类数量;随机设定每个聚类的质心向量;为每个数据分配距离最近质心,选用二范数,其计算方法如下:
Figure BDA0003584615290000021
其中(x,y)代表质心的向量,(xi,yi)代表非质心向量,i为整数表示聚类数量。
将该数据分配到所属质心的聚类,直到全部分配完毕;更新质心向量,质心向量值为该聚类的均值;如果质心向量发生变化则重复3、4步骤,否则输出质心。
步骤六、构建模型:YOLO v5网络包括特征提取部分、特征融合部分和预测部分;
对其特征提取部分和特征融合部分进行优化:
特征提取部分包括Focus模块、CBL模块、由CBL模块和残差模块组成的CSP模块、以及SPP模块。Focus模块用于对图像进行切片融合,CBL模块由2D卷积、批量归一化、Leakyrelu组成,CSP由CBL和多个残差块组成,SPP模块由多个多尺度最大池化组成。将SKNet模块嵌入到Focus模块中,形成SKFocus。并将SKNet与残差模块相结合设计新的SK残差模块。
SKFocus为:对输入图片X,分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图F1、F2。将两个特征按元素相加得到特征F。F在经过全局平均池化得到通道统计信息,其计算公式为:
Figure BDA0003584615290000022
其中,H为特征F的高,W为特征F的宽,c为特征F的通道数。
Sc在经过FC+Sigmoid对特征图F1、F2分别生成对应权重向量A,B。然后分别按通道方向做softmax,其公式为:
Figure BDA0003584615290000023
其中c代表通道数,ac和bc分别与特征F1、F2加权相乘,在与原来输入X进行按通道拼接。
SK残差模块为,对输入Y经过两个CBL后输出特征U,该特征U分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图U1、U2。将两个特征按元素相加得到特征U3。U3在经过全局平均池化得到通道统计信息,在经过FC+Sigmoid分别生成权重c2,d2,其中c2+d2=1。将c2和d2分别与特征U1、U2加权相乘按元素相加,然后与原来输入Y按元素相加。
其中空洞卷积为,在标准卷积的基础上增加参数dilated rate,这个参数就是在卷积核中填充dilation rate-1个0,在具体实现时,采用对输入的间隔dilation rate-1采样,从而在实现同样感受野的时候,减小参数量和运算量。
特征融合模块主要采用了FPN+PAN的结构对特征进行融合得到19*19,38*38,76*76的特征图,同时本方法将特征融合模块中卷积核大于等于5*5的卷积操作替换为dilatedrate=2的空洞卷积。将上述得到的特征图输入预测模块进行预测。其中19*19特征图用于大目标的预测,38*38特征图用于中等目标的预测,76*76特征图用于小目标的预测。
步骤七、训练模型并调参优化模型:在训练之前,使用步骤五中得到的先验框输入到模型检测头对目标的位置和类别进行训练,同时使用迁移学习,将已经在大数据集上训练的YOLO v5参数加载到此模型,然后使用经步骤一~步骤四处理的数据集进行训练;每次迭代都计算损失函数,并更新参数值,使损失函数的值最小,直到模型收敛,同时为防止过拟合,迭代次数不超过300次。
步骤八、在完成模型训练后,保存模型权重参数,设置格式为.pt格式。对保存到模型权重文件重新加载,并用这个权重文件检测测试集的图片。
本发明对预测框的聚类分析使模型针对水果形状更好的进行预测;改进的YOLOv5特征提取网络,针对市面上大部分水果进行特征提取,针对不同通道,分配不同的特征权重,降低重要特征在传递过程中的损失,提高针对水果的识别率;同时使用空洞卷积降低模型计算复杂度。
附图说明
图1为拍摄的水果视频;
图2为对视频进行处理采集到的水果图像;
图3为使用labelimg对图像打标;
图4为构建的特征提取与分类模型;
图5为空洞卷积示意图;
图6为训练集的损失函数图;
图7为测试集的测试结果图。
具体实施方式
步骤一、水果图像收集:如图1所示,利用相机对超市每种水果进行视频拍摄得到视频40个,得到水果种类40种。
步骤二、视频采样图片:如图2所示,使用OpenCV对拍摄的视频进行间隔采样,每类250张共获得图片10000张。
步骤三、图像标注以及数据集划分:如图3所示,使用labelimg对获得的图片进行标注物体边界框位置和类别,然后将数据集划分为训练集、验证集、测试集,其比例为8:1:1。
步骤四、图像数据增强:使用torchvision对训练集图像进行预处理,旋转、裁剪,增加训练集图片数量,以提高模型的泛化能力。
步骤五、对真实框聚类分析设计先验框。与原模型直接采用K-means算法不同,首先对所有真实框进行划分,严格按照大中小面积划分,其中大目标定义为像素面积大于96*96,中目标定义为像素面积大于32*32并小于96*96,小目标定义为像素面积小于32*32。在分别对大中小真实框进行K-means聚类,得到大中小类别分别三个先验框的大小。
其中K-means聚类包括以下步骤:在数据集中确定聚类数量i,本实施中聚类数量i为3;随机设定每个聚类的质心向量;为每个数据分配距离最近质心,选用二范数,其计算方法如下:
Figure BDA0003584615290000031
其中(x,y)代表质心的向量,(xi,yi)代表非质心向量。
将该数据分配到所属质心的聚类,直到全部分配完毕;更新质心向量,质心向量值为该聚类的均值;如果质心向量发生变化则重复步骤三、步骤四,否则输出质心。
步骤六、构建模型:YOLO v5网络包括特征提取部分、特征融合部分和预测部分,对其特征提取部分进行优化;
如图4所示,YOLO v5的特征提取部分包括Focus模块、CBL模块、CSP模块以及SPP模块。其中Focus模块用于对图像进行切片融合,CBL模块包括2D卷积、批量归一化和Leakyrelu,CSP模块包括CBL模块和多个残差块组成,SPP模块包括多个多尺度最大池化。将SKNet模块嵌入到Focus模块中,形成SKFocus,并将SKNet与残差模块相结合设计出SKResNet模块。
其中SKFocus为:对输入图片X,分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图F1、F2,将两个特征按元素相加得到特征F。F在经过全局平均池化得到通道统计信息,其计算公式为:
Figure BDA0003584615290000041
其中,H为特征F的高,W为特征F的宽c为特征F的通道数。
Sc在经过FC+Sigmoid对特征图F1、F2分别生成对应权重向量A,B。然后分别按通道方向做softmax,其公式为:
Figure BDA0003584615290000042
其中c代表通道数,ac和bc分别与特征F1、F2加权相乘,在与原来输入X进行按通道拼接。
其中SKResNet模块为:对输入Y经过两个CBL模块后输出特征U,该特征U分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图U1、U2;将两个特征按元素相加得到特征U3。U3在经过全局平均池化得到通道统计信息,在经过FC+Sigmoid分别生成权重c2,d2,其中c2+d2=1。将c2和d2分别与特征U1、U2加权相乘按元素相加,再与原来输入Y按元素相加。
空洞卷积为:在标准卷积的基础上增加参数dilated rate(在卷积核中填充dilation rate-1个0),在具体实现时,采用对输入的间隔dilation rate-1采样,从而在实现同样感受野的时候,减小参数量和运算量。如图5所示,本实施例中设置dilated rate为2。
特征融合模块采用了FPN+PAN的结构对特征进行融合得到19*19,38*38,76*76的特征图,同时本方法将特征融合模块中卷积核大于等于5*5的卷积操作替换为dilatedrate=2的空洞卷积。将上述得到的特征图输入预测模块进行预测。其中19*19特征图用于大目标的预测,38*38特征图用于中等目标的预测,76*76特征图用于小目标的预测。
步骤七、训练模型并调参优化模型:在训练之前,使用步骤五中得到的先验框输入到模型检测头对目标的位置和类别进行训练,同时使用迁移学习,将已经在大数据集上训练的YOLO v5参数加载到此模型,然后使用经步骤一~步骤四处理的数据集进行训练。每次迭代都计算损失函数,并更新参数值,使损失函数的值最小,直到模型收敛,同时为防止过拟合,如图6所以,迭代次数不超过300次。
步骤八、在完成模型训练后,保存模型权重参数,设置格式为.pt格式。对保存到模型权重文件重新加载,并用这个权重文件检测测试集的图片,查看如图7所示的实际效果。

Claims (1)

1.一种基于YOLO v5的水果识别方法,其特征在于:具体包括如下步骤:
步骤一、水果图像收集:利用相机对超市水果进行视频拍摄;
步骤二、视频采样图片:对拍摄的视频进行间隔采样,获得图片;
步骤三、图像标注以及数据集划分:对获得的图片标注图中物体边界框位置和类别,然后将数据集划分为训练集、验证集、测试集;
步骤四、图像数据增强:对训练集图像进行预处理,旋转、裁剪,增加训练集图片数量;
步骤五、对真实框聚类分析设计先验框:首先对所有真实框进行划分,严格按照大中小面积划分,其中大目标定义为像素面积大于96*96,中目标定义为像素面积大于32*32并小于96*96,小目标定义为像素面积小于32*32,再分别对大中小真实框进行K-means聚类,得到大中小三个先验框的大小;
K-means聚类包括以下步骤:在数据集中确定聚类数量;随机设定每个聚类的质心向量;为每个数据分配距离最近质心,选用二范数,其计算方法如下:
Figure FDA0003584615280000011
其中(x,y)代表质心的向量,(xi,yi)代表非质心向量,i为整数表示聚类数量;
将该数据分配到所属质心的聚类,直到全部分配完毕;更新质心向量,质心向量值为该聚类的均值;如果质心向量发生变化则重复步骤三、步骤四,否则输出质心;
步骤六、构建模型:YOLO v5网络包括特征提取部分、特征融合部分和预测部分,对其特征提取部分和特征融合部分进行优化;
YOLO v5的特征提取部分包括Focus模块、CBL模块、由CBL模块和残差模块组成的CSP模块、以及SPP模块;Focus模块用于对图像进行切片融合,CBL模块由2D卷积、批量归一化、Leaky relu组成,CSP由CBL和多个残差块组成,SPP模块由多个多尺度最大池化组成;将SKNet模块嵌入到Focus模块中,形成SKFocus;并将SKNet与残差模块相结合设计新的SK残差模块;
SKFocus为:对输入图片X,分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图F1、F2;将两个特征按元素相加得到特征F;F在经过全局平均池化得到通道统计信息,其计算公式为:
Figure FDA0003584615280000012
其中,H为特征F的高,W为特征F的宽,c为特征F的通道数;
Sc在经过FC+Sigmoid对特征图F1、F2分别生成对应权重向量A,B;然后分别按通道方向做softmax,其公式为:
Figure FDA0003584615280000013
其中c代表通道数,ac和bc分别与特征F1、F2加权相乘,在与原来输入X进行按通道拼接;
SK残差模块为,对输入Y经过两个CBL后输出特征U,该特征U分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图U1、U2;将两个特征按元素相加得到特征U3;U3在经过全局平均池化得到通道统计信息,在经过FC+Sigmoid分别生成权重a2,b2,其中a2+b2=1;将a2和b2分别与特征U1、U2加权相乘按元素相加,然后与原来输入Y按元素相加;
其中空洞卷积为,在标准卷积的基础上增加参数dilated rate,这个参数就是在卷积核中填充dilation rate-1个0,在具体实现时,采用对输入的间隔dilation rate-1采样,从而在实现同样感受野的时候,减小参数量和运算量;
特征融合模块采用了FPN+PAN的结构对特征进行融合得到19*19,38*38,76*76的特征图,同时本方法将特征融合模块中卷积核大于等于5*5的卷积操作替换为dilated rate=2的空洞卷积;
将上述得到的特征图输入预测模块进行预测;其中19*19特征图用于大目标的预测,38*38特征图用于中等目标的预测,76*76特征图用于小目标的预测;
步骤七、训练模型并调参优化模型:在训练之前,使用步骤五中得到的先验框输入到模型检测头对目标的位置和类别进行训练,同时使用迁移学习,将已经在大数据集上训练的YOLO v5参数加载到此模型,然后使用经步骤一~步骤四处理的数据集进行训练;每次迭代都计算损失函数,并更新参数值,使损失函数的值最小,直到模型收敛,同时为防止过拟合,迭代次数不超过300次;
步骤八、在完成模型训练后,保存模型权重参数,设置格式为.pt格式;对保存到模型权重文件重新加载,并用这个权重文件检测测试集的图片。
CN202210362789.XA 2022-04-07 2022-04-07 一种基于YOLO v5的水果识别方法 Active CN114663769B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210362789.XA CN114663769B (zh) 2022-04-07 2022-04-07 一种基于YOLO v5的水果识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210362789.XA CN114663769B (zh) 2022-04-07 2022-04-07 一种基于YOLO v5的水果识别方法

Publications (2)

Publication Number Publication Date
CN114663769A true CN114663769A (zh) 2022-06-24
CN114663769B CN114663769B (zh) 2023-04-18

Family

ID=82035788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210362789.XA Active CN114663769B (zh) 2022-04-07 2022-04-07 一种基于YOLO v5的水果识别方法

Country Status (1)

Country Link
CN (1) CN114663769B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116530438A (zh) * 2023-07-04 2023-08-04 华南农业大学 一种笼养种蛋鸭个体产蛋性能巡检测定装置、方法和系统
CN117649609A (zh) * 2024-01-30 2024-03-05 中国人民解放军海军航空大学 面向跨时空尺度域的遥感图像建筑物信息提取方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021155230A1 (en) * 2020-01-31 2021-08-05 James R. Glidewell Dental Ceramics, Inc. Teeth segmentation using neural networks
CN113627240A (zh) * 2021-06-29 2021-11-09 南京邮电大学 一种基于改进ssd学习模型的无人机树木种类识别方法
CN113688948A (zh) * 2021-10-11 2021-11-23 中核检修有限公司 一种基于YOLO v5的附着海生物种类识别方法
CN113762209A (zh) * 2021-09-22 2021-12-07 重庆邮电大学 一种基于yolo的多尺度并行特征融合路标检测方法
WO2021244079A1 (zh) * 2020-06-02 2021-12-09 苏州科技大学 智能家居环境中图像目标检测方法
CN113902729A (zh) * 2021-10-26 2022-01-07 重庆邮电大学 一种基于YOLO v5模型的路面坑洼检测方法
CN113947108A (zh) * 2021-10-15 2022-01-18 福州大学 一种基于yolo v5的球员追踪检测方法
CN114120037A (zh) * 2021-11-25 2022-03-01 中国农业科学院农业信息研究所 一种基于改进yolov5模型的发芽马铃薯图像识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021155230A1 (en) * 2020-01-31 2021-08-05 James R. Glidewell Dental Ceramics, Inc. Teeth segmentation using neural networks
WO2021244079A1 (zh) * 2020-06-02 2021-12-09 苏州科技大学 智能家居环境中图像目标检测方法
CN113627240A (zh) * 2021-06-29 2021-11-09 南京邮电大学 一种基于改进ssd学习模型的无人机树木种类识别方法
CN113762209A (zh) * 2021-09-22 2021-12-07 重庆邮电大学 一种基于yolo的多尺度并行特征融合路标检测方法
CN113688948A (zh) * 2021-10-11 2021-11-23 中核检修有限公司 一种基于YOLO v5的附着海生物种类识别方法
CN113947108A (zh) * 2021-10-15 2022-01-18 福州大学 一种基于yolo v5的球员追踪检测方法
CN113902729A (zh) * 2021-10-26 2022-01-07 重庆邮电大学 一种基于YOLO v5模型的路面坑洼检测方法
CN114120037A (zh) * 2021-11-25 2022-03-01 中国农业科学院农业信息研究所 一种基于改进yolov5模型的发芽马铃薯图像识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
张为;魏晶晶;: "嵌入DenseNet结构和空洞卷积模块的改进YOLO v3火灾检测算法" *
李佳禧;邱东;杨宏韬;刘克平;: "基于改进的YOLO v3的工件识别方法研究" *
谌贵辉;易欣;李忠兵;钱济人;陈伍;: "基于改进YOLOv2和迁移学习的管道巡检航拍图像第三方施工目标检测" *
赵琼;李宝清;李唐薇;: "基于改进YOLO v3的目标检测算法" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116530438A (zh) * 2023-07-04 2023-08-04 华南农业大学 一种笼养种蛋鸭个体产蛋性能巡检测定装置、方法和系统
CN116530438B (zh) * 2023-07-04 2023-10-13 华南农业大学 一种笼养种蛋鸭个体产蛋性能巡检测定装置、方法和系统
CN117649609A (zh) * 2024-01-30 2024-03-05 中国人民解放军海军航空大学 面向跨时空尺度域的遥感图像建筑物信息提取方法
CN117649609B (zh) * 2024-01-30 2024-04-30 中国人民解放军海军航空大学 面向跨时空尺度域的遥感图像建筑物信息提取方法

Also Published As

Publication number Publication date
CN114663769B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN111310862B (zh) 复杂环境下基于图像增强的深度神经网络车牌定位方法
CN108416266B (zh) 一种利用光流提取运动目标的视频行为快速识别方法
CN114663769B (zh) 一种基于YOLO v5的水果识别方法
CN109711366B (zh) 一种基于群组信息损失函数的行人重识别方法
CN109766873B (zh) 一种混合可变形卷积的行人再识别方法
CN111680705B (zh) 适于目标检测的mb-ssd方法和mb-ssd特征提取网络
CN115661943B (zh) 一种基于轻量级姿态评估网络的跌倒检测方法
CN112926652B (zh) 一种基于深度学习的鱼类细粒度图像识别方法
CN114463218B (zh) 一种基于事件数据驱动的视频去模糊方法
CN110827312A (zh) 一种基于协同视觉注意力神经网络的学习方法
CN110991444A (zh) 面向复杂场景的车牌识别方法及装置
CN114943893B (zh) 一种土地覆盖分类的特征增强方法
CN111666852A (zh) 一种基于卷积神经网络的微表情双流网络识别方法
CN111507183A (zh) 一种基于多尺度密度图融合空洞卷积的人群计数方法
CN113159300A (zh) 图像检测神经网络模型及其训练方法、图像检测方法
CN114266757A (zh) 一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法
CN113139489A (zh) 基于背景提取和多尺度融合网络的人群计数方法及系统
CN116052212A (zh) 一种基于双重自监督学习的半监督跨模态行人重识别方法
CN115049945A (zh) 一种基于无人机图像的小麦倒伏面积提取方法和装置
Li et al. A self-attention feature fusion model for rice pest detection
CN111339950B (zh) 一种遥感图像目标检测方法
CN111401209B (zh) 一种基于深度学习的动作识别方法
CN112836748A (zh) 一种基于crnn-ctc的铸件标识字符识别方法
CN112308087A (zh) 基于动态视觉传感器的一体化成像识别系统和方法
CN112149528A (zh) 一种全景图目标检测方法、系统、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant