CN114663769B - 一种基于YOLO v5的水果识别方法 - Google Patents
一种基于YOLO v5的水果识别方法 Download PDFInfo
- Publication number
- CN114663769B CN114663769B CN202210362789.XA CN202210362789A CN114663769B CN 114663769 B CN114663769 B CN 114663769B CN 202210362789 A CN202210362789 A CN 202210362789A CN 114663769 B CN114663769 B CN 114663769B
- Authority
- CN
- China
- Prior art keywords
- module
- convolution
- model
- characteristic
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于YOLO v5的水果识别方法。本发明将SKnet与残差模块相结合设计新的模块替换YOLO v5中的残差模块,同时使用空洞卷积降低模型复杂度,实现超市中水果的自动识别。本发明对预测框的聚类分析使模型针对水果形状更好的进行预测;改进的YOLOv5特征提取网络,针对市面上大部分水果进行特征提取,针对不同通道,分配不同的特征权重,降低重要特征在传递过程中的损失,提高针对水果的识别率。
Description
技术领域
本发明属于计算机视觉技术领域,涉及一种基于YOLO v5的水果识别方法。
背景技术
目前国内众多超市水果售卖流程复杂且枯燥,需要大量人工成本,并且在人流高峰时期售卖压力很大。同时疫情期间,增大了公共场所人员接触风险,对防疫不利。因此对水果的智能化结算显得十分重要,使用水果智能称结算成为解决方法之一。这要求智能称可以完全代替人眼对水果进行识别,即需要识别出待识别区域的水果种类。
由于水果种类很多,并且每个大类中还有很多小分类,其外观形状相似,这很大程度上增加了水果识别的难度,导致水果种类的识别率降低,且处理速度变慢。目前大多数的水果种类识别方式都是,通过人工称重,并打印条形码标签,贴上标签,最后通过扫描条形码进行识别结算。这很不方便,并且不环保。同时由于是人工识别,长时间并且单调的工作很可能造成疲倦,导致工作的出错率提高。
近年来,随着计算机视觉与目标检测的快速发展,许多的目标检测算法可以很好的完成目标检测任务,目标检测的关键步骤是定位目标,以及目标分类。目前YOLO v5在目标检测领域具有很好的表现。但是在智能称识别中,由于摄像头距离是固定的,水果大小,形状都相对单一,因此对模型对特定通道的关注十分的重要。然而YOLO v5的特征提取,并没有对重要的通道进行重点关注,以及所有卷积操作都采用标准卷积,增加了模型计算量,因此存在很多改进的方面。
发明内容
本发明的目的就是提供一种基于YOLO v5的水果识别方法。将SKnet与残差模块相结合设计新的模块替换YOLO v5中的残差模块,同时使用空洞卷积降低模型复杂度,实现超市中水果的自动识别。
本发明包括以下步骤:
步骤一、水果图像收集:利用相机对超市水果进行视频拍摄,其中每次拍摄单品种水果,方便后续打标等处理。
步骤二、视频采样图片:对拍摄的视频进行间隔采样,获得图片。
步骤三、图像标注以及数据集划分:对获得的图片标注图中物体边界框位置和类别,然后将数据集划分为训练集、验证集、测试集,其比例为8:1:1。
步骤四、图像数据增强:对训练集图像进行预处理,旋转、裁剪,增加训练集图片数量,以提高模型的泛化能力。
步骤五、对真实框聚类分析设计先验框:首先对所有真实框进行划分,严格按照大中小面积划分,其中大目标定义为像素面积大于96*96,中目标定义为像素面积大于32*32并小于96*96,小目标定义为像素面积小于32*32。再分别对大中小真实框进行K-means聚类,得到大中小三个先验框的大小。
K-means聚类包括以下步骤:在数据集中确定聚类数量;随机设定每个聚类的质心向量;为每个数据分配距离最近质心,选用二范数,其计算方法如下:
其中(x,y)代表质心的向量,(xi,yi)代表非质心向量,i为整数表示聚类数量。
将该数据分配到所属质心的聚类,直到全部分配完毕;更新质心向量,质心向量值为该聚类的均值;如果质心向量发生变化则重复3、4步骤,否则输出质心。
步骤六、构建模型:YOLO v5网络包括特征提取部分、特征融合部分和预测部分;
对其特征提取部分和特征融合部分进行优化:
特征提取部分包括Focus模块、CBL模块、由CBL模块和残差模块组成的CSP模块、以及SPP模块。Focus模块用于对图像进行切片融合,CBL模块由2D卷积、批量归一化、Leakyrelu组成,CSP由CBL和多个残差块组成,SPP模块由多个多尺度最大池化组成。将SKNet模块嵌入到Focus模块中,形成SKFocus。并将SKNet与残差模块相结合设计新的SK残差模块。
SKFocus为:对输入图片X,分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图F1、F2。将两个特征按元素相加得到特征F。F在经过全局平均池化得到通道统计信息,其计算公式为:
其中,H为特征F的高,W为特征F的宽,c为特征F的通道数。
Sc在经过FC+Sigmoid对特征图F1、F2分别生成对应权重向量A,B。然后分别按通道方向做softmax,其公式为:
其中c代表通道数,ac和bc分别与特征F1、F2加权相乘,在与原来输入X进行按通道拼接。
SK残差模块为,对输入Y经过两个CBL后输出特征U,该特征U分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图U1、U2。将两个特征按元素相加得到特征U3。U3在经过全局平均池化得到通道统计信息,在经过FC+Sigmoid分别生成权重c2,d2,其中c2+d2=1。将c2和d2分别与特征U1、U2加权相乘按元素相加,然后与原来输入Y按元素相加。
其中空洞卷积为,在标准卷积的基础上增加参数dilated rate,这个参数就是在卷积核中填充dilation rate-1个0,在具体实现时,采用对输入的间隔dilation rate-1采样,从而在实现同样感受野的时候,减小参数量和运算量。
特征融合模块主要采用了FPN+PAN的结构对特征进行融合得到19*19,38*38,76*76的特征图,同时本方法将特征融合模块中卷积核大于等于5*5的卷积操作替换为dilatedrate=2的空洞卷积。将上述得到的特征图输入预测模块进行预测。其中19*19特征图用于大目标的预测,38*38特征图用于中等目标的预测,76*76特征图用于小目标的预测。
步骤七、训练模型并调参优化模型:在训练之前,使用步骤五中得到的先验框输入到模型检测头对目标的位置和类别进行训练,同时使用迁移学习,将已经在大数据集上训练的YOLO v5参数加载到此模型,然后使用经步骤一~步骤四处理的数据集进行训练;每次迭代都计算损失函数,并更新参数值,使损失函数的值最小,直到模型收敛,同时为防止过拟合,迭代次数不超过300次。
步骤八、在完成模型训练后,保存模型权重参数,设置格式为.pt格式。对保存到模型权重文件重新加载,并用这个权重文件检测测试集的图片。
本发明对预测框的聚类分析使模型针对水果形状更好的进行预测;改进的YOLOv5特征提取网络,针对市面上大部分水果进行特征提取,针对不同通道,分配不同的特征权重,降低重要特征在传递过程中的损失,提高针对水果的识别率;同时使用空洞卷积降低模型计算复杂度。
附图说明
图1为拍摄的水果视频;
图2为对视频进行处理采集到的水果图像;
图3为使用labelimg对图像打标;
图4为构建的特征提取与分类模型;
图5为空洞卷积示意图;
图6为训练集的损失函数图;
图7为测试集的测试结果图。
具体实施方式
步骤一、水果图像收集:如图1所示,利用相机对超市每种水果进行视频拍摄得到视频40个,得到水果种类40种。
步骤二、视频采样图片:如图2所示,使用OpenCV对拍摄的视频进行间隔采样,每类250张共获得图片10000张。
步骤三、图像标注以及数据集划分:如图3所示,使用labelimg对获得的图片进行标注物体边界框位置和类别,然后将数据集划分为训练集、验证集、测试集,其比例为8:1:1。
步骤四、图像数据增强:使用torchvision对训练集图像进行预处理,旋转、裁剪,增加训练集图片数量,以提高模型的泛化能力。
步骤五、对真实框聚类分析设计先验框。与原模型直接采用K-means算法不同,首先对所有真实框进行划分,严格按照大中小面积划分,其中大目标定义为像素面积大于96*96,中目标定义为像素面积大于32*32并小于96*96,小目标定义为像素面积小于32*32。在分别对大中小真实框进行K-means聚类,得到大中小类别分别三个先验框的大小。
其中K-means聚类包括以下步骤:在数据集中确定聚类数量i,本实施中聚类数量i为3;随机设定每个聚类的质心向量;为每个数据分配距离最近质心,选用二范数,其计算方法如下:
其中(x,y)代表质心的向量,(xi,yi)代表非质心向量。
将该数据分配到所属质心的聚类,直到全部分配完毕;更新质心向量,质心向量值为该聚类的均值;如果质心向量发生变化则重复步骤三、步骤四,否则输出质心。
步骤六、构建模型:YOLO v5网络包括特征提取部分、特征融合部分和预测部分,对其特征提取部分进行优化;
如图4所示,YOLO v5的特征提取部分包括Focus模块、CBL模块、CSP模块以及SPP模块。其中Focus模块用于对图像进行切片融合,CBL模块包括2D卷积、批量归一化和Leakyrelu,CSP模块包括CBL模块和多个残差块组成,SPP模块包括多个多尺度最大池化。将SKNet模块嵌入到Focus模块中,形成SKFocus,并将SKNet与残差模块相结合设计出SKResNet模块。
其中SKFocus为:对输入图片X,分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图F1、F2,将两个特征按元素相加得到特征F。F在经过全局平均池化得到通道统计信息,其计算公式为:
其中,H为特征F的高,W为特征F的宽c为特征F的通道数。
Sc在经过FC+Sigmoid对特征图F1、F2分别生成对应权重向量A,B。然后分别按通道方向做softmax,其公式为:
其中c代表通道数,ac和bc分别与特征F1、F2加权相乘,在与原来输入X进行按通道拼接。
其中SKResNet模块为:对输入Y经过两个CBL模块后输出特征U,该特征U分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图U1、U2;将两个特征按元素相加得到特征U3。U3在经过全局平均池化得到通道统计信息,在经过FC+Sigmoid分别生成权重c2,d2,其中c2+d2=1。将c2和d2分别与特征U1、U2加权相乘按元素相加,再与原来输入Y按元素相加。
空洞卷积为:在标准卷积的基础上增加参数dilated rate(在卷积核中填充dilation rate-1个0),在具体实现时,采用对输入的间隔dilation rate-1采样,从而在实现同样感受野的时候,减小参数量和运算量。如图5所示,本实施例中设置dilated rate为2。
特征融合模块采用了FPN+PAN的结构对特征进行融合得到19*19,38*38,76*76的特征图,同时本方法将特征融合模块中卷积核大于等于5*5的卷积操作替换为dilatedrate=2的空洞卷积。将上述得到的特征图输入预测模块进行预测。其中19*19特征图用于大目标的预测,38*38特征图用于中等目标的预测,76*76特征图用于小目标的预测。
步骤七、训练模型并调参优化模型:在训练之前,使用步骤五中得到的先验框输入到模型检测头对目标的位置和类别进行训练,同时使用迁移学习,将已经在大数据集上训练的YOLO v5参数加载到此模型,然后使用经步骤一~步骤四处理的数据集进行训练。每次迭代都计算损失函数,并更新参数值,使损失函数的值最小,直到模型收敛,同时为防止过拟合,如图6所以,迭代次数不超过300次。
步骤八、在完成模型训练后,保存模型权重参数,设置格式为.pt格式。对保存到模型权重文件重新加载,并用这个权重文件检测测试集的图片,查看如图7所示的实际效果。
Claims (1)
1.一种基于YOLO v5的水果识别方法,其特征在于:具体包括如下步骤:
步骤一、水果图像收集:利用相机对超市水果进行视频拍摄;
步骤二、视频采样图片:对拍摄的视频进行间隔采样,获得图片;
步骤三、图像标注以及数据集划分:对获得的图片标注图中物体边界框位置和类别,然后将数据集划分为训练集、验证集、测试集;
步骤四、图像数据增强:对训练集图像进行预处理,旋转、裁剪,增加训练集图片数量;
步骤五、对真实框聚类分析设计先验框:首先对所有真实框进行划分,严格按照大中小面积划分,其中大目标定义为像素面积大于96*96,中目标定义为像素面积大于32*32并小于96*96,小目标定义为像素面积小于32*32,再分别对大中小真实框进行K-means聚类,得到大中小三个先验框的大小;
K-means聚类包括以下步骤:在数据集中确定聚类数量;随机设定每个聚类的质心向量;为每个数据分配距离最近质心,选用二范数,其计算方法如下:
其中(x,y)代表质心的向量,(xi,yi)代表非质心向量,i为整数表示聚类数量;
将该数据分配到所属质心的聚类,直到全部分配完毕;更新质心向量,质心向量值为该聚类的均值;如果质心向量发生变化则重复步骤三、步骤四,否则输出质心;
步骤六、构建模型:YOLO v5网络包括特征提取部分、特征融合部分和预测部分,对其特征提取部分和特征融合部分进行优化;
YOLO v5的特征提取部分包括Focus模块、CBL模块、由CBL模块和残差模块组成的CSP模块、以及SPP模块;Focus模块用于对图像进行切片融合,CBL模块由2D卷积、批量归一化、Leaky relu组成,CSP由CBL和多个残差块组成,SPP模块由多个多尺度最大池化组成;将SKNet模块嵌入到Focus模块中,形成SKFocus;并将SKNet与残差模块相结合设计新的SK残差模块;
SKFocus为:对输入图片X,分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图F1、F2;将两个特征按元素相加得到特征F;F在经过全局平均池化得到通道统计信息,其计算公式为:
其中,H为特征F的高,W为特征F的宽,C为特征F的通道数;
SC在经过FC+Sigmoid对特征图F1、F2分别生成对应权重向量A,B;然后分别按通道方向做softmax,其公式为:
其中c代表通道数,aC和bC分别与特征F1、F2加权相乘,在与原来输入图片X进行按通道拼接;
SK残差模块为,对输入Y经过两个CBL后输出特征U,该特征U分别使用卷积核大小为3*3卷积操作,卷积核为5*5的空洞卷积,得到特征图U1、U2;将两个特征按元素相加得到特征U3;U3在经过全局平均池化得到通道统计信息,在经过FC+Sigmoid分别生成权重a2,b2,其中a2+b2=1;将a2和b2分别与特征U1、U2加权相乘按元素相加,然后与原来输入Y按元素相加;
其中空洞卷积为,在标准卷积的基础上增加参数dilated rate,这个参数就是在卷积核中填充dilation rate-1个0,在具体实现时,对输入的特征间隔dilation rate-1采样;
特征融合模块采用了FPN+PAN的结构对特征进行融合得到19*19,38*38,76*76的特征图,同时本方法将特征融合模块中卷积核大于等于5*5的卷积操作替换为dilated rate=2的空洞卷积;
将上述得到的特征图输入预测模块进行预测;其中19*19特征图用于大目标的预测,38*38特征图用于中等目标的预测,76*76特征图用于小目标的预测;
步骤七、训练模型并调参优化模型:在训练之前,使用步骤五中得到的先验框输入到模型检测头对目标的位置和类别进行训练,同时使用迁移学习,将已经在大数据集上训练的YOLO v5参数加载到此模型,然后使用经步骤一~步骤四处理的数据集进行训练;每次迭代都计算损失函数,并更新参数值,使损失函数的值最小,直到模型收敛,同时为防止过拟合,迭代次数不超过300次;
步骤八、在完成模型训练后,保存模型权重参数,设置格式为.pt格式;对保存到模型权重文件重新加载,并用这个权重文件检测测试集的图片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210362789.XA CN114663769B (zh) | 2022-04-07 | 2022-04-07 | 一种基于YOLO v5的水果识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210362789.XA CN114663769B (zh) | 2022-04-07 | 2022-04-07 | 一种基于YOLO v5的水果识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114663769A CN114663769A (zh) | 2022-06-24 |
CN114663769B true CN114663769B (zh) | 2023-04-18 |
Family
ID=82035788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210362789.XA Active CN114663769B (zh) | 2022-04-07 | 2022-04-07 | 一种基于YOLO v5的水果识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114663769B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116530438B (zh) * | 2023-07-04 | 2023-10-13 | 华南农业大学 | 一种笼养种蛋鸭个体产蛋性能巡检测定装置、方法和系统 |
CN117649609B (zh) * | 2024-01-30 | 2024-04-30 | 中国人民解放军海军航空大学 | 面向跨时空尺度域的遥感图像建筑物信息提取方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021155230A1 (en) * | 2020-01-31 | 2021-08-05 | James R. Glidewell Dental Ceramics, Inc. | Teeth segmentation using neural networks |
CN113627240A (zh) * | 2021-06-29 | 2021-11-09 | 南京邮电大学 | 一种基于改进ssd学习模型的无人机树木种类识别方法 |
CN113688948A (zh) * | 2021-10-11 | 2021-11-23 | 中核检修有限公司 | 一种基于YOLO v5的附着海生物种类识别方法 |
CN113762209A (zh) * | 2021-09-22 | 2021-12-07 | 重庆邮电大学 | 一种基于yolo的多尺度并行特征融合路标检测方法 |
WO2021244079A1 (zh) * | 2020-06-02 | 2021-12-09 | 苏州科技大学 | 智能家居环境中图像目标检测方法 |
CN113902729A (zh) * | 2021-10-26 | 2022-01-07 | 重庆邮电大学 | 一种基于YOLO v5模型的路面坑洼检测方法 |
CN113947108A (zh) * | 2021-10-15 | 2022-01-18 | 福州大学 | 一种基于yolo v5的球员追踪检测方法 |
CN114120037A (zh) * | 2021-11-25 | 2022-03-01 | 中国农业科学院农业信息研究所 | 一种基于改进yolov5模型的发芽马铃薯图像识别方法 |
-
2022
- 2022-04-07 CN CN202210362789.XA patent/CN114663769B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021155230A1 (en) * | 2020-01-31 | 2021-08-05 | James R. Glidewell Dental Ceramics, Inc. | Teeth segmentation using neural networks |
WO2021244079A1 (zh) * | 2020-06-02 | 2021-12-09 | 苏州科技大学 | 智能家居环境中图像目标检测方法 |
CN113627240A (zh) * | 2021-06-29 | 2021-11-09 | 南京邮电大学 | 一种基于改进ssd学习模型的无人机树木种类识别方法 |
CN113762209A (zh) * | 2021-09-22 | 2021-12-07 | 重庆邮电大学 | 一种基于yolo的多尺度并行特征融合路标检测方法 |
CN113688948A (zh) * | 2021-10-11 | 2021-11-23 | 中核检修有限公司 | 一种基于YOLO v5的附着海生物种类识别方法 |
CN113947108A (zh) * | 2021-10-15 | 2022-01-18 | 福州大学 | 一种基于yolo v5的球员追踪检测方法 |
CN113902729A (zh) * | 2021-10-26 | 2022-01-07 | 重庆邮电大学 | 一种基于YOLO v5模型的路面坑洼检测方法 |
CN114120037A (zh) * | 2021-11-25 | 2022-03-01 | 中国农业科学院农业信息研究所 | 一种基于改进yolov5模型的发芽马铃薯图像识别方法 |
Non-Patent Citations (4)
Title |
---|
张为 ; 魏晶晶 ; .嵌入DenseNet结构和空洞卷积模块的改进YOLO v3火灾检测算法.天津大学学报(自然科学与工程技术版).2020,(09),全文. * |
李佳禧 ; 邱东 ; 杨宏韬 ; 刘克平 ; .基于改进的YOLO v3的工件识别方法研究.组合机床与自动化加工技术.2020,(08),全文. * |
谌贵辉 ; 易欣 ; 李忠兵 ; 钱济人 ; 陈伍 ; .基于改进YOLOv2和迁移学习的管道巡检航拍图像第三方施工目标检测.计算机应用.(04),全文. * |
赵琼 ; 李宝清 ; 李唐薇 ; .基于改进YOLO v3的目标检测算法.激光与光电子学进展.(12),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114663769A (zh) | 2022-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310862B (zh) | 复杂环境下基于图像增强的深度神经网络车牌定位方法 | |
Zhang et al. | Hierarchical feature fusion with mixed convolution attention for single image dehazing | |
CN106228185B (zh) | 一种基于神经网络的通用图像分类识别系统及方法 | |
CN114663769B (zh) | 一种基于YOLO v5的水果识别方法 | |
CN113065558A (zh) | 一种结合注意力机制的轻量级小目标检测方法 | |
CN112800876B (zh) | 一种用于重识别的超球面特征嵌入方法及系统 | |
CN108256426A (zh) | 一种基于卷积神经网络的人脸表情识别方法 | |
CN115661943B (zh) | 一种基于轻量级姿态评估网络的跌倒检测方法 | |
CN111680705B (zh) | 适于目标检测的mb-ssd方法和mb-ssd特征提取网络 | |
CN110046574A (zh) | 基于深度学习的安全帽佩戴识别方法及设备 | |
CN112926652B (zh) | 一种基于深度学习的鱼类细粒度图像识别方法 | |
CN113139489A (zh) | 基于背景提取和多尺度融合网络的人群计数方法及系统 | |
CN114943893B (zh) | 一种土地覆盖分类的特征增强方法 | |
CN110827312A (zh) | 一种基于协同视觉注意力神经网络的学习方法 | |
CN112308087B (zh) | 基于动态视觉传感器的一体化成像识别方法 | |
CN111666852A (zh) | 一种基于卷积神经网络的微表情双流网络识别方法 | |
CN114266757A (zh) | 一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法 | |
CN109740539A (zh) | 基于超限学习机和融合卷积网络的3d物体识别方法 | |
CN116052212A (zh) | 一种基于双重自监督学习的半监督跨模态行人重识别方法 | |
CN113011506B (zh) | 一种基于深度重分形频谱网络的纹理图像分类方法 | |
CN111582202B (zh) | 一种智能网课系统 | |
CN113744205A (zh) | 一种端到端的道路裂缝检测系统 | |
CN117392668A (zh) | 一种麦田小麦赤霉病状态评估方法、系统及电子设备 | |
CN112149528A (zh) | 一种全景图目标检测方法、系统、介质及设备 | |
Pang et al. | PTRSegNet: A Patch-to-Region Bottom-Up Pyramid Framework for the Semantic Segmentation of Large-Format Remote Sensing Images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |