CN114782936B - 一种基于改进yolov5s网络的行为检测方法 - Google Patents

一种基于改进yolov5s网络的行为检测方法 Download PDF

Info

Publication number
CN114782936B
CN114782936B CN202210683839.4A CN202210683839A CN114782936B CN 114782936 B CN114782936 B CN 114782936B CN 202210683839 A CN202210683839 A CN 202210683839A CN 114782936 B CN114782936 B CN 114782936B
Authority
CN
China
Prior art keywords
layer
fusion
characteristic diagram
module
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210683839.4A
Other languages
English (en)
Other versions
CN114782936A (zh
Inventor
夏景明
麻学岚
谈玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202210683839.4A priority Critical patent/CN114782936B/zh
Publication of CN114782936A publication Critical patent/CN114782936A/zh
Application granted granted Critical
Publication of CN114782936B publication Critical patent/CN114782936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于改进yolov5s网络的行为检测方法,包括以下步骤:获取抽烟、打电话行为数据集,将数据集通过Labelimg进行标记,标记为calling和smoking两类;将标记好的行为数据集经过格式转换,转换为txt格式,将其分为训练集和测试集;获取yolov5s网络结构,对yolov5s网络结构进行改进创新;将数据在改进过后的yolov5s网络结构上进行训练;通过测试集对训练后得到的训练模型进行测试,计算mAP指标和Recall指标。本发明能够增强了网络的特征提取能力,保证检测小目标物体的检测精度。

Description

一种基于改进yolov5s网络的行为检测方法
技术领域
本发明属于计算机视觉图像识别技术领域,具体涉及一种基于改进yolov5s网络的行为检测方法。
背景技术
目前,民众购车力度不断发展,根据最新数据表示,仅我国机动车保有量就已经达到3.95亿辆,机动车驾驶人达4.81亿人。但是随之而来的也是汽车事故案件的不断增长。由于机动车驾驶人的不规范操作,例如开车过程中玩手机、打电话、抽烟等,造成汽车事故案件。因此,研究机动车内人员是否有违规行为具有十分重要的意义。然而,玩手机、打电话和抽烟等行为中的行为对象(手机、烟)均属于小目标,如何能够实现对小目标物体的精准识别是当前亟需解决的技术问题。
发明内容
解决的技术问题:针对前述技术问题,本发明公开了一种基于改进yolov5s网络的行为检测方法,增强了网络的特征提取能力,保证检测小目标物体的检测精度。
技术方案:
一种基于改进yolov5s网络的行为检测方法,其特征在于,所述行为检测方法包括以下步骤:
S1,采集违规行为图像,生成行为数据集,对行为数据集进行标注;将标注好的行为数据集转换成文本格式,并划分成训练集和测试集;
S2,基于yolov5s网络构建行为识别模型,所述行为识别模型包括特征提取模块、特征融合模块和检测模块;所述特征提取模块包括依次连接的四个特征提取层,对导入的违规行为图像进行特征提取操作,依次得到第一特征图、第二特征图、第三特征图和第四特征图;所述特征融合模块对第四特征图依次进行三次上采样处理,在上采样过程中,三次上采样结果按照自下而上的顺序分别和第三特征图、第二特征图、第一特征图进行融合,分别得到第一融合特征图、第二融合特征图和第三融合特征图;第三融合特征图进行1*1且步长为1的卷积,再采用Bottleneck模块对卷积结果进行处理后与第五特征图融合,融合结果依次通过BN层和卷积层,得到第一输出特征图,第一输出特征图结合FcaNet注意力机制,进入检测模块;所述第一输出特征图再依次进行三次下采样处理,在下采样过程中,三次下采样结果按照自上而下的顺序分别与第二融合特征图、第二次上采样之前的特征图和第一次上采样之前的特征图进行融合,分别得到第二输出特征图、第三输出特征图和第四输出特征图,结合FcaNet注意力机制,进入检测模块;所述检测模块结合第一输出特征图、第二输出特征图、第三输出特征图和第四输出特征图,识别得到违规行为类别和违规行为对象;
S3,采用训练集对行为识别模型进行训练,在训练完成后,采用测试集对训练完成的行为识别模型进行测试,计算mAP指标和Recall指标。
进一步地,步骤S1中,违规行为图像包括抽烟图像和打电话图像。
进一步地,步骤S2中,所述特征提取模块包括第一特征提取层、第二特征提取层、第三特征提取层和第四特征提取层;
所述第一特征提取层包括依次连接的两个卷积层和一个C3模块;所述第二特征提取层、第三特征提取层和第四特征提取层分别包括相互连接的一个卷积层和一个C3模块。
进一步地,步骤S2中,所述特征提取模块采用的卷积层的激活函数为MetaAconC函数。
进一步地,所述特征融合模块包括依次连接的第一卷积层、第一上采样层、第一融合层、第一C3层、第二卷积层、第二上采样层、第二融合层、第二C3层、第三卷积层、第三上采样层、第三融合层、第三C3层、第四卷积层、第四融合层、第四C3层、第五卷积层、第五融合层、第五C3层、第六卷积层、第六融合层和第六C3层;
所述第一卷积层的输出端与第六融合层的输入端连接;所述第二卷积层的输出端与第五融合层的输入端连接;第三卷积层的输出端与第四融合层的输入端连接。
进一步地,所述第二C3层和第三C3层采用改进的C3模块,用于对输入的原始特征图进行1*1且步长为1的卷积,再采用Bottleneck模块对卷积结果进行处理后与原始特征图融合,融合结果依次通过BN层和卷积层,输出相应的特征图。
进一步地,所述行为识别模型的四个输出通道上一一对应地添加有FcaNet注意力模块,FcaNet注意力模块采用多光谱通道注意力机制。
进一步地,步骤S3中,计算mAP指标和Recall指标的过程包括以下步骤:
在模型训练完成后,保存生成的权重文件,采用生成的权重文件进行测试,生成对应的CSV格式文件,从CSV格式文件中提取得到mAP指标和Recall指标。
进一步地,所述行为识别模型的损失函数为:
Ltotal=Lcla_loss+Lloc_loss+Lcon_loss
式中,Lcla_loss代表分类损失,Lloc_loss代表矩形框损失,Lcon_loss代表置信度损失;矩形框损失采用CIOU_Loss函数计算得到,分类损失和置信度损失采用BCEWithlogitsloss函数计算得到。
有益效果:
第一,本发明提出的基于改进yolov5s网络的行为检测方法,既可以监督车辆驾驶员不规范行为,也可以在公共场所,例如禁烟地点监督人群的不规范行为,以便管理。此外,本发明提出的基于改进的yolov5s网络结构具有轻量级效果,也可以部署在嵌入式设备上。
第二,本发明提出的基于改进yolov5s网络的行为检测方法,主要是检测打电话、抽烟行为,因为抽烟、打电话图片数据集存在面部阻挡或手指阻挡,所以对网络结构精度要求较高,而本发明提出的算法,在识别小目标物体上有着较高的精度和速度,并且在复杂天气或者多目标数据的识别上可以保持较高的识别精度和速度。
附图说明
图1为基于改进yolov5s网络的行为检测方法流程图。
图2为本发明实施例中手动标注数据集的示意图。
图3为本发明实施例中Backbone中改进后的Conv模块(Conv_M层)的示意图。
图4为本发明实施例中第一特征融合层中改进后的C3模块(C3_1模块)的结构示意图。
图5为本发明实施例中改进yolov5s网络结构的结构示意图。
具体实施方式
下面的实施例可使本专业技术人员更全面地理解本发明,但不以任何方式限制本发明。
图1为基于改进yolov5s网络的行为检测方法流程图。参见图1,该行为检测方法包括以下步骤:
S1,采集违规行为图像,生成行为数据集,对行为数据集进行标注;将标注好的行为数据集转换成文本格式,并划分成训练集和测试集。
S2,基于yolov5s网络构建行为识别模型,所述行为识别模型包括特征提取模块、特征融合模块和检测模块;所述特征提取模块包括依次连接的四个特征提取层,对导入的违规行为图像进行特征提取操作,依次得到第一特征图、第二特征图、第三特征图和第四特征图;所述特征融合模块对第四特征图依次进行三次上采样处理,在上采样过程中,三次上采样结果按照自下而上的顺序分别和第三特征图、第二特征图、第一特征图进行融合,分别得到第一融合特征图、第二融合特征图和第三融合特征图;第三融合特征图进行1*1且步长为1的卷积,再采用Bottleneck模块对卷积结果进行处理后与第五特征图融合,融合结果依次通过BN层和卷积层,得到第一输出特征图,第一输出特征图结合FcaNet注意力机制,进入检测模块;所述第一输出特征图再依次进行三次下采样处理,在下采样过程中,三次下采样结果按照自上而下的顺序分别与第二融合特征图、第二次上采样之前的特征图和第一次上采样之前的特征图进行融合,分别得到第二输出特征图、第三输出特征图和第四输出特征图,结合FcaNet注意力机制,进入检测模块;所述检测模块结合第一输出特征图、第二输出特征图、第三输出特征图和第四输出特征图,识别得到违规行为类别和违规行为对象。
S3,采用训练集对行为识别模型进行训练,在训练完成后,采用测试集对训练完成的行为识别模型进行测试,计算mAP指标和Recall指标。
步骤一,生成行为数据集,对行为数据集进行标注
示例性地,违规行为图像包括抽烟图像和打电话图像。应当理解,烟和电话是其中两个小目标对象,本发明的行为检测方法可以推广应用在更多的目标行为识别任务中,例如在特殊场景下对人员携带的违规物品的识别等等。图2为其中一种手动标注数据集的效果示意图。图中的驾驶员正在抽烟,此时,烟是行为识别模型的识别目标,抽烟行为是行为识别模型得到的行为分类。图2中的字符是软件参数,与本实施例的技术方案无关。
在开源数据集上获取更多的抽烟、打电话数据集,将数据集通过Labelimg进行标记,标记为calling和smoking两类。但是由于抽烟、打电话等行为数据集属于小目标数据集,且改进yolov5s网络结构模型旨在识别小目标数据,所以需要利用无人机拍取一些行为密集数据,从而得到改进yolov5s网络结构的优缺点。当抽烟、打电话行为检测数据集用Labelimg进行标记过后会变为VOC格式,但是这一格式不能直接通过改进yolov5s网络结构进行训练,因此还需要将其进行格式转换,例如转换为txt格式,再将其分为训练集和测试集。
步骤二,行为识别模型
本实施例的行为识别模型基于yolov5s网络构建,为了适配本实施例的应用场景,本实施例对原始yolov5s网络结构进行改进创新。图5为本发明实施例中改进yolov5s网络结构的结构示意图。
具体的,本实施例从以下几个方面对原始yolov5s网络结构进行了改进:
第一,在yolov5s网络结构中,添加一个特征融合层,添加了新的特征融合层之后将Backbone网络的特征信息和新的特征融合层结合,获得用于小目标检测的较大特征图,因此,新添加的融合层能够提升模型特征融合能力,改进的yolov5s网络结构中有4个融合层,目的是能够更好的识别小目标特征信息。
参见图5,行为识别模型包括特征提取模块(Backbone模块)、特征融合模块(Neck模块)和检测模块(Head模块)。
特征提取模块包括第一特征提取层、第二特征提取层、第三特征提取层和第四特征提取层;所述第一特征提取层包括依次连接的两个卷积层和一个C3模块;所述第二特征提取层、第三特征提取层和第四特征提取层分别包括相互连接的一个卷积层和一个C3模块。所述特征融合模块包括依次连接的第一卷积层、第一上采样层、第一融合层、第一C3层、第二卷积层、第二上采样层、第二融合层、第二C3层、第三卷积层、第三上采样层、第三融合层、第三C3层、第四卷积层、第四融合层、第四C3层、第五卷积层、第五融合层、第五C3层、第六卷积层、第六融合层和第六C3层;所述第一卷积层的输出端与第六融合层的输入端连接;所述第二卷积层的输出端与第五融合层的输入端连接;所述第二融合层的输出端与第四C3层的输入端连接;第三卷积层的输出端与第四融合层的输入端连接。
第二C3层、第三卷积层、第三上采样层、第三融合层、第三C3层、第四卷积层、第四融合层是新增特征融合层,新增特征融合层的作用是将骨干网中产生的特征图和经过3次上采样产生的特征图进行融合,并且经过C3_1和Conv之后再进行一次下采样(下采样过程不在网络结构中单独示意)与第三次上采样之前产生的特征图进行融合连接,通过第三次上采样之后通过C3_1模块结合FcaNet注意力机制,进入检测模块。
第二,将yolov5s网络结构中Backbone中Conv模块换为Conv_M模块,具体表现为将原本Conv模块的激活函数变为MetaAconC,目的是提升网络精度。图3为本发明实施例中Backbone中改进后的Conv模块(Conv_M模块或者Conv_M层)的示意图。
第三,对第二C3层和第三C3层进行改进,初始yolov5s网络结构的C3模块是将特征图输出到两个分支中,分支一是大小为1*1且步长为1的卷积,分支二是先进行1*1且步长为1的卷积,之后经过Bottleneck模块,之后再将分支一和分支二进行Concat,最后依次通过BN层和卷积层,最终得到输出特征图,输出特征图的大小为160*160*255。改进过后的C3模块将分支一的卷积部分去掉,直接与经过卷积和Bottleneck模块的分支二进行Concat。改进过后的C3模块减少了卷积模块的运算,加快了一定的速度。图4为本发明实施例中新添加的特征融合层中改进后的C3模块(C3_1模块)的结构示意图。
第四,在yolov5s网络结构中添加FcaNet注意力机制,该注意力机制是多光谱通道注意力机制,将添加的FcaNet注意力机制与新添加的特征融合层相结合,目的是更好的提取目标信息特征和提高模型特征融合能力。如图5所示,行为识别模型的四个输出通道上一一对应地添加有FcaNet注意力模块,FcaNet注意力模块采用多光谱通道注意力机制。
步骤S3,行为识别模型训练和测试
训练过程:
提前下载好yolov5s网络预训练模型,根据基于yolov5s网络结构的改进部分在下载好的yolov5s预训练模型中进行对应修改,具体表现为将nc修改为2,将Backbone中Conv的激活函数变为MetaAconC,将head部分中添加新的卷积、上采样以及C3_M部分。
结合前述步骤可以得到训练过程为:一开始输入大小为640*640*3,经过两次Conv_M以及一次C3后输出大小为160*160*64特征图,将其与新添加的特征融合层结合,此外,将大小为160*160*64特征图经过一次Conv_M和一次C3之后输出大小为80*80*128特征图,之后再次将大小为80*80*128特征图作为输入,经过一次Conv_M和一次C3之后输出大小为40*40*256特征图,之后将大小为40*40*256特征图经过一次Conv_M、C3和SPPF生成大小为20*20*512特征图,并且每次生成不同大小的特征。
测试过程:
步骤S3中,计算mAP指标和Recall指标的过程包括以下步骤:
经过训练过程后,会保存训练数据过后生成的权重文件。利用生成的权重文件进行测试,测试完成后会生成CSV格式文件,就可以看到recall和mAP指标。
在本实施例中,改进后的Yolov5网络的损失函数为:
Ltotal=Lcla_loss+Lloc_loss+Lcon_loss
式中,Lcla_loss代表分类损失、Lloc_loss代表矩形框损失、Lcon_loss代表置信度损失,矩形框损失采用CIOU_Loss计算,分类损失和置信度损失采用BCEWithlogitsloss计算:
Figure GDA0003775835050000061
Figure GDA0003775835050000062
Figure GDA0003775835050000063
Figure GDA0003775835050000064
Figure GDA0003775835050000065
式中,
Figure GDA0003775835050000066
是sigmoid函数,可以把x映射到0-1区间内;IoU代表候选边界框和真实边界框的交并比;V代表衡量长宽比一致性的参数;α代表用于权衡的参数,即为v的影响因子,取值范围为0-1;ρ(A,B)代表框A和框B两个中心点之间的欧氏距离;C为框A和框B的最小包围矩形的对角线的欧式距离;wgt是真实边界框的宽度,hgt是真实边界框的高度,w是预测边界框的宽度,h是预测边界框的高度。
Figure GDA0003775835050000071
Figure GDA0003775835050000072
Figure GDA0003775835050000073
Figure GDA0003775835050000074
Precision代表准确率,Recall代表漏检率;p代表单个类别的查准率;AP代表没过类别的平均精度;r代表所有图片之和;k代表类别数;mAP是所有类别AP的平均值;TP代表真正例,TN代表真反例,FP代表假正例,FN代表假反例。

Claims (9)

1.一种基于改进yolov5s网络的行为检测方法,其特征在于,所述行为检测方法包括以下步骤:
S1,采集违规行为图像,生成行为数据集,对行为数据集进行标注;将标注好的行为数据集转换成文本格式,并划分成训练集和测试集;
S2,基于yolov5s网络构建行为识别模型,所述行为识别模型包括特征提取模块、特征融合模块和检测模块;所述特征提取模块包括依次连接的四个特征提取层,对导入的违规行为图像进行特征提取操作,依次得到第一特征图、第二特征图、第三特征图和第四特征图;所述特征融合模块对第四特征图依次进行三次上采样处理,在上采样过程中,三次上采样结果按照自下而上的顺序分别和第三特征图、第二特征图、第一特征图进行融合,分别得到第一融合特征图、第二融合特征图和第三融合特征图;第三融合特征图进行1*1且步长为1的卷积,再采用Bottleneck模块对卷积结果进行处理后与第五特征图融合,融合结果依次通过BN层和卷积层,得到第一输出特征图,第一输出特征图结合FcaNet注意力机制,进入检测模块;所述第一输出特征图再依次进行三次下采样处理,在下采样过程中,三次下采样结果按照自上而下的顺序分别与第二融合特征图、第二次上采样之前的特征图和第一次上采样之前的特征图进行融合,分别得到第二输出特征图、第三输出特征图和第四输出特征图,结合FcaNet注意力机制,进入检测模块;所述检测模块结合第一输出特征图、第二输出特征图、第三输出特征图和第四输出特征图,识别得到违规行为类别和违规行为对象;
S3,采用训练集对行为识别模型进行训练,在训练完成后,采用测试集对训练完成的行为识别模型进行测试,计算mAP指标和Recall指标。
2.根据权利要求1所述的基于改进yolov5s网络的行为检测方法,其特征在于,步骤S1中,违规行为图像包括抽烟图像和打电话图像。
3.根据权利要求1所述的基于改进yolov5s网络的行为检测方法,其特征在于,步骤S2中,所述特征提取模块包括第一特征提取层、第二特征提取层、第三特征提取层和第四特征提取层;
所述第一特征提取层包括依次连接的两个卷积层和一个C3模块;所述第二特征提取层、第三特征提取层和第四特征提取层分别包括相互连接的一个卷积层和一个C3模块。
4.根据权利要求3所述的基于改进yolov5s网络的行为检测方法,其特征在于,步骤S2中,所述特征提取模块采用的卷积层的激活函数为MetaAconC函数。
5.根据权利要求1所述的基于改进yolov5s网络的行为检测方法,其特征在于,所述特征融合模块包括依次连接的第一卷积层、第一上采样层、第一融合层、第一C3层、第二卷积层、第二上采样层、第二融合层、第二C3层、第三卷积层、第三上采样层、第三融合层、第三C3层、第四卷积层、第四融合层、第四C3层、第五卷积层、第五融合层、第五C3层、第六卷积层、第六融合层和第六C3层;
所述第一卷积层的输出端与第六融合层的输入端连接;所述第二卷积层的输出端与第五融合层的输入端连接;第三卷积层的输出端与第四融合层的输入端连接。
6.根据权利要求5所述的基于改进yolov5s网络的行为检测方法,其特征在于,所述第二C3层和第三C3层采用改进的C3模块,用于对输入的原始特征图进行1*1且步长为1的卷积,再采用Bottleneck模块对卷积结果进行处理后与原始特征图融合,融合结果依次通过BN层和卷积层,输出相应的特征图。
7.根据权利要求1所述的基于改进yolov5s网络的行为检测方法,其特征在于,所述行为识别模型的四个输出通道上一一对应地添加有FcaNet注意力模块,FcaNet注意力模块采用多光谱通道注意力机制。
8.根据权利要求1所述的基于改进yolov5s网络的行为检测方法,其特征在于,步骤S3中,计算mAP指标和Recall指标的过程包括以下步骤:
在模型训练完成后,保存生成的权重文件,采用生成的权重文件进行测试,生成对应的CSV格式文件,从CSV格式文件中提取得到mAP指标和Recall指标。
9.根据权利要求1所述的基于改进yolov5s网络的行为检测方法,其特征在于,所述行为识别模型的损失函数为:
Ltotal=Lcla_loss+Lloc_loss+Lcon_loss
式中,Lcla_loss代表分类损失,Lloc_loss代表矩形框损失,Lcon_loss代表置信度损失;矩形框损失采用CIOU_Loss函数计算得到,分类损失和置信度损失采用BCEWithlogitsloss函数计算得到。
CN202210683839.4A 2022-06-17 2022-06-17 一种基于改进yolov5s网络的行为检测方法 Active CN114782936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210683839.4A CN114782936B (zh) 2022-06-17 2022-06-17 一种基于改进yolov5s网络的行为检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210683839.4A CN114782936B (zh) 2022-06-17 2022-06-17 一种基于改进yolov5s网络的行为检测方法

Publications (2)

Publication Number Publication Date
CN114782936A CN114782936A (zh) 2022-07-22
CN114782936B true CN114782936B (zh) 2022-09-02

Family

ID=82420272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210683839.4A Active CN114782936B (zh) 2022-06-17 2022-06-17 一种基于改进yolov5s网络的行为检测方法

Country Status (1)

Country Link
CN (1) CN114782936B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116205895B (zh) * 2023-03-16 2024-04-02 四川轻化工大学 一种基于改进YOLOv5的变压器漏油检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378890A (zh) * 2021-05-17 2021-09-10 浙江工业大学 一种基于改进YOLO v4的轻量级行人车辆检测方法
CN114092764A (zh) * 2021-11-19 2022-02-25 扬州大学 一种加入注意力机制的YOLOv5神经网络车辆检测方法
CN114120019A (zh) * 2021-11-08 2022-03-01 贵州大学 一种轻量化的目标检测方法
CN114549507A (zh) * 2022-03-01 2022-05-27 浙江理工大学 改进Scaled-YOLOv4的织物瑕疵检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378890A (zh) * 2021-05-17 2021-09-10 浙江工业大学 一种基于改进YOLO v4的轻量级行人车辆检测方法
CN114120019A (zh) * 2021-11-08 2022-03-01 贵州大学 一种轻量化的目标检测方法
CN114092764A (zh) * 2021-11-19 2022-02-25 扬州大学 一种加入注意力机制的YOLOv5神经网络车辆检测方法
CN114549507A (zh) * 2022-03-01 2022-05-27 浙江理工大学 改进Scaled-YOLOv4的织物瑕疵检测方法

Also Published As

Publication number Publication date
CN114782936A (zh) 2022-07-22

Similar Documents

Publication Publication Date Title
CN110532878B (zh) 一种基于轻量化卷积神经网络的驾驶员行为识别方法
CN111191663B (zh) 车牌号码识别方法、装置、电子设备及存储介质
CN107944450B (zh) 一种车牌识别方法及装置
CN112380921A (zh) 一种基于车联网的道路检测方法
CN106599832A (zh) 一种基于卷积神经网络的多类障碍物检测与识别方法
CN112990065B (zh) 一种基于优化的YOLOv5模型的车辆分类检测方法
CN112580643A (zh) 一种基于深度学习的车牌识别方法、装置及存储介质
CN108009548A (zh) 一种智能路牌识别方法及系统
CN110533119B (zh) 标识识别方法及其模型的训练方法、装置及电子系统
CN114817991B (zh) 一种车联网图像脱敏方法和系统
CN111931683B (zh) 图像识别方法、装置及计算机可读存储介质
CN114495029A (zh) 一种基于改进YOLOv4的交通目标检测方法及系统
CN114782936B (zh) 一种基于改进yolov5s网络的行为检测方法
CN112132216B (zh) 车型识别方法、装置、电子设备及存储介质
CN112288701A (zh) 一种智慧交通图像检测方法
CN114359789B (zh) 视频图像的目标检测方法、装置、设备及介质
CN115953744A (zh) 一种基于深度学习的车辆识别追踪方法
CN111860219A (zh) 一种高速占道判断方法、装置及电子设备
WO2024152659A9 (zh) 一种图像处理方法、装置、设备、介质及程序产品
CN114218999A (zh) 一种基于融合图像特征的毫米波雷达目标检测方法及系统
CN113902753A (zh) 基于双通道和自注意力机制的图像语义分割方法及系统
CN113486856A (zh) 一种基于语义分割和卷积神经网络的驾驶员不规范行为检测方法
CN111178181B (zh) 交通场景分割方法及相关装置
CN112288702A (zh) 一种基于车联网的道路图像检测方法
CN116363072A (zh) 一种轻型航拍图像检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant