CN111723657A - 一种基于YOLOv3与自优化的河道异物检测方法及装置 - Google Patents

一种基于YOLOv3与自优化的河道异物检测方法及装置 Download PDF

Info

Publication number
CN111723657A
CN111723657A CN202010399599.6A CN202010399599A CN111723657A CN 111723657 A CN111723657 A CN 111723657A CN 202010399599 A CN202010399599 A CN 202010399599A CN 111723657 A CN111723657 A CN 111723657A
Authority
CN
China
Prior art keywords
foreign matter
river
model
training
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010399599.6A
Other languages
English (en)
Other versions
CN111723657B (zh
Inventor
缑秦征
周勇
黄笑
刘加
周婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Electronic System Technology Co ltd
Zhongdian Cloud Computing Technology Co ltd
Original Assignee
China Electronic System Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Electronic System Technology Co ltd filed Critical China Electronic System Technology Co ltd
Priority to CN202010399599.6A priority Critical patent/CN111723657B/zh
Publication of CN111723657A publication Critical patent/CN111723657A/zh
Application granted granted Critical
Publication of CN111723657B publication Critical patent/CN111723657B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于YOLOv3与自优化的河道异物检测方法及装置。本发明涉及深度学习和计算机视觉技术领域,解决现有的河道异物检测方法不能通过自发优化的方法,提高异物检测模型准确率的问题。本发明采用无人机实时拍摄传回视频作为数据来源,减少了人工干预,同时将检测结果生成的异物图像实时反馈到给社会治理平台服务端,实现异物“早发现,早治理”目标。本发明基于YOLOv3网络,性能上较YOLOv2有所提升,且增加了自优化功能,能够将识别结果加以人工干预生成困难样本,当收集到的困难样本超过一定数量时,自优化会自动开启,随着测试过程的积累,不断触发自优化进程,提升模型准确率。

Description

一种基于YOLOv3与自优化的河道异物检测方法及装置
技术领域
本发明涉及深度学习和计算机视觉技术领域,尤其涉及一种基于YOLOv3与自优化的河道异物检测方法及装置。
背景技术
无人机的应用在现代生活中涉及的领域很广,它适应于各种地形,不拘泥于山川湖海、城市乡村,在各个领域都能有一席之地,而且对于一些人类难以完成的任务,无人机能完成的很好,因此在河道检测方面,应用无人机参与社会治理项目是一个创新大胆的尝试。所谓社会治理,就是政府、社会组织、企事业单位、社区以及个人等诸行为者,通过平等的合作型伙伴关系,依法对社会事务、社会组织和社会生活进行规范和管理,最终实现公共利益最大化的过程。在人工智能时代,社会治理需要大量的智能处理单元代替人力治理,由人治转变为“智”治。社会治理平台是社会治理项目的服务端,可将需要治理的资源至于社会治理平台中,由平台统一处理分析,将分析结果上报到处理人员。本发明将河道异物检测识别服务置于社会治理平台中,达到“治理联动,平台上报”的目的。
河道中常见的异物有浮萍、垃圾、落叶,这些异物会加剧水体污染,使水体富营养化,破坏水体生态环境以及其他物种的生存环境;此外,在河道中游泳、垂钓,冬季在冰面溜冰、奔跑等,若不及时处理,可能会威胁城市居民生命财产安全。目前河道治理多以人工为主,河面异物由专人定期处理,行为不规范的人群由专人劝阻,这些安排虽然解决了河道治理问题,但在河道治理效率方面还需要较大提升。而通过深度学习介入社会治理,将大大提升社会治理的效率,解放一部分人力,及时准确地定位河道异物,减少河道污染以及因河道游泳与垂钓带来的安全隐患。现有河道异物检测方法大多基于传统算法与YOLOv2算法且模型不能自发优化,从长远来看,模型准确率不高,且无法提升。
发明内容
本发明提供一种基于YOLOv3与自优化的河道异物检测方法及装置,以解决现有的河道异物检测方法不能自发优化,模型准确率不高的问题。
第一方面,本发明提供一种基于YOLOv3与自优化的河道异物检测方法,所述方法包括:
获取无人机拍摄的河道视频数据;
对所述河道视频数据按帧截取图片,得到初始数据集;
对所述始数据集进行预处理,得到河道图片数据集Q;
将所述河道图片数据集Q按预设比例分为训练集,验证集和测试集;
将所述训练集,验证集和测试集中的图片数据按照异物策略中制定的异物类别进行标记,得到与所述图片数据一一对应的标记数据集,所述标记数据集包括异物标注框坐标和异物类别信息;
对所述训练集及相应的标记数据集进行数据增强处理;
利用YOLOv3网络对数据增强处理后的训练集以及相应的标记数据集进行模型训练,得到多个权重的河道异物检测模型;
将所述验证集和验证集的标记数据集输入YOLOv3网络,在模型训练的同时对模型进行验证,获得模型当前的准确率,以便于及时调整模型参数,获得最优权重模型;
在模型训练完成后,利用测试集和测试集标记数据集对最优权重模型进行测试;
获取无人机拍摄的实时河道视频数据;
将所述实时河道视频数据输入所述最优权重模型进行河道异物检测,获得河道异物检测结果;
将河道异物检测结果以截图的形式返回给社会治理平台服务端相关人员进行人工审核;
根据人工审核结果判断所述河道异物检测结果是否正确;
如果所述河道异物检测结果正确,发出河道异物警告信息,以通知相关人员进行处理;
如果所述河道异物检测结果不正确,接收相关人员对异物类别信息的修改信息,将修改后的图片样本作为困难样本;
判断困难样本的数量是否超过预设阈值;
如果困难样本的数量超过预设阈值,自动开启自优化进程,对所述困难样本进行去重处理;
将去重处理后的困难样本与训练集合并为新的训练集,以利用YOLOv3网络根据所述新的训练集进行模型训练,得到训练迭代后的河道异物检测模型。
结合第一方面,在第一方面的第一种可实现方式中,对所述始数据集进行预处理,得到河道图片数据集Q的步骤中,对失真、变形、模糊的图片数据进行筛选和校正,得到所述得到河道图片数据集Q。
结合第一方面,在第一方面的第二种可实现方式中,将所述河道图片数据集Q按预设比例分为训练集,验证集和测试集的步骤中,按照8:1:1的比例分将所述河道图片数据集Q为训练集,验证集和测试集。
结合第一方面,在第一方面的第三种可实现方式中,将所述训练集,验证集和测试集中的图片数据按照异物策略中制定的异物类别进行标记,得到与所述图片数据一一对应的标记数据集包括:
对所述训练集,验证集和测试集的每一张图片中的每一个在异物类别中的物体用矩形框框选物体,并存储矩形框在图片中的位置,所述位置包括矩形框左上角与右下角坐标信息,同时对所述物体的类别进行标记,将标记后的信息生成XML文件,形成与标记的图片一一对应的标记数据集。
结合第一方面的第三种可实现方式,在第一方面的第四种可实现方式中,所述异物类别包括桥梁、水草、船、浮萍、落叶、牛奶盒、树枝、瓶子、塑料垃圾、塑料袋、球形物体和人。
结合第一方面,在第一方面的第五种可实现方式中,对所述训练集及相应的标记数据集进行数据增强处理的步骤中,将标记好的训练集图片通过数据增强的方式增加至原始训练数据的2~10倍。
结合第一方面,在第一方面的第六种可实现方式中,对所述训练集及相应的标记数据集进行数据增强处理包括:
采用翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换或反射变换,以及SamplePairing方法进行数据增强处理,所述SamplePairing方法为随机选择两个样本xa和xb,这两个样本对应的标签分别为ya和yb,从ya和yb中随机选择一个标签为y,则得出以下结论:(xa+xb)/2=Z,Z为新样本,其标签为y。
结合第一方面,在第一方面的第七种可实现方式中,利用YOLOv3网络对数据增强处理后的训练集以及相应的标记数据集进行模型训练,得到多个权重的河道异物检测模型的步骤中,将标记好的图片样本与背景图片样本一起送入YOLOv3网络,标记好的图片为正样本,背景图片不含有异物类别中的物体,不做标注,未标注的背景图片为负样本,正负样本一起在YOLOv3网络中训练,通过迭代训练获得多个权重的河道异物检测模型。
结合第一方面,在第一方面的第八种可实现方式中,对所述困难样本进行去重处理包括:
根据图像像素直方图分布计算困难样本之间的相似度,采用下式:
Figure BDA0002488922090000031
式中,P为相似度,gi,si分别为两张困难样本图片各自直方图曲线的第i个点,N为各自直方图曲线顶点的序号;
判断两个困难样本的相似度P是否大于0.8;
如果所述相似度P大于0.8,删除两个困难样本图片中任意一张图片。
第二方面,本发明提供一种基于YOLOv3与自优化的河道异物检测装置,所述装置包括:
第一获取单元,用于获取无人机拍摄的河道视频数据;
截取单元,用于对所述河道视频数据按帧截取图片,得到初始数据集;
预处理单元,用于对所述始数据集进行预处理,得到河道图片数据集Q;
分组单元,用于将所述河道图片数据集Q按预设比例分为训练集,验证集和测试集;
标记单元,用于将所述训练集,验证集和测试集中的图片数据按照异物策略中制定的异物类别进行标记,得到与所述图片数据一一对应的标记数据集,所述标记数据集包括异物标注框坐标和异物类别信息;
数据增强单元,用于对所述训练集及相应的标记数据集进行数据增强处理;
模型训练单元,用于利用YOLOv3网络对数据增强处理后的训练集以及相应的标记数据集进行模型训练,得到多个权重的河道异物检测模型;
模型验证单元,用于将所述验证集和验证集的标记数据集输入YOLOv3网络,在模型训练的同时对模型进行验证,获得模型当前的准确率,以便于及时调整模型参数,获得最优权重模型;
模型测试单元,用于在模型训练完成后,利用测试集和测试集标记数据集对最优权重模型进行测试;
第二获取单元,用于获取无人机拍摄的实时河道视频数据;
检测单元,用于将所述实时河道视频数据输入所述最优权重模型进行河道异物检测,获得河道异物检测结果;
返回单元,用于将河道异物检测结果以截图的形式返回给社会治理平台服务端相关人员进行人工审核;
第一判断单元,用于根据人工审核结果判断所述河道异物检测结果是否正确;
通知单元,用于如果所述河道异物检测结果正确,发出河道异物警告信息,以通知相关人员进行处理;
修改单元,用于在所述河道异物检测结果不正确的情况下,接收相关人员对异物类别信息的修改信息,将修改后的图片样本作为困难样本;
第二判断单元,用于判断困难样本的数量是否超过预设阈值;
去重单元,用于在困难样本的数量超过预设阈值的情况下,自动开启自优化进程,对所述困难样本进行去重处理;
合并单元,用于将去重处理后的困难样本与训练集合并为新的训练集,以利用YOLOv3网络根据所述新的训练集进行模型训练,得到训练迭代后的河道异物检测模型。
本发明具有以下有益效果:本发明的一种基于YOLOv3与自优化的河道异物检测方法及装置,基于YOLOv3网络,性能上较YOLOv2有所提升,且本发明增加了自优化功能,能够将识别结果加以人工干预生成困难样本,当收集到的困难样本超过一定数量时,自优化会自动开启,随着测试过程的积累,不断触发自优化,提升模型准确率。本发明采用无人机实时拍摄传回视频作为数据来源,减少了人工干预,同时将检测结果生成的异物图像实时反馈到给社会治理平台服务端,实现异物“早发现,早治理”目标。本发明在检测到异物后,平台上会有人工进行处置。本发明会收集检测到的物体图片以及人工处置的结果,并将人工处置的结果转换为训练模型所对应的标签。当收集到的物体图片数量到达指定的阈值后,本发明会自动开启模型训练的进程。随着时间的推移,本发明获得的人工反馈变多,在线训练迭代的次数也变多,模型的效果会逐渐优化,准确率会逐渐提升。本发明以河道治理为主要目的,基于YOLOv3实时检测,模型稳定性高,检测识别性能好,能排除外界因素的影响,达到“精准治理”的目的。本发明与社会治理平台结合,治理联动实现异常自动上报预警功能,在水体治理、水域搜救、水域事故预警方面均有重大作用。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的基于YOLOv3与自优化的河道异物检测方法的流程图。
图2为本发明提供的基于YOLOv3与自优化的河道异物检测方法一实施例的流程图。
图3为本发明提供的基于YOLOv3与自优化的河道异物检测装置的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。以下结合附图,详细说明本发明各实施例提供的技术方案。
请参阅图1,为本发明提供的本发明提供一种基于YOLOv3与自优化的河道异物检测方法,所述方法包括:
步骤S101,获取无人机拍摄的河道视频数据。
步骤S102,对所述河道视频数据按帧截取图片,得到初始数据集。
步骤S103,对所述始数据集进行预处理,得到河道图片数据集Q。
具体地,可通过对失真、变形、模糊的图片数据进行筛选和校正,得到所述河道图片数据集Q。
步骤S104,将所述河道图片数据集Q按预设比例分为训练集,验证集和测试集。
具体地,可以按照8:1:1的比例分将所述河道图片数据集Q为训练集,验证集和测试集。
步骤S105,将所述训练集,验证集和测试集中的图片数据按照异物策略中制定的异物类别进行标记,得到与所述图片数据一一对应的标记数据集,所述标记数据集包括异物标注框坐标和异物类别信息。
具体地,对所述训练集,验证集和测试集的每一张图片中的每一个在异物类别中的物体用矩形框框选物体,并存储矩形框在图片中的位置,所述位置包括矩形框左上角与右下角坐标信息,同时对所述物体的类别进行标记,将标记后的信息生成XML文件,形成与标记的图片一一对应的标记数据集。异物类别由人为指定,根据河道治理需要将物体加入异物类别中,本发明中异物类别为桥梁、水草、船、浮萍、落叶、牛奶盒、树枝、瓶子、塑料垃圾、塑料袋、球形物体、人等12类物体。
步骤S106,对所述训练集及相应的标记数据集进行数据增强处理。
由于本专利的数据量远远小于一般深度学习所需数据量,因此本专利可归类于小样本学习(few_shot_learing),本发明主要用数据增强进行小样本学习。在数据标记后,出于扩充数据量的目的,将标记好的训练集图片通过数据增强的方式增加至原始训练数据的2~10倍。
具体地,对所述训练集,及相应的标记数据集进行数据增强处理包括:
采用翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换或反射变换,以及SamplePairing方法进行数据增强处理,所述SamplePairing方法为随机选择两个样本xa和xb,这两个样本对应的标签分别为ya和yb,从ya和yb中随机选择一个标签为y,则得出以下结论:(xa+xb)/2=Z,Z为新样本,其标签为y。
步骤S107,利用YOLOv3网络对数据增强处理后的训练集以及相应的标记数据集进行模型训练,得到多个权重的河道异物检测模型。
YOLOv3网络的工作原理说明如下:YOLOv3主要由75个卷积层构成,并在网络中添加了resnet残差模块,在YOLOv1与YOLOv2的基础上调整了网络结构,利用多尺度特征进行对象检测,对象分类用Logistic取代了softmax。YOLOv3没有全连接层与池化层,可以对应任意大小的输入图像。
Resnet残差网络相当于在原始CNN网络结构中添加了一条捷径(shortcut path),学习过程从直接学习特征,变成在之前学习的特征的基础上添加某些特征,来获得更好的特征。这样一来,一个复杂的特征H(x),之前是独立一层一层学习的,现在就变成了这样一个模型H(x)=F(x)+x,其中x是shortcut开始时的特征,而F(x)就是对x进行的填补与增加,成为残差。因此学习的目标就从学习完整的信息,变成学习残差了,这样有利于解决深层次网络的梯度问题。
YOLOv3用了3个不同尺度的特征图来检测对象,能够检测到更加细粒度的特征,YOLOv3采用FPN(Feature Pyramid Network)结构来对应多重尺度的不同精度,对不同深度的特征图(feature map)分别进行目标检测,当前层的特征图(feature map)会对未来层的特征图(feature map)进行上采样,并加以利用,将低阶特征与高阶特征融合起来,提升检测精度。
Softmax层被替换为一个1x1的卷积层+logistic激活函数的结构。可以对应多标签对象。YOLOv3对预选框bbox进行预测时,采用逻辑回归(logistic regression),每个预选框包含五个元素bbox(x,y,w,h,c)其中前四个表示预选框的大小与坐标位置,最后一个值为置信度。
Pr(object)*IOU(bbox,object)=σ(t0);
其中Pr(object)*IOU(bbox,object)为置信度。logistic regression会对bbox包围部分进行一个目标性评分,找到目标存在可能性得分最高的一个。
具体地,将标记好的图片样本与背景图片样本一起送入YOLOv3网络,标记好的图片为正样本,背景图片不含有异物类别中的物体,因此不做标注,未标记的背景图片为负样本,正负样本一起在YOLOv3网络中训练,通过迭代训练获得多个权重的河道异物检测模型。
步骤S108,将所述验证集和验证集的标记数据集输入YOLOv3网络,在模型训练的同时对模型进行验证,获得模型当前的准确率,以便于及时调整模型参数,获得最优权重模型。
步骤S109,在模型训练完成后,利用测试集和测试集标记数据集对最优权重模型进行测试。
本发明将数据集分为训练集、验证集和测试集。其中将训练集用于YOLOv3网络的训练,可获得多个权重模型;验证集用于调整模型参数,将多个权重模型对验证集进行预测,记录各个模型的准确率,通过比较准确率得出模型的最优参数,并通过该参数得到最优权重模型;用最优权重模型对测试集进行预测,并将最优权重模型用于河道异物实时检测中。
步骤S110,获取无人机拍摄的实时河道视频数据。
具体地,将无人机拍摄的视频流与社会治理平台服务器端视频流对接,用训练好的最优权重模型对解码后的视频流实时检测,将解码后的视频送入模型中,由模型对视频中的抽帧图片进行检测。
步骤S111,将所述实时河道视频数据输入所述最优权重模型进行河道异物检测,获得河道异物检测结果。
步骤S112,将河道异物检测结果以截图的形式返回给社会治理平台服务端相关人员进行人工审核。
步骤S113,根据人工审核结果判断所述河道异物检测结果是否正确。
步骤S114,如果所述河道异物检测结果正确,发出河道异物警告信息,以通知相关人员进行处理。
步骤S115,如果所述河道异物检测结果不正确,接收相关人员对异物类别信息的修改信息,将修改后的图片样本作为困难样本。
步骤S116,判断困难样本的数量是否超过预设阈值。
步骤S117,如果困难样本的数量超过预设阈值,自动开启自优化进程,对所述困难样本进行去重处理。
如图2所示,对所述困难样本进行去重处理包括:
步骤S201,根据图像像素直方图分布计算困难样本之间的相似度,采用下式:
Figure BDA0002488922090000081
式中,P为相似度,gi,si分别为两张困难样本图片各自直方图曲线的第i个点,N为直方图曲线上的顶点序号。
步骤S202,判断两个困难样本的相似度P是否大于0.8。
步骤S203,如果所述相似度P大于0.8,删除两个困难样本图片中任意一张图片。
步骤S118,将去重处理后的困难样本与训练集合并为新的训练集,以利用YOLOv3网络根据所述新的训练集进行模型训练,得到训练迭代后的河道异物检测模型。
本发明数据来源主要有三部分:标记好的图片样本,检测错误的图片样本与不包含目标物体的背景图片样本。标记好的图片样本为正样本,背景图片不做标注,为负样本,正负样本构成训练数据集X,一起送入YOLOv3网络中训练;检测错误的样本称为困难样本,困难样本由人工更改其标签,然后与数据集X合并迭代训练。本发明为基于YOLOv3网络的目标检测问题,由训练好的最优权重模型检测无人机实时拍摄的视频,由模型对视频检测,识别视频中异物类别与坐标信息,并返回异物类别与具体信息,而不是将物体分为异物与非异物的分类问题。
本发明基于YOLOv3网络,性能上较YOLOv2有所提升,且本发明增加了自优化功能,能够将识别结果加以人工干预生成困难样本,当收集到的困难样本超过一定数量时,自优化会自动开启,随着测试过程的积累,不断触发自优化,提升模型准确率。本发明采用无人机实时拍摄传回视频作为数据来源,减少了人工干预,同时将检测结果生成的异物图像实时反馈到给社会治理平台服务端,实现异物“早发现,早治理”目标。本发明在检测到异物后,平台上会有人工进行处置。本发明会收集检测到的物体图片以及人工处置的结果,并将人工处置的结果转换为训练模型所对应的标签。当收集到的物体图片数量到达指定的阈值后,本发明会自动开启模型训练的进程。随着时间的推移,本发明获得的人工反馈变多,在线训练迭代的次数也变多,模型的效果会逐渐优化,准确率会逐渐提升。本发明以河道治理为主要目的,基于YOLOv3实时检测,模型稳定性高,检测识别性能好,能排除外界因素的影响,达到“精准治理”的目的。本发明与社会治理平台结合,治理联动实现异常自动上报预警功能,在水体治理、水域搜救、水域事故预警方面均有重大作用。
如图3所示,本发明提供一种基于YOLOv3与自优化的河道异物检测装置,所述装置包括:
第一获取单元301,用于获取无人机拍摄的河道视频数据;
截取单元302,用于对所述河道视频数据按帧截取图片,得到初始数据集;
预处理单元303,用于对所述初始数据集进行预处理,得到河道图片数据集Q;
分组单元304,用于将所述河道图片数据集Q按预设比例分为训练集,验证集和测试集;
标记单元305,用于将所述训练集,验证集和测试集中的图片数据按照异物策略中制定的异物类别进行标记,得到与所述图片数据一一对应的标记数据集,所述标记数据集包括异物标注框坐标和异物类别信息;
数据增强单元306,用于对所述训练集及相应的标记数据集进行数据增强处理;
模型训练单元307,用于利用YOLOv3网络对数据增强处理后的训练集以及相应的标记数据集进行模型训练,得到多个权重的河道异物检测模型;
模型验证单元308,用于将所述验证集和验证集的标记数据集输入YOLOv3网络,在模型训练的同时对模型进行验证,获得模型当前的准确率,以便于及时调整模型参数,获得最优权重模型;
模型测试单元309,用于在模型训练完成后,利用测试集和测试集标记数据集对最优权重模型进行测试;
第二获取单元310,用于获取无人机拍摄的实时河道视频数据;
检测单元311,用于将所述实时河道视频数据输入所述最优权重模型进行河道异物检测,获得河道异物检测结果;
返回单元312,用于将河道异物检测结果以截图的形式返回给社会治理平台服务端相关人员进行人工审核;
第一判断单元313,用于根据人工审核结果判断所述河道异物检测结果是否正确;
通知单元314,用于如果所述河道异物检测结果正确,发出河道异物警告信息,以通知相关人员进行处理;
修改单元315,用于在所述河道异物检测结果不正确的情况下,接收相关人员对异物类别信息的修改信息,将修改后的图片样本作为困难样本;
第二判断单元316,用于判断困难样本的数量是否超过预设阈值;
去重单元317,用于在困难样本的数量超过预设阈值的情况下,自动开启自优化进程,对所述困难样本进行去重处理;
合并单元318,用于将去重处理后的困难样本与训练集合并为新的训练集,以利用YOLOv3网络根据所述新的训练集进行模型训练,得到训练迭代后的河道异物检测模型。
本发明实施例还提供一种存储介质,本发明实施例还提供一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现本发明提供的基于YOLOv3与自优化的河道异物检测方法的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:Read-OnlyMemory,简称:ROM)或随机存储记忆体(英文:RandomAccessMemory,简称:RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于基于YOLOv3与自优化的河道异物检测装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims (10)

1.一种基于YOLOv3与自优化的河道异物检测方法,其特征在于,所述方法包括:
获取无人机拍摄的河道视频数据;
对所述河道视频数据按帧截取图片,得到初始数据集;
对所述始数据集进行预处理,得到河道图片数据集Q;
将所述河道图片数据集Q按预设比例分为训练集,验证集和测试集;
将所述训练集,验证集和测试集中的图片数据按照异物策略中制定的异物类别进行标记,得到与所述图片数据一一对应的标记数据集,所述标记数据集包括异物标注框坐标和异物类别信息;
对所述训练集及相应的标记数据集进行数据增强处理;
利用YOLOv3网络对数据增强处理后的训练集以及相应的标记数据集进行模型训练,得到多个权重的河道异物检测模型;
将所述验证集和验证集的标记数据集输入YOLOv3网络,在模型训练的同时对模型进行验证,获得模型当前的准确率,以便于及时调整模型参数,获得最优权重模型;
在模型训练完成后,利用测试集和测试集标记数据集对最优权重模型进行测试;
获取无人机拍摄的实时河道视频数据;
将所述实时河道视频数据输入所述最优权重模型进行河道异物检测,获得河道异物检测结果;
将河道异物检测结果以截图的形式返回给社会治理平台服务端相关人员进行人工审核;
根据人工审核结果判断所述河道异物检测结果是否正确;
如果所述河道异物检测结果正确,发出河道异物警告信息,以通知相关人员进行处理;
如果所述河道异物检测结果不正确,接收相关人员对异物类别信息的修改信息,将修改后的图片样本作为困难样本;
判断困难样本的数量是否超过预设阈值;
如果困难样本的数量超过预设阈值,自动开启自优化进程,对所述困难样本进行去重处理;
将去重处理后的困难样本与训练集合并为新的训练集,以利用YOLOv3网络根据所述新的训练集进行模型训练,得到训练迭代后的河道异物检测模型。
2.如权利要求1所述的方法,其特征在于,对所述始数据集进行预处理,得到河道图片数据集Q的步骤中,对失真、变形、模糊的图片数据进行筛选和校正,得到所述河道图片数据集Q。
3.如权利要求1所述的方法,其特征在于,将所述河道图片数据集Q按预设比例分为训练集,验证集和测试集的步骤中,按照8:1:1的比例将所述河道图片数据集Q分为训练集,验证集和测试集。
4.如权利要求1所述的方法,其特征在于,将所述训练集,验证集和测试集中的图片数据按照异物策略中制定的异物类别进行标记,得到与所述图片数据一一对应的标记数据集包括:
对所述训练集,验证集和测试集的每一张图片中的每一个在异物类别中的物体用矩形框框选物体,并存储矩形框在图片中的位置,所述位置包括矩形框左上角与右下角坐标信息,同时对所述物体的类别进行标记,将标记后的信息生成XML文件,形成与标记的图片一一对应的标记数据集。
5.如权利要求4所述的方法,其特征在于,所述异物类别包括桥梁、水草、船、浮萍、落叶、牛奶盒、树枝、瓶子、塑料垃圾、塑料袋、球形物体和人。
6.如权利要求1所述的方法,其特征在于,对所述训练集以及相应的标记数据集进行数据增强处理的步骤中,将标记好的训练集图片通过数据增强的方式增加至原始训练数据的2~10倍。
7.如权利要求1所述的方法,其特征在于,对所述训练集以及相应的标记数据集进行数据增强处理包括:
采用翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换或反射变换,以及SamplePairing方法进行数据增强处理,所述SamplePairing方法为随机选择两个样本xa和xb,这两个样本对应的标签分别为ya和yb,从ya和yb中随机选择一个标签为y,则得出以下结论:(xa+xb)/2=Z,Z为新样本,其标签为y。
8.如权利要求1所述的方法,其特征在于,利用YOLOv3网络对数据增强处理后的训练集以及相应的标记数据集进行模型训练,得到多个权重的河道异物检测模型的步骤中,将标记好的图片样本与背景图片样本一起送入YOLOv3网络,标记好的图片为正样本,背景图片不含有异物类别中的物体,因此不做标注,未标注的背景图片为负样本,正负样本一起在YOLOv3网络中训练,通过迭代训练获得多个权重的河道异物检测模型。
9.如权利要求1所述的方法,其特征在于,对所述困难样本进行去重处理包括:
根据图像像素直方图分布计算困难样本之间的相似度,采用下式:
Figure FDA0002488922080000021
式中,P为相似度,gi,si分别为两张困难样本图片各自直方图曲线的第i个点,N为直方图曲线顶点的序号;
判断两个困难样本的相似度P是否大于0.8;
如果所述相似度P大于0.8,删除两个困难样本图片中任意一张图片。
10.一种基于YOLOv3与自优化的河道异物检测装置,其特征在于,所述装置包括:
第一获取单元,用于获取无人机拍摄的河道视频数据;
截取单元,用于对所述河道视频数据按帧截取图片,得到初始数据集;
预处理单元,用于对所述始数据集进行预处理,得到河道图片数据集Q;
分组单元,用于将所述河道图片数据集Q按预设比例分为训练集,验证集和测试集;
标记单元,用于将所述训练集,验证集和测试集中的图片数据按照异物策略中制定的异物类别进行标记,得到与所述图片数据一一对应的标记数据集,所述标记数据集包括异物标注框坐标和异物类别信息;
数据增强单元,用于对所述训练集及相应的标记数据集进行数据增强处理;
模型训练单元,用于利用YOLOv3网络对数据增强处理后的训练集以及相应的标记数据集进行模型训练,得到多个权重的河道异物检测模型;
模型验证单元,用于将所述验证集和验证集的标记数据集输入YOLOv3网络,在模型训练的同时对模型进行验证,获得模型当前的准确率,以便于及时调整模型参数,获得最优权重模型;
模型测试单元,用于在模型训练完成后,利用测试集和测试集标记数据集对最优权重模型进行测试;
第二获取单元,用于获取无人机拍摄的实时河道视频数据;
检测单元,用于将所述实时河道视频数据输入所述最优权重模型进行河道异物检测,获得河道异物检测结果;
返回单元,用于将河道异物检测结果以截图的形式返回给社会治理平台服务端相关人员进行人工审核;
第一判断单元,用于根据人工审核结果判断所述河道异物检测结果是否正确;
通知单元,用于如果所述河道异物检测结果正确,发出河道异物警告信息,以通知相关人员进行处理;
修改单元,用于在所述河道异物检测结果不正确的情况下,接收相关人员对异物类别信息的修改信息,将修改后的图片样本作为困难样本;
第二判断单元,用于判断困难样本的数量是否超过预设阈值;
去重单元,用于在困难样本的数量超过预设阈值的情况下,自动开启自优化进程,对所述困难样本进行去重处理;
合并单元,用于将去重处理后的困难样本与训练集合并为新的训练集,以利用YOLOv3网络根据所述新的训练集进行模型训练,得到训练迭代后的河道异物检测模型。
CN202010399599.6A 2020-05-12 2020-05-12 一种基于YOLOv3与自优化的河道异物检测方法及装置 Active CN111723657B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010399599.6A CN111723657B (zh) 2020-05-12 2020-05-12 一种基于YOLOv3与自优化的河道异物检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010399599.6A CN111723657B (zh) 2020-05-12 2020-05-12 一种基于YOLOv3与自优化的河道异物检测方法及装置

Publications (2)

Publication Number Publication Date
CN111723657A true CN111723657A (zh) 2020-09-29
CN111723657B CN111723657B (zh) 2023-04-07

Family

ID=72564326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010399599.6A Active CN111723657B (zh) 2020-05-12 2020-05-12 一种基于YOLOv3与自优化的河道异物检测方法及装置

Country Status (1)

Country Link
CN (1) CN111723657B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183463A (zh) * 2020-10-23 2021-01-05 珠海大横琴科技发展有限公司 基于雷达图像的船只识别模型的验证方法及装置
CN112733666A (zh) * 2020-12-31 2021-04-30 湖北亿咖通科技有限公司 一种难例图像的搜集、及模型训练方法、设备及存储介质
CN112766141A (zh) * 2020-12-31 2021-05-07 北京中科晶上科技股份有限公司 一种烟草卷包设备异物检测方法及系统
CN115147770A (zh) * 2022-08-30 2022-10-04 山东千颐科技有限公司 基于图像处理的皮带异物视觉识别系统
CN115294536A (zh) * 2022-08-10 2022-11-04 北京百度网讯科技有限公司 基于人工智能的违章检测方法、装置、设备及存储介质
CN116091719A (zh) * 2023-03-06 2023-05-09 山东建筑大学 一种基于物联网的河道数据管理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018137357A1 (zh) * 2017-01-24 2018-08-02 北京大学 一种目标检测性能优化的方法
WO2018208947A1 (en) * 2017-05-09 2018-11-15 Blue River Technology Inc. Automated plant detection using image data
CN110738230A (zh) * 2019-04-15 2020-01-31 中国石油大学(华东) 一种基于f-cdssd的衣物识别与分类方法
CN110796048A (zh) * 2019-10-18 2020-02-14 武汉大学 一种基于深度神经网络的船舰目标实时检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018137357A1 (zh) * 2017-01-24 2018-08-02 北京大学 一种目标检测性能优化的方法
WO2018208947A1 (en) * 2017-05-09 2018-11-15 Blue River Technology Inc. Automated plant detection using image data
CN110738230A (zh) * 2019-04-15 2020-01-31 中国石油大学(华东) 一种基于f-cdssd的衣物识别与分类方法
CN110796048A (zh) * 2019-10-18 2020-02-14 武汉大学 一种基于深度神经网络的船舰目标实时检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周雯等: "基于深度学习的动车组运行安全图像异物检测", 《交通信息与安全》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183463A (zh) * 2020-10-23 2021-01-05 珠海大横琴科技发展有限公司 基于雷达图像的船只识别模型的验证方法及装置
CN112733666A (zh) * 2020-12-31 2021-04-30 湖北亿咖通科技有限公司 一种难例图像的搜集、及模型训练方法、设备及存储介质
CN112766141A (zh) * 2020-12-31 2021-05-07 北京中科晶上科技股份有限公司 一种烟草卷包设备异物检测方法及系统
CN115294536A (zh) * 2022-08-10 2022-11-04 北京百度网讯科技有限公司 基于人工智能的违章检测方法、装置、设备及存储介质
CN115147770A (zh) * 2022-08-30 2022-10-04 山东千颐科技有限公司 基于图像处理的皮带异物视觉识别系统
CN116091719A (zh) * 2023-03-06 2023-05-09 山东建筑大学 一种基于物联网的河道数据管理方法及系统
CN116091719B (zh) * 2023-03-06 2023-06-20 山东建筑大学 一种基于物联网的河道数据管理方法及系统

Also Published As

Publication number Publication date
CN111723657B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN111723657B (zh) 一种基于YOLOv3与自优化的河道异物检测方法及装置
CN111259809B (zh) 基于DANet的无人机海岸线漂浮垃圾巡检系统
CN107563372B (zh) 一种基于深度学习ssd框架的车牌定位方法
CN109034044B (zh) 一种基于融合卷积神经网络的行人再识别方法
CN111723654B (zh) 基于背景建模、YOLOv3与自优化的高空抛物检测方法及装置
CN109344753A (zh) 一种基于深度学习的航拍图像输电线路细小金具识别方法
CN112837315B (zh) 一种基于深度学习的输电线路绝缘子缺陷检测方法
CN113160062B (zh) 一种红外图像目标检测方法、装置、设备及存储介质
CN113643228B (zh) 一种基于改进的CenterNet网络的核电站设备表面缺陷检测方法
CN112560623B (zh) 一种基于无人机的红树植物种类快速识别方法
CN116385958A (zh) 一种用于电网巡检和监控的边缘智能检测方法
Gleason et al. A Fusion Approach for Tree Crown Delineation from Lidar Data.
CN115861619A (zh) 一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与系统
CN111126155A (zh) 一种基于语义约束生成对抗网络的行人再识别方法
Meng et al. Physical knowledge-enhanced deep neural network for sea surface temperature prediction
CN114549909A (zh) 一种基于自适应阈值的伪标签遥感图像场景分类方法
Zhang et al. Land use and land cover classification base on image saliency map cooperated coding
Lou et al. Research on edge detection method based on improved HED network
CN112418262A (zh) 车辆再识别的方法、客户端及系统
CN116580243A (zh) 一种掩码图像建模引导域适应的跨域遥感场景分类方法
He et al. An efficient urban flood mapping framework towards disaster response driven by weakly supervised semantic segmentation with decoupled training samples
Deng et al. A paddy field segmentation method combining attention mechanism and adaptive feature fusion
Mu et al. Small scale dog face detection using improved Faster RCNN
Park et al. Slash or burn: Power line and vegetation classification for wildfire prevention
CN116071624B (zh) 一种基于主动学习的抽烟检测数据标注方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240118

Address after: No. N3013, 3rd Floor, R&D Building N, Artificial Intelligence Science and Technology Park, Wuhan Economic and Technological Development Zone, Wuhan City, Hubei Province, 430058

Patentee after: Zhongdian Cloud Computing Technology Co.,Ltd.

Patentee after: CHINA ELECTRONIC SYSTEM TECHNOLOGY Co.,Ltd.

Address before: No.49 Fuxing Road, Haidian District, Beijing 100036

Patentee before: CHINA ELECTRONIC SYSTEM TECHNOLOGY Co.,Ltd.