CN109598293B - 基于类别平衡采样的无人机巡检航拍图片批处理训练方法 - Google Patents
基于类别平衡采样的无人机巡检航拍图片批处理训练方法 Download PDFInfo
- Publication number
- CN109598293B CN109598293B CN201811407794.8A CN201811407794A CN109598293B CN 109598293 B CN109598293 B CN 109598293B CN 201811407794 A CN201811407794 A CN 201811407794A CN 109598293 B CN109598293 B CN 109598293B
- Authority
- CN
- China
- Prior art keywords
- defect
- category
- normal
- random
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
Abstract
本发明公开了一种基于类别平衡采样的无人机巡检航拍图片数据样本批处理训练方法,步骤如下:S1、按照正常、缺陷类别对无人机巡检航拍图进行排序,分别计算出缺陷、正常类别数据样本的数量;S2、根据正常类别样本数分别对正常类与缺陷类生成随机排列的列表,将随机列表的随机数对各自对应的类别样本数取余,所得的结果作为对应的索引值;S3、根据索引值提取对应类别的图片数据以生成图片随机列表;S4、将正常类别与缺陷类别的图像随机列表结合在一起,并且打乱顺序,使得缺陷类别数据样本数与正常类别样本数相同;S5、根据上述图像最终列表批处理训练模型,当本轮训练结束后,重复上述操作进行下一轮训练。
Description
技术领域
本发明涉及机器学习技术领域,具体涉及一种基于类别平衡采样的无人机巡检航拍图片数据样本批处理训练方法。
背景技术
架空输电线路因其结构简单、施工和检修维护方便等优点而在电力传输上得到广泛应用。为确保电网能够安全稳定的运行,巡检人员必须进行架空输电线路的定期检查。传统检测方式主要依靠人工开展,人工开展巡检工作不仅要耗费大量人力物力,周围的环境因素还大大缩减了检查范围。因此,无人机巡检技术相继得到了广泛的应用,它们搭载照相或摄像设备沿输电线路走廊飞行,近距离拍摄线路获取航拍图像,人工标注航拍图像中架空输电线路的缺陷部位。
传统的图像标注是人工完成的,对图像的理解与标注相对准确,但在大数据环境下,人工标注工作量十分巨大,并且容易受到主观经验的影响,对同一幅图像的理解不一致。近几年,随着深度学习的发展,于是有学者提出了利用计算机技术实现图像的自动标注。智能检测方法因其优良的性能、符合现代智能化和自动化的要求而逐渐受到重视。机器学习作为人工智能的一个重要分支,是使计算机具有智能的根本途径,让机器从数据中学习,进而得到一个更加符合现实规律的模型,通过对模型的使用使得机器比以往表现的更好。深度学习作为机器学习的分支,在缺陷检测方面发挥着极其重要的作用。因此,将深度学习与现代巡检技术相结合,在电力缺陷检测方面具有很高的便利性与优越性。
近几年来,基于图像的缺陷检测问题,随着深度学习的深入研究,缺陷检测方面取得了可观的成就,与此同时,基于深度学习的缺陷检测技术仍然存在不少的关键问题有待于解决。
在机器学习的经典假设中往往假定训练样本各个类别是同等数量的,即各类别样本数目是均衡(平衡)的,但电力系统领域中的缺陷检测这一实际任务是不符合这一假设的,电力系统大部分时间是处于安全、稳定的运行状态的,缺陷数据样本只占少数,大部分样本是正常的。一般来说,这种不平衡的训练样本会导致训练模型在测试集上侧重样本数目比较多的类别,也就是正常类别,而“轻视”样本数目比较少的缺陷类别,这样,模型在测试集上的泛化能力就会受到影响。因此,为了进一步提升模型泛化能力、解决网络训练时无人机巡检航拍图中的不平衡样本处理问题,在原有深度学习算法模型批处理训练中做出相应的改进,才能满足现代智能巡检要求。因此,有必要针对上述问题,提出一种基于类别平衡采样的无人机巡检航拍图片数据样本批处理训练方法。
发明内容
本发明的目的在于解决基于深度学习的电力缺陷检测中正负数据样本不平衡这一问题,提供一种基于类别平衡采样的无人机巡检航拍图片数据样本批处理训练方法,能够有效缓解电力缺陷检测中正负数据样本不平衡导致的训练模型在测试集上侧重样本数目比较多的正常类别这一问题。
本发明的目的可以通过采取如下技术方案达到:
一种基于类别平衡采样的无人机巡检航拍图片数据样本批处理训练方法,包括以下步骤:
S1、按照类别对图片排序,统计各个类别包含数据样本的数量;
S2、根据某类最多样本数对各个类生成随机列表,使用随即列表中的数值对相应类别样本数求余,得到相应的索引值;
S3、根据索引值提取对应类别的图片数据以生成图片随机列表;
S4、将以上每一类别的数据样本随机列表整合在一起,然后打乱顺序,得到最终的图片列表;
S5、最终,使用最终的图片列表进行批处理训练,直至本轮训练结束,重复上述操作进行下一轮训练。
作为优选的技术方案,步骤S1的具体过程如下:
针对某一类特定电力缺陷,将无人机巡检航拍图分成正常类别与缺陷类,并且按类别对数据样本排序,然后统计各类样本数量;
作为优选的技术方案,步骤S2的具体过程如下:
由于电力缺陷样本中缺陷类别数据量远少于正常类别,以数量居多的正常类别样本数为基准,即此时正常类别样本数作为某类最多样本数,分别生成缺陷类别、正常类别随机列表,每个随机列表随机数的个数要与正常类别样本数相同,之后将每一个列表中的随机数除以相应类别数,并将余数结果作为索引值;
作为优选的技术方案,步骤S3的具体过程如下:
根据步骤S2中的索引值从属于该类别的数据中获取相应图片,将获取的图片生成图片随机列表;
作为优选的技术方案,步骤S4的具体过程如下:
将正常类别的图片随机列表与缺陷类别的图片随机列表放在一起,打乱图片以及相应标签的顺序;
作为优选的技术方案,步骤S5的具体过程如下:
将S4中打乱顺序后的图片随机列表用于批处理训练深度学习缺陷检测模型,直至本轮训练结束,重复上述步骤,进行下一轮的训练。
本发明相对于现有技术具有如下的优点及效果:
1、本发明方法采用类别平衡采样方法,使得最终训练用的数据样本中正常类别数据量与缺陷类样本数目相同,有效提高了训练模型的泛化能力;
2、本发明方法易于实现,所有操作以原始图像列表为基础即可完成,并且均可以在内存中在线实现。
附图说明
图1是无人机航拍电力金具示例图,其中,图1(a)是闭口销正常的示例图,图1(b)是闭口销松动的示例图,图1(c)是闭口销缺失的示例图,图1(d)是螺栓松动的示例图;
图2是本发明中类别重组法示例图;
图3是示例流程图
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1无人机航拍图所示,电力金具闭口销有正常与缺陷两种状态,缺陷可以细分为松动与缺失两种状态,图2所示的类别重组法的示例图将其简单概括为排序、计数、重组、取余、乱序,图3所示的算法流程图展示了闭口销缺陷检测的模型批处理训练实施例流程图,包括以下步骤:
S1、整理针对电力金具的无人机航拍图,根据金具上的闭口销正常与否将数据样本分成正常与缺陷两类,统计每一类样本数量,正常类样本数记作a,缺陷类样本数用b表示(本例a=600,b=256);
S2、由于正常类别样本数偏多,以数值a为基准,每个列表在1~600之间生成600个不同随机数,采用正常类别对应的列表随机数对600取余,采用缺陷类别对应的列表随机数对256求余,得到各自类别的索引值;
S3、在步骤S2中的索引值基础上添加图片文件格式“.jpg”生成相应的图片名称,得到图片随机列表;
S4、将随机列表中正常类别的图片和缺陷类别的图片混合在一起,并打乱顺序。此外,与图片相对应的标签也按照步骤S1~S4相同方法进行处理,这样才可以保证每一张图片对应着相应的标签;
S5、使用最终图片列表以及相对应的标签批处理训练模型,直至本轮训练结束,重复上述操作进行下一轮训练,直至达到预先指定的训练轮数。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (3)
1.一种基于类别平衡采样的无人机巡检航拍图片数据样本批处理训练方法,其特征在于,所述的训练方法包括以下步骤:
S1、按照类别对图片排序,统计各个类别包含数据样本的数量;
S2、根据某类最多样本数对各个类别生成随机列表,使用随机列表中的数值对相应类别样本数取余,得到相应的索引值;所述的步骤S2具体如下:
根据电力缺陷样本中缺陷类别数据量远少于正常类别数据量,以正常类别样本数据量为基准,分别生成缺陷类别、正常类别随机列表,将每一个列表中的随机数除以相应类别数,并将最终余数结果作为索引值;
S3、根据所述的索引值从属于该类别的数据样本中提取图片,将获取的图片生成各自类别的图片随机列表;
S4、将以上每一类别的图片随机列表整合在一起,然后打乱顺序,得到最终的图片列表;
S5、使用最终的图片列表进行批处理训练深度学习缺陷检测模型,直至本轮训练结束,重复上述操作进行下一轮训练。
2.根据权利要求1所述的基于类别平衡采样的无人机巡检航拍图片数据样本批处理训练方法,其特征在于,所述的步骤S1具体如下:
针对某一类电力缺陷,将无人机巡检航拍图分成正常类别与缺陷类别,并且按类别排序,分别计算正常类别与缺陷类别的数据样本数量。
3.根据权利要求2所述的基于类别平衡采样的无人机巡检航拍图片数据样本批处理训练方法,其特征在于,所述的步骤S4具体如下:
将正常类别的图像随机列表与缺陷类别的图像随机列表放在一起,打乱图片以及相应标签的顺序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811407794.8A CN109598293B (zh) | 2018-11-23 | 2018-11-23 | 基于类别平衡采样的无人机巡检航拍图片批处理训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811407794.8A CN109598293B (zh) | 2018-11-23 | 2018-11-23 | 基于类别平衡采样的无人机巡检航拍图片批处理训练方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109598293A CN109598293A (zh) | 2019-04-09 |
CN109598293B true CN109598293B (zh) | 2023-04-07 |
Family
ID=65959610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811407794.8A Active CN109598293B (zh) | 2018-11-23 | 2018-11-23 | 基于类别平衡采样的无人机巡检航拍图片批处理训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109598293B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529033A (zh) * | 2020-09-22 | 2021-03-19 | 陕西土豆数据科技有限公司 | 一种解决遥感影像多分类场景分割算法数据不均衡的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104732242A (zh) * | 2015-04-08 | 2015-06-24 | 苏州大学 | 一种多分类器构建方法和系统 |
CN105138527A (zh) * | 2014-05-30 | 2015-12-09 | 华为技术有限公司 | 一种数据分类回归方法及装置 |
CN107273919A (zh) * | 2017-05-27 | 2017-10-20 | 南京理工大学 | 一种基于置信度构造类属字典的高光谱无监督分类方法 |
CN108510058A (zh) * | 2018-02-28 | 2018-09-07 | 中国科学院计算技术研究所 | 神经网络中的权重存储方法以及基于该方法的处理器 |
-
2018
- 2018-11-23 CN CN201811407794.8A patent/CN109598293B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105138527A (zh) * | 2014-05-30 | 2015-12-09 | 华为技术有限公司 | 一种数据分类回归方法及装置 |
CN104732242A (zh) * | 2015-04-08 | 2015-06-24 | 苏州大学 | 一种多分类器构建方法和系统 |
CN107273919A (zh) * | 2017-05-27 | 2017-10-20 | 南京理工大学 | 一种基于置信度构造类属字典的高光谱无监督分类方法 |
CN108510058A (zh) * | 2018-02-28 | 2018-09-07 | 中国科学院计算技术研究所 | 神经网络中的权重存储方法以及基于该方法的处理器 |
Also Published As
Publication number | Publication date |
---|---|
CN109598293A (zh) | 2019-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110033453B (zh) | 基于改进YOLOv3的输变电线路绝缘子航拍图像故障检测方法 | |
CN107742093B (zh) | 一种红外图像电力设备部件实时检测方法、服务器及系统 | |
CN111598164B (zh) | 识别目标对象的属性的方法、装置、电子设备和存储介质 | |
WO2022017163A1 (zh) | 图像处理方法、装置、设备及存储介质 | |
CN108365557A (zh) | 一种无人机精细化巡检输电线路的方法及系统 | |
CN110472510A (zh) | 基于红外及可见图像的电力设备故障检测方法及评估设备 | |
CN110580529A (zh) | 一种输电通道无人机精细化巡检数据的自动分析管理方法、系统及存储介质 | |
CN113515655B (zh) | 一种基于图像分类的故障识别方法及装置 | |
CN109598772B (zh) | 基于架空输电线路单一缺陷自动标注图片数据源扩充方法 | |
CN109598293B (zh) | 基于类别平衡采样的无人机巡检航拍图片批处理训练方法 | |
CN116109207A (zh) | 一种工程质量管理方法及系统 | |
CN109086737A (zh) | 基于卷积神经网络的航运货物监控视频识别方法及系统 | |
CN109614888B (zh) | 基于架空输电线路缺陷辅助数据集的深度学习缺陷检测模型训练方法 | |
WO2023065640A1 (zh) | 一种模型参数调整方法、装置、电子设备和存储介质 | |
CN109598349A (zh) | 基于类别随机采样的架空输电线路缺陷检测数据样本批处理训练方法 | |
CN113253757B (zh) | 一种无人机巡检方法及系统 | |
CN112561276B (zh) | 作业操作风险演示方法及装置、存储介质、电子装置 | |
CN113806574A (zh) | 一种软硬件一体化的人工智能图像识别数据处理方法 | |
CN116977260A (zh) | 目标物的缺陷检测方法、装置、电子设备及存储介质 | |
CN108564125A (zh) | 一种绝缘子图像分类方法及系统 | |
CN114170515A (zh) | 一种配电网设备异常类型检测方法 | |
CN111783899B (zh) | 一种自主学习识别新型违禁品的方法 | |
CN113971627B (zh) | 一种车牌图片生成方法及装置 | |
Sun et al. | Research on the application of YOLOv4 in power inspection | |
CN113920424A (zh) | 一种变电巡检机器人视物提取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |