CN114529751A - 一种电力场景智能识别样本数据的自动筛选方法 - Google Patents

一种电力场景智能识别样本数据的自动筛选方法 Download PDF

Info

Publication number
CN114529751A
CN114529751A CN202111630943.9A CN202111630943A CN114529751A CN 114529751 A CN114529751 A CN 114529751A CN 202111630943 A CN202111630943 A CN 202111630943A CN 114529751 A CN114529751 A CN 114529751A
Authority
CN
China
Prior art keywords
power scene
algorithm model
data
target detection
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111630943.9A
Other languages
English (en)
Inventor
陈亮
刘垚宏
李�诚
徐彤
易伟
喻婷
杨斯旭
唐海东
汪晓帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Sichuan Electric Power Co Ltd
Original Assignee
State Grid Sichuan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Sichuan Electric Power Co Ltd filed Critical State Grid Sichuan Electric Power Co Ltd
Priority to CN202111630943.9A priority Critical patent/CN114529751A/zh
Publication of CN114529751A publication Critical patent/CN114529751A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/535Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种电力场景智能识别样本数据的自动筛选方法,属于数据筛选技术领域,包括如下步骤:录入电力场景样本,构建电力场景筛选样本库;构建的电力场景筛选样本库,分别构建目标检测算法模型、图像分类算法模型和图像检索算法模型;通过图像检索算法模型对待筛选电力场景数据进行图像检索,筛除不合规的电力场景数据;通过构建的目标检测算法模型对图像检索合规的电力场景数据中的电力设备进行定位,对图像检索合规的电力场景数据中定位的电力设备同步进行图像分类和目标检测,得到分类后的电力场景数据。本发明从目标检测、图像分类、图片检索三个方面着手,结合相关的深度学习算法对数据进行筛选,实现电力场景数据筛选的自动筛选。

Description

一种电力场景智能识别样本数据的自动筛选方法
技术领域
本发明属于数据筛选技术领域,具体涉及一种电力场景智能识别样本数据 的自动筛选方法。
背景技术
电网是高效快捷的能源输送通道和优化配置平台,是能源电力可持续发 展的关键环节,在现代能源供应体系中发挥着重要的枢纽作用,关系国家能 源安全。隐患,一直是重大风险事故的“前奏曲”。近年来,电力公司日均 现场作业点和现场作业人员有数量不断增加。人多面广,潜藏风险众多,依靠 传统“人盯人”的监管模式来发现隐患显然不合实际,因此需要在兼顾效率 的同时把风险消灭在“萌芽”。目前电力各业务场景的数据存在大量重复, 或者因为摄像头位置变化造成场景数据不合规,会造成数据分类或者预测错 误问题,常采用人工方式来进行筛选处理,因此在图像识别算法模型的前期 准备阶段能够处理样本数据的准确标记,使得图像识别模型算法能够准确学 习图像中的目标特征。因此须对电力样本数据进行自动化和可视化相关研究, 达到降低从业人员的劳动强度,提高处理效率。
针对电力业务场景数据大量重复的客观问题,常采用人工方式来进行筛 选处理重复和不合规的场景数据。但是,人工筛选的方式有以下三方面缺点:
(1)、在数据量巨大的情况下,从业人员劳动强度大,筛选成本高;
(2)、人工筛选效率低;
(3)、筛选具有个人主观性,没有具体量化评价标准。
对电力样本数据进行自动筛选和可视化相关研究,可达到降低从业人员 的劳动强度,提高处理效率的目的。因此,需要设计一种筛选方法或筛选系 统,以满足自动筛选的需求。
发明内容
本发明所要解决的技术问题便是针对上述现有技术的不足,提供一种电 力场景智能识别样本数据的自动筛选方法,从目标检测、图像分类、图片检 索三个方面着手,结合相关的深度学习算法对数据进行筛选,实现电力场景 数据筛选的自动筛选。
本发明所采用的技术方案是:一种电力场景智能识别样本数据的自动筛 选方法,包括如下步骤:
步骤10、录入电力场景样本,对录入的电力场景样本中的电力设备进行 标注,构建电力场景筛选样本库;
步骤20、基于步骤10中构建的电力场景筛选样本库,分别构建目标检测 算法模型、图像分类算法模型和图像检索算法模型;
步骤30、获取待筛选电力场景数据,通过步骤20中构建的图像检索算法 模型对待筛选电力场景数据进行图像检索,筛除不合规的电力场景数据,得 到图像检索合规的电力场景数据,具体如下:
步骤301、获取待筛选电力场景数据;
步骤302、将获取的待筛选电力场景数据与图像检索算法模型中的数据进 行比对;
步骤303、根据对比结果,得到与图像检索算法模型中的电力场景样本相 似的图像检索合规的电力场景数据,并筛除不合规的电力场景数据;
步骤40、获取图像检索合规的电力场景数据,通过步骤20中构建的目标 检测算法模型对图像检索合规的电力场景数据中的电力设备进行定位,并通 过步骤20中构建的图像分类算法模型和目标检测算法模型对图像检索合规的 电力场景数据中定位的电力设备同步进行图像分类和目标检测,筛除不合规 的电力场景数据,得到分类后的电力场景数据,具体如下:
步骤401、获取图像检索合规的电力场景数据;
步骤402、检索图像检索合规的电力场景数据中电力设备并分别定位;
步骤403、将完成电力设备定位的图像检索合规的电力场景数据与图像分 类算法模型和目标检测算法模型中的电力场景样本进行比对,分别得到图像 检索合规的电力场景数据对应的预测类别;
步骤404、根据图像分类算法模型和目标检测算法模型得到的预测类别对 图像检索合规的电力场景数据进行类别确认,得到分类后的电力场景数据, 并筛除不合规的电力场景数据。
其中一个实施例中,还包括模型训练和测试步骤,具体如下:
将电力场景筛选样本库中的电力场景样本划分为训练集和测试集;
通过训练集对构建的目标检测算法模型、图像分类算法模型和图像检索 算法模型进行训练;
通过测试集对训练后的目标检测算法模型、图像分类算法模型和图像检 索算法模型进行测试,并根据测试结果调整目标检测算法模型、图像分类算 法模型和图像检索算法模型内的电力场景样本及电力场景样本的标注。
其中一个实施例中,所述训练集和测试集按比例进行划分且训练集和测 试集的电力场景样本不重合。
其中一个实施例中,所述的训练集的比例为60%-80%,所述的测试集的比 例为20%-40%。
其中一个实施例中,所述测试集测试目标检测算法模型过程中,针对测 试集中电力场景样本的电力设备标注框的大小和比例对目标检测算法模型中 电力场景样本的初始框进行调整。
其中一个实施例中,所述测试集测试目标检测算法模型过程中,如目标 检测算法模型的电力场景样本中存在多个电力设备,结合电力设备的标注结 果,对目标检测算法模型中的电力场景样本非极大值抑制的比例进行调整。
其中一个实施例中,步骤30中,步骤301和步骤302之间,还包括初步 筛选步骤,具体如下:
设置相似度阈值,根据设置的相似度阈值筛除与不合规的电力场景数据 相似的电力场景数据或将电力场景数据与图像检索算法模型中的电力场景样 本比对,筛除与图像检索算法模型中的电力场景样本相似度低的电力场景数 据,得到经初步筛选的电力场景数据,进入步骤302。
其中一个实施例中,步骤40中,还包括目标检测算法模型电力场景样本 增广步骤,具体如下:
基于目标检测算法模型中已标注的电力场景样本对通过目标检测算法模 型进行目标检测的电力场景数据进行标注,筛除无法标注的电力场景数据, 通过可标注的电力场景数据构建已标注数据集;
将已标注数据集录入电力场景筛选样本库,得到更新之后的电力场景样 本;
获取已录入到电力场景筛选样本库的电力场景样本增补至目标检测算法 模型。
其中一个实施例中,步骤404中,分别设置图像分类算法模型和目标检 测算法模型对电力设备的预测类别阈值,并对电力设备的预测类别设置不同 的概率,如图像分类算法模型和目标检测算法模型得到对电力场景数据中的 电力设备的预测概率均超过彼此的阈值时,预测结果可靠,重新加权投票得 到电力设备的最终类别,如图像分类算法模型和目标检测算法模型得到对电 力场景数据中的电力设备的预测概率均未超过彼此的阈值时,预测结果不可 靠,通过人工判别电力设备的最终类别。
本发明的有益效果在于:
1、从目标检测、图像分类、图片检索三个方面着手,结合相关的深度学 习算法对数据进行筛选,实现电力场景数据筛选的自动筛选;
2、图像检索算法模型通过检索筛选图像质量,剔除质量差的数据,目标 检测算法模型配合图像分类算法模型同步进行比对,对电力场景数据进行分 类,三者结合,保证筛选及分类的效果;
3、模型训练和测试步骤的设置可对模型进行训练并对训练后的模型进行 测试,保证后续模型运行的准确度;
4、初步筛选步骤的设置,可在对电力场景数据进行检索前,筛除一部分 不合规的电力场景数据,以减少后续电力场景数据检索的工作量;
5、目标检测算法模型电力场景样本增广步骤的设置可不断更新目标检测 算法模型,通过不断的更新电力场景样本,增加目标检测算法模型的检测精度。
附图说明
图1为本发明流程框图;
图2为本发明步骤30流程框图;
图3为本发明步骤40流程框图;
图4为本发明目标检测算法流程示意图;
图5为本发明图像分类算法流程示意图;
图6为本发明图像检索算法流程示意图;
图7为本发明数据分析筛选和可视化数据处理系统框图。
具体实施方式
下面将结合附图及具体实施例对本发明作进一步详细说明。
如图1-图6所示,本发明公开了一种电力场景智能识别样本数据的自动筛 选方法,包括如下步骤:
步骤10、录入电力场景样本,对录入的电力场景样本中的电力设备进行 标注,构建电力场景筛选样本库;
步骤20、基于步骤10中构建的电力场景筛选样本库,分别构建目标检测 算法模型、图像分类算法模型和图像检索算法模型;
步骤30、获取待筛选电力场景数据,通过步骤20中构建的图像检索算法 模型对待筛选电力场景数据进行图像检索,筛除不合规的电力场景数据,得 到图像检索合规的电力场景数据,具体如下:
步骤301、获取待筛选电力场景数据;
步骤302、将获取的待筛选电力场景数据与图像检索算法模型中的数据进 行比对;
步骤303、根据对比结果,得到与图像检索算法模型中的电力场景样本相 似的图像检索合规的电力场景数据,并筛除不合规的电力场景数据;
步骤40、获取图像检索合规的电力场景数据,通过步骤20中构建的目标 检测算法模型对图像检索合规的电力场景数据中的电力设备进行定位,并通 过步骤20中构建的图像分类算法模型和目标检测算法模型对图像检索合规的 电力场景数据中定位的电力设备同步进行图像分类和目标检测,筛除不合规 的电力场景数据,得到分类后的电力场景数据,具体如下:
步骤401、获取图像检索合规的电力场景数据;
步骤402、检索图像检索合规的电力场景数据中电力设备并分别定位;
步骤403、将完成电力设备定位的图像检索合规的电力场景数据与图像分 类算法模型和目标检测算法模型中的电力场景样本进行比对,分别得到图像 检索合规的电力场景数据对应的预测类别;
步骤404、根据图像分类算法模型和目标检测算法模型得到的预测类别对 图像检索合规的电力场景数据进行类别确认,得到分类后的电力场景数据, 并筛除不合规的电力场景数据。
本实施例中,还包括模型训练和测试步骤,具体如下:
将电力场景筛选样本库中的电力场景样本划分为训练集和测试集;
通过训练集对构建的目标检测算法模型、图像分类算法模型和图像检索 算法模型进行训练;
通过测试集对训练后的目标检测算法模型、图像分类算法模型和图像检 索算法模型进行测试,并根据测试结果调整目标检测算法模型、图像分类算 法模型和图像检索算法模型内的电力场景样本及电力场景样本的标注。
本实施例中,所述训练集和测试集按比例进行划分且训练集和测试集的 电力场景样本不重合。
本实施例中,所述的训练集的比例为60%-80%,所述的测试集的比例为 20%-40%。
本实施例中,所述测试集测试目标检测算法模型过程中,针对测试集中 电力场景样本的电力设备标注框的大小和比例对目标检测算法模型中电力场 景样本的初始框进行调整。
本实施例中,所述测试集测试目标检测算法模型过程中,如目标检测算 法模型的电力场景样本中存在多个电力设备,结合电力设备的标注结果,对 目标检测算法模型中的电力场景样本非极大值抑制的比例进行调整。
本实施例中,步骤30中,步骤301和步骤302之间,还包括初步筛选步 骤,具体如下:
设置相似度阈值,根据设置的相似度阈值筛除与不合规的电力场景数据 相似的电力场景数据或将电力场景数据与图像检索算法模型中的电力场景样 本比对,筛除与图像检索算法模型中的电力场景样本相似度低的电力场景数 据,得到经初步筛选的电力场景数据,进入步骤302。
本实施例中,步骤40中,还包括目标检测算法模型电力场景样本增广步 骤,具体如下:
基于目标检测算法模型中已标注的电力场景样本对通过目标检测算法模 型进行目标检测的电力场景数据进行标注,筛除无法标注的电力场景数据, 通过可标注的电力场景数据构建已标注数据集;
将已标注数据集录入电力场景筛选样本库,得到更新之后的电力场景样 本;
获取已录入到电力场景筛选样本库的电力场景样本增补至目标检测算法 模型。
本实施例中,步骤404中,分别设置图像分类算法模型和目标检测算法模 型对电力设备的预测类别阈值,并对电力设备的预测类别设置不同的概率,如 图像分类算法模型和目标检测算法模型得到对电力场景数据中的电力设备的 预测概率均超过彼此的阈值时,预测结果可靠,重新加权投票得到电力设备的 最终类别,如图像分类算法模型和目标检测算法模型得到对电力场景数据中的 电力设备的预测概率均未超过彼此的阈值时,预测结果不可靠,通过人工判别 电力设备的最终类别。
本申请中,目标检测算法模型和图像分类算法模型主要实现数据标注的目 标;图像检索算法模型主要实现数据筛选目的,通过上述三个模型,可构建数 据分析筛选和可视化数据处理系统。构建的处理系统框架如图7。
本申请中,电力场景筛选样本库中的电力场景样本,需在对电力场景数据 筛选前进行构建。其中的电力场景样本需选择清晰度高、电力设备丰富且无歪 斜的图片,以更好的服务于相关的算法模型,最终提高算法上的性能。其中, 电力场景样本通过对数据的收集,预处理,筛选方法以及需要划分的训练集和 测试集比例的分析,并结合不同模型的训练结果得到。
训练集可以对相关的算法模型进行模型训练,使用测试集数据对训练好的 算法模型进行准确率、泛化性能、召回率等性能的评估,为研究人员进行算法 选取和算法改进提供实验依据。因此,电网系统规范操作数据集的收集方法, 训练集和测试集的划分比例和方法也应当进行科学的实验,避免数据的错误划 分影响实验结果。具体来讲,在收集图片数据的过程中需要将来不合规数据与 合规数据进行准确区分。针对合规数据的选取,需要区分需要局部细节图、检 测抠图错误等因素导致同一场景下的存在不同物体的图片。此外,由于不同的 图片可能对应的是相同的场景,应当进行数据均衡操作,否则会导致分类类别 数目急剧膨胀,而且算法模型难于收敛。因此,在训练检索模型之前,需要完 成相似图片选取与合并两个环节。针对检索模型和标注模型的任务差异性较 大,应当建立检索模型数据库和分类模型数据库,才能实现对相应的算法模型 进行有效训练。针对已收集数据集的划分方法,主要有留出法、交叉验证法、 自助法;在实际的模型训练过程中应该根据数据集图片数据大小以及模型训练 结果对划分方法进行评估,避免因为划分方法选取不当影响实验结果,从而影 响后续研究的顺利开展。
本申请的图像检索算法根据查询区域的不同又分为实例检索和图片检索。 实例检索主要是查询与输入图片具有相同物体的其他图片,它主要比较的是不 同的实例对象区域之间的相关性,而不是两张图片之间的相关性。因此,实例 检索还应当在返回的图像中定位目标实例。只要求返回的内容与查询图像在视 觉上相似,无论它们是否共享相同的源。实例检索的首要步骤就是主体检测, 即先定位用户感兴趣的区域,去除掉背景对后续环节的干扰。主体检测基本是 大部分以图搜图产品的公认首要操作,主体检测的算法各有差异,如目标检测 算法、显著性区域预测等算法。为了解放用户,希望算法能够自动定位物体区 域,考虑到显著性区域预测很难处理多个物体出现在视野的情况,应当采用更 加精确的物体检测算法来定位物体位置,并选择置信度最高的物体图片进行后 续的图像检索以及可视化展示。
图片检索需要依靠整张图片的特征来查找其他相似的图片。鉴于图像的全 局特征主要包含图片的内容信息,而局部特征包含图像特征区域的几何信息, 这就导致全局特征在召回率方面的性能更佳,而局部特征则侧重在预测方面。 全局特征可以学习不同姿态下的相似性,而局部特征无法学到这种对应关系; 而基于局部特征的几何验证所提供的分数通常能较好地反映图像的相似性,比 全局特征距离更可靠。一个常见的检索系统设置是首先通过全局特征进行搜 索,然后使用局部特征匹配对顶级数据库图像进行重新排序,以达到两者的最 佳效果。因此,针对已收集的电力场景图片信息,应该对实例检索和图片检索 的相关算法进行研究和分析,找到一个在该场景数据上检索性能卓越的目标检 索模型,在数据筛选和可视化数据处理系统构建中发挥重要作用。
将图像分类、目标检测和图像检索算法相组合得到可避免或弥补各自技术 的弱点,在提升图像类别的预测准确性的同时也有效的实现了数据筛选。同时 通过目标检测模型和图像分类模型对这些图片中的物体类别预测信息、图片检 索得到的相似图片数据信息等度量信息,可以建立一个可视化的数据筛选系 统,对电力场景中的图片数据进行更加精细的分析和筛选。
本申请所述的加权投票是指得到样本库数据的特征权重。即,特征的权重 和类别是相关的,图像类别不同,特征的权重是不一样的。用训练集中的样本 计算出每个类别的特征权重,赋予相应的特征,用加权特征学习SVM分类模型。 对于待分类图像,分别采用训练样本得到的权重进行加权,然后选用概率最大 的作为图像的类别。SVM为支持向量机。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详 细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本 领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变 形和改进,这些都属于本发明的保护范围。

Claims (9)

1.一种电力场景智能识别样本数据的自动筛选方法,其特征在于,包括如下步骤:
步骤10、录入电力场景样本,对录入的电力场景样本中的电力设备进行标注,构建电力场景筛选样本库;
步骤20、基于步骤10中构建的电力场景筛选样本库,分别构建目标检测算法模型、图像分类算法模型和图像检索算法模型;
步骤30、获取待筛选电力场景数据,通过步骤20中构建的图像检索算法模型对待筛选电力场景数据进行图像检索,筛除不合规的电力场景数据,得到图像检索合规的电力场景数据,具体如下:
步骤301、获取待筛选电力场景数据;
步骤302、将获取的待筛选电力场景数据与图像检索算法模型中的数据进行比对;
步骤303、根据对比结果,得到与图像检索算法模型中的电力场景样本相似的图像检索合规的电力场景数据,并筛除不合规的电力场景数据;
步骤40、获取图像检索合规的电力场景数据,通过步骤20中构建的目标检测算法模型对图像检索合规的电力场景数据中的电力设备进行定位,并通过步骤20中构建的图像分类算法模型和目标检测算法模型对图像检索合规的电力场景数据中定位的电力设备同步进行图像分类和目标检测,筛除不合规的电力场景数据,得到分类后的电力场景数据,具体如下:
步骤401、获取图像检索合规的电力场景数据;
步骤402、检索图像检索合规的电力场景数据中电力设备并分别定位;
步骤403、将完成电力设备定位的图像检索合规的电力场景数据与图像分类算法模型和目标检测算法模型中的电力场景样本进行比对,分别得到图像检索合规的电力场景数据对应的预测类别;
步骤404、根据图像分类算法模型和目标检测算法模型得到的预测类别对图像检索合规的电力场景数据进行类别确认,得到分类后的电力场景数据,并筛除不合规的电力场景数据。
2.根据权利要求1所述的一种电力场景智能识别样本数据的自动筛选方法,其特征在于,还包括模型训练和测试步骤,具体如下:
将电力场景筛选样本库中的电力场景样本划分为训练集和测试集;
通过训练集对构建的目标检测算法模型、图像分类算法模型和图像检索算法模型进行训练;
通过测试集对训练后的目标检测算法模型、图像分类算法模型和图像检索算法模型进行测试,并根据测试结果调整目标检测算法模型、图像分类算法模型和图像检索算法模型内的电力场景样本及电力场景样本的标注。
3.根据权利要求2所述的一种电力场景智能识别样本数据的自动筛选方法,其特征在于,所述训练集和测试集按比例进行划分且训练集和测试集的电力场景样本不重合。
4.根据权利要求2或3中任意一项所述的一种电力场景智能识别样本数据的自动筛选方法,其特征在于,所述的训练集的比例为60%-80%,所述的测试集的比例为20%-40%。
5.根据权利要求4中任意一项所述的一种电力场景智能识别样本数据的自动筛选方法,其特征在于,所述测试集测试目标检测算法模型过程中,针对测试集中电力场景样本的电力设备标注框的大小和比例对目标检测算法模型中电力场景样本的初始框进行调整。
6.根据权利要求2、3或5所述的一种电力场景智能识别样本数据的自动筛选方法,其特征在于,所述测试集测试目标检测算法模型过程中,如目标检测算法模型的电力场景样本中存在多个电力设备,结合电力设备的标注结果,对目标检测算法模型中的电力场景样本非极大值抑制的比例进行调整。
7.根据权利要求6所述的一种电力场景智能识别样本数据的自动筛选方法,其特征在于,步骤30中,步骤301和步骤302之间,还包括初步筛选步骤,具体如下:
设置相似度阈值,根据设置的相似度阈值筛除与不合规的电力场景数据相似的电力场景数据或将电力场景数据与图像检索算法模型中的电力场景样本比对,筛除与图像检索算法模型中的电力场景样本相似度低的电力场景数据,得到经初步筛选的电力场景数据,进入步骤302。
8.根据权利要求7所述的一种电力场景智能识别样本数据的自动筛选方法,其特征在于,步骤40中,还包括目标检测算法模型电力场景样本增广步骤,具体如下:
基于目标检测算法模型中已标注的电力场景样本对通过目标检测算法模型进行目标检测的电力场景数据进行标注,筛除无法标注的电力场景数据,通过可标注的电力场景数据构建已标注数据集;
将已标注数据集录入电力场景筛选样本库,得到更新之后的电力场景样本;
获取已录入到电力场景筛选样本库的电力场景样本增补至目标检测算法模型。
9.根据权利要求8所述的一种电力场景智能识别样本数据的自动筛选方法,其特征在于,步骤404中,分别设置图像分类算法模型和目标检测算法模型对电力设备的预测类别阈值,并对电力设备的预测类别设置不同的概率,如图像分类算法模型和目标检测算法模型得到对电力场景数据中的电力设备的预测概率均超过彼此的阈值时,预测结果可靠,重新加权投票得到电力设备的最终类别,如图像分类算法模型和目标检测算法模型得到对电力场景数据中的电力设备的预测概率均未超过彼此的阈值时,预测结果不可靠,通过人工判别电力设备的最终类别。
CN202111630943.9A 2021-12-28 2021-12-28 一种电力场景智能识别样本数据的自动筛选方法 Pending CN114529751A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111630943.9A CN114529751A (zh) 2021-12-28 2021-12-28 一种电力场景智能识别样本数据的自动筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111630943.9A CN114529751A (zh) 2021-12-28 2021-12-28 一种电力场景智能识别样本数据的自动筛选方法

Publications (1)

Publication Number Publication Date
CN114529751A true CN114529751A (zh) 2022-05-24

Family

ID=81621083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111630943.9A Pending CN114529751A (zh) 2021-12-28 2021-12-28 一种电力场景智能识别样本数据的自动筛选方法

Country Status (1)

Country Link
CN (1) CN114529751A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115269377A (zh) * 2022-06-23 2022-11-01 南通大学 一种基于优化实例选择的跨项目软件缺陷预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354735A (zh) * 2015-07-22 2017-01-25 杭州海康威视数字技术股份有限公司 一种图像中目标的检索方法和装置
CN112199983A (zh) * 2020-07-08 2021-01-08 北京航空航天大学 一种多层次筛选的长时间大范围行人再识别方法
CN113344852A (zh) * 2021-04-30 2021-09-03 苏州经贸职业技术学院 一种电力场景通用物品的目标检测方法、装置及存储介质
WO2021237967A1 (zh) * 2020-05-29 2021-12-02 上海依图网络科技有限公司 一种目标检索方法及装置
WO2021249575A1 (zh) * 2020-06-09 2021-12-16 全球能源互联网研究院有限公司 一种变电作业场景的区域语义学习与地图点标识方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354735A (zh) * 2015-07-22 2017-01-25 杭州海康威视数字技术股份有限公司 一种图像中目标的检索方法和装置
WO2021237967A1 (zh) * 2020-05-29 2021-12-02 上海依图网络科技有限公司 一种目标检索方法及装置
WO2021249575A1 (zh) * 2020-06-09 2021-12-16 全球能源互联网研究院有限公司 一种变电作业场景的区域语义学习与地图点标识方法
CN112199983A (zh) * 2020-07-08 2021-01-08 北京航空航天大学 一种多层次筛选的长时间大范围行人再识别方法
CN113344852A (zh) * 2021-04-30 2021-09-03 苏州经贸职业技术学院 一种电力场景通用物品的目标检测方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
梅舒欢;闵巍庆;刘林虎;段华;蒋树强;: "基于Faster R-CNN的食品图像检索和分类", 南京信息工程大学学报(自然科学版), no. 06, 28 November 2017 (2017-11-28) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115269377A (zh) * 2022-06-23 2022-11-01 南通大学 一种基于优化实例选择的跨项目软件缺陷预测方法

Similar Documents

Publication Publication Date Title
CN107169049B (zh) 应用的标签信息生成方法及装置
CN102804208B (zh) 为视觉搜索应用自动挖掘名人的个人模型
CN110717534B (zh) 一种基于网络监督的目标分类和定位方法
CN108171184A (zh) 基于Siamese网络的用于行人重识别的方法
CN102880729A (zh) 基于人脸检测与识别的人物图片索引方法及装置
CN106203490A (zh) 一种安卓平台下基于属性学习和交互反馈的图像在线识别、检索方法
CN110807434A (zh) 一种基于人体解析粗细粒度结合的行人重识别系统及方法
CN110931112B (zh) 一种基于多维信息融合和深度学习的脑部医学影像分析方法
CN108416314B (zh) 图片重要人脸检测方法
CN113222149B (zh) 模型训练方法、装置、设备和存储介质
CN111680603A (zh) 一种菜品检测和识别方法
CN113159826B (zh) 基于深度学习的服装流行元素预测的系统及方法
CN113313149B (zh) 一种基于注意力机制和度量学习的菜品识别方法
CN112927776A (zh) 一种面向医学检验报告的人工智能自动解读系统
CN114529751A (zh) 一种电力场景智能识别样本数据的自动筛选方法
CN110097603B (zh) 一种时尚图像主色调解析方法
CN116578703A (zh) 一种智慧鉴定系统及方法
CN107563327B (zh) 一种基于自步反馈的行人重识别方法及系统
CN116612347A (zh) 基于考场违规的深度学习模型训练方法
CN116525075A (zh) 基于少样本学习的甲状腺结节计算机辅助诊断方法及系统
CN115659056A (zh) 基于大数据的用户服务精准匹配系统
Sun et al. Automatic building age prediction from street view images
Greenwell et al. Implicit land use mapping using social media imagery
CN115222070B (zh) 一种智慧消防快速定位维保问题的数据分析方法
CN114565878B (zh) 一种支持类别可配置的视频标志物检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination