CN112183303A - 变电设备图像分类方法、装置、计算机设备和介质 - Google Patents
变电设备图像分类方法、装置、计算机设备和介质 Download PDFInfo
- Publication number
- CN112183303A CN112183303A CN202011015839.4A CN202011015839A CN112183303A CN 112183303 A CN112183303 A CN 112183303A CN 202011015839 A CN202011015839 A CN 202011015839A CN 112183303 A CN112183303 A CN 112183303A
- Authority
- CN
- China
- Prior art keywords
- deep learning
- learning model
- image
- power transformation
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及电力行业领域,提供了一种变电设备图像分类方法、装置、计算机设备和存储介质。本申请可提升获取变电设备图像分类信息的效率。该方法包括:获取待分类的变电设备图像,以及变电设备图像对应的目标分类标识信息,其中,目标分类标识信息包括场景标识或属性标识,将变电设备图像输入到预先训练好的与目标分类标识信息对应的深度学习模型,根据深度学习模型的输出,得到变电设备图像的分类信息。
Description
技术领域
本申请涉及电力行业领域,特别是涉及一种变电设备图像分类方法、装置、计算机设备和存储介质。
背景技术
随着人工智能技术的发展,深度学习技术的应用越来越广泛。在电力行业变电设备识别领域,基于深度学习进行变电设备图像识别,应用也日益普遍,为了了解变电设备的当前状态,通常需要对复杂场景下的变电设备进行识别。
现有技术中,通常会针对变电设备不同场景或属性分别进行训练以得到训练模型,占用资源较多且处理效率低。
发明内容
基于此,有必要针对目前技术中存在的场景或属性模型处理效率低的技术问题,提供一种变电设备图像分类方法、装置、计算机设备和存储介质。
一种变电设备图像分类方法,所述方法包括:
获取待分类的变电设备图像,以及所述变电设备图像对应的目标分类标识信息;所述目标分类标识信息包括场景标识或者属性标识;所述场景标识表征所述变电设备图像为所在场景的设备类别待定的图像;所述属性标识表征所述变电设备图像为设备属性待定的图像;
将所述变电设备图像输入到预先训练好的与所述目标分类标识信息对应的深度学习模型;所述深度学习模型用于按照所述目标分类标识信息对输入的变电设备图像按照场景或者属性进行分类;
根据所述深度学习模型的输出,得到所述变电设备图像的分类信息。
在其中一个实施例中,所述方法还包括:
获取训练图片集;
将所述训练图片划分为多个子训练图片集,使得每个子训练图片集中的训练图像对应相同场景或者相同属性;
分别对所述多个子训练图片集进行预处理;
将预处理后的所述多个子训练图片集输入到待训练的深度学习模型进行训练,得到训练后的所述场景或者属性对应的所述深度学习模型。
在其中一个实施例中,所述分别对所述多个子训练图片集进行预处理,包括:
建立与所述多个子训练图片集分别对应的多个管道;
在所述多个管道内对各自对应的所述子训练图片集进行预处理。
在其中一个实施例中,所述方法还包括:
将预处理后的所述多个子训练图片集按照顺序叠加合成,获得张量形式的所述多个子训练图片集;
将张量形式的所述多个子训练图片集输入到待训练的所述深度学习模型。
在其中一个实施例中,所述深度学习模型包括多个分支;所述将预处理后的所述多个子训练图片集输入到待训练的深度学习模型进行训练,包括:
获得所述多个分支各自对应的损失函数和损失函数比例系数;
将所述多个分支的损失函数按照对应的所述损失函数比例系数加权,得到所述深度学习模型的损失值;根据所述损失值反向更新所述深度学习模型的权重,直到训练完成得到训练后的所述深度学习模型。
在其中一个实施例中,所述获得所述多个分支各自对应的损失函数和损失函数比例系数,包括:
将预处理后的所述多个子训练图片集输入到待训练的深度学习模型的基础网络;
将所述基础网络输出的特征图输入到所述多个分支分别对应的多个全连接层;
根据所述多个全连接层的输出,获得所述多个分支各自对应的损失函数。
在其中一个实施例中,所述根据所述深度学习模型的输出,得到所述变电设备图像的分类信息,包括:
若所述目标分类标识信息为所述场景标识,根据所述深度学习模型的输出、所述场景标识和所述场景标识对应的所述分支的置信度,确定所述变电设备图像在所述场景下的场景分类信息;
或,若所述目标分类标识信息为所述属性标识,根据所述深度学习模型的输出,获得所述变电设备图像在所述多个分支的子属性类别;根据所述子属性类别,获得所述变电设备图像的属性分类信息。
一种变电设备图像分类装置,所述装置包括:
图像信息获取模块,用于获取待分类的变电设备图像,以及所述变电设备图像对应的目标分类标识信息;所述目标分类标识信息包括场景标识或者属性标识;所述场景标识表征所述变电设备图像为所在场景的设备类别待定的图像;所述属性标识表征所述变电设备图像为设备属性待定的图像;
模型输入模块,用于将所述变电设备图像输入到预先训练好的与所述目标分类标识信息对应的深度学习模型;所述深度学习模型用于按照所述目标分类标识信息对输入的变电设备图像按照场景或者属性进行分类;
分类信息获取模块,用于根据所述深度学习模型的输出,得到所述变电设备图像的分类信息。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待分类的变电设备图像,以及所述变电设备图像对应的目标分类标识信息;所述目标分类标识信息包括场景标识或者属性标识;所述场景标识表征所述变电设备图像为所在场景的设备类别待定的图像;所述属性标识表征所述变电设备图像为设备属性待定的图像;将所述变电设备图像输入到预先训练好的与所述目标分类标识信息对应的深度学习模型;所述深度学习模型用于按照所述目标分类标识信息对输入的变电设备图像按照场景或者属性进行分类;根据所述深度学习模型的输出,得到所述变电设备图像的分类信息。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待分类的变电设备图像,以及所述变电设备图像对应的目标分类标识信息;所述目标分类标识信息包括场景标识或者属性标识;所述场景标识表征所述变电设备图像为所在场景的设备类别待定的图像;所述属性标识表征所述变电设备图像为设备属性待定的图像;将所述变电设备图像输入到预先训练好的与所述目标分类标识信息对应的深度学习模型;所述深度学习模型用于按照所述目标分类标识信息对输入的变电设备图像按照场景或者属性进行分类;根据所述深度学习模型的输出,得到所述变电设备图像的分类信息。
上述变电设备图像分类方法、装置、计算机设备和存储介质,通过获取待分类的变电设备图像,以及变电设备图像对应的目标分类标识信息,其中,目标分类标识信息包括场景标识或属性标识,将变电设备图像输入到预先训练好的与目标分类标识信息对应的深度学习模型,根据深度学习模型的输出,得到变电设备图像的分类信息;本方案中,在获取变电设备图像时,根据变电设备图像对应的目标分类标识信息,将图像输入到场景标识对应的深度学习模型进行场景分类,或输入到属性标识对应的深度学习模型进行属性分类,无需将变电设备图像输入到的单个场景或属性对应的训练模型,提高了获取变电设备分类信息的效率。
附图说明
图1为一个实施例中变电设备图像分类方法的应用环境图;
图2为一个实施例中变电设备图像分类方法的流程示意图;
图3为一个实施例中变电设备的场景示意图;
图4为一个实施例中变电设备的场景示意图;
图5为一个实施例中变电设备的场景示意图;
图6为一个实施例中变电设备图像分类方法的流程示意图;
图7为一个实施例中变电设备图像分类方法的流程示意图;
图8为一个实施例中变电设备图像分类方法的流程示意图;
图9为一个实施例中变电设备图像分类装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的变电设备图像分类方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102获取待分类的变电设备图像,从终端102的本地存储模块或服务器104获得预选训练好的深度学习模型,将变电设备图像输入到深度学习模型进行图像分类。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了变电设备图像分类方法,以该方法应用于图1的终端102为例进行说明,包括以下步骤:
步骤S201,获取待分类的变电设备图像,以及变电设备图像对应的目标分类标识信息。
其中,目标分类标识信息可以包括场景标识或者属性标识;场景标识可以表征变电设备图像为所在场景的设备类别待定的图像;属性标识可以表征变电设备图像为设备属性待定的图像。变电设备图像可以是用于指示变电设备的场景或属性的图像,可以包括变电设备的整体或局部信息,例如变电设备的额定参数,变电设备开关、指示灯的不同场景或属性等。变电设备图像可以对应有目标分类标识信息,目标分类标识信息可以用于确定针对该变电设备图像中的设备需要进行分类的依据,例如按照场景分类,或者按照属性分类。终端102可以将获得的变电设备图像输入到与目标设备标识信息对应的深度学习模型。
具体实现中,终端102可以从关联设备或者终端102的存储模块获得待分类的变电设备图像,并获得该变电设备图像对应的目标分类标识信息。
步骤S202,将变电设备图像输入到预先训练好的与目标分类标识信息对应的深度学习模型。
其中,深度学习模型用于按照目标分类标识信息对输入的变电设备图像按照场景或者属性进行分类。深度学习模型与目标分类标识信息相对应,根据变电设备图像的目标分类标识信息,可以确定对目标设备图像进行分类时需要使用的深度学习模型。例如,如变电设备图像对应的目标分类标识信息为场景标识,则将变电设备图像输入到与场景标识对应的深度学习模型进行分类;如果变电设备图像对应的目标分类标识信息为属性标识,则将变电设备图像输入到与属性标识对应的深度学习模型进行分类。
具体实现中,终端102可以根据目标分类标识信息,确定针对变电设备图像进行分类所需的深度学习模型,将变电设备图像输入到对应的深度学习模型中,按照目标分类标识信息,对变电设备按照场景或属性进行分类。
步骤S203,根据深度学习模型的输出,得到变电设备图像的分类信息。
具体实现中,不同的目标分类标识信息对应的深度学习模型的输出可以不同。例如,场景标识对应的深度学习模型,输出的为变电设备图像的场景分类信息,而属性标识对应的深度学习模型,输出的为变电设备图像的属性分类信息。终端102可以根据深度学习模型的输出,结合目标分类标识信息,得到变电设备图像的分类信息。
上述变电设备图像分类方法中,终端102获取待分类的变电设备图像,以及变电设备图像对应的目标分类标识信息,其中,目标分类标识信息包括场景标识或属性标识,将变电设备图像输入到预先训练好的与目标分类标识信息对应的深度学习模型,根据深度学习模型的输出,得到变电设备图像的分类信息。本方案中,在获取变电设备图像后,根据变电设备图像对应的目标分类标识信息,将图像输入到场景标识对应的深度学习模型进行场景分类,或输入到属性标识对应的深度学习模型进行属性分类,无需将变电设备图像输入到的单个场景或属性对应的训练模型,提高了获取变电设备分类信息的效率。
在一个实施例中,上述方法还包括:
获取训练图片集;将训练图片划分为多个子训练图片集,使得每个子训练图片集中的训练图像对应相同场景或者相同属性;分别对多个子训练图片集进行预处理;将预处理后的多个子训练图片集输入到待训练的深度学习模型进行训练,得到训练后的场景或者属性对应的深度学习模型。
本实施例中,训练图片集中包括与场景或属性对应的训练图片。终端102可以根据训练的需要,设计相应的深度学习模型,其中,深度学习模型可以基于神经网络算法进行设计。终端102可以根据目标分类标识信息中的场景标识或属性标识,分别进行深度学习模型的训练。
在一些实施例中,终端102可以训练属性标识对应的深度学习模型。属性标识可以对应多个属性,每个属性可以作为一个属性分类。终端102可以根据变电设备图像分类的需要,确定需要进行模型训练的设备的多个属性。终端102可以获取与属性对应的训练图片集。将该训练图片集按照属性划分为多个子训练图片集,每个子训练图片集中的训练图片对应相同的属性。终端102可以每个子训练图片集分别进行预处理,其中,根据任务需求的不同,可以对每个子训练图片集单独添加或者减少数据预处理的类型。终端102将预处理后的子训练图片集输入到待训练的深度学习训练模型进行训练,以得到训练后的与属性标识对应的深度学习模型。例如,当变电设备红绿指示灯,图3中的红绿指示灯可以用来阐述按照属性标识训练模型的过程,属性可以包括指示灯颜色属性和指示灯开关状态属性,终端102可以将指示灯颜色属性和开关状态属性作为两个属性分类,分别获得指示灯颜色对应的训练图片和指示灯开关对应的训练图片,并分别放入对应的文件夹,将标注不同属性的图片数据,放到相应的属性文件夹的子文件夹中,例如指示灯颜色为红色的图片,可以放入颜色属性文件夹下的红色文件夹中。每个分类的文件夹结构可以与常规分类数据的文件夹结构一致。终端102可以根据变电设备的多个属性训练的深度学习模型,最终得到可以进行变电设备图像的多属性分类的深度学习模型。在属性对应的深度学习模型训练中,在构建分类时,终端102可以增加只标注某些类别的外部数据参与模型训练,以提高同属性不同类别特征之间的区分度。
在一些实施例中,终端102可以训练场景标识对应的深度学习模型。场景标识可以对应多个场景,每个场景可以作为一个场景分类。例如,终端102可以训练包括红绿指示灯场景和十字指示灯场景的深度学习模型,其中,如图3所示的红绿指示灯场景,如图4所示的十字指示灯场景,终端102可以分别获得红绿指示灯场景和十字指示灯场景对应的训练图片,并分别建立对应场景的文件夹,将标注不同场景的图片数据,放到相应的文件夹中,例如可以将十字指示灯横的图片放入十字指示灯场景文件夹下的十字指示灯横文件夹中。终端102可以根据变电设备的多场景,训练深度学习模型,最终得到可以进行变电设备图像的多场景分类的深度学习模型。
上述实施例的方案,通过获取训练图片集,将训练图片集划分为子训练图片集,使得每个子训练图片集中的训练图像对应相同场景或者相同属性,将子训练图片集进行预处理后,输入到待训练的深度学习模型进行训练,以得到训练后的场景或属性对应的深度学习模型,提供了深度学习模型训练的方法,提高了通过深度学习模型进行变电设备图像多属性或者多场景分类的可行性。
在一个实施例中,分别对多个子训练图片集进行预处理,包括:
建立与多个子训练图片集分别对应的多个管道;在多个管道内对各自对应的子训练图片集进行预处理。
本实施例中,终端102可以将获得多个子训练图片集中每个训练图片集建立一个管道,对子训练图片集进行数据读取和数据预处理。终端102可以基于管道对每个子训练图片集单独做数据预处理,根据任务需求增加或者减少数据预处理,并单独设计数据增强。管道内的每个子训练图片集中的图片可以被打乱。数据预处理的手段可以包括随机剪切、高斯噪声、随机翻转、归一化等。在一些实施例中,在场景标识对应的深度学习模型训练时,终端102可以对每个场景的数据单独设计数据增强,以使得每个场景中仅输出该场景的结果。
上述实施例的方案,终端102建立与子训练图片集对应的管道,在管道内对子训练图片集进行预处理,提升了输入深度学习模型的数据的有效性。
在一个实施例中,上述方法还包括:
将预处理后的多个子训练图片集按照顺序叠加合成,获得张量形式的多个子训练图片集;将张量形式的多个子训练图片集输入到待训练的深度学习模型。
本实施例中,终端102可以将预处理后的多个子训练图片集按照顺序叠加合成新的批次,获得张量形式的多个子训练图片集。在神经网络中,张量可以是向量和矩阵的推广,可以将标量视为零阶张量,矢量视为一阶张量,矩阵视为二阶张量,将多个矩阵组成一个新的数组,可以得到一个3D张量,依次类推。终端102可以将多个子训练图片集中的图像参数进行解码,转换为张量形式的子训练图片集,以进行深度学习模型训练。终端102可以将获得的张量形式的多个子训练图片集输入到待训练的深度学习模型中。
上述实施例的方案,通过将预处理后的子训练图片集叠加合成获得张量形式的子训练图片集,以获得可以输入深度学习模型进行模型训练的数据。
在一个实施例中,深度学习模型包括多个分支;将预处理后的多个子训练图片集输入到待训练的深度学习模型进行训练,包括:
获得多个分支各自对应的损失函数和损失函数比例系数;将多个分支的损失函数按照对应的所述损失函数比例系数加权,得到深度学习模型的损失值;根据损失值反向更新深度学习模型的权重,直到训练完成得到训练后的深度学习模型。
本实施例中,终端102构建的深度学习模型可以包括基础网络和多个分支,其中,每个分支对应一个场景或者属性的分类,每个分支使用一个全连接层,每个分支单独计算对应的场景或者属性分类的损失函数。在基于神经网络的深度学习模型训练中,基础网络可以包括卷积层、池化层和激活函数层等,用于将原始数据映射到隐层特征空间,分支的全连接层则是起到分类器的作用,将基础网络输出的特征映射样本标记空间。损失函数用于计算损失单个样本的预测值与真实值的差,也就是损失值,损失越小,模型越好,如果预测值与真实值相等,就是没有损失。反向更新是在模型训练过程中,每一次迭代根据计算出的结果与样本标签的误差,反向调整基础网络层之间的权重,以使得误差值达到要求,提高学习模型的预测准确率。终端102可以根据图像分类任务的频次、样本数量、图像分类难度、历史经验数据、任务难度等指标,设计每个分支对应的损失函数的比例系数。在进行深度学习模型训练时,终端102可以计算每个分支的损失函数,将计算的每个分支的损失函数与对应的损失函数比例系数进行加权后,得到深度学习模型的损失值,根据该损失值,反向更新深度学习模型的基础网络层之间的权重,直到获得符合模型训练需求的深度学习模型。
上述实施例的方案,根据分支对应的损失函数和损失函数比例系数加权得到深度学习模型的损失值反向更新深度学习模型的权重,以得到训练后的深度学习模型,提高了获得的深度学习模型的准确性。
在一个实施例中,获得多个分支各自对应的损失函数和损失函数比例系数,包括:
将预处理后的多个子训练图片集输入到待训练的深度学习模型的基础网络;将基础网络输出的特征图输入到多个分支分别对应的多个全连接层;根据多个全连接层的输出,获得多个分支各自对应的损失函数。
本实施例中,特征图可以是将图片输入到待训练的深度学习模型的基础网络,经过基础网络处理后,输出的最后一层的图,特征图中包含对输入的图像在多种角度进行的特征描述,特征图可以被压缩成N*1的特征。终端102可以将该特征图输入到多个分支分别对应的多个全连接层,每个全连接层的大小可以N*M,其中M可以是每个场景或属性分类的分类数目。分支对应的场景或属性分类不同,则M的值可以不同。通过全连接层处理后的特征图,可以获得该分支对应的输出结果,根据输出结果可以单独计算该分支对应的损失函数。
在一些实施例中,当训练属性标识对应的深度学习模型时,每个分支可以对应一个属性分类,M可以是每个属性分类中的分类数目。例如当属性分类是变电设备的指示灯颜色属性,且颜色属性对应的分类有红色和绿色2个,变电设备的指示灯颜色属性对应的分支的M值应当为2。
在一些实施例中,当训练场景标识对应的深度学习模型时,每个分支可以对应一个场景分类,M可以是每个场景分类中的分类数目,例如当场景分类是变电设备的压板开关场景,且压板开关场景对应的分类数目有压板开关开和压板开关合2个,则压板开关场景对应的分支的M值应当为2。
上述实施例的方案,通过将预处理后的多个子训练图片集输入到待训练的深度学习模型的基础网络,将输出的特征图输入到多个分支分别对应的全连接层,并根据多个全连接层的输出,获得该多个分支各自对应的损失函数,实现了根据按照分支进行每个场景或属性分类的处理和训练,提高了按照属性或场景进行分类的可行性。
在一个实施例中,根据深度学习模型的输出,得到变电设备图像的分类信息,包括:
若目标分类标识信息为场景标识,根据深度学习模型的输出、场景标识和场景标识对应的分支的置信度,确定变电设备图像在场景下的场景分类信息。
本实施例中,当待分类的变电设备图像的目标分类标识信息为场景标识,分类信息可以为场景分类信息,场景分类信息可以是在实际应用场景下,深度学习模型输出的变电设备的类别,场景标识可以对应的多个场景分类,每个场景分类对应的深度学习模型的一个分支。终端102可以根据待分类的变电设备图像的场景标识,确定该变电设备所属的场景,进而将该变电设备图像输入到对应的深度学习模型中进行分类。终端102获得深度学习模型在多个分支的输出后,可以根据场景分类确定对应的深度学习模型输出的分支,以该分支下深度学习模型输出的结果,确定变电设备的设备类别。例如,深度学习模型包含了压板开关场景和十字指示灯场景两个分类,在进行变电设备图像识别时,如图5所示,当获取到的变电设备图像的场景标识对应的是压板开关场景,终端102根据压板开关场景对应的深度学习模型的分支中,对比压板开关合以及压板开关开的分别对应的置信度,取置信度高的类别作为压板开关的类别,而不考虑十字指示灯场景对应分支的输出结果。当获取到的变电设备图像的场景标识对应的是十字指示灯场景时,终端102则在十字指示灯场景对应的分支下,根据十字指示灯横以及十字指示灯竖分别对应的置信度,确定十字指示灯的类别,而不考虑压板开关场景对应分支的输出结果。
在一些实施例中,终端102可以根据图6所示的方法获取变电设备图像的场景分类信息。
上述实施例的方案,在目标分类标识信息为场景标识的情形下,将变电设备图像输入对应的深度学习模型,获得变电设备在该场景下的场景分类信息,使得可以将多场景的图像分别输入到场景标识对应的深度学习模型,以得到对应的场景分类信息,而无需针对每个场景分别训练模型,提升了获得场景分类信息的效率。
在一个实施例中,根据所述深度学习模型的输出,得到变电设备图像的分类信息,包括:
若目标分类标识信息为属性标识,根据深度学习模型的输出,获得变电设备图像在多个分支的子属性类别;根据子属性类别,获得变电设备图像的属性分类信息。
本实施例中,当待分类的变电设备图像的目标分类标识信息为属性标识,分类信息可以为属性分类信息,属性分类信息可以根据深度学习模型的各个分支输出的子属性类别得到。每个子属性类别可以用于描述变电设备的某一个特征属性。终端102获得深度学习模型在多个分支的输出后,可以获得每个分支的子属性类别,将子属性类别合并,获得变电设备的属性分类信息。例如,如图3所示,当变电设备为红绿指示灯,属性包括颜色属性和开关状态属性两个分类,并分别对应深度学习模型的两个分支,包括颜色分支和开关状态分支,终端102将待分类的红绿指示灯图像输入到深度学习模型后,可以根据两个分支输出结果,确定红绿指示灯的属性信息,其中,当颜色分支的输出结果为红色,且开关状态属性分支输出的结果为灭,将两个分支的结果合并,可以确定输入的红绿指示灯的属性为红灯灭。
在一些实施例中,变电设备图像的属性分类可以更复杂,包含两个以上属性分类,每个属性分类也可以分别对应多个分类数目,终端102可以据此训练出来深度学习模型,以根据需要识别出变电设备的更精确的特征。
上述实施例的方案,在目标分类标识信息为属性标识的情形下,将变电设备图像输入对应的深度学习模型,获得变电设备在的属性分类信息,使得可以将多属性的图像输入到目标分类标识信息对应的深度学习模型,以得到各个分支输出的子属性分类信息,并根据子属性分类信息确定属性分类信息,而无需针对每个属性分别训练模型,提升了获得属性分类信息的效率。
在一个实施例中,如图7所示,提供了一种变电设备图像分类的深度学习模型的训练方法,该方法包括:
步骤S701,获取训练图片集;将训练图片划分为多个子训练图片集。
步骤S702,建立与多个子训练图片集分别对应的多个管道;在多个管道内对各自对应的子训练图片集进行预处理。
步骤S703,将预处理后的多个子训练图片集按照顺序叠加合成,获得张量形式的多个子训练图片集;将张量形式的多个子训练图片集输入到待训练的深度学习模型。
步骤S704,将预处理后的多个子训练图片集输入到待训练的深度学习模型的基础网络;将基础网络输出的特征图输入到多个分支分别对应的多个全连接层;根据多个全连接层的输出,获得多个分支各自对应的损失函数。
步骤S705,获得多个分支各自对应的损失函数和损失函数比例系数;将多个分支的损失函数按照对应的损失函数比例系数加权,得到深度学习模型的损失值;根据损失值反向更新深度学习模型的权重,直到训练完成得到训练后的深度学习模型。
在一些实施例中,终端102可以根据如图8所示的流程进行深度学习模型的训练。
上述实施例,通过获取训练图片集,按照场景或属性将训练图片集划分为多个子训练图片集,将图片集进行预处理后,输入到包括多个分支的深度学习模型进行模型训练,得到可以进行多属性或多场景份分类的深度学习模型,使用该模型进行变电设备图像识别时,无需训练单个场景或属性的模型,即可进行变电设备的多属性或多场景的识别,提高了模型训练的效率。
应该理解的是,虽然图2-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-8中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
为了进一步阐述本申请的变电设备图像分类方法,将上述方法应用于场景标识下的深度学习模型的训练。终端102可以基于pytorch框架随Mobilenet V3分类算法改进,可以适用于所有的分类算法。获取如图3至5所示的三个场景的数据进行训练,训练数据合计7633张,测试数据合计1322张,在1080ti显卡训练,每个任务批次(batch)大小为128,图片输入尺寸为224*224。其中,场景1有4种类别,场景2有2中类别,场景3有两种类别。采用的数据增强手段包括数据增强包括随机剪切、高斯噪声、随机翻转、归一化。训练了120轮(epoch),最终在测试集的准确率为98.79%。
在一个实施例中,如图9所示,提供了一种变电设备图像分类装置,该装置900包括:
图像信息获取模块901,用于获取待分类的变电设备图像,以及变电设备图像对应的目标分类标识信息;目标分类标识信息包括场景标识或者属性标识;场景标识表征变电设备图像为所在场景的设备类型待定的图像;属性标识表征变电设备图像为设备属性待定的图像;
模型输入模块902,用于将变电设备图像输入到预先训练好的与目标分类标识信息对应的深度学习模型;深度学习模型用于按照目标分类标识信息对输入的变电设备图像按照场景或者属性进行分类;
分类信息获取模块903,用于根据深度学习模型的输出,得到变电设备图像的分类信息。
在一个实施例中,上述装置900还包括:模型训练模块,用于获取训练图片集;训练图集中包括与目标分类标识信息对应的训练图片;将训练图片划分为多个子训练图片集,使得每个子训练图片集中的训练图像对应相同场景或者相同属性;分别对多个子训练图片集进行预处理;将预处理后的多个子训练图片集输入到待训练的深度学习模型进行训练,得到训练后的场景或者属性对应的深度学习模型。
在一个实施例中,模型训练模块进一步用于建立与多个子训练图片集分别对应的多个管道;在多个管道内对各自对应的所述子训练图片集进行预处理。
在一个实施例中,模型训练模块进一步用于将预处理后的多个子训练图片集按照顺序叠加合成,获得张量形式的多个子训练图片集;将张量形式的多个子训练图片集输入到待训练的深度学习模型。
在一个实施例中,深度学习模型包括多个分支,模型训练模块进一步用于获得多个分支各自对应的损失函数和损失函数比例系数;将多个分支的损失函数按照对应的损失函数比例系数加权,得到深度学习模型的损失值;根据述损失值反向更新深度学习模型的权重,直到训练完成得到训练后的深度学习模型。
在一个实施例中,模型训练模块进一步用于将预处理后的多个子训练图片集输入到待训练的深度学习模型的基础网络;将基础网络输出的特征图输入到多个分支分别对应的多个全连接层;根据多个全连接层的输出,获得多个分支各自对应的损失函数。
在一个实施例中,分类信息获取模块903进一步用于若目标分类标识信息为场景标识,根据深度学习模型的输出、场景标识和场景标识对应的分支的置信度,确定变电设备图像在场景下的场景分类信息。
在一个实施例中,分类信息获取模块903进一步用于若目标分类标识信息为属性标识,根据深度学习模型的输出,获得变电设备图像在多个分支的子属性类别;根据子属性类别,获得变电设备图像的属性分类信息。
关于变电设备图像分类装置的具体限定可以参见上文中对于变电设备图像分类方法的限定,在此不再赘述。上述变电设备图像分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本申请提供的变电设备图像分类方法,可以应用于计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种变电设备图像分类方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种变电设备图像分类方法,其特征在于,所述方法包括:
获取待分类的变电设备图像,以及所述变电设备图像对应的目标分类标识信息;所述目标分类标识信息包括场景标识或者属性标识;所述场景标识表征所述变电设备图像为所在场景的设备类别待定的图像;所述属性标识表征所述变电设备图像为设备属性待定的图像;
将所述变电设备图像输入到预先训练好的与所述目标分类标识信息对应的深度学习模型;所述深度学习模型用于按照所述目标分类标识信息对输入的变电设备图像按照场景或者属性进行分类;
根据所述深度学习模型的输出,得到所述变电设备图像的分类信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取训练图片集;
根据所述深度学习模型的输出,得到所述变电设备图像的分类信息;
分别对所述多个子训练图片集进行预处理;
将预处理后的所述多个子训练图片集输入到待训练的深度学习模型进行训练,得到训练后的所述场景或者属性对应的所述深度学习模型。
3.根据权利要求2所述的方法,其特征在于,所述分别对所述多个子训练图片集进行预处理,包括:
建立与所述多个子训练图片集分别对应的多个管道;
在所述多个管道内对各自对应的所述子训练图片集进行预处理。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将预处理后的所述多个子训练图片集按照顺序叠加合成,获得张量形式的所述多个子训练图片集;
将张量形式的所述多个子训练图片集输入到待训练的所述深度学习模型。
5.根据权利要求2所述的方法,其特征在于,所述深度学习模型包括多个分支;所述将预处理后的所述多个子训练图片集输入到待训练的深度学习模型进行训练,包括:
获得所述多个分支各自对应的损失函数和损失函数比例系数;
将所述多个分支的损失函数按照对应的所述损失函数比例系数加权,得到所述深度学习模型的损失值;根据所述损失值反向更新所述深度学习模型的权重,直到训练完成得到训练后的所述深度学习模型。
6.根据权利要求5所述的方法,其特征在于,所述获得所述多个分支各自对应的损失函数和损失函数比例系数,包括:
将预处理后的所述多个子训练图片集输入到待训练的深度学习模型的基础网络;
将所述基础网络输出的特征图输入到所述多个分支分别对应的多个全连接层;
根据所述多个全连接层的输出,获得所述多个分支各自对应的损失函数。
7.根据权利要求5至6任一项所述的方法,其特征在于,所述根据所述深度学习模型的输出,得到所述变电设备图像的分类信息,包括:
若所述目标分类标识信息为所述场景标识,根据所述深度学习模型的输出、所述场景标识和所述场景标识对应的所述分支的置信度,确定所述变电设备图像在所述场景下的场景分类信息;
或,
若所述目标分类标识信息为所述属性标识,根据所述深度学习模型的输出,获得所述变电设备图像在所述多个分支的子属性类别;根据所述子属性类别,获得所述变电设备图像的属性分类信息。
8.一种变电设备图像分类装置,其特征在于,所述装置包括:
图像信息获取模块,用于获取待分类的变电设备图像,以及所述变电设备图像对应的目标分类标识信息;所述目标分类标识信息包括场景标识或者属性标识;所述场景标识表征所述变电设备图像为所在场景的设备类别待定的图像;所述属性标识表征所述变电设备图像为设备属性待定的图像;
模型输入模块,用于将所述变电设备图像输入到预先训练好的与所述目标分类标识信息对应的深度学习模型;所述深度学习模型用于按照所述目标分类标识信息对输入的变电设备图像按照场景或者属性进行分类;
分类信息获取模块,用于根据所述深度学习模型的输出,得到所述变电设备图像的分类信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011015839.4A CN112183303A (zh) | 2020-09-24 | 2020-09-24 | 变电设备图像分类方法、装置、计算机设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011015839.4A CN112183303A (zh) | 2020-09-24 | 2020-09-24 | 变电设备图像分类方法、装置、计算机设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112183303A true CN112183303A (zh) | 2021-01-05 |
Family
ID=73956633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011015839.4A Pending CN112183303A (zh) | 2020-09-24 | 2020-09-24 | 变电设备图像分类方法、装置、计算机设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112183303A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113643136A (zh) * | 2021-09-01 | 2021-11-12 | 京东科技信息技术有限公司 | 信息处理方法、系统和装置 |
TWI801982B (zh) * | 2021-08-27 | 2023-05-11 | 國立政治大學 | 自動化數位檔案分類系統及分類方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103824092A (zh) * | 2014-03-04 | 2014-05-28 | 国家电网公司 | 一种用于输变电设备状态在线监测的图像分类方法 |
CN109389180A (zh) * | 2018-10-30 | 2019-02-26 | 国网四川省电力公司广元供电公司 | 一款基于深度学习的电力设备图像识别方法及巡查机器人 |
CN110276394A (zh) * | 2019-06-21 | 2019-09-24 | 扬州大学 | 一种小样本下基于深度学习的电力设备分类方法 |
CN110378408A (zh) * | 2019-07-12 | 2019-10-25 | 台州宏创电力集团有限公司 | 基于迁移学习和神经网络的电力设备图像识别方法和装置 |
CN111027565A (zh) * | 2019-12-05 | 2020-04-17 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种光学视觉语义提取的输变电设备报告内容生成方法 |
CN111079795A (zh) * | 2019-11-21 | 2020-04-28 | 西安工程大学 | 基于cnn的分片多尺度特征融合的图像分类方法 |
CN111179249A (zh) * | 2019-12-30 | 2020-05-19 | 南京南瑞信息通信科技有限公司 | 一种基于深度卷积神经网络的电力设备检测方法和装置 |
CN111353378A (zh) * | 2019-12-31 | 2020-06-30 | 国网北京市电力公司 | 目标对象的检测方法及装置、存储介质、电子装置 |
CN111695622A (zh) * | 2020-06-09 | 2020-09-22 | 全球能源互联网研究院有限公司 | 变电作业场景的标识模型训练方法、标识方法及装置 |
-
2020
- 2020-09-24 CN CN202011015839.4A patent/CN112183303A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103824092A (zh) * | 2014-03-04 | 2014-05-28 | 国家电网公司 | 一种用于输变电设备状态在线监测的图像分类方法 |
CN109389180A (zh) * | 2018-10-30 | 2019-02-26 | 国网四川省电力公司广元供电公司 | 一款基于深度学习的电力设备图像识别方法及巡查机器人 |
CN110276394A (zh) * | 2019-06-21 | 2019-09-24 | 扬州大学 | 一种小样本下基于深度学习的电力设备分类方法 |
CN110378408A (zh) * | 2019-07-12 | 2019-10-25 | 台州宏创电力集团有限公司 | 基于迁移学习和神经网络的电力设备图像识别方法和装置 |
CN111079795A (zh) * | 2019-11-21 | 2020-04-28 | 西安工程大学 | 基于cnn的分片多尺度特征融合的图像分类方法 |
CN111027565A (zh) * | 2019-12-05 | 2020-04-17 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种光学视觉语义提取的输变电设备报告内容生成方法 |
CN111179249A (zh) * | 2019-12-30 | 2020-05-19 | 南京南瑞信息通信科技有限公司 | 一种基于深度卷积神经网络的电力设备检测方法和装置 |
CN111353378A (zh) * | 2019-12-31 | 2020-06-30 | 国网北京市电力公司 | 目标对象的检测方法及装置、存储介质、电子装置 |
CN111695622A (zh) * | 2020-06-09 | 2020-09-22 | 全球能源互联网研究院有限公司 | 变电作业场景的标识模型训练方法、标识方法及装置 |
Non-Patent Citations (2)
Title |
---|
王铭民;许栋栋;陈曦;高建;: "基于图像识别技术的变电站设备短路损耗工况检测模型算法", 科技通报, no. 12, pages 91 - 95 * |
陈旭: "基于深度学习的变电设备图像特征提取", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 138 - 1684 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI801982B (zh) * | 2021-08-27 | 2023-05-11 | 國立政治大學 | 自動化數位檔案分類系統及分類方法 |
CN113643136A (zh) * | 2021-09-01 | 2021-11-12 | 京东科技信息技术有限公司 | 信息处理方法、系统和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112766244B (zh) | 目标对象检测方法、装置、计算机设备和存储介质 | |
CN109522942B (zh) | 一种图像分类方法、装置、终端设备和存储介质 | |
CN112434721A (zh) | 一种基于小样本学习的图像分类方法、系统、存储介质及终端 | |
CN111476806B (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN112418292B (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN116580257A (zh) | 特征融合模型训练及样本检索方法、装置和计算机设备 | |
CN113095370A (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN111950570B (zh) | 目标图像提取方法、神经网络训练方法及装置 | |
US20230334893A1 (en) | Method for optimizing human body posture recognition model, device and computer-readable storage medium | |
CN113112518A (zh) | 基于拼接图像的特征提取器生成方法、装置和计算机设备 | |
CN115311730A (zh) | 一种人脸关键点的检测方法、系统和电子设备 | |
CN112347361A (zh) | 推荐对象的方法、神经网络及其训练方法、设备和介质 | |
CN112183303A (zh) | 变电设备图像分类方法、装置、计算机设备和介质 | |
CN115601692A (zh) | 数据处理方法、神经网络模型的训练方法及装置 | |
CN111652181A (zh) | 目标跟踪方法、装置及电子设备 | |
EP3588441B1 (en) | Imagification of multivariate data sequences | |
CN110717405A (zh) | 人脸特征点定位方法、装置、介质及电子设备 | |
CN112069412B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN114332457A (zh) | 图像实例分割模型训练、图像实例分割方法和装置 | |
CN111709473A (zh) | 对象特征的聚类方法及装置 | |
CN114155388B (zh) | 一种图像识别方法、装置、计算机设备和存储介质 | |
CN116310308A (zh) | 图像分割方法、装置、计算机设备和存储介质 | |
CN115661472A (zh) | 图像查重方法、装置、计算机设备及存储介质 | |
CN115115910A (zh) | 图像处理模型的训练方法、使用方法、装置、设备及介质 | |
CN117036658A (zh) | 一种图像处理方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |