CN107590621A - 基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置 - Google Patents

基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置 Download PDF

Info

Publication number
CN107590621A
CN107590621A CN201710935559.7A CN201710935559A CN107590621A CN 107590621 A CN107590621 A CN 107590621A CN 201710935559 A CN201710935559 A CN 201710935559A CN 107590621 A CN107590621 A CN 107590621A
Authority
CN
China
Prior art keywords
candidate
mrow
frequent
item
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710935559.7A
Other languages
English (en)
Other versions
CN107590621B (zh
Inventor
张紫薇
高文胜
吐松江·卡日
莫文雄
王劲
王红斌
栾乐
崔屹平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Tsinghua University
Guangzhou Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Guangzhou Power Supply Bureau Co Ltd filed Critical Tsinghua University
Priority to CN201710935559.7A priority Critical patent/CN107590621B/zh
Publication of CN107590621A publication Critical patent/CN107590621A/zh
Application granted granted Critical
Publication of CN107590621B publication Critical patent/CN107590621B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置,其中,方法包括:获取预设编码的数据集,并得到总输入数据集;生成第一层的频繁项集;从每层的候选集中寻找频繁项集,并保存对应的支持度;查找对应层项集的超集,并生成下一层级的候选项集,并且调用扫描函数模块查找下一层级的候选项集中是否有频繁项集,同时构建成下一层的候选项集;将每层的频繁项集存入知识库,并通过设备ID与变压器主诊断评价系统建立关键链接关系。该方法可以通过自适应式阈值算法,有效解决了现有方法中静态数据分析的迟缓、以及统一阈值与动态数据规模不同步的问题,并实现了广域数据支撑的变压器缺陷亲和性分析,提高了挖掘结果的精度。

Description

基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置
技术领域
本发明涉及电气设备状态评估智能化技术领域,特别涉及一种基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置。
背景技术
随着社会经济的持续发展,市场对供电负荷量和供电稳定方面的需求渐增。一方面,电网规模随着用电需求的增大而迅速扩大,从扩张效益性来看,电力变压器作为最昂贵的电气设备之一,提高其服役期可用度有利于降低电网的运行成本;另一方面,电力变压器作为输变电系统的核心设备,其运行的可靠性直接影响电力系统的稳定。因此,建立准确的评估系统,实现对服役期电力变压器进行全生命周期管理,能够有效地预防事故的发生,有利于合理安排运维计划,提高电力变压器的可用度,降低运维费用,为电网长期可靠运行提供保障。
其中,家族性缺陷是电气设备状态评估和全生命周期管理的重要考量因素之一,及时发现潜在的家族性缺陷对电网运行安全起着重要的作用。然而,该类缺陷由于制造工艺、设计、材料等因素而造成,一旦一类设备存在家族性缺陷,该家族重设备投运之后出现同样缺陷的概率就会高于其他设备,并且这一类缺陷往往很难通过原理性分析识别。传统的做法通常是通过对某区域、过去某时间段内的静态缺陷数据进行统计分析,该种做法难以为设备的实时状态评估系统提供最有利的参考信息。
相关技术中,近年各地区电力公司已致力于建立大数据平台,将原本存于多个部门管理系统中的数据有效地整合在一个数据平台中。平台数据具有增长快速、规模巨大的特点。并且,各管辖地区之间的数据仍缺乏共享性,数据挖掘算法为大数据分析的核心,而数据规模则决定了挖掘结果的质量,数据的局域性会造成结果的偏差性。
然而,现有的数据挖掘方法不完全满足变压器缺陷分析的需求,主要体现在以下两方面:针对不同数据规模、或日益增长的动态数据库,应用统一的阈值筛选项集明显不利于高效智能的规则挖掘;缺少有效利用广域数据支撑分立的大数据平台数据的功能。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于自适应频繁集挖掘法的缺陷亲和性分析方法,该方法可以有效解决静态数据分析的迟缓、统一阈值与动态数据规模不同步的问题,从而提高挖掘结果的精度,精化评估结果。
本发明的另一个目的在于提出一种基于自适应频繁集挖掘法的缺陷亲和性分析装置。
为达到上述目的,本发明一方面实施例提出了一种基于自适应频繁集挖掘法的缺陷亲和性分析方法,包括以下步骤:获取所有在运电力变压器从投运年起的运行信息,并根据所述运行信息通过模糊识别分类得到缺陷部件和故障模式信息,以添加相应项集至集合,从文本数据集得到所述文本数据集对应的预设编码数据集D1;确认户导向候选项,根据所述户导向候选项调用封装数据仓中对应数据集,以根据调用的数据集与本地数据集合得到总输入数据集;生成第一层的候选项集,以得到所述第一层的选项集的支持度,并确认靶项集,用以计算自适应最小支持度,从而在所述第一层的候选项集中得到满足所述自适应最小支持度的项,以生成第一层的频繁项集;生成扫描函数模块,所述扫描函数模块用于从每层的候选集中寻找频繁项集,并保存对应的支持度;当所述频繁项集不为空集时,查找对应层项集的超集,并生成下一层级的候选项集,并且调用所述扫描函数模块查找所述下一层级的候选项集中是否有频繁项集,以进行保留,同时构建成下一层的候选项集,直到存储完每层的频繁项集;将所述每层的频繁项集存入知识库,并通过设备ID(Identification,身份标识号)与变压器主诊断评价系统建立关键链接关系。
本发明实施例的基于自适应频繁集挖掘法的缺陷亲和性分析方法,可以通过自适应式阈值算法,并利用各地合作项目数据建立封装数据仓,提出调用功能的方案,通过对本地大数据平台数据库中与广域数据仓中变压器缺陷数据的联合调用,实现广域数据支撑的变压器缺陷亲和性分析,而且亲和性分析结果可以实时地为变压器状态诊断评估系统提供动态的量化信息,使变压器状态评估全面包含潜在的家族性缺陷因素的影响,从而有效解决静态数据分析的迟缓、统一阈值与动态数据规模不同步的问题,进而提高挖掘结果的精度,精化评估结果。
另外,根据本发明上述实施例的自适应频繁集挖掘法的缺陷亲和性分析方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述确认户导向候选项,根据所述确认户导向候选项调用封装数据仓中对应数据集,以根据调用的数据集与本地数据集合得到总输入数据集,进一步包括:根据平台需求确认所述户导向候选项t1;根据所述户导向候选项t1从封装的广域数据库Lib(library,静态库)中调用相关数据集Dt1;获取总输入数据集,其中,所述总输入数据集为D1∪Dt1,所述总输入数据集的大小为|D1|+|Dt1|。
进一步地,在本发明的一个实施例中,所述支持度的计算公式为:
进一步地,在本发明的一个实施例中,所述自适应最小支持度的计算公式为:
MinSup=min(supp(X|X∈t2))。
可选地,在本发明的一个实施例中,所述运行信息包括缺陷记录、厂商信息、电压等级、投运日期。
为达到上述目的,本发明另一方面实施例提出了一种基于自适应频繁集挖掘法的缺陷亲和性分析装置,包括:第一获取模块,用于获取所有在运电力变压器从投运年起的运行信息,并根据所述运行信息通过模糊识别分类得到缺陷部件和故障模式信息,以添加相应项集至集合,从文本数据集得到所述文本数据集对应的预设编码数据集D1;第二获取模块,用于确认户导向候选项,根据所述确认户导向候选项调用封装数据仓中对应数据集,以根据调用的数据集与本地数据集合得到总输入数据集;第一生成模块,用于生成第一层的候选项集,以得到所述第一层的选项集的支持度,并确认靶项集,用以计算自适应最小支持度,从而在所述第一层的候选项集中得到满足所述自适应最小支持度的项,以生成第一层的频繁项集;第二生成模块,用于生成扫描函数模块,所述扫描函数模块用于从每层的候选集中寻找频繁项集,并保存对应的支持度;处理模块,用于在所述频繁项集不为空集时,查找对应层项集的超集,并生成下一层级的候选项集,并且调用所述扫描函数模块查找所述下一层级的候选项集中是否有频繁项集,以进行保留,同时构建成下一层的候选项集,直到存储完每层的频繁项集;分析模块,用于将所述每层的频繁项集存入知识库,并通过设备ID与变压器主诊断评价系统建立关键链接关系。
本发明实施例的基于自适应频繁集挖掘法的缺陷亲和性分析装置,可以通过自适应式阈值算法,并利用各地合作项目数据建立封装数据仓,提出调用功能的方案,通过对本地大数据平台数据库中与广域数据仓中变压器缺陷数据的联合调用,实现广域数据支撑的变压器缺陷亲和性分析,而且亲和性分析结果可以实时地为变压器状态诊断评估系统提供动态的量化信息,使变压器状态评估全面包含潜在的家族性缺陷因素的影响,从而有效解决静态数据分析的迟缓、统一阈值与动态数据规模不同步的问题,进而提高挖掘结果的精度,精化评估结果。
另外,根据本发明上述实施例的基于自适应频繁集挖掘法的缺陷亲和性分析装置还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述第二获取模块还用于根据平台需求确认所述户导向候选项t1,并且根据所述确认户导向候选项t1从封装的广域数据库Lib中调用相关数据集Dt1,以及获取总输入数据集,其中,所述总输入数据集为D1∪Dt1,所述总输入数据集的大小为|D1|+|Dt1|。
进一步地,在本发明的一个实施例中,所述支持度的计算公式为:
进一步地,在本发明的一个实施例中,所述自适应最小支持度的计算公式为:
MinSup=min(supp(X|X∈t2))。
可选地,在本发明的一个实施例中,所述运行信息包括缺陷记录、厂商信息、电压等级、投运日期。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的基于自适应频繁集挖掘法的缺陷亲和性分析方法的流程图;
图2为根据本发明一个具体实施例的实施例的基于自适应频繁集挖掘法的缺陷亲和性分析方法的流程图;
图3为根据本发明一个实施例的扫描函数模块实施过程的流程图;
图4为根据本发明一个实施例的基于自适应频繁集挖掘法的缺陷亲和性分析装置的方框示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参照附图描述根据本发明实施例提出的基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置,首先将参照附图描述根据本发明实施例提出的基于自适应频繁集挖掘法的缺陷亲和性分析方法。
图1是本发明一个实施例的基于自适应频繁集挖掘法的缺陷亲和性分析方法的流程图。
如图1所示,该基于自适应频繁集挖掘法的缺陷亲和性分析方法包括以下步骤:
在步骤S101中,获取所有在运电力变压器从投运年起的运行信息,并根据运行信息通过模糊识别分类得到缺陷部件和故障模式信息,以添加相应项集至集合,从文本数据集得到文本数据集对应的预设编码的数据集D1
其中,在本发明的一个实施例中,运行信息包括缺陷记录、厂商信息、电压等级、投运日期。
可以理解的是,如图2所示,本发明实施例的方法可以从本地大数据平台中检索所有在运电力变压器从投运年起的运行信息,例如,缺陷记录、厂商信息、电压等级、投运日期等信息,并且利用模糊识别分类从缺陷记录中提取缺陷部件与故障模式信息,并添加相应项集到数据集,然后将收集与提取的数据集转制为统一编码数据集,即得到预设编码的数据集,进而可以将该数据集记为D1
举例而言,实施的平台可以为某电力公司搭建的大数据中心,在该数据库中,运电力变压器的缺陷相关交易数据以桑基流量分布图展示,从中能够显示出部分特征参量之间的关联与占比。
在步骤S102中,确认户导向候选项,根据确认户导向候选项调用封装数据仓中对应数据集,以根据调用的数据集与本地数据集合得到总输入数据集。
也就是说,如图2所示,确认户导向候选项t1,可以用以调用封装数据仓Lib中对应数据集,调用的数据集与本地数据集合为总输入数据集。
进一步地,在本发明的一个实施例中,确认户导向候选项,根据确认户导向候选项调用封装数据仓中对应数据集,以根据调用的数据集与本地数据集合得到总输入数据集,进一步包括:根据平台需求确认户导向候选项t1;根据户导向候选项t1从封装的广域数据库Lib中调用相关数据集Dt1;获取总输入数据集,其中,总输入数据集为D1∪Dt1,总输入数据集的大小为|D1|+|Dt1|。
可以理解的是,输入数据集获取方法包括:(1)根据平台需求确认户导向候选项t1,用t1从封装的广域数据库Lib中调用相关数据集Dt1;(2)总输入数据集为:D1∪Dt1,大小为:|D1|+|Dt1|,其中,符号‘|D|’表示数据集D的相数。
在本发明的实施例中,本发明实施例的方法可以根据平台的用户需求,确认户导向候选项t1。其中,确认户导向候选项可以为设备厂商信息,根据设备厂商信息,从封装的广域数据仓Lib中调用同厂商设备的数据集Dt1。则总输入数据集为:D1∪Dt1,大小为:|D1|+|Dt1|,其中,符号‘|D|’表示数据集D的相数。
在步骤S103中,生成第一层的候选项集,以得到第一层的选项集的支持度,并确认靶项集,用以计算自适应最小支持度,从而在第一层的候选项集中得到满足自适应最小支持度的项,以生成第一层的频繁项集。
举例而言,如图2所示,生成第一层初始候选项集,计算候选集支持度;确认靶项集t2,计算自适应最小支持度;在初始候选项集中找出满足自适应最小支持度的项,生成第一层频繁项集。
可选地,在本发明的一个实施例中,支持度的计算公式为:
可选地,在本发明的一个实施例中,自适应最小支持度的计算公式为:
MinSup=min(supp(X|X∈t2))。
具体地言,生成第一层初始候选项集,可以根据公式计算候选集支持度;确认靶项集t2,根据公式MinSup=min(supp(X|X∈t2))计算自适应最小支持度;在初始候选项集中找出满足自适应最小支持度的项,生成第一层频繁项集。其中,在本发明的实施例中,‘缺陷部件’作为项靶项集t2,随着数据库数据的动态更新,由t2算出的最小支持度也是动态更新的。
在步骤S104中,生成扫描函数模块,扫描函数模块用于从每层的候选集中寻找频繁项集,并保存对应的支持度。
例如,如图2所示,生成扫描函数模块实现从候选集中寻找频繁项集、并保存对应的支持度功能。其中,该模块的具体实施流程图如图3所示,步骤如下:
步骤S1,开始;
步骤S2,判断can是否属于候选项集;若是,则执行步骤S3;若否,则执行步骤S8;
步骤S3,判断can是否是交易记录tran的子集;若是,则执行步骤S4;若否,则执行步骤S2;
步骤S4,增加计数;
步骤S5,计算支持度;
步骤S6,判断支持度是否不小于最小支持度;若是,则执行步骤S7;若否,则执行步骤S2;
步骤S7,存入频繁项集;
步骤S8,结束。
在步骤S105中,当频繁项集不为空集时,查找对应层项集的超集,并生成下一层级的候选项集,并且调用扫描函数模块查找下一层级的候选项集中是否有频繁项集,以进行保留,同时构建成下一层的候选项集,直到存储完每层的频繁项集。
可以理解的是,如图2所示,当该层频繁项集不为空时,查找该层项集的超集,并生成下一层级的候选项集,且调用生成扫描函数模块查找新候选项集中是否有频繁项集,保留频繁项集,由此构建成下一层的频繁项集,并存储新发现的频繁项集。
在步骤S106中,将每层的频繁项集存入知识库,并通过设备ID与变压器主诊断评价系统建立关键链接关系。
即言,如图2所示,将频繁集存入知识库,并通过设备ID与变压器主诊断评价系统建立关键链接关系。
根据本发明实施例提出的基于自适应频繁集挖掘法的缺陷亲和性分析方法,可以通过自适应式阈值算法,并利用各地合作项目数据建立封装数据仓,提出调用功能的方案,通过对本地大数据平台数据库中与广域数据仓中变压器缺陷数据的联合调用,实现广域数据支撑的变压器缺陷亲和性分析,而且亲和性分析结果可以实时地为变压器状态诊断评估系统提供动态的量化信息,使变压器状态评估全面包含潜在的家族性缺陷因素的影响,从而有效解决静态数据分析的迟缓、统一阈值与动态数据规模不同步的问题,进而提高挖掘结果的精度,精化评估结果。
其次参照附图描述根据本发明实施例提出的基于自适应频繁集挖掘法的缺陷亲和性分析装置。
图4是本发明一个实施例的基于自适应频繁集挖掘法的缺陷亲和性分析装置的方框示意图。
如图4所示,该基于自适应频繁集挖掘法的缺陷亲和性分析装置10包括:第一获取模块100、第二获取模块200、第一生成模块300、第二生成模块400、处理模块500和分析模块600。
其中,第一获取模块100用于获取所有在运电力变压器从投运年起的运行信息,并根据运行信息通过模糊识别分类得到缺陷部件和故障模式信息,以添加相应项集至集合,从文本数据集得到文本数据集对应的预设编码数据集D1。第二获取模块200用于确认户导向候选项,根据确认户导向候选项调用封装数据仓中对应数据集,以根据调用的数据集与本地数据集合得到总输入数据集。第一生成模块300用于生成第一层的候选项集,以得到第一层的选项集的支持度,并确认靶项集,用以计算自适应最小支持度,从而在第一层的候选项集中得到满足自适应最小支持度的项,以生成第一层的频繁项集。第二生成模块400用于生成扫描函数模块,扫描函数模块用于从每层的候选集中寻找频繁项集,并保存对应的支持度。处理模块500用于在频繁项集不为空集时,查找对应层项集的超集,并生成下一层级的候选项集,并且调用扫描函数模块查找下一层级的候选项集中是否有频繁项集,以进行保留,同时构建成下一层的候选项集,直到存储完每层的频繁项集。分析模块600用于将每层的频繁项集存入知识库,并通过设备ID与变压器主诊断评价系统建立关键链接关系。本发明实施例的装置10可以通过自适应式阈值算法,提出调用功能的方案,从而有效解决静态数据分析的迟缓、统一阈值与动态数据规模不同步的问题,进而提高挖掘结果的精度,精化评估结果。
进一步地,在本发明的一个实施例中,第二获取模块200还用于根据平台需求确认户导向候选项t1,并且根据确认户导向候选项t1从封装的广域数据库Lib中调用相关数据集Dt1,以及获取总输入数据集,其中,总输入数据集为D1∪Dt1,总输入数据集的大小为|D1|+|Dt1|。
进一步地,在本发明的一个实施例中,支持度的计算公式为:
进一步地,在本发明的一个实施例中,自适应最小支持度的计算公式为:
MinSup=min(supp(X|X∈t2))。
进一步地,在本发明的一个实施例中,运行信息包括缺陷记录、厂商信息、电压等级、投运日期。
需要说明的是,前述对基于自适应频繁集挖掘法的缺陷亲和性分析方法实施例的解释说明也适用于该实施例的基于自适应频繁集挖掘法的缺陷亲和性分析装置,此处不再赘述。
根据本发明实施例提出的基于自适应频繁集挖掘法的缺陷亲和性分析装置,可以通过自适应式阈值算法,并利用各地合作项目数据建立封装数据仓,提出调用功能的方案,通过对本地大数据平台数据库中与广域数据仓中变压器缺陷数据的联合调用,实现广域数据支撑的变压器缺陷亲和性分析,而且亲和性分析结果可以实时地为变压器状态诊断评估系统提供动态的量化信息,使变压器状态评估全面包含潜在的家族性缺陷因素的影响,从而有效解决静态数据分析的迟缓、统一阈值与动态数据规模不同步的问题,进而提高挖掘结果的精度,精化评估结果。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于自适应频繁集挖掘法的缺陷亲和性分析方法,其特征在于,包括以下步骤:
获取所有在运电力变压器从投运年起的运行信息,并根据所述运行信息通过模糊识别分类得到缺陷部件和故障模式信息,以添加相应项集至集合,从文本数据集得到所述文本数据集对应的预设编码数据集D1
确认户导向候选项,根据所述确认户导向候选项调用封装数据仓中对应数据集,以根据调用的数据集与本地数据集合得到总输入数据集;
生成第一层的候选项集,以得到所述第一层的选项集的支持度,并确认靶项集,用以计算自适应最小支持度,从而在所述第一层的候选项集中得到满足所述自适应最小支持度的项,以生成第一层的频繁项集;
生成扫描函数模块,所述扫描函数模块用于从每层的候选集中寻找频繁项集,并保存对应的支持度;
当所述频繁项集不为空集时,查找对应层项集的超集,并生成下一层级的候选项集,并且调用所述扫描函数模块查找所述下一层级的候选项集中是否有频繁项集,以进行保留,同时构建成下一层的候选项集,直到存储完每层的频繁项集;
将所述每层的频繁项集存入知识库,并通过设备ID与变压器主诊断评价系统建立关键链接关系。
2.根据权利要求1所述的基于自适应频繁集挖掘法的缺陷亲和性分析方法,其特征在于,所述确认户导向候选项,根据所述确认户导向候选项调用封装数据仓中对应数据集,以根据调用的数据集与本地数据集合得到总输入数据集,进一步包括:
根据平台需求确认所述户导向候选项t1;
根据所述户导向候选项t1从封装的广域数据库Lib中调用相关数据集Dt1
获取总输入数据集,其中,所述总输入数据集为D1∪Dt1,所述总输入数据集的大小为|D1|+|Dt1|。
3.根据权利要求2所述的基于自适应频繁集挖掘法的缺陷亲和性分析方法,其特征在于,所述支持度的计算公式为:
<mrow> <mi>sup</mi> <mi>p</mi> <mrow> <mo>(</mo> <mi>Y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <mo>{</mo> <mi>Y</mi> <mo>&amp;SubsetEqual;</mo> <mi>T</mi> <mo>,</mo> <mi>T</mi> <mo>&amp;Element;</mo> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mn>1</mn> </msub> <mo>&amp;cup;</mo> <msub> <mi>D</mi> <mrow> <mi>t</mi> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>}</mo> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mn>1</mn> </msub> <mo>|</mo> <mo>+</mo> <mo>|</mo> <msub> <mi>D</mi> <mrow> <mi>t</mi> <mn>1</mn> </mrow> </msub> <mo>|</mo> </mrow> </mfrac> <mo>.</mo> </mrow>
4.根据权利要求3所述的基于自适应频繁集挖掘法的缺陷亲和性分析方法,其特征在于,所述自适应最小支持度的计算公式为:
MinSup=min(supp(X|X∈t2))。
5.根据权利要求1-4任一项所述的基于自适应频繁集挖掘法的缺陷亲和性分析方法,其特征在于,所述运行信息包括缺陷记录、厂商信息、电压等级、投运日期。
6.一种基于自适应频繁集挖掘法的缺陷亲和性分析装置,其特征在于,包括:
第一获取模块,用于获取所有在运电力变压器从投运年起的运行信息,并根据所述运行信息通过模糊识别分类得到缺陷部件和故障模式信息,以添加相应项集至集合,从文本数据集得到所述文本数据集对应的预设编码数据集D1
第二获取模块,用于确认户导向候选项,根据所述确认户导向候选项调用封装数据仓中对应数据集,以根据调用的数据集与本地数据集合得到总输入数据集;
第一生成模块,用于生成第一层的候选项集,以得到所述第一层的选项集的支持度,并确认靶项集,用以计算自适应最小支持度,从而在所述第一层的候选项集中得到满足所述自适应最小支持度的项,以生成第一层的频繁项集;
第二生成模块,用于生成扫描函数模块,所述扫描函数模块用于从每层的候选集中寻找频繁项集,并保存对应的支持度;
处理模块,用于在所述频繁项集不为空集时,查找对应层项集的超集,并生成下一层级的候选项集,并且调用所述扫描函数模块查找所述下一层级的候选项集中是否有频繁项集,以进行保留,同时构建成下一层的候选项集,直到存储完每层的频繁项集;
分析模块,用于将所述每层的频繁项集存入知识库,并通过设备ID与变压器主诊断评价系统建立关键链接关系。
7.根据权利要求6所述的基于自适应频繁集挖掘法的缺陷亲和性分析装置,其特征在于,所述第二获取模块还用于根据平台需求确认所述户导向候选项t1,并且根据所述确认户导向候选项t1从封装的广域数据库Lib中调用相关数据集Dt1,以及获取总输入数据集,其中,所述总输入数据集为D1∪Dt1,所述总输入数据集的大小为|D1|+|Dt1|。
8.根据权利要求7所述的基于自适应频繁集挖掘法的缺陷亲和性分析装置,其特征在于,所述支持度的计算公式为:
<mrow> <mi>sup</mi> <mi>p</mi> <mrow> <mo>(</mo> <mi>Y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <mo>{</mo> <mi>Y</mi> <mo>&amp;SubsetEqual;</mo> <mi>T</mi> <mo>,</mo> <mi>T</mi> <mo>&amp;Element;</mo> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mn>1</mn> </msub> <mo>&amp;cup;</mo> <msub> <mi>D</mi> <mrow> <mi>t</mi> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>}</mo> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mn>1</mn> </msub> <mo>|</mo> <mo>+</mo> <mo>|</mo> <msub> <mi>D</mi> <mrow> <mi>t</mi> <mn>1</mn> </mrow> </msub> <mo>|</mo> </mrow> </mfrac> <mo>.</mo> </mrow>
9.根据权利要求8所述的基于自适应频繁集挖掘法的缺陷亲和性分析装置,其特征在于,所述自适应最小支持度的计算公式为:
MinSup=min(supp(X|X∈t2))。
10.根据权利要求6-9任一项所述的基于自适应频繁集挖掘法的缺陷亲和性分析装置,其特征在于,所述运行信息包括缺陷记录、厂商信息、电压等级、投运日期。
CN201710935559.7A 2017-10-10 2017-10-10 基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置 Active CN107590621B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710935559.7A CN107590621B (zh) 2017-10-10 2017-10-10 基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710935559.7A CN107590621B (zh) 2017-10-10 2017-10-10 基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置

Publications (2)

Publication Number Publication Date
CN107590621A true CN107590621A (zh) 2018-01-16
CN107590621B CN107590621B (zh) 2020-08-21

Family

ID=61052107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710935559.7A Active CN107590621B (zh) 2017-10-10 2017-10-10 基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置

Country Status (1)

Country Link
CN (1) CN107590621B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609857A (zh) * 2019-08-30 2019-12-24 哈尔滨工业大学(威海) 一种基于动态阈值的序列模式挖掘方法及其用途

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013082955A1 (zh) * 2011-12-08 2013-06-13 中国电力科学研究院 一种锂离子电池运行状态评估分析系统
CN103455563A (zh) * 2013-08-15 2013-12-18 国家电网公司 一种适用于智能变电站一体化监控系统的数据挖掘方法
CN103513139A (zh) * 2013-10-16 2014-01-15 王丽华 一种电力变压器故障智能诊断技术、方法及设备
CN103902816A (zh) * 2014-03-12 2014-07-02 郑州轻工业学院 基于数据挖掘技术的带电检测数据处理方法
CN104598569A (zh) * 2015-01-12 2015-05-06 北京航空航天大学 一种基于关联规则的mbd数据集完整性检查方法
CN105373883A (zh) * 2015-10-30 2016-03-02 江苏省电力公司电力科学研究院 基于数据挖掘的变压器家族性缺陷的预警方法
CN105843210A (zh) * 2016-03-22 2016-08-10 清华大学 电力变压器缺陷信息数据挖掘方法
CN103955542B (zh) * 2014-05-20 2017-03-22 广西财经学院 文本词间完全加权正负关联模式挖掘方法及其挖掘系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013082955A1 (zh) * 2011-12-08 2013-06-13 中国电力科学研究院 一种锂离子电池运行状态评估分析系统
CN103455563A (zh) * 2013-08-15 2013-12-18 国家电网公司 一种适用于智能变电站一体化监控系统的数据挖掘方法
CN103513139A (zh) * 2013-10-16 2014-01-15 王丽华 一种电力变压器故障智能诊断技术、方法及设备
CN103902816A (zh) * 2014-03-12 2014-07-02 郑州轻工业学院 基于数据挖掘技术的带电检测数据处理方法
CN103955542B (zh) * 2014-05-20 2017-03-22 广西财经学院 文本词间完全加权正负关联模式挖掘方法及其挖掘系统
CN104598569A (zh) * 2015-01-12 2015-05-06 北京航空航天大学 一种基于关联规则的mbd数据集完整性检查方法
CN105373883A (zh) * 2015-10-30 2016-03-02 江苏省电力公司电力科学研究院 基于数据挖掘的变压器家族性缺陷的预警方法
CN105843210A (zh) * 2016-03-22 2016-08-10 清华大学 电力变压器缺陷信息数据挖掘方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吐松江·卡日,高文胜等: "SF6断路器缺陷分析与运维策略", 《高压电器》 *
吐松江·卡日,高文胜等: "基于支持向量机和遗传算法的变压器故障诊断", 《清华大学学报(自然科学版)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609857A (zh) * 2019-08-30 2019-12-24 哈尔滨工业大学(威海) 一种基于动态阈值的序列模式挖掘方法及其用途

Also Published As

Publication number Publication date
CN107590621B (zh) 2020-08-21

Similar Documents

Publication Publication Date Title
Lim et al. Agility and proximity considerations in supply chain design
León et al. Variability and trend-based generalized rule induction model to NTL detection in power companies
CN111639237B (zh) 一种基于聚类和关联规则挖掘的电力通信网风险评估系统
CN104462314B (zh) 电网数据处理方法及装置
CN109816161A (zh) 一种配电网运行辅助决策分析系统及其应用方法
CN109117974A (zh) 一种配电网台区重过载风险评估方法和装置
CN102870056A (zh) 智能网络
CN104239437A (zh) 一种面向电网调度的智能告警分析方法
CN106503121A (zh) 一种x光安检图像的结构化描述方法及系统
CN114048870A (zh) 一种基于日志特征智能挖掘的电力系统异常监测方法
CN105488118B (zh) 电气设备故障信息的展示方法和装置
CN106021733B (zh) 一种生产线的快速定制设计服务系统
CN102567412A (zh) 一种计算机辅助电网负荷分析的信息处理方法
CN109816233A (zh) 用于电网的用户标签模型生成方法及装置
CN104299056A (zh) 配电网规划基础技术支持平台
CN106708984A (zh) 采集电缆通道的基础数据的方法、装置和系统
CN110348683A (zh) 电能质量扰动事件主成因分析方法、装置设备及存储介质
CN108269059B (zh) 一种数据管理系统
CN107844962B (zh) 一种基于标准数据结构的配网工程造价数据归集系统
CN107590621A (zh) 基于自适应频繁集挖掘法的缺陷亲和性分析方法及装置
CN107862459B (zh) 一种基于大数据的计量设备状态评估方法及系统
CN110458421A (zh) 一种质量安全管理方法、装置以及存储装置
CN105894093A (zh) 基于微信平台的风电变流器健康值及产品追溯系统及方法
CN110262313B (zh) 基于物联网技术的电力物资关键点远程监测系统
CN102222038A (zh) 一种基于银行业务的交易软件测试方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231030

Address after: 100084 Tsinghua Yuan, Beijing, Haidian District

Patentee after: TSINGHUA University

Patentee after: Guangzhou Power Supply Bureau of Guangdong Power Grid Co.,Ltd.

Address before: 100084 Tsinghua Yuan, Beijing, Haidian District

Patentee before: TSINGHUA University

Patentee before: GUANGZHOU POWER SUPPLY Co.,Ltd.