CN111160750A - 一种基于关联规则挖掘的配网分析和投资决策方法 - Google Patents
一种基于关联规则挖掘的配网分析和投资决策方法 Download PDFInfo
- Publication number
- CN111160750A CN111160750A CN201911341294.3A CN201911341294A CN111160750A CN 111160750 A CN111160750 A CN 111160750A CN 201911341294 A CN201911341294 A CN 201911341294A CN 111160750 A CN111160750 A CN 111160750A
- Authority
- CN
- China
- Prior art keywords
- index
- data
- distribution network
- analysis
- investment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000005065 mining Methods 0.000 title claims abstract description 31
- 238000003012 network analysis Methods 0.000 title claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 15
- 230000009467 reduction Effects 0.000 claims abstract description 14
- 238000003064 k means clustering Methods 0.000 claims abstract description 11
- 238000010606 normalization Methods 0.000 claims abstract description 10
- 238000013210 evaluation model Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000000513 principal component analysis Methods 0.000 claims abstract description 7
- 238000011156 evaluation Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000011002 quantification Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012847 principal component analysis method Methods 0.000 claims description 3
- 238000000611 regression analysis Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000008859 change Effects 0.000 abstract description 2
- 230000035945 sensitivity Effects 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012098 association analyses Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
- G06Q10/06375—Prediction of business process outcome or impact based on a proposed change
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Strategic Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于关联规则挖掘的配网分析和投资决策方法。通过采集配网历史运行数据,并进行数据预处理,对坏数据/缺数据情况进行填补或剔除,并根据指标分析要求进行数据归一化处理;随后通过主成分分析进行降维处理,采用K‑means聚类对各指标进行聚类分析;对于不同主成分,通过数据关联规则挖掘频繁项集以及强/弱关联规则,确定影响各个主成分的强关联指标;与此同时,建立配网运行评估模型,根据综合评分和各层级得分寻找配网的薄弱点;根据指标年变化率和年度投资金额建立投资回报率模型,挖掘对投资敏感度的指标;最后综合配网运行现状、主成分强关联指标和投资回报率模型建立投资量化决策模型,进行定量投资决策分析。
Description
技术领域
本发明涉及的一种基于关联规则挖掘的配网分析和投资决策方法,是一种以配电网运行状态分析为基础,采用数据清洗、数据关联规则挖掘配影响电网运行的关键指标,采用综合评价寻找配网运行薄弱环节,根据薄弱环节的影响指标和投资回报率进行后续投资决策,属于配网运行评估范畴。
背景技术
随着国家经济结构调整,电力企业投资管理的目标已从扩大规模逐渐向提高电网质量转变。然而配电网建设规模较大、不确定因素众多、其建设过程中存在诸多问题与挑战,针对复杂配电网综合评价与决策研究,简单根据设备规模、负载率等单方面指标的统计结果,依赖专家经验定性分析评价配电系统,已不能满足其科学化投资管理的需要,与此同时,随着电力大数据的不断普及,如何利用好大数据,深度挖掘配网运行中的薄弱环节,并为此后的投资提供决策依据,因此必要提出一种基于关联规则挖掘的配网分析和投资决策方法。
针对配电网发展现状的综合评价和决策分析,目前部分方法通过建立配电网投资决策评价指标体系,结合层次分析法、主成分分析、聚类分析等展开综合投资决策分析并确定了最优投资方案,但此类方法多从统计学角度进行分析,并未利用大数据技术对数据指标之间存在的潜在联系进行深层挖掘,且所得到的投资方案只是停留在方向上的指引,并未做出量化决策方案,因此关于配电网发展现状的综合评价和决策分析研究存在以下不足:
1.未考虑数据指标潜在的联系。电力大数据的不断普及使得采用传统统计方法对配网进行评估已远远不够,利用大数据技术挖掘配网运行的潜在问题的趋势未来会越来越明显,而当今鲜有研究将大数据技术运用在配网投资决策方案中。
2.未量化给出投资决策方案。绝大部分配网投资方案均只是根据配网的发展现状给出方向性的建议,并未具体给出投资量化分析,随着大数据技术的挖掘,投资量化的有效性分析可根据配网相应指标的实际年变化量和目标年变化量进行挖掘和资金量化分配。
综上所述,有必要将大数据技术与配网运行评估和投资决策进行融合,寻找配网运行指标内的潜在关联规则,为配网投资提出量化决策方案。
发明内容
为解决上述问题,为配网投资决策提供参考,本发明提出一种基于关联规则挖掘的配网分析和投资决策方法。通过采集配网历史运行数据,并进行数据预处理,对坏数据/缺数据情况进行填补或剔除,并根据指标分析要求进行数据归一化处理;随后通过主成分分析进行降维处理,采用K-means聚类对各指标进行聚类分析;对于不同主成分,通过数据关联规则挖掘频繁项集以及强/弱关联规则,确定影响各个主成分的强关联指标;与此同时,建立配网运行评估模型,根据综合评分和各层级得分寻找配网的薄弱点;根据指标年变化率和年度投资金额建立投资回报率模型,挖掘对投资敏感度的指标;最后综合配网运行现状、主成分强关联指标和投资回报率模型建立投资量化决策模型,进行定量投资决策分析。
为实现上述目的,本发明采用的技术方案为:
一种基于关联规则挖掘的配网分析和投资决策方法包含以下步骤:
步骤S1、获取配网运行数据,分别采用均值法、多重插补法进行坏数据和缺数据进行数据预处理,并用最大值-最小值进行归一化和标准化处理;
步骤S2、采用主成分分析法对数据进行降维分析,将所得数据分为n个维度;
步骤S3、采用K-means聚类方法,对各指标数据和各指标数据年变化量进行聚类分析,确定聚类中心,并根据距离聚类中心的长短确定等级范围;
步骤S4、设定最小支持度,采用FP-Growth算法从n个维度挖掘频繁项集;
步骤S5、采用关联规则挖掘各项指标与所述维度的关联规则、各指标年变化量与投资金额的关联规则,并设定最小置信度,寻找各维度上指标的强关联规则和各指标的投资回报率;
步骤S6、根据预处理后得到的指标数据建立配网运行评估模型,寻找配网运行薄弱点及其强关联指标;
步骤S7、根据强关联规则寻找影响配网运行的薄弱指标和各指标的投资回报率综合进行投资决策;
其中,步骤S1具体如下,为获得后续评估的有效完整的数据,构建坏数据和缺失数据的填补和删除模型:
针对缺失数据,采用多重插补模型处理,采用R语言的mice()函数对缺失数据集进行处理,生成多个完整数据集,再利用with()函数对完整数据集进行线性模型回归分析,最后采用pool()函数将单独的分析结果整合为一组结果,根据最终模型的标准误差和p值选取较为合理的值;
不可修复坏数据,直接删除该指标;可修复发坏数据,采用均值替换模型:
式中:xi为指标坏数据,xj为除指标坏数据外的同一类型的数据,I为除含坏数据外的指标数据集合。
其中,步骤S2具体如下,采用主成分分析对经预处理后得到的Ns个指标进行降维分析,并根据样本信息量确定主成分及其各主成分所包含的指标:
Y=PX (2)
其中,步骤S3具体如下,采用k-means聚类对Ns个指标进行聚类,并确定Na个对象分别对应的Ns个指标的等级范围;
以年份为基本单元,对Ns个指标作k-means聚类,其基本步骤为:
1.对Na个指标作归一化处理,归一化公式为:
xij *=(xij-xi,min)/(xi,max-xi,min)(i=1,2,…Na;j=1,2,…Nd) (3)
式中,xij *为第i个指标第j个数据归一化后的值,xi,min为第i个指标的最小值,xi,max为第i个指标的最大值;
2.分别构造Na个指标的k-means聚类样本:
式中,Si为指标i的聚类样本;
3.从Si中随机选取k个不重复行向量,初始化k个聚类中心,xc1、xc2…xck;4.计算每一个样本到各聚类中心的距离,并把样本归到各聚类中心,其中距离公式采用欧式距离公式:
4.计算每一类新的聚类中心,则第i个聚类中心的更新公式为:
5.重复上述步骤4,直至聚类中心收敛为止;
其中,步骤S4具体如下,采用FP-Growth算法分别从各个主成分挖掘频繁项集:
1.选取主成分i的最小支持度:
式中,Ngrade_I为指标等级个数不小于Dmin的事务个数;
2.将Nd组数据集中的等级按照出现的次数降序排列,删除小于min_sup_I的项,然后按照每个事务对应的支持度进行排序,删掉小于min_sup_I的项;
3.用排序好的事务构建前缀树,即FP-Tree树;
4.深度优先遍历FP-Tree树,生成其条件模式基;
5.以条件模式基当成数据库,重复(2-4),最后生成频繁项集。
其中,步骤S5具体如下,采用关联规则算法挖掘与各主成分具有强相关的指标等级:
1.选取主成分i的最小置信度:
式中,Cgrade_A为主成分i中包含A指标等级的事务个数,Cmul_grade为主成分i中同时包含A和B指标等级的最小事务个数,A,B为待判定的指标等级;
2.根据最小支持度确定主成分i的强关联规则,为寻找配网运行薄弱主成分的强关联规则作铺垫。
其中,步骤S6具体如下,建立配网运行评估模型;
1.根据上述经过预处理后得到的Nd*Na*Ny个数据按其性质分类,构建层次结构指标体系,并用层次分析法构造判断矩阵,进一步计算第i个指标的主观权重值αi(i=1,2,…,n);
2.利用熵权法计算第i个指标的客观权重值βi;
3.根据αi和βi,进一步计算各个指标组合赋权值γi:
式中,θ1、θ2分别为层次分析法和熵权法的加权系数;
4.根据组合权重γi和隶属度函数,计算每个指标的得分;
5.将各个指标的得分相加,得出每个评价对象的综合得分,综合得分采用百分制计算,设定最低得分为60分,最高得分为100分;
6.根据专家组制定的综合得分等级划分区间,将综合得分进行等级划分和进一步的评估分析,得到配网运行的薄弱成分。
其中,步骤S7具体如下,建立综合配网运行现状、主成分强关联指标和投资回报率模型建立投资量化决策模型:
式中,fi为指标i的投资回报率,Δxi为指标i的实际年变化量,ΔOi为指标i的目标年变化量,Mi为指标i是否为配网薄弱指标,Ci为指标i的置信度值
所述数据预处理方法,能够保证数据库的信息完整性和分析结果可靠性;
所述主成分分析法,能够降低数据指标分析的冗余度,精简意义相同的指标,提高分析效率;
所述K-means聚类方法,实现多数据的自动聚类,排除人为分类的主观性,提高决策分析的客观性;
所述数据关联规则技术,能够挖掘数据潜在关联,更加充分地利用数据特性,为决策提供更有效的参考的依据。
相对于现有技术,本发明的优点如下:该技术方案克服了现有技术的问题,考虑到数据指标潜在的联系,并且量化给出具体的投资决策分析。本发明首先采用大数据技术对初步选取的指标数据进行清洗,得到数据完整、合理和准确评价体系,采用主成分分析和聚类分析将评价指标体系按不同的性质进行指标关联分析,从不同角度和不同维度进行配电网评价分析;采用基于FP_Tree的关联规则和最小置信度和最小支持度确定不同性质下指标间的强弱关联关系,从指标本身数据间的关系入手,改变了通过传统专家经验法确定指标间的关联强度的方法,具有客观性和有效性;最后根据强弱关联规则和基础指标数据改善量建立基于投资回报率的投资量化决策模型,配电网可根据投资决策模型值的排序确定投资方向,以量化分析给出配电网投资决策方案,降低了专家根据经验给出配网改造方案带来的主观性和局限性,更加注重配电网本身的状况进行决策分析。
附图说明
图1为基于关联规则挖掘的配网分析和投资决策策略流程图。
图2为基于熵权层次分析法的配电网组合赋权综合评估方法流程图。
具体实施方式
为了加深对本发明的认识和理解,下面结合附图对本发明作更进一步的说明,
实施例1:参见图1、图2,一种基于关联规则挖掘的配网分析和投资决策方法包含以下步骤:
步骤S1、获得历史数据,并构建坏数据和缺失数据的填补和删除模型;
针对缺失数据,采用多重插补模型处理,采用R语言的mice()函数对缺失数据集进行处理,生成多个完整数据集,再利用with()函数对完整数据集进行线性模型回归分析,最后采用pool()函数将单独的分析结果整合为一组结果,根据最终模型的标准误差和p值选取较为合理的值;
不可修复坏数据,直接删除该指标;可修复发坏数据,采用均值替换模型:
式中:xi为指标坏数据,xj为除指标坏数据外的同一类型的数据,I为除含坏数据外的指标数据集合。
步骤S2、采用主成分分析对经预处理后得到的Ns个指标进行降维分析,并根据样本信息量确定主成分及其各主成分所包含的指标:
Y=PX (2)
基本步骤如下:1.对所有样本进行中心化:
式中,xi为第i个数据经中心化后的值,xj为第j个数据未中心化的值。
2.计算样本协方差矩阵C:
3.求出协方差矩阵的特征值及对应的特征向量;4、将特征向量按对应特征值大小从上到下按行排列成矩阵,取前Na行组成矩阵P;5、Y=PX即为降维到Na维后的数据。
步骤S3、采用k-means聚类对Ns个指标进行聚类,并确定Nd个对象分别对应的Ns个指标的等级范围;
以年份为基本单元,对Ns个指标作k-means聚类,其基本步骤为:1.对Na个指标作归一化处理,归一化公式为:
xij *=(xij-xi,min)/(xi,max-xi,min)(i=1,2,…Na;j=1,2,…Nd) (5)
式中,xij *为第i个指标第j个数据归一化后的值,xi,min为第i个指标的最小值,xi,max为第i个指标的最大值;2.分别构造Na个指标的k-means聚类样本:
式中,Si为指标i的聚类样本;
3.从Si中随机选取k个不重复行向量,初始化k个聚类中心,xc1、xc2…xck;4.计算每一个样本到各聚类中心的距离,并把样本归到各聚类中心,其中距离公式采用欧式距离公式:
4.计算每一类新的聚类中心,则第i个聚类中心的更新公式为:
5.重复上述步骤4,直至聚类中心收敛为止;
步骤S4、采用FP-Growth算法分别从各个主成分挖掘频繁项集:
1.选取主成分i的最小支持度:
式中,Ngrade_I为指标等级个数不小于Dmin的事务个数;
2.将Nd组数据集中的等级按照出现的次数降序排列,删除小于min_sup_I的项,然后按照每个事务对应的支持度进行排序,删掉小于min_sup_I的项;3.用排序好的事务构建前缀树,即FP-Tree树;4.深度优先遍历FP-Tree树,生成其条件模式基;5.以条件模式基当成数据库,重复(2-4),最后生成频繁项集。
步骤S5、采用关联规则算法挖掘与各主成分具有强相关的指标等级:
1.选取主成分i的最小置信度:
式中,Cgrade_A为主成分i中包含A指标等级的事务个数,Cmul_grade为主成分i中同时包含A和B指标等级的最小事务个数,A,B为待判定的指标等级;
2.根据最小支持度确定主成分i的强关联规则,为寻找配网运行薄弱主成分的强关联规则作铺垫。
步骤S6、建立配网运行评估模型:
1.根据上述经过预处理后得到的Nd*Na*Ny个数据按其性质分类,构建层次结构指标体系,并用层次分析法构造判断矩阵,进一步计算第i个指标的主观权重值αi(i=1,2,…,n);2.利用熵权法计算第i个指标的客观权重值βi;3.根据αi和βi,进一步计算各个指标组合赋权值γi:
式中,θ1、θ2分别为层次分析法和熵权法的加权系数;
4.根据组合权重γi和隶属度函数,计算每个指标的得分;5.将各个指标的得分相加,得出每个评价对象的综合得分,综合得分采用百分制计算,设定最低得分为60分,最高得分为100分;6.根据专家组制定的综合得分等级划分区间,将综合得分进行等级划分和进一步的评估分析,得到配网运行的薄弱成分。
步骤S7、建立综合配网运行现状、主成分强关联指标和投资回报率模型建立投资量化决策模型:
式中,fi为指标i的投资回报率,Δxi为指标i的实际年变化量,ΔOi为指标i的目标年变化量,Mi为指标i是否为配网薄弱指标,Ci为指标i的置信度值。
需要说明的是上述实施例仅仅是本发明的较佳实施例,并没有用来限定本发明的保护范围,在上述技术方案的基础上做出的等同替换或者替代均属于本发明的保护范围。
Claims (8)
1.一种基于关联规则挖掘的配网分析和投资决策方法,其特征在于,所述方法包含以下步骤:
步骤S1、获取配网运行数据,分别采用均值法、多重插补法进行坏数据和缺数据进行数据预处理,并用最大值-最小值进行归一化和标准化处理;
步骤S2、采用主成分分析法对数据进行降维分析,将所得数据分为n个维度;
步骤S3、采用K-means聚类方法,对各指标数据和各指标数据年变化量进行聚类分析,确定聚类中心,并根据距离聚类中心的长短确定等级范围;
步骤S4、设定最小支持度,采用FP-Growth算法从n个维度挖掘频繁项集;
步骤S5、采用关联规则挖掘各项指标与所述维度的关联规则、各指标年变化量与投资金额的关联规则,并设定最小置信度,寻找各维度上指标的强关联规则和各指标的投资回报率;
步骤S6、根据预处理后得到的指标数据建立配网运行评估模型,寻找配网运行薄弱点及其强关联指标;
步骤S7、根据强关联规则寻找影响配网运行的薄弱指标和各指标的投资回报率综合进行投资决策。
2.根据权利要求1所述的一种基于关联规则挖掘的配网分析和投资决策方法,其特征在于:步骤S1具体如下,为获得后续评估的有效完整的数据,构建坏数据和缺失数据的填补和删除模型:
针对缺失数据,采用多重插补模型处理,采用R语言的mice()函数对缺失数据集进行处理,生成多个完整数据集,再利用with()函数对完整数据集进行线性模型回归分析,最后采用pool()函数将单独的分析结果整合为一组结果,根据最终模型的标准误差和p值选取较为合理的值;
不可修复坏数据,直接删除该指标;可修复发坏数据,采用均值替换模型:
式中:xi为指标坏数据,xj为除指标坏数据外的同一类型的数据,I为除含坏数据外的指标数据集合。
4.根据权利要求1所述的一种基于关联规则挖掘的配网分析和投资决策方法,其特征在于:步骤S3具体如下,采用k-means聚类对Ns个指标进行聚类,并确定Na个对象分别对应的Ns个指标的等级范围;
以年份为基本单元,对Ns个指标作k-means聚类,其基本步骤为:
1.对Na个指标作归一化处理,归一化公式为:
xij *=(xij-xi,min)/(xi,max-xi,min)(i=1,2,…Na;j=1,2,…Nd) (3)
式中,xij *为第i个指标第j个数据归一化后的值,xi,min为第i个指标的最小值,xi,max为第i个指标的最大值;
2.分别构造Na个指标的k-means聚类样本:
式中,Si为指标i的聚类样本;
3.从Si中随机选取k个不重复行向量,初始化k个聚类中心,xc1、xc2…xck;4.计算每一个样本到各聚类中心的距离,并把样本归到各聚类中心,其中距离公式采用欧式距离公式:
4.计算每一类新的聚类中心,则第i个聚类中心的更新公式为:
5.重复上述步骤4,直至聚类中心收敛为止。
7.根据权利要求1所述的一种基于关联规则挖掘的配网分析和投资决策策,其特征在于:步骤S6具体如下,建立配网运行评估模型;
1.根据上述经过预处理后得到的Nd*Na*Ny个数据按其性质分类,构建层次结构指标体系,并用层次分析法构造判断矩阵,进一步计算第i个指标的主观权重值αi(i=1,2,…,n);
2.利用熵权法计算第i个指标的客观权重值βi;
3.根据αi和βi,进一步计算各个指标组合赋权值γi:
式中,θ1、θ2分别为层次分析法和熵权法的加权系数;
4.根据组合权重γi和隶属度函数,计算每个指标的得分;
5.将各个指标的得分相加,得出每个评价对象的综合得分,综合得分采用百分制计算,设定最低得分为60分,最高得分为100分;
6.根据专家组制定的综合得分等级划分区间,将综合得分进行等级划分和进一步的评估分析,得到配网运行的薄弱成分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911341294.3A CN111160750A (zh) | 2019-12-23 | 2019-12-23 | 一种基于关联规则挖掘的配网分析和投资决策方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911341294.3A CN111160750A (zh) | 2019-12-23 | 2019-12-23 | 一种基于关联规则挖掘的配网分析和投资决策方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111160750A true CN111160750A (zh) | 2020-05-15 |
Family
ID=70558091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911341294.3A Pending CN111160750A (zh) | 2019-12-23 | 2019-12-23 | 一种基于关联规则挖掘的配网分析和投资决策方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111160750A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111768045A (zh) * | 2020-07-03 | 2020-10-13 | 上海积成能源科技有限公司 | 一种居民用电管理中应用多重插补补充居民用电缺失数据的方法 |
CN111798333A (zh) * | 2020-06-12 | 2020-10-20 | 国网山东省电力公司电力科学研究院 | 一种用能评估与用电安全分析方法和系统 |
CN111815190A (zh) * | 2020-07-15 | 2020-10-23 | 国网能源研究院有限公司 | 基于多元信息深度挖掘的电网发展诊断分析方法和系统 |
CN112257015A (zh) * | 2020-10-28 | 2021-01-22 | 华润电力技术研究院有限公司 | 一种火电机组数据获取方法、系统及数据处理方法 |
CN112286923A (zh) * | 2020-11-05 | 2021-01-29 | 河海大学常州校区 | 一种智能制造资源数据预处理方法 |
CN112381654A (zh) * | 2020-11-13 | 2021-02-19 | 国网福建省电力有限公司经济技术研究院 | 一种电网工程投资管理指标关联性分析方法 |
CN112861008A (zh) * | 2021-03-01 | 2021-05-28 | 山东大学 | 一种基于多用户信息融合和熵的餐厅点餐推荐方法和系统 |
CN113049226A (zh) * | 2021-03-15 | 2021-06-29 | 中国电力科学研究院有限公司 | 一种基于环境参量的opgw光缆健康度评估方法及系统 |
CN113592035A (zh) * | 2021-08-23 | 2021-11-02 | 广州梦源信息科技有限公司 | 基于ai辅助决策的大数据挖掘方法及ai辅助决策系统 |
CN114116828A (zh) * | 2020-08-31 | 2022-03-01 | 中兴通讯股份有限公司 | 多维网络指标的关联规则分析方法、设备和存储介质 |
CN117539726A (zh) * | 2024-01-09 | 2024-02-09 | 广东奥飞数据科技股份有限公司 | 绿色智算中心能效优化方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930482A (zh) * | 2012-11-30 | 2013-02-13 | 河北省电力公司电力科学研究院 | 一种县域配电网投资效果评估方法 |
CN106446016A (zh) * | 2016-08-29 | 2017-02-22 | 中国电力科学研究院 | 一种基于并行关联规则挖掘的配电网运行可靠性预测方法 |
CN109636157A (zh) * | 2018-11-30 | 2019-04-16 | 国网冀北电力有限公司经济技术研究院 | 一种新型配电网投资效益分析方法 |
CN109857775A (zh) * | 2018-12-30 | 2019-06-07 | 国网天津市电力公司电力科学研究院 | 一种配电网调度控制系统的海量历史数据挖掘方法 |
CN110555623A (zh) * | 2019-09-10 | 2019-12-10 | 南方电网科学研究院有限责任公司 | 一种配电设备日运行效率的主要影响因素筛选方法及装置 |
-
2019
- 2019-12-23 CN CN201911341294.3A patent/CN111160750A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930482A (zh) * | 2012-11-30 | 2013-02-13 | 河北省电力公司电力科学研究院 | 一种县域配电网投资效果评估方法 |
CN106446016A (zh) * | 2016-08-29 | 2017-02-22 | 中国电力科学研究院 | 一种基于并行关联规则挖掘的配电网运行可靠性预测方法 |
CN109636157A (zh) * | 2018-11-30 | 2019-04-16 | 国网冀北电力有限公司经济技术研究院 | 一种新型配电网投资效益分析方法 |
CN109857775A (zh) * | 2018-12-30 | 2019-06-07 | 国网天津市电力公司电力科学研究院 | 一种配电网调度控制系统的海量历史数据挖掘方法 |
CN110555623A (zh) * | 2019-09-10 | 2019-12-10 | 南方电网科学研究院有限责任公司 | 一种配电设备日运行效率的主要影响因素筛选方法及装置 |
Non-Patent Citations (3)
Title |
---|
刘海林等: "基于关联规则算法的配电网联络有效性", 《农村电气化》 * |
朱倩: "基于复杂网络的中压配电网综合评估指标体系研究", 《中国优秀硕士学位论文全文数据库(电子期刊) 工程科技Ⅱ辑》 * |
李琪等: "基于主成分分析和集对分析理论的配电网项目群投资决策", 《广东电力》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798333A (zh) * | 2020-06-12 | 2020-10-20 | 国网山东省电力公司电力科学研究院 | 一种用能评估与用电安全分析方法和系统 |
CN111768045A (zh) * | 2020-07-03 | 2020-10-13 | 上海积成能源科技有限公司 | 一种居民用电管理中应用多重插补补充居民用电缺失数据的方法 |
CN111815190A (zh) * | 2020-07-15 | 2020-10-23 | 国网能源研究院有限公司 | 基于多元信息深度挖掘的电网发展诊断分析方法和系统 |
CN114116828A (zh) * | 2020-08-31 | 2022-03-01 | 中兴通讯股份有限公司 | 多维网络指标的关联规则分析方法、设备和存储介质 |
CN112257015A (zh) * | 2020-10-28 | 2021-01-22 | 华润电力技术研究院有限公司 | 一种火电机组数据获取方法、系统及数据处理方法 |
CN112257015B (zh) * | 2020-10-28 | 2023-08-15 | 华润电力技术研究院有限公司 | 一种火电机组数据获取方法、系统及数据处理方法 |
CN112286923B (zh) * | 2020-11-05 | 2023-06-20 | 河海大学常州校区 | 一种智能制造资源数据预处理方法 |
CN112286923A (zh) * | 2020-11-05 | 2021-01-29 | 河海大学常州校区 | 一种智能制造资源数据预处理方法 |
CN112381654A (zh) * | 2020-11-13 | 2021-02-19 | 国网福建省电力有限公司经济技术研究院 | 一种电网工程投资管理指标关联性分析方法 |
CN112861008A (zh) * | 2021-03-01 | 2021-05-28 | 山东大学 | 一种基于多用户信息融合和熵的餐厅点餐推荐方法和系统 |
CN112861008B (zh) * | 2021-03-01 | 2022-08-09 | 山东大学 | 一种基于多用户信息融合和熵的餐厅点餐推荐方法和系统 |
CN113049226A (zh) * | 2021-03-15 | 2021-06-29 | 中国电力科学研究院有限公司 | 一种基于环境参量的opgw光缆健康度评估方法及系统 |
CN113592035A (zh) * | 2021-08-23 | 2021-11-02 | 广州梦源信息科技有限公司 | 基于ai辅助决策的大数据挖掘方法及ai辅助决策系统 |
CN113592035B (zh) * | 2021-08-23 | 2022-07-05 | 山东腾邦国际商务有限公司 | 基于ai辅助决策的大数据挖掘方法及ai辅助决策系统 |
CN117539726A (zh) * | 2024-01-09 | 2024-02-09 | 广东奥飞数据科技股份有限公司 | 绿色智算中心能效优化方法及系统 |
CN117539726B (zh) * | 2024-01-09 | 2024-04-26 | 广东奥飞数据科技股份有限公司 | 绿色智算中心能效优化方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111160750A (zh) | 一种基于关联规则挖掘的配网分析和投资决策方法 | |
WO2018045642A1 (zh) | 一种母线负荷预测方法 | |
CN105243255A (zh) | 一种软基处理方案的评价方法 | |
CN113256066A (zh) | 基于PCA-XGBoost-IRF的作业车间实时调度方法 | |
CN112557034B (zh) | 一种基于pca_cnns的轴承故障诊断方法 | |
CN112756759B (zh) | 点焊机器人工作站故障判定方法 | |
CN102682221B (zh) | 一种复杂电子信息系统电磁兼容性综合评估方法 | |
CN111339478B (zh) | 基于改进模糊层次分析法的气象数据质量评估方法 | |
CN117290462B (zh) | 一种数据大模型的智能决策系统及方法 | |
CN113779264A (zh) | 基于专利供需知识图谱的交易推荐方法 | |
CN111338950A (zh) | 一种基于谱聚类的软件缺陷特征选择方法 | |
CN111291822A (zh) | 基于模糊聚类最优k值选择算法的设备运行状态判断方法 | |
CN116502455A (zh) | 一种激光选区熔化技术的工艺参数确定方法及系统 | |
CN109711727A (zh) | 机电产品加工工艺组合评价系统及其评价方法 | |
CN112508363A (zh) | 基于深度学习的电力信息系统状态分析方法及装置 | |
CN116485021A (zh) | 一种煤炭企业技术技能人才人岗匹配预测方法与系统 | |
CN107220320A (zh) | 一种基于专利引文的新兴技术识别方法 | |
CN113523904A (zh) | 一种刀具磨损检测方法 | |
CN112465253B (zh) | 一种城市路网中的链路预测方法及装置 | |
CN112070140B (zh) | 一种基于维度分解的密度聚类类标模式识别方法 | |
CN115600913A (zh) | 一种用于智能矿山的主数据识别方法 | |
CN108376261B (zh) | 一种基于密度和在线半监督学习烟草分类方法 | |
CN116468557A (zh) | 一种面向股票时序预测排序结果的判定方法 | |
CN118350921A (zh) | 新型农业经营主体信用评价方法、装置、设备及存储介质 | |
CN116204778A (zh) | 用户的评分确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200515 |