CN110348713A - 一种基于关联性分析和数据挖掘的台区线损计算方法 - Google Patents

一种基于关联性分析和数据挖掘的台区线损计算方法 Download PDF

Info

Publication number
CN110348713A
CN110348713A CN201910575651.6A CN201910575651A CN110348713A CN 110348713 A CN110348713 A CN 110348713A CN 201910575651 A CN201910575651 A CN 201910575651A CN 110348713 A CN110348713 A CN 110348713A
Authority
CN
China
Prior art keywords
line loss
platform area
data
electric characteristic
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910575651.6A
Other languages
English (en)
Inventor
刘国伟
朱广名
朱子坤
陈宏辉
张延旭
邓刘毅
陈童
杨永
王青之
曹陈生
陈阅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Maoming Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Maoming Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Maoming Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN201910575651.6A priority Critical patent/CN110348713A/zh
Publication of CN110348713A publication Critical patent/CN110348713A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于关联性分析和数据挖掘的台区线损计算方法,通过对比分析不同台区电气特征指标对台区线损率的影响大小,选取影响更大的特征指标数据作为深度信念网络的输入,利用聚类算法对不同类型台区进行区分来分别进行训练,以挖掘输入参数与台区线损率之间复杂的关联关系,最终生成计算迅速高效、结果准确性较高的台区线损预测模型,从而利用该模型对台区线损进行计算分析,解决了现有的台区线损计算方法不能准确有效的挖掘台区线损影响因素的关联,计算工作效率以及准确率低等问题。

Description

一种基于关联性分析和数据挖掘的台区线损计算方法
技术领域
本发明涉及电力线损计算技术领域,尤其涉及一种基于关联性分析和数据挖掘的台区线损计算方法。
背景技术
电力系统的低压电网会在电力的传输过程中存在线损现象,电能从电厂发电厂运送出来,通过一定方式的传送途径传送到用电的客户。在这一过程中,由于存在很多的传输环节,例如:输电环节、变电环节、配电环节等,这些环节在一定程度上让电能出现了传输损耗,作为电网系统的规划设计或者是生产的运行管理的一个非常重要的指标。
在现有低压配网台区线损的分析测算方法中,台区线损指标数据往往便于收集且数据充足,但由于缺少有针对性的线损指标分析与灵活高效的线损计算方法,不能准确有效的挖掘台区线损影响因素的关联,无法充分拟合台区数据与线损的复杂映射关系,导致低压配网台区线损分析指标数据的实用性低,并且线损率的计算工作十分繁杂,计算耗时长的同时精确率较低。
发明内容
本发明为解决现有的台区线损计算方法不能准确有效的挖掘台区线损影响因素的关联,计算工作效率以及准确率低等问题,提供了一种基于关联性分析和数据挖掘的台区线损计算方法。
为实现以上发明目的,而采用的技术手段是:
一种基于关联性分析和数据挖掘的台区线损计算方法,包括以下步骤:
S1.获取历史台区电气特征指标数据;
S2.使用相关性分析法计算各个台区电气特征指标与台区线损率的关联度,并筛选得到关联度高于预设值的电气特征指标数据;
S3.根据筛选得到的电气特征指标数据,采用聚类算法对台区进行聚类,得到聚类结果;
S4.构建深度信念网络,使用聚类后的各类台区电气特征指标数据分别对深度信念网络进行训练得到台区线损预测模型,用于计算台区的线损率。
上述方案中,通过对比分析不同台区电气特征指标对台区线损率的影响大小,选取影响更大的特征指标数据作为深度信念网络的输入,利用聚类算法对不同类型台区进行区分来分别进行训练,以挖掘输入参数与台区线损率之间复杂的关联关系,最终生成计算迅速高效、结果准确性较高的台区线损预测模型,从而利用该模型对台区线损进行计算分析。
优选的,所述步骤S1具体为:获取历史t年共n种台区电气特征指标数据,所述电气特征指标包括台区属性、配变容量、台区供电半径、线缆类型、低压线路总长度、电力用户数、总功率因数、负载率、年平均线损率、用电性质及比例;其中t和n均为正整数。在本优选方案中,主要考虑与台区网架结构和负荷特性相关的电气特征指标。
优选的,所述步骤S1还包括:
S11.根据获取得到的历史台区电气特征指标数据,构建台区线损率的影响因素矩阵X=[xi,j],j∈[1,t],其中xi,j为第i个影响因素的第j年的数据,即第i个电气特征指标的第j年的数据;由台区年平均线损率构成影响对象序列行向量Y=[yj],j∈[1,2,…,t],其中yj为第j年台区年平均线损率;
S12.对影响因素矩阵X=[xi,j],j∈[1,t]以及影响对象序列行向量Y=[yj],j∈[1,2,…,t]中的各个数据进行标准化处理,表示为:xi,j=xi,j/xi,1,yj=yj/y1。在本优选方案中,由于不同序列的数值取值范围和单位都不相同,可能干扰到分析结果,为避免受量纲影响进行计算,在本优选方案中对原始数据进行标准化处理。
优选的,所述步骤S2使用的相关性分析法为灰色关联度分析法。在本优选方案中,灰色关联度分析法基于影响因素与影响对象序列曲线几何形状的相似程度来判断其关系的紧密程度,是确定因子间影响程度或因子对主行为的贡献程度而进行的一种分析方法,其尤其适合数据有限、没有原型、复杂而且具有不确定性问题的分析和评价。
优选的,所述步骤S2具体包括以下步骤:
S21.根据标准化处理后的数据,计算影响对象序列行向量中数据yj与影响因素矩阵中数据xi,j的差序矩阵Δj,i,并计算差序矩阵Δj,i中不同年份对应元素的最大值Mj,i和最小值mj,i,其中差序矩阵Δj,i中第t年的元素计算为:Δj,i=|yj-xi,j|,j=t;
S22.分别计算影响对象序列行向量中数据yj与影响因素矩阵中数据xi,j的关联度矩阵λ=[λji],影响对象序列行向量中数据yj与影响因素矩阵中数据xi,j之间的综合关联度ri,得到关联度向量R;
其中关联度矩阵λ=[λji]中向量λji的计算为:
其中ρ为分辨系数,ρ∈[0,1],Mj,i和mj,i分别为差序矩阵Δj,i中不同年份对应元素的最大值和最小值;
其中综合关联度ri的计算为:
其中,ωj为第j年的权重,ri表示第i个影响因素与线损率的相关程度;ri越大则关联程度越大;
关联度向量R为:R=[r1 r2 ... ri ... rn],其中n指共n种影响因素;
S23.从步骤S22计算得到的关联度向量R中筛选出前m个综合关联度ri对应影响因素的电气特征指标数据,得到m维的电气特征指标数据集,其中m∈[4,5,6]。
优选的,所述步骤S3具体包括:
S31.初始化聚类中心:
计算评价指标
其中N为共有N个m维的电气特征指标数据,xjmin为第j个电气特征指标的N个电气特征指标数据中的最小值,ωj第j个电气特征指标的权重;
将所有电气特征指标数据根据计算得到的PE值进行升序排序后,等分成k类,并选取每类的中心电气特征指标数据作为该类的初始聚类中心;k值通过初始化得到;
S32.确定最优分类数k:采用综合轮廓系数St评价聚类效果,通过对比不同聚类情况下的S(i)选取最大轮廓系数所对应的最优分类数k;对于任意一个样本点i,计算方法为:
轮廓系数
综合轮廓系数
其中q(i)为样本点i到所属类中其它点的平均距离;p(i)为样本点i到非所属类中所有点平均距离的最小值,聚类结果的综合轮廓系数St是所有样本点轮廓系数S(i)的平均值;
S33.计算各个电气特征指标数据与k个初始聚类中心的距离Lij,按照距离大小将所有电气特征指标数据对应分配给最近的初始聚类中心,形成k个台区聚类;
其中
Lij为样本点i与第j个聚类中心的距离,xik为样本点i的第k个电气特征指标,xjk为第j个聚类中心的第k个元素;
S34.对于形成的k个台区聚类,求取每个台区聚类中所有数据的平均值,并用该平均值更新对应台区聚类的聚类中心;
S35.判断台区聚类过程是否结束,计算公式为:
其中mi为Ci类的聚类中心;Xq为Ci类中的样本,若计算得到的E达到收敛条件,则完成台区聚类;否则返回步骤S32。
优选的,所述步骤S4构建的深度信念网络由若干个玻尔兹曼机堆叠而成,其中深度信念网络的输入层节点个数等于电气特征指标的维数m,输出层对应线损率预测值,节点个数为1;初始化深度信念网络的结构参数为2层隐层,隐层节点个数为s=2m+1,隐层激活函数为Relu函数,深度信念网络的学习效率为0.01,迭代次数为1000。在本优选方案中,采用Relu函数作为隐层激活函数,由于其具有非饱和性,收敛速度更快,能够提高深度信念网络的训练速度。
优选的,步骤S4中所述的使用聚类后的各类台区电气特征指标数据分别对深度信念网络进行训练得到台区线损计算模型具体包括以下步骤:
S41.样本集划分:将筛选得到的电气特征指标数据按8:2的比例划分为训练样本集和测试样本集;
S42.模型无监督逐层预训练:获取所述深度信念网络的初始结构参数,输入所述训练样本集并采用贪婪学习算法对所述深度信念网络进行前向训练,通过采用对比散度算法更新各个RBM的层间连接权值、可见层的偏置以及隐藏层的偏置;
S43.模型有监督整体精调:
采用梯度下降算法对预训练后的深度信念网络进行后向训练,通过BP算法对预训练后的深度信念网络进行自顶向下的回调;
S44.模型训练:
输入训练样本集对步骤S43得到的深度信念网络进行充分训练,得到待验证的台区线损预测模型;
S45.模型测试:将测试样本集输入待验证的台区线损预测模型,检验预测线损值与实际线损值之间的误差值是否在预设误差范围内,若是则得到台区线损预测模型,用于计算台区的线损率;若否则返回步骤S42。
优选的,步骤S42中还包括将所述训练样本集划分为若干组样本子集,分别通过各组样本子集并采用贪婪学习算法对所述深度信念网络进行前向训练;对于各组样本子集依次采用对比散度算法更新各个受限玻尔兹曼机的层间连接权值ωij,g、可见层的偏置ai,g以及隐藏层的偏置bj,g,对于包含K个样本的第g组数据集,计算公式具体为:
其中对比散度算法的采样步数为1,vi,k为第k个样本中可视层的第i个神经元的值,v′i,k为vi,k反向回代的值;hj,k为第j个样本中隐藏层的第i个神经元的值,h′j,k为hj,k的第二次迭代的计算值;εCD为对比散度算法的学习率。
在本优选方案中,由于存在训练样本数据量巨大的情况,因此采用小批量梯度下降算法,将训练样本划分为若干组小批量的样本子集依次进行训练,以提高计算效率。
与现有技术相比,本发明技术方案的有益效果是:
本发明的台区线损计算方法通过对比分析不同台区电气特征指标对台区线损率的影响大小,选取影响更大的特征指标数据作为深度信念网络的输入,利用聚类算法对不同类型台区进行区分来分别进行训练,以挖掘输入参数与台区线损率之间复杂的关联关系,最终生成计算迅速高效、结果准确性较高的台区线损预测模型,从而利用该模型对台区线损进行计算分析。本发明的台区线损计算方法可以快速对种类繁多、数量庞大的台区线损计算数据进行分析、筛选、归类,提高计算的效率及精准度。
附图说明
图1为本发明方法的总流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
一种基于关联性分析和数据挖掘的台区线损计算方法,如图1所示,包括以下步骤:
S1.获取历史台区电气特征指标数据;
S2.使用相关性分析法计算各个台区电气特征指标与台区线损率的关联度,并筛选得到关联度高于预设值的电气特征指标数据;
S3.根据筛选得到的电气特征指标数据,采用聚类算法对台区进行聚类,得到聚类结果;
S4.构建深度信念网络,使用聚类后的各类台区电气特征指标数据分别对深度信念网络进行训练得到台区线损预测模型,用于计算台区的线损率。
实施例2
一种基于关联性分析和数据挖掘的台区线损计算方法,包括以下步骤:
S1.获取历史t年共n种台区电气特征指标数据,所述电气特征指标包括台区属性、配变容量、台区供电半径、线缆类型、低压线路总长度、电力用户数、总功率因数、负载率、年平均线损率、用电性质及比例;其中t和n均为正整数;
然后:
S11.根据获取得到的历史台区电气特征指标数据,构建台区线损率的影响因素矩阵X=[xi,j],j∈[1,t],其中xi,j为第i个影响因素的第j年的数据,即第i个电气特征指标的第j年的数据;由台区年平均线损率构成影响对象序列行向量Y=[yj],j∈[1,2,…,t],其中yj为第j年台区年平均线损率;
S12.对影响因素矩阵X=[xi,j],j∈[1,t]以及影响对象序列行向量Y=[yj],j∈[1,2,…,t]中的各个数据进行标准化处理,表示为:xi,j=xi,j/xi,1,yj=yj/y1
S2.使用灰色关联度分析法计算各个台区电气特征指标与台区线损率的关联度,并筛选得到关联度高于预设值的电气特征指标数据;
S21.根据标准化处理后的数据,计算影响对象序列行向量中数据yj与影响因素矩阵中数据xi,j的差序矩阵Δj,i,并计算差序矩阵Δj,i中不同年份对应元素的最大值Mj,i和最小值mj,i,其中差序矩阵Δj,i中第t年的元素计算为:Δj,i=|yj-xi,j|,j=t;
S22.分别计算影响对象序列行向量中数据yj与影响因素矩阵中数据xi,j的关联度矩阵λ=[λji],影响对象序列行向量中数据yj与影响因素矩阵中数据xi,j之间的综合关联度ri,得到关联度向量R;
其中关联度矩阵λ=[λji]中向量λji的计算为:
其中ρ为分辨系数,ρ∈[0,1],Mj,i和mj,i分别为差序矩阵Δj,i中不同年份对应元素的最大值和最小值;
其中综合关联度ri的计算为:
其中,ωj为第j年的权重,ri表示第i个影响因素与线损率的相关程度;
关联度向量R为:R=[r1 r2 ... ri ... rn],其中n指共n种影响因素;
S23.从步骤S22计算得到的关联度向量R中筛选出前m个综合关联度ri对应影响因素的电气特征指标数据,得到m维的电气特征指标数据集,其中m∈[4,5,6]。
S3.根据筛选得到的电气特征指标数据,采用聚类算法对台区进行聚类,得到聚类结果:
S31.初始化聚类中心:
计算评价指标
其中N为共有N个m维的电气特征指标数据,xjmin为第j个电气特征指标的N个电气特征指标数据中的最小值,ωj第j个电气特征指标的权重;
将所有电气特征指标数据根据计算得到的PE值进行升序排序后,等分成k类,并选取每类的中心电气特征指标数据作为该类的初始聚类中心;k值通过初始化得到;
S32.确定最优分类数k:采用综合轮廓系数St评价聚类效果,通过对比不同聚类情况下的S(i)选取最大轮廓系数所对应的最优分类数k;对于任意一个样本点i,计算方法为:
轮廓系数
综合轮廓系数
其中q(i)为样本点i到所属类中其它点的平均距离;p(i)为样本点i到非所属类中所有点平均距离的最小值,聚类结果的综合轮廓系数St是所有样本点轮廓系数S(i)的平均值;
S33.计算各个电气特征指标数据与k个初始聚类中心的距离Lij,按照距离大小将所有电气特征指标数据对应分配给最近的初始聚类中心,形成k个台区聚类;
其中
Lij为样本点i与第j个聚类中心的距离,xik为样本点i的第k个电气特征指标,xjk为第j个聚类中心的第k个元素;
S34.对于形成的k个台区聚类,求取每个台区聚类中所有数据的平均值,并用该平均值更新对应台区聚类的聚类中心;
S35.判断台区聚类过程是否结束,计算公式为:
其中mi为Ci类的聚类中心;Xq为Ci类中的样本,若计算得到的E达到收敛条件,则完成台区聚类;否则返回步骤S32。
S4.构建深度信念网络,使用聚类后的各类台区电气特征指标数据分别对深度信念网络进行训练得到台区线损预测模型,用于计算台区的线损率:
其中构建的深度信念网络由若干个玻尔兹曼机堆叠而成,其中深度信念网络的输入层节点个数等于电气特征指标的维数m,输出层对应线损率预测值,节点个数为1;初始化深度信念网络的结构参数为2层隐层,隐层节点个数为s=2m+1,隐层激活函数为Relu函数,深度信念网络的学习效率为0.01,迭代次数为1000;
使用聚类后的各类台区电气特征指标数据分别对深度信念网络进行训练得到台区线损计算模型具体包括以下步骤:
S41.样本集划分:将筛选得到的电气特征指标数据按8:2的比例划分为训练样本集和测试样本集;
S42.模型无监督逐层预训练:获取所述深度信念网络的初始结构参数,将所述训练样本集划分为若干组样本子集,分别通过各组样本子集并采用贪婪学习算法对所述深度信念网络进行前向训练;对于各组样本子集依次采用对比散度算法更新各个受限玻尔兹曼机的层间连接权值ωij,g、可见层的偏置ai,g以及隐藏层的偏置bj,g,对于包含K个样本的第g组数据集,计算公式具体为:
其中对比散度算法的采样步数为1,vi,k为第k个样本中可视层的第i个神经元的值,v′i,k为vi,k反向回代的值;hj,k为第j个样本中隐藏层的第i个神经元的值,h′j,k为hj,k的第二次迭代的计算值;εCD为对比散度算法的学习率。
S43.模型有监督整体精调:
采用梯度下降算法对预训练后的深度信念网络进行后向训练,通过BP算法对预训练后的深度信念网络进行自顶向下的回调;
S44.模型训练:
输入训练样本集对步骤S43得到的深度信念网络进行充分训练,得到待验证的台区线损预测模型;
S45.模型测试:将测试样本集输入待验证的台区线损预测模型,检验预测线损值与实际线损值之间的误差值是否在预设误差范围内,若是则得到台区线损预测模型,用于计算台区的线损率;若否则返回步骤S42。
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (9)

1.一种基于关联性分析和数据挖掘的台区线损计算方法,其特征在于,包括以下步骤:
S1.获取历史台区电气特征指标数据;
S2.使用相关性分析法计算各个台区电气特征指标与台区线损率的关联度,并筛选得到关联度高于预设值的电气特征指标数据;
S3.根据筛选得到的电气特征指标数据,采用聚类算法对台区进行聚类,得到聚类结果;
S4.构建深度信念网络,使用聚类后的各类台区电气特征指标数据分别对深度信念网络进行训练得到台区线损预测模型,用于计算台区的线损率。
2.根据权利要求1所述的基于关联性分析和数据挖掘的台区线损计算方法,其特征在于,所述步骤S1具体为:获取历史t年共n种台区电气特征指标数据,所述电气特征指标包括台区属性、配变容量、台区供电半径、线缆类型、低压线路总长度、电力用户数、总功率因数、负载率、年平均线损率、用电性质及比例;其中t和n均为正整数。
3.根据权利要求2所述的基于关联性分析和数据挖掘的台区线损计算方法,其特征在于,所述步骤S1还包括:
S11.根据获取得到的历史台区电气特征指标数据,构建台区线损率的影响因素矩阵X=[xi,j],j∈[1,t],其中xi,j为第i个影响因素的第j年的数据,即第i个电气特征指标的第j年的数据;由台区年平均线损率构成影响对象序列行向量Y=[yj],j∈[1,2,…,t],其中yj为第j年台区年平均线损率;
S12.对影响因素矩阵X=[xi,j],j∈[1,t]以及影响对象序列行向量Y=[yj],j∈[1,2,…,t]中的各个数据进行标准化处理,表示为:xi,j=xi,j/xi,1,yj=yj/y1
4.根据权利要求1所述的基于关联性分析和数据挖掘的台区线损计算方法,其特征在于,所述步骤S2使用的相关性分析法为灰色关联度分析法。
5.根据权利要求3所述的基于关联性分析和数据挖掘的台区线损计算方法,其特征在于,所述步骤S2具体包括以下步骤:
S21.根据标准化处理后的数据,计算影响对象序列行向量中数据yj与影响因素矩阵中数据xi,j的差序矩阵Δj,i,并计算差序矩阵Δj,i中不同年份对应元素的最大值Mj,i和最小值mj,i,其中差序矩阵Δj,i中第t年的元素计算为:Δj,i=|yj-xi,j|,j=t;
S22.分别计算影响对象序列行向量中数据yj与影响因素矩阵中数据xi,j的关联度矩阵λ=[λji],影响对象序列行向量中数据yj与影响因素矩阵中数据xi,j之间的综合关联度ri,得到关联度向量R;
其中关联度矩阵λ=[λji]中向量λji的计算为:
其中ρ为分辨系数,ρ∈[0,1],Mj,i和mj,i分别为差序矩阵Δj,i中不同年份对应元素的最大值和最小值;
其中综合关联度ri的计算为:
其中,ωj为第j年的权重,ri表示第i个影响因素与线损率的相关程度;
关联度向量R为:R=[r1r2...ri...rn],其中n指共n种影响因素;
S23.从步骤S22计算得到的关联度向量R中筛选出前m个综合关联度ri对应影响因素的电气特征指标数据,得到m维的电气特征指标数据集,其中m∈[4,5,6]。
6.根据权利要求5所述的基于关联性分析和数据挖掘的台区线损计算方法,其特征在于,所述步骤S3具体包括:
S31.初始化聚类中心:
计算评价指标
其中N为共有N个m维的电气特征指标数据,xjmin为第j个电气特征指标的N个电气特征指标数据中的最小值,ωj第j个电气特征指标的权重;
将所有电气特征指标数据根据计算得到的PE值进行升序排序后,等分成k类,并选取每类的中心电气特征指标数据作为该类的初始聚类中心;k值通过初始化得到;
S32.确定最优分类数k:采用综合轮廓系数St评价聚类效果,通过对比不同聚类情况下的S(i)选取最大轮廓系数所对应的最优分类数k;对于任意一个样本点i,计算方法为:
轮廓系数
综合轮廓系数
其中q(i)为样本点i到所属类中其它点的平均距离;p(i)为样本点i到非所属类中所有点平均距离的最小值,聚类结果的综合轮廓系数St是所有样本点轮廓系数S(i)的平均值;
S33.计算各个电气特征指标数据与k个初始聚类中心的距离Lij,按照距离大小将所有电气特征指标数据对应分配给最近的初始聚类中心,形成k个台区聚类;其中
Lij为样本点i与第j个聚类中心的距离,xik为样本点i的第k个电气特征指标,xjk为第j个聚类中心的第k个元素;
S34.对于形成的k个台区聚类,求取每个台区聚类中所有数据的平均值,并用该平均值更新对应台区聚类的聚类中心;
S35.判断台区聚类过程是否结束,计算公式为:
其中mi为Ci类的聚类中心;Xq为Ci类中的样本,若计算得到的E达到收敛条件,则完成台区聚类;否则返回步骤S32。
7.根据权利要求6所述的基于关联性分析和数据挖掘的台区线损计算方法,其特征在于,所述步骤S4构建的深度信念网络由若干个玻尔兹曼机堆叠而成,其中深度信念网络的输入层节点个数等于电气特征指标的维数m,输出层对应线损率预测值,节点个数为1;初始化深度信念网络的结构参数为2层隐层,隐层节点个数为s=2m+1,隐层激活函数为Relu函数,深度信念网络的学习效率为0.01,迭代次数为1000。
8.根据权利要求7所述的基于关联性分析和数据挖掘的台区线损计算方法,其特征在于,步骤S4中所述的使用聚类后的各类台区电气特征指标数据分别对深度信念网络进行训练得到台区线损计算模型具体包括以下步骤:
S41.样本集划分:将筛选得到的电气特征指标数据按8:2的比例划分为训练样本集和测试样本集;
S42.模型无监督逐层预训练:获取所述深度信念网络的初始结构参数,输入所述训练样本集并采用贪婪学习算法对所述深度信念网络进行前向训练,通过采用对比散度算法更新各个RBM的层间连接权值、可见层的偏置以及隐藏层的偏置;
S43.模型有监督整体精调:
采用梯度下降算法对预训练后的深度信念网络进行后向训练,通过BP算法对预训练后的深度信念网络进行自顶向下的回调;
S44.模型训练:
输入训练样本集对步骤S43得到的深度信念网络进行充分训练,得到待验证的台区线损预测模型;
S45.模型测试:将测试样本集输入待验证的台区线损预测模型,检验预测线损值与实际线损值之间的误差值是否在预设误差范围内,若是则得到台区线损预测模型,用于计算台区的线损率;若否则返回步骤S42。
9.根据权利要求8所述的基于关联性分析和数据挖掘的台区线损计算方法,其特征在于,步骤S42中还包括将所述训练样本集划分为若干组样本子集,对于各组样本子集依次采用对比散度算法更新各个受限玻尔兹曼机的层间连接权值ωij,g、可见层的偏置ai,g以及隐藏层的偏置bj,g,对于包含K个样本的第g组数据集,计算公式具体为:
其中对比散度算法的采样步数为1,vi,k为第k个样本中可视层的第i个神经元的值,v’i,k为vi,k反向回代的值;hj,k为第j个样本中隐藏层的第i个神经元的值,h’j,k为hj,k的第二次迭代的计算值;εCD为对比散度算法的学习率。
CN201910575651.6A 2019-06-28 2019-06-28 一种基于关联性分析和数据挖掘的台区线损计算方法 Pending CN110348713A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910575651.6A CN110348713A (zh) 2019-06-28 2019-06-28 一种基于关联性分析和数据挖掘的台区线损计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910575651.6A CN110348713A (zh) 2019-06-28 2019-06-28 一种基于关联性分析和数据挖掘的台区线损计算方法

Publications (1)

Publication Number Publication Date
CN110348713A true CN110348713A (zh) 2019-10-18

Family

ID=68177069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910575651.6A Pending CN110348713A (zh) 2019-06-28 2019-06-28 一种基于关联性分析和数据挖掘的台区线损计算方法

Country Status (1)

Country Link
CN (1) CN110348713A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991866A (zh) * 2019-11-29 2020-04-10 国网江苏省电力有限公司电力科学研究院 一种基于机器学习的台区数据缺失值补全方法和装置
CN111027841A (zh) * 2019-12-04 2020-04-17 广西大学 一种基于梯度提升决策树的低压台区线损计算方法
CN111160404A (zh) * 2019-12-09 2020-05-15 国网北京市电力公司 配电网线损标杆合理值的分析方法及装置
CN111200290A (zh) * 2020-03-16 2020-05-26 广东电网有限责任公司 一种用于台区三相不平衡治理的换相开关智能控制方法
CN111553568A (zh) * 2020-04-15 2020-08-18 贵州电网有限责任公司 一种基于数据挖掘技术的线损管理方法
CN111723839A (zh) * 2020-05-07 2020-09-29 国家电网有限公司 一种基于边缘计算的台区线损率预测方法
CN111738483A (zh) * 2020-04-24 2020-10-02 国网上海市电力公司 基于聚类和深层信念网络的电网降损优化方法及系统
CN112001441A (zh) * 2020-08-24 2020-11-27 中国石油大学(华东) 一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法
CN112330225A (zh) * 2020-12-02 2021-02-05 国网江苏省电力有限公司常州供电分公司 通过服务器获取线损影响因素影响度的方法、服务器和介质
CN112488395A (zh) * 2020-12-01 2021-03-12 湖南大学 一种配电网线损预测方法及系统
CN112711601A (zh) * 2021-03-29 2021-04-27 广州欧赛斯信息科技有限公司 一种针对高等教育专业数据指标的信息处理方法及系统
CN112990500A (zh) * 2021-04-01 2021-06-18 国网山东省电力公司营销服务中心(计量中心) 基于改进加权灰色关联分析的台区线损分析方法及系统
CN113392897A (zh) * 2021-06-10 2021-09-14 济南市公安局交通警察支队 一种计算机动车查验机构和安检机构耦合度的方法和系统
CN113435609A (zh) * 2021-06-08 2021-09-24 国网河北省电力有限公司临漳县供电分公司 线损异常检测方法、装置及终端设备
CN113449257A (zh) * 2021-05-26 2021-09-28 北京智芯微电子科技有限公司 配电网线损的预测方法、控制装置、及存储介质
CN113674014A (zh) * 2021-07-07 2021-11-19 湖南大学 一种配电线路日线损率预测方法和系统
CN114047372A (zh) * 2021-11-16 2022-02-15 国网福建省电力有限公司营销服务中心 一种基于电压特征的台区拓扑辨识系统
CN114065598A (zh) * 2021-11-02 2022-02-18 河北大学 一种风电机组发电机的故障预警方法
CN114881429A (zh) * 2022-04-19 2022-08-09 国网江苏省电力有限公司南通供电分公司 基于数据驱动的台区线损量化方法及系统
CN116305671A (zh) * 2023-05-23 2023-06-23 山东伟国板业科技有限公司 一种人造板的生产线监测方法及系统
CN117713386A (zh) * 2024-02-05 2024-03-15 国网山东省电力公司东营市河口区供电公司 电网智能监测控制方法、装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120232938A1 (en) * 2005-06-15 2012-09-13 Jones Richard B insurance product, rating system and method
US20160117326A1 (en) * 2014-10-28 2016-04-28 Oracle International Corporation Correlating consumption and voltage data to identify line loss in an electric grid
CN107832855A (zh) * 2017-09-14 2018-03-23 北京中恒博瑞数字电力科技有限公司 基于相关性分析的线损多源诊断方法及系统
CN108710990A (zh) * 2018-04-19 2018-10-26 国网天津市电力公司 基于同期数据的线变台户多级线损分析方法及系统
CN109102126A (zh) * 2018-08-30 2018-12-28 燕山大学 一种基于深度迁移学习的理论线损率预测模型
CN109389517A (zh) * 2018-04-08 2019-02-26 北京中电普华信息技术有限公司 一种量化线路损耗影响因素的分析方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120232938A1 (en) * 2005-06-15 2012-09-13 Jones Richard B insurance product, rating system and method
US20160117326A1 (en) * 2014-10-28 2016-04-28 Oracle International Corporation Correlating consumption and voltage data to identify line loss in an electric grid
CN107832855A (zh) * 2017-09-14 2018-03-23 北京中恒博瑞数字电力科技有限公司 基于相关性分析的线损多源诊断方法及系统
CN109389517A (zh) * 2018-04-08 2019-02-26 北京中电普华信息技术有限公司 一种量化线路损耗影响因素的分析方法及装置
CN108710990A (zh) * 2018-04-19 2018-10-26 国网天津市电力公司 基于同期数据的线变台户多级线损分析方法及系统
CN109102126A (zh) * 2018-08-30 2018-12-28 燕山大学 一种基于深度迁移学习的理论线损率预测模型

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李亚等: "基于改进K-Means聚类和BP 神经网络的台区线损率计算方法", 《中国电机工程学报》 *
龚月华: "基于深度学习的理论线损率计算与分析", 《中国优秀硕士论文全文数据库》 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991866B (zh) * 2019-11-29 2022-09-06 国网江苏省电力有限公司电力科学研究院 一种基于机器学习的台区数据缺失值补全方法和装置
CN110991866A (zh) * 2019-11-29 2020-04-10 国网江苏省电力有限公司电力科学研究院 一种基于机器学习的台区数据缺失值补全方法和装置
CN111027841A (zh) * 2019-12-04 2020-04-17 广西大学 一种基于梯度提升决策树的低压台区线损计算方法
CN111160404A (zh) * 2019-12-09 2020-05-15 国网北京市电力公司 配电网线损标杆合理值的分析方法及装置
CN111160404B (zh) * 2019-12-09 2024-01-23 国网北京市电力公司 配电网线损标杆合理值的分析方法及装置
CN111200290A (zh) * 2020-03-16 2020-05-26 广东电网有限责任公司 一种用于台区三相不平衡治理的换相开关智能控制方法
CN111553568A (zh) * 2020-04-15 2020-08-18 贵州电网有限责任公司 一种基于数据挖掘技术的线损管理方法
CN111738483A (zh) * 2020-04-24 2020-10-02 国网上海市电力公司 基于聚类和深层信念网络的电网降损优化方法及系统
CN111723839A (zh) * 2020-05-07 2020-09-29 国家电网有限公司 一种基于边缘计算的台区线损率预测方法
CN112001441A (zh) * 2020-08-24 2020-11-27 中国石油大学(华东) 一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法
CN112488395A (zh) * 2020-12-01 2021-03-12 湖南大学 一种配电网线损预测方法及系统
CN112488395B (zh) * 2020-12-01 2024-04-05 湖南大学 一种配电网线损预测方法及系统
CN112330225A (zh) * 2020-12-02 2021-02-05 国网江苏省电力有限公司常州供电分公司 通过服务器获取线损影响因素影响度的方法、服务器和介质
CN112330225B (zh) * 2020-12-02 2022-08-30 国网江苏省电力有限公司常州供电分公司 通过服务器获取线损影响因素影响度的方法、服务器和介质
CN112711601A (zh) * 2021-03-29 2021-04-27 广州欧赛斯信息科技有限公司 一种针对高等教育专业数据指标的信息处理方法及系统
CN112711601B (zh) * 2021-03-29 2021-07-13 广州欧赛斯信息科技有限公司 一种针对高等教育专业数据指标的信息处理方法及系统
CN112990500A (zh) * 2021-04-01 2021-06-18 国网山东省电力公司营销服务中心(计量中心) 基于改进加权灰色关联分析的台区线损分析方法及系统
CN113449257A (zh) * 2021-05-26 2021-09-28 北京智芯微电子科技有限公司 配电网线损的预测方法、控制装置、及存储介质
CN113435609A (zh) * 2021-06-08 2021-09-24 国网河北省电力有限公司临漳县供电分公司 线损异常检测方法、装置及终端设备
CN113392897A (zh) * 2021-06-10 2021-09-14 济南市公安局交通警察支队 一种计算机动车查验机构和安检机构耦合度的方法和系统
CN113392897B (zh) * 2021-06-10 2022-09-27 济南市公安局交通警察支队 一种计算机动车查验机构和安检机构耦合度的方法和系统
CN113674014A (zh) * 2021-07-07 2021-11-19 湖南大学 一种配电线路日线损率预测方法和系统
CN113674014B (zh) * 2021-07-07 2023-10-20 湖南大学 一种配电线路日线损率预测方法和系统
CN114065598B (zh) * 2021-11-02 2022-06-28 河北大学 一种风电机组发电机的故障预警方法
CN114065598A (zh) * 2021-11-02 2022-02-18 河北大学 一种风电机组发电机的故障预警方法
CN114047372B (zh) * 2021-11-16 2024-03-12 国网福建省电力有限公司营销服务中心 一种基于电压特征的台区拓扑辨识系统
CN114047372A (zh) * 2021-11-16 2022-02-15 国网福建省电力有限公司营销服务中心 一种基于电压特征的台区拓扑辨识系统
CN114881429A (zh) * 2022-04-19 2022-08-09 国网江苏省电力有限公司南通供电分公司 基于数据驱动的台区线损量化方法及系统
CN114881429B (zh) * 2022-04-19 2024-04-02 国网江苏省电力有限公司南通供电分公司 基于数据驱动的台区线损量化方法及系统
CN116305671A (zh) * 2023-05-23 2023-06-23 山东伟国板业科技有限公司 一种人造板的生产线监测方法及系统
CN116305671B (zh) * 2023-05-23 2023-10-20 山东伟国板业科技有限公司 一种人造板的生产线监测方法及系统
CN117713386A (zh) * 2024-02-05 2024-03-15 国网山东省电力公司东营市河口区供电公司 电网智能监测控制方法、装置
CN117713386B (zh) * 2024-02-05 2024-04-16 国网山东省电力公司东营市河口区供电公司 电网智能监测控制方法、装置

Similar Documents

Publication Publication Date Title
CN110348713A (zh) 一种基于关联性分析和数据挖掘的台区线损计算方法
CN108053052B (zh) 一种油罐车油气泄漏速度智能监测系统
CN106779087A (zh) 一种通用机器学习数据分析平台
CN110765700A (zh) 基于量子蚁群优化rbf网络的特高压输电线损预测方法
CN105260786B (zh) 一种电力推进系统仿真可信度评估模型综合优化方法
CN109461025A (zh) 一种基于机器学习的电能替代潜在客户预测方法
CN106869990B (zh) 基于lvq-cpso-bp算法的煤体瓦斯渗透率预测方法
CN105701596A (zh) 一种基于大数据技术的配网抢修精益化方法以及管理系统
CN102520342B (zh) 基于动态反馈神经网络建模的模拟电路测试节点选择方法
CN110232434A (zh) 一种基于属性图优化的神经网络架构评估方法
CN104052612B (zh) 一种电信业务的故障识别与定位的方法及系统
CN104200096B (zh) 基于微分进化算法和bp神经网络的避雷器均压环优化法
CN102024179A (zh) 一种基于半监督学习的ga-som聚类方法
CN108133225A (zh) 一种基于支持向量机的覆冰闪络故障预警方法
CN103049651A (zh) 一种用于电力负荷聚类的方法及装置
CN104634265A (zh) 一种基于多元图像特征融合的矿物浮选泡沫层厚度软测量方法
CN104363104A (zh) 一种面向用户需求的海量多元数据态势显示系统与方法
CN109034232A (zh) 城市规划条件核实成果报告的自动化输出系统及控制方法
CN109919236A (zh) 一种基于标签相关性的bp神经网络多标签分类方法
CN106656357A (zh) 一种工频通信信道状态评估系统和方法
CN104680025A (zh) 基于遗传算法极限学习机的抽油机参数优化方法
Canfei et al. A multi-criteria fusion feature selection algorithm for fault diagnosis of helicopter planetary gear train
CN104021315A (zh) 基于bp神经网络的电厂厂用电率计算方法
CN108334957A (zh) 电网一次设备运维检修成本预测方法及系统
Guan et al. Application of a novel PNN evaluation algorithm to a greenhouse monitoring system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191018