CN115146715A - 用电安全隐患诊断方法、装置、设备及存储介质 - Google Patents
用电安全隐患诊断方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115146715A CN115146715A CN202210708775.9A CN202210708775A CN115146715A CN 115146715 A CN115146715 A CN 115146715A CN 202210708775 A CN202210708775 A CN 202210708775A CN 115146715 A CN115146715 A CN 115146715A
- Authority
- CN
- China
- Prior art keywords
- power utilization
- potential safety
- curve
- safety hazard
- typical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000003860 storage Methods 0.000 title claims description 10
- 230000005611 electricity Effects 0.000 claims abstract description 91
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 33
- 238000007637 random forest analysis Methods 0.000 claims abstract description 24
- 238000005259 measurement Methods 0.000 claims abstract description 8
- 238000012360 testing method Methods 0.000 claims description 43
- 238000012549 training Methods 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000012935 Averaging Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000011524 similarity measure Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 5
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000007621 cluster analysis Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000819 phase cycle Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Water Supply & Treatment (AREA)
- Algebra (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供用电安全隐患诊断方法,属于电网安全技术领域。包括:收集96点用户历史负荷曲线的样本集C;基于欧式距离和DTW距离算法,计算所述样本集C中任意两条曲线的距离DISTDTW(x,y);以所述距离DISTDTW(x,y)作为相似度衡量依据,进行所述样本集C的曲线聚类,得到M个曲线簇;分别根据各个所述曲线簇计算出M个所述用户典型用电特征曲线;初步选取用电安全隐患指标;以所述用电安全隐患指标作为特征,以一个所述曲线簇作为诊断样本集,以所述曲线簇所对应的所述用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型;根据所述用电安全隐患诊断模型,诊断具有相同典型用电特征的用户电力设备是否存在用电安全隐患。
Description
技术领域
本发明涉及电网安全技术领域,尤其涉及一种用电安全隐患诊断方法、装置、设备及存储介质。
背景技术
我国电力急速发展,电气化进程显著改善人民生活,但由诸多因素引起的电力事故时有发生,给用电安全、经济建设及电力市场发展带来直接影响。因此,安全用电的检查十分重要,然而,在日常工作中的用电检查往往存在范围广、人数多的特征,需要将用电安全隐患排查工作信息化、自动化。
传统方式通常是对用户用电数据加以分析,根据历史用户负荷曲线可以简单得出用户用电习惯,识别出该用户可能具有用电安全隐患。然而,分析用户用电安全隐患时,仅将该用户的历史数据作为参考对象会造成样本量不足、分析结果不全面的情况,从大数据的角度进行统计分析,可以更好地深度挖掘出可能造成用电安全隐患的因素。
发明内容
有鉴于此,本发明提供一种用电安全隐患诊断方法、装置、设备及存储介质,基于DTW算法聚类分析用户侧的典型用电特征曲线、以及随机森林算法搭建诊断模型,提供考虑多种类指标诊断用户电力设备是否存在用电安全隐患的方案。
本发明实施例解决其技术问题所采用的技术方案是:
一种用电安全隐患诊断方法,包括:
步骤S1,收集用户侧的96点用户历史负荷曲线的样本集C,C={C1,C2,…,CN};
步骤S2,基于欧式距离和DTW距离算法,计算所述样本集C中任意两条曲线的距离DISTDTW(x,y);
步骤S3,以所述距离DISTDTW(x,y)作为相似度衡量依据,进行所述样本集C的曲线聚类,得到M个曲线簇;
步骤S4,利用均值法,根据各个所述曲线簇计算出用户典型用电特征曲线,得到M个所述用户典型用电特征曲线。
步骤S5,初步选取用电安全隐患指标,所述用电安全隐患指标包括但不限于电流不平衡率、电压不平衡率、额定电压偏离度、用电量同比、用电量环比、电气设备信息、分时电量、电压、电流、有功功率,所述电气设备信息包括但不限于设备生产厂家、设备价格、设备投运日期,其中,所述用电量同比、所述用电量环比的参照对象为所述用户典型用电特征曲线;
步骤S6,以所述用电安全隐患指标作为特征,以一个所述曲线簇作为诊断样本集,以所述曲线簇所对应的所述用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型;
步骤S7,根据所述用电安全隐患诊断模型,诊断具有相同典型用电特征的用户电力设备是否存在用电安全隐患。
较优地,所述步骤S2基于欧式距离和DTW距离算法计算所述样本集C中任意两条曲线的距离DISTDTW(x,y)包括:
步骤S21,构建对应曲线x的时间序列D、对应曲线y的时间序列T、以及欧式距离计算式:
D=[d1,d2,d3…dn]
T=[t1,t2,t3…tn]
其中,dx为所述时间序列D中的元素,ty为所述时间序列T中的元素,DTW(dx,ty)表示dx到ty之间的欧式距离;
步骤S22,计算所述距离DISTDTW(x,y):
DISTDTW(x,y)=DTW(dx,ty)+min{DISTDTW(x-1,y),DISTDTW(x,y-1),DISTDTW(x-1,y-1)}
较优地,所述步骤S3以所述距离DISTDTW(x,y)作为相似度衡量依据,进行所述样本集C的曲线聚类,得到M个曲线簇包括:
步骤S31,将所述样本集C处理为一个最小生成树,设置模糊的分裂数q-1;
步骤S32,按照maxDISTDTW(x,y)将所述最小生成树分成q棵子树;
步骤S33,根据q棵所述子树所对应的元素数目选择初始聚类数目n;
步骤S34,按照元素数目排序,将前n棵所述子树视为初始的n个簇,计算各个所述簇的初始聚类中心;
步骤S35,利用评价函数I判断是否进行簇之间的合并操作:
其中,Ai表示n个所述簇中的第i个簇,p是所述Ai中的样本点,mi为所述Ai的聚类中心值,t为迭代次数;
步骤S36,若dete>ε,确定当前需要进行簇之间的合并操作,返回步骤S33并重新选择一个小于nt-1的数目nt、并重复执行步骤S33-S35;若dete≤ε,则确定当前不需要进行簇之间的合并操作,结束所述曲线聚类操作、并得到M个所述曲线簇,其中,ε为常数。
较优地,所述步骤S4利用均值法根据各个所述曲线簇计算出用户典型用电特征曲线,得到M个所述用户典型用电特征曲线包括:
将每一个所述曲线簇视为所述具有典型用电特征的样本集,根据所述具有典型用电特征的样本集中所有96点用户历史负荷曲线,计算每一个时间点的纵坐标的平均数,得到所述用户典型用电特征曲线;
根据各个所述曲线簇进行计算,最终得到M个具有不同典型用电特征的所述用户典型用电特征曲线。
较优地,所述步骤S6以所述用电安全隐患指标作为特征,以一个所述曲线簇作为诊断样本集,以所述曲线簇所对应的所述用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型包括:
将所述诊断样本集分为训练集和测试集;
基于所述训练集,利用随机森林模型对所述步骤S5中给出的所述用电安全隐患指标进行训练;
设定重要指标数目S,通过网格搜索法进行搜索,找到S个重要指标,其中,当所述设备生产厂家成为所述重要指标时,代表所述设备生产厂家的电表极易被改装、具有高窃电风险和高安全隐患;
基于S个所述重要指标生成所述用电安全隐患诊断模型;
通过所述测试集测试所述用电安全隐患诊断模型;
若测试结果正确率超过阈值,则所述用电安全隐患诊断模型无需调整;
若所述测试结果正确率低于所述阈值,则重新划分训练集与测试集,重新训练模型,直至所述用电安全隐患诊断模型的所述测试结果正确率超过所述阈值。
进一步地,本发明还提供一种用电安全隐患诊断装置,包括:
收集模块,用于收集96点用户历史负荷曲线的样本集C,C={C1,C2,…,CN};
计算模块,用于基于欧式距离和DTW距离算法,计算所述样本集C中任意两条曲线的距离DISTDTW(x,y),x∈C,y∈C;
聚类模块,用于以所述距离DISTDTW(x,y)作为相似度衡量依据,进行所述样本集C的曲线聚类,得到M个曲线簇;
用户典型用电特征曲线计算模块,用于利用均值法根据各个所述曲线簇计算出用户典型用电特征曲线,得到M个所述用户典型用电特征曲线;
指标选取模块,用于初步选取用电安全隐患指标,所述用电安全隐患指标包括但不限于电流不平衡率、电压不平衡率、额定电压偏离度、用电量同比、用电量环比、电气设备信息、分时电量、电压、电流、有功功率,所述电气设备信息包括但不限于设备生产厂家、设备价格、设备投运日期,其中,所述用电量同比、所述用电量环比的参照对象为所述用户典型用电特征曲线;
用电安全隐患诊断模型建立模块,用于以所述用电安全隐患指标作为特征,以一个所述曲线簇作为诊断样本集,以所述曲线簇所对应的所述用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型;
诊断模块,用于根据所述用电安全隐患诊断模型,诊断具有相同典型用电特征的用户电力设备是否存在用电安全隐患。
较优地,所述聚类模块,用于将所述样本集C处理为一个最小生成树,设置模糊的分裂数q-1;按照maxDISTDTW(x,y)将所述最小生成树分成q棵子树;根据q棵所述子树所对应的元素数目选择初始聚类数目n;按照元素数目排序,将前n棵所述子树视为初始的n个簇,计算各个所述簇的初始聚类中心;利用评价函数I判断是否进行簇之间的合并操作:
其中,Ai表示n个所述簇中的第i个簇,p是所述Ai中的样本点,mi为所述Ai的聚类中心值,t为迭代次数;若dete>ε,确定当前需要进行簇之间的合并操作,重新选择一个小于nt -1的数目nt、并重复计算dete;若dete≤ε,则确定当前不需要进行簇之间的合并操作,结束所述曲线聚类操作、并得到M个所述曲线簇,其中,ε为常数。
较优地,所述用户典型用电特征曲线计算模块,用于将每一个所述曲线簇视为所述具有典型用电特征的样本集,根据所述具有典型用电特征的样本集中所有96点用户历史负荷曲线,计算每一个时间点的纵坐标平均数,得到所述用户典型用电特征曲线;并根据各个所述曲线簇进行计算,最终得到M个具有不同典型用电特征的所述用户典型用电特征曲线;
所述用电安全隐患诊断模型建立模块,用于将所述诊断样本集分为训练集和测试集;还用于基于所述训练集,利用随机森林模型对所述步骤S5中给出的所述用电安全隐患指标进行训练;设定重要指标数目S,通过网格搜索法进行搜索,找到S个重要指标,其中,当所述设备生产厂家成为所述重要指标时,代表所述设备生产厂家的电表极易被改装、具有高窃电风险和高安全隐患;基于S个所述重要指标生成所述用电安全隐患诊断模型;通过所述测试集测试所述用电安全隐患诊断模型;若测试结果正确率超过阈值,则所述用电安全隐患诊断模型无需调整;若所述测试结果正确率低于所述阈值,则重新划分训练集与测试集,重新训练模型,直至所述用电安全隐患诊断模型的所述测试结果正确率超过所述阈值。
进一步地,本发明还提供一种用电安全隐患诊断的电子设备,包括:存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如前述的方法。
进一步地,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述的方法。
由上述技术方案可知,本发明实施例提供的用电安全隐患诊断方法,首先收集96点用户历史负荷曲线的样本集C;基于欧式距离和DTW距离算法,计算所述样本集C中任意两条曲线的距离DISTDTW(x,y);以所述距离DISTDTW(x,y)作为相似度衡量依据,进行所述样本集C的曲线聚类,得到M个曲线簇;分别根据各个所述曲线簇计算出M个所述用户典型用电特征曲线;初步选取用电安全隐患指标;以所述用电安全隐患指标作为特征,以一个所述曲线簇作为诊断样本集,以所述曲线簇所对应的所述用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型;根据所述用电安全隐患诊断模型,可诊断具有相同典型用电特征的用户电力设备是否存在用电安全隐患。
附图说明
图1为本发明的用电安全隐患诊断方法的流程图。
图2为本发明的用电安全隐患诊断装置的结构图。
图3为本发明的用电安全隐患诊断的电子设备示意图。
具体实施方式
以下结合本发明的附图,对本发明的技术方案以及技术效果做进一步的详细阐述。
本发明针对状态监测数据、历史数据、发生安全隐患次数以及检修数据分析产生故障的原因,提出了一种基于DTW的聚类算法和随机森林算法的用电安全隐患诊断方法,通过训练与测试,智能识别各设备用电安全隐患状态。首先应用聚类算法开展用户用电行为特征的用电负荷监测分析,掌握典型负荷特性;然后应用随机森林算法在相应类中进行综合诊断,实现对电力设备安全运行的提前预警。
如图1所示,本发明提供一种用电安全隐患诊断方法,步骤包括:
步骤S1,收集96点用户历史负荷曲线的样本集C,C={C1,C2,…,CN};需将样本集C中数据进行预处理,清洗无效数据、补全缺失数据;
步骤S2,基于欧式距离和DTW距离算法,计算样本集C中任意两条曲线的距离DISTDTW(x,y);
步骤S3,以距离DISTDTW(x,y)作为相似度衡量依据,进行样本集C的曲线聚类,得到M个曲线簇;
步骤S4,利用均值法,根据各个曲线簇计算出用户典型用电特征曲线,得到M个用户典型用电特征曲线;
步骤S5,初步选取用电安全隐患指标,用电安全隐患指标包括但不限于电流不平衡率、电压不平衡率、额定电压偏离度、用电量同比、用电量环比、电气设备信息、分时电量、电压、电流、有功功率,电气设备信息包括但不限于设备生产厂家、设备价格、设备投运日期,其中,用电量同比、用电量环比的参照对象为用户典型用电特征曲线;
步骤S6,以用电安全隐患指标作为特征,以一个曲线簇作为诊断样本集,以曲线簇所对应的用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型;
步骤S7,根据用电安全隐患诊断模型,诊断具有相同典型用电特征的用户电力设备是否存在用电安全隐患。
具体的,步骤S2基于欧式距离和DTW距离算法计算样本集C中任意两条曲线的距离DISTDTW(x,y)的具体实施为:
步骤S21,构建对应曲线x的时间序列D、对应曲线y的时间序列T、以及欧式距离计算式:
D=[d1,d2,d3…dn] (1)
T=[t1,t2,t3…tn] (2)
其中,dx为时间序列D中的元素,ty为时间序列T中的元素,DTW(dx,ty)表示dx到ty之间的欧式距离;
步骤S22,计算距离DISTDTW(x,y):
DISTDTW(x,y)=DTW(dx,ty)+min{DISTDTW(x-1,y),DISTDTW(x,y-1),DISTDTW(x-1,y-1)} (4)
步骤S3利用“网格化搜索+数据观测”相结合的方式,首先通过聚类有效性评价指标(Silhouette Coefficient、Calinski-Harabasz)等衡量聚类算法产生的聚类结果是否达到最佳标准,同时结合数据类别特征观测效果科学调整,进而明确聚类数量n,根据聚类分析结果得到的n个聚类类别,分析各类别的负荷曲线特性,找到用户电气设备的典型曲线。具体的,步骤S3以距离DISTDTW(x,y)作为相似度衡量依据,进行样本集C的曲线聚类,得到M个曲线簇的具体实施为:
步骤S31,将样本集C处理为一个最小生成树,设置模糊的分裂数q-1;
步骤S32,按照maxDISTDTW(x,y)将最小生成树分成q棵子树,maxDISTDTW(x,y)是指距离的最大值;
步骤S33,根据q棵子树所对应的元素数目选择初始聚类数目n;
步骤S34,按照元素数目排序,将前n棵子树视为初始的n个簇,计算各个簇的初始聚类中心;
步骤S35,利用评价函数I判断是否进行簇之间的合并操作:
其中,Ai表示n个簇中的第i个簇,p是Ai中的样本点,mi为Ai的聚类中心值,t为迭代次数
步骤S36,若dete>ε,确定当前需要进行簇之间的合并操作,返回步骤S33并重新选择一个小于nt-1的数目nt、并重复执行步骤S33-S35;若dete≤ε,则确定当前不需要进行簇之间的合并操作,结束曲线聚类操作、并得到M个曲线簇,其中,ε为一个极小常数。
较优地,步骤S4利用均值法根据各个曲线簇计算出用户典型用电特征曲线,得到M个用户典型用电特征曲线包括:
步骤S41,将每一个曲线簇视为具有典型用电特征的样本集,根据具有典型用电特征的样本集中所有96点用户历史负荷曲线,计算每一个时间点的纵坐标平均数,得到用户典型用电特征曲线;
步骤S42,根据各个曲线簇进行计算,最终得到M个具有不同典型用电特征的用户典型用电特征曲线。
当有用户电气设备发生用电安全隐患时,其相关电气参量指标数值会产生异常变化。通过对电力设备状态监测数据、历史数据、发生故障次数以及检修数据相似度的比较分析,可以将存有电力设备安全隐患的用户筛选出来。本发明以随机森林算法为基础构建用电安全隐患识别模型。
前述步骤S5提及,初步选取的用电安全隐患指标包括但不限于电流不平衡率、电压不平衡率、额定电压偏离度、用电量同比、用电量环比、电气设备信息、分时电量、电压、电流、有功功率。其中:
三相用户的电流不平衡率为:
其中,IPRmax是电流最大项的值,IPRmin是电流最小项的值;
单相用户的电流不平衡率为:
其中,Ia是火线电流,In是零线电流;
电压不平衡率为:
其中,UPRmax是电压最大项的值,UPRmin是电压最小项的值;
额定电压偏离度是电压和额定电压之间的偏离度,能反映是否出现设备安全隐患;
用电量同比体现的是不同时间周期的电量波动情况,在本发明中,用电量同比、用电量环比的参照对象为用户典型用电特征曲线;
上述指标的使用方式一般为超过或者不超过;
电气设备信息包括但不限于设备生产厂家、生产批次、设备价格、设备投运日期;电气设备信息的使用方式是“是”或“否”,价格高于或低于,日期在前或在后。
进一步地,用电安全隐患指标还可以从以下范围中选取:例如,营销业务特征(计量故障发生频率、违窃记录数目)、用电加工特征(峰谷差、负载率、电流平衡率、功率因数波动率)、异常事件(开盖事件、开箱时间、相序异常、异常停上电事件)、终端报警次数等。
导入上述指标,步骤S6以用电安全隐患指标作为特征,以一个曲线簇作为诊断样本集,以曲线簇所对应的用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型的具体实施包括:
步骤S61,将诊断样本集分为7:3的训练集和测试集,其中,训练集用于模型训练,测试集用于模型检验;
步骤S62,基于训练集,利用随机森林模型对步骤S5中给出的用电安全隐患指标进行训练;
步骤S63,设定重要指标数目S,通过网格搜索法进行搜索,找到S个重要指标。本步骤采用随机森林算法进一步分析各特征对设备安全隐患识别的重要程度,筛选影响较大的前S个重要性特征集合,重新优化预测模型,提升模型的准确性和泛化能力。例如,当设备生产厂家成为重要指标时,代表设备生产厂家的电表极易被改装、具有高窃电风险和高安全隐患;
步骤S64,基于S个重要指标生成用电安全隐患诊断模型;
步骤S65,通过测试集测试用电安全隐患诊断模型;采用MAPE、MAE、RMSE等方法可评估预测模型的准确率:
采用MAPE方法,平均绝对百分比误差计算值范围为[0,+∞),当MAPE值越接近于0,模型效果越好,反之。具体计算逻辑如下:
采用MAE方法,平均绝对误差计算值范围为[0,+∞),当预测值与真实值越接近时,MAE值越接近于0,模型效果越好,反之。具体计算逻辑如下:
采用RMSE方法,均方根误差计算值范围为[0,+∞),当预测值与真实值越接近时,RMSE值越接近于0,模型效果越好,反之。具体计算逻辑如下:
步骤S66,若测试结果正确率超过阈值,则用电安全隐患诊断模型无需调整;若测试结果正确率低于阈值,则重新划分训练集与测试集,重新训练模型,直至用电安全隐患诊断模型的测试结果正确率超过阈值。
进一步地,如图2所示,本发明还提供一种用电安全隐患诊断装置,包括:
收集模块21,用于收集96点用户历史负荷曲线的样本集C,C={C1,C2,…,CN};
计算模块22,用于基于欧式距离和DTW距离算法,计算样本集C中任意两条曲线的距离DISTDTW(Cx,Cy),x∈C,y∈C;
聚类模块23,用于以距离DISTDTW(Cx,Cy)作为相似度衡量依据,进行样本集C的曲线聚类,得到M个曲线簇;
用户典型用电特征曲线计算模块24,用于利用均值法根据各个曲线簇计算出用户典型用电特征曲线,得到M个用户典型用电特征曲线;
指标选取模块25,用于初步选取用电安全隐患指标,用电安全隐患指标包括但不限于电流不平衡率、电压不平衡率、额定电压偏离度、用电量同比、用电量环比、电气设备信息、分时电量、电压、电流、有功功率,电气设备信息包括但不限于设备生产厂家、设备价格、设备投运日期,其中,用电量同比、用电量环比的参照对象为用户典型用电特征曲线;
用电安全隐患诊断模型建立模块26,用于以用电安全隐患指标作为特征,以一个曲线簇作为诊断样本集,以曲线簇所对应的用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型;
诊断模块27,用于根据用电安全隐患诊断模型,诊断具有相同典型用电特征的用户电力设备是否存在用电安全隐患。
较优地,聚类模块23,用于将样本集C处理为一个最小生成树,设置模糊的分裂数q-1;按照maxDISTDTW(x,y)将最小生成树分成q棵子树;根据q棵子树所对应的元素数目选择初始聚类数目n;按照元素数目排序,将前n棵子树视为初始的n个簇,计算各个簇的初始聚类中心;根据前述公式(1)-(6),利用评价函数I判断是否进行簇之间的合并操作;若dete>ε,确定当前需要进行簇之间的合并操作,重新选择一个小于nt-1的数目nt、并重复计算dete;若dete≤ε,则确定当前不需要进行簇之间的合并操作,结束曲线聚类操作、并得到M个曲线簇。
较优地,用户典型用电特征曲线计算模块24,用于将每一个曲线簇视为具有典型用电特征的样本集,根据具有典型用电特征的样本集中所有96点用户历史负荷曲线,计算每一个时间点的纵坐标平均数,得到用户典型用电特征曲线;并根据各个曲线簇进行计算,最终得到M个具有不同典型用电特征的用户典型用电特征曲线;
用电安全隐患诊断模型建立模块25,用于将诊断样本集分为训练集和测试集;还用于基于训练集,利用随机森林模型对步骤S5中给出的用电安全隐患指标进行训练;设定重要指标数目S,通过网格搜索法进行搜索,找到S个重要指标,其中,当设备生产厂家成为重要指标时,代表设备生产厂家的电表极易被改装、具有高窃电风险和高安全隐患;基于S个重要指标生成用电安全隐患诊断模型;通过测试集测试用电安全隐患诊断模型;若测试结果正确率超过阈值,则用电安全隐患诊断模型无需调整;若测试结果正确率低于阈值,则重新划分训练集与测试集,重新训练模型,直至用电安全隐患诊断模型的测试结果正确率超过阈值。
本发明提出了一种基于DTW层次聚类和集成算法的故障诊断,将无监督学习方法和监督学习方法有机的结合起来。首先,利用DTW算法改进相似度的衡量方式,接着进行聚类分析,掌握用电设备不同的负荷特性类别。接着以无监督学习的输出数据类别,分别进行监督学习建模,构建随机森林模型,实现对有用电安全隐患设备的自动化输出。
本发明用于客户侧用电设备安全隐患智能化识别,可以客户侧物联服务平台的终端连接、数据采集、数据存储为基础,通过聚类分析、随机森林等人工智能技术进行大数据模拟计算,通过搭建基于用户设备的用电安全隐患诊断模型,实现客户侧用电安全隐患状态智能识别,以用电大数据为基础展开研究,降低了人工排查的成本,提升了识别效率。
进一步地,如图3所示,本发明还提供一种用电安全隐患诊断的电子设备,设备包括:处理器301、存储器302和总线303;其中,处理器301和存储器302通过总线303完成相互间的通信;处理器301用于调用存储器302中的程序指令,以执行上述各方法实施例所提供的方法。
本发明实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置及设备等实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种用电安全隐患诊断方法,其特征在于,包括:
步骤S1,收集用户侧的96点用户历史负荷曲线的样本集C,C={C1,C2,…,CN};
步骤S2,基于欧式距离和DTW距离算法,计算所述样本集C中任意两条曲线的距离DISTDTW(x,y),x∈C,y∈C;
步骤S3,以所述距离DISTDTW(x,y)作为相似度衡量依据,进行所述样本集C的曲线聚类,得到M个曲线簇;
步骤S4,利用均值法,根据各个所述曲线簇计算出用户典型用电特征曲线,得到M个所述用户典型用电特征曲线;
步骤S5,初步选取用电安全隐患指标,所述用电安全隐患指标包括但不限于电流不平衡率、电压不平衡率、额定电压偏离度、用电量同比、用电量环比、电气设备信息、分时电量、电压、电流、有功功率,所述电气设备信息包括但不限于设备生产厂家、设备价格、设备投运日期,其中,所述用电量同比、所述用电量环比的参照对象为所述用户典型用电特征曲线;
步骤S6,以所述用电安全隐患指标作为特征,以一个所述曲线簇作为诊断样本集,以所述曲线簇所对应的所述用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型;
步骤S7,根据所述用电安全隐患诊断模型,诊断具有相同典型用电特征的用户电力设备是否存在用电安全隐患。
2.如权利要求1所述的用电安全隐患诊断方法,其特征在于,所述步骤S2基于欧式距离和DTW距离算法计算所述样本集C中任意两条曲线的距离DISTDTW(x,y)包括:
步骤S21,构建对应曲线x的时间序列D、对应曲线y的时间序列T、以及欧式距离计算式:
D=[d1,d2,d3…dn]
T=[t1,t2,t3…tn]
其中,dx为所述时间序列D中的元素,ty为所述时间序列T中的元素,DTW(dx,ty)表示dx到dy之间的欧式距离;
步骤S22,计算所述距离DISTDTW(x,y):
DISTDTW(x,y)=DTW(dx,ty)+min{DISTDTW(x-1,y),DISTDTW(x,y-1),DISTDTW(x-1,y-1)}。
3.如权利要求2所述的用电安全隐患诊断方法,其特征在于,所述步骤S3以所述距离DISTDTW(x,y)作为相似度衡量依据,进行所述样本集C的曲线聚类,得到M个曲线簇包括:
步骤S31,将所述样本集C处理为一个最小生成树,设置模糊的分裂数q-1;
步骤S32,按照maxDISTDTW(x,y)将所述最小生成树分成q棵子树;
步骤S33,根据q棵所述子树所对应的元素数目选择初始聚类数目n;
步骤S34,按照元素数目排序,将前n棵所述子树视为初始的n个簇,计算各个所述簇的初始聚类中心;
步骤S35,利用评价函数I判断是否进行簇之间的合并操作:
其中,Ai表示n个所述簇中的第i个簇,p是所述Ai中的样本点,mi为所述Ai的聚类中心值,t为迭代次数;
步骤S36,若dete>ε,确定当前需要进行簇之间的合并操作,返回步骤S33并重新选择一个小于nt-1的数目nt、并重复执行步骤S33-S35;若dete≤ε,则确定当前不需要进行簇之间的合并操作,结束所述曲线聚类操作、并得到M个所述曲线簇,其中,ε为常数。
4.如权利要求3所述的用电安全隐患诊断方法,其特征在于,所述步骤S4利用均值法,根据各个所述曲线簇计算出用户典型用电特征曲线,得到M个所述用户典型用电特征曲线包括:
步骤S41,将每一个所述曲线簇视为所述具有典型用电特征的样本集,根据所述具有典型用电特征的样本集中所有96点用户历史负荷曲线,计算每一个时间点的纵坐标平均数,得到所述用户典型用电特征曲线;
步骤S42,根据各个所述曲线簇进行计算,最终得到M个具有不同典型用电特征的所述用户典型用电特征曲线。
5.如权利要求4所述的用电安全隐患诊断方法,其特征在于,所述步骤S6以所述用电安全隐患指标作为特征,以一个所述曲线簇作为诊断样本集,以所述曲线簇所对应的所述用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型包括:
步骤S61,将所述诊断样本集分为训练集和测试集;
步骤S62,基于所述训练集,利用随机森林模型对所述步骤S5中给出的所述用电安全隐患指标进行训练;
步骤S63,设定重要指标数目S,通过网格搜索法进行搜索,找到S个重要指标,其中,当所述设备生产厂家成为所述重要指标时,代表所述设备生产厂家的电表极易被改装、具有高窃电风险和高安全隐患;
步骤S64,基于S个所述重要指标生成所述用电安全隐患诊断模型;
步骤S65,通过所述测试集测试所述用电安全隐患诊断模型;
步骤S66,若测试结果正确率超过阈值,则所述用电安全隐患诊断模型无需调整;若所述测试结果正确率低于所述阈值,则重新划分训练集与测试集,重新训练模型,直至所述用电安全隐患诊断模型的所述测试结果正确率超过所述阈值。
6.一种用电安全隐患诊断装置,其特征在于,包括:
收集模块,用于收集用户侧的96点用户历史负荷曲线的样本集C,C={C1,C2,…,CN};
计算模块,用于基于欧式距离和DTW距离算法,计算所述样本集C中任意两条曲线的距离DISTDTW(x,y),x∈C,y∈C;
聚类模块,用于以所述距离DISTDTW(x,y)作为相似度衡量依据,进行所述样本集C的曲线聚类,得到M个曲线簇;
用户典型用电特征曲线计算模块,用于利用均值法,根据各个所述曲线簇计算出用户典型用电特征曲线,得到M个所述用户典型用电特征曲线;
指标选取模块,用于初步选取用电安全隐患指标,所述用电安全隐患指标包括但不限于电流不平衡率、电压不平衡率、额定电压偏离度、用电量同比、用电量环比、电气设备信息、分时电量、电压、电流、有功功率,所述电气设备信息包括但不限于设备生产厂家、设备价格、设备投运日期,其中,所述用电量同比、所述用电量环比的参照对象为所述用户典型用电特征曲线;
用电安全隐患诊断模型建立模块,用于以所述用电安全隐患指标作为特征,以一个所述曲线簇作为诊断样本集,以所述曲线簇所对应的所述用户典型用电特征曲线为参照对象,基于随机森林算法生成具有典型用电特征的用电安全隐患诊断模型;
诊断模块,用于根据所述用电安全隐患诊断模型,诊断具有相同典型用电特征的用户电力设备是否存在用电安全隐患。
7.如权利要求6所述的用电安全隐患诊断装置,其特征在于,
所述聚类模块,用于将所述样本集C处理为一个最小生成树,设置模糊的分裂数q-1;按照maxDISTDTW(x,y)将所述最小生成树分成q棵子树;根据q棵所述子树所对应的元素数目选择初始聚类数目n;按照元素数目排序,将前n棵所述子树视为初始的n个簇,计算各个所述簇的初始聚类中心;利用评价函数I判断是否进行簇之间的合并操作:
其中,Ai表示n个所述簇中的第i个簇,p是所述Ai中的样本点,mi为所述Ai的聚类中心值,t为迭代次数;若dete>ε,确定当前需要进行簇之间的合并操作,返重新选择一个小于nt-1的数目nt、并重复利用所述评价函数I判断是否进行簇之间的合并操作;若dete≤ε,则确定当前不需要进行簇之间的合并操作,结束所述曲线聚类操作、并得到M个所述曲线簇,其中,ε为常数。
8.如权利要求7所述的用电安全隐患诊断装置,其特征在于,
所述用户典型用电特征曲线计算模块,用于将每一个所述曲线簇视为所述具有典型用电特征的样本集,根据所述具有典型用电特征的样本集中所有96点用户历史负荷曲线,计算每一个时间点的纵坐标加权平均数,得到所述用户典型用电特征曲线;并根据各个所述曲线簇进行计算,最终得到M个具有不同典型用电特征的所述用户典型用电特征曲线;
所述用电安全隐患诊断模型建立模块,用于将所述诊断样本集分为训练集和测试集;还用于基于所述训练集,利用随机森林模型对所述步骤S5中给出的所述用电安全隐患指标进行训练;设定重要指标数目S,通过网格搜索法进行搜索,找到S个重要指标,其中,当所述设备生产厂家成为所述重要指标时,代表所述设备生产厂家的电表极易被改装、具有高窃电风险和高安全隐患;基于S个所述重要指标生成所述用电安全隐患诊断模型;通过所述测试集测试所述用电安全隐患诊断模型;若测试结果正确率超过阈值,则所述用电安全隐患诊断模型无需调整;若所述测试结果正确率低于所述阈值,则重新划分训练集与测试集,重新训练模型,直至所述用电安全隐患诊断模型的所述测试结果正确率超过所述阈值。
9.一种用电安全隐患诊断的电子设备,其特征在于,包括:存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至5任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210708775.9A CN115146715A (zh) | 2022-06-21 | 2022-06-21 | 用电安全隐患诊断方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210708775.9A CN115146715A (zh) | 2022-06-21 | 2022-06-21 | 用电安全隐患诊断方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115146715A true CN115146715A (zh) | 2022-10-04 |
Family
ID=83407501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210708775.9A Pending CN115146715A (zh) | 2022-06-21 | 2022-06-21 | 用电安全隐患诊断方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115146715A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115912359A (zh) * | 2023-02-23 | 2023-04-04 | 豪派(陕西)电子科技有限公司 | 基于大数据的数字化安全隐患识别排查治理方法 |
-
2022
- 2022-06-21 CN CN202210708775.9A patent/CN115146715A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115912359A (zh) * | 2023-02-23 | 2023-04-04 | 豪派(陕西)电子科技有限公司 | 基于大数据的数字化安全隐患识别排查治理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN110223196B (zh) | 基于典型行业特征库和反窃电样本库的反窃电分析方法 | |
CN107527114B (zh) | 一种基于大数据的线路台区异常分析方法 | |
CN108376982B (zh) | 负载相序的识别方法及装置 | |
CN108445410A (zh) | 一种监测蓄电池组运行状态的方法及装置 | |
CN109856299A (zh) | 一种变压器在线监测差异化阈值动态设置方法、系统 | |
CN105677791B (zh) | 用于分析风力发电机组的运行数据的方法和系统 | |
JP2000512766A (ja) | 高電圧絶縁における部分放電測定の統計的パターン分析方法 | |
CN111008193B (zh) | 一种数据清洗与质量评价方法及系统 | |
CN111738462A (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN115638875B (zh) | 基于图谱分析的电厂设备故障诊断方法及系统 | |
CN113987294A (zh) | 一种基于遗传优化gru神经网络的cvt在线故障诊断方法 | |
CN111612371A (zh) | 一种基于层次分析法的智能电表质量评估方法 | |
CN116882804A (zh) | 一种智能电力监控方法及系统 | |
CN113033617A (zh) | 一种基于大数据台区线损数据深度挖掘分析方法 | |
Long et al. | A data-driven combined algorithm for abnormal power loss detection in the distribution network | |
CN115617784A (zh) | 一种信息化配电的数据处理系统及其处理方法 | |
CN116154972A (zh) | 一种分布式电网电能质量监测方法及系统 | |
CN115293257A (zh) | 一种针对异常用电用户的检测方法及系统 | |
CN109409629B (zh) | 基于多属性决策模型的采集终端生产厂商评价方法 | |
CN110378358A (zh) | 一种配电网异构数据整合方法及系统 | |
CN115146715A (zh) | 用电安全隐患诊断方法、装置、设备及存储介质 | |
CN111612149A (zh) | 一种基于决策树的主网线路状态检测方法、系统及介质 | |
CN116714469A (zh) | 充电桩健康监测方法、装置、终端及存储介质 | |
CN112101673A (zh) | 一种基于隐马尔可夫模型的电网发展趋势预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |