CN107967485A - 用电计量设备故障分析方法及装置 - Google Patents
用电计量设备故障分析方法及装置 Download PDFInfo
- Publication number
- CN107967485A CN107967485A CN201711136943.7A CN201711136943A CN107967485A CN 107967485 A CN107967485 A CN 107967485A CN 201711136943 A CN201711136943 A CN 201711136943A CN 107967485 A CN107967485 A CN 107967485A
- Authority
- CN
- China
- Prior art keywords
- data
- electro
- metering
- characteristic item
- ammeter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 52
- 238000012360 testing method Methods 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 238000010801 machine learning Methods 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 15
- 230000001419 dependent effect Effects 0.000 claims description 13
- 230000005611 electricity Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 5
- 238000007477 logistic regression Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 235000013399 edible fruits Nutrition 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 238000013075 data extraction Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用电计量设备故障分析方法及装置,其中方法包括:获得与用电计量设备故障相关的源数据;对所述源数据进行数据清洗;对数据清洗后的所述源数据进行特征项选取;将选取的特征项制成样本数据,样本数据包括训练数据、测试数据和预测数据;将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试;将预测数据加载至训练好的模型,获得用电计量设备故障分析结果。本发明可以提高用电计量设备故障分析的准确性,并降低人力资源成本、提高效率。
Description
技术领域
本发明涉及电力计量技术领域,尤其涉及用电计量设备故障分析方法及装置。
背景技术
近几年来,随着社会的发展,人民的生活和社会的生产对电力的需求不断增大,用电计量设备计量的电力数据也呈爆发式增长。用户数多、计量数据量大的这种现状对电力系统的计量工作是一个大的挑战。另一方面,全国范围内,在数亿只电表运行过程中存在很多有故障的电表。这些电表的故障种类多,最终会影响到计量数据,导致损害用户或供电企业的切身利益。所以保证用电计量设备安全可靠运行,能够精准地计量用户的用电数据就成为了电力系统中的重要工作之一。在用电计量设备开展工作的过程中,如果能实时地发现故障计量数据,并加以分析,就可以及时得出用电计量设备的故障类型和故障原因,这样就可以最大程度减少因计量故障对用户和供电企业造成的损失。近年来,国家电力体制不断深化,用户对服务的要求越来越高,电力市场的竞争也愈加激烈,这种形势下,电力系统迫切需求依靠信息化技术手段为用户提供精准服务。如何通过采集的海量数据及时地判断各类故障,提前发现用电计量设备故障,及早完成现场处置,已成为电力系统的迫切需求。
为深化用电信息采集数据应用,增强营销业务辅助决策手段,支撑用电计量设备运维管理,研究人员也一直在做相关工作和努力。当前,最常用的技术是电力系统建立的基于用电信息采集系统主站的计量在线监测与智能诊断分析模型。该技术主要是电力专家根据经验和业务知识做的各种故障的判定规则,其判定方法基本是阈值法,即通过判定规则算出的数值是否超过了某个阈值,若超过,则判定为异常。此方法虽然在一定程度上可以发现一些计量异常,但是通过现场核实,存在较大的误差。该方法中的阈值是一个范围,如何将阈值定为一个最合适的值需要不断的现场验证,每调节一个阈值就需要核实一次,这就需要大量的人力资源做支撑,时间、效率都没有很好的保证。
发明内容
本发明实施例提供一种用电计量设备故障分析方法,用以提高用电计量设备故障分析的准确性,并降低人力资源成本、提高效率,该方法包括:
获得与用电计量设备故障相关的源数据;
对所述源数据进行数据清洗;
对数据清洗后的所述源数据进行特征项选取;
将选取的特征项制成样本数据,样本数据包括训练数据、测试数据和预测数据;
将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试;
将预测数据加载至训练好的模型,获得用电计量设备故障分析结果。
本发明实施例还提供一种用电计量设备故障分析装置,用以提高用电计量设备故障分析的准确性,并降低人力资源成本、提高效率,该装置包括:
数据获得模块,用于获得与用电计量设备故障相关的源数据;
数据处理模块,用于对所述源数据进行数据清洗;对数据清洗后的所述源数据进行特征项选取;将选取的特征项制成样本数据,样本数据包括训练数据、测试数据和预测数据;
训练与测试模块,用于将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试;
故障分析模块,用于将预测数据加载至训练好的模型,获得用电计量设备故障分析结果。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述用电计量设备故障分析方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述用电计量设备故障分析方法的计算机程序。
本发明实施例中,获得与用电计量设备故障相关的源数据,对所述源数据进行数据清洗,对数据清洗后的所述源数据进行特征项选取,可以提高用电计量设备故障分析的准确性;将选取的特征项制成样本数据,样本数据包括训练数据、测试数据和预测数据,将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试,将预测数据加载至训练好的模型,获得用电计量设备故障分析结果,由于采用了Xgboost算法建立的机器学习的模型,因此可以提高用电计量设备故障分析的效率和准确性,降低人力资源成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中用电计量设备故障分析方法的示意图;
图2为本发明实施例中用电计量设备故障概率的示例图;
图3为本发明实施例中用电计量设备故障分析方法的一具体实例图;
图4为本发明实施例中用电计量设备故障分析装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本发明实施例中,基于机器学习决策树的用电计量设备故障分析利用数据挖掘技术对用电计量设备故障的数据进行分析,发现隐藏在数据中有用的信息,通过模型对数据的迭代分析,最终能够准确地判断出用电计量设备发生的故障。本发明实施例可以及时高效地发现用电计量设备故障,有利于电力系统可靠运行,避免了供电企业和电力用户不必要的损失。
具体的,在本发明实施例中,提出了用决策树Xgboost算法分析用电计量设备故障的方法,避免了传统方法的低效率和低准确率的问题。图1为本发明实施例中用电计量设备故障分析方法的示意图,如图1所示,该方法可以包括:
步骤101、获得与用电计量设备故障相关的源数据;
步骤102、对所述源数据进行数据清洗;
步骤103、对数据清洗后的所述源数据进行特征项选取;
步骤104、将选取的特征项制成样本数据,样本数据包括训练数据、测试数据和预测数据;
步骤105、将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试;
步骤106、将预测数据加载至训练好的模型,获得用电计量设备故障分析结果。
具体实施时,先获得与用电计量设备故障相关的源数据。实施例中,可以根据用电计量设备故障的含义,选用和用电计量设备故障相关的一些源数据,旨在通过这些源数据选取出和用电计量设备故障关系最紧密的特征项。例如,这些源数据可以包括以下数据其中之一或任意组合:用户档案数据,电表档案数据,电表计量的电流数据,电表计量的电压数据,电表计量的负荷数据,相关故障事件数据等。
源数据存在“脏数据”,要对其进行数据清洗。例如可以包括对源数据进行如下任意一项或多项数据清洗:错误值处理,缺失值处理,数据去重处理。数据清洗可以提高用电计量设备故障分析的准确性。
错误值处理主要是对有明显错误的数据基于电力业务规则进行修正。缺失值处理指对没有采集到的为空值的数据进行处理。缺失值处理主要通过缺失范围和缺失值的重要性综合考虑采取策略。若缺失的数据对于本次故障分析重要性低,可以不做处理或者将其删除;若重要性高且范围大,就要考虑重新获取数据;若重要性高且缺失范围少,可以通过业务知识进行补全。
在对源数据进行数据清洗后,需要再进行特征项选取。特征项包括模型加载的特征数据。选出合适的特征项可以降低模型的特征维度,加快运算速度,降低无关特征对分类效果的影响,提高分析结果的准确度。在实施例中,选取的特征项主要可以包括三类:从用户档案数据和电表档案数据提取的特征项;根据电表计量的电流数据、电压数据和负荷数据计算的特征项;通过加载相关故障事件数据获得的特征项。
实施例中,从用户档案数据和电表档案数据提取的特征项,可以包括:电表接线方式、用户行业类型及计量方式等其中之一或任意组合。根据电表计量的电流数据、电压数据和负荷数据计算的特征项,可以包括:电流电压相关性、电流功率相关性及日电量的趋势等其中之一或任意组合。通过加载相关故障事件数据获得的特征项,可以包括:用电计量设备的故障事件状态等。用电计量设备的故障事件状态,例如可以是将状态量通过1和0来标记,发生故障记为1,未发生记为0。
在选取特征项后,将选取的特征项制成样本数据,样本数据包括训练数据、测试数据和预测数据。实施例中,训练数据可以包括故障特征数据和故障结果数据。
实施时将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试。本发明实施例选用的机器学习的模型是Xgboost。Xgbosot算法是一种新型提升决策树算法,基本思想是每次建立的弱学习器是在之前建立的弱学习器的损失函数的梯度下降方向,能够自动利用CPU的多线程进行并行运算,实现了算法在精度上得提高。本发明实施例由于采用了Xgboost算法建立的机器学习的模型,因此可以提高用电计量设备故障分析的效率和准确性,降低人力资源成本。
实施例中,可以在服务器中搭建好Xgboost的运行环境,并配置好环境变量,可以运行Xgboost。Xgboost算法模型加载训练数据后,模型进行有监督的学习,利用机器学习寻找出故障与非故障的区别,故障用户之间的共同特点等。
实施例中,加载训练数据和测试数据前,可以进一步包括:将Xgboost算法的参数设置为以下参数:
'booster':'gbtree',分类器每次迭代的模型为:基于树的模型。
'objective':'binary:logistic',该参数是定义需要被最小化的损失函数。本实施例选择的是二分类的逻辑回归,可以返回预测的概率,即窃电嫌疑的概率0-1。
'eval_metric':'auc',该参数指对于有效数据的度量方法,本实施例选择的是auc曲线下面积。
'lambda':50,该参数指权重的L2正则化项,这个参数用来控制Xgboost的正则化部分,在减少过拟合上有较大的作用。
'eta':0.2,指学习效率,通过减少每一步的权重,可以提高模型的鲁棒性。
参数设置完毕,加载训练数据和测试数据,训练数据和测试数据可以按合适的比例划为,对模型进行训练与测试。
实施例中,还可以对模型进行优化。例如可以根据训练和测试效果,通过修改数据的特征项和模型参数对模型进行优化。
在训练好模型后,将预测数据加载至训练好的模型,获得用电计量设备故障分析结果。实施例中,可以将预测数据加载至训练好的模型,获得用电计量设备故障的概率。优化好的模型已处于最优状态,加载要预测故障的数据,对其分析并得出该用电计量设备故障的概率,最终概率值在0-1之间,数值越大,发生该种故障的概率越大。
在一具体实例中,根据多次现场核实,最终定为概率值在0.85以上属于用电计量设备故障,应该对其进行故障排查和检修;在0.7到0.85应该给予持续关注,可能会有用电计量设备故障;在0.7以下,认为没有用电计量设备故障。对某用电计量设备2017年3月到 9月的数据按此本发明实施例方法进行分析,得出该用电计量设备发生故障的概率如图2 所示。通过现场核实该用电计量设备在6月到9月的确发生了故障,与本发明实施例方法的判断结果一致。
图3为本发明实施例中用电计量设备故障分析方法的一具体实例图,如图3所示,在本例中,先获得源数据,其中包括用户档案数据,电表档案数据,电表计量的电流数据,电表计量的电压数据,电表计量的负荷数据,相关故障事件数据。然后进行数据清洗,包括错误值处理,缺失值处理,数据去重处理。再选取特征项,包括选取:从用户档案数据和电表档案数据提取的特征项,根据电表计量的电流数据、电压数据和负荷数据计算的特征项,通过加载相关故障事件数据获得的特征项。再经建模与训练数据,优化模型,最后利用优化的模型判断出用电计量设备故障的概率。
本发明实施例中还提供了一种用电计量设备故障分析装置,如下面的实施例所述。由于该装置解决问题的原理与用电计量设备故障分析方法相似,因此该装置的实施可以参见用电计量设备故障分析方法的实施,重复之处不再赘述。
图4为本发明实施例中用电计量设备故障分析装置的示意图,如图4所示,该装置可以包括:
数据获得模块401,用于获得与用电计量设备故障相关的源数据;
数据处理模块402,用于对所述源数据进行数据清洗;对数据清洗后的所述源数据进行特征项选取;将选取的特征项制成样本数据,样本数据包括训练数据、测试数据和预测数据;
训练与测试模块403,用于将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试;
故障分析模块404,用于将预测数据加载至训练好的模型,获得用电计量设备故障分析结果。
一个实施例中,所述源数据可以包括以下数据其中之一或任意组合:用户档案数据,电表档案数据,电表计量的电流数据,电表计量的电压数据,电表计量的负荷数据,相关故障事件数据。
一个实施例中,所述数据处理模块可以进一步用于对所述源数据进行如下任意一项或多项数据清洗:错误值处理,缺失值处理,数据去重处理。
一个实施例中,所述数据处理模块402可以进一步用于:
对数据清洗后的所述源数据选取:从用户档案数据和电表档案数据提取的特征项,根据电表计量的电流数据、电压数据和负荷数据计算的特征项,通过加载相关故障事件数据获得的特征项。
一个实施例中,所述从用户档案数据和电表档案数据提取的特征项,可以包括:电表接线方式、用户行业类型及计量方式其中之一或任意组合;
所述根据电表计量的电流数据、电压数据和负荷数据计算的特征项,可以包括:电流电压相关性、电流功率相关性及日电量的趋势其中之一或任意组合;
所述通过加载相关故障事件数据获得的特征项,可以包括:用电计量设备的故障事件状态。
一个实施例中,所述训练数据可以包括故障特征数据和故障结果数据。
一个实施例中,所述训练与测试模块403可以进一步用于在加载训练数据和测试数据前,将Xgboost算法的参数设置为以下参数:
分类器每次迭代的模型为:基于树的模型;
需要被最小化的损失函数为:二分类的逻辑回归;
有效数据的度量方法为:auc曲线下面积;
权重的L2正则化项为:50;
学习效率为:0.2。
一个实施例中,所述训练与测试模块403可以进一步用于:
根据训练和测试效果,通过修改数据的特征项和模型参数对模型进行优化。
一个实施例中,所述故障分析模块404可以进一步用于:
将预测数据加载至训练好的模型,获得用电计量设备故障的概率。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述用电计量设备故障分析方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述用电计量设备故障分析方法的计算机程序。
综上所述,本发明实施例中,获得与用电计量设备故障相关的源数据,对所述源数据进行数据清洗,对数据清洗后的所述源数据进行特征项选取,可以提高用电计量设备故障分析的准确性;将选取的特征项制成样本数据,样本数据包括训练数据、测试数据和预测数据,将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试,将预测数据加载至训练好的模型,获得用电计量设备故障分析结果,由于采用了Xgboost算法建立的机器学习的模型,因此可以提高用电计量设备故障分析的效率和准确性,降低人力资源成本。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (20)
1.一种用电计量设备故障分析方法,其特征在于,包括:
获得与用电计量设备故障相关的源数据;
对所述源数据进行数据清洗;
对数据清洗后的所述源数据进行特征项选取;
将选取的特征项制成样本数据,样本数据包括训练数据、测试数据和预测数据;
将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试;
将预测数据加载至训练好的模型,获得用电计量设备故障分析结果。
2.如权利要求1所述的方法,其特征在于,所述源数据包括以下数据其中之一或任意组合:用户档案数据,电表档案数据,电表计量的电流数据,电表计量的电压数据,电表计量的负荷数据,相关故障事件数据。
3.如权利要求1所述的方法,其特征在于,对所述源数据进行数据清洗,包括对所述源数据进行如下任意一项或多项处理:错误值处理,缺失值处理,数据去重处理。
4.如权利要求2所述的方法,其特征在于,对数据清洗后的所述源数据进行特征项选取,包括:
对数据清洗后的所述源数据选取:从用户档案数据和电表档案数据提取的特征项,根据电表计量的电流数据、电压数据和负荷数据计算的特征项,通过加载相关故障事件数据获得的特征项。
5.如权利要求4所述的方法,其特征在于,所述从用户档案数据和电表档案数据提取的特征项,包括:电表接线方式、用户行业类型及计量方式其中之一或任意组合;
所述根据电表计量的电流数据、电压数据和负荷数据计算的特征项,包括:电流电压相关性、电流功率相关性及日电量的趋势其中之一或任意组合;
所述通过加载相关故障事件数据获得的特征项,包括:用电计量设备的故障事件状态。
6.如权利要求1所述的方法,其特征在于,所述训练数据包括故障特征数据和故障结果数据。
7.如权利要求1至6任一项所述的方法,其特征在于,加载训练数据和测试数据前,进一步包括:将Xgboost算法的参数设置为以下参数:
分类器每次迭代的模型为:基于树的模型;
需要被最小化的损失函数为:二分类的逻辑回归;
有效数据的度量方法为:auc曲线下面积;
权重的L2正则化项为:50;
学习效率为:0.2。
8.如权利要求1所述的方法,其特征在于,进一步包括:
根据训练和测试效果,通过修改数据的特征项和模型参数对模型进行优化。
9.如权利要求1所述的方法,其特征在于,所述将预测数据加载至训练好的模型,获得用电计量设备故障分析结果,包括:
将预测数据加载至训练好的模型,获得用电计量设备故障的概率。
10.一种用电计量设备故障分析装置,其特征在于,包括:
数据获得模块,用于获得与用电计量设备故障相关的源数据;
数据处理模块,用于对所述源数据进行数据清洗;对数据清洗后的所述源数据进行特征项选取;将选取的特征项制成样本数据,样本数据包括训练数据、测试数据和预测数据;
训练与测试模块,用于将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试;
故障分析模块,用于将预测数据加载至训练好的模型,获得用电计量设备故障分析结果。
11.如权利要求10所述的装置,其特征在于,所述源数据包括以下数据其中之一或任意组合:用户档案数据,电表档案数据,电表计量的电流数据,电表计量的电压数据,电表计量的负荷数据,相关故障事件数据。
12.如权利要求10所述的装置,其特征在于,所述数据处理模块进一步用于对所述源数据进行如下任意一项或多项数据清洗:错误值处理,缺失值处理,数据去重处理。
13.如权利要求11所述的装置,其特征在于,所述数据处理模块进一步用于:
对数据清洗后的所述源数据选取:从用户档案数据和电表档案数据提取的特征项,根据电表计量的电流数据、电压数据和负荷数据计算的特征项,通过加载相关故障事件数据获得的特征项。
14.如权利要求13所述的装置,其特征在于,所述从用户档案数据和电表档案数据提取的特征项,包括:电表接线方式、用户行业类型及计量方式其中之一或任意组合;
所述根据电表计量的电流数据、电压数据和负荷数据计算的特征项,包括:电流电压相关性、电流功率相关性及日电量的趋势其中之一或任意组合;
所述通过加载相关故障事件数据获得的特征项,包括:用电计量设备的故障事件状态。
15.如权利要求10所述的装置,其特征在于,所述训练数据包括故障特征数据和故障结果数据。
16.如权利要求10至15任一项所述的装置,其特征在于,所述训练与测试模块进一步用于在加载训练数据和测试数据前,将Xgboost算法的参数设置为以下参数:
分类器每次迭代的模型为:基于树的模型;
需要被最小化的损失函数为:二分类的逻辑回归;
有效数据的度量方法为:auc曲线下面积;
权重的L2正则化项为:50;
学习效率为:0.2。
17.如权利要求10所述的装置,其特征在于,所述训练与测试模块进一步用于:
根据训练和测试效果,通过修改数据的特征项和模型参数对模型进行优化。
18.如权利要求10所述的装置,其特征在于,所述故障分析模块进一步用于:
将预测数据加载至训练好的模型,获得用电计量设备故障的概率。
19.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9任一所述方法。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至9任一所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711136943.7A CN107967485B (zh) | 2017-11-16 | 用电计量设备故障分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711136943.7A CN107967485B (zh) | 2017-11-16 | 用电计量设备故障分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107967485A true CN107967485A (zh) | 2018-04-27 |
CN107967485B CN107967485B (zh) | 2024-05-14 |
Family
ID=
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108663651A (zh) * | 2018-05-04 | 2018-10-16 | 国网上海市电力公司 | 一种基于多源数据融合的智能电能表运行状态评价系统 |
CN108693868A (zh) * | 2018-05-25 | 2018-10-23 | 深圳市轱辘车联数据技术有限公司 | 故障预测模型训练的方法、车辆故障预测的方法及装置 |
CN108710555A (zh) * | 2018-05-23 | 2018-10-26 | 郑州云海信息技术有限公司 | 一种基于监督学习的服务器错误诊断方法 |
CN109446574A (zh) * | 2018-09-26 | 2019-03-08 | 北京国双科技有限公司 | 油气开采监测方法、故障识别模型获得方法及相关设备 |
CN109492783A (zh) * | 2018-11-14 | 2019-03-19 | 中国电力科学研究院有限公司 | 一种基于gbdt的电力计量设备故障风险预测方法 |
CN109523190A (zh) * | 2018-11-29 | 2019-03-26 | 国网河北省电力有限公司电力科学研究院 | 一种电能表的管理方法、管理装置及终端 |
CN109800895A (zh) * | 2019-01-18 | 2019-05-24 | 广东电网有限责任公司 | 一种基于增强现实技术在计量自动化流水线故障预警和维护的方法 |
CN109979122A (zh) * | 2019-02-13 | 2019-07-05 | 中国工商银行股份有限公司 | Atm维护预警方法及系统 |
CN110232415A (zh) * | 2019-06-12 | 2019-09-13 | 中南大学 | 一种基于生物信息特征的列车转向架故障识别方法 |
CN110262465A (zh) * | 2019-07-11 | 2019-09-20 | 电子科技大学 | 一种基于故障码分类的飞控故障诊断方法 |
CN110297207A (zh) * | 2019-07-08 | 2019-10-01 | 国网上海市电力公司 | 智能电表的故障诊断方法、系统及电子装置 |
CN110348641A (zh) * | 2019-07-16 | 2019-10-18 | 珠海格力电器股份有限公司 | 设备电耗预测方法、装置和电量采集装置 |
CN110441725A (zh) * | 2018-05-03 | 2019-11-12 | 国网安徽省电力有限公司电力科学研究院 | 基于自适应神经模糊推理的智能电表故障诊断方法及装置 |
CN110689272A (zh) * | 2019-10-09 | 2020-01-14 | 华北电力大学 | 一种基于流式计算的敏感设备耐受特性实时在线评估方法 |
CN111060755A (zh) * | 2019-11-28 | 2020-04-24 | 北京济松科技有限公司 | 一种电磁干扰诊断方法和装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004072875A (ja) * | 2002-08-05 | 2004-03-04 | Chubu Electric Power Co Inc | 模擬故障電流発生装置および地絡点表示器の点検装置 |
US20090157573A1 (en) * | 2006-01-23 | 2009-06-18 | The Trustees Of Columbia University In The City Of New York | System And Method For Grading Electricity Distribution Network Feeders Susceptible To Impending Failure |
CN103605103A (zh) * | 2013-06-26 | 2014-02-26 | 广东电网公司东莞供电局 | 基于s型曲线函数的电能计量故障智能诊断方法 |
CN104751374A (zh) * | 2015-03-27 | 2015-07-01 | 深圳供电局有限公司 | 一种计量自动化系统无线通信故障预测方法 |
CN106054104A (zh) * | 2016-05-20 | 2016-10-26 | 国网新疆电力公司电力科学研究院 | 一种基于决策树的智能电表故障实时预测方法 |
US20170031329A1 (en) * | 2015-07-31 | 2017-02-02 | Fanuc Corporation | Machine learning method and machine learning device for learning fault conditions, and fault prediction device and fault prediction system including the machine learning device |
CN106707221A (zh) * | 2017-01-05 | 2017-05-24 | 云南电网有限责任公司电力科学研究院 | 一种电能计量装置中传感器故障诊断方法及系统 |
CN107179503A (zh) * | 2017-04-21 | 2017-09-19 | 美林数据技术股份有限公司 | 基于随机森林的风电机组故障智能诊断预警的方法 |
CN107273585A (zh) * | 2017-05-25 | 2017-10-20 | 国网山东省电力公司青岛供电公司 | 一种有载分接开关故障检测方法及装置 |
CN107271829A (zh) * | 2017-05-09 | 2017-10-20 | 安徽继远软件有限公司 | 一种配电设备运行状态分析方法及装置 |
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004072875A (ja) * | 2002-08-05 | 2004-03-04 | Chubu Electric Power Co Inc | 模擬故障電流発生装置および地絡点表示器の点検装置 |
US20090157573A1 (en) * | 2006-01-23 | 2009-06-18 | The Trustees Of Columbia University In The City Of New York | System And Method For Grading Electricity Distribution Network Feeders Susceptible To Impending Failure |
CN103605103A (zh) * | 2013-06-26 | 2014-02-26 | 广东电网公司东莞供电局 | 基于s型曲线函数的电能计量故障智能诊断方法 |
CN104751374A (zh) * | 2015-03-27 | 2015-07-01 | 深圳供电局有限公司 | 一种计量自动化系统无线通信故障预测方法 |
US20170031329A1 (en) * | 2015-07-31 | 2017-02-02 | Fanuc Corporation | Machine learning method and machine learning device for learning fault conditions, and fault prediction device and fault prediction system including the machine learning device |
CN106054104A (zh) * | 2016-05-20 | 2016-10-26 | 国网新疆电力公司电力科学研究院 | 一种基于决策树的智能电表故障实时预测方法 |
CN106707221A (zh) * | 2017-01-05 | 2017-05-24 | 云南电网有限责任公司电力科学研究院 | 一种电能计量装置中传感器故障诊断方法及系统 |
CN107179503A (zh) * | 2017-04-21 | 2017-09-19 | 美林数据技术股份有限公司 | 基于随机森林的风电机组故障智能诊断预警的方法 |
CN107271829A (zh) * | 2017-05-09 | 2017-10-20 | 安徽继远软件有限公司 | 一种配电设备运行状态分析方法及装置 |
CN107273585A (zh) * | 2017-05-25 | 2017-10-20 | 国网山东省电力公司青岛供电公司 | 一种有载分接开关故障检测方法及装置 |
Non-Patent Citations (2)
Title |
---|
谭学清等: "《商务智能》", 武汉大学出版社, pages: 128 - 130 * |
陈通;付峰;王军;陈霜;: "基于CAPSO-BPNN的计量装置运行状态预警方法", 电测与仪表, no. 17 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110441725A (zh) * | 2018-05-03 | 2019-11-12 | 国网安徽省电力有限公司电力科学研究院 | 基于自适应神经模糊推理的智能电表故障诊断方法及装置 |
CN108663651A (zh) * | 2018-05-04 | 2018-10-16 | 国网上海市电力公司 | 一种基于多源数据融合的智能电能表运行状态评价系统 |
CN108710555A (zh) * | 2018-05-23 | 2018-10-26 | 郑州云海信息技术有限公司 | 一种基于监督学习的服务器错误诊断方法 |
CN108693868A (zh) * | 2018-05-25 | 2018-10-23 | 深圳市轱辘车联数据技术有限公司 | 故障预测模型训练的方法、车辆故障预测的方法及装置 |
CN108693868B (zh) * | 2018-05-25 | 2021-06-11 | 深圳市轱辘车联数据技术有限公司 | 故障预测模型训练的方法、车辆故障预测的方法及装置 |
CN109446574A (zh) * | 2018-09-26 | 2019-03-08 | 北京国双科技有限公司 | 油气开采监测方法、故障识别模型获得方法及相关设备 |
CN109446574B (zh) * | 2018-09-26 | 2023-07-07 | 北京国双科技有限公司 | 油气开采监测方法、故障识别模型获得方法及相关设备 |
CN109492783A (zh) * | 2018-11-14 | 2019-03-19 | 中国电力科学研究院有限公司 | 一种基于gbdt的电力计量设备故障风险预测方法 |
CN109492783B (zh) * | 2018-11-14 | 2023-09-15 | 中国电力科学研究院有限公司 | 一种基于gbdt的电力计量设备故障风险预测方法 |
CN109523190A (zh) * | 2018-11-29 | 2019-03-26 | 国网河北省电力有限公司电力科学研究院 | 一种电能表的管理方法、管理装置及终端 |
CN109800895A (zh) * | 2019-01-18 | 2019-05-24 | 广东电网有限责任公司 | 一种基于增强现实技术在计量自动化流水线故障预警和维护的方法 |
CN109979122A (zh) * | 2019-02-13 | 2019-07-05 | 中国工商银行股份有限公司 | Atm维护预警方法及系统 |
CN110232415B (zh) * | 2019-06-12 | 2020-10-30 | 中南大学 | 一种基于生物信息特征的列车转向架故障识别方法 |
CN110232415A (zh) * | 2019-06-12 | 2019-09-13 | 中南大学 | 一种基于生物信息特征的列车转向架故障识别方法 |
CN110297207A (zh) * | 2019-07-08 | 2019-10-01 | 国网上海市电力公司 | 智能电表的故障诊断方法、系统及电子装置 |
CN110262465B (zh) * | 2019-07-11 | 2021-05-14 | 电子科技大学 | 一种基于故障码分类的飞控故障诊断方法 |
CN110262465A (zh) * | 2019-07-11 | 2019-09-20 | 电子科技大学 | 一种基于故障码分类的飞控故障诊断方法 |
CN110348641A (zh) * | 2019-07-16 | 2019-10-18 | 珠海格力电器股份有限公司 | 设备电耗预测方法、装置和电量采集装置 |
CN110689272A (zh) * | 2019-10-09 | 2020-01-14 | 华北电力大学 | 一种基于流式计算的敏感设备耐受特性实时在线评估方法 |
CN111060755A (zh) * | 2019-11-28 | 2020-04-24 | 北京济松科技有限公司 | 一种电磁干扰诊断方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108375715B (zh) | 一种配电网线路故障风险日预测方法及系统 | |
CN103257921B (zh) | 一种基于改进随机森林算法的软件故障预测系统及其方法 | |
CN107358366B (zh) | 一种配电变压器故障风险监测方法及系统 | |
CN102509178B (zh) | 配网设备状态评估系统 | |
CN108052528A (zh) | 一种存储设备时序分类预警方法 | |
CN105677791B (zh) | 用于分析风力发电机组的运行数据的方法和系统 | |
CN107818344A (zh) | 用户行为进行分类和预测的方法和系统 | |
CN106201871A (zh) | 基于代价敏感半监督的软件缺陷预测方法 | |
CN107492043A (zh) | 窃电分析方法及装置 | |
CN110348615B (zh) | 基于蚁群优化支持向量机的电缆线路故障概率预测方法 | |
CN111459700A (zh) | 设备故障的诊断方法、诊断装置、诊断设备及存储介质 | |
CN106803799B (zh) | 一种性能测试方法和装置 | |
CN111259947A (zh) | 一种基于多模态学习的电力系统故障预警方法和系统 | |
CN108683560A (zh) | 一种大数据流处理框架的性能基准测试系统及方法 | |
CN108345544A (zh) | 一种基于复杂网络的软件缺陷分布影响因素分析方法 | |
CN113011530B (zh) | 一种基于多分类器融合的智能电表故障预测方法 | |
CN113010389A (zh) | 一种训练方法、故障预测方法、相关装置及设备 | |
WO2017071369A1 (zh) | 一种预测用户离网的方法和设备 | |
CN115330275B (zh) | 一种退役电池的梯次利用方法及装置 | |
CN111539493A (zh) | 一种告警预测方法、装置、电子设备及存储介质 | |
CN107766500A (zh) | 固定资产卡片的审计方法 | |
CN109194534A (zh) | 面向物联网设备群体的调度与管理方法 | |
CN208224474U (zh) | 用电计量设备故障监控装置 | |
CN112257784A (zh) | 一种基于梯度提升决策树的窃电检测方法 | |
CN111612149A (zh) | 一种基于决策树的主网线路状态检测方法、系统及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |