CN116933197B - 一种基于大数据的用电信息采集系统故障判别方法及系统 - Google Patents
一种基于大数据的用电信息采集系统故障判别方法及系统 Download PDFInfo
- Publication number
- CN116933197B CN116933197B CN202311208967.4A CN202311208967A CN116933197B CN 116933197 B CN116933197 B CN 116933197B CN 202311208967 A CN202311208967 A CN 202311208967A CN 116933197 B CN116933197 B CN 116933197B
- Authority
- CN
- China
- Prior art keywords
- data
- fault
- electricity consumption
- electricity
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 241
- 238000012850 discrimination method Methods 0.000 title claims abstract description 12
- 230000002159 abnormal effect Effects 0.000 claims abstract description 93
- 238000005265 energy consumption Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000000737 periodic effect Effects 0.000 claims abstract description 18
- 238000012300 Sequence Analysis Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 25
- 230000005856 abnormality Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 19
- 230000004927 fusion Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 4
- 238000013461 design Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 238000012847 principal component analysis method Methods 0.000 claims description 3
- 238000013450 outlier detection Methods 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012731 temporal analysis Methods 0.000 description 3
- 238000000700 time series analysis Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于大数据的用电信息采集系统故障判别方法及系统,涉及电力技术领域,该故障判别方法包括以下步骤:建立用电信息采集系统故障异常库,并设定故障异常库中各参数间的对应关系;分别收集商业用电及居民用电的实时用电信息,并对商业用电及居民用电的实时用电信息进行预处理。本发明通过综合异常用电特征数据及能耗趋势特征数据,并根据权重值进行权衡,使得故障预测模型能够更好地反映故障发生的实际情况,通过多项式回归模型分析数据中是否存在较长周期的趋势项,同时使用波束形成法和时间序列分析法分析数据中的周期变化,增强了故障预测模型的准确性和稳定性。
Description
技术领域
本发明涉及电力技术领域,具体来说,涉及一种基于大数据的用电信息采集系统故障判别方法及系统。
背景技术
用电信息采集系统是国家电网公司构建智能电网的重要组成部分和技术支撑,通过采集主站、通信信道、采集设备等软硬件组成的物理链路和信息系统,实现数据采集、数据管理、电能质量数据统计、线损统计分析,及时采集用户用电信息,发现用电异常情况,对电力用户的用电负荷进行监测和控制,为实现阶梯电价、智能费控等营销业务提供了有力支撑。
随着用电信息采集系统建设的逐步完成,采集工作的重点从建设向运维转变,作为智能电网建设的基础,由于其中应用大量传感、通信、自动控制等技术,系统众多、结构复杂、故障模式繁多,运维复杂度较高,对故障诊断提出了较高的要求。
城市用电为了给电力运行带来较大的经济效益,采用分区域分时段的计费模式,不同计费模式下的供电线路的电量采集采用不同的装置是电力经济运行的关键手段,但往往因为数据上传的不及时或者采集的数据不准确导致电力运转决策部门对于用户端的用户需求判断有误,对电力的经济运行带来较大的负面影响,造成电力浪费,并且缺乏有效的诊断技术,对于故障定位提高恶了困难程度,缺乏对整个区域的终端设备状态的系统信息和故障的预测分析能力。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对现有技术的不足,本发明提出一种基于大数据的用电信息采集系统故障判别方法及系统,解决了上述背景技术中提出现有的因为数据上传的不及时或者采集的数据不准确导致电力运转决策部门对于用户端的用户需求判断有误,对电力的经济运行带来较大的负面影响,造成电力浪费,并且缺乏有效的诊断技术,对于故障定位提高恶了困难程度,缺乏对整个区域的终端设备状态的系统信息和故障的预测分析能力的问题。
为实现以上目的,本发明通过以下技术方案予以实现:
根据本发明的一个方面,提供了一种基于大数据的用电信息采集系统故障判别方法,该故障判别方法包括以下步骤:
S1、建立用电信息采集系统故障异常库,并设定故障异常库中各参数间的对应关系;
S2、分别收集商业用电及居民用电的实时用电信息,并对商业用电及居民用电的实时用电信息进行预处理;
S3、将预处理后结果通过数据融合算法整合商业用电数据和居民用电数据,并对整合后的数据进行特征提取,得到异常用电特征数据和能耗趋势特征数据;
S4、将所述异常用电特征数据和所述能耗趋势特征数据划分成若干份数据,利用局部离群因子算法对每份数据进行异常值检测,识别潜在的故障数据,并将故障数据输入至故障异常库进行故障判别;
S5、利用信息增益计算所述异常用电特征数据和所述能耗趋势特征数据的权重值;
S6、基于所述异常用电特征数据、所述能耗趋势特征数据及所述权重值,并利用波束形成法和时间序列分析法构建故障预测模型;
S7、利用所述故障预测模型对下一时刻的故障发生进行预测。
进一步的,所述分别收集商业用电及居民用电的实时用电信息,并对商业用电及居民用电的实时用电信息进行预处理包括以下步骤:
S21、通过智能电表、传感器和监控设备及数据采集系统获取商业用电及居民用电的实时用电信息数据;
其中,所述实时用电信息数据包括:用电量、用电负荷、用电时间分布、用电设备状态及用电波动;
S22、将获取的所述实时用电信息数据的缺失值、异常值和重复数据,并对缺失值、异常值和重复数据进行去噪、滤波及平滑处理;
S23、将所述实时用电信息数据中未处理的数据行进行联结,生成新的数据表,通过外部键值将不同的数据表进行关联,生成完整的数据表,并得到准确数据。
进一步的,所述将预处理后结果通过数据融合算法整合商业用电数据和居民用电数据,并对整合后的数据进行特征提取,得到异常用电特征数据和能耗趋势特征数据包括以下步骤:
S31、利用主成分分析法将所述商业用电数据和所述居民用电数据融合到同一个数据集中;
S32、从数据集中提取商业用电和居民用电的特征,所述特征至少包括不同时间段的用电总量、用电趋势、用电负荷波动性;
S33、根据不同时间段的用电总量、用电趋势,并结合用电设备的额定功率或设计功率,计算各设备的电能消耗指数;
S34、根据不同时间段的用电负荷波动性,并结合用电系统的负荷均衡度和供电能力信息,计算用电系统的负荷平衡指数。
进一步的,所述将所述异常用电特征数据和所述能耗趋势特征数据划分成若干份数据,并利用局部离群因子算法对每份数据进行异常值检测,识别潜在的故障数据包括以下步骤:
S41、获取每份数据的数据点;
S42、计算每份数据的数据点的K近邻距离和局部可达密度,通过比较每份数据的数据点的局部可达密度与其K近邻的局部可达密度,计算局部离群因子值;
S43、设定局部离群因子值的阈值,若某每份数据的数据点的局部离群因子值大于设定的阈值,将其视为异常值,得到潜在的故障数据。
进一步的,所述计算每份数据的数据点的K近邻距离和局部可达密度,通过比较每份数据的数据点的局部可达密度与其K近邻的局部可达密度,计算局部离群因子值包括以下步骤:
S421、通过提取每份数据的特征,并构建特征矩阵,其中,每行代表一个每份数据点,每列代表一个特征值;
S422、使用欧氏距离计算每份数据的数据点之间的距离,以量化每份数据的数据点之间的相似性;
S423、选择最优的K值,对于每份数据的数据点,找到其距离最近的K个邻居,并记录K个邻居在特征矩阵的位置;
S424、对于每份数据的数据点和它的某个K近邻,分别计算可达距离、局部可达密度及局部离群因子值;
S425、根据可达距离、局部可达密度及局部离群因子值得出每份数据的数据点周围邻居的密集程度,评估每份数据的数据点的异常程度,并按照局部离群因子值对每份数据的数据点进行排序。
进一步的,所述对于每份数据的数据点和它的某个K近邻,分别计算可达距离、局部可达密度及局部离群因子值包括以下步骤:
S4241、对于每份数据的数据点和每份数据的数据点一个K近邻,计算每份数据的数据点与每份数据的数据点一个K近邻之间的实际距离和每份数据的数据点一个K近邻与其所有K近邻之间的最大距离之间的较大值,得出可达距离;
S4242、利用K值除以每份数据的数据点,得到其K近邻的可达距离之和,得出局部可达密度;
S4243、为每份数据的数据点的K近邻的局部可达密度之和除以每份数据的数据点自身的局部可达密度再除以K值,得出局部离群因子值。
进一步的,所述利用信息增益计算所述异常用电特征数据和所述能耗趋势特征数据的权重值包括以下步骤:
S51、收集异常用电特征数据和能耗趋势特征数据的样本数据集;
S52、根据所述样本数据集中的目标变量计算其信息熵,衡量目标变量的不确定性;
S53、对于每个特征,分别计算其与目标变量之间的信息增益;
S54、将信息增益值作为特征的权重值,并对权重值进行归一化处理;
S55、分析归一化后的权重值,了解异常用电特征数据和能耗趋势特征数据的重要程度。
进一步的,所述基于所述异常用电特征数据、所述能耗趋势特征数据及所述权重值,并利用波束形成法和时间序列分析法构建故障预测模型包括以下步骤:
S61、采用多项式回归模型分析所述异常用电特征数据及所述能耗趋势特征数据中是否存在较长周期的趋势项;
S62、若存在,则去除较长周期的趋势项;
S63、若不存在,继续分析所述异常用电特征数据及所述能耗趋势特征数据中的周期变化;
S64、根据分析的结果,对去除趋势项后的所述异常用电特征数据及所述能耗趋势特征数据执行波束形成法,得到各频率分量的振幅和相位;
其中,振幅表示某一频率下的用电变化量,相位表示变化的时滞特性;
S65、使用显著性检验判断各个频率分量是否显著,提取显著的周期项,以构建周期项模型;
S66、消除趋势项和周期项后的残差视为随机变化,并构建残差预测模型;
S67、将多项式回归模型、周期项模型和残差预测模型进行叠加,得到故障预测模型。
进一步的,所述利用所述故障预测模型对下一时刻的故障发生进行预测包括以下步骤:
S71、通过所述故障预测模型预测下一时刻所述异常用电特征数据及所述能耗趋势特征数据;
S72、将预测的所述异常用电特征数据及所述能耗趋势特征数据与所述权重值进行相应的加权处理,得到故障发生的综合预测输出。
根据本发明的另一个方面,还提供了一种基于大数据的用电信息采集系统故障判别系统,该系统包括:建立故障异常库模块、用电信息收集和处理模块、特征提取模块、故障判别模块、权重计算模块、故障预测模型构建模块及故障预测模型执行模块;
其中,所述建立故障异常库模块,用于建立用电信息采集系统故障异常库,并设定故障异常库中各参数间的对应关系;
所述用电信息收集和处理模块,用于分别收集商业用电及居民用电的实时用电信息,并对商业用电及居民用电的实时用电信息进行预处理;
所述特征提取模块,用于将预处理后结果通过数据融合算法整合商业用电数据和居民用电数据,并对整合后的数据进行特征提取,得到异常用电特征数据和能耗趋势特征数据;
所述故障判别模块,用于将所述异常用电特征数据和所述能耗趋势特征数据划分成若干份数据,利用局部离群因子算法对每份数据进行异常值检测,识别潜在的故障数据,并将故障数据输入至故障异常库进行故障判别;
所述权重计算模块,用于利用信息增益计算所述异常用电特征数据和所述能耗趋势特征数据的权重值;
所述故障预测模型构建模块,用于基于所述异常用电特征数据、所述能耗趋势特征数据及所述权重值,并利用波束形成法和时间序列分析法构建故障预测模型;
所述故障预测模型执行模块,用于利用所述故障预测模型对下一时刻的故障发生进行预测。
本发明的有益效果为:
1、本发明通过综合异常用电特征数据及能耗趋势特征数据,并根据权重值进行权衡,使得故障预测模型能够更好地反映故障发生的实际情况,通过多项式回归模型分析数据中是否存在较长周期的趋势项,同时使用波束形成法和时间序列分析法分析数据中的周期变化,增强了故障预测模型的准确性和稳定性。
2、本发明通过划分成若干份数据并应用局部离群因子算法,可以更精细地检测和识别潜在的故障数据,使得可以准确定位和识别出故障数据,从而提供更及时的预警和故障处理的同时,使用局部离群因子算法进行异常值检测时,可以避免将正常的数据点错误地标记为异常值,进而可以提高故障数据的发现和识别能力,减少误报率,并帮助进行精细化的故障分析和处理,进而提升用电信息采集系统的可靠性和效率。
3、本发明通过建立故障异常库,使得可以记录和存储各种已知的故障模式和异常情况,当新的故障数据进入用电信息采集系统时,可以与故障异常库中的参数对应关系进行比对和匹配,从而实现实时的故障识别和预警功能,从而有助于及时发现和解决潜在的故障问题,并且便于维护人员可以快速查找和理解已记录的故障模式和对应的参数关系,从而更加高效地进行故障排查和维修,进而提高用电信息采集系统的可靠性和稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种基于大数据的用电信息采集系统故障判别方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。此外,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性。
根据本发明的实施例,提供了一种基于大数据的用电信息采集系统故障判别方法及系统。
现结合附图和具体实施方式对本发明进一步说明,如图1所示,根据本发明的一个实施例,提供了一种基于大数据的用电信息采集系统故障判别方法,该故障判别方法包括以下步骤:
S1、建立用电信息采集系统故障异常库,并设定故障异常库中各参数间的对应关系;
具体的,参数包括异常现象、异常原因、诊断方法和修复方案;
S2、分别收集商业用电及居民用电的实时用电信息,并对商业用电及居民用电的实时用电信息进行预处理;
S3、将预处理后结果通过数据融合算法整合商业用电数据和居民用电数据,并对整合后的数据进行特征提取,得到异常用电特征数据和能耗趋势特征数据;
具体的,异常用电特征数据包括以下几个方面:
异常波动:用电量或用电功率的波动幅度,反映用电的不稳定性;
异常峰值:用电量或用电功率的异常高峰值,可能表示某些设备的异常运行或负荷过大;
常频谱:用电量或用电功率在不同频率上的能量分布,可以用于检测特定频率上的异常变化;
异常时段:用电量或用电功率在特定时间段内的异常变化,如突然的用电量增加或减少。
具体的,能耗趋势特征数据包括以下几个方面:
周期性:用电量或用电功率的周期性变化,如每天、每周或每年的周期性变化;
增长趋势:用电量或用电功率随时间逐渐增加或减少的趋势;
季节性:用电量或用电功率在不同季节之间的变化模式,如夏季用电量高于冬季;
变化率:用电量或用电功率的变化速率,表示用电增长或减少的速度。
S4、将所述异常用电特征数据和所述能耗趋势特征数据划分成若干份数据,利用局部离群因子算法对每份数据进行异常值检测,识别潜在的故障数据,并将故障数据输入至故障异常库进行故障判别;
S5、利用信息增益计算所述异常用电特征数据和所述能耗趋势特征数据的权重值;
S6、基于所述异常用电特征数据、所述能耗趋势特征数据及所述权重值,并利用波束形成法和时间序列分析法构建故障预测模型;
S7、利用所述故障预测模型对下一时刻的故障发生进行预测。
在一个实施例中,所述分别收集商业用电及居民用电的实时用电信息,并对商业用电及居民用电的实时用电信息进行预处理包括以下步骤:
S21、通过智能电表、传感器和监控设备及数据采集系统获取商业用电及居民用电的实时用电信息数据;
其中,所述实时用电信息数据包括:用电量、用电负荷、用电时间分布、用电设备状态及用电波动;
具体的,实时用电信息数据还包括以下几个方面:
用电量:记录商业用电和居民用电的实时用电量,可以是整体用电量或细分为不同电器设备或用途的用电量;
用电功率:记录商业用电和居民用电的实时用电功率;
用电时段:记录商业用电和居民用电的实时用电时段,即用电活跃的时间段;
用电模式:记录商业用电和居民用电的实时用电模式,即用电行为的模式和规律;
用电设备:记录商业用电和居民用电的实时用电设备信息,可以收集各个用电设备的用电量、用电功率等信息;
用电负荷曲线:记录商业用电和居民用电的实时用电负荷曲线,即用电负荷随时间的变化曲线;
异常用电:记录商业用电和居民用电的实时异常用电情况,如突发的用电波动、异常的用电模式等。
其中,所述实时用电信息数据包括:用电量、用电负荷、用电时间分布、用电设备状态及用电波动;
S22、将获取的所述实时用电信息数据的缺失值、异常值和重复数据,并对缺失值、异常值和重复数据进行去噪、滤波及平滑处理;
S23、将所述实时用电信息数据中未处理的数据行进行联结,生成新的数据表,通过外部键值将不同的数据表进行关联,生成完整的数据表,并得到准确数据。
具体的,得到准确数据包括以下步骤:
确定不同数据集之间的外键关系;
根据需要将不同数据表中的数据行相互联结,创建新的数据表,并通过指定的外部键值进行关联;
通过SQL语句中的JOIN操作符,将需要联结的数据表连接在一起;
在进行联结时,确保数据的完整性约束得到满足;
完成联结后,插入测试数据检查联结结果是否正确,确保能够正确地被识别和关联,并得到准确数据集。
在一个实施例中,所述将预处理后结果通过数据融合算法整合商业用电数据和居民用电数据,并对整合后的数据进行特征提取,得到异常用电特征数据和能耗趋势特征数据包括以下步骤:
S31、利用主成分分析法将所述商业用电数据和所述居民用电数据融合到同一个数据集中;
S32、从数据集中提取商业用电和居民用电的特征,所述特征至少包括不同时间段的用电总量、用电趋势、用电负荷波动性;
S33、根据不同时间段的用电总量、用电趋势,并结合用电设备的额定功率或设计功率,计算各设备的电能消耗指数;
S34、根据不同时间段的用电负荷波动性,并结合用电系统的负荷均衡度和供电能力信息,计算用电系统的负荷平衡指数。
在一个实施例中,所述将所述异常用电特征数据和所述能耗趋势特征数据划分成若干份数据,并利用局部离群因子算法对每份数据进行异常值检测,识别潜在的故障数据包括以下步骤:
S41、获取每份数据的数据点;
S42、计算每份数据的数据点的K近邻距离和局部可达密度,通过比较每份数据的数据点的局部可达密度与其K近邻的局部可达密度,计算局部离群因子值;
S43、设定局部离群因子值的阈值,若某每份数据的数据点的局部离群因子值大于设定的阈值,将其视为异常值,得到潜在的故障数据。
在一个实施例中,所述计算每份数据的数据点的K近邻距离和局部可达密度,通过比较每份数据的数据点的局部可达密度与其K近邻的局部可达密度,计算局部离群因子值包括以下步骤:
S421、通过提取每份数据的特征,并构建特征矩阵,其中,每行代表一个每份数据点,每列代表一个特征值;
S422、使用欧氏距离计算每份数据的数据点之间的距离,以量化每份数据的数据点之间的相似性;
S423、选择最优的K值,对于每份数据的数据点,找到其距离最近的K个邻居,并记录K个邻居在特征矩阵的位置;
S424、对于每份数据的数据点和它的某个K近邻,分别计算可达距离、局部可达密度及局部离群因子值;
S425、根据可达距离、局部可达密度及局部离群因子值得出每份数据的数据点周围邻居的密集程度,评估每份数据的数据点的异常程度,并按照局部离群因子值对每份数据的数据点进行排序。
在一个实施例中,所述对于每份数据的数据点和它的某个K近邻,分别计算可达距离、局部可达密度及局部离群因子值包括以下步骤:
S4241、对于每份数据的数据点和每份数据的数据点一个K近邻,计算每份数据的数据点与每份数据的数据点一个K近邻之间的实际距离和每份数据的数据点一个K近邻与其所有K近邻之间的最大距离之间的较大值,得出可达距离;
S4242、利用K值除以每份数据的数据点,得到其K近邻的可达距离之和,得出局部可达密度;
S4243、为每份数据的数据点的K近邻的局部可达密度之和除以每份数据的数据点自身的局部可达密度再除以K值,得出局部离群因子值。
具体的,局部离群因子算法(Local Outlier Factor,LOF算法)是一种基于密度的异常检测算法,其主要思想是通过比较数据点周围邻居的密集程度,来评估该数据点是否为异常值。
在一个实施例中,所述利用信息增益计算所述异常用电特征数据和所述能耗趋势特征数据的权重值包括以下步骤:
S51、收集异常用电特征数据和能耗趋势特征数据的样本数据集;
S52、根据所述样本数据集中的目标变量计算其信息熵,衡量目标变量的不确定性;
具体的,目标变量指的是用于判断用电采集系统是否故障的变量。
S53、对于每个特征,分别计算其与目标变量之间的信息增益;
S54、将信息增益值作为特征的权重值,并对权重值进行归一化处理;
具体的,归一化处理(Normalization):归一化处理是将数据的量纲统一,使不同数据之间具有可比性,对预测结果进行归一化处理,有助于消除数据量纲的影响,便于后续的加权处理和求和计算。
S55、分析归一化后的权重值,了解异常用电特征数据和能耗趋势特征数据的重要程度。
在一个实施例中,所述基于所述异常用电特征数据、所述能耗趋势特征数据及所述权重值,并利用波束形成法和时间序列分析法构建故障预测模型包括以下步骤:
S61、采用多项式回归模型分析所述异常用电特征数据及所述能耗趋势特征数据中是否存在较长周期的趋势项;
S62、若存在,则去除较长周期的趋势项;
S63、若不存在,继续分析所述异常用电特征数据及所述能耗趋势特征数据中的周期变化;
S64、根据分析的结果,对去除趋势项后的所述异常用电特征数据及所述能耗趋势特征数据执行波束形成法,得到各频率分量的振幅和相位;
其中,振幅表示某一频率下的用电变化量,相位表示变化的时滞特性;
S65、使用显著性检验判断各个频率分量是否显著,提取显著的周期项,以构建周期项模型;
S66、消除趋势项和周期项后的残差视为随机变化,并构建残差预测模型;
S67、将多项式回归模型、周期项模型和残差预测模型进行叠加,得到故障预测模型。
具体的,显著性检验:显著性检验是一种统计学方法,用于检验观察到的数据与某一假设之间是否存在显著差异。在时间序列分析中,显著性检验常用于判断数据中的周期性成分是否具有统计意义。显著性检验的结果通常用p值表示,p值越小,表明观察到的数据与假设之间的差异越显著。
周期项模型:周期项模型主要用于描述时间序列数据中的周期性成分。在用电信息采集系统故障预测中,周期项模型可以帮助捕捉故障发生在一天内、一周内等不同时间尺度上的周期性变化。构建周期项模型的方法包括傅里叶分析、周期回归等。
消除趋势项和周期项:在时间序列分析中,数据通常可以分解为趋势项、周期项和随机变化(残差)。通过消除趋势项和周期项,可以将数据中的规律性成分剔除,从而更好地关注随机变化。消除趋势项和周期项的方法包括差分、滤波等。
残差预测模型:残差预测模型用于描述时间序列数据中的随机变化(残差)。在消除趋势项和周期项后,残差被视为随机变化,可以通过构建残差预测模型来估计其下一时刻的波动。常用的残差预测模型包括自回归移动平均模型(ARIMA)、指数平滑模型(ETS)等。
在一个实施例中,所述利用所述故障预测模型对下一时刻的故障发生进行预测包括以下步骤:
S71、通过所述故障预测模型预测下一时刻所述异常用电特征数据及所述能耗趋势特征数据;
S72、将预测的所述异常用电特征数据及所述能耗趋势特征数据与所述权重值进行相应的加权处理,得到故障发生的综合预测输出。
根据本发明的另一个实施例,还提供了一种基于大数据的用电信息采集系统故障判别系统,该系统包括:建立故障异常库模块、用电信息收集和处理模块、特征提取模块、故障判别模块、权重计算模块、故障预测模型构建模块及故障预测模型执行模块;
其中,所述建立故障异常库模块,用于建立用电信息采集系统故障异常库,并设定故障异常库中各参数间的对应关系;
所述用电信息收集和处理模块,用于分别收集商业用电及居民用电的实时用电信息,并对商业用电及居民用电的实时用电信息进行预处理;
所述特征提取模块,用于将预处理后结果通过数据融合算法整合商业用电数据和居民用电数据,并对整合后的数据进行特征提取,得到异常用电特征数据和能耗趋势特征数据;
所述故障判别模块,用于将所述异常用电特征数据和所述能耗趋势特征数据划分成若干份数据,利用局部离群因子算法对每份数据进行异常值检测,识别潜在的故障数据,并将故障数据输入至故障异常库进行故障判别;
所述权重计算模块,用于利用信息增益计算所述异常用电特征数据和所述能耗趋势特征数据的权重值;
所述故障预测模型构建模块,用于基于所述异常用电特征数据、所述能耗趋势特征数据及所述权重值,并利用波束形成法和时间序列分析法构建故障预测模型;
所述故障预测模型执行模块,用于利用所述故障预测模型对下一时刻的故障发生进行预测。
综上所述,借助于本发明的上述技术方案,本发明通过划分成若干份数据并应用局部离群因子算法,可以更精细地检测和识别潜在的故障数据,使得可以准确定位和识别出故障数据,从而提供更及时的预警和故障处理的同时,使用局部离群因子算法进行异常值检测时,可以避免将正常的数据点错误地标记为异常值,进而可以提高故障数据的发现和识别能力,减少误报率,并帮助进行精细化的故障分析和处理,进而提升用电信息采集系统的可靠性和效率。本发明通过建立故障异常库,使得可以记录和存储各种已知的故障模式和异常情况,当新的故障数据进入用电信息采集系统时,可以与故障异常库中的参数对应关系进行比对和匹配,从而实现实时的故障识别和预警功能,从而有助于及时发现和解决潜在的故障问题,并且便于维护人员可以快速查找和理解已记录的故障模式和对应的参数关系,从而更加高效地进行故障排查和维修,进而提高用电信息采集系统的可靠性和稳定性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于大数据的用电信息采集系统故障判别方法,其特征在于,该故障判别方法包括以下步骤:
S1、建立用电信息采集系统故障异常库,并设定故障异常库中各参数间的对应关系;
S2、分别收集商业用电及居民用电的实时用电信息,并对商业用电及居民用电的实时用电信息进行预处理;
S3、将预处理后结果通过数据融合算法整合商业用电数据和居民用电数据,并对整合后的数据进行特征提取,得到异常用电特征数据和能耗趋势特征数据;
S4、将所述异常用电特征数据和所述能耗趋势特征数据划分成若干份数据,利用局部离群因子算法对每份数据进行异常值检测,识别潜在的故障数据,并将故障数据输入至故障异常库进行故障判别;
S5、利用信息增益计算所述异常用电特征数据和所述能耗趋势特征数据的权重值;
S6、基于所述异常用电特征数据、所述能耗趋势特征数据及所述权重值,并利用波束形成法和时间序列分析法构建故障预测模型;
所述基于所述异常用电特征数据、所述能耗趋势特征数据及所述权重值,并利用波束形成法和时间序列分析法构建故障预测模型包括以下步骤:
S61、采用多项式回归模型分析所述异常用电特征数据及所述能耗趋势特征数据中是否存在较长周期的趋势项;
S62、若存在,则去除较长周期的趋势项;
S63、若不存在,继续分析所述异常用电特征数据及所述能耗趋势特征数据中的周期变化;
S64、根据分析的结果,对去除趋势项后的所述异常用电特征数据及所述能耗趋势特征数据执行波束形成法,得到各频率分量的振幅和相位;
其中,振幅表示某一频率下的用电变化量,相位表示变化的时滞特性;
S65、使用显著性检验判断各个频率分量是否显著,提取显著的周期项,以构建周期项模型;
S66、消除趋势项和周期项后的残差视为随机变化,并构建残差预测模型;
S67、将多项式回归模型、周期项模型和残差预测模型进行叠加,得到故障预测模型;S7、利用所述故障预测模型对下一时刻的故障发生进行预测。
2.根据权利要求1所述的一种基于大数据的用电信息采集系统故障判别方法,其特征在于,所述分别收集商业用电及居民用电的实时用电信息,并对商业用电及居民用电的实时用电信息进行预处理包括以下步骤:
S21、通过智能电表、传感器和监控设备及数据采集系统获取商业用电及居民用电的实时用电信息数据;
S22、获取所述实时用电信息数据的缺失值、异常值和重复数据,并对缺失值、异常值和重复数据进行去噪、滤波及平滑处理;
S23、将所述实时用电信息数据中未处理的数据行进行联结,生成新的数据表,通过外部键值将不同的数据表进行关联,生成完整的数据表,并得到准确数据。
3.根据权利要求1所述的一种基于大数据的用电信息采集系统故障判别方法,其特征在于,所述将预处理后结果通过数据融合算法整合商业用电数据和居民用电数据,并对整合后的数据进行特征提取,得到异常用电特征数据和能耗趋势特征数据包括以下步骤:
S31、利用主成分分析法将所述商业用电数据和所述居民用电数据融合到同一个数据集中;
S32、从数据集中提取商业用电和居民用电的特征,所述特征至少包括不同时间段的用电总量、用电趋势、用电负荷波动性;
S33、根据不同时间段的用电总量、用电趋势,并结合用电设备的额定功率或设计功率,计算各设备的电能消耗指数;
S34、根据不同时间段的用电负荷波动性,并结合用电系统的负荷均衡度和供电能力信息,计算用电系统的负荷平衡指数。
4.根据权利要求1所述的一种基于大数据的用电信息采集系统故障判别方法,其特征在于,所述将所述异常用电特征数据和所述能耗趋势特征数据划分成若干份数据,并利用局部离群因子算法对每份数据进行异常值检测,识别潜在的故障数据包括以下步骤:
S41、获取每份数据的数据点;
S42、计算每份数据的数据点的K近邻距离和局部可达密度,通过比较每份数据的数据点的局部可达密度与其K近邻的局部可达密度,计算局部离群因子值;
S43、设定局部离群因子值的阈值,若某份数据的数据点的局部离群因子值大于设定的阈值,将其视为异常值,得到潜在的故障数据。
5.根据权利要求4所述的一种基于大数据的用电信息采集系统故障判别方法,其特征在于,所述计算每份数据的数据点的K近邻距离和局部可达密度,通过比较每份数据的数据点的局部可达密度与其K近邻的局部可达密度,计算局部离群因子值包括以下步骤:
S421、通过提取每份数据的特征,并构建特征矩阵,其中,每行代表一个每份数据点,每列代表一个特征值;
S422、使用欧氏距离计算每份数据的数据点之间的距离,以量化每份数据的数据点之间的相似性;
S423、选择最优的K值,对于每份数据的数据点,找到其距离最近的K个邻居,并记录K个邻居在特征矩阵的位置;
S424、对于每份数据的数据点和它的某个K近邻,分别计算可达距离、局部可达密度及局部离群因子值;
S425、根据可达距离、局部可达密度及局部离群因子值得出每份数据的数据点周围邻居的密集程度,评估每份数据的数据点的异常程度,并按照局部离群因子值对每份数据的数据点进行排序。
6.根据权利要求5所述的一种基于大数据的用电信息采集系统故障判别方法,其特征在于,所述对于每份数据的数据点和它的某个K近邻,分别计算可达距离、局部可达密度及局部离群因子值包括以下步骤:
S4241、对于每份数据的数据点和每份数据的数据点一个K近邻,计算每份数据的数据点与每份数据的数据点一个K近邻之间的实际距离和每份数据的数据点一个K近邻与其所有K近邻之间的最大距离之间的较大值,得出可达距离;
S4242、利用K值除以每份数据的数据点,得到其K近邻的可达距离之和,得出局部可达密度;
S4243、每份数据的数据点的K近邻的局部可达密度之和除以每份数据的数据点自身的局部可达密度再除以K值,得出局部离群因子值。
7.根据权利要求1所述的一种基于大数据的用电信息采集系统故障判别方法,其特征在于,所述利用信息增益计算所述异常用电特征数据和所述能耗趋势特征数据的权重值包括以下步骤:
S51、收集异常用电特征数据和能耗趋势特征数据的样本数据集;
S52、根据所述样本数据集中的目标变量计算其信息熵,衡量目标变量的不确定性;
S53、对于每个特征,分别计算其与目标变量之间的信息增益;
S54、将信息增益值作为特征的权重值,并对权重值进行归一化处理;
S55、分析归一化后的权重值,了解异常用电特征数据和能耗趋势特征数据的重要程度。
8.根据权利要求1所述的一种基于大数据的用电信息采集系统故障判别方法,其特征在于,所述利用所述故障预测模型对下一时刻的故障发生进行预测包括以下步骤:
S71、通过所述故障预测模型预测下一时刻所述异常用电特征数据及所述能耗趋势特征数据;
S72、将预测的所述异常用电特征数据及所述能耗趋势特征数据与所述权重值进行相应的加权处理,得到故障发生的综合预测输出。
9.一种基于大数据的用电信息采集系统故障判别系统,用于实现权利要求1-8中任一项所述的基于大数据的用电信息采集系统故障判别方法,其特征在于,该系统包括:建立故障异常库模块、用电信息收集和处理模块、特征提取模块、故障判别模块、权重计算模块、故障预测模型构建模块及故障预测模型执行模块;
其中,所述建立故障异常库模块,用于建立用电信息采集系统故障异常库,并设定故障异常库中各参数间的对应关系;
所述用电信息收集和处理模块,用于分别收集商业用电及居民用电的实时用电信息,并对商业用电及居民用电的实时用电信息进行预处理;
所述特征提取模块,用于将预处理后结果通过数据融合算法整合商业用电数据和居民用电数据,并对整合后的数据进行特征提取,得到异常用电特征数据和能耗趋势特征数据;
所述故障判别模块,用于将所述异常用电特征数据和所述能耗趋势特征数据划分成若干份数据,利用局部离群因子算法对每份数据进行异常值检测,识别潜在的故障数据,并将故障数据输入至故障异常库进行故障判别;
所述权重计算模块,用于利用信息增益计算所述异常用电特征数据和所述能耗趋势特征数据的权重值;
所述故障预测模型构建模块,用于基于所述异常用电特征数据、所述能耗趋势特征数据及所述权重值,并利用波束形成法和时间序列分析法构建故障预测模型;
所述故障预测模型执行模块,用于利用所述故障预测模型对下一时刻的故障发生进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311208967.4A CN116933197B (zh) | 2023-09-19 | 2023-09-19 | 一种基于大数据的用电信息采集系统故障判别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311208967.4A CN116933197B (zh) | 2023-09-19 | 2023-09-19 | 一种基于大数据的用电信息采集系统故障判别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116933197A CN116933197A (zh) | 2023-10-24 |
CN116933197B true CN116933197B (zh) | 2023-12-08 |
Family
ID=88384767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311208967.4A Active CN116933197B (zh) | 2023-09-19 | 2023-09-19 | 一种基于大数据的用电信息采集系统故障判别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116933197B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117172620B (zh) * | 2023-11-02 | 2023-12-26 | 江苏全天软件有限公司 | 一种基于参数化分析的建筑光伏潜力评估方法及系统 |
CN117251698B (zh) * | 2023-11-17 | 2024-01-19 | 北京德众国良环保科技有限公司 | 一种基于区块链的饮食业油烟净化在线监控方法及系统 |
CN117851787B (zh) * | 2024-03-01 | 2024-07-26 | 江苏森讯达智能科技有限公司 | 一种卫浴产品智能交互控制方法及系统 |
CN118199049B (zh) * | 2024-03-28 | 2024-09-20 | 郑州英高克通信技术有限公司 | 一种基于用户需求的电网智能调度方法及系统 |
CN118332291B (zh) * | 2024-06-12 | 2024-08-23 | 中国人民解放军海军航空大学 | 一种飞行器多传感器数据故障预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007225566A (ja) * | 2006-02-27 | 2007-09-06 | Digital Electronics Corp | 異常検出装置 |
JP2015036962A (ja) * | 2013-08-16 | 2015-02-23 | 富士ゼロックス株式会社 | 処置判定装置、処置判定システム、処置判定プログラム及び処置判定方法 |
CN110956281A (zh) * | 2019-10-29 | 2020-04-03 | 广东电网有限责任公司 | 一种基于Log分析的电力设备异常检测报警系统 |
WO2020140560A1 (zh) * | 2019-05-31 | 2020-07-09 | 南京航空航天大学 | 一种生产物流输送装备故障预警方法 |
CN114676749A (zh) * | 2022-02-25 | 2022-06-28 | 云南电网有限责任公司 | 一种基于数据挖掘的配电网运行数据异常判定方法 |
CN116226770A (zh) * | 2023-01-10 | 2023-06-06 | 中国人民解放军国防科技大学 | 一种时间序列数据异常检测方法及装置 |
-
2023
- 2023-09-19 CN CN202311208967.4A patent/CN116933197B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007225566A (ja) * | 2006-02-27 | 2007-09-06 | Digital Electronics Corp | 異常検出装置 |
JP2015036962A (ja) * | 2013-08-16 | 2015-02-23 | 富士ゼロックス株式会社 | 処置判定装置、処置判定システム、処置判定プログラム及び処置判定方法 |
WO2020140560A1 (zh) * | 2019-05-31 | 2020-07-09 | 南京航空航天大学 | 一种生产物流输送装备故障预警方法 |
CN110956281A (zh) * | 2019-10-29 | 2020-04-03 | 广东电网有限责任公司 | 一种基于Log分析的电力设备异常检测报警系统 |
CN114676749A (zh) * | 2022-02-25 | 2022-06-28 | 云南电网有限责任公司 | 一种基于数据挖掘的配电网运行数据异常判定方法 |
CN116226770A (zh) * | 2023-01-10 | 2023-06-06 | 中国人民解放军国防科技大学 | 一种时间序列数据异常检测方法及装置 |
Non-Patent Citations (2)
Title |
---|
Co-attention learning cross time and frequency domains for fault diagnosis;Ping Luo等;Cognitive Robotics;第3卷;34-44 * |
基于局部权重角度离群算法的球磨机故障诊断;曲星宇;曾鹏;李俊鹏;;信息与控制(第04期);109-114 * |
Also Published As
Publication number | Publication date |
---|---|
CN116933197A (zh) | 2023-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116933197B (zh) | 一种基于大数据的用电信息采集系统故障判别方法及系统 | |
CN106780121B (zh) | 一种基于用电负荷模式分析的用电异常识别方法 | |
WO2018028005A1 (zh) | 一种大型光伏电站中电池面板的故障检测算法 | |
CN111353911A (zh) | 电力设备运维方法、系统、设备和存储介质 | |
CN117172620B (zh) | 一种基于参数化分析的建筑光伏潜力评估方法及系统 | |
CN117554821A (zh) | 基于深度学习网络的储能电池在线监测管理方法及系统 | |
CN116976707B (zh) | 基于用电信息采集的用户用电数据异常分析方法及系统 | |
CN117808456B (zh) | 一种基于智慧运营管理的设备故障预警方法及装置 | |
CN112346893A (zh) | 故障预测方法、装置、终端及存储介质 | |
CN117308498A (zh) | 一种基于云存储的冷库温度智能监测管理方法及系统 | |
CN110968703B (zh) | 基于lstm端到端抽取算法的异常计量点知识库构建方法及系统 | |
CN117674128A (zh) | 基于电力调度系统自动化故障排除方法 | |
CN117331790A (zh) | 一种用于数据中心的机房故障检测方法及装置 | |
CN115037603A (zh) | 用电信息采集设备的诊断评估方法、装置及系统 | |
CN110956281A (zh) | 一种基于Log分析的电力设备异常检测报警系统 | |
Fu et al. | Trimming outliers using trees: winning solution of the large-scale energy anomaly detection (LEAD) competition | |
Dong et al. | Fault diagnosis and classification in photovoltaic systems using scada data | |
CN117375231A (zh) | 一种基于电网数据节点的统计方法及数据处理系统 | |
CN111506636A (zh) | 一种基于自回归和近邻算法的居民用电行为分析的系统及方法 | |
CN104714205A (zh) | 电表错置侦测系统及其方法 | |
CN111781554A (zh) | 基于四象限电能量数据的计量装置故障判定方法及系统 | |
CN109474069B (zh) | 一种分布式发电站状态监测方法 | |
CN118246695B (zh) | 一种光伏新能源运维调度系统 | |
CN117808157B (zh) | 基于智能识别的未报备停电行为预测分析系统 | |
CN117272844B (zh) | 配电盘工作寿命的预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |