CN117649015A - 电网时序数据质量评估方法、系统、设备和存储介质 - Google Patents
电网时序数据质量评估方法、系统、设备和存储介质 Download PDFInfo
- Publication number
- CN117649015A CN117649015A CN202311565431.8A CN202311565431A CN117649015A CN 117649015 A CN117649015 A CN 117649015A CN 202311565431 A CN202311565431 A CN 202311565431A CN 117649015 A CN117649015 A CN 117649015A
- Authority
- CN
- China
- Prior art keywords
- power grid
- time sequence
- data
- sequence data
- grid time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001303 quality assessment method Methods 0.000 title claims abstract description 12
- 238000003860 storage Methods 0.000 title claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims description 13
- 238000013441 quality evaluation Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电网时序数据质量评估方法、系统、设备及存储介质,根据电网时序数据的预测熵获取电网时序数据的可预测性,根据电网时序数据的可预测性对电网时序数据质量进行评估。本发明基于预测熵来评估时间序列样本中的信息量,并根据预测熵来获取电网时序数据的可预测性,基于电网时序数据的可预测性与时序数据的不确定性和重复特征规律之间的关联,实现对电网时序数据质量的评估,很好地解决了现有方法无法对时序数据中的特征规律等高级特征进行提取,导致准确度、可信度不高的问题。
Description
技术领域
本发明属于电网数据分析技术领域,具体涉及一种基于预测熵的电网时序数据质量评估方法、系统、设备和存储介质。
背景技术
目前,电力物联网中在边缘计算能有效缓解云端的运算压力,提升解决方案的响应时间。然而,外界干扰或设备故障带来的数据噪声不可避免地干扰了智能模型的学习推理,进而影响对边缘设备状态的实时感知和诊断,不利于电网的安全稳定运行。因此,在电力物联应用场景中,亟需攻克现有边端设备数据采集存在的噪声干扰问题,设计面向电网时序数据的数据质量感知方法,过滤噪声数据,为电力智能模型提供可靠的学习数据。
针对电网时序数据的质量评估问题,现有研究方法主要分为:基于统计的数据分析方法和基于模型的影响分析方法。(1)基于统计的数据分析方法通常是在预处理过程中,通过离群点检测、滤波技术、箱线图等统计方法,对时序数据的异常值、中心趋势、分布情况、噪声等进行计算,进而评估数据的质量。这些方法是机器学习中的常用预处理方法,对于后续的模型学习具有重要作用。(2)基于模型的影响分析方法主要是在训练过程中,根据数据对于模型训练结果的影响进行量化,主要有留一法(Leave-One-Out)、样本边际贡献(Shapley Value)、影响函数(Influence Function)等,这些方法对于各种类型的数据和模型都具有普适性,在机器学习领域得到了广泛应用。总的来说,基于统计的数据分析方法,能够挖掘时序数据的一些简单特征,但是无法深入挖掘时序数据中的规律特征、可预测性等高级的特征;而基于模型的影响分析方法能够针对任务有针对性的评估数据对于最终模型训练的贡献程度,但是这类方法严重依赖于模型和训练过程,复杂度较高,且评估出来的结果不具有普适性。
发明内容
本发明的目的在于提供一种电网时序数据质量评估方法、系统、设备和存储介质,以解决现有方法在对电网时序数据进行质量评估分析时存在的上述问题。
本发明通过下述技术方案实现:
电网时序数据质量评估方法,根据电网时序数据的预测熵获取电网时序数据的可预测性,根据电网时序数据的可预测性对电网时序数据质量进行评估。
在一些实施例中,电网时序数据质量评估方法包括以下步骤:
S02、获取电网时序数据;
S04、对电网时序数据进行离散处理,将电网时序数据转换为离散的符号序列;
S06、基于离散的符号序列获取电网时序数据的预测熵;
S08、建立预测熵与电网时序数据最大可预测性之间的关系式,获取电网时序数据的最大可预测性。
在一些实施例中,采用分段读取设定长度的电网时序数据,并分别对各段电网时序数据进行评估的方式,完成对所有电网时序数据的评估。
在一些实施例中,步骤S04包括以下步骤:
S041、对读取的电网时序数据进行归一化处理;
S042、采用欧式距离作为任意两个时刻的数据点之间距离度量,基于该距离度量将电网时序数据中的各个数据点输入到层次聚类模型中,根据数据点之间的相似性逐步合并聚类;
S043、采用离散的类标符号代替序列数据中各个时刻的数据点,得到由离散点组成的符号序列。
在一些实施例中,步骤S06中离散的符号序列的预测熵S为:
;
其中,为符号序列中位置以k开始的最短的且在前面1至k-1为止,从未出现过的子序列的长度,N为在采用层次聚类模型进行合并聚类时设定的所要得到的簇的数量。
在一些实施例中,在采用层次聚类模型进行合并聚类时设定所要得到的簇的数量为50。
在一些实施例中,步骤S08中,基于Fano不等式建立预测熵与时序数据最大可预测性之间的关系式,表示为:
;
其中,为时序数据的最大可预测性,S为预测熵。
另一方面,本发明中还提供一种电网时序数据质量评估系统,包括:
数据获取模块,用于获取电网时序数据;
数据处理模块,用于对电网时序数据进行离散处理,将电网时序数据转换为离散的符号序列;
预测熵模块,用于计算电网时序数据的预测熵;
质量评估模块,用于计算时序数据的可预测性,并根据时序数据的可预测性对电网时序数据质量进行评估。
另一方面,本发明中还提供一种电子设备,包括:
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现所述的电网时序数据质量评估方法。
另一方面,本发明中还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现所述的电网时序数据质量评估方法。
本发明与现有技术相比,具有以下优点及有益效果:
本发明基于预测熵来评估时间序列样本中的信息量,并根据预测熵来获取电网时序数据的可预测性,基于电网时序数据的可预测性与时序数据的不确定性和重复特征规律之间的关联,实现对电网时序数据质量的评估,很好地解决了现有方法无法对时序数据中的特征规律等高级特征进行提取,导致准确度、可信度不高的问题。
本发明所采用的方法与模型和训练过程无关,计算复杂度低,运算量小,并且能够更加对采集的电力设备数据质量进行客观、准确的评价,结果可信度高,能够很好地应用于对电力物联场景中预测模型的训练优化。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明方法流程示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
相关词义解释:
电网时序数据:在电力物联网中,很多边端设备(如变压器,风力发电机,用能数据采集装置,配电网传感器等)都在实时运行并产生电压、电流、温度、湿度等各种时序信号数据,在本发明中将这些时序信号数据均定义为电网时序数据。
电力智能模型:在电网设备运维场景中,需要根据采集得到的边端设备的时序信号数据判断其当前是否正常运行或预测未来一段时间是否能继续正常运行;在电网调度场景中,需要根据采集得到的用户侧用电需求以及发电侧的出力情况等数据,快速预测未来一段时间内的用电、发电情况,进而为调度决策提供数据支撑。在这些场景中执行异常检测和状态预测任务时,往往需要利用一些智能模型。一般来说,这些智能模型特指基于神经网络构建的模型。在本发明中定义这些智能模型为电力智能模型。
预测熵:预测熵是一种从离散状态空间表示时序数据不确定性或者随机性的度量。用于时间序列样本中信息量的量化指标。这是本发明设计的指标。
归一化:把原始数据通过某种算法处理后,限制在一定范围内的数据标准化处理手段。
Fano不等式:也称为Fano 逆和Fano 引理,在信息论中将噪声通道中丢失的平均信息与分类错误的概率联系起来的,用以说明噪音信道中的平均信息损失和错误分类概率之间的关系。
欧氏距离,即欧几里得距离,指在多维空间中两个点之间的真实距离。
本发明对电网时序数据进行质量评估的核心思路是:基于电网时序数据能够用于衡量时序数据的不确定性和重复特征规律,在一定程度上能够反映电网时序数据的质量,因此从电网时序数据的可预测性出发来及进行电网时序数据质量的评估。
该方法中预测熵是获取电网时序数据可预测性的核心。
基于上述技术思路,本发明中给出了一种基于预测熵的电网时序数据质量评估方法,参照图1,包括数据准备、数据评估及结果输出的步骤,在数据准备步骤中获取电网数据数据样本,在数据评估步骤中采用对时序数据进行层次聚类、计算预测熵的方法来求解时序数据的可预测性,在结果输出步骤中基于时序数据的可预测性对时序数据质量进行评估,并输出评估结果。
在一实施例中,该方法包括以下步骤:
步骤一、获取电网时序数据;
该步骤中,采集得到的电网时序数据中,以长度为T的一段时序数据为例,该段时序数据用X表示,。
其中,该段时序数据中t时刻的数可称为数据点,该数据点/>包含有多个属性数据,分别为:/>,这些属性数据分别表征在t时刻电力系统中各边端设备的信号数据。以配电房采集的温度、湿度、电流、电压这4各属性数据为例,该段读取100各时刻的数据,表示为/>,对于第1个时刻的数据点/>,其所包含的四个属性数据,即/>分别对应为第1时刻的温度、湿度、电流、电压的值。
在一实施例中,在对采集的电网时序数据进行分析时,采用先读取长度为T的时序数据作为序列样本,对该段序列样本进行评估分析得到评估结果后,再读取另外一段长度为T的时序数据进行评估分析的方法,依次完成对所采集的电网时序数据的评估分析。
步骤二、对电网时序数据进行离散处理,将电网时序数据转换为离散的符号序列;
电力系统中,外界干扰或设备故障会带来数据噪声,这些数据噪声对电力智能模型的预测效果会存在影响。
本发明是基于预测熵来获取电网时序数据的可预测性,预测熵是基于信息熵的改进,时序数据在连续域中取值,在计算时序数据信息熵时,需要分析时序数据中的重复模式,但在连续域中要取得相同的值难度较大,因此要获取预测熵就需要将时序数据转换到离散域,将其中相近的值表示为相同的类标。
因此,本发明中提出了基于层次聚类的离散域转换方法,认为越相近的数据点表示时间序列的状态越类似,更有可能被归为同一类别。
在一实施例中,对电网时序数据进行离散处理,包括以下步骤:
对读取的电网时序数据进行归一化处理;
采用欧式距离作为任意两个时刻的数据点之间距离度量;例如,i,j两个时刻的数据点之间的距离度量为:
;
其中,为第i时刻数据点的d属性数据,/>为第j时刻数据点的d属性数据。
基于该距离度量将电网时序数据中的各个数据点输入到层次聚类模型中,层次聚类模型根据数据点之间的相似性逐步合并聚类,形成聚类树状结构。
在采用层次聚类模型计算执行到簇的数量达到预设值N时,则停止;最终簇的数量即为所需的聚类数量N,每个簇内的样本被视为同一类;这里的N值可根据数据的分布情况进行调整。
本实施例中,设定的所要得到的簇的数量预设值N为50。
采用离散的类标符号1,2,3,…,N代替序列数据中各个时刻的数据点,得到由长度为T的离散点组成的符号序列C,表示为。
具体地,序列数据转换为符号序列的步骤为:
1)获取序列数据X的最小值X_min和最大值X_max;
2)把X_min到X_max的距离平均划分为N段,其间隔为X_int= (X_max-X_min) /N;
则可将X的每一段分别表示为:
[X_min,X_min+ 1*X_int],设定与该段数据对应的序列数据用类标符号1表示;
[X_min+1*X_int,X_min+ 2 *X_int],设定与该段数据对应的序列数据用类标符号2表示;
[X_min+ 2*X_int,X_min+ 3 *X_int],设定与该段数据对应的序列数据用类标符号3表示;
…
[X_min+ (N-1)*X_int,X_min+N*X_int],设定与该段数据对应的序列数据用类标符号N表示。
判断序列样本X中的所有数据点属于哪一段,并赋予对应的类标符号,从而得到对应的符号序列。
例如,给定序列样本X={0.1, 0.6, 0.3, 1.3},设N=4;
则可得到序列样本X中的最大值为1.3,最大值0.1;
将0.1至1.3之间划分为4段,间隔X_int=(1.3-0.1)/4=0.3;
则序列样本X的每一段可分别表示为:[0.1-0.4],[0.4-0.7],[0.7-1.0],[1.0-1.3],各段对应的类标符号分别为1,2,3,4。
对序列X={0.1, 0.6, 0.3, 1.3}中的所有数据点,判断其属于哪一段,并赋予对应的符号,则得到转换后的符号序列为:[1,2,1,4]。
步骤三、基于离散的符号序列获取电网时序数据的预测熵;
在得到离散的符号系列后,可以用于识别表示数据中的重复模块,并计算出时序数据样本的预测熵。
对于从原始连续域数据序列样本X得到的离散符号序列C,其预测熵S,可采用以下公式计算得到:
;
其中,为符号序列中位置以k开始的最短的且在前面1至k-1为止,从未出现过的子序列的长度,N为在采用层次聚类模型进行合并聚类时设定的所要得到的簇的数量。
以上述得到的符号序列C=[1,2,1,4]为例;
取k=4,则满足条件的“以k开始的最短的且在前面1至k-1为止,从未出现过的子序列”为:
先确定前面1至k-1的序列为[1,2,1],子序列有{1}, {2}, {1,2};
对于子序列{1}, {2},在序列{1,2}中出现过;
对于子序列{1,2},在{1,2}中未出现过;
所以,当取k=4,则满足条件的“以k开始的最短的且在前面1至k-1为止,从未出现过的子序列”为{1,2},其长度为2。
步骤三、求解电网时序数据可预测性;
电网时序数据可预测性,用表示。
这里从预测概率的角度,建模可预测性求解问题。
定义,表示给定1到T-1时刻的序列数据后,即
后预测下一时刻(第T时刻)为y的概率。
那么给定长度为t-1的历史序列数据的可预测性,可采用以下公式计算:
;
其中,supy表示概率的上确界,/>为出现序列P(x_{1...t-1})的概率。
基于得到的电网时序数据可预测性的值,可对电网时序数据质量进行评估。
在采用上述方法及公式在计算可预测性时,需要遍历所有/>可能的取值,存在运算数据量大的问题。
基于上述问题,本发明中通过建立预测熵与电网时序数据最大可预测性之间的关系式,获取电网时序数据的最大可预测性,根据电网时序数据的最大可预测性对电网时序数据质量进行评估。
在一实施例中,基于Fano不等式建立预测熵与时序数据最大可预测性之间的关系式,表示为:
;
其中,为时序数据的最大可预测性,S为预测熵。
基于上述公式和步骤三得到的预测熵S,可计算得到时序数据的最大可预测性,根据时序数据的最大可预测性的值对电网时序数据质量进行评估,可得到电网时序数据的质量估计值(其取值为0到1之间的标量)。
另一方面,本发明还提供一种基于预测熵的电网时序数据质量评估系统,包括
数据获取模块,用于获取电网时序数据;这里可通过设置设备传感器来获取各个时刻下对应的运行状态参数,如温度、湿度、电流、电压的值等。
数据处理模块,用于对电网时序数据进行离散处理,将电网时序数据转换为离散的符号序列;
预测熵模块,用于计算电网时序数据的预测熵;
质量评估模块,用于计算时序数据的可预测性,并根据时序数据的可预测性对电网时序数据质量进行评估。
另一方面,本发明还提供一种电子设备,包括:存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述实施例中的电网时序数据质量评估方法。
另一方面,本发明还提供一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中的电网时序数据质量评估方法。
以上所述,仅是本发明的较佳实施例,并非对本发明做任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化,均落入本发明的保护范围之内。
Claims (10)
1.电网时序数据质量评估方法,其特征在于,根据电网时序数据的预测熵获取电网时序数据的可预测性,根据电网时序数据的可预测性对电网时序数据质量进行评估。
2.根据权利要求1所述的电网时序数据质量评估方法,其特征在于,包括以下步骤:
S02、获取电网时序数据;
S04、对电网时序数据进行离散处理,将电网时序数据转换为离散的符号序列;
S06、基于离散的符号序列获取电网时序数据的预测熵;
S08、建立预测熵与电网时序数据最大可预测性之间的关系式,获取电网时序数据的最大可预测性。
3.根据权利要求2所述的电网时序数据质量评估方法,其特征在于,采用分段读取设定长度的电网时序数据,并分别对各段电网时序数据进行评估的方式,完成对所有电网时序数据的评估。
4.根据权利要求2或3所述的电网时序数据质量评估方法,其特征在于,步骤S04包括以下步骤:
S041、对读取的电网时序数据进行归一化处理;
S042、采用欧式距离作为任意两个时刻的数据点之间距离度量,基于该距离度量将电网时序数据中的各个数据点输入到层次聚类模型中,根据数据点之间的相似性逐步合并聚类;
S043、采用离散的类标符号代替序列数据中各个时刻的数据点,得到由离散点组成的符号序列。
5.根据权利要求4所述的电网时序数据质量评估方法,其特征在于,步骤S06中离散的符号序列的预测熵S为:
;
其中,为符号序列中位置以k开始的最短的且在前面1至k-1为止,从未出现过的子序列的长度,N为在采用层次聚类模型进行合并聚类时设定的所要得到的簇的数量。
6.根据权利要求4所述的电网时序数据质量评估方法,其特征在于,在采用层次聚类模型进行合并聚类时设定所要得到的簇的数量为50。
7.根据权利要求2或3所述的电网时序数据质量评估方法,其特征在于,步骤S08中,基于Fano不等式建立预测熵与时序数据最大可预测性之间的关系式,表示为:
;
其中,为时序数据的最大可预测性,S为预测熵。
8.电网时序数据质量评估系统,其特征在于,包括:
数据获取模块,用于获取电网时序数据;
数据处理模块,用于对电网时序数据进行离散处理,将电网时序数据转换为离散的符号序列;
预测熵模块,用于计算电网时序数据的预测熵;
质量评估模块,用于计算时序数据的可预测性,并根据时序数据的可预测性对电网时序数据质量进行评估。
9.一种电子设备,其特征在于,包括:
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一项所述的电网时序数据质量评估方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的电网时序数据质量评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311565431.8A CN117649015A (zh) | 2023-11-22 | 2023-11-22 | 电网时序数据质量评估方法、系统、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311565431.8A CN117649015A (zh) | 2023-11-22 | 2023-11-22 | 电网时序数据质量评估方法、系统、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117649015A true CN117649015A (zh) | 2024-03-05 |
Family
ID=90044371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311565431.8A Pending CN117649015A (zh) | 2023-11-22 | 2023-11-22 | 电网时序数据质量评估方法、系统、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117649015A (zh) |
-
2023
- 2023-11-22 CN CN202311565431.8A patent/CN117649015A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8630962B2 (en) | Error detection method and its system for early detection of errors in a planar or facilities | |
CN113255848B (zh) | 基于大数据学习的水轮机空化声信号辨识方法 | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN112414694B (zh) | 基于多元状态估计技术的设备多级异常状态识别方法及装置 | |
CN115412455A (zh) | 一种基于时间序列的服务器多性能指标异常检测方法及装置 | |
Shajihan et al. | CNN based data anomaly detection using multi-channel imagery for structural health monitoring | |
CN115484102A (zh) | 一种面向工业控制系统的异常检测系统和方法 | |
CN106405384A (zh) | 模拟电路健康状态评估方法 | |
CN117668684B (zh) | 基于大数据分析的电网电能数据异常检测方法 | |
CN113866455A (zh) | 基于深度学习的桥梁加速度监测数据异常检测方法、系统和装置 | |
CN114118219A (zh) | 基于数据驱动的长期加电设备健康状态实时异常检测方法 | |
Li et al. | Knowledge enhanced ensemble method for remaining useful life prediction under variable working conditions | |
CN117951646A (zh) | 一种基于边缘云的数据融合方法及系统 | |
CN112947649B (zh) | 一种基于互信息矩阵投影的多变量过程监控方法 | |
CN117825864A (zh) | 一种配电网线路短路容量监控诊断方法及系统 | |
CN113052302A (zh) | 基于循环神经网络的机器健康监控方法、装置及终端设备 | |
CN117251817A (zh) | 雷达故障检测方法、装置、设备和存储介质 | |
CN117131022A (zh) | 一种电力信息系统的异构数据迁移方法 | |
CN117056842A (zh) | 构建设备异常监测模型的方法、装置、设备、介质及产品 | |
CN117649015A (zh) | 电网时序数据质量评估方法、系统、设备和存储介质 | |
CN115545104A (zh) | 基于函数型数据分析的kpi异常检测方法、系统及介质 | |
CN116956089A (zh) | 电器设备温度异常检测模型训练方法以及检测方法 | |
CN105654128A (zh) | 基于核范数正则低秩编码的风机叶片图像故障识别方法 | |
CN118427670B (zh) | 换电柜的数据在线监测方法及系统 | |
CN118549823B (zh) | 一种锂电池电性能测试方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |