CN113393107A - 一种面向发电设备状态参量参考值的增量式计算方法 - Google Patents

一种面向发电设备状态参量参考值的增量式计算方法 Download PDF

Info

Publication number
CN113393107A
CN113393107A CN202110631676.0A CN202110631676A CN113393107A CN 113393107 A CN113393107 A CN 113393107A CN 202110631676 A CN202110631676 A CN 202110631676A CN 113393107 A CN113393107 A CN 113393107A
Authority
CN
China
Prior art keywords
data
calculation
model
aggregated
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110631676.0A
Other languages
English (en)
Other versions
CN113393107B (zh
Inventor
杨嘉伟
崔宇
唐健
田军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongfang Electric Group Research Institute of Science and Technology Co Ltd
Original Assignee
Dongfang Electric Group Research Institute of Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongfang Electric Group Research Institute of Science and Technology Co Ltd filed Critical Dongfang Electric Group Research Institute of Science and Technology Co Ltd
Priority to CN202110631676.0A priority Critical patent/CN113393107B/zh
Publication of CN113393107A publication Critical patent/CN113393107A/zh
Application granted granted Critical
Publication of CN113393107B publication Critical patent/CN113393107B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Probability & Statistics with Applications (AREA)
  • Molecular Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Educational Administration (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Public Health (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Biology (AREA)
  • Water Supply & Treatment (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Fuzzy Systems (AREA)

Abstract

本申请涉及智慧电厂发电设备领域,尤其是针对发电机定子部件重要状态参量的参考值计算方式的一种面向发电设备状态参量参考值的增量式计算框架方法。本方法基于局部敏感哈希算法分别对发电设备相关历史数据和新增数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的。并且本发明相较于传统的增量式计算方法,具有计算速度快,计算开销小,计算精度高等特点。

Description

一种面向发电设备状态参量参考值的增量式计算方法
技术领域
本申请涉及智慧电厂发电设备领域,尤其是针对发电机定子部件重要状态参量的参考值计算方式的一种面向发电设备状态参量参考值的增量式计算方法。
背景技术
随着“互联网+”智慧能源发展意见的推进,以智能管控一体化系统为核心的智慧电厂应运而生。智慧电厂对传感器采集数据进行全面整合处理,进行管理决策制定,以期形成一套覆盖火力发电厂全生命周期的智能传感、智能执行、智能控制、智能优化和智能管控的技术方案。其中智能管控技术以自学习、自分析为依托,通过对设备机组的海量历史数据进行数据挖掘,结合输入和输出对象建立系统工况模型,再通过实时运行数据与建立的历史工况模式进行比对,实现对设备缺陷或故障的预判或诊断。因此,准确地对设备重要状态参量进行参考值计算和阈值分析,是智能管控模块的关键技术。
目前,针对发电设备状态参量参考值的计算方法主要包括基于统计学的计算方法,基于机器学习和深度学习的回归计算方法。前者通过状态参量及其相关特征的因果关系和关联关系进行相关回归,如最小二乘法等,但计算效果通常受制于回归函数复杂程度。后者通过建立有监督的输入和输出黑盒模型,对状态参量进行不同工况下的数值拟合,得益于机器学习和深度学习模型的非线性函数组合和复杂度可调节网络,目前在参考值计算精度上获得了广泛的应用。
在设备正常老化和负荷峰谷周期交替等多中因素的影响下,设备状态参量存在多变性,为保证模型的时效性,状态参量计算模型需要定期对新采集数据进行增量式计算。目前采用的增量式计算模型,直接将新采集数据与历史数据在时间维度上进行拼接,视作新的训练集对模型进行校验更新。在传感器采样频率高、采样点繁多的背景下,上述增量式计算方法容易造成训练集数据爆发式增长,对计算硬件的内存和性能要求极为严苛。
虽然发电设备具有工况多变的特性,但也不乏长时间工作于同一工况下的情况,导致同一时段内所采集的数据通常富有冗余性。因此,对发电设备相关数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的,具有一定的实际应用意义。
发明内容
本发明的目的在于解决发电机定子部件重要状态参量参考值的增量式计算问题,提供了一种面向发电设备状态参量参考值的增量式计算框架方法,主要应用于发电设备中大数据的增量式计算过程,减少数据大量增长对计算硬件的压力。
本发明的技术内容如下:
一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,包括如下步骤:
步骤一、从离线存储数据库以最小时间单位提取历史数据;这里最小时间单位可以自定义为周、月、年等时间单位用以提取历史数据。
步骤二、以每个最小时间单位历史数据为待聚合数据z;
步骤三、对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z′;
步骤四、将各历史数据中最小时间单位聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤三基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板D0保存至在线计算数据库中;
步骤四具体是将原始数据按照最小时间单位分为多个待聚合数据z,对每个 z分别进行基于局部敏感哈希算法的数据聚合得到每个最小时间单位的聚合后数据z′,其中每个z′与z对应,将所有z′进行级联拼接,组合成新的待聚合数据,再次进行数据聚合,生成小样本数据模板D0
步骤五、建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss 损失函数选取均方根误差;
步骤六、以小样本数据模板D0为训练集,所有历史最小时间单位源数据Z0为验证集,对步骤五所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型;
步骤七、对离线存储数据库最近新增一个最小时间单位的数据Zt,将其与过去3-12个最小时间单位数据组成新的验证模板Zv,保存至在线计算数据库中;
这里提到的过去3-12个最小时间单位数据与本次小时间单位源新增数据共同组成了验证数据模板Zv,用来验证后续预测模型的精度。
步骤八、将新增数据Zt作为待聚合数据进行步骤三所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据Z′t,并将其与上一最小时间单位小样本数据模板Dt-1级联拼接,作为新的待聚合数据,通过步骤三所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板Dt保存至在线计算数据库中,此时,小样本数据模板Dt既包含历史数据信息,也涵盖本最小时间单位新增的模式特点;
步骤九、以小样本数据模板Dt为训练集,验证数据模板Zv为验证集,对与步骤五中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板Zv上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中;
步骤十、提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据Xc为输入,计算得到状态参量的参考值yc
进一步地,所述步骤一中,所示每最小时间单位历史数据
Figure BDA0003103818400000031
其中L代表该最小时间单位所记录的时序数据条数,每条数据
Figure BDA0003103818400000032
由需计算的状态参量的测量值
Figure BDA0003103818400000033
及该参量相关的特征测量值
Figure BDA0003103818400000034
组成,l代表该最小时间单位的第l条数据,N代表每条数据所记录的特征维数,通常情况下L>>200000,N>>15。
进一步地,所述步骤三中的基于局部敏感哈希算法的数据聚合算法,具体步骤如下:
步骤(1).对每条数据
Figure BDA0003103818400000041
经哈希函数映射后的数值
Figure BDA0003103818400000042
Figure BDA0003103818400000043
上式中,随机矩阵
Figure BDA0003103818400000044
均满足N~(0,1)标准正态分布,r0为预设敏感阈值,共同构成哈希函数H(.),T表示矩阵转置;
步骤(2).对映射后的hl=[h1,h2,...,hS]的每一维数值hs通过符号函数进行0, 1二进制编码,作为每条数据的键值kl=[k1,k2,...,kS]进行标记,每条数据可记为 (kl,zl);提取该最小时间单位数据的键值集合K={k1,k2,...,kQ},对每个键值建立Q 个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中;
Figure BDA0003103818400000045
上式中,sgn(.)为符号函数;
步骤(3).对每个哈希桶中数据
Figure BDA0003103818400000046
每次取出两条数据
Figure BDA0003103818400000047
作为数据对进行欧式距离计算,其中J代表键值为kq的哈希桶中的数据条数,
Figure BDA0003103818400000048
分别代表键值为kq哈希桶中的第i条和第m条不同的数据,i≠m;若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据
Figure BDA0003103818400000049
加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
Figure BDA00031038184000000410
Figure BDA00031038184000000411
上式中,且
Figure BDA00031038184000000412
步骤(4)、将Q个哈希桶中剩余数据,进行级联拼接,得到原始数据z对应的聚合数据
Figure BDA00031038184000000413
其中zq′为键值为kq哈希桶的剩余数据,L′为聚合数据样本数,且L′<<L,通常在5000以内;
进一步地,步骤五中模型具体为:
gi+1=σ(Ai·gi+Ci)
Figure BDA0003103818400000051
上式中Ai和Bi代表第i层神经网络的神经元权重和偏置,σ(.)为激活函数,可取sigmoid、tanh或relu,gi和gi+1分别代表第i层神经网络的输入和输出,yj
Figure BDA0003103818400000052
分别代表第j个样本的实测值和模型计算值。
本发明的有益效果如下:
1、本发明的目的在于解决发电机定子部件重要状态参量参考值的增量式计算问题,提供了一种面向发电设备状态参量参考值的增量式计算框架方法,主要应用于发电设备中大数据的增量式计算过程,减少数据大量增长对计算硬件的压力。同一时段内所采集的数据通常富有冗余性,本发明通过步骤三、步骤八-九所述的基于局部敏感哈希算法分别对发电设备相关历史数据和新增数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的。并且本发明相较于传统的增量式计算方法,具有计算速度快,计算开销小,计算精度高等特点。
2、本发明面向发电设备状态参量参考值的增量式计算,首先利用局部敏感哈希算法对离线存储数据库中各历史周期的采样数据进行数据聚合生成小样本数据模板,利用小样本数据模板作为训练集,历史源数据为验证集对基于深度神经网络的回归计算模型进行训练,并存储于在线计算数据库中。对新采集周期数据,同样利用局部敏感哈希进行数据聚合,并与历史存储的小样本数据模板进行级联拼接,再进行一次数据聚合得到涵盖最新特征的小样本数据模板。以历史最近6个周期数据为验证数据模板,并作为回归计算模型的验证集,用最新数据模板为训练集进行回归计算模型更新。利用在线计算数据库中最新的回归计算模型对待计算数据进行状态参量的参考值计算。本发明实现过程中,在保证发电设备状态参量计算精度的情况下,缓解了状态参量数据日益积累造成的计算开销,提升了计算模型更新速度,与传统的直接拼接增量式计算模型相比,简单实用,对计算硬件要求简单,并可以实现多项状态参量的参考值计算具备通用性。
附图说明
图1为本发明的基于局部敏感哈希的数据聚合示意图。
图2为本发明的流程示意图。
具体实施方式
实施例1
一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,包括如下步骤:
步骤一、从离线存储数据库以最小时间单位提取历史数据;这里最小时间单位可以自定义为周、月、年等时间单位用以提取历史数据。进一步地,所示每最小时间单位历史数据
Figure BDA0003103818400000061
其中L代表该最小时间单位所记录的时序数据条数,每条数据
Figure BDA0003103818400000062
由需计算的状态参量的测量值
Figure BDA0003103818400000063
及该参量相关的特征测量值
Figure BDA0003103818400000064
组成,l代表该最小时间单位的第l条数据,N代表每条数据所记录的特征维数,通常情况下L>>200000,N>>15。
步骤二、以每个最小时间单位历史数据为待聚合数据z;
步骤三、对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z′;
具体步骤如下:
步骤(1).对每条数据
Figure BDA0003103818400000065
经哈希函数映射后的数值
Figure BDA0003103818400000066
Figure BDA0003103818400000067
上式中,随机矩阵
Figure BDA0003103818400000068
均满足N~(0,1)标准正态分布,r0为预设敏感阈值,共同构成哈希函数H(.),T表示矩阵转置;
步骤(2).对映射后的hl=[h1,h2,...,hS]的每一维数值hs通过符号函数进行0, 1二进制编码,作为每条数据的键值kl=[k1,k2,...,kS]进行标记,每条数据可记为 (kl,zl);提取该最小时间单位数据的键值集合K={k1,k2,...,kQ},对每个键值建立Q 个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中;
Figure BDA0003103818400000071
上式中,sgn(.)为符号函数;
步骤(3).对每个哈希桶中数据
Figure BDA0003103818400000072
每次取出两条数据
Figure BDA0003103818400000073
作为数据对进行欧式距离计算,其中J代表键值为kq的哈希桶中的数据条数,
Figure BDA0003103818400000074
分别代表键值为kq哈希桶中的第i条和第m条不同的数据,i≠m;若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据
Figure BDA0003103818400000075
加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
Figure BDA0003103818400000076
Figure BDA0003103818400000077
上式中,且
Figure BDA0003103818400000078
步骤(4)、将Q个哈希桶中剩余数据,进行级联拼接,得到原始数据z对应的聚合数据
Figure BDA0003103818400000079
其中zq′为键值为kq哈希桶的剩余数据,L′为聚合数据样本数,且L′<<L,通常在5000以内;
步骤四、将各历史数据中最小时间单位聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤三基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板D0保存至在线计算数据库中;
步骤四具体是将原始数据按照最小时间单位分为多个待聚合数据z,对每个 z分别进行基于局部敏感哈希算法的数据聚合得到每个最小时间单位的聚合后数据z′,其中每个z′与z对应,将所有z′进行级联拼接,组合成新的待聚合数据,再次进行数据聚合,生成小样本数据模板D0
步骤五、建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss 损失函数选取均方根误差;
步骤五中模型具体为:
gi+1=σ(Ai·gi+Ci)
Figure BDA0003103818400000081
上式中Ai和Bi代表第i层神经网络的神经元权重和偏置,σ(.)为激活函数,可取sigmoid、tanh或relu,gi和gi+1分别代表第i层神经网络的输入和输出,yj
Figure BDA0003103818400000082
分别代表第j个样本的实测值和模型计算值。
步骤六、以小样本数据模板D0为训练集,所有历史最小时间单位源数据Z0为验证集,对步骤五所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型;
步骤七、对离线存储数据库最近新增一个最小时间单位的数据Zt,将其与过去3-12个最小时间单位数据组成新的验证模板Zv,保存至在线计算数据库中;
这里提到的过去3-12个最小时间单位数据与本次小时间单位源新增数据共同组成了验证数据模板Zv,用来验证后续预测模型的精度。
步骤八、将新增数据Zt作为待聚合数据进行步骤三所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据Z′t,并将其与上一最小时间单位小样本数据模板Dt-1级联拼接,作为新的待聚合数据,通过步骤三所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板Dt保存至在线计算数据库中,此时,小样本数据模板Dt既包含历史数据信息,也涵盖本最小时间单位新增的模式特点;
步骤九、以小样本数据模板Dt为训练集,验证数据模板Zv为验证集,对与步骤五中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板Zv上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中;
步骤十、提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据Xc为输入,计算得到状态参量的参考值yc
本发明提供了一种面向发电设备状态参量参考值的增量式计算框架方法,主要应用于发电设备中大数据的增量式计算过程,减少数据大量增长对计算硬件的压力。同一时段内所采集的数据通常富有冗余性,本发明通过步骤三、步骤八- 九所述的基于局部敏感哈希算法分别对发电设备相关历史数据和新增数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的。并且本发明相较于传统的增量式计算方法,具有计算速度快,计算开销小,计算精度高等特点。
本发明首先利用局部敏感哈希算法对离线存储数据库中各历史周期的采样数据进行数据聚合生成小样本数据模板,利用小样本数据模板作为训练集,历史源数据为验证集对基于深度神经网络的回归计算模型进行训练,并存储于在线计算数据库中。对新采集周期数据,同样利用局部敏感哈希进行数据聚合,并与历史存储的小样本数据模板进行级联拼接,再进行一次数据聚合得到涵盖最新特征的小样本数据模板。以历史最近6个周期数据为验证数据模板,并作为回归计算模型的验证集,用最新数据模板为训练集进行回归计算模型更新。利用在线计算数据库中最新的回归计算模型对待计算数据进行状态参量的参考值计算。本发明实现过程中,在保证发电设备状态参量计算精度的情况下,缓解了状态参量数据日益积累造成的计算开销,提升了计算模型更新速度,与传统的直接拼接增量式计算模型相比,简单实用,对计算硬件要求简单,并可以实现多项状态参量的参考值计算具备通用性。
实施例2
根据图2所示,本发明设计的一种面向发电设备状态参量参考值的增量式计算框架方法,其计算步骤如下:
(1)从离线存储数据库以月为单位提取历史数据。
所示每月历史数据
Figure BDA0003103818400000091
其中L代表该月所记录的时序数据条数,每条数据
Figure BDA0003103818400000092
由需计算的状态参量的测量值
Figure BDA0003103818400000093
及该参量相关的特征测量值
Figure BDA0003103818400000094
组成,l代表该月的第 l条数据,N代表每条数据所记录的特征维数,通常情况下L>>200000,N>>15。
(2)以每月历史数据为待聚合数据z进行步骤(3)所述的基于局部敏感哈希算法进行数据聚合。
(3)对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z′。所述的基于局部敏感哈希算法的数据聚合算法,具体步骤如下:
①对每条数据
Figure BDA0003103818400000101
经哈希函数映射后的数值
Figure BDA0003103818400000102
Figure BDA0003103818400000103
上式中,随机矩阵
Figure BDA0003103818400000104
均满足N~(0,1)标准正态分布,r0为预设敏感阈值,共同构成哈希函数H(.),T表示矩阵转置。
②对映射后的hl=[h1,h2,...,hS]的每一维数值hs通过符号函数进行0,1 二进制编码,作为每条数据的键值kl=[k1,k2,...,kS]进行标记,每条数据可记为(kl,zl)。提取该月数据的键值集合K={k1,k2,...,kQ},对每个键值建立Q个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中。
Figure BDA0003103818400000105
上式中,sgn(.)为符号函数。
③对每个哈希桶中数据
Figure BDA0003103818400000106
每次取出两条数据
Figure BDA0003103818400000107
作为数据对进行欧式距离计算,其中J代表键值为kq的哈希桶中的数据条数,
Figure BDA0003103818400000108
分别代表键值为kq哈希桶中的第i条和第m条不同的数据, i≠m。若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据
Figure BDA0003103818400000109
加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
Figure BDA00031038184000001010
Figure BDA00031038184000001011
上式中,且
Figure BDA0003103818400000111
④将Q个哈希桶中剩余数据,进行级联拼接,得到原始数据z对应的聚合数据
Figure BDA0003103818400000112
其中zq′为键值为kq哈希桶的剩余数据, L′为聚合数据样本数,且L′<<L,通常在5000以内。
(4)将各历史月份聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤(3)所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板D0保存至在线计算数据库中。 (5)建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss损失函数选取均方根误差。
gi+1=σ(Ai·gi+Ci)
Figure BDA0003103818400000113
上式中Ai和Bi代表第i层神经网络的神经元权重和偏置,σ(.)为激活函数,可取sigmoid、tanh或relu,gi和gi+1分别代表第i层神经网络的输入和输出,yj
Figure BDA0003103818400000114
分别代表第j个样本的实测值和模型计算值。
(6)以小样本数据模板D0为训练集,所有历史月份源数据Z0为验证集,对步骤(5)所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型。
(7)对离线存储数据库最近新增一个月的数据Zt,将其与过去5个月数据组成新的验证模板Zv,保存至在线计算数据库中。
(8)将新增数据Zt作为待聚合数据进行步骤(3)所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据Z′t,并将其与上一月小样本数据模板Dt-1级联拼接,作为新的待聚合数据,通过步骤(3)所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板Dt保存至在线计算数据库中。此时,小样本数据模板Dt既包含历史数据信息,也涵盖本月新增的模式特点。
(9)以小样本数据模板Dt为训练集,验证数据模板Zv为验证集,对与步骤(5)中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板Zv上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中。
(10)提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据Xc为输入,计算得到状态参量的参考值yc

Claims (4)

1.一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,包括如下步骤:
步骤一、从离线存储数据库以最小时间单位提取历史数据;
步骤二、以每个最小时间单位历史数据为待聚合数据z;
步骤三、对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z′;
步骤四、将各历史数据中最小时间单位聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤三基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板D0保存至在线计算数据库中;
步骤五、建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss损失函数选取均方根误差;
步骤六、以小样本数据模板D0为训练集,所有历史最小时间单位源数据Z0为验证集,对步骤五所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型;
步骤七、对离线存储数据库最近新增一个最小时间单位的数据Zt,将其与过去3-12个最小时间单位数据组成新的验证模板Zv,保存至在线计算数据库中;
步骤八、将新增数据Zt作为待聚合数据进行步骤三所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据Z′t,并将其与上一最小时间单位小样本数据模板Dt-1级联拼接,作为新的待聚合数据,通过步骤三所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板Dt保存至在线计算数据库中,此时,小样本数据模板Dt既包含历史数据信息,也涵盖本最小时间单位新增的模式特点;
步骤九、以小样本数据模板Dt为训练集,验证数据模板Zv为验证集,对与步骤五中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板Zv上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中;
步骤十、提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据Xc为输入,计算得到状态参量的参考值yc
2.根据权利要求1所述的一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,所述步骤一中,所示每最小时间单位历史数据
Figure FDA0003103818390000021
其中L代表该月所记录的时序数据条数,每条数据
Figure FDA0003103818390000022
由需计算的状态参量的测量值
Figure FDA0003103818390000023
及该参量相关的特征测量值
Figure FDA0003103818390000024
组成,l代表该月的第l条数据,N代表每条数据所记录的特征维数,通常情况下L>>200000,N>>15。
3.根据权利要求1所述的一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,所述步骤三中的基于局部敏感哈希算法的数据聚合算法,具体步骤如下:
步骤(1).对每条数据
Figure FDA0003103818390000025
经哈希函数映射后的数值
Figure FDA0003103818390000026
Figure FDA0003103818390000027
上式中,随机矩阵
Figure FDA0003103818390000028
均满足N~(0,1)标准正态分布,r0为预设敏感阈值,共同构成哈希函数H(.),T表示矩阵转置;
步骤(2).对映射后的hl=[h1,h2,...,hS]的每一维数值hs通过符号函数进行0,1二进制编码,作为每条数据的键值kl=[k1,k2,...,kS]进行标记,每条数据可记为(kl,zl);提取该月数据的键值集合K={k1,k2,...,kQ},对每个键值建立Q个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中;
Figure FDA0003103818390000029
上式中,sgn(.)为符号函数;
步骤(3).对每个哈希桶中数据
Figure FDA0003103818390000031
每次取出两条数据
Figure FDA0003103818390000032
作为数据对进行欧式距离计算,其中J代表键值为kq的哈希桶中的数据条数,
Figure FDA0003103818390000033
分别代表键值为kq哈希桶中的第i条和第m条不同的数据,i≠m;若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据
Figure FDA0003103818390000034
加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
Figure FDA0003103818390000035
Figure FDA0003103818390000036
上式中,且
Figure FDA0003103818390000037
步骤(4)、将Q个哈希桶中剩余数据,进行级联拼接,得到原始数据z对应的聚合数据
Figure FDA0003103818390000038
其中zq′为键值为kq哈希桶的剩余数据,L′为聚合数据样本数,且L′<<L,通常在5000以内。
4.根据权利要求1所述的一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,步骤五中模型具体为:
gi+1=σ(Ai·gi+Ci)
Figure FDA0003103818390000039
上式中Ai和Bi代表第i层神经网络的神经元权重和偏置,σ(.)为激活函数,可取sigmoid、tanh或relu,gi和gi+1分别代表第i层神经网络的输入和输出,yj
Figure FDA00031038183900000310
分别代表第j个样本的实测值和模型计算值。
CN202110631676.0A 2021-06-07 2021-06-07 一种面向发电设备状态参量参考值的增量式计算方法 Active CN113393107B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110631676.0A CN113393107B (zh) 2021-06-07 2021-06-07 一种面向发电设备状态参量参考值的增量式计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110631676.0A CN113393107B (zh) 2021-06-07 2021-06-07 一种面向发电设备状态参量参考值的增量式计算方法

Publications (2)

Publication Number Publication Date
CN113393107A true CN113393107A (zh) 2021-09-14
CN113393107B CN113393107B (zh) 2022-08-12

Family

ID=77618554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110631676.0A Active CN113393107B (zh) 2021-06-07 2021-06-07 一种面向发电设备状态参量参考值的增量式计算方法

Country Status (1)

Country Link
CN (1) CN113393107B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530812A (zh) * 2013-07-25 2014-01-22 国家电网公司 一种基于局部敏感哈希的电网状态相似度量化分析方法
US20160371405A1 (en) * 2015-06-19 2016-12-22 General Electric Company Systems and Methods of Forecasting Power Plant Performance
CN106649715A (zh) * 2016-12-21 2017-05-10 中国人民解放军国防科学技术大学 一种基于局部敏感哈希算法和神经网络的跨媒体检索方法
CN107194414A (zh) * 2017-04-25 2017-09-22 浙江工业大学 一种基于局部敏感哈希的svm快速增量学习算法
CN110045237A (zh) * 2019-04-08 2019-07-23 国网上海市电力公司 基于果蝇算法优化的变压器状态参量数据预测方法及系统
CN110275868A (zh) * 2019-06-21 2019-09-24 厦门嵘拓物联科技有限公司 一种智能工厂中多模态制造数据预处理的方法
CN111191801A (zh) * 2019-12-10 2020-05-22 国网甘肃省电力公司 一种基于全景监测及智能预警的配电网数据源构建方法
CN111241106A (zh) * 2020-01-15 2020-06-05 平安科技(深圳)有限公司 近似数据处理方法、装置、介质及电子设备
US20200265301A1 (en) * 2019-02-15 2020-08-20 Microsoft Technology Licensing, Llc Incremental training of machine learning tools
CN111768082A (zh) * 2020-06-02 2020-10-13 广东电网有限责任公司 一种基于大数据分析的电力设备状态评估方法
CN112102111A (zh) * 2020-09-27 2020-12-18 华电福新广州能源有限公司 一种发电厂数据智能处理系统
CN112668870A (zh) * 2020-12-25 2021-04-16 苏州热工研究院有限公司 一种核电厂设备状态在线智能监测方法及计算机终端
CN112859645A (zh) * 2021-02-02 2021-05-28 东方电气集团科学技术研究院有限公司 一种综合能源系统性能测试平台
CN112883995A (zh) * 2020-12-30 2021-06-01 华北电力大学 基于集成学习的闭源电力工控系统恶意行为识别方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530812A (zh) * 2013-07-25 2014-01-22 国家电网公司 一种基于局部敏感哈希的电网状态相似度量化分析方法
US20160371405A1 (en) * 2015-06-19 2016-12-22 General Electric Company Systems and Methods of Forecasting Power Plant Performance
CN106649715A (zh) * 2016-12-21 2017-05-10 中国人民解放军国防科学技术大学 一种基于局部敏感哈希算法和神经网络的跨媒体检索方法
CN107194414A (zh) * 2017-04-25 2017-09-22 浙江工业大学 一种基于局部敏感哈希的svm快速增量学习算法
US20200265301A1 (en) * 2019-02-15 2020-08-20 Microsoft Technology Licensing, Llc Incremental training of machine learning tools
CN110045237A (zh) * 2019-04-08 2019-07-23 国网上海市电力公司 基于果蝇算法优化的变压器状态参量数据预测方法及系统
CN110275868A (zh) * 2019-06-21 2019-09-24 厦门嵘拓物联科技有限公司 一种智能工厂中多模态制造数据预处理的方法
CN111191801A (zh) * 2019-12-10 2020-05-22 国网甘肃省电力公司 一种基于全景监测及智能预警的配电网数据源构建方法
CN111241106A (zh) * 2020-01-15 2020-06-05 平安科技(深圳)有限公司 近似数据处理方法、装置、介质及电子设备
CN111768082A (zh) * 2020-06-02 2020-10-13 广东电网有限责任公司 一种基于大数据分析的电力设备状态评估方法
CN112102111A (zh) * 2020-09-27 2020-12-18 华电福新广州能源有限公司 一种发电厂数据智能处理系统
CN112668870A (zh) * 2020-12-25 2021-04-16 苏州热工研究院有限公司 一种核电厂设备状态在线智能监测方法及计算机终端
CN112883995A (zh) * 2020-12-30 2021-06-01 华北电力大学 基于集成学习的闭源电力工控系统恶意行为识别方法及装置
CN112859645A (zh) * 2021-02-02 2021-05-28 东方电气集团科学技术研究院有限公司 一种综合能源系统性能测试平台

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
ARSLAN HABIB, RABEH ABBASSI: "Forecasting model for wind power integrating least squares support vector machine, singular spectrum analysis, deep belief network, and locality-sensitive hashing", 《WILEY》 *
L. LIU; T. Y. JI; M. S. LI; Q. H. WU: "Short-term Wind Power Local Forecast based on Morphological High-frequency Filter and Local-sensitive Hashing", 《 2019 IEEE PES GTD GRAND INTERNATIONAL CONFERENCE AND EXPOSITION ASIA (GTD ASIA)》 *
RADHAKRISHNAN MAIVIZHI; PALANICHAMY YOGESH: "Spatial Correlation based Data Redundancy Elimination for Data Aggregation in Wireless Sensor Networks", 《2020 INTERNATIONAL CONFERENCE ON INNOVATIVE TRENDS IN INFORMATION TECHNOLOGY (ICITIIT)》 *
梁涛等: "火电厂智能化远程管理云平台系统设计", 《中国测试》 *
王正杰; 田军; 唐健; 杨嘉伟: "电网电压不平衡条件下三相锁相环的性能比较", 《东方电气评论》 *
陈富国,彭跃辉,宋选锋,张有平,寇新民: "基于哈希算法的电力设备局部放电模式识别研究", 《高电压技术》 *

Also Published As

Publication number Publication date
CN113393107B (zh) 2022-08-12

Similar Documents

Publication Publication Date Title
CN110210993B (zh) 基于循环神经网络模型的城市短期燃气负荷预测方法
CN111639783A (zh) 一种基于lstm神经网络的线损预测方法及系统
CN102562469A (zh) 基于校正算法的短期风力发电机输出功率预测方法
CN114548509B (zh) 一种多能源系统多类型负荷联合预测方法及系统
CN105354620A (zh) 一种风机发电功率的预测方法
CN115438726A (zh) 一种基于数字孪生技术的设备寿命与故障类型预测方法及系统
CN111931989A (zh) 基于深度学习神经网络的电力系统短期负荷预测方法
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN115204491A (zh) 基于数字孪生与lstm的生产线工况预测方法及系统
CN113822418A (zh) 一种风电场功率预测方法、系统、设备和存储介质
CN112669168B (zh) 一种风电功率短期预测方法
Velasco et al. Next day electric load forecasting using Artificial Neural Networks
CN112381673A (zh) 一种基于数字孪生的园区用电信息分析方法及装置
CN108830405B (zh) 基于多指标动态匹配的实时电力负荷预测系统及其方法
CN113988210A (zh) 结构监测传感网失真数据修复方法、装置及存储介质
CN114021483A (zh) 基于时域特征与XGBoost的超短期风电功率预测方法
CN114330934A (zh) 一种模型参数自适应的gru新能源短期发电功率预测方法
CN114692981B (zh) 基于Seq2Seq模型的中长期径流预报方法和系统
CN116703644A (zh) 一种基于Attention-RNN的短期电力负荷预测方法
CN110807508A (zh) 计及复杂气象影响的母线峰值负荷预测方法
CN110750455A (zh) 基于系统日志分析的智能在线自更新故障诊断方法和系统
CN113393107B (zh) 一种面向发电设备状态参量参考值的增量式计算方法
CN115796000B (zh) 一种基于堆叠机器学习算法的短期气温预报集合订正方法
CN117408833A (zh) 一种基于负荷辨识的短期负荷预测的方法
CN117113086A (zh) 一种储能机组负荷预测方法、系统、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant