CN113393107A - 一种面向发电设备状态参量参考值的增量式计算方法 - Google Patents
一种面向发电设备状态参量参考值的增量式计算方法 Download PDFInfo
- Publication number
- CN113393107A CN113393107A CN202110631676.0A CN202110631676A CN113393107A CN 113393107 A CN113393107 A CN 113393107A CN 202110631676 A CN202110631676 A CN 202110631676A CN 113393107 A CN113393107 A CN 113393107A
- Authority
- CN
- China
- Prior art keywords
- data
- calculation
- model
- aggregated
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 141
- 238000010248 power generation Methods 0.000 title claims abstract description 28
- 238000004220 aggregation Methods 0.000 claims abstract description 38
- 230000002776 aggregation Effects 0.000 claims abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000012795 verification Methods 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 24
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 4
- 238000013499 data model Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 4
- 230000017105 transposition Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 20
- 238000007726 management method Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Probability & Statistics with Applications (AREA)
- Molecular Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Educational Administration (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Public Health (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Water Supply & Treatment (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Computational Biology (AREA)
- Fuzzy Systems (AREA)
Abstract
本申请涉及智慧电厂发电设备领域,尤其是针对发电机定子部件重要状态参量的参考值计算方式的一种面向发电设备状态参量参考值的增量式计算框架方法。本方法基于局部敏感哈希算法分别对发电设备相关历史数据和新增数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的。并且本发明相较于传统的增量式计算方法,具有计算速度快,计算开销小,计算精度高等特点。
Description
技术领域
本申请涉及智慧电厂发电设备领域,尤其是针对发电机定子部件重要状态参量的参考值计算方式的一种面向发电设备状态参量参考值的增量式计算方法。
背景技术
随着“互联网+”智慧能源发展意见的推进,以智能管控一体化系统为核心的智慧电厂应运而生。智慧电厂对传感器采集数据进行全面整合处理,进行管理决策制定,以期形成一套覆盖火力发电厂全生命周期的智能传感、智能执行、智能控制、智能优化和智能管控的技术方案。其中智能管控技术以自学习、自分析为依托,通过对设备机组的海量历史数据进行数据挖掘,结合输入和输出对象建立系统工况模型,再通过实时运行数据与建立的历史工况模式进行比对,实现对设备缺陷或故障的预判或诊断。因此,准确地对设备重要状态参量进行参考值计算和阈值分析,是智能管控模块的关键技术。
目前,针对发电设备状态参量参考值的计算方法主要包括基于统计学的计算方法,基于机器学习和深度学习的回归计算方法。前者通过状态参量及其相关特征的因果关系和关联关系进行相关回归,如最小二乘法等,但计算效果通常受制于回归函数复杂程度。后者通过建立有监督的输入和输出黑盒模型,对状态参量进行不同工况下的数值拟合,得益于机器学习和深度学习模型的非线性函数组合和复杂度可调节网络,目前在参考值计算精度上获得了广泛的应用。
在设备正常老化和负荷峰谷周期交替等多中因素的影响下,设备状态参量存在多变性,为保证模型的时效性,状态参量计算模型需要定期对新采集数据进行增量式计算。目前采用的增量式计算模型,直接将新采集数据与历史数据在时间维度上进行拼接,视作新的训练集对模型进行校验更新。在传感器采样频率高、采样点繁多的背景下,上述增量式计算方法容易造成训练集数据爆发式增长,对计算硬件的内存和性能要求极为严苛。
虽然发电设备具有工况多变的特性,但也不乏长时间工作于同一工况下的情况,导致同一时段内所采集的数据通常富有冗余性。因此,对发电设备相关数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的,具有一定的实际应用意义。
发明内容
本发明的目的在于解决发电机定子部件重要状态参量参考值的增量式计算问题,提供了一种面向发电设备状态参量参考值的增量式计算框架方法,主要应用于发电设备中大数据的增量式计算过程,减少数据大量增长对计算硬件的压力。
本发明的技术内容如下:
一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,包括如下步骤:
步骤一、从离线存储数据库以最小时间单位提取历史数据;这里最小时间单位可以自定义为周、月、年等时间单位用以提取历史数据。
步骤二、以每个最小时间单位历史数据为待聚合数据z;
步骤三、对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z′;
步骤四、将各历史数据中最小时间单位聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤三基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板D0保存至在线计算数据库中;
步骤四具体是将原始数据按照最小时间单位分为多个待聚合数据z,对每个 z分别进行基于局部敏感哈希算法的数据聚合得到每个最小时间单位的聚合后数据z′,其中每个z′与z对应,将所有z′进行级联拼接,组合成新的待聚合数据,再次进行数据聚合,生成小样本数据模板D0。
步骤五、建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss 损失函数选取均方根误差;
步骤六、以小样本数据模板D0为训练集,所有历史最小时间单位源数据Z0为验证集,对步骤五所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型;
步骤七、对离线存储数据库最近新增一个最小时间单位的数据Zt,将其与过去3-12个最小时间单位数据组成新的验证模板Zv,保存至在线计算数据库中;
这里提到的过去3-12个最小时间单位数据与本次小时间单位源新增数据共同组成了验证数据模板Zv,用来验证后续预测模型的精度。
步骤八、将新增数据Zt作为待聚合数据进行步骤三所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据Z′t,并将其与上一最小时间单位小样本数据模板Dt-1级联拼接,作为新的待聚合数据,通过步骤三所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板Dt保存至在线计算数据库中,此时,小样本数据模板Dt既包含历史数据信息,也涵盖本最小时间单位新增的模式特点;
步骤九、以小样本数据模板Dt为训练集,验证数据模板Zv为验证集,对与步骤五中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板Zv上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中;
步骤十、提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据Xc为输入,计算得到状态参量的参考值yc。
进一步地,所述步骤一中,所示每最小时间单位历史数据其中L代表该最小时间单位所记录的时序数据条数,每条数据由需计算的状态参量的测量值及该参量相关的特征测量值组成,l代表该最小时间单位的第l条数据,N代表每条数据所记录的特征维数,通常情况下L>>200000,N>>15。
进一步地,所述步骤三中的基于局部敏感哈希算法的数据聚合算法,具体步骤如下:
步骤(2).对映射后的hl=[h1,h2,...,hS]的每一维数值hs通过符号函数进行0, 1二进制编码,作为每条数据的键值kl=[k1,k2,...,kS]进行标记,每条数据可记为 (kl,zl);提取该最小时间单位数据的键值集合K={k1,k2,...,kQ},对每个键值建立Q 个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中;
上式中,sgn(.)为符号函数;
步骤(3).对每个哈希桶中数据每次取出两条数据作为数据对进行欧式距离计算,其中J代表键值为kq的哈希桶中的数据条数,分别代表键值为kq哈希桶中的第i条和第m条不同的数据,i≠m;若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
进一步地,步骤五中模型具体为:
gi+1=σ(Ai·gi+Ci)
上式中Ai和Bi代表第i层神经网络的神经元权重和偏置,σ(.)为激活函数,可取sigmoid、tanh或relu,gi和gi+1分别代表第i层神经网络的输入和输出,yj和分别代表第j个样本的实测值和模型计算值。
本发明的有益效果如下:
1、本发明的目的在于解决发电机定子部件重要状态参量参考值的增量式计算问题,提供了一种面向发电设备状态参量参考值的增量式计算框架方法,主要应用于发电设备中大数据的增量式计算过程,减少数据大量增长对计算硬件的压力。同一时段内所采集的数据通常富有冗余性,本发明通过步骤三、步骤八-九所述的基于局部敏感哈希算法分别对发电设备相关历史数据和新增数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的。并且本发明相较于传统的增量式计算方法,具有计算速度快,计算开销小,计算精度高等特点。
2、本发明面向发电设备状态参量参考值的增量式计算,首先利用局部敏感哈希算法对离线存储数据库中各历史周期的采样数据进行数据聚合生成小样本数据模板,利用小样本数据模板作为训练集,历史源数据为验证集对基于深度神经网络的回归计算模型进行训练,并存储于在线计算数据库中。对新采集周期数据,同样利用局部敏感哈希进行数据聚合,并与历史存储的小样本数据模板进行级联拼接,再进行一次数据聚合得到涵盖最新特征的小样本数据模板。以历史最近6个周期数据为验证数据模板,并作为回归计算模型的验证集,用最新数据模板为训练集进行回归计算模型更新。利用在线计算数据库中最新的回归计算模型对待计算数据进行状态参量的参考值计算。本发明实现过程中,在保证发电设备状态参量计算精度的情况下,缓解了状态参量数据日益积累造成的计算开销,提升了计算模型更新速度,与传统的直接拼接增量式计算模型相比,简单实用,对计算硬件要求简单,并可以实现多项状态参量的参考值计算具备通用性。
附图说明
图1为本发明的基于局部敏感哈希的数据聚合示意图。
图2为本发明的流程示意图。
具体实施方式
实施例1
一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,包括如下步骤:
步骤一、从离线存储数据库以最小时间单位提取历史数据;这里最小时间单位可以自定义为周、月、年等时间单位用以提取历史数据。进一步地,所示每最小时间单位历史数据其中L代表该最小时间单位所记录的时序数据条数,每条数据由需计算的状态参量的测量值及该参量相关的特征测量值组成,l代表该最小时间单位的第l条数据,N代表每条数据所记录的特征维数,通常情况下L>>200000,N>>15。
步骤二、以每个最小时间单位历史数据为待聚合数据z;
步骤三、对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z′;
具体步骤如下:
步骤(2).对映射后的hl=[h1,h2,...,hS]的每一维数值hs通过符号函数进行0, 1二进制编码,作为每条数据的键值kl=[k1,k2,...,kS]进行标记,每条数据可记为 (kl,zl);提取该最小时间单位数据的键值集合K={k1,k2,...,kQ},对每个键值建立Q 个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中;
上式中,sgn(.)为符号函数;
步骤(3).对每个哈希桶中数据每次取出两条数据作为数据对进行欧式距离计算,其中J代表键值为kq的哈希桶中的数据条数,分别代表键值为kq哈希桶中的第i条和第m条不同的数据,i≠m;若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
步骤四、将各历史数据中最小时间单位聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤三基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板D0保存至在线计算数据库中;
步骤四具体是将原始数据按照最小时间单位分为多个待聚合数据z,对每个 z分别进行基于局部敏感哈希算法的数据聚合得到每个最小时间单位的聚合后数据z′,其中每个z′与z对应,将所有z′进行级联拼接,组合成新的待聚合数据,再次进行数据聚合,生成小样本数据模板D0。
步骤五、建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss 损失函数选取均方根误差;
步骤五中模型具体为:
gi+1=σ(Ai·gi+Ci)
上式中Ai和Bi代表第i层神经网络的神经元权重和偏置,σ(.)为激活函数,可取sigmoid、tanh或relu,gi和gi+1分别代表第i层神经网络的输入和输出,yj和分别代表第j个样本的实测值和模型计算值。
步骤六、以小样本数据模板D0为训练集,所有历史最小时间单位源数据Z0为验证集,对步骤五所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型;
步骤七、对离线存储数据库最近新增一个最小时间单位的数据Zt,将其与过去3-12个最小时间单位数据组成新的验证模板Zv,保存至在线计算数据库中;
这里提到的过去3-12个最小时间单位数据与本次小时间单位源新增数据共同组成了验证数据模板Zv,用来验证后续预测模型的精度。
步骤八、将新增数据Zt作为待聚合数据进行步骤三所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据Z′t,并将其与上一最小时间单位小样本数据模板Dt-1级联拼接,作为新的待聚合数据,通过步骤三所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板Dt保存至在线计算数据库中,此时,小样本数据模板Dt既包含历史数据信息,也涵盖本最小时间单位新增的模式特点;
步骤九、以小样本数据模板Dt为训练集,验证数据模板Zv为验证集,对与步骤五中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板Zv上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中;
步骤十、提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据Xc为输入,计算得到状态参量的参考值yc。
本发明提供了一种面向发电设备状态参量参考值的增量式计算框架方法,主要应用于发电设备中大数据的增量式计算过程,减少数据大量增长对计算硬件的压力。同一时段内所采集的数据通常富有冗余性,本发明通过步骤三、步骤八- 九所述的基于局部敏感哈希算法分别对发电设备相关历史数据和新增数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的。并且本发明相较于传统的增量式计算方法,具有计算速度快,计算开销小,计算精度高等特点。
本发明首先利用局部敏感哈希算法对离线存储数据库中各历史周期的采样数据进行数据聚合生成小样本数据模板,利用小样本数据模板作为训练集,历史源数据为验证集对基于深度神经网络的回归计算模型进行训练,并存储于在线计算数据库中。对新采集周期数据,同样利用局部敏感哈希进行数据聚合,并与历史存储的小样本数据模板进行级联拼接,再进行一次数据聚合得到涵盖最新特征的小样本数据模板。以历史最近6个周期数据为验证数据模板,并作为回归计算模型的验证集,用最新数据模板为训练集进行回归计算模型更新。利用在线计算数据库中最新的回归计算模型对待计算数据进行状态参量的参考值计算。本发明实现过程中,在保证发电设备状态参量计算精度的情况下,缓解了状态参量数据日益积累造成的计算开销,提升了计算模型更新速度,与传统的直接拼接增量式计算模型相比,简单实用,对计算硬件要求简单,并可以实现多项状态参量的参考值计算具备通用性。
实施例2
根据图2所示,本发明设计的一种面向发电设备状态参量参考值的增量式计算框架方法,其计算步骤如下:
(1)从离线存储数据库以月为单位提取历史数据。
所示每月历史数据其中L代表该月所记录的时序数据条数,每条数据由需计算的状态参量的测量值及该参量相关的特征测量值组成,l代表该月的第 l条数据,N代表每条数据所记录的特征维数,通常情况下L>>200000,N>>15。
(2)以每月历史数据为待聚合数据z进行步骤(3)所述的基于局部敏感哈希算法进行数据聚合。
(3)对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z′。所述的基于局部敏感哈希算法的数据聚合算法,具体步骤如下:
②对映射后的hl=[h1,h2,...,hS]的每一维数值hs通过符号函数进行0,1 二进制编码,作为每条数据的键值kl=[k1,k2,...,kS]进行标记,每条数据可记为(kl,zl)。提取该月数据的键值集合K={k1,k2,...,kQ},对每个键值建立Q个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中。
上式中,sgn(.)为符号函数。
③对每个哈希桶中数据每次取出两条数据作为数据对进行欧式距离计算,其中J代表键值为kq的哈希桶中的数据条数,分别代表键值为kq哈希桶中的第i条和第m条不同的数据, i≠m。若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
(4)将各历史月份聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤(3)所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板D0保存至在线计算数据库中。 (5)建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss损失函数选取均方根误差。
gi+1=σ(Ai·gi+Ci)
上式中Ai和Bi代表第i层神经网络的神经元权重和偏置,σ(.)为激活函数,可取sigmoid、tanh或relu,gi和gi+1分别代表第i层神经网络的输入和输出,yj和分别代表第j个样本的实测值和模型计算值。
(6)以小样本数据模板D0为训练集,所有历史月份源数据Z0为验证集,对步骤(5)所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型。
(7)对离线存储数据库最近新增一个月的数据Zt,将其与过去5个月数据组成新的验证模板Zv,保存至在线计算数据库中。
(8)将新增数据Zt作为待聚合数据进行步骤(3)所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据Z′t,并将其与上一月小样本数据模板Dt-1级联拼接,作为新的待聚合数据,通过步骤(3)所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板Dt保存至在线计算数据库中。此时,小样本数据模板Dt既包含历史数据信息,也涵盖本月新增的模式特点。
(9)以小样本数据模板Dt为训练集,验证数据模板Zv为验证集,对与步骤(5)中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板Zv上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中。
(10)提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据Xc为输入,计算得到状态参量的参考值yc。
Claims (4)
1.一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,包括如下步骤:
步骤一、从离线存储数据库以最小时间单位提取历史数据;
步骤二、以每个最小时间单位历史数据为待聚合数据z;
步骤三、对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z′;
步骤四、将各历史数据中最小时间单位聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤三基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板D0保存至在线计算数据库中;
步骤五、建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss损失函数选取均方根误差;
步骤六、以小样本数据模板D0为训练集,所有历史最小时间单位源数据Z0为验证集,对步骤五所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型;
步骤七、对离线存储数据库最近新增一个最小时间单位的数据Zt,将其与过去3-12个最小时间单位数据组成新的验证模板Zv,保存至在线计算数据库中;
步骤八、将新增数据Zt作为待聚合数据进行步骤三所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据Z′t,并将其与上一最小时间单位小样本数据模板Dt-1级联拼接,作为新的待聚合数据,通过步骤三所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板Dt保存至在线计算数据库中,此时,小样本数据模板Dt既包含历史数据信息,也涵盖本最小时间单位新增的模式特点;
步骤九、以小样本数据模板Dt为训练集,验证数据模板Zv为验证集,对与步骤五中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板Zv上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中;
步骤十、提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据Xc为输入,计算得到状态参量的参考值yc。
3.根据权利要求1所述的一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,所述步骤三中的基于局部敏感哈希算法的数据聚合算法,具体步骤如下:
步骤(2).对映射后的hl=[h1,h2,...,hS]的每一维数值hs通过符号函数进行0,1二进制编码,作为每条数据的键值kl=[k1,k2,...,kS]进行标记,每条数据可记为(kl,zl);提取该月数据的键值集合K={k1,k2,...,kQ},对每个键值建立Q个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中;
上式中,sgn(.)为符号函数;
步骤(3).对每个哈希桶中数据每次取出两条数据作为数据对进行欧式距离计算,其中J代表键值为kq的哈希桶中的数据条数,分别代表键值为kq哈希桶中的第i条和第m条不同的数据,i≠m;若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110631676.0A CN113393107B (zh) | 2021-06-07 | 2021-06-07 | 一种面向发电设备状态参量参考值的增量式计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110631676.0A CN113393107B (zh) | 2021-06-07 | 2021-06-07 | 一种面向发电设备状态参量参考值的增量式计算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113393107A true CN113393107A (zh) | 2021-09-14 |
CN113393107B CN113393107B (zh) | 2022-08-12 |
Family
ID=77618554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110631676.0A Active CN113393107B (zh) | 2021-06-07 | 2021-06-07 | 一种面向发电设备状态参量参考值的增量式计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113393107B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103530812A (zh) * | 2013-07-25 | 2014-01-22 | 国家电网公司 | 一种基于局部敏感哈希的电网状态相似度量化分析方法 |
US20160371405A1 (en) * | 2015-06-19 | 2016-12-22 | General Electric Company | Systems and Methods of Forecasting Power Plant Performance |
CN106649715A (zh) * | 2016-12-21 | 2017-05-10 | 中国人民解放军国防科学技术大学 | 一种基于局部敏感哈希算法和神经网络的跨媒体检索方法 |
CN107194414A (zh) * | 2017-04-25 | 2017-09-22 | 浙江工业大学 | 一种基于局部敏感哈希的svm快速增量学习算法 |
CN110045237A (zh) * | 2019-04-08 | 2019-07-23 | 国网上海市电力公司 | 基于果蝇算法优化的变压器状态参量数据预测方法及系统 |
CN110275868A (zh) * | 2019-06-21 | 2019-09-24 | 厦门嵘拓物联科技有限公司 | 一种智能工厂中多模态制造数据预处理的方法 |
CN111191801A (zh) * | 2019-12-10 | 2020-05-22 | 国网甘肃省电力公司 | 一种基于全景监测及智能预警的配电网数据源构建方法 |
CN111241106A (zh) * | 2020-01-15 | 2020-06-05 | 平安科技(深圳)有限公司 | 近似数据处理方法、装置、介质及电子设备 |
US20200265301A1 (en) * | 2019-02-15 | 2020-08-20 | Microsoft Technology Licensing, Llc | Incremental training of machine learning tools |
CN111768082A (zh) * | 2020-06-02 | 2020-10-13 | 广东电网有限责任公司 | 一种基于大数据分析的电力设备状态评估方法 |
CN112102111A (zh) * | 2020-09-27 | 2020-12-18 | 华电福新广州能源有限公司 | 一种发电厂数据智能处理系统 |
CN112668870A (zh) * | 2020-12-25 | 2021-04-16 | 苏州热工研究院有限公司 | 一种核电厂设备状态在线智能监测方法及计算机终端 |
CN112859645A (zh) * | 2021-02-02 | 2021-05-28 | 东方电气集团科学技术研究院有限公司 | 一种综合能源系统性能测试平台 |
CN112883995A (zh) * | 2020-12-30 | 2021-06-01 | 华北电力大学 | 基于集成学习的闭源电力工控系统恶意行为识别方法及装置 |
-
2021
- 2021-06-07 CN CN202110631676.0A patent/CN113393107B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103530812A (zh) * | 2013-07-25 | 2014-01-22 | 国家电网公司 | 一种基于局部敏感哈希的电网状态相似度量化分析方法 |
US20160371405A1 (en) * | 2015-06-19 | 2016-12-22 | General Electric Company | Systems and Methods of Forecasting Power Plant Performance |
CN106649715A (zh) * | 2016-12-21 | 2017-05-10 | 中国人民解放军国防科学技术大学 | 一种基于局部敏感哈希算法和神经网络的跨媒体检索方法 |
CN107194414A (zh) * | 2017-04-25 | 2017-09-22 | 浙江工业大学 | 一种基于局部敏感哈希的svm快速增量学习算法 |
US20200265301A1 (en) * | 2019-02-15 | 2020-08-20 | Microsoft Technology Licensing, Llc | Incremental training of machine learning tools |
CN110045237A (zh) * | 2019-04-08 | 2019-07-23 | 国网上海市电力公司 | 基于果蝇算法优化的变压器状态参量数据预测方法及系统 |
CN110275868A (zh) * | 2019-06-21 | 2019-09-24 | 厦门嵘拓物联科技有限公司 | 一种智能工厂中多模态制造数据预处理的方法 |
CN111191801A (zh) * | 2019-12-10 | 2020-05-22 | 国网甘肃省电力公司 | 一种基于全景监测及智能预警的配电网数据源构建方法 |
CN111241106A (zh) * | 2020-01-15 | 2020-06-05 | 平安科技(深圳)有限公司 | 近似数据处理方法、装置、介质及电子设备 |
CN111768082A (zh) * | 2020-06-02 | 2020-10-13 | 广东电网有限责任公司 | 一种基于大数据分析的电力设备状态评估方法 |
CN112102111A (zh) * | 2020-09-27 | 2020-12-18 | 华电福新广州能源有限公司 | 一种发电厂数据智能处理系统 |
CN112668870A (zh) * | 2020-12-25 | 2021-04-16 | 苏州热工研究院有限公司 | 一种核电厂设备状态在线智能监测方法及计算机终端 |
CN112883995A (zh) * | 2020-12-30 | 2021-06-01 | 华北电力大学 | 基于集成学习的闭源电力工控系统恶意行为识别方法及装置 |
CN112859645A (zh) * | 2021-02-02 | 2021-05-28 | 东方电气集团科学技术研究院有限公司 | 一种综合能源系统性能测试平台 |
Non-Patent Citations (6)
Title |
---|
ARSLAN HABIB, RABEH ABBASSI: "Forecasting model for wind power integrating least squares support vector machine, singular spectrum analysis, deep belief network, and locality-sensitive hashing", 《WILEY》 * |
L. LIU; T. Y. JI; M. S. LI; Q. H. WU: "Short-term Wind Power Local Forecast based on Morphological High-frequency Filter and Local-sensitive Hashing", 《 2019 IEEE PES GTD GRAND INTERNATIONAL CONFERENCE AND EXPOSITION ASIA (GTD ASIA)》 * |
RADHAKRISHNAN MAIVIZHI; PALANICHAMY YOGESH: "Spatial Correlation based Data Redundancy Elimination for Data Aggregation in Wireless Sensor Networks", 《2020 INTERNATIONAL CONFERENCE ON INNOVATIVE TRENDS IN INFORMATION TECHNOLOGY (ICITIIT)》 * |
梁涛等: "火电厂智能化远程管理云平台系统设计", 《中国测试》 * |
王正杰; 田军; 唐健; 杨嘉伟: "电网电压不平衡条件下三相锁相环的性能比较", 《东方电气评论》 * |
陈富国,彭跃辉,宋选锋,张有平,寇新民: "基于哈希算法的电力设备局部放电模式识别研究", 《高电压技术》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113393107B (zh) | 2022-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110210993B (zh) | 基于循环神经网络模型的城市短期燃气负荷预测方法 | |
CN111639783A (zh) | 一种基于lstm神经网络的线损预测方法及系统 | |
CN102562469A (zh) | 基于校正算法的短期风力发电机输出功率预测方法 | |
CN114548509B (zh) | 一种多能源系统多类型负荷联合预测方法及系统 | |
CN105354620A (zh) | 一种风机发电功率的预测方法 | |
CN115438726A (zh) | 一种基于数字孪生技术的设备寿命与故障类型预测方法及系统 | |
CN111931989A (zh) | 基于深度学习神经网络的电力系统短期负荷预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN115204491A (zh) | 基于数字孪生与lstm的生产线工况预测方法及系统 | |
CN113822418A (zh) | 一种风电场功率预测方法、系统、设备和存储介质 | |
CN112669168B (zh) | 一种风电功率短期预测方法 | |
Velasco et al. | Next day electric load forecasting using Artificial Neural Networks | |
CN112381673A (zh) | 一种基于数字孪生的园区用电信息分析方法及装置 | |
CN108830405B (zh) | 基于多指标动态匹配的实时电力负荷预测系统及其方法 | |
CN113988210A (zh) | 结构监测传感网失真数据修复方法、装置及存储介质 | |
CN114021483A (zh) | 基于时域特征与XGBoost的超短期风电功率预测方法 | |
CN114330934A (zh) | 一种模型参数自适应的gru新能源短期发电功率预测方法 | |
CN114692981B (zh) | 基于Seq2Seq模型的中长期径流预报方法和系统 | |
CN116703644A (zh) | 一种基于Attention-RNN的短期电力负荷预测方法 | |
CN110807508A (zh) | 计及复杂气象影响的母线峰值负荷预测方法 | |
CN110750455A (zh) | 基于系统日志分析的智能在线自更新故障诊断方法和系统 | |
CN113393107B (zh) | 一种面向发电设备状态参量参考值的增量式计算方法 | |
CN115796000B (zh) | 一种基于堆叠机器学习算法的短期气温预报集合订正方法 | |
CN117408833A (zh) | 一种基于负荷辨识的短期负荷预测的方法 | |
CN117113086A (zh) | 一种储能机组负荷预测方法、系统、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |