CN112926269A - 电厂边缘节点数据分组与清洗的方法及系统 - Google Patents
电厂边缘节点数据分组与清洗的方法及系统 Download PDFInfo
- Publication number
- CN112926269A CN112926269A CN202110277580.9A CN202110277580A CN112926269A CN 112926269 A CN112926269 A CN 112926269A CN 202110277580 A CN202110277580 A CN 202110277580A CN 112926269 A CN112926269 A CN 112926269A
- Authority
- CN
- China
- Prior art keywords
- data
- power plant
- grouping
- historical operating
- null
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000004140 cleaning Methods 0.000 title claims abstract description 33
- 238000004088 simulation Methods 0.000 claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 14
- 238000012935 Averaging Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 5
- 230000007547 defect Effects 0.000 description 3
- 238000005265 energy consumption Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Water Supply & Treatment (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供了一种电厂边缘节点数据分组与清洗的方法及系统,涉及电厂数据分组和清洗技术领域,该方法包括:步骤S1:在边缘设备上获取电厂运行数据,所述电厂运行数据包括电厂实时运行数据和电厂历史运行数据;步骤S2:对所述电厂历史运行数据进行分组;步骤S3:根据所述电厂历史运行数据的分组结果,基于BP神经网络训练数据仿真模型,并将训练好的数据仿真模型保存在边缘设备;步骤S4:根据步骤S3中的数据仿真模型,对步骤S1中的所述电厂实时运行数据进行清洗。本发明能够实现电厂运行数据的高效处理。
Description
技术领域
本发明涉及电厂数据分组和清洗技术领域,具体地,涉及一种电厂边缘节点数据分组与清洗的方法及系统。
背景技术
建设智慧电厂就是在智能发电的基础上,通过发电与其他产业的融合延伸,形成循环经济,提高能源和资源的利用率,承担更多保护环境和服务社会的功能,不仅可以成为电厂参与市场经济的资本,也是新时代生态环境建设和经济社会发展对电力企业的要求。
目前智慧电厂建设是电力行业信息化的发展方向,对电厂运行数据进行清洗是建设智慧电厂的关键步骤,随着电厂运行数据的数据量的迅速增加,以云计算模型为核心的集中式大数据处理方式在计算能力、网络延迟、能源消耗和隐私安全等方面呈现出不足,已难以实现数据的高效处理。
因此,现有技术中(2017年1月的期刊“华电技术”第1页公开了“一体化大数据平台方法”)的这种集中式数据清洗方法,其虽然能够实现对电厂运行数据的清洗,但在数据传输上具有较高的延迟。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种电厂边缘节点数据分组与清洗的方法及系统,能够高效的处理电厂运行数据。
根据本发明提供的一种电厂边缘节点数据分组与清洗的方法及系统,所述方案如下:
第一方面,提供了一种电厂边缘节点数据分组与清洗的方法,所述方法包括:
步骤S1:在边缘设备上获取电厂运行数据,所述电厂运行数据包括电厂实时运行数据和电厂历史运行数据;
步骤S2:对所述电厂历史运行数据进行分组;
步骤S3:根据所述电厂历史运行数据的分组结果,基于BP神经网络训练数据仿真模型,并将训练好的数据仿真模型保存在边缘设备;
步骤S4:根据步骤S3中的数据仿真模型,对步骤S1中的所述电厂实时运行数据进行清洗。
优选的,所述步骤S2具体如下:
对电厂历史运行数据进行聚类,得到电厂历史运行数据的初步分组结果;
对电厂历史运行数据的梯度进行聚类,得到电厂历史运行数据梯度的分组结果;
将电厂历史运行数据的初步分组结果和电厂历史运行数据梯度的分组结果进行求交集处理,得到电厂历史运行数据的最终分组结果。
优选的,所述步骤S3包括:
删除电厂历史运行数据中包含空值的数据;
对删除了空值的电厂历史运行数据进行归一化处理;
对于得到的分组结果,若组内包含的数据为n条,则分别以组内的其中一条数据作为目标变量,以剩余的n-1条数据作为输入变量,取总样本的80%作为训练样本,取总样本的20%作为测试样本,训练BP神经网络,最终训练得到n个数据仿真模型,并将得到数据仿真模型并保存到边缘设备。
优选的,所述步骤S4具体如下:
步骤S4.1:对电厂实时运行数据进行滤波;
步骤S4.2:对经过滤波的电厂实时运行数据中的每一条数据进行状态识别,若数据的梯度大于阈值或者出现连续不变号的情况时认为数据处于动态,否则认为数据处于稳态;
步骤S4.3:对电厂实时运行数据中的每一条数据进行空值插补;
步骤S4.4:对经过空值插补的电厂实时运行数据中的每一条数据进行异常检测;
步骤S4.5:对经过异常检测的电厂实时运行数据中的数据进行冗余测点数据去除,判断冗余测点的数据是否异常,将异常数据删除后将其余正常数据求平均后作为冗余测点的数据。
优选的,所述步骤S4.3具体如下:
当数据处于稳态且空值占比小于5%时采用均值替换进行空值插补;
当数据处于稳态且空值占比处于5-15%时采用拉格朗日插值法进行空值插补;
当数据处于动态或数据处于稳态但是空值占比大于15%时采用步骤S3中的数据仿真模型进行空值插补。
第二方面,提供了一种电厂边缘节点数据分组与清洗的系统,所述系统包括:
模块M1:在边缘设备上获取电厂运行数据,所述电厂运行数据包括电厂实时运行数据和电厂历史运行数据;
模块M2:对所述电厂历史运行数据进行分组;
模块M3:根据所述电厂历史运行数据的分组结果,基于BP神经网络训练数据仿真模型,并将训练好的数据仿真模型保存在边缘设备;
模块M4:根据模块M3中的数据仿真模型,对模块M1中的所述电厂实时运行数据进行清洗。
优选的,所述模块M2具体如下:
对电厂历史运行数据进行聚类,得到电厂历史运行数据的初步分组结果;
对电厂历史运行数据的梯度进行聚类,得到电厂历史运行数据梯度的分组结果;
将电厂历史运行数据的初步分组结果和电厂历史运行数据梯度的分组结果进行求交集处理,得到电厂历史运行数据的最终分组结果。
优选的,所述模块M3包括:
删除电厂历史运行数据中包含空值的数据;
对删除了空值的电厂历史运行数据进行归一化处理;
对于得到的分组结果,若组内包含的数据为n条,则分别以组内的其中一条数据作为目标变量,以剩余的n-1条数据作为输入变量,取总样本的80%作为训练样本,取总样本的20%作为测试样本,训练BP神经网络,最终训练得到n个数据仿真模型,并将得到数据仿真模型并保存到边缘设备。
优选的,所述模块M4具体如下:
模块M4.1:对电厂实时运行数据进行滤波;
模块M4.2:对经过滤波的电厂实时运行数据中的每一条数据进行状态识别,若数据的梯度大于阈值或者出现连续不变号的情况时认为数据处于动态,否则认为数据处于稳态;
模块M4.3:对电厂实时运行数据中的每一条数据进行空值插补;
模块M4.4:对经过空值插补的电厂实时运行数据中的每一条数据进行异常检测;
模块M4.5:对经过异常检测的电厂实时运行数据中的数据进行冗余测点数据去除,判断冗余测点的数据是否异常,将异常数据删除后将其余正常数据求平均后作为冗余测点的数据。
优选的,所述模块M4.3,具体如下:
当数据处于稳态且空值占比小于5%时采用均值替换进行空值插补;
当数据处于稳态且空值占比处于5-15%时采用拉格朗日插值法进行空值插补;
当数据处于动态或数据处于稳态但是空值占比大于15%时采用模块M3中的数据仿真模型进行空值插补。
与现有技术相比,本发明具有如下的有益效果:
本发明在对电厂运行数据进行清洗的过程中,随着电厂运行数据的数据量的迅速增加,能够克服以云计算模型为核心的集中式大数据处理方式在计算能力、网络延迟、能源消耗和隐私安全等方面呈现出不足,实现数据的高效处理。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明整体流程示意图;
图2为空值插补示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
本发明实施例提供了一种电厂边缘节点数据分组与清洗的方法,参照图1和图2所示,首先在边缘设备上获取电厂运行数据,电厂运行数据包括电厂实时运行数据和电厂历史运行数据,再采用改进的K-Means聚类方法,对电厂历史运行数据进行分组,具体为:
对电厂历史运行数据进行聚类,得到电厂历史运行数据的初步分组结果,再对电厂历史运行数据的梯度进行聚类,得到电厂历史运行数据梯度的分组结果。其次将电厂历史运行数据的初步分组结果和电厂历史运行数据梯度的分组结果进行求交集处理,得到电厂历史运行数据的最终分组结果。
其次,根据电厂历史运行数据的分组结果,基于BP神经网络训练数据仿真模型,将训练好的数据仿真模型保存在边缘设备,具体为:先删除电厂历史运行数据中包含空值的数据,再对删除了空值的电厂历史运行数据进行归一化处理,以每一组中的其中一条数据为目标变量,再以每一组中的其余数据为输入变量,例如组内包含的数据为n条,则分别以组内的其中一条数据作为目标变量,以剩余的n-1条数据作为输入变量。取总样本的80%作为训练样本,取总样本的20%作为测试样本,训练BP神经网络,最终训练得到n个数据仿真模型,并将得到数据仿真模型并保存到边缘设备。
得到数据仿真模型后,根据数据仿真模型,对前述中的电厂实时运行数据进行清洗:
首先对电厂实时运行数据进行滤波,再对经过滤波的电厂实时运行数据中的每一条数据进行状态识别,若数据的梯度大于阈值或者出现连续不变号的情况时认为数据处于动态,否则认为数据处于稳态。
随后,对电厂实时运行数据中的每一条数据进行空值插补,当数据处于稳态且空值占比小于5%时采用均值替换进行空值插补;当数据处于稳态且空值占比处于5-15%时采用拉格朗日插值法进行空值插补;当数据处于动态或数据处于稳态但是空值占比大于15%时采用前述步骤当中的数据仿真模型进行空值插补。本实施例中的拉格朗日插值法在数值分析中,是以法国十八世纪数学家约瑟夫·拉格朗日命名的一种多项式插值方法。
对经过空值插补的电厂实时运行数据中的每一条数据进行异常检测,当数据处于稳态时采用孤立森林方法或基于高斯概率密度分布的异常检测方法进行异常检测,当数据处于动态时基于前述步骤中的数据仿真模型进行异常检测,检测出的异常值视为空值,采用上一步骤中的方法进行空值插补。本实施例中孤立森林又名隔离森林,是一种从异常点出发,通过指定规则进行划分,根据划分次数进行判断的异常检测方法。
对经过异常检测的电厂实时运行数据中的数据进行冗余测点数据去除,根据皮尔逊相关系数判断冗余测点的数据是否异常,将异常数据删除后将其余正常数据求平均后作为冗余测点的数据。本实施例中的皮尔逊相关系数,在统计学中又称皮尔逊积矩相关系数,是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。
本发明实施例提供了一种电厂边缘节点数据分组与清洗的方法,在对电厂运行数据进行清洗的过程中,随着电厂运行数据的数据量的迅速增加,能够克服以云计算模型为核心的集中式大数据处理方式在计算能力、网络延迟、能源消耗和隐私安全等方面呈现出不足,实现数据的高效处理。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (10)
1.一种电厂边缘节点数据分组与清洗的方法,其特征在于,包括:
步骤S1:在边缘设备上获取电厂运行数据,所述电厂运行数据包括电厂实时运行数据和电厂历史运行数据;
步骤S2:对所述电厂历史运行数据进行分组;
步骤S3:根据所述电厂历史运行数据的分组结果,基于BP神经网络训练数据仿真模型,并将训练好的数据仿真模型保存在边缘设备;
步骤S4:根据步骤S3中的数据仿真模型,对步骤S1中的所述电厂实时运行数据进行清洗。
2.根据权利要求1所述的电厂边缘节点数据分组与清洗的方法,其特征在于,所述步骤S2具体如下:
步骤S2.1:对电厂历史运行数据进行聚类,得到电厂历史运行数据的初步分组结果;
步骤S2.2:对电厂历史运行数据的梯度进行聚类,得到电厂历史运行数据梯度的分组结果;
步骤S2.3:将电厂历史运行数据的初步分组结果和电厂历史运行数据梯度的分组结果进行求交集处理,得到电厂历史运行数据的最终分组结果。
3.根据权利要求1所述的电厂边缘节点数据分组与清洗的方法,其特征在于,所述步骤S3包括:
步骤S3.1:删除电厂历史运行数据中包含空值的数据;
步骤S3.2:对删除了空值的电厂历史运行数据进行归一化处理;
步骤S3.3:对于得到的分组结果,若组内包含的数据为n条,则分别以组内的其中一条数据作为目标变量,以剩余的n-1条数据作为输入变量,取总样本的80%作为训练样本,取总样本的20%作为测试样本,训练BP神经网络,最终训练得到n个数据仿真模型,并将得到数据仿真模型并保存到边缘设备。
4.根据权利要求1所述的电厂边缘节点数据分组与清洗的方法,其特征在于,所述步骤S4具体如下:
步骤S4.1:对电厂实时运行数据进行滤波;
步骤S4.2:对经过滤波的电厂实时运行数据中的每一条数据进行状态识别,若数据的梯度大于阈值或者出现连续不变号的情况时认为数据处于动态,否则认为数据处于稳态;
步骤S4.3:对电厂实时运行数据中的每一条数据进行空值插补;
步骤S4.4:对经过空值插补的电厂实时运行数据中的每一条数据进行异常检测;
步骤S4.5:对经过异常检测的电厂实时运行数据中的数据进行冗余测点数据去除,判断冗余测点的数据是否异常,将异常数据删除后将其余正常数据求平均后作为冗余测点的数据。
5.根据权利要求4所述的电厂边缘节点数据分组与清洗的方法,其特征在于,所述步骤S4.3具体如下:
当数据处于稳态且空值占比小于5%时采用均值替换进行空值插补;
当数据处于稳态且空值占比处于5-15%时采用拉格朗日插值法进行空值插补;
当数据处于动态或数据处于稳态但是空值占比大于15%时采用步骤S3中的数据仿真模型进行空值插补。
6.一种电厂边缘节点数据分组与清洗的系统,其特征在于,包括:
模块M1:在边缘设备上获取电厂运行数据,所述电厂运行数据包括电厂实时运行数据和电厂历史运行数据;
模块M2:对所述电厂历史运行数据进行分组;
模块M3:根据所述电厂历史运行数据的分组结果,基于BP神经网络训练数据仿真模型,并将训练好的数据仿真模型保存在边缘设备;
模块M4:根据模块M3中的数据仿真模型,对模块M1中的所述电厂实时运行数据进行清洗。
7.根据权利要求6所述的电厂边缘节点数据分组与清洗的系统,其特征在于,所述模块M2具体如下:
对电厂历史运行数据进行聚类,得到电厂历史运行数据的初步分组结果;
对电厂历史运行数据的梯度进行聚类,得到电厂历史运行数据梯度的分组结果;
将电厂历史运行数据的初步分组结果和电厂历史运行数据梯度的分组结果进行求交集处理,得到电厂历史运行数据的最终分组结果。
8.根据权利要求6所述的电厂边缘节点数据分组与清洗的系统,其特征在于,所述模块M3包括:
删除电厂历史运行数据中包含空值的数据;
对删除了空值的电厂历史运行数据进行归一化处理;
对于得到的分组结果,若组内包含的数据为n条,则分别以组内的其中一条数据作为目标变量,以剩余的n-1条数据作为输入变量,取总样本的80%作为训练样本,取总样本的20%作为测试样本,训练BP神经网络,最终训练得到n个数据仿真模型,并将得到数据仿真模型并保存到边缘设备。
9.根据权利要求6所述的电厂边缘节点数据分组与清洗的系统,其特征在于,所述模块M4具体如下:
模块M4.1:对电厂实时运行数据进行滤波;
模块M4.2:对经过滤波的电厂实时运行数据中的每一条数据进行状态识别,若数据的梯度大于阈值或者出现连续不变号的情况时认为数据处于动态,否则认为数据处于稳态;
模块M4.3:对电厂实时运行数据中的每一条数据进行空值插补;
模块M4.4:对经过空值插补的电厂实时运行数据中的每一条数据进行异常检测;
模块M4.5:对经过异常检测的电厂实时运行数据中的数据进行冗余测点数据去除,判断冗余测点的数据是否异常,将异常数据删除后将其余正常数据求平均后作为冗余测点的数据。
10.根据权利要求9所述的电厂边缘节点数据分组与清洗的系统,其特征在于,所述模块M4.3,具体如下:
当数据处于稳态且空值占比小于5%时采用均值替换进行空值插补;
当数据处于稳态且空值占比处于5-15%时采用拉格朗日插值法进行空值插补;
当数据处于动态或数据处于稳态但是空值占比大于15%时采用模块M3中的数据仿真模型进行空值插补。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110277580.9A CN112926269B (zh) | 2021-03-15 | 2021-03-15 | 电厂边缘节点数据分组与清洗的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110277580.9A CN112926269B (zh) | 2021-03-15 | 2021-03-15 | 电厂边缘节点数据分组与清洗的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112926269A true CN112926269A (zh) | 2021-06-08 |
CN112926269B CN112926269B (zh) | 2022-12-09 |
Family
ID=76175109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110277580.9A Active CN112926269B (zh) | 2021-03-15 | 2021-03-15 | 电厂边缘节点数据分组与清洗的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112926269B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114218184A (zh) * | 2022-02-21 | 2022-03-22 | 深圳市玄羽科技有限公司 | 工业互联网平台数据处理方法、装置及电子设备 |
CN114490596A (zh) * | 2021-12-08 | 2022-05-13 | 大唐水电科学技术研究院有限公司 | 一种基于机器学习与神经网络的变压器油色谱数据清洗的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858125A (zh) * | 2019-01-22 | 2019-06-07 | 中国大唐集团科学技术研究院有限公司火力发电技术研究院 | 一种基于径向基神经网络的火电机组供电煤耗计算方法 |
WO2020114978A1 (en) * | 2018-12-06 | 2020-06-11 | Siemens Aktiengesellschaft | Device and method for creating piping and instrument diagram (p&id) for power plant |
-
2021
- 2021-03-15 CN CN202110277580.9A patent/CN112926269B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020114978A1 (en) * | 2018-12-06 | 2020-06-11 | Siemens Aktiengesellschaft | Device and method for creating piping and instrument diagram (p&id) for power plant |
CN109858125A (zh) * | 2019-01-22 | 2019-06-07 | 中国大唐集团科学技术研究院有限公司火力发电技术研究院 | 一种基于径向基神经网络的火电机组供电煤耗计算方法 |
Non-Patent Citations (4)
Title |
---|
ZONG WEI: "Research on Cleaning Inaccurate Data in Production management module in ERP", 《PROCEEDINGS OF THE 2012 9TH INTERNATIONAL CONFERENCE ON SERVICE SYSTEMS AND SERVICE MANAGEMENT (ICSSSM 2012)》 * |
李星南; 施展; 亢中苗; 苏卓: "基于孤立森林算法和BP神经网络算法的电力运维数据清洗方法", 《电气应用》 * |
杜光程等: "基于BP神经网络的火电厂煤耗在线仿真", 《计算机仿真》 * |
杜晓亮;蒋志方;谭业浩: "基于样本自组织聚类的BP神经网络预测模型", 《计算机工程与应用》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114490596A (zh) * | 2021-12-08 | 2022-05-13 | 大唐水电科学技术研究院有限公司 | 一种基于机器学习与神经网络的变压器油色谱数据清洗的方法 |
CN114490596B (zh) * | 2021-12-08 | 2024-05-10 | 大唐水电科学技术研究院有限公司 | 一种基于机器学习与神经网络的变压器油色谱数据清洗的方法 |
CN114218184A (zh) * | 2022-02-21 | 2022-03-22 | 深圳市玄羽科技有限公司 | 工业互联网平台数据处理方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112926269B (zh) | 2022-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110377984B (zh) | 一种工业设备剩余有效寿命预测方法、系统及电子设备 | |
Sharp et al. | A survey of the advancing use and development of machine learning in smart manufacturing | |
CN107634857B (zh) | 基于svm的故障检测模型构建及评估方法 | |
CN112926269B (zh) | 电厂边缘节点数据分组与清洗的方法及系统 | |
Malafeyev et al. | Stochastic models of social-economic dynamics | |
Plakhotnikov et al. | The Use of Artificial Intelligence in Cyber-Physical Systems | |
CN109670695B (zh) | 基于离群数据挖掘的机械产品加工工序异常并行检测方法 | |
CN116756225B (zh) | 一种基于计算机网络安全的态势数据信息处理方法 | |
Li et al. | Fill missing data for wind farms using long short-term memory based recurrent neural network | |
Ismail et al. | Principal component regression with artificial neural network to improve prediction of electricity demand. | |
CN105787113A (zh) | 一种基于plm数据库面向dpipp工艺信息的挖掘算法 | |
Chen et al. | Reliability analysis using deep learning | |
DE112021001422T5 (de) | Algorithmische Lernmaschine zur dynamischen Erzeugung von Vorhersageanalysen aus Streaming-Daten mit hohem Volumen und hoher Geschwindigkeit | |
Waheeb et al. | Forecasting the behavior of gas furnace multivariate time series using ridge polynomial based neural network models | |
Leite et al. | Granular approach for evolving system modeling | |
Khalyasmaa et al. | The analysis of efficiency of artificial intelligence methods application for an assessment of feasibility of scientific and technical decisions | |
Goorden et al. | Supervisory control of multilevel discrete-event systems with a bus structure | |
CN115983714A (zh) | 边图神经网络电力系统静态安全评估方法及系统 | |
Horvath | New methods on the way to intelligent modeling in computer integrated engineering | |
CN114881162A (zh) | 计量自动化主站的故障预测方法、装置、设备及介质 | |
Chernyshev et al. | Integration of building information modeling and artificial intelligence systems to create a digital twin of the construction site | |
CN113807704A (zh) | 一种城市轨道交通数据的智能算法平台构建方法 | |
CN112926227A (zh) | 基于子部件可靠度函数的系统可靠性评估方法和系统 | |
Wang et al. | An enhanced software defect prediction model with multiple metrics and learners | |
CN114519445A (zh) | 一种业务交互网络的预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |