CN113986892A - 一种火电机组煤耗预测、数据清洗方法及系统 - Google Patents
一种火电机组煤耗预测、数据清洗方法及系统 Download PDFInfo
- Publication number
- CN113986892A CN113986892A CN202111073933.XA CN202111073933A CN113986892A CN 113986892 A CN113986892 A CN 113986892A CN 202111073933 A CN202111073933 A CN 202111073933A CN 113986892 A CN113986892 A CN 113986892A
- Authority
- CN
- China
- Prior art keywords
- data
- thermal power
- sample data
- generating unit
- power generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003245 coal Substances 0.000 title claims abstract description 73
- 238000004140 cleaning Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 41
- 238000007418 data mining Methods 0.000 claims abstract description 25
- 230000002159 abnormal effect Effects 0.000 claims abstract description 18
- 238000001514 detection method Methods 0.000 claims description 24
- 238000010586 diagram Methods 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 5
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 description 6
- 238000007405 data analysis Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 238000010977 unit operation Methods 0.000 description 2
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 239000003546 flue gas Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Fuzzy Systems (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Water Supply & Treatment (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了火电机组煤耗预测技术领域的一种火电机组煤耗预测、数据清洗方法及系统。火电机组煤耗预测数据清洗方法包括:获取给定时间段的火电机组历史运行数据,建立初步样本数据库;对初步样本数据库中的样本数据进行常规清洗,获得第一样本数据;去除第一样本数据中与火电机组的运行规则不匹配的数据,获得第二样本数据;利用给定的数据挖掘算法剔除第二样本数据中的异常数据,获得第三样本数据;对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测。煤耗预测数据清洗方法能有效提高数据的有效性和准确性从而提高煤耗预测的准确性。
Description
技术领域
本发明属于火电机组煤耗预测技术领域,具体涉及一种火电机组煤耗预测、数据清洗方法及系统。
背景技术
火电机组的耗煤预测的准确性不仅对于节能降耗有着非常重要的意义,而且也对市场优化和调节(煤价等经济运行指标)有着奠定基础的作用,并且其准确性也是数字化电厂、智能电厂业务与应用开发的一个基础保障。但,如何能保证火电机组煤耗预测的准确性,或者提高预测的拟合优度是从事数据分析、数据挖掘、算法设计等从业人员首要考虑的因素。常规的基于数据挖掘、统计学方法的数据清洗方法对于互联网用户自画像、行为数据的处理方法,不适用于在电力数据采集生产过程。特别是实时监控系统的数据采集中,出现的数据中断、跳变、超值越限、数值不合理等现象,是常规的数据清洗方法无法判断的。
发明内容
为解决现有技术中的不足,本发明提供一种火电机组煤耗预测、数据清洗方法及系统,煤耗预测数据清洗方法能有效提高数据的有效性和准确性从而提高煤耗预测的准确性。
为达到上述目的,本发明所采用的技术方案是:
第一方面,提供一种火电机组煤耗预测数据清洗方法,包括:获取给定时间段的火电机组历史运行数据,建立初步样本数据库;对初步样本数据库中的样本数据进行常规清洗,获得第一样本数据;去除第一样本数据中与火电机组的运行规则不匹配的数据,获得第二样本数据;利用给定的数据挖掘算法剔除第二样本数据中的异常数据,获得第三样本数据;对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测。
进一步地,所述常规清洗包括去除空值、文本值和非法值,同时,对每一个维度,分别计算第一样本数据的基本特征值,并进行可视化。
进一步地,所述火电机组的运行规则包括火电机组的运行负荷。
进一步地,所述利用给定的数据挖掘算法剔除第二样本数据中的异常数据,包括:利用主成分分析算法确定输入变量;计算各输入变量的特征指标值、分布曲线并可视化;利用局部异常因子算法或者DBSCAN聚类算法侦测并剔除孤立点、离群点;利用箱线图检测、均方差检测进行稳态检测,最终形成第三样本数据。
进一步地,所述利用箱线图检测、均方差检测进行稳态检测,具体为:箱线图检测对单元数据计算上四分位数和下四分位数,去除两端的值,再在此基础上设置阈值ξ的情况下计算均方差校正因箱线图单元数据区间段选择不完善导致的漏掉的数据,其中,n表示[t-d,t]时间段内数据点数量;Pi表示时刻i对应的参数值;表示[t-d,t]时间段内的参数均值;ξ表示设定阈值。
进一步地,采用K-means聚类算法对第三样本数据进行工况划分。
第二方面,提供一种火电机组煤耗预测数据清洗系统,包括:第一模块,用于获取给定时间段的火电机组历史运行数据,建立初步样本数据库;第二模块,用于对初步样本数据库中的样本数据进行常规清洗,获得第一样本数据;第三模块,用于去除第一样本数据中与火电机组的运行规则不匹配的数据,获得第二样本数据;第四模块,用于利用给定的数据挖掘算法剔除第二样本数据中的异常数据,获得第三样本数据;第五模块,用于对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测。
第三方面,提供一种火电机组煤耗预测方法,其特征是,采用权利要求1~6任一项所述的火电机组煤耗预测数据清洗方法获取不同工况下的样本数据,用于火电机组煤耗预测;包括:根据不同工况下的样本数据计算拟合优度、P值;根据拟合优度和P值,调整给定的数据挖掘算法的参数及对第三样本数据进行工况划分时的参数,最终形成火电机组煤耗预测模型。
第四方面,提供一种火电机组煤耗预测系统,采用第二方面所述的火电机组煤耗预测数据清洗系统获取不同工况下的样本数据,用于火电机组煤耗预测;包括:第六模块,用于根据不同工况下的样本数据计算拟合优度、P值;第七模块,用于根据拟合优度和P值,调整给定的数据挖掘算法的参数及对第三样本数据进行工况划分时的参数,最终形成火电机组煤耗预测模型。
与现有技术相比,本发明所达到的有益效果:本发明通过对初步样本数据库中的样本数据进行常规清洗,然后去除第一样本数据中与火电机组的运行规则不匹配的数据,再利用给定的数据挖掘算法剔除第二样本数据中的异常数据;在对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测,提供一套完备的基于煤耗预测业务背景的数据清洗集成方法为目前电厂大数据应用领域开展各大数据分析、数据挖掘、智能计算等业务提供了有效的、准确的数据保障,另一方面,也为煤耗预测拟合优度朔源提供了清晰的脉络分析。从而大大提高了发电行业以煤耗预测为依赖的拟合、预测准确性。
附图说明
图1是本发明实施例提供的一种火电机组煤耗预测方法的主要流程示意图;
图2是本发明实施例中利用局部异常因子算法(LOF算法)或者DBSCAN聚类算法侦测出孤立点、离群点的示意图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例一:
一种火电机组煤耗预测数据清洗方法,包括:获取给定时间段的火电机组历史运行数据,建立初步样本数据库;对初步样本数据库中的样本数据进行常规清洗,获得第一样本数据;去除第一样本数据中与火电机组的运行规则不匹配的数据,获得第二样本数据;利用给定的数据挖掘算法剔除第二样本数据中的异常数据,获得第三样本数据;对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测,如图1所示。
步骤一:获取给定时间段的火电机组历史运行数据,建立初步样本数据库;根据电厂专工经验,建立初步样本数据库。从电厂SIS系统离线获取机组运行历史数据,根据电厂所在地理位置以及实际生产情况,获取半年及以上区间段的数据,并且根据专工的经验划分采集数据的时间区间间隔。以确保数据的全覆盖和合适的样本容量。
步骤二:对初步样本数据库中的样本数据进行常规清洗,获得第一样本数据;进行离线数据常规统计方法清洗。第二步是获取初步样本的情况下,从单纯的数据的角度,不考虑业务背景的情况,进行横纵向数据分析,去除空值,去除文本值、去除非法值等非机组正常运行状态下的数据。另一方面,对于每一个维度,分别计算样本数据的基本特征值(均值、方差、中位数、协方差等刻画数据分布特征的特征值),并且进行可视化展示。
步骤三:去除第一样本数据中与火电机组的运行规则不匹配的数据,获得第二样本数据;根据机组运行的惯性经验设置规则和判断策略,结合业务需求,筛选样本数据。比如,机组正常运转的负荷应该是250MW~1000MW,那么设置规则小于250MW或者高于1000MW的负荷对应的样本应该排除掉。
步骤四:利用给定的数据挖掘算法剔除第二样本数据中的异常数据,获得第三样本数据;进行离线数据挖掘,确定样本维度和去除异常、非稳态值。通过之前的步骤,已经将样本数据库根据统计方法和经验规则设置筛选了。接下来需要利用数据挖掘算法对工况指标和能耗特征指标确定样本的输入变量、数据的稳态检测以及非肉眼和常规统计方法就能侦测出的异常数据。
步骤4.1:利用主成分分析算法,计算样本之间的相关性和累计贡献率降维分析,根据需要保留多少的信息量,确定输入变量,注意,为了消除量纲的影响,在计算之前先进行标准化操作。比如,经过分析负荷、环境温度、主蒸汽温度、主蒸汽压力、排烟温度、氧量、再热蒸汽温度、给水温度、背压作为输入变量。
步骤4.2:计算各输入变量的特征指标值、各自的分布曲线并将其可视化。
步骤4.3:利用局部异常因子算法(LOF算法)或者DBSCAN聚类算法侦测出孤立点、离群点,优化样本质量。如图2所示。
在统计方法里,o1、o2点归属于C2集合,认为它们是正常的数据。但是,从图中显然可见,其是孤立点。
步骤4.4:稳态检测,建立稳态数据库。因为煤耗预测的特性需求,需要在机组运行稳定的状态下进行预测。稳态检测的算法常规的比较多,比如基于统计方法的箱线图检测、均方差检测、最大最小值检测、高斯滤波+R检测或者基于滤波的EWMA和SSD算法等。但经过实践,箱线图和均方差检测的结果效果最佳:箱线图检测对单元数据计算上四分位数和下四分位数,去除两端的值,再在此基础上设置阈值ξ的情况下计算均方差校正因箱线图单元数据区间段选择不完善导致的漏掉的数据,其中,n表示[t-d,t]时间段内数据点数量;Pi表示时刻i对应的参数值;表示[t-d,t]时间段内的参数均值;ξ表示设定阈值。
步骤五:对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测。工况划分,工况主要包含煤质、负荷、环境温度等,不同工况下的能效特征指标基准值不同。在进行煤耗预测时,必须考虑工况划分和匹配的问题。工况划分问题,转化为数据处理问题,属于机器学习聚类的范畴、或者分类的范畴。可以考虑的聚类、分类算法有很多。本实施例采用可迭代的K-means聚类算法。
本实施例基于火电机组煤耗预测数据挖掘数据清洗前,设置火电机组的运行规则进行样本过滤这一数据清洗方法这一步骤;基于火电机组煤耗预测实际业务生产需求,增加基于箱线图和均方差结合的稳态检测数据清洗方法这一步骤;基于火电机组煤耗预测实际业务生产需求,增加工况划分数据清洗方法这一步骤;通过对初步样本数据库中的样本数据进行常规清洗,然后去除第一样本数据中与火电机组的运行规则不匹配的数据,再利用给定的数据挖掘算法剔除第二样本数据中的异常数据;在对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测,提供一套完备的基于煤耗预测业务背景的数据清洗集成方法为目前电厂大数据应用领域开展各大数据分析、数据挖掘、智能计算等业务提供了有效的、准确的数据保障,另一方面,也为煤耗预测拟合优度朔源提供了清晰的脉络分析。从而大大提高了发电行业以煤耗预测为依赖的拟合、预测准确性。
实施例二:
基于实施例一所述的一种火电机组煤耗预测数据清洗方法,本实施例提供一种火电机组煤耗预测数据清洗系统,包括:第一模块,用于获取给定时间段的火电机组历史运行数据,建立初步样本数据库;第二模块,用于对初步样本数据库中的样本数据进行常规清洗,获得第一样本数据;第三模块,用于去除第一样本数据中与火电机组的运行规则不匹配的数据,获得第二样本数据;第四模块,用于利用给定的数据挖掘算法剔除第二样本数据中的异常数据,获得第三样本数据;第五模块,用于对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测。
实施例三:
基于基于实施例一和实施例二,本实施例提供一种火电机组煤耗预测方法,采用实施例一所述的火电机组煤耗预测数据清洗方法获取不同工况下的样本数据,用于火电机组煤耗预测;如图1所示,包括:根据不同工况下的样本数据计算拟合优度、P值;根据拟合优度和P值,调整给定的数据挖掘算法的参数及对第三样本数据进行工况划分时的参数,最终形成火电机组煤耗预测模型。
步骤六:根据不同工况下的样本数据计算拟合优度、P值。基于每一个工况下的样本数据,根据步骤4.1确定的主成分和4.2输入变量与输出变量的特征分布图和密度函数图,确定相应的预测算法。通过样本训练集计算拟合优度、P值。
步骤七:根据拟合优度和P值,调整给定的数据挖掘算法的参数及对第三样本数据进行工况划分时的参数,最终形成火电机组煤耗预测模型。模型调优。根据拟合优度和P值,调整步骤四和五中所涉及到的算法中的各大人为设置的参数值,直到找到最恰当、最合适的预测模型。
实施例四:
基于实施例一~三,本实施例提供一种火电机组煤耗预测系统,采用实施例二所述的火电机组煤耗预测数据清洗系统获取不同工况下的样本数据,用于火电机组煤耗预测;包括:第六模块,用于根据不同工况下的样本数据计算拟合优度、P值;第七模块,用于根据拟合优度和P值,调整给定的数据挖掘算法的参数及对第三样本数据进行工况划分时的参数,最终形成火电机组煤耗预测模型。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (9)
1.一种火电机组煤耗预测数据清洗方法,其特征是,包括:
获取给定时间段的火电机组历史运行数据,建立初步样本数据库;
对初步样本数据库中的样本数据进行常规清洗,获得第一样本数据;
去除第一样本数据中与火电机组的运行规则不匹配的数据,获得第二样本数据;
利用给定的数据挖掘算法剔除第二样本数据中的异常数据,获得第三样本数据;
对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测。
2.根据权利要求1所述的火电机组煤耗预测数据清洗方法,其特征是,所述常规清洗包括去除空值、文本值和非法值,同时,对每一个维度,分别计算第一样本数据的基本特征值,并进行可视化。
3.根据权利要求1所述的火电机组煤耗预测数据清洗方法,其特征是,所述火电机组的运行规则包括火电机组的运行负荷。
4.根据权利要求1所述的火电机组煤耗预测数据清洗方法,其特征是,所述利用给定的数据挖掘算法剔除第二样本数据中的异常数据,包括:
利用主成分分析算法确定输入变量;
计算各输入变量的特征指标值、分布曲线并可视化;
利用局部异常因子算法或者DBSCAN聚类算法侦测并剔除孤立点、离群点;
利用箱线图检测、均方差检测进行稳态检测,最终形成第三样本数据。
6.根据权利要求1所述的火电机组煤耗预测数据清洗方法,其特征是,采用K-means聚类算法对第三样本数据进行工况划分。
7.一种火电机组煤耗预测数据清洗系统,其特征是,包括:
第一模块,用于获取给定时间段的火电机组历史运行数据,建立初步样本数据库;
第二模块,用于对初步样本数据库中的样本数据进行常规清洗,获得第一样本数据;
第三模块,用于去除第一样本数据中与火电机组的运行规则不匹配的数据,获得第二样本数据;
第四模块,用于利用给定的数据挖掘算法剔除第二样本数据中的异常数据,获得第三样本数据;
第五模块,用于对第三样本数据进行工况划分,获得不同工况下的样本数据,用于火电机组煤耗预测。
8.一种火电机组煤耗预测方法,其特征是,采用权利要求1~6任一项所述的火电机组煤耗预测数据清洗方法获取不同工况下的样本数据,用于火电机组煤耗预测;包括:
根据不同工况下的样本数据计算拟合优度、P值;
根据拟合优度和P值,调整给定的数据挖掘算法的参数及对第三样本数据进行工况划分时的参数,最终形成火电机组煤耗预测模型。
9.一种火电机组煤耗预测系统,其特征是,采用权利要求7所述的火电机组煤耗预测数据清洗系统获取不同工况下的样本数据,用于火电机组煤耗预测;包括:
第六模块,用于根据不同工况下的样本数据计算拟合优度、P值;
第七模块,用于根据拟合优度和P值,调整给定的数据挖掘算法的参数及对第三样本数据进行工况划分时的参数,最终形成火电机组煤耗预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111073933.XA CN113986892A (zh) | 2021-09-14 | 2021-09-14 | 一种火电机组煤耗预测、数据清洗方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111073933.XA CN113986892A (zh) | 2021-09-14 | 2021-09-14 | 一种火电机组煤耗预测、数据清洗方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113986892A true CN113986892A (zh) | 2022-01-28 |
Family
ID=79735784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111073933.XA Pending CN113986892A (zh) | 2021-09-14 | 2021-09-14 | 一种火电机组煤耗预测、数据清洗方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113986892A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116383262A (zh) * | 2023-05-31 | 2023-07-04 | 山东英伟电子技术有限公司 | 一种基于电厂sis系统的能耗数据管理平台 |
CN118569449A (zh) * | 2024-08-01 | 2024-08-30 | 华能信息技术有限公司 | 一种基于人机交互的燃料智能感知监测系统 |
-
2021
- 2021-09-14 CN CN202111073933.XA patent/CN113986892A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116383262A (zh) * | 2023-05-31 | 2023-07-04 | 山东英伟电子技术有限公司 | 一种基于电厂sis系统的能耗数据管理平台 |
CN116383262B (zh) * | 2023-05-31 | 2023-08-11 | 山东英伟电子技术有限公司 | 一种基于电厂sis系统的能耗数据管理平台 |
CN118569449A (zh) * | 2024-08-01 | 2024-08-30 | 华能信息技术有限公司 | 一种基于人机交互的燃料智能感知监测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111539553B (zh) | 基于svr算法和偏峰度的风电机组发电机故障预警方法 | |
CN113986892A (zh) | 一种火电机组煤耗预测、数据清洗方法及系统 | |
CN104794535B (zh) | 一种基于主导行业的电力需求预测及预警的方法 | |
CN112801388B (zh) | 一种基于非线性时间序列算法的电力负荷预测方法及系统 | |
CN111080074B (zh) | 基于网络多特征关联的系统服役安全态势要素获取方法 | |
CN103631681A (zh) | 一种在线修复风电场异常数据的方法 | |
CN108448625B (zh) | 一种基于数据驱动的风机切入风速计算方法 | |
CN113036913B (zh) | 一种综合能源设备状态监测方法及装置 | |
CN110717610A (zh) | 一种基于数据挖掘的风电功率预测方法 | |
CN112001511A (zh) | 基于数据挖掘的设备可靠性及动态风险评价方法、系统和设备 | |
CN113627735A (zh) | 工程建设项目安全风险的预警方法及系统 | |
CN113632025A (zh) | 用于评估工业环境中的能量消耗的方法、系统和计算机程序产品 | |
CN116186624A (zh) | 一种基于人工智能的锅炉评估方法及系统 | |
CN110852496A (zh) | 一种基于lstm循环神经网络的天然气负荷预测方法 | |
CN117056688A (zh) | 一种基于数据分析的新材料生产数据管理系统及方法 | |
Ak et al. | Data analytics and uncertainty quantification for energy prediction in manufacturing | |
CN115204583A (zh) | 化工园区区域风险分级管控评估分析方法、系统及装置 | |
CN118016202B (zh) | 一种基于汽水质量的化学设备运行分析方法及系统 | |
CN112231971A (zh) | 基于相对整体趋势扩散故障样本生成的高炉故障诊断方法 | |
CN118017624A (zh) | 基于配网重构的多时间尺度的无功优化方法 | |
CN109469919A (zh) | 一种基于权重聚类的电站空预器堵灰监测方法 | |
CN109101659A (zh) | 一种小水电数据采集系统中功率数据异常的方法 | |
Oprime et al. | X-bar control chart design with asymmetric control limits and triple sampling | |
CN116910128A (zh) | 风电机组硬软故障数据分析系统及其分析方法 | |
CN108123436B (zh) | 基于主成分分析和多元回归算法的电压越限预测模型 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |