CN116644867A - 一种用于热力供热远程关系系统的数据处理方法 - Google Patents
一种用于热力供热远程关系系统的数据处理方法 Download PDFInfo
- Publication number
- CN116644867A CN116644867A CN202310927545.6A CN202310927545A CN116644867A CN 116644867 A CN116644867 A CN 116644867A CN 202310927545 A CN202310927545 A CN 202310927545A CN 116644867 A CN116644867 A CN 116644867A
- Authority
- CN
- China
- Prior art keywords
- data
- abnormal
- correlation coefficient
- time period
- heat supply
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 230000002159 abnormal effect Effects 0.000 claims abstract description 234
- 238000000034 method Methods 0.000 claims abstract description 52
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 52
- 238000010438 heat treatment Methods 0.000 claims description 36
- 238000005070 sampling Methods 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 10
- 238000009499 grossing Methods 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 10
- 230000005856 abnormality Effects 0.000 description 14
- 239000008400 supply water Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据预测技术领域,具体涉及一种用于热力供热远程关系系统的数据处理方法。该方法通过历史数据的统计,分析供回水温度差信息和瞬时流量信息的普遍相关系数,进一步统计出历史数据中的异常时间段信息,进而获得限制离群区间。通过异常时间段获得的参考时间段对历史供热数据进行分段分析,利用限制离群区间优化分析数据,获得限制数据相关系数集合,利用限制数据相关系数集合结合当前参考时间段下的数据相关系数对未来时间段下的数据相关系数进行预测,实现对供热数据的异常判断。本发明通过基于历史数据的大数据统计,获得便于预测的限制数据相关系数集合,进而通过数据的预测实现供热数据的异常判断。
Description
技术领域
本发明涉及数据预测技术领域,具体涉及一种用于热力供热远程关系系统的数据处理方法。
背景技术
集中供热系统的热量输配由室外系统完成,大多数地区采用热水作为集中供热系统的热源,而热水的供回水温度差和瞬时流量对用户供热质量的影响大,热力供热远程关系通常包括水力关系和热力关系两个方面,水力关系包含水力失调,热力关系包含热力失调,供回水温度差和瞬时流量的不均衡很可能导致水力失调和热力失调的问题,影响用户的供暖质量,因此需要利用热力供热远程关系系统对集中供热系统进行远程管理。
在集中供暖场景中,现有技术通过采集大量的集中供热系统中数据,并对其中的异常数据进行分析并加以利用,以发现供暖异常情况,但是采集的数据往往具有滞后性,并且对数据预测常采用霍尔特双参数平滑法,该方法是用于预测时间序列的一种指数平滑方法,直接对集中供热系统中数据使用该方法时预测结果容易受到离群值的影响,离群值为与供热数据差异较大的供热数据,进而导致预测结果准确性低,对集中供热系统中数据处理的效果不好。
发明内容
为了解决现有技术直接对集中供热系统中数据使用霍尔特双参数平滑法时,预测结果容易受到离群值的影响,进而导致预测结果准确性低,对集中供热系统中数据处理的效果不好的技术问题,本发明的目的在于提供一种用于热力供热远程关系系统的数据处理方法,所采用的技术方案具体如下:
本发明提出了一种用于热力供热远程关系系统的数据处理方法,所述方法包括:
根据预设采样频率获得经过预处理后的历史供热数据中的时刻集合,以及对应时刻下的供回水温度差集合和瞬时流量集合;
根据所述供回水温度差集合和所述瞬时流量集合获得所述历史供热数据的普遍相关系数;获取所述历史供热数据中异常数据的异常时间段;根据每一个异常时间段下的供回水温度差数据和瞬时流量数据获得每一个异常时间段的异常相关系数;根据所述异常时间段的时长和其所在预设采样周期下异常时间段的数量,获得每一个异常时间段对应的异常相关系数权重,根据所述异常相关系数和所述异常相关系数权重获得异常数据的异常关系系数;
根据所述普遍相关系数和所述异常关系系数获得限制离群区间;根据所述异常时间段获得参考时间段,获得所述历史供热数据每一个参考时间段下的数据相关系数,根据所述限制离群区间和所述数据相关系数获得限制数据相关系数集合;
根据所述限制数据相关系数集合和当前参考时间段下的数据相关系数,获得未来参考时间段下的预测数据相关系数,根据所述预测数据相关系数预测对应的供热数据是否出现异常。
进一步地,相关系数的获取方法包括:
以供回水温度差数据和对应瞬时流量数据之间的皮尔逊相关系数的绝对值作为相关系数。
进一步地,所述获得每一个异常时间段对应的异常相关系数权重,包括:
将每一个异常时间段的时间长度归一化后除以所述异常时间段所在预设采样周期下异常时间段的数量,获得初始异常相关系数权重,将所述初始异常相关系数权重负相关映射并归一化,获得所述异常相关系数权重。
进一步地,所述根据所述异常相关系数和所述异常相关系数权重获得所述异常数据的异常关系系数,包括:
将每一个所述异常相关系数与对应的异常相关系数权重的乘积的平均值作为所述异常关系系数。
进一步地,所述根据所述普遍相关系数和所述异常关系系数获得限制离群区间,包括:
将所述普遍相关系数作为所述限制离群区间的上限值,将所述异常关系系数作为所述限制离群区间的下限值,获得所述限制离群区间。
进一步地,所述根据所述异常时间段获得参考时间段,包括:
将所述异常时间段的平均值作为所述参考时间段。
进一步地,所述根据所述限制离群区间和所述数据相关系数获得限制数据相关系数集合,包括:
在历史供热数据中按照所述参考时间段进行划分,计算所述历史供热数据每一个参考时间段下的供回水温度差数据和对应的瞬时流量数据之间的数据相关系数;在所述限制离群区间外的所述数据相关系数被距离最近的上限值或下限值替换,结合所述限制离群区间中的所述数据相关系数,获得所述限制数据相关系数集合。
进一步地,所述根据所述预测数据相关系数预测对应的供热数据是否出现异常,包括:
在所述限制离群区间外的当前参考时间段下的数据相关系数被距离最近的上限值或下限值替换,获得当前限制数据相关系数集合,将所述限制数据相关系数集合中数据和所述当前限制数据相关系数集合中数据按照时间先后排列,获得限制序列;使用霍尔特双参数平滑法,根据所述限制序列中最后预设数量的数据相关系数,获得限制序列下一个未来参考时间段下的预测数据相关系数;若所述预测数据相关系数相较于所述普遍相关系数更靠近所述异常关系系数,则所述预测数据相关系数对应的供热数据的预测结果为异常;反之,为正常。
进一步地,所述预处理的方法包括:
对历史供热数据中的错误数据进行修正,根据所述错误数据的冗余程度,根据错误数据修正方法处理所述错误数据。
本发明具有如下有益效果:
在本发明中,普遍相关系数表征了供回水温度差集合中数据和对应的瞬时流量集合中数据的相关程度,因为在历史供热数据中异常时间段较短,并且相对于正常数据而言异常数据的数据量更少,因此根据历史供热数据获得的普遍相关系数更接近于正常数据对应的相关系数。历史供热数据中异常时间段越短,该异常时间段下异常相关系数很可能越偏离普遍相关系数,越应当引起重视,因此将异常时间段作为获取异常相关系数权重的一个因子;预设采样周期下异常时间段的数量越多,该预设采样周期下供热数据出现异常的可能性越大,因此将预设采样周期下异常时间段的数量作为获取异常相关系数权重的一个因子,异常相关系数权重表征了对应的异常相关系数对异常关系系数的贡献程度,根据历史供热数据中异常数据结合异常相关系数权重获得的异常关系系数更接近于异常数据对应的相关系数。限制离群区间消除了限制离群区间外数据相关系数对预测结果的影响。连续的异常时间点所在时间段的长度集中出现在异常时间段长度所在的区间范围,所以需要统计异常时间段的长度,获得参考时间段,参考时间段是历史供热数据中异常数据的一个特征,以参考时间段作为后续预测过程的步长,更有利于后续预测本发明根据限制离群区间消除了限制离群区间外数据相关系数对预测结果的影响,以参考时间段为预测步长,预测未来的供热数据是否出现异常的准确性更高,对供热数据处理的效果更好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种用于热力供热远程关系系统的数据处理方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种用于热力供热远程关系系统的数据处理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种用于热力供热远程关系系统的数据处理方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种用于热力供热远程关系系统的数据处理方法流程图,该方法包括:
步骤S1:根据预设采样频率获得经过预处理后的历史供热数据中的时刻集合,以及对应时刻下的供回水温度差集合和瞬时流量集合。为了能够更好地对历史供热数据进行分析,并且便于后续进行分析处理,根据预设采样频率对历史供热数据进行采集。
在本发明一个实施例中,历史供热数据为当天之前的供热数据。
在本发明一个实施例中,在供热远程关系系统中,历史供热数据通过自动化采集方式进行采集。
在本发明实施例中,需要根据具体的监测要求和采集设备的情况设置不同的预设采样频率,对系统的运行状态进行实时监测和调控的要求越高,预设采样频率越高。
在本发明一个实施例中,预设采样频率为每间隔一分钟采样一次,能够对系统的运行状态进行实时监测和调控。
虽然自动化采集的准确性较高,但是也可能受到设备故障等因素的影响,采集的历史供热数据中的部分数据可能是错误的,错误的历史供热数据降低了后续预测结果的准确性,因此需要对历史供热数据进行预处理。
优选地,在本发明实施例中,预处理的具体方法为:
对历史供热数据中的错误数据进行修正,该错误数据往往具备冗余的特点,根据冗余程度的大小,按照错误数据修正方法处理错误的历史供热数据,能够有效减少明显错误的历史供热数据,后续使用处理过的数据进行分析时,能够最大化保证分析结果的准确性。
在本发明其他实施例中,可根据对历史供热数据预处理的精度要求,选择合适的错误数据修正方法。在本发明一个实施例中,选择平均插值法作为错误数据修正方法。
时刻集合中的时刻与采样的时刻一一对应,供回水温度差集合中的数据的数值为对应的供水温度减去对应的回水温度,瞬时流量集合中的数据通常用来描述该系统中的水流量。时刻集合中的时刻、供回水温度差集合中的数据和瞬时流量集合中的数据一一对应,方便了后续对历史供热数据进行处理。供回水温度差集合中的数据和瞬时流量集合中的数据在供热远程关系系统中表示不同的物理量,但它们的变化趋势和相互作用对于该系统的运行状态和效果产生了重要的影响,供回水温度差和瞬时流量的不均衡很可能导致水力失调和热力失调的问题,影响用户的供暖质量,因此需要获得历史供热数据,再后续对历史供热数据进行分析处理,以便于后续预测未来供热数据是否出现异常,若异常则做出相应的操作,以提高用户的供暖质量。
步骤S2:根据供回水温度差集合和瞬时流量集合获得历史供热数据的普遍相关系数;获取历史供热数据中异常数据的异常时间段;根据每一个异常时间段下的供回水温度差数据和瞬时流量数据获得每一个异常时间段的异常相关系数;根据异常时间段的时长和其所在预设采样周期下异常时间段的数量,获得每一个异常时间段对应的异常相关系数权重,根据异常相关系数和异常相关系数权重获得异常数据的异常关系系数。
热水的供回水温度差和瞬时流量对用户供热质量的影响大,供回水温度差和瞬时流量的不均衡很可能导致水力失调和热力失调的问题,影响用户的供暖质量,因此对供回水温度差集合和瞬时流量集合进行分析。为了获得后续的限制离群区间和后续判断未来供热数据是否异常的指标,需要根据历史供热数据获得普遍相关系数。时刻集合中的时刻、供回水温度差集合中的数据和瞬时流量集合中的数据一一对应,因此能够根据供回水温度差集合和瞬时流量集合获得历史供热数据的普遍相关系数。普遍相关系数表征了供回水温度差集合中数据和对应的瞬时流量集合中数据的相关程度。因为在历史供热数据中异常时间段较短,并且相对于正常数据而言异常数据的数据量更少,因此根据历史供热数据获得的普遍相关系数更接近于正常数据对应的相关系数。
为了获得后续预测过程的参考时间段,并且获得异常数据的特征,以便于后续预测未来供热数据是否出现异常,对历史供热数据中的异常数据进行分析,并获得异常时间段。在本发明一个实施例中,根据供热远程关系系统获得异常数据的异常时间点,将连续的异常时间点作为一段异常时间段。
为了获得每一个异常时间段下异常数据的特征,对每一个异常时间段下的供回水温度差数据和瞬时流量数据进行分析。在每一个异常时间段下,供回水温度差数据和瞬时流量数据一一对应,因此能够获得每一个异常时间段的异常相关系数。异常相关系数表征了对应异常时间段下供回水温度差数据和对应瞬时流量数据的相关程度。
历史供热数据中时间段越短,说明该段时间内所包含的信息越单一,越不会受到其他信息的干扰,越应当引起重视,因此将异常时间段作为获取异常相关系数权重的一个因子。预设采样周期下异常时间段的数量越多,该预设采样周期下供热数据出现异常的可能性越大,因此将预设采样周期下异常时间段的数量作为获取异常相关系数权重的一个因子。为了后续获得异常关系系数,并且获得不同异常时间段下异常相关系数对异常关系系数的贡献程度,根据异常时间段和其所在预设采样周期下异常时间段的数量,获得每一个异常时间段对应的异常相关系数权重。异常相关系数权重表征了对应的异常相关系数对异常关系系数的贡献程度。
为了获得后续的限制离群区间,并且获得后续判断未来供热数据是否异常的指标,考虑到历史供热数据中不同异常时间段下的异常相关系数对后续预测过程的重要程度不同,异常相关系数和异常相关系数权重一一对应,对异常相关系数和异常相关系数权重进行分析处理,并获得异常关系系数。根据历史供热数据中异常数据获得的异常关系系数更接近于异常数据对应的相关系数。
优选地,在本发明一个实施例中,相关系数的具体获取方法包括:在供热场景中,皮尔逊相关系数的绝对值能够更好地表征供回水温度差数据和对应瞬时流量数据之间的相关程度,因此以供回水温度差数据和对应瞬时流量数据之间的皮尔逊相关系数的绝对值作为相关系数,该绝对值越大,对应的相关程度越大。将供回水温度差集合中数据和对应的瞬时流量集合中数据之间的皮尔逊相关系数的绝对值作为普遍相关系数。将每一个异常时间段下的供回水温度差数据和对应瞬时流量数据之间的皮尔逊相关系数的绝对值作为对应异常时间段的异常相关系数。
皮尔逊相关系数为本领域技术人员所熟知的现有技术,在此不做进一步限定和赘述,仅列出本发明一个实施例中的普遍相关系数的公式和异常相关系数的公式。
普遍相关系数的公式为:
式中,为普遍相关系数,/>为计算协方差的函数,/>为第n个时刻,t为时刻集合,/>为第n个时刻的供回水温度差数据,T为供回水温度差集合,/>为第n个时刻的瞬时流量数据,IF为瞬时流量集合,/>为供回水温度集合的标准差,/>瞬时流量集合的标准差。
公式表明该相关程度越大,普遍相关系数越大。普遍相关系数表征了供回水温度差集合中数据和对应的瞬时流量集合中数据的相关程度。
异常相关系数的公式为:
式中,为第j个异常时间段对应的异常相关系数,/>为第j个异常时间段长度,/>为异常时间段长度的集合,/>为第j个异常时间段下每个时刻下供回水温度差数据的集合,m为历史供热数据中异常时间段的数量,/>为第m个异常时间段长度,第m个异常时间段下每个时刻下供回水温度差数据的集合,/>为第m个异常时间段下每个时刻下瞬时流量数据的集合,/>为/>的集合,/>为第j个异常时间段下每个时刻下瞬时流量数据的集合,/>为/>的集合,/>为计算协方差的函数,/>为第j个异常时间段下供回水温度差数据的集合的标准差,/>为第j个异常时间段下瞬时流量数据的集合的标准差。
该公式表明该相关程度越大,对应的异常相关系数越大。异常相关系数表征了对应异常时间段下供回水温度差数据和对应瞬时流量数据的相关程度。
优选地,在本发明一个实施例中,异常相关系数权重的获取方法包括:
将每一个异常时间段的时间长度归一化后除以对应异常时间段所在预设采样周期下异常时间段的数量,获得初始异常相关系数权重,初始异常相关系数权重为获取异常相关系数权重的一个因子,将每一个初始异常相关系数权重负相关映射并归一化,获得异常相关系数权重。
在本发明实施例中,异常时间段明显小于预设采样周期,异常时间段归一化的方法为异常时间段除以预设采样周期。在本发明一个实施例中,预设采样周期为:一天24小时。在本发明一个实施例中,负相关映射并归一化函数为。/>为以自然常数e为底的指数函数。
异常相关系数权重的公式为:
式中,第j个异常时间段对应的异常相关系数权重,/>为第j个异常时间段长度,/>为预设采样周期长度,/>为第j个异常时间段所在预设采样周期内异常时间段的数量,/>为第j个异常时间段对应的初始异常相关系数权重。因为在本发明一个实施例中,预设采样周期设置为一天24小时,因此为了方便数据处理,异常时间段的长度单位也设置为小时,即/>的值为24。
在本发明其他实施例中,可根据对预测结果的精度要求设置合适的预设采样周期,在此不做限定及赘述。
异常时间段越短,越应当引起重视,其他变量不变时,对应的异常相关系数权重越大,越有利于后续预测。预设采样周期下异常时间段的数量越多,该预设采样周期下供热数据出现异常的可能性越大,其他变量不变时,对应的异常相关系数权重越大,越有利于后续预测。当越短且/>越大时,第j个异常时间段对应的初始异常相关系数权重越小,/>越大,说明第j个异常时间段对应的异常相关系数对异常关系系数的贡献程度越大,越有利于后续预测。异常相关系数权重表征了对应的异常相关系数对异常关系系数的贡献程度。
优选地,在本发明一个实施例中,异常关系系数的具体获取方法包括:
将每一个异常相关系数与对应的异常相关系数权重的乘积的平均值作为异常关系系数。异常关系系数的公式为:
式中,为异常数据的异常关系系数,m为历史供热数据中异常数据的异常时间段的总数量,/>为第j个异常时间段对应的异常相关系数,/>第j个异常时间段对应的异常相关系数权重。
异常相关系数权重能够放大异常相关系数之间的差异。异常相关系数与对应的异常相关系数权重的乘积表征了对应异常相关系数对异常相关系数的贡献程度,且平均值是统计学中最常用的统计量,用来表示数据中观察值相对集中的中心位置,因此每一个异常相关系数与对应的异常相关系数权重的乘积的平均值作为后续预测未来供热数据是否为异常的指标更合适。
步骤S3:根据普遍相关系数和异常关系系数获得限制离群区间;根据异常时间段获得参考时间段,获得历史供热数据每一个参考时间段下的数据相关系数,根据限制离群区间和数据相关系数获得限制数据相关系数集合。
根据历史供热数据获得的普遍相关系数更接近于正常数据对应的相关系数,根据历史供热数据中异常数据获得的异常关系系数更接近于异常数据对应的相关系数,即普遍相关系数与异常关系系数的差异大;又因为需要区间对后续的数据相关系数进行限定,因此对普遍相关系数和异常关系系数进行分析,并获得具有明显区间范围限制离群区间,限制离群区间消除了限制离群区间外数据相关系数对预测结果的影响。
连续的异常时间点所在时间段的长度集中出现在异常时间段长度所在的区间范围,所以需要统计异常时间段的长度,获得参考时间段,参考时间段是历史供热数据中异常数据的一个特征,以参考时间段作为后续预测过程的步长,更有利于后续预测。后续对参考时间段进行分析,对根据参考时间段获得的数据相关系数进行分析,更有利于后续预测。
为了预测后续未来参考时间段下供热数据是否出现异常,需要对历史供热数据每一个参考时间段下的供热数据进行分析,并获得对应的数据相关系数,数据相关系数表征了对应的供热数据中供回水温度差数据与对应的瞬时流量数据之间的相关程度。因为长时间段中的少量的异常数据对获取该时间段的相关系数的权重较小,根据异常时间段获得参考时间段较短,因此根据参考时间段获得的数据相关系数更能表征该时间段下供热数据的相关性,更有利于后续预测。
因为限制离群区间外的数据相关系数对后续预测结果影响大,所以利用限制离群区间对历史供热数据每一个参考时间段下的数据相关系数进行分析,进而获得限制数据相关系数集合,该限制数据相关系数集合中数据对后续预测结果无影响,其为后续预测过程中具有参考性的数据。
优选地,在本发明一个实施例中,限制离群区间的具体获取方法:
当正常数据的供回水温度差数据越大时,对应的瞬时流量越大,正常数据对应的相关系数明显较大,当供热数据出现异常时,异常数据在对应时间段下的相关系数明显比正常数据在对应时间段下的相关系数小,异常数据在对应时间段下的相关系数更接近异常关系系数,正常数据在对应时间段下的相关系数更接近普遍相关系数,因此普遍相关系数明显大于异常关系系数,将普遍相关系数作为限制离群区间的上限值,将异常关系系数作为所述限制离群区间的下限值,获得了具有明显区间范围的限制离群区间。
优选地,在本发明一个实施例中,参考时间段具体的获取方法:
将异常时间段的平均值作为参考时间段。参考时间段的公式为:
式中,为参考时间段,m为历史供热数据中异常数据的异常时间段的总数量,为第j个异常时间段。
连续的异常时间点所在时间段的长度集中出现在异常时间段长度所在的区间范围,连续的异常时间点所在时间段的长度为异常时间段长度平均值附近值的可能性最大,因此将异常时间段的平均值作为参考时间段,以参考时间段为后续预测过程中的步长更有利于后续预测出异常数据。该公式表明了异常时间段的平均值越大,参考时间段越大,后续预测过程中的预测步长越大。
优选地,在本发明一个实施例中,限制数据相关系数集合的具体获取方法:
为了将历史供热数据作为后续预测过程的参考,参考时间段为后续预测过程的预测步长,将历史供热数据按照参考时间段进行划分,计算历史供热数据每一个参考时间段下的供回水温度差数据和对应的瞬时流量数据之间的数据相关系数。因为限制离群区间外的历史供热数据在参考时间段下的数据相关系数对后续预测结果的影响较大,所以在限制离群区间外的历史供热数据在参考时间段下的数据相关系数被距离最近的上限值或下限值替换,结合限制离群区间中的历史供热数据在参考时间段下的数据相关系数,获得限制数据相关系数集合。
步骤S4:根据限制数据相关系数集合和当前参考时间段下的数据相关系数,获得未来参考时间段下的预测数据相关系数,根据预测数据相关系数预测对应的供热数据是否出现异常。
为了后续预测未来供热数据是否出现异常,需要获得未来参考时间段下的预测数据相关系数,其为未来参考时间段下供回水温度差数据与对应的瞬时流量数据之间的相关系数的预测值。后续的预测结果需要根据历史供热数据和当前的供热数据获得,限制数据相关系数集合为根据历史供热数据获得,当前参考时间段下的数据相关系数为根据当前的供热数据获得,因此能够对限制数据相关系数集合和当前参考时间段下的数据相关系数进行分析,并获得未来参考时间段下的预测数据相关系数。当未来供热数据的预测结果为异常时,供热远程关系系统很可能已经出现故障,需要对供热远程关系系统进行分析处理,以便尽快解决故障问题,预测数据相关系数很可能与对应的真实的数据相关系数差别很小,因此需要根据预测数据相关系数预测对应的供热数据是否出现异常。在本发明一个实施例中,当前的供热数据为当天已经采集过的供热数据,当前参考时间段为当天已经采集过的供热数据的参考时间段。
优选地,在本发明一个实施例中,根据预测数据相关系数预测对应的供热数据是否出现异常的具体方法为:
因为限制离群区间外的当前参考时间段下的数据相关系数对后续预测结果的影响较大,因此在限制离群区间外的当前参考时间段下的数据相关系数被距离最近的上限值或下限值替换,获得当前限制数据相关系数集合。距离限制序列下一个未来参考时间段供热数据越近的之前供热数据对预测结果的影响越大,因此将限制数据相关系数集合中数据和当前限制数据相关系数集合中数据按照时间先后排列,获得限制序列,便于后续分析。
在本发明一个实施例中,使用霍尔特双参数平滑法进行预测,消除了后续预测结果的滞后,能够提供准确的预测结果。需要说明的是,霍尔特双参数平滑法中两个平滑系数根据限制序列中数据通过交叉验证法获取。交叉验证法为本领域技术人员所熟知的现有技术,在此不做进一步限定和赘述。霍尔特双参数平滑法为本领域技术人员所熟知的现有技术,在此不做进一步限定和赘述。
为了减少后续预测过程中的计算量,根据限制序列中最后预设数量的数据相关系数作为参考进行预测,根据对预测结果的精度要求,设置合适的预设数量的数据相关系数,该准确性要求越高,预设数量越大。为了保证后续预测结果的准确性,对限制序列下一个未来参考时间段下的供热数据进行预测,并获得对应的预测数据相关系数。在本发明的一个实施例中,举个示例,限制序列中最后预设数量取50。
若预测数据相关系数相较于普遍相关系数更靠近异常关系系数,则预测数据相关系数对应的供热数据的预测结果为异常;反之,为正常;当预测结果为异常时,当前供热远程关系系统很可能已经出现异常,应当做出相应的处理。
综上,本发明通过历史数据的统计,分析供回水温度差信息和瞬时流量信息的普遍相关系数,进一步统计出历史数据中的异常时间段信息,通过异常时间段和所在采样周期下异常时间段的数量获得异常数据的异常关系系数,进而获得限制离群区间。通过异常时间段获得的参考时间段对历史供热数据进行分段分析,进一步利用限制离群区间优化分析数据,获得限制数据相关系数集合,进而利用限制数据相关系数集合结合当前参考时间段下的数据相关系数对未来时间段下的数据相关系数进行预测,根据预测数据相关系数即可实现对供热数据的异常判断。本发明通过基于历史数据的大数据统计,获得便于预测的限制数据相关系数集合,进而通过数据的预测实现供热数据的异常判断。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每一个实施例重点说明的都是与其他实施例的不同之处。
Claims (9)
1.一种用于热力供热远程关系系统的数据处理方法,其特征在于,所述方法包括:
根据预设采样频率获得经过预处理后的历史供热数据中的时刻集合,以及对应时刻下的供回水温度差集合和瞬时流量集合;
根据所述供回水温度差集合和所述瞬时流量集合获得所述历史供热数据的普遍相关系数;获取所述历史供热数据中异常数据的异常时间段;根据每一个异常时间段下的供回水温度差数据和瞬时流量数据获得每一个异常时间段的异常相关系数;根据所述异常时间段的时长和其所在预设采样周期下异常时间段的数量,获得每一个异常时间段对应的异常相关系数权重,根据所述异常相关系数和所述异常相关系数权重获得异常数据的异常关系系数;
根据所述普遍相关系数和所述异常关系系数获得限制离群区间;根据所述异常时间段获得参考时间段,获得所述历史供热数据每一个参考时间段下的数据相关系数,根据所述限制离群区间和所述数据相关系数获得限制数据相关系数集合;
根据所述限制数据相关系数集合和当前参考时间段下的数据相关系数,获得未来参考时间段下的预测数据相关系数,根据所述预测数据相关系数预测对应的供热数据是否出现异常。
2.根据权利要求1所述的一种用于热力供热远程关系系统的数据处理方法,其特征在于,相关系数的获取方法包括:
以供回水温度差数据和对应瞬时流量数据之间的皮尔逊相关系数的绝对值作为相关系数。
3.根据权利要求1所述的一种用于热力供热远程关系系统的数据处理方法,其特征在于,所述获得每一个异常时间段对应的异常相关系数权重,包括:
将每一个异常时间段的时间长度归一化后除以所述异常时间段所在预设采样周期下异常时间段的数量,获得初始异常相关系数权重,将所述初始异常相关系数权重负相关映射并归一化,获得所述异常相关系数权重。
4.根据权利要求1所述的一种用于热力供热远程关系系统的数据处理方法,其特征在于,所述根据所述异常相关系数和所述异常相关系数权重获得所述异常数据的异常关系系数,包括:
将每一个所述异常相关系数与对应的异常相关系数权重的乘积的平均值作为所述异常关系系数。
5.根据权利要求1所述的一种用于热力供热远程关系系统的数据处理方法,其特征在于,所述根据所述普遍相关系数和所述异常关系系数获得限制离群区间,包括:
将所述普遍相关系数作为所述限制离群区间的上限值,将所述异常关系系数作为所述限制离群区间的下限值,获得所述限制离群区间。
6.根据权利要求1所述的一种用于热力供热远程关系系统的数据处理方法,其特征在于,所述根据所述异常时间段获得参考时间段,包括:
将所述异常时间段的平均值作为所述参考时间段。
7.根据权利要求5所述的一种用于热力供热远程关系系统的数据处理方法,其特征在于,所述根据所述限制离群区间和所述数据相关系数获得限制数据相关系数集合,包括:
在历史供热数据中按照所述参考时间段进行划分,计算所述历史供热数据每一个参考时间段下的供回水温度差数据和对应的瞬时流量数据之间的数据相关系数;在所述限制离群区间外的所述数据相关系数被距离最近的上限值或下限值替换,结合所述限制离群区间中的所述数据相关系数,获得所述限制数据相关系数集合。
8.根据权利要求7所述的一种用于热力供热远程关系系统的数据处理方法,其特征在于,所述根据所述预测数据相关系数预测对应的供热数据是否出现异常,包括:
在所述限制离群区间外的当前参考时间段下的数据相关系数被距离最近的上限值或下限值替换,获得当前限制数据相关系数集合,将所述限制数据相关系数集合中数据和所述当前限制数据相关系数集合中数据按照时间先后排列,获得限制序列;使用霍尔特双参数平滑法,根据所述限制序列中最后预设数量的数据相关系数,获得限制序列下一个未来参考时间段下的预测数据相关系数;若所述预测数据相关系数相较于所述普遍相关系数更靠近所述异常关系系数,则所述预测数据相关系数对应的供热数据的预测结果为异常;反之,为正常。
9.根据权利要求1所述的一种用于热力供热远程关系系统的数据处理方法,其特征在于,所述预处理的方法包括:
对历史供热数据中的错误数据进行修正,根据所述错误数据的冗余程度,根据错误数据修正方法处理所述错误数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310927545.6A CN116644867B (zh) | 2023-07-27 | 2023-07-27 | 一种用于热力供热远程关系系统的数据处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310927545.6A CN116644867B (zh) | 2023-07-27 | 2023-07-27 | 一种用于热力供热远程关系系统的数据处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116644867A true CN116644867A (zh) | 2023-08-25 |
CN116644867B CN116644867B (zh) | 2023-10-24 |
Family
ID=87643797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310927545.6A Active CN116644867B (zh) | 2023-07-27 | 2023-07-27 | 一种用于热力供热远程关系系统的数据处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116644867B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109959122A (zh) * | 2019-03-11 | 2019-07-02 | 浙江工业大学 | 一种基于长短期记忆循环神经网络的空调能耗预测方法 |
US20200158350A1 (en) * | 2017-04-18 | 2020-05-21 | Qingdao Haier Air Conditioner General Corp., Ltd. | Heating adjustment method and device |
CN111275579A (zh) * | 2020-02-21 | 2020-06-12 | 浙江大学 | 基于皮尔森相关系数和移动平均法的供热系统热延迟时间辨识方法 |
CN111476439A (zh) * | 2020-05-18 | 2020-07-31 | 瑞纳智能设备股份有限公司 | 基于灰色时间序列的供暖户阀调节方法、系统及设备 |
CN112199365A (zh) * | 2020-10-26 | 2021-01-08 | 天津大学 | 供热系统监测数据异常识别方法 |
CN113606634A (zh) * | 2021-07-01 | 2021-11-05 | 华能国际电力股份有限公司上安电厂 | 一种基于长输管网优化热源运行参数的热源保障系统 |
CN114925053A (zh) * | 2022-05-18 | 2022-08-19 | 河北工大科雅能源科技股份有限公司 | 一种供热数据的预处理方法及装置 |
CN114936805A (zh) * | 2022-06-24 | 2022-08-23 | 河北工大科雅能源科技股份有限公司 | 一种供热系统的节能措施的确定方法、装置及电子设备 |
CN115018315A (zh) * | 2022-05-31 | 2022-09-06 | 河北建筑工程学院 | 一种供热异常的检测方法、装置、电子设备及存储介质 |
CN115453366A (zh) * | 2022-08-23 | 2022-12-09 | 斑马网络技术有限公司 | 一种动力电池的健康评估系统、方法及电子设备 |
KR20220165969A (ko) * | 2021-06-09 | 2022-12-16 | 주식회사 경동나비엔 | 보일러 이상 판단 장치 및 이상 판단 방법 |
CN115600932A (zh) * | 2022-12-12 | 2023-01-13 | 杭州原数科技有限公司(Cn) | 一种基于大数据的文物储藏环境异常评估方法 |
CN115964668A (zh) * | 2022-11-26 | 2023-04-14 | 青岛益堃达热能设备有限公司 | 一种基于大数据的供热监控分析方法、装置、设备及介质 |
CN116011686A (zh) * | 2023-03-28 | 2023-04-25 | 山东创宇环保科技有限公司 | 基于多数据融合的充电棚光伏发电储量预测方法 |
-
2023
- 2023-07-27 CN CN202310927545.6A patent/CN116644867B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200158350A1 (en) * | 2017-04-18 | 2020-05-21 | Qingdao Haier Air Conditioner General Corp., Ltd. | Heating adjustment method and device |
CN109959122A (zh) * | 2019-03-11 | 2019-07-02 | 浙江工业大学 | 一种基于长短期记忆循环神经网络的空调能耗预测方法 |
CN111275579A (zh) * | 2020-02-21 | 2020-06-12 | 浙江大学 | 基于皮尔森相关系数和移动平均法的供热系统热延迟时间辨识方法 |
CN111476439A (zh) * | 2020-05-18 | 2020-07-31 | 瑞纳智能设备股份有限公司 | 基于灰色时间序列的供暖户阀调节方法、系统及设备 |
CN112199365A (zh) * | 2020-10-26 | 2021-01-08 | 天津大学 | 供热系统监测数据异常识别方法 |
KR20220165969A (ko) * | 2021-06-09 | 2022-12-16 | 주식회사 경동나비엔 | 보일러 이상 판단 장치 및 이상 판단 방법 |
CN113606634A (zh) * | 2021-07-01 | 2021-11-05 | 华能国际电力股份有限公司上安电厂 | 一种基于长输管网优化热源运行参数的热源保障系统 |
CN114925053A (zh) * | 2022-05-18 | 2022-08-19 | 河北工大科雅能源科技股份有限公司 | 一种供热数据的预处理方法及装置 |
CN115018315A (zh) * | 2022-05-31 | 2022-09-06 | 河北建筑工程学院 | 一种供热异常的检测方法、装置、电子设备及存储介质 |
CN114936805A (zh) * | 2022-06-24 | 2022-08-23 | 河北工大科雅能源科技股份有限公司 | 一种供热系统的节能措施的确定方法、装置及电子设备 |
CN115453366A (zh) * | 2022-08-23 | 2022-12-09 | 斑马网络技术有限公司 | 一种动力电池的健康评估系统、方法及电子设备 |
CN115964668A (zh) * | 2022-11-26 | 2023-04-14 | 青岛益堃达热能设备有限公司 | 一种基于大数据的供热监控分析方法、装置、设备及介质 |
CN115600932A (zh) * | 2022-12-12 | 2023-01-13 | 杭州原数科技有限公司(Cn) | 一种基于大数据的文物储藏环境异常评估方法 |
CN116011686A (zh) * | 2023-03-28 | 2023-04-25 | 山东创宇环保科技有限公司 | 基于多数据融合的充电棚光伏发电储量预测方法 |
Non-Patent Citations (2)
Title |
---|
SHALAGINOVA, Z.I.等: "Development of methods for modeling dynamic thermo-hydraulic conditions for assessing the quality of functioning of heat supply systems", 《E3S WEB OF CONFERENCES》, vol. 219 * |
张庆峰;陈冬岩;: "基于大数据分析的供热二次管网异常监测的算法比较", 区域供热, no. 06 * |
Also Published As
Publication number | Publication date |
---|---|
CN116644867B (zh) | 2023-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3483517B1 (en) | System and method for predicting load of and controlling subway heating, ventilation, and air conditioning system | |
US7356548B1 (en) | System and method for remote monitoring and controlling of facility energy consumption | |
CN117349778B (zh) | 一种基于物联网的用电设备在线实时监测系统 | |
CN115933787B (zh) | 基于室内环境监测的室内多末端智能控制系统 | |
CN115861011B (zh) | 一种基于多源数据融合的智慧城市优化管理方法和系统 | |
CN109740648B (zh) | 电力负荷异常数据识别方法、装置和计算机设备 | |
CN116418120A (zh) | 一种应用于水冷电源的智能预警方法 | |
CN116680661B (zh) | 基于多维数据的燃气自动调压柜压力监测方法 | |
CN110567101A (zh) | 一种基于支持向量机模型的冷水机组高能效控制方法 | |
CN111507520A (zh) | 一种换热机组负荷的动态预测方法及系统 | |
CN110298765B (zh) | 一种基于客观关联因素的配电网用电功率异常检测方法 | |
CN117459073B (zh) | 一种热泵系统运行数据的智能管理方法 | |
CN115423158A (zh) | 一种水轮发电机组数据趋势的预测分析方法及系统 | |
CN116644867B (zh) | 一种用于热力供热远程关系系统的数据处理方法 | |
CN116772285A (zh) | 一种智能楼宇供暖负载安全实时监控方法 | |
CN117436845A (zh) | 一种智慧小区供热系统异常数据监测方法 | |
CN117979371A (zh) | 用于带宽调节的无线通信数据分析系统和方法 | |
CN116320833B (zh) | 一种基于物联网技术的供热管网监测方法 | |
CN117650628A (zh) | 一种基于自适应预调节场景的能效管理系统 | |
CN114460890A (zh) | 一种无人值守配电房的远程监控系统及方法 | |
CN217442300U (zh) | 一种间接空冷机组循环水水质数字化智能监测控制装置 | |
CN117346417B (zh) | 一种基于物联网技术的冷水机温度控制系统和方法 | |
CN118310129B (zh) | 一种用于制冷加热恒温系统的串级控制方法及系统 | |
CN117806154B (zh) | 一种用于篦式冷却机的pid控制器参数优化方法及系统 | |
CN117450688B (zh) | 一种基于物联网的烟气余热回收能源调度管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |