CN116341770B - 基于聚苯乙烯生产数据的生产能力预测方法及系统 - Google Patents
基于聚苯乙烯生产数据的生产能力预测方法及系统 Download PDFInfo
- Publication number
- CN116341770B CN116341770B CN202310618752.3A CN202310618752A CN116341770B CN 116341770 B CN116341770 B CN 116341770B CN 202310618752 A CN202310618752 A CN 202310618752A CN 116341770 B CN116341770 B CN 116341770B
- Authority
- CN
- China
- Prior art keywords
- data
- windows
- window
- similarity
- polystyrene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 102
- 239000004793 Polystyrene Substances 0.000 title claims abstract description 93
- 229920002223 polystyrene Polymers 0.000 title claims abstract description 93
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 87
- 238000005457 optimization Methods 0.000 claims abstract description 36
- 238000005259 measurement Methods 0.000 claims abstract description 17
- 238000012216 screening Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims description 40
- 239000002994 raw material Substances 0.000 claims description 27
- 238000010606 normalization Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000011958 production data acquisition Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 abstract description 6
- 238000012545 processing Methods 0.000 abstract description 4
- 230000008859 change Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Manufacturing & Machinery (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及电子数据处理技术领域,具体涉及基于聚苯乙烯生产数据的生产能力预测方法及系统,包括:数据采集,设定数据窗口长度,根据不同窗口中二维时序数据的二维数据差异得到不同窗口中数据点初始距离,通过窗口中二维数据之间趋势相关性对初始距离度量进行优化,并获取优化后最近邻窗口对应关系,确定CAC曲线,根据曲线局部最小值进行时序数据划分,设定划分阈值进行子序列的筛选,设定相似程度阈值进行子序列筛选,通过筛选后外部自回归变量对产量预测模型进行多变量引入,优化预测模型。本发明通过对多维时序数据进行分段,将存在影响子序列引入,将低影响子序列去除,从而保证时序数据分段进行外部变量引入的准确性,优化预测模型。
Description
技术领域
本发明涉及电子数据处理技术领域,具体涉及基于聚苯乙烯生产数据的生产能力预测方法及系统。
背景技术
聚苯乙烯是一种广泛应用于包装,电器,建筑和汽车等领域的塑料材料。在实际生产中,了解和预测化工厂的聚苯乙烯生产能力具有重要意义。通过了解聚苯乙烯的生产能力,可以更好地制定生产计划,合理安排生产周期和生产流程,以满足市场需求。并且,聚苯乙烯的生产涉及到许多成本和收益因素。通过对生产能力的预测,可以评估生产方案的经济效益,为企业提供决策依据。
聚苯乙烯的生产设计到许多因素,其中原材料供应和能源供应是重要的影响因
素。在现有的聚苯乙烯生产量预测模型基础上,使用模型引入原材料供应
数据与能源供应数据作为外部解释变量。这些外部变量可以帮助解释生产能力的变化,提
高预测模型的准确性。
在引入外部变量的过程中,因为聚苯乙烯的生产可能会发生结构性变化,如市场需求变化,政策变动等情况。为了让模型可以捕捉到这些变化,需要通过时间序列分段,对于原材料供应数据与能源供应数据在不同状态下的通过不同的参考程度进行外部变量的引入调整。
发明内容
本发明提供基于聚苯乙烯生产数据的生产能力预测方法及系统,以解决现有的问题。
本发明的基于聚苯乙烯生产数据的生产能力预测方法及系统采用如下技术方案:
一方面,本发明提供了基于聚苯乙烯生产数据的生产能力预测方法,该方法包括以下步骤:
通过工厂的聚苯乙烯生产数据进行数据采集,得到聚苯乙烯历史产量数据的一维时序数据以及原材料供应数据和能源供应数据组成的二维时序数据;
根据生产数据设定窗口长度,根据不同窗口中的二维时序数据的二维数据差异得到不同窗口中数据点的初始距离,根据窗口中不同维度相邻数据点的差异得到窗口中不同维度的相似程度,根据窗口中的相似程度和窗口中不同维度时序数据的DTW距离得到不同窗口之间的距离优化因子,根据窗口中不同维度数据和聚苯乙烯历史产量数据的相似程度得到不同窗口的平均相关程度,根据距离优化因子、初始距离、平均相关程度得到优化后的距离;
根据优化后的距离通过方法获取到整个二维时序数据中的窗口
之间最近邻窗口对应关系,根据最近邻窗口对应关系确定CAC曲线,根据CAC曲线的局部最
小值将二维时序数据进行时序数据的划分和筛选得到筛选后的子序列;
根据筛选后的子序列对产量预测模型进行生产能力预测;
所述根据距离优化因子、初始距离、平均相关程度得到优化后的距离,包括的具体步骤如下:
式中,表示第个窗口与第个窗口的平均相关程度,表示第个窗口与第个窗
口之间的距离优化因子,表示在二维时序数据中第个窗口中数据点与第个窗口中的数
据点的初始距离,表示优化后的距离。
进一步地,所述根据不同窗口中的二维时序数据的二维数据差异得到不同窗口中数据点的初始距离,包括的具体步骤如下:
获取任意一个窗口中的二维时序数据中的任意一个窗口位置的第一二维数据和任意一个其他窗口中的二维时序数据中相同窗口位置的第二二维数据,计算第一二维数据和第二二维数据在窗口中所有位置的数据差值的绝对值,将得到的窗口中所有位置的数据差值的绝对值进行求和得到不同窗口中数据点的初始距离。
进一步地,所述根据窗口中不同维度相邻数据点的差异得到窗口中不同维度的相似程度,包括的具体步骤如下:
式中,表示设定的窗口长度,即窗口中每个维度中数据点的数量,表示第
个窗口中第个维度中的第个数据点与第个数据点的差异,表示第个窗口中
第个维度中的第个数据点与第个数据点的差异,表示第个窗口中第个维
度中的第个数据点与第个数据点的差异,表示第个窗口中第个维度中的第
个数据点与第个数据点的差异,表示对于整个时序数据中全部窗口中的计算数
值进行线性归一化处理,表示第个窗口内两个维度的相似程度。
进一步地,所述根据窗口中的相似程度和窗口中不同维度时序数据的DTW距离得到不同窗口之间的距离优化因子,包括的具体步骤如下:
式中,表示窗口中的第个维度,的取值为和,表示第个窗口中的两个维度
之间的相似程度,表示第个窗口中的两个维度之间的相似程度,表示第个维度中窗
口滑动到窗口需要滑动的次数,表示第个窗口中的第个维度的时序数据,表示
第个窗口中的第个维度的时序数据,表示与之间的距离,
表示对所有窗口距离进行线性归一化处理,表示第个维度中第个窗口与第个窗
口之间的距离优化因子。
进一步地,所述根据窗口中不同维度数据和聚苯乙烯历史产量数据的相似程度得到不同窗口的平均相关程度,包括的具体步骤如下:
式中,表示第个窗口中的第个维度数据与聚苯乙烯历史产量数据的相似程
度,表示第个窗口中的第个维度数据与聚苯乙烯历史产量数据的相似程度,表示第个窗口中的第个维度数据与聚苯乙烯历史产量数据的相似程度,表示第个窗口中的
第个维度数据与聚苯乙烯历史产量数据的相似程度,表示第个窗口与第个窗口的平
均相关程度。
进一步地,所述筛选得到筛选后的子序列,包括的具体步骤如下:
获取到的曲线,通过将曲线上每一个时间戳对应的数据都进行归一化,获取
到每一个数据点的划分可能性,并将划分可能性小于划分阈值的时间戳对应点作为子序列
划分点,获取到全部子序列划分;
对于全部子序列划分中的第个子序列的维度之间的相似程度:
式中,表示第个子序列线性归一化后的相似程度,表示第个子序列的相
似程度,表示对全部子序列的相似程度进行线性归一化处理,设定相似程度阈值,将的子序列进行剔除。
另一方面,本发明还提供了基于聚苯乙烯生产数据的生产能力预测系统,该系统包含如下模块:
生产数据采集模块,用于数据采集,得到聚苯乙烯历史产量数据的一维时序数据以及原材料供应数据和能源供应数据的二维时序数据;
距离度量优化模块,用以设置滑动窗口,根据不同窗口中的二维时序数据的二维数据差异得到不同窗口中数据点的初始距离,根据窗口中不同维度相邻数据点的差异得到窗口中不同维度的相似程度;
根据窗口中的相似程度和窗口中不同维度时序数据的DTW距离得到不同窗口之间的距离优化因子,根据窗口中不同维度数据和聚苯乙烯历史产量数据的相似程度得到不同窗口的平均相关程度,根据距离优化因子、初始距离、平均相关程度得到优化后的距离;
最近邻窗口分析模块,根据优化后的距离通过方法获取到整个
二维时序数据中的窗口之间最近邻窗口对应关系,根据最近邻窗口对应关系确定CAC曲线,
根据CAC曲线的局部最小值将二维时序数据进行时序数据的划分和筛选得到筛选后的子序
列;
优化预测模型预测模块,根据筛选后的子序列对产量预测模型进行生产能力预测;
所述根据距离优化因子、初始距离、平均相关程度得到优化后的距离,包括的具体步骤如下:
式中,表示第个窗口与第个窗口的平均相关程度,表示第个窗口与第个窗
口之间的距离优化因子,表示在二维时序数据中第个窗口中数据点与第个窗口中的数
据点的初始距离,表示优化后的距离。
本发明的技术方案的有益效果是:
基于本发明所述的通过聚苯乙烯生产数据中的原材料供应数据与能源供应数据
进行外部自回归变量,相较于传统的单独通过产量数据通过模型进行预
测。可以通过运材料供应数据与能源供应数据进行聚苯乙烯产能数据中数据变化的解释,
从而提高对于聚苯乙烯生产能力预测的准确性。
基于本发明所述的通过优化后的对多维时序数据进行分段,通过原材料供
应数据与能源供应数据不同模态下对于产能数据的影响差异进行外部自回归变量引入过
程中的调整,将时序数据的局部特征信息与传统的产能数据预测模型具有共线性的
部分去除,保留共线性低的部分作为外部自回归变量。相较于直接将原材料供应数据与能
源供应数据引入,可以避免出现多重共线性的问题而导致模型的稳定性与预测能力的下
降。
基于本发明所述的通过多维时序数据中原材料供应数据与能源供应数据的变化差异进行最近邻子序列判断过程中不同维度中数据点距离的调整,可以在对多维时序数据进行分段时,避免待引入变量中出现的与聚苯乙烯产量时序数据具有高度相似性的数据导致的多重共线性的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于聚苯乙烯生产数据的生产能力预测方法的步骤流程图;
图2为本发明基于聚苯乙烯生产数据的生产能力预测系统的系统框架图;
图3为本发明实施例所给出的,以现有引入外部自回归变量方法训练所得现有ARIMAX模型的预测效果,和本实施例引入筛选后的外部自回归变量训练所得优化ARIMAX模型的预测效果的对比图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于聚苯乙烯生产数据的生产能力预测方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于聚苯乙烯生产数据的生产能力预测方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于聚苯乙烯生产数据的生产能力预测方法的步骤流程图,该方法包括以下步骤:
步骤S001、通过工厂的聚苯乙烯生产数据进行数据采集。
在聚苯乙烯工厂中的聚苯乙烯生产数据中,提取该工厂聚苯乙烯生产数据中的聚苯乙烯产量数据,原材料供应数据与能源供应数据。所述的供应数据为历史数据中每个时间点对于聚苯乙烯生产的投入量,即根据生产规划确定的每个生产周期的原材料投入量与能源消耗范围。
具体的,根据生产规划确定每一周的原材料供应数据和能源供应数据,将生产规划确定的所有原材料供应数据和能源供应数据构成一个时序序列,这个时序序列是二维的时序数据;二维时序数据中第一个维度是原材料供应数据构成的一个时序序列,第二个维度是能源供应数据构成的一个时序序列,根据历史的聚苯乙烯产量数据得到聚苯乙烯历史产量数据,聚苯乙烯历史产量数据也是一维时序数据。
至此,通过工厂的聚苯乙烯生产数据完成了数据采集,获取到了聚苯乙烯的原材料供应数据、能源供应数据,以及聚苯乙烯历史产量数据。
步骤S002、设定用于时序数据分段的窗口长度,根据不同窗口中的二维时序数据的二维数据差异得到不同窗口中数据点的初始距离。
需要说明的是,在采集到用于优化产量数据预测模型的聚苯乙烯生产原材料供应
数据与能源供应数据之后,即可以通过进行时序数据的基于的时
间序列模态分段。在这个过程中首先需要确定最基础的窗口大小,此处的窗口大小是用于
分析时间序列模态变化的最小单元。在确定窗口大小之后,即可通过窗口的滑动,在整个时
序数据中确定与该窗口内数据点之间差异最小的一个窗口。
进一步需要说明的是,在确定最近邻窗口的过程中,现有的距离度量为通过窗口内两个维度数据中的数值差异进行距离判断。为了在时间序列的分段中可以将具有共线性的数据进行剔除,在距离的度量中,就需要在最近邻窗口确定的过程中通过窗口内的数据点共线性进行距离度量的优化。从而在ARC曲线中可以通过曲线的局部最小值确定共线性严重的区域,并将其进行剔除。
具体的,在聚苯乙烯的生产数据中,通过聚苯乙烯的生产计划周期进行窗口长度
的判断,对于窗口长度即可设定为一个季度的数据长度即。即本实施例通过设定窗
口长度为进行后续的计算,对于该窗口长度可以通过生产工厂的数据采集实际情况进行
调整,本实施例不进行具体限定。
进一步的,在确定窗口长度之后,即可根据确定的窗口长度进行过程,在这个过程中对于窗口中的数据点差异所计算的初始距离:
式中,表示第个窗口中的二维时序数据中的第个位置的二维数据,表示第个窗口中的二维时序数据中的第个位置的二维数据,表示设定的窗口长度,表示在
二维时序数据中第个窗口中数据点与第个窗口中的数据点的初始距离。
需要说明的是,二维数据是指原材料供应数据与能源供应数据构成的两个数值,表示第个窗口与第个窗口对应位置处二维数据各自的差值的绝对值。
至此,根据不同窗口中的二维时序数据的二维数据差异得到不同窗口中数据点的初始距离。
步骤S003、通过窗口中二维数据之间的趋势相关性对初始距离度量进行优化,并获取优化后的最近邻窗口对应关系。
需要说明的是,在获取到在过程中窗口之间的二维时序数据的
初始距离度量之后,即可以通过窗口中的趋势相关性对初始距离度量进行优化。优化的原
因:在通过对原材料供应数据与能源供应数据形成的二维时序数据进行时序分段的
过程中,因为目的是要将二维时序数据中存在维度之间高相关性的子序列去除,从而保证
引入的外部自回归变量不会在优化模型时出现多重共线性的问题导致模型的稳定
性和准确性降低。
进一步需要说明的是,对于时序数据之间的相关性,首先需要对窗口中两个维度
之间的相关性进行判断,对于二维时序数据中的第个窗口中的数据中的第一个维度数据与第二个维度数据(此处所述的第一个维度即为原材料供应数据,第二个维度即为
能源供应数据)中数据趋势变化的一致性进行时序数据之间相关性的衡量。
1.具体的,根据窗口中不同维度相邻数据点的差异得到窗口中不同维度的相似程度。
对于第个窗口内两个维度的相似程度:
式中,表示设定的窗口长度,即窗口中每个维度中数据点的数量,表示第
个窗口中第个维度中的第个数据点与第个数据点的差异,表示第个窗口中
第个维度中的第个数据点与第个数据点的差异,表示第个窗口中第个维度
中的第个数据点与第个数据点的差异,表示第个窗口中第个维度中的第
个数据点与第个数据点的差异,表示对于整个时序数据中全部窗口中的计算数
值进行线性归一化处理,表示第个窗口内两个维度的相似程度。
其中,相邻数据点的差异具体可以如下表示:
,表示第个窗口中第个维度中的第个数据点与第
个数据点的差异。
,表示第个窗口中第个维度中的第个数据点与第
个数据点的差异。
至此,获取到第个窗口的两个维度的相似程度。
需要说明的是,对于二维时序数据中第个窗口,通过每个数据点在自身维度中的
归一化数值与的差异作为二者在对应时间戳下的距离度量。在维度相似
性的衡量中,当数据点的前后变化相似时,即,与,之间的变化
量的数值相近时,则说明两个维度的数据点在该位置具有相近的变化情况。通过窗口内两
个维度中数据点的变化方向相同的数据点的变化量的相似度量作为两个维度的相似程度,以此作为当前窗口中维度相似的特征值。用于衡量在整个时序数据中不同窗口之间的
共线性问题。
进一步需要说明的是,在获取到二维时序数据中第个窗口中两个维度的相似程
度之后,即为窗口内时序数据相似度量,可以用该相似程度在中窗口之间
的窗口之间数据距离度量中进行优化。因为上述的所计算的相似程度表示的为单个窗口
中的度量,在不同的窗口中因为存在着时序数据整体上的趋势变化,所以需要在两个窗口
(第个窗口和第个窗口)进行距离计算时,通过窗口之间的整体数据差异进行的优化判
断,从而准确的描述在数值与变化趋势两个方面的最近邻窗口度量。从而在后续的
过程中将会出现多重共线性问题的子序列进行提取。
2.具体的,根据窗口中的相似程度和窗口中不同维度时序数据的DTW距离得到不同窗口之间的距离优化因子。
对于第个窗口与第个窗口之间的距离优化因子:
式中,表示窗口中的第个维度,的取值为和,表示第个窗口中的两个维度
之间的相似程度,表示第个窗口中的两个维度之间的相似程度,表示第个维度中窗
口滑动到窗口需要滑动的次数,表示第个窗口中的第个维度的时序数据,表示第个窗口中的第个维度的时序数据,:表示与之间的距离,表
示对所有窗口距离进行线性归一化处理,表示第个维度中第个窗口与第个窗口
之间的距离优化因子。
需要说明的是,在的时序分段中,需要尽可能让附近的维度相似的窗口被
确定为最近邻窗口,并且在窗口之间的距离度量中,存在着窗口中数据点的在时间跨度中
的整体变大,这就会出现窗口各自的窗口内维度间相似度点度量出现不准确的情况,那么
在最近邻窗口确定时就需要通过时间跨度的影响进行距离的调整。那么对于两个窗口之间
的距离优化因子,即可以通过在到之间的窗口连续变化进行距离优化因子的获取。对
于第个窗口,通过其开始进行窗口滑动,并计算每一次变化时的窗口内维度间相似程度,通过连续的变化信息均值进行距离优化因子的计算。通过距离优化因子对进行优化
从而保证最近邻窗口之间的维度相似程度高并且时间跨度小。
进一步需要说明的是,基于上式所述的通过多维时序数据中原材料供应数据与能源供应数据的变化差异进行最近邻子序列判断过程中不同维度中数据点距离的调整,可以在对多维时序数据进行分段时,避免待引入变量中出现的与聚苯乙烯产量时序数据具有高度相似性的数据导致的多重共线性的问题。
需要说明的是,在距离优化因子中,通过待判断的第个窗口与第个窗口中相同维
度之间的距离作为两个窗口中数据点的形态偏差度量。并通过每个窗口内不同维度
之间的时序数据相似程度在窗口滑动过程中的整体均值变化进行调整。从而在距离调整的
过程中即可以考虑到窗口内不同维度之间的相似性,同时也可以考虑到不同窗口的相同维
度之间的形态差异。以此作为距离度量在分割的过程中将具有共线性问题的窗口进
行去除。
但是在上述的度量过程中,对于窗口的筛选过程中会出现待引入的外部自回归变
量(所述的二维时序数据)中虽然在此二维数据对比中存在着共线性的问题。但是当待引入
的二位时序数据与原模型中的聚苯乙烯产量时序数据具有着较大的形态差异时,对
于原模型数据来说待引入的时序数据就是重要的,所以对于还需要进一步通过待引入
数据与聚苯乙烯的历史产量数据之间的相关性判断,根据待引入的二维时序数据与原数据
之间的相关性获取到每个窗口的重要程度,并通过重要程度对距离优化因子进行约束,使
得平均重要程度越高的窗口在距离度量的过程中数值越小。
进一步需要说明的是,在最近邻子序列的判断过程中,对于第个窗口中的二维子
序列,通过两个维度各自与聚苯乙烯产量数据的相关程度进行衡量,获取到两个维度各自
的相关程度,再通过第个窗口与第个窗口中的各自与产量数据的平均相关程度作为衡
量。
3.具体的,根据窗口中不同维度数据和聚苯乙烯历史产量数据的相似程度得到不同窗口的平均相关程度。
式中,表示第个窗口中的第个维度数据与聚苯乙烯历史产量数据的相似程
度,表示第个窗口中的第个维度数据与聚苯乙烯历史产量数据的相似程度,表示第个窗口中的第个维度数据与聚苯乙烯历史产量数据的相似程度,表示第个窗口中的
第个维度数据与聚苯乙烯历史产量数据的相似程度,表示第个窗口与第个窗口的平
均相关程度。
其中:
需要说明的是,,与步骤S003中子步骤1中所述的的计算方式相同,不再
进行赘述,表示第个窗口中第个维度的时序数据,即第个窗口中聚苯乙烯的历史产
量数据,此处为通过窗口中的数据与聚苯乙烯的历史产量数据进行相关性对比,通过归一
化结果获取到窗口中数据点与基础产量数据的相关程度,并以窗口中两个维度的相关程度
的均值作为窗口中数据重要程度的衡量,并根据待对比的两个窗口的平均相关程度作为对
比过程中的重要程度衡量。
进一步需要说明的是,在获取到距离优化因子、初始距离、平均相关程度之后,即
可获取到在二维时序数据中第个窗口与第个窗口之间优化后的距离。
4.具体的,根据距离优化因子、初始距离、平均相关程度得到优化后的距离。
式中,表示第个窗口与第个窗口的平均相关程度,表示第个窗口与第个窗
口之间的距离优化因子,表示在二维时序数据中第个窗口中数据点与第个窗口中的数
据点的初始距离,表示优化后的距离。
需要说明的是,在获取到优化后的距离度量之后,对于二维时序数据即可通过方法获取到整个时序数据中的窗口之间最近邻窗口对应关系,需要特别
说明的是,方法是现有方法,最近邻窗口对应关系是该现有方法获取的输
出结果,此处不再进行赘述。
至此,通过窗口中二维数据之间的趋势相关性对初始距离度量进行优化,并获取优化后的最近邻窗口对应关系。
步骤S004、通过最近邻窗口对应关系确定CAC曲线,根据曲线的局部最小值进行时序数据的划分,设定划分阈值进行子序列的筛选,设定相似程度阈值进行子序列的筛选。
具体的,在获取到对于待引入的外部自回归变量:原材料供应与能源供应的二维
时序数据在过程中的最近邻对应关系之后,对于整个时间序列即可获取曲线。
需要说明的是,所述的曲线为整个时间序列数据中,每一个数据点上方的最
近邻关系连线的数量。
进一步的,对于曲线的局部最小值则说明两侧的时序模态发生了变化。那么
通过局部最小值的划分就可以将原材料供应与能源供应的时序数据中趋势变化相似的子
序列同样划分出来。
进一步的,对于获取到的曲线,通过将曲线上每一个时间戳对应的数据都进
行归一化,获取到每一个数据点的划分可能性,并将划分可能性小于划分阈值的时间戳对
应点作为子序列划分点,获取到全部子序列划分。此处将获取到的全部子序列数量记为
个。
需要说明的是,本实施例以划分阈值为0.3进行叙述,实施时可以设置为其他值。
进一步的,对于全部子序列划分中的第个子序列。通过对子序列中的二维数据
相似性进行判断,根据趋势的相似程度进行子序列剔除。对于第个子序列的维度之间的
相似程度:
式中,表示第个子序列线性归一化后的相似程度,表示第个子序列的相
似程度,表示对全部子序列的相似程度进行线性归一化处理,设定相似程度阈值,将的子序列进行剔除,即对于这个部分不引入外部自回归变量。
需要说明的是,本实施例以相似程度阈值为例进行叙述,实施时可以设置
为其他值。
至此,通过最近邻窗口对应关系确定CAC曲线,并通过曲线的局部最小值进行时序数据的划分,设定相似程度阈值进行子序列的筛选,即得到筛选后的外部自回归变量。
步骤S005、通过筛选后的外部自回归变量对产量预测模型进行多变量引入,优化预测模型并进行生产预测。
在获取到筛选后的聚苯乙烯原材料供应数据与能源供应数据之后,将数据作为外
部自回归变量结合已有的聚苯乙烯产量预测模型训练模型(引入外部自回
归变量为现有技术)。在获取到引入外部自回归变量后的模型后通过模型对聚苯
乙烯的生产能力进行预测,获取预测结果并根据预测结果进行决策调整。
如图3所示,编号1表示以现有的引入外部自回归变量方法训练所得的现有模型对聚苯乙烯产量的预测结果,编号2表示以本实施例的通过引入所述筛选后
的外部自回归变量训练所得改进模型对聚苯乙烯产量的预测结果,数据点表示历
史数据中每周真实的聚苯乙烯产量。
从图3中两种预测模型对聚苯乙烯产量的预测结果可以看出,在相同预测次数下,
编号2所对应的改进模型对真实的聚苯乙烯产量预测命中次数为5次,而现有模型对真实的聚苯乙烯产量预测命中次数则仅为4次,且改进模型的预测
趋势相较于现有模型明显更贴合真实的聚苯乙烯产量数据的走势。所以可以确
定,本实施例通过引入所述筛选后的外部自回归变量训练所得改进模型,对聚苯
乙烯产量也即对聚苯乙烯生产能力可取得更好的预测效果。
至此,通过以上步骤,完成基于聚苯乙烯生产数据的生产能力预测。
本发明的另一个实施例提供了基于聚苯乙烯生产数据的生产能力预测系统,如图2所示,该系统包括以下模块:
生产数据采集模块,用于数据采集,得到聚苯乙烯历史产量数据的一维时序数据以及原材料供应数据和能源供应数据的二维时序数据;
距离度量优化模块,用以设置滑动窗口,根据不同窗口中的二维时序数据的二维数据差异得到不同窗口中数据点的初始距离,根据窗口中不同维度相邻数据点的差异得到窗口中不同维度的相似程度;
根据窗口中的相似程度和窗口中不同维度时序数据的DTW距离得到不同窗口之间的距离优化因子,根据窗口中不同维度数据和聚苯乙烯历史产量数据的相似程度得到不同窗口的平均相关程度,根据距离优化因子、初始距离、平均相关程度得到优化后的距离;
最近邻窗口分析模块,根据优化后的距离通过方法获取到整个
二维时序数据中的窗口之间最近邻窗口对应关系,根据最近邻窗口对应关系确定CAC曲线,
根据CAC曲线的局部最小值将二维时序数据进行时序数据的划分和筛选得到筛选后的子序
列;
优化预测模型预测模块,根据筛选后的子序列对产量预测模型进行生产能力预测。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.基于聚苯乙烯生产数据的生产能力预测方法,其特征在于,该方法包括以下步骤:
通过工厂的聚苯乙烯生产数据进行数据采集,得到聚苯乙烯历史产量数据的一维时序数据以及原材料供应数据和能源供应数据组成的二维时序数据;
根据生产数据设定窗口长度,根据不同窗口中的二维时序数据的二维数据差异得到不同窗口中数据点的初始距离,根据窗口中不同维度相邻数据点的差异得到窗口中不同维度的相似程度,根据窗口中的相似程度和窗口中不同维度时序数据的DTW距离得到不同窗口之间的距离优化因子,根据窗口中不同维度数据和聚苯乙烯历史产量数据的相似程度得到不同窗口的平均相关程度,根据距离优化因子、初始距离、平均相关程度得到优化后的距离;
根据优化后的距离通过方法获取到整个二维时序数据中的窗口之间最近邻窗口对应关系,根据最近邻窗口对应关系确定CAC曲线,根据CAC曲线的局部最小值将二维时序数据进行时序数据的划分和筛选得到筛选后的子序列;
根据筛选后的子序列对产量预测模型进行生产能力预测;
所述根据距离优化因子、初始距离、平均相关程度得到优化后的距离,包括的具体步骤如下:
式中,表示第/>个窗口与第/>个窗口的平均相关程度,/>表示第/>个窗口与第/>个窗口之间的距离优化因子,/>表示在二维时序数据中第/>个窗口中数据点与第/>个窗口中的数据点的初始距离,/>表示优化后的距离。
2.根据权利要求1所述基于聚苯乙烯生产数据的生产能力预测方法,其特征在于,所述根据不同窗口中的二维时序数据的二维数据差异得到不同窗口中数据点的初始距离,包括的具体步骤如下:
获取任意一个窗口中的二维时序数据中的任意一个窗口位置的第一二维数据和任意一个其他窗口中的二维时序数据中相同窗口位置的第二二维数据,计算第一二维数据和第二二维数据在窗口中所有位置的数据差值的绝对值,将得到的窗口中所有位置的数据差值的绝对值进行求和得到不同窗口中数据点的初始距离。
3.根据权利要求1所述基于聚苯乙烯生产数据的生产能力预测方法,其特征在于,所述根据窗口中不同维度相邻数据点的差异得到窗口中不同维度的相似程度,包括的具体步骤如下:
式中,表示设定的窗口长度,即窗口中每个维度中数据点的数量,/>表示第/>个窗口中第/>个维度中的第/>个数据点与第/>个数据点的差异,/>表示第/>个窗口中第/>个维度中的第/>个数据点与第/>个数据点的差异,/>表示第/>个窗口中第/>个维度中的第/>个数据点与第/>个数据点的差异,/>表示第/>个窗口中第/>个维度中的第个数据点与第/>个数据点的差异,/>表示对于整个时序数据中全部窗口中的计算数值进行线性归一化处理,/>表示第/>个窗口内两个维度的相似程度。
4.根据权利要求1所述基于聚苯乙烯生产数据的生产能力预测方法,其特征在于,所述根据窗口中的相似程度和窗口中不同维度时序数据的DTW距离得到不同窗口之间的距离优化因子,包括的具体步骤如下:
式中,表示窗口中的第/>个维度,/>的取值为/>和/>,/>表示第/>个窗口中的两个维度之间的相似程度,/>表示第/>个窗口中的两个维度之间的相似程度,/>表示第/>个维度中窗口/>滑动到窗口/>需要滑动的次数,/>表示第/>个窗口中的第/>个维度的时序数据,/>表示第/>个窗口中的第/>个维度的时序数据,/>表示/>与/>之间的/>距离,/>表示对所有窗口/>距离进行线性归一化处理,/>表示第/>个维度中第/>个窗口与第/>个窗口之间的距离优化因子。
5.根据权利要求1所述基于聚苯乙烯生产数据的生产能力预测方法,其特征在于,所述根据窗口中不同维度数据和聚苯乙烯历史产量数据的相似程度得到不同窗口的平均相关程度,包括的具体步骤如下:
式中,表示第/>个窗口中的第/>个维度数据与聚苯乙烯历史产量数据的相似程度,/>表示第/>个窗口中的第/>个维度数据与聚苯乙烯历史产量数据的相似程度,/>表示第/>个窗口中的第/>个维度数据与聚苯乙烯历史产量数据的相似程度,/>表示第/>个窗口中的第/>个维度数据与聚苯乙烯历史产量数据的相似程度,/>表示第/>个窗口与第/>个窗口的平均相关程度。
6.根据权利要求1所述基于聚苯乙烯生产数据的生产能力预测方法,其特征在于,所述筛选得到筛选后的子序列,包括的具体步骤如下:
获取到的曲线,通过将曲线上每一个时间戳对应的数据都进行归一化,获取到每一个数据点的划分可能性,并将划分可能性小于划分阈值的时间戳对应点作为子序列划分点,获取到全部子序列划分;
对于全部子序列划分中的第个子序列的维度之间的相似程度/>:
式中,表示第/>个子序列线性归一化后的相似程度,/>表示第/>个子序列的相似程度,/>表示对全部子序列的相似程度进行线性归一化处理,设定相似程度阈值/>,将的子序列进行剔除。
7.基于聚苯乙烯生产数据的生产能力预测系统,其特征在于,该系统包括以下模块:
生产数据采集模块,用于数据采集,得到聚苯乙烯历史产量数据的一维时序数据以及原材料供应数据和能源供应数据的二维时序数据;
距离度量优化模块,用以设置滑动窗口,根据不同窗口中的二维时序数据的二维数据差异得到不同窗口中数据点的初始距离,根据窗口中不同维度相邻数据点的差异得到窗口中不同维度的相似程度;
根据窗口中的相似程度和窗口中不同维度时序数据的DTW距离得到不同窗口之间的距离优化因子,根据窗口中不同维度数据和聚苯乙烯历史产量数据的相似程度得到不同窗口的平均相关程度,根据距离优化因子、初始距离、平均相关程度得到优化后的距离;
最近邻窗口分析模块,根据优化后的距离通过方法获取到整个二维时序数据中的窗口之间最近邻窗口对应关系,根据最近邻窗口对应关系确定CAC曲线,根据CAC曲线的局部最小值将二维时序数据进行时序数据的划分和筛选得到筛选后的子序列;
优化预测模型预测模块,根据筛选后的子序列对产量预测模型进行生产能力预测;
所述根据距离优化因子、初始距离、平均相关程度得到优化后的距离,包括的具体步骤如下:
式中,表示第/>个窗口与第/>个窗口的平均相关程度,/>表示第/>个窗口与第/>个窗口之间的距离优化因子,/>表示在二维时序数据中第/>个窗口中数据点与第/>个窗口中的数据点的初始距离,/>表示优化后的距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310618752.3A CN116341770B (zh) | 2023-05-30 | 2023-05-30 | 基于聚苯乙烯生产数据的生产能力预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310618752.3A CN116341770B (zh) | 2023-05-30 | 2023-05-30 | 基于聚苯乙烯生产数据的生产能力预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116341770A CN116341770A (zh) | 2023-06-27 |
CN116341770B true CN116341770B (zh) | 2023-07-21 |
Family
ID=86879067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310618752.3A Active CN116341770B (zh) | 2023-05-30 | 2023-05-30 | 基于聚苯乙烯生产数据的生产能力预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116341770B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117235462B (zh) * | 2023-11-09 | 2024-02-13 | 海门市知行包装制品有限公司 | 基于时序数据分析的袋式包装机故障智能预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012042362A1 (en) * | 2010-09-30 | 2012-04-05 | Energie Etiche S.R.L. | Combined system for evaluating the producibility of a wind farm |
CN109508818A (zh) * | 2018-10-23 | 2019-03-22 | 保定正德电力技术有限公司 | 一种基于LSSVM的在线NOx预测方法 |
CN115049113A (zh) * | 2022-05-30 | 2022-09-13 | 三峡大学 | 基于时间窗口和超参数自适应选择的s2s电力负荷预测系统 |
CN115544361A (zh) * | 2022-10-10 | 2022-12-30 | 上海瀛数信息科技有限公司 | 一种窗口相似度分析的关注点变化预测框架及其分析方法 |
EP4120158A1 (en) * | 2021-07-12 | 2023-01-18 | Bühler AG | Control system for optimizing energy management in production processes of plants or industrial sites or measuring system for automated measuring of co2e quantification measures |
CN116151451A (zh) * | 2023-02-22 | 2023-05-23 | 江南大学 | 基于三重强化学习的电池制造能力可变权组合预测方法 |
-
2023
- 2023-05-30 CN CN202310618752.3A patent/CN116341770B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012042362A1 (en) * | 2010-09-30 | 2012-04-05 | Energie Etiche S.R.L. | Combined system for evaluating the producibility of a wind farm |
CN109508818A (zh) * | 2018-10-23 | 2019-03-22 | 保定正德电力技术有限公司 | 一种基于LSSVM的在线NOx预测方法 |
EP4120158A1 (en) * | 2021-07-12 | 2023-01-18 | Bühler AG | Control system for optimizing energy management in production processes of plants or industrial sites or measuring system for automated measuring of co2e quantification measures |
CN115049113A (zh) * | 2022-05-30 | 2022-09-13 | 三峡大学 | 基于时间窗口和超参数自适应选择的s2s电力负荷预测系统 |
CN115544361A (zh) * | 2022-10-10 | 2022-12-30 | 上海瀛数信息科技有限公司 | 一种窗口相似度分析的关注点变化预测框架及其分析方法 |
CN116151451A (zh) * | 2023-02-22 | 2023-05-23 | 江南大学 | 基于三重强化学习的电池制造能力可变权组合预测方法 |
Non-Patent Citations (1)
Title |
---|
基于多维度与QGA-LSSVM算法的制造业用电量预测;王宝等;电力需求侧管理;第19卷(第1期);17-21、28 * |
Also Published As
Publication number | Publication date |
---|---|
CN116341770A (zh) | 2023-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116341770B (zh) | 基于聚苯乙烯生产数据的生产能力预测方法及系统 | |
CN111008726B (zh) | 一种电力负荷预测中类图片转换方法 | |
CN111768034A (zh) | 一种电力负荷预测中基于近邻算法进行插补补充缺失值的方法 | |
CN111967535A (zh) | 一种储粮管理场景温度传感器故障诊断方法及其诊断装置 | |
CN112749840A (zh) | 一种火电机组能效特征指标基准值的获取方法 | |
CN116821832A (zh) | 针对高压工商业用户用电负荷的异常数据辨识与修正方法 | |
CN116520772A (zh) | 基于多任务迁移学习的薄板零件数控加工质量预测方法 | |
CN102713974B (zh) | 学习装置、识别装置、学习识别系统和学习识别装置 | |
CN106845825B (zh) | 一种基于改进pca的带钢冷轧质量问题溯源及控制方法 | |
CN114912720A (zh) | 基于记忆网络电力负荷预测方法、装置、终端及存储介质 | |
CN114118401A (zh) | 基于神经网络的配电网络流量预测方法、系统、装置及存储介质 | |
CN111091243A (zh) | 基于pca-gm的电力负荷预测方法、系统、计算机可读存储介质和计算设备 | |
CN112418522A (zh) | 一种基于三支集成预测模型的工业加热炉钢温预测方法 | |
Kurz et al. | Monitoring virtual metrology reliability in a sampling decision system | |
CN114266423B (zh) | 基于多模型的电力能源需求预测方法、装置及存储介质 | |
CN115169721B (zh) | 一种基于迁移辨识的精馏过程单吨能耗预测方法及系统 | |
CN113626578B (zh) | 一种密封材料的智能分析方法及系统 | |
Gong et al. | Short-term electricity price forecasting based on novel SVM using artificial fish swarm algorithm under deregulated power | |
CN113535527A (zh) | 一种面向实时流数据预测性分析的降载方法及系统 | |
CN109376957B (zh) | 一种火电厂负荷的预测方法 | |
CN117792404B (zh) | 一种用于铝合金压铸零件的数据管理方法 | |
CN116757337B (zh) | 一种基于人工智能的房建施工进度预测系统 | |
WO2024077876A1 (zh) | 一种基于自适应的局部动态焦炭质量预测方法 | |
CN116843368B (zh) | 基于arma模型的营销数据处理方法 | |
US20240134978A1 (en) | Dynamic Windowing for Processing Event Streams |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |