CN116307298B - 一种基于多源异构张量数据的组合碳排放预测方法 - Google Patents
一种基于多源异构张量数据的组合碳排放预测方法 Download PDFInfo
- Publication number
- CN116307298B CN116307298B CN202310580222.4A CN202310580222A CN116307298B CN 116307298 B CN116307298 B CN 116307298B CN 202310580222 A CN202310580222 A CN 202310580222A CN 116307298 B CN116307298 B CN 116307298B
- Authority
- CN
- China
- Prior art keywords
- carbon emission
- data
- tensor
- prediction
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 229910052799 carbon Inorganic materials 0.000 title claims abstract description 129
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 title claims description 14
- 230000008451 emotion Effects 0.000 claims abstract description 49
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims abstract description 13
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 4
- 238000013480 data collection Methods 0.000 claims abstract description 3
- 238000007781 pre-processing Methods 0.000 claims abstract description 3
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims description 15
- 230000009193 crawling Effects 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 4
- 230000002996 emotional effect Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 239000003086 colorant Substances 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 230000036651 mood Effects 0.000 claims description 3
- 230000002688 persistence Effects 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000005303 weighing Methods 0.000 claims description 2
- 239000003344 environmental pollutant Substances 0.000 abstract description 3
- 231100000719 pollutant Toxicity 0.000 abstract description 3
- 239000013589 supplement Substances 0.000 abstract description 3
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 8
- 238000010792 warming Methods 0.000 description 5
- 229910002092 carbon dioxide Inorganic materials 0.000 description 4
- 239000005431 greenhouse gas Substances 0.000 description 4
- 239000001569 carbon dioxide Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/84—Greenhouse gas [GHG] management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及污染物排放预测技术领域,具体的涉及一种基于多源异构张量数据的组合碳排放预测模型,包括以下步骤:数据收集,获取历年的碳排放数据;文本情感分析,为构建数值数据的张量信息空间做准备;张量表示,对数据进行预处理,构建起碳排放预测的信息空间,将预测信息表示为三阶张量流;张量分解与重构,使用高阶奇异值分解的方式将矩阵分解为奇异向量和奇异值,捕捉不同信息模式之间的潜在关系,完成张量重构;碳排放组合预测,将预测结果进行加和得到未来碳排放量。将媒体信息与历史碳排放数据相结合,进行情感分析,结合搜索频次和历史碳排放量构建一个三维张量,以补充时间序列历史数据,避免有价值信息的遗失,提高预测性能。
Description
技术领域
本发明涉及污染物排放预测技术领域,具体的涉及一种基于多源异构张量数据的组合碳排放预测模型。
背景技术
温室气体排放是世界各国一直在努力解决的问题。其目的旨在减少污染物排放并改善全球气候变暖情况。值得注意的是,碳排放是温室气体排放中的主要贡献者。因此,减少CO2排放是世界各国在治理温室气体时的首要关注点。对碳排放量进行预测可以帮助预测未来的全球变暖,估计减少二氧化碳的成本以及防止温度上升等相关好处。因此,探讨如何精准预测二氧化碳的排放量,在改善全球变暖和制定环境政策方面具有深远意义。
人们对碳排放量进行了多种预测,主要集中在应用时间序列模型进行。常见的时间序列统计模型,如ARIMA已被广泛用于碳排放预测。尽管人们对时间序列预测模型非常感兴趣,但它们只是基于历史值来预测碳排放。然而,碳排放是一个复杂的系统,它不仅受到过去信息的影响,还受到其他因素的影响,这些因素的影响很可能在未来的碳排放中显现出来。因此,如果忽略了它们的作用,可能会影响最终投影结果的可靠性和准确性。
近年来,研究人员广泛地将互联网数据作为解释变量纳入预测研究。多项研究表明,从用户生成内容中提取的信息可以有效地提高数值预测的准确性。由于它涵盖了即将发生的事件的信息,并可以提供时间序列历史数据的补充,因此可以有效地抵消由于缺乏对未来信息的了解而导致的预测性能的恶化。目前,这项技术已经被应用于评估标准监测,分析问题情况,天气和污染评估等领域。互联网数据和预测模型的结合可能会促进预测性能的提高,其中最主要的原因是文本挖掘对于识别想法和提取信息非常有用。
因此,现有的碳排放预测模型中往往忽略了互联网数据对碳排放的影响,本领域技术人员亟需一种能够解决当前问题的,并从用户生成内容中提取的信息从而有效地提高碳排放数值预测的准确性的碳排放预测模型。
发明内容
针对现有技术中存在的问题,本发明的目的在于:提供一种将互联网数据作为解释变量纳入碳排放预测研究,从用户生成内容中提取碳排放相关信息,有效地提高碳排放数值预测的准确性的基于多源异构张量数据的组合的碳排放预测模型。
为实现上述目的,本发明采用的技术方案是:
一种基于多源异构张量数据的组合碳排放预测模型,包括以下步骤:
步骤一:数据收集,通过关键词衡量网民对碳排放的关注程度,以及媒体对碳排放的关注指数,并获取历年的碳排放数据;
步骤二:文本情感分析,对带有情感色彩的主观性文本进行分析、处理、归纳和推理,对感情色彩强弱程度赋值,将文本数据转换为数值数据,为构建数值数据的张量信息空间做准备;
步骤三:张量表示,对数据进行预处理,结合上述获取的搜索频次、情感指数、历史碳排放量三类数据,将三类数据放置在三阶张量的三个不同面上,构建起碳排放预测的信息空间,保持数据的多面性和相互关联,将预测信息表示为三阶张量流,张量的每一阶表示信息模态的一个子空间;
步骤四:张量分解与重构,使用高阶奇异值分解的方式将矩阵分解为奇异向量和奇异值,捕捉不同信息模式之间的潜在关系,将一个张量分解成一个核心张量,再乘以每个模式的矩阵,完成张量重构;
步骤五:碳排放组合预测,采用“剩余补偿”思想构建RNN-ARIMA组合预测模型,利用RNN对数据序列进行整体分析,用ARIMA解释RNN预测残差之间的线性关系,将两者预测结果进行加和得到未来碳排放量。
上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤一包括:
步骤1-1:从互联网上收集不同关键词的每日指数,将其作为搜索量指数用于衡量网民对碳排放的关注程度;
步骤1-2:从搜索数据库中检索与碳排放相关的新闻广播,并用关键词的出现频率作为媒体关注指数;
步骤1-3:从碳核算数据库获取历年的碳排放数据。
上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤二包括:
步骤2-1:根据互联网指数选取与“碳排放”相关性最强的关键词;
步骤2-2:以关键词为索引,从互联网博文和新闻网站标题中爬取相关文本内容;
步骤2-3:使用Python对所需文本内容进行爬取,通过使用基本情感词典对爬取的内容进行单词匹配,对情感进行分类,设置情感取值范围,确定情感的积极性;
步骤2-4:将文本内容分类,计算每日的情绪平均值,并获得每月情绪平均值。
上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤三包括:
所述张量表示为:表示t时刻历史碳排放量与社交媒体信息之间的关系,I1,I2,I3分别代表搜索频次、情感指数、历史碳排放量的特征集合。
上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤四包括:
步骤4-1:将t时刻的三阶张量分解为C、U1、U2、U3,其中C为核心张量,因子矩阵U1,U2,U3分别描述了经过高阶奇异值分解之后的搜索频次、情感指数、历史碳排放量三种预测信息的特征;
步骤4-2:利用公式将核心张量和三个因子矩阵相乘,导出重构张量/>其中×m,m∈1,2,3为运算符,分别代表搜索频次、情感指数、历史碳排放量的矩阵乘积,以避免信息重叠以及信息抵消导致的有价值信息的遗失。
上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤五包括:
步骤5-1:将重构张量数据流作为输入,利用公式/>获得RNN在t时刻的隐藏状态ht,其中f是RNN的激活函数,U代表输入值/>的权重值,W代表隐藏值ht-1的权重值,b是隐藏值ht-1的偏置值;
步骤5-2:计算出当前时刻的隐藏状态ht后,在当前时刻的预测输出值的计算公式如下:/>V是隐藏层到输出层的权重值,c是隐藏值ht的偏置值,计算出残差序列/>其中Yt为预测时间序列所对应的碳排放量真实值;
步骤5-3:将残差序列et作为ARIMA模型的输入,利用自回归模型e′t=C0+r1et-1+…+rpet-p+wt进行自回归分析,运用残差et-p至et-1的状态变化来预测t时刻的残差e′t,其中C0是常数,r1,...,rp是自回归参数,p是自回归顺序,wt表示误差;
步骤5-4:利用移动平均模型at=λ+wt+m1wt-1+…+mqwt-f对自回归模型的误差部分进行累加,消除预测中相关因素因随机波动而形成的具有相互抵偿性的误差,其中,at表示误差加和,λ表示与at相关的期望,wt,...,wt-f表示误差项,m1,...,mq是移动平均参数,q是移动平均顺序;
步骤5-5:自回归、移动平均两个子模型的集成定义了ARIMA模型的最终输出结果公式为/>
步骤5-6:利用残差预测对RNN预测结果/>进行校正,得到组合预测结果的未来碳排量/>
上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤四与步骤五之间还包括:使用LSTM模型进行前期试验,了解社交媒体信息对碳排放预测的具体影响。
上述的基于多源异构张量数据的组合碳排放预测模型,所述前期试验包括:
步骤a:基于将不同类型的数据作为输入的LSTM预测结果,分析搜索频率、文本情绪和媒体关注度变量对碳排放预测的影响;
步骤b:将不同文本特征数据组合与历史碳排放数据相结合作为输入,与单独使用历史碳排放数据作为输入的预测结果进行对比,测试文本特征集的预测性能;
步骤c:通过使用一段时间的数据作为输入,探讨其对预测影响的持久性,分析每月频率数据对情绪和注意力变量的影响。
本发明一种基于多源异构张量数据的组合碳排放预测模型的有益效果是:将社交媒体信息与历史碳排放数据相结合,先对文本信息进行情感分析,再结合搜索频次和历史碳排放量构建成一个三维张量,以补充时间序列历史数据,避免信息重叠以及信息抵消导致的有价值信息的遗失,从而提高预测性能。在此基础上,构建了张量-RNN-ARIMA联合预测模型,通过对张量进行分解重构,提取并分析组合数据之间的动态关系,改善原始串联输入忽略不同数据组合之间关系的问题。同时,将非线性RNN模型与线性ARIMA模型相结合,基于“剩余补偿”思想,使用RNN对数据序列进行线性分析,然后通过ARIMA来解释从RNN预测中获得的残差中的线性关系,从而构建了具有较高预测精度的组合预测模型。
附图说明
图1为本发明基于多源异构张量数据的组合碳排放预测模型的系统框架图;
图2为本发明三阶张量的分解流程图;
图3为本发明ARIMA-RNN组合模型的预测流程图。
具体实施方式
为使本领域技术人员更好的理解本技术方案的内容,下面结合具体实施方式和附图对本申请的技术方案进行说明。
如图1-图3所示,一种基于多源异构张量数据的组合碳排放预测模型,模型框架如图1所示,具体步骤如下:
步骤1、数据收集。
1.1从相关互联网网络搜索引擎收集不同关键词在一定时间段内,如2021年1月至2022年8月期间的每日网络搜索引擎的搜索指数,将其作为搜索量指数用于衡量网民对碳排放的关注程度,搜索量越高表示网民关注度越高;反之,则表示越低。
1.2从Wisers搜索数据库的数据库中检索出一段时间内,如2021年1月至2022年8月与该主题相关的每月新闻广播,并用关键词“碳排放”的出现频率作为媒体关注指数,出现频率越高表示媒体关注度越高;反之,则表示越低。
1.3从碳核算数据库获取历年的碳排放数据。
步骤2、文本情感分析。
文本情感分析对带有情感色彩的主观性文本进行分析、处理、归纳和推理,通过给感情色彩强弱程度赋值,将文本数据转换为数值数据,为构建社交媒体情感与历史碳排放量等其它数值数据的张量信息空间做准备,本发明利用基本情感词典对互联网记载的原创内容和新闻标题进行情感赋值。
2.1根据相关互联网网络搜索引擎搜索指数选取与“碳排放”相关性最强的关键词,关键词共有28个,分别为:碳排放、碳足迹、气候变化、能源污染、二氧化碳排放、碳关税、雾霾、碳普惠、气候变暖、碳计算器、温室气体、碳、排放交易、碳交易、碳税、能量守恒、碳补偿、碳排放物、碳汇、全球变暖、低碳、碳中和、碳交易、碳排放减少、双碳、碳达峰、空气质量、节能措施、排放。
2.2以这28个关键词为索引,从互联网上,如互联网记载的原创内容或新闻网站标题中爬取相关文本内容,具体爬取方式可采用现有爬取技术,在此不进行赘述。
2.3首先,使用Python对所需文本内容进行爬取,通过使用基本情感词典对爬取的内容进行单词匹配,从而对情感进行分类,情感取值范围在0到1之间,数值接近0表示句子中表达的情绪越消极,反之则越积极。
2.4将文本内容按天分类,计算出每条文本的情绪值,从而求出每日的情绪平均值,在求得日平均值后,计算三十天的情绪平均值从而得到月情绪值。
步骤3、张量表示。
结合上述的三类数据:搜索频次、情感指数、历史碳排放量,将三类数据放置在三阶张量的三个不同面上,构建起碳排放预测的信息空间,以保持数据的多面性和相互关联,图2给出了一个三阶张量的例子,其中表示t时刻历史碳排放量与社交媒体信息之间的关系,I1,I2,I3分别代表搜索频次、情感指数、历史碳排放量的特征集合,各特征合集中的元素值/>定义如下:/>表示t时刻搜索频次的特征,由一个个点的t时刻搜索频次的特征的集合组成面的搜索频次特征集合I1,/>表示t时刻情感指数的特征,由一个个点的t时刻情感指数的特征的集合组成面的情感指数特征集合I2,/>表示t时刻历史碳排放量的特征,由一个个点的t时刻历史碳排放量的特征的集合组成面的历史碳排放量特征集合I3;由此,将各特征合集中的单一元素值形成的集合,用面的形式构成特征集合,预测信息被表示为三阶张量流,张量的每一阶表示一类预测信息的特征合集。
步骤4、张量分解与重构。
使用高阶奇异值分解将矩阵分解为奇异向量和奇异值,从而来捕捉不同信息模式之间的潜在关系,将一个张量分解成一个核心张量,再乘以每个模式的矩阵。
4.1将t时刻的三阶张量分解为C、U1、U2、U3,其中C为核心张量,因子矩阵U1,U2,U3分别描述了经过高阶奇异值分解之后的搜索频次、情感指数、历史碳排放量三种预测信息的特征。
4.2利用公式将核心张量和三个因子矩阵相乘,导出重构张量/>其中×m,m∈1,2,3为运算符,分别代表搜索频次、情感指数、历史碳排放量的矩阵乘积,以避免信息重叠以及信息抵消导致的有价值信息的遗失。
步骤5、前期试验。
选取少量数据进行初步预测,以了解社交媒体信息对碳排放预测的具体影响,由于LSTM模型可以对长时间序列数据进行学习预测,因此本发明在正式预测前使用LSTM模型进行前期实验。
5.1基于将不同类型的数据作为输入的LSTM预测结果,分析日常搜索频率、文本情绪和媒体关注度变量对碳排放预测的影响。
5.2将不同文本特征数据组合与历史碳排放数据相结合作为输入,与单独使用历史碳排放数据作为输入的预测结果进行对比,测试文本特征集的预测性能。
5.3通过使用前一个月、前两个月和前三个月的数据作为输入,探讨其对预测影响的持久性,分析每月频率数据对情绪和注意力变量的影响。
步骤6、碳排放组合预测。
如图3所示,采用“剩余补偿”思想构建RNN-ARIMA组合预测模型,首先利用RNN对数据序列进行整体分析,然后用ARIMA解释了RNN预测残差之间的线性关系,最后将两者预测结果进行加和得到未来碳排放量。
6.1将重构张量数据流作为输入,利用公式/>获得RNN在t时刻的隐藏状态ht,其中f是RNN的激活函数,U代表输入值/>的权重值,W代表隐藏值ht-1的权重值,初始化合理的权重值,能够使每个神经元尽可能躲开梯度消失的区域,b是隐藏值ht-1的偏置值,在本方案中b=1。
6.2计算出当前时刻的隐藏状态ht后,在当前时刻的预测输出值的计算公式如下:/>V是隐藏层到输出层的权重值,c是隐藏值ht的偏置值,计算出残差序列/>其中Yt为预测时间序列所对应的碳排放量真实值。
6.3将残差序列et作为ARIMA模型的输入,利用自回归模型e′t=C0+r1et-1+…+rpet-p+wt进行自回归分析,运用残差et-p至et-1的状态变化来预测t时刻的残差e′t,其中C0是常数,r1,...,rp是自回归参数,p是自回归顺序,由偏自相关系数图的最大滞后点确定,wt表示误差,即自噪声,自回归模型表明残差序列et可以由其自身的过去或滞后值以及随机扰动项来解释。
6.4利用移动平均模型at=λ+wt+m1wt-1+…+mqwt-f对自回归模型的误差部分进行累加,消除预测中相关因素因随机波动而形成的具有相互抵偿性的误差,其中,at表示误差加和,入表示与at相关的期望,wt,...,wt-f表示误差项,即自噪声项,m1,...,mq是移动平均参数,q是移动平均顺序由自相关系数图的最大滞后点确定。
6.5上述两个子模型的集成定义了ARIMA模型的最终输出结果公式为
6.6利用残差预测对RNN预测结果/>进行校正,得到组合预测结果的未来碳排量
上述实施例只是为了说明本发明的发明构思和特点,其目的在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限定本发明的保护范围。凡是根据本发明内容的实质所做出的等效变化或修饰,都应该涵盖在本发明的保护范围之内。
Claims (5)
1.一种基于多源异构张量数据的组合碳排放预测方法,其特征在于,包括以下步骤:
步骤一:数据收集,通过关键词衡量网民对碳排放的关注程度,以及媒体对碳排放的关注指数,并获取历年的碳排放数据;
步骤二:文本情感分析,对带有情感色彩的主观性文本进行分析、处理、归纳和推理,对感情色彩强弱程度赋值,将文本数据转换为数值数据,为构建数值数据的张量信息空间做准备;
步骤三:张量表示,对数据进行预处理,结合上述获取的搜索频次、情感指数、历史碳排放量三类数据,将三类数据放置在三阶张量的三个不同面上,构建起碳排放预测的信息空间,保持数据的多面性和相互关联,将预测信息表示为三阶张量流,张量的每一阶表示信息模态的一个子空间,所述张量表示为:表示t时刻历史碳排放量与社交媒体信息之间的关系,I1,I2,I3分别代表搜索频次、情感指数、历史碳排放量的特征集合;
步骤四:张量分解与重构,使用高阶奇异值分解的方式将矩阵分解为奇异向量和奇异值,捕捉不同信息模式之间的潜在关系,将一个张量分解成一个核心张量,再乘以每个模式的矩阵,完成张量重构,包括:
步骤4-1:将三阶张量分解为C、U1、U2、U3,其中因子矩阵U1,U2,U3分别描述了经过高阶奇异值分解之后的搜索频次、情感指数、历史碳排放量三种预测信息的特征;
步骤4-2:利用公式将核心张量和三个因子矩阵相乘,导出重构张量/>其中×m,m∈1,2,3是一个运算符,分别代表搜索频次、情感指数、历史碳排放量的矩阵乘积,以避免信息重叠以及信息抵消导致的有价值信息的遗失;
步骤五:碳排放组合预测,采用“剩余补偿”思想构建RNN-ARIMA组合预测模型,利用RNN对数据序列进行整体分析,用ARIMA解释RNN预测残差之间的线性关系,将两者预测结果进行加和得到未来碳排放量,包括:
步骤5-1:将重构张量数据流作为输入,利用公式/>获得RNN在t时刻的隐藏状态ht,其中f是RNN的激活函数,U代表输入值/>的权重值,W代表隐藏值ht-1的权重值,b是隐藏值ht-1的偏置值;
步骤5-2:计算出当前时刻的隐藏状态ht后,在当前时刻的预测输出值的计算公式如下:/>V是隐藏层到输出层的权重值,c是隐藏值ht的偏置值,计算出残差序列/>其中Yt为预测时间序列所对应的碳排放量真实值;
步骤5-3:将残差序列et作为ARIMA模型的输入,利用自回归模型e′t=C0+r1et-1+…+rpet-p+wt进行自回归分析,运用残差et-p至et-1的状态变化来预测t时刻的残差e′t,其中C0是常数,r1,...,rp是自回归参数,p是自回归顺序,wt表示误差;
步骤5-4:利用移动平均模型at=λ+wt+m1wt-1+…+mqwt-f对自回归模型的误差部分进行累加,消除预测中相关因素因随机波动而形成的具有相互抵偿性的误差,其中入表示与at相关的期望,wt,...,wt-f表示误差项,m1,...,mq是移动平均参数,q是移动平均顺序;
步骤5-5:自回归、移动平均子模型的集成定义了ARIMA模型的最终输出结果公式为
步骤5-6:利用残差预测对RNN预测结果/>进行校正,得到组合预测结果的未来碳排量/>
2.根据权利要求1所述的基于多源异构张量数据的组合碳排放预测方法,其特征是:所述步骤一包括:
步骤1-1:从互联网上收集不同关键词的每日指数,将其作为搜索量指数用于衡量网民对碳排放的关注程度;
步骤1-2:从搜索数据库中检索与碳排放相关的新闻广播,并用关键词的出现频率作为媒体关注指数;
步骤1-3:从碳核算数据库获取历年的碳排放数据。
3.根据权利要求2所述的基于多源异构张量数据的组合碳排放预测方法,其特征是:所述步骤二包括:
步骤2-1:根据互联网指数选取与“碳排放”相关性最强的关键词;
步骤2-2:以关键词为索引,从互联网博文和新闻网站标题中爬取相关文本内容;
步骤2-3:使用Python对所需文本内容进行爬取,通过使用基本情感词典对爬取的内容进行单词匹配,对情感进行分类,设置情感取值范围,确定情感的积极性;
步骤2-4:将文本内容分类,计算每日的情绪平均值,并获得每月情绪平均值。
4.根据权利要求1所述的基于多源异构张量数据的组合碳排放预测方法,其特征是:所述步骤四与步骤五之间还包括:使用LSTM模型进行前期试验,了解社交媒体信息对碳排放预测的具体影响。
5.根据权利要求4所述的基于多源异构张量数据的组合碳排放预测方法,其特征是:所述前期试验包括:
步骤a:基于将不同类型的数据作为输入的LSTM预测结果,分析搜索频率、文本情绪和媒体关注度变量对碳排放预测的影响;
步骤b:将不同文本特征数据组合与历史碳排放数据相结合作为输入,与单独使用历史碳排放数据作为输入的预测结果进行对比,测试文本特征集的预测性能;
步骤c:通过使用一段时间的数据作为输入,探讨其对预测影响的持久性,分析每月频率数据对情绪和注意力变量的影响。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310580222.4A CN116307298B (zh) | 2023-05-23 | 2023-05-23 | 一种基于多源异构张量数据的组合碳排放预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310580222.4A CN116307298B (zh) | 2023-05-23 | 2023-05-23 | 一种基于多源异构张量数据的组合碳排放预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116307298A CN116307298A (zh) | 2023-06-23 |
CN116307298B true CN116307298B (zh) | 2023-08-18 |
Family
ID=86785403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310580222.4A Active CN116307298B (zh) | 2023-05-23 | 2023-05-23 | 一种基于多源异构张量数据的组合碳排放预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116307298B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116862741B (zh) * | 2023-07-25 | 2024-05-28 | 杭州超腾能源技术股份有限公司 | 一种工业园区碳排放的智能监测方法及系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109802430A (zh) * | 2018-12-29 | 2019-05-24 | 上海电力学院 | 一种基于LSTM-Attention网络的风电电网控制方法 |
CN109919366A (zh) * | 2019-02-22 | 2019-06-21 | 西南财经大学 | 基于张量及事件驱动lstm模型的股价预测方法 |
CN110909928A (zh) * | 2019-11-19 | 2020-03-24 | 润联软件系统(深圳)有限公司 | 能源负荷短期预测方法、装置、计算机设备及存储介质 |
CN112561119A (zh) * | 2020-10-29 | 2021-03-26 | 西安理工大学 | 一种使用arima-rnn组合模型的云服务器资源性能预测方法 |
CN113239314A (zh) * | 2021-04-09 | 2021-08-10 | 国网河北省电力有限公司沧州供电分公司 | 用于碳排放量预测的方法、装置、终端及计算机可读存储介质 |
CN113240155A (zh) * | 2021-04-16 | 2021-08-10 | 国网河北省电力有限公司沧州供电分公司 | 预测碳排放量的方法、装置及终端 |
CN114118537A (zh) * | 2021-11-09 | 2022-03-01 | 南京航空航天大学 | 一种空域航班碳排放量组合预测方法 |
CN114443844A (zh) * | 2022-01-18 | 2022-05-06 | 安徽大学 | 融合用户情感倾向的社交网络评论文本情感分析方法及系统 |
KR20220057121A (ko) * | 2020-10-29 | 2022-05-09 | 인하대학교 산학협력단 | 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법 |
KR20220109632A (ko) * | 2021-01-29 | 2022-08-05 | 인하대학교 산학협력단 | 탄소 배출권 가격 추이와 시계열 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법 |
US11531387B1 (en) * | 2022-04-11 | 2022-12-20 | Pledgeling Technologies, Inc. | Methods and systems for real time carbon emission determination incurred by execution of computer processes and the offset thereof |
CN115660152A (zh) * | 2022-10-10 | 2023-01-31 | 杭州拓深科技有限公司 | 一种碳排放量的预测方法 |
-
2023
- 2023-05-23 CN CN202310580222.4A patent/CN116307298B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109802430A (zh) * | 2018-12-29 | 2019-05-24 | 上海电力学院 | 一种基于LSTM-Attention网络的风电电网控制方法 |
CN109919366A (zh) * | 2019-02-22 | 2019-06-21 | 西南财经大学 | 基于张量及事件驱动lstm模型的股价预测方法 |
CN110909928A (zh) * | 2019-11-19 | 2020-03-24 | 润联软件系统(深圳)有限公司 | 能源负荷短期预测方法、装置、计算机设备及存储介质 |
CN112561119A (zh) * | 2020-10-29 | 2021-03-26 | 西安理工大学 | 一种使用arima-rnn组合模型的云服务器资源性能预测方法 |
KR20220057121A (ko) * | 2020-10-29 | 2022-05-09 | 인하대학교 산학협력단 | 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법 |
KR20220109632A (ko) * | 2021-01-29 | 2022-08-05 | 인하대학교 산학협력단 | 탄소 배출권 가격 추이와 시계열 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법 |
CN113239314A (zh) * | 2021-04-09 | 2021-08-10 | 国网河北省电力有限公司沧州供电分公司 | 用于碳排放量预测的方法、装置、终端及计算机可读存储介质 |
CN113240155A (zh) * | 2021-04-16 | 2021-08-10 | 国网河北省电力有限公司沧州供电分公司 | 预测碳排放量的方法、装置及终端 |
CN114118537A (zh) * | 2021-11-09 | 2022-03-01 | 南京航空航天大学 | 一种空域航班碳排放量组合预测方法 |
CN114443844A (zh) * | 2022-01-18 | 2022-05-06 | 安徽大学 | 融合用户情感倾向的社交网络评论文本情感分析方法及系统 |
US11531387B1 (en) * | 2022-04-11 | 2022-12-20 | Pledgeling Technologies, Inc. | Methods and systems for real time carbon emission determination incurred by execution of computer processes and the offset thereof |
CN115660152A (zh) * | 2022-10-10 | 2023-01-31 | 杭州拓深科技有限公司 | 一种碳排放量的预测方法 |
Non-Patent Citations (1)
Title |
---|
天然气消费预测和采购策略研究综述与展望;徐小峰等;《中国石油大学学报(社会科学版)》;第39卷(第4期);第1-11页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116307298A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ağbulut | Forecasting of transportation-related energy demand and CO2 emissions in Turkey with different machine learning algorithms | |
CN104820629B (zh) | 一种智能的舆情突发事件应急处理系统及方法 | |
Chen et al. | A hybrid CNN-Transformer model for ozone concentration prediction | |
CN116307298B (zh) | 一种基于多源异构张量数据的组合碳排放预测方法 | |
CN117171546A (zh) | 一种结合污染扩散指数的城市空气质量预测方法 | |
CN115829081B (zh) | 一种基于支持向量回归模型的城市交通碳排放预测方法 | |
CN116257759A (zh) | 一种深度神经网络模型的结构化数据智能分类分级系统 | |
CN117829370A (zh) | 一种交通事故严重程度预测方法、系统及计算机设备 | |
CN117370766A (zh) | 一种基于深度学习的卫星任务规划方案评估方法 | |
Xu et al. | Analysis and prediction of vehicle exhaust emission using ann | |
Jiang et al. | How Does the Consumers’ Attention Affect the Sale Volumes of New Energy Vehicles: Evidence From China’s Market | |
CN117374917A (zh) | 一种超短期电力负荷的多元回归预测方法及装置 | |
Guan et al. | Sale Forecast and Analysis of Public’s Attitude of EV Base on Combination of BP and LSTM Network and Decision Tree | |
CN116258234A (zh) | 一种基于bp神经网络模型的能源企业碳排测算与预测方法 | |
Lai et al. | Government affairs message text classification based on RoBerta and TextCNN | |
Benabbou et al. | Machine learning for used cars price prediction: Moroccan use case | |
Hidiyanto et al. | Modeling Indonesian Motor Vehicle Tax Coefficients Based on Machine Learning Emission Data | |
Chen | Construction of a carbon neutral enterprise environmental performance assessment model based on transformer-GRU | |
Ren et al. | An optimised method of weighting combination in multi-index comprehensive evaluation | |
Lu et al. | Prediction of American Automobile Pricing based on Quantitative Analysis of Machine | |
Ruan | Ambient Air Quality Evaluation and Prediction Model based on Data Mining. | |
Chen et al. | A research on the Taipei MRT passenger traffic prediction model | |
CN117556118B (zh) | 基于科研大数据预测的可视化推荐系统及方法 | |
XU et al. | Interval-based Non-dimensionalization Method (IBNM) and Its Application in PM2. 5 Grade Prediction | |
Mengqin et al. | Research on Machine Learning System of Stock Prediction Based on Computer LSTM Technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |