CN117972355A - 时间序列数据预测方法、系统、设备及介质 - Google Patents
时间序列数据预测方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN117972355A CN117972355A CN202410227486.6A CN202410227486A CN117972355A CN 117972355 A CN117972355 A CN 117972355A CN 202410227486 A CN202410227486 A CN 202410227486A CN 117972355 A CN117972355 A CN 117972355A
- Authority
- CN
- China
- Prior art keywords
- information text
- trend
- vector
- feature vector
- series data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000008451 emotion Effects 0.000 claims abstract description 135
- 230000007246 mechanism Effects 0.000 claims abstract description 31
- 230000008859 change Effects 0.000 claims description 21
- 230000009466 transformation Effects 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 10
- 230000004927 fusion Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 6
- 230000007935 neutral effect Effects 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 17
- 230000035772 mutation Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 3
- 235000015277 pork Nutrition 0.000 description 16
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000005611 electricity Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据处理技术领域,提供一种时间序列数据预测方法、系统、设备及介质,包括:获取资讯文本;根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量;利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量;根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。本发明提供的时间序列数据预测方法、系统、设备及介质,借助舆情分析实现时间序列数据的精确预测,能够有效应对时间序列趋势的突变,预测出与实际情况更为贴近的时间序列数据。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种时间序列数据预测方法、系统、设备及介质。
背景技术
时间序列数据是指在不同时间上收集的数据,用于描述现象随时间变化的情况。这类数据反映了某一事物、现象等随时间的变化状态或者程度。由于时间序列数据在日常生活工作中,易收集、产量大的特点,近年来得到广泛的关注。这种数据在不同领域上可以进行不同的任务,比如:工业数据可以进行用电趋势分析;金融数据可以进行价格走势预测等。现有技术一般采用深度神经网络模型基于历史时间序列数据直接预测未来时间序列数据,但这些模型大多都具有两个共同的缺点,一是现有的方法对时间序列趋势的突变不够敏感,导致预测得到的数据不够精确,与实际数据相差甚远,二是预测结果不具有可解释性。因此,亟需一种新型的时间序列数据预测方法。
发明内容
本发明提供一种时间序列数据预测方法、系统、设备及介质,用以解决现有技术对时间序列趋势的突变不够敏感,导致预测得到的时间序列数据不够精确,与实际数据相差甚远的缺陷。
本发明提供一种时间序列数据预测方法,包括:
获取资讯文本;
根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量;
利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量;
根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。
根据本发明提供的一种时间序列数据预测方法,所述根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量,包括:
将所述资讯文本转换为资讯文本向量;
根据所述资讯文本向量,通过所述资讯文本情感倾向判定模型的特征提取层,得到资讯文本情感倾向特征向量;
根据所述资讯文本情感倾向特征向量,通过所述资讯文本情感倾向判定模型的资讯文本情感倾向判定层,得到资讯文本情感倾向类型,所述资讯文本情感倾向类型包括正面情感倾向、负面情感倾向、及中性情感倾向。
根据本发明提供的一种时间序列数据预测方法,所述利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量,包括:
对所述资讯文本情感倾向特征向量进行线性变换,得到变换后的资讯文本情感倾向特征向量;
对所述历史时间序列数据进行线性变换,得到变换后的历史时间序列数据特征向量;
根据所述变换后的资讯文本情感倾向特征向量和所述变换后的历史时间序列数据特征向量,得到特征节点之间的第一相关度;
根据特征节点之间的第一相关度,利用第一非线性激活函数,融合所述变换后的资讯文本情感倾向特征向量和所述变换后的历史时间序列数据特征向量,得到市场历史走向向量。
根据本发明提供的一种时间序列数据预测方法,所述根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据,包括:
根据所述市场历史走向向量,通过所述趋势预测模型的第一卷积网络,得到时间维度特征向量;
根据所述市场历史走向向量,通过所述趋势预测模型的第二卷积网络,得到全局特征向量;
利用第二注意力机制融合所述时间维度特征向量和所述全局特征向量,得到市场趋势变化向量;
根据所述市场趋势变化向量,通过所述趋势预测模型的预测层预测市场未来趋势,得到未来时间序列数据。
根据本发明提供的一种时间序列数据预测方法,所述利用第二注意力机制融合所述时间维度特征和所述全局特征,得到市场趋势变化向量,包括:
对所述时间维度特征向量进行线性变换,得到变换后的时间维度特征向量;
对所述全局特征向量进行线性变换,得到变换后的全局特征向量;
根据所述变换后的时间维度特征向量和所述变换后的全局特征向量,得到特征节点之间的第二相关度;
根据特征节点之间的第二相关度,利用第二非线性激活函数,融合所述变换后的时间维度特征向量和所述变换后的全局特征向量,得到市场趋势变化向量。
根据本发明提供的一种时间序列数据预测方法,所述第一卷积网络为时空卷积网络,所述第二卷积网络为1×1卷积神经网络。
本发明还提供一种时间序列数据预测系统,其特征在于,包括:
获取模块,用于:获取资讯文本;
情感判定模块,用于:根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量;
融合模块,用于:利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量;
预测模块,用于:根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述时间序列数据预测方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述时间序列数据预测方法的步骤。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述时间序列数据预测方法的步骤。
本发明提供的时间序列数据预测方法、系统、设备及介质,通过资讯文本情感倾向判定模型基于资讯文本得到携带情感反馈的资讯文本情感倾向特征向量,再利用第一注意力机制融合资讯文本情感倾向特征向量和历史时间序列数据,得到融合了文本知识的市场历史走向向量,然后基于资讯舆情与市场走向的关联性,通过趋势预测模型基于市场历史走向向量预测市场未来趋势,得到精确的未来时间序列数据。
本发明提供的时间序列数据预测方法、系统、设备及介质,借助舆情分析实现时间序列数据的精确预测,能够有效应对时间序列趋势的突变,预测出与实际情况更为贴近的时间序列数据。本发明可用于时间序列趋势受新闻、突发事件等影响较大的领域的趋势预测,如股票价格趋势分析、农产品价格趋势分析、用电趋势分析等。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的时间序列数据预测方法的流程示意图;
图2示出本发明提供的时间序列数据预测方法中资讯文本情感倾向判定模型的架构图;
图3示出发明提供的时间序列数据预测方法中趋势预测模型的架构图;
图4示出本发明提供的时间序列数据预测方法中第一注意力机制和第二注意力机制的流程图;
图5示出2016年至2020年猪肉价格与舆情的趋势关系图;
图6示出利用本发明实施例提供的时间序列数据预测方法预测得到的2021年猪肉价格(未来时间序列数据)与2021年实际猪肉价格的趋势关系图;
图7是本发明提供的时间序列数据预测装置的结构示意图;
图8是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了时间序列数据预测方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些数据下,可以以不同于此处的顺序完成所示出或描述的步骤。
参照图1,图1是本发明提供的时间序列数据预测方法的流程示意图之一。本发明实施例提供的时间序列数据预测方法包括:
步骤101,获取资讯文本;
步骤102,根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量;
步骤103,利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量;
步骤104,根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。
需要说明的是,本发明提供的时间序列数据预测方法,可用于时间序列趋势受新闻、突发事件等影响较大的领域的趋势预测,如股票价格趋势分析、农产品价格趋势分析、用电趋势分析等,当用于股票价格趋势分析时,历史时间序列数据可以是过去某段时间内的股票价格数据,得到的未来时间序列数据即为未来某段时间段内的股票价格数据;当用于农产品价格趋势分析时,历史时间序列数据可以是过去某段时间内的农产品价格数据,得到的未来时间序列数据即为未来某段时间段内的农产品价格数据;当用于用电趋势分析时,历史时间序列数据可以是过去某段时间内的用电量数据,得到的未来时间序列数据即为未来某段时间段内的用电量数据。未来时间序列数据是通过本发明提供的时间序列数据预测方法预测所得到的,能够有效应对突发的新闻、资讯、时事等对时间序列数据的发展趋势造成的影响,预测出与实际情况更为贴近的未来时间序列数据,为应用领域提供具备高参考性的有效数据。
本发明实施例的执行主体可以是任何符合使用要求的终端侧设备,例如时间序列数据预测系统等。
在步骤101中,终端侧设备会获取资讯文本。
需要说明的是,资讯文本可以是过去某段时间内发布的新闻、资讯、头条、热点、期刊等公开的内容,也可以是任何会影响舆论走向的信息,其获取渠道可以是从国内外的新闻网获取,也可以根据应用领域从相关的行业网站中获取。终端侧设备获取资讯文本,旨在后续借助舆情分析来预测市场未来趋势,以得到更加精确的未来时间序列数据。
在步骤102中,终端侧设备会根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量。
需要说明的是,本实施例中的资讯文本情感倾向判定模型可以采用文本处理模型(TextCNN)的模型框架,其包括嵌入层、卷积层、最大池化层、全连接层以及其它层结构,并采用softmax函数作为分类函数,实现从资讯文本中提取资讯文本情感倾向特征向量,并对资讯文本的情感倾向进行分类,对资讯文本进行情感倾向分类的目的是想探索舆情走向与时间序列趋势的关系。资讯文本情感倾向判定模型的具体架构可以参考图2。
在一种实施例中,步骤102可以包括:
步骤1021,将所述资讯文本转换为资讯文本向量;
步骤1022,根据所述资讯文本向量,通过所述资讯文本情感倾向判定模型的特征提取层,得到资讯文本情感倾向特征向量;
步骤1023,根据所述资讯文本情感倾向特征向量,通过所述资讯文本情感倾向判定模型的资讯文本情感倾向判定层,得到资讯文本情感倾向类型,所述资讯文本情感倾向类型包括正面情感倾向、负面情感倾向、及中性情感倾向。
具体的,资讯文本情感倾向判定模型可以通过嵌入层(embedding层)将资讯文本转换为资讯文本向量,再通过特征提取层在资讯文本向量中提取资讯文本情感倾向特征向量,资讯文本中的文本情感倾向特征可能是对该资讯表达积极态度的信息(例如对价格看涨),也可能是对该资讯表达消极态度或中立态度的信息(例如认为价格会下跌或停滞),然后通过资讯文本情感倾向判定模型的资讯文本情感倾向判定层根据资讯文本情感倾向特征向量判定资讯文本情感倾向类型(正面情感倾向、负面情感倾向、及中性情感倾向)。
需要说明的是,终端侧设备通过步骤102一方面获取了资讯文本情感倾向特征向量,便于后续将资讯文本情感倾向特征向量和历史时间序列数据进行融合,得到融合了资讯文本情感倾向特征的时间序列数据,有利于精准预测未来时间序列数据;另一方面也得到了资讯文本情感倾向类型,可以将预测得到的未来时间序列数据的趋势与舆情走向进行比对,以验证舆情与时间序列趋势的关联。
在步骤103中,终端侧设备会利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量。
需要说明的是,根据本发明的应用领域的不同,历史时间序列数据可能是过去某段时间内的股票价格数据、农产品价格数据、用电量数据等,对应得到的市场历史走向向量可能是融合了过去该某段时间内的资讯文本情感倾向特征向量的、在过去该某段时间内的股票价格走向向量、农产品价格走向向量、用电量走向向量等(即市场历史走向向量等于历史时间t1内的历史时间序列数据和历史时间t1内的资讯文本情感倾向特征向量的融合结果)。
在一种实施例中,步骤103可以包括:
步骤1031,对所述资讯文本情感倾向特征向量进行线性变换,得到变换后的资讯文本情感倾向特征向量;
步骤1032,对所述历史时间序列数据进行线性变换,得到变换后的历史时间序列数据特征向量;
步骤1033,根据所述变换后的资讯文本情感倾向特征向量和所述变换后的历史时间序列数据特征向量,得到特征节点之间的第一相关度;
步骤1034,根据特征节点之间的第一相关度,利用第一非线性激活函数,融合所述变换后的资讯文本情感倾向特征向量和所述变换后的历史时间序列数据特征向量,得到市场历史走向向量。
具体的,特征集合可以表示为h=[h1,h2,…,hN,],第一注意力机制采用第一自注意力机制,其目的是输出新特征集合h′=[h′1,h′2,…,h′N,],新的特征融合了相邻特征节点、同类特征节点或规划关系特征节点的特征。
例如,参考图3,对于特征hi和特征hj(假设特征hi为目标特征),首先分别对两个特征进行线性变换(即对资讯文本情感倾向特征向量和历史时间序列数据进行线性变换),得到[Whi,Whj],W表示对特征进行线性变换的函数或矩阵,可以采用任何适用的现有函数或矩阵;然后通过向量内积来计算特征hi和特征hj之间的第一相关度,第一相关度计算公式为:eij表示特征hi和特征hj之间的相关度,/>表示进行向量内积;为了更好地在特征之间分配权重,需要计算目标特征与其它所有特征之间的相关度(同样采用第一相关度计算公式计算),并对所有的相关度进行归一化处理,具体的,本实施例采用softmax函数对所有特征之间的相关度进行归一化处理,得到归一化注意力值αij,表示为: 表示特征hi和特征hj之间的第一相关度的指数,与特征hi和所有特征(k个)之间的相关度的指数的和的比值;然后结合相关度和线性变换后的特征,通过第一非线性激活函数δ(例如ReLu函数),输出新特征集合h′,表示为:/>
融合特征后得到的市场历史走向向量既包含了资讯文本情感倾向特征向量关于舆情走向的特点,又包括了历史时间序列数据特征向量关于过去时间序列趋势的特点,能够有效应对突发事件对预测结果的影响,为后续精准预测未来时间序列数据提供有效数据。
在步骤104中,终端侧设备会根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。
在一种实施例中,步骤104可以包括:
步骤1041,根据所述市场历史走向向量,通过所述趋势预测模型的第一卷积网络,得到时间维度特征向量;
步骤1042,根据所述市场历史走向向量,通过所述趋势预测模型的第二卷积网络,得到全局特征向量;
步骤1043,利用第二注意力机制融合所述时间维度特征向量和所述全局特征向量,得到市场趋势变化向量;
步骤1044,根据所述市场趋势变化向量,通过所述趋势预测模型的预测层预测市场未来趋势,得到未来时间序列数据。
需要说明的是,本实施例中的趋势预测模型的架构可以参考图4,其第一卷积网络采用时空卷积网络(TCN),用于根据市场历史走向向量得到时间维度特征向量,第二卷积网络采用1×1卷积神经网络(1×1CNN),用于根据市场历史走向向量得到全局特征向量,其中,时间维度特征向量更倾向于各时间点的数据趋势变化,比如今天的价格比昨天高/低,而全局特征向量更倾向于数据的整体趋势,例如最高值、最低值、变化频率、变化幅度等。
具体的,第一卷积网络采用时空卷积网络(TCN)是一种一维的全卷积网络(FCN)架构+因果卷积的结果,其中的隐藏层神经元具有和输入层一样的神经元个数,为了实现每层具有相同的神经元个数,将零填充(zero-padding)加入到每层网络中。而且,这个网络的输出和输入具有相同的长度。除此之外,因果卷积表示t时刻的输出只与t时刻的元素和前一层更早的元素进行卷积,这样就不会引入未来数据,使得输出结果更加精确。
趋势预测模型在得到时间维度特征向量和全局特征向量后,利用第二注意力机制融合时间维度特征向量和全局特征向量后,再通过全连接层进行预测层预测市场未来趋势,得到未来时间序列数据。利用第二注意力机制融合时间维度特征向量和全局特征向量,能够增加趋势预测模型的泛化能力,对全局的变化有所感知,比如限制趋势预测模型的阈值。在本实施例中,第二注意力机制采用自注意力机制。
在一种实施例中,步骤1043可以包括:
对所述时间维度特征向量进行线性变换,得到变换后的时间维度特征向量;
对所述全局特征向量进行线性变换,得到变换后的全局特征向量;
根据所述变换后的时间维度特征向量和所述变换后的全局特征向量,得到特征节点之间的第二相关度;
根据特征节点之间的第二相关度,利用第二非线性激活函数,融合所述变换后的时间维度特征向量和所述变换后的全局特征向量,得到市场趋势变化向量。
需要说明的是,为降低模型构建复杂度,步骤1043的实现原理可以与步骤103的实现原理相同,其原理说明在此不再赘述,即步骤1043中,线性变换可以采用任何适用的现有技术或矩阵对时间维度特征向量和全局特征向量分别进行,第二相关度的计算可以采用第一相关度计算公式,第二非线性激活函数可以采用ReLu函数。
趋势预测模型基于融合时间维度特征向量和全局特征向量的市场趋势变化向量对市场未来趋势进行预测,得到与现实情况更为贴近的未来时间序列数据,有效为应用领域的人员提供具有高参考价值的数据。
基于本发明提出的时间序列数据预测方法,从中国养猪网、猪肉价格格网等行业网站中获取相关的资讯文本,其中,2016年~2020年共计有10781条与猪肉价格相关的资讯。然后通过资讯文本情感倾向判定模型得到资讯文本情感倾向特征向量,并对资讯文本进行情感倾向分类,再利用第一注意力机制融合资讯文本情感倾向特征向量和历史时间序列数据(例如2016~2020年的历史猪肉价格数据),得到市场历史走向向量,然后通过趋势预测模型预测2021年的猪肉价格走向,得到2021年的猪肉价格数据(即未来时间序列数据)。
参见图5-6,图5示出2016年至2020年猪肉价格与舆情的趋势关系图,A线表示舆情看涨走势(即基于资讯文本,认为猪肉价格即将上涨的趋势,该图基于资讯文本情感倾向类型为正面情感倾向的资讯文本得到),B线表示实际猪肉价格的走势,可以看出,实际猪肉价格与舆情的变化趋势较为接近,峰值的位置存在一定的滞后关联,这也证明市场走向与资讯舆情具有关联性,可借助舆情分析来协助时间序列数据的预测。图6表示利用本发明实施例提供的时间序列数据预测方法预测得到的2021年猪肉价格(未来时间序列数据)与2021年实际猪肉价格的趋势关系图,C线表示预测得到猪肉价格的走势,D线表示实际猪肉价格的走势,相较于其它现有技术,本发明实施例提供的时间序列数据预测方法得到的未来时间序列数据是结合知识和时间序列数据预测(从整体架构而言,可以将本发明视为KD-TCN(知识+时间卷积网络)模型)的结果,其能够更好地表达时间序列特征,输出结果的滞后性更轻微,能够有效应对时间序列趋势的突变,并使得预测结果具有良好的可解释性。
本发明实施例提供的时间序列数据预测方法,通过资讯文本情感倾向判定模型基于资讯文本得到携带情感反馈的资讯文本情感倾向特征向量,再利用第一注意力机制融合资讯文本情感倾向特征向量和历史时间序列数据,得到融合了文本知识的市场历史走向向量,然后基于资讯舆情与市场走向的关联性,通过趋势预测模型基于市场历史走向向量预测市场未来趋势,得到精确的未来时间序列数据。
本发明实施例提供的时间序列数据预测方法,借助舆情分析实现时间序列数据的精确预测,能够有效应对时间序列趋势的突变,预测出与实际情况更为贴近的时间序列数据。本发明可用于时间序列趋势受新闻、突发事件等影响较大的领域的趋势预测,如股票价格趋势分析、农产品价格趋势分析、用电趋势分析等。
下面对本发明提供的时间序列数据预测系统进行描述,下文描述的时间序列数据预测系统与上文描述的时间序列数据预测方法可相互对应参照。
参照图7,该时间序列数据预测系统,包括:
获取模块701,用于:获取资讯文本;
情感判定模块702,用于:根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量;
融合模块703,用于:利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量;
预测模块704,用于:根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。
根据本发明提供的一种时间序列数据预测系统,所述情感判定模块702可以包括:
转换子模块,用于:将所述资讯文本转换为资讯文本向量;
特征提取子模块,用于:根据所述资讯文本向量,通过所述资讯文本情感倾向判定模型的特征提取层,得到资讯文本情感倾向特征向量;
情感判定子模块,用于:根据所述资讯文本情感倾向特征向量,通过所述资讯文本情感倾向判定模型的资讯文本情感倾向判定层,得到资讯文本情感倾向类型,所述资讯文本情感倾向类型包括正面情感倾向、负面情感倾向、及中性情感倾向。
根据本发明提供的一种时间序列数据预测系统,所述融合模块703可以包括:
第一线性变换子模块,用于:对所述资讯文本情感倾向特征向量进行线性变换,得到变换后的资讯文本情感倾向特征向量;
第二线性变换子模块,用于:对所述历史时间序列数据进行线性变换,得到变换后的历史时间序列数据特征向量;
第一相关度得到子模块,用于:根据所述变换后的资讯文本情感倾向特征向量和所述变换后的历史时间序列数据特征向量,得到特征节点之间的第一相关度;
第一融合子模块,用于:根据特征节点之间的第一相关度,利用第一非线性激活函数,融合所述变换后的资讯文本情感倾向特征向量和所述变换后的历史时间序列数据特征向量,得到市场历史走向向量。
根据本发明提供的一种时间序列数据预测系统,所述预测模块704可以包括:
第一向量得到子模块,用于:根据所述市场历史走向向量,通过所述趋势预测模型的第一卷积网络,得到时间维度特征向量;
第二向量得到子模块,用于:根据所述市场历史走向向量,通过所述趋势预测模型的第二卷积网络,得到全局特征向量;
第二融合子模块,用于:利用第二注意力机制融合所述时间维度特征向量和所述全局特征向量,得到市场趋势变化向量;
趋势预测子模块,用于:根据所述市场趋势变化向量,通过所述趋势预测模型的预测层预测市场未来趋势,得到未来时间序列数据。
需要说明的是,所述第一卷积网络为时空卷积网络,所述第二卷积网络为1×1卷积神经网络。
根据本发明提供的一种时间序列数据预测系统,所述第二融合子模块可以包括:
第三线性变换子模块,用于:对所述时间维度特征向量进行线性变换,得到变换后的时间维度特征向量;
第四线性变换子模块,用于:对所述全局特征向量进行线性变换,得到变换后的全局特征向量;
第二相关度得到子模块,用于:根据所述变换后的时间维度特征向量和所述变换后的全局特征向量,得到特征节点之间的第二相关度;
第三融合子模块,用于:根据特征节点之间的第二相关度,利用第二非线性激活函数,融合所述变换后的时间维度特征向量和所述变换后的全局特征向量,得到市场趋势变化向量。
图8示例了一种电子设备的实体结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行时间序列数据预测方法,该方法包括:
获取资讯文本;
根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量;
利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量;
根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的时间序列数据预测方法,该方法包括:获取资讯文本;
根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量;
利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量;
根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的时间序列数据预测方法,该方法包括:
获取资讯文本;
根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量;
利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量;
根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种时间序列数据预测方法,其特征在于,包括:
获取资讯文本;
根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量;
利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量;
根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。
2.根据权利要求1所述的时间序列数据预测方法,其特征在于,所述根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量,包括:
将所述资讯文本转换为资讯文本向量;
根据所述资讯文本向量,通过所述资讯文本情感倾向判定模型的特征提取层,得到资讯文本情感倾向特征向量;
根据所述资讯文本情感倾向特征向量,通过所述资讯文本情感倾向判定模型的资讯文本情感倾向判定层,得到资讯文本情感倾向类型,所述资讯文本情感倾向类型包括正面情感倾向、负面情感倾向、及中性情感倾向。
3.根据权利要求2所述的时间序列数据预测方法,其特征在于,所述利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量,包括:
对所述资讯文本情感倾向特征向量进行线性变换,得到变换后的资讯文本情感倾向特征向量;
对所述历史时间序列数据进行线性变换,得到变换后的历史时间序列数据特征向量;
根据所述变换后的资讯文本情感倾向特征向量和所述变换后的历史时间序列数据特征向量,得到特征节点之间的第一相关度;
根据特征节点之间的第一相关度,利用第一非线性激活函数,融合所述变换后的资讯文本情感倾向特征向量和所述变换后的历史时间序列数据特征向量,得到市场历史走向向量。
4.根据权利要求3所述的时间序列数据预测方法,其特征在于,所述根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据,包括:
根据所述市场历史走向向量,通过所述趋势预测模型的第一卷积网络,得到时间维度特征向量;
根据所述市场历史走向向量,通过所述趋势预测模型的第二卷积网络,得到全局特征向量;
利用第二注意力机制融合所述时间维度特征向量和所述全局特征向量,得到市场趋势变化向量;
根据所述市场趋势变化向量,通过所述趋势预测模型的预测层预测市场未来趋势,得到未来时间序列数据。
5.根据权利要求4所述的时间序列数据预测方法,其特征在于,所述利用第二注意力机制融合所述时间维度特征和所述全局特征,得到市场趋势变化向量,包括:
对所述时间维度特征向量进行线性变换,得到变换后的时间维度特征向量;
对所述全局特征向量进行线性变换,得到变换后的全局特征向量;
根据所述变换后的时间维度特征向量和所述变换后的全局特征向量,得到特征节点之间的第二相关度;
根据特征节点之间的第二相关度,利用第二非线性激活函数,融合所述变换后的时间维度特征向量和所述变换后的全局特征向量,得到市场趋势变化向量。
6.根据权利要求4所述的时间序列数据预测方法,其特征在于,所述第一卷积网络为时空卷积网络,所述第二卷积网络为1×1卷积神经网络。
7.一种时间序列数据预测系统,其特征在于,包括:
获取模块,用于:获取资讯文本;
情感判定模块,用于:根据所述资讯文本,通过资讯文本情感倾向判定模型,得到资讯文本情感倾向特征向量;
融合模块,用于:利用第一注意力机制融合所述资讯文本情感倾向特征向量和历史时间序列数据,得到市场历史走向向量;
预测模块,用于:根据所述市场历史走向向量,通过趋势预测模型预测市场未来趋势,得到未来时间序列数据。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述时间序列数据预测方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述时间序列数据预测方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述时间序列数据预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410227486.6A CN117972355A (zh) | 2023-07-18 | 2023-07-18 | 时间序列数据预测方法、系统、设备及介质 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310883839.3A CN116701880B (zh) | 2023-07-18 | 2023-07-18 | 基于时间序列数据的农产品价格预测方法及系统 |
CN202410227486.6A CN117972355A (zh) | 2023-07-18 | 2023-07-18 | 时间序列数据预测方法、系统、设备及介质 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310883839.3A Division CN116701880B (zh) | 2023-07-18 | 2023-07-18 | 基于时间序列数据的农产品价格预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117972355A true CN117972355A (zh) | 2024-05-03 |
Family
ID=87843440
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310883839.3A Active CN116701880B (zh) | 2023-07-18 | 2023-07-18 | 基于时间序列数据的农产品价格预测方法及系统 |
CN202410227486.6A Pending CN117972355A (zh) | 2023-07-18 | 2023-07-18 | 时间序列数据预测方法、系统、设备及介质 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310883839.3A Active CN116701880B (zh) | 2023-07-18 | 2023-07-18 | 基于时间序列数据的农产品价格预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN116701880B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117875522A (zh) * | 2024-03-12 | 2024-04-12 | 之江实验室 | 一种事件数量预测的方法、装置、存储介质、设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10963799B1 (en) * | 2016-05-05 | 2021-03-30 | Wells Fargo Bank, N.A. | Predictive data analysis of stocks |
CN115660855A (zh) * | 2022-11-09 | 2023-01-31 | 山东大学 | 一种融合新闻数据的股票收盘价预测方法 |
-
2023
- 2023-07-18 CN CN202310883839.3A patent/CN116701880B/zh active Active
- 2023-07-18 CN CN202410227486.6A patent/CN117972355A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN116701880A (zh) | 2023-09-05 |
CN116701880B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Research on Healthy Anomaly Detection Model Based on Deep Learning from Multiple Time‐Series Physiological Signals | |
CN111753092B (zh) | 一种数据处理方法、模型训练方法、装置及电子设备 | |
CN110866628A (zh) | 利用动态时间上下文学习进行多界限时间序列预测的系统和方法 | |
CN115796173A (zh) | 针对监管报送需求的数据处理方法和系统 | |
CN110781686B (zh) | 一种语句相似度计算方法、装置及计算机设备 | |
He et al. | MTAD‐TF: Multivariate Time Series Anomaly Detection Using the Combination of Temporal Pattern and Feature Pattern | |
Sun et al. | Two-channel attention mechanism fusion model of stock price prediction based on CNN-LSTM | |
CN114722950B (zh) | 一种多模态的多变量时间序列自动分类方法及装置 | |
CN116701880B (zh) | 基于时间序列数据的农产品价格预测方法及系统 | |
Waheeb et al. | Ridge polynomial neural network with error feedback for time series forecasting | |
CN111784062A (zh) | 点击概率预测方法、系统、电子设备和介质 | |
Dong et al. | Research on the time-varying network structure evolution of the stock indices of the BRICS countries based on fluctuation correlation | |
CN110705279A (zh) | 一种词汇表的选择方法、装置及计算机可读存储介质 | |
CN117744855A (zh) | 基于机器学习的负荷预测系统及方法 | |
CN116956289B (zh) | 动态调整潜在黑名单和黑名单的方法 | |
Deng et al. | An intelligent hybrid deep learning model for rolling bearing remaining useful life prediction | |
CN111382232A (zh) | 问答信息处理方法、装置及计算机设备 | |
CN114338416A (zh) | 一种时空多指标预测方法、装置和存储介质 | |
CN111723186A (zh) | 用于对话系统的基于人工智能的知识图谱生成方法、电子设备 | |
Rathee et al. | A machine learning approach to predict the next word in a statement | |
Mane | Stock Market Prediction using Natural Language Processing--A Survey | |
Li et al. | [Retracted] Deep Intelligence‐Driven Efficient Forecasting for the Agriculture Economy of Computational Social Systems | |
Wen et al. | Deep learning-driven hybrid model for short-term load forecasting and smart grid information management | |
Zhou | [Retracted] Event Scene Method of Legal Domain Knowledge Map Based on Neural Network Hybrid Model | |
Guo et al. | Script identification of ancient books by Chinese ethnic minorities using multi-branch DCNN and SPP |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |