CN114118622A - 基于时间序列的数据趋势预测方法和系统 - Google Patents

基于时间序列的数据趋势预测方法和系统 Download PDF

Info

Publication number
CN114118622A
CN114118622A CN202111492350.0A CN202111492350A CN114118622A CN 114118622 A CN114118622 A CN 114118622A CN 202111492350 A CN202111492350 A CN 202111492350A CN 114118622 A CN114118622 A CN 114118622A
Authority
CN
China
Prior art keywords
data
time series
time
matrix
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111492350.0A
Other languages
English (en)
Inventor
季斌林
李建
任晓茂
乔慧娟
李萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Peking University Software Engineering Co ltd
Original Assignee
Beijing Peking University Software Engineering Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Peking University Software Engineering Co ltd filed Critical Beijing Peking University Software Engineering Co ltd
Priority to CN202111492350.0A priority Critical patent/CN114118622A/zh
Publication of CN114118622A publication Critical patent/CN114118622A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于时间序列的数据趋势预测方法和系统,其中方法包括:将历史时间序列数据转换为可视化的时间序列图像数据;将时间序列图像数据转换为矩阵数据;采用支持输入多变量数据的卷积神经网络模型提取矩阵数据的数据趋势特征;根据数据趋势特征构建基于条件随机场的联合时序数据趋势预测模型;向联合时序数据趋势预测模型中输入待预测时间序列数据,输出时间序列数据趋势预测结果。本发明结合经济类数据的结构和分布特点,进行PSV序列数据转换,解决深度学习过程中时序数据预处理问题;按照时序数据结构特点提取卷积采样数据特征分类判别,效果有明显提升;结合矩阵数据卷积特征和序列状态传播特征对数据趋势判别任务进行增强。

Description

基于时间序列的数据趋势预测方法和系统
技术领域
本发明涉及大数据处理技术领域,尤其涉及一种基于时间序列的数据趋势预测方法、系统、电子设备以及计算机可读存储介质。
背景技术
趋势预测问题是时间序列数据分析领域中重要的分析任务。以商品价格数据为例,决策者们希望通过对已有数据分析来对未来商品价格上涨、平稳、下跌进行判断。趋势预测的方法主要分为两类,一类是基于回归的方法,一类是基于分类的方法。基于回归的方法,是通过回归模型把下一时序的数据预测出来,进而获得序列发展趋势的判断,如将时间序列多变量作为输入模糊规则模型,来计算在目标时间点的数据的变化及分类情况,或者结合ARIMA和卡尔曼滤波器构建联合模型来对短期的数据变化进行预测等,或者采用决策树、随机森林、支持向量机、核函数等方式对数据趋势进行预测。回归方法在单序列数据趋势预测任务中有较多应用,但与基于分类的任务相比其性能和效果受到限制。时间序列数据集通常是由多个序列组成的数据集,与回归方法相比,基于分类判断数据对象的潜在发展趋势的方法更适合趋势预测分析任务。
在时间序列的分类任务中,需要通过转换数据空间等数据预处理,再对其进行数据分类分析。在时间序列数据预处理时,可以结合时序数据的特点,以及模型方法的要求选择合适的数据转换方法有,有研究者采用均值处理的方法,将时间序列数据进行归一化之后,转化成固定时间尺度的序列数据,以保证数据集内的数据具有相同的时间尺度和相同的序列维度。除了单维度向量序列数据转换方法外,有研究使用神经网络方法的方式,将时间序列数据转化RP递归数据,并在指定维度矩阵条件下将RP数据转换到目标向量空间,以满足学习模型的输入矩阵的尺寸要求。基于金融时间序列数据,在预处理阶段将数据转化为二维图像类型的三通道矩阵数据,以确保实验数据可以通过卷积网络进行特征提取,进而进行CNN-BI判别模拟。在数据预处理过程中,数据的归一化处理是必要的和有效的。
在分类器选择研究中,影响较为广泛的机器学习方法包括KNN(K-NearestNeighbours)方法、决策树方法、Logistic Regression方法、SVM方法等序列数据分类方法。选择机器学习分类器的核心问题是分类指标参数的选择。目前常用的指标参数有三种。第一种是数据空间的欧氏距离度,当数据集中各序列数据完成归一化之后,每个数据在相同的数据空间内存在数据的超平面分布函数,可以利用这些数据分布之间的欧式距离情况进行聚类分析和分类分析。另一种是通过对序列的波动变化相似度在多变量数据间进行训练和学习,根据这些特征情况对数据集进行有监督的分类学习。第三种是根据状态特征和观察特征之间的条件概率分布情况进行分类模型的构建。KNN等聚类的方法一般采用欧氏距离度参数建模,SVM等特征判别方法一般采用波动变化度参数建模,HMM(隐马可尔夫模型)、CRF(条件随机场算法)等条件概率方法一般采用条件概率参数建模。
在已有研究中,采用空间距离参数进行分类研究较多,其中DTW-KNN方法的效果较优。DTW-KNN是使用动态时间刻度调整(Dynamic Time Warping)的方法,增强距离函数计算的效果,帮助分类器可以得到更精准的分类结果。自然语言数据和语音数据是两类独特的时间序列数据,在这两种类型的数据分类分析任务中,LSTM-CRF模型在很多任务中取得了很好的效果。这是因为时间序列数据具有明显的隐马尔可夫性,HMM及CRF可以从时序数据中提取到这样的相邻依赖和顺序传播特征。在LSTM-CRF中,LSTM方法的作用与DTW的作用相似,是在已有数据集中抽取更准确的特征值,以帮助分类器能够更好的完成分类任务。这些增强式研究表明,在分类器处理前先进行特征提取可以帮助分类任务取得更好的效果。
近些年来有越来越多的研究采用深度学习方法开展时序数据的分类分析任务。相较经典方法和机器学习方法,深度学习方法可以更好的提取序列数据中的特征规律,进而帮助构建具有更好性能的分类算法模型。研究者们将分类器通过联合DNNs(Deep NeuralNetworks)、CNNs(Convolutional Neural Networks)、ESNs(Echo State Networks)、RNNs(Recurrent Neural Networks)等深度学习方法,对序列数据进行二次编码生成新的时间序列向量空间,然后使用深度学习方法获取其潜在的特征表示,之后再进行分类判别。这种方法已经在很多研究中得到了效果验证。如研究者结合LSTM和Softmax函数对SVM的判别分类器进行了优化,得到了更优的模型和实验效果。LSTM模型在很多研究中的表现都是较优的。采用EMD经验模式分解和DNNs深度学习网络来对模型进行预训练,该模型在实验中取得了更好的效果。当使用深度学习方法前,如果采用如数据图像化等方法将时序数据转换为深度学习模型可处理的数据格式,将帮助整体模型得到更好的训练效果。
整体来看,已有序列数据趋势预测研究的发展趋势为机器学习分类方法逐渐与深度学习方法相融合,以逐步突破高维和非特征向量的这两个时序数据限制条件。数据的预处理很关键,如何通过融合学习策略构建有效的趋势预测模型是非常重要的研究方向。
时间序列数据分析的关键任务是通过获取现有数据的规律来判断未来数据变化趋势。以商品价格数据分析任务为例,政策制定者需要通过数据分析来判断商品价格在下一个时间点是上涨还是下跌,以及判断随后一段时期内的价格波动趋势。利用已有数据判断未来变化趋势,这是时序数据分析的重要发明任务。现有方法主要使用回归预测或分类的思路来处理趋势判断问题。与回归预测方法相比,分类方法更注重如上升、稳定、下降等波动性特征。传统方法很难通过分类思想来解决趋势判别的问题,机器学习方法在时序趋势预测中的应用依赖于数据预处理和特征提取。
发明内容
针对现有技术的不足,本发明的目的在于解决上述背景技术中的至少一个技术问题,提供一种基于时间序列的数据趋势预测方法,包括:
将历史时间序列数据转换为可视化的时间序列图像数据;
将所述时间序列图像数据转换为矩阵数据;
采用支持输入多变量数据的卷积神经网络模型提取所述矩阵数据的数据趋势特征;
根据所述数据趋势特征构建基于条件随机场的联合时序数据趋势预测模型;
向所述联合时序数据趋势预测模型中输入待预测时间序列数据,输出时间序列数据趋势预测结果。
根据本发明的一个方面,将所述时间序列图像数据转换为矩阵数据为:
从数据集某个时间序列中抽取连续N个时序数据,构建N*3的实验时间序列矩阵,结合目标数据集的时间特点,将实验序列矩阵转换为
Figure 731125DEST_PATH_IMAGE001
的矩阵数据,其中n*n=N,3表示3个月;
转换后的数据通过图像表达,每个图像含有
Figure 466869DEST_PATH_IMAGE002
个像素数据,其中图像包括结合时间特点的数据的图像和图像经过数据转换形成的矩阵数据图像。
根据本发明的一个方面,所述卷积神经网络模型的数学表达式包括:
Figure 758173DEST_PATH_IMAGE003
其中,zi为卷积后的第i个特征图,xj为当前第j个特征图,Wi,j为zi应的第j个权重,m为输入特征图个数,bi代表第i个偏移量;
Figure 170744DEST_PATH_IMAGE004
其中g,h为分类类别,且
Figure 635224DEST_PATH_IMAGE005
,Yg为第g个分类类别的输出值,softmax(Yg)为分类类别为g的概率,在测试模型时,softmax层取softmax(Y1),softmax(Y2),…,softmax(Yh)中数值最大的类别作为样本的预测标签。
根据本发明的一个方面,所述条件随机场中的状态特征时间序列是隐性状态时间序列,其构成一个无向图
Figure 241786DEST_PATH_IMAGE006
,其中V表示结点的集合,E表示边的集合,对任意结点V成立的条件概率分布
Figure 890942DEST_PATH_IMAGE007
条件随机场,表达为式一:
Figure 848533DEST_PATH_IMAGE008
,式中
Figure 851125DEST_PATH_IMAGE009
表示在无向图
Figure 328505DEST_PATH_IMAGE010
中与所有状态点
Figure 899294DEST_PATH_IMAGE011
和所有状态点
Figure 327870DEST_PATH_IMAGE012
的连接关系,
Figure 134152DEST_PATH_IMAGE013
为所有状态点
Figure 184148DEST_PATH_IMAGE014
和所有状态点
Figure 207730DEST_PATH_IMAGE012
的非连接关系,
Figure 467810DEST_PATH_IMAGE015
是在给定
Figure 749887DEST_PATH_IMAGE016
的条件下
Figure 434815DEST_PATH_IMAGE017
的条件概率分布,
Figure 81828DEST_PATH_IMAGE016
为输入向量,表示观察特征时间序列数据,
Figure 829204DEST_PATH_IMAGE018
Figure 665704DEST_PATH_IMAGE019
为输出变量,表示状态特征时间序列数据,
Figure 159134DEST_PATH_IMAGE018
基于构建时间序列数据的隐马尔可夫链(Time-Series Data Hidden MarkovModel Chain,TMS-HMM-Chain)和三项马尔科夫性质,对所述式一进一步推导为:
Figure 85370DEST_PATH_IMAGE020
其中,在时间点
Figure 929829DEST_PATH_IMAGE021
该条件概率表达为
Figure 616026DEST_PATH_IMAGE022
,其前序时间点
Figure 42590DEST_PATH_IMAGE023
的条件概率表达为
Figure 296985DEST_PATH_IMAGE024
,以及
Figure 487795DEST_PATH_IMAGE025
Figure 367895DEST_PATH_IMAGE026
之间的概率情况
Figure 898234DEST_PATH_IMAGE027
进一步构建矩阵M阶矩阵,其中M取
Figure 448164DEST_PATH_IMAGE028
矩阵的特征数量值,观测序列x的每一个位置为i=1,2,..n+1,在状态链两头分别加入两个状态y0=start,yn+1=stop作为起始状态和终止状态:
Figure 17947DEST_PATH_IMAGE029
矩阵元素为:
Figure 983629DEST_PATH_IMAGE030
Figure 430791DEST_PATH_IMAGE031
将转移特征和状态特征及其权值用统一的符号表示,设K1个转移特征,K2个状态特征,K=K1+K2,记:
Figure 338573DEST_PATH_IMAGE032
然后,对转移特征与状态特征在各个位置i求和,记作:
Figure 644921DEST_PATH_IMAGE033
其中,f是特征函数,yi-1和yi分别是观察特征时间序列Yi-1和Yi的取值,wk代表fk的权重,Wi表示时间点i对应的权重参数;tk是转移特征,依赖于当前位置和前一个位置,k代表转移特征的数量;sl是状态特征,依赖于当前位置,l代表状态特征的数量;w代表权重。
根据本发明的一个方面,所述条件随机场采用前向后向联合算法计算条件概率,包括:
在原有状态链前后各加入一个状态y0=start和yn+1=stop分别作为起始状态和终止状态,对于每一个指标
Figure 476611DEST_PATH_IMAGE034
,定义前向过程向量
Figure 466695DEST_PATH_IMAGE035
和后向过程向量
Figure 499373DEST_PATH_IMAGE036
,对于
Figure 152071DEST_PATH_IMAGE037
Figure 912085DEST_PATH_IMAGE038
时刻,存在:
Figure 271522DEST_PATH_IMAGE039
Figure 599736DEST_PATH_IMAGE040
定义前向过程向量
Figure 100249DEST_PATH_IMAGE035
和后向过程向量
Figure 804900DEST_PATH_IMAGE036
,则前向后向递推得到:
Figure 18844DEST_PATH_IMAGE041
Figure 377013DEST_PATH_IMAGE042
其中T表示转置;
进一步简化得到:
Figure 4303DEST_PATH_IMAGE043
Figure 653590DEST_PATH_IMAGE044
其中
Figure 953333DEST_PATH_IMAGE035
(x)代表在位置i时状态为yi且从位置1到位置i的状态序列的非规范化概率,因为yi的取值有m个所以
Figure 357770DEST_PATH_IMAGE035
(x)为m维列向量;后向向量
Figure 347723DEST_PATH_IMAGE045
(x)表示在位置i时状态为yi且从位置i+1到位置n的状态序列的非规范化概率。
根据前向后向过程,概率计算符合规律Z(x):
Figure 49968DEST_PATH_IMAGE046
由此开展所述条件随机场的条件概率计算和期望计算为:
Figure 566400DEST_PATH_IMAGE047
由前向向量和后向向量的定义,得出在给定观察值x的条件下,在位置i对应状态yi在位置i-1对应状态为yi-1的条件概率:
Figure 17104DEST_PATH_IMAGE048
根据本发明的一个方面,所述条件随机场通过模型训练以达到在极大似然下的最优化,对于给定的经验分布
Figure 41823DEST_PATH_IMAGE049
条件下的所述条件随机场条件概率模型为:
Figure 626388DEST_PATH_IMAGE050
其用于学习过程的似然函数对数表示为:
Figure 607114DEST_PATH_IMAGE051
学习任务描述为求得某一矩阵
Figure 618932DEST_PATH_IMAGE052
使得
Figure 363903DEST_PATH_IMAGE053
,在采用L-BFGS方法下
Figure 627525DEST_PATH_IMAGE054
问题转换为期望值损失最低的问题,其损失函数为:
Figure 587391DEST_PATH_IMAGE055
其中
Figure 192947DEST_PATH_IMAGE056
为联合概率分布P~(X,Y)的经验期望,Ep(f)为模型期望。
根据本发明的一个方面,所述联合时序数据趋势预测模型包括:数据预处理层、卷积层、长短时记忆层和条件随机场算法层;
所述数据预处理层先将时间序列数据转换为时间序列图像数据,再将时间序列图像数据转换为矩阵数据;
所述卷积层用来捕捉感受野范围内的特征数据,所述卷积层中有两个输出,一个是按照时间序列排列卷积形成的特征数据,另一个是对目标序列的分类结果;卷积神经网络共设置两层,每层设置两个
Figure 644788DEST_PATH_IMAGE057
的卷积器,每两个卷积器之后设置一个池化器,其中第一个卷积器产生的数据为模型采样提取的特征数据;
所述长短时记忆层对数据进行训练和计算,得到包含局部信息、全局信息和卷积特征信息的长短时特征信息;
所述条件随机场算法层的数据是状态概率矩阵
Figure 305577DEST_PATH_IMAGE058
和长短时记忆层输出的状态概率矩阵
Figure 510162DEST_PATH_IMAGE059
,计算输出给定时间点m的
Figure 801466DEST_PATH_IMAGE060
,其中
Figure 334078DEST_PATH_IMAGE061
,r是条件随机场算法层输出数据。
为实现上述目的,本发明还提供一种基于时间序列的数据趋势预测系统,包括:
图像数据转换模块,将历史时间序列数据转换为可视化的时间序列图像数据;
矩阵数据转换模块,将所述时间序列图像数据转换为矩阵数据;
数据趋势特征提取模块,采用支持输入多变量数据的卷积神经网络模型提取所述矩阵数据的数据趋势特征;
数据趋势预测模型构建模块,根据所述数据趋势特征构建基于条件随机场的联合时序数据趋势预测模型;
数据趋势预测结果输出模块,向所述联合时序数据趋势预测模型中输入待预测时间序列数据,输出时间序列数据趋势预测结果。
为实现上述目的,本发明还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述基于时间序列的数据趋势预测方法。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述基于时间序列的数据趋势预测方法。
根据本发明的方案,本发明结合趋势判别任务和商品价格等时序数据特点,提出了PSV-CNN-CRF趋势预测方法。该模型方法按照时序数据结构特征对时序数据进行了图像化数据转换,通过卷积采样学习提取数据趋势特征,并结合时序规律信息对数据趋势进行了预测。该方法的主要创新点有三项,一是PSV-CNN-CRF方法结合经济类数据的自身数据结构和分布特点,进行了PSV序列数据转换,有效的解决了深度学习过程中时序数据预处理的问题;二是PSV-CNN-CRF方法有效的按照时序数据结构特点提取卷积采样数据特征进行分类判别,效果较已有的分类和判别方法有明显提升;三是PSV-CNN-CRF方法结合矩阵数据卷积特征和序列状态传播特征对数据趋势判别任务进行增强。PSV-CNN-CRF在实验和工程实践中进行了验证并取得了较好的效果。
附图说明
图1示意性表示根据本发明的基于时间序列的数据趋势预测方法的流程图;
图2表示时间序列数据转换为二维可视化图像数据图;
图3表示经数据预处理转换为矩阵数据图;
图4、图5、图6和图7表示CNN模型训练和实验结果图;
图8和图9表示两种TMS-CRF的结构图;
图10示意性表示根据本发明的基于时间序列的数据趋势预测系统的结构框图。
具体实施方式
现在将参照示例性实施例来论述本发明的内容,应当理解,论述的实施例仅是为了使得本领域普通技术人员能够更好地理解且因此实现本发明的内容,而不是暗示对本发明的范围的任何限制。
如本文中所使用的,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。术语“基于”要被解读为“至少部分地基于”,术语“一个实施例”和“一种实施例”要被解读为“至少一个实施例”。
以下结合趋势预测任务和商品价格等时序数据特点,提出了一种PSV-CNN-CRF趋势预测的方法,其中PSV为价格数据(Price Data)、销量数据(Sales Data)、价值数据(Value Data)组合构建PSV三维数据组,CNN为卷积神经网络模型,CRF条件随机场模型。
图1示意性表示根据本发明的基于时间序列的数据趋势预测方法的流程图。如图1所示,根据本发明的基于时间序列的数据趋势预测方法,包括以下步骤:
a. 将历史时间序列数据转换为可视化的时间序列图像数据;
b. 将所述时间序列图像数据转换为矩阵数据;
c. 采用支持输入多变量数据的卷积神经网络模型提取所述矩阵数据的数据趋势特征;
d. 根据所述数据趋势特征构建基于条件随机场的联合时序数据趋势预测模型;
e. 向所述联合时序数据趋势预测模型中输入待预测时间序列数据,输出时间序列数据趋势预测结果。
根据本发明的一种实施方式,在上述a和b步骤中,利用python的seaborn包绘制热力图,实现数据的图像可视化,即实现将时间序列数据转换为时间序列图像式的数据结构。这部分的主要目的是通过数据转换将时间序列数据转换为更有效和可分析的数据结构。时间序列可以以相对简单的方式直接转换为目标数据格式。在深度学习卷积神经网络分析方法中,将开盘价,收盘价,最高价和最低价可视化,然后将时间序列可视化的二维图像用作模型的输入。可视化的CNN模型图像如图2所示。
经过数据转换之后,卷积神经网络在图像识别中的特征获取和分类能力可帮助完成特征提取和数据趋势预测任务。如此方案,一是可以通过数据转换输入更多的技术指标,二是可以应用于更经济的数据趋势预测和分类任务。三是结合序列组合进行多序列数据分析。
时间序列数据的数据转换研究需要从时间序列数据本身的特征出发,以便获得最适合时间序列数据的编码转换方法。在传统的时序数据分析中,时序数据的时间特点是时序数据独有的特点。以商品价格数据为例,如果按月提取数据,则会发现该数据具有12个月的周期,并且每12个月的间隔之间的数据之间存在显着的相关性;按日抽取的数据也具备这样的特点,每20天的数据存在有显著的关联关系和波动相似性。基于这样的时序数据规律,可以根据季节定律来重塑时间序列数据的数据结构。以某监测点商品价格数据集为例,将同一时间点上的价格数据(Price Data)、销量数据(Sales Data)、价值数据(ValueData)组合构建PSV三维数据组。在本实施方式中,从数据集某个时间序列中抽取连续400个时序数据,构建
Figure 424656DEST_PATH_IMAGE062
*3的实验时间序列矩阵。结合目标数据集的时间特点,将实验序列矩阵转换为
Figure 296797DEST_PATH_IMAGE063
的矩阵数据,在20*20*3中,第一个20表示20个月,之后20*3表示一个月采集20条数据,共采集3个月的数据。转换后的数据可以通过图像进行表达,每个图像含有
Figure 86899DEST_PATH_IMAGE064
个像素数据。数据示意如图3,图3是经数据预处理后的图像。
以上是PSV矩阵的构建过程。经过转换之后,可以将数据输入至卷积神经网络以进行进一步的分析和计算。与现有技术中的序列深度学习方法不同,卷积神经网络可以对数据的全局信息进行归纳和规律挖掘。
根据本发明的一种实施方式,在上述c步骤中,采用多变量的CNN模型进行数据分析研究,提取所述矩阵数据的数据趋势特征。具体地, CNN模型可以支持并行输入多变量数据,例如图像数据R-G-B三分量数据。多元CNN时间序列分析模型可以充分发挥CNN在多通道并行数据处理中的性能优势。
如前所述,本发明已经将时序数据通过PSV转化为多变量的并行矩阵式数据,因此可以采用多变量的CNN模型进行数据分析研究。CNN通过卷积滤波和数据采样能够很好的表达整体序列数据的全局规律情况。
CNN模型的数学表达式包括:
Figure 965862DEST_PATH_IMAGE003
其中,zi为卷积后的第i个特征图,xj为当前第j个特征图,Wi,j为Zi对应的第j个权重,m为输入特征图个数,bi代表第i个偏移量;
Figure 171715DEST_PATH_IMAGE004
其中g,h为分类类别,且
Figure 226259DEST_PATH_IMAGE005
,Yg为第g个分类类别的输出值,softmax(Yg)为分类类别为g的概率,在测试模型时,softmax层取softmax(Y1),softmax(Y2),…,softmax(Yh)中数值最大的类别作为样本的预测标签。
实验研究的CNN模型算法如下:
1.
Figure 282202DEST_PATH_IMAGE065
2.
Figure 727090DEST_PATH_IMAGE066
3.
Figure 798951DEST_PATH_IMAGE067
4.
Figure 567056DEST_PATH_IMAGE068
5.
Figure 371064DEST_PATH_IMAGE069
6.
Figure 99985DEST_PATH_IMAGE070
7.
Figure 398374DEST_PATH_IMAGE071
8.
Figure 302876DEST_PATH_IMAGE072
9.
Figure 74523DEST_PATH_IMAGE073
CNN模型在实验数据集上表现符合效果良好。训练数据集含有商品价格图像式数据300张,其中50张为夹杂噪音数据的商品价格图像式数据,模型的任务是需要从这300张矩阵数据中识别出噪音数据矩阵。训练和实验结果情况如图4、图5、图6和图7所示,经500轮次训练可达到98.94%准确度和0.96的F1评分。
经实验验证,基于PSV-CNN的判别矩阵是有效的,该模型可以有效的提取时序数据卷积特征,可以有效结合全局信息实现矩阵数据图像的分类。
根据本发明的一种实施方式,在上述d步骤中,定义时间序列数据条件随机场(TMS-CRF)的基础参数,假设观察特征时间序列数据为
Figure 946533DEST_PATH_IMAGE074
,状态特征时间序列数据为
Figure 32300DEST_PATH_IMAGE075
Figure 650364DEST_PATH_IMAGE076
是在给定
Figure 281327DEST_PATH_IMAGE077
的条件下
Figure 125787DEST_PATH_IMAGE078
的条件概率分布。TMS-CRF方法的主要问题均是围绕条件概率模型
Figure 77562DEST_PATH_IMAGE079
展开的。
一般情况下,TMS-CRF中的状态特征时间序列是隐性状态时间序列,其可以构成一个无向图
Figure 940345DEST_PATH_IMAGE080
,其中V表示结点的集合,E表示边的集合。TMS-CRF是满足MRF的特征的,即对任意结点𝑣成立的条件概率分布
Figure 257057DEST_PATH_IMAGE076
条件随机场,可以表达为式一:
Figure 447866DEST_PATH_IMAGE008
,式中
Figure 626169DEST_PATH_IMAGE009
表示在无向图
Figure 359770DEST_PATH_IMAGE010
中与所有状态点
Figure 909700DEST_PATH_IMAGE011
和所有状态点
Figure 712440DEST_PATH_IMAGE012
的连接关系,
Figure 943701DEST_PATH_IMAGE013
为所有状态点
Figure 656442DEST_PATH_IMAGE014
和所有状态点
Figure 991653DEST_PATH_IMAGE012
的非连接关系
Figure 94739DEST_PATH_IMAGE015
是在给定
Figure 926428DEST_PATH_IMAGE016
的条件下
Figure 618310DEST_PATH_IMAGE017
的条件概率分布,
Figure 447725DEST_PATH_IMAGE016
为输入向量,表示观察特征时间序列数据,
Figure 834844DEST_PATH_IMAGE018
Figure 158641DEST_PATH_IMAGE019
为是输出变量,表示状态特征时间序列数据,
Figure 721340DEST_PATH_IMAGE081
。可以进行推导证明,TMS-CRF是满足MRF的成对、局部和全局三项马尔科夫性质的。基于TMS-HMM-Chain和三项马尔科夫性质,我们可以将式一进一步推导成以下形式:
Figure 783974DEST_PATH_IMAGE082
图8和图9是TMS-CRF的两种结构示意图。
在这样的问题和无向图结构下,对时间序列条件随机场TMS-CRF的三个核心问题进行逐步讨论。首先构建关联函数,在图8的情况下,TMS-CRF的第一个核心问题是条件概率计算的问题,即对于观察特征时间序列数据
Figure 845340DEST_PATH_IMAGE016
和状态特征时间序列数据
Figure 894198DEST_PATH_IMAGE017
计算出该模型的条件概率分布
Figure 858874DEST_PATH_IMAGE083
。在时间点
Figure 357989DEST_PATH_IMAGE021
该条件概率可以表达为
Figure 595066DEST_PATH_IMAGE084
,其前序时间点
Figure 837829DEST_PATH_IMAGE085
的条件概率可以表达为
Figure 421126DEST_PATH_IMAGE086
,以及
Figure 700929DEST_PATH_IMAGE025
Figure 549936DEST_PATH_IMAGE026
之间的概率情况
Figure 19226DEST_PATH_IMAGE087
。进一步构建矩阵M阶矩阵,其中M取
Figure 411024DEST_PATH_IMAGE028
矩阵的特征数量值,观测序列x的每一个位置为i=1,2,..n+1,在状态链两头分别加入两个状态y0=start,yn+1=stop作为起始状态和终止状态:
Figure 986362DEST_PATH_IMAGE029
矩阵元素为:
Figure 244036DEST_PATH_IMAGE030
Figure 438389DEST_PATH_IMAGE031
将转移特征和状态特征及其权值用统一的符号表示,设K1个转移特征,K2个状态特征,K=K1+K2,记:
Figure 809327DEST_PATH_IMAGE032
然后,对转移特征与状态特征在各个位置i求和,记作:
Figure 978402DEST_PATH_IMAGE033
其中,f是特征函数,yi-1和yi分别是观察特征时间序列Yi-1和Yi的取值,wk代表fk的权重,Wi表示时间点i对应的权重参数;tk是转移特征,依赖于当前位置和前一个位置,k代表转移特征的数量;sl是状态特征,依赖于当前位置,l代表状态特征的数量;w代表权重。
在本实施方式中,TMS-CRF的条件概率计算问题,即为计算上述条件概率及其期望的问题。TMS-CRF的条件概率计算问题可以采用前向后向联合算法(Forward-BackwardAlgorithm)进行计算。在原有状态链前后各加入一个状态y0=start和yn+1=stop分别作为起始状态和终止状态,对于每一个指标
Figure 942947DEST_PATH_IMAGE034
,定义前向过程向量
Figure 986996DEST_PATH_IMAGE035
和后向过程向量
Figure 212441DEST_PATH_IMAGE036
,对于
Figure 67264DEST_PATH_IMAGE037
Figure 4258DEST_PATH_IMAGE038
时刻,存在:
Figure 665047DEST_PATH_IMAGE039
Figure 885944DEST_PATH_IMAGE040
定义前向过程向量
Figure 160936DEST_PATH_IMAGE035
和后向过程向量
Figure 959128DEST_PATH_IMAGE036
,则前向后向递推可得:
Figure 298974DEST_PATH_IMAGE041
Figure 921847DEST_PATH_IMAGE042
其中T表示转置;
进一步简化得到:
Figure 180790DEST_PATH_IMAGE043
Figure 341644DEST_PATH_IMAGE044
其中
Figure 796765DEST_PATH_IMAGE035
(x)代表在位置i时状态为yi且从位置1到位置i的状态序列的非规范化概率,因为yi的取值有m个所以
Figure 851309DEST_PATH_IMAGE035
(x)为m维列向量;后向向量
Figure 156519DEST_PATH_IMAGE045
(x)表示在位置i时状态为yi且从位置i+1到位置n的状态序列的非规范化概率;
根据前向后向过程,概率计算符合规律:
Figure 352140DEST_PATH_IMAGE088
由此可以开展TMS-CRF的条件概率计算问题和期望计算的问题。
Figure 424001DEST_PATH_IMAGE089
由前向向量和后向向量的定义,可得出在给定观察值x的条件下,在位置i对应状态yi在位置i-1对应状态为yi-1的条件概率:
Figure 942838DEST_PATH_IMAGE090
在阐明TMS-CRF的计算问题后,可以开展对TMS-CRF模型的学习和训练问题进行讨论,该问题是通过模型训练以达到在极大似然下的最优化。对于给定的经验分布
Figure 996113DEST_PATH_IMAGE091
条件下TMS-CRF的条件概率模型:
Figure 990614DEST_PATH_IMAGE092
其可用于学习过程的似然函数对数表示为:
Figure 475953DEST_PATH_IMAGE093
学习任务可以描述为,求得某一矩阵
Figure 239510DEST_PATH_IMAGE094
使得
Figure 976870DEST_PATH_IMAGE095
。我们可以采用改进的迭代尺度法(Improved Iterative Scaling,IIS)、梯度下降法(Gradient descent,GD)以及拟牛顿L-BFGS(Quasi-Newton Limited Memory BFGS Methods)算法进行学习训练。在采用L-BFGS方法下
Figure 68454DEST_PATH_IMAGE096
问题可以转换为期望值损失最低的问题,其损失函数为:
Figure 482118DEST_PATH_IMAGE097
;其中
Figure 287132DEST_PATH_IMAGE098
为联合概率分布
Figure 370626DEST_PATH_IMAGE099
的经验期望,
Figure 339719DEST_PATH_IMAGE100
为模型期望。
根据本发明的一种实施方式,在上述d步骤中,构建的联合时序数据趋势预测模型包括:数据预处理层、卷积层、长短时记忆层和条件随机场算法层。在本实施方式中,构建联合时序数据趋势预测模型(即PSV-CNN-CRF联合模型),以实现对目标时序数据趋势的预测判断任务。实验数据集是商品价格数据集,分析任务为对目标时间点的物价变化趋势进行判定,变化趋势包括上涨、下跌和平稳三个状态。联合模型在对数据集进行补全之后,通过PSV转换方法对数据进行预处理,之后利用卷积层进行卷积特征提取,利用长短时记忆层进行长程关联性关系提取,最后通过条件随机场算法层来进行目标时间数据状态的概率判定。
模型主要分为上述四层。接下来结合具体的参数表达对各层的任务进行介绍。
记物价数据集中某一类商品A的价格数据PriceA为:
Figure 979910DEST_PATH_IMAGE101
Pi代表ti时刻的商品价格,T代表共有T个时刻。
在相同时间戳条件下,引入更多观测变量序列,该商品的销量数据SalesA和销售价值数据ValueA:
Figure 593425DEST_PATH_IMAGE102
Figure 972453DEST_PATH_IMAGE103
si代表ti时刻的销售数据,vi代表ti时刻的销售价值数据。
上述序列波动率归一化序列分别简记为:
Figure 350214DEST_PATH_IMAGE104
Figure 981047DEST_PATH_IMAGE105
Figure 573702DEST_PATH_IMAGE106
在相同时间戳条件下,下一时间点的趋势变化状态序列为:
Figure 546468DEST_PATH_IMAGE107
状态序列简记为:
Figure 365520DEST_PATH_IMAGE108
每个状态可以从集合
Figure 659098DEST_PATH_IMAGE109
中进行取值,状态变量取值规模为3。Upward trend代表上升趋势;steady trend代表平稳趋势;Downward trend代表下降趋势。
结合状态矩阵和状态取值范围,可以将
Figure 496473DEST_PATH_IMAGE110
转换为状态概率矩阵
Figure 154987DEST_PATH_IMAGE111
Figure 54810DEST_PATH_IMAGE112
模型的第一层为数据的预处理,即将数据通过PSV转换为结构友好且可分析的矩阵数据。对于商品A,构建其PSV矩阵:
Figure 778178DEST_PATH_IMAGE113
第二层为数据的卷积层,用来捕捉感受野范围内的特征数据。卷积层中有两个输出,一个是按照时间序列排列卷积形成的特征数据,另一个是对目标序列的分类结果。卷积神经网络共设置两层,每层设置两个
Figure 283108DEST_PATH_IMAGE114
的卷积器,每两个卷积器之后设置一个池化器。其中第一个卷积器产生的数据为模型采样提取的特征数据。
将卷积的分类过程记为
Figure 174841DEST_PATH_IMAGE115
,卷积提取特征值过程记为
Figure 952173DEST_PATH_IMAGE116
。其中分类过程会根据商品价格的波动性进行商品分类。
Figure 525237DEST_PATH_IMAGE116
是对PSV矩阵的进一步卷积处理,卷积得到的特征矩阵记为
Figure 212570DEST_PATH_IMAGE117
。在
Figure 901303DEST_PATH_IMAGE116
模型中,未解决矩阵边缘感受野范围与矩阵内部感受野不用的问题,需要在PSV矩阵边缘增加补充变量,将
Figure 713401DEST_PATH_IMAGE118
的数据矩阵规模转换为
Figure 886893DEST_PATH_IMAGE119
矩阵规模,以保证卷积特征提取的序列长度与原输入保持一致。
Figure 553367DEST_PATH_IMAGE115
分类器和
Figure 459006DEST_PATH_IMAGE120
独立进行训练。
Figure 86296DEST_PATH_IMAGE121
第三层为数据的长短时记忆层,数据的输入除原始序列
Figure 751895DEST_PATH_IMAGE122
之外,还补充了卷积形成的特征数据序列
Figure 758028DEST_PATH_IMAGE117
和分类数据集的平均波动数据序列
Figure 428044DEST_PATH_IMAGE123
,通过长短时记忆网络的训练和计算,可以得到包含局部信息、全局信息和卷积特征信息的长短时特征信息。构建联合信息矩阵
Figure 464002DEST_PATH_IMAGE124
的表示如下:
Figure 385822DEST_PATH_IMAGE125
Figure 371095DEST_PATH_IMAGE124
为观察矩阵,
Figure 634849DEST_PATH_IMAGE126
为状态矩阵。LSTM的训练过程与前述的训练过程一致,该LSTM可以需要和CRF联合进行训练。由LSTM模型计算输出的新的状态概率矩阵记为
Figure 112098DEST_PATH_IMAGE127
第四层为CRF层。在序列趋势预测中,相邻的数据具有很强的依赖性,因此联合解码比做独立判断模型更为有效。CRF层的数据是状态概率矩阵
Figure 431083DEST_PATH_IMAGE126
和长短时记忆层输出的状态概率矩阵
Figure 926656DEST_PATH_IMAGE127
,计算输出给定时间点
Figure 610578DEST_PATH_IMAGE128
Figure 699757DEST_PATH_IMAGE129
,其中
Figure 182953DEST_PATH_IMAGE130
,r是CRF层输出数据。
根据本发明的一种实施方式,在上述e步骤中,PSV-CNN-CRF联合模型选择连续200个交易日45类商品6000个物价时序数据序列进行实验,数据规模约480万条。其中的实验效果评价机制采用二分类法评价方法,选择KNN(K-NearestNeighbor)、SVM(support vectormachines)、CNN和CRF四种方法作为基线对比方法,P代表精确率,R代表召回率,F1代表均衡平均数。对比情况如下表1所示:
Figure 408398DEST_PATH_IMAGE131
表1
整体来看,PSV-CNN-CRF相较于基线对比模型效果较好,趋势判断的准确率提高了四个百分点,应用效果也取得了较好的提升。
根据本发明的上述方案,本发明结合趋势判别任务和商品价格等时序数据特点,提出了PSV-CNN-CRF趋势预测方法(即基于时间序列的数据趋势预测方法),该方法按照时序数据结构特征对时序数据进行了图像化数据转换,通过卷积采样学习提取数据趋势特征,并结合时序规律信息对数据趋势进行了预测。该方法的主要创新点有三项,一是PSV-CNN-CRF方法结合经济类数据的自身数据结构和分布特点,进行了PSV序列数据转换,有效的解决了深度学习过程中时序数据预处理的问题;二是PSV-CNN-CRF方法有效的按照时序数据结构特点提取卷积采样数据特征进行分类判别,效果较已有的分类和判别方法有明显提升;三是PSV-CNN-CRF方法结合矩阵数据卷积特征和序列状态传播特征对数据趋势判别任务进行增强。PSV-CNN-CRF在实验和工程实践中进行了验证并取得了较好的效果。
为了实现本发明的目的,本发明还提供一种基于时间序列的数据趋势预测系统,具体结构框图如图10所示,具体包括:
图像数据转换模块,将历史时间序列数据转换为可视化的时间序列图像数据;
矩阵数据转换模块,将时间序列图像数据转换为矩阵数据;
数据趋势特征提取模块,采用支持输入多变量数据的卷积神经网络模型提取矩阵数据的数据趋势特征;
数据趋势预测模型构建模块,根据数据趋势特征构建基于条件随机场的联合时序数据趋势预测模型;
数据趋势预测结果输出模块,向联合时序数据趋势预测模型中输入待预测时间序列数据,输出时间序列数据趋势预测结果。
根据本发明的一种实施方式,在图像数据转换模块和矩阵数据转换模块中,利用python的seaborn包绘制热力图,实现数据的图像可视化,通过数据转换将时间序列数据转换为时间序列图像式的数据结构。这部分的主要目的是通过数据转换将时间序列数据转换为更有效和可分析的数据结构。时间序列可以以相对简单的方式直接转换为目标数据格式。在深度学习卷积神经网络分析方法中,将开盘价,收盘价,最高价和最低价可视化,然后将时间序列可视化的二维图像用作模型的输入。可视化的CNN模型图像如图2所示。
经过数据转换之后,卷积神经网络在图像识别中的特征获取和分类能力可帮助完成特征提取和数据趋势预测任务。如此方案,一是可以通过数据转换输入更多的技术指标,二是可以应用于更经济的数据趋势预测和分类任务。三是结合序列组合进行多序列数据分析。
时间序列数据的数据转换研究需要从时间序列数据本身的特征出发,以便获得最适合时间序列数据的编码转换方法。在传统的时序数据分析中,时序数据的时间特点是时序数据独有的特点。以商品价格数据为例,如果按月提取数据,则会发现该数据具有12个月的周期,并且每12个月的间隔之间的数据之间存在显着的相关性;按日抽取的数据也具备这样的特点,每20天的数据存在有显著的关联关系和波动相似性。基于这样的时序数据规律,可以根据季节定律来重塑时间序列数据的数据结构。以某监测点商品价格数据集为例,将同一时间点上的价格数据(Price Data)、销量数据(Sales Data)、价值数据(ValueData)组合构建PSV三维数据组。在本实施方式中,从数据集某个时间序列中抽取连续400个时序数据,构建
Figure 528801DEST_PATH_IMAGE132
*3的实验时间序列矩阵。结合目标数据集的时间特点,将实验序列矩阵转换为
Figure 964330DEST_PATH_IMAGE133
的矩阵数据,在20*20*3中,第一个20表示20个月,之后20*3表示一个月采集20条数据,共采集3个月的数据。转换后的数据可以通过图像进行表达,每个图像含有
Figure 625118DEST_PATH_IMAGE134
个像素数据。数据示意如图3,图3是经数据预处理后的图像。
以上是PSV矩阵的构建过程。经过转换之后,可以将数据输入至卷积神经网络以进行进一步的分析和计算。与现有技术中的序列深度学习方法不同,卷积神经网络可以对数据的全局信息进行归纳和规律挖掘。
根据本发明的一种实施方式,在数据趋势特征提取模块中,采用多变量的CNN模型进行数据分析研究,提取所述矩阵数据的数据趋势特征。具体地, CNN模型可以支持并行输入多变量数据,例如图像数据R-G-B三分量数据。多元CNN时间序列分析模型可以充分发挥CNN在多通道并行数据处理中的性能优势。
如前所述,本发明已经将时序数据通过PSV转化为多变量的并行矩阵式数据,因此可以采用多变量的CNN模型进行数据分析研究。CNN通过卷积滤波和数据采样能够很好的表达整体序列数据的全局规律情况。
CNN模型的数学表达式包括:
Figure 846015DEST_PATH_IMAGE135
其中,zi为卷积后的第i个特征图,xj为当前第j个特征图,Wi,j为zi应的第j个权重,m为输入特征图个数,bi代表第i个偏移量;
Figure 610754DEST_PATH_IMAGE136
其中g,h为分类类别,且
Figure 408946DEST_PATH_IMAGE137
,Yg为第g个分类类别的输出值,softmax(Yg)为分类类别为g的概率,在测试模型时,softmax层取softmax(Y1),softmax(Y2),…,softmax(Yh)中数值最大的类别作为样本的预测标签。
实验研究的CNN模型算法如下:
1.
Figure 748791DEST_PATH_IMAGE065
2.
Figure 870200DEST_PATH_IMAGE066
3.
Figure 394722DEST_PATH_IMAGE067
4.
Figure 289997DEST_PATH_IMAGE138
5.
Figure 558167DEST_PATH_IMAGE069
6.
Figure 35547DEST_PATH_IMAGE139
7.
Figure 871916DEST_PATH_IMAGE071
8.
Figure 379121DEST_PATH_IMAGE072
9.
Figure 106774DEST_PATH_IMAGE073
CNN模型在实验数据集上表现符合效果良好。训练数据集含有商品价格图像式数据300张,其中50张为夹杂噪音数据的商品价格图像式数据,模型的任务是需要从这300张矩阵数据中识别出噪音数据矩阵。训练和实验结果情况如图4、图5、图6和图7所示,经500轮次训练可达到98.94%准确度和0.96的F1评分。
经实验验证,基于PSV-CNN的判别矩阵是有效的,该模型可以有效的提取时序数据卷积特征,可以有效结合全局信息实现矩阵数据图像的分类。
根据本发明的一种实施方式,在数据趋势预测模型构建模块中,定义时间序列数据条件随机场(TMS-CRF)的基础参数,假设观察特征时间序列数据为
Figure 156770DEST_PATH_IMAGE140
,状态特征时间序列数据为
Figure 757516DEST_PATH_IMAGE141
Figure 643694DEST_PATH_IMAGE142
是在给定
Figure 925771DEST_PATH_IMAGE143
的条件下
Figure 689328DEST_PATH_IMAGE144
的条件概率分布。TMS-CRF方法的主要问题均是围绕条件概率模型
Figure 116767DEST_PATH_IMAGE142
展开的。
一般情况下,TMS-CRF中的状态特征时间序列是隐性状态时间序列,其可以构成一个无向图
Figure 270668DEST_PATH_IMAGE145
,其中V表示结点的集合,E表示边的集合。TMS-CRF是满足MRF的特征的,即对任意结点𝑣成立的条件概率分布
Figure 684331DEST_PATH_IMAGE142
条件随机场,可以表达为式一:
Figure 928493DEST_PATH_IMAGE146
,式中
Figure 402200DEST_PATH_IMAGE147
表示在无向图
Figure 43397DEST_PATH_IMAGE148
中与所有状态点
Figure 119806DEST_PATH_IMAGE149
和所有状态点
Figure 857955DEST_PATH_IMAGE150
的连接关系,
Figure 377929DEST_PATH_IMAGE151
为所有状态点
Figure 834318DEST_PATH_IMAGE152
和所有状态点
Figure 12621DEST_PATH_IMAGE150
的非连接关系,
Figure 215063DEST_PATH_IMAGE153
是在给定
Figure 30573DEST_PATH_IMAGE154
的条件下
Figure 895629DEST_PATH_IMAGE155
的条件概率分布,
Figure 64574DEST_PATH_IMAGE154
为输入向量,表示观察特征时间序列数据,
Figure 200151DEST_PATH_IMAGE156
Figure 920982DEST_PATH_IMAGE157
为是输出变量,表示状态特征时间序列数据,
Figure 961751DEST_PATH_IMAGE156
可以进行推导证明,TMS-CRF是满足MRF的成对、局部和全局三项马尔科夫性质的。基于TMS-HMM-Chain和三项马尔科夫性质,我们可以将式一进一步推导成以下形式:
Figure 980391DEST_PATH_IMAGE158
图8和图9是TMS-CRF的两种结构示意图。
在这样的问题和无向图结构下,对时间序列条件随机场TMS-CRF的三个核心问题进行逐步讨论。首先构建关联函数,在图8的情况下,TMS-CRF的第一个核心问题是条件概率计算的问题,即对于观察特征时间序列数据
Figure 547639DEST_PATH_IMAGE154
和状态特征时间序列数据
Figure 314737DEST_PATH_IMAGE155
计算出该模型的条件概率分布
Figure 390272DEST_PATH_IMAGE159
。在时间点
Figure 291232DEST_PATH_IMAGE160
该条件概率可以表达为
Figure 385090DEST_PATH_IMAGE161
,其前序时间点
Figure 837937DEST_PATH_IMAGE162
的条件概率可以表达为
Figure 712352DEST_PATH_IMAGE163
,以及
Figure 89107DEST_PATH_IMAGE164
Figure 257045DEST_PATH_IMAGE165
之间的概率情况
Figure 490580DEST_PATH_IMAGE166
。进一步构建矩阵M阶矩阵,其中M取
Figure 993237DEST_PATH_IMAGE028
矩阵的特征数量值,观测序列x的每一个位置为i=1,2,..n+1,在状态链两头分别加入两个状态y0=start,yn+1=stop作为起始状态和终止状态:
Figure 891792DEST_PATH_IMAGE167
矩阵元素为:
Figure 960242DEST_PATH_IMAGE168
Figure 630257DEST_PATH_IMAGE169
将转移特征和状态特征及其权值用统一的符号表示,设K1个转移特征,K2个状态特征,K=K1+K2,记:
Figure 117082DEST_PATH_IMAGE032
然后,对转移特征与状态特征在各个位置i求和,记作:
Figure 570060DEST_PATH_IMAGE033
其中,f是特征函数,yi-1和yi分别是观察特征时间序列Yi-1和Yi的取值,wk代表fk的权重,Wi表示时间点i对应的权重参数;tk是转移特征,依赖于当前位置和前一个位置,k代表转移特征的数量;sl是状态特征,依赖于当前位置,l代表状态特征的数量;w代表权重。
在本实施方式中,TMS-CRF的条件概率计算问题,即为计算上述条件概率及其期望的问题。TMS-CRF的条件概率计算问题可以采用前向后向联合算法(Forward-BackwardAlgorithm)进行计算。在原有状态链前后各加入一个状态y0=start和yn+1=stop分别作为起始状态和终止状态,对于每一个指标
Figure 86492DEST_PATH_IMAGE170
,定义前向过程向量
Figure 786464DEST_PATH_IMAGE171
和后向过程向量
Figure 60450DEST_PATH_IMAGE172
,对于
Figure 645015DEST_PATH_IMAGE173
Figure 642053DEST_PATH_IMAGE174
时刻,存在:
Figure 388292DEST_PATH_IMAGE175
Figure 883995DEST_PATH_IMAGE176
定义前向过程向量
Figure 396885DEST_PATH_IMAGE171
和后向过程向量
Figure 356751DEST_PATH_IMAGE172
,则前向后向递推可得:
Figure 414837DEST_PATH_IMAGE177
Figure 414148DEST_PATH_IMAGE178
其中T表示转置;
进一步简化得到:
Figure 340515DEST_PATH_IMAGE179
Figure 30254DEST_PATH_IMAGE180
其中
Figure 649454DEST_PATH_IMAGE171
(x)代表在位置i时状态为yi且从位置1到位置i的状态序列的非规范化概率,因为yi的取值有m个所以
Figure 369017DEST_PATH_IMAGE171
(x)为m维列向量;后向向量
Figure 708863DEST_PATH_IMAGE181
(x)表示在位置i时状态为yi且从位置i+1到位置n的状态序列的非规范化概率;
根据前向后向过程,概率计算符合规律:
Figure 643321DEST_PATH_IMAGE088
由此可以开展TMS-CRF的条件概率计算问题和期望计算的问题。
Figure 59521DEST_PATH_IMAGE089
由前向向量和后向向量的定义,可得出在给定观察值x的条件下,在位置i对应状态yi在位置i-1对应状态为yi-1的条件概率:
Figure 17113DEST_PATH_IMAGE090
在阐明TMS-CRF的计算问题后,可以开展对TMS-CRF模型的学习和训练问题进行讨论,该问题是通过模型训练以达到在极大似然下的最优化。对于给定的经验分布
Figure 19704DEST_PATH_IMAGE182
条件下TMS-CRF的条件概率模型:
Figure 198881DEST_PATH_IMAGE092
其可用于学习过程的似然函数对数表示为:
Figure 831988DEST_PATH_IMAGE093
学习任务可以描述为,求得某一矩阵
Figure 339192DEST_PATH_IMAGE094
使得
Figure 771573DEST_PATH_IMAGE095
。我们可以采用改进的迭代尺度法(Improved Iterative Scaling,IIS)、梯度下降法(Gradient descent,GD)以及拟牛顿L-BFGS(Quasi-Newton Limited Memory BFGS Methods)算法进行学习训练。在采用L-BFGS方法下
Figure 946202DEST_PATH_IMAGE096
问题可以转换为期望值损失最低的问题,其损失函数为:
Figure 484631DEST_PATH_IMAGE097
其中
Figure 869345DEST_PATH_IMAGE098
为联合概率分布
Figure 885843DEST_PATH_IMAGE183
的经验期望,
Figure 649399DEST_PATH_IMAGE184
为模型期望。
根据本发明的一种实施方式,在数据趋势预测模型构建模块中,构建的联合时序数据趋势预测模型包括:数据预处理层、卷积层、长短时记忆层和条件随机场算法层。在本实施方式中,构建联合时序数据趋势预测模型(即PSV-CNN-CRF联合模型),以实现对目标时序数据趋势的预测判断任务。实验数据集是商品价格数据集,分析任务为对目标时间点的物价变化趋势进行判定,变化趋势包括上涨、下跌和平稳三个状态。联合模型在对数据集进行补全之后,通过PSV转换方法对数据进行预处理,之后利用卷积层进行卷积特征提取,利用长短时记忆层进行长程关联性关系提取,最后通过条件随机场算法层来进行目标时间数据状态的概率判定。
在本实施方式中,整体模型主要分为上述四层。接下来结合具体的参数表达对各层的任务进行介绍。
记物价数据集中某一类商品A的价格数据为:
Figure 312724DEST_PATH_IMAGE101
在相同时间戳条件下,引入更多观测变量序列,该商品的销量数据和销售价值数据:
Figure 60100DEST_PATH_IMAGE102
Figure 145868DEST_PATH_IMAGE103
上述序列波动率归一化序列分别简记为:
Figure 888565DEST_PATH_IMAGE104
Figure 362271DEST_PATH_IMAGE105
Figure 3468DEST_PATH_IMAGE106
在相同时间戳条件下,下一时间点的趋势变化状态序列为:
Figure 581342DEST_PATH_IMAGE107
状态序列简记为:
Figure 319491DEST_PATH_IMAGE108
每个状态可以从集合
Figure 573886DEST_PATH_IMAGE185
中进行取值,状态变量取值规模为3。结合状态矩阵和状态取值范围,可以将
Figure 951647DEST_PATH_IMAGE110
转换为状态概率矩阵
Figure 707113DEST_PATH_IMAGE111
Figure 175135DEST_PATH_IMAGE112
模型的第一层为数据的预处理,即将数据通过PSV转换为结构友好且可分析的矩阵数据。对于商品A,构建其PSV矩阵:
Figure 413480DEST_PATH_IMAGE113
第二层为数据的卷积层,用来捕捉感受野范围内的特征数据。卷积层中有两个输出,一个是按照时间序列排列卷积形成的特征数据,另一个是对目标序列的分类结果。卷积神经网络共设置两层,每层设置两个
Figure 357166DEST_PATH_IMAGE114
的卷积器,每两个卷积器之后设置一个池化器。其中第一个卷积器产生的数据为模型采样提取的特征数据。
将卷积的分类过程记为
Figure 260531DEST_PATH_IMAGE115
,卷积提取特征值过程记为
Figure 894643DEST_PATH_IMAGE116
。其中分类过程会根据商品价格的波动性进行商品分类。
Figure 881054DEST_PATH_IMAGE116
是对PSV矩阵的进一步卷积处理,卷积得到的特征矩阵记为
Figure 921822DEST_PATH_IMAGE117
。在
Figure 19091DEST_PATH_IMAGE116
模型中,未解决矩阵边缘感受野范围与矩阵内部感受野不用的问题,需要在PSV矩阵边缘增加补充变量,将
Figure 997456DEST_PATH_IMAGE118
的数据矩阵规模转换为
Figure 764555DEST_PATH_IMAGE119
矩阵规模,以保证卷积特征提取的序列长度与原输入保持一致。
Figure 682833DEST_PATH_IMAGE115
分类器和
Figure 239585DEST_PATH_IMAGE120
独立进行训练。
Figure 536705DEST_PATH_IMAGE121
第三层为数据的长短时记忆层,数据的输入除原始序列
Figure 864918DEST_PATH_IMAGE122
之外,还补充了卷积形成的特征数据序列
Figure 427749DEST_PATH_IMAGE117
和分类数据集的平均波动数据序列
Figure 7766DEST_PATH_IMAGE123
,通过长短时记忆网络的训练和计算,可以得到包含局部信息、全局信息和卷积特征信息的长短时特征信息。构建联合信息矩阵
Figure 284026DEST_PATH_IMAGE124
的表示如下:
Figure 907775DEST_PATH_IMAGE125
Figure 207169DEST_PATH_IMAGE124
为观察矩阵,
Figure 918773DEST_PATH_IMAGE126
为状态矩阵。LSTM的训练过程与前述的训练过程一致,该LSTM可以需要和CRF联合进行训练。由LSTM模型计算输出的新的状态概率矩阵记为
Figure 206797DEST_PATH_IMAGE127
第四层为CRF层。在序列趋势预测中,相邻的数据具有很强的依赖性,因此联合解码比做独立判断模型更为有效。CRF层的数据是状态概率矩阵
Figure 548917DEST_PATH_IMAGE126
和长短时记忆层输出的状态概率矩阵
Figure 663503DEST_PATH_IMAGE127
,计算输出给定时间点
Figure 303432DEST_PATH_IMAGE128
Figure 819864DEST_PATH_IMAGE129
,其中
Figure 332885DEST_PATH_IMAGE130
,r是CRF层输出数据。
根据本发明的一种实施方式,在数据趋势预测结果输出模块中,PSV-CNN-CRF联合模型选择连续200个交易日45类商品6000个物价时序数据序列进行实验,数据规模约480万条。其中的实验效果评价机制采用二分类法评价方法,选择KNN、SVM、CNN和CRF四种方法作为基线对比方法,对比情况如上表1所示。
整体来看,PSV-CNN-CRF相较于基线对比模型效果较好,趋势判断的准确率提高了四个百分点,应用效果也取得了较好的提升。
根据本发明的上述方案,本发明结合趋势判别任务和商品价格等时序数据特点,提出了PSV-CNN-CRF趋势预测系统(即基于时间序列的数据趋势预测系统),该系统按照时序数据结构特征对时序数据进行了图像化数据转换,通过卷积采样学习提取数据趋势特征,并结合时序规律信息对数据趋势进行了预测。该方法的主要创新点有三项,一是PSV-CNN-CRF方法结合经济类数据的自身数据结构和分布特点,进行了PSV序列数据转换,有效的解决了深度学习过程中时序数据预处理的问题;二是PSV-CNN-CRF方法有效的按照时序数据结构特点提取卷积采样数据特征进行分类判别,效果较已有的分类和判别方法有明显提升;三是PSV-CNN-CRF方法结合矩阵数据卷积特征和序列状态传播特征对数据趋势判别任务进行增强。PSV-CNN-CRF在实验和工程实践中进行了验证并取得了较好的效果。
为实现本发明的目的,本发明还提供一种电子设备,包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现上述基于时间序列的数据趋势预测方法。
为实现本发明的目的,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现上述基于时间序列的数据趋势预测方法。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明实施例方案的目的。
另外,在本发明实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例节能信号发送/接收的方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
应理解,本发明的发明内容及实施例中各步骤的序号的大小并不绝对意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

Claims (10)

1.基于时间序列的数据趋势预测方法,其特征在于,包括:
将历史时间序列数据转换为可视化的时间序列图像数据;
将所述时间序列图像数据转换为矩阵数据;
采用支持输入多变量数据的卷积神经网络模型提取所述矩阵数据的数据趋势特征;
根据所述数据趋势特征构建基于条件随机场的联合时序数据趋势预测模型;
向所述联合时序数据趋势预测模型中输入待预测时间序列数据,输出时间序列数据趋势预测结果。
2.根据权利要求1所述的基于时间序列的数据趋势预测方法,其特征在于,将所述时间序列图像数据转换为矩阵数据为:
从数据集某个时间序列中抽取连续N个时序数据,构建N*3的实验时间序列矩阵,结合目标数据集的时间特点,将实验时间序列矩阵转换为的矩阵数据,其中n*n=N,3表示3个月;
转换后的数据通过图像表达,每个图像含有
Figure 288143DEST_PATH_IMAGE001
个像素数据,其中图像包括结合时间特点的数据的图像和图像经过数据转换形成的矩阵数据图像。
3.根据权利要求1所述的基于时间序列的数据趋势预测方法,其特征在于,所述卷积神经网络模型的数学表达式包括:
Figure 628120DEST_PATH_IMAGE002
其中,zi为卷积后的第i个特征图,xj为当前第j个特征图,Wi,j为zi应的第j个权重,m为输入特征图个数,bi代表第i个偏移量;
Figure 204595DEST_PATH_IMAGE003
其中g,h为分类类别,且
Figure 271908DEST_PATH_IMAGE004
,Yg为第g个分类类别的输出值,softmax(Yg)为分类类别为g的概率,在测试模型时,softmax层取softmax(Y1),softmax(Y2),…,softmax(Yh)中数值最大的类别作为样本的预测标签。
4.根据权利要求1所述的基于时间序列的数据趋势预测方法,其特征在于,所述条件随机场中的状态特征时间序列是隐性状态时间序列,其构成一个无向图
Figure 7652DEST_PATH_IMAGE005
,其中V表示结点的集合,E表示边的集合,对任意结点V成立的条件概率分布
Figure 502218DEST_PATH_IMAGE006
条件随机场,表达为式一:
Figure 565989DEST_PATH_IMAGE007
,式中
Figure 922146DEST_PATH_IMAGE008
表示在无向图
Figure 263129DEST_PATH_IMAGE009
中与所有状态点
Figure 53230DEST_PATH_IMAGE010
和所有状态点
Figure 728931DEST_PATH_IMAGE011
的连接关系,
Figure 138047DEST_PATH_IMAGE012
为所有状态点
Figure 84269DEST_PATH_IMAGE013
和所有状态点
Figure 310851DEST_PATH_IMAGE014
的非连接关系,
Figure 959001DEST_PATH_IMAGE006
是在给定
Figure 155496DEST_PATH_IMAGE015
的条件下
Figure 736650DEST_PATH_IMAGE016
的条件概率分布,
Figure 868554DEST_PATH_IMAGE015
为输入向量,表示观察特征时间序列数据,
Figure 20312DEST_PATH_IMAGE017
Figure 505651DEST_PATH_IMAGE018
为是输出变量,表示状态特征时间序列数据,
Figure 800366DEST_PATH_IMAGE019
基于构建时间序列数据的隐马尔可夫链和三项马尔科夫性质,对所述式一进一步推导为:
Figure 493384DEST_PATH_IMAGE020
其中,在时间点
Figure 850547DEST_PATH_IMAGE021
的条件概率表达为
Figure 529790DEST_PATH_IMAGE022
,其前序时间点
Figure 293392DEST_PATH_IMAGE023
的条件概率表达为
Figure 642465DEST_PATH_IMAGE024
,以及
Figure 877137DEST_PATH_IMAGE025
Figure 219126DEST_PATH_IMAGE026
之间的概率情况
Figure 363799DEST_PATH_IMAGE027
进一步构建矩阵M阶矩阵,其中M取
Figure 900085DEST_PATH_IMAGE028
矩阵的特征数量值,观测序列x的每一个位置为i=1,2,..n+1,在状态链两头分别加入两个状态y0=start,yn+1=stop作为起始状态和终止状态:
Figure 622053DEST_PATH_IMAGE029
矩阵元素为:
Figure 518465DEST_PATH_IMAGE030
Figure 501333DEST_PATH_IMAGE031
将转移特征和状态特征及其权值用统一的符号表示,设K1个转移特征,K2个状态特征,K=K1+K2,记:
Figure 457788DEST_PATH_IMAGE032
然后,对转移特征与状态特征在各个位置i求和,记作:
Figure 667053DEST_PATH_IMAGE033
其中,f是特征函数,yi-1和yi分别是观察特征时间序列Yi-1和Yi的取值,wk代表fk的权重,Wi表示时间点i对应的权重参数;tk是转移特征,依赖于当前位置和前一个位置,k代表转移特征的数量;sl是状态特征,依赖于当前位置,l代表状态特征的数量;w代表权重。
5.根据权利要求4所述的基于时间序列的数据趋势预测方法,其特征在于,所述条件随机场采用前向后向联合算法计算条件概率,包括:
在原有状态链前后各加入一个状态y0=start和yn+1=stop分别作为起始状态和终止状态,对于每一个指标
Figure 117888DEST_PATH_IMAGE034
,定义前向过程向量
Figure 705995DEST_PATH_IMAGE035
和后向过程向量
Figure 82619DEST_PATH_IMAGE036
,对于
Figure 513600DEST_PATH_IMAGE037
Figure 751814DEST_PATH_IMAGE038
时刻,存在:
Figure 476319DEST_PATH_IMAGE039
Figure 368052DEST_PATH_IMAGE040
定义前向过程向量
Figure 427275DEST_PATH_IMAGE035
和后向过程向量
Figure 718447DEST_PATH_IMAGE036
,则前向后向递推得到:
Figure 140202DEST_PATH_IMAGE041
Figure 609360DEST_PATH_IMAGE042
其中T表示转置;
进一步简化得到:
Figure 641032DEST_PATH_IMAGE043
Figure 611262DEST_PATH_IMAGE044
其中
Figure 28468DEST_PATH_IMAGE035
(x)代表在位置i时状态为yi且从位置1到位置i的状态序列的非规范化概率,因为yi的取值有m个所以
Figure 917796DEST_PATH_IMAGE035
(x)为m维列向量;后向向量
Figure 545086DEST_PATH_IMAGE045
(x)表示在位置i时状态为yi且从位置i+1到位置n的状态序列的非规范化概率;
根据前向后向过程,概率计算符合规律Z(x):
Figure 194373DEST_PATH_IMAGE046
由此开展所述条件随机场的条件概率计算和期望计算为:
Figure 482397DEST_PATH_IMAGE047
由前向向量和后向向量的定义,得出在给定观察值x的条件下,在位置i对应状态yi在位置i-1对应状态为yi-1的条件概率:
Figure 293359DEST_PATH_IMAGE048
6.根据权利要求5所述的基于时间序列的数据趋势预测方法,其特征在于,所述条件随机场通过模型训练以达到在极大似然下的最优化,对于给定的经验分布
Figure 63737DEST_PATH_IMAGE049
条件下的所述条件随机场条件概率模型为:
Figure 110191DEST_PATH_IMAGE050
其用于学习过程的似然函数对数表示为:
Figure 767568DEST_PATH_IMAGE051
学习任务描述为求得某一矩阵
Figure 500163DEST_PATH_IMAGE052
使得
Figure 242991DEST_PATH_IMAGE053
,在采用L-BFGS方法下
Figure 827556DEST_PATH_IMAGE054
问题转换为期望值损失最低的问题,其损失函数为:
Figure 588708DEST_PATH_IMAGE055
其中
Figure 741472DEST_PATH_IMAGE056
为联合概率分布P~(X,Y)的经验期望,Ep(f)为模型期望。
7.根据权利要求6所述的基于时间序列的数据趋势预测方法,其特征在于,所述联合时序数据趋势预测模型包括:数据预处理层、卷积层、长短时记忆层和条件随机场算法层;
所述数据预处理层先将时间序列数据转换为时间序列图像数据,再将时间序列图像数据转换为矩阵数据;
所述卷积层用来捕捉感受野范围内的特征数据,所述卷积层中有两个输出,一个是按照时间序列排列卷积形成的特征数据,另一个是对目标序列的分类结果;卷积神经网络共设置两层,每层设置两个
Figure 830650DEST_PATH_IMAGE057
的卷积器,每两个卷积器之后设置一个池化器,其中第一个卷积器产生的数据为模型采样提取的特征数据;
所述长短时记忆层对数据进行训练和计算,得到包含局部信息、全局信息和卷积特征信息的长短时特征信息;
所述条件随机场算法层的数据是状态概率矩阵
Figure 845005DEST_PATH_IMAGE058
和长短时记忆层输出的状态概率矩阵
Figure 211395DEST_PATH_IMAGE059
,计算输出给定时间点m的
Figure 659694DEST_PATH_IMAGE060
,其中
Figure 626382DEST_PATH_IMAGE061
,r是条件随机场算法层输出数据。
8.基于时间序列的数据趋势预测系统,其特征在于,包括:
图像数据转换模块,将历史时间序列数据转换为可视化的时间序列图像数据;
矩阵数据转换模块,将所述时间序列图像数据转换为矩阵数据;
数据趋势特征提取模块,采用支持输入多变量数据的卷积神经网络模型提取所述矩阵数据的数据趋势特征;
数据趋势预测模型构建模块,根据所述数据趋势特征构建基于条件随机场的联合时序数据趋势预测模型;
数据趋势预测结果输出模块,向所述联合时序数据趋势预测模型中输入待预测时间序列数据,输出时间序列数据趋势预测结果。
9.电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于时间序列的数据趋势预测方法。
10.计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于时间序列的数据趋势预测方法。
CN202111492350.0A 2021-12-08 2021-12-08 基于时间序列的数据趋势预测方法和系统 Pending CN114118622A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111492350.0A CN114118622A (zh) 2021-12-08 2021-12-08 基于时间序列的数据趋势预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111492350.0A CN114118622A (zh) 2021-12-08 2021-12-08 基于时间序列的数据趋势预测方法和系统

Publications (1)

Publication Number Publication Date
CN114118622A true CN114118622A (zh) 2022-03-01

Family

ID=80363335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111492350.0A Pending CN114118622A (zh) 2021-12-08 2021-12-08 基于时间序列的数据趋势预测方法和系统

Country Status (1)

Country Link
CN (1) CN114118622A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116471307A (zh) * 2023-06-20 2023-07-21 北京中科朗易科技有限责任公司 物联网异构数据级联传输方法、装置、设备及介质
WO2023165145A1 (zh) * 2022-03-02 2023-09-07 北京沃东天骏信息技术有限公司 时序流量预测方法及装置、存储介质及电子设备
CN117113262A (zh) * 2023-10-23 2023-11-24 北京中科网芯科技有限公司 网络流量识别方法及其系统
CN117391125A (zh) * 2023-12-08 2024-01-12 成都星幔长庚科技有限公司 一种基于神经网络的数据处理方法及系统
CN117557299A (zh) * 2024-01-11 2024-02-13 天津慧聪科技有限公司 基于计算机辅助的营销策划方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023165145A1 (zh) * 2022-03-02 2023-09-07 北京沃东天骏信息技术有限公司 时序流量预测方法及装置、存储介质及电子设备
CN116471307A (zh) * 2023-06-20 2023-07-21 北京中科朗易科技有限责任公司 物联网异构数据级联传输方法、装置、设备及介质
CN116471307B (zh) * 2023-06-20 2023-08-22 北京中科朗易科技有限责任公司 物联网异构数据级联传输方法、装置、设备及介质
CN117113262A (zh) * 2023-10-23 2023-11-24 北京中科网芯科技有限公司 网络流量识别方法及其系统
CN117113262B (zh) * 2023-10-23 2024-02-02 北京中科网芯科技有限公司 网络流量识别方法及其系统
CN117391125A (zh) * 2023-12-08 2024-01-12 成都星幔长庚科技有限公司 一种基于神经网络的数据处理方法及系统
CN117391125B (zh) * 2023-12-08 2024-03-01 成都星幔长庚科技有限公司 一种基于神经网络的数据处理方法及系统
CN117557299A (zh) * 2024-01-11 2024-02-13 天津慧聪科技有限公司 基于计算机辅助的营销策划方法及系统
CN117557299B (zh) * 2024-01-11 2024-03-22 天津慧聪科技有限公司 基于计算机辅助的营销策划方法及系统

Similar Documents

Publication Publication Date Title
Ghaderizadeh et al. Hyperspectral image classification using a hybrid 3D-2D convolutional neural networks
CN114118622A (zh) 基于时间序列的数据趋势预测方法和系统
Kumar et al. Performance evaluation of classifiers for the recognition of offline handwritten Gurmukhi characters and numerals: a study
Yang et al. A dynamic subspace method for hyperspectral image classification
Richman AI in actuarial science
Wang et al. Adaptive feature fusion for time series classification
Zhou et al. Data preprocessing strategy in constructing convolutional neural network classifier based on constrained particle swarm optimization with fuzzy penalty function
CN111339978A (zh) 利用卷积神经网络模型识别交通指数时间序列模式的方法
Li et al. Multivariate financial time-series prediction with certified robustness
Ma et al. Echo memory-augmented network for time series classification
He et al. CECAV-DNN: Collective ensemble comparison and visualization using deep neural networks
Goumiri et al. A new hybrid model of convolutional neural networks and hidden Markov chains for image classification
Koskela Neural network methods in analysing and modelling time varying processes
Bharambe et al. Used car price prediction using different machine learning algorithms
Pal Factors influencing the accuracy of remote sensing classifications: a comparative study
Sarang Thinking Data Science: A Data Science Practitioner’s Guide
Jeyalakshmi et al. Accurate liver disease prediction system using convolutional neural network
US20230097940A1 (en) System and method for extracting and using groups of features for interpretability analysis
Wu Predictions of cryptocurrency prices based on inherent interrelationships
Nsimba et al. An information-theoretic wavelet-based texture descriptor using Gaussian Markov random field models
Sbrana et al. N-BEATS perceiver: a novel approach for robust cryptocurrency portfolio forecasting
Zhao et al. Financial time series data prediction by combination model Adaboost-KNN-LSTM
Shah et al. Study of various dimensionality reduction and classification algorithms on high dimensional dataset
Hasan et al. A Comparative Study of Hybrid Dimension Reduction Techniques to Enhance the Classification of High-Dimensional Microarray Data
Rychlewski Hyperspectral image classification of satellite images using compressed neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220301