发明内容
本发明针对现有技术中的缺点,提供了一种基于BiLSTM模型的话务数据的预测方法,解决了现在的话务量预测算法对于各种话务领域的特征识别不够精确,预测精准度偏低的问题。
为了解决上述技术问题,本发明通过下述技术方案得以解决:
一种话务量预测方法,包括以下步骤:
输入连续时间序列的话务数据,以卷积神经网络提取话务数据特征向量; 将所述数据特征向量输入BiLSTM模型得到第三特征向量矩阵,以激活函数转化输出预测时间话务量数据;
第三特征向量矩阵计算方法包括:以预测时间节点为基准,将所述连续时间序列的话务数据分为正向话务数据和反向话务数据,以正向LSTM网络拟合所述正向话务数据输出第一特征向量矩阵,以反向LSTM网络拟合所述反向话务数据输出第二特征向量矩阵;合并所述第一特征向量矩阵和所述第二特征向量矩阵,并计算权重,得到第三特征向量矩阵。
其中一种实施方式中,所述第一特征向量矩阵和所述第二特征向量矩阵的计算方法包括:
预设时间步长和时间周期,将所述时间周期内的连续时间序列的话务数据输入所述BiLSTM模型,其中,所述正向LSTM网络取周期内预测时间节点之前的连续时间序列的话务数据,拟合该时间段的话务数据特征向量,得到第一特征向量矩阵;
所述反向LSTM网络取周期内预测时间节点之后连续时间序列的话务数据,拟合该时间段的话务数据特征向量,得到第二特征向量矩阵。
其中一种实施方式中,计算权重的方法包括:
根据输入权重参数矩阵,和合并的第一特征向量矩阵和所述第二特征向量矩阵,计算第三特征向量矩阵;或,
根据多层感知机权重算法对合并的第一特征向量矩阵和所述第二特征向量矩阵执行加权计算。
其中一种实施方式中,还包括输入特征参数,将所述输入特征参数转化为输入特征向量,与所述话务数据特征向量合并后输入BiLSTM模型。
其中一种实施方式中,还包括步骤:预处理所述话务数据,并将预处理后的话务数据以特征工程提取泛化特征向量。
其中一种实施方式中,还包括步骤:
以卷积神经网络提取话务数据特征向量后输入第一Dropout层,合并所述第一特征向量矩阵和所述第二特征向量矩阵后输入第二Dropout层。
其中一种实施方式中,所述话务数据包括日期、时间和话务量。
本发明还基于上述方法公开一种话务预测系统, 包括:数据输入接口,用于接收连续时间序列的话务数据;
一维卷积层,用于以卷积神经网络提取话务数据特征向量;
BiLSTM层,用于以正向LSTM网络拟合正时序的话务数据输出第一特征向量矩阵,以反向LSTM网络拟合反向时序的话务数据输出第二特征向量矩阵;合并所述第一特征向量矩阵和所述第二特征向量矩阵;
Attention层,用于对合并所述第一特征向量矩阵和所述第二特征向量矩阵执行加权计算;
全连接层,用于以激活函数转化输出预测时间节点的话务量数据;
数据输出接口,输出预测时间节点的话务量数据;
所述数据输入接口、一维卷积层、BiLSTM层、Attention层、全连接层和数据输出接口顺次通信连接。
本发明的有益效果:采用双向LSTM技术实现话务数据的特征自动化。话务数据作为时间序列数据,通过考虑时间的连续性这一属性来预测某一时段的话务量能更好、更全面的预测话务量。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。
实施例1
一种话务量预测方法,如图1,包括以下步骤:
输入连续时间序列的话务数据,以卷积神经网络提取话务数据特征向量; 将所述数据特征向量输入BiLSTM模型得到第三特征向量矩阵,以激活函数转化输出预测时间话务量数据;
第三特征向量矩阵计算方法包括:以预测时间节点为基准,将所述连续时间序列的话务数据分为正向话务数据和反向话务数据,以正向LSTM网络拟合所述正向话务数据输出第一特征向量矩阵,以反向LSTM网络拟合所述反向话务数据输出第二特征向量矩阵;合并所述第一特征向量矩阵和所述第二特征向量矩阵,并计算权重,得到第三特征向量矩阵。
如图2,所述第一特征向量矩阵和所述第二特征向量矩阵的计算方法包括:
预设时间步长和时间周期,将所述时间周期内的连续时间序列的话务数据输入所述BiLSTM模型,其中,所述正向LSTM网络取周期内预测时间节点之前的连续时间序列的话务数据,拟合该时间段的话务数据特征向量,得到第一特征向量矩阵;
所述反向LSTM网络取周期内预测时间节点之后连续时间序列的话务数据,拟合该时间段的话务数据特征向量,得到第二特征向量矩阵。
以话务数据为例, T为8,K为下午5:00,预设时间步长为30分钟,则提取下午1:00-下午4:30的8组数据输入到正向LSTM网络中进行训练,直到拟合下午5:00的数据值。同理,逆向LSTM网络取下午5:30到下午9:00的8组数据进行训练拟合。
预测话务量时,正向LSTM网络通过历史数据预测下个时段的所述话务量数据,逆向LSTM网络则通过正向LSTM网络预测出来的话务量数据和历史数据来反推,然后合并得到最终结果。以上述方法话务量预测方法实现未来时间段的话务数据预测。当正向LSTM网络通过输入的话务数据历史数据得到预测结果后,逆向LSTM网络在经过历史数据训练后,根据预测结果从预测日期的最后一日开始倒着往前预测。
计算权重的方法包括:
根据输入权重参数矩阵,和合并的第一特征向量矩阵和所述第二特征向量矩阵,计算第三特征向量矩阵;
在其他实施方式中,采用自动加权计算方法,即根据多层感知机权重算法对合并的第一特征向量矩阵和所述第二特征向量矩阵执行加权计算。
即,BiLSTM模型输出若干特征向量Vi,输入Attention模型和预设的权重矩阵Ai求乘积或者采用自主学习的权重矩阵A’i通过多层感知机方法进行加权组合,输入通过全连接层输出最终预测时间节点的话务量结果。
实施例2
基于实施例1公开的一种话务量预测方法,还提出了一种话务量预测方法,如图3所示,除了实施例1公开的方案还包括处理步骤:
(1)输入话务数据集,对输入的话务数据集进行数据预处理,包括有:数据空值检测、数据空值补充、异常值检测和异常值处理。输入话务数据集,空值分为0或者空白,遍历话务数据表格,执行控制检测。数据空值补充方法为,对于检测的空值以当月该时段除空值外的平均值做补充。
其中,异常值检测设有两层,一层为DBSCAN聚类异常值检测,另一层为3sigma(拉伊达准则)。异常值处理为被检测到异常值使用当月该时段除异常值外的平均值做补充。
(2)数据特征工程处理方法,经过步骤(1)处理后的话务数据集执行数据特征工程,该步骤在采用卷积神经网络提取话务数据特征向量之前,提取换泛化性特征,例如时间、日期参数。基于输入的话务数据集为一段时间序列的连续数据集,在输入卷积神经网络前先提取时间段、年、月、日、是否为节假日、季度、调休等特征参数。并将提取的特征参数输入卷积神经网络。
(3)还包括外部输入特征参数处理,在输入话务数据集时,同时将该组话务数据集的相关特征参数作为外部输入数据输入,输入特征参数,将所述输入特征参数转化为输入特征向量,与所述话务数据特征向量合并后输出。
进一步的,以卷积神经网络提取话务数据特征向量后输入第一Dropout层,合并所述第一特征向量矩阵和所述第二特征向量矩阵后输入第二Dropout层。在两个步骤之后加入Dropout层防止模型过拟合。
以上,实施例1所述话务数据,以及实施例2中所阐述的话务数据集包括日期、时间和话务量。外部输入特征参数包括用户在意的其他特征参数,如天气、当日特殊事件等参数。
实施例3
一种话务预测系统,如图4,包括:数据输入接口,用于接收连续时间序列的话务数据;
一维卷积层,用于以卷积神经网络提取话务数据特征向量;
第一Dropout层,用于防止过拟合;
BiLSTM层,用于以正向LSTM网络拟合正时序的话务数据输出第一特征向量矩阵,以反向LSTM网络拟合反向时序的话务数据输出第二特征向量矩阵;合并所述第一特征向量矩阵和所述第二特征向量矩阵;
第二Dropout层,用于防止过拟合;
Attention层,用于对合并所述第一特征向量矩阵和所述第二特征向量矩阵执行加权计算;
全连接层,用于以激活函数转化输出预测时间节点的话务量数据;
数据输出接口,输出预测时间节点的话务量数据;
所述数据输入接口、一维卷积层、第一Dropout层、BiLSTM层、第二Dropout层、Attention层、全连接层和数据输出接口顺次通信连接。
进一步的,BiLSTM层包括正向LSTM网络和反向LSTM网络,所述正向LSTM网络用于拟合待预测时间节点之前时间周期的话务数据,反向LSTM网络用于拟合待预测时间节点之后的时间周期的话务数据。
还公开一种话务量预测装置,包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序可以被所述处理器调用用于实现实施例1和实施例2所述的话务量预测方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。
所述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质(存储器)中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何在本发明揭露的技术范围内的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。