CN110163401B

CN110163401B - 时间序列的预测方法、数据预测方法和装置

Info

Publication number: CN110163401B
Application number: CN201810146876.5A
Authority: CN
Inventors: 马林; 张卫忠; 刘威; 陶蕴哲
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-02-12
Filing date: 2018-02-12
Publication date: 2023-05-26
Anticipated expiration: 2038-02-12
Also published as: CN110163401A

Abstract

本发明实施例公开了时间序列的预测方法、数据预测方法和装置，用于提高对时间序列的预测准确度。其中，在时间序列的预测方法中，首先通过对至少一个外部时间序列的特征信息提取，可以得到特征信息序列，然后通过特征信息序列获取到表达信息序列，使用分层注意力机制逐层筛选出与主时间序列相关的相关信息序列，最后结合相关信息序列以及历史时刻的主时间序列，使用时间序列预测模型可以得到在当前时刻的主时间序列预测值。

Description

时间序列的预测方法、数据预测方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及时间序列的预测方法、数据预测方法和装置。

背景技术

随着数据的爆炸式增长，将这些数据结合对应的时间戳统计起来，就会构成时间序列。使用时间序列的预测方法可以分析时间序列的模式规律，能够较精确地找出数据内在的统计特性和发展规律，通过对这些统计特性和规律进行分析，可以用于对未来行为的预测。

时间序列的预测方法可以基于与时间参数相关联的有序观测数据预测出数据发展趋势。当前基于时间序列的预测方法一般使用自回归滑动平均模型(AutoregressiveMoving Average Model，ARMA)。其中，ARMA是研究平稳随机过程有理谱的典型方法，适用于很大一类实际问题，但其参数估算比较繁琐，特别是在参数估计是非线性的时候，难以求得ARMA参数的准确估值，因此现有技术的方案存在预测准确度差的问题。如何找到一种更快捷有效的时间序列预测方案获取用户需要的预测结果，是本领域技术人员函待解决的问题。

发明内容

本发明实施例提供了时间序列的预测方法、数据预测方法和装置，用于提高对时间序列的预测准确度。

为解决上述技术问题，本发明实施例提供以下技术方案：

第一方面，本发明实施例提供一种时间序列的预测方法，包括：

对至少一个外部时间序列在T-1个历史时刻分别进行特征信息的提取，得到长度为T-1的特征信息序列，其中，所述外部时间序列与待预测的主时间序列相关联，且所述T为大于或等于2的正整数；

分别获取所述特征信息序列在K个语义层上的特征表达信息，得到长度为T-1的表达信息序列，所述K为大于或等于2的正整数；

使用分层注意力机制，从所述表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列；

结合所述相关信息序列以及对应历史时刻的所述主时间序列，使用时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测，得到在T时刻的主时间序列预测值。

第二方面，本发明实施例还提供一种数据预测方法，包括：

获取数据源，所述数据源包括对应多个历史时刻的主时间序列以及对应所述历史时刻的至少一个外部时间序列；

将所述至少一个外部时间序列输入到第一模型，获得所述外部时间序列在多个历史时刻的表达信息序列；

将所述相关信息序列以及对应历史时刻的所述主时间序列输入到第二模型，并通过所述第二模型预测所述主时间序列在当前时刻的主时间序列预测值。

第三方面，本发明实施例还提供一种时间序列的预测装置，包括：

特征信息提取模块，用于对至少一个外部时间序列在T-1个历史时刻分别进行特征信息的提取，得到长度为T-1的特征信息序列，其中，所述外部时间序列与待预测的主时间序列相关联，且所述T为大于或等于2的正整数；

表达信息获取模块，用于分别获取所述特征信息序列在K个语义层上的特征表达信息，得到长度为T-1的表达信息序列，所述K为大于或等于2的正整数；

筛选模块，用于使用分层注意力机制，从所述表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列；

预测模块，用于结合所述相关信息序列以及对应历史时刻的所述主时间序列，使用时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测，得到在T时刻的主时间序列预测值。

第四方面，本发明实施例还提供一种数据预测装置，包括：

数据源获取模块，用于获取数据源，所述数据源包括对应多个历史时刻的主时间序列以及对应所述历史时刻的至少一个外部时间序列；

表达信息序列获取模块，用于将所述至少一个外部时间序列输入到第一模型，获得所述外部时间序列在多个历史时刻的表达信息序列；

筛选模块，用于使用分层注意力机制从所述表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列；

预测模块，用于将所述相关信息序列以及对应历史时刻的所述主时间序列输入到第二模型，并通过所述第二模型预测所述主时间序列在当前时刻的主时间序列预测值。

第五方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

从以上技术方案可以看出，本发明实施例具有以下优点：

在本发明实施例中，首先通过对至少一个外部时间序列的特征信息提取，可以得到特征信息序列，然后通过特征信息序列获取到表达信息序列，使用分层注意力机制逐层筛选出与主时间序列相关的相关信息序列，最后结合相关信息序列以及历史时刻的主时间序列，使用时间序列预测模型可以得到在当前时刻的主时间序列预测值。本发明实施例中能够基于外部时间序列获取到相关信息序列，使用时间序列预测模型可以对主时间序列进行预测，由于本发明实施例中充分利用了外部时间序列的交互性和相关性，因此可以更为精准的获取到主时间序列预测值。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种时间序列的预测方法的流程方框示意图；

图2为本发明实施例提供的使用分层注意力机制的时间序列的预测过程示意图；

图3-a为本发明实施例提供的一种时间序列的预测装置的组成结构示意图；

图3-b为本发明实施例提供的一种预测模块的组成结构示意图；

图3-c为本发明实施例提供的另一种预测模块的组成结构示意图；

图3-d为本发明实施例提供的一种筛选模块的组成结构示意图；

图4为本发明实施例提供的一种数据预测装置的组成结构示意图；

图5为本发明实施例提供的时间序列的预测方法、数据预测方法应用于服务器的组成结构示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部实施例。基于本发明中的实施例，本领域的技术人员所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。

以下分别进行详细说明。

本发明时间序列的预测方法的一个实施例，具体可以应用于对主时间序列的预测场景中。本发明实施例中，主时间序列是指将同一个统计指标的数值按照其发生时间的先后顺序排列而成的数据序列。例如，某一款应用程序每天的下载数量、某个网站每天的访问人数等等。通过对主时间序列分析，可以应用于预测领域，比如，在互联网产业中，通过对主时间序列预测值的输出可实现对网站访问量、应用程序下载量等业务指标进行预测。本发明实施例中在对主时间序列进行预测时可以结合多组外部时间序列，利用多组外部时间序列的交互性和相关性，可以提高对主时间序列的预测精确度。请参阅图1所示，本发明一个实施例提供的时间序列的预测方法，可以包括如下步骤：

101、对至少一个外部时间序列在T-1个历史时刻分别进行特征信息的提取，得到长度为T-1的特征信息序列，其中，外部时间序列与待预测的主时间序列相关联，且T为大于或等于2的正整数。

在本发明实施例中，首先获取到至少一个的外部时间序列，例如以m表示获取到的外部时间序列的个数，具体的，该外部时间序列可以为至少两个，则m为大于或等于2的正整数。其中，每个外部时间序列包括有在历史时刻对应的外部指标取值，外部时间序列中包括的历史时刻的个数用T-1来表示，则当前时刻可以用于第T个时刻来表示。外部时间序列是含有辅助信息的时间序列，外部时间序列用于辅助时间序列预测模型对主时间序列的预测。外部时间序列中的外部指标取值是指在外部时间序列中所包括的数值大小，举例说明，某一个外部时间序列为(x₁,x₂,...,x_t,...,x_T-1)，x_t表示在第t个历史时刻对应的外部指标取值。

在本发明实施例中，获取到至少一个外部时间序列之后，对于每个历史时刻都可以对外部时间序列进行特征信息的提取，则每个历史时刻提取到的特征信息取值可以构成特征信息序列，该特征信息序列的长度为T-1。本发明实施例中，若获取到外部时间序列为至少两个时，将至少两个外部时间序列在某一个历史时刻同时进行特征提取，从而特征信息序列，该特征信息序列中包括了多个外部时间序列的特征，该特征信息序列中的组成元素表达了多个外部时间序列之间的交互信息。举例说明，本发明实施例先对多组外部时间序列的以往记录提取出卷积神经网络特征，这些卷积神经网络特征构成了特征信息序列，通过该特征信息序列中的组成元素可以表示多个外部时间序列之间的交互信息。

在本发明的一些实施例中，步骤102对至少一个外部时间序列在T-1个历史时刻分别进行特征信息的提取，包括：

使用特征提取模型对外部时间序列中的第t个外部指标取值进行特征信息的提取，得到在第t个历史时刻提取到的特征信息取值，t∈[1,T-1]。

其中，至少两个外部时间序列在不同历史时刻的外部指标取值可以使用特征提取模型进行特征提取，例如m个外部时间序列中的第t个外部指标取值可以使用特征提取模型进行特征信息的提取，得到在第t个历史时刻提取到的特征信息取值，其中t可以表示小于或等于T-1的任意一个历史时刻。需要说明的是，本发明实施例中使用的特征提取模型可以有多种，基于不同的特征提取模型可以提取到不同类型的特征，举例说明如下，该特征提取模型具体可以是卷积神经网络(Convolutional Neural Network,CNN)模型，则使用特征提取模型所提取到的特征信息可以是卷积神经网络特征，通过提取到的特征信息可以获得不同外部时间序列之间的交互信息，本发明实施例中还可以采用机器学习算法中具有特征提取功能的其它算法模型，此处不做限定。

102、分别获取特征信息序列在K个语义层上的特征表达信息，得到长度为T-1的表达信息序列，K为大于或等于2的正整数。

在本发明实施例中，获取到特征信息序列之后，可以将该特征信息序列进行多个语义层的表达，获取到特征信息序列在多个语义层上的特征表达信息，例如用于K表示语义层的个数，K为大于或等于2的正整数。在T-1个历史时刻分别对应的K个语义层上的表达信息取值可以构成表达信息序列，该表达信息序列是特征信息序列在不同语义层的特征表达。通过对特征信息序列在多个语义层上的特征表达，可以确定出在多个语义层上的表达信息。

在本发明的一些实施例中，步骤102分别获取特征信息序列在K个语义层上的特征表达信息，包括：

结合特征信息序列中的第t个特征信息取值和在第k-1个语义层上的表达信息取值，使用表达信息预测模型对特征信息序列在第k个语义层上的特征表达信息进行预测，得到在第k个语义层上的表达信息取值，k∈[1,K]。

其中，本发明实施例中可以使用表达信息预测模型来预测特征表达，本发明实施例中使用的表达信息预测模型可以是用于预测输出的多种模型，例如该表达信息预测模型具体可以是高速循环神经网络模型，后续实施例中将该高速循环神经网络的英文名称为Recurrent High Networks，简称为RHN。本发明实施例中还可以采用机器学习算法中具有预测功能的其它算法模型，此处不做限定。

例如，首先通过表达信息预测模型获取到在第k-1个语义层上的表达信息取值，从特征信息序列中获取到第t个特征信息取值。使用特征信息序列中的第t个特征信息取值和在第k-1个语义层上的表达信息取值，通过表达信息预测模型进行表达信息的预测，其中，在第k个语义层上的表达信息取值具体可以是第t个历史时刻在第k个语义层上的表达信息取值，对于第k个语义层上的表达信息取值的具体计算过程由使用的表达信息预测模型来确定，后续实施例中对表达信息取值的计算过程进行举例说明。

103、使用分层注意力机制，从表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列。

在本发明实施例中，表达信息序列包括了在T-1个历史时刻分别对应的K个语义层上的表达信息取值，则在每个语义层上可以使用注意力机制筛选出特征相关信息，因此在K个语义层上可以筛选出K个特征相关信息，由于K个语义层上都使用了注意力机制，本发明实施例中不同语义层上的注意力机制称为分层注意力机制，这里的分层指的是在不同的语义层上。本发明实施例中使用分层注意力机制从表达信息序列中逐层筛选出每个语义层对应的特征相关信息，可以得到相关信息序列，该相关信息序列包括有在K个语义层上的相关信息取值，因此通过该相关信息序列可以描述出多组外部时间序列之间的相关性。

在本发明的一些实施例中，每个语义层上单独使用注意力机制，以第k个语义层的注意力机制的执行过程为例进行说明，步骤104使用分层注意力机制，从表达信息序列中逐层筛选出与主时间序列相关的相关信息序列，包括：

获取时间序列预测模型输出的在第t-1个历史时刻对应的主时间序列预测值；

结合第t-1个历史时刻对应的主时间序列预测值和第k个语义层对应的表达信息取值，使用第k个语义层的注意力机制筛选出在第t个历史时刻上第k个语义层对应的相关信息取值，t∈[1,T-1]，k∈[1,K]；

将在第t个历史时刻上K个语义层对应的相关信息取值分别作为单独的元素整合在一个向量中；

将T-1个历史时刻分别对应的向量分别作为单独的行向量整合在一个序列中，得到相关信息序列。

其中，首先使用时间序列预测模型输出在第t-1个历史时刻对应的主时间序列预测值，接下来使用第t-1个历史时刻对应的主时间序列预测值和第k个语义层对应的表达信息取值，通过第k个语义层的注意力机制筛选出在第t个历史时刻上第k个语义层对应的相关信息取值，该k具体可以是小于或等于K的任意一个语义层，通过k的取值从1到K的不断变化，可以得到在第t个历史时刻上K个语义层对应的相关信息取值，将这K个语义层对应的相关信息取值组合到一个向量中，可以得到在第t个历史时刻的向量，t可以表示小于或等于T-1的任意一个历史时刻，通过t的取值从1到T-1的不断变化，可以得到T-1个历史时刻分别对应的向量，将T-1个历史时刻分别对应的向量整合在一个序列中，就可以得到相关信息序列。对于在第t个历史时刻上第k个语义层对应的相关信息取值的具体计算过程由使用的分层注意力机制来确定，后续实施例中对相关信息取值的计算过程进行举例说明。

104、结合相关信息序列以及对应历史时刻的主时间序列，使用时间序列预测模型对主时间序列在T时刻的主指标取值进行预测，得到在T时刻的主时间序列预测值。

在本发明实施例中，确定出相关信息序列之后，利用时间序列预测模型对主时间序列的历史时刻对应的主指标取值进行建模，在此过程中将相关信息序列引入到时间序列预测模型中，最后使用时间序列预测模型对主时间序列进行预测，得到在T时刻的主时间序列预测值。本发明实施例中能够有效地从外部时间序列中筛选并且利用相关信息序列，从而使得主时间序列的预测结果更加精准。其中，本发明实施例中使用的时间序列预测模型可以是用于预测输出的多种模型，例如该时间序列预测模型具体可以是高速循环神经网络模型，后续实施例中将该高速循环神经网络简称为“RHN”。本发明实施例中还可以采用机器学习算法中具有预测功能的其它算法模型，此处不做限定。

在本发明实施例中，多组的外部时间序列是包括有辅助信息的序列，该外部时间序列与主时间序列具有相同的时间长度，例如都是长度为T-1的序列。多组外部时间序列之间的交互性和相关性，可以用于时间序列预测模型对主时间序列的预测中。在本发明的一些实施例中，外部时间序列与主时间序列具有相同的指标属性。举例说明，主时间序列是需要预测输出的序列，外部时间序列是含有辅助信息的序列。

例如，需要预测股票A的趋势，那么主时间序列可以是股票A的历史记录，外部时间序列可以是其它一些股票的历史记录，例如外部时间序列可以是股票B、股票C的历史记录，这些股票可能和股票A相关，通过本发明实施例中对股票B、股票C的历史记录进行特征提取、表达信息序列和相关信息序列的处理，可以基于该相关信息序列以及股票A的历史记录，通过时间序列预测模型进行预测，从而可以输出股票A在当前时刻的股票指数预测值。

在本发明的一些实施例中，步骤104结合相关信息序列以及对应历史时刻的主时间序列，使用时间序列预测模型对主时间序列在T时刻的主指标取值进行预测，包括：

根据相关信息序列对主时间序列进行修正，得到修正后的主时间序列；

结合相关信息序列和修正后的主时间序列，使用时间序列预测模型对主时间序列在T时刻的主指标取值进行预测。

其中，相关信息序列用于表示多组外部时间序列之间的相关性，通过相关信息序列对主时间序列进行修正，该相关信息序列可以整合到主时间序列中。修正后的主时间序列可用于时间序列预测模型的输入，结合相关信息序列和修正后的主时间序列，使用时间序列预测模型对主时间序列在T时刻的主指标取值进行预测，对于在T时刻的主指标取值的具体计算过程由使用的时间序列预测模型来确定，后续实施例中对在T时刻的主指标取值的计算过程进行举例说明。

进一步的，在本发明的一些实施例中，接下来对主时间序列的预测过程进行举例说明，结合相关信息序列和修正后的主时间序列，使用时间序列预测模型对主时间序列在T时刻的主指标取值进行预测，包括：

从修正后的主时间序列中获取修正后的第t个历史时刻对应的主指标取值，t∈[1,T-1]；

结合修正后的第t个历史时刻对应的主指标取值和时间序列预测模型输出的在第t个历史时刻上第k-1个语义层对应的主指标取值，使用时间序列预测模型对主时间序列在第t个历史时刻上第k个语义层对应的主指标取值进行预测，得到主时间序列在第t个历史时刻上第k个语义层对应的主指标取值，k∈[1,K]；

根据主时间序列在第t个历史时刻上第k个语义层对应的主指标取值，确定主时间序列在T-1个历史时刻上K个语义层对应的主指标取值；

结合相关信息序列中T-1个历史时刻对应的行向量和主时间序列在T-1个历史时刻上K个语义层对应的主指标取值，使用时间序列预测模型对主时间序列在T时刻的主指标取值进行预测。

其中，相关信息序列对主时间序列进行修正，该相关信息序列可以整合到主时间序列中，以主时间序列中第t个历史时刻对应的主指标取值的计算过程为例，首先从修正后的主时间序列中获取修正后的第t个历史时刻对应的主指标取值。通过时间序列预测模型输出在第t个历史时刻上第k-1个语义层对应的主指标取值，结合修正后的第t个历史时刻对应的主指标取值和在第t个历史时刻上第k-1个语义层对应的主指标取值，使用时间序列预测模型对主时间序列在第t个历史时刻上第k个语义层对应的主指标取值进行预测，从而预测出主时间序列在第t个历史时刻上第k个语义层对应的主指标取值。接下来通过t的取值从1到T-1的不断变化，根据主时间序列在第t个历史时刻上第k个语义层对应的主指标取值，可以得到T-1个历史时刻上K个语义层对应的主指标取值。最后结合相关信息序列中T-1个历史时刻对应的行向量和主时间序列在T-1个历史时刻上K个语义层对应的主指标取值，使用时间序列预测模型对主时间序列在T时刻的主指标取值进行预测。对于在T时刻的主指标取值的具体计算过程由使用的时间序列预测模型来确定，后续实施例中对在T时刻的主指标取值的计算过程进行举例说明。

通过以上实施例对本发明实施例的描述可知，通过对至少一个外部时间序列的特征信息提取，可以得到特征信息序列，然后通过特征信息序列获取到表达信息序列，使用分层注意力机制逐层筛选出与主时间序列相关的相关信息序列，最后结合相关信息序列以及历史时刻的主时间序列，使用时间序列预测模型可以得到在当前时刻的主时间序列预测值。本发明实施例中能够基于外部时间序列获取到相关信息序列，使用时间序列预测模型可以对主时间序列进行预测，由于本发明实施例中充分利用了外部时间序列的交互性和相关性，因此可以更为精准的获取到主时间序列预测值。

本发明实施例还提供一种数据预测方法，主要包括如下步骤：

步骤1、获取数据源，数据源包括对应多个历史时刻的主时间序列以及对应所述历史时刻的至少一个外部时间序列。

其中，在不同的数据预测场景下，该数据源具有不同的实现方式，例如该在视频观看人数的预测场景下，该数据源可以是视频数据源。在股票预测场景下，该数据源可以是股票数据源。在应用程序下载量的预测场景下，该数据源可以是应用程序数据源。对于外部时间序列的个数说明以及主时间序列的说明，详见前述实施例中的描述。

步骤2、将至少一个外部时间序列输入到第一模型，获得外部时间序列在多个历史时刻的表达信息序列。

其中，本发明实施例中的第一模型具体可以是特征提取模型，例如可以是卷积神经网络特征提取模型，对于表达信息序列的说明，详见前述实施例中的描述。

在本发明的一些实施例中，步骤2将至少一个外部时间序列输入到第一模型，获得外部时间序列在多个历史时刻的表达信息序列，包括：

将外部时间序列输入到第一模型，通过第一模型提取出特征信息序列；

分别获取特征信息序列在多个语义层上的特征表达信息，得到表达信息序列。

对于此处实施例的执行过程，可以详见前述实施例中步骤101和步骤102的实现过程。

步骤3、使用分层注意力机制，从表达信息序列中逐层筛选出与主时间序列相关的相关信息序列。

在本发明实施例中，表达信息序列包括了在多个历史时刻分别对应的多个语义层上的表达信息取值，则在每个语义层上可以使用注意力机制筛选出特征相关信息，因此在多个语义层上可以筛选出多个特征相关信息，多个语义层上都使用了注意力机制，本发明实施例中不同语义层上的注意力机制称为分层注意力机制。步骤3的执行过程详见前述实施例中步骤103的描述。

步骤4、将相关信息序列以及对应历史时刻的主时间序列输入到第二模型，并通过第二模型预测主时间序列在当前时刻的主时间序列预测值。

其中，第二模型具体为前述实施例中的时间序列预测模型，该第二模型的预测过程可以详见前述实施例中的步骤104。

在本发明的一些实施例中，步骤4将相关信息序列以及对应历史时刻的主时间序列输入到第二模型，并通过第二模型预测主时间序列在当前时刻的主时间序列预测值，包括：

将相关信息序列和修正后的主时间序列输入到第二模型，通过第二模型预测主时间序列在当前时刻的主时间序列预测值。

其中，相关信息序列用于表示多组外部时间序列之间的相关性，通过相关信息序列对主时间序列进行修正，该相关信息序列可以整合到主时间序列中。修正后的主时间序列可用于时间序列预测模型的输入，结合相关信息序列和修正后的主时间序列，使用时间序列预测模型对主时间序列在当前时刻的主指标取值进行预测，对于在当前时刻的主指标取值的具体计算过程由使用的时间序列预测模型来确定。

接下来，针对前述实施例中的数据预测方法，以视频观看人数的预测场景下的应用为例进行说明。首先，获取视频数据源，例如视频数据源包括：至少两个外部时间序列和主时间序列，该外部时间序列具体可以代表视频图像数据，也可以代表视频评论内容，该主时间序列是该视频源在多个历史时刻的观看人数数据。将该外部时间序列输入到卷积神经网络模型中，获得外部时间序列在多个历史时刻的表达信息序列，该表达信息序列表示了多个外部时间序列在不同语义层上的特征表达，例如该表达信息序列涵盖了视频图像的像素特征、图像人物特征、评论内容的字数长短特征、正负面评论特征等，在不同场景下该表达信息序列所表示不同的特征，此处仅作说明。接下来使用分层注意力机制，从表达信息序列中逐层筛选出对应于至少两个语义层的相关信息序列，该相关信息序列可以认为是与主时间序列最相关的特征向量。例如，在本实施例中，使用分层注意力机制，筛选出图像人物的姓名(例如某个明星)以及正面评论内容作为所述相关信息序列，并认为该图像人物的姓名以及正面评论内容是跟视频观看人数最相关的特征。同时，会将这些特征与对应历史时刻的观看人数数据进行结合，得到组合的信息。最后，将组合的相关信息序列以及对应历史时刻的主时间序列输入到高速循环神经网络模型，并通过高速循环神经网络模型预测主时间序列在当前时刻的主时间序列预测值，通过该高速循环神经网络模型可以预测出视频在当前时刻的观看人数预测值，通过该视频在当前时刻的观看人数预测值可以预测出该视频的热度。

为便于更好的理解和实施本发明实施例的上述方案，下面举例相应的应用场景来进行具体说明。

本发明实施例中可以实现基于具有分层注意力机制的时间序列预测，接下来以时间序列预测模型具体为深度循环神经网络模型为例，本发明实施例中的主时间序列具体是复杂时间序列，例如股票、大盘指数等。本发明实施例主要通过具有分层注意力机制的深度循环神经网络完成主时间序列的预测，能够利用外部时间序列使得预测结果更为精准。具体而言，本发明实施例中先对多组外部时间序列的历史外部指标取值提取出卷积神经网络特征，以获得它们之间的特征信息。然后利用高速循环神经网络模型对外部时间序列的所有特征进行整合，得到表达信息序列，以获得其在不同语义层次上的特征表达。接着，本发明实施例中利用高速循环神经网络模型对主时间序列的历史主指标取值进行建模、整合，在此过程中用分层注意力机制从外部时间序列中逐层筛选出相关信息序列引入到该循环神经网络模型中，该相关信息序列表示了多组外部时间序列之间的最相关的特征。最后使用该高速循环神经网络模型的输出进行预测。本发明实施例中能够有效地从外部时间序列中筛选并且利用最相关的信息，从而使得主时间序列的预测结果更加精准。

本发明实施例提供的时间序列预测方法可以提供时间序列的预测服务，比如对股票和大盘指数进行预测，也能对网络视频、电视在下一时刻的观看人数进行预测。如图2所示，本发明实施例中，使用编码器抽取外部时间序列的特征信息在不同语义层上的特征、对该特征序列进行建模、以及使用分层注意力机制筛选其中的相关信息序列，使用解码器将该相关信息序列整合到主时间序列的建模和预测中。接下来对本发明实施例提供的使用分层注意力机制的时间序列的预测过程进行举例说明，主要包括如下过程：

步骤1、外部时间序列的建模和特征提取。

其中，对于长度为T-1的多组外部时间序列，在每一时刻对其用卷积神经网络模型进行特征提取，图2中某一个外部时间序列为

(x₁,x₂,...,x_t,...,x_T-1)，x_t表示在第t个历史时刻对应的外部指标取值，图2中卷积神经网络模型用CNN来表示。可以获得这些特征组成的特征信息序列w_t∈R^m，其中，R^m表示m维欧式空间，t∈[1,T-1]。

步骤2、用高速循环神经网络模型对该特征信息序列进行建模，获得其在K个语义层上表达的表达信息序列：

其中t∈[1,T-1]，k∈[1,K]。

其中，图2中高速循环神经网络模型用RHN来表示。本发明实施例中使用的建模和特征提取方案可以基于高速循环神经网络模型，在对特征信息序列建模过程中利用高速神经网络的多层结构获取数据在不同语义层的特征表达，得到长度为T-1的表达信息序列。例如，一个K层的高速循环神经网络的任意层k可具体表示为：

具体的，W_G,W_R,W_c∈R^l×m、V_Gk,V_Rk,V_ck∈R^l×l和b_Gk,b_Rk,b_ck∈R^l为需要学习的参数，具体可以结合高速循环神经网络的算法来确定各个参数的取值，此处不再赘述。tanh为激活函数，Ⅱ_{k＝1}为指示函数，如果k＝1，那么Ⅱ_{k＝1}的值为1，否则为0。

表示在第t个历史时刻上第k-1个语义层对应的表达信息取值。

步骤3、使用分层注意力机制逐层筛选出最有效的相关信息d_t，其中t∈[1,T-1]。

其中，分层注意力机制就是每一层都使用注意力机制寻找和任务最相关的信息。在基于高速循环神经网络提取的表达信息的基础之上，使用分层注意力机制筛选出其中最相关的信息。具体地，给定解码器中的高速循环神经网络在t-1时刻的输出

对于第k个语义层特征/>

计算其权重如下：

其中，

V_K,∈R^l，T_K∈R^l×l，U_K∈R^l×l是需要学习的参数，具体可以结合注意力机制的算法来确定各个参数的取值，此处不再赘述。

然后，将各个时刻的特征按上述权重加权平均后得到新的特征向量：

将K层中的上述特征向量拼接到一起，得到最相关的特征向量d_t：

最后将d_t整合到主时间序列中，作为主时间序列的高速循环神经网络模型的输入。

其中，

为需要学习的参数。具体可以结合高速循环神经网络的算法来确定各个参数的取值，此处不再赘述。

步骤4、结合筛选出来的相关信息序列，使用高速循环神经网络模型对主时间序列进行建模和预测，其中，主时间序列为y_t∈R^d，t∈[1,T-1]。

对于整合了外部时间序列相关信息的新的主时间序列

其中，/>

t∈[1,T-1]，采用高速循环神经网络模型对其进行建模：

其中，

最后，本发明实施例中可以用以下线性函数进行预测：

其中，W∈R^d×p、V∈R^d×Kl、b∈R^d为需要学习的参数。

本实施例中主要利用卷积神经网络和高速循环网络获得外部时间序列的特征信息在不同语义层上的表达，然后用注意力机制逐层筛选出其中最有效的相关信息整合到主时间序列中，从而使得预测更加精准。另外，本发明不需要利用外部序列在当前时刻的值，因此具有更加广泛的应用场景。本发明实施例能够对复杂的主时间序列进行预测，由于能更好地利用外部时间序列，因此本发明实施例相比于现有方法更为精准，可用于股票预测，视频观看人数预测等，具有潜在的经济效益。需要说明的是，本发明实施例中除了上述说明的时间序列预测方法，还可以使用其它的分层注意力机制，此处不再逐一举例说明。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

为便于更好的实施本发明实施例的上述方案，下面还提供用于实施上述方案的相关装置。

请参阅图3-a所示，本发明实施例提供的一种时间序列的预测装置300，可以包括：特征信息提取模块301、表达信息获取模块302、筛选模块303、预测模块304，其中，

特征信息提取模块301，用于对至少一个外部时间序列在T-1个历史时刻分别进行特征信息的提取，得到长度为T-1的特征信息序列，其中，所述外部时间序列与待预测的主时间序列相关联，且所述T为大于或等于2的正整数；

表达信息获取模块302，用于分别获取所述特征信息序列在K个语义层上的特征表达信息，得到长度为T-1的表达信息序列，所述K为大于或等于2的正整数；

筛选模块303，用于使用分层注意力机制，从所述表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列；

预测模块304，用于结合所述相关信息序列以及对应历史时刻的所述主时间序列，使用时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测，得到在T时刻的主时间序列预测值。

在本发明的一些实施例中，如图3-b所示，所述预测模块304，包括：

修正单元3041，用于根据所述相关信息序列对所述主时间序列进行修正，得到修正后的主时间序列；以及，

预测单元3042，用于结合所述相关信息序列和所述修正后的主时间序列，使用所述时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测。

进一步的，在本发明的一些实施例中，请参阅图3-c所示，所述预测模块304，包括：

第一主指标获取单元3043，用于从所述修正后的主时间序列中获取修正后的第t个历史时刻对应的主指标取值，t∈[1,T-1]；

第二主指标获取单元3044，用于结合所述修正后的第t个历史时刻对应的主指标取值和所述时间序列预测模型输出的在第t个历史时刻上第k-1个语义层对应的主指标取值，使用所述时间序列预测模型对所述主时间序列在第t个历史时刻上第k个语义层对应的主指标取值进行预测，得到所述主时间序列在第t个历史时刻上第k个语义层对应的主指标取值，k∈[1,K]；

第三主指标获取单元3045，用于根据所述主时间序列在第t个历史时刻上第k个语义层对应的主指标取值，确定所述主时间序列在T-1个历史时刻上K个语义层对应的主指标取值；

主指标预测单元3046，用于结合所述相关信息序列中T-1个历史时刻对应的行向量和所述主时间序列在T-1个历史时刻上K个语义层对应的主指标取值，使用所述时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测。

在本发明的一些实施例中，请参阅图3-d所示，所述筛选模块303，包括：

历史预测值获取单元3031，用于获取所述时间序列预测模型输出的在第t-1个历史时刻对应的主时间序列预测值；

相关信息筛选单元3032，用于结合所述第t-1个历史时刻对应的主时间序列预测值和第k个语义层对应的表达信息取值，使用第k个语义层的注意力机制筛选出在第t个历史时刻上第k个语义层对应的相关信息取值，t∈[1,T-1]，k∈[1,K]；

相关信息整合单元3033，用于将在第t个历史时刻上K个语义层对应的相关信息取值分别作为单独的元素整合在一个向量中；

向量整合单元3034，用于将T-1个历史时刻分别对应的向量分别作为单独的行向量整合在一个序列中，得到所述相关信息序列。

在本发明的一些实施例中，所述特征信息提取模块301，用于使用特征提取模型对所述外部时间序列中的第t个外部指标取值进行特征信息的提取，得到在第t个历史时刻提取到的特征信息取值，t∈[1,T-1]。

在本发明的一些实施例中，所述表达信息获取模块302，用于结合所述特征信息序列中的第t个特征信息取值和在第k-1个语义层上的表达信息取值，使用表达信息预测模型对所述特征信息序列在第k个语义层上的特征表达信息进行预测，得到在第k个语义层上的表达信息取值，k∈[1,K]。

在本发明的一些实施例中，所述外部时间序列与所述主时间序列具有相同的指标属性。

通过以上对本发明实施例的描述可知，首先通过对至少一个外部时间序列的特征信息提取，可以得到特征信息序列，然后通过特征信息序列获取到表达信息序列，使用分层注意力机制逐层筛选出与主时间序列相关的相关信息序列，最后结合相关信息序列以及历史时刻的主时间序列，使用时间序列预测模型可以得到在当前时刻的主时间序列预测值。本发明实施例中能够基于外部时间序列获取到相关信息序列，使用时间序列预测模型可以对主时间序列进行预测，由于本发明实施例中充分利用了外部时间序列的交互性和相关性，因此可以更为精准的获取到主时间序列预测值。

如图4所示，本发明实施例还提供一种数据预测装置400，包括：

数据源获取模块401，用于获取数据源，所述数据源包括对应多个历史时刻的主时间序列以及对应所述历史时刻的至少一个外部时间序列；

表达信息序列获取模块402，用于将所述至少一个外部时间序列输入到第一模型，获得所述外部时间序列在多个历史时刻的表达信息序列；

筛选模块403，用于使用分层注意力机制，从所述表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列；

预测模块404，用于将所述相关信息序列以及对应历史时刻的所述主时间序列输入到第二模型，并通过所述第二模型预测所述主时间序列在当前时刻的主时间序列预测值。

在本发明的一些实施例中，所述表达信息序列获取模块402，还用于将所述外部时间序列输入到第一模型，通过所述第一模型提取出特征信息序列；分别获取所述特征信息序列在多个语义层上的特征表达信息，得到所述表达信息序列。

图5是本发明实施例提供的一种服务器结构示意图，该服务器1100可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processingunits，CPU)1122(例如，一个或一个以上处理器)和存储器1132，一个或一个以上存储应用程序1142或数据1144的存储介质1130(例如一个或一个以上海量存储设备)。其中，存储器1132和存储介质1130可以是短暂存储或持久存储。存储在存储介质1130的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1122可以设置为与存储介质1130通信，在服务器1100上执行存储介质1130中的一系列指令操作。

服务器1100还可以包括一个或一个以上电源1126，一个或一个以上有线或无线网络接口1150，一个或一个以上输入输出接口1158，和/或，一个或一个以上操作系统1141，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由服务器所执行的时间序列的预测方法或数据预测方法的步骤可以基于该图5所示的服务器结构。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

综上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照上述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对上述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种时间序列的预测方法，其特征在于，应用于视频观看人数的预测场景中，包括：

对至少一个外部时间序列在T-1个历史时刻分别进行特征信息的提取，得到长度为T-1的特征信息序列，其中，所述外部时间序列与待预测的主时间序列相关联，且所述T为大于或等于2的正整数；所述外部时间序列包括视频图像数据或视频评论内容；所述主时间序列包括在多个历史时刻的观看人数数据；

分别获取所述特征信息序列在K个语义层上的特征表达信息，得到长度为T-1的表达信息序列，所述K为大于或等于2的正整数；所述表达信息序列为多个所述外部时间序列在不同语义层上的特征表达；

使用分层注意力机制，从所述表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列；所述相关信息序列为与所述主时间序列最相关的特征向量；以及，

结合所述相关信息序列以及对应历史时刻的所述主时间序列，使用时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测，得到在T时刻的主时间序列预测值；所述在T时刻的主时间序列预测值为T时刻的观看人数预测值。

2.根据权利要求1所述的方法，其特征在于，所述使用时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测，包括：

根据所述相关信息序列对所述主时间序列进行修正，得到修正后的主时间序列；

结合所述相关信息序列和所述修正后的主时间序列，使用所述时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测。

3.根据权利要求2所述的方法，其特征在于，所述结合所述相关信息序列和所述修正后的主时间序列，使用所述时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测，包括：

从所述修正后的主时间序列中获取修正后的第t个历史时刻对应的主指标取值，t∈[1,T-1]；

结合所述修正后的第t个历史时刻对应的主指标取值和所述时间序列预测模型输出的在第t个历史时刻上第k-1个语义层对应的主指标取值，使用所述时间序列预测模型对所述主时间序列在第t个历史时刻上第k个语义层对应的主指标取值进行预测，得到所述主时间序列在第t个历史时刻上第k个语义层对应的主指标取值，k∈[1,K]；

根据所述主时间序列在第t个历史时刻上第k个语义层对应的主指标取值，确定所述主时间序列在T-1个历史时刻上K个语义层对应的主指标取值；

结合所述相关信息序列中T-1个历史时刻对应的行向量和所述主时间序列在T-1个历史时刻上K个语义层对应的主指标取值，使用所述时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测。

4.根据权利要求1所述的方法，其特征在于，所述使用分层注意力机制，从所述表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列，包括：

获取所述时间序列预测模型输出的在第t-1个历史时刻对应的主时间序列预测值；

结合所述第t-1个历史时刻对应的主时间序列预测值和第k个语义层对应的表达信息取值，使用第k个语义层的注意力机制筛选出在第t个历史时刻上第k个语义层对应的相关信息取值，t∈[1,T-1]，k∈[1,K]；

将T-1个历史时刻分别对应的向量分别作为单独的行向量整合在一个序列中，得到所述相关信息序列。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述对至少一个外部时间序列在T-1个历史时刻分别进行特征信息的提取，包括：

使用特征提取模型对所述外部时间序列中的第t个外部指标取值进行特征信息的提取，得到在第t个历史时刻提取到的特征信息取值，t∈[1,T-1]。

6.根据权利要求1至4中任一项所述的方法，其特征在于，所述分别获取所述特征信息序列在K个语义层上的特征表达信息，包括：

结合所述特征信息序列中的第t个特征信息取值和在第k-1个语义层上的表达信息取值，使用表达信息预测模型对所述特征信息序列在第k个语义层上的特征表达信息进行预测，得到在第k个语义层上的表达信息取值，k∈[1,K]。

7.一种数据预测方法，其特征在于，应用于视频观看人数的预测场景中，包括：

获取数据源，所述数据源包括对应多个历史时刻的主时间序列以及对应所述历史时刻的至少一个外部时间序列；所述外部时间序列包括视频图像数据或视频评论内容；所述主时间序列包括在多个历史时刻的观看人数数据；

将所述至少一个外部时间序列输入到第一模型，获得所述外部时间序列在多个历史时刻的表达信息序列；所述表达信息序列为多个所述外部时间序列在不同语义层上的特征表达；

使用分层注意力机制，从所述表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列；所述相关信息序列为与所述主时间序列最相关的特征向量；以及

将所述相关信息序列以及对应历史时刻的所述主时间序列输入到第二模型，并通过所述第二模型预测所述主时间序列在当前时刻的主时间序列预测值；所述在当前时刻的主时间序列预测值为当前时刻的观看人数预测值。

8.根据权利要求7所述的方法，其特征在于，所述将所述至少一个外部时间序列输入到第一模型，获得所述外部时间序列在多个历史时刻的表达信息序列，包括：

将所述外部时间序列输入到第一模型，通过所述第一模型提取出特征信息序列；

分别获取所述特征信息序列在多个语义层上的特征表达信息，得到所述表达信息序列。

9.根据权利要求7所述的方法，其特征在于，所述将所述相关信息序列以及对应历史时刻的所述主时间序列输入到第二模型，并通过所述第二模型预测所述主时间序列在当前时刻的主时间序列预测值，包括：

将所述相关信息序列和所述修正后的主时间序列输入到所述第二模型，通过所述第二模型预测所述主时间序列在当前时刻的主时间序列预测值。

10.一种时间序列的预测装置，其特征在于，应用于视频观看人数的预测场景中，包括：

特征信息提取模块，用于对至少一个外部时间序列在T-1个历史时刻分别进行特征信息的提取，得到长度为T-1的特征信息序列，其中，所述外部时间序列与待预测的主时间序列相关联，且所述T为大于或等于2的正整数；所述外部时间序列包括视频图像数据或视频评论内容；所述主时间序列包括在多个历史时刻的观看人数数据；

表达信息获取模块，用于分别获取所述特征信息序列在K个语义层上的特征表达信息，得到长度为T-1的表达信息序列，所述K为大于或等于2的正整数；所述表达信息序列为多个所述外部时间序列在不同语义层上的特征表达；

筛选模块，用于使用分层注意力机制，从所述表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列；所述相关信息序列为与所述主时间序列最相关的特征向量；以及，

预测模块，用于结合所述相关信息序列以及对应历史时刻的所述主时间序列，使用时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测，得到在T时刻的主时间序列预测值；所述在T时刻的主时间序列预测值为T时刻的观看人数预测值。

11.根据权利要求10所述的装置，其特征在于，所述预测模块包括：

修正单元，用于根据所述相关信息序列对所述主时间序列进行修正，得到修正后的主时间序列；以及，

预测单元，用于结合所述相关信息序列和所述修正后的主时间序列，使用所述时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测。

12.根据权利要求11所述的装置，其特征在于，所述预测模块包括：

第一主指标获取单元，用于从所述修正后的主时间序列中获取修正后的第t个历史时刻对应的主指标取值，t∈[1,T-1]；

第二主指标获取单元，用于结合所述修正后的第t个历史时刻对应的主指标取值和所述时间序列预测模型输出的在第t个历史时刻上第k-1个语义层对应的主指标取值，使用所述时间序列预测模型对所述主时间序列在第t个历史时刻上第k个语义层对应的主指标取值进行预测，得到所述主时间序列在第t个历史时刻上第k个语义层对应的主指标取值，k∈[1,K]；

第三主指标获取单元，用于根据所述主时间序列在第t个历史时刻上第k个语义层对应的主指标取值，确定所述主时间序列在T-1个历史时刻上K个语义层对应的主指标取值；

主指标预测单元，用于结合所述相关信息序列中T-1个历史时刻对应的行向量和所述主时间序列在T-1个历史时刻上K个语义层对应的主指标取值，使用所述时间序列预测模型对所述主时间序列在T时刻的主指标取值进行预测。

13.一种数据预测装置，其特征在于，应用于视频观看人数的预测场景中，包括：

数据源获取模块，用于获取数据源，所述数据源包括对应多个历史时刻的主时间序列以及对应所述历史时刻的至少一个外部时间序列；所述外部时间序列包括视频图像数据或视频评论内容；所述主时间序列包括在多个历史时刻的观看人数数据；

表达信息序列获取模块，用于将所述至少一个外部时间序列输入到第一模型，获得所述外部时间序列在多个历史时刻的表达信息序列；所述表达信息序列为多个所述外部时间序列在不同语义层上的特征表达；

筛选模块，用于使用分层注意力机制，从所述表达信息序列中逐层筛选出与所述主时间序列相关的相关信息序列；所述相关信息序列为与所述主时间序列最相关的特征向量；

预测模块，用于将所述相关信息序列以及对应历史时刻的所述主时间序列输入到第二模型，并通过所述第二模型预测所述主时间序列在当前时刻的主时间序列预测值；所述在当前时刻的主时间序列预测值为当前时刻的观看人数预测值。

14.根据权利要求13所述的装置，其特征在于，所述表达信息序列获取模块还用于将所述外部时间序列输入到第一模型，通过所述第一模型提取出特征信息序列；以及分别获取所述特征信息序列在多个语义层上的特征表达信息，得到所述表达信息序列。

15.一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如权利要求1至6、或7至9中任一项所述的方法。