CN111222051B

CN111222051B - 一种趋势预测模型的训练方法及装置

Info

Publication number: CN111222051B
Application number: CN202010047480.2A
Authority: CN
Inventors: 郑婉腾; 林伟翔
Original assignee: Shenzhen Huahai Tongchuang Technology Co ltd
Current assignee: Shenzhen Huahai Tongchuang Technology Co ltd
Priority date: 2020-01-16
Filing date: 2020-01-16
Publication date: 2023-09-12
Anticipated expiration: 2040-01-16
Also published as: CN111222051A

Abstract

本申请适用于计算机技术领域，提供了一种趋势预测模型的训练方法，包括：获取预设时间段内的新闻关键词对应的词向量信息和影响力特征信息、并且获取所述预设时间段对应的趋势标签；获取新闻特征信息；所述新闻特征信息基于所述词向量信息和所述影响力特征信息生成；基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练，得到用于输出趋势信息的趋势预测模型；在训练过程中，所述趋势预测模型的输入为所述新闻特征信息；所述趋势预测模型的输出为所述新闻特征信息对应的趋势信息。上述方法，将新闻文本转换成词向量信息，基于词向量信息和影响力特征信息生成新闻特征信息，将新闻特征信息及其对应的趋势标签作为训练样本，训练得到用于输出趋势信息的趋势预测模型，从而可以对新闻数据的趋势进行预测，提高新闻数据的分析效率。

Description

一种趋势预测模型的训练方法及装置

技术领域

本申请属于计算机技术领域，尤其涉及一种趋势预测模型的训练方法及装置。

背景技术

随着互联网行业的发展，用户除了通过传统媒体获取新闻还可以通过很多新形式的媒体来获取新闻，例如，新闻客户端、网页、微博等等。由于用户获取到的新闻数据的数量过大，对于新闻数据的分析以及趋势的预测就十分必要。但是，现有的对于新闻数据的分析方法只能获取到已经发生的新闻数据对应的趋势，无法对趋势进行预测，得到的分析结果不具有前瞻性，新闻数据的分析效率低。

发明内容

本申请实施例提供了一种趋势预测模型的训练方法及装置，可以解决现有的对于新闻数据的分析方法只能获取到已经发生的新闻数据对应的趋势，无法对趋势进行预测，得到的分析结果不具有前瞻性，新闻数据的分析效率低的问题。

第一方面，本申请实施例提供了一种方法，包括：

获取预设时间段内的新闻关键词对应的词向量信息和影响力特征信息、并且获取所述预设时间段对应的趋势标签；

获取新闻特征信息；所述新闻特征信息基于所述词向量信息和所述影响力特征信息生成；

基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练，得到用于输出趋势信息的趋势预测模型；在训练过程中，所述趋势预测模型的输入为所述新闻特征信息；所述趋势预测模型的标注为所述预设时间段对应的趋势标签；所述趋势预测模型的输出为所述预测趋势信息。

进一步地，获取预设时间段内的新闻关键词对应的影响力特征信息，包括：

基于所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻，生成预设时间段内的新闻关键词对应的影响力特征信息。

进一步地，所述基于所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻，生成预设时间段内的新闻关键词对应的影响力特征信息，包括：

基于第一影响力特征计算策略、所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻，生成预设时间段内的新闻关键词对应的影响力特征信息；所述第一影响力特征计算策略为：

影响力特征信息＝1/(T-t_i)^α

其中，α为可调整参数，t_i为新闻发布时刻，T为结束时刻。

基于第二影响力特征计算策略、所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻，生成预设时间段内的新闻关键词对应的影响力特征信息；所述第二影响力特征计算策略为：

其中，α为可调整参数，t_i为新闻发布时刻，T为结束时刻。

进一步地，获取预设时间段内的新闻关键词对应的词向量信息，包括：

获取预设时间段内的新闻关键词；

从预设词向量库中获取所述新闻关键词对应的词向量；

基于所述词向量生成所述词向量信息。

进一步地，所述词向量信息包括所有所述词向量的集合或者所有所述词向量的平均向量。

进一步地，在所述从预设词向量库中获取所述新闻关键词对应的词向量之前，还包括：

获取历史新闻数据中的预设新闻关键词；

将所述预设新闻关键词输入预设词向量获取模型进行处理，得到所述预设新闻关键词对应的词向量；

基于所述预设新闻关键词及其对应的词向量生成预设词向量库。

进一步地，所述基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练，得到用于输出趋势信息的趋势预测模型，包括：

将每个所述新闻特征信息输入所述深度神经网络进行处理，得到计算趋势信息；

使用预设的损失函数评估每个所述新闻特征信息对应的计算趋势信息与趋势标签之间的差异度；

当所述差异度大于预设的差异度阈值时，调整所述深度学习网络的模型参数，并返回执行所述将每个所述新闻特征信息输入深度学习网络进行处理，得到计算趋势信息；

得到所述趋势预测模型。

第二方面，本申请实施例提供了一种趋势预测的方法，包括：

当检测到趋势预测指令时，获取目标新闻特征信息；所述新闻特征信息基于目标新闻关键词对应的词向量信息和影响力特征信息生成；

将所述目标新闻特征信息输入趋势预测模型，得到所述目标新闻特征信息对应的趋势信息。

第三方面，本申请实施例提供了一种趋势预测模型的训练装置，包括：

第一获取单元，用于获取预设时间段内的新闻关键词对应的词向量信息和影响力特征信息、并且获取所述预设时间段对应的趋势标签；

第二获取单元，用于获取新闻特征信息；所述新闻特征信息基于所述词向量信息和所述影响力特征信息生成；

第一处理单元，用于基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练，得到用于输出趋势信息的趋势预测模型；在训练过程中，所述趋势预测模型的输入为所述新闻特征信息；所述趋势预测模型的标注为所述预设时间段对应的趋势标签；所述趋势预测模型的输出为所述预测趋势信息。

进一步地，所述第一获取单元，具体用于：

影响力特征信息＝1/(T-t_i)^α

其中，α为可调整参数，t_i为新闻发布时刻，T为结束时刻。

进一步地，所述第一获取单元，具体用于：

其中，α为可调整参数，t_i为新闻发布时刻，T为结束时刻。

进一步地，所述第一获取单元，包括：

第三获取单元，用于获取预设时间段内的新闻关键词；

第四获取单元，用于从预设词向量库中获取所述新闻关键词对应的词向量；

生成单元，用于基于所述词向量生成所述词向量信息。

进一步地，所述第一获取单元，还用于：

获取历史新闻数据中的预设新闻关键词；

进一步地，所述第一处理单元，具体用于：

得到所述趋势预测模型。

第四方面，本申请实施例提供了一种趋势预测的装置，包括：

获取单元，用于当检测到趋势预测指令时，获取目标新闻特征信息；所述新闻特征信息基于目标新闻关键词对应的词向量信息和影响力特征信息生成；

处理单元，用于将所述目标新闻特征信息输入趋势预测模型，得到所述目标新闻特征信息对应的趋势信息。

第五方面，本申请实施例提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面或第二方面所述的方法。

第六方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面或第二方面所述的方法。

本申请实施例中，获取预设时间段内的新闻关键词对应的词向量信息和影响力特征信息、并且获取所述预设时间段对应的趋势标签；获取新闻特征信息；所述新闻特征信息基于所述词向量信息和所述影响力特征信息生成；基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练，得到用于输出趋势信息的趋势预测模型；在训练过程中，所述趋势预测模型的输入为所述新闻特征信息；所述趋势预测模型的输出为所述新闻特征信息对应的趋势信息。上述方法，将新闻文本转换成词向量信息，同时考虑新闻的发布顺序，基于词向量信息和影响力特征信息生成新闻特征信息，将新闻特征信息及其对应的趋势标签作为训练样本，训练得到用于输出趋势信息的趋势预测模型，从而可以对新闻数据的趋势进行预测，提高新闻数据的分析效率。

另一方面，当检测到趋势获取指令时，获取目标新闻特征信息；将所述目标新闻特征信息输入趋势预测模型，得到所述目标新闻特征信息对应的趋势信息。上述方法，将新闻文本转换成词向量信息，将目标新闻特征信息输入至趋势预测模型，趋势预测模型的训练样本为新闻特征信息及其对应的趋势标签，从而实现可以对新闻数据的趋势进行预测，提高新闻数据的分析效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请第一实施例提供的一种趋势预测模型的训练方法的示意流程图；

图2是本申请第一实施例提供的一种趋势预测模型的训练方法中S104细化的示意流程图；

图3是本申请第二实施例提供的另一种趋势预测模型的训练方法的示意流程图；

图4是本申请第三实施例提供的另一种趋势预测模型的训练方法的示意流程图；

图5是本申请第四实施例提供的一种趋势预测的方法的示意流程图；

图6是本申请第四实施例提供的趋势预测模型的训练装置的示意图；

图7是本申请第五实施例提供的趋势预测的装置的示意图；

图8是本申请第六实施例提供的趋势预测模型的训练设备的示意图；

图9是本申请第七实施例提供的趋势预测的设备的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

请参见图1，图1是本申请第一实施例提供的一种趋势预测模型的训练方法的示意流程图。本实施例中一种趋势预测模型的训练方法的执行主体为具有趋势预测模型的训练功能的设备，设备包括但不限于台式电脑、机器人、服务器等。如图1所示的趋势预测模型的训练方法可包括：

S101：获取预设时间段内的新闻关键词对应的词向量信息和影响力特征信息、并且获取所述预设时间段对应的趋势标签。

在本实施例中，获取预设时间段内的新闻关键词对应的词向量信息和影响力特征信息、并且获取所述预设时间段对应的趋势标签。其中，预设时间段可以任意时间段，例如一个月、一年、一个星期等等；预设时间段内的新闻关键词为在这一时间段内的原始新闻数据对应的新闻关键词；词向量信息为新闻关键词的向量形式，即将新闻关键词的文本转换成向量数值，例如，一篇新闻有三个关键词，它们的词向量信息分别为[3,0,3,0],[0,3,3,0],[0,-3,3,0]；影响力特征信息标识新闻关键词的影响力，主要影响因素是新闻关键词对应的新闻发布的时间以及预测趋势的时间点；预设时间段对应的趋势标签为在预设时间段内的基于新闻数据预测的趋势，例如，在预设时间段内，三个词向量信息[3,0,3,0],[0,3,3,0],[0,-3,3,0]对应的预测的趋势信息可以为“下降”或者“上升”。

其中，词向量的长度和方向本身可以没有意义，词向量之间的位置关系标识了词与词之间的关系度，两个向量在空间之中的夹角越小则两个词的关系度越高，A和B两个向量的差与C和D两个向量的差很接近，则说明A和B的差别与C和D的差别很接近，举例来说，男与女的向量差就与父和母的向量差很接近。

因此，同一个词得到的最后的词嵌入向量完全可能不同。

预设时间段内的新闻关键词对应的词向量信息和影响力特征信息、所述词向量信息对应的趋势标签可以由设备直接获取已经打包好的数据，也可以由设备基于原始新闻数据进行处理获取。

设备获取原始新闻数据，新闻数据可以是从开源数据库、区块链媒体网站获得新闻历史数据，从虚拟货币交易所获得市场价格历史数据。历史新闻数据库的数据来源包括：开源历史新闻数据集，包括搜狐开源新闻数据集，雅虎开源新闻数据集，kaggle新闻数据集；知名区块链新闻媒体的历史新闻数据：中文媒体如金色财经、巴比特、币世界等，英文媒体如The Bitcoin News，Bit coinist.com，Coindesk等。当然获取新闻数据的途径也不仅仅自行抓取这种方式，可以直接获取已经打包成型的新闻数据包而不是自行抓取。

进一步的，为了进一步更准确的获取到新闻关键词对应的影响力特征信息，S101中获取预设时间段内的新闻关键词对应的影响力特征信息可以包括：基于所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻，生成预设时间段内的新闻关键词对应的影响力特征信息。

设备从原始新闻数据中可以获取到新闻关键词对应的新闻发布时刻和预设时间段对应的结束时刻，其中，预设时间段对应的结束时刻即为生成市场趋势标签的时刻。例如，设备可以获取到新闻关键词对应的新闻的发布时刻为2019/12/1 19:00:20，以及预设时间段对应的结束时刻，即生成市场趋势标签的时刻为2019/12/1 19:05:00。设备基于新闻发布时刻和结束时刻，生成预设时间段内的新闻关键词对应的影响力特征信息。

一种实施方式中，设备基于第一影响力特征计算策略、所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻，生成预设时间段内的新闻关键词对应的影响力特征信息；所述第一影响力特征计算策略为：

影响力特征信息＝1/(T-t_i)^α

设备基于新闻发布时刻和结束时刻生成预设时间段内的新闻关键词对应的影响力特征信息可以通过1/(T-t_i)^α函数来计算，其中，α为可调整参数，α数值越大代表时间较久的新闻对当前市场的影响力越低，t_i为新闻发布时刻，T为结束时刻。例如，发布时刻为2019/12/1 19:00:20，结束时刻为2019/12/1 19:05:00，α为1，则影响力特征信息为1/280≈0.00357。

另一种实施方式中，基于第二影响力特征计算策略、所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻，生成预设时间段内的新闻关键词对应的影响力特征信息；所述第二影响力特征计算策略为：

设备基于新闻发布时刻和结束时刻生成预设时间段内的新闻关键词对应的影响力特征信息可以通过函数来计算，其中，α为可调整参数，α数值越大代表时间较久的新闻对当前市场的影响力越低，t_i为新闻发布时刻，T为结束时刻。例如，发布时刻为2019/12/1 19:00:20，结束时刻为2019/12/1 19:05:00，α为0.01，则影响力特征信息为e^-2.8≈0.0608。

S102：获取新闻特征信息；所述新闻特征信息基于所述词向量信息和所述影响力特征信息生成。

设备获取新闻特征信息，新闻特征信息基于所述词向量信息和所述影响力特征信息生成。设备基于词向量信息和影响力特征信息，生成新闻特征信息，设备可以将词向量信息和影响力特征信息进行拼接成为一个新的向量，即为新闻特征信息。举例来说，当词向量信息为[1,0,3,0]，影响力特征信息为0.00357时，新闻特征信息为[1,0,1,0,0.00357]。

S103：基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练，得到用于输出趋势信息的趋势预测模型；在训练过程中，所述趋势预测模型的输入为所述新闻特征信息；所述趋势预测模型的标注为所述预设时间段对应的趋势标签；所述趋势预测模型的输出为所述预测趋势信息。

设备可以将新闻特征信息及其对应的趋势标签分成多个批次，从而能够采用不同批次的训练样本进行训练。

设备也可以基于新闻特征信息和趋势标签生成训练集，训练集包括新闻特征信息及其对应的趋势标签。由于新闻特征信息是基于词向量信息和影响力特征信息生成的，词向量信息对应的趋势标签即为新闻特征信息对应的趋势标签，将新闻特征信息和其对应的趋势标签关联存储，形成一个训练样本，训练集有多个训练样本组成。在此对训练样本的数量不做限制，样本训练集中的训练样本的数量，可以根据实际情况进行设置，在一定程度上来说，训练样本集合中的训练样本的数量越多，使用该训练样本集合训练得到的趋势预测模型进行趋势预测时，预测出的结果越准确。

设备基于新闻特征信息及其对应的趋势标签对深度神经网络训练，得到用于输出趋势信息的趋势预测模型，在训练过程中，趋势预测模型的输入为所述新闻特征信息，趋势预测模型的标注为预设时间段对应的趋势标签，趋势预测模型的输出为预测趋势信息，其中，预测趋势信息可以是对应某一个时间段的所有新闻的预测趋势信息，或者是该时间段对应的预测趋势信息。设备可以将新闻特征信息输入深度学习网络进行处理，预测每个新闻特征信息的趋势信息，将获取到的趋势信息与对应的趋势标签进行比较，得到比较结果，通过比较结果对深度学习网络进行调整。

其中，本实施例中的深度神经网络包括但是不限于循环神经网络(RNN)、卷积神经网络(CNN)，长短期记忆网络(LSTM)，双向循环神经网络(bidirectional RNN)，门控循环单元神经网络(GRU)。

进一步地，为了得到预测结果更准确的趋势预测模型，S103可以包括S1031～S1034，如图2所示，S1031～S1034具体如下：

S1031：将每个所述新闻特征信息输入所述深度神经网络进行处理，得到计算趋势信息。

设备可以将每个新闻特征信息输入深度学习网络进行处理，提取新闻特征信息的特征信息，并对新闻特征信息的趋势进行去测，得到新闻特征信息对应的计算趋势信息。

S1032：使用预设的损失函数评估每个所述新闻特征信息对应的计算趋势信息与趋势标签之间的差异度。

在机器学习中，我们希望模型在训练数据上学到的预测数据分布与真实数据分布越相近越好，因此要设置损失函数(loss function)。本实施例中，预设用于评估计算趋势信息与趋势标签之间的差异的损失函数。每个新闻特征信息对应的计算趋势信息与趋势标签之间的差异度用于衡量预测结果的准确度。当计算的到差异度大于预设的差异度阈值时，执行S1033。

S1033：当所述差异度大于预设的差异度阈值时，调整所述深度学习网络的模型参数，并返回执行所述将每个所述新闻特征信息输入深度学习网络进行处理，得到计算趋势信息。

当差异度大于预设的差异度阈值时，判定当前的预测准确度还未达到要求，需要调整深度学习网络的模型参数后，返回执行S1031～S1032。

S1034：得到所述趋势预测模型。

当判定训练符合预期要求，可以结束训练。此时调整模型参数后的深度学习网络经过了大量的样本训练，且其差异度保持在一个较小的范围内，使用该深度学习网络对新闻特征信息进行处理，可以获得较准确的预测结果，得到趋势预测模型。

请参见图3，图3是本申请第二实施例提供的另一种趋势预测模型的训练方法的示意流程图。本实施例中一种趋势预测模型的训练方法的执行主体为具有趋势预测模型的训练功能的设备，设备包括但不限于台式电脑、机器人、服务器等。为了准确的获取预设时间段内的新闻关键词对应的词向量信息，本实施例与第一实施例的区别在于S201～S203，其中，本实施例中S204为第一实施例中的S101中的获取预设时间段内的新闻关键词对应的影响力特征信息，获取所述预设时间段对应的趋势标签，本实施例中的S205～S206与第一实施例中的S102～S103相同，S201～S203为S101中获取预设时间段内的新闻关键词对应的词向量信息的进一步细化。如图3所示，S201～S203具体如下：

S201：获取预设时间段内的新闻关键词。

设备可以从其他设备处直接获取打包好的预设时间段内的新闻关键词，也可以通过对原始新闻数据进行分词处理得到原始新闻数据对应的所有分词，从所有分词中可以通过关键词提取得到预设时间段内的新闻关键词。本实施例中，对分词处理的算法和关键词提取的算法不做限定。

S202：从预设词向量库中获取所述新闻关键词对应的词向量。

设备中预先存储词向量库，预设词向量库中包括预设关键词及其对应的预设词向量。预设词向量库中包括了新闻数据中常用的预设关键词，预设词向量库可以定时更新，丰富预设词向量库。设备获取新闻关键词，基于预设关键词和预设词向量之间的对应关系从预设词向量库中获取新闻关键词对应的词向量。

S203：基于所述词向量生成所述词向量信息。

设备基于词向量生成词向量信息，词向量信息用于标识所有新闻关键词的特征。设备基于所有词向量生成词向量信息，可以对词向量信息进行计算处理，例如，求所有词向量的平均向量作为词向量信息来标识所有新闻关键词的特征。本实施例中，对基于词向量生成词向量信息的方式不做限定。

一种实施方式中，当词向量的数量为至少两个，S204可以包括：获取所有所述词向量的平均向量，作为所述新闻关键词对应的词向量信息。在本实施例中，词向量的数量为至少两个，设备将词向量的平均向量作为新闻关键词对应的词向量信息，可以通过函数确定新闻关键词对应的词向量信息，其中，/>表示词向量的平均指，V_i表示词向量信息。例如，词向量分别为[3,0,3,0]、[0,3,3,0]、[0,-3,3,0]，则词向量信息为[1,0,3,0]。

另一种实施方式中，所述词向量信息为所有所述词向量的集合。在本实施例中，词向量信息包括所有词向量，设备将所有词向量作为新闻关键词对应的词向量信息，例如，词向量分别为[3,0,3,0]、[0,3,3,0]、[0,-3,3,0]，则词向量信息为[[3,0,3,0],[0,3,3,0],[0,-3,3,0]]。

请参见图4，图4是本申请第三实施例提供的另一种趋势预测模型的训练方法的示意流程图。本实施例中一种趋势预测模型的训练方法的执行主体为具有趋势预测模型的训练功能的设备，设备包括但不限于台式电脑、机器人、服务器等。为了建立高质量的预设词向量库，从而准确的获取到新闻关键词的词向量，本实施例与第二实施例的区别在于S302～S304，本实施例中的S301与第二实施例中的S201相同，本实施例中的S305～S309与第二实施例中的S202～S206相同，S302～S304在S305之前执行即可，如图4所示，S302～S304具体如下：

S302：获取历史新闻数据中的预设新闻关键词。

在本实施例中，限定了如何生成预设词向量库。设备获取历史新闻数据，历史新闻数据作为预设词向量库的基础数据，历史新闻数据的获取方式可以参考S101中的具体描述，此处不再赘述。设备获取历史新闻数据中的预设新闻关键词，可以通过对历史新闻数据进行分词处理得到历史新闻数据对应的所有分词，从所有分词中可以通过关键词提取得到预设时间段内的预设新闻关键词。本实施例中，对分词处理的算法和关键词提取的算法不做限定。举例来说，我们通过历史新闻数据可以得到一个小的新闻数据库：

设备对历史新闻数据进行分词处理，并且进行关键词抽取，得到分词与关键词抽取结果：

S303：将所述预设新闻关键词输入预设词向量获取模型进行处理，得到所述预设新闻关键词对应的词向量。

设备中预先设置词向量获取模型，词向量获取模型用于得到预设新闻关键词对应的词向量，设备将预设新闻关键词输入预设词向量获取模型进行处理，得到预设新闻关键词对应的词向量。例如，将S302中的表格得到的关键词抽取结果输入至预设词向量获取模型进行处理，得到所述预设新闻关键词对应的词向量可以为：

/>

S304：基于所述预设新闻关键词及其对应的词向量生成预设词向量库。

设备将预设新闻关键词及其对应的词向量关联存储，生成预设词向量库。

请参见图5，图5是本申请第四实施例提供的一种趋势预测的方法的示意流程图。本实施例中一种趋势预测的方法的执行主体为具有趋势预测功能的设备，设备包括但不限于台式电脑、机器人、服务器等。如图5所示的趋势预测方法可包括：

S401：当检测到趋势预测指令时，获取目标新闻特征信息；所述新闻特征信息基于目标新闻关键词对应的词向量信息和影响力特征信息生成。

设备检测到趋势预测指令时，获取待预测的目标新闻，设备获取目标新闻的目标新闻关键词，并且获取目标新闻关键词的词向量信息和影响力特征信息。基于词向量信息和影响力特征信息生成目标新闻特征信息。本步骤中的相关细节可以参阅上述实施例的相关描述，此处不再赘述。

S402：将所述目标新闻特征信息输入趋势预测模型，得到所述目标新闻特征信息对应的趋势信息。

设备将目标新闻特征信息输入趋势预测模型，得到目标新闻特征信息对应的趋势信息。设备中预先设置趋势预测模型，本实施例中的趋势预测模型即通过上述第一～第三实施例中任一实施例训练得到的趋势预测模型。在训练过程中，将新闻文本转换成词向量信息，同时考虑新闻的发布顺序，基于词向量信息和影响力特征信息生成新闻特征信息，将新闻特征信息及其对应的趋势标签作为训练样本，训练得到用于输出趋势信息的趋势预测模型。

可以理解的是，趋势预测模型可以由设备预先训练好，也可以由其他设备预先训练好后将趋势预测模型对应的文件移植至设备中。具体地，其他设备在训练好深度学习网络时，冻结深度学习网络的模型参数，将冻结后的深度学习网络对应的趋势预测模型文件移植到设备中。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

请参见图6，图6是本申请第四实施例提供的趋势预测模型的训练装置的示意图。包括的各单元用于执行图1～图4对应的实施例中的各步骤。具体请参阅图1～图4各自对应的实施例中的相关描述。为了便于说明，仅示出了与本实施例相关的部分。参见图6，趋势预测模型的训练装置6包括：

第一获取单元610，用于获取预设时间段内的新闻关键词对应的词向量信息和影响力特征信息、并且获取所述预设时间段对应的趋势标签；

第二获取单元620，用于获取新闻特征信息；所述新闻特征信息基于所述词向量信息和所述影响力特征信息生成；

第一处理单元630，用于基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练，得到用于输出趋势信息的趋势预测模型；在训练过程中，所述趋势预测模型的输入为所述新闻特征信息；所述趋势预测模型的标注为所述预设时间段对应的趋势标签；所述趋势预测模型的输出为所述预测趋势信息。

进一步地，第一获取单元610，具体用于：

影响力特征信息＝1/(T-y_i)^α

其中，α为可调整参数，t_i为新闻发布时刻，T为结束时刻。

进一步地，第一获取单元610，具体用于：

其中，α为可调整参数，t_i为新闻发布时刻，T为结束时刻。

进一步地，第一获取单元610，包括：

第三获取单元，用于获取预设时间段内的新闻关键词；

生成单元，用于基于所述词向量生成所述词向量信息。

进一步地，第一获取单元610，还用于：

获取历史新闻数据中的预设新闻关键词；

进一步地，第一处理单元630，具体用于：

得到所述趋势预测模型。

请参见图7，图7是本申请第五实施例提供的趋势预测的装置的示意图。包括的各单元用于执行图5对应的实施例中的各步骤。具体请参阅图5对应的实施例中的相关描述。为了便于说明，仅示出了与本实施例相关的部分。参见图7，趋势预测装置7包括：

获取单元710，用于当检测到趋势预测指令时，获取目标新闻特征信息；所述新闻特征信息基于目标新闻关键词对应的词向量信息和影响力特征信息生成；

处理单元720，用于将所述目标新闻特征信息输入趋势预测模型，得到所述目标新闻特征信息对应的趋势信息。

图8是本申请第六实施例提供的趋势预测模型的训练设备的示意图。如图8所示，该实施例的趋势预测模型的训练设备8包括：处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82，例如支付程序。所述处理器80执行所述计算机程序82时实现上述各个趋势预测模型的训练方法实施例中的步骤，例如图1所示的步骤101至103。或者，所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块/单元的功能，例如图6所示模块610至630的功能。

示例性的，所述计算机程序82可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器81中，并由所述处理器80执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序82在所述支付设备8中的执行过程。例如，所述计算机程序82可以被分割成第一获取单元、第二获取单元、第一处理单元，各单元具体功能如下：

所述趋势预测模型的训练设备可包括，但不仅限于，处理器80、存储器81。本领域技术人员可以理解，图8仅仅是趋势预测模型的训练设备8的示例，并不构成对趋势预测模型的训练设备8的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述趋势预测模型的训练设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器80可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器81可以是所述趋势预测模型的训练设备8的内部存储单元，例如趋势预测模型的训练设备8的硬盘或内存。所述存储器81也可以是所述趋势预测模型的训练设备8的外部存储设备，例如所述趋势预测模型的训练设备8上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述趋势预测模型的训练设备8还可以既包括所述趋势预测模型的训练设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述趋势预测模型的训练设备所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。

图9是本申请第七实施例提供的趋势预测的设备的示意图。如图9所示，该实施例的趋势预测的设备9包括：处理器90、存储器91以及存储在所述存储器91中并可在所述处理器90上运行的计算机程序92，例如趋势预测的程序。所述处理器90执行所述计算机程序92时实现上述各个趋势预测的方法实施例中的步骤，例如图5所示的步骤401至402。或者，所述处理器90执行所述计算机程序92时实现上述各装置实施例中各模块/单元的功能，例如图7所示模块710至720的功能。

示例性的，所述计算机程序92可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器91中，并由所述处理器90执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序92在所述趋势预测的设备9中的执行过程。例如，所述计算机程序92可以被分割成获取单元、处理单元，各单元具体功能如下：

所述趋势预测的设备可包括，但不仅限于，处理器90、存储器91。本领域技术人员可以理解，图9仅仅是趋势预测的设备9的示例，并不构成对趋势预测的设备9的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述趋势预测的设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器90可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器91可以是所述趋势预测的设备9的内部存储单元，例如趋势预测的设备9的硬盘或内存。所述存储器91也可以是所述趋势预测的设备9的外部存储设备，例如所述趋势预测的设备9上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述趋势预测的设备9还可以既包括所述趋势预测的设备9的内部存储单元也包括外部存储设备。所述存储器91用于存储所述计算机程序以及所述趋势预测的设备所需的其他程序和数据。所述存储器91还可以用于暂时地存储已经输出或者将要输出的数据。

需要说明的是，上述装置/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请实施例还提供了一种网络设备，该网络设备包括：至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

本申请实施例提供了一种计算机程序产品，当计算机程序产品在移动终端上运行时，使得移动终端执行时实现可实现上述各个方法实施例中的步骤。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括：能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/网络设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/网络设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种趋势预测模型的训练方法，其特征在于，包括：

基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练，得到用于输出趋势信息的趋势预测模型；在训练过程中，所述趋势预测模型的输入为所述新闻特征信息；所述趋势预测模型的标注为所述预设时间段对应的趋势标签；所述趋势预测模型的输出为预测趋势信息；

所述获取预设时间段内的新闻关键词对应的影响力特征信息，包括：

基于所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻，生成预设时间段内的新闻关键词对应的影响力特征信息；

所述基于所述预设时间段的新闻关键词对应的新闻发布时刻和所述预设时间段对应的结束时刻，生成预设时间段内的新闻关键词对应的影响力特征信息，包括：

影响力特征信息=

其中，α为可调整参数，为新闻发布时刻，T为结束时刻；

所述获取预设时间段内的新闻关键词对应的词向量信息，包括：

获取预设时间段内的新闻关键词；

从预设词向量库中获取所述新闻关键词对应的词向量；

基于所述词向量生成所述词向量信息；

所述词向量信息包括所有所述词向量的集合或者所有所述词向量的平均向量。

2.如权利要求1所述的趋势预测模型的训练方法，其特征在于，所述基于所述新闻特征信息及其对应的趋势标签对深度神经网络训练，得到用于输出趋势信息的趋势预测模型，包括：

当所述差异度大于预设的差异度阈值时，调整所述深度神经网络的模型参数，并返回执行所述将每个所述新闻特征信息输入所述深度神经网络进行处理，得到计算趋势信息；

得到所述趋势预测模型。

3.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1或2所述的方法。

4.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1或2所述的方法。