CN114565196A

CN114565196A - 基于政务热线的多事件趋势预判方法、装置、设备及介质

Info

Publication number: CN114565196A
Application number: CN202210454326.6A
Authority: CN
Inventors: 包利安; 吉文标; 汤灏
Original assignee: Beijing Zero Data Technology Co ltd; Beijing Zero Vision Network Technology Co ltd
Current assignee: Beijing Zero Data Technology Co ltd; Beijing Zero Vision Network Technology Co ltd
Priority date: 2022-04-28
Filing date: 2022-04-28
Publication date: 2022-05-31
Anticipated expiration: 2042-04-28
Also published as: CN114565196B

Abstract

本申请涉及事件趋势预判的领域，尤其是涉及基于政务热线的多事件趋势预判方法、装置、设备及介质。其方法包括：获取历史热线事件信息，然后对历史热线事件信息进行分析，确定历史热线事件信息的时间序列长度，并基于时间序列长度以及街区组合数量对历史热线事件信息进行无监督时间序列数据整理，然后将热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，并将得到的特征维度数量与热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据，然后对未来热线矩阵数据中所包含的数据进行数据处理，并将得到的热线数据输入至预设算法模型中进行数据推算，生成热线事件发生量。本申请具有提高热线事件的预测准确度的效果。

Description

基于政务热线的多事件趋势预判方法、装置、设备及介质

技术领域

本申请涉及事件趋势预判的领域，尤其是涉及基于政务热线的多事件趋势预判方法、装置、设备及介质。

背景技术

随着大数据及人工智能行业的不断发展，如何更好的利用大数据中蕴含的知识信息，开发各种领域的应用算法，服务于政务各条线的决策支持和智慧治理是非常重要的。在政务热线数据场景中，通过采集热线工单内容中的不同区域以及不同区域对应的不同事件，对不同区域事件的未来发生量进行趋势变化预测，以达到预先对不同区域内所发生的事件进行预警的效果。

目前，在对热线工单内容中的未来不同区域事件的未来发生量进行趋势变化预测时，通过采集短时间内的不同区域的历史事件发生量，对历史事件发生量的趋势进行分析，得到在短时间内的历史事件的发生趋势，基于历史事件的发生趋势做短周期时间序列的未来一个周期时间事件发生数量的预测。

针对于上述相关技术，发明人认为在对未来不同区域事件的未来发生量进行趋势变化预测时，单纯对短时间内的历史事件发生量进行趋势分析，从宏观角度来说，存在降低预测准确度的缺陷。

发明内容

为了提高热线事件的预测准确度，本申请提供基于政务热线的多事件趋势预判方法、装置、设备及介质。

第一方面，本申请提供一种基于政务热线的多事件趋势预判方法，采用如下的技术方案：

一种基于政务热线的多事件趋势预判方法，包括：

获取过去预设时间段内的历史热线事件信息，所述历史热线事件信息为不同城市对应的不同街区所发生过的热线事件；

对所述历史热线事件信息进行分析，确定所述历史热线事件信息中不同街区的街区组合数量以及所述街区组合数量中每个街区组合对应的时间序列长度，并基于所述时间序列长度以及所述街区组合数量对所述历史热线事件信息进行无监督时间序列数据整理，得到热线事件矩阵数据；

将所述热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，并将得到的所述特征维度数量与所述热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据；

对所述未来热线矩阵数据中所包含的数据进行数据处理，得到热线数据，并将得到的所述热线数据输入至预设算法模型中进行数据推算，生成所述街区组合数量中每个街区组合在未来预设时间段内的热线事件发生量。

通过采用上述技术方案，在对政务热线的时间趋势进行预判时，通过对不同城市对应的不同街区所发生过的热线事件进行采集的，得到历史热线事件信息，然后对历史热线事件信息进行分析，获取历史热线事件信息中的不同街区的街区组合数量以及时间序列长度，其中，时间序列长度与街区组合数量是一一对应的关系，然后根据时间序列长度以及街区组合数量对历史热线事件热线信息进行无监督时间序列数据整理，得到热线事件矩阵数据，然后将热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，并将得到的特征维度数量与热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据，然后对未来热线矩阵数据中所包含的数据进行一一处理，得到热线数据，将热线数据输入至预设算法模型中进行数据推算，生成街区组合数量中每个街区组合在未来预设时间段内的热线事件发生量，工作人员根据实际需求设置过去预设时间段以及未来预设时间段，获取未来事件发生量，改善了单纯对短时间内的历史事件发生量进行趋势分析的缺陷，从而达到了提高热线事件的预测准确度的效果。

在另一种可能实现的方式中，所述对所述历史热线事件信息进行分析，确定所述历史热线事件信息中不同街区的街区组合数量以及所述街区组合数量中每个街区组合对应的时间序列长度，包括：

基于所述历史热线事件信息确定至少一组热线工单数据；

分别对所述至少一组热线工单数据进行标签获取，得到每组热线工单数据中的街区数据以及工单处理时间数据；

根据所述工单处理时间数据确定所述热线工单数据是否处理完结，若未处理完结，则将所述热线工单数据进行数据瓦解，若处理完结，将所述街区数据与所述工单处理时间数据进行对应绑定，得到街区时间绑定数据；

对所述街区时间绑定数据进行街区组合类型筛选，得到所述历史热线事件信息的街区组合数量以及所述街区组合数量中每个街区组合对应的时间序列长度。

通过采用上述技术方案，在对历史热线事件信息进行分析时，获取历史热线事件信息中的至少一组热线工单数据，然后分别对每组热线数据进行标签获取，得到每组热线工单数据中的街区数据以及工单处理时间数据，判断工单处理时间数据是否处理完结，即截止到目前为止，当前的工单的处理状态是否仍在处理中，若未处理完结，则将热线工单数据进行数据瓦解，不将该热线工单数据计入到历史热线事件信息中，若处理完结，则将街区数据与工单处理时间数据进行对应绑定，得到街区时间绑定数据，随后对街区时间绑定数据进行街区组合类型筛选，以得到街区组合数量以及时间序列长度，通过将未处理完结的热线工单数据进行瓦解，提高了历史热线事件信息的可靠性。

在另一种可能实现的方式中，所述将所述热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，包括：

基于所述热线事件矩阵数据确定所述历史热线事件信息中每个热线事件的事件名称、事件时间以及事件区域；

分别将所述事件名称、所述事件时间以及所述事件区域输入至所述预研模型进行向量提取，得到与所述事件名称对应的文本特征向量、与所述事件时间对应的时间特征向量以及与所述事件区域对应的区域特征向量；

对所述文本特征向量、所述时间特征向量以及所述区域特征向量进行数量统计，得到所述特征维度数量。

通过采用上述技术方案，在对特征维度数量进行获取时，根据热线事件矩阵数据确定历史热线事件信息中每个热线事件的时间名称、事件时间以及事件区域，然后分别将事件名称、事件时间以及事件区域输入至预研模型中进行向量提取，得到与事件名称对应的文本特征向量、与事件时间对应的时间特征向量以及与事件区域对应的区域特征向量，然后通过对文本特征向量、时间特征向量以及区域特征向量进行数量统计，得到特征维度数量，分别对历史热线事件信息中每个热线事件的特征维度进行统计，达到了提高特征维度数量的准确度的效果。

在另一种可能实现的方式中，所述将得到的所述特征维度数量与所述热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据，包括：

将所述特征维度数量与所述热线事件矩阵数据进行整合，生成热线维度矩阵数据；

对所述热线维度矩阵数据进行基本数据分布探查，获取所述历史热线事件信息中热线事件发生的相对周期性规律，并基于所述相对周期性规律确定时间周期长度；

基于所述时间周期长度对所述热线维度矩阵数据进行有监督时间序列数据整理，得到热线事件预测矩阵数据；

基于所述热线事件预测矩阵数据对未来预设时间段内的热线事件发生趋势进行预判，生成未来热线矩阵数据。

通过采用上述技术方案，在生成未来热线矩阵数据时，将特征维度数量与热线事件矩阵数据进行整合，得到热线维度矩阵数据，然后对热线维度矩阵数据进行基本数据分布探查，获取历史热线信息中热线事件发生的相对周期性规律，并根据相对周期性规律确定时间周期长度，然后基于时间周期长度对热线维度矩阵数据进行有监督时间序列数据整理，得到热线事件预测矩阵数据，然后根据热线事件预测矩阵数据与未来预设时间段内的热线事件发生趋势进行预判，生成未来热线矩阵数据，达到了对热线维度矩阵数据进行时间序列监督的效果。

在另一种可能实现的方式中，所述对所述未来热线矩阵数据中所包含的数据进行数据处理，得到热线数据，包括：

计算所述未来热线矩阵数据中所包含的数据的正太分布均值以及正太分布方差，并基于所述正太分布均值以及所述正太分布方差确定所述未来热线矩阵数据的3δ范围；

判断所述数据是否在所述3δ范围之外，若所述数据在所述3δ范围之外，则确定所述数据所在所述未来热线矩阵数据的矩阵序列，根据所述矩阵序列计算序列平均值，用所述序列平均值对所述数据进行替换，得到替换后的矩阵序列，并对所述矩阵序列进行缺失值处理；

对所述未来热线矩阵数据中的矩阵序列进行序列的归一化处理，得到热线数据。

通过采用上述技术方案，在获取热线数据时，通过计算未来热线矩阵数据中所包含的数据的正太分布均值以及正太分布方差确定未来热线矩阵数据的3δ范围，确定当前数据是否在3δ范围至外，若是，则将数据进行剔除，同时将序列平均值添加到数据所在序列位置处，得到新的矩阵序列，然后对矩阵序列进行缺失值处理，以保证矩阵序列的完整性，然后将未来热线矩阵数据中的矩阵序列进行序列的归一化处理，得到热线数据，以便后续对热线数据进行数据处理。

在另一种可能实现的方式中，所述生成所述街区组合数量中每个街区组合在未来预设时间段内的热线事件发生量，之后还包括：

获取所述街区组合数量中每个街区组合在未来预设时间段内的真实热线事件发生量；

基于所述真实热线事件发生量对所述热线事件发生量进行反归一处理，将所述热线事件发生量恢复到所述真实热线事件发生量。

通过采用上述技术方案，在对未来预设时间段内的热线事件发生量预测完成后，确定在未来预设时间段内的真实热线事件发生量，然后通过真实热线事件发生量对热线事件发生量进行反归一处理，将真实热线事件发生量对热线事件发生量进行覆盖，从而达到了对热线事件发生量进行数据更新的效果。

在另一种可能实现的方式中，所述将所述热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，之后还包括：

基于所述真实热线事件发生量以及所述热线事件发生量确定热线事件均方根误差；

根据所述热线事件均方根误差对所述预研模型中的epoch训练模型中的参数进行设置，并对设置后的epoch训练模型进行反向迭代，得到所述预研模型中每一轮的验证集；

对所述验证集进行计算评估，生成所述验证集的损失值以及评价指标。

通过采用上述技术方案，在提取完热线事件矩阵数据的向量特征后，根据真实热线事件发生量与热线事件发生量确定出热线事件均方根误差，然后根据热线事件均方根误差对预研模型中的epoch训练模型进行参数设置，紧接着对epoch训练模型进行反向迭代，以获取预研模型中每一轮的验证集，然后对验证集进行计算评估，生成验证集的损失值以及评价指标，工作人员通过损失值以及评价指标的直观数据，对当前向量特征提取效果进行监测。

第二方面，本申请提供一种基于政务热线的多事件趋势预判装置，采用如下的技术方案：

一种基于政务热线的多事件趋势预判装置，包括：

数据探查模块，获取历史热线事件信息，所述历史热线事件信息为不同城市对应的不同街区所发生过的热线事件；

数据预处理模块，对所述历史热线事件信息进行分析，确定所述历史热线事件信息中不同街区的街区组合数量以及所述街区组合数量中每个街区组合对应的时间序列长度，并基于所述时间序列长度以及所述街区组合数量对所述历史热线事件信息进行无监督时间序列数据整理，得到热线事件矩阵数据；

数据模型提取模块，将所述热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，并将得到的所述特征维度数量与所述热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据；

数据算法分析模块，对所述未来热线矩阵数据中所包含的数据进行数据处理，得到热线数据，并将得到的所述热线数据输入至预设算法模型中进行数据推算，生成所述街区组合数量中每个街区组合在未来预设时间段内的热线事件发生量。

通过采用上述技术方案，在对政务热线的时间趋势进行预判时，通过数据探查模块对不同城市对应的不同街区所发生过的热线事件进行采集的，得到历史热线事件信息，然后数据预处理模块对历史热线事件信息进行分析，获取历史热线事件信息中的不同街区的街区组合数量以及时间序列长度，其中，时间序列长度与街区组合数量是一一对应的关系，然后根据时间序列长度以及街区组合数量对历史热线事件热线信息进行无监督时间序列数据整理，得到热线事件矩阵数据，然后数据模型提取模块将热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，并将得到的特征维度数量与热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据，然后数据算法分析模块对未来热线矩阵数据中所包含的数据进行一一处理，得到热线数据，将热线数据输入至预设算法模型中进行数据推算，生成街区组合数量中每个街区组合在未来预设时间段内的热线事件发生量，工作人员根据实际需求设置过去预设时间段以及未来预设时间段，获取未来事件发生量，改善了单纯对短时间内的历史事件发生量进行趋势分析的缺陷，从而达到了提高热线事件的预测准确度的效果。

在一种可能的实现方式中，所述数据预处理模块在对所述历史热线事件信息进行分析，确定所述历史热线事件信息中不同街区的街区组合数量以及所述街区组合数量中每个街区组合对应的时间序列长度时，具体用于：

基于所述历史热线事件信息确定至少一组热线工单数据；

在另一种可能的实现方式中，所述数据模型提取模块在将所述热线事件矩阵数据输入至训练好的预研模型进行向量特征提取时，得到特征维度数量，具体用于：

在另一种可能的实现方式中，所述数据模型提取模块在将得到的所述特征维度数量与所述热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据时，具体用于：

在另一种可能的实现方式中，所述数据算法分析模块在对所述未来热线矩阵数据中所包含的数据进行数据处理，得到热线数据时，具体用于：

在另一种可能的实现方式中，所述装置还包括：事件获取模块以及事件处理模块，其中，

所述事件获取模块，用于获取所述街区组合数量中每个街区组合在未来预设时间段内的真实热线事件发生量；

所述事件处理模块，用于基于所述真实热线事件发生量对所述热线事件发生量进行反归一处理，将所述热线事件发生量恢复到所述真实热线事件发生量。

在另一种可能的实现方式中，所述装置还包括：误差确定模块、验证获取模块以及计算评估模块，其中，

所述误差确定模块，用于基于所述真实热线事件发生量以及所述热线事件发生量确定热线事件均方根误差；

所述验证获取模块，用于根据所述热线事件均方根误差对所述预研模型中的epoch训练模型中的参数进行设置，并对设置后的epoch训练模型进行反向迭代，得到所述预研模型中每一轮的验证集；

所述计算评估模块，用于对所述验证集进行计算评估，生成所述验证集的损失值以及评价指标。

第三方面，本申请提供一种电子设备，采用如下的技术方案：

一种电子设备，该电子设备包括：

至少一个处理器；

存储器；

至少一个应用程序，其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行，所述至少一个应用程序配置用于：执行上述基于政务热线的多事件趋势预判方法。

第四方面，本申请提供一种计算机可读存储介质，采用如下的技术方案：

一种计算机可读存储介质，包括：存储有能够被处理器加载并执行上述基于政务热线的多事件趋势预判方法的计算机程序。

综上所述，本申请包括以下有益技术效果：

1、在对政务热线的时间趋势进行预判时，通过对不同城市对应的不同街区所发生过的热线事件进行采集的，得到历史热线事件信息，然后对历史热线事件信息进行分析，获取历史热线事件信息中的不同街区的街区组合数量以及时间序列长度，其中，时间序列长度与街区组合数量是一一对应的关系，然后根据时间序列长度以及街区组合数量对历史热线事件热线信息进行无监督时间序列数据整理，得到热线事件矩阵数据，然后将热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，并将得到的特征维度数量与热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据，然后对未来热线矩阵数据中所包含的数据进行一一处理，得到热线数据，将热线数据输入至预设算法模型中进行数据推算，生成街区组合数量中每个街区组合在未来预设时间段内的热线事件发生量，工作人员根据实际需求设置过去预设时间段以及未来预设时间段，获取未来事件发生量，改善了单纯对短时间内的历史事件发生量进行趋势分析的缺陷，从而达到了提高热线事件的预测准确度的效果；

2、在提取完热线事件矩阵数据的向量特征后，根据真实热线事件发生量与热线事件发生量确定出热线事件均方根误差，然后根据热线事件均方根误差对预研模型中的epoch训练模型进行参数设置，紧接着对epoch训练模型进行反向迭代，以获取预研模型中每一轮的验证集，然后对验证集进行计算评估，生成验证集的损失值以及评价指标，工作人员通过损失值以及评价指标的直观数据，对当前向量特征提取效果进行监测。

附图说明

图1是本申请实施例基于政务热线的多事件趋势预判方法的流程示意图；

图2是本申请实施例基于政务热线的热线工单数据处理方法的流程示意图；

图3是本申请实施例基于政务热线的特征向量数量统计方法的流程示意图；

图4是本申请实施例基于政务热线的有监督时间序列数据整理方法的流程示意图；

图5是本申请实施例基于政务热线的序列归一化处理方法的流程示意图；

图6是本申请实施例基于政务热线的多事件趋势预判装置的方框示意图；

图7是本申请实施例电子设备的示意图。

具体实施方式

以下结合附图1-7对本申请作进一步详细说明。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，基于政务热线的多事件趋势预判方法、装置、设备及介质和/或B，可以表示：单独存在基于政务热线的多事件趋势预判方法、装置、设备及介质，同时存在基于政务热线的多事件趋势预判方法、装置、设备及介质和B，单独存在B这三种情况。另外，本文中字符“/”，如无特殊说明，一般表示前后关联对象是一种“或”的关系。

本申请实施例提供了一种基于政务热线的多事件趋势预判方法，由电子设备执行，该电子设备可以为服务器也可以为终端设备，其中，该服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此，该终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请实施例在此不做限制，如图1所示，该方法包括：

步骤S10，获取过去预设时间段内的历史热线事件信息，历史热线事件信息为不同城市对应的不同街区所发生过的热线事件。

对于本申请实施例来说，过去预设时间段为工作人员通过指定终端设备进行输入的，指定终端设备包括平板、手机以及电脑等。

具体地，工作人员在指定终端设备中输入过去预设时间段（例如：2021年1月1号—2022年1月1号），然后指定终端设备将过去预设时间段发送至电子设备进行处理，在电子设备接收到过去预设时间段后，获取预设时间段中不同城市对应的不同街区所发生过的历史热线事件信息。

具体地，获取历史热线事件信息的一种可实施方式为大数据获取方式，通过大数据技术对所有历史热线事件信息进行获取，然后再根据过去预设时间段对所有热线事件信息进行筛选，得到历史热线事件信息。

步骤S11，对历史热线事件信息进行分析，确定历史热线事件信息中不同街区的街区组合数量以及街区组合数量中每个街区组合对应的时间序列长度，并基于时间序列长度以及街区组合数量对历史热线事件信息进行无监督时间序列数据整理，得到热线事件矩阵数据。

具体地，历史热线事件信息是在过往时间中各个街区所发生的热线事件，历史热线事件信息中包括：事件发生的具体位置以及起始时间等，例如：某件热线事件信息为****年*月*号在**省**市**区**街区发生了一起井盖丢失事件，热线拨打人员为张三，热线接听人员为李四，直至****年*月*号该事件得以解决。电子设备获取历史热线事件信息后，对信息内容中的具体位置进行提取，从而确定不同历史热线事件信息的街区组合（**省**市**区**街区），然后对街区组合的数量进行统计得到街区组合数量。

具体地，时间序列是按照时间排序的一组随机变量，它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果。时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势，而时间序列预测方法的核心就是从数据中挖掘出这种规律，并利用其对将来的数据做出估计。

在本申请实施例中，时间序列长度表示的是热线事件随时间不断变化的长度。

根据时间序列长度以及街区组合数量对历史热线事件信息进行无监督时间序列数据整理，得到以下热线事件矩阵数据：

。

其中，m为街区组合数量，n为时间序列长度。

步骤S12，将热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，并将得到的特征维度数量与热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据。

具体地，在将热线事件矩阵数据输入至预研模型中进行向量特征提取钱，需要预先获取矩阵数据样本，矩阵数据样本包括所有历史热线事件信息所形成的热线事件矩阵数据以及热线事件矩阵数据中的向量特征，然后创建预研模型，并基于矩阵数据样本对预研模型进行训练，得到训练好的预研模型。

具体地，预研模型为预先训练好的神经网络模型，神经网络是由大量的、简单的处理单元（称为神经元）广泛地互相连接而形成的复杂网络系统，它反映了人脑功能的许多基本特征，是一个高度复杂的非线性动力学习系统。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力，特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。神经网络的发展与神经科学、数理科学、认知科学、计算机科学、人工智能、信息科学、控制论、机器人学、微电子学、心理学、光计算、分子生物学等有关。

具体地，将热线矩阵数据输入至预研模型中进行向量特征提取，并将提取到的向量特征进行统计，得到特征维度数量，其中，向量特征包括历史热线事件信息中的事件文本向量特征、时间向量特征以及街区组合向量特征等，然后将特征维度数量与热线事件矩阵进行数据结合，得到未来热线矩阵数据。

步骤S13，对未来热线矩阵数据中所包含的数据进行数据处理，得到热线数据，并将得到的热线数据输入至预设算法模型中进行数据推算，生成街区组合数量中每个街区组合在未来预设时间段内的热线事件发生量。

对于本申请实施例来说，采用双向LSTM模型为预设算法模型进行举例说明，包括但不仅限于双向LSTM模型。

具体地，预设算法模型构建，模型主体采用双向LSTM作为趋势预测模型，LSTM主要有遗忘门，输入门，输出门构成；

遗忘门：

；

输入门：

；

经过遗忘门和输入门的信息过滤后，将历史的记忆和当前阶段的记忆内容合并，生成的值为：

输出门：

。

在上面描述的LSTM之后，在反向接入一层LSTM网络层，通过该过程可以得到BI-LSTM层，由于是若干组事件组合共同训练；添加事件空间特征联合学习层，初始化关联向量矩阵大小为M*V*K，取LSTM最后一层的输出向量，转置乘关联向量参数矩阵，最终连接回归损失函数，完成预设算法模型的构建。

本申请实施例提供了一种基于政务热线的多事件趋势预判方法，在对政务热线的时间趋势进行预判时，通过对不同城市对应的不同街区所发生过的热线事件进行采集的，得到历史热线事件信息，然后对历史热线事件信息进行分析，获取历史热线事件信息中的不同街区的街区组合数量以及时间序列长度，其中，时间序列长度与街区组合数量是一一对应的关系，然后根据时间序列长度以及街区组合数量对历史热线事件热线信息进行无监督时间序列数据整理，得到热线事件矩阵数据，然后将热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，并将得到的特征维度数量与热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据，然后对未来热线矩阵数据中所包含的数据进行一一处理，得到热线数据，将热线数据输入至预设算法模型中进行数据推算，生成街区组合数量中每个街区组合在未来预设时间段内的热线事件发生量，工作人员根据实际需求设置过去预设时间段以及未来预设时间段，获取未来事件发生量，改善了单纯对短时间内的历史事件发生量进行趋势分析的缺陷，从而达到了提高热线事件的预测准确度的效果。

本申请实施例的一种可能的实现方式，在步骤S11中，对历史热线事件信息进行分析，确定历史热线事件信息中不同街区的街区组合数量以及街区组合数量中每个街区组合对应的时间序列长度，参照图2，具体包括步骤S111、步骤S112、步骤S113以及步骤S114，其中，

步骤S101，基于历史热线事件信息确定至少一组热线工单数据。

具体地，历史热线事件信息中所包含的热线工单数据是由热线接听人员在接听热线拨打人员所诉说的信息后进行记录填写的，热线工单数据包括热线事件发生地点、热线事件详情、热线事件类型、热线事件发生时间以及热线事件解决时间。

步骤S102，分别对至少一组热线工单数据进行标签获取，得到每组热线工单数据中的街区数据以及工单处理时间数据。

具体地，根据至少一组热线工单数据中的数据标签进行标签获取，获取到指定的标签内容，即通过获取热线事件发生地点、热线事件发生时间以及热线事件解决时间标签，得到街区数据以及工单时间数据。

步骤S103，根据工单处理时间数据确定热线工单数据是否处理完结，若未处理完结，则将热线工单数据进行数据瓦解，若处理完结，将街区数据与工单处理时间数据进行对应绑定，得到街区时间绑定数据。

具体地，通过获取到的热线事件解决时间标签所对应的信息，确定当前热线事件是否处理完结，若热线事件解决时间标签并无对应时间信息，即表明热线事件仍在处理过程中，因此将热线工单数据进行数据瓦解，若热线事件解决时间标签中存在对应的时间信息，则将街区数据与工单处理时间数据进行对应绑定。

步骤S104，对街区时间绑定数据进行街区组合类型筛选，得到历史热线事件信息的街区组合数量以及街区组合数量中每个街区组合对应的时间序列长度。

本申请实施例的一种可能的实现方式，在步骤S12中，将热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，参照图3，包括步骤S121、步骤S122以及步骤S123，其中，

步骤S121，基于热线事件矩阵数据确定历史热线事件信息中每个热线事件的事件名称、事件时间以及事件区域。

具体地，根据热线矩阵数据中x确定热线事件对应的事件名称，根据热线矩阵数据中n确定热线事件对应的事件时间，根据热线矩阵数据中m确定热线事件对应事件区域。

步骤S122，分别将事件名称、事件时间以及事件区域输入至预研模型进行向量提取，得到与事件名称对应的文本特征向量、与事件时间对应的时间特征向量以及与事件区域对应的区域特征向量。

步骤S123，对文本特征向量、时间特征向量以及区域特征向量进行数量统计，得到特征维度数量。

具体地，一个矩阵的特征向量的总数计算方法：个数=n-特征矩阵的秩，个数=n-r（入E-A）其中n是阶数，而不是每个矩阵都能相似对角化的。如果一个矩阵，它的特征值各不相同，那么一定可以对角化。特征向量在基向量上的投影(即坐标)，这里假设向量空间为h维。由此，可以直接以坐标向量表示。利用基向量，线性变换也可以用一个简单的矩阵乘法表示。

本申请实施例一种可能的实现方式，在步骤S12中，将得到的特征维度数量与热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据，参照图4，包括步骤S12A、步骤S12B、步骤S12C以及步骤S12D，其中，

步骤S12A，将特征维度数量与热线事件矩阵数据进行整合，生成热线维度矩阵数据。

具体地，将特征维度数量作为维度与热线事件矩阵数据进行整合，本申请实施例采用pytorch技术进行举例说明，包括但不局限于pytorch技术一种可实现方式。

通过pytorch中的指令“out.unsqueeze(-1)”将特征维度数量以维度的方式添加到热线事件矩阵数据中，实现维度整合。

具体地，PyTorch是一个基于Torch的Python开源机器学习库，用于自然语言处理等应用程序。它主要由Facebookd的人工智能小组开发，不仅能够实现强大的GPU加速，同时还支持动态神经网络，这一点是现在很多主流框架如TensorFlow都不支持的。PyTorch提供了两个高级功能：1.具有强大的GPU加速的张量计算（如Numpy）；2.包含自动求导系统的深度神经网络除了Facebook之外，Twitter、GMU和Salesforce等机构都采用了PyTorch。

将特征维度数量与热线事件矩阵数据进行整合完毕后，得到以下热线维度矩阵数据：

其中，v表示特征维度数量。

步骤S12B，对热线维度矩阵数据进行基本数据分布探查，获取历史热线事件信息中热线事件发生的相对周期性规律，并基于相对周期性规律确定时间周期长度。

具体地，将热线维度矩阵数据导入到Excel表格中，并且配置Python集成jupyter环境，针对热线维度矩阵数据中n时间序列做基本数据分布探查，主要目的在于找到对应序列的相对周期性规律，然后根据相周期性规律确定时间周期长度。

步骤S12C，基于时间周期长度对热线维度矩阵数据进行有监督时间序列数据整理，得到热线事件预测矩阵数据。

具体地，用t来代替时间周期性长度，并将热线维度矩阵数据中的n替换为t，得到新的热线维度矩阵数据：

。

步骤S12D，基于热线事件预测矩阵数据对未来预设时间段内的热线事件发生趋势进行预判，生成未来热线矩阵数据。

具体地，假设预设未来预设时间段为k，即移动步长为k步预测，得到热线事件矩阵数据：

。

本申请实施例一种可能的实现方式，在步骤S13中，对未来热线矩阵数据中所包含的数据进行数据处理，得到热线数据，参照图5，包括步骤S131、步骤S132以及步骤S133，其中，

步骤S131，计算未来热线矩阵数据中所包含的数据的正太分布均值以及正太分布方差，并基于正太分布均值以及正太分布方差确定未来热线矩阵数据的3δ范围。

步骤S132，判断数据是否在3δ范围之外，若数据在3δ范围之外，则确定数据所在未来热线矩阵数据的矩阵序列，根据矩阵序列计算序列平均值，用序列平均值对数据进行替换，得到替换后的矩阵序列，并对矩阵序列进行缺失值处理。

具体地，具体地，3δ范围是建立在正态分布的等精度重复测量基础上而造成奇异数据的干扰或噪声难以满足正态分布。如果一组测量数据中某个测量值的残余误差的绝对值νi＞3δ，则该测量值为坏值，应剔除。通常把等于±3δ的误差作为极限误差，对于正态分布的随机误差，落在±3δ以外的概率只有0.27%，它在有限次测量中发生的可能性很小，故存在3δ准则。3δ准则是最常用也是最简单的粗大误差判别准则，它一般应用于测量次数充分多（n≥30）或当n＞10做粗略判别时的情况。

具体地，缺失值是指矩阵序列中由于缺少信息而造成的数据聚类、分组、删失或截断，对于缺失值的处理，从总体上来说分为删除存在缺失值的个案和缺失值插补，本申请实施例采用删除存在缺失值的个案对矩阵序列进行处理，删除存在缺失值的个案主要有简单删除法和权重法。简单删除法是对缺失值进行处理的最原始方法。它将存在缺失值的个案删除。如果数据缺失问题可以通过简单的删除小部分样本来达到目标，那么这个方法是最有效的。当缺失值的类型为非完全随机缺失的时候，可以通过对完整的数据加权来减小偏差。把数据不完全的个案标记后，将完整的数据个案赋予不同的权重，个案的权重可以通过logistic或probit回归求得。

步骤S133，对未来热线矩阵数据中的矩阵序列进行序列的归一化处理，得到热线数据。

具体地，归一化方法有两种形式，一种是把数变为（0，1）之间的小数，一种是把有量纲表达式变为无量纲表达式。主要是为了数据处理方便提出来的，把数据映射到0～1范围之内处理，更加便捷快速。

具体处理归一方法为：

本申请实施例的一种可能的实现方式，步骤S13之后还包括步骤S14（图中未示出）以及步骤S15（图中未示出），其中，

步骤S14，获取街区组合数量中每个街区组合在未来预设时间段内的真实热线事件发生量。

具体地，获取未来预设时间段内的真实热线事件发生量，例如：未来预设时间段为一个月，那么在过一个月后，获取街区组合数量中每个街区组合的真实热线事件发生量。

步骤S15，基于真实热线事件发生量对热线事件发生量进行反归一处理，将热线事件发生量恢复到真实热线事件发生量。

具体地，将热线事件发生量进行反归一处理，使得热线事件发生量恢复到归一化处理之前的数据，然后将真实热线事件发生量对热线事件发生量进行覆盖。

本申请实施例的一种可能的实现方式，步骤S13之后还包括步骤S16（图中未示出）、步骤S17（图中未示出）以及步骤S18（图中未示出），其中，

步骤S16，基于真实热线事件发生量以及热线事件发生量确定热线事件均方根误差。

具体地，均方根误差,它是观测值与真值偏差的平方和观测次数n比值的平方根,均方根误差计算公式：Re＝√[∑di^2/n]，式中n为测量次数，di为一组真实热线事件发生量以及热线事件发生量的偏差。

步骤S17，根据热线事件均方根误差对预研模型中的epoch训练模型中的参数进行设置，并对设置后的epoch训练模型进行反向迭代，得到预研模型中每一轮的验证集。

具体地，当一个完整的数据集通过了神经网络一次并且返回了一次，这个过程称为一次epoch训练模型。一个epoch指代所有的数据送入网络中完成一次前向计算及反向传播的过程。由于一个epoch常常太大，计算机无法负荷，我们会将它分成几个较小的batches。在训练时，将所有数据迭代训练一次是不够的，需要反复多次才能拟合收敛。在实际训练时，我们将所有数据分成几个batch，每次送入一部分数据，梯度下降本身就是一个迭代过程。根据热线事件均方根误差对epoch训练模型中的参数进行设置，已得到预研模型中每一轮的验证集，即热线事件发生量的验证集合。

步骤S18，对验证集进行计算评估，生成验证集的损失值以及评价指标。

具体地，对验证集的计算评估包括一下步骤：

将验证集与预研模型的训练集进行百分比计算，得到损失值；

将损失值与标准损失值表进行对照，得到评价指标。

例如：当前损失值为50%，标准损失值表对应的50%为2级指标。

上述实施例从方法流程的角度介绍一种基于政务热线的多事件趋势预判方法，下述实施例从虚拟模块或者虚拟单元的角度介绍了一种基于政务热线的多事件趋势预判装置，具体详见下述实施例。

本申请实施例提供了一种基于政务热线的多事件趋势预判装置，如参照图6所示，该装置60具体可以包括：数据探查模块61、数据预处理模块62、数据模型提取模块63以及数据算法分析模块64，其中，

数据探查模块61，获取历史热线事件信息，历史热线事件信息为不同城市对应的不同街区所发生过的热线事件；

数据预处理模块62，对历史热线事件信息进行分析，确定历史热线事件信息中不同街区的街区组合数量以及街区组合数量中每个街区组合对应的时间序列长度，并基于时间序列长度以及街区组合数量对历史热线事件信息进行无监督时间序列数据整理，得到热线事件矩阵数据；

数据模型提取模块63，将热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，并将得到的特征维度数量与热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据；

数据算法分析模块64，对未来热线矩阵数据中所包含的数据进行数据处理，得到热线数据，并将得到的热线数据输入至预设算法模型中进行数据推算，生成街区组合数量中每个街区组合在未来预设时间段内的热线事件发生量。

本申请实施例的一种可能的实现方式，数据预处理模块62在对历史热线事件信息进行分析，确定历史热线事件信息中不同街区的街区组合数量以及街区组合数量中每个街区组合对应的时间序列长度时，具体用于：

基于历史热线事件信息确定至少一组热线工单数据；

分别对至少一组热线工单数据进行标签获取，得到每组热线工单数据中的街区数据以及工单处理时间数据；

根据工单处理时间数据确定热线工单数据是否处理完结，若未处理完结，则将热线工单数据进行数据瓦解，若处理完结，将街区数据与工单处理时间数据进行对应绑定，得到街区时间绑定数据；

对街区时间绑定数据进行街区组合类型筛选，得到历史热线事件信息的街区组合数量以及街区组合数量中每个街区组合对应的时间序列长度。

本申请实施例的另一种可能的实现方式，数据模型提取模块63在将热线事件矩阵数据输入至训练好的预研模型进行向量特征提取时，得到特征维度数量，具体用于：

基于热线事件矩阵数据确定历史热线事件信息中每个热线事件的事件名称、事件时间以及事件区域；

分别将事件名称、事件时间以及事件区域输入至预研模型进行向量提取，得到与事件名称对应的文本特征向量、与事件时间对应的时间特征向量以及与事件区域对应的区域特征向量；

对文本特征向量、时间特征向量以及区域特征向量进行数量统计，得到特征维度数量。

本申请实施例的另一种可能的实现方式，数据模型提取模块63在将得到的特征维度数量与热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据时，具体用于：

将特征维度数量与热线事件矩阵数据进行整合，生成热线维度矩阵数据；

对热线维度矩阵数据进行基本数据分布探查，获取历史热线事件信息中热线事件发生的相对周期性规律，并基于相对周期性规律确定时间周期长度；

基于时间周期长度对热线维度矩阵数据进行有监督时间序列数据整理，得到热线事件预测矩阵数据；

基于热线事件预测矩阵数据对未来预设时间段内的热线事件发生趋势进行预判，生成未来热线矩阵数据。

本申请实施例的另一种可能的实现方式，数据算法分析模块64在对未来热线矩阵数据中所包含的数据进行数据处理，得到热线数据时，具体用于：

计算未来热线矩阵数据中所包含的数据的正太分布均值以及正太分布方差，并基于正太分布均值以及正太分布方差确定未来热线矩阵数据的3δ范围；

判断数据是否在3δ范围之外，若数据在3δ范围之外，则确定数据所在未来热线矩阵数据的矩阵序列，根据矩阵序列计算序列平均值，用序列平均值对数据进行替换，得到替换后的矩阵序列，并对矩阵序列进行缺失值处理；

对未来热线矩阵数据中的矩阵序列进行序列的归一化处理，得到热线数据。

本申请实施例的另一种可能的实现方式，装置60还包括：事件获取模块以及事件处理模块，其中，

事件获取模块，用于获取街区组合数量中每个街区组合在未来预设时间段内的真实热线事件发生量；

事件处理模块，用于基于真实热线事件发生量对热线事件发生量进行反归一处理，将热线事件发生量恢复到真实热线事件发生量。

本申请实施例的另一种可能的实现方式，装置60还包括：误差确定模块、验证获取模块以及计算评估模块，其中，

误差确定模块，用于基于真实热线事件发生量以及热线事件发生量确定热线事件均方根误差；

验证获取模块，用于根据热线事件均方根误差对预研模型中的epoch训练模型中的参数进行设置，并对设置后的epoch训练模型进行反向迭代，得到预研模型中每一轮的验证集；

计算评估模块，用于对验证集进行计算评估，生成验证集的损失值以及评价指标。

本申请实施例还从实体装置的角度介绍了一种电子设备，如参照图7所示，参照图7所示的电子设备700包括：处理器701和存储器703。其中，处理器701和存储器703相连，如通过总线702相连。可选地，电子设备700还可以包括收发器704。需要说明的是，实际应用中收发器704不限于一个，该电子设备700的结构并不构成对本申请实施例的限定。

处理器701可以是CPU（Central Processing Unit，中央处理器），通用处理器，DSP（Digital Signal Processor，数据信号处理器），ASIC（Application SpecificIntegrated Circuit，专用集成电路），FPGA（Field Programmable Gate Array，现场可编程门阵列）或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器701也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

总线702可包括一通路，在上述组件之间传送信息。总线702可以是PCI（Peripheral Component Interconnect，外设部件互连标准）总线或EISA（ExtendedIndustry Standard Architecture，扩展工业标准结构）总线等。总线702可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器703可以是ROM（Read Only Memory，只读存储器）或可存储静态信息和指令的其他类型的静态存储设备，RAM（Random Access Memory，随机存取存储器）或者可存储信息和指令的其他类型的动态存储设备，也可以是EEPROM（Electrically ErasableProgrammable Read Only Memory，电可擦可编程只读存储器）、CD-ROM（Compact DiscRead Only Memory，只读光盘）或其他光盘存储、光碟存储（包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等）、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

存储器703用于存储执行本申请方案的应用程序代码，并由处理器701来控制执行。处理器701用于执行存储器703中存储的应用程序代码，以实现前述方法实施例所示的内容。

其中，电子设备包括但不限于：移动电话、笔记本电脑、数字广播接收器、PDA（个人数字助理）、PAD（平板电脑）、PMP（便携式多媒体播放器）、车载终端（例如车载导航终端）等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。还可以为服务器等。图7示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上仅是本申请的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种基于政务热线的多事件趋势预判方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述历史热线事件信息进行分析，确定所述历史热线事件信息中不同街区的街区组合数量以及所述街区组合数量中每个街区组合对应的时间序列长度，包括：

基于所述历史热线事件信息确定至少一组热线工单数据；

3.根据权利要求1所述的方法，其特征在于，所述将所述热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，得到特征维度数量，包括：

4.根据权利要求1所述的方法，其特征在于，所述将得到的所述特征维度数量与所述热线事件矩阵数据进行数据结合处理，生成未来热线矩阵数据，包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述未来热线矩阵数据中所包含的数据进行数据处理，得到热线数据，包括：

6.根据权利要求1所述的方法，其特征在于，所述生成所述街区组合数量中每个街区组合在未来预设时间段内的热线事件发生量，之后还包括：

7.根据权利要求6所述的方法，其特征在于，所述将所述热线事件矩阵数据输入至训练好的预研模型进行向量特征提取，之后还包括：

8.一种基于政务热线的多事件趋势预判装置，其特征在于，包括：

9.一种电子设备，其特征在于，该电子设备包括：

至少一个处理器；

存储器；

至少一个应用程序，其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行，所述至少一个应用程序配置用于：执行权利要求1～7任一项所述的基于政务热线的多事件趋势预判方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，当所述计算机程序在计算机中执行时，令所述计算机执行权利要求1～7任一项所述的基于政务热线的多事件趋势预判方法。