CN116775882B

CN116775882B - 一种智慧政务留言处理方法及设备

Info

Publication number: CN116775882B
Application number: CN202310791456.3A
Authority: CN
Inventors: 宫小艺; 徐伟; 任泳兆; 张奕晨; 周童
Original assignee: Shandong University of Science and Technology
Current assignee: Shandong University of Science and Technology
Priority date: 2023-06-29
Filing date: 2023-06-29
Publication date: 2024-02-27
Anticipated expiration: 2043-06-29
Also published as: CN116775882A

Abstract

本说明书实施例公开了一种智慧政务留言处理方法及设备，涉及数据处理技术领域，用于解决现有政务留言处理依靠于人工进行分类与热点编排时处理销量低的问题，方法包括：对留言问题描述文本进行预处理，获得留言问题描述文本的分词分类结果；将分词分类结果导入结合随机森林算法的PLDA主题模型，获得预设数量的主题分类词语；获取各主题分类词语的热度评价，以基于因子分析法对热度评价进行排序获得待回复主题分类词语，将待回复主题分类词语相对应的留言问题信息加入处理队列中进行处理，获得答复信息；提取答复信息与留言问题信息的意见评价指标，建立评价模型以基于评价模型对待评价的答复信息进行评价。

Description

一种智慧政务留言处理方法及设备

技术领域

本说明书涉及数据处理技术领域，尤其涉及一种智慧政务留言处理方法及设备。

背景技术

随着微博、微信、市长信箱、阳光热线等政府网络服务平台逐渐成为政府收集民意、联系民意、掌握民意的重要渠道，与各种民情民意有关的文本数据逐步增加，因此及时掌握民众关注热点及时提出解决方案并反馈解决信息的需求，成为了当前智慧政务系统所需要实现的一项重要功能。

当前随着互联网的快速发展和渗透下，网络问政平台为收集海量文本数据提供方便，但同时面临着在对于海量文本进行分类分析时，需要对大量文本数据进行集中分析才能确定当前留言热点的问题。而现有技术中，传统的留言信息处理方法仍然是依靠人工来进行留言划分和热点整理。然而，仅靠人工进行分析，分析速度慢，效率低，且工作量大，人工成本较高。并且由于信息迭代速度过快仅基于人工整理的方式难以及时锁定热点留言问题进行处理，进而导致民意难以及时有效的掌握，而对于留言问题的答复信息也难以及时进行评价反馈使得留言处理的流程缺少回馈环节，进而导致对于留言答复信息的质量难以基于统一标准进行规范。

发明内容

为了解决上述技术问题，本说明书一个或多个实施例提供了一种智慧政务留言处理方法及设备。

本说明书一个或多个实施例采用下述技术方案：

本说明书一个或多个实施例提供一种智慧政务留言处理方法，方法包括：

基于预设时间间隔获取智慧政务留言系统的留言问题信息；其中，所述留言问题信息包括：留言问题描述文本、用户基本信息；

若基于所述用户基本信息确定所述用户身份为合法身份，且所述留言问题描述文本不存在对应的答复信息，则筛选确定所述留言问题描述文本为有效问题，若确定所述留言问题描述文本为有效问题，则将该留言问题描述文本进行预处理，获得所述留言问题描述文本的分词分类结果；

将所述分词分类结果导入结合随机森林算法的PLDA主题模型，获得预设数量的主题分类词语；

获取各所述主题分类词语的热度评价，以基于因子分析法对所述热度评价进行排序获得待回复主题分类词语，以将所述待回复主题分类词语相对应的留言问题信息加入处理队列中进行处理，获得答复信息；

提取所述答复信息与所述留言问题信息的意见评价指标，建立评价模型以基于所述评价模型对待评价的答复信息进行评价。

可选地，在本说明书一个或多个实施例中，将该留言问题描述文本输入预置分词模型进行预处理，获得所述留言问题描述文本的分词分类结果，具体包括：

将所述留言问题描述文本输入预置分词模型，获得所述留言问题描述文本的中文分词结果；

基于不同类型的分类模型对所述中文分词结果进行分类，获得各所述不同类型的分类模型的预测结果；

基于所述预测结果确定各所述不同类型的分类模型的准确率与召回率，并根据所述准确率与所述召回率确定最佳分类模型，以将所述中文分词结果导入所述最佳分类模型，获得所述中文分词结果的分词分类结果。

可选地，在本说明书一个或多个实施例中，将所述留言问题描述文本输入预置分词模型，获得所述留言问题描述文本的中文分词结果之前，所述方法还包括：

收集所述智慧政务留言系统中的若干历史处理数据，作为训练数据；其中，所述历史处理数据为具有BIES标注的中文分词结果；

根据所述训练集对初始分词模型模型进行训练，获得所述初始分词模型模型输出的分词结果；

对比所述初始分词模型模型输出的分词结果与所述训练集中各所述历史处理数据标注的中文分词结果，确定所述初始分词模型是否符合要求；其中，所述初始分词模型为transformers模型；

若确定所述初始分词模型不符合要求，则获取所述初始分词模型模型的配置参数，则基于所述初始分词模型模型输出的分词结果与所述训练集中各所述历史处理数据标注的中文分词结果，确定所述初始分词模型的分词误差值；

根据所述分词误差值训练预设自回归求和滑动平均模型，以获得所述初始分词模型的预测误差值；

根据所述预测误差值对所述初始分词模型的配置参数进行修改，以对所述初始分词模型进行迭代更新，并基于所述训练集对更新后的初始分词模型进行迭代训练，以获得符合要求的初始分词模型作为预置分词模型。

可选地，在本说明书一个或多个实施例中，将所述分类结果导入结合随机森林算法的PLDA主题模型，获得预设数量的主题分类词语，具体包括：

将所述分词分类结果输入所述PLDA主题模型，以获得所述PLDA主题模型输出的主题作为特征变量；分词分类结果包括：相似留言归类、特定地点或人员归类；

将所述PLDA主题模型输出的主题作为特征变量后，将所述特征变量作为主题分类词语的数据集；

将所述数据集输入多决策树构成的所述随机森林算法中，以获得各所述决策树的决策结果，通过对各所述决策树的决策结果进行评价，获得预设数量的主题分类词语；其中，所述主题分类词语为最频繁词语分类。

可选地，在本说明书一个或多个实施例中，提取所述答复信息与所述留言问题信息的意见评价指标，建立评价模型以基于所述评价模型对待评价的答复信息进行评价，具体包括：

基于意见评价指标模板，提取所述答复信息与所述留言问题信息中的可用内容，以基于斯皮尔曼等级相关系数法确定当前量化方法中的最优量化方法；其中，所述当前量化方法包括：极差化量化法、极小值量化法、极大值量化法、中心化量化方法、均值量化方法；

基于所述最优量化方法对所述可用内容进行一致化处理，获得意见评价指标；其中，所述可用内容包括：留言主题、留言时间、留言详情、答复意见、答复时间；

基于预置评价策略对所述意见评价指标与所述答复信息进行评价，确定所述答复信息的评价结果；其中，所述答复质量包括：用于评价答复意见速度的第一评价结果，用于评价答复意见与所述留言问题信息的相关度的第二评价结果、用于评价所述答复意见的格式匹配度的第三评价结果、用于评价所述答复意见的完整性的第四评价结果；

基于所述评价策略确定各所述评价结果所对应的意见评价指标，以基于所述评价结果与所述评价结果对应的意见评价指标建立对应的评价模型；

将待评价的答复信息根据所述评价模型进行评价。

可选地，在本说明书一个或多个实施例中，所述基于预置评价策略对所述意见评价指标与所述答复信息进行评价，确定所述答复信息的评价结果，具体包括：

根据所述答复信息的发布时间与所述留言问题信息的上传时间，确定所述答复信息的答复速度，以对所述答复速度进行量化获得所述答复信息的第一评价结果；

获取所述答复信息的答复意见与所述留言问题信息的留言详情，以基于所述答复意见与所述留言详情的相似度，确定所述答复信息的第二评价结果；

获取所述答复信息的预设答复格式，以提取所述预设答复格式的格式关键词，根据所述格式关键词与所述答复信息的匹配率，确定所述答复信息的第三评价结果；

对所述答复信息进行文本预处理，以确定所述答复信息的文本词量，并根据所述文本词量确定所述答复信息的第四评价结果；

汇总所述第一评价结果、所述第二评价结果、所述第三评价结果与所述第四评价结果，确定所述答复信息的评价结果。

可选地，在本说明书一个或多个实施例中，获取所述答复信息的答复意见与所述留言问题信息的留言详情，以基于所述答复意见与所述留言详情的相似度，确定所述答复信息的第二评价结果，具体包括：

基于所述PLDA主题模型对所述答复信息的答复意见，进行答复主题词的提取获得答复主题词集合，并获取所述留言问题信息的主题分类词语，确定主题分类词语集合；

基于词频-逆向文件频率模型确定所述答复主题词集合中各所述答复主题词的向量值，并基于所述词频-逆向文件频率模型确定所述主题分类词语集合中各所述主题分类词语的向量值；

以将各所述答复主题词的向量值与各所述主题分类词语的向量值输入预置余弦定理计算模型，确定所述答复意见与所述留言详情的相似度。

可选地，在本说明书一个或多个实施例中，基于所述评价模型对待评价的答复信息进行评价之后，所述方法还包括：

获取各地区所对应的智慧政务在预设时间段内的答复信息评价结果，以获取预设时间段内的答复信息评价结果的分布直方图；

根据所述预设时间段内的答复信息评价结果的分布直方图，确定所述答复信息评价结果的集中范围，以将所述集中范围内评价结果均值作为各地区所对应的智慧政务的评价值；

根据预设评价值的划分范围，确定各地区所对应的智慧政务的答复质量；其中，所述答复质量包括：优秀等级、良好等级、中等等级、不良等级；

获取各地区所对应的智慧政务连续时间段内的答复质量，若确定连续时间段内的答复质量不存在优秀等级，则将对应的调整提醒信息发送到对应的智慧政务所在管理服务端。

可选地，在本说明书一个或多个实施例中，确定所述留言问题描述文本为有效问题，具体包括：

首先基于所述用户基本信息确定所述用户身份是否为合法身份，若否则确定所述留言问题描述文本为第一无效问题；

若是，则基于所述用户基本信息调用与所述用户基本信息相对应的历史留言问题描述文本；

获取所述历史留言问题描述文本与所述留言问题描述文本的差异词语，若确定所述差异词语为无意义词语，且所述历史留言问题描述文本存在对应的历史答复信息则将所述留言问题描述文本为第二无效问题；

对所述第一无效问题与所述第二无效问题进行过滤，获得有效问题。

本说明书一个或多个实施例提供一种智慧政务留言处理设备，设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

提取所述答复信息与所述留言问题信息的意见评价指标，以对所述意见评价指标进行量化获得留言答复质量。

本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果：

通过对留言问题中的有效问题进行提取，避免了对于海量留言问题进行处时，留言问题中掺杂的无效问题导致的无意义计算量增大的问题。通过将分词分类结果导入结合随机森林算法的PLDA主题模型，获得预设数量的主题分类词语，实现了对于热点留言问题的挖掘，避免了人工分析确定热点问题导致的成本高效率低的问题。通过建立评价模型对待评价的答复信息进行评价，为智慧政务系统提供了一个统一标准的评价方式，以便于及时基于评价结果进行服务调整与更新提高留言问题的答复质量。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1为本说明书实施例提供的一种智慧政务留言处理方法的流程示意图；

图2为本说明书实施例提供的一种智慧政务留言处理的全流程示意图；

图3为本说明书实施例提供的某应用场景下确定出的主题分类词语示意图；

图4为本说明书实施例提供的一种智慧政务留言处理设备的内部结构示意图。

具体实施方式

本说明书实施例提供一种智慧政务留言处理方法及设备。

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

如图1所示，本说明书一个或多个实施例中提供了一种智慧政务留言处理方法流程示意图。由图1可知，一种智慧政务留言处理方法，包括以下步骤：

S101：基于预设时间间隔获取智慧政务留言系统的留言问题信息；其中，所述留言问题信息包括：留言问题描述文本、用户基本信息。

为了及时掌握智慧政务留言系统中未解决的留言问题信息，以通过分析留言问题信息确定热点留言问题掌握当前民意。本说明书实施例中首先根据预设时间间隔获取智慧政务留言系统中的留言问题信息。其中，需要说明的是留言问题信息包括提出留言问题的用户基本信息，以及描述具体问题的留言问题描述文本。

S102：若基于所述用户基本信息确定所述用户身份为合法身份，且所述留言问题描述文本不存在对应的答复信息，则筛选确定所述留言问题描述文本为有效问题，若确定所述留言问题描述文本为有效问题，则将该留言问题描述文本进行预处理，获得所述留言问题描述文本的分词分类结果。

为了避免对于海量留言问题进行处时，留言问题中掺杂的无效问题对计算量造成的影响。本说明书实施例中如果根据用户信息确定出留言问题描述文本为有效问题才会对留言问题描述文本进行预处理，也就是说只有根据用户基本信息确定用户身份是合法的，并且留言问题描述文本不存在对应的历史答复信息也就是还没有被解决时，才确定该留言问题描述文本为有效问题，并进行后续处理。例如图2中所示的去停用词后对整句进行中文分词后，获得预处理后留言问题描述文本的分词分类结果。

具体地，在本说明书一个或多个实施例中，确定所述留言问题描述文本为有效问题，具体包括以下过程：

首先基于用户基本信息确定出用户身份是否为合法身份，如果确定该用户身份不符合要求，那么就将该留言问题描述文本判定为第一无效问题。反之，如果确定该用户身份符合要求那么就根据用户基本信息调用和用户基本信息相对应的历史留言问题描述文本。通过获取历史留言问题描述文本和留言问题描述文本的差异词语，如果确定出差异词语为无意义词语，且历史留言问题描述文本存在对应的历史答复信息则将所述留言问题描述文本为第二无效问题，对留言问题描述问题中的第一无效问题与第二无效问题进行过滤，从而获得有效问题。

具体地，在本说明书一个或多个实施例中，将该留言问题描述文本输入预置分词模型进行预处理，获得所述留言问题描述文本的分词分类结果，具体包括：

将留言问题描述文本输入预置分词模型，获得留言问题描述文本的中文分词结果。然后根据不同类型的分类模型对中文分词结果进行分类，获得各不同类型的分类模型的预测结果。然后根据分类模型的预测结果确定各不同类型的分类模型的准确率与召回率，并根据准确率与召回率确定最佳分类模型，从而将中文分词结果导入到确定出的最佳分类模型中，获得中文分词结果的分词分类结果。具体地，在某应用场景中例如当某留言问题描述文本对应于城乡建设、环境保护、交通运输、教育文体、劳动和社会保障、商贸旅游和卫生计生共7项一级分类标签。为了更好地完成文本分类，达到精确效果，我们将7项一级分类分别进行分类模型预测，验证模型的准确率。鉴于常用的分类算法种类颇多，因此，为了找出最优模型，我们分别利用贝叶斯分类算法、逻辑回归、支持向量机、随机森林、决策树等算法分别进行模型预测。最终，比较多种模型的准确率与一致性，找出最优模型，进行评价还需要说明的是模型评价方式可以基于F-Score即准确率与召回率进行评价，此处的F-Score评价方法为现有技术此处不在加以赘述。

进一步地，如图2所示在本说明书一个或多个实施例中，将留言问题描述文本输入预置分词模型，获得留言问题描述文本的中文分词结果之前，还需要构建精准可靠的预置分词模型，所以方法还包括以下过程：

首先收集智慧政务留言系统中的若干历史处理数据，作为训练数据；其中，需要说明的是该预置分词模型的学习过程为有监督的学习，所以历史处理数据为具有BIES标注的中文分词结果。然后根据训练集对初始分词模型模型进行训练，获得初始分词模型模型输出的分词结果。通过对比初始分词模型模型输出的分词结果与训练集中各所述历史处理数据标注的中文分词结果，确定初始分词模型是否符合要求。其中，需要说明的是初始分词模型为transformers模型。而如果确定初始分词模型不符合要求，那么就获取初始分词模型模型的配置参数，并根据初始分词模型模型输出的分词结果与训练集中各历史处理数据标注的中文分词结果，确定初始分词模型的分词误差值。由于预置分词模型不可避免的存在各类误差导致分词结果存在误差。因此根据分词误差值训练预设自回归求和滑动平均模型，以获得初始分词模型的预测误差值。根据预测误差值对初始分词模型的配置参数进行修改，以对初始分词模型进行迭代更新，并基于训练集对更新后的初始分词模型进行迭代训练，以获得符合要求的初始分词模型作为预置分词模型。基于自回归求和滑动平均模型对误差进行预测，实现了对于分类模型的修正，实现了两个模型的互补，提高了分类的准确性。

S103：将所述分词分类结果导入结合随机森林算法的PLDA主题模型，获得预设数量的主题分类词语。

基于上述步骤获得分词分类结果之后如图2所示，需要进行热点挖掘从而确定出当前留言问题描述问题的热点主题。因此，本说明书实施例中将分词分类加工导入到结合了随机森林的PLDA主题偶像中。以基于PLDA主题模型获得预设数据量的主题分类词语。

具体地，在本说明书一个或多个实施例中，将分类结果导入结合随机森林算法的PLDA主题模型，获得预设数量的主题分类词语，具体包括以下过程：

首先将分词分类结果输入到PLDA主题模型中，以获得PLDA主题模型输出的主题作为特征变量。其中需要说明的是如图2所示分词分类结果包括：相似留言归类、特定地点或人员归类。在将PLDA主题模型输出的主题作为特征变量后，将特征变量作为主题分类词语的数据集。并将所述数据集输入多决策树构成的所述随机森林算法中，以获得各决策树的决策结果，通过对各决策树的决策结果进行评价，获得预设数量的主题分类词语。如图3所示为选出的10个出现概率最大的，即热度最高的词语作为了主题分类词语，因此可以理解的是主题分类词语为最频繁词语分类。

进一步地，需要说明的是由于的PLDA主题模型将基于主题模型的主题作为特征变量，需要训练特征变量。因此基于传统PLDA主体模型的分类算法在此问题当中效果较差。基于该问题需要，我们引入随机森林算法，随机森林算法的执行步骤主要如下：

Step1：创建大量决策树，每棵树之间都不一样，基于观察点和变量的不同子集。

Step2：为每棵树用自助法(bootstrap)来采样观察数据集(用置换法从原始数据采样)，相同的观察点可以在相同的数据集出现多次。

Step3：为每棵树随机选择并仅适用一部分变量。

Step4：适用由采样所排除的管擦点来估计每棵树的性能。

Step5：在全部数据被拟合和预测后，获取最终预测，即为回归估计的平均值或用于预测的最频繁类。

S104：获取各所述主题分类词语的热度评价，以基于因子分析法对所述热度评价进行排序获得待回复主题分类词语，以将所述待回复主题分类词语相对应的留言问题信息加入处理队列中进行处理，获得答复信息。

为了通过将某一时段内反映特定地点或特定的人群问题的留言进行归类后确定各所述主题分类词语的热度指标的评价，本说明书实施例中通过获取各主体词语的热度评价，从而根据因子分析法对热度评价进行排序获得待回复主题分类词语，并将待回复主题分类词语相对应的留言问题信息加入处理队列中进行处理，获得答复信息。具体地，将特定地点、人群的问题留言作为评价指标的选取定义，采用如下表1所示的热度热度评价指标集确定出大众认可度(包括反对数、点赞数)、问题迫切性(包括词量、词语出现频率、出现时长)两个评价指标。采用因子分析法对热度综合得分进行排序，选出前五个热度最高、亟需回复的问题。

表1.热度评价指标集

利用因子分析模型对热度指标特征进行分析，以实现对信息热度的评价。分析步骤为：首先需要对因子荷载矩阵A进行确定，然后是旋转因子，最后计算因子得分。

下面我们给出具体的方程加以说明：

先考虑两个因子的平面正交旋转。对因子荷载矩阵A按行计算共同度，考虑到各个变量的共同度之间的差异所造成的不平衡，需对A中的元素进行规格化处理，即每行的元素用每行的共同度除之。规格化后的矩阵，为了方便仍记为A，施行方差最大正交旋转(C为正交阵)：

其中，A为规格化后的因子荷载矩阵，与相关系数矩阵和特征向量有关，a为每行元素用每行共同度除之所得参数，p为矩阵的行数；C为方差最大正交旋转矩阵，φ为对角元素是唯一方差的p×p对角矩阵，可间接指定其初始值，对角元素计算为(1-公因子方差)；B为因子荷载矩阵与其平面正交旋转矩阵之积，b为各个公共因子的贡献率。

此时，我们引入因子得分函数，即：

F_j＝b_j1x₁+b_j2x₂+...+b_jpx_p,j＝1,2,...,m；其中，F为利用回归算法计算所得的单个因子得分函数，F_j用于表示第j个因子得分函数，x为因子得分函数相应自变量。

为了合理的估计因子得分函数，我们采用汤姆森回归法进行估计：

假设公共因子可以对p个变量做回归，由于假设变量及公共因子都已经标准化了，所以常数项为0，即回归方程为：

其中，/>为与F_j相对应的回归方程；

我们现在仅知道由样本值可得因子载荷阵A，由因子载荷的意义可知：

其中，α为综合变量的变化系数，γ为综合法所指定的视参数；

则我们有以下的方程组：

为原始变量的相关系数矩阵，

为载荷矩阵的第j列/>为第j个因子得分函数的系数，记为B。于是F＝BX就是估计因子得分的计算公式，其中X为载荷矩阵。根据上述的操作，能够得到各个热度指标的综合得分情况，通过得分情况对各个热度指标进行先后次序的排名，排名结果即为所求如下表2所示为本说明书实施例提供的某应用场景下的热点问题示意表格。根据热点挖掘出来的结果，能够针对性的完成热点问题处理，提高政务处理的工作效率，进而提高了人民满意度。

表2.某应用场景下的热点问题示意表格

S105：提取所述答复信息与所述留言问题信息的意见评价指标，建立评价模型以基于所述评价模型对待评价的答复信息进行评价。

为了能够从相关性、完整性、可解释性等多维角度对答复信息进行评价，以便于对答复信息进行规划性评价，保证答复信息的答复质量。本说明书实施例中提取答复信息和留言问题信息的意见评价指标，从而建立对应的评价模型，以便根据评价模型对待评价的答复信息进行评价。

具体地，在本说明书一个或多个实施例中，提取答复信息与留言问题信息的意见评价指标，建立评价模型以基于评价模型对待评价的答复信息进行评价，具体包括：

首先基于意见评价指标模板，提取出答复信息与所述留言问题信息中的可用内容，以基于斯皮尔曼等级相关系数法确定当前量化方法中的最优量化方法；其中，当前量化方法包括：极差化量化法、极小值量化法、极大值量化法、中心化量化方法、均值量化方法。基于最优量化方法对所述可用内容进行一致化处理，获得意见评价指标。其中，可以理解的是由于意见评价指标中存在极小型指标和极大型指标，所以需要对指标进行一致化。其中，需要说明的是可用内容为如下表3所示的文本内容结构中提取的重要信息，可用内容包括如下表4所示的用户相关信息中的留言主题、留言时间、留言详情，以及如下表5所示相关部门答复信息中的答复意见、答复时间。

表3.答复信息与留言问题信息的文本内容结构

表4.用户相关信息的可用内容

表5.相关部门答复信息的可用内容

答复意见	答复时间
		现将网友在平台《问政西地省》...	2019/5/10 14:56:53

因此根据上述可以用内容基于预置评价策略对意见评价指标与答复信息进行评价，可以确定出答复信息的评价结果；其中，需要说明的是答复质量包括：用于评价答复意见速度的第一评价结果，用于评价答复意见与留言问题信息的相关度的第二评价结果、用于评价答复意见的格式匹配度的第三评价结果、用于评价答复意见的完整性的第四评价结果。然后根据评价策略确定出各评价结果所对应的意见评价指标，以基于评价结果与评价结果对应的意见评价指标建立对应的评价模型。然后将待评价的答复信息根据评价模型进行评价。

进一步地，在本说明书一个或多个实施例中，基于预置评价策略对意见评价指标与答复信息进行评价，确定出答复信息的评价结果，具体包括以下过程：

首先根据答复信息的发布时间与留言问题信息的上传时间，确定出答复信息的答复速度，以对答复速度进行量化获得答复信息的第一评价结果。其中，需要说明的是对于答复速度的量化，我们可以通过对比用户的留言时间与相关部门的答复时间进行量化，用时间间隔代表回复速度。因为留言时间与答复时间间隔大部分在10天以上，因此，我们可以忽略秒的间隔，如下表6所示为本说明书实施例提供的某应用场景下留言答复速度的示意表。

表6.某应用场景下留言答复速度的示意表

留言时间	答复时间	答复速度
			2019/4/25 9:32:09	2019/5/10 14:56:53	15(天)

由上表6可知，时间间隔被量化为代表答复速度的参量，作为答复信息的第一评价结果。同时获取答复信息的答复意见与留言问题信息的留言详情，从而根据答复意见与留言详情的相似度，确定出答复信息的第二评价结果。并且获取答复信息的预设答复格式，以提取预设答复格式的格式关键词，根据格式关键词与答复信息的匹配率，确定出答复信息的第三评价结果。例如：答复意见中存在某种格式为：“您好：...反映问题...引起重视...对...回复如下：...经过核查(据查)...得...因为...目前...正在...感谢...理解与监督。”此时，根据以上格式提取关键词作为主题词，与答复意见中的文本内容进行比较，计算主题词在答复意见中匹配成功率P。此外，对答复信息进行文本预处理，以确定出答复信息的文本词量，并根据文本词量确定答复信息的第四评价结果，即根据答复意见内容的丰富度代表完整性，而丰富度利用答复意见当中的文本词量来表示。基于文本预处理的步骤对答复意见当中的文本词量来表示。基于文本预处理的步骤对答复意见文本进行去停用词后词量统计从而确定出答复信息的第四评价结果。汇总第一评价结果、第二评价结果、第三评价结果与第四评价结果，确定出答复信息的评价结果，通过对答复信息进行多维度评价确定出答复信息的评价结果，解决了现有技术中对于留言答复处理缺少答复信息评价过程导致的答复信息质量难以控制的问题。其中，需要说明的是，汇总第一评价结果、第二评价结果、第三评价结果与第四评价结果，确定出答复信息的评价结果时，是基于指标评价模型确定的，指标评价模型为：其中，/>z_i是第i个评价对象的评价结果，x_ij是第i个评价对象的第j项指标值，y_j是第j个评价指标的权重。

进一步地，在本说明书一个或多个实施例中，获取答复信息的答复意见与留言问题信息的留言详情，从而根据答复意见与留言详情的相似度，确定出答复信息的第二评价结果，具体包括以下过程：

首先基于PLDA主题模型对所述答复信息的答复意见，进行答复主题词的提取获得答复主题词集合，并获取留言问题信息的主题分类词语，确定主题分类词语集合。然后再根据词频-逆向文件频率模型确定出答复主题词集合中各答复主题词的向量值，并基于词频-逆向文件频率模型确定主题分类词语集合中各所述主题分类词语的向量值。其中需要说明的是词频-逆向文件频率模型为：TF-IDF＝TF*IDF其中，将各答复主题词的向量值与各主题分类词语的向量值输入到预置余弦定理计算模型中，从而确定出答复意见与留言详情的相似度，以将相似度值作为答复信息的第二评价结果。具体地，在本说明书某应用场景下确定出答复意见与留言详情的相似度的具体过程为：

将留言详情D中出现所有主题词的集合标记为W＝(W₁,W₂,...,W_M)。通过TF-IDF算法，可以得到答复内容d中每个词语TF-IDF值的向量，记做t＝(t₁,t₂,...,t_M)，其中t₁表示W₁在d中的TF-IDF值。其中，需要说明的是：

W为主题词的集合，M为主题词集合中主题词的个数，t为主题词在答复内容中TF-IDF值的向量，TF为词频，IDF为逆文档频率。

于是可以将要比较的问题d₁与答复d₂表示为TF-IDF值的向量：

d₁＝(t₁₁,t₁₂,...,t_1M)

d₂＝(t₂₁,t₂₂,...,t_2M)；

其中，d₁为需要比较的问题，d₂为需要比较的问题将要比较的答复(二者均为TF-IDF值的向量)

最后利用余弦定理计算相似度:

其中，cosθ为多维空间余弦相似度，θ为d₁与d₂二者TF-IDF值的向量之间的夹角，有点积和向量长度所得，当余弦值越接近1时，表明问题d₁与答复d₂越相似。

进一步地，为了能够根据各地答复信息的实际需求，及时改善政务服务工作方案，提高留言信息的处理质量。在本说明书一个或多个实施例中，基于评价模型对待评价的答复信息进行评价之后，方法还包括以下过程：

获取各地区所对应的智慧政务在预设时间段内的答复信息评价结果，以获取预设时间段内的答复信息评价结果的分布直方图。从而根据预设时间段内的答复信息评价结果的分布直方图，确定出答复信息评价结果的集中范围，并将集中范围内评价结果均值作为各地区所对应的智慧政务的评价值。根据预先设置的评价值的划分范围，确定出各地区所对应的智慧政务的答复质量。其中，答复质量包括：优秀等级、良好等级、中等等级、不良等级。获取各地区所对应的智慧政务连续时间段内的答复质量，如果确定连续时间段内的答复质量不存在优秀等级，那么就将对应的调整提醒信息发送到对应的智慧政务所在管理服务端，以便于管理服务端及时调整该晒政务服务。

如图4所示，本说明书一个或多个实施例中提供了一种智慧政务留言处理设备，设备包括：

至少一个处理器401；以及，

与所述至少一个处理器401通信连接的存储器402；其中，

所述存储器402存储有可被所述至少一个处理器401执行的指令，所述指令被所述至少一个处理器401执行，以使所述至少一个处理器401能够：

获取各所述主题分类词语的热度评价，以基于因子分析法对所述热度评价进行排序获得待回复主题分类词语，以将所述待回复主题分类词语相对应的留言问题信息加入处理队列中进行处理，获得答复信息。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备、非易失性计算机存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

以上所述仅为本说明书的一个或多个实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种智慧政务留言处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种智慧政务留言处理方法，其特征在于，将该留言问题描述文本输入预置分词模型进行预处理，获得所述留言问题描述文本的分词分类结果，具体包括：

3.根据权利要求2所述的一种智慧政务留言处理方法，其特征在于，将所述留言问题描述文本输入预置分词模型，获得所述留言问题描述文本的中文分词结果之前，所述方法还包括：

根据所述训练数据对初始分词模型进行训练，获得所述初始分词模型输出的分词结果；

对比所述初始分词模型输出的分词结果与所述训练数据中各所述历史处理数据标注的中文分词结果，确定所述初始分词模型是否符合要求；其中，所述初始分词模型为transformers模型；

若确定所述初始分词模型不符合要求，则获取所述初始分词模型的配置参数，则基于所述初始分词模型输出的分词结果与所述训练数据中各所述历史处理数据标注的中文分词结果，确定所述初始分词模型的分词误差值；

根据所述预测误差值对所述初始分词模型的配置参数进行修改，以对所述初始分词模型进行迭代更新，并基于所述训练数据对更新后的初始分词模型进行迭代训练，以获得符合要求的初始分词模型作为预置分词模型。

4.根据权利要求1所述的一种智慧政务留言处理方法，其特征在于，将所述分类结果导入结合随机森林算法的PLDA主题模型，获得预设数量的主题分类词语，具体包括：

5.根据权利要求1所述的一种智慧政务留言处理方法，其特征在于，提取所述答复信息与所述留言问题信息的意见评价指标，建立评价模型以基于所述评价模型对待评价的答复信息进行评价，具体包括：

基于预置评价策略对所述意见评价指标与所述答复信息进行评价，确定所述答复信息的评价结果；其中，所述评价结果包括：用于评价答复意见速度的第一评价结果，用于评价答复意见与所述留言问题信息的相关度的第二评价结果、用于评价所述答复意见的格式匹配度的第三评价结果、用于评价所述答复意见的完整性的第四评价结果；

将待评价的答复信息根据所述评价模型进行评价。

6.根据权利要求5所述的一种智慧政务留言处理方法，其特征在于，所述基于预置评价策略对所述意见评价指标与所述答复信息进行评价，确定所述答复信息的评价结果，具体包括：

7.根据权利要求6所述的一种智慧政务留言处理方法，其特征在于，获取所述答复信息的答复意见与所述留言问题信息的留言详情，以基于所述答复意见与所述留言详情的相似度，确定所述答复信息的第二评价结果，具体包括：

以将各所述答复主题词的向量值与各所述主题分类词语的向量值输入预置余弦定理计算模型，确定所述答复意见与所述留言详情的相似度，以将所述相似度值作为所述答复信息的第二评价结果。

8.根据权利要求1所述的一种智慧政务留言处理方法，其特征在于，基于所述评价模型对待评价的答复信息进行评价之后，所述方法还包括：

9.根据权利要求2所述的一种智慧政务留言处理方法，其特征在于，确定所述留言问题描述文本为有效问题，具体包括：

获取所述历史留言问题描述文本与所述留言问题描述文本的差异词语，若确定所述差异词语为无意义词语，且所述历史留言问题描述文本存在对应的历史答复信息，则确定所述留言问题描述文本为第二无效问题；

10.一种智慧政务留言处理设备，其特征在于，所述设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，