CN115392220A

CN115392220A - 一种满意度数值的确定方法及装置

Info

Publication number: CN115392220A
Application number: CN202211020824.6A
Authority: CN
Inventors: 孟李娜
Original assignee: Bank of China Ltd
Current assignee: Bank of China Ltd
Priority date: 2022-08-24
Filing date: 2022-08-24
Publication date: 2022-11-25

Abstract

本申请实施例提供了一种满意度数值的确定方法及满意度数值的确定装置，可应用于金融领域或其他领域，该方法包括：获取待处理数据；将待处理数据按照预设规则进行拆分，得到多个待处理分句；提取每个待处理分句的特征词，并对特征词进行聚类，确定特征词对应的影响因素；根据每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值，根据每个特征词对应的影响因素的满意度数值，计算每个影响因素对应的满意度数值，解决现有的用户满意度确定方法无法及时确定用户满意度和无法准确确定用户满意度的问题，能够快速且准确地确定用户满意度，从而提高确定用户满意度的效率和准确率。

Description

一种满意度数值的确定方法及装置

技术领域

本申请涉及计算机技术领域，尤其涉及一种满意度数值的确定方法及装置。

背景技术

近年来，客户满意度调查在国内外得到了普遍重视，特别是服务性行业的客户满意度调查已经成为企业发现问题、改进服务的重要手段之一。通过满意度调查了解客户的需求、企业存在的问题以及与竞争对手之间的差异，从而有针对性地改进服务工作，显得尤为重要。

目前，银行对客户满意度调查方面的研究较少，在对客户评论进行分析，即在对自然语言处理时，文本分句方式通常是通过段落分句，甚至是不分句，将整个评论作为情感分析对象。这样会使得文本研究粒度过大，影响分析结果，也会导致不能明确客户对银行的看法，更不能明确客户对银行各方面的满意度情况。

发明内容

有鉴于此，本申请的目的在于提供了一种满意度数值的确定方法及装置，能够快速且准确地确定用户满意度，从而提高确定用户满意度的效率和准确率，其具体技术方案如下：

第一方面，本申请提供了一种满意度数值的确定方法，所述方法包括：

获取待处理数据，所述待处理数据包括用户的评论内容；

将所述待处理数据按照预设规则进行拆分，得到多个待处理分句；

提取每个待处理分句的特征词，并对所述特征词进行聚类，确定每个特征词对应的影响因素；

根据所述每个待处理分句，基于预设的专用情感词典，计算所述每个特征词对应的影响因素的满意度数值；

根据所述每个特征词对应的影响因素的满意度数值，计算每个影响因素对应的满意度数值。

在一种可能的实现方式中，所述将所述待处理数据按照预设规则进行拆分，得到多个待处理分句，包括：

将所述待处理数据按照句号、感叹号和转折词进行拆分，得到多个待处理分句。

在一种可能的实现方式中，所述根据每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值，包括：

确定所述待处理分句中在所述特征词前的副词和在所述特征词后的副词；

确定所述待处理分句中在所述特征词前的情感词和在所述特征词后的情感词，所述情感词与所述专用情感词典中的情感词相同；

根据所述情感词对应的分值和所述副词对应的分值，计算所述特征词对应的影响因素的满意度数值。

在一种可能的实现方式中，在所述获取待处理数据之后，所述方法还包括：

对所述待处理数据进行数据清洗，所述数据清洗包括文本去重、机械压缩和短句删除中的至少一种。

在一种可能的实现方式中，在所述确定每个影响因素对应的满意度数值之后，所述方法还包括：

计算所述待处理数据中每个影响因素的相对权重值；

根据所述每个影响因素对应的满意度数值和所述每个影响因素的相对权重值，对所述每个影响因素进行统计。

第二方面，本申请还提供了一种满意度数值的确定装置，所述装置包括：

获取模块，用于获取待处理数据，所述待处理数据包括用户的评论内容；

拆分模块，用于将所述待处理数据按照预设规则进行拆分，得到多个待处理分句；

提取模块，用于提取每个待处理分句的特征词；

聚类模块，用于对所述特征词进行聚类，确定所述特征词对应的影响因素；

计算模块，用于根据所述每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值；

所述计算模块，还用于根据所述每个特征词对应的影响因素的满意度数值，计算每个影响因素对应的满意度数值。

在一种可能的实现方式中，所述拆分模块，具体用于：

在一种可能的实现方式中，所述计算模块在计算每个特征词对应的影响因素的满意度数值时具体用于：

在一种可能的实现方式中，所述装置还包括：

清洗模块，用于对所述待处理数据进行数据清洗，所述数据清洗包括文本去重、机械压缩和短句删除中的至少一种。

在一种可能的实现方式中，所述装置还包括：统计模块，

所述计算模块，还用于计算所述待处理数据中每个影响因素的相对权重值；

所述统计模块，用于根据所述每个影响因素对应的满意度数值和所述每个影响因素的相对权重值，对所述每个影响因素进行统计。

本申请实施例提供的方法，获取待处理数据；将待处理数据按照预设规则进行拆分，得到多个待处理分句；提取每个待处理分句的特征词，并对特征词进行聚类，确定每个特征词对应的影响因素；根据每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值；根据每个特征词对应的影响因素的满意度数值，计算每个影响因素对应的满意度数值，解决现有的用户满意度确定方法无法及时确定用户满意度和无法准确确定用户满意度的问题，能够快速且准确地确定用户满意度，从而提高确定用户满意度的效率和准确率。通过本申请实施例，对评论内容作更细致地划分，能够更精确地反馈用户各方面的满意程度，从而更清楚用户的关注点和态度，以便更好地进行整改提升。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请提供的一种满意度数值的确定方法实施例的流程图；

图2示出了本申请提供的一种满意度数值的确定装置的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

目前银行在客户产品服务满意度方面的分析欠缺，无法理清客户对银行服务、银行业务等各方面的态度，银行方也无法针对性提高。而分析客户满意度的有效方法是对客户评论及建议内容做分析。在客户评论内容分析，即自然语言处理方面，通常会将回车作为分句标准，将一段文字作为分析对象，导致句子过长，表达内容混杂。但就目前人们语言习惯而言，一段话中会包含多个句子，一个句子中可能包含转折词，并且句号或转折词前后所阐述的对象和情感都可能存在差别。所以，目前的客户评论内容分析方法会使得文本研究粒度过大，影响分析结果。

因此，本申请实施例提供一种满意度数值的确定方法，该方法包括：获取待处理数据；将待处理数据按照预设规则进行拆分，得到多个待处理分句；提取每个待处理分句的特征词，并对特征词进行聚类，确定每个特征词对应的影响因素；根据每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值；根据每个特征词对应的影响因素的满意度数值，计算每个影响因素对应的满意度数值，解决现有的用户满意度确定方法无法及时确定用户满意度和无法准确确定用户满意度的问题，能够快速且准确地确定用户满意度，从而提高确定用户满意度的效率和准确率。通过本申请实施例，对评论内容作更细致地划分，能够更精确地反馈用户各方面的满意程度，从而更清楚用户的关注点和态度，以便更好地进行整改提升。

请参见图1，示出了本申请实施例提供的一种满意度数值的确定方法实施例的流程图，本申请实施例至少包括以下步骤：

S110，获取待处理数据。

在本申请实施例中，获取能反映用户对银行态度的评论内容，将这些评论内容作为待处理数据。其中，待处理数据包括用户的评论内容。

本申请实施例在获取待处理数据之后，对待处理数据进行数据清洗。本申请实施例中，可以通过多种实现方式进行数据清洗，在此不进行限定，优选的，数据清洗包括文本去重、机械压缩和短句删除中的至少一种。

S120，将待处理数据按照预设规则进行拆分，得到多个待处理分句。

在本申请实施例中，将待处理数据按照预设规则进行拆分，得到多个待处理分句。

其中，将待处理数据按照预设规则进行拆分的其中一种实现方式可以是：

将待处理数据按照句号、感叹号和转折词进行拆分。

就目前人们的语言习惯而言，一段话中会包含多个句子，每个句子中可能会包含转折词，而句号或转折词前后阐述的对象和情感是可能存在差异的，所以，按照句号、感叹号和转折词对数据进行拆分，能够更准确地识别出用户想要表达的观点。

S130，提取每个待处理分句的特征词，并对特征词进行聚类，确定每个特征词对应的影响因素。

在本申请实施例中，得到多个待处理分句后，提取每个待处理分句的特征词，并对特征词进行聚类，确定特征词对应的影响因素。其中，影响因素包括银行的服务态度，理财产品的收益等。

提取每个待处理分句的名词和动词作为可以反映用户观点的特征词，并对特征词进行聚类，确定特征词对应的影响因素。

S140，根据每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值。

在本申请实施例中，根据每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值。

其中，预设的专用情感词典通过以下方式得到：

提取有关银行的评论内容作为研究样本，并根据评论内容所带星级确定评论内容的正负向情感，结合现有的情感词典，基于银行方面的专业知识，生成专用情感词典。其中，根据评论内容所带星级确定评论内容的正负向情感，例如，将带有1、2、3星级的评论内容确定为负向评论，带有4、5星级的评论内容确定为正向评论。

专用情感词典中包括正向情感词和负向情感词。有些词的结合可能和现有情感词典中的正负向标记相反，如“存款利润很高”中“高”是一种正向词汇，而“贷款利率高”中的“高”是一种负向词汇。所以，本申请实施例中的专用情感词典基于现有银行方面的专业知识建立。

其中，根据每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值，可以包括以下步骤：

S41，确定待处理分句中在特征词前的副词和在特征词后的副词；

S42，确定待处理分句中在特征词前的情感词和在特征词后的情感词，情感词与专用情感词典中的情感词相同；

S43，根据情感词对应的分值和副词对应的分值，计算特征词对应的影响因素的满意度数值。

本申请实施例先确定待处理分句中涉及的副词和情感词，再根据副词对应的分值和情感词对应的分值，计算特征词对应的影响因素的满意度数值。

在本申请实施例中，情感词和副词都有对应的分值，需要说明的是，情感词和副词对应的分值可以由技术人员根据实际场景需要进行设定，本申请不做限定。例如，正向情感词：+1，负向情感词：-1，副词(非常/特别)：3，副词(稍微/有点)：2。

S150，根据每个特征词对应的影响因素的满意度数值，计算每个影响因素对应的满意度数值。

在本申请实施例中，根据每个特征词对应的影响因素的满意度数值，计算每个影响因素对应的满意度数值，即将每个特征词对应的影响因素的满意度数值进行汇总，属于同一个影响因素的满意度数值相加，得到每个影响因素对应的满意度数值。

S160，计算待处理数据中每个影响因素的相对权重值。

在本申请实施例中，待处理数据对应多个影响因素，可以计算每个影响因素的相对权重值，从而进行有针对性地改进。

其中，计算待处理数据中每个影响因素的相对权重值，可以包括以下步骤：

S61，计算待处理数据中每个影响因素的权重值；

S62，将待处理数据中每个影响因素的权重值除以各个影响因素的权重值的总和，得到每个影响因素的相对权重值。

词频-逆文件频率(term frequency–inverse document frequency，TF-IDF)是一种用于信息检索与数据挖掘的常用加权技术。本申请实施例利用TF-IDF计算各个影响因素的权重值：

其中，w_i表示第i个影响因素的权重值，p_i表示第i个影响因素对应的特征词出现的频数，M代表待处理分句的个数，m_i表示包含第i个影响因素的待处理分句的个数。

S170，根据每个影响因素对应的满意度数值和每个影响因素的相对权重值，对每个影响因素进行统计。

在本申请实施例中，根据各个影响因素对应的满意度数值和各个影响因素的相对权重值，对各个影响因素进行统计，以便对相对权重值高满意度数值低的影响因素对应的业务进行改进。

在本申请实施例中，获取待处理数据；将待处理数据按照预设规则进行拆分，得到多个待处理分句；提取每个待处理分句的特征词，并对特征词进行聚类，确定特征词对应的影响因素；根据每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值，根据每个特征词对应的影响因素的满意度数值，计算每个影响因素对应的满意度数值，解决现有的用户满意度确定方法无法及时确定用户满意度和无法准确确定用户满意度的问题，能够快速且准确地确定用户满意度，从而提高确定用户满意度的效率和准确率。通过本申请实施例，对评论内容作更细致地划分，能够更精确地反馈用户各方面的满意程度，从而更清楚用户的关注点，以便更好地进行整改提升。

接下来对本申请提供的一种满意度数值的确定装置进行介绍，下文介绍的一种满意度数值的确定装置与上文介绍的一种满意度数值的确定方法可相互对应参照。

请参见图2，示出了本申请提供的一种满意度数值的确定装置的结构示意图，所述装置包括：

获取模块201，用于获取待处理数据，所述待处理数据包括用户的评论内容；

拆分模块202，用于将所述待处理数据按照预设规则进行拆分，得到多个待处理分句；

提取模块203，用于提取每个待处理分句的特征词；

聚类模块204，用于对所述特征词进行聚类，确定所述特征词对应的影响因素；

计算模块205，用于根据所述每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值；

所述计算模块205，还用于根据所述每个特征词对应的影响因素的满意度数值，计算每个影响因素对应的满意度数值。

在本申请实施例中，所述拆分模块202，具体用于：

在本申请实施例中，所述计算模块205在计算每个特征词对应的影响因素的满意度数值时，具体用于：

在本申请实施例中，所述装置还包括：

在本申请实施例中，所述装置还包括：统计模块，

所述计算模块205，还用于计算所述待处理数据中每个影响因素的相对权重值；

需要说明的是，本申请提供的(一种满意度数值的确定方法及装置)可用于金融领域或其他领域，例如，可用于金融领域中的用户满意度数值计算的应用场景。其他领域为除金融领域之外的任意领域，例如，计算机领域。上述仅为示例，并不对本申请提供的(一种满意度满意度数值的确定方法及装置)的应用领域进行限定。

需要说明的是，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例、系统类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

对于前述的各实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种满意度数值的确定方法，其特征在于，所述方法包括：

获取待处理数据，所述待处理数据包括用户的评论内容；

2.根据权利要求1所述的方法，其特征在于，所述将所述待处理数据按照预设规则进行拆分，得到多个待处理分句，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据每个待处理分句，基于预设的专用情感词典，计算每个特征词对应的影响因素的满意度数值，包括：

4.根据权利要求1至3任一项所述的方法，其特征在于，在所述获取待处理数据之后，所述方法还包括：

5.根据权利要求1至3任一项所述的方法，其特征在于，在所述确定每个影响因素对应的满意度数值之后，所述方法还包括：

计算所述待处理数据中每个影响因素的相对权重值；

6.一种满意度数值的确定装置，其特征在于，所述装置包括：

提取模块，用于提取每个待处理分句的特征词；

7.根据权利要求6所述的装置，其特征在于，所述拆分模块，具体用于：

8.根据权利要求6所述的装置，其特征在于，所述计算模块在计算每个特征词对应的影响因素的满意度数值时具体用于：

9.根据权利要求6至8任一项所述的装置，其特征在于，所述装置还包括：

10.根据权利要求6至8任一项所述的装置，其特征在于，所述装置还包括：统计模块，