CN114415845A

CN114415845A - 反馈信息处理方法、装置、电子设备、介质及产品

Info

Publication number: CN114415845A
Application number: CN202111663886.4A
Authority: CN
Inventors: 潘雪玉
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-12-30
Filing date: 2021-12-30
Publication date: 2022-04-29

Abstract

本公开提供了一种反馈信息处理方法、装置、电子设备、介质及产品，涉及人工智能技术领域，尤其涉及自然语言处理技术领域。具体实现方案为：获取反馈素材库中已有的反馈素材；对所述反馈素材进行聚类，得到多个子聚类；在所述多个子聚类中的每个子聚类中，确定能够表征该子聚类中所有反馈素材的目标反馈素材。本公开对反馈素材库中已有的反馈素材进行聚类，并在聚类得到的每个子聚类中，确定能够表征该子聚类中所有反馈素材的目标反馈素材，能够降低反馈素材的重复率，提高反馈素材搜索效率。本公开在利用目标反馈素材对反馈信息进行补全时，能够提高反馈信息的补全准确率。

Description

反馈信息处理方法、装置、电子设备、介质及产品

技术领域

本公开涉及人工智能技术领域，尤其涉及自然语言处理技术领域，具体涉及一种反馈信息处理方法、装置、电子设备、介质及产品。

背景技术

对已输入信息进行自动补全是一种输入联想方法，应用于在用户输入信息时，根据用户已输入的信息，预测或扩散用户的意图。根据预测或扩散得到的用户意图，对用户输入的信息进行自动补全。向用户推荐自动补全后的信息。用户根据自己实际表达意愿，选择推荐的自动补全信息。相关技术中，在用户反馈体系中，用户反馈信息基本都是用户自行编写，存在描述不清楚的缺陷。

发明内容

本公开提供了一种反馈信息处理方法、装置、电子设备、介质及产品。

根据本公开的一方面，提供了一种反馈信息处理方法，包括：

获取反馈素材库中已有的反馈素材；对所述反馈素材进行聚类，得到多个子聚类；在所述多个子聚类中的每个子聚类中，确定能够表征该子聚类中所有反馈素材的目标反馈素材。

根据本公开的另一方面，提供了一种反馈信息处理方法，包括：

检测反馈信息输入操作，并确定已输入反馈信息；确定所述已输入反馈信息的关键词；在反馈素材库中确定匹配所述关键词的关键词索引，并基于所述关键词索引确定对所述已输入反馈信息进行素材补全的目标反馈素材；所述反馈素材库中包括通过上述所述反馈信息处理方法生成的目标反馈素材。

根据本公开的又一方面，提供了一种反馈信息处理装置，包括：

获取模块，用于获取反馈素材库中已有的反馈素材；聚类模块，用于对所述反馈素材进行聚类，得到多个子聚类；确定模块，用于在所述多个子聚类中的每个子聚类中，确定能够表征该子聚类中所有反馈素材的目标反馈素材。

检测模块，用于检测反馈信息输入操作，并确定已输入反馈信息；补全模块，用于确定所述已输入反馈信息的关键词，在反馈素材库中确定匹配所述关键词的关键词索引，并基于所述关键词索引确定对所述已输入反馈信息进行素材补全的目标反馈素材；所述反馈素材库中包括通过上述所述反馈信息处理方法生成的目标反馈素材。

根据本公开的又一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述所述反馈信息处理方法。

根据本公开的又一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行所述反馈信息处理方法。

根据本公开的又一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现所述反馈信息处理方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开实施例的反馈信息处理方法的流程示意图；

图2是根据本公开实施例的对反馈素材进行聚类的流程示意图；

图3是根据本公开实施例的A、B、C和D间的关联关系示意图；

图4是根据本公开实施例的关联关系图谱的示意图；

图5是根据本公开实施例的采用社区发现算法确定子聚类的流程示意图；

图6是根据本公开实施例的确定目标反馈素材的流程示意图；

图7是根据本公开实施例的补全反馈信息的流程示意图；

图8是根据本公开实施例的利用目标反馈素材进行补全的示意图；

图9是根据本公开实施例的利用目标反馈素材进行补全的场景示意图；

图10是根据一示例性实施例示出的一种反馈信息处理装置的框图；

图11是根据一示例性实施例示出的另一种反馈信息处理装置的框图；

图12示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本公开应用于反馈体系中对输入信息进行自动补全的场景。利用相关技术中对输入信息进行自动补全时，推荐的补全结果可能存在以下缺陷中的至少一种：推荐的补全结果容易集中在出现频次高的反馈信息，使出现频次低的反馈信息得不到曝光；对于没有上下文的场景，无法推荐符合用户意图的补全结果；基于时间敏感的自动补全方法不适用于无时间敏感的反馈体系。目前反馈体系中用户反馈基本都是用户自行编写，存在描述不清楚的缺陷。另外由于表达方式过于自由，导致很难通过策略模型对用户反馈进行语义理解和问题分类。采用人工靠经验整理的反馈信息，不仅成本高效率低，而且没有理论和数据依据，也不可传递。

鉴于此，本公开提供了一种反馈信息处理方法，对反馈系统中已有的反馈素材按照不同类型进行聚类，在每个类型中确定出能够反映该类型中所有反馈素材的反馈素材代表，并将确定出来的反馈素材代表进行存储。在检测到用户已经输入的反馈信息时，根据存储的反馈素材代表对用户已经输入的反馈信息进行补全，并将补全后的反馈信息推荐给用户。如此，可以提高向用户推荐反馈信息的准确率，以及推荐效率。

反馈系统可以理解为，为了提高用户使用应用程序的体验，为用户提供能够反馈用户在使用应用程序时的问题，需求和/或建议的系统。通过用户反馈信息解决用户问题、收集需求、处理投诉、解决漏洞等。本公开应用于用户反馈场景中，在用户反馈场景中用户输入的反馈信息有强烈的目的性，是为了解决某类问题。因此，本公开通过已有的反馈素材分析用户遇到的问题，以及表达问题的方式，确定能够表征大多数用户的目标反馈素材。通过目标反馈素材对用户输入的反馈信息进行补全，能够提高预测用户意图的准确度。

本公开下述实施例中，将结合附图对一种反馈信息处理方法进行说明。

图1是根据本公开实施例的反馈信息处理方法的流程示意图。如图1所示，本公开中的反馈信息处理方法，包括以下步骤。

在步骤S101中，获取反馈素材库中已有的反馈素材。

在步骤S102中，对反馈素材进行聚类，得到多个子聚类。

本公开通过聚类将表征相同含义的反馈素材聚在一起，得到子聚类。相同含义可以理解为同一问题的不同表达形式，或同一需求的不同表达形式。

在本公开实施例中，可以采用聚类算法对反馈素材进行聚类，得到多个子聚类。其中，聚类算法包括但不限于k-means聚类算法、层次聚类算法、自组织映射(Self-organizing Maps，SOM)算法以及模糊C均值(Fuzzy C-means，FCM)算法等。

示例的，本公开实施例以k-means聚类算法为例，说明对反馈素材库中已有的反馈素材进行聚类，得到多个子聚类。将已有的反馈素材组成一个数据集，并指定所要分成的类别数目K，K为正整数。从数据集中随机选择K个数据作为K个类别的初始聚类中心，对于数据集中除K个初始聚类中心之外的每个数据，分别计算该数据与K个初始聚类中心中的每个初始聚类中心之间的距离，并将该数据归到与该数据距离最近的初始聚类中心对应的类别中。然后根据K个类别中包括的数据，重新计算K个类别的新的聚类中心，然后将数据集中的数据重新进行分类，直到K个类别中的每个类别的相邻两次聚类中心之间的距离在预设距离内。通过k-means聚类算法对反馈素材进行聚类，可以得到K个子聚类。

在步骤S103中，在多个子聚类中的每个子聚类中，确定能够表征该子聚类中所有反馈素材的目标反馈素材。

反馈素材库中已有的反馈素材按照闭环流程，将每个反馈素材标记为某类问题。通过聚类，将表征同一类问题的反馈素材聚为一类，生成多个子聚类。在每个子聚类中确定能够表征该子聚类中所有反馈素材的目标反馈素材。

根据本公开实施例的反馈信息处理方法，对反馈素材库中已有的反馈素材进行聚类，并在聚类得到的每个子聚类中，确定能够表征该子聚类中所有反馈素材的目标反馈素材。通过目标反馈素材表征该目标反馈素材对应子聚类中除目标反馈素材外其余所有的反馈素材，能够降低反馈素材的重复率，提高反馈素材搜索效率。在利用目标反馈素材对反馈信息进行补全时，能够提高反馈信息的补全准确率。相比于采用全量日志的自动补全方法，本公开通过代表不同子聚类中的目标反馈素材补全反馈信息，提升补全反馈信息的全面性，避免对于表征不同问题的反馈信息，均采用频率最高的反馈素材进行补全。

在上述任意实施例的基础上，图2是根据本公开实施例的对反馈素材进行聚类的流程示意图。如图2所示，本公开中对反馈素材进行聚类，得到多个子聚类，包括以下步骤。

在步骤S201中，将反馈素材作为节点，确定各节点间反馈素材的相似度。

本公开实施例中为了便于表述，将反馈素材作为节点，后续实施例中，出现节点和反馈素材时，应理解其含义的一致性。

在步骤S202中，建立相似度大于相似度阈值的节点间的关联关系，以生成建立有关联关系的各节点之间的关联关系图谱。

将两个节点中的一个节点采用第一节点表征，将两个节点中的另一个节点采用第二节点表征。确定第一节点和第二节点间的相似度。确定第一节点和第二节点间的相似度与相似度阈值的关系。根据第一节点和第二节点间的相似度与相似度阈值的关系，确定第一节点和第二节点间的关联关系。若第一节点和第二节点间的相似度大于相似度阈值，则在第一节点和第二节点间建立关联关系。若第一节点和第二节点间的相似度小于相似度阈值，则不在第一节点和第二节点间建立关联关系。通过所有建立有关联关系的节点，形成关联关系图谱。

为了说明在有关联关系的各反馈素材间生成关联关系图谱，本公开实施例以物种之间关系网的建立为例进行说明。已知大猩猩属于脊椎动物，哺乳纲，人猿亚目，人科，以及黑猩猩属。金丝猴属于脊椎动物，哺乳纲，人猿亚目，猴科，以及仰鼻猴属。丹顶鹤属于脊椎动物，鸟科，金鸟亚纲，鹤形目以及鹤科。鹌鹑属于脊椎动物，鸟科，金鸟亚纲，鸡形目以及雉科。对比大猩猩与金丝猴，对比结果为大猩猩与金丝猴同属脊椎动物中的哺乳纲，且都属于哺乳纲、灵长目、类人猿亚目。对比大猩猩与丹顶鹤，对比结果为大猩猩与丹顶鹤同属脊椎动物，但属于不同的纲类。对比丹顶鹤和鹌鹑，对比结果为丹顶鹤和鹌鹑都属于脊椎动物中的鸟纲，且同属于今鸟亚纲。基于上面的对比结果，得到大猩猩与金丝猴存在较高的相似度，大猩猩与丹顶鹤存在较低相似度，以及丹顶鹤和鹌鹑间存在较高的相似度。设定两只动物至少属于同一纲且属于同一目，或者属于同一纲且属于同一亚纲才存在关联关系。例如，大猩猩与金丝猴之间存在关联关系，丹顶鹤和鹌鹑之间存在关联关系，大猩猩与丹顶鹤之间不存在关联关系。按照上述设定条件，根据各类动物间的关联关系，可以得到关联关系图谱。

按照上述方法，假设有四个反馈素材，为了便于区分，将四个反馈素材通过A、B、C和D表征。确定两两反馈素材间的相似度，A与B的相似度为0.8，A与C的相似度为0.3，A与D的相似度为0.6。B与C的相似度为0.6，B与D的相似度为0.4。C与D的相似度为0.6。设定条件在相似度大于相似度阈值的反馈素材间建立关联关系。其中，相似度阈值为0.5。如图3所示，在A和B，B和C以及A和D间建立关联关系。在满足设定条件的反馈素材之间建立关联关系，最终得到效果为图4所示的关联关系图谱。

在步骤S203中，基于社区发现算法，在关联关系图谱中确定属于同一社区结构的节点，将属于同一社区结构的节点所对应的反馈素材作为一个子聚类。

图5是根据本公开实施例的采用社区发现算法确定子聚类的流程示意图。如图5所示，采用社区发现算法确定子聚类的包括以下步骤。

在步骤S301中，计算关联关系图谱中各个节点的度，从中选择度最大的节点i作为初始社区Ci，并初始化模块度Q＝0。

在本公开中，各节点的度可以理解为和该节点相关联的边数。

在步骤S302中，找出所有与社区Ci相连接的节点，并把它们放入邻近节点集N中。

在步骤S303中，计算节点集N中的每个节点j对社区Ci的贡献度q，并将对社区具有最大贡献度的节点加入到社区Ci中。

在步骤S304中，计算社区Ci的模块度Q'。若Q'＞Q，则将节点j加入社区Ci成功，并将节点j做上标记，同时更新模块度Q＝Q'，返回步骤S302，继续执行；否则，转步骤S305中。

在步骤S305中，得到社区Ci。此时模块度Q已经达到最大值，即当前社区Ci达到划分的最优结果。

在步骤S306中，如果不存在未作标记的节点，关联关系图谱中的所有社区已检测到，则过程结束；否则，从没有标记的节点中选择度最大的节点，作为新的初始社区Ci，返回步骤S302继续执行。

通过上述社区发现算法，在关联关系图谱中确定属于同一社区结构的节点，将属于同一社区结构的节点所对应的反馈素材作为一个子聚类。

本公开中，在反馈信息间通过相似度，建立各节点间的关联关系，并通过社区发现算法，在建立有关联关系的各节点之间的关联关系图谱中，确定子聚类。一个子聚类表征一个用户问题，或一个用户需求，或一个用户建议。通过多个子聚类表征用户问题、需求或建议的反馈素材，避免直接在已有的反馈素材中确定有代表性的反馈素材时，采用同一个出现频率高的反馈素材代表多个不同的问题集合。

在本公开实施例中，通过各节点间的相似度，建立各节点间的关联关系。通过社区发现算法，确定属于同一社区结构的节点。如此，可以从同一社区中确定目标节点，通过各社区的目标节点对反馈信息进行补全。确定目标节点可以理解为在关联关系图谱中确定中心点。可以采用中心点算法确定目标节点。中心点算法包括点度中心性算法、中介中心性算法、接近中心性算法和特征向量中心性算法。本公开并不限定采用的中心点算法。本公开是为了确定大多数用户的想法，向用户推荐的反馈素材应该是最大程度符合该用户的表达方式。故，为了保证能够准确的预测用户意图，向用户推荐符合用户意图的反馈信息，本公开采用特征向量中心性算法确定关联关系图谱中的中心点，即目标节点。换言之，特征向量中心性算法是在关联关系图谱中确定与其他节点进行直接相连以及间接相连最多的节点。在通过聚类算法得到的子聚类中，确定子聚类中的各节点间的相似度。根据子聚类中的各节点间的相似度与相似度阈值的关系，确定各节点间的关联关系。之后利用特征向量中心性算法确定子聚类中的目标节点。

本公开实施例中通过图6说明确定目标节点的过程。图6是根据本公开实施例的确定目标反馈素材的流程示意图。如图6所示，本公开中确定能够表征该子聚类中所有反馈素材的目标反馈素材，包括以下步骤。

在步骤S401中，在同一子聚类包括的节点中，确定与其他节点产生关联关系最多的目标节点。

在图4所示的关联关系图谱中，在同一子聚类包括的节点中，确定与其他节点产生关联关系最多的目标节点。本实施例中的关联关系包括各节点间的直接关联，以及各节点间的间接关联。示例的，若第一节点与第二节点之间连接，第二节点与第三节点直接连接，则第一节点和第二节点，以及第二节点和第三节点属于直接连接，第一节点和第三节点属于间接连接。本公开并不限定两节点间间隔的节点个数。

在步骤S402中，将目标节点对应的反馈素材，作为目标反馈素材。

本公开实施例利用不同子聚类中的目标反馈素材对用户已输入的反馈信息进行补全，避免对于表征不同问题的反馈信息采用同一搜索频率高的反馈素材进行补全。

在本公开实施例中，反馈信息处理方法还包括，对目标反馈素材进行关键词解析，得到目标反馈素材的关键词，并将关键词作为目标反馈素材的关键词索引，保存在反馈素材库中。

例如，目标反馈素材为“文挡不影响阅读，请重新审核”对该目标反馈素材进行关键词解析，确定该目标反馈素材中的关键词为文挡，审核或文档审核。可以将文挡，审核和/或文档审核作为该目标反馈素材中的关键词索引。在关键词索引和对应的目标反馈素材间建立对应关系。将具有对应关系的关键词索引和目标反馈素材存储到反馈素材库中。

本公开实施例，通过关键词解析能够确定快速的确定与其对应的目标反馈素材，提高检索效率。

本公开实施例可以离线生成目标反馈素材，即通过数据分析、用户行为推演，能推荐出符合用户意图信息的目标反馈素材。将离线生成的目标反馈素材作为推荐的基础，目标反馈素材的关键词作为关键词索引。实时接收补全用户反馈信息请求，并返回向用户推荐的目标反馈素材。达到快速识别用户意图并补全功能。

基于相同的构思，本公开实施例还通过一种反馈信息处理方法，实现对反馈信息的补全。图7是根据本公开实施例的补全反馈信息的流程示意图。如图7所示，本公开实施例中反馈信息处理方法，包括以下步骤。

在步骤S501中，检测反馈信息输入操作，并确定已输入反馈信息。

在步骤S502中，确定已输入反馈信息的关键词。

对已输入反馈信息进行关键词解析，确定已输入反馈信息的关键词。

在步骤S503中，在反馈素材库中确定匹配关键词的关键词索引，并基于关键词索引确定对已输入反馈信息进行素材补全的目标反馈素材。

在本公开实施例中，反馈素材库中包括通过上述任一实施例中的方法生成的目标反馈素材。

通过本公开实施例提供的反馈信息处理方法，对已输入反馈信息采用各子聚类中的目标反馈素材进行素材补全，提高补全的准确率以及全面性。

本公开利用目标反馈素材对用户已输入的反馈信息进行实时补全。用户输入反馈信息时，以字作为单位，发出请求。提取用户已输入反馈信息中的关键词，检索预先生成的关键词索引，通过预测用户意图生成推荐，从而实现对用户输入反馈信息的补全。

本发明在用户反馈这个功能场景上，无需人工整理索引，基于理论和数据依据，计算出代表节点，可快速识别用户反馈意图，实现反馈信息自动补全的功能，

图8是根据本公开实施例的利用目标反馈素材进行补全的示意图。如图8所示，在本公开中将反馈素材库中已有的反馈素材作为样本集合，确定各样本间的相似度。进行样本相似度对比，根据样本间相似度对比结果确定子聚类。在子聚类中确定能够表征该子聚类中所有反馈素材的目标反馈素材。对目标反馈素材进行关键词解析，生成关键词索引。接收用户已经输入的反馈信息，从已经接收的反馈信息中提取关键词。在反馈素材库中检索与关键词匹配的关键词索引。基于关键词索引确定对已输入反馈信息进行素材补全的目标反馈素材。将对已输入反馈信息进行素材补全的目标反馈素材推荐给用户。

图9是根据本公开实施例的利用目标反馈素材进行补全的场景示意图。如图9所示，检测到用户输入“文档审核”，对“文档审核”进行关键词解析，确定已输出的反馈信息中包括的关键词为“文档”和“审核”。搜索关键词为“文档”和“审核”的关键词索引。在下拉框中向用户推荐“文档”和“审核”的关键词索引对应的目标反馈素材。为了便于区别，可以将关键词通过不同颜色进行标注。将本公开应用于反馈体系下的信息自动补全场景，从反馈素材间的关系出发，结合图论的社区发现与中心性，快速准确的预测到用户的意图，提高推荐的准确率与有效率。经测试，通过本公开进行的反馈信息补全被用户采纳的采纳率为50％。相比于相关技术中采纳率得到了大幅提升。

基于相同的构思，本公开实施例还提供一种反馈信息处理装置。

可以理解的是，本公开实施例提供的反馈信息处理装置为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。结合本公开实施例中所公开的各示例的单元及算法步骤，本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能，但是这种实现不应认为超出本公开实施例的技术方案的范围。

图10是根据一示例性实施例示出的一种反馈信息处理装置的框图。参照图10，该装置600包括获取模块601，聚类模块602和确定模块603。

获取模块601，用于获取反馈素材库中已有的反馈素材；聚类模块602，用于对反馈素材进行聚类，得到多个子聚类；确定模块603，用于在多个子聚类中的每个子聚类中，确定能够表征该子聚类中所有反馈素材的目标反馈素材。

在一种实施方式中，聚类模块602，用于：将反馈素材作为节点，确定各节点间反馈素材的相似度；建立相似度大于相似度阈值的节点间的关联关系，以生成建立有关联关系的各节点之间的关联关系图谱；基于社区发现算法，在关联关系图谱中确定属于同一社区结构的节点，将属于同一社区结构的节点所对应的反馈素材作为一个子聚类。

在一种实施方式中，确定模块603，用于：在同一子聚类包括的节点中，确定与其他节点产生关联关系最多的目标节点；将目标节点对应的反馈素材，作为目标反馈素材。

在一种实施方式中，装置600，还包括：存储模块604，用于对目标反馈素材进行关键词解析，得到目标反馈素材的关键词，并将关键词作为目标反馈素材的关键词索引，保存在反馈素材库中。

基于相同的构思，本公开实施例还提供一种反馈信息处理装置。图11是根据一示例性实施例示出的另一种反馈信息处理装置的框图。参照图11，该装置700包括检测模块701和补全模块702。

检测模块701，用于检测反馈信息输入操作，并确定已输入反馈信息；补全模块702，用于确定已输入反馈信息的关键词，在反馈素材库中确定匹配关键词的关键词索引，并基于关键词索引确定对已输入反馈信息进行素材补全的目标反馈素材；反馈素材库中包括通过上述任意一项实施例中的反馈信息处理方法生成的目标反馈素材。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图12示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图12所示，设备800包括计算单元801，其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序，来执行各种适当的动作和处理。在RAM 803中，还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

设备800中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如反馈信息处理方法。例如，在一些实施例中，反馈信息处理方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时，可以执行上文描述的反馈信息处理方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行反馈信息处理方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

通过本公开提供的技术方案，对反馈素材库中已有的反馈素材进行聚类，并在聚类得到的每个子聚类中，确定能够表征该子聚类中所有反馈素材的目标反馈素材。通过目标反馈素材表征该目标反馈素材对应子聚类中除目标反馈素材外其余所有的反馈素材，能够降低反馈素材的重复率，提高反馈素材搜索效率。在利用目标反馈素材对反馈信息进行补全时，能够提高反馈信息的补全准确率。相比于采用全量日志的自动补全方法，本公开通过代表不同子聚类中的目标反馈素材补全反馈信息，提升补全反馈信息的全面性，避免对于表征不同问题的反馈信息，均采用频率最高的反馈素材进行补全。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种反馈信息处理方法，包括：

获取反馈素材库中已有的反馈素材；

对所述反馈素材进行聚类，得到多个子聚类；

在所述多个子聚类中的每个子聚类中，确定能够表征该子聚类中所有反馈素材的目标反馈素材。

2.根据权利要求1所述的方法，其中，所述对所述反馈素材进行聚类，得到多个子聚类，包括：

将反馈素材作为节点，确定各节点间反馈素材的相似度；

建立相似度大于相似度阈值的节点间的关联关系，以生成建立有关联关系的各节点之间的关联关系图谱；

基于社区发现算法，在所述关联关系图谱中确定属于同一社区结构的节点，将属于同一社区结构的节点所对应的反馈素材作为一个子聚类。

3.根据权利要求2所述的方法，其中，所述确定能够表征该子聚类中所有反馈素材的目标反馈素材，包括：

在同一子聚类包括的节点中，确定与其他节点产生关联关系最多的目标节点；

将所述目标节点对应的反馈素材，作为目标反馈素材。

4.根据权利要求1至3中任意一项所述的方法，还包括：

对所述目标反馈素材进行关键词解析，得到所述目标反馈素材的关键词；

将所述关键词作为所述目标反馈素材的关键词索引，保存在所述反馈素材库中。

5.一种反馈信息处理方法，包括：

检测反馈信息输入操作，并确定已输入反馈信息；

确定所述已输入反馈信息的关键词；

在反馈素材库中确定匹配所述关键词的关键词索引，并基于所述关键词索引确定对所述已输入反馈信息进行素材补全的目标反馈素材；

所述反馈素材库中包括通过权利要求1-4中任意一项所述方法生成的目标反馈素材。

6.一种反馈信息处理装置，包括：

获取模块，用于获取反馈素材库中已有的反馈素材；

聚类模块，用于对所述反馈素材进行聚类，得到多个子聚类；

确定模块，用于在所述多个子聚类中的每个子聚类中，确定能够表征该子聚类中所有反馈素材的目标反馈素材。

7.根据权利要求6所述的装置，其中，所述聚类模块，用于：

将反馈素材作为节点，确定各节点间反馈素材的相似度；

8.根据权利要求7所述的装置，其中，所述确定模块，用于：

将所述目标节点对应的反馈素材，作为目标反馈素材。

9.根据权利要求6至8中任意一项所述的装置，还包括：

存储模块，用于对所述目标反馈素材进行关键词解析，得到所述目标反馈素材的关键词，并将所述关键词作为所述目标反馈素材的关键词索引，保存在所述反馈素材库中。

10.一种反馈信息处理装置，包括：

检测模块，用于检测反馈信息输入操作，并确定已输入反馈信息；

补全模块，用于确定所述已输入反馈信息的关键词，在反馈素材库中确定匹配所述关键词的关键词索引，并基于所述关键词索引确定对所述已输入反馈信息进行素材补全的目标反馈素材；

11.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法，或权利要求5所述的方法。

12.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-4中任一项所述的方法，或权利要求5所述的方法。

13.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-4中任一项所述的方法，或权利要求5所述的方法。