CN108876407B

CN108876407B - 一种数据处理方法及电子设备

Info

Publication number: CN108876407B
Application number: CN201810685775.5A
Authority: CN
Inventors: 缪庆亮; 胡长建; 李杨
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2018-06-28
Filing date: 2018-06-28
Publication date: 2022-04-19
Anticipated expiration: 2038-06-28
Also published as: WO2020000875A1; CN108876407A

Abstract

本发明公开了一种数据处理方法及电子设备，当接收到第一用户发送的问题信息时，获取第一用户的用户信息，根据第一用户的用户信息确定第一用户标签聚类，将第一用户标签聚类确定为第一用户的用户标签聚类，依据第一用户标签聚类的技术水平参数回复第一用户发送的问题信息。本方案通过根据不同用户的用户信息确定该用户对应的不同的用户标签聚类，从而实现根据每个用户的用户标签聚类所对应的技术水平参数回复其所提出的问题，实现了根据不同用户的不同专业水平进行针对性解答。

Description

一种数据处理方法及电子设备

技术领域

本发明涉及处理领域，尤其涉及一种数据处理方法及电子设备。

背景技术

在客服系统中，用户通过客服系统输入想要问的问题，客服根据用户提出的问题进行解答。

然而，由于不同用户的技术水平或对产品使用的知识参差不齐，对于客服人员来说，有些用户的问题比较容易解答，有些用户的问题比较复杂；而对于用户来说，技术水平较低或者对产品使用的知识了解较少的用户需要客服人员提供较为详细的回答，而技术水平较高或者对产品使用的知识了解较多的用户则不需要客服人员进行较多的解释。

为了针对不同用户，为不同用户提供具有针对性的问题解答，就需要对不同用户进行技术水平的评估。

发明内容

有鉴于此，本发明提供一种数据处理方法及电子设备，以解决现有技术中针对不同用户提出的问题，无法提供具有针对性的解答的问题，其具体方案如下：

一种数据处理方法，包括：

当接收到第一用户发送的问题信息时，获取所述第一用户的用户信息；

根据所述第一用户的用户信息确定第一用户标签聚类，将所述第一用户标签聚类确定为所述第一用户的用户标签聚类；

依据所述第一用户标签聚类的技术水平参数回复所述第一用户发送的问题信息。

进一步的，根据所述第一用户的用户信息确定第一用户标签聚类，包括：

查找用户关系图，所述用户关系图包括：不少于两个用户及每两个用户间的相似度；

当所述用户关系图中包括所述第一用户时，根据所述用户关系图中初始用户的用户标签聚类确定所述第一用户的第一用户标签聚类。

根据所述第一用户的用户信息确定所述第一用户与第一数量的用户标签聚类的相似度排行；

按照相似度确定第一用户标签聚类。

进一步的，所述根据所述用户关系图中初始用户的用户标签聚类确定所述第一用户的第一用户标签聚类，包括：

从所述用户关系图中的不少于两个用户中确定初始用户，为所述初始用户设定用户标签聚类；

根据所述用户关系图中每两个用户间的相似度及迭代函数确定所述用户关系图中的不少于两个用户中除所述初始用户外的其他用户的用户标签聚类。

进一步的，所述从所述用户关系图中的不少于两个用户中确定初始用户，包括：

为所述用户关系图中的不少于两个用户中每个用户所发送的问题信息设置问题聚类；

确定每个问题聚类中人数所占比例，其中，所述问题聚类中人数所占比例为：提出每个问题聚类下的问题所对应的用户数量与提出所有问题聚类下所有问题所对应的用户数量的比值；

按照所述每个问题聚类中人数所占比例确定每个问题聚类所对应的初始用户数量；

按照所述每个问题聚类所对应的初始用户数量确定初始用户。

进一步的，还包括：

接收第一用户发送的问题信息，确定接收到所述问题信息的第一时间间隔内，是否接收到其他问题信息；

当在接收到所述问题信息的第一时间间隔内，接收到其他问题信息，将所述问题信息与其他问题信息合并。

一种电子设备，包括：处理器及存储器，其中：

所述存储器用于存储用户标签聚类及与所述用户标签聚类对应的技术水平参数；

所述处理器用于当接收到第一用户发送的问题信息时，获取所述第一用户的用户信息，根据所述第一用户的用户信息确定第一用户标签聚类，将所述第一用户标签聚类确定为所述第一用户的用户标签聚类，依据所述第一用户标签聚类的技术水平参数回复所述第一用户发送的问题信息。

进一步的，所述处理器根据所述第一用户的用户信息确定第一用户标签聚类，包括：

所述处理器查找用户关系图，所述用户关系图包括：不少于两个用户及每两个用户间的相似度，当所述用户关系图中包括所述第一用户时，根据所述用户关系图中初始用户的用户标签聚类确定所述第一用户的第一用户标签聚类。

所述处理器根据所述第一用户的用户信息确定所述第一用户与第一数量的用户标签聚类的相似度排行，按照相似度确定第一用户标签聚类。

进一步的，所述处理器根据所述用户关系图中初始用户的用户标签聚类确定所述第一用户的第一用户标签聚类，包括：

所述处理器从所述用户关系图中的不少于两个用户中确定初始用户，为所述初始用户设定用户标签聚类，根据所述用户关系图中每两个用户间的相似度及迭代函数确定所述用户关系图中的不少于两个用户中除所述初始用户外的其他用户的用户标签聚类。

从上述技术方案可以看出，本申请公开的数据处理方法及电子设备，当接收到第一用户发送的问题信息时，获取第一用户的用户信息，根据第一用户的用户信息确定第一用户标签聚类，将第一用户标签聚类确定为第一用户的用户标签聚类，依据第一用户标签聚类的技术水平参数回复第一用户发送的问题信息。本方案通过根据不同用户的用户信息确定该用户对应的不同的用户标签聚类，从而实现根据每个用户的用户标签聚类所对应的技术水平参数回复其所提出的问题，实现了根据不同用户的不同专业水平进行针对性解答。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例公开的一种数据处理方法的流程图；

图2为本发明实施例公开的一种数据处理方法的流程图；

图3为本发明实施例公开的一种数据处理方法的流程图；

图4为本发明实施例公开的一种数据处理方法的流程图；

图5为本发明实施例公开的一种数据处理方法的流程图；

图6为本发明实施例公开的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明公开了一种数据处理方法，其流程图如图1所示，包括：

步骤S11、当接收到第一用户发送的问题信息时，获取第一用户的用户信息；

在客服系统或网页、论坛等系统中，当有用户进行提问时，该提问的用户必然是处于登录状态，可以在用户发送提问信息时，由该用户登录的账户获知该用户的用户信息。

其中，用户信息可以为：用户在注册或补充该已登录的账户时所填写的个人信息，还可以为：该用户所登录的账户在之前所发出的提问或发言等信息。

例如：在客服系统中，用户向客服发送问题，在其发送问题之前，该用户需要首先进行账户的登录，登录后，将该问题发送给客服，之后，客服系统从账户中获取该用户的用户信息，如：年龄、使用产品的时间、使用产品的个数、用户曾经问过的问题等。

步骤S12、根据第一用户的用户信息确定第一用户标签聚类，将第一用户标签聚类确定为第一用户的用户标签聚类；

预先设置多个用户标签聚类，不同的用户标签聚类对应不同的技术水平参数，通过不同的技术水平参数表示对应的用户标签聚类中用户的技术水平。

例如：预先设置3个用户标签聚类，分别是第一用户标签聚类，第二用户标签聚类及第三用户标签聚类，第一用户标签聚类对应技术水平高，技术水平参数可以为1；第二用户标签聚类对应技术水平中，技术水平参数可以为2；第三用户标签聚类对应技术水平低，技术水平参数可以为3。

根据第一用户的用户信息确定第一用户标签聚类，可以具体为：根据第一用户中不同的用户信息综合评定该用户的用户标签聚类。

例如：用户所咨询的产品为电子产品，用户年龄为30岁，使用该电子产品的时间为3年，并且，该用户曾经问过的问题都比较专业。由于年轻人对电子产品的了解比较清楚，并且已经使用该电子产品达到3年时间，其问过的问题也比较专业，那么，可以由此确定该用户所属的用户标签聚类为第一用户标签聚类，技术水平高；

若用户所咨询的产品为电子产品，用户年龄为65岁，使用该电子产品的时间为3个月，由于老年人对电子产品了解较少，并且使用该电子产品的时间较短，可以由此确定该用户所属的用户标签聚类为第三用户标签聚类，技术水平低。

本实施例公开的数据处理方法中，也可以采用其他方式确定用户的用户标签聚类，在此不做具体限定。

步骤S13、依据第一用户标签聚类的技术水平参数回复第一用户发送的问题信息。

由于不同的用户标签聚类对应不同的技术水平参数，根据不同的技术水平参数可以确定属于该对应的用户标签聚类中的用户的技术水平，那么，依据不同用户的不同技术水平回复其所提出的问题。

不同的技术水平参数对应不同的问题回复方式，如：对于技术水平低的用户，回复其所提出的问题时，使用较为浅显的语言，尽量减少专业用语，回复内容较长；对于技术水平高的用户，回复其所提出的问题时，可以使用较为专业的术语，回复内容以简短为主。

本实施例公开的数据处理方法，当接收到第一用户发送的问题信息时，获取第一用户的用户信息，根据第一用户的用户信息确定第一用户标签聚类，将第一用户标签聚类确定为第一用户的用户标签聚类，依据第一用户标签聚类的技术水平参数回复第一用户发送的问题信息。本方案通过根据不同用户的用户信息确定该用户对应的不同的用户标签聚类，从而实现根据每个用户的用户标签聚类所对应的技术水平参数回复其所提出的问题，实现了根据不同用户的不同专业水平进行针对性解答。

本实施例公开了一种数据处理方法，其流程图如图2所示，包括：

步骤S21、当接收到第一用户发送的问题信息时，获取第一用户的用户信息；

步骤S22、查找用户关系图，用户关系图包括：不少于两个用户及每两个用户间的相似度；

预先存储用户关系图，该用户关系图中为：不少于两个用户，以及每两个用户之间的相似度。

具体的，构建用户关系图需要首先提取用户特征并进行特征值计算，之后构建用户及特征矩阵。

提取用户特征可以具体为：提取预先定义的用户特征和问句特征，如表1用户特征说明及表2用户问题特征说明所示：

表1

用户特征名称	特征值	特征说明
			用户年龄	整数值	根据用户注册时填的信息估算出年龄
用户使用手机数	整数值	用户购买手机的次数
			用户使用手机时间跨度	整数值	用户第一次购买手机到问问题的时间间隔

表2

用户问题特征名称	特征值	特征说明
			用户问题中专业词频率	整数值	用户历史问题中专业词汇出现的频率
用户问题的代表性	整数值	用户问题所在聚类的样本数
			用户问题答案详细程度	整数值	用户问题对应答案的字符数
用户问题数	整数值	用户历史问题数量
			用户对话时间	整数值	用户对话平均耗时
用户交互轮数	整数值	用户与客服人员交互的轮数

其中，表1中包括：用户特征的名称、特征值及特征说明，如：当用户在客服系统中所发送的问题是针对手机进行的咨询，用户特征为用户年龄时，其是根据用户注册时填的信息估算出的年龄；用户特殊为用户使用手机数时，其是根据用户购买手机的次数确定的；用户特征为用户使用手机时间跨度，其是根据用户第一次购买手机到问当前问题之间的时间间隔确定的。

表2中包括：用户问题特征的名称、特征值及特征说明，如：当用户在客服系统中所发送的问题是针对手机进行的咨询，用户问题特征为用户问题中专业词频率，其是根据用户历史问题中专业词汇出现的频率确定的；用户问题特征为用户问题的代表性，其是根据用户问题所在聚类的样本数确定的；用户问题特征为用户问题答案详细程度，其是根据用户问题对应的答案的字符数确定的；用户问题特征为用户问题数，其是根据用户历史问题数量确定的；用户问题特征为用户对话时间，其是根据用户在客服系统中的历史问题对话的平均耗时确定的；用户问题特征为用户交互轮数，其是根据用户在客服系统中的历史问题中，用户与客服交互的轮数确定的。

构建用户及特征矩阵M，矩阵每一行表示一个用户，矩阵每一列表示一维特征，然后对每一列进行归一化处理。

假设用户关系图G为全链接：

用户关系图G由用户U和用户相似度组成，其中，G的节点为用户，边为用户之间的相似度，定义一个节点V_i＝<U_i,Q_i>，其中，V_i为第i个节点，U_i为V_i的用户信息部分，Q_i为V_i的用户问题部分，节点之间的边表示节点的相似度。节点V_i＝<U_i,Q_i>与V_j＝<U_j,Q_j>之间的相似度的计算方法如下：

sim(V_i,V_j)＝αsim(U_i,U_j)+(1-α)sim(Q_i,Q_j) 公式(1)

其中，公式(1)、(2)及(3)中的U_i、U_j、Q_i、Q_j均为归一化后的特征值，δ及γ为常数。

经过上述步骤可实现用户关系图的构建。

步骤S23、当用户关系图中包括第一用户时，根据用户关系图中初始用户的用户标签聚类确定第一用户的第一用户标签聚类；

当上述步骤中构建完成的用户关系图中的用户中包括有第一用户，即发送问题信息的用户时，直接根据用户关系图中的初始用户的用户标签聚类确定第一用户的第一用户标签聚类。

具体的，预先从用户关系图中的不少于两个用户中确定初始用户，为初始用户设定用户标签聚类，根据用户关系图中每两个用户间的相似度及迭代函数确定用户关系图中的不少于两个用户中除初始用户外的其他用户的用户标签聚类。

当用户关系图中所有用户的用户标签聚类均已确定时，那么，用户关系图中的第一用户所属的用户标签聚类也已确定。

进一步的，根据用户关系图中每两个用户间的相似度及迭代函数确定用户关系图中的不少于两个用户中除初始用户外的其他用户的用户标签聚类，可以具体为：

设n*n矩阵M为用户关系图G的边权重矩阵，该矩阵中的元素m_ij表示节点r_i和r_j的相似度，之后对M的每个行向量进行归一化得到矩阵M'，M'中的每个元素通过公式(4)计算得到，使得M'的每个行向量中各项之和为1。

对于图中节点设置其类别信息向量，对于初始标注类别节点设置器小类别向量为：v＝(0,...,1_t,...，0)_n。

以n＝2为例：

对于已标注类别的节点，设其类别向量为v＝(0,...,1_t,...，0)_n，该向量的第t维为1，其余纬度为0，在迭代的第k+1步中，每个类别节点r的类别向量v被改写成v_k+1＝M'v_k。

类别扩散过程中，迭代的更新每个节点的类别向量之后，初始标注类别的节点的类别向量将被恢复为初始设置向量，使其与标注类别相一致，而对于其他未标注类别的节点，当第i次迭代后，计算该节点此次迭代前后两个类别向量的余弦相似度sim(v_i,v_i+1)，并且，记第i次迭代对该节点的影响度为impact(v_i)＝1-sim(v_i,v_i+1)。

以第i次迭代后所有节点平均的影响度average_impact(i)作为类别扩散是否平衡的标准：

如果第i次迭代后的节点平均影响度小于一定阈值，就认为扩散已经达到平衡，并且终止迭代的类别扩散过程。

扩散达到平衡时，对图中的每个节点r的类别信息向量v＝(p(c₁),p(c₂),...,p(c_n))_n，取关系类别向量中最大维度对应的类别为该关系对的类别，type(v)＝argmaxp(c_i)。

其中，不同类别即为不同的技术水平。

步骤S24、依据第一用户标签聚类的技术水平参数回复第一用户发送的问题信息。

本实施例公开了一种数据处理方法，其流程图如图3所示，包括：

步骤S31、当接收到第一用户发送的问题信息时，获取第一用户的用户信息；

步骤S32、查找用户关系图，用户关系图包括：不少于两个用户及每两个用户间的相似度；

步骤S33、当用户关系图中包括第一用户时，为用户关系图中的不少于两个用户中每个用户所发送的问题信息设置问题聚类；

步骤S34、确定每个问题聚类中人数所占比例，其中，问题聚类中人数所占比例为：提出每个问题聚类下的问题所对应的用户数量与提出所有问题聚类下所有问题所对应的用户数量的比值；

步骤S35、按照每个问题聚类中人数所占比例确定每个问题聚类所对应的初始用户数量；

步骤S36、按照每个问题聚类所对应的初始用户数量确定初始用户，为初始用户设定用户标签聚类；

为用户关系图中所有用户所提出的所有问题设置问题聚类，每个问题聚类下对应不少于一个问题。

例如：设置5个问题聚类，第一个问题聚类下包括100个问题，第二个问题聚类下包括300个问题，第三个问题聚类下包括200个问题，第四个问题聚类下包括400个问题，第五个问题聚类下包括500个问题。

在每个问题聚类下，一个问题对应一个用户，那么，第一个问题聚类下100个问题，就对应100个用户，即有100个用户提出过属于第一个问题聚类的问题；第二个问题聚类下300个问题，就对应300的用户，即有300个用户提出过属于第二个问题聚类的问题。

确定每个问题聚类中人数所占比例，即：提出每个问题聚类下的问题所对应的用户数量与提出所有问题聚类下所有问题所对应的用户数量的比例，其中，提出所有问题聚类下所有问题所对应的用户数量，即5个问题聚类一共有1500个问题，对应1500个用户，那么，第一个问题聚类中人数所占比例为：100/1500，即1/15；第二个问题聚类中人数所占比例为：300/1500，即3/15；第三个问题聚类中人数所占比例为：200/1500，即2/15；第四个问题聚类中人数所占比例为：400/1500，即4/15；第五个问题聚类中人数所占比例为：500/1500，即5/15。

按照每个问题聚类中人数所占比例确定每个问题聚类所对应的初始用户数量，即第一个问题聚类中人数所占比例为1/15，那么，在所有的初始用户中，从第一个问题聚类中抽取的用户数量占所有初始用户数量的1/15，即若所有初始用户一共有15人，那么，从第一个问题聚类中选取一个用户作为初始用户，从第二个问题聚类中选取3个用户作为初始用户，从第三个问题聚类中选取2个用户作为初始用户，从第四个问题聚类中选取4个用户作为初始用户，从第五个问题聚类中选取5个用户作为初始用户。即每个问题聚类中抽取的初始用户数量与该问题聚类中人数占所有问题聚类中人数的比例相关，并且，是呈正比的。

步骤S37、根据用户关系图中每两个用户间的相似度及迭代函数确定用户关系图中的不少于两个用户中除初始用户外的其他用户的用户标签聚类；

步骤S38、依据第一用户所对应的第一用户标签聚类的技术水平参数回复第一用户发送的问题信息。

本实施例公开了一种数据处理方法，其流程图如图4所示，包括：

步骤S41、当接收到第一用户发送的问题信息时，获取第一用户的用户信息；

步骤S42、根据第一用户的用户信息确定第一用户与第一数量的用户标签聚类的相似度排行；

步骤S43、按照相似度确定第一用户标签聚类，将第一用户标签聚类确定为第一用户的用户标签聚类；

预先设置第一数量的用户标签聚类，该第一数量的用户标签聚类是根据用户特征设置的。

当接收到第一用户发送的问题信息时，根据第一用户的用户信息确定第一用户与第一数量的用户标签聚类的相似度排行。

即根据第一用户的用户信息确定第一用户的用户特征，确定第一用户的用户特征与多个用户标签聚类中每一个用户标签聚类的相似度，将多个相似度进行排列，确定第一用户的用户特征与多个用户标签聚类中每一个用户标签聚类的相似度高低，选取相似度最高的用户标签聚类，将该用户标签聚类确定为第一用户标签聚类，即第一用户的用户标签聚类。

例如：预先设置5个用户标签聚类，当第一用户的用户特征与5个用户标签聚类的相似度高低排行为：C用户标签聚类→D用户标签聚类→A用户标签聚类→E用户标签聚类→B用户标签聚类，那么，其中与第一用户的用户特征相似度最高的为C用户标签聚类，相似度最低的为B用户标签聚类，将C用户标签聚类设置为第一用户标签聚类，即将C用户标签聚类确定为第一用户的用户标签聚类。

进一步的，也可以为：直接选取与第一用户的用户特征相似度最高的用户标签聚类，将其确定为第一用户的用户标签聚类，无需进行相似度高低排列。

进一步的，间隔固定时长，根据所有用户的用户特征，对用户标签聚类进行重新设置，即，当提出问题的用户增多时，用户标签聚类中的用户基数增多，根据新增的以及原有的所有用户的用户特征确定新的用户标签聚类。

步骤S44、依据第一用户标签聚类的技术水平参数回复第一用户发送的问题信息。

本实施例公开了一种数据处理方法，其流程图如图5所示，包括：

步骤S51、当接收到第一用户发送的问题信息时，确定接收到问题信息的第一时间间隔内，是否接收到其他问题信息；

步骤S52、当在接收到问题信息的第一时间间隔内，接收到其他问题信息，将问题信息与其他问题信息合并；

当接收到第一用户发送的问题信息时，首先确定在接收到该问题信息的第一时间间隔内是否接收到其他问题信息，其中，该第一时间间隔可以为：接收到该问题信息的时刻之前的第一预定时长以及接收到该问题信息的时刻之后的第二预定时长，如果在第一时间间隔内还接收到其他问题信息，则将问题信息与其他问题信息合并，以便于能够统一对用户进行回复，无需多次回复，或者，用户将一个问题分多次问完时，不会造成问题不清楚的情况。

进一步的，还可以为：过滤掉用户发送的问题信息的长度低于第一阈值的信息，如：打招呼、寒暄等信息，例如：Hi，Hello等。

步骤S53、获取第一用户的用户信息；

步骤S54、根据第一用户的用户信息确定第一用户标签聚类，将第一用户标签聚类确定为第一用户的用户标签聚类；

步骤S55、依据第一用户标签聚类的技术水平参数回复第一用户发送的合并后的问题信息。

本实施例公开了一种电子设备，其结构示意图如图6所示，包括：

处理器61及存储器62。

其中，存储器62用于存储用户标签聚类及与用户标签聚类对应的技术水平参数。

处理器61用于当接收到第一用户发送的问题信息时，获取第一用户的用户信息，根据第一用户的用户信息确定第一用户标签聚类，将第一用户标签聚类确定为第一用户的用户标签聚类，依据第一用户标签聚类的技术水平参数回复第一用户发送的问题信息。

处理器61根据第一用户的用户信息确定第一用户标签聚类，包括：

处理器用于查找用户关系图，用户关系图包括：不少于两个用户及每两个用户间的相似度，当用户关系图中包括第一用户时，根据用户关系图中初始用户的用户标签聚类确定第一用户的第一用户标签聚类。

表1

表2

假设用户关系图G为全链接：

sim(V_i,V_j)＝αsim(U_i,U_j)+(1-α)sim(Q_i,Q_j) 公式(1)

经过上述步骤可实现用户关系图的构建。

以n＝2为例：

其中，不同类别即为不同的技术水平。

处理器61从用户关系图中的不少于两个用户中确定初始用户，包括：

处理器用于为用户关系图中的不少于两个用户中每个用户所发送的问题信息设置问题聚类，确定每个问题聚类中人数所占比例，其中，问题聚类中人数所占比例为：提出每个问题聚类下的问题所对应的用户数量与提出所有问题聚类下所有问题所对应的用户数量的比值，按照每个问题聚类中人数所占比例确定每个问题聚类所对应的初始用户数量，按照每个问题聚类所对应的初始用户数量确定初始用户。

处理器根据第一用户的用户信息确定第一用户与第一数量的用户标签聚类的相似度排行，按照相似度确定第一用户标签聚类。

处理器61还用于：接收第一用户发送的问题信息，确定接收到问题信息的第一时间间隔内，是否接收到其他问题信息，当在接收到问题信息的第一时间间隔内，接收到其他问题信息，将问题信息与其他问题信息合并。

本实施例公开的电子设备，包括存储器及处理器，处理器用于当接收到第一用户发送的问题信息时，获取第一用户的用户信息，根据第一用户的用户信息确定第一用户标签聚类，将第一用户标签聚类确定为第一用户的用户标签聚类，依据第一用户标签聚类的技术水平参数回复第一用户发送的问题信息。本方案通过根据不同用户的用户信息确定该用户对应的不同的用户标签聚类，从而实现根据每个用户的用户标签聚类所对应的技术水平参数回复其所提出的问题，实现了根据不同用户的不同专业水平进行针对性解答。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种数据处理方法，其特征在于，包括：

当接收到第一用户发送的问题信息时，获取所述第一用户的用户信息；所述用户信息包括年龄、使用产品的时间、使用产品的个数、用户曾经问过的问题中的至少一项；

2.根据权利要求1所述的方法，其特征在于，根据所述第一用户的用户信息确定第一用户标签聚类，包括：

3.根据权利要求1所述的方法，其特征在于，根据所述第一用户的用户信息确定第一用户标签聚类，包括：

按照相似度确定第一用户标签聚类。

4.根据权利要求2所述的方法，其特征在于，所述根据所述用户关系图中初始用户的用户标签聚类确定所述第一用户的第一用户标签聚类，包括：

5.根据权利要求4所述的方法，其特征在于，所述从所述用户关系图中的不少于两个用户中确定初始用户，包括：

6.根据权利要求1所述的方法，其特征在于，还包括：

7.一种电子设备，其特征在于，包括：处理器及存储器，其中：

所述处理器用于当接收到第一用户发送的问题信息时，获取所述第一用户的用户信息，根据所述第一用户的用户信息确定第一用户标签聚类，将所述第一用户标签聚类确定为所述第一用户的用户标签聚类，依据所述第一用户标签聚类的技术水平参数回复所述第一用户发送的问题信息；

所述用户信息包括年龄、使用产品的时间、使用产品的个数、用户曾经问过的问题中的至少一项。

8.根据权利要求7所述的电子设备，其特征在于，所述处理器根据所述第一用户的用户信息确定第一用户标签聚类，包括：

9.根据权利要求7所述的电子设备，其特征在于，所述处理器根据所述第一用户的用户信息确定第一用户标签聚类，包括：

10.根据权利要求8所述的电子设备，其特征在于，所述处理器根据所述用户关系图中初始用户的用户标签聚类确定所述第一用户的第一用户标签聚类，包括：