CN109062914B

CN109062914B - 用户推荐方法和装置，存储介质和服务器

Info

Publication number: CN109062914B
Application number: CN201710438782.0A
Authority: CN
Inventors: 王明强; 杨洪宇
Original assignee: Neusoft Corp
Current assignee: Neusoft Corp
Priority date: 2017-06-12
Filing date: 2017-06-12
Publication date: 2020-10-23
Anticipated expiration: 2037-06-12
Also published as: CN109062914A

Abstract

本公开涉及一种用户推荐方法和装置，存储介质和服务器，以解决现有的用户推荐不够精准有效的技术问题。该方法包括：根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量；确定所述目标用户的特征向量以及所述待推荐用户的特征向量，其中，所述目标用户的特征向量包括所述目标用户的网络向量，所述待推荐用户的特征向量包括所述待推荐用户的网络向量；根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度；根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户。

Description

用户推荐方法和装置，存储介质和服务器

技术领域

本公开涉及网络技术领域，具体地，涉及一种用户推荐方法和装置，存储介质和服务器。

背景技术

传统的用户推荐方法通常采用基于好友关系的推荐方式，比如，若两个用户有共同的好友或共同关注了某些人，则可将其中一个用户推荐给另一个用户。但是，传统推荐方法仅依赖用户的好友关系或者关注人进行推荐，其推荐给用户的人往往不符合用户所需，造成用户推荐的盲目性。

现有技术为了解决这一问题，在进行好友推荐时，增加考虑了用户的兴趣和专长，使得具有相同兴趣或专长的用户更可能被推荐。然而，发明人发现，针对网络中存在的大量的用户以及用户行为，增加考虑用户兴趣和用户专长仍无法全面准确的评估用户之间的相似度，导致现有的用户推荐方法仍不够精准有效。

发明内容

本公开的主要目的是提供一种用户推荐方法和装置，存储介质和服务器，以解决现有的用户推荐不够精准有效的技术问题。

为了实现上述目的，本公开第一方面提供一种用户推荐方法，包括：

根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量；

确定所述目标用户的特征向量以及所述待推荐用户的特征向量，其中，所述目标用户的特征向量包括所述目标用户的网络向量，所述待推荐用户的特征向量包括所述待推荐用户的网络向量；

根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度；

根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户。

可选地，确定所述目标用户的特征向量，包括：

根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText；

将所述词袋模型vector(bow)、所述语义向量模型word2vecVectorOfText、所述目标用户的网络向量vector_net融合得到所述目标用户的特征向量user_vector_A：

user_vector_A＝[vector(bow),word2vecVectorOfText,vector_net]。

可选地，所述根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度包括：

根据如下公式计算所述目标用户与所述待推荐用户的相似度sim(A,B)：

sim(A,B)＝cosine(user_vector_A,user_vector_B)；

其中，cosine表示求取两个向量的余弦值，user_vector_B表示所述待推荐用户的特征向量。

可选地，所述方法应用于问答系统，所述目标用户为提问者，所述待推荐用户为待推荐的答题者，所述方法还包括：

确定所述目标用户提出的目标问题的特征向量；

确定所述待推荐用户回答过的与所述目标问题同类的问题的特征向量；

根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度，所述用户特征信息包括所述问题匹配度。

可选地，所述确定所述目标用户提出的目标问题的特征向量包括：

根据所述目标问题的描述以及所述目标问题的标签生成问题词袋模型vector(bow)以及问题语义向量模型word2vecVectorOfText；

将所述问题词袋模型vector(bow1)与所述问题语义向量模型word2vecVectorOfText1融合表示问题的特征向量question_vector：

question_vector＝[vector(bow1),word2vecVectorOfText1]；

所述根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度，包括：

根据如下公式计算所述问题匹配度sim(q,B)：

其中，q为所述目标问题的特征向量，question(B)为所述待推荐用户回答过的与所述目标问题同类的问题集合，qn为所述问题集合中的第n个问题的特征向量。

可选地，所述用户特征信息还包括所述待推荐用户对所述目标问题所述分类的兴趣度interest[i]以及专长度authority[i]，所述根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户包括：

通过如下公式计算推荐所述待推荐用户B回答所述目标用户A提出的所述目标问题的概率值：

sim(A,q,B)＝interest[i]×authority[i]×(α·sim(A,B)+β·sim(q,B))

其中，(α+β)＝1，i为问题q的类别标签；

根据所述概率值从所述待推荐用户中选择推荐回到所述目标问题的用户。

第二方面提供一种用户推荐装置，包括：

网络嵌入模块，用于根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量；

特征向量确定模块，用于确定所述目标用户的特征向量以及所述待推荐用户的特征向量，其中，所述目标用户的特征向量包括所述目标用户的网络向量，所述待推荐用户的特征向量包括所述待推荐用户的网络向量；

相似度确定模块，用于根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度；

推荐模块，用于根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户。

可选地，所述特征向量确定模块用于：根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText；

user_vector_A＝[vector(bow),word2vecVectorOfText,vector_net]。

第三方面提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面或者第一方面任一可选的实现方式所述方法的步骤。

第四方面提供一种服务器，包括：

第三方面所述的计算机可读存储介质；以及

一个或者多个处理器，用于执行所述计算机可读存储介质中的程序。

本公开提供的技术方案，基于网络嵌入算法计算得到用于表明用户在网络中与其他用户之间的行为关系的网络向量，从而在进行用户推荐时，增加考虑了用户之间的网络关系，其中，该网络关系可以是用户之间评论，点赞或者转发等行为构成的网络关系。这样，相比现有技术，本公开提供的技术方案在进行用户推荐采用的因素更全面更多维，从而提高了用户推荐的准确性和有效性。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1是本公开实施例提供的一种用户推荐方法的流程示意图；

图2是本公开实施例提供的一种用户关系的示意图；

图3是本公开实施例提供的一种在问答系统中的用户推荐方法的流程示意图；

图4A是本公开实施例提供的一种用户推荐装置的结构示意图；

图4B是本公开实施例提供的一种用户推荐装置的结构示意图；

图5是本公开实施例提供的一种服务器的结构示意图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

为了使本领域技术人员能够更容易理解本公开实施例提供的技术方案，下面首先对涉及到的相关术语进行简单介绍。

本文所述的网络嵌入算法是指多维尺度分析(multidimensional scaling，MDS)，等距映射算法(Isometric Mapping，IsoMap)，拉普拉斯特征映射(Laplacian eigenmaps)或者大规模信息网络嵌入(Large-scale Information Network Embedding，LINE)算法等用于将高维数据降维处理的算法。其中，把数据从高维空间降到低维空间，有利于更好的分析利用数据。

下面主要介绍LINE算法，LINE算法主要用于将信息网络嵌入到低维空间。而低维空间向量能够更加有助于可视化，网络节点分类，节点相似度计算。LINE能够处理各种各样的网络，适用于有向、无向、有权、无权图。

具体地，信息网络定义为G＝(V，E)，其中，V是点集，E是边集。每条边是有序对e＝(u，v)且有大于0的权重w_u,v来表示关系强度。

将信息网络嵌入到低维空间需要先保留网络结构。LINE模型对于给出的大型网络G＝(V，E)，可以把每个节点v表示到低维空间R_d中，对应的函数为f_G：V→R_d，其中d＜＜|V|。在空间R_d中一阶相似度和二阶相似度都保留着，保留了网络结构。

基于网络嵌入算法，本公开实施例提供一种用户推荐方法，如图1所示，该方法包括：

S101、根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量。

值得说明的是，本公开实施例提供的用户推荐方法可以应用于不同类型的网络系统中。例如，问答类网络系统，社交网络，或者媒体网络等。在问答类网络系统中，所述目标用户可以是提出问题的提问者，所述待推荐用户可以是待推荐回答问题的回答者；在社交网络中，所述待推荐用户可以是待推荐给所述目标用户的好友；在媒体网络中，所述待推荐用户可以是推荐给所述目标用户的自媒体账号。

另外，所述待推荐用户可以是网络系统中除该目标用户以外的所有其他用户，也可以是经过预筛选得到的部分用户。

S102、确定所述目标用户的特征向量以及所述待推荐用户的特征向量，其中，所述目标用户的特征向量包括所述目标用户的网络向量，所述待推荐用户的特征向量包括所述待推荐用户的网络向量。

在具体实施时，用户的特征向量通常还可以包括其他可以用于表明用户某一特征的向量，例如，根据用户账号的个人描述生成的语义向量，根据用户标签生成的词袋模型向量等，具体可以根据实际需求设定，本公开不做限定。

S103、根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度。

具体地，用户之间的相似度可以用特征向量之间的余弦值表示，余弦值越大，相似度越高；余弦值越小，相似度越低。

S104、根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户。

值得说明的是，用户特征信息包括在进行用户推荐时需要考虑的多种因素，用户之间的相似度其中的一项重要因素。在具体实施时，该用户特征信息还可以包括用户专长度，用户兴趣度等，本公开对此不做限定。

上述方法基于网络嵌入算法计算得到用于表明用户在网络中与其他用户之间的行为关系的网络向量，从而在进行用户推荐时，增加考虑了用户之间的网络关系，其中，该网络关系可以是用户之间评论，点赞或者转发等行为构成的网络关系。这样，相比现有技术，本公开提供的技术方案在进行用户推荐采用的因素更全面更多维，从而提高了用户推荐的准确性和有效性。

为了使本领域技术人员更加理解本公开实施例提供的技术方案，下面以问答系统为例，对根据LINE模型求取目标用户的网络向量进行说明。

示例地，图2是问答系统中的社会关系示意图，其中，每一个节点为一个用户，用户之间的边上存在权重值，这样，根据节点向量来进行相关运算可以得到所有用户之间的联系。参照图2，用户A与用户B之间存在A—>B的一条边，且权重为5；用户A与用户C之间存在A—>C的一条边，且权重为5；用户B与用户C之间存在B—>C的一条边，且权重为3；用户C与用户D之间存在C—>D的一条边，且权重为8；用户E与用户B之间存在E—>B的一条边，且权重为9。

由图2可知，节点之间的边为有向边，在本公开实施例的一种可能的实现方式中，节点边的权重weight(A,B)的计算方法可以是：

其中，Q(B)是用户B提出的问题集合。

上述只是举例说明，在问答系统中，权重值还可以与用户之间其他行为关系有关，例如，用户E对用户B回答的某一问题点击了赞同，则边E—>B的权重值可以加1，本公开对此不做限定。

进一步地，根据图2所示的用户相关关系，可以通过LINE训练一个网络模型，并且根据训练好的网络模型可以得到每一个用户的网络向量：

A:[w1,w2,w3...wn]；

B:[w1,w2,w3...wn]；

......

E:[w1,w2,w3...wn]。

其中，网络向量有助于节点相似度计算。值得说明的是，上述只是以LINE模型进行举例说明，在具体实施时，也可以采用其他网络嵌入算法，本公开对此不做限定。

下面对本公开实施中，利用网络向量求取用户之间的相似度的方法进行说明。

首先，本公开实施可以通过如下方法步骤确定所述目标用户的特征向量：根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText；将所述词袋模型vector(bow)、所述语义向量模型word2vecVectorOfText、所述目标用户的网络向量vector_net融合得到所述目标用户的特征向量user_vector_A：

user_vector_A＝[vector(bow),word2vecVectorOfText,vector_net]。

其中，目标用户的个人描述可以是用户对自己的介绍，包括专业，兴趣爱好等。所述用户标签可以是用户选择的感兴趣的领域，话题等。

同理，待推荐用户的特征向量user_vector_B也可以是词袋模型，语义向量模型和网络向量的融合表示。

这样，进一步地，所述根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度包括：

sim(A,B)＝cosine(user_vector_A,user_vector_B)。

其中，cosine表示求取两个向量的余弦值。余弦值取值越大说明，用户A和待推荐用户B的相似度越高。

上述只是举例说明，除了采用特征向量之间的余弦值表示用户相似度，在具体实施时，还可以采用特征向量之间的其他系数表示用户之间的相似度，例如欧式距离等，本公开对此不做限定。

进一步地，步骤S104中所述的用户特征信息除用户之间的相似度以外，还可以包括其他信息。并且，在具体实施时，针对不同的网络系统，用户特征信息可以有差异。下面以问答系统为例进行详细说明。

具体地，在问答系统中，本公开实施例提供的用户推荐方法还可以考虑到提出的问题与待推荐用户回答过的问题之间的关系。具体地，在问答系统时，所述目标用户为提问者，所述待推荐用户为待推荐的答题者，则所述方法还包括：确定所述目标用户提出的目标问题的特征向量；确定所述待推荐用户回答过的与所述目标问题同类的问题的特征向量；根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度，所述用户特征信息包括所述问题匹配度。

示例地，所述目标问题的特征向量可以通过如下方法步骤实现：

根据所述目标问题的描述以及所述目标问题的标签生成问题词袋模型vector(bow)以及问题语义向量模型word2vecVectorOfText；将所述问题词袋模型vector(bow1)与所述问题语义向量模型word2vecVectorOfText1融合表示问题的特征向量question_vector：

question_vector＝[vector(bow1),word2vecVectorOfText1]。

同理，待推荐用户回答过的与所述目标问题同类的问题的特征向量也可以是词袋模型和语义向量的融合表示。

进一步地，通过如下公式可以计算得到所述问题匹配度sim(q,B)：

在一种可能的实现方式中，步骤S104所述的用户特征信息包括待推荐用户与目标用户的相似度sim(A,B)以及问题匹配度sim(q,B)，则本公开实施例可以通过如下公式计算待推荐用户中的任一用户(用户B)回答用户A提出的问题q的概率值：

sim(A,q,B)＝α·sim(A,B)+β·sim(q,B)；

其中，(α+β)＝1，并且α和β的取值可以根据实际需求设定，在进行用户推荐时，若更看重用户之间的相似度，则可调大α的取值，若更看重问题之间的匹配度，则可调大β的取值。

这样，在计算得到待推荐用户中的每一用户的概率值后，可以按照概率值高低推荐概率值较大的N个用户回答问题q。

另外，值得说明的是，为了降低计算量，上述待推荐用户可以是经过兴趣度和专长度预筛选得到的用户集合。也就是说，针对网络系统中除目标用户以外的其他所有用户，可以依次判断用户对目标问题的兴趣度和专长度，对于不满足兴趣度或者专长度要求的用户，无需再进行用户相似度和问题匹配对的计算，降低了计算量。

举例说明对兴趣度和专长度的计算：

在获取到目标问题后，分析所述目标问题所属的类别。并针对每一待推荐用户执行以下计算：

interest[i]＝isAnsweredCount[i]/isNotAnsweredCount[i]；

其中，i为所述目标问题的类别，interest[i]为所述待推荐用户对所述目标问题的兴趣度，isAnsweredCount[i]为所述待推荐用户回答的i类问题的总数，isNotAnsweredCount[i]为所述待推荐用户没有回答的i类问题的总数。

进一步地，可以根据如下公式计算所述待推荐用户对i类问题的专长度authority[i]：

其中，B为所述待推荐用户，Q_i(B)为用户B回答过的类别i的问题集合，goodAnswerCount(q’)为问题q’的精品回答数，surportCoun(q’)为问题q’的点赞数，answerCount(B)为用户B回答的问题总数。

在本公开实施例的另一种可能的实现方式中，步骤S104中所述的用户特征信息包括待推荐用户对目标问题所述分类的兴趣度interest[i]以及专长度authority[i]，以及待推荐用户与目标用户的相似度sim(A,B)以及问题匹配度sim(q,B)，则本公开实施例也可以通过如下公式计算推荐所述待推荐用户回答所述目标用户提出的所述目标问题的概率值：

sim(A,q,B)＝interest[i]×authority[i]×(α·sim(A,B)+β·sim(q,B))，其中，(α+β)＝1。

在上述可能的实现方式中，所述待推荐用户可以是网络系统中除所述目标用户以外的所有用户，这样，在计算得到待推荐用户中的每一用户的概率值后，可以按照概率值高低推荐概率值较大的N个用户回答问题q。

值得说明的是，本领域技术人员应该知悉，上述仅是以问答系统为例对用户特征信息进行的说明，在具体实施时，根据不同类型的网络系统，用户特征信息除了用户相似度以外还可以包括其他信息，本公开实施例对此不做限定。

为了是本领域技术人员更加清楚的理解本公开实施例提供的技术方案，下面通过一个详细的例子对本公开实施例提供的用户推荐方法进行说明。示例地，在问答系统中，用户A新提出问题q，在此种情况下，本公开实施例提供的一种推荐用户回答该问题q的方法如图3所示，包括：

S301、确定用户A新提出的问题q的问题类别i。

具体地，在提出新的问题时，问答系统通常需要用户选取所提问题所处的领域，进而可以根据领域划分问题的类别。也可以通过提取问题文字描述的关键词确定问题所属的类别。

S302、计算所述问答系统中除用户A以外的其他所有用户对于类别i问题的兴趣度，并根据所述兴趣度从所述其他所有用户中筛选出第一待推荐用户集合。

S303、计算所述第一待推荐用户集合中每一用户对类别i问题的专长度，并根据所述专长度从所述第一待推荐用户集合中筛选出第二待推荐用户集合。

其中，兴趣度和专长度的计算可以参照上述对图1方法步骤进行的说明中对应的描述，此处不再赘述。

S304、根据LINE模型确定所述第二待推荐用户集合中的每一用户的网络向量，以及用户A的网络向量。

S305、确定用户A的特征向量以及所述第二待推荐用户集合中的每一用户的特征向量。其中，用户的特征向量包括用户的网络向量。

S306、根据用户A的特征向量以及所述第二待推荐用户集合中的每一用户的特征向量确定用户A分别与所述第二待推荐用户集合中的每一用户之间的相似度。

S307、计算问题q的特征向量，以及所述第二待推荐用户集合中的每一用户回答过的i类问题的特征向量。

S308、根据问题q的特征向量以及所述第二待推荐用户集合中的每一用户回答过的i类问题的特征向量计算用户A分别与所述第二待推荐用户集合中的每一用户的问题匹配度。

S309、根据所述第二待推荐用户集合中的每一用户与用户A的相似度以及问题匹配度计算推荐每一用户回答问题q的概率值。

S310、根据所述第二待推荐用户集合中的每一用户概率值的高低选择推荐概率值较大的N个用户回答问题q。

值得说明的是，对于上述方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，例如，在具体实施时，也可以先计算待推荐用户与目标用户的问题匹配度，再计算待推荐用户与目标用户的相似度。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明所必须的。

本公开实施例还提供一种用户推荐装置40，用于实施上述方法实施例提供的一种用户推荐方法，如图4A所示，该用户推荐装置40包括：

网络嵌入模块401，用于根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量；

特征向量确定模块402，用于确定所述目标用户的特征向量以及所述待推荐用户的特征向量，其中，所述目标用户的特征向量包括所述目标用户的网络向量，所述待推荐用户的特征向量包括所述待推荐用户的网络向量；

相似度确定模块403，用于根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度；

推荐模块404，用于根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户。

可选地，所述特征向量确定模块402用于：根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText；将所述词袋模型vector(bow)、所述语义向量模型word2vecVectorOfText、所述目标用户的网络向量vector_net融合得到所述目标用户的特征向量user_vector_A：

user_vector_A＝[vector(bow),word2vecVectorOfText,vector_net]。

可选地，相似度确定模块403用于：

sim(A,B)＝cosine(user_vector_A,user_vector_B)；

可选地，所述方法应用于问答系统，所述目标用户为提问者，所述待推荐用户为待推荐的答题者，如图4B所示，所述装置还包括：

问题特征向量确定模块405，用于确定所述目标用户提出的目标问题的特征向量，以及确定所述待推荐用户回答过的与所述目标问题同类的问题的特征向量；

问题匹配度确定模块406，用于根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度，所述用户特征信息包括所述问题匹配度。

可选地，所述问题特征向量确定模块405用于：

question_vector＝[vector(bow1),word2vecVectorOfText1]；

所述问题匹配度确定模块406用于，根据如下公式计算所述问题匹配度：

可选地，所述用户特征信息还包括所述待推荐用户对所述目标问题所述分类的兴趣度interest[i]以及专长度authority[i]，所述推荐模块404用于：

sim(A,q,B)＝interest[i]×authority[i]×(α·sim(A,B)+β·sim(q,B))

其中，(α+β)＝1，i为问题q的类别标签；

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图5是本公开实施例示出的一种服务器500的框图。参照图5，服务器500包括处理器501，其数量可以为一个或多个，以及存储器502，用于存储可由处理器501执行的计算机程序。存储器502中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理器502可以被配置为执行该计算机程序，以执行上述的用户推荐方法。

另外，服务器500还可以包括电源组件503和通信组件504，该电源组件503可以被配置为执行服务器500的电源管理，该通信组件504可以被配置为实现服务器500的通信，例如，有线或无线通信。此外，该服务器500还可以包括输入/输出(I/O)接口505。其中，针对不同的网络系统，本公开实施例提供的服务器500具体可以是问答系统的服务器，社交网络系统的服务器等。

本公开实施例还提供一种包括程序指令的计算机可读存储介质，例如包括程序指令的存储器502，上述程序指令可由服务器500的处理器501执行以完成上述用户推荐方法。

以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，可以对本公开的技术方案进行多种简单变型，这些简单变型均属于本公开的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本公开对各种可能的组合方式不再另行说明。

此外，本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。

Claims

1.一种用户推荐方法，其特征在于，包括：

根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户；

所述方法应用于问答系统，所述目标用户为提问者，所述待推荐用户为待推荐的答题者，所述方法还包括：

确定所述目标用户提出的目标问题的特征向量；

根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度，所述用户特征信息包括所述问题匹配度；

所述确定所述目标用户提出的目标问题的特征向量包括：

将所述问题词袋模型vector(bow)与所述问题语义向量模型word2vecVectorOfText融合表示问题的特征向量question_vector：

question_vector＝[vector(bow),word2vecVectorOfText]；

根据如下公式计算所述问题匹配度sim(q,B)：

2.根据权利要求1所述的方法，其特征在于，确定所述目标用户的特征向量，包括：

user_vector_A＝[vector(bow),word2vecVectorOfText,vector_net]。

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度包括：

其中，cosine表示求取两个向量的余弦值，

表示所述目标用户的特征向量，

表示所述待推荐用户的特征向量。

4.根据权利要求1所述的方法，其特征在于，所述用户特征信息还包括所述待推荐用户对所述目标问题分类的兴趣度interest[i]以及专长度authority[i]，所述根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户包括：

sim(A,q,B)＝interest[i]×authority[i]×(α·sim(A,B)+β·sim(q,B))

其中，(α+β)＝1，i为问题q的类别标签，sim(A,B)表征所述待推荐用户与所述目标用户的相似度，α表征所述相似度的权重，β表征所述问题匹配度的权重；

根据所述概率值从所述待推荐用户中选择推荐回答所述目标问题的用户。

5.一种用户推荐装置，其特征在于，包括：

推荐模块，用于根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户；

所述目标用户为提问者，所述待推荐用户为待推荐的答题者，所述装置还包括：

问题特征向量确定模块，用于确定所述目标用户提出的目标问题的特征向量，以及确定所述待推荐用户回答过的与所述目标问题同类的问题的特征向量；

问题匹配度确定模块，用于根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度，所述用户特征信息包括所述问题匹配度；

所述问题特征向量确定模块具体用于：

根据所述目标问题的描述以及所述目标问题的标签生成问题词袋模型vector(bow)以及问题语义向量模型word2vecVectorOfText；将所述问题词袋模型vector(bow)与所述问题语义向量模型word2vecVectorOfText融合表示问题的特征向量question_vector：

question_vector＝[vector(bow),word2vecVectorOfText]；

所述问题匹配度确定模块具体用于：

根据如下公式计算所述问题匹配度sim(q,B)：

6.根据权利要求5所述的装置，其特征在于，所述特征向量确定模块用于：根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText；

user_vector_A＝[vector(bow),word2vecVectorOfText,vector_net]。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。

8.一种服务器，其特征在于，包括：

权利要求7中所述的计算机可读存储介质；以及