CN109062914B - 用户推荐方法和装置,存储介质和服务器 - Google Patents

用户推荐方法和装置,存储介质和服务器 Download PDF

Info

Publication number
CN109062914B
CN109062914B CN201710438782.0A CN201710438782A CN109062914B CN 109062914 B CN109062914 B CN 109062914B CN 201710438782 A CN201710438782 A CN 201710438782A CN 109062914 B CN109062914 B CN 109062914B
Authority
CN
China
Prior art keywords
user
vector
question
recommended
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710438782.0A
Other languages
English (en)
Other versions
CN109062914A (zh
Inventor
王明强
杨洪宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201710438782.0A priority Critical patent/CN109062914B/zh
Publication of CN109062914A publication Critical patent/CN109062914A/zh
Application granted granted Critical
Publication of CN109062914B publication Critical patent/CN109062914B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本公开涉及一种用户推荐方法和装置,存储介质和服务器,以解决现有的用户推荐不够精准有效的技术问题。该方法包括:根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量;确定所述目标用户的特征向量以及所述待推荐用户的特征向量,其中,所述目标用户的特征向量包括所述目标用户的网络向量,所述待推荐用户的特征向量包括所述待推荐用户的网络向量;根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度;根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户。

Description

用户推荐方法和装置,存储介质和服务器
技术领域
本公开涉及网络技术领域,具体地,涉及一种用户推荐方法和装置,存储介质和服务器。
背景技术
传统的用户推荐方法通常采用基于好友关系的推荐方式,比如,若两个用户有共同的好友或共同关注了某些人,则可将其中一个用户推荐给另一个用户。但是,传统推荐方法仅依赖用户的好友关系或者关注人进行推荐,其推荐给用户的人往往不符合用户所需,造成用户推荐的盲目性。
现有技术为了解决这一问题,在进行好友推荐时,增加考虑了用户的兴趣和专长,使得具有相同兴趣或专长的用户更可能被推荐。然而,发明人发现,针对网络中存在的大量的用户以及用户行为,增加考虑用户兴趣和用户专长仍无法全面准确的评估用户之间的相似度,导致现有的用户推荐方法仍不够精准有效。
发明内容
本公开的主要目的是提供一种用户推荐方法和装置,存储介质和服务器,以解决现有的用户推荐不够精准有效的技术问题。
为了实现上述目的,本公开第一方面提供一种用户推荐方法,包括:
根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量;
确定所述目标用户的特征向量以及所述待推荐用户的特征向量,其中,所述目标用户的特征向量包括所述目标用户的网络向量,所述待推荐用户的特征向量包括所述待推荐用户的网络向量;
根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度;
根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户。
可选地,确定所述目标用户的特征向量,包括:
根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText;
将所述词袋模型vector(bow)、所述语义向量模型word2vecVectorOfText、所述目标用户的网络向量vector_net融合得到所述目标用户的特征向量user_vector_A:
user_vector_A=[vector(bow),word2vecVectorOfText,vector_net]。
可选地,所述根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度包括:
根据如下公式计算所述目标用户与所述待推荐用户的相似度sim(A,B):
sim(A,B)=cosine(user_vector_A,user_vector_B);
其中,cosine表示求取两个向量的余弦值,user_vector_B表示所述待推荐用户的特征向量。
可选地,所述方法应用于问答系统,所述目标用户为提问者,所述待推荐用户为待推荐的答题者,所述方法还包括:
确定所述目标用户提出的目标问题的特征向量;
确定所述待推荐用户回答过的与所述目标问题同类的问题的特征向量;
根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度,所述用户特征信息包括所述问题匹配度。
可选地,所述确定所述目标用户提出的目标问题的特征向量包括:
根据所述目标问题的描述以及所述目标问题的标签生成问题词袋模型vector(bow)以及问题语义向量模型word2vecVectorOfText;
将所述问题词袋模型vector(bow1)与所述问题语义向量模型word2vecVectorOfText1融合表示问题的特征向量question_vector:
question_vector=[vector(bow1),word2vecVectorOfText1];
所述根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度,包括:
根据如下公式计算所述问题匹配度sim(q,B):
Figure BDA0001319276060000031
其中,q为所述目标问题的特征向量,question(B)为所述待推荐用户回答过的与所述目标问题同类的问题集合,qn为所述问题集合中的第n个问题的特征向量。
可选地,所述用户特征信息还包括所述待推荐用户对所述目标问题所述分类的兴趣度interest[i]以及专长度authority[i],所述根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户包括:
通过如下公式计算推荐所述待推荐用户B回答所述目标用户A提出的所述目标问题的概率值:
sim(A,q,B)=interest[i]×authority[i]×(α·sim(A,B)+β·sim(q,B))
其中,(α+β)=1,i为问题q的类别标签;
根据所述概率值从所述待推荐用户中选择推荐回到所述目标问题的用户。
第二方面提供一种用户推荐装置,包括:
网络嵌入模块,用于根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量;
特征向量确定模块,用于确定所述目标用户的特征向量以及所述待推荐用户的特征向量,其中,所述目标用户的特征向量包括所述目标用户的网络向量,所述待推荐用户的特征向量包括所述待推荐用户的网络向量;
相似度确定模块,用于根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度;
推荐模块,用于根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户。
可选地,所述特征向量确定模块用于:根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText;
将所述词袋模型vector(bow)、所述语义向量模型word2vecVectorOfText、所述目标用户的网络向量vector_net融合得到所述目标用户的特征向量user_vector_A:
user_vector_A=[vector(bow),word2vecVectorOfText,vector_net]。
第三方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面或者第一方面任一可选的实现方式所述方法的步骤。
第四方面提供一种服务器,包括:
第三方面所述的计算机可读存储介质;以及
一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
本公开提供的技术方案,基于网络嵌入算法计算得到用于表明用户在网络中与其他用户之间的行为关系的网络向量,从而在进行用户推荐时,增加考虑了用户之间的网络关系,其中,该网络关系可以是用户之间评论,点赞或者转发等行为构成的网络关系。这样,相比现有技术,本公开提供的技术方案在进行用户推荐采用的因素更全面更多维,从而提高了用户推荐的准确性和有效性。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是本公开实施例提供的一种用户推荐方法的流程示意图;
图2是本公开实施例提供的一种用户关系的示意图;
图3是本公开实施例提供的一种在问答系统中的用户推荐方法的流程示意图;
图4A是本公开实施例提供的一种用户推荐装置的结构示意图;
图4B是本公开实施例提供的一种用户推荐装置的结构示意图;
图5是本公开实施例提供的一种服务器的结构示意图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
为了使本领域技术人员能够更容易理解本公开实施例提供的技术方案,下面首先对涉及到的相关术语进行简单介绍。
本文所述的网络嵌入算法是指多维尺度分析(multidimensional scaling,MDS),等距映射算法(Isometric Mapping,IsoMap),拉普拉斯特征映射(Laplacian eigenmaps)或者大规模信息网络嵌入(Large-scale Information Network Embedding,LINE)算法等用于将高维数据降维处理的算法。其中,把数据从高维空间降到低维空间,有利于更好的分析利用数据。
下面主要介绍LINE算法,LINE算法主要用于将信息网络嵌入到低维空间。而低维空间向量能够更加有助于可视化,网络节点分类,节点相似度计算。LINE能够处理各种各样的网络,适用于有向、无向、有权、无权图。
具体地,信息网络定义为G=(V,E),其中,V是点集,E是边集。每条边是有序对e=(u,v)且有大于0的权重wu,v来表示关系强度。
将信息网络嵌入到低维空间需要先保留网络结构。LINE模型对于给出的大型网络G=(V,E),可以把每个节点v表示到低维空间Rd中,对应的函数为fG:V→Rd,其中d<<|V|。在空间Rd中一阶相似度和二阶相似度都保留着,保留了网络结构。
基于网络嵌入算法,本公开实施例提供一种用户推荐方法,如图1所示,该方法包括:
S101、根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量。
值得说明的是,本公开实施例提供的用户推荐方法可以应用于不同类型的网络系统中。例如,问答类网络系统,社交网络,或者媒体网络等。在问答类网络系统中,所述目标用户可以是提出问题的提问者,所述待推荐用户可以是待推荐回答问题的回答者;在社交网络中,所述待推荐用户可以是待推荐给所述目标用户的好友;在媒体网络中,所述待推荐用户可以是推荐给所述目标用户的自媒体账号。
另外,所述待推荐用户可以是网络系统中除该目标用户以外的所有其他用户,也可以是经过预筛选得到的部分用户。
S102、确定所述目标用户的特征向量以及所述待推荐用户的特征向量,其中,所述目标用户的特征向量包括所述目标用户的网络向量,所述待推荐用户的特征向量包括所述待推荐用户的网络向量。
在具体实施时,用户的特征向量通常还可以包括其他可以用于表明用户某一特征的向量,例如,根据用户账号的个人描述生成的语义向量,根据用户标签生成的词袋模型向量等,具体可以根据实际需求设定,本公开不做限定。
S103、根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度。
具体地,用户之间的相似度可以用特征向量之间的余弦值表示,余弦值越大,相似度越高;余弦值越小,相似度越低。
S104、根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户。
值得说明的是,用户特征信息包括在进行用户推荐时需要考虑的多种因素,用户之间的相似度其中的一项重要因素。在具体实施时,该用户特征信息还可以包括用户专长度,用户兴趣度等,本公开对此不做限定。
上述方法基于网络嵌入算法计算得到用于表明用户在网络中与其他用户之间的行为关系的网络向量,从而在进行用户推荐时,增加考虑了用户之间的网络关系,其中,该网络关系可以是用户之间评论,点赞或者转发等行为构成的网络关系。这样,相比现有技术,本公开提供的技术方案在进行用户推荐采用的因素更全面更多维,从而提高了用户推荐的准确性和有效性。
为了使本领域技术人员更加理解本公开实施例提供的技术方案,下面以问答系统为例,对根据LINE模型求取目标用户的网络向量进行说明。
示例地,图2是问答系统中的社会关系示意图,其中,每一个节点为一个用户,用户之间的边上存在权重值,这样,根据节点向量来进行相关运算可以得到所有用户之间的联系。参照图2,用户A与用户B之间存在A—>B的一条边,且权重为5;用户A与用户C之间存在A—>C的一条边,且权重为5;用户B与用户C之间存在B—>C的一条边,且权重为3;用户C与用户D之间存在C—>D的一条边,且权重为8;用户E与用户B之间存在E—>B的一条边,且权重为9。
由图2可知,节点之间的边为有向边,在本公开实施例的一种可能的实现方式中,节点边的权重weight(A,B)的计算方法可以是:
Figure BDA0001319276060000081
Figure BDA0001319276060000082
其中,Q(B)是用户B提出的问题集合。
上述只是举例说明,在问答系统中,权重值还可以与用户之间其他行为关系有关,例如,用户E对用户B回答的某一问题点击了赞同,则边E—>B的权重值可以加1,本公开对此不做限定。
进一步地,根据图2所示的用户相关关系,可以通过LINE训练一个网络模型,并且根据训练好的网络模型可以得到每一个用户的网络向量:
A:[w1,w2,w3...wn];
B:[w1,w2,w3...wn];
......
E:[w1,w2,w3...wn]。
其中,网络向量有助于节点相似度计算。值得说明的是,上述只是以LINE模型进行举例说明,在具体实施时,也可以采用其他网络嵌入算法,本公开对此不做限定。
下面对本公开实施中,利用网络向量求取用户之间的相似度的方法进行说明。
首先,本公开实施可以通过如下方法步骤确定所述目标用户的特征向量:根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText;将所述词袋模型vector(bow)、所述语义向量模型word2vecVectorOfText、所述目标用户的网络向量vector_net融合得到所述目标用户的特征向量user_vector_A:
user_vector_A=[vector(bow),word2vecVectorOfText,vector_net]。
其中,目标用户的个人描述可以是用户对自己的介绍,包括专业,兴趣爱好等。所述用户标签可以是用户选择的感兴趣的领域,话题等。
同理,待推荐用户的特征向量user_vector_B也可以是词袋模型,语义向量模型和网络向量的融合表示。
这样,进一步地,所述根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度包括:
根据如下公式计算所述目标用户与所述待推荐用户的相似度sim(A,B):
sim(A,B)=cosine(user_vector_A,user_vector_B)。
其中,cosine表示求取两个向量的余弦值。余弦值取值越大说明,用户A和待推荐用户B的相似度越高。
上述只是举例说明,除了采用特征向量之间的余弦值表示用户相似度,在具体实施时,还可以采用特征向量之间的其他系数表示用户之间的相似度,例如欧式距离等,本公开对此不做限定。
进一步地,步骤S104中所述的用户特征信息除用户之间的相似度以外,还可以包括其他信息。并且,在具体实施时,针对不同的网络系统,用户特征信息可以有差异。下面以问答系统为例进行详细说明。
具体地,在问答系统中,本公开实施例提供的用户推荐方法还可以考虑到提出的问题与待推荐用户回答过的问题之间的关系。具体地,在问答系统时,所述目标用户为提问者,所述待推荐用户为待推荐的答题者,则所述方法还包括:确定所述目标用户提出的目标问题的特征向量;确定所述待推荐用户回答过的与所述目标问题同类的问题的特征向量;根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度,所述用户特征信息包括所述问题匹配度。
示例地,所述目标问题的特征向量可以通过如下方法步骤实现:
根据所述目标问题的描述以及所述目标问题的标签生成问题词袋模型vector(bow)以及问题语义向量模型word2vecVectorOfText;将所述问题词袋模型vector(bow1)与所述问题语义向量模型word2vecVectorOfText1融合表示问题的特征向量question_vector:
question_vector=[vector(bow1),word2vecVectorOfText1]。
同理,待推荐用户回答过的与所述目标问题同类的问题的特征向量也可以是词袋模型和语义向量的融合表示。
进一步地,通过如下公式可以计算得到所述问题匹配度sim(q,B):
Figure BDA0001319276060000101
其中,q为所述目标问题的特征向量,question(B)为所述待推荐用户回答过的与所述目标问题同类的问题集合,qn为所述问题集合中的第n个问题的特征向量。
在一种可能的实现方式中,步骤S104所述的用户特征信息包括待推荐用户与目标用户的相似度sim(A,B)以及问题匹配度sim(q,B),则本公开实施例可以通过如下公式计算待推荐用户中的任一用户(用户B)回答用户A提出的问题q的概率值:
sim(A,q,B)=α·sim(A,B)+β·sim(q,B);
其中,(α+β)=1,并且α和β的取值可以根据实际需求设定,在进行用户推荐时,若更看重用户之间的相似度,则可调大α的取值,若更看重问题之间的匹配度,则可调大β的取值。
这样,在计算得到待推荐用户中的每一用户的概率值后,可以按照概率值高低推荐概率值较大的N个用户回答问题q。
另外,值得说明的是,为了降低计算量,上述待推荐用户可以是经过兴趣度和专长度预筛选得到的用户集合。也就是说,针对网络系统中除目标用户以外的其他所有用户,可以依次判断用户对目标问题的兴趣度和专长度,对于不满足兴趣度或者专长度要求的用户,无需再进行用户相似度和问题匹配对的计算,降低了计算量。
举例说明对兴趣度和专长度的计算:
在获取到目标问题后,分析所述目标问题所属的类别。并针对每一待推荐用户执行以下计算:
interest[i]=isAnsweredCount[i]/isNotAnsweredCount[i];
其中,i为所述目标问题的类别,interest[i]为所述待推荐用户对所述目标问题的兴趣度,isAnsweredCount[i]为所述待推荐用户回答的i类问题的总数,isNotAnsweredCount[i]为所述待推荐用户没有回答的i类问题的总数。
进一步地,可以根据如下公式计算所述待推荐用户对i类问题的专长度authority[i]:
Figure BDA0001319276060000111
其中,B为所述待推荐用户,Qi(B)为用户B回答过的类别i的问题集合,goodAnswerCount(q’)为问题q’的精品回答数,surportCoun(q’)为问题q’的点赞数,answerCount(B)为用户B回答的问题总数。
在本公开实施例的另一种可能的实现方式中,步骤S104中所述的用户特征信息包括待推荐用户对目标问题所述分类的兴趣度interest[i]以及专长度authority[i],以及待推荐用户与目标用户的相似度sim(A,B)以及问题匹配度sim(q,B),则本公开实施例也可以通过如下公式计算推荐所述待推荐用户回答所述目标用户提出的所述目标问题的概率值:
sim(A,q,B)=interest[i]×authority[i]×(α·sim(A,B)+β·sim(q,B)),其中,(α+β)=1。
在上述可能的实现方式中,所述待推荐用户可以是网络系统中除所述目标用户以外的所有用户,这样,在计算得到待推荐用户中的每一用户的概率值后,可以按照概率值高低推荐概率值较大的N个用户回答问题q。
值得说明的是,本领域技术人员应该知悉,上述仅是以问答系统为例对用户特征信息进行的说明,在具体实施时,根据不同类型的网络系统,用户特征信息除了用户相似度以外还可以包括其他信息,本公开实施例对此不做限定。
为了是本领域技术人员更加清楚的理解本公开实施例提供的技术方案,下面通过一个详细的例子对本公开实施例提供的用户推荐方法进行说明。示例地,在问答系统中,用户A新提出问题q,在此种情况下,本公开实施例提供的一种推荐用户回答该问题q的方法如图3所示,包括:
S301、确定用户A新提出的问题q的问题类别i。
具体地,在提出新的问题时,问答系统通常需要用户选取所提问题所处的领域,进而可以根据领域划分问题的类别。也可以通过提取问题文字描述的关键词确定问题所属的类别。
S302、计算所述问答系统中除用户A以外的其他所有用户对于类别i问题的兴趣度,并根据所述兴趣度从所述其他所有用户中筛选出第一待推荐用户集合。
S303、计算所述第一待推荐用户集合中每一用户对类别i问题的专长度,并根据所述专长度从所述第一待推荐用户集合中筛选出第二待推荐用户集合。
其中,兴趣度和专长度的计算可以参照上述对图1方法步骤进行的说明中对应的描述,此处不再赘述。
S304、根据LINE模型确定所述第二待推荐用户集合中的每一用户的网络向量,以及用户A的网络向量。
S305、确定用户A的特征向量以及所述第二待推荐用户集合中的每一用户的特征向量。其中,用户的特征向量包括用户的网络向量。
S306、根据用户A的特征向量以及所述第二待推荐用户集合中的每一用户的特征向量确定用户A分别与所述第二待推荐用户集合中的每一用户之间的相似度。
S307、计算问题q的特征向量,以及所述第二待推荐用户集合中的每一用户回答过的i类问题的特征向量。
S308、根据问题q的特征向量以及所述第二待推荐用户集合中的每一用户回答过的i类问题的特征向量计算用户A分别与所述第二待推荐用户集合中的每一用户的问题匹配度。
S309、根据所述第二待推荐用户集合中的每一用户与用户A的相似度以及问题匹配度计算推荐每一用户回答问题q的概率值。
S310、根据所述第二待推荐用户集合中的每一用户概率值的高低选择推荐概率值较大的N个用户回答问题q。
值得说明的是,对于上述方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,例如,在具体实施时,也可以先计算待推荐用户与目标用户的问题匹配度,再计算待推荐用户与目标用户的相似度。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明所必须的。
本公开实施例还提供一种用户推荐装置40,用于实施上述方法实施例提供的一种用户推荐方法,如图4A所示,该用户推荐装置40包括:
网络嵌入模块401,用于根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量;
特征向量确定模块402,用于确定所述目标用户的特征向量以及所述待推荐用户的特征向量,其中,所述目标用户的特征向量包括所述目标用户的网络向量,所述待推荐用户的特征向量包括所述待推荐用户的网络向量;
相似度确定模块403,用于根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度;
推荐模块404,用于根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户。
可选地,所述特征向量确定模块402用于:根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText;将所述词袋模型vector(bow)、所述语义向量模型word2vecVectorOfText、所述目标用户的网络向量vector_net融合得到所述目标用户的特征向量user_vector_A:
user_vector_A=[vector(bow),word2vecVectorOfText,vector_net]。
可选地,相似度确定模块403用于:
根据如下公式计算所述目标用户与所述待推荐用户的相似度sim(A,B):
sim(A,B)=cosine(user_vector_A,user_vector_B);
其中,cosine表示求取两个向量的余弦值,user_vector_B表示所述待推荐用户的特征向量。
可选地,所述方法应用于问答系统,所述目标用户为提问者,所述待推荐用户为待推荐的答题者,如图4B所示,所述装置还包括:
问题特征向量确定模块405,用于确定所述目标用户提出的目标问题的特征向量,以及确定所述待推荐用户回答过的与所述目标问题同类的问题的特征向量;
问题匹配度确定模块406,用于根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度,所述用户特征信息包括所述问题匹配度。
可选地,所述问题特征向量确定模块405用于:
根据所述目标问题的描述以及所述目标问题的标签生成问题词袋模型vector(bow)以及问题语义向量模型word2vecVectorOfText;
将所述问题词袋模型vector(bow1)与所述问题语义向量模型word2vecVectorOfText1融合表示问题的特征向量question_vector:
question_vector=[vector(bow1),word2vecVectorOfText1];
所述问题匹配度确定模块406用于,根据如下公式计算所述问题匹配度:
Figure BDA0001319276060000151
其中,q为所述目标问题的特征向量,question(B)为所述待推荐用户回答过的与所述目标问题同类的问题集合,qn为所述问题集合中的第n个问题的特征向量。
可选地,所述用户特征信息还包括所述待推荐用户对所述目标问题所述分类的兴趣度interest[i]以及专长度authority[i],所述推荐模块404用于:
通过如下公式计算推荐所述待推荐用户B回答所述目标用户A提出的所述目标问题的概率值:
sim(A,q,B)=interest[i]×authority[i]×(α·sim(A,B)+β·sim(q,B))
其中,(α+β)=1,i为问题q的类别标签;
根据所述概率值从所述待推荐用户中选择推荐回到所述目标问题的用户。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是本公开实施例示出的一种服务器500的框图。参照图5,服务器500包括处理器501,其数量可以为一个或多个,以及存储器502,用于存储可由处理器501执行的计算机程序。存储器502中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器502可以被配置为执行该计算机程序,以执行上述的用户推荐方法。
另外,服务器500还可以包括电源组件503和通信组件504,该电源组件503可以被配置为执行服务器500的电源管理,该通信组件504可以被配置为实现服务器500的通信,例如,有线或无线通信。此外,该服务器500还可以包括输入/输出(I/O)接口505。其中,针对不同的网络系统,本公开实施例提供的服务器500具体可以是问答系统的服务器,社交网络系统的服务器等。
本公开实施例还提供一种包括程序指令的计算机可读存储介质,例如包括程序指令的存储器502,上述程序指令可由服务器500的处理器501执行以完成上述用户推荐方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (8)

1.一种用户推荐方法,其特征在于,包括:
根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量;
确定所述目标用户的特征向量以及所述待推荐用户的特征向量,其中,所述目标用户的特征向量包括所述目标用户的网络向量,所述待推荐用户的特征向量包括所述待推荐用户的网络向量;
根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度;
根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户;
所述方法应用于问答系统,所述目标用户为提问者,所述待推荐用户为待推荐的答题者,所述方法还包括:
确定所述目标用户提出的目标问题的特征向量;
确定所述待推荐用户回答过的与所述目标问题同类的问题的特征向量;
根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度,所述用户特征信息包括所述问题匹配度;
所述确定所述目标用户提出的目标问题的特征向量包括:
根据所述目标问题的描述以及所述目标问题的标签生成问题词袋模型vector(bow)以及问题语义向量模型word2vecVectorOfText;
将所述问题词袋模型vector(bow)与所述问题语义向量模型word2vecVectorOfText融合表示问题的特征向量question_vector:
question_vector=[vector(bow),word2vecVectorOfText];
所述根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度,包括:
根据如下公式计算所述问题匹配度sim(q,B):
Figure FDA0002642961160000021
其中,q为所述目标问题的特征向量,question(B)为所述待推荐用户回答过的与所述目标问题同类的问题集合,qn为所述问题集合中的第n个问题的特征向量。
2.根据权利要求1所述的方法,其特征在于,确定所述目标用户的特征向量,包括:
根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText;
将所述词袋模型vector(bow)、所述语义向量模型word2vecVectorOfText、所述目标用户的网络向量vector_net融合得到所述目标用户的特征向量user_vector_A:
user_vector_A=[vector(bow),word2vecVectorOfText,vector_net]。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度包括:
根据如下公式计算所述目标用户与所述待推荐用户的相似度sim(A,B):
Figure FDA0002642961160000022
其中,cosine表示求取两个向量的余弦值,
Figure FDA0002642961160000023
表示所述目标用户的特征向量,
Figure FDA0002642961160000024
表示所述待推荐用户的特征向量。
4.根据权利要求1所述的方法,其特征在于,所述用户特征信息还包括所述待推荐用户对所述目标问题分类的兴趣度interest[i]以及专长度authority[i],所述根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户包括:
通过如下公式计算推荐所述待推荐用户B回答所述目标用户A提出的所述目标问题的概率值:
sim(A,q,B)=interest[i]×authority[i]×(α·sim(A,B)+β·sim(q,B))
其中,(α+β)=1,i为问题q的类别标签,sim(A,B)表征所述待推荐用户与所述目标用户的相似度,α表征所述相似度的权重,β表征所述问题匹配度的权重;
根据所述概率值从所述待推荐用户中选择推荐回答所述目标问题的用户。
5.一种用户推荐装置,其特征在于,包括:
网络嵌入模块,用于根据网络嵌入算法确定目标用户的网络向量以及待推荐用户的网络向量;
特征向量确定模块,用于确定所述目标用户的特征向量以及所述待推荐用户的特征向量,其中,所述目标用户的特征向量包括所述目标用户的网络向量,所述待推荐用户的特征向量包括所述待推荐用户的网络向量;
相似度确定模块,用于根据所述目标用户的特征向量以及所述待推荐用户的特征向量确定所述目标用户与所述待推荐用户之间的相似度;
推荐模块,用于根据所述待推荐用户的包括所述相似度的用户特征信息向所述目标用户推荐用户;
所述目标用户为提问者,所述待推荐用户为待推荐的答题者,所述装置还包括:
问题特征向量确定模块,用于确定所述目标用户提出的目标问题的特征向量,以及确定所述待推荐用户回答过的与所述目标问题同类的问题的特征向量;
问题匹配度确定模块,用于根据所述目标问题的特征向量与所述同类问题的特征向量计算得到所述目标用户与所述待推荐用户的问题匹配度,所述用户特征信息包括所述问题匹配度;
所述问题特征向量确定模块具体用于:
根据所述目标问题的描述以及所述目标问题的标签生成问题词袋模型vector(bow)以及问题语义向量模型word2vecVectorOfText;将所述问题词袋模型vector(bow)与所述问题语义向量模型word2vecVectorOfText融合表示问题的特征向量question_vector:
question_vector=[vector(bow),word2vecVectorOfText];
所述问题匹配度确定模块具体用于:
根据如下公式计算所述问题匹配度sim(q,B):
Figure FDA0002642961160000041
其中,q为所述目标问题的特征向量,question(B)为所述待推荐用户回答过的与所述目标问题同类的问题集合,qn为所述问题集合中的第n个问题的特征向量。
6.根据权利要求5所述的装置,其特征在于,所述特征向量确定模块用于:根据所述目标用户的个人描述以及用户标签生成词袋模型vector(bow)以及语义向量模型word2vecVectorOfText;
将所述词袋模型vector(bow)、所述语义向量模型word2vecVectorOfText、所述目标用户的网络向量vector_net融合得到所述目标用户的特征向量user_vector_A:
user_vector_A=[vector(bow),word2vecVectorOfText,vector_net]。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。
8.一种服务器,其特征在于,包括:
权利要求7中所述的计算机可读存储介质;以及
一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
CN201710438782.0A 2017-06-12 2017-06-12 用户推荐方法和装置,存储介质和服务器 Active CN109062914B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710438782.0A CN109062914B (zh) 2017-06-12 2017-06-12 用户推荐方法和装置,存储介质和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710438782.0A CN109062914B (zh) 2017-06-12 2017-06-12 用户推荐方法和装置,存储介质和服务器

Publications (2)

Publication Number Publication Date
CN109062914A CN109062914A (zh) 2018-12-21
CN109062914B true CN109062914B (zh) 2020-10-23

Family

ID=64675999

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710438782.0A Active CN109062914B (zh) 2017-06-12 2017-06-12 用户推荐方法和装置,存储介质和服务器

Country Status (1)

Country Link
CN (1) CN109062914B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111442779B (zh) * 2019-01-16 2022-03-22 百度在线网络技术(北京)有限公司 出行方式推荐方法及装置
CN109815414A (zh) * 2019-01-23 2019-05-28 四川易诚智讯科技有限公司 基于多层网络社团划分的社交网络人物关系分析方法
CN110163657A (zh) * 2019-04-12 2019-08-23 中国平安财产保险股份有限公司 基于流形学习算法的保险产品推荐方法及相关设备
CN110232152B (zh) * 2019-05-27 2021-03-23 腾讯科技(深圳)有限公司 内容推荐方法、装置、服务器以及存储介质
CN110335112A (zh) * 2019-06-18 2019-10-15 中国平安财产保险股份有限公司 一种产品推荐方法、装置及计算机存储介质
CN110929172B (zh) * 2019-11-27 2022-11-18 中科曙光国际信息产业有限公司 信息选择方法、装置、电子设备及可读存储介质
CN111063227B (zh) * 2019-12-17 2021-05-07 河南科技学院 一种基于移动终端的思政答题方法及系统
CN113641791A (zh) * 2021-08-12 2021-11-12 卓尔智联(武汉)研究院有限公司 专家推荐方法、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101221583A (zh) * 2008-01-29 2008-07-16 北京百问百答网络技术有限公司 一种问题推荐方法及系统
CN101944125A (zh) * 2010-09-26 2011-01-12 深圳市珍爱网信息技术有限公司 网络交友用户推荐系统及方法
CN102760128A (zh) * 2011-04-26 2012-10-31 华东师范大学 一种基于智能客服机器人交互的电信领域套餐推荐方法
CN103200279A (zh) * 2013-04-28 2013-07-10 百度在线网络技术(北京)有限公司 推荐方法和云端服务器
CN103279533A (zh) * 2013-05-31 2013-09-04 北京华悦博智科技有限责任公司 一种社交关系推荐方法及系统
CN103577592A (zh) * 2013-11-13 2014-02-12 西安工程大学 基于性格相似度匹配计算的网络社区用户好友推荐方法
CN104424235A (zh) * 2013-08-26 2015-03-18 腾讯科技(深圳)有限公司 实现用户信息聚类的方法和装置
CN104601438A (zh) * 2014-04-28 2015-05-06 腾讯科技(深圳)有限公司 一种好友推荐方法和装置
CN106126582A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 推荐方法及装置
CN106528643A (zh) * 2016-10-13 2017-03-22 上海师范大学 一种基于社交网络的多维度综合推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10394829B2 (en) * 2015-12-08 2019-08-27 International Business Machines Corporation Content authoring

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101221583A (zh) * 2008-01-29 2008-07-16 北京百问百答网络技术有限公司 一种问题推荐方法及系统
CN101944125A (zh) * 2010-09-26 2011-01-12 深圳市珍爱网信息技术有限公司 网络交友用户推荐系统及方法
CN102760128A (zh) * 2011-04-26 2012-10-31 华东师范大学 一种基于智能客服机器人交互的电信领域套餐推荐方法
CN103200279A (zh) * 2013-04-28 2013-07-10 百度在线网络技术(北京)有限公司 推荐方法和云端服务器
CN103279533A (zh) * 2013-05-31 2013-09-04 北京华悦博智科技有限责任公司 一种社交关系推荐方法及系统
CN104424235A (zh) * 2013-08-26 2015-03-18 腾讯科技(深圳)有限公司 实现用户信息聚类的方法和装置
CN103577592A (zh) * 2013-11-13 2014-02-12 西安工程大学 基于性格相似度匹配计算的网络社区用户好友推荐方法
CN104601438A (zh) * 2014-04-28 2015-05-06 腾讯科技(深圳)有限公司 一种好友推荐方法和装置
CN106126582A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 推荐方法及装置
CN106528643A (zh) * 2016-10-13 2017-03-22 上海师范大学 一种基于社交网络的多维度综合推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"社区问答系统中问题分类及推荐机制的研究";陈俊;《中国优秀硕士学位论文全文数据库信息科技辑》;20170215(第2期);第4.4节 *

Also Published As

Publication number Publication date
CN109062914A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
CN109062914B (zh) 用户推荐方法和装置,存储介质和服务器
CN108287864B (zh) 一种兴趣群组划分方法、装置、介质及计算设备
TWI408560B (zh) 用以在一電腦網路中推薦使用者其可能感興趣的項目或人物的方法、系統及其裝置
Sussman et al. A consistent adjacency spectral embedding for stochastic blockmodel graphs
CN110472090B (zh) 基于语义标签的图像检索方法以及相关装置、存储介质
CN109582956B (zh) 应用于句子嵌入的文本表示方法和装置
Lappas et al. A survey of algorithms and systems for expert location in social networks
CN104714931A (zh) 用于选择用以代表表格式信息的方法和系统
US8032469B2 (en) Recommending similar content identified with a neural network
US20140129320A1 (en) B-matching using sufficient selection belief propagation
CN110033097B (zh) 基于多个数据域确定用户与物品的关联关系的方法及装置
Muhammadi et al. A unified statistical framework for crowd labeling
CN113343091A (zh) 面向产业和企业的科技服务推荐计算方法、介质及程序
Neve et al. Hybrid reciprocal recommender systems: Integrating item-to-user principles in reciprocal recommendation
Stanimirović et al. Decomposition of Catalan numbers and convex polygon triangulations
US20180308057A1 (en) Joint optimization and assignment of member profiles
Jin et al. Lending Interaction Wings to Recommender Systems with Conversational Agents
Hüllermeier Similarity-based inference as evidential reasoning
Gentile et al. Extracting semantic user networks from informal communication exchanges
CN113515519A (zh) 图结构估计模型的训练方法、装置、设备及存储介质
CN115564013B (zh) 提高网络表示学习表示能力的方法、模型训练方法和系统
CN110262906B (zh) 接口标签推荐方法、装置、存储介质和电子设备
Priyanka et al. Calibration estimators for quantitative sensitive mean estimation under successive sampling
Ahuja et al. Fusion of Semantic, Visual and Network Information for Detection of Misinformation on Social Media
CN111444338A (zh) 文本处理、装置、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant