CN106021311A - 网络社交活动推荐方法和装置 - Google Patents

网络社交活动推荐方法和装置 Download PDF

Info

Publication number
CN106021311A
CN106021311A CN201610292747.8A CN201610292747A CN106021311A CN 106021311 A CN106021311 A CN 106021311A CN 201610292747 A CN201610292747 A CN 201610292747A CN 106021311 A CN106021311 A CN 106021311A
Authority
CN
China
Prior art keywords
social intercourse
network social
movable
recommended
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610292747.8A
Other languages
English (en)
Inventor
程祥
苏森
李舒辰
双锴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201610292747.8A priority Critical patent/CN106021311A/zh
Publication of CN106021311A publication Critical patent/CN106021311A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种网络社交活动推荐方法和装置。该方法包括:根据各待推荐网络社交活动的内容信息,获取用户对各待推荐网络社交活动的第一评分;根据各待推荐网络社交活动的位置信息,获取用户对各待推荐网络社交活动的第二评分,和/或根据各待推荐网络社交活动的组织者信息,获取用户对各待推荐网络社交活动的第三评分;根据第一评分,以及第二评分和/或第三评分,获取各待推荐网络社交活动的总评分;根据总评分,向用户进行网络社交活动推荐。通过综合多方面评分向用户进行网络社交活动推荐,可显著改善网络社交活动的推荐效果。

Description

网络社交活动推荐方法和装置
技术领域
本发明涉及数据挖掘技术,尤其涉及一种网络社交活动推荐方法和装置。
背景技术
近些年来,随着物质生活水平的提高,人们越来越热衷参加各类活动,如爬山、健身、旅游等,以丰富假期生活,以豆瓣同城等为代表的基于活动的社交网络得到了快速发展。该些基于活动的社交网络给用户提供了一个在线的平台,用户通过该平台组织、管理和参加各种各样的网络社交活动。
然而,由于网络社交活动具有时效性,每天都有大量的网络社交活动失效,同时每天都有大量的新网络社交活动被发布,若社交网络没有对所有的网络社交活动在推荐表中进行合理的排序,将会使用户无法在大量的网络社交活动中快速获取到感兴趣且未失效的网络社交活动,浪费了用户的时间,进而可能导致用户改用其他社交网络。
现有网络社交活动的推荐方式,通常采用基于内容的推荐方法。通过对网络社交活动的内容与用户的偏好进行比较,越符合用户偏好的新网络社交活动在新网络社交活动推荐表中的位置越靠前,但是,一个网络社交活动通常具有多元属性,仅基于网络社交活动内容进行新网络社交活动的推荐往往导致新网络社交活动的推荐效果较差。
发明内容
本发明提供一种网络社交活动推荐方法和装置,用以克服现有网络社交活动推荐方法仅基于网络社交活动的内容信息进行推荐,导致推荐效果较差的问题。
本发明一方面提供一种网络社交活动推荐方法,包括:
根据各待推荐网络社交活动的内容信息和已举办网络社交活动的内容信息,获取用户对各所述待推荐网络社交活动的第一评分;
根据各所述待推荐网络社交活动的位置信息和所述用户的已参加网络社交活动的位置信息,获取所述用户对各所述待推荐网络社交活动的第二评分,和/或根据各所述待推荐网络社交活动的组织者信息和所述所有已举办网络社交活动的组织者信息,获取所述用户对各所述待推荐网络社交活动的第三评分;
根据各所述待推荐网络社交活动的所述第一评分,以及所述第二评分和/或所述第三评分,获取各所述待推荐网络社交活动的总评分;
根据各所述待推荐网络社交活动的总评分,向所述用户进行网络社交活动推荐。
本发明另一方面提供一种网络社交活动推荐装置,包括:
第一评分模块,用于根据各待推荐网络社交活动的内容信息和已举办网络社交活动的内容信息,获取用户对各所述待推荐网络社交活动的第一评分;
第二评分模块,用于根据各所述待推荐网络社交活动的位置信息和所述用户的已参加网络社交活动的位置信息,获取所述用户对各所述待推荐网络社交活动的第二评分,和/或第三评分模块,用于根据各所述待推荐网络社交活动的组织者信息和所述所有已举办网络社交活动的组织者信息,获取所述用户对各所述待推荐网络社交活动的第三评分;
总评分模块,用于根据各所述待推荐网络社交活动的所述第一评分,以及所述第二评分和/或所述第三评分,获取各所述待推荐网络社交活动的总评分;
推荐模块,用于根据各所述待推荐网络社交活动的总评分,向所述用户进行网络社交活动推荐。
本发明提供一种网络社交活动推荐方法和装置,根据待推荐网络社交活动的内容信息、位置信息和/或组织者信息对待推荐网络社交活动进行多方面评分,综合多方面评分结果向用户进行网络社交活动推荐,从而改善网络社交活动的推荐效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的网络社交活动推荐方法实施例一的流程示意图;
图2为本发明提供的网络社交活动推荐方法实施例二的流程示意图;
图3为本发明提供的网络社交活动推荐方法实施例三的流程示意图;
图4为本发明提供的网络社交活动推荐方法实施例四的流程示意图;
图5为本发明提供的网络社交活动推荐装置实施例一的结构示意图;
图6为本发明提供的网络社交活动推荐装置实施例二的结构示意图;
图7为本发明提供的网络社交活动推荐装置实施例三的结构示意图;
图8为本发明提供的网络社交活动推荐装置实施例四的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
社交网络上存在有多个已经举办过的网络社交活动,对于用户而言,所有已举办网络社交活动可划分为已参加过的网络社交活动和未参加过的网络社交活动,已参加过的网络社交活动可认为是用户感兴趣的网络社交活动。当有多个新的网络社交活动被发布时,可结合用户已经参加过的网络社交活动信息,推测用户在多个新的网络社交活动中的倾向,向用户推荐可能感兴趣的网络社交活动,以提高推荐效果。
本发明实施例提供一种网络社交活动推荐方法和装置,根据网络社交活动的内容、位置信息和/或组织者信息对网络社交活动进行多方面评分,综合多方面评分向用户进行网络社交活动推荐,从而改善网络社交活动的推荐效果。
下面以具体地实施例对本发明的技术方案以及本发明的技术方案如何实现进行详细说明。
本发明实施例提供一种网络社交活动推荐方法,该方法的执行主体可以为网络社交活动推荐装置,该装置可以由软件和/或硬件实现。图1为本发明提供的网络社交活动推荐方法实施例一的流程示意图。如图1所示,该方法包括:
步骤101、根据各待推荐网络社交活动的内容信息和已举办网络社交活动的内容信息,获取用户对各待推荐网络社交活动的第一评分;
步骤102、根据各待推荐网络社交活动的位置信息和用户的已参加网络社交活动的位置信息,获取用户对各待推荐网络社交活动的第二评分;和/或步骤103、根据各待推荐网络社交活动的组织者信息和所有已举办网络社交活动的组织者信息,获取用户对各待推荐网络社交活动的第三评分;
步骤104、根据各待推荐网络社交活动的第一评分,以及第二评分和/或第三评分,获取各待推荐网络社交活动的总评分;
步骤105、根据各待推荐网络社交活动的总评分,向用户进行网络社交活动推荐。
其中,步骤101、步骤102和步骤103之间没有严格的先后执行关系,可同时执行也按预设顺序先后执行。步骤102与步骤103可同时执行,也可择一执行,对应的在步骤104中,则根据步骤102与步骤103是否执行,采用得到的第二评分和/或第三评分获取总评分。
具体的,在步骤101中,对于所有待推荐的网络社交活动,可通过比较活动内容与用户已参加过的网络社交活动的活动内容的相似度,来对各待推荐的网络社交活动进行打分,相似度越高则打分越高。示例性的,通过统计用户已参加过的网络社交活动的活动内容,发现用户热衷参加爬山类活动,对于待推荐的内容为爬山和游泳的网络社交活动,则对活动内容为爬山的网络社交活动给出较高的评分,对于活动内容为游泳的网络社交活动则给出较低的评分。
具体的,在步骤102中,考虑到待推荐网络社交活动的位置信息可能会影响用户对该网络社交活动的倾向性,示例性的,可参考用户的已参加网络社交活动的位置信息,获取用户经常参加的网络社交活动的位置信息以及参加次数,进而确定用户的感兴趣地点,当新的待推荐网络社交活动的位置与用户的感兴趣地点越接近时,可为该待推荐网络社交活动打较高的评分,当新的待推荐网络社交活动的位置与用户的感兴趣地点越远时,可为该待推荐网络社交活动打较低的评分。
具体的,在步骤103中,考虑到待推荐网络社交活动的组织者的组织能力可能会影响用户对该网络社交活动的倾向性,可将各组织者对用户的影响力作为用户对各待推荐网络社交活动的评分,当影响力越大,评分越高,用户越有可能对该网络社交活动感兴趣。示例性的,可将用户参加各组织者组织的网络社交活动的次数作为该组织者对用户的影响力,还可根据所有已举办网络社交活动的组织者信息,获取各组织者举办过的网络社交活动以及参加的人数,进而根据参加人数的多少对所有组织者进行排序,根据排序获取用户对各待推荐网络社交活动的第三评分。
具体的,在步骤104中,根据获取到的各待推荐网络社交活动的第一评分,以及第二评分和/或第三评分,对各评分进行加权求和,即可得到各待推荐网络社交活动的总评分,具体的,各评分的权重系数可由用户预设。
具体的,在步骤105中,根据获取到的各待推荐网络社交活动的总评分,按照评分由高至低的顺序向用户进行网络社交活动推荐。
本发明提供一种网络社交活动推荐方法,根据网络社交活动的内容信息、位置信息和/或组织者信息对网络社交活动进行多方面评分,综合多方面评分结果向用户进行网络社交活动推荐,从而改善网络社交活动的推荐效果。
进一步地,在图1所示实施例的基础上,对于基于网络社交活动的活动内容,对待推荐的网络社交活动进行评分进行详细说明。图2为本发明提供的网络社交活动推荐方法实施例二的流程示意图。如图2所示,基于网络社交活动的活动内容,对待推荐的网络社交活动进行评分包括:
步骤201、根据已举办网络社交活动的内容信息,获取主题模型和用户的所有已参加网络社交活动的内容信息在主题模型上的主题分布。
具体地,对于所有已举办网络社交活动,以用户为单位,将每一个用户的已参加网络社交活动的内容,记录在一个用户文档中,获得多个用户文档,对多个用户文档使用隐含狄利克雷分布(Latent Dirichlet Allocation,简称LDA模型)生成一个主题模型,并可得到每个用户在主题模型上的主题分布。该主题模型体现了用户在所有已举办网络社交活动的活动内容中的各活动主题上的偏好,活动主题可能包括爬山、游泳、骑行、读书等。用户的所有已参加网络社交活动的内容信息在主题模型上的主题分布表明了用户参加各活动活动的偏好,例如,用户有60%的概率参加爬山活动,有30%的概率参加骑行活动,有10%的概率参加游泳活动,且对其他主题的网络社交活动没有偏好。
步骤202、根据吉布斯采样算法获取各待推荐网络社交活动的内容信息在主题模型上的主题分布。
具体的,对于各待推荐网络社交活动,可通过吉布斯采样算法,根据步骤201中得到的主题模型,学习出各待推荐网络社交活动的主题分布,即根据任一一个待推荐的网络社交活动的内容信息,可得到该网络社交活动的主题分布。
步骤203、获取各待推荐网络社交活动的主题分布与用户的主题分布的散度,根据各散度,获取用户对各待推荐网络社交活动的第一评分。
具体的,可以为Jensen-Shannon散度,对于任一当前用户,可应用散度计算公式获取各待推荐网络社交活动j对应的主题分布θj与当前用户对应的主题分布θ的散度D(θ||θj);
其中,散度计算公式为:
D ( θ | | θ j ) = 1 2 [ D K L ( θ | | P ) + D K L ( θ j | | P ) ] ;
DKL(θ||P)表示用户对应的主题分布θ与P之间的KL散度,DKLj||P)表示待推荐网络社交活动j对应的主题分布θj与P之间的KL散度,j取从1至N的正整数,N表示待推荐网络社交活动的总个数。
其中,KL散度(Kullback–Leibler divergence),用于描述两个概率分布之间的差异,当两个概率分布越相似,KL散度值越小,当两个概率分布差异越大,KL散度值越大。
具体的,在根据各待推荐网络社交活动j对应的散度D(θ||θj)获取用户对各待推荐网络社交活动j的第一评分时,散度值与第一评分成反比,当散度值越大,该待推荐网络社交活动的第一评分越低。示例性的,散度与第一评分之和可以为1。示例性的,将1-D(θ||θj)作为用户对各待推荐网络社交活动j的评分,然后将各待推荐网络社交活动的评分进行归一化,得到各待推荐网络社交活动的第一评分。
进一步地,在图1或图2所示实施例的基础上,对于基于网络社交活动的位置信息,对待推荐的网络社交活动进行评分进行详细说明。图3为本发明提供的网络社交活动推荐方法实施例三的流程示意图。如图3所示,基于网络社交活动的位置信息,对待推荐的网络社交活动进行评分包括:
步骤301、根据用户的已参加网络社交活动的位置信息,获取用户的所有已参加网络社交活动的举办位置的集合L,获取用户参加位于举办位置li处的网络社交活动的次数n(li),举办位置li表示集合L中的任一举办位置,i的取值为从1至M的正整数,M表示集合L的元素总个数;
步骤302、获取集合L中每两个举办位置之间的距离,根据所有两个举办位置之间的距离获取所有两个举办位置之间的距离的概率分布,根据概率分布获取距离分布模型p(dis),距离分布模型表示任一距离dis的概率p;
步骤303、根据参与概率公式获取用户参加各待推荐网络社交活动j的参与概率p(j),根据各参与概率p(j)获取用户对各待推荐网络社交活动的第二评分;
其中,参与概率公式为:
p ( j ) = Σ l i ∈ L n ( l i ) * p ( d i s ( l i , l j ) ) Σ l i ∈ L n ( l i ) ;
其中,lj表示待推荐网络社交活动j的举办位置,dis(li,lj)表示举办位置lj与举办位置li之间的距离,p(dis(li,lj))表示根据距离分布模型获得的距离dis(li,lj)的概率,j取从1至N的正整数,N表示待推荐网络社交活动的总个数。
具体的,在步骤301中,统计用户的已参加网络社交活动的位置信息,获取用户参加过的网络社交活动的所有的举办位置li,确定所有的举办位置li的集合L,集合L中的元素总个数用M表示,i的取值为从1至M的正整数。同时获取用户参加位于举办位置li处的网络社交活动的次数n(li)。
具体的,在步骤302中,对于集合L中的所有举办位置li,获取每两个举办位置之间的距离,得到多个距离以及每个距离出现的概率,根据每个距离出现的概率,拟合一个距离分布模型p(dis),示例性的,该距离分布模型可以为p(dis)=a·disn,该距离分布模型表示任一距离dis的概率p,即根据已有的距离的分布概率,推测在距离可以为任意值时,所有距离的分布概率。
具体的,在步骤303中,根据待推荐网络社交活动j的举办位置lj与用户的已参加网络社交活动的举办位置li之间的距离dis(li,lj),应用参与概率公式,可得到用户参加各待推荐网络社交活动j的参与概率p(j)。
具体的,参与概率公式为:
p ( j ) = Σ l i ∈ L n ( l i ) * p ( d i s ( l i , l j ) ) Σ l i ∈ L n ( l i ) ;
根据该参与概率公式可知,当待推荐网络社交活动j的举办位置lj与所有用户的已参加网络社交活动的举办位置li之间的距离dis(li,lj)的概率较高时,该待推荐网络社交活动的参与概率较高,将各待推荐网络社交活动的参与概率进行归一化,即可得到用户对各待推荐网络社交活动的第二评分。
进一步地,在上述任一实施例的基础上,对于基于网络社交活动的组织者信息,对待推荐的网络社交活动进行评分进行详细说明。图4为本发明提供的网络社交活动推荐方法实施例四的流程示意图。如图4所示,基于网络社交活动的组织者信息,对待推荐的网络社交活动进行评分包括:
步骤401、根据已举办网络社交活动的组织者信息,将已举办网络社交活动中用户已参加网络社交活动的组织者记为第一组织者,获取各第一组织者对用户的影响力;
步骤402、将已举办网络社交活动的所有组织者中除第一组织者外的组织者记为第二组织者,根据各第一组织者对用户的影响力和贝叶斯推理,获取各第二组织者对用户的影响力;
步骤403、根据各第一组织者对用户的影响力或各第二组织者对用户的影响力,获取各待推荐网络社交活动的组织者对用户的影响力,根据各待推荐网络社交活动的组织者对用户的影响力获取用户对各待推荐网络社交活动的第三评分。
具体的,在步骤401中,对于所有已举办网络社交活动的组织者,当用户参加过其组织的网络社交活动时,将该组织者记为第一组织者,获取各第一组织者对用户的影响力。
可选的,获取用户参加各第一组织者所组织的网络社交活动的次数,将各次数作为各第一组织者对用户的影响力。
具体的,在步骤402中,对于所有已举办网络社交活动的组织者,当用户未参加过其组织的网络社交活动时,将该组织者记为第二组织者,根据各第一组织者对用户的影响力以及贝叶斯推理,推测出各第二组织者对用户的影响力。
示例性的,可根据用户参加各第一组织者组织的网络社交活动次数,推测出用户参加各第二组织者组织的网络社交活动的次数,将各推测出的次数作为各第二组织者对用户的影响力,具体过程包括:
步骤一、根据所有组织者组织的网络社交活动的流行度,获取所有组织者的流行度。其中,针对所有已举办网络社交活动中的每一个网络社交活动k,可根据如下的公式计算该网络社交活动的流行度:
PE k = δNY k + ( 1 - δ ) NM k M A X ( δNY k + ( 1 - δ ) NM k ) , 0 ≤ δ ≤ 1 , ;
其中,NYk表示参加过网络社交活动k的人数,NMk表示对网络社交活动k感兴趣的人数,δ为预设权重因子,可选的,δ默认为0.5。
任一组织者n的流行度为其所举办的所有网络社交活动的流行度的平均值,记为Pn
步骤二、为所有组织者和用户建立用户-组织者矩阵R,矩阵R中的任一个元素rm,n表示用户um参与活动组织者on所举办活动的次数,根据上述分析可知,矩阵R中的部分值可在步骤401中确定,而剩余的部分值则无法确定,可先赋值为0。采用指示函数Im,n表示矩阵R中的各元素的取值情况,如果rm,n>0,则Im,n为1,否则Im,n为0。
步骤三、获取R中各元素取不同值时的条件概率p(R|U,O,P,σ2)。其中,
p ( R | U , O , P , σ 2 ) = Π n = 1 N Π m = 1 M [ N ( r m , n | g ( U m , O n , P n ) , σ 2 ) ] I m , n ,
假设R中的任一元素rm,n的取值符合高斯分布N(x|μ,σ2),μ=g(Um,On,Pn)=Pn·Um TOn表示高斯分布的均值,σ2表示高斯分布的方差,σ2为预设值,Pn表示组织者on的流行度,Um和On分别表示用户um和组织者on的特征向量,U和O分别表示所有用户和所有组织者的特征向量矩阵,P表示所有组织者的流行度矩阵。
步骤四、获取所有用户和所有组织者的特征向量矩阵U和O的先验概率,假设用户um和组织者on的特征向量均符合零均值的高斯分布:
p ( U | σ U 2 ) = Π m = 1 M N ( U m | 0 , σ U 2 I ) ;
p ( O | σ O 2 ) = Π n = 1 N N ( O n | 0 , σ O 2 I ) .
其中,为预设方差,表示多元正态分布的协方差矩阵,其中I为单位矩阵。
步骤五、首先,根据贝叶斯推理可知,后验概率可正比于条件概率与先验概率的乘积,故可得到特征向量矩阵U和O后验概率符合以下公式:
p ( U , O | R , P , σ U 2 , σ O 2 , σ 2 ) ∝ p ( R | U , O , P , σ 2 ) p ( U | σ U 2 ) p ( O | σ O 2 ) ;
其次,对特征向量矩阵U和O的后验概率进行log以e为底的对数运算,得到其中:
ln p ( U , O | R , P , σ U 2 , σ O 2 , σ 2 ) ∝ ln p ( R | U , O , P , σ 2 ) + ln p ( U | σ U 2 ) + ln p ( O | σ O 2 ) ;
ln p ( U , O | R , P , σ U 2 , σ O 2 , σ 2 ) = - 1 2 σ 2 Σ n = 1 N Σ m = 1 M I m , n ( r m , n - P n · U m T O n ) 2 - 1 2 σ U 2 Σ m = 1 M U m T U m - 1 2 σ O 2 Σ n = 1 N O n T O n - 1 2 ( ( Σ n = 1 N Σ m = 1 M I m , n ) lnσ 2 + N D lnσ U 2 + M D lnσ O 2 ) + C ;
其中,C、M、N、D为常数。
根据贝叶斯推理,通过最大化后验概率进行U和O的求解。
再次,对进行最大化,等同于对下述公式E进行最小化;
E = 1 2 Σ n = 1 N Σ m = 1 M I m , n ( r m , n - P n · U m T O n ) 2 + λ U 2 Σ m = 1 M | | U m | | F 2 + λ O 2 Σ n = 1 N | | O n | | F 2 ,
其中, 表示Frobenius范数。
再次,采用梯度下降法迭代求解上述目标函数E,并得到最终的Um和On,其中Um和On的梯度为:
∂ E ∂ U m = - Σ n = 1 N I m , n ( r m , n - P n · U m T O n ) · P n O n + λ U U m ;
∂ E ∂ O n = - Σ m = 1 M I m , n ( r m , n - P n · U m T O n ) · P n U m + λ O O n .
最后,根据获取到的Um和On,即可通过公式rm,n=Pn·Um TOn获取用户Um参与任意活动组织者On所组织活动的次数。
具体的,在步骤403中,对于各待推荐网络社交活动,通过根据步骤401与步骤402中获取的所有组织者对用户的影响力,可确定各待推荐网络社交活动的组织者对用户的影响力,将各影响力作为用户对各待推荐网络社交活动的评分,然后对各评分进行归一化,即可得到用户对各待推荐网络社交活动的第三评分。
本发明另一方面还提供一种网络社交活动推荐装置,用于执行如上所述的网络社交活动推荐方法,具有相同的特征和效果,本发明不再赘述。
图5为本发明提供的网络社交活动推荐装置实施例一的结构示意图。如图5所示,该装置包括:
第一评分模块501,用于根据各待推荐网络社交活动的内容信息和已举办网络社交活动的内容信息,获取用户对各待推荐网络社交活动的第一评分;
第二评分模块502,用于根据各待推荐网络社交活动的位置信息和用户的已参加网络社交活动的位置信息,获取用户对各待推荐网络社交活动的第二评分,和/或第三评分模块503,用于根据各待推荐网络社交活动的组织者信息和所有已举办网络社交活动的组织者信息,获取用户对各待推荐网络社交活动的第三评分;
总评分模块504,用于根据各待推荐网络社交活动的第一评分,以及第二评分和/或第三评分,获取各待推荐网络社交活动的总评分;
推荐模块505,用于根据各待推荐网络社交活动的总评分,向用户进行网络社交活动推荐。
进一步的,在图5所示实施例的基础上,对第一评分模块进行详细说明。图6为本发明提供的网络社交活动推荐装置实施例二的结构示意图。如图6所示,第一评分模块501,包括:
主题模型获取模块601,用于根据已举办网络社交活动的内容信息,获取所有已举办网络社交活动的主题模型和用户的所有已参加网络社交活动的内容信息在主题模型上的主题分布;
主题分布获取模块602,用于根据吉布斯采样算法获取各待推荐网络社交活动的内容信息在主题模型上的主题分布;
评分获取模块603,用于获取各待推荐网络社交活动的主题分布与用户的主题分布的散度,根据各散度,获取用户对各待推荐网络社交活动的第一评分。
可选的,评分获取模块603具体用于,根据散度计算公式获取各待推荐网络社交活动j对应的主题分布θj与用户对应的主题分布θ的散度D(θ||θj);
其中,散度计算公式为:
D ( θ | | θ j ) = 1 2 [ D K L ( θ | | P ) + D K L ( θ j | | P ) ] ;
DKL(θ||P)表示主题分布θ与P之间的KL散度,DKLj||P)表示主题分布θj与P之间的KL散度,j取从1至N的正整数,N表示待推荐网络社交活动的总个数。
可选的,散度与第一评分成反比。
进一步的,在图5或图6所示实施例的基础上,对第二评分模块进行详细说明。图7为本发明提供的网络社交活动推荐装置实施例三的结构示意图。如图7所示,第二评分模块502包括:
位置信息处理模块701,用于根据用户的已参加网络社交活动的位置信息,获取用户的所有已参加网络社交活动的举办位置的集合L,获取用户参加位于举办位置li处的网络社交活动的次数n(li),举办位置li表示集合L中的任一举办位置,i的取值为从1至M的正整数,M表示集合L的元素总个数;
模型获取模块702,用于获取集合L中每两个举办位置之间的距离,根据所有两个举办位置之间的距离获取所有两个举办位置之间的距离的概率分布,根据概率分布获取距离分布模型p(dis),距离分布模型表示任一距离dis的概率p;
评分获取模块703,用于根据参与概率公式获取用户参加各待推荐网络社交活动j的参与概率p(j),根据各参与概率p(j)获取用户对各待推荐网络社交活动的第二评分;
其中,参与概率公式为:
p ( j ) = Σ l i ∈ L n ( l i ) * p ( d i s ( l i , l j ) ) Σ l i ∈ L n ( l i ) ;
其中,lj表示待推荐网络社交活动j的举办位置,dis(li,lj)表示举办位置lj与举办位置li之间的距离,p(dis(li,lj))表示根据距离分布模型获得的距离dis(li,lj)的概率,j取从1至N的正整数,N表示待推荐网络社交活动的总个数。
进一步的,在上述任一实施例的基础上,对第三评分模块进行详细说明。图8为本发明提供的网络社交活动推荐装置实施例四的结构示意图。如图8所示,,第三评分模块503包括:
第一影响力获取模块801,用于根据已举办网络社交活动的组织者信息,将已举办网络社交活动中用户已参加网络社交活动的组织者记为第一组织者,获取各第一组织者对用户的影响力;
第二影响力获取模块802,用于将已举办网络社交活动中用户未参加网络社交活动的组织者记为第二组织者,根据各第一组织者对用户的影响力和贝叶斯推理,获取各第二组织者对用户的影响力;
评分获取模块803,用于根据各第一组织者对用户的影响力或各第二组织者对用户的影响力,获取各待推荐网络社交活动的组织者对用户的影响力,根据各待推荐网络社交活动的组织者对用户的影响力获取用户对各待推荐网络社交活动的第三评分。
可选的,第一影响力获取模块801具体用于,根据用户的已参加网络社交活动的组织者信息,获取用户参加各第一组织者所组织的网络社交活动的次数,将各次数作为各第一组织者对用户的影响力。
本发明提供一种网络社交活动推荐装置,根据网络社交活动的内容信息、位置信息和/或组织者信息对网络社交活动进行多方面评分,综合多方面评分结果向用户进行网络社交活动推荐,从而改善网络社交活动的推荐效果。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种网络社交活动推荐方法,其特征在于,包括:
根据各待推荐网络社交活动的内容信息和已举办网络社交活动的内容信息,获取用户对各所述待推荐网络社交活动的第一评分;
根据各所述待推荐网络社交活动的位置信息和所述用户的已参加网络社交活动的位置信息,获取所述用户对各所述待推荐网络社交活动的第二评分,和/或根据各所述待推荐网络社交活动的组织者信息和所述所有已举办网络社交活动的组织者信息,获取所述用户对各所述待推荐网络社交活动的第三评分;
根据各所述待推荐网络社交活动的所述第一评分,以及所述第二评分和/或所述第三评分,获取各所述待推荐网络社交活动的总评分;
根据各所述待推荐网络社交活动的总评分,向所述用户进行网络社交活动推荐。
2.根据权利要求1所述的方法,其特征在于,所述根据各所述待推荐网络社交活动的位置信息和所述用户的已参加网络社交活动的位置信息,获取所述用户对各所述待推荐网络社交活动的第二评分,包括:
根据所述用户的已参加网络社交活动的位置信息,获取所述用户的所有已参加网络社交活动的举办位置的集合L,获取所述用户参加位于举办位置li处的网络社交活动的次数n(li),举办位置li表示所述集合L中的任一举办位置,i的取值为从1至M的正整数,M表示所述集合L的元素总个数;
获取所述集合L中每两个举办位置之间的距离,根据所有所述两个举办位置之间的距离获取所有所述两个举办位置之间的距离的概率分布,根据所述概率分布获取距离分布模型p(dis),所述距离分布模型表示任一距离dis的概率p;
根据参与概率公式获取所述用户参加各所述待推荐网络社交活动j的参与概率p(j),根据各所述参与概率p(j)获取所述用户对各所述待推荐网络社交活动的第二评分;
其中,所述参与概率公式为:
p ( j ) = Σ l i ∈ L n ( l i ) * p ( d i s ( l i , l j ) ) Σ l i ∈ L n ( l i ) ;
其中,lj表示所述待推荐网络社交活动j的举办位置,dis(li,lj)表示举办位置lj与举办位置li之间的距离,p(dis(li,lj))表示根据所述距离分布模型获得的距离dis(li,lj)的概率,j取从1至N的正整数,N表示所述待推荐网络社交活动的总个数。
3.根据权利要求1或2所述的方法,其特征在于,所述根据各所述待推荐网络社交活动的组织者信息和所述已举办网络社交活动的组织者信息,获取用户对各所述待推荐网络社交活动的第三评分,包括:
根据所述已举办网络社交活动的组织者信息,将所述已举办网络社交活动中所述用户已参加网络社交活动的组织者记为第一组织者,获取各所述第一组织者对所述用户的影响力;
将所述已举办网络社交活动的所有组织者中除第一组织者外的组织者记为第二组织者,根据各所述第一组织者对用户的影响力和贝叶斯推理,获取各所述第二组织者对所述用户的影响力;
根据各所述第一组织者对所述用户的影响力或各所述第二组织者对所述用户的影响力,获取各所述待推荐网络社交活动的组织者对所述用户的影响力,根据各所述待推荐网络社交活动的组织者对所述用户的影响力获取所述用户对各所述待推荐网络社交活动的第三评分。
4.根据权利要求3所述的方法,其特征在于,所述获取各所述第一组织者对所述用户的影响力,包括:
根据所述用户的已参加网络社交活动的组织者信息,获取所述用户参加各所述第一组织者所组织的网络社交活动的次数,将各所述次数作为各所述第一组织者对用户的影响力。
5.根据权利要求1或2所述的方法,其特征在于,所述根据各待推荐网络社交活动的内容信息和已举办网络社交活动的内容信息,获取用户对各所述待推荐网络社交活动的第一评分,包括:
根据所述已举办网络社交活动的内容信息,获取主题模型和所述用户的所有已参加网络社交活动的内容信息在所述主题模型上的主题分布;
根据吉布斯采样算法获取各所述待推荐网络社交活动的内容信息在所述主题模型上的主题分布;
获取各所述待推荐网络社交活动的主题分布与所述用户的主题分布的散度,根据各所述散度,获取所述用户对各所述待推荐网络社交活动的第一评分。
6.根据权利要求5所述的方法,其特征在于,所述获取各所述待推荐网络社交活动对应的主题分布与所述用户对应的主题分布的散度,包括:
根据散度计算公式获取各所述待推荐网络社交活动j对应的主题分布θj与所述用户对应的主题分布θ的散度D(θ||θj);
其中,所述散度计算公式为:
D ( θ | | θ j ) = 1 2 [ D K L ( θ | | P ) + D K L ( θ j | | P ) ] ;
DKL(θ||P)表示所述主题分布θ与所述P之间的KL散度,DKLj||P)表示所述主题分布θj与所述P之间的KL散度,j取从1至N的正整数,N表示所述待推荐网络社交活动的总个数。
7.根据权利要求6所述的方法,其特征在于,所述散度与所述第一评分成反比。
8.一种网络社交活动推荐装置,其特征在于,包括:
第一评分模块,用于根据各待推荐网络社交活动的内容信息和已举办网络社交活动的内容信息,获取用户对各所述待推荐网络社交活动的第一评分;
第二评分模块,用于根据各所述待推荐网络社交活动的位置信息和所述用户的已参加网络社交活动的位置信息,获取所述用户对各所述待推荐网络社交活动的第二评分,和/或第三评分模块,用于根据各所述待推荐网络社交活动的组织者信息和所述所有已举办网络社交活动的组织者信息,获取所述用户对各所述待推荐网络社交活动的第三评分;
总评分模块,用于根据各所述待推荐网络社交活动的所述第一评分,以及所述第二评分和/或所述第三评分,获取各所述待推荐网络社交活动的总评分;
推荐模块,用于根据各所述待推荐网络社交活动的总评分,向所述用户进行网络社交活动推荐。
9.根据权利要求8所述的装置,其特征在于,所述第二评分模块包括:
位置信息处理模块,用于根据所述用户的已参加网络社交活动的位置信息,获取所述用户的所有已参加网络社交活动的举办位置的集合L,获取所述用户参加位于举办位置li处的网络社交活动的次数n(li),举办位置li表示所述集合L中的任一举办位置,i的取值为从1至M的正整数,M表示所述集合L的元素总个数;
模型获取模块,用于获取所述集合L中每两个举办位置之间的距离,根据所有所述两个举办位置之间的距离获取所有所述两个举办位置之间的距离的概率分布,根据所述概率分布获取距离分布模型p(dis),所述距离分布模型表示任一距离dis的概率p;
评分获取模块,用于根据参与概率公式获取所述用户参加各所述待推荐网络社交活动j的参与概率p(j),根据各所述参与概率p(j)获取所述用户对各所述待推荐网络社交活动的第二评分;
其中,所述参与概率公式为:
p ( j ) = Σ l i ∈ L n ( l i ) * p ( d i s ( l i , l j ) ) Σ l i ∈ L n ( l i ) ;
其中,lj表示所述待推荐网络社交活动j的举办位置,dis(li,lj)表示举办位置lj与举办位置li之间的距离,p(dis(li,lj))表示根据所述距离分布模型获得的距离dis(li,lj)的概率,j取从1至N的正整数,N表示所述待推荐网络社交活动的总个数。
10.根据权利要求8或9所述的装置,其特征在于,所述第三评分模块包括:
第一影响力获取模块,用于根据所述已举办网络社交活动的组织者信息,将所述已举办网络社交活动中所述用户已参加网络社交活动的组织者记为第一组织者,获取各所述第一组织者对所述用户的影响力;
第二影响力获取模块,用于将所述已举办网络社交活动的所有组织者中除第一组织者外的组织者记为第二组织者,根据各所述第一组织者对用户的影响力和贝叶斯推理,获取各所述第二组织者对所述用户的影响力;
评分获取模块,用于根据各所述第一组织者对所述用户的影响力或各所述第二组织者对所述用户的影响力,获取各所述待推荐网络社交活动的组织者对所述用户的影响力,根据各所述待推荐网络社交活动的组织者对所述用户的影响力获取所述用户对各所述待推荐网络社交活动的第三评分。
CN201610292747.8A 2016-05-05 2016-05-05 网络社交活动推荐方法和装置 Pending CN106021311A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610292747.8A CN106021311A (zh) 2016-05-05 2016-05-05 网络社交活动推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610292747.8A CN106021311A (zh) 2016-05-05 2016-05-05 网络社交活动推荐方法和装置

Publications (1)

Publication Number Publication Date
CN106021311A true CN106021311A (zh) 2016-10-12

Family

ID=57082254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610292747.8A Pending CN106021311A (zh) 2016-05-05 2016-05-05 网络社交活动推荐方法和装置

Country Status (1)

Country Link
CN (1) CN106021311A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273472A (zh) * 2017-06-07 2017-10-20 广东工业大学 一种资源受限约束下的活动推荐方法及系统
CN110889434A (zh) * 2019-10-29 2020-03-17 东南大学 一种基于活动的社交网络活动特征提取方法
CN111143700A (zh) * 2018-10-16 2020-05-12 北京邮电大学 一种活动推荐方法、装置、服务器及计算机存储介质
CN111241415A (zh) * 2019-12-28 2020-06-05 四川文理学院 一种融合多因素社交活动的推荐方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273472A (zh) * 2017-06-07 2017-10-20 广东工业大学 一种资源受限约束下的活动推荐方法及系统
CN107273472B (zh) * 2017-06-07 2020-09-11 广东工业大学 一种资源受限约束下的活动推荐方法及系统
CN111143700A (zh) * 2018-10-16 2020-05-12 北京邮电大学 一种活动推荐方法、装置、服务器及计算机存储介质
CN111143700B (zh) * 2018-10-16 2023-07-25 北京邮电大学 一种活动推荐方法、装置、服务器及计算机存储介质
CN110889434A (zh) * 2019-10-29 2020-03-17 东南大学 一种基于活动的社交网络活动特征提取方法
CN110889434B (zh) * 2019-10-29 2023-04-21 东南大学 一种基于活动的社交网络活动特征提取方法
CN111241415A (zh) * 2019-12-28 2020-06-05 四川文理学院 一种融合多因素社交活动的推荐方法

Similar Documents

Publication Publication Date Title
King et al. Why propensity scores should not be used for matching
CN109460473B (zh) 基于症状提取和特征表示的电子病历多标签分类方法
WO2020233259A1 (zh) 一种基于多中心模式下随机森林算法的特征重要性排序系统
Newman et al. Mixture models and exploratory analysis in networks
Saaty Relative measurement and its generalization in decision making why pairwise comparisons are central in mathematics for the measurement of intangible factors the analytic hierarchy/network process
Amancio et al. Comparing intermittency and network measurements of words and their dependence on authorship
CN109783479B (zh) 一种数据标准化处理方法、装置及存储介质
CN106021311A (zh) 网络社交活动推荐方法和装置
D'ambrosio et al. Two algorithms for finding optimal solutions of the Kemeny rank aggregation problem for full rankings
CN103324758B (zh) 一种新闻分类方法和系统
Mollica et al. Epitope profiling via mixture modeling of ranked data
Joo et al. Impact of psychological traits on rationality of individual investors
CN108363699A (zh) 一种基于百度贴吧的网民学业情绪分析方法
Giorgi et al. Correcting sociodemographic selection biases for population prediction from social media
Stoffi et al. Estimating heterogeneous causal effects in the presence of irregular assignment mechanisms
CN109902157A (zh) 一种训练样本有效性检测方法及装置
Kim et al. Scalable and interpretable data representation for high-dimensional, complex data
Cao Quantifying economic reasoning in court: Judge economics sophistication and pro-business orientation
CN103218419B (zh) 网络标签聚类方法和系统
CN110750572A (zh) 一种科技成果启发式评价的自适应方法和装置
CN109686429A (zh) 医生就诊时间段推荐方法及装置
Yarnold Matrix display of pairwise novometric associations for ordered variables
Zhao et al. Model averaging in a multiplicative heteroscedastic model
CN115641946B (zh) 基于大数据的智慧医疗管理系统及方法
CN108073567A (zh) 一种特征词提取处理方法、系统及服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012