CN109919793A - 活动参与分析及推荐方法 - Google Patents
活动参与分析及推荐方法 Download PDFInfo
- Publication number
- CN109919793A CN109919793A CN201910185945.8A CN201910185945A CN109919793A CN 109919793 A CN109919793 A CN 109919793A CN 201910185945 A CN201910185945 A CN 201910185945A CN 109919793 A CN109919793 A CN 109919793A
- Authority
- CN
- China
- Prior art keywords
- participant
- activity
- movable
- event organizer
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种活动参与分析及推荐方法,通过引入双向选择建模,可以更为真实地还原活动双方的决策过程,同时又通过双层优化解决了传统匹配问题对完整排序列表的依赖,从而既可以实现对于用户的精准画像,又可以提升对于用户决策分析乃至活动推荐的性能,实现一举多得的效果。
Description
技术领域
本发明涉及数据挖掘中的社交用户行为分析领域,尤其涉及一种活动参与分析及推荐 方法。
背景技术
社交网络的发展促进了社交元素与新兴商业模式的深度融合,传统的熟人社交逐渐拓 展为基于兴趣主题的陌生人社交,并进而衍生出面向特定主题的线下聚会及所谓“由事件 驱动的社交网络”。借助这一社交媒介,活动组织者可以便捷地发布与活动相关的介绍并 邀请潜在的参与者。而用户(参与者)则往往根据主题、时间、地点、社交影响等因素综合考虑决定是否参加活动。由于用户与活动数量的飞速增长,如何有效地协助用户找 到感兴趣的活动,同时帮助活动组织者成功聚集目标参与者,已成为社交活动平台所急 需解决的重要任务。
目前,围绕社交活动中的用户画像与活动推荐,已有诸多相关的技术方案与研究成 果,部分代表性的公开技术包括:
CN201610781795.3,一种移动社交网络中的社交活动推荐算法,主要根据用户与活 动之间的标签、地理、好友等相似度来进行活动推荐。
CN201710423237.4,一种资源受限约束下的活动推荐方法及系统,基于推荐成本与 营销成本的约束,将活动推荐转化为一个优化问题并加以求解。
CN201711224583.6,一种活动社交网络用户参加活动推荐的多因素决策方法,根据 活动属性与用户的社交影响力,及内容、地点、时间相关性等诸多因素,采用经典的J48决策树算法,实现活动推荐。
然而,现有技术存在一个严重的缺陷,即往往仅考虑活动中的一方(多为作为参与者 的用户)所做的选择,而另一方仅止于被动接受。在传统推荐问题中,由于其中一方在名额上可视作无限制(如商品的可销售件数或电影的可容纳观众数),这种被动接受现 象有其合理性。但对于活动推荐问题而言,组织方受限于场地或活动规模,而参与者受 限于时间或精力,因此双方都不可能无限制地接受对方。在这种情况下,双方都具有较 强的主动性去根据一定的标准去进行筛选,从而形成了所谓“双向选择”的过程。
对于这一过程的建模及其衍生出的“稳定匹配”问题的求解,虽然目前已有包括经典 的Gale-Shapley算法在内的大量研究成果,但这些技术依赖于显性的对于对方的完整排 序。然而在现实世界中,排序甚至作为排序依据的用户画像都往往以隐性方式存在,需要从大量的历史行为数据中加以揭示和归纳。
发明内容
本发明的目的是提供一种活动参与分析及推荐方法,通过建模活动组织者与参与者双 方的双向选择过程,更加真实地还原双方在活动过程中的决策,同时解决参与预测与活 动推荐两项任务并提升其效果。
本发明的目的是通过以下技术方案实现的:
(与权利要求相对应)。
由上述本发明提供的技术方案可以看出,通过引入双向选择建模,可以更为真实地还 原活动双方的决策过程,同时又通过双层优化解决了传统匹配问题对完整排序列表的依 赖,从而既可以实现对于用户的精准画像,又可以提升对于用户决策分析乃至活动推荐 的性能,实现一举多得的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的 附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得 其他附图。
图1为本发明实施例提供的一种活动参与分析及推荐方法的流程图;
图2为本发明实施例提供的模型训练与参数估计流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地 描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例一种活动参与分析及推荐方法,如图1所示,其主要包括如下步骤:
步骤1、从活动组织者与参与者的历史行为记录中获取用于分析的基本数据。
步骤2、基于获得的基本数据,通过双向稳定匹配与参数迭代优化两层优化过程,还 原历史活动参与决策中的活动组织者与参与者的双向选择过程,从而结合各自的决策函 数估计各方的相对排序,并实现各自决策函数中相关参数的训练。
步骤3、对于新组织的活动,基于活动自身信息、以及完成参数训练的决策函数,计算双方对于对方每个成员的评分,进而通过稳定匹配的方式预测双方相互选择的结果并进行推荐。
上述方案中,通过引入双向选择建模,可以更为真实地还原活动双方的决策过程,同时又通过双层优化解决了传统匹配问题对完整排序列表的依赖,从而既可以实现对于用户的精准画像,又可以提升对于用户决策分析乃至活动推荐的性能,实现一举多得的 效果。
为了便于理解,下面针对上述三个步骤的优选实施方式进行介绍。
1、基本数据的收集、筛选及预处理。
1)基本数据的收集。
本发明实施例中,所述基本数据至少包括:历史活动信息以及活动组织者与参与者 各自的画像信息;
其中,历史活动信息包括:活动主题、活动相关文本描述、活动属性、活动所属的活动组织者、以及参与者的活动反馈与参与记录(是否参见活动、活动后的评价或评 分)等;所述活动属性包括:活动时间、地点及费用等。
活动组织者与参与者各自的画像信息包括:活动组织者对应的领导人或者发起人、 活动组织者与参与者各自的标签与自我介绍、以及参与者之间的显式好友关系等。
2)数据筛选。
由于需要还原活动组织者与参与者之间的双向选择过程,因此,需要为双方,尤其是参与方(用户)提供一定的选择空间。根据这一需求,对获得的基本数据进行数据筛 选,数据筛选时设置了两项阈值。
第一项阈值,用于确保所筛选出的多个活动中,每一活动的潜在参与者之间存在一 定的重叠,所述潜在参与者是指被邀请的参与者;重叠的人数或比例需要根据预设的阈值加以筛选。一般而言,阈值需要根据历史活动的规模与用户的重叠程度来决定。较高 的阈值可以保证活动之间有更多的重叠,从而使得某一组中有更为丰富的用户量可供分 析,双向选择建模的优势也更明显。但是同时,较高的阈值也会导致符合要求的活动组 较少,从而导致覆盖的用户群较为有限。因此,阈值需要在综合考虑上述两种因素的基 础之上进行设定。在本发明实施例中,可以将阈值设定为两两活动之间必须具有10%以 上的重叠用户。
第二项阈值,用于确保活动组织者与参与者均具有一定数量的历史活动记录,从而 保证参与者画像的精度,在本发明实施例中,对于这项阈值并不做额外要求。
3)数据预处理。
无论是历史活动信息还是活动参与双方的介绍,都包含丰富的文本信息。对筛选出 的数据进行预处理时,将相应的文本信息进行向量化处理,以便于进行后续分析,并去除文本信息中的停用词,以免对文本信息向量化处理造成干扰。
本发明实施例中,可以采用Latent Dirichlet Allocation模型,并基于公开的停用词表 筛去部分停用词。
2、模型训练与参数估计。
如图2所示,模型训练与参数估计步骤主要包括5个环节。其中,②和④分别对应外层(双向匹配优化)和内层(参数迭代优化)两个优化过程,而①、③、⑤分别对应着 参数初始化、计算损失函数和排序更新。接下来将详细介绍每个步骤的定义及实施方 式。
①参数初始化。
在本环节中,对活动组织者与参与者各自对于对方的评价因素进行参数初始化,所 涉及的评价因素也即决策函数中的相关参数;并结合初始化后的评价因素与决策函数,初步得到活动组织者所组织的活动和参与者对于对方的完整排序列表,以支撑②中的外层优化(双向匹配)环节。
对于活动组织者而言,其对参与者的评价因素包括:参与者ui的兴趣向量与活动 组织者gj所组织的活动ejk的主题向量的相似性(即参与者的兴趣与活动主题的契合度),以及参与者的影响力(即参与者吸引其他用户参与的能力),其中参与者的影响 力采用参与者在社交网络中的PageRank值加以近似估计,则活动组织者gj对于参与者ui的决策函数表示为:其中,表示活动ejk对参与者 ui的评分,评分大小决定排序列表中相应参与者的位置;cos<.>表示余弦相似度函数, pagerank(W)[i]表示指参与者ui在社交网络中的PageRank值。
对于参与者(用户)而言,其对活动组织者的评价因素包括:参与者ui的兴趣向量与活动ejk的主题向量的相似性,参与者ui对活动ejk所属活动组织者gj的忠诚度 hij、以及来自社交好友的态度影响,来自社交好友的态度影则采用社会影响力计算领域 经典的独立级联模型(Independent Cascade Model)加以近似估计;则参与者ui对于活 动组织者gj的决策函数表示为:其中,表示 参与者ui对活动ejk的评分,评分大小决定排序列表中相应活动的位置;表 示对于参与者ui而言来自社交好友的态度影响,W={wir}为参与者ui与参与者ur之间的 社交关系强度,用于构建参与者之间的社交网络,并实现PageRank值与参与者的影响力 两个部分的计算;表示参与者ui想要参加活动ejk的好友集合。
根据所获得的数据源的不同,可以补充更多的评价因素。在本发明实施例中,根据已有的数据,各评价因素初始化方式如下:
参与者ui的兴趣向量与活动ejk的主题向量的相似性的初始化,依赖于参与者ui的自我介绍或活动ejk的相关文本描述,采用话题模型(Latent DirichletAllocation, LDA)技术,对活动ejk的相关文本描述进行学习并生成若干潜在主题,进而将所有文本 转化为对应的主题向量;如果参与者ui没有自我介绍或活动ejk没有相关文本描述,则将 所有的主题向量设为均值,即每一维均为1/N,其中,N为潜在主题个数;
参与者ui与参与者ur之间的社交关系强度W={wir}的初始化方法为,参与者ui与参与者ur共同参加过的活动数量sumir除以参与者ui参加过的活动的数量sumi:
PageRank值根据初始化W={wir}后所得到的社交网络计算得到;
参与者ui对活动ejk所属活动组织者gj的忠诚度hij初始值设为1,即忠诚于活动ejk所 属活动组织者gj;
同时,考虑到存在部分用户即使受到多个活动邀请,也会选择一个活动都不参加的 情况,因而设计了一个额外的全拒绝倾向参数gri,即当参与者ui对于所有活动的评分均低于gri时,该参与者ui将拒绝全部活动邀请;在本发明实施例中,全拒绝倾向参数gri的初始值为0.1。
通过上述初始化后,利用初始化后的评价因素与各决策函数,得到活动组织者所组 织的活动和参与者对于对方的完整排序列表。
②双向稳定匹配(外层优化)。
在本环节中,利用得到的活动组织者所组织的活动和参与者对于对方的完整排序列 表(通过环节①或者⑤得到),通过改进的一对多Gale-Shapley算法,实现双方的稳定匹配,从而对活动组织者向参与者发放邀请、以及参与者接受邀请并参与活动的情况做 出预测。
首先,基本Gale-Shapley算法主要针对一对一稳定匹配问题,如其衍生的稳定婚姻 问题等。在本问题中,由于活动可以同时承载多个参与用户,因此,需要将这一算法拓展至一对多的场景。具体而言,可将每个活动视作θjk个相同的主体(θjk为该活动所最多 容纳的人数),每个主体所能容纳的用户为1人,同时θjk个主体分享其属性,并在用户 的排序中获得同样的排序分数(并列排名)。在这一设定下,可以很容易地证明面向社 交活动的一对多稳定匹配问题将等价转化为一对一匹配问题,从而可以采用Gale- Shapley算法加以求解。
同时,如前所述,考虑到部分用户可能拒绝所有活动邀请,在本发明实施例中,进行双向稳定匹配环节之前,构造一个虚拟活动,其面向所有参与者开放,同时,参与者 ui对于该虚拟活动活动的评分取决于参数初始化环节中设计的全拒绝倾向参数gri。
基于上述设定,将对活动组织者和参与者进行双向稳定匹配,以实现外层优化。具体而言,考虑到活动组织者gj设计活动ejk,并向潜在参与者发放邀请,潜在参与者根据 收到的邀请进行选择并反馈;然后,活动组织方根据潜在参与者的反馈,结合活动所能 容纳的最大参与者数量θjk,发放下一轮邀请,直到达到最大容纳数量或所有参与者都已 做出稳定选择;相关步骤如下:
1)对于活动ejk,首先根据排序列表,将邀请发给评分前ηjk名参与者;
2)对于接受到ejk邀请的参与者ui,查询其对于活动的完整排序列表,读取对于活动 ejk的评分若没有收到邀请,则将设置为0;
3)对于参与者ui,根据其排序列表,包括虚拟活动的评分gri,选择接受排序最高的活动,如果虚拟活动的评分gri排名最高,则不参加任何活动;
4)对于活动ejk,其所能容纳的最大参与者数量θjk,维护一个最大长度为θjk的参与者列表;如果收到来自参与者ui的参加反馈,则与当前的参与者列表进行比较:如果活 动ejk的参与者列表未满,则将参与者ui按照其评分的顺序加入参与者列表之中;如果活 动ejk的参与者列表已满,则比较排序末尾参与者与参与者ui的评分,保留评分较高者, 且按照评分放入参与者列表相应位置;
5)在所有参与者做出反馈之后,若活动ejk的参与者列表未满,重复上述1)~4),直至活动的参与者列表均已填满,或所有参与者均已做出稳定选择不再修改。
对于所有活动都按照以上的方式进行,最终完成双向稳定匹配,从而对活动组织者 向参与者发放邀请、以及参与者接受邀请并参与活动的情况做出预测。上述步骤1)与步骤5)即为双向匹配结果,分别对应活动组织者向参与者发放邀请的预测结果、参与者接 受邀请并参与活动的预测结果。
③计算损失函数。
在本环节中,基于活动组织者和参与者之间的双向稳定匹配结果,结合活动记录中 的邀请发放与参与者的参与记录,找出预测中所出现的错误,从而计算损失函数。
具体而言,在本发明实施例中,由于试图解决组织方邀请与用户参与两项任务,故损失函数也将基于这两项预测任务而设计,主要考虑如下两类错误:一类是本应被邀请 或参与的参与者,在预测结果中并没有被邀请或并没有参与活动;另一类则是,本不应 被邀请或参与的参与者在预测中收到了邀请或参加了活动。
将活动组织者向参与者ui发放邀请的预测结果和参与者ui接受邀请并参与活动的 预测结果与实际的活动邀请结果和参与者ui的参与结果作比较,设计如下损 失函数:
其中,n表示参与者数量,m表示活动组织者数量,l1表示活动组织者gj所组织的活动的数量;分别表示预测活动组织者向参与者ui发放邀请、预测活动组 织者未向参与者ui发放邀请;分别表示实际上活动组织者向参与者ui发 放邀请、实际上活动组织者未向参与者ui发放邀请;和代表两种预测错 误,即:当且仅当且当且仅当且这两种情 况下,上式对应活动组织者gj邀请预测错误;表示活动组织者向 参与者ui发放邀请的预测结果正确,有如下两种情况且或者 且分别表示预测参与者ui接受邀请并参与活动ejk、预测 参与者ui未接受邀请并参与活动ejk;分别表示实际上参与者ui接受邀请 并参与活动ejk、实际上参与者ui未接受邀请并参与活动ejk;和代表两种 预测错误,即:当且仅当且当且仅当且这两种情况下,上式对应的参与者预测错误;表示活动组织者向参 与者ui发放邀请的预测结果正确,有如下两种情况且或者且
对于每个组织者和参与者,分别用其邀请参与者或参与活动的最低分近似表示判别 接受与否的一个界限,并将预测错误的参与者或活动的评分与界限之间的差距作为损失。具体而言,即,预测的活动邀请结果中活动ejk所邀请的参与者中最 低参与者评分,近似为活动ejk邀请用户的界限。即,预测的参与结果中, 参与者ui所参与的活动中最低的活动评分,近似为参与者ui参与活动的界限。
④参数迭代优化(内层优化)。
在本环节中,将基于环节③中设计的损失函数,利用损失函数并借此更新活动或参 与者的决策函数中相关参数。
对于活动而言,其信息主要为活动主题及活动组织者集合(即活动对应的多个组 织者)。其中前者由活动介绍的文本生成,在训练中不会更新;而活动组织者集合,其 涉及活动组织者所造成的社交影响,将会与参与者的社交网络进行统一训练更新。
对于参与者而言所要更新的参数包括:参与者ui的兴趣向量全拒绝倾向参数gri、对活动ejk所属活动组织者gj的忠诚度hij、以及参与者ui与参与者ur之间的社交关 系强度W={wir};上述所有参数通过梯度下降法来更新,也可以采用其他类似方法来更 新,实现方式可以参照常规技术。
之后,利用更新后的社交关系强度W={wir},更新社交网络结构并重新计算各个参与者的PageRank值用于决策函数。
⑤排序更新。
利用参数迭代优化结果,结合决策函数更新活动组织者所组织的活动和参与者对于 对方的完整排序列表,并重新进入双向稳定匹配环节进行循环优化,直至活动组织者所组织的活动和参与者对于对方的完整排序列表不再改变。
3、模型应用与预测任务
在完成模型训练与参数估计步骤之后,基于已训练的参数,可以实现对于活动组织 者与参与者更为真实的偏好的评估。同时,基于评估结果,可以进而实现对活动组织方对用户发放邀请,以及用户接受邀请并参与活动情况的预测;主要步骤如下:
首先,进行参数初始化:将活动自身信息(主题或文本描述)进行向量化处理,参与者则采用训练得到的参数;如果出现冷启动情况,即某位参与者未在之前的训练样本 中出现,则采用和参数初始化环节中同样的初始值作为默认参数取值。
然后,进行活动组织者邀请预测:基于活动组织者对于参与用户的决策函数,对参与者进行评分并排序,前θjk名参与者将被发放邀请,邀请分一次发送或多次发送。
最后,进行参与者参与活动预测:面向每个参与者收到的邀请,根据参与者对于活动组织者的决策函数,对各活动进行评分并排序,并接受排名最高的活动邀请;如果没 有收到邀请,或排名最高的为虚拟活动,则不参加任何活动。需要说明的是,上述测试 阶段的过程也是双向匹配,执行过程可参见前文介绍的②双向稳定匹配;如果活动组织 者可能发放多轮邀请,则参与者的决策可能发生改变(其中的参数仅有好友之间的相互 影响会不断改变),需要根据最终稳定结果进行预测。
本发明实施例上述方案,通过利用多种数据的融合,基于双向匹配技术与内外双层 优化,实现对于活动组织方与参与用户的真实偏好更为准确的估计,进而同时实现组织方邀请与用户参与两项任务,从而提供更加完整与精确的分析。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以 通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一 个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得 一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施 例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替 换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的 保护范围为准。
Claims (9)
1.一种活动参与分析及推荐方法,其特征在于,包括:
从活动组织者与参与者的历史行为记录中获取用于分析的基本数据;
基于获得的基本数据,通过双向稳定匹配与参数迭代优化两层优化过程,还原历史活动参与决策中的活动组织者与参与者的双向选择过程,从而结合各自的决策函数估计各方的相对排序,并实现各自决策函数中相关参数的训练;
对于新组织的活动,基于活动自身信息、以及完成参数训练的决策函数,计算双方对于对方每个成员的评分,进而通过稳定匹配的方式预测双方相互选择的结果并进行推荐。
2.根据权利要求1所述的一种活动参与分析及推荐方法,其特征在于,所述基本数据至少包括:历史活动信息以及活动组织者与参与者各自的画像信息;
其中,历史活动信息包括:活动主题、活动相关文本描述、活动属性、活动所属的活动组织者、以及参与者的活动反馈与参与记录;所述活动属性包括:活动时间、地点及费用;
活动组织者与参与者各自的画像信息包括:活动组织者对应的领导人或者发起人、活动组织者与参与者各自的标签与自我介绍、以及参与者之间的显式好友关系。
3.根据权利要求1或2所述的一种活动参与分析及推荐方法,其特征在于,该方法还包括:
对获得的基本数据进行数据筛选,数据筛选时设置了两项阈值,第一项阈值,用于确保所筛选出的多个活动中,每一活动的潜在参与者之间存在一定的重叠,所述潜在参与者是指被邀请的参与者;第二项阈值,用于确保活动组织者与参与者均具有一定数量的历史活动记录;
之后,对筛选出的数据进行预处理;先去除文本信息中的提用词,再对文本信息进行向量化处理。
4.根据权利要求1或2所述的一种活动参与分析及推荐方法,其特征在于,所述基于获得的基本数据,通过双向稳定匹配与参数迭代优化两层优化过程,还原历史活动参与决策中的活动组织者与参与者的双向选择过程,从而结合各自的决策函数估计各方的相对排序,并实现各自决策函数中相关参数的训练包括如下五个环节:
①参数初始化:此环节对活动组织者与参与者各自对于对方的评价因素进行参数初始化,所涉及的评价因素也即决策函数中的相关参数;结合初始化后的评价因素与决策函数得到活动组织者所组织的活动和参与者对于对方的完整排序列表;
②双向稳定匹配:利用得到的活动组织者所组织的活动和参与者对于对方的完整排序列表,通过一对多Gale-Shapley算法,实现双方的稳定匹配,从而对活动组织者向参与者发放邀请、以及参与者接受邀请并参与活动的情况做出预测;
③计算损失函数:基于活动组织者和参与者之间的双向稳定匹配结果,结合活动记录中的邀请发放与参与者的参与记录,找出预测中所出现的错误,从而计算损失函数;
④参数迭代优化:利用损失函数并借此更新活动或参与者的决策函数中相关参数;
⑤排序更新:利用参数迭代优化结果,结合决策函数更新活动组织者所组织的活动和参与者对于对方的完整排序列表,并重新进入双向稳定匹配环节进行循环优化,直至活动组织者所组织的活动和参与者对于对方的完整排序列表不再改变。
5.根据权利要求4所述的一种活动参与分析及推荐方法,其特征在于,
对于活动组织者而言,其对参与者的评价因素包括:参与者ui的兴趣向量与活动组织者gj所组织的活动ejk的主题向量的相似性,以及参与者的影响力,其中参与者的影响力采用参与者在社交网络中的PageRank值加以近似估计,则活动组织者gj对于参与者ui的决策函数表示为:其中,表示活动ejk对参与者ui的评分,评分大小决定排序列表中相应参与者的位置;cos<.>表示余弦相似度函数,pagerank(W)[i]表示指参与者ui在社交网络中的PageRank值;
对于参与者而言,其对活动组织者的评价因素包括:参与者ui的兴趣向量与活动ejk的主题向量的相似性,参与者ui对活动ejk所属活动组织者gj的忠诚度hij、以及来自社交好友的态度影响,则参与者ui对于活动组织者gj的决策函数表示为:其中,表示参与者ui对活动ejk的评分,评分大小决定排序列表中相应活动的位置;;表示对于参与者ui而言来自社交好友的态度影响,W={wir}为参与者ui与参与者ur之间的社交关系强度,用于构建参与者之间的社交网络,并实现PageRank值与参与者的影响力两个部分的计算;表示参与者ui想要参加活动ejk的好友集合;
各评价因素初始化方式如下:
参与者ui的兴趣向量与活动ejk的主题向量的相似性的初始化,依赖于参与者ui的自我介绍或活动ejk的相关文本描述,采用话题模型技术,对活动ejk的相关文本描述进行学习并生成若干潜在主题,进而将所有文本转化为对应的主题向量;如果参与者ui没有自我介绍或活动ejk没有相关文本描述,则将所有的主题向量设为均值,即每一维均为1/N,其中,N为潜在主题个数;
参与者ui与参与者ur之间的社交关系强度W={wir}的初始化方法为,参与者ui与参与者ur共同参加过的活动数量sumir除以参与者ui参加过的活动的数量sumi:
PageRank值根据初始化W={wir}后所得到的社交网络计算得到;
参与者ui对活动ejk所属活动组织者gj的忠诚度hij初始值设为1,即忠诚于活动ejk所属活动组织者gj;
同时,还设计了一个额外的全拒绝倾向参数gri,即当参与者ui对于所有活动的评分均低于gri时,该参与者ui将拒绝全部活动邀请;
通过上述初始化后,利用初始化后的评价因素与各决策函数,得到活动组织者和参与者对于对方的完整排序列表。
6.根据权利要求5所述的一种活动参与分析及推荐方法,其特征在于,进行双向稳定匹配环节之前,构造一个虚拟活动,其面向所有参与者开放,同时,参与者ui对于该虚拟活动评分取决于参数初始化环节中设计的全拒绝倾向参数gri;在双向稳定匹配环节时,活动组织者gj设计活动ejk,并向潜在参与者发放邀请,潜在参与者根据收到的邀请进行选择并反馈;然后,活动组织方根据潜在参与者的反馈,结合活动所能容纳的最大参与者数量θjk,发放下一轮邀请,直到达到最大容纳数量或所有参与者都已做出稳定选择;相关步骤如下:
1)对于活动ejk,首先根据排序列表,将邀请发给评分前ηjk名参与者;
2)对于接受到ejk邀请的参与者ui,查询其对于活动的完整排序列表,读取对于活动ejk的评分若没有收到邀请,则将设置为0;
3)对于参与者ui,根据其排序列表,包括虚拟活动的评分gri,选择接受排序最高的活动,如果虚拟活动的评分gri排名最高,则不参加任何活动;;
4)对于活动ejk,其所能容纳的最大参与者数量θjk,维护一个最大长度为θjk的参与者列表;如果收到来自参与者ui的参加反馈,则与当前的参与者列表进行比较:如果活动ejk的参与者列表未满,则将参与者ui按照其评分的顺序加入参与者列表之中;如果活动ejk的参与者列表已满,则比较排序末尾参与者与参与者ui的评分,保留评分较高者,且按照评分放入参与者列表相应位置;
5)在所有参与者做出反馈之后,若活动ejk的参与者列表未满,重复上述1)~4),直至活动的参与者列表均已填满,或所有参与者均已做出稳定选择不再修改。
7.根据权利要求6所述的一种活动参与分析及推荐方法,其特征在于,计算损失函数环节中,针对双向稳定匹配时的预测结果进行判断,找出预测中所出现的错误,所述的错误包括两类:一类是本应被邀请或参与的参与者,在预测结果中并没有被邀请或并没有参与活动;另一类则是,本不应被邀请或参与的参与者在预测中收到了邀请或参加了活动;
将活动组织者向参与者ui发放邀请的预测结果和参与者ui接受邀请并参与活动的预测结果与实际的活动邀请结果和参与者ui的参与结果作比较,设计如下损失函数:
其中,n表示参与者数量,m表示活动组织者数量,l1表示活动组织者gj所组织的活动的数量;分别表示预测活动组织者向参与者ui发放邀请、预测活动组织者未向参与者ui发放邀请;分别表示实际上活动组织者向参与者ui发放邀请、实际上活动组织者未向参与者ui发放邀请;和代表两种预测错误,即:当且仅当且 当且仅当且这两种情况下,上式对应活动组织者gj邀请预测错误;表示活动组织者向参与者ui发放邀请的预测结果正确,有如下两种情况且或者且 分别表示预测参与者ui接受邀请并参与活动ejk、预测参与者ui未接受邀请并参与活动ejk;分别表示实际上参与者ui接受邀请并参与活动ejk、实际上参与者ui未接受邀请并参与活动ejk;和代表两种预测错误,即:当且仅当且 当且仅当且这两种情况下,上式对应的参与者预测错误;表示活动组织者向参与者ui发放邀请的预测结果正确,有如下两种情况且或者且
8.根据权利要求7所述的一种活动参与分析及推荐方法,其特征在于,参数迭代优化时,对于活动而言所要更新的参数包括:活动组织者集合,其涉及活动组织者所造成的社交影响;对于参与者而言所要更新的参数包括:参与者ui的兴趣向量全拒绝倾向参数gri、对活动ejk所属活动组织者gj的忠诚度hij、以及参与者ui与参与者ur之间的社交关系强度W={wir};上述所有参数通过梯度下降法来更新;
之后,利用更新后的社交关系强度W={wir},更新社交网络结构并重新计算各个参与者的PageRank值用于决策函数。
9.根据权利要求4所述的一种活动参与分析及推荐方法,其特征在于,对于新组织的活动,首先进行参数初始化:将活动自身信息进行向量化处理,参与者则采用训练得到的参数;如果出现冷启动情况,即某位参与者未在之前的训练样本中出现,则采用和参数初始化环节中同样的初始值作为默认参数取值;
然后,进行活动组织者邀请预测:基于活动组织者对于参与用户的决策函数,对参与者进行评分并排序,前θjk名参与者将被发放邀请,邀请分一次发送或多次发送;
最后,进行参与者参与活动预测:面向每个参与者收到的邀请,根据参与者对于活动组织者的决策函数,对各活动进行评分并排序,并接受排名最高的活动邀请;如果没有收到邀请,或排名最高的为虚拟活动,则不参加任何活动。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910185945.8A CN109919793B (zh) | 2019-03-12 | 2019-03-12 | 活动参与分析及推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910185945.8A CN109919793B (zh) | 2019-03-12 | 2019-03-12 | 活动参与分析及推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109919793A true CN109919793A (zh) | 2019-06-21 |
CN109919793B CN109919793B (zh) | 2023-06-16 |
Family
ID=66964509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910185945.8A Active CN109919793B (zh) | 2019-03-12 | 2019-03-12 | 活动参与分析及推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109919793B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110517158A (zh) * | 2019-08-09 | 2019-11-29 | 福建路阳信息科技有限公司 | 一种活动组织管理方法 |
CN111091888A (zh) * | 2019-11-25 | 2020-05-01 | 泰康保险集团股份有限公司 | 活动决策方法、装置、设备及存储介质 |
CN113077235A (zh) * | 2021-04-12 | 2021-07-06 | 上海明略人工智能(集团)有限公司 | 一种会议日程冲突管理方法、系统、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090313346A1 (en) * | 2008-06-13 | 2009-12-17 | C-Mail Corp. | Method and system for mapping organizational social networks utilizing dynamically prioritized e-mail flow indicators |
CN103390009A (zh) * | 2012-05-25 | 2013-11-13 | 许友权 | 一种网上双向选择应用环境下目标精确定位技术 |
CN105279180A (zh) * | 2014-07-07 | 2016-01-27 | 南京理工大学常熟研究院有限公司 | 一种基于双向选择的推荐框架 |
US20170024406A1 (en) * | 2011-11-16 | 2017-01-26 | Yahoo! Inc. | Social media user recommendation system and method |
CN107194723A (zh) * | 2017-05-17 | 2017-09-22 | 中国科学技术大学 | 网络小额贷款中借款项目与出借人的双向匹配推荐方法 |
CN107657034A (zh) * | 2017-09-28 | 2018-02-02 | 武汉大学 | 一种社交信息增强的事件社交网络推荐算法 |
CN108470075A (zh) * | 2018-04-12 | 2018-08-31 | 重庆邮电大学 | 一种面向排序预测的社会化推荐方法 |
US20180292981A1 (en) * | 2007-12-19 | 2018-10-11 | Match Group, Llc | Matching Process System and Method |
-
2019
- 2019-03-12 CN CN201910185945.8A patent/CN109919793B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180292981A1 (en) * | 2007-12-19 | 2018-10-11 | Match Group, Llc | Matching Process System and Method |
US20090313346A1 (en) * | 2008-06-13 | 2009-12-17 | C-Mail Corp. | Method and system for mapping organizational social networks utilizing dynamically prioritized e-mail flow indicators |
US20170024406A1 (en) * | 2011-11-16 | 2017-01-26 | Yahoo! Inc. | Social media user recommendation system and method |
CN103390009A (zh) * | 2012-05-25 | 2013-11-13 | 许友权 | 一种网上双向选择应用环境下目标精确定位技术 |
CN105279180A (zh) * | 2014-07-07 | 2016-01-27 | 南京理工大学常熟研究院有限公司 | 一种基于双向选择的推荐框架 |
CN107194723A (zh) * | 2017-05-17 | 2017-09-22 | 中国科学技术大学 | 网络小额贷款中借款项目与出借人的双向匹配推荐方法 |
CN107657034A (zh) * | 2017-09-28 | 2018-02-02 | 武汉大学 | 一种社交信息增强的事件社交网络推荐算法 |
CN108470075A (zh) * | 2018-04-12 | 2018-08-31 | 重庆邮电大学 | 一种面向排序预测的社会化推荐方法 |
Non-Patent Citations (2)
Title |
---|
YANG SONG, LU ZHANG, C. LEE GILES: "Automatic Tag Recommendation Algorithms for", 《ACM TRANSACTIONS ON COMPUTATIONAL LOGIC》 * |
徐童: "社交协作行为中的用户建模及其应用研究", 《中国博士学位论文全文数据库信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110517158A (zh) * | 2019-08-09 | 2019-11-29 | 福建路阳信息科技有限公司 | 一种活动组织管理方法 |
CN111091888A (zh) * | 2019-11-25 | 2020-05-01 | 泰康保险集团股份有限公司 | 活动决策方法、装置、设备及存储介质 |
CN111091888B (zh) * | 2019-11-25 | 2023-10-31 | 泰康保险集团股份有限公司 | 活动决策方法、装置、设备及存储介质 |
CN113077235A (zh) * | 2021-04-12 | 2021-07-06 | 上海明略人工智能(集团)有限公司 | 一种会议日程冲突管理方法、系统、电子设备及存储介质 |
CN113077235B (zh) * | 2021-04-12 | 2024-03-22 | 上海明略人工智能(集团)有限公司 | 一种会议日程冲突管理方法、系统、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109919793B (zh) | 2023-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xia et al. | Reciprocal recommendation system for online dating | |
CN112232925A (zh) | 一种融合知识图谱对商品进行个性化推荐的方法 | |
Zhao et al. | Participant selection for federated learning with heterogeneous data in intelligent transport system | |
CN108647800B (zh) | 一种基于节点嵌入的在线社交网络用户缺失属性预测方法 | |
CN109919793A (zh) | 活动参与分析及推荐方法 | |
CN111428127B (zh) | 融合主题匹配与双向偏好的个性化事件推荐方法及系统 | |
CN109992784B (zh) | 一种融合多模态信息的异构网络构建和距离度量方法 | |
Stockdale | From ‘trailing wives’ to the emergence of a ‘trailing husbands’ phenomenon: Retirement migration to rural areas | |
Jia et al. | Collaborative restricted Boltzmann machine for social event recommendation | |
CN111967971A (zh) | 银行客户数据处理方法及装置 | |
Jacobsen et al. | Intraorganizational network dynamics: past progress, current challenges, and new frontiers | |
Agarwal et al. | Constrained optimization for homepage relevance | |
CN103620627A (zh) | 用于增强互动式体验的参与者分组 | |
CN111475724A (zh) | 一种基于用户相似度的随机游走社交网络事件推荐方法 | |
Zhao et al. | Bounded confidence-based opinion formation for opinion leaders and opinion followers on social networks | |
US20180150864A1 (en) | Method and System for creating and comparing virtual firms | |
CN116383519A (zh) | 基于双加权的自注意力的群组推荐方法 | |
Shrestha et al. | Multi-dimensional analysis and prediction model for tourist satisfaction | |
Anderson-Cook | Optimizing in a complex world: A statistician's role in decision making | |
CN110795640A (zh) | 一种弥补群组成员差异的自适应组推荐方法 | |
CN115564013B (zh) | 提高网络表示学习表示能力的方法、模型训练方法和系统 | |
Zhang et al. | Content+ attributes: A latent factor model for recommending scientific papers in heterogeneous academic networks | |
Wu et al. | The graph model for conflict resolution with consensus fuzzy preferences and its application to environmental sustainable development | |
Nongaillard et al. | Egalitarian negotiations in agent societies | |
Rajkumar et al. | Learning to partition using score based compatibilities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |