CN109919793A

CN109919793A - 活动参与分析及推荐方法

Info

Publication number: CN109919793A
Application number: CN201910185945.8A
Authority: CN
Inventors: 徐童; 殷子凯; 陈恩红; 熊辉
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2019-03-12
Filing date: 2019-03-12
Publication date: 2019-06-21
Anticipated expiration: 2039-03-12
Also published as: CN109919793B

Abstract

本发明公开了一种活动参与分析及推荐方法，通过引入双向选择建模，可以更为真实地还原活动双方的决策过程，同时又通过双层优化解决了传统匹配问题对完整排序列表的依赖，从而既可以实现对于用户的精准画像，又可以提升对于用户决策分析乃至活动推荐的性能，实现一举多得的效果。

Description

活动参与分析及推荐方法

技术领域

本发明涉及数据挖掘中的社交用户行为分析领域，尤其涉及一种活动参与分析及推荐方法。

背景技术

社交网络的发展促进了社交元素与新兴商业模式的深度融合，传统的熟人社交逐渐拓展为基于兴趣主题的陌生人社交，并进而衍生出面向特定主题的线下聚会及所谓“由事件驱动的社交网络”。借助这一社交媒介，活动组织者可以便捷地发布与活动相关的介绍并邀请潜在的参与者。而用户(参与者)则往往根据主题、时间、地点、社交影响等因素综合考虑决定是否参加活动。由于用户与活动数量的飞速增长，如何有效地协助用户找到感兴趣的活动，同时帮助活动组织者成功聚集目标参与者，已成为社交活动平台所急需解决的重要任务。

目前，围绕社交活动中的用户画像与活动推荐，已有诸多相关的技术方案与研究成果，部分代表性的公开技术包括：

CN201610781795.3，一种移动社交网络中的社交活动推荐算法，主要根据用户与活动之间的标签、地理、好友等相似度来进行活动推荐。

CN201710423237.4，一种资源受限约束下的活动推荐方法及系统，基于推荐成本与营销成本的约束，将活动推荐转化为一个优化问题并加以求解。

CN201711224583.6，一种活动社交网络用户参加活动推荐的多因素决策方法，根据活动属性与用户的社交影响力，及内容、地点、时间相关性等诸多因素，采用经典的J48决策树算法，实现活动推荐。

然而，现有技术存在一个严重的缺陷，即往往仅考虑活动中的一方(多为作为参与者的用户)所做的选择，而另一方仅止于被动接受。在传统推荐问题中，由于其中一方在名额上可视作无限制(如商品的可销售件数或电影的可容纳观众数)，这种被动接受现象有其合理性。但对于活动推荐问题而言，组织方受限于场地或活动规模，而参与者受限于时间或精力，因此双方都不可能无限制地接受对方。在这种情况下，双方都具有较强的主动性去根据一定的标准去进行筛选，从而形成了所谓“双向选择”的过程。

对于这一过程的建模及其衍生出的“稳定匹配”问题的求解，虽然目前已有包括经典的Gale-Shapley算法在内的大量研究成果，但这些技术依赖于显性的对于对方的完整排序。然而在现实世界中，排序甚至作为排序依据的用户画像都往往以隐性方式存在，需要从大量的历史行为数据中加以揭示和归纳。

发明内容

本发明的目的是提供一种活动参与分析及推荐方法，通过建模活动组织者与参与者双方的双向选择过程，更加真实地还原双方在活动过程中的决策，同时解决参与预测与活动推荐两项任务并提升其效果。

本发明的目的是通过以下技术方案实现的：

(与权利要求相对应)。

由上述本发明提供的技术方案可以看出，通过引入双向选择建模，可以更为真实地还原活动双方的决策过程，同时又通过双层优化解决了传统匹配问题对完整排序列表的依赖，从而既可以实现对于用户的精准画像，又可以提升对于用户决策分析乃至活动推荐的性能，实现一举多得的效果。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种活动参与分析及推荐方法的流程图；

图2为本发明实施例提供的模型训练与参数估计流程图。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明的保护范围。

本发明实施例一种活动参与分析及推荐方法，如图1所示，其主要包括如下步骤：

步骤1、从活动组织者与参与者的历史行为记录中获取用于分析的基本数据。

步骤2、基于获得的基本数据，通过双向稳定匹配与参数迭代优化两层优化过程，还原历史活动参与决策中的活动组织者与参与者的双向选择过程，从而结合各自的决策函数估计各方的相对排序，并实现各自决策函数中相关参数的训练。

步骤3、对于新组织的活动，基于活动自身信息、以及完成参数训练的决策函数，计算双方对于对方每个成员的评分，进而通过稳定匹配的方式预测双方相互选择的结果并进行推荐。

上述方案中，通过引入双向选择建模，可以更为真实地还原活动双方的决策过程，同时又通过双层优化解决了传统匹配问题对完整排序列表的依赖，从而既可以实现对于用户的精准画像，又可以提升对于用户决策分析乃至活动推荐的性能，实现一举多得的效果。

为了便于理解，下面针对上述三个步骤的优选实施方式进行介绍。

1、基本数据的收集、筛选及预处理。

1)基本数据的收集。

本发明实施例中，所述基本数据至少包括：历史活动信息以及活动组织者与参与者各自的画像信息；

其中，历史活动信息包括：活动主题、活动相关文本描述、活动属性、活动所属的活动组织者、以及参与者的活动反馈与参与记录(是否参见活动、活动后的评价或评分)等；所述活动属性包括：活动时间、地点及费用等。

活动组织者与参与者各自的画像信息包括：活动组织者对应的领导人或者发起人、活动组织者与参与者各自的标签与自我介绍、以及参与者之间的显式好友关系等。

2)数据筛选。

由于需要还原活动组织者与参与者之间的双向选择过程，因此，需要为双方，尤其是参与方(用户)提供一定的选择空间。根据这一需求，对获得的基本数据进行数据筛选，数据筛选时设置了两项阈值。

第一项阈值，用于确保所筛选出的多个活动中，每一活动的潜在参与者之间存在一定的重叠，所述潜在参与者是指被邀请的参与者；重叠的人数或比例需要根据预设的阈值加以筛选。一般而言，阈值需要根据历史活动的规模与用户的重叠程度来决定。较高的阈值可以保证活动之间有更多的重叠，从而使得某一组中有更为丰富的用户量可供分析，双向选择建模的优势也更明显。但是同时，较高的阈值也会导致符合要求的活动组较少，从而导致覆盖的用户群较为有限。因此，阈值需要在综合考虑上述两种因素的基础之上进行设定。在本发明实施例中，可以将阈值设定为两两活动之间必须具有10％以上的重叠用户。

第二项阈值，用于确保活动组织者与参与者均具有一定数量的历史活动记录，从而保证参与者画像的精度，在本发明实施例中，对于这项阈值并不做额外要求。

3)数据预处理。

无论是历史活动信息还是活动参与双方的介绍，都包含丰富的文本信息。对筛选出的数据进行预处理时，将相应的文本信息进行向量化处理，以便于进行后续分析，并去除文本信息中的停用词，以免对文本信息向量化处理造成干扰。

本发明实施例中，可以采用Latent Dirichlet Allocation模型，并基于公开的停用词表筛去部分停用词。

2、模型训练与参数估计。

如图2所示，模型训练与参数估计步骤主要包括5个环节。其中，②和④分别对应外层(双向匹配优化)和内层(参数迭代优化)两个优化过程，而①、③、⑤分别对应着参数初始化、计算损失函数和排序更新。接下来将详细介绍每个步骤的定义及实施方式。

①参数初始化。

在本环节中，对活动组织者与参与者各自对于对方的评价因素进行参数初始化，所涉及的评价因素也即决策函数中的相关参数；并结合初始化后的评价因素与决策函数，初步得到活动组织者所组织的活动和参与者对于对方的完整排序列表，以支撑②中的外层优化(双向匹配)环节。

对于活动组织者而言，其对参与者的评价因素包括：参与者u_i的兴趣向量与活动组织者g_j所组织的活动e_jk的主题向量的相似性(即参与者的兴趣与活动主题的契合度)，以及参与者的影响力(即参与者吸引其他用户参与的能力)，其中参与者的影响力采用参与者在社交网络中的PageRank值加以近似估计，则活动组织者g_j对于参与者u_i的决策函数表示为：其中，表示活动e_jk对参与者 u_i的评分，评分大小决定排序列表中相应参与者的位置；cos<.>表示余弦相似度函数， pagerank(W)[i]表示指参与者u_i在社交网络中的PageRank值。

对于参与者(用户)而言，其对活动组织者的评价因素包括：参与者u_i的兴趣向量与活动e_jk的主题向量的相似性，参与者u_i对活动e_jk所属活动组织者g_j的忠诚度 h_ij、以及来自社交好友的态度影响，来自社交好友的态度影则采用社会影响力计算领域经典的独立级联模型(Independent Cascade Model)加以近似估计；则参与者u_i对于活动组织者g_j的决策函数表示为：其中，表示参与者u_i对活动e_jk的评分，评分大小决定排序列表中相应活动的位置；表示对于参与者u_i而言来自社交好友的态度影响，W＝{w_ir}为参与者u_i与参与者u_r之间的社交关系强度，用于构建参与者之间的社交网络，并实现PageRank值与参与者的影响力两个部分的计算；表示参与者u_i想要参加活动e_jk的好友集合。

根据所获得的数据源的不同，可以补充更多的评价因素。在本发明实施例中，根据已有的数据，各评价因素初始化方式如下：

参与者u_i的兴趣向量与活动e_jk的主题向量的相似性的初始化，依赖于参与者u_i的自我介绍或活动e_jk的相关文本描述，采用话题模型(Latent DirichletAllocation， LDA)技术，对活动e_jk的相关文本描述进行学习并生成若干潜在主题，进而将所有文本转化为对应的主题向量；如果参与者u_i没有自我介绍或活动e_jk没有相关文本描述，则将所有的主题向量设为均值，即每一维均为1/N，其中，N为潜在主题个数；

参与者u_i与参与者u_r之间的社交关系强度W＝{w_ir}的初始化方法为，参与者u_i与参与者u_r共同参加过的活动数量sum_ir除以参与者u_i参加过的活动的数量sum_i：

PageRank值根据初始化W＝{w_ir}后所得到的社交网络计算得到；

参与者u_i对活动e_jk所属活动组织者g_j的忠诚度hi_j初始值设为1，即忠诚于活动e_jk所属活动组织者g_j；

同时，考虑到存在部分用户即使受到多个活动邀请，也会选择一个活动都不参加的情况，因而设计了一个额外的全拒绝倾向参数gr_i，即当参与者u_i对于所有活动的评分均低于gr_i时，该参与者u_i将拒绝全部活动邀请；在本发明实施例中，全拒绝倾向参数gr_i的初始值为0.1。

通过上述初始化后，利用初始化后的评价因素与各决策函数，得到活动组织者所组织的活动和参与者对于对方的完整排序列表。

②双向稳定匹配(外层优化)。

在本环节中，利用得到的活动组织者所组织的活动和参与者对于对方的完整排序列表(通过环节①或者⑤得到)，通过改进的一对多Gale-Shapley算法，实现双方的稳定匹配，从而对活动组织者向参与者发放邀请、以及参与者接受邀请并参与活动的情况做出预测。

首先，基本Gale-Shapley算法主要针对一对一稳定匹配问题，如其衍生的稳定婚姻问题等。在本问题中，由于活动可以同时承载多个参与用户，因此，需要将这一算法拓展至一对多的场景。具体而言，可将每个活动视作θ_jk个相同的主体(θ_jk为该活动所最多容纳的人数)，每个主体所能容纳的用户为1人，同时θ_jk个主体分享其属性，并在用户的排序中获得同样的排序分数(并列排名)。在这一设定下，可以很容易地证明面向社交活动的一对多稳定匹配问题将等价转化为一对一匹配问题，从而可以采用Gale- Shapley算法加以求解。

同时，如前所述，考虑到部分用户可能拒绝所有活动邀请，在本发明实施例中，进行双向稳定匹配环节之前，构造一个虚拟活动，其面向所有参与者开放，同时，参与者 u_i对于该虚拟活动活动的评分取决于参数初始化环节中设计的全拒绝倾向参数gr_i。

基于上述设定，将对活动组织者和参与者进行双向稳定匹配，以实现外层优化。具体而言，考虑到活动组织者g_j设计活动e_jk，并向潜在参与者发放邀请，潜在参与者根据收到的邀请进行选择并反馈；然后，活动组织方根据潜在参与者的反馈，结合活动所能容纳的最大参与者数量θ_jk，发放下一轮邀请，直到达到最大容纳数量或所有参与者都已做出稳定选择；相关步骤如下：

1)对于活动e_jk，首先根据排序列表，将邀请发给评分前η_jk名参与者；

2)对于接受到e_jk邀请的参与者u_i，查询其对于活动的完整排序列表，读取对于活动 e_jk的评分若没有收到邀请，则将设置为0；

3)对于参与者u_i，根据其排序列表，包括虚拟活动的评分gr_i，选择接受排序最高的活动，如果虚拟活动的评分gr_i排名最高，则不参加任何活动；

4)对于活动e_jk，其所能容纳的最大参与者数量θ_jk，维护一个最大长度为θ_jk的参与者列表；如果收到来自参与者u_i的参加反馈，则与当前的参与者列表进行比较：如果活动e_jk的参与者列表未满，则将参与者u_i按照其评分的顺序加入参与者列表之中；如果活动e_jk的参与者列表已满，则比较排序末尾参与者与参与者u_i的评分，保留评分较高者，且按照评分放入参与者列表相应位置；

5)在所有参与者做出反馈之后，若活动e_jk的参与者列表未满，重复上述1)～4)，直至活动的参与者列表均已填满，或所有参与者均已做出稳定选择不再修改。

对于所有活动都按照以上的方式进行，最终完成双向稳定匹配，从而对活动组织者向参与者发放邀请、以及参与者接受邀请并参与活动的情况做出预测。上述步骤1)与步骤5)即为双向匹配结果，分别对应活动组织者向参与者发放邀请的预测结果、参与者接受邀请并参与活动的预测结果。

③计算损失函数。

在本环节中，基于活动组织者和参与者之间的双向稳定匹配结果，结合活动记录中的邀请发放与参与者的参与记录，找出预测中所出现的错误，从而计算损失函数。

具体而言，在本发明实施例中，由于试图解决组织方邀请与用户参与两项任务，故损失函数也将基于这两项预测任务而设计，主要考虑如下两类错误：一类是本应被邀请或参与的参与者，在预测结果中并没有被邀请或并没有参与活动；另一类则是，本不应被邀请或参与的参与者在预测中收到了邀请或参加了活动。

将活动组织者向参与者u_i发放邀请的预测结果和参与者u_i接受邀请并参与活动的预测结果与实际的活动邀请结果和参与者u_i的参与结果作比较，设计如下损失函数：

其中，n表示参与者数量，m表示活动组织者数量，l₁表示活动组织者g_j所组织的活动的数量；分别表示预测活动组织者向参与者u_i发放邀请、预测活动组织者未向参与者u_i发放邀请；分别表示实际上活动组织者向参与者u_i发放邀请、实际上活动组织者未向参与者u_i发放邀请；和代表两种预测错误，即：当且仅当且当且仅当且这两种情况下，上式对应活动组织者g_j邀请预测错误；表示活动组织者向参与者u_i发放邀请的预测结果正确，有如下两种情况且或者且分别表示预测参与者u_i接受邀请并参与活动e_jk、预测参与者u_i未接受邀请并参与活动e_jk；分别表示实际上参与者u_i接受邀请并参与活动e_jk、实际上参与者u_i未接受邀请并参与活动e_jk；和代表两种预测错误，即：当且仅当且当且仅当且这两种情况下，上式对应的参与者预测错误；表示活动组织者向参与者u_i发放邀请的预测结果正确，有如下两种情况且或者且

对于每个组织者和参与者，分别用其邀请参与者或参与活动的最低分近似表示判别接受与否的一个界限，并将预测错误的参与者或活动的评分与界限之间的差距作为损失。具体而言，即，预测的活动邀请结果中活动e_jk所邀请的参与者中最低参与者评分，近似为活动e_jk邀请用户的界限。即，预测的参与结果中，参与者u_i所参与的活动中最低的活动评分，近似为参与者u_i参与活动的界限。

④参数迭代优化(内层优化)。

在本环节中，将基于环节③中设计的损失函数，利用损失函数并借此更新活动或参与者的决策函数中相关参数。

对于活动而言，其信息主要为活动主题及活动组织者集合(即活动对应的多个组织者)。其中前者由活动介绍的文本生成，在训练中不会更新；而活动组织者集合，其涉及活动组织者所造成的社交影响，将会与参与者的社交网络进行统一训练更新。

对于参与者而言所要更新的参数包括：参与者u_i的兴趣向量全拒绝倾向参数gr_i、对活动e_jk所属活动组织者g_j的忠诚度h_ij、以及参与者u_i与参与者u_r之间的社交关系强度W＝{w_ir}；上述所有参数通过梯度下降法来更新，也可以采用其他类似方法来更新，实现方式可以参照常规技术。

之后，利用更新后的社交关系强度W＝{w_ir}，更新社交网络结构并重新计算各个参与者的PageRank值用于决策函数。

⑤排序更新。

利用参数迭代优化结果，结合决策函数更新活动组织者所组织的活动和参与者对于对方的完整排序列表，并重新进入双向稳定匹配环节进行循环优化，直至活动组织者所组织的活动和参与者对于对方的完整排序列表不再改变。

3、模型应用与预测任务

在完成模型训练与参数估计步骤之后，基于已训练的参数，可以实现对于活动组织者与参与者更为真实的偏好的评估。同时，基于评估结果，可以进而实现对活动组织方对用户发放邀请，以及用户接受邀请并参与活动情况的预测；主要步骤如下：

首先，进行参数初始化：将活动自身信息(主题或文本描述)进行向量化处理，参与者则采用训练得到的参数；如果出现冷启动情况，即某位参与者未在之前的训练样本中出现，则采用和参数初始化环节中同样的初始值作为默认参数取值。

然后，进行活动组织者邀请预测：基于活动组织者对于参与用户的决策函数，对参与者进行评分并排序，前θ_jk名参与者将被发放邀请，邀请分一次发送或多次发送。

最后，进行参与者参与活动预测：面向每个参与者收到的邀请，根据参与者对于活动组织者的决策函数，对各活动进行评分并排序，并接受排名最高的活动邀请；如果没有收到邀请，或排名最高的为虚拟活动，则不参加任何活动。需要说明的是，上述测试阶段的过程也是双向匹配，执行过程可参见前文介绍的②双向稳定匹配；如果活动组织者可能发放多轮邀请，则参与者的决策可能发生改变(其中的参数仅有好友之间的相互影响会不断改变)，需要根据最终稳定结果进行预测。

本发明实施例上述方案，通过利用多种数据的融合，基于双向匹配技术与内外双层优化，实现对于活动组织方与参与用户的真实偏好更为准确的估计，进而同时实现组织方邀请与用户参与两项任务，从而提供更加完整与精确的分析。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现，也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解，上述实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求书的保护范围为准。

Claims

1.一种活动参与分析及推荐方法，其特征在于，包括：

从活动组织者与参与者的历史行为记录中获取用于分析的基本数据；

基于获得的基本数据，通过双向稳定匹配与参数迭代优化两层优化过程，还原历史活动参与决策中的活动组织者与参与者的双向选择过程，从而结合各自的决策函数估计各方的相对排序，并实现各自决策函数中相关参数的训练；

对于新组织的活动，基于活动自身信息、以及完成参数训练的决策函数，计算双方对于对方每个成员的评分，进而通过稳定匹配的方式预测双方相互选择的结果并进行推荐。

2.根据权利要求1所述的一种活动参与分析及推荐方法，其特征在于，所述基本数据至少包括：历史活动信息以及活动组织者与参与者各自的画像信息；

其中，历史活动信息包括：活动主题、活动相关文本描述、活动属性、活动所属的活动组织者、以及参与者的活动反馈与参与记录；所述活动属性包括：活动时间、地点及费用；

活动组织者与参与者各自的画像信息包括：活动组织者对应的领导人或者发起人、活动组织者与参与者各自的标签与自我介绍、以及参与者之间的显式好友关系。

3.根据权利要求1或2所述的一种活动参与分析及推荐方法，其特征在于，该方法还包括：

对获得的基本数据进行数据筛选，数据筛选时设置了两项阈值，第一项阈值，用于确保所筛选出的多个活动中，每一活动的潜在参与者之间存在一定的重叠，所述潜在参与者是指被邀请的参与者；第二项阈值，用于确保活动组织者与参与者均具有一定数量的历史活动记录；

之后，对筛选出的数据进行预处理；先去除文本信息中的提用词，再对文本信息进行向量化处理。

4.根据权利要求1或2所述的一种活动参与分析及推荐方法，其特征在于，所述基于获得的基本数据，通过双向稳定匹配与参数迭代优化两层优化过程，还原历史活动参与决策中的活动组织者与参与者的双向选择过程，从而结合各自的决策函数估计各方的相对排序，并实现各自决策函数中相关参数的训练包括如下五个环节：

①参数初始化：此环节对活动组织者与参与者各自对于对方的评价因素进行参数初始化，所涉及的评价因素也即决策函数中的相关参数；结合初始化后的评价因素与决策函数得到活动组织者所组织的活动和参与者对于对方的完整排序列表；

②双向稳定匹配：利用得到的活动组织者所组织的活动和参与者对于对方的完整排序列表，通过一对多Gale-Shapley算法，实现双方的稳定匹配，从而对活动组织者向参与者发放邀请、以及参与者接受邀请并参与活动的情况做出预测；

③计算损失函数：基于活动组织者和参与者之间的双向稳定匹配结果，结合活动记录中的邀请发放与参与者的参与记录，找出预测中所出现的错误，从而计算损失函数；

④参数迭代优化：利用损失函数并借此更新活动或参与者的决策函数中相关参数；

⑤排序更新：利用参数迭代优化结果，结合决策函数更新活动组织者所组织的活动和参与者对于对方的完整排序列表，并重新进入双向稳定匹配环节进行循环优化，直至活动组织者所组织的活动和参与者对于对方的完整排序列表不再改变。

5.根据权利要求4所述的一种活动参与分析及推荐方法，其特征在于，

对于活动组织者而言，其对参与者的评价因素包括：参与者u_i的兴趣向量与活动组织者g_j所组织的活动e_jk的主题向量的相似性，以及参与者的影响力，其中参与者的影响力采用参与者在社交网络中的PageRank值加以近似估计，则活动组织者g_j对于参与者u_i的决策函数表示为：其中，表示活动e_jk对参与者u_i的评分，评分大小决定排序列表中相应参与者的位置；cos<.>表示余弦相似度函数，pagerank(W)[i]表示指参与者u_i在社交网络中的PageRank值；

对于参与者而言，其对活动组织者的评价因素包括：参与者u_i的兴趣向量与活动e_jk的主题向量的相似性，参与者u_i对活动e_jk所属活动组织者g_j的忠诚度h_ij、以及来自社交好友的态度影响，则参与者u_i对于活动组织者g_j的决策函数表示为：其中，表示参与者u_i对活动e_jk的评分，评分大小决定排序列表中相应活动的位置；；表示对于参与者u_i而言来自社交好友的态度影响，W＝{w_ir}为参与者u_i与参与者u_r之间的社交关系强度，用于构建参与者之间的社交网络，并实现PageRank值与参与者的影响力两个部分的计算；表示参与者u_i想要参加活动e_jk的好友集合；

各评价因素初始化方式如下：

参与者u_i的兴趣向量与活动e_jk的主题向量的相似性的初始化，依赖于参与者u_i的自我介绍或活动e_jk的相关文本描述，采用话题模型技术，对活动e_jk的相关文本描述进行学习并生成若干潜在主题，进而将所有文本转化为对应的主题向量；如果参与者u_i没有自我介绍或活动e_jk没有相关文本描述，则将所有的主题向量设为均值，即每一维均为1/N，其中，N为潜在主题个数；

PageRank值根据初始化W＝{w_ir}后所得到的社交网络计算得到；

参与者u_i对活动e_jk所属活动组织者g_j的忠诚度h_ij初始值设为1，即忠诚于活动e_jk所属活动组织者g_j；

同时，还设计了一个额外的全拒绝倾向参数gr_i，即当参与者u_i对于所有活动的评分均低于gr_i时，该参与者u_i将拒绝全部活动邀请；

通过上述初始化后，利用初始化后的评价因素与各决策函数，得到活动组织者和参与者对于对方的完整排序列表。

6.根据权利要求5所述的一种活动参与分析及推荐方法，其特征在于，进行双向稳定匹配环节之前，构造一个虚拟活动，其面向所有参与者开放，同时，参与者u_i对于该虚拟活动评分取决于参数初始化环节中设计的全拒绝倾向参数gr_i；在双向稳定匹配环节时，活动组织者g_j设计活动e_jk，并向潜在参与者发放邀请，潜在参与者根据收到的邀请进行选择并反馈；然后，活动组织方根据潜在参与者的反馈，结合活动所能容纳的最大参与者数量θ_jk，发放下一轮邀请，直到达到最大容纳数量或所有参与者都已做出稳定选择；相关步骤如下：

2)对于接受到e_jk邀请的参与者u_i，查询其对于活动的完整排序列表，读取对于活动e_jk的评分若没有收到邀请，则将设置为0；

3)对于参与者u_i，根据其排序列表，包括虚拟活动的评分gr_i，选择接受排序最高的活动，如果虚拟活动的评分gr_i排名最高，则不参加任何活动；；

7.根据权利要求6所述的一种活动参与分析及推荐方法，其特征在于，计算损失函数环节中，针对双向稳定匹配时的预测结果进行判断，找出预测中所出现的错误，所述的错误包括两类：一类是本应被邀请或参与的参与者，在预测结果中并没有被邀请或并没有参与活动；另一类则是，本不应被邀请或参与的参与者在预测中收到了邀请或参加了活动；

8.根据权利要求7所述的一种活动参与分析及推荐方法，其特征在于，参数迭代优化时，对于活动而言所要更新的参数包括：活动组织者集合，其涉及活动组织者所造成的社交影响；对于参与者而言所要更新的参数包括：参与者u_i的兴趣向量全拒绝倾向参数gr_i、对活动e_jk所属活动组织者g_j的忠诚度h_ij、以及参与者u_i与参与者u_r之间的社交关系强度W＝{w_ir}；上述所有参数通过梯度下降法来更新；

9.根据权利要求4所述的一种活动参与分析及推荐方法，其特征在于，对于新组织的活动，首先进行参数初始化：将活动自身信息进行向量化处理，参与者则采用训练得到的参数；如果出现冷启动情况，即某位参与者未在之前的训练样本中出现，则采用和参数初始化环节中同样的初始值作为默认参数取值；

然后，进行活动组织者邀请预测：基于活动组织者对于参与用户的决策函数，对参与者进行评分并排序，前θ_jk名参与者将被发放邀请，邀请分一次发送或多次发送；

最后，进行参与者参与活动预测：面向每个参与者收到的邀请，根据参与者对于活动组织者的决策函数，对各活动进行评分并排序，并接受排名最高的活动邀请；如果没有收到邀请，或排名最高的为虚拟活动，则不参加任何活动。