CN113961818B

CN113961818B - 一种基于长短期兴趣与社会影响力的群体需求预测方法

Info

Publication number: CN113961818B
Application number: CN202110647693.3A
Authority: CN
Inventors: 高岭; 李妍; 向东; 许佶鹏; 朱海蓉; 孙秦豫; 郭子正; 杨旭东; 郭红波; 杨琰
Original assignee: NORTHWEST UNIVERSITY
Current assignee: NORTHWEST UNIVERSITY
Priority date: 2021-06-10
Filing date: 2021-06-10
Publication date: 2024-03-12
Anticipated expiration: 2041-06-10
Also published as: CN113961818A

Abstract

一种基于长短期兴趣与社会影响力的群体需求预测方法，该方法首先基于用户访问资源时的IP地址划分群体；其次，结合用户的历史访问记录，为每一个用户建立兴趣‑评分关联表，并训练个体LSTM网络模型，在综合考虑用户历史行为与兴趣迁移的情况下对指定项目进行评分预测，进而构建群体用户‑项目评分表；接着，在对用户个性以及专业程度进行分析的基础上，考察用户对群组中其他用户意见的敏感程度，并通过挖掘群组中用户间的亲密程度分析用户间相互关系，从而形成基于社会影响力的群体用户模型；最后，根据模型对群体需求进行预测。该方法将用户长短期兴趣与用户间的社会影响力运用到需求预测方法中，最大程度满足群体成员的需求。

Description

一种基于长短期兴趣与社会影响力的群体需求预测方法

技术领域

本发明属于群体推荐技术领域，具体涉及一种基于长短期兴趣与社会影响力的群体需求预测方法。

背景技术

公共数字文化服务还存在不少瓶颈问题，诸如：资源采集交换缺少统一的标准规范，数字资源“孤岛化”现象普遍存在，社会主体参与资源建设单一，缺少个性化服务等，项目致力于从技术层面对上述问题予以研究突破。本发明即基于长短期兴趣与社会影响力的群体需求预测方法，围绕公共数字文化惠民服务中智能化对提升我国公共数字文化服务水平，在梳理分析国内外相关机构和技术领域研究现状的基础上，拟解决处于云端的公共文化资源在调度和分发时的效率问题和公平问题，为实现我国公共文化资源智能共建共享与管理提供理论基础和技术支撑。

与传统的群体需求预测技术不同，公共文化云资源中的群体需求预测的最终目的是将云端资源按照用户需求预先调度到靠近群体用户的位置，解决云资源使用的效率问题，因此，需要直接按照用户访问时的ip地址进行群体划分，根据区域用户的历史访问记录和实时访问情况预测群体需求。而且，在现有的大多数群体需求预测方法中，主要考虑用户偏好问题，而较少考虑到影响群体决策的一些其他因素，例如个体用户兴趣迁移问题和群体成员间社会影响力。在建立一种实时性、高效率的群体需求预测机制时，将用户兴趣迁移与成员间社会影响力纳入考量也是很有必要的。

发明内容

为了克服上述现有技术的不足，本发明的目的是提供一种基于长短期兴趣与社会影响力的群体需求预测方法，将用户的兴趣迁移与社会影响力嵌入到群体需求预测中，提供一种基于长短期兴趣和社会影响力的群体需求预测方法，用于实现根据用户历史访问行为分析用户长短期兴趣偏好、对他人意见敏感程度以及与其他用户相互关系等信息，进而对群体需求进行实时预测，以提高公共文化云平台资源访问的效率。

为了实现上述目的，本发明采用的技术方案是：

一种基于长短期兴趣与社会影响力的群体需求预测方法，包括以下步骤：

步骤1，群体划分：按照用户IP地址划分群体；

步骤2，用户访问数据处理：根据用户对资源的历史访问数据构建用户在不同时刻的兴趣-评分关联表，挖掘用户需求随时间的变化情况，具体包括：

1)对资源类别进行编号标码，构建资源类别标签词典，并根据资源属性取值将资源归属到不同类别中，进而构建资源-类别表；

2)分别构建两个q行M列的矩阵，分别存放q个用户对M个资源的访问时间和评分，即用户-资源访问时间表和用户-资源评分表；扫描输入的样本数据集，提取用户对资源的访问时间以填充用户-资源访问时间表，提取用户对资源评分以填充用户-资源评分表；

3)对于每一个用户，分别从资源-类别表、用户-资源访问时间表、用户-资源评分表中筛选出与该用户相关的记录，构建该用户在不同时刻的兴趣-评分关联表；其中，每个用户的兴趣-评分关联表中的记录按照访问时间升序排序；

步骤3，建立基于LSTM的个体项目评分预测模型：基于长短期记忆神经网络(LongShort-Term Memory，LSTM)模型，根据用户在不同时刻的兴趣-评分关联表建立相应的个体项目评分预测模型，获取用户对项目的初始评分矩阵，进而形成群体用户对项目的初始评分矩阵，步骤如下：

1)逐行提取兴趣-评分关联表中的记录，将用户随时间发生变化的部分作为LSTM模型的输入，将用户评分作为模型的输出，去训练每个用户基于LSTM的网络模型；

2)LSTM网络包括遗忘门f_t、输入门i_t、更新门c_t和输出门o_t四种门结构，用以保持和更新细胞状态，其中t表示当前时刻，f、i、C、o表示四种不同的门结构对应向量；

①遗忘门层用以决定从细胞状态中丢弃的信息，它读取上一层的输出h_t-1和当前时刻的输入x_t，输出一个数值f_t，并赋值给当前细胞的状态C_t-1；其中f_t计算方式为：

f_t＝σ(W_f·[h_t-1，x_t]+b_f)

其中h表示隐藏的状态结构，x_t表示当前时刻LSTM的输入向量，C表示细胞状态向量，f_t表示遗忘门的激活向量，W_f、U_f和b_f分别表示的是遗忘门的输入权重、循环权重和偏置；

②输入门层用以筛选新旧信息并存放于细胞状态，它包含两个部分：第一部分，通过sigmod函数决定需要输入的值；另一部分，通过tanh函数创建一个新的候选值向量，该向量会被加入到状态C_t中；新的候选值向量计算为：

i_t＝σ(W_i·[h_t-1，x_t]+b_i)

其中W_i和b_i、W_C和b_C分别表示的是输入门的输入权重和偏置以及更新门的输入权重和偏置；

③更新门层更新旧细胞状态，将C_t-1更新为C_t，更新方式为：

其中，细胞状态用以存放模型中的关键信息，为LSTM网络模型能够得以存储用户的个性化信息的关键；

④输出门层基于细胞的状态输出数值：首先运行一个sigmoid层来确定细胞状态将输出的部分o_t；接着把细胞状态通过tanh进行处理并把它和sigmoid门的输出相乘；最后输出确定要输出的部分h_t，即下一时间步的评分预测：

o_t＝o(W_o·[h_t-1，x_t]+b_o)

h_t＝o_t*tanh(C_t)

其中W_o和b_o分别表示的是输出门的输入权重和偏置；

由于四种门结构的存在，LSTM能够智能“记忆”用户长短期访问兴趣，以预测各用户在下一时刻对各个项目的评分；

神经网络模型采用按时间展开的反向误差传播算法(BPTT)进行训练，依照预定义的损失函数迭代修正网络中的权重参数，以最小化t时刻用户对某一项目的预测评分与实际评分的误差；

3)根据训练好的LSTM网络模型，获取用户对项目的初始评分矩阵；

步骤4，建立基于社会影响力的群体用户模型：通过社交网络上的用户数据，获取用户对其他用户意见敏感程度以及群体成员之间相互关系，从而构建基于社会影响力的群体用户模型，步骤如下：

1)用户对其他用户意见的敏感程度主要是由于用户自身的个性因素和专业性因素等所造成，通过收集用户在网络上的资源访问情况与交互信息，分析用户专业性程度以及个性特点，如在与他人意见出现分歧时属于独断型、协作型或者妥协型行为等；

①个性因素表示方法如下：

Personality

＝[Personality₁ Personality₂ Personality₃... Personality_q]^T

其中，Personality_u取值在[0，1]，用户个性越强，该用户个性值越高，反之则越低，Personality_u为0时代表该用户合作性很高，独断性很低；Personality_u为1时代表该用户独断性很高，而合作性很低；

②专业程度表示方法如下：

Expert(G)

＝[Expert₁(G) Expert₂(G) Expert₃(G) ... Expert_q(G)]^T

其中，expert_j表示群体用户j的绝对专业性等级程度，Expertj(G)代表群体用户j在群体G中的专业性程度，群体G中所有用户的相对专业性等级之和为1；

③通过对用户个性因素和在群组中的相对专业性因素设定不同的权重因子，对用户这两种属性进行有效选择和控制，进而确定在其对用户的敏感性程度因素的不同影响，群组G中用户u的敏感性程度表示方法如下：

其中，α和β分别代表了用户u的个性因素Personality_u和在群组G中的相对专业程度因素Expert_u(G)在计算用户u的敏感性程度Susceptibility_u时所占的权重；

④群体成员的敏感性程度表示为：

Susceptibility

＝[Susceptibility₁ Susceptibility₂ Susceptibility₃ ...Susceptibility_q]

2)通过收集用户在社交网络上的信息以及与他人的交互情况，分析用户之间的相互关系；其中，度量指标包括用户认识时间长短、用户间联系频率、用户密切程度、相互信任程度、用户间拥有的共同朋友数量等；

用户i和用户j之间相互关系，即亲密程度Intimacy_(i，j)表示方式如下：

其中，L_i表示用户在k个相互关系量化指标上的评分值，Max(L_i)表示用户对评分量化指标的最高评分值，i＝1，2，…，k；

群体成员之间的相互关系可以表示如下：

3)群组G中q个用户的社会影响力SInfluence表示如下：

SInfluence＝(I-diag(Susceptibility)Intimacy)^-1(I-diag(Susceptibility))；

步骤5，群体需求预测：利用群体用户对项目的初始评分矩阵，通过基于社会影响力的群体用户模型，对不同群体的需求进行预测，考虑社会影响力后的群体成员对项目的预测评分可以表示为：

PredictedR＝SInfluence·R。

进一步，所述的步骤1中根据用户访问资源时的IP地址将其划分到具体的群体中，可以根据具体需求将群体划分省域级群体、市级群体和机构群体三个级别。

进一步，考察用户历史访问记录，在对项目进行分类与属性分析的基础上，判断用户长短期兴趣偏好，形成用户对项目的初始评分矩阵。

进一步，考察用户个性特征、专业程度、与群体中其他成员相互关系，分析用户的社会影响力，结合基于用户长短期兴趣所形成的当前的用户对项目的初始评分矩阵，对群体需求进行预测。

本发明的有益效果是：

1.本发明在实现群体需求预测过程中构建的基于用户个体需求预测模型对数据稀疏性、用户兴趣刻画不细致等问题提出了解决方案。通过从资源-类别表、用户-资源访问时间表、用户-资源评分表提取用户在不同时刻的兴趣-评分关联表，降低了数据稀疏性；通过构建LSTM个体需求预测模型，加入对用户长短期兴趣的考量，提高个体用户需求预测准确率；

2.本发明构建的基于长短期兴趣与用户影响力的群体需求预测模型在考虑群体用户个体偏好的同时，考虑了群体成员之间的社会影响因素，包括由于个体用户的专业性与本身个性等造成的在群体间表现出来的敏感度和由于用户间密切程度、联系频率、用户间共同好友数等所形成的用户间的相互关系，使得群体需求预测研究更贴合实际情况，并提高个体用户满意度与群体预测效果。

附图说明

图1为本发明的流程示意图；

图2为基于LSTM的个体项目评分预测模型；

图3为基于社会影响力的群体用户模型。

具体实施方式

以下结合实施例及附图对本发明进一步叙述。

如图1所示，一种基于长短期兴趣与社会影响力的群体需求预测方法，包括以下步骤：

步骤1，群体划分：按照用户IP地址划分群体；

步骤3，建立基于LSTM的个体项目评分预测模型：基于长短期记忆神经网络(LongShort-Term Memory,LSTM)模型，根据用户在不同时刻的兴趣-评分关联表建立相应的个体项目评分预测模型，获取用户对项目的初始评分矩阵，进而形成群体用户对项目的初始评分矩阵，步骤如下：

2)如图2所示，LSTM网络包括遗忘门f_t、输入门i_t、更新门C_t和输出门o_t四种门结构，用以保持和更新细胞状态，其中t表示当前时刻，f、i、C、o表示四种不同的门结构对应向量；

f_t＝σ(W_f·[h_t-1，x_t]+b_f)

i_t＝σ(W_i·[h_t-1，x_t]+b_i)

o_t＝σ(W_o·[h_t-1，x_t]+b_o)

h_t＝o_t*tanh(C_t)

其中W_o和b_o分别表示的是输出门的输入权重和偏置；

步骤4，建立基于社会影响力的群体用户模型：如图3所示，通过社交网络上的用户数据，获取用户对其他用户意见敏感程度以及群体成员之间相互关系，从而构建基于社会影响力的群体用户模型，步骤如下：

①个性因素表示方法如下：

Personality

＝[Personality₁ Personality₂ Personality₃ ... Personality_q]^T

②专业程度表示方法如下：

ExpeIt(G)

＝[Expert₁(G) Expert₂(G) Expert₃(G) ... Expert_q(G)]^T

其中，expert_j表示群体用户j的绝对专业性等级程度，Expert_j(G)代表群体用户j在群体G中的专业性程度，群体G中所有用户的相对专业性等级之和为1；

④群体成员的敏感性程度表示为：

Susceptibility

＝[Susceptibility₁ Susceptibility₂ Susceptibility₃ ...Susceptibility_q]

其中，L_i表示用户在k个相互关系量化指标上的评分值，Maxx(L_i)表示用户对评分量化指标的最高评分值，i＝1，2，…，k；

群体成员之间的相互关系可以表示如下：

3)群组G中q个用户的社会影响力SInfluence表示如下：

SInfluence＝(I-diag(Susceptibility)Intimacy)^-1(I-diag(Susceptibility))；

PredictedR＝SInfluence·R。

Claims

1.一种基于长短期兴趣与社会影响力的群体需求预测方法，其特征在于，包括以下步骤：

步骤1，群体划分：按照用户IP地址划分群体；

f_t＝σ(W_f·[h_t-1，x_t]+b_f)

i_t＝σ(W_i·[h_t-1，x_t]+b_i)

o_t＝σ(W_o·[h_t-1，x_t]+b_o)

h_t＝o_t*tanh(C_t)

其中W_o和b_o分别表示的是输出门的输入权重和偏置；

①个性因素表示方法如下：

Personality

＝[Personality₁ Personality₂ Personality₃ ... Personality_q]^T

②专业程度表示方法如下：

Expert(G)

＝[Expert₁(G) Expert₂(G) Expert₃(G) ... Expert_q(G)]^T

④群体成员的敏感性程度表示为：

Susceptibility

＝[Susceptibility₁ Susceptibility₂ Susceptibility₃ ... Susceptibility_q]

群体成员之间的相互关系可以表示如下：

3)群组G中q个用户的社会影响力SInfluence表示如下：

SInfluence＝(I-diag(Susceptibility)Intimacy)^-1(I-diag(Susceptibility))；

PredictedR＝SInfluence·R。

2.根据权利要求1所述的一种基于长短期兴趣与社会影响力的群体需求预测方法，其特征在于，所述的步骤1中根据用户访问资源时的IP地址将其划分到具体的群体中，可以根据具体需求将群体划分省域级群体、市级群体和机构群体三个级别。

3.根据权利要求1所述的一种基于长短期兴趣与社会影响力的群体需求预测方法，其特征在于，考察用户历史访问记录，在对项目进行分类与属性分析的基础上，判断用户长短期兴趣偏好，形成用户对项目的初始评分矩阵。

4.根据权利要求1所述的一种基于长短期兴趣与社会影响力的群体需求预测方法，其特征在于，考察用户个性特征、专业程度、与群体中其他成员相互关系，分析用户的社会影响力，结合基于用户长短期兴趣所形成的当前的用户对项目的初始评分矩阵，对群体需求进行预测。