CN113961818A - 一种基于长短期兴趣与社会影响力的群体需求预测方法 - Google Patents

一种基于长短期兴趣与社会影响力的群体需求预测方法 Download PDF

Info

Publication number
CN113961818A
CN113961818A CN202110647693.3A CN202110647693A CN113961818A CN 113961818 A CN113961818 A CN 113961818A CN 202110647693 A CN202110647693 A CN 202110647693A CN 113961818 A CN113961818 A CN 113961818A
Authority
CN
China
Prior art keywords
user
users
group
score
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110647693.3A
Other languages
English (en)
Other versions
CN113961818B (zh
Inventor
高岭
李妍
向东
许佶鹏
朱海蓉
孙秦豫
郭子正
杨旭东
郭红波
杨琰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwest University
Original Assignee
Northwest University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwest University filed Critical Northwest University
Priority to CN202110647693.3A priority Critical patent/CN113961818B/zh
Publication of CN113961818A publication Critical patent/CN113961818A/zh
Application granted granted Critical
Publication of CN113961818B publication Critical patent/CN113961818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于长短期兴趣与社会影响力的群体需求预测方法,该方法首先基于用户访问资源时的IP地址划分群体;其次,结合用户的历史访问记录,为每一个用户建立兴趣‑评分关联表,并训练个体LSTM网络模型,在综合考虑用户历史行为与兴趣迁移的情况下对指定项目进行评分预测,进而构建群体用户‑项目评分表;接着,在对用户个性以及专业程度进行分析的基础上,考察用户对群组中其他用户意见的敏感程度,并通过挖掘群组中用户间的亲密程度分析用户间相互关系,从而形成基于社会影响力的群体用户模型;最后,根据模型对群体需求进行预测。该方法将用户长短期兴趣与用户间的社会影响力运用到需求预测方法中,最大程度满足群体成员的需求。

Description

一种基于长短期兴趣与社会影响力的群体需求预测方法
技术领域
本发明属于群体推荐技术领域,具体涉及一种基于长短期兴趣与 社会影响力的群体需求预测方法。
背景技术
公共数字文化服务还存在不少瓶颈问题,诸如:资源采集交换缺 少统一的标准规范,数字资源“孤岛化”现象普遍存在,社会主体参 与资源建设单一,缺少个性化服务等,项目致力于从技术层面对上述 问题予以研究突破。本发明即基于长短期兴趣与社会影响力的群体需 求预测方法,围绕公共数字文化惠民服务中智能化对提升我国公共数 字文化服务水平,在梳理分析国内外相关机构和技术领域研究现状的 基础上,拟解决处于云端的公共文化资源在调度和分发时的效率问题 和公平问题,为实现我国公共文化资源智能共建共享与管理提供理论 基础和技术支撑。
与传统的群体需求预测技术不同,公共文化云资源中的群体需求 预测的最终目的是将云端资源按照用户需求预先调度到靠近群体用 户的位置,解决云资源使用的效率问题,因此,需要直接按照用户访 问时的ip地址进行群体划分,根据区域用户的历史访问记录和实时 访问情况预测群体需求。而且,在现有的大多数群体需求预测方法中, 主要考虑用户偏好问题,而较少考虑到影响群体决策的一些其他因 素,例如个体用户兴趣迁移问题和群体成员间社会影响力。在建立一 种实时性、高效率的群体需求预测机制时,将用户兴趣迁移与成员间 社会影响力纳入考量也是很有必要的。
发明内容
为了克服上述现有技术的不足,本发明的目的是提供一种基于长 短期兴趣与社会影响力的群体需求预测方法,将用户的兴趣迁移与社 会影响力嵌入到群体需求预测中,提供一种基于长短期兴趣和社会影 响力的群体需求预测方法,用于实现根据用户历史访问行为分析用户 长短期兴趣偏好、对他人意见敏感程度以及与其他用户相互关系等信息,进而对群体需求进行实时预测,以提高公共文化云平台资源访问 的效率。
为了实现上述目的,本发明采用的技术方案是:
一种基于长短期兴趣与社会影响力的群体需求预测方法,包括以 下步骤:
步骤1,群体划分:按照用户IP地址划分群体;
步骤2,用户访问数据处理:根据用户对资源的历史访问数据构 建用户在不同时刻的兴趣-评分关联表,挖掘用户需求随时间的变化 情况,具体包括:
1)对资源类别进行编号标码,构建资源类别标签词典,并根据 资源属性取值将资源归属到不同类别中,进而构建资源-类别表;
2)分别构建两个q行M列的矩阵,分别存放q个用户对M个资 源的访问时间和评分,即用户-资源访问时间表和用户-资源评分表; 扫描输入的样本数据集,提取用户对资源的访问时间以填充用户-资 源访问时间表,提取用户对资源评分以填充用户-资源评分表;
3)对于每一个用户,分别从资源-类别表、用户-资源访问时间 表、用户-资源评分表中筛选出与该用户相关的记录,构建该用户在 不同时刻的兴趣-评分关联表;其中,每个用户的兴趣-评分关联表中 的记录按照访问时间升序排序;
步骤3,建立基于LSTM的个体项目评分预测模型:基于长短期 记忆神经网络(LongShort-Term Memory,LSTM)模型,根据用户在 不同时刻的兴趣-评分关联表建立相应的个体项目评分预测模型,获 取用户对项目的初始评分矩阵,进而形成群体用户对项目的初始评分 矩阵,步骤如下:
1)逐行提取兴趣-评分关联表中的记录,将用户随时间发生变化 的部分作为LSTM模型的输入,将用户评分作为模型的输出,去训练 每个用户基于LSTM的网络模型;
2)LSTM网络包括遗忘门ft、输入门it、更新门Ct和输出门ot四种门 结构,用以保持和更新细胞状态,其中t表示当前时刻,f、i、C、o 表示四种不同的门结构对应向量;
①遗忘门层用以决定从细胞状态中丢弃的信息,它读取上一层的 输出ht-1和当前时刻的输入xt,输出一个数值ft,并赋值给当前细胞的 状态Ct-1;其中ft计算方式为:
ft=σ(Wf·[ht-1,Xt]+bf)
其中h表示隐藏的状态结构,xt表示当前时刻LSTM的输入向量, C表示细胞状态向量,ft表示遗忘门的激活向量,Wf、Uf和bf分别表示 的是遗忘门的输入权重、循环权重和偏置;
②输入门层用以筛选新旧信息并存放于细胞状态,它包含两个部 分:第一部分,通过sigmod函数决定需要输入的值;另一部分,通 过tanh函数创建一个新的候选值向量,该向量会被加入到状态Ct中; 新的候选值向量计算为:
it=σ(Wi·[ht-1,xt]+bi)
Figure BDA0003110500190000041
其中Wi和bi、WC和bC分别表示的是输入门的输入权重和偏置以及 更新门的输入权重和偏置;
③更新门层更新旧细胞状态,将Ct-1更新为Ct,更新方式为:
Figure BDA0003110500190000042
其中,细胞状态用以存放模型中的关键信息,为LSTM网络模型 能够得以存储用户的个性化信息的关键;
④输出门层基于细胞的状态输出数值:首先运行一个sigmoid层 来确定细胞状态将输出的部分ot;接着把细胞状态通过tanh进行处理 并把它和sigmoid门的输出相乘;最后输出确定要输出的部分ht,即 下一时间步的评分预测:
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中Wo和bo分别表示的是输出门的输入权重和偏置;
由于四种门结构的存在,LSTM能够智能“记忆”用户长短期访 问兴趣,以预测各用户在下一时刻对各个项目的评分;
神经网络模型采用按时间展开的反向误差传播算法(BPTT)进行 训练,依照预定义的损失函数迭代修正网络中的权重参数,以最小化 t时刻用户对某一项目的预测评分与实际评分的误差;
3)根据训练好的LSTM网络模型,获取用户对项目的初始评分矩 阵;
Figure BDA0003110500190000051
步骤4,建立基于社会影响力的群体用户模型:通过社交网络上 的用户数据,获取用户对其他用户意见敏感程度以及群体成员之间相 互关系,从而构建基于社会影响力的群体用户模型,步骤如下:
1)用户对其他用户意见的敏感程度主要是由于用户自身的个性 因素和专业性因素等所造成,通过收集用户在网络上的资源访问情况 与交互信息,分析用户专业性程度以及个性特点,如在与他人意见出 现分歧时属于独断型、协作型或者妥协型行为等;
①个性因素表示方法如下:
Personality
=PerSonality1 Personality2 Personality3…Personalityq]T
其中,Personalityu取值在[0,1],用户个性越强,该用户个性值越 高,反之则越低,Personalityu为0时代表该用户合作性很高,独断性很 低;Personalityu为1时代表该用户独断性很高,而合作性很低;
②专业程度表示方法如下:
Expert(G)
=[Expert1(G) Expert2(G) Expert3(G)…Expertq(G)]T
其中,
Figure BDA0003110500190000061
expertj表示群体用户j的绝对专业性等 级程度,Expertj(G)代表群体用户j在群体G中的专业性程度,群体G 中所有用户的相对专业性等级之和为1;
③通过对用户个性因素和在群组中的相对专业性因素设定不同 的权重因子,对用户这两种属性进行有效选择和控制,进而确定在其 对用户的敏感性程度因素的不同影响,群组G中用户u的敏感性程度 表示方法如下:
Figure BDA0003110500190000062
其中,α和β分别代表了用户u的个性因素Personalityu和在群组G 中的相对专业程度因素Expertu(G)在计算用户u的敏感性程度Susceptibilityu时所占的权重;
④群体成员的敏感性程度表示为:
Susceptibility
=[Susceptibility1 Susceptibility2 Susceptibility3…Susceptibilityq]
2)通过收集用户在社交网络上的信息以及与他人的交互情况, 分析用户之间的相互关系;其中,度量指标包括用户认识时间长短、 用户间联系频率、用户密切程度、相互信任程度、用户间拥有的共同 朋友数量等;
用户i和用户j之间相互关系,即亲密程度Intimacy(i,j)表示方式如 下:
Figure BDA0003110500190000071
其中,Li表示用户在k个相互关系量化指标上的评分值,Max(Li)表 示用户对评分量化指标的最高评分值,i=1,2,…,k;
群体成员之间的相互关系可以表示如下:
Figure BDA0003110500190000072
3)群组G中q个用户的社会影响力SInfluence表示如下:
SInfluence=(I-diag(Susceptibility)Intimacy)-1(I- diag(Susceptibility));
步骤5,群体需求预测:利用群体用户对项目的初始评分矩阵, 通过基于社会影响力的群体用户模型,对不同群体的需求进行预测, 考虑社会影响力后的群体成员对项目的预测评分可以表示为:
PredictedR=SInfluence·R。
进一步,所述的步骤1中根据用户访问资源时的IP地址将其划 分到具体的群体中,可以根据具体需求将群体划分省域级群体、市级 群体和机构群体三个级别。
进一步,考察用户历史访问记录,在对项目进行分类与属性分析 的基础上,判断用户长短期兴趣偏好,形成用户对项目的初始评分矩 阵。
进一步,考察用户个性特征、专业程度、与群体中其他成员相互 关系,分析用户的社会影响力,结合基于用户长短期兴趣所形成的当 前的用户对项目的初始评分矩阵,对群体需求进行预测。
本发明的有益效果是:
1.本发明在实现群体需求预测过程中构建的基于用户个体需求 预测模型对数据稀疏性、用户兴趣刻画不细致等问题提出了解决方 案。通过从资源-类别表、用户-资源访问时间表、用户-资源评分表 提取用户在不同时刻的兴趣-评分关联表,降低了数据稀疏性;通过 构建LSTM个体需求预测模型,加入对用户长短期兴趣的考量,提高 个体用户需求预测准确率;
2.本发明构建的基于长短期兴趣与用户影响力的群体需求预测 模型在考虑群体用户个体偏好的同时,考虑了群体成员之间的社会影 响因素,包括由于个体用户的专业性与本身个性等造成的在群体间表 现出来的敏感度和由于用户间密切程度、联系频率、用户间共同好友 数等所形成的用户间的相互关系,使得群体需求预测研究更贴合实际 情况,并提高个体用户满意度与群体预测效果。
附图说明
图1为本发明的流程示意图;
图2为基于LSTM的个体项目评分预测模型;
图3为基于社会影响力的群体用户模型。
具体实施方式
以下结合实施例及附图对本发明进一步叙述。
如图1所示,一种基于长短期兴趣与社会影响力的群体需求预测 方法,包括以下步骤:
步骤1,群体划分:按照用户IP地址划分群体;
步骤2,用户访问数据处理:根据用户对资源的历史访问数据构 建用户在不同时刻的兴趣-评分关联表,挖掘用户需求随时间的变化 情况,具体包括:
1)对资源类别进行编号标码,构建资源类别标签词典,并根据 资源属性取值将资源归属到不同类别中,进而构建资源-类别表;
2)分别构建两个q行M列的矩阵,分别存放q个用户对M个资 源的访问时间和评分,即用户-资源访问时间表和用户-资源评分表; 扫描输入的样本数据集,提取用户对资源的访问时间以填充用户-资 源访问时间表,提取用户对资源评分以填充用户-资源评分表;
3)对于每一个用户,分别从资源-类别表、用户-资源访问时间 表、用户-资源评分表中筛选出与该用户相关的记录,构建该用户在 不同时刻的兴趣-评分关联表;其中,每个用户的兴趣-评分关联表中 的记录按照访问时间升序排序;
步骤3,建立基于LSTM的个体项目评分预测模型:基于长短期 记忆神经网络(LongShort-Term Memory,LSTM)模型,根据用户在 不同时刻的兴趣-评分关联表建立相应的个体项目评分预测模型,获 取用户对项目的初始评分矩阵,进而形成群体用户对项目的初始评分 矩阵,步骤如下:
1)逐行提取兴趣-评分关联表中的记录,将用户随时间发生变化 的部分作为LSTM模型的输入,将用户评分作为模型的输出,去训练 每个用户基于LSTM的网络模型;
2)如图2所示,LSTM网络包括遗忘门ft、输入门it、更新门Ct和 输出门ot四种门结构,用以保持和更新细胞状态,其中t表示当前时 刻,f、i、C、o表示四种不同的门结构对应向量;
①遗忘门层用以决定从细胞状态中丢弃的信息,它读取上一层的 输出ht-1和当前时刻的输入xt,输出一个数值ft,并赋值给当前细胞的 状态Ct-1;其中ft计算方式为:
ft=σ(Wf·[ht-1,Xt]+bf)
其中h表示隐藏的状态结构,xt表示当前时刻LSTM的输入向量, C表示细胞状态向量,ft表示遗忘门的激活向量,Wf、Uf和bf分别表示 的是遗忘门的输入权重、循环权重和偏置;
②输入门层用以筛选新旧信息并存放于细胞状态,它包含两个部 分:第一部分,通过sigmod函数决定需要输入的值;另一部分,通 过tanh函数创建一个新的候选值向量,该向量会被加入到状态Ct中; 新的候选值向量计算为:
it=σ(Wi·[ht-1,xt]+bi)
Figure BDA0003110500190000111
其中Wi和bi、WC和bC分别表示的是输入门的输入权重和偏置以及 更新门的输入权重和偏置;
③更新门层更新旧细胞状态,将Ct-1更新为Ct,更新方式为:
Figure BDA0003110500190000112
其中,细胞状态用以存放模型中的关键信息,为LSTM网络模型 能够得以存储用户的个性化信息的关键;
④输出门层基于细胞的状态输出数值:首先运行一个sigmoid层 来确定细胞状态将输出的部分ot;接着把细胞状态通过tanh进行处理 并把它和sigmoid门的输出相乘;最后输出确定要输出的部分ht,即 下一时间步的评分预测:
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中Wo和bo分别表示的是输出门的输入权重和偏置;
由于四种门结构的存在,LSTM能够智能“记忆”用户长短期访 问兴趣,以预测各用户在下一时刻对各个项目的评分;
神经网络模型采用按时间展开的反向误差传播算法(BPTT)进行 训练,依照预定义的损失函数迭代修正网络中的权重参数,以最小化 t时刻用户对某一项目的预测评分与实际评分的误差;
3)根据训练好的LSTM网络模型,获取用户对项目的初始评分矩 阵;
Figure BDA0003110500190000121
步骤4,建立基于社会影响力的群体用户模型:如图3所示,通 过社交网络上的用户数据,获取用户对其他用户意见敏感程度以及群 体成员之间相互关系,从而构建基于社会影响力的群体用户模型,步 骤如下:
1)用户对其他用户意见的敏感程度主要是由于用户自身的个性 因素和专业性因素等所造成,通过收集用户在网络上的资源访问情况 与交互信息,分析用户专业性程度以及个性特点,如在与他人意见出 现分歧时属于独断型、协作型或者妥协型行为等;
①个性因素表示方法如下:
Personality
=[Personality1 Personality2 Personality3…Personalityq]T
其中,Personalityu取值在[0,1],用户个性越强,该用户个性值越 高,反之则越低,Personalityu为0时代表该用户合作性很高,独断性很 低;Personalityu为1时代表该用户独断性很高,而合作性很低;
②专业程度表示方法如下:
Expert(G)
=[Expert1(G) Expert2(G) Expert3(G)…Experta(G)]T
其中,
Figure BDA0003110500190000131
expertj表示群体用户j的绝对专业性等 级程度,Expertj(G)代表群体用户j在群体G中的专业性程度,群体G 中所有用户的相对专业性等级之和为1;
③通过对用户个性因素和在群组中的相对专业性因素设定不同 的权重因子,对用户这两种属性进行有效选择和控制,进而确定在其 对用户的敏感性程度因素的不同影响,群组G中用户u的敏感性程度 表示方法如下:
Figure BDA0003110500190000132
其中,α和β分别代表了用户u的个性因素Personalityu和在群组G 中的相对专业程度因素Expertu(G)在计算用户u的敏感性程度 Susceptibilityu时所占的权重;
④群体成员的敏感性程度表示为:
Susceptibility
=[Susceptibility1 Susceptibility2 Susceptibility3…Susceptibilityq]
2)通过收集用户在社交网络上的信息以及与他人的交互情况, 分析用户之间的相互关系;其中,度量指标包括用户认识时间长短、 用户间联系频率、用户密切程度、相互信任程度、用户间拥有的共同 朋友数量等;
用户i和用户j之间相互关系,即亲密程度Intimacy(i,j)表示方式如 下:
Figure BDA0003110500190000141
其中,Li表示用户在k个相互关系量化指标上的评分值,Max(Li)表 示用户对评分量化指标的最高评分值,i=1,2,…,k;
群体成员之间的相互关系可以表示如下:
Figure BDA0003110500190000142
3)群组G中q个用户的社会影响力SInfluence表示如下:
SInfluence=(I-diag(Susceptibility)Intimacy)-1(I- diag(Susceptibility));
步骤5,群体需求预测:利用群体用户对项目的初始评分矩阵, 通过基于社会影响力的群体用户模型,对不同群体的需求进行预测, 考虑社会影响力后的群体成员对项目的预测评分可以表示为:
PredictedR=SInfluence·R。
进一步,所述的步骤1中根据用户访问资源时的IP地址将其划 分到具体的群体中,可以根据具体需求将群体划分省域级群体、市级 群体和机构群体三个级别。
进一步,考察用户历史访问记录,在对项目进行分类与属性分析 的基础上,判断用户长短期兴趣偏好,形成用户对项目的初始评分矩 阵。
进一步,考察用户个性特征、专业程度、与群体中其他成员相互 关系,分析用户的社会影响力,结合基于用户长短期兴趣所形成的当 前的用户对项目的初始评分矩阵,对群体需求进行预测。

Claims (4)

1.一种基于长短期兴趣与社会影响力的群体需求预测方法,其特征在于,包括以下步骤:
步骤1,群体划分:按照用户IP地址划分群体;
步骤2,用户访问数据处理:根据用户对资源的历史访问数据构建用户在不同时刻的兴趣-评分关联表,挖掘用户需求随时间的变化情况,具体包括:
1)对资源类别进行编号标码,构建资源类别标签词典,并根据资源属性取值将资源归属到不同类别中,进而构建资源-类别表;
2)分别构建两个q行M列的矩阵,分别存放q个用户对M个资源的访问时间和评分,即用户-资源访问时间表和用户-资源评分表;扫描输入的样本数据集,提取用户对资源的访问时间以填充用户-资源访问时间表,提取用户对资源评分以填充用户-资源评分表;
3)对于每一个用户,分别从资源-类别表、用户-资源访问时间表、用户-资源评分表中筛选出与该用户相关的记录,构建该用户在不同时刻的兴趣-评分关联表;其中,每个用户的兴趣-评分关联表中的记录按照访问时间升序排序;
步骤3,建立基于LSTM的个体项目评分预测模型:基于长短期记忆神经网络(LongShort-Term Memory,LSTM)模型,根据用户在不同时刻的兴趣-评分关联表建立相应的个体项目评分预测模型,获取用户对项目的初始评分矩阵,进而形成群体用户对项目的初始评分矩阵,步骤如下:
1)逐行提取兴趣-评分关联表中的记录,将用户随时间发生变化的部分作为LSTM模型的输入,将用户评分作为模型的输出,去训练每个用户基于LSTM的网络模型;
2)LSTM网络包括遗忘门ft、输入门it、更新门Ct和输出门ot四种门结构,用以保持和更新细胞状态,其中t表示当前时刻,f、i、C、o表示四种不同的门结构对应向量;
①遗忘门层用以决定从细胞状态中丢弃的信息,它读取上一层的输出ht-1和当前时刻的输入xt,输出一个数值ft,并赋值给当前细胞的状态Ct-1;其中ft计算方式为:
ft=σ(Wf·[ht-1,xt]+bf)
其中h表示隐藏的状态结构,xt表示当前时刻LSTM的输入向量,C表示细胞状态向量,ft表示遗忘门的激活向量,Wf、uf和bf分别表示的是遗忘门的输入权重、循环权重和偏置;
②输入门层用以筛选新旧信息并存放于细胞状态,它包含两个部分:第一部分,通过sigmod函数决定需要输入的值;另一部分,通过tanh函数创建一个新的候选值向量,该向量会被加入到状态Ct中;新的候选值向量计算为:
it=σ(Wi·[ht-1,xt]+bi)
Figure FDA0003110500180000021
其中Wi和bi、WC和bC分别表示的是输入门的输入权重和偏置以及更新门的输入权重和偏置;
③更新门层更新旧细胞状态,将Ct-1更新为Ct,更新方式为:
Figure FDA0003110500180000031
其中,细胞状态用以存放模型中的关键信息,为LSTM网络模型能够得以存储用户的个性化信息的关键;
④输出门层基于细胞的状态输出数值:首先运行一个sigmoid层来确定细胞状态将输出的部分ot;接着把细胞状态通过tanh进行处理并把它和sigmoid门的输出相乘;最后输出确定要输出的部分ht,即下一时间步的评分预测:
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中Wo和bo分别表示的是输出门的输入权重和偏置;
由于四种门结构的存在,LSTM能够智能“记忆”用户长短期访问兴趣,以预测各用户在下一时刻对各个项目的评分;
神经网络模型采用按时间展开的反向误差传播算法(BPTT)进行训练,依照预定义的损失函数迭代修正网络中的权重参数,以最小化t时刻用户对某一项目的预测评分与实际评分的误差;
3)根据训练好的LSTM网络模型,获取用户对项目的初始评分矩阵;
Figure FDA0003110500180000032
步骤4,建立基于社会影响力的群体用户模型:通过社交网络上的用户数据,获取用户对其他用户意见敏感程度以及群体成员之间相互关系,从而构建基于社会影响力的群体用户模型,步骤如下:
1)用户对其他用户意见的敏感程度主要是由于用户自身的个性因素和专业性因素等所造成,通过收集用户在网络上的资源访问情况与交互信息,分析用户专业性程度以及个性特点,如在与他人意见出现分歧时属于独断型、协作型或者妥协型行为等;
①个性因素表示方法如下:
Personality
=[Personality1 Personality2 Personality3 ... Personalityq]T
其中,Personalityu取值在[0,1],用户个性越强,该用户个性值越高,反之则越低,Personalityu为0时代表该用户合作性很高,独断性很低;Personalityu为1时代表该用户独断性很高,而合作性很低;
②专业程度表示方法如下:
Expert(G)
=[Expert1(G) Expert2(G) Expert3(G) ... Expertq(G)]T
其中,
Figure FDA0003110500180000041
expertj表示群体用户j的绝对专业性等级程度,Expertj(G)代表群体用户j在群体G中的专业性程度,群体G中所有用户的相对专业性等级之和为1;
③通过对用户个性因素和在群组中的相对专业性因素设定不同的权重因子,对用户这两种属性进行有效选择和控制,进而确定在其对用户的敏感性程度因素的不同影响,群组G中用户u的敏感性程度表示方法如下:
Figure FDA0003110500180000051
其中,α和β分别代表了用户u的个性因素Personalityu和在群组G中的相对专业程度因素Expertu(G)在计算用户u的敏感性程度Susceptibilityu时所占的权重;
④群体成员的敏感性程度表示为:
Susceptibility
=[Susceptibility1 Susceptibility2 Susceptibility3 ... Susceptibilityq]
2)通过收集用户在社交网络上的信息以及与他人的交互情况,分析用户之间的相互关系;其中,度量指标包括用户认识时间长短、用户间联系频率、用户密切程度、相互信任程度、用户间拥有的共同朋友数量等;
用户i和用户j之间相互关系,即亲密程度Intimacy(i,j)表示方式如下:
Figure FDA0003110500180000052
其中,Li表示用户在k个相互关系量化指标上的评分值,Max(Li)表示用户对评分量化指标的最高评分值,i=1,2,…,k;
群体成员之间的相互关系可以表示如下:
Figure FDA0003110500180000053
3)群组G中q个用户的社会影响力SInfluence表示如下:
SInfluence=(I-diag(Susceptibility)Intimacy)-1(I-diag(Susceptibility));
步骤5,群体需求预测:利用群体用户对项目的初始评分矩阵,通过基于社会影响力的群体用户模型,对不同群体的需求进行预测,考虑社会影响力后的群体成员对项目的预测评分可以表示为:
PredictedR=SInfluence·R。
2.根据权利要求1所述的一种基于长短期兴趣与社会影响力的群体需求预测方法,其特征在于,所述的步骤1中根据用户访问资源时的IP地址将其划分到具体的群体中,可以根据具体需求将群体划分省域级群体、市级群体和机构群体三个级别。
3.根据权利要求1所述的一种基于长短期兴趣与社会影响力的群体需求预测方法,其特征在于,考察用户历史访问记录,在对项目进行分类与属性分析的基础上,判断用户长短期兴趣偏好,形成用户对项目的初始评分矩阵。
4.根据权利要求1所述的一种基于长短期兴趣与社会影响力的群体需求预测方法,其特征在于,考察用户个性特征、专业程度、与群体中其他成员相互关系,分析用户的社会影响力,结合基于用户长短期兴趣所形成的当前的用户对项目的初始评分矩阵,对群体需求进行预测。
CN202110647693.3A 2021-06-10 2021-06-10 一种基于长短期兴趣与社会影响力的群体需求预测方法 Active CN113961818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110647693.3A CN113961818B (zh) 2021-06-10 2021-06-10 一种基于长短期兴趣与社会影响力的群体需求预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110647693.3A CN113961818B (zh) 2021-06-10 2021-06-10 一种基于长短期兴趣与社会影响力的群体需求预测方法

Publications (2)

Publication Number Publication Date
CN113961818A true CN113961818A (zh) 2022-01-21
CN113961818B CN113961818B (zh) 2024-03-12

Family

ID=79460371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110647693.3A Active CN113961818B (zh) 2021-06-10 2021-06-10 一种基于长短期兴趣与社会影响力的群体需求预测方法

Country Status (1)

Country Link
CN (1) CN113961818B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115242462A (zh) * 2022-06-30 2022-10-25 北京华顺信安科技有限公司 一种数据泄露检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256093A (zh) * 2018-01-29 2018-07-06 华南理工大学 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法
CN108334638A (zh) * 2018-03-20 2018-07-27 桂林电子科技大学 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法
EP3564889A1 (en) * 2018-05-04 2019-11-06 The Boston Consulting Group, Inc. Systems and methods for learning and predicting events
AU2020101885A4 (en) * 2020-08-19 2020-09-24 Xinjiang University A Novel Tensor Factorization Using Trust and Rating for Recommendation, system and method thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256093A (zh) * 2018-01-29 2018-07-06 华南理工大学 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法
CN108334638A (zh) * 2018-03-20 2018-07-27 桂林电子科技大学 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法
EP3564889A1 (en) * 2018-05-04 2019-11-06 The Boston Consulting Group, Inc. Systems and methods for learning and predicting events
AU2020101885A4 (en) * 2020-08-19 2020-09-24 Xinjiang University A Novel Tensor Factorization Using Trust and Rating for Recommendation, system and method thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
康嘉钰;苏凡军;: "基于生成对抗网络的长短兴趣推荐模型", 计算机技术与发展, no. 06, 10 June 2020 (2020-06-10) *
沈冬东;汪海涛;姜瑛;陈星;: "基于知识图谱嵌入与多神经网络的序列推荐算法", 计算机工程与科学, no. 09, 15 September 2020 (2020-09-15) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115242462A (zh) * 2022-06-30 2022-10-25 北京华顺信安科技有限公司 一种数据泄露检测方法

Also Published As

Publication number Publication date
CN113961818B (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
Song et al. A review of research on tourism demand forecasting: Launching the Annals of Tourism Research Curated Collection on tourism demand forecasting
CN110135630B (zh) 基于随机森林回归和多步寻优的短期负荷需求预测方法
Zhang et al. A feature selection and multi-model fusion-based approach of predicting air quality
CN107067283B (zh) 基于历史商家记录及用户行为的电商消费客流量预测方法
CN111160992A (zh) 一种基于用户画像体系的营销系统
CN108334638B (zh) 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法
CN107424070A (zh) 一种基于机器学习的贷款用户信用评级方法及系统
CN104462216B (zh) 居委标准代码转换系统及方法
CN106408343A (zh) 一种基于bp神经网络的用户行为分析与预测的建模方法及其装置
CN110610447A (zh) 一种智慧养老系统及预测护理方案方法
CN109523021A (zh) 一种基于长短时记忆网络的动态网络结构预测方法
CN109783738A (zh) 一种基于多相似度的双极限学习机混合协同过滤推荐方法
CN108876132B (zh) 基于云的工业企业能效服务推荐方法和系统
CN112149352B (zh) 一种结合gbdt自动特征工程对营销活动点击的预测方法
CN109034500A (zh) 一种多时序协同的中期电力负荷预测方法
CN109948913A (zh) 一种基于双层的xgboost算法的多源特征电力用户综合画像系统
CN114444561A (zh) 基于CNNs-GRU融合深度学习模型的PM2.5预测方法
CN112150094A (zh) 模型训练方法、基于模型的评估方法及装置
Gong et al. A new approach of stock price prediction based on logistic regression model
CN115099450A (zh) 基于融合模型的家庭碳排放监测核算平台
CN113961818B (zh) 一种基于长短期兴趣与社会影响力的群体需求预测方法
CN110633401A (zh) 一种门店数据的预测模型及其建立方法
CN110793896B (zh) 一种尾气中粉尘浓度短期预测方法
CN112288187A (zh) 一种基于大数据的售电量预测方法
CN116662860A (zh) 一种基于能源大数据的用户画像与分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant