CN113961818B - 一种基于长短期兴趣与社会影响力的群体需求预测方法 - Google Patents
一种基于长短期兴趣与社会影响力的群体需求预测方法 Download PDFInfo
- Publication number
- CN113961818B CN113961818B CN202110647693.3A CN202110647693A CN113961818B CN 113961818 B CN113961818 B CN 113961818B CN 202110647693 A CN202110647693 A CN 202110647693A CN 113961818 B CN113961818 B CN 113961818B
- Authority
- CN
- China
- Prior art keywords
- user
- group
- users
- resource
- personality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000035945 sensitivity Effects 0.000 claims abstract description 21
- 230000007774 longterm Effects 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims abstract description 7
- 230000006399 behavior Effects 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 9
- 230000003993 interaction Effects 0.000 claims description 6
- 238000013139 quantization Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 230000001010 compromised effect Effects 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000006403 short-term memory Effects 0.000 claims description 3
- 230000005012 migration Effects 0.000 abstract description 4
- 238000013508 migration Methods 0.000 abstract description 4
- 238000011160 research Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于长短期兴趣与社会影响力的群体需求预测方法,该方法首先基于用户访问资源时的IP地址划分群体;其次,结合用户的历史访问记录,为每一个用户建立兴趣‑评分关联表,并训练个体LSTM网络模型,在综合考虑用户历史行为与兴趣迁移的情况下对指定项目进行评分预测,进而构建群体用户‑项目评分表;接着,在对用户个性以及专业程度进行分析的基础上,考察用户对群组中其他用户意见的敏感程度,并通过挖掘群组中用户间的亲密程度分析用户间相互关系,从而形成基于社会影响力的群体用户模型;最后,根据模型对群体需求进行预测。该方法将用户长短期兴趣与用户间的社会影响力运用到需求预测方法中,最大程度满足群体成员的需求。
Description
技术领域
本发明属于群体推荐技术领域,具体涉及一种基于长短期兴趣与社会影响力的群体需求预测方法。
背景技术
公共数字文化服务还存在不少瓶颈问题,诸如:资源采集交换缺少统一的标准规范,数字资源“孤岛化”现象普遍存在,社会主体参与资源建设单一,缺少个性化服务等,项目致力于从技术层面对上述问题予以研究突破。本发明即基于长短期兴趣与社会影响力的群体需求预测方法,围绕公共数字文化惠民服务中智能化对提升我国公共数字文化服务水平,在梳理分析国内外相关机构和技术领域研究现状的基础上,拟解决处于云端的公共文化资源在调度和分发时的效率问题和公平问题,为实现我国公共文化资源智能共建共享与管理提供理论基础和技术支撑。
与传统的群体需求预测技术不同,公共文化云资源中的群体需求预测的最终目的是将云端资源按照用户需求预先调度到靠近群体用户的位置,解决云资源使用的效率问题,因此,需要直接按照用户访问时的ip地址进行群体划分,根据区域用户的历史访问记录和实时访问情况预测群体需求。而且,在现有的大多数群体需求预测方法中,主要考虑用户偏好问题,而较少考虑到影响群体决策的一些其他因素,例如个体用户兴趣迁移问题和群体成员间社会影响力。在建立一种实时性、高效率的群体需求预测机制时,将用户兴趣迁移与成员间社会影响力纳入考量也是很有必要的。
发明内容
为了克服上述现有技术的不足,本发明的目的是提供一种基于长短期兴趣与社会影响力的群体需求预测方法,将用户的兴趣迁移与社会影响力嵌入到群体需求预测中,提供一种基于长短期兴趣和社会影响力的群体需求预测方法,用于实现根据用户历史访问行为分析用户长短期兴趣偏好、对他人意见敏感程度以及与其他用户相互关系等信息,进而对群体需求进行实时预测,以提高公共文化云平台资源访问的效率。
为了实现上述目的,本发明采用的技术方案是:
一种基于长短期兴趣与社会影响力的群体需求预测方法,包括以下步骤:
步骤1,群体划分:按照用户IP地址划分群体;
步骤2,用户访问数据处理:根据用户对资源的历史访问数据构建用户在不同时刻的兴趣-评分关联表,挖掘用户需求随时间的变化情况,具体包括:
1)对资源类别进行编号标码,构建资源类别标签词典,并根据资源属性取值将资源归属到不同类别中,进而构建资源-类别表;
2)分别构建两个q行M列的矩阵,分别存放q个用户对M个资源的访问时间和评分,即用户-资源访问时间表和用户-资源评分表;扫描输入的样本数据集,提取用户对资源的访问时间以填充用户-资源访问时间表,提取用户对资源评分以填充用户-资源评分表;
3)对于每一个用户,分别从资源-类别表、用户-资源访问时间表、用户-资源评分表中筛选出与该用户相关的记录,构建该用户在不同时刻的兴趣-评分关联表;其中,每个用户的兴趣-评分关联表中的记录按照访问时间升序排序;
步骤3,建立基于LSTM的个体项目评分预测模型:基于长短期记忆神经网络(LongShort-Term Memory,LSTM)模型,根据用户在不同时刻的兴趣-评分关联表建立相应的个体项目评分预测模型,获取用户对项目的初始评分矩阵,进而形成群体用户对项目的初始评分矩阵,步骤如下:
1)逐行提取兴趣-评分关联表中的记录,将用户随时间发生变化的部分作为LSTM模型的输入,将用户评分作为模型的输出,去训练每个用户基于LSTM的网络模型;
2)LSTM网络包括遗忘门ft、输入门it、更新门ct和输出门ot四种门结构,用以保持和更新细胞状态,其中t表示当前时刻,f、i、C、o表示四种不同的门结构对应向量;
①遗忘门层用以决定从细胞状态中丢弃的信息,它读取上一层的输出ht-1和当前时刻的输入xt,输出一个数值ft,并赋值给当前细胞的状态Ct-1;其中ft计算方式为:
ft=σ(Wf·[ht-1,xt]+bf)
其中h表示隐藏的状态结构,xt表示当前时刻LSTM的输入向量,C表示细胞状态向量,ft表示遗忘门的激活向量,Wf、Uf和bf分别表示的是遗忘门的输入权重、循环权重和偏置;
②输入门层用以筛选新旧信息并存放于细胞状态,它包含两个部分:第一部分,通过sigmod函数决定需要输入的值;另一部分,通过tanh函数创建一个新的候选值向量,该向量会被加入到状态Ct中;新的候选值向量计算为:
it=σ(Wi·[ht-1,xt]+bi)
其中Wi和bi、WC和bC分别表示的是输入门的输入权重和偏置以及更新门的输入权重和偏置;
③更新门层更新旧细胞状态,将Ct-1更新为Ct,更新方式为:
其中,细胞状态用以存放模型中的关键信息,为LSTM网络模型能够得以存储用户的个性化信息的关键;
④输出门层基于细胞的状态输出数值:首先运行一个sigmoid层来确定细胞状态将输出的部分ot;接着把细胞状态通过tanh进行处理并把它和sigmoid门的输出相乘;最后输出确定要输出的部分ht,即下一时间步的评分预测:
ot=o(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中Wo和bo分别表示的是输出门的输入权重和偏置;
由于四种门结构的存在,LSTM能够智能“记忆”用户长短期访问兴趣,以预测各用户在下一时刻对各个项目的评分;
神经网络模型采用按时间展开的反向误差传播算法(BPTT)进行训练,依照预定义的损失函数迭代修正网络中的权重参数,以最小化t时刻用户对某一项目的预测评分与实际评分的误差;
3)根据训练好的LSTM网络模型,获取用户对项目的初始评分矩阵;
步骤4,建立基于社会影响力的群体用户模型:通过社交网络上的用户数据,获取用户对其他用户意见敏感程度以及群体成员之间相互关系,从而构建基于社会影响力的群体用户模型,步骤如下:
1)用户对其他用户意见的敏感程度主要是由于用户自身的个性因素和专业性因素等所造成,通过收集用户在网络上的资源访问情况与交互信息,分析用户专业性程度以及个性特点,如在与他人意见出现分歧时属于独断型、协作型或者妥协型行为等;
①个性因素表示方法如下:
Personality
=[Personality1 Personality2 Personality3... Personalityq]T
其中,Personalityu取值在[0,1],用户个性越强,该用户个性值越高,反之则越低,Personalityu为0时代表该用户合作性很高,独断性很低;Personalityu为1时代表该用户独断性很高,而合作性很低;
②专业程度表示方法如下:
Expert(G)
=[Expert1(G) Expert2(G) Expert3(G) ... Expertq(G)]T
其中,expertj表示群体用户j的绝对专业性等级程度,Expertj(G)代表群体用户j在群体G中的专业性程度,群体G中所有用户的相对专业性等级之和为1;
③通过对用户个性因素和在群组中的相对专业性因素设定不同的权重因子,对用户这两种属性进行有效选择和控制,进而确定在其对用户的敏感性程度因素的不同影响,群组G中用户u的敏感性程度表示方法如下:
其中,α和β分别代表了用户u的个性因素Personalityu和在群组G中的相对专业程度因素Expertu(G)在计算用户u的敏感性程度Susceptibilityu时所占的权重;
④群体成员的敏感性程度表示为:
Susceptibility
=[Susceptibility1 Susceptibility2 Susceptibility3 ...Susceptibilityq]
2)通过收集用户在社交网络上的信息以及与他人的交互情况,分析用户之间的相互关系;其中,度量指标包括用户认识时间长短、用户间联系频率、用户密切程度、相互信任程度、用户间拥有的共同朋友数量等;
用户i和用户j之间相互关系,即亲密程度Intimacy(i,j)表示方式如下:
其中,Li表示用户在k个相互关系量化指标上的评分值,Max(Li)表示用户对评分量化指标的最高评分值,i=1,2,…,k;
群体成员之间的相互关系可以表示如下:
3)群组G中q个用户的社会影响力SInfluence表示如下:
SInfluence=(I-diag(Susceptibility)Intimacy)-1(I-diag(Susceptibility));
步骤5,群体需求预测:利用群体用户对项目的初始评分矩阵,通过基于社会影响力的群体用户模型,对不同群体的需求进行预测,考虑社会影响力后的群体成员对项目的预测评分可以表示为:
PredictedR=SInfluence·R。
进一步,所述的步骤1中根据用户访问资源时的IP地址将其划分到具体的群体中,可以根据具体需求将群体划分省域级群体、市级群体和机构群体三个级别。
进一步,考察用户历史访问记录,在对项目进行分类与属性分析的基础上,判断用户长短期兴趣偏好,形成用户对项目的初始评分矩阵。
进一步,考察用户个性特征、专业程度、与群体中其他成员相互关系,分析用户的社会影响力,结合基于用户长短期兴趣所形成的当前的用户对项目的初始评分矩阵,对群体需求进行预测。
本发明的有益效果是:
1.本发明在实现群体需求预测过程中构建的基于用户个体需求预测模型对数据稀疏性、用户兴趣刻画不细致等问题提出了解决方案。通过从资源-类别表、用户-资源访问时间表、用户-资源评分表提取用户在不同时刻的兴趣-评分关联表,降低了数据稀疏性;通过构建LSTM个体需求预测模型,加入对用户长短期兴趣的考量,提高个体用户需求预测准确率;
2.本发明构建的基于长短期兴趣与用户影响力的群体需求预测模型在考虑群体用户个体偏好的同时,考虑了群体成员之间的社会影响因素,包括由于个体用户的专业性与本身个性等造成的在群体间表现出来的敏感度和由于用户间密切程度、联系频率、用户间共同好友数等所形成的用户间的相互关系,使得群体需求预测研究更贴合实际情况,并提高个体用户满意度与群体预测效果。
附图说明
图1为本发明的流程示意图;
图2为基于LSTM的个体项目评分预测模型;
图3为基于社会影响力的群体用户模型。
具体实施方式
以下结合实施例及附图对本发明进一步叙述。
如图1所示,一种基于长短期兴趣与社会影响力的群体需求预测方法,包括以下步骤:
步骤1,群体划分:按照用户IP地址划分群体;
步骤2,用户访问数据处理:根据用户对资源的历史访问数据构建用户在不同时刻的兴趣-评分关联表,挖掘用户需求随时间的变化情况,具体包括:
1)对资源类别进行编号标码,构建资源类别标签词典,并根据资源属性取值将资源归属到不同类别中,进而构建资源-类别表;
2)分别构建两个q行M列的矩阵,分别存放q个用户对M个资源的访问时间和评分,即用户-资源访问时间表和用户-资源评分表;扫描输入的样本数据集,提取用户对资源的访问时间以填充用户-资源访问时间表,提取用户对资源评分以填充用户-资源评分表;
3)对于每一个用户,分别从资源-类别表、用户-资源访问时间表、用户-资源评分表中筛选出与该用户相关的记录,构建该用户在不同时刻的兴趣-评分关联表;其中,每个用户的兴趣-评分关联表中的记录按照访问时间升序排序;
步骤3,建立基于LSTM的个体项目评分预测模型:基于长短期记忆神经网络(LongShort-Term Memory,LSTM)模型,根据用户在不同时刻的兴趣-评分关联表建立相应的个体项目评分预测模型,获取用户对项目的初始评分矩阵,进而形成群体用户对项目的初始评分矩阵,步骤如下:
1)逐行提取兴趣-评分关联表中的记录,将用户随时间发生变化的部分作为LSTM模型的输入,将用户评分作为模型的输出,去训练每个用户基于LSTM的网络模型;
2)如图2所示,LSTM网络包括遗忘门ft、输入门it、更新门Ct和输出门ot四种门结构,用以保持和更新细胞状态,其中t表示当前时刻,f、i、C、o表示四种不同的门结构对应向量;
①遗忘门层用以决定从细胞状态中丢弃的信息,它读取上一层的输出ht-1和当前时刻的输入xt,输出一个数值ft,并赋值给当前细胞的状态Ct-1;其中ft计算方式为:
ft=σ(Wf·[ht-1,xt]+bf)
其中h表示隐藏的状态结构,xt表示当前时刻LSTM的输入向量,C表示细胞状态向量,ft表示遗忘门的激活向量,Wf、Uf和bf分别表示的是遗忘门的输入权重、循环权重和偏置;
②输入门层用以筛选新旧信息并存放于细胞状态,它包含两个部分:第一部分,通过sigmod函数决定需要输入的值;另一部分,通过tanh函数创建一个新的候选值向量,该向量会被加入到状态Ct中;新的候选值向量计算为:
it=σ(Wi·[ht-1,xt]+bi)
其中Wi和bi、WC和bC分别表示的是输入门的输入权重和偏置以及更新门的输入权重和偏置;
③更新门层更新旧细胞状态,将Ct-1更新为Ct,更新方式为:
其中,细胞状态用以存放模型中的关键信息,为LSTM网络模型能够得以存储用户的个性化信息的关键;
④输出门层基于细胞的状态输出数值:首先运行一个sigmoid层来确定细胞状态将输出的部分ot;接着把细胞状态通过tanh进行处理并把它和sigmoid门的输出相乘;最后输出确定要输出的部分ht,即下一时间步的评分预测:
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中Wo和bo分别表示的是输出门的输入权重和偏置;
由于四种门结构的存在,LSTM能够智能“记忆”用户长短期访问兴趣,以预测各用户在下一时刻对各个项目的评分;
神经网络模型采用按时间展开的反向误差传播算法(BPTT)进行训练,依照预定义的损失函数迭代修正网络中的权重参数,以最小化t时刻用户对某一项目的预测评分与实际评分的误差;
3)根据训练好的LSTM网络模型,获取用户对项目的初始评分矩阵;
步骤4,建立基于社会影响力的群体用户模型:如图3所示,通过社交网络上的用户数据,获取用户对其他用户意见敏感程度以及群体成员之间相互关系,从而构建基于社会影响力的群体用户模型,步骤如下:
1)用户对其他用户意见的敏感程度主要是由于用户自身的个性因素和专业性因素等所造成,通过收集用户在网络上的资源访问情况与交互信息,分析用户专业性程度以及个性特点,如在与他人意见出现分歧时属于独断型、协作型或者妥协型行为等;
①个性因素表示方法如下:
Personality
=[Personality1 Personality2 Personality3 ... Personalityq]T
其中,Personalityu取值在[0,1],用户个性越强,该用户个性值越高,反之则越低,Personalityu为0时代表该用户合作性很高,独断性很低;Personalityu为1时代表该用户独断性很高,而合作性很低;
②专业程度表示方法如下:
ExpeIt(G)
=[Expert1(G) Expert2(G) Expert3(G) ... Expertq(G)]T
其中,expertj表示群体用户j的绝对专业性等级程度,Expertj(G)代表群体用户j在群体G中的专业性程度,群体G中所有用户的相对专业性等级之和为1;
③通过对用户个性因素和在群组中的相对专业性因素设定不同的权重因子,对用户这两种属性进行有效选择和控制,进而确定在其对用户的敏感性程度因素的不同影响,群组G中用户u的敏感性程度表示方法如下:
其中,α和β分别代表了用户u的个性因素Personalityu和在群组G中的相对专业程度因素Expertu(G)在计算用户u的敏感性程度Susceptibilityu时所占的权重;
④群体成员的敏感性程度表示为:
Susceptibility
=[Susceptibility1 Susceptibility2 Susceptibility3 ...Susceptibilityq]
2)通过收集用户在社交网络上的信息以及与他人的交互情况,分析用户之间的相互关系;其中,度量指标包括用户认识时间长短、用户间联系频率、用户密切程度、相互信任程度、用户间拥有的共同朋友数量等;
用户i和用户j之间相互关系,即亲密程度Intimacy(i,j)表示方式如下:
其中,Li表示用户在k个相互关系量化指标上的评分值,Maxx(Li)表示用户对评分量化指标的最高评分值,i=1,2,…,k;
群体成员之间的相互关系可以表示如下:
3)群组G中q个用户的社会影响力SInfluence表示如下:
SInfluence=(I-diag(Susceptibility)Intimacy)-1(I-diag(Susceptibility));
步骤5,群体需求预测:利用群体用户对项目的初始评分矩阵,通过基于社会影响力的群体用户模型,对不同群体的需求进行预测,考虑社会影响力后的群体成员对项目的预测评分可以表示为:
PredictedR=SInfluence·R。
进一步,所述的步骤1中根据用户访问资源时的IP地址将其划分到具体的群体中,可以根据具体需求将群体划分省域级群体、市级群体和机构群体三个级别。
进一步,考察用户历史访问记录,在对项目进行分类与属性分析的基础上,判断用户长短期兴趣偏好,形成用户对项目的初始评分矩阵。
进一步,考察用户个性特征、专业程度、与群体中其他成员相互关系,分析用户的社会影响力,结合基于用户长短期兴趣所形成的当前的用户对项目的初始评分矩阵,对群体需求进行预测。
Claims (4)
1.一种基于长短期兴趣与社会影响力的群体需求预测方法,其特征在于,包括以下步骤:
步骤1,群体划分:按照用户IP地址划分群体;
步骤2,用户访问数据处理:根据用户对资源的历史访问数据构建用户在不同时刻的兴趣-评分关联表,挖掘用户需求随时间的变化情况,具体包括:
1)对资源类别进行编号标码,构建资源类别标签词典,并根据资源属性取值将资源归属到不同类别中,进而构建资源-类别表;
2)分别构建两个q行M列的矩阵,分别存放q个用户对M个资源的访问时间和评分,即用户-资源访问时间表和用户-资源评分表;扫描输入的样本数据集,提取用户对资源的访问时间以填充用户-资源访问时间表,提取用户对资源评分以填充用户-资源评分表;
3)对于每一个用户,分别从资源-类别表、用户-资源访问时间表、用户-资源评分表中筛选出与该用户相关的记录,构建该用户在不同时刻的兴趣-评分关联表;其中,每个用户的兴趣-评分关联表中的记录按照访问时间升序排序;
步骤3,建立基于LSTM的个体项目评分预测模型:基于长短期记忆神经网络(LongShort-Term Memory,LSTM)模型,根据用户在不同时刻的兴趣-评分关联表建立相应的个体项目评分预测模型,获取用户对项目的初始评分矩阵,进而形成群体用户对项目的初始评分矩阵,步骤如下:
1)逐行提取兴趣-评分关联表中的记录,将用户随时间发生变化的部分作为LSTM模型的输入,将用户评分作为模型的输出,去训练每个用户基于LSTM的网络模型;
2)LSTM网络包括遗忘门ft、输入门it、更新门Ct和输出门ot四种门结构,用以保持和更新细胞状态,其中t表示当前时刻,f、i、C、o表示四种不同的门结构对应向量;
①遗忘门层用以决定从细胞状态中丢弃的信息,它读取上一层的输出ht-1和当前时刻的输入xt,输出一个数值ft,并赋值给当前细胞的状态Ct-1;其中ft计算方式为:
ft=σ(Wf·[ht-1,xt]+bf)
其中h表示隐藏的状态结构,xt表示当前时刻LSTM的输入向量,C表示细胞状态向量,ft表示遗忘门的激活向量,Wf、uf和bf分别表示的是遗忘门的输入权重、循环权重和偏置;
②输入门层用以筛选新旧信息并存放于细胞状态,它包含两个部分:第一部分,通过sigmod函数决定需要输入的值;另一部分,通过tanh函数创建一个新的候选值向量,该向量会被加入到状态Ct中;新的候选值向量计算为:
it=σ(Wi·[ht-1,xt]+bi)
其中Wi和bi、WC和bC分别表示的是输入门的输入权重和偏置以及更新门的输入权重和偏置;
③更新门层更新旧细胞状态,将Ct-1更新为Ct,更新方式为:
其中,细胞状态用以存放模型中的关键信息,为LSTM网络模型能够得以存储用户的个性化信息的关键;
④输出门层基于细胞的状态输出数值:首先运行一个sigmoid层来确定细胞状态将输出的部分ot;接着把细胞状态通过tanh进行处理并把它和sigmoid门的输出相乘;最后输出确定要输出的部分ht,即下一时间步的评分预测:
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中Wo和bo分别表示的是输出门的输入权重和偏置;
由于四种门结构的存在,LSTM能够智能“记忆”用户长短期访问兴趣,以预测各用户在下一时刻对各个项目的评分;
神经网络模型采用按时间展开的反向误差传播算法(BPTT)进行训练,依照预定义的损失函数迭代修正网络中的权重参数,以最小化t时刻用户对某一项目的预测评分与实际评分的误差;
3)根据训练好的LSTM网络模型,获取用户对项目的初始评分矩阵;
步骤4,建立基于社会影响力的群体用户模型:通过社交网络上的用户数据,获取用户对其他用户意见敏感程度以及群体成员之间相互关系,从而构建基于社会影响力的群体用户模型,步骤如下:
1)用户对其他用户意见的敏感程度主要是由于用户自身的个性因素和专业性因素等所造成,通过收集用户在网络上的资源访问情况与交互信息,分析用户专业性程度以及个性特点,如在与他人意见出现分歧时属于独断型、协作型或者妥协型行为等;
①个性因素表示方法如下:
Personality
=[Personality1 Personality2 Personality3 ... Personalityq]T
其中,Personalityu取值在[0,1],用户个性越强,该用户个性值越高,反之则越低,Personalityu为0时代表该用户合作性很高,独断性很低;Personalityu为1时代表该用户独断性很高,而合作性很低;
②专业程度表示方法如下:
Expert(G)
=[Expert1(G) Expert2(G) Expert3(G) ... Expertq(G)]T
其中,expertj表示群体用户j的绝对专业性等级程度,Expertj(G)代表群体用户j在群体G中的专业性程度,群体G中所有用户的相对专业性等级之和为1;
③通过对用户个性因素和在群组中的相对专业性因素设定不同的权重因子,对用户这两种属性进行有效选择和控制,进而确定在其对用户的敏感性程度因素的不同影响,群组G中用户u的敏感性程度表示方法如下:
其中,α和β分别代表了用户u的个性因素Personalityu和在群组G中的相对专业程度因素Expertu(G)在计算用户u的敏感性程度Susceptibilityu时所占的权重;
④群体成员的敏感性程度表示为:
Susceptibility
=[Susceptibility1 Susceptibility2 Susceptibility3 ... Susceptibilityq]
2)通过收集用户在社交网络上的信息以及与他人的交互情况,分析用户之间的相互关系;其中,度量指标包括用户认识时间长短、用户间联系频率、用户密切程度、相互信任程度、用户间拥有的共同朋友数量等;
用户i和用户j之间相互关系,即亲密程度Intimacy(i,j)表示方式如下:
其中,Li表示用户在k个相互关系量化指标上的评分值,Max(Li)表示用户对评分量化指标的最高评分值,i=1,2,…,k;
群体成员之间的相互关系可以表示如下:
3)群组G中q个用户的社会影响力SInfluence表示如下:
SInfluence=(I-diag(Susceptibility)Intimacy)-1(I-diag(Susceptibility));
步骤5,群体需求预测:利用群体用户对项目的初始评分矩阵,通过基于社会影响力的群体用户模型,对不同群体的需求进行预测,考虑社会影响力后的群体成员对项目的预测评分可以表示为:
PredictedR=SInfluence·R。
2.根据权利要求1所述的一种基于长短期兴趣与社会影响力的群体需求预测方法,其特征在于,所述的步骤1中根据用户访问资源时的IP地址将其划分到具体的群体中,可以根据具体需求将群体划分省域级群体、市级群体和机构群体三个级别。
3.根据权利要求1所述的一种基于长短期兴趣与社会影响力的群体需求预测方法,其特征在于,考察用户历史访问记录,在对项目进行分类与属性分析的基础上,判断用户长短期兴趣偏好,形成用户对项目的初始评分矩阵。
4.根据权利要求1所述的一种基于长短期兴趣与社会影响力的群体需求预测方法,其特征在于,考察用户个性特征、专业程度、与群体中其他成员相互关系,分析用户的社会影响力,结合基于用户长短期兴趣所形成的当前的用户对项目的初始评分矩阵,对群体需求进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110647693.3A CN113961818B (zh) | 2021-06-10 | 2021-06-10 | 一种基于长短期兴趣与社会影响力的群体需求预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110647693.3A CN113961818B (zh) | 2021-06-10 | 2021-06-10 | 一种基于长短期兴趣与社会影响力的群体需求预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113961818A CN113961818A (zh) | 2022-01-21 |
CN113961818B true CN113961818B (zh) | 2024-03-12 |
Family
ID=79460371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110647693.3A Active CN113961818B (zh) | 2021-06-10 | 2021-06-10 | 一种基于长短期兴趣与社会影响力的群体需求预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113961818B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115242462B (zh) * | 2022-06-30 | 2024-08-27 | 北京华顺信安科技有限公司 | 一种数据泄露检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256093A (zh) * | 2018-01-29 | 2018-07-06 | 华南理工大学 | 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法 |
CN108334638A (zh) * | 2018-03-20 | 2018-07-27 | 桂林电子科技大学 | 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法 |
EP3564889A1 (en) * | 2018-05-04 | 2019-11-06 | The Boston Consulting Group, Inc. | Systems and methods for learning and predicting events |
AU2020101885A4 (en) * | 2020-08-19 | 2020-09-24 | Xinjiang University | A Novel Tensor Factorization Using Trust and Rating for Recommendation, system and method thereof |
-
2021
- 2021-06-10 CN CN202110647693.3A patent/CN113961818B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256093A (zh) * | 2018-01-29 | 2018-07-06 | 华南理工大学 | 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法 |
CN108334638A (zh) * | 2018-03-20 | 2018-07-27 | 桂林电子科技大学 | 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法 |
EP3564889A1 (en) * | 2018-05-04 | 2019-11-06 | The Boston Consulting Group, Inc. | Systems and methods for learning and predicting events |
AU2020101885A4 (en) * | 2020-08-19 | 2020-09-24 | Xinjiang University | A Novel Tensor Factorization Using Trust and Rating for Recommendation, system and method thereof |
Non-Patent Citations (2)
Title |
---|
基于生成对抗网络的长短兴趣推荐模型;康嘉钰;苏凡军;;计算机技术与发展;20200610(第06期);全文 * |
基于知识图谱嵌入与多神经网络的序列推荐算法;沈冬东;汪海涛;姜瑛;陈星;;计算机工程与科学;20200915(第09期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113961818A (zh) | 2022-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107067283B (zh) | 基于历史商家记录及用户行为的电商消费客流量预测方法 | |
CN108334638B (zh) | 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法 | |
CN111160992A (zh) | 一种基于用户画像体系的营销系统 | |
CN106408343A (zh) | 一种基于bp神经网络的用户行为分析与预测的建模方法及其装置 | |
CN109523021A (zh) | 一种基于长短时记忆网络的动态网络结构预测方法 | |
CN111709575A (zh) | 基于c-lstm的学业成绩预测方法 | |
CN115115389B (zh) | 一种基于价值细分和集成预测的快递客户流失预测方法 | |
CN112149352B (zh) | 一种结合gbdt自动特征工程对营销活动点击的预测方法 | |
CN114444561A (zh) | 基于CNNs-GRU融合深度学习模型的PM2.5预测方法 | |
CN113961818B (zh) | 一种基于长短期兴趣与社会影响力的群体需求预测方法 | |
CN114862506B (zh) | 一种基于深度强化学习的金融产品推荐方法 | |
CN115099450A (zh) | 基于融合模型的家庭碳排放监测核算平台 | |
CN117763228A (zh) | 一种基于多元文化框架的创意表达动态适配方法 | |
CN115525819A (zh) | 一种面向信息茧房的跨领域推荐方法 | |
CN117314266B (zh) | 一种基于超图注意力机制的新型科技人才智能评价方法 | |
Abdelaziz et al. | Convolutional neural network with genetic algorithm for predicting energy consumption in public buildings | |
CN117495482A (zh) | 一种基于用户画像的二手手机销售推荐方法及系统 | |
CN116883057A (zh) | 一种基于XGBoost的高精度电力客户营销渠道偏好预测系统 | |
CN116662860A (zh) | 一种基于能源大数据的用户画像与分类方法 | |
CN111626465B (zh) | 一种新能源功率短期区间预测方法及系统 | |
CN111353809A (zh) | 社会消费品零售总额季度累计增幅预测方法和系统 | |
CN111967937A (zh) | 一种基于时间序列分析的电商推荐系统及实现方法 | |
Severiukhina et al. | Segment-wise Users' Response Prediction based on Activity Traces in Online Social Networks | |
Jinyang | Application of data mining in logistics industry in the era of big data | |
CN114239936B (zh) | 一种基于产品粘性的信贷额度调整方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |