CN110795640B - 一种弥补群组成员差异的自适应组推荐方法 - Google Patents
一种弥补群组成员差异的自适应组推荐方法 Download PDFInfo
- Publication number
- CN110795640B CN110795640B CN201910966164.2A CN201910966164A CN110795640B CN 110795640 B CN110795640 B CN 110795640B CN 201910966164 A CN201910966164 A CN 201910966164A CN 110795640 B CN110795640 B CN 110795640B
- Authority
- CN
- China
- Prior art keywords
- group
- members
- activity
- representing
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000000694 effects Effects 0.000 claims abstract description 94
- 230000008451 emotion Effects 0.000 claims description 52
- 239000011159 matrix material Substances 0.000 claims description 43
- 238000005070 sampling Methods 0.000 claims description 14
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 238000005755 formation reaction Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 34
- 230000008569 process Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012552 review Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种弥补群组成员差异的自适应组推荐方法,首先计算群组成员属性‑活动差异度,然后判断计算出的群组成员属性‑活动差异度是否小于预设参考因子;当群组成员属性‑活动差异度小于预设参考因子时,通过构建共识函数决策模型,并基于共识函数决策模型进行组推荐;当群组成员属性‑活动差异度大于或等于预设参考因子时,基于LVM模型和群组成员的偏好度进行组推荐。本发明的方法可以提高群组成员对推荐结果的接受度,改善推荐效果。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种弥补群组成员差异的自适应组推荐方法。
背景技术
绝大多数推荐系统都是为个人推荐而设计的。通过挖掘个人的兴趣爱好可以向个人推荐电影,音乐,书刊等。然而,在某些情况下,针对一个群体也可以使用推荐技术。例如,一群朋友计划去看电影或去餐馆,为其群体提供可供参考的电影推荐列表或者参考推荐信息。
传统的群体推荐方法可以分为三类,第一类组推荐方法是通过组合为每个组成员生成推荐列表,例如把每个人的电影推荐列表组合起来合成一个群的推荐列表最后依据这个群推荐列表推荐;第二类,组推荐方法通过聚合组成员来获得推荐选项,例如,把每个成员的推荐列表聚类分析得到相似的推荐列表,最后依照这个相似的推荐列表生成群的推荐列表;第三类尝试挖掘群组成员的深层信息构建一个群体共识函数,这类组推荐方法相比与第一类,第二类推荐方法来说,采用了群员间的决策模型,深挖了成员的隐含信息。目前比较流行,但是该方法不适合群组成员分歧较大的情况。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
传统的组推荐方法注重群组的相似性寻求群组成员的共识函数。然而,由于群体具有多样性,而用户之间的差异是显而易见的。在群组成员差异性大于相似性的情况下(差异性极大的情况下)丢弃成员间的差异性,而竭力寻求群组的相似性,导致推荐效果不佳,会大大降低群组成员对推荐结果的满意度。
由此可知,现有技术中的方法存在推荐效果不佳的技术问题。
发明内容
有鉴于此,本发明提供了一种弥补群组成员差异的自适应组推荐方法,用以解决或者至少部分解决现有技术中的方法存在的推荐效果不佳的技术问题。
为了解决上述技术问题,本发明提供了一种弥补群组成员差异的自适应组推荐方法,包括:
步骤S1:计算群组成员属性-活动差异度,其中,群组成员属性-活动差异度用以表征群组中成员之间的差异性;
步骤S2:判断计算出的群组成员属性-活动差异度是否小于预设参考因子;
步骤S3:如果小于,则构建共识函数决策模型,并基于共识函数决策模型进行组推荐;
步骤S4:否则,基于LVM模型和群组成员的偏好度进行组推荐。
在一种实施方式中,步骤S1具体包括:
步骤S1.1:计算群组成员属性-活动的偏差度;
步骤S1.2:计算群组成员属性-活动的相似度;
步骤S1.3:根据群组成员属性-活动的偏差度和群组成员属性-活动的相似度,计算群组成员属性-活动差异度。
在一种实施方式中,步骤S3具体包括:
步骤S3.1:计算群体中各个成员的决策权重;
步骤S3.2:利用预设个人推荐系统进行评分预测,将评分多的成员分成一组,并将评分多的成员的评分作为源评分矩阵,评分少的成员分为另一组,并将评分少的成员的评分作为目标矩阵,利用目标矩阵预测源矩阵评分,预测得到每个成员的评分列表;
步骤S3.3:根据群体中各个成员的决策权重以及预测出的评分列表构建共识函数决策模型;
步骤S3.4:根据共识函数决策模型的值生成符合预设条件的推荐列表。
在一种实施方式中,步骤S3.1具体包括:
步骤S3.1.1:确定信任区间函数:
其中,式(1)为成员mi在考虑属性cj情况下对方案ek的信任区间函数,代表信任区间,/>不信任区间;
步骤S3.1.2:根据信任区间函数计算成员间的共识度:
其中,mi、mj表示群组中的成员,表示两个成员mi、mj之间的共识度;
步骤S3.1.3:根据成员间的共识度计算群体中各个成员的决策权重:
其中,Wmi表示成员mi的决策权重,表示所有其他成员对成员i的共识评分,表示所有成员对其他成员的共识评分总和。
在一种实施方式中,步骤S3.3中构建的共识函数决策模型为:
其中,Rij为评分列表中的评分,n为成员的数量。
在一种实施方式中,步骤S4具体包括:
步骤S4.1:获取群组成员的偏好度;
步骤S4.2:构建LVM模型,其中,LVM模型包括<概念;主题;情感>三元组及其分布;
步骤S4.3:根据<概念;主题;情感>三元组及其分布获取活动的概率分布,选择具有最高概率的ci评级r作为群成员ei的属性,
步骤S4.4:根据群组成员的偏好度和群成员ei的属性的相似度进行组推荐,并根据<概念;主题;情感>三元组对推荐结果进行解释。
在一种实施方式中,步骤S4.1具体包括:
通过构建群组成员偏好矩阵获取群组成员的偏好度,其中,群组成员偏好矩阵中的元素表示相应的群组成员对属性的关心程度。
在一种实施方式中,步骤S4.2具体包括:
通过训练词向量,并提取评论主题和评论情感构建LVM模型。
在一种实施方式中,步骤S4.3具体包括:
步骤S4.3.1:利用Gibbs EM采样去条件得到随机变量的后验分布;
步骤S4.3.2:根据得到的随机变量的后验分布,获取每个候选评分r排序:
其中,表示给定成员m的观点评分的条件概率,πe,v表示每个活动e的观点分布,公式(5)用以在给定群成员m和活动e时,为预测mi和e之间的未知评分,计算评分rm,e=r的概率;
步骤S4.3.3:通过对每个候选评分r的排序,选择具有最高概率的ci评级r作为群成员的属性。
在一种实施方式中,步骤S4.4具体包括通过公式(6)进行组推荐:
其中,xij表示群组成员的偏好度,eic表示具有最高概率的群成员ei的属性;
并根据<概念;主题;情感>三元组对推荐结果进行解释。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明提供的一种弥补群组成员差异的自适应组推荐方法,首先,计算群组成员属性-活动差异度,然后判断计算出的群组成员属性-活动差异度是否小于预设参考因子;如果小于,则通过构建共识函数决策模型进行组推荐;否则,基于LVM模型和群组成员的偏好度进行组推荐。
由于本发明提供的组推荐方法,通过群组成员属性-活动的相似度计算,形成基于不同群组特性的自适应推荐列表,对于成员属性-活动相似度高的群组采用群体共识函数决策模型生成群组推荐列表,对于成员属性-活动相似度差异大的群组采用LDA+个人语言情感特征(即LVM模型和偏好度)的可解释性方法来提高群组成员对推荐结果的接受度,从而可以改善推荐效果。
进一步地,通过计算群体中各个成员的决策权重,结合评分预测来构建共识函数决策模型,即采取用成员决策权重和共识函数两大指标生成群组推荐,从而可以进一步改善推荐效果,使得推荐结果的满意度较高。
进一步地,本发明使用一种新的隐变量模型(Latent Variable Model,LVM),该模型可以通过训练词向量,评论主题,评论情感,构建<概念;主题;情感>及其分布,然后再预测各个活动的属性,再根据各个活动的多样性和群组成员偏好相似度计算,进行生成TOPN推荐列表,并根据<概念;主题;情感>三元组对推荐结果进行解释,从而大大弥补成员推荐的满意度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种弥补群组成员差异的自适应组推荐方法的流程示意图;
图2为具体实施方式中本发明提供的方法的整体框架图;
图3为本发明实施例中建立的群组社会结构图;
图4为本发明一种实施方式中群组差异度GMD小于参考因子DEF时推荐方法的具体实现流程图;
图5为本发明一种实施方式中群组差异度GMD大于或等于参考因子DEF时推荐方法的具体实现流程图。
具体实施方式
本发明的目的在于针对现有技术没有根据群组成员属性相似度的不同而采取不同的推荐方法所导致的推荐满意度不佳的问题(即现有技术中在群组成员差异性远大于相似性的情况下,丢弃成员间的差异性,而竭力寻求群组的相似性,从而导致推荐结果差强人意),提出一种弥补群组成员差异的自适应组推荐方法。该方法首先把群组分为相似性群组和差异性群组。针对于相似性群组本专利采用群体共识函数决策模型生成群组推荐列表,针对于差异性的群组采用LVM+个人语言情感特征的可解释性方法来提高群组成员对推荐结果的接受度。改善推荐效果的目的。
为达到上述目的,本发明的主要构思如下:
本发明通过群组成员属性-活动的相似度计算,形成基于不同群组特性的自适应推荐列表,对于成员属性-活动相似度高的群组采用群体共识函数决策模型生成群组推荐列表,对于成员属性-活动相似度差异大的群组采用LDA+个人语言情感特征的可解释性方法进行组推荐,从而提高群组成员对推荐结果的接受度。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供了一种弥补群组成员差异的自适应组推荐方法,请参见图1,该方法包括:
步骤S1:计算群组成员属性-活动差异度,其中,群组成员属性-活动差异度用以表征群组中成员之间的差异性;
步骤S2:判断计算出的群组成员属性-活动差异度是否小于预设参考因子;
步骤S3:如果小于,则构建共识函数决策模型,并基于共识函数决策模型进行组推荐;
步骤S4:否则,基于LVM模型和群组成员的偏好度进行组推荐。
具体来说,本发明提供的是一种自适应组推荐方法,在群组成员属性属性-活动差异度小于预设参考因子:即成员属性-活动相似度高时,采用共识函数决策模型进行组推荐的方式,在群组成员属性-活动差异度大于或等于预设参考因子:即成员属性-活动相似度低时,采用LVM模型和群组成员的偏好度的方式进行组推荐,从而实现了自适应推荐,有利于改善推荐效果,提高成员对推荐结果的满意度。
以下是本发明提供的一种弥补群组成员差异的可解释性组推荐方法中概念的定义与解释:
①:基于群组成员属性-活动差异度GMD
其中,dis(Gui,Guj)表示用户的差异性,sim(Ui,Uj)表示用户的相似性
②:基于群组成员决策权重因子:Wmi
其中表示群组成员的共识度,如图3所示。
③基于LDA+个人语言情感特征的可解释性方法
给定概念h、主题z和情感标签l,对于评论的观点定义为包含h、z、l的有限混合三元组v,v=<h,z,l>,情感标签可以作为可解释性推荐的凭据。
定义评论的主题为z,作为字符的概率分布,在关注的群成员评论中存在K个主题,故z∈{1,2,...,K}。定义评论的概念作为围绕主题的特性的严格标识符,表示为h,每一个群成员评论都包含概念hd∈ε。评论的情感定义为概率分布在积极和消极的情绪标签,情绪标签lj取决于评论的每个字符ωj,同时也依赖于主题zj,具体而言:
在执行步骤S1之前,本发明还进行了数据采集,
(1)源数据采集
多数在线购物网站(如天猫、京东、亚马逊等)和在线评论系统(如大众点评、豆瓣等)允许用户在给出数值化打分的同时也给出文本评论以描述自己的观点和看法。文本评论包含了用户在对应商品上丰富的情感、观点和偏好信息,而这为可解释的推荐提供了数据源,组推荐系统的源数据包括:群组成员行为历史信息、浏览记录、用户-项目评分矩阵、项目类型关系矩阵等。其中,与用户相关的源数据经过整理后存储在用户描述文档(userprofile)中,组推荐系统为每个用户维护一个用户描述文档,同时也为每个群组维护一个群组描述文档(group profile)。
(2)评分归一化
我们知道不同的在线评论系统的评分量纲和量纲单位不一致,而且不用的人评分也不同有的评分过高,有的评分过低。所以为了消除这些影响在计算差异度之前要进行数据的归一化处理,让各指标处于同一数量级,适合进行综合对比评价。Z-score标准化方法,数据处理后符合标准正态分布,即均值为0,标准差为1,其转化函数为:
其中u为所有样本数据的均值,σ为所有样本数据的标准方差。
请参见图2,为本发明提供的组推荐方法的整体框架图,其主要包含两个分支,左分支为成员属性-活动相似时组推荐方法的实现过程,右分支为成员属性-活动差异时组推荐方法的实现过程,其中,群员属性提取,即提取出具有最高概率的ci评级r作为群成员ei的属性。
在一种实施方式中,步骤S1具体包括:
步骤S1.1:计算群组成员属性-活动的偏差度;
步骤S1.2:计算群组成员属性-活动的相似度;
步骤S1.3:根据群组成员属性-活动的偏差度和群组成员属性-活动的相似度,计算群组成员属性-活动差异度。
在具体的实施过程中,主要包含如下几个部分:
(1)群组成员属性-活动偏差度dis(Gui,Guj)表示用户(或成员)Ui和用户Uj的差异度,群组差异度可以采用多种现有的计算方法,本实施方式中给出一种常见的方法,利用分歧方差方法(disagreement variance)计算群组分歧度:
其中,prerating(Gui,Guj)表示在群组G中用户i和用户j的评分,mean(Gui,Guj),表示在群组G中用户i和用户j评分的平均值。
(2)群组成员属性-活动的相似度,可以采用不同的方式,本实施方式中成员Ui和成员Uj的相似度用余弦相似度表示:
其中,rui表示用户i的评分矩阵,ruj表示用户j的评分矩阵
(3)群组成员属性-活动差异度(Group Membership Difference)系数GMD的公式为:
在一种实施方式中,步骤S3具体包括:
步骤S3.1:计算群体中各个成员的决策权重;
步骤S3.2:利用预设个人推荐系统进行评分预测,将评分多的成员分成一组,并将评分多的成员的评分作为源评分矩阵,评分少的成员分为另一组,并将评分少的成员的评分作为目标矩阵,利用目标矩阵预测源矩阵评分,预测得到每个成员的评分列表;
步骤S3.3:根据群体中各个成员的决策权重以及预测出的评分列表构建共识函数决策模型;
步骤S3.4:根据共识函数决策模型的值生成符合预设条件的推荐列表。
在一种实施方式中,步骤S3.1具体包括:
步骤S3.1.1:确定信任区间函数:
其中,式(1)为成员mi在考虑属性cj情况下对方案ek的信任区间函数,代表信任区间,/>不信任区间;
步骤S3.1.2:根据信任区间函数计算成员间的共识度:
其中,mi、mj表示群组中的成员,表示两个成员mi、mj之间的共识度;
步骤S3.1.3:根据成员间的共识度计算群体中各个成员的决策权重:
其中,Wmi表示成员mi的决策权重,表示所有其他成员对成员i的共识评分,表示所有成员对其他成员的共识评分总和。
具体来说,对于差异度小于DEF的群组,在群体成员做抉择时相互的信任较为高,做出的最后抉择也能最终反映群体的满意度。
举例来说,假设群组G={m1,m2,…,mn}包含有m1到mn小组成员,某次活动中有E={e1,e2,…,en}种方案给小组成员选择,需要把合适的方案推荐给这个群组。E表示e1到en种备选方案,每种方案需要考虑的属性为C={c1,c2,…,ck}。其原理如图4所示,群体平均信任度即为成员决策权重。其中成员决策权重计算(分三步S3.1.1~S3.1.3)。
信任函数的作用是确定两个成员之间的共识度。两个成员之间的在决策方案时的信任度越高,之间的共识程度自然就高。[t-,t+],[d-,d+]其中代表信任区间,/>不信任区间。/> 表信任区间为0.6~0.8,当然越接近1信任越高,/>代表不信任度,越接近0代表越信任。/>表示两个成员的共识度,ACommi表示成员i在群组中的平均信任度(一个表示相互信任,一个表示成员在群组中的平均信任)。其中,成员mi对群体的平均共识度为:
由步骤S3.1.2可以计算出每个成员间的共识程度,其构成的共识度矩阵为T
其中
不同的群组有不同的社会结构,参见图3。因为彼此的共识度不一致导致成员间的决策权重不一样。而研究群体决策策略的一个关键目的是了解一组个体是如何达成共识的,根据签名计算出的成员间的共识程度,则可以计算出各个成员的决策权重,如公式(3)所示。公式3中,mi代表成员i的决策权重,代表所有其他对成员i的共识评分。首先,评分需要反映成员对该项目的偏好程度。小组成员越喜欢某个项目,该项目在小组中的得分就应该越高。其次,评分需要反映出成员之间意见不一致或意见一致的程度。
在具体实现过程中,步骤S3.2在利用目标矩阵预测源矩阵评分,预测得到每个成员的评分列表的具体实现过程如下:
Xs,Xt分别为源域和目标域评分矩阵,则Xt和Xs非负矩阵分解为:
和/>分别表示源域和目标用户的特征矩阵;/>分别表示源域和目标域的项目特征矩阵;/>分别表示Xs,Xt的特征矩阵。
(1)如果和/>概率分布相等且Vs (0),Vt (0)的条件概率分布相等,则源域共享信息/>和目标域共享信息/>一致,
(2)如果和/>概率分布相等且Vs (0),Vt (0)的条件概率分布不相等,则需要利用GFK映射技术。找到Ψs,Ψt,Φs,Φt映射函数来分别调整/>使调整后的 Vs (1),Vt (1)满足用户(项目)各自的联合概率分布相等。
对于不同的成员需要考虑他们的评分习惯的差异,有的成员积极可能大多数项目他会评分,有的成员可能会很少评分,这就需要一个评分预测系统把未评分的项补全。因为考虑到群员属性-活动的差异度小,群组成员偏好具有单一性,则可以很容易挖掘群组成员的共享偏好。具体做法是:将评分多的成员分成一组为源评分矩阵,而评分少的成员分为另一组为目标矩阵。接下来就是用目标矩阵预测源矩阵评分。
第一步:抽取目标矩阵共享偏好S
其中Xt为评分少的成员目标矩阵Xt={m1,m2,…,mk},Xs评分多的成员源矩阵Xs={m1,m2,…,ml},k<n,l<n,k+l=n.E为对应的活动项目矩阵。
若并且/>那么/> 就是一致信息;其中,/>表示/>和/>相等的条件概率
若并且/>即不相等则通过第二步找出映射函数,
第二步:找到映射函数使
其中,为/>的z-score标准化。同样,/>分别为 的z-score标准化。Ψs,Ψt,Φs,Φt是GFK映射函数。
第三步:评分预测
用梯度下降法的优化算法,使用非负性的KKT互补条件。
类似的可以得到C,V的更新规则:
评分预测矩阵为:R=M1S1V1,(M、E和S为原评分,对应于前述理论中用户的特征矩阵、项目特征矩阵;以及非负分解的特征矩阵)M1、S1、V1表示更新后的评分。
通过更新规则的计算,则可以计算出最后的评分预测R。
在一种实施方式中,步骤S3.3中构建的共识函数决策模型为:
其中,Rij为评分列表中的评分,n为成员的数量。
具体来说,得到所有成员的预测评分后,本发明采取用成员决策权重和预测评分两大指标生成群组推荐。因为本发明中,选取的群组成员相似性大,所以共识函数采用平均满意度来决策,即公式(4)。最后则可以按照average(Ei)的大小生成TopN的推荐列表,TopN表示符合预设条件的前N个结果。
在一种实施方式中,步骤S4具体包括:
步骤S4.1:获取群组成员的偏好度;
步骤S4.2:构建LVM模型,其中,LVM模型包括<概念;主题;情感>三元组及其分布;
步骤S4.3:根据<概念;主题;情感>三元组及其分布获取活动的概率分布,选择具有最高概率的ci评级r作为群成员ei的属性,
步骤S4.4:根据群组成员的偏好度和群成员ei的属性的相似度进行组推荐,并根据<概念;主题;情感>三元组对推荐结果进行解释。
具体来说,当群组差异较大时,此时的群组的偏好具有多样性。为了满足成员差异度较大的偏好,所以需要考虑各个活动E={e1,e2,…,en}多样性C={c1,c2,…,ck}。对于差异度较大的群组,一个活动ei若能绝大程度满足各个成员不同的偏好,同时结合推荐的可解释性,可以大大弥补成员推荐的满意度。为了挖掘群组成员的偏好的多样性和让推荐具有可解释性。本发明采用一种新的隐变量模型(Latent Variable Model,LVM),该模型可以通过训练词向量,评论主题,评论情感,构建<概念;主题;情感>及其分布,然后再预测各个活动ei的属性。其原理如图5所示,
在一种实施方式中,步骤S4.1具体包括:
通过构建群组成员偏好矩阵获取群组成员的偏好度,其中,群组成员偏好矩阵中的元素表示相应的群组成员对属性的关心程度。
具体来说,不同的群组成员他们在历史评论中对不同活动属性提及的频率也各不相同,一般而言,群组成员对自己所关心的偏好往往提及频率更高。群组成员偏好关注度矩阵X,表示相应的群组成员对属性的关心程度。
在具体实施过程中,令C={c1,c2,…,ck}为属性词集合,G={m1,m2,…,mn}为群员集合,考察给定成员mi的所有历史评论,并从中抽取所有命中的属性词及考虑否定词后用户在指定属性词上表达的最终情感(C,s')。设属性词Cj被用户mi提及tij次,本发明定义群组成员偏好关注度矩阵的每一个元素值如下:
在一种实施方式中,步骤S4.2具体包括:
通过训练词向量,并提取评论主题和评论情感构建LVM模型。
具体来说,LVM模型的构建包括如下几个部分:
①训练词向量
在推荐平台中使用描述性关键字作为活动的概念,Hi特征存在于活动e的评论中。为了从群成员评论d∈Di中提取出其对应的概念,本发明使用word2Vec来计算给定概念h∈Hi和群成员评论d之间的相似度。然后使用训练好的word2Vec模型来预测群成员评论中给定的概念e和评论中每个字符的相似度。相似度计算公式如下:
其中Nd表示评论中的字符数。给定候选概念εi,与d最相似的概念将被视为相关概念。通过根据候选概念和群成员评论之间的相似性对文档进行排序,找到每个群成员评论的相关概念。
②提取评论主题与评论情感
群组成员对每个活动ei所具有的C={c1,c2,…,ck}属性打分,而群成员对一个活动的打分都与该群成员对活动的评论相关联。定义评分观测值集合为Q={(m,e)},m为群组成员为e活动。为群成员评论集合为d1,每一条评论d∈Di为一组字符的集合,即d={ω1,ω2,...,ωd}。
定义评论的主题为z,作为字符的概率分布,在关注的群成员评论中存在K个主题,故z∈{1,2,...,K}。定义评论的概念作为围绕主题的特性的严格标识符,表示为h,每一个群成员评论都包含概念hd∈ε。评论的情感定义为概率分布在积极和校级的情绪标签,情绪标签lj取决于评论的每个字符ωj,同时也依赖于主题zj,具体而言:
给定概念h、主题z和情感标签l,对于评论的观点定义为包含h、z、l的有限混合三元组v,v=<h,z,l>,情感标签可以作为可解释性推荐的凭据。
③LVM模型的构建<概念;主题;情感>
基于群组成员评论的文本挖掘,在每个群成员评论d中存在多个观点,对于不同事件的评论,选取一个合适的观点为主管点vd,表示为概念h-主题z-情感标签l的组合;每个活动e能够表示为观点上的混合,因此本发明将πe设置为活动e中的观点的概率分布,μ是主题在视点上的概率分布,λ是概念在观点上的概率分布;这样,将φ设置为观点-主题-情感标签上的概率分布,该分布超参数β上的Dirichlet分布得出。
与现有技术中预测给定群成员和活动的小数评分得分的方法不同,本发明在指数组中应用概率评级分布,以提供更多信息以反映群成员的评级习惯。对于每个群成员u,在推荐系统中的评分不仅可以反映群员的活动状态,还可以通过他们的观点分布来预测,即θm={θv1 m,θv2 m,...,θvV m}。给定观点v∈V,是指每个评分值的概率分布,评分值r∈[1,R],因此θm也可以表示为一个R×V的矩阵:
其中表示给定的群成员m和观点v时评分值为r的概率。
在一种实施方式中,步骤S4.3具体包括:
步骤S4.3.1:利用Gibbs EM采样去条件得到随机变量的后验分布;
步骤S4.3.2:根据得到的随机变量的后验分布,获取每个候选评分r排序:
其中,表示给定成员m的观点评分的条件概率,πe,v表示每个活动e的观点分布,公式(5)用以在给定群成员m和活动e时,为预测mi和e之间的未知评分,计算评分rm,e=r的概率;
步骤S4.3.3:通过对每个候选评分r的排序,选择具有最高概率的ci评级r作为群成员ei的属性。
具体来说,由于随机变量之间存在着未知关系,本发明使用Gibbs EM采样去条件近似得到随机变量的后验分布。具体的实现过程中,采样方法分为两部分:E步和M步。给定活动e和群成员m,对于每个群成员评论d,在E步骤采样的目标是近似得到后验分布p(V,Z,L|W,ε,R,F)。采样程序分为三个部分:
·第一步,给定群成员m和活动e,在E步骤期间,采样观点f(m,e)的条件概率,给定当前的观点状态,即P(f(m,e)=y|f(m,e),W,V,R);
·第二步,给定推断主题和情感标签的值,在每个d∈D中对观点v的条件概率进行采样,即P(vd=v|V-d,ε,W,Z,R);
·第三步,给定当前的观点状态,对于字符wj,用情感来对主题zj的条件概率进行抽样,情感标签lj转换标签xj,即p(zj=k,lj=l,xj=x|v,X-j,L-j,Z-j,W,R,F)。
具体描述如下:给定用户m和活动e,首先在不带(m,e)对的f-(m,e)采样得到fm,e。因此对于用户m对活动e的观点,得到p(f(m,e)=y|f(m,e),W,V,R)如下:
其中Rm表示用户m为活动e评分的次数,表示将变量f定活动e、但不包括用户m分配给y的次数;此外,/>表示活动e中的视点v被分配给y的次数;/>表示用户在f=y下的r(m,e)下,对于所有活动的评分,但不包括当前活动。计算/>的公式如下:
其中Tm,m'表示用户m和m'之间的信任值;Fm表示群组中的信任关系。
对于用户m为活动e撰写的评论d,推断所有其他随机变量都得出观点vd=v的条件概率,即
其中表示将观点v分配给用户评论的次数,但不包括d;/>表示在评论中将概念h分配给观点v的次数,同样不包括d;表示主题z被分配给观点v的次数,不包括d;此外,表示除d之外,有多少个词语分配给主题z、观点v和情感l。给定检测到的观点vd=v,对于每个词语wj∈Nd,通过词语wj的情感标签lj来采样得到主题zj的条件概率,即p(zj=k,lj=l,xj=x|v,X-j,L-j,Z-j,W,R,F)。给定在文档级别采样的观点v,使用下式中的概率直接对单词wj的主题zj和情感标签lj进行采样。
其中表示主题k被分配给视点v的次数,不包括评论d中的第j个单词;/>表示已将多少个主题分配给v,但不包括wj;/>表示将词语wj同步分配给主题z和情感l的次数,不包括当前的主题;/>表示wj分配给x的次数,不包括当前词语。
在M步骤期间,给定在E步骤期间导出的条件概率,最大化每个群成员m的观点分布θm,每个视点分布π以及视点,概念,主题和情感在字符上的联合概率,即φ。
在Gibbs EM采样之后,对于每个群成员m∈G,用一个矩阵θm来描述给定m的观点评分的条件概率,即对于每个活动e,观点分布为πi,即p(v|e)=πv,e。因此,给定群成员m和活动e,为了预测mi和e之间的未知评分,计算评分rm,e=r的概率,公式如(5).
通过对每个候选评分r排序p(rm,e=r|m,e),可以选择具有最高概率的ci评级r作为群成员ei的属性,记为eic。
在一种实施方式中,步骤S4.4具体包括通过公式(6)进行组推荐:
其中,xij表示群组成员的偏好度,eic表示具有最高概率的群成员ei的属性;
并根据<概念;主题;情感>三元组对推荐结果进行解释。
具体来说,根据照ei的多样性和群组成员偏好相似度的大小计则可以生成TopN推荐。
总体来说,本发明可自适应弥补群组成员差异,并基于此产生可解释性组推荐。通过自适应方法,对不同特性的群组采用不同的组推荐模型,使其推荐满意度达到最大。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (4)
1.一种弥补群组成员差异的自适应组推荐方法,其特征在于,包括:
步骤S1:计算群组成员属性-活动差异度,其中,群组成员属性-活动差异度用以表征群组中成员之间的差异性;
步骤S2:判断计算出的群组成员属性-活动差异度是否小于预设参考因子;
步骤S3:如果小于,则构建共识函数决策模型,并基于共识函数决策模型进行组推荐;
步骤S4:否则,基于LVM模型和群组成员的偏好度进行组推荐;
其中,步骤S1具体包括:
步骤S1.1:计算群组成员属性-活动的偏差度;
步骤S1.2:计算群组成员属性-活动的相似度;
步骤S1.3:根据群组成员属性-活动的偏差度和群组成员属性-活动的相似度,计算群组成员属性-活动差异度,
其中,群组成员属性-活动的偏差度dis(Gui,Guj)表示用户Ui和用户Uj的差异度,计算方式为:
其中,prerating(Gui,Guj)表示在群组G中用户i和用户j的评分,mean(Gui,Guj),表示在群组G中用户i和用户j评分的平均值,群组成员属性-活动的相似度采用余弦相似度表示为:
其中,rui表示用户i的评分矩阵,ruj表示用户j的评分矩阵;
群组成员属性-活动差异度GMD的公式为:
步骤S4具体包括:
步骤S4.1:获取群组成员的偏好度;
步骤S4.2:构建LVM模型,其中,LVM模型包括<概念;主题;情感>三元组及其分布;
步骤S4.3:根据<概念;主题;情感>三元组及其分布获取活动的概率分布,选择具有最高概率的ci候选评分r作为群成员的属性,
步骤S4.4:根据群组成员的偏好度和群成员的属性的相似度进行组推荐,并根据<概念;主题;情感>三元组对推荐结果进行解释;
步骤S4.1具体包括:
通过构建群组成员偏好矩阵获取群组成员的偏好度,其中,群组成员偏好矩阵中的元素表示相应的群组成员对属性的关心程度;
步骤S4.2具体包括:
通过训练词向量,并提取评论主题和评论情感构建LVM模型;
步骤S4.3具体包括:
步骤S4.3.1:利用Gibbs EM采样去条件得到随机变量的后验分布;
步骤S4.3.2:根据得到的随机变量的后验分布,获取每个候选评分r排序:
其中,表示给定成员m和观点v时评分值为r的概率,πe,v表示每个活动e的观点分布,公式(5)用以在给定群成员m和活动e时,为预测m和e之间的未知评分,计算评分rm,e=r的概率;
步骤S4.3.3:通过对每个候选评分r的排序,选择具有最高概率的ci候选评分r作为群成员的属性;
步骤S4.4具体包括通过公式(6)进行组推荐:
其中,xij表示群组成员的偏好度,eic表示具有最高概率的群成员的属性;
并根据<概念;主题;情感>三元组对推荐结果进行解释。
2.如权利要求1所述的方法,其特征在于,步骤S3具体包括:
步骤S3.1:计算群体中各个成员的决策权重;
步骤S3.2:利用预设个人推荐系统进行评分预测,将评分多的成员分成一组,并将评分多的成员的评分作为源评分矩阵,评分少的成员分为另一组,并将评分少的成员的评分作为目标矩阵,利用目标矩阵预测源矩阵评分,预测得到每个成员的评分列表;
步骤S3.3:根据群体中各个成员的决策权重以及预测出的评分列表构建共识函数决策模型;
步骤S3.4:根据共识函数决策模型的值生成符合预设条件的推荐列表。
3.如权利要求2所述的方法,其特征在于,步骤S3.1具体包括:
步骤S3.1.1:确定信任区间函数:
其中,式(1)为成员mi在考虑属性cj情况下对方案ek的信任区间函数,代表信任区间,/>不信任区间;
步骤S3.1.2:根据信任区间函数计算成员间的共识度:
其中,mi、mj表示群组中的成员,表示两个成员mi、mj之间的共识度;
步骤S3.1.3:根据成员间的共识度计算群体中各个成员的决策权重:
其中,Wmi表示成员mi的决策权重,表示所有其他成员对成员i的共识评分,表示所有成员对其他成员的共识评分总和。
4.如权利要求3所述的方法,其特征在于,步骤S3.3中构建的共识函数决策模型为:
其中,Rij为评分列表中的评分,n为成员的数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910966164.2A CN110795640B (zh) | 2019-10-12 | 2019-10-12 | 一种弥补群组成员差异的自适应组推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910966164.2A CN110795640B (zh) | 2019-10-12 | 2019-10-12 | 一种弥补群组成员差异的自适应组推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110795640A CN110795640A (zh) | 2020-02-14 |
CN110795640B true CN110795640B (zh) | 2023-08-18 |
Family
ID=69438965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910966164.2A Active CN110795640B (zh) | 2019-10-12 | 2019-10-12 | 一种弥补群组成员差异的自适应组推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110795640B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113239289B (zh) * | 2021-05-28 | 2022-08-30 | 山东大学 | 一种群组活动推荐方法、系统、电子设备及可读存储介质 |
CN116796076B (zh) * | 2023-08-29 | 2023-11-03 | 中亿(深圳)信息科技有限公司 | 业务推荐方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104361102A (zh) * | 2014-11-24 | 2015-02-18 | 清华大学 | 一种基于群组匹配的专家推荐方法及系统 |
KR101785219B1 (ko) * | 2016-08-17 | 2017-10-18 | 한국과학기술원 | 사물 인터넷 환경에서의 그룹 사용자를 위한 그룹 구성 정보 기반 서비스 추천 방법 |
CN108920503A (zh) * | 2018-05-28 | 2018-11-30 | 哈尔滨工程大学 | 一种基于社交网络信任度的微视频个性化推荐算法 |
CN110209954A (zh) * | 2019-06-03 | 2019-09-06 | 南京邮电大学 | 基于lda主题模型和深度学习的群组推荐方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110270774A1 (en) * | 2010-04-30 | 2011-11-03 | Microsoft Corporation | Group Recommendations in Social Networks |
US9311308B2 (en) * | 2010-10-29 | 2016-04-12 | Hewlett-Packard Development Company, L.P. | Content recommendation for groups |
-
2019
- 2019-10-12 CN CN201910966164.2A patent/CN110795640B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104361102A (zh) * | 2014-11-24 | 2015-02-18 | 清华大学 | 一种基于群组匹配的专家推荐方法及系统 |
KR101785219B1 (ko) * | 2016-08-17 | 2017-10-18 | 한국과학기술원 | 사물 인터넷 환경에서의 그룹 사용자를 위한 그룹 구성 정보 기반 서비스 추천 방법 |
CN108920503A (zh) * | 2018-05-28 | 2018-11-30 | 哈尔滨工程大学 | 一种基于社交网络信任度的微视频个性化推荐算法 |
CN110209954A (zh) * | 2019-06-03 | 2019-09-06 | 南京邮电大学 | 基于lda主题模型和深度学习的群组推荐方法 |
Non-Patent Citations (1)
Title |
---|
基于用户签到行为的群组兴趣点推荐模型;陶永才;小型微型计算机系统;第39卷(第10期);第2260-2265页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110795640A (zh) | 2020-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gurini et al. | Temporal people-to-people recommendation on social networks with sentiment-based matrix factorization | |
Bach et al. | Personalized recommendation of stories for commenting in forum-based social media | |
Castro et al. | A consensus‐driven group recommender system | |
Jannach et al. | Tutorial: recommender systems | |
Agarwal et al. | Does order matter? Effect of order in group recommendation | |
KR20050043917A (ko) | 통계적 개인화된 추천 시스템 | |
Eliyas et al. | Recommendation systems: Content-based filtering vs collaborative filtering | |
Wu et al. | Context-aware recommendation via graph-based contextual modeling and postfiltering | |
Mazharov et al. | Some problems of dynamic contactless charging of electric vehicles | |
CN113744032B (zh) | 一种图书推荐的方法、相关装置、设备及存储介质 | |
Zou et al. | Exploring user engagement strategies and their impacts with social media mining: the case of public libraries | |
Diaby et al. | Exploration of methodologies to improve job recommender systems on social networks | |
Zheng et al. | Algorithm for recommending answer providers in community-based question answering | |
Yigit et al. | Extended topology based recommendation system for unidirectional social networks | |
Neve et al. | Hybrid reciprocal recommender systems: Integrating item-to-user principles in reciprocal recommendation | |
CN110795640B (zh) | 一种弥补群组成员差异的自适应组推荐方法 | |
Zhou et al. | Incorporating social network and user’s preference in matrix factorization for recommendation | |
CN110781405B (zh) | 基于联合卷积矩阵分解的文档上下文感知推荐方法及系统 | |
Amane et al. | ERSDO: E-learning recommender system based on dynamic ontology | |
Ortega et al. | Recommendation to groups of users using the singularities concept | |
Hong et al. | Latent space regularization for recommender systems | |
CN114065016A (zh) | 一种推荐方法、装置、设备及计算机可读存储介质 | |
Deng et al. | A Trust-aware Neural Collaborative Filtering for Elearning Recommendation. | |
de Campos et al. | Group recommending: A methodological approach based on bayesian networks | |
Nguyen et al. | Collaborative multi-key learning with an anonymization dataset for a recommender system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |