CN104408643B - 一种行为感知偏好获取系统及其获取方法 - Google Patents
一种行为感知偏好获取系统及其获取方法 Download PDFInfo
- Publication number
- CN104408643B CN104408643B CN201410604018.2A CN201410604018A CN104408643B CN 104408643 B CN104408643 B CN 104408643B CN 201410604018 A CN201410604018 A CN 201410604018A CN 104408643 B CN104408643 B CN 104408643B
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- preference
- user
- behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Abstract
一种行为感知偏好获取系统及其获取方法,通过建立一个融合上下文信息的行为感知偏好获取算法模型,在传统偏好获取算法的基础上,充分考虑用户历史数据所体现出的行为特性及行为规律,并将其与上下文环境信息相结合,通过用户行为感知计算子系统构建用户标准偏好空间、计算行为波动阈值、判断偏好是否可预知,并据此对用户行为进行聚类分析。然后针对不同的用户行为类,设计了羁束偏好获取算法、可控偏离偏好获取算法、不可控偏好获取算法,然后通过相应的自适应修正策略逐步精确的提取用户偏好,从而实现提高偏好获取精确度、偏好算法适用性的目的。
Description
技术领域
本发明涉及信息推送技术领域,尤其涉及一种行为感知偏好获取系统及其获取方法。
背景技术
电子商务的急剧发展与扩张将人们带入了数字化信息的海洋,电子商务功能的迅速发展也带来了传统服务模式的变革,网上购物、在线业务办理等新型服务模式为人们的生活带来了很大的便利。随着“面向服务”、“普适计算”等新技术的广泛应用,使得各类电子商务网站上的资源呈现爆炸性的增长,并且这种增长大大超过了人们能够接受和有效利用的范围,这也就是我们熟知的“信息过载”问题。在这种背景下,如何从繁多的信息化商品中为不同的用户推荐出符合其偏好的商品,已经成为制约电子商务平台发展的关键性因素。
传统的个性化推荐服务研究主要通过挖掘“用户-项目”之间的二元关系来构建用户偏好模型,而这种方法仅仅将“用户-项目”间的二元关系数据作为单一数据源,并依赖于基于内容的过滤、协同过滤等技术来实现,而用户偏好是在环境上下文、用户行为状态等多种影响因素共同作用下的结果。因此采用这种方法所构建的用户偏好模型,不能客观的反应出用户的真实偏好,在实际的应用中难以取得较好的推荐结果。
近年来,各研究机构及商业网站对于偏好获取策略的研究取得了较多成果,许多研究者开始将上下文信息融入偏好获取过程,相比于传统的推荐方法,取得了较好的推荐效果。但是这些方法主要都是将上下文信息融入偏好获取模型中,缺少对于用户行为规律性的研究分析,在推荐精确度、算法适用性等方面还有很大的不足。
发明内容
为克服上述现有技术的不足,本发明的目的在于提供一种行为感知偏好获取系统及其获取方法,依据用户历史记录及上下文信息作为数据源,通过行为感知及偏好获取算法来获取用户偏好,能够向用户提供高质量的个性化服务,提高了网络资源利用率,有效的解决了大数据时代日益严峻的“信息过载”问题。
为实现上述目的,本发明的采用的技术方案是:
一种行为感知偏好获取系统,所述偏好获取系统包括用户行为数据获取子系统、数据存储与管理子系统、用户行为感知计算子系统、用户偏好获取子系统,其中:
用户行为数据获取子系统,用以完成获取用户的历史行为数据,并据此生成融入上下文信息的用户行为数据;
数据存储与管理子系统,用以完成用户历史行为数据、上下文信息、用户行为类集、偏好算法集、用户偏好等数据信息的存储与管理;
用户行为感知计算子系统,用以完成依据用户行为数据的分类预处理,通过构建标准偏好空间、计算行为波动阈值、判断偏好是否可预知等为用户行为进行分类;
用户偏好获取子系统,用以依据用户行为感知分类结果及用户行为数据提取用户偏好信息,并根据用户反馈、具体应用环境等对获取的用户偏好进行自适应修正。
所述用户行为数据获取子系统包括:用户历史行为生成模块、上下文信息生成模块;
所述用户历史行为生成模块,用以根据用户历史行为记录生成符合偏好获取算法需求的数据源;
所述用户上下文信息生成模块,用以实现与用户历史行为对应的上下文信息的生成,包括地理上下文、情绪上下文、环境上下文。
所述用户行为感知计算子系统包括:标准偏好空间构建模块、行为波动阈值计算模块、可预知偏好判定模块、行为分类模块;其中,
所述标准偏好空间构建模块,针对当前用户群组,采用k-中心点方法对用户偏好行为进行聚类,得出的k个用户行为簇的并集即表示标准偏好空间,用以分离用户行为孤点及判断用户偏好是否可预测;
所述行为波动阈值计算模块,用以针对当前用户群组,采用量化的偏好均值来表示用户偏好的变化,即用户行为波动,并根据其量化值分布特征计算波动阈值以分离用户行为孤点;
所述可预知偏好判定模块,依据标准偏好空间分离出的行为孤点,以判断相应用户偏好行为是否具有可预测性;
所述行为分类模块,用以依据标准偏好空间及行为波动阈值将用户行为分类,输出用户与不同行为类的对应关系。
所述用户偏好获取子系统包括:偏好计算模块、偏好自适应修正模块,其中:
所述偏好计算模块,根据用户行为感知计算子系统所获取的用户行为分类数据,修正基础偏好获取算法,获取用户偏好并输出结果至数据存储与管理子系统;
所述偏好自适应修正模块,用以依据用户反馈、客观应用环境等对用户偏好进行惩罚性/增强性修正,并输出结果至数据存储与管理子系统。
一种行为感知偏好获取方法,包括以下步骤:
1)获取触发推荐算法运行指令;
2)用户行为数据获取子系统生成用户历史行为及地理上下文、情绪上下文、环境上下文信息数据,并将其存储至数据存储与管理子系统;
3)用户行为感知计算子系统由数据存储与管理子系统获取用户行为数据,标准偏好空间构建模块以其为数据源对用户聚类,并构建标准偏好空间;行为波动阈值计算模块计算针对当前用户群组的行为波动阈值;可预知偏好判断模块依据上述两模块结果计算用户偏好的可预知性;行为分类模块利用上述三模块结果对用户行为进行分类,并将结果数据保存至数据存储与管理子系统;
4)用户偏好获取子系统获取用户行为分类,偏好计算模块采用偏好算法计算融合上下文信息与行为信息的用户偏好,偏好自适应修正模块根据用户反馈与具体应用环境对用户偏好进行自适应修正,并将最终的用户偏好信息存储至数据存储与管理子系统,然后依据用户偏好信息通过网络服务为用户推荐出符合其偏好的信息资源。
所述的标准偏好空间构建模块在融合上下文信息的用户行为数据上,选取聚类中心点,依据相异度度量方法分配用户聚类归属,并通过优化特征权重及距离权重,对其进行重复聚类直至中心点稳定,由稳定中心点所构成的用户簇并集即标准偏好空间,
其中,所述相异度度量方法如下:
式中,Xi=(xi1,xi2,...,xim)与Xj=(xj1,xj2,...,xjm)分别表示第i与j个用户在m种上下文环境下的量化行为数据值,其中χ为距离权重,C为上下文环境集合,dsc表示同种上下文环境下Ck的用户行为距离,ddc表示不同上下文环境Cm,Cn下用户行为距离,特征如下:
式中,sim(Cm,Cn)表示上下文环境Cm,Cn的相似度,具体计算方法如下:
其中,Prejms与Prejns分别表示用户Uj在单维上下文环境Cm与Cn下对项目Ss的偏好值,表示用户Uj在不同上下文环境下的平均偏好值。
所述的行为波动阈值计算模块,通过计算量化的偏好均值来获取用户偏好的偏离程度,依据预设的舍弃比率最终获取行为波动阈值,
其中,所述量化的偏好均值获取方法如下:
式中,Uk表示簇k内用户集,Item表示簇内用户有行为记录的项目集,Card(Item)表示集合Item内项目数量,Prejms表示在上下文环境Cm下用户Uj对于项目Ss的历史偏好值,
所述用户偏好偏离程度,其获取方法为:
所述可预知偏好判定模块,首先获取预设基准孤点比率,再计算用户行为孤点比率,最后获取用户偏好的可预知性。其中,所述用户行为孤点比率计算方法如下:
式中,Card(Aj,acnode)表示每个用户Uj行为孤点的数量,Card(Prej)表示用户Uj历史偏好行为数目,
所述可预知性获取方法如下:
式中,Aprej表示用户j的偏好可预知性,Aprej,able表示其偏好可预知,Aprej,unable表示其偏好不可预知。
所述的行为分类模块,用户行为分为:
1)羁束行为:在可预知偏好的范围内,允许有小于行为波动阈值的行为类;
2)可控偏离羁束行为:在可预知偏好的范围内大于行为波动阈值的用户行为;
3)不可控行为:不可预知偏好行为,其偏好不属于标准偏好空间。
所述的偏好计算模块,依据行为分类模块所获取用户行为类,分别采用羁束偏好获取算法、可控偏离偏好获取算法、不可控偏好获取算法来提取用户偏好,
其中,所述羁束偏好获取方法如下:
式中,与分别表示用户Ua与用户Ub对于其他所有项目的平均评分,Preams表示在上下文环境Cm下用户Ua对于项目Ss的评分值,kNN(b)为用户Ub的前k个最近邻,获取方法为选取与用户Ub相似度最大的k个用户,sim(b,a)表示用户Ub与用户Ua的相似度,CSba表示用户Ub与用户Ua间有共同行为记录项目的数目,表示用户Ub与其他用户有共同行为记录项目的平均数目;
所述可控偏离偏好获取算法,具体为:
式中,α为防止分母为0的修正因子,Prebms为在上下文环境Cm下用户Ub对于项目Ss通过基础偏好算法所获取的预测偏好值,
所述不可控偏好获取算法,具体为:
式中δ为权重因子,其取值依具体应用环境而定。
本发明的有益效果是:本发明通过提出一种行为感知偏好获取系统及其获取方法,并设计出具体的实现方法与实现过程,其中,通过使用用户行为数据获取子系统,获取用户历史行为发生时所处的上下文环境,并将这些历史上下文融入偏好获取过程,能够提高历史行为数据的多样性与准确度;在行为感知计算子系统中,充分考虑用户历史数据所体现出的行为特性及行为规律,并将其与历史上下文信息相结合,通过构建用户标准偏好空间、计算行为波动阈值、判断偏好是否可预知,并据此对用户行为进行聚类分析,根据不同的行为类设计了羁束偏好获取算法、可控偏离偏好获取算法、不可控偏好获取算法,然后通过相应的自适应修正策略逐步精确的提取用户偏好,能够在对用户行为进行初步分类的基础上,进一步的获取用户偏好,提高算法适用性与偏好获取精确度。
附图说明
图1为本发明的行为感知偏好获系统结构示意图。
图2为本发明的标准偏好空间构建模块结构示意图。
图3为本发明的行为波动阈值计算模块结构示意图。
图4为本发明的可预知偏好判定模块结构示意图。
图5为本发明的行为分类模块结构示意图。
图6为本发明的偏好计算模块结构示意图。
图7为本发明的偏好自适应修正模块结构示意图。
具体实施方式
下面结合附图对本发明的实施方法作进一步的详细说明。
本发明的核心思想是:通过建立一个融合上下文信息的行为感知偏好获取算法模型,在传统偏好获取算法的基础上,充分考虑用户历史数据所体现出的行为特性及行为规律,并将其与上下文环境相结合,通过构建用户标准偏好空间、计算行为波动阈值、判断偏好是否可预知,并据此对用户行为进行聚类分析,然后再通过偏好获取算法及相应的自适应修正策略逐步提取更为精确的用户偏好。
由于本发明涉及偏好获取领域相关的理论与技术,因此需对相关内容作出说明,例如:用户行为、行为簇、行为孤点、行为波动量化均值、协同过滤、k-中心点聚类。
所述用户行为,指在特定上下文环境下,由用户自身要素及相关操作构成的活动集合,一般由量化的评分数据与行为记录来表示;
所述行为簇,指具有某些相似行为特性的用户群组;
所述行为孤点,指某用户在同类上下文环境下,对同一物品的偏好行为大幅偏离多数用户对于该商品的偏好行为;
所述行为波动量化均值,指用户行为的变化体现在量化的数据上,用其均值偏差来衡量,并根据多数偏差值来筛选行为孤点;
所述协同过滤,指利用用户间或项目间的相似性关系,首先获取与当前用户(或项目)最相似的若干最近邻,依据最近邻的决策来预测当前用户的偏好信息;
所述k-中心点聚类,指一种用户聚类方法,选用簇中离平均值最近的对象作为簇中心对用户进行聚类。
一种行为感知偏好获取系统,所述偏好获取系统包括用户行为数据获取子系统、数据存储与管理子系统、用户行为感知计算子系统、用户偏好获取子系统,其中:
用户行为数据获取子系统,用以完成获取用户的历史行为数据,并据此生成融入上下文信息的用户行为数据;
数据存储与管理子系统,用以完成用户历史行为数据、上下文信息、用户行为类集、偏好算法集、用户偏好等数据信息的存储与管理;
用户行为感知计算子系统,用以完成依据用户行为数据的分类预处理,通过构建标准偏好空间、计算行为波动阈值、判断偏好是否可预知等为用户行为进行分类;
用户偏好获取子系统,用以依据用户行为感知分类结果及用户行为数据提取用户偏好信息,并根据用户反馈、具体应用环境等对获取的用户偏好进行自适应修正。
所述用户行为数据获取子系统包括:用户历史行为生成模块、上下文信息生成模块;
所述用户历史行为生成模块,用以根据用户历史行为记录生成符合偏好获取算法需求的数据源;
所述用户上下文信息生成模块,用以实现与用户历史行为对应的上下文信息的生成,包括地理上下文、情绪上下文、环境上下文。
所述用户行为感知计算子系统包括:标准偏好空间构建模块、行为波动阈值计算模块、可预知偏好判定模块、行为分类模块;其中,
所述标准偏好空间构建模块,针对当前用户群组,采用k-中心点方法对用户偏好行为进行聚类,得出的k个用户行为簇的并集即表示标准偏好空间,用以分离用户行为孤点及判断用户偏好是否可预测;
所述行为波动阈值计算模块,用以针对当前用户群组,采用量化的偏好均值来表示用户偏好的变化,即用户行为波动,并根据其量化值分布特征计算波动阈值以分离用户行为孤点;
所述可预知偏好判定模块,依据标准偏好空间分离出的行为孤点,以判断相应用户偏好行为是否具有可预测性;
所述行为分类模块,用以依据标准偏好空间及行为波动阈值将用户行为分类,输出用户与不同行为类的对应关系。
所述用户偏好获取子系统包括:偏好计算模块、偏好自适应修正模块,其中:
所述偏好计算模块,根据用户行为感知计算子系统所获取的用户行为分类数据,修正基础偏好获取算法,获取用户偏好并输出结果至数据存储与管理子系统;
所述偏好自适应修正模块,用以依据用户反馈、客观应用环境等对用户偏好进行惩罚性/增强性修正,并输出结果至数据存储与管理子系统。
一种行为感知偏好获取方法,包括以下步骤:
1)获取触发推荐算法运行指令;
2)用户行为数据获取子系统生成用户历史行为及地理上下文、情绪上下文、环境上下文信息数据,并将其存储至数据存储与管理子系统;
3)用户行为感知计算子系统由数据存储与管理子系统获取用户行为数据,标准偏好空间构建模块以其为数据源对用户聚类,并构建标准偏好空间;行为波动阈值计算模块计算针对当前用户群组的行为波动阈值;可预知偏好判断模块依据上述两模块结果计算用户偏好的可预知性;行为分类模块利用上述三模块结果对用户行为进行分类,并将结果数据保存至数据存储与管理子系统;
4)用户偏好获取子系统获取用户行为分类,偏好计算模块采用偏好算法计算融合上下文信息与行为信息的用户偏好,偏好自适应修正模块根据用户反馈与具体应用环境对用户偏好进行自适应修正,并将最终的用户偏好信息存储至数据存储与管理子系统,然后依据用户偏好信息通过网络服务为用户推荐出符合其偏好的信息资源。
所述的标准偏好空间构建模块在融合上下文信息的用户行为数据上,选取聚类中心点,依据相异度度量方法分配用户聚类归属,并通过优化特征权重及距离权重,对其进行重复聚类直至中心点稳定,由稳定中心点所构成的用户簇并集即标准偏好空间,
其中,所述相异度度量方法如下:
式中,Xi=(xi1,xi2,...,xim)与Xj=(xj1,xj2,...,xjm)分别表示第i与j个用户在m种上下文环境下的量化行为数据值,其中χ为距离权重,C为上下文环境集合,dsc表示同种上下文环境下Ck的用户行为距离,ddc表示不同上下文环境Cm,Cn下用户行为距离,特征如下:
式中,sim(Cm,Cn)表示上下文环境Cm,Cn的相似度,具体计算方法如下:
其中,Prejms与Prejns分别表示用户Uj在单维上下文环境Cm与Cn下对项目Ss的偏好值,表示用户Uj在不同上下文环境下的平均偏好值。
所述的行为波动阈值计算模块,通过计算量化的偏好均值来获取用户偏好的偏离程度,依据预设的舍弃比率最终获取行为波动阈值,
其中,所述量化的偏好均值获取方法如下:
式中,Uk表示簇k内用户集,Item表示簇内用户有行为记录的项目集,Card(Item)表示集合Item内项目数量,Prejms表示在上下文环境Cm下用户Uj对于项目Ss的历史偏好值,
所述用户偏好偏离程度,其获取方法为:
所述可预知偏好判定模块,首先获取预设基准孤点比率,再计算用户行为孤点比率,最后获取用户偏好的可预知性。其中,所述用户行为孤点比率计算方法如下:
式中,Card(Aj,acnode)表示每个用户Uj行为孤点的数量,Card(Prej)表示用户Uj历史偏好行为数目,
所述可预知性获取方法如下:
式中,Aprej表示用户j的偏好可预知性,Aprej,able表示其偏好可预知,Aprej,unable表示其偏好不可预知。
所述的行为分类模块,用户行为分为:
1)羁束行为:在可预知偏好的范围内,允许有小于行为波动阈值的行为类;
2)可控偏离羁束行为:在可预知偏好的范围内大于行为波动阈值的用户行为;
3)不可控行为:不可预知偏好行为,其偏好不属于标准偏好空间。
所述的偏好计算模块,依据行为分类模块所获取用户行为类,分别采用羁束偏好获取算法、可控偏离偏好获取算法、不可控偏好获取算法来提取用户偏好,
其中,所述羁束偏好获取方法如下:
式中,与分别表示用户Ua与用户Ub对于其他所有项目的平均评分,Preams表示在上下文环境Cm下用户Ua对于项目Ss的评分值,kNN(b)为用户Ub的前k个最近邻,获取方法为选取与用户Ub相似度最大的k个用户,sim(b,a)表示用户Ub与用户Ua的相似度,CSba表示用户Ub与用户Ua间有共同行为记录项目的数目,表示用户Ub与其他用户有共同行为记录项目的平均数目;
所述可控偏离偏好获取算法,具体为:
式中,α为防止分母为0的修正因子,Prebms为在上下文环境Cm下用户Ub对于项目Ss通过基础偏好算法所获取的预测偏好值,
所述不可控偏好获取算法,具体为:
式中δ为权重因子,其取值依具体应用环境而定。
图1为本发明的总体结构图,如图1所示,所述原型系统主要由用户行为数据获取子系统(11)、数据存储与管理子系统(12)、用户行为感知计算子系统(13)、用户偏好获取子系统(14)。
具体算法流程说明如下:
步骤111,用户历史行为生成模块111将原始用户历史行为记录转换为符合系统需求的量化数据,并存储至数据存储与管理子系统12;
步骤112,上下文信息生成模块112生成算法所需的上下文信息,包括地理上下文、情绪上下文、环境上下文等,并以单位向量的格式存储至数据存储与管理子系统12;
本系统k种不同类型的上下文信息形式化定义如下:
C=(C1,C2,C3,…,Ck)
其中,Ci∈C表示任一类型的单维度上下文向量;
步骤131,标准偏好空间构建模块131采用k-中心点方法对用户偏好行为进行聚类,得出的k个用户行为簇的并集即表示标准偏好空间;
步骤132,行为波动阈值计算模块132采用量化的偏好均值来表示用户偏好的变化,即用户行为波动,并根据其量化值分布特征计算波动阈值以分离用户行为孤点;
步骤133,可预知偏好判定模块133依据标准偏好空间分离出的行为孤点,并根据可预测判别算法,判断相应用户偏好行为是否具有可预测性;
步骤134,行为分类模块134依据步骤132与步骤133结果,采用行为分类算法获取用户与不同行为类间关联关系;
步骤141,偏好计算模块141根据基础偏好获取算法提取用户初始偏好结果集;
步骤142,偏好自适应修正模块142根据偏好修正策略修正用户初始偏好,并生成用户最终偏好结果集。
图2为本发明的标准偏好空间构建模块131功能示意图,如图2所示,具体流程说明如下:
步骤201,从数据存储与管理子系统12获取用户行为数据,并融合历史上下文数据;
步骤202,随机选取k个任意用户的行为数据作为k个行为簇的代表对象,即初始聚类中心点(k值选取依具体应用环境而定);
步骤203,依据相异度度量方法分配聚类归属,即将所有用户行为数据分配给与其距离最近的中心点,形成k个初始用户行为簇。其具体描述如下:
设M={X1,X2,...,Xn}为一个点域在C=(C1×C2×...×Cm×Ch)上的混合数据点集,其中C1、…、Cm为m种不同种类上下文环境,Ch为历史行为记录。本步骤即为找出一个分类方法使得M=M1∪M2∪...∪Mk,首先定义最小化目标函数如下:
式(1)中,M中任两用户行为数据的距离即相异度度量方法如下:
式中,Xi=(xi1,xi2,...,xim)与Xj=(xj1,xj2,...,xjm)分别表示第i与j个用户在m种上下文环境下的量化行为数据值,其中χ为距离权重,C为上下文环境集合,dsc表示同种上下文环境下用户行为距离,ddc表示不同上下文环境Cm,Cn下用户行为距离,特征如下:
式中,sim(Cm,Cn)表示上下文环境Cm与Cn的相似度,具体计算方法如下:
其中,Prejms与Prejns分别表示用户Uj在单维上下文环境Cm与Cn下对项目Ss的偏好值,表示用户Uj在不同上下文环境下的平均偏好值。通过减去不同用户自身的平均偏好值来修正其偏好差异。相似度值越大,表示两个上下文环境越相似。
步骤204,根据最小化目标函数的方向优化特征权重及距离权重,而目标函数与k中心点选取直接关联,因此优化方式为通过判断行为簇内用户行为点能否替代k中心点,判断规则如下:
a).p属于当前中心点Ok1,若Ok1被Orandom所代替作为中心点,且p离一个Ok2最近,k1≠k2,那么p被重新分配给Ok2;
b).p属于当前中心点Ok1,若Ok1被Orandom所代替作为一个中心点,且p离Orandom最近,那么p被重新分配给Orandom;
c).p属于当前中心点Ok2,k1≠k2,如果Ok2被Orandom代替作为一个中心点,而p仍然离Ok2最近,那么对象的隶属不发生变化;
d).p属于当前中心点Ok2,k1≠k2,如果Ok2被Orandom代替作为一个中心点,而p离Orandom最近,那么p被重新分配给Orandom;
步骤205,依据步骤204获取的用户行为与中心点的隶属关系,重新获取聚类结果;
步骤206,根据步骤205获取的聚类结果,获取新的k个聚类中心点集;
步骤207,对比步骤206获取的k个聚类中心点集与本次运算前的原始k中心点(即步骤202中的中心点),若有变化,则转步骤204,否则转步骤208;
步骤208,根据稳定的k个聚类中心点集所获取的k个行为簇,即构成了标准偏好空间。
图3为行为波动阈值计算模块132结构示意图,具体流程如下:
步骤301,获取标准偏好空间构建模块131所得到的k个用户行为簇;
步骤302,获取量化的用户历史偏好;
步骤303,根据步骤301获取的行为簇,在每个行为簇内,以步骤302获取的量化用户行为记录为数据源,计算每个簇内用户历史偏好分布均值,具体如下:
式(5)中,Uk表示簇k内用户集,Item表示簇内用户有行为记录的项目集,Card(Item)表示集合Item内项目数量,Prejms表示在上下文环境s下用户Uj对于项目Ss,Ss∈Item的历史偏好值;
步骤304,根据步骤303获取的历史偏好均值,获取用户偏好偏离程度,具体如下:
步骤305,根据实际应用获取用户舍弃比率γ;
步骤306,根据步骤305获取的用户舍弃比率γ,获取行为波动阈值,具体如下:
Ew=(1-γ)·Em (7)
图4为可预知偏好判定模块(133)结构示意图,具体流程如下:
步骤401,获取用户行为数据;
步骤402,根据步骤306计算出的行为波动阈值,分离出用户行为孤点;
步骤403,依据具体应用环境,设定行为孤点在用户偏好行为中所占基准比率,设为β,具体算法如下:
式(8)中,Card(Aj,acnode)表示每个用户Uj行为孤点的数量,Card(Prej)表示用户Uj历史偏好行为数目;
步骤404,计算每个用户的孤点比率βu,具体算法如下:
步骤405,依据步骤403所得出基准行为孤点比率与步骤404得出的每个用户的孤点比率进行判断,对任一用户j而言,判断方法如下:
式(10)中,Aprej表示用户Uj的偏好可预知性,Aprej,able表示其偏好可预知,Aprej,unable表示其偏好不可预知。
图5为行为分类模块134结构示意图,具体流程如下:
步骤501,获取行为波动阈值数据;
步骤502,获取偏好可预测性信息数据;
步骤503,触发调用行为分类算法;
步骤504,判断用户偏好是否可预知;
步骤505,若用户偏好行为不可预知,则此用户为不可控行为类;
步骤506,判断用户用户偏好波动是否小于波动阈值;
步骤507,若用户偏好波动大于等于波动阈值,则此用户为可控偏离羁束行为类;
步骤508,若用户偏好波动小于波动阈值,则此用户为羁束行为类。
图6为偏好计算模块141结构示意图,具体流程如下:
步骤601,获取用户历史行为记录,主要指获取用户量化的评分记录;
步骤602,获取行为分类模块134所生成的用户行为分类数据;
步骤603,调用基础偏好获取算法,具体为经典协同过滤算法,描述如下:
式(11)中与分别表示用户Ua与用户Ub对于其他所有项目的平均评分,Preams表示在上下文环境下用户Ua对于项目的评分值,kNN(b)为用户Ub的前k个最近邻,获取方法为选取与用户b相似度最大的k个用户,sim(b,a)表示用户Ub与用户Ua的相似度,计算方法如下:
式(12)中Sab表示用户Ua与用户Ub有共同行为记录的项目集合,Prebms表示在上下文环境Cm下用户Ua对于项目Ss的评分值;
步骤604,依据步骤602所获取的用户行为分类数据信息调用相应的修正策略,对于羁束行为类则转步骤605,对于可控偏离羁束行为类则转步骤606,对于不可控行为类则转步骤607;
步骤605,对于羁束行为类,用户的偏好是可预知偏好并且其行为波动小于行为波动阈值,对于此类用户更加注重推荐的精确度,采用羁束偏好获取算法修正基础偏好获取算法,即通过增强与当前用户有共同行为记录用户在偏好获取算法中的影响比重,来提高偏好获取的精确度,具体如下:
式(14)中,CSba表示用户Ua与用户Ub间有共同行为记录项目的数目,表示用户Ua与其他用户有共同行为记录项目的平均数目;
步骤606,对于不可控用户类,用户的偏好行为具有很大的随机性,此类用户更加注重推荐的新颖性。采用不可控偏好获取算法来修正基础偏好获取算法,通过对于热门资源进行惩罚,以提高推荐列表的多样性,进而提高偏好获取结果的新颖性,具体如下:
式(16)中,α为防止分母为0的修正因子,Prebms为用户Ub对于项目Ss通过基础偏好算法所获取的预测偏好值;
步骤607,对于可控偏离羁束用户类,其修正策略应结合羁束修正策略与不可控修正策略,具体如下:
式(18)中δ为权重因子,其取值依具体应用环境而定;
步骤608,针对不同的用户行为类,依据上述三种偏好获取算法所获取的偏好结果,生成用户的偏好结果。
图7为偏好自适应修正模块142结构示意图,具体流程如下:
步骤701,获取偏好计算模块141所计算出的用户偏好信息;
步骤702,获取用户反馈信息修正用户行为类,进而修正偏好获取结果;
步骤703,根据具体应用,以提升偏好获取精确度与多样性为目标,调整偏好获取算法参数;
步骤704,依据客观实际需求情况,修正偏好获取算法;
步骤705,依据步骤702,步骤703,步骤704所述情况修正偏好获取算法;
步骤706,生成修正后的最终用户偏好结果。
Claims (7)
1.一种行为感知偏好获取系统,其特征在于,所述偏好获取系统包括用户行为数据获取子系统(11)、数据存储与管理子系统(12)、用户行为感知计算子系统(13)、用户偏好获取子系统(14),其中:
用户行为数据获取子系统(11),用以完成获取用户的历史行为数据,并据此生成融入上下文信息的用户行为数据;
数据存储与管理子系统(12),用以完成用户历史行为数据、上下文信息、用户行为类集、偏好算法集、用户偏好数据信息的存储与管理;
用户行为感知计算子系统(13),用以完成依据用户行为数据的分类预处理,通过构建标准偏好空间、计算行为波动阈值、判断偏好是否可预知为用户行为进行分类;
用户偏好获取子系统(14),用以依据用户行为感知分类结果及用户行为数据提取用户偏好信息,并根据用户反馈、具体应用环境对获取的用户偏好进行自适应修正;
所述用户行为数据获取子系统(11)包括:用户历史行为生成模块(111)、上下文信息生成模块(112);
所述用户历史行为生成模块(111),用以根据用户历史行为记录生成符合偏好获取算法需求的数据源;
所述用户上下文信息生成模块(112),用以实现与用户历史行为对应的上下文信息的生成,包括地理上下文、情绪上下文、环境上下文;
所述用户行为感知计算子系统(13)包括:标准偏好空间构建模块(131)、行为波动阈值计算模块(132)、可预知偏好判定模块(133)、行为分类模块(134);其中,
所述标准偏好空间构建模块(131),针对当前用户群组,采用k-中心点方法对用户偏好行为进行聚类,得出的k个用户行为簇的并集即表示标准偏好空间,用以分离用户行为孤点及判断用户偏好是否可预测;
所述行为波动阈值计算模块(132),用以针对当前用户群组,采用量化的偏好均值来表示用户偏好的变化,即用户行为波动,并根据其量化值分布特征计算波动阈值以分离用户行为孤点;
所述可预知偏好判定模块(133),依据标准偏好空间分离出的行为孤点,以判断相应用户偏好行为是否具有可预测性;
所述行为分类模块(134),用以依据标准偏好空间及行为波动阈值将用户行为分类,输出用户与不同行为类的对应关系;
所述用户偏好获取子系统(14)包括:偏好计算模块(141)、偏好自适应修正模块(142),其中:
所述偏好计算模块(141),根据用户行为感知计算子系统(13)所获取的用户行为分类数据,修正基础偏好获取算法,获取用户偏好并输出结果至数据存储与管理子系统(12);
所述偏好自适应修正模块(142),用以依据用户反馈、客观应用环境对用户偏好进行惩罚性/增强性修正,并输出结果至数据存储与管理子系统(12)。
2.一种行为感知偏好获取方法,其特征在于,包括以下步骤:
1)获取触发推荐算法运行指令;
2)用户行为数据获取子系统(11)生成用户历史行为及地理上下文、情绪上下文、环境上下文数据,并将其存储至数据存储与管理子系统(12);
3)用户行为感知计算子系统(13)由数据存储与管理子系统(12)获取用户行为数据,标准偏好空间构建模块(131)以其为数据源对用户聚类,并构建标准偏好空间;行为波动阈值计算模块(132)计算针对当前用户群组的行为波动阈值;可预知偏好判断模块(133)依据上述两模块结果计算用户偏好的可预知性;行为分类模块(134)利用上述三模块结果对用户行为进行分类,并将结果数据保存至数据存储与管理子系统(12);
4)用户偏好获取子系统(14)获取用户行为分类,偏好计算模块(141)采用偏好算法计算融合上下文信息与行为信息的用户偏好,偏好自适应修正模块(142)根据用户反馈与具体应用环境对用户偏好进行自适应修正,并将最终的用户偏好信息存储至数据存储与管理子系统(12),然后依据用户偏好信息通过网络服务为用户推荐出符合其偏好的信息资源。
3.根据权利要求书2所述一种行为感知偏好获取方法,其特征在于,所述的标准偏好空间构建模块(131)在融合上下文信息的用户行为数据上,选取聚类中心点,依据相异度度量方法分配用户聚类归属,并通过优化特征权重及距离权重,对其进行重复聚类直至中心点稳定,由稳定中心点所构成的用户簇并集即标准偏好空间,
其中,所述相异度度量方法如下:
<mrow>
<mi>d</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>X</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>X</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>&chi;</mi>
<mo>.</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>&Element;</mo>
<mi>C</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msubsup>
<mi>d</mi>
<mrow>
<mi>s</mi>
<mi>c</mi>
</mrow>
<mn>2</mn>
</msubsup>
<mo>(</mo>
<mrow>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>j</mi>
<mi>k</mi>
</mrow>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<mi>&chi;</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>m</mi>
<mo>&Element;</mo>
<mi>C</mi>
<mo>,</mo>
<mi>n</mi>
<mo>&Element;</mo>
<mi>C</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msubsup>
<mi>d</mi>
<mrow>
<mi>d</mi>
<mi>c</mi>
</mrow>
<mn>2</mn>
</msubsup>
<mo>(</mo>
<mrow>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mi>m</mi>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>j</mi>
<mi>n</mi>
</mrow>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,Xi=(xi1,xi2,...,xim)与Xj=(xj1,xj2,...,xjm)分别表示第i与j个用户在m种上下文环境下的量化行为数据值,其中χ为距离权重,C为上下文环境集合,dsc表示同种上下文环境下Ck的用户行为距离,ddc表示不同上下文环境Cm,Cn下用户行为距离,特征如下:
<mrow>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>d</mi>
<mrow>
<mi>s</mi>
<mi>c</mi>
</mrow>
<mn>2</mn>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>j</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>j</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>d</mi>
<mrow>
<mi>d</mi>
<mi>c</mi>
</mrow>
<mn>2</mn>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mi>m</mi>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>j</mi>
<mi>n</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mi>m</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>j</mi>
<mi>n</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>&CenterDot;</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>+</mo>
<mi>s</mi>
<mi>i</mi>
<mi>m</mi>
<mo>(</mo>
<mrow>
<msub>
<mi>C</mi>
<mi>m</mi>
</msub>
<mo>,</mo>
<msub>
<mi>C</mi>
<mi>n</mi>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,sim(Cm,Cn)表示上下文环境Cm,Cn的相似度,具体计算方法如下:
<mrow>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>C</mi>
<mi>m</mi>
</msub>
<mo>,</mo>
<msub>
<mi>C</mi>
<mi>n</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<msub>
<mi>C</mi>
<mi>m</mi>
</msub>
<mo>,</mo>
<msub>
<mi>C</mi>
<mi>n</mi>
</msub>
<mo>&Element;</mo>
<mi>C</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>j</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<mover>
<mrow>
<msub>
<mi>Pre</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mrow>
<mo>(</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>j</mi>
<mi>n</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<mover>
<mrow>
<msub>
<mi>Pre</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<msub>
<mi>C</mi>
<mi>m</mi>
</msub>
<mo>,</mo>
<msub>
<mi>C</mi>
<mi>n</mi>
</msub>
<mo>&Element;</mo>
<mi>C</mi>
</mrow>
</munder>
<msqrt>
<mrow>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>j</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<mover>
<mrow>
<msub>
<mi>Pre</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>j</mi>
<mi>n</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<mover>
<mrow>
<msub>
<mi>Pre</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,Prejms与Prejns分别表示用户Uj在单维上下文环境Cm与Cn下对项目Ss的偏好值,表示用户Uj在不同上下文环境下的平均偏好值。
4.根据权利要求书2所述一种行为感知偏好获取方法,其特征在于,所述的行为波动阈值计算模块(132),通过计算量化的偏好均值来获取用户偏好的偏离程度,依据预设的舍弃比率最终获取行为波动阈值,
其中,所述量化的偏好均值获取方法如下:
<mrow>
<mover>
<mi>P</mi>
<mo>&OverBar;</mo>
</mover>
<mo>=</mo>
<mfrac>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>&Element;</mo>
<msub>
<mi>U</mi>
<mi>k</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>Pre</mi>
<mrow>
<mi>j</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
</mrow>
<mrow>
<mi>C</mi>
<mi>a</mi>
<mi>r</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>I</mi>
<mi>t</mi>
<mi>e</mi>
<mi>m</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,Uk表示簇k内用户集,Item表示簇内用户有行为记录的项目集,Card(Item)表示集合Item内项目数量,Prejms表示在上下文环境Cm下用户Uj对于项目Ss的历史偏好值,
所述用户偏好偏离程度,其获取方法为:
<mrow>
<msub>
<mi>E</mi>
<mi>m</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>m</mi>
<mo>&Element;</mo>
<mi>I</mi>
<mi>t</mi>
<mi>e</mi>
<mi>m</mi>
</mrow>
</munder>
<mrow>
<mo>|</mo>
<mrow>
<mover>
<mi>P</mi>
<mo>&OverBar;</mo>
</mover>
<mo>-</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>j</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
</mrow>
<mo>|</mo>
</mrow>
</mrow>
<mrow>
<mi>C</mi>
<mi>a</mi>
<mi>r</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>I</mi>
<mi>t</mi>
<mi>e</mi>
<mi>m</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
<mo>.</mo>
</mrow>
5.根据权利要求书2所述的一种行为感知偏好获取方法,其特征在于,所述可预知偏好判定模块(133),首先获取预设基准孤点比率,再计算用户行为孤点比率,最后获取用户偏好的可预知性;其中,所述用户行为孤点比率计算方法如下:
<mrow>
<mi>&beta;</mi>
<mi>u</mi>
<mo>=</mo>
<mfrac>
<mrow>
<mi>C</mi>
<mi>a</mi>
<mi>r</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>A</mi>
<mrow>
<mi>j</mi>
<mo>,</mo>
<mi>a</mi>
<mi>c</mi>
<mi>n</mi>
<mi>o</mi>
<mi>d</mi>
<mi>e</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>C</mi>
<mi>a</mi>
<mi>r</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>Pre</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,Card(Aj,acnode)表示每个用户Uj行为孤点的数量,Card(Prej)表示用户Uj历史偏好行为数目,
所述可预知性获取方法如下:
<mrow>
<msub>
<mi>Apre</mi>
<mi>j</mi>
</msub>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>Apre</mi>
<mrow>
<mi>j</mi>
<mo>,</mo>
<mi>a</mi>
<mi>b</mi>
<mi>l</mi>
<mi>e</mi>
</mrow>
</msub>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>&beta;u</mi>
<mi>j</mi>
</msub>
<mo><</mo>
<mi>&beta;</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>Apre</mi>
<mrow>
<mi>j</mi>
<mo>,</mo>
<mi>u</mi>
<mi>n</mi>
<mi>a</mi>
<mi>b</mi>
<mi>l</mi>
<mi>e</mi>
</mrow>
</msub>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>&beta;u</mi>
<mi>j</mi>
</msub>
<mo>&GreaterEqual;</mo>
<mi>&beta;</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,Aprej表示用户j的偏好可预知性,Aprej,able表示其偏好可预知,Aprej,unable表示其偏好不可预知,β表示行为孤点在用户偏好行为中所占基准比率,即
6.根据权利要求书2所述的一种行为感知偏好获取方法,其特征在于,所述的行为分类模块(134),用户行为分为:
1)羁束行为:在可预知偏好的范围内,允许有小于行为波动阈值的行为类;
2)可控偏离羁束行为:在可预知偏好的范围内大于行为波动阈值的用户行为;
3)不可控行为:不可预知偏好行为,其偏好不属于标准偏好空间。
7.根据权利要求书2所述的一种行为感知偏好获取方法,其特征在于,所述的偏好计算模块(141),依据行为分类模块(134)所获取用户行为类,分别采用羁束偏好获取算法、可控偏离偏好获取算法、不可控偏好获取算法来提取用户偏好,
其中,所述羁束偏好获取方法如下:
<mrow>
<msub>
<mi>Pre</mi>
<mrow>
<mi>b</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>=</mo>
<mover>
<mrow>
<msub>
<mi>Pre</mi>
<mi>b</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>+</mo>
<mfrac>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>a</mi>
<mo>&Element;</mo>
<mi>k</mi>
<mi>N</mi>
<mi>N</mi>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>a</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<mover>
<mrow>
<msub>
<mi>Pre</mi>
<mi>a</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>sim</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>,</mo>
<mi>a</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>a</mi>
<mo>&Element;</mo>
<mi>k</mi>
<mi>N</mi>
<mi>N</mi>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<mo>|</mo>
<msub>
<mi>sim</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>,</mo>
<mi>a</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>sim</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>a</mi>
<mo>,</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>s</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>a</mi>
<mo>,</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msqrt>
<mrow>
<mn>1</mn>
<mo>+</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>CS</mi>
<mrow>
<mi>b</mi>
<mi>a</mi>
</mrow>
</msub>
<mo>-</mo>
<mover>
<mrow>
<msub>
<mi>CS</mi>
<mi>b</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>9</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,与分别表示用户Ua与用户Ub对于其他所有项目的平均评分,Preams表示在上下文环境Cm下用户Ua对于项目Ss的评分值,kNN(b)为用户Ub的前k个最近邻,获取方法为选取与用户Ub相似度最大的k个用户,sim(b,a)表示用户Ub与用户Ua的相似度,CSba表示用户Ub与用户Ua间有共同行为记录项目的数目,表示用户Ub与其他用户有共同行为记录项目的平均数目;
所述可控偏离偏好获取算法,具体为:
<mrow>
<msub>
<msup>
<mi>Pre</mi>
<mo>&prime;</mo>
</msup>
<mrow>
<mi>b</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>=</mo>
<mover>
<mrow>
<msub>
<mi>Pre</mi>
<mi>b</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>+</mo>
<mfrac>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>a</mi>
<mo>&Element;</mo>
<mi>k</mi>
<mi>N</mi>
<mi>N</mi>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>a</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<mover>
<mrow>
<msub>
<mi>Pre</mi>
<mi>a</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>sim</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>,</mo>
<mi>a</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>a</mi>
<mo>&Element;</mo>
<mi>k</mi>
<mi>N</mi>
<mi>N</mi>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<mo>|</mo>
<msub>
<mi>sim</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>,</mo>
<mi>a</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>10</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>sim</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>a</mi>
<mo>,</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>s</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>a</mi>
<mo>,</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<mfrac>
<msqrt>
<mrow>
<mo>|</mo>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>b</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>a</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
<mo>|</mo>
</mrow>
</msqrt>
<mrow>
<mrow>
<mo>|</mo>
<mrow>
<msub>
<mi>Pre</mi>
<mrow>
<mi>b</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>a</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
</mrow>
<mo>|</mo>
</mrow>
<mo>+</mo>
<mi>&alpha;</mi>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>11</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,α为防止分母为0的修正因子,Prebms为在上下文环境Cm下用户Ub对于项目Ss通过基础偏好算法所获取的预测偏好值,
所述不可控偏好获取算法,具体为:
<mrow>
<msub>
<msup>
<mi>Pre</mi>
<mo>&prime;</mo>
</msup>
<mrow>
<mi>b</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>=</mo>
<mover>
<mrow>
<msub>
<mi>Pre</mi>
<mi>b</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>+</mo>
<mfrac>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>a</mi>
<mo>&Element;</mo>
<mi>k</mi>
<mi>N</mi>
<mi>N</mi>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>a</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<mover>
<mrow>
<msub>
<mi>Pre</mi>
<mi>a</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>sim</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>,</mo>
<mi>a</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>a</mi>
<mo>&Element;</mo>
<mi>k</mi>
<mi>N</mi>
<mi>N</mi>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<mo>|</mo>
<msub>
<mi>sim</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>b</mi>
<mo>,</mo>
<mi>a</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>12</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>sim</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>a</mi>
<mo>,</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>s</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>a</mi>
<mo>,</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mrow>
<mo>(</mo>
<mi>&delta;</mi>
<mo>&CenterDot;</mo>
<msqrt>
<mrow>
<mn>1</mn>
<mo>+</mo>
<msup>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>CS</mi>
<mrow>
<mi>b</mi>
<mi>a</mi>
</mrow>
</msub>
<mo>-</mo>
<mover>
<mrow>
<msub>
<mi>CS</mi>
<mi>b</mi>
</msub>
</mrow>
<mo>&OverBar;</mo>
</mover>
</mrow>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
<mo>+</mo>
<mo>(</mo>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mi>&delta;</mi>
</mrow>
<mo>)</mo>
<mo>&CenterDot;</mo>
<mo>(</mo>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mfrac>
<msqrt>
<mrow>
<mo>|</mo>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>b</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>a</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
<mo>|</mo>
</mrow>
</msqrt>
<mrow>
<mrow>
<mo>|</mo>
<mrow>
<msub>
<mi>Pre</mi>
<mrow>
<mi>b</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>Pre</mi>
<mrow>
<mi>a</mi>
<mi>m</mi>
<mi>s</mi>
</mrow>
</msub>
</mrow>
<mo>|</mo>
</mrow>
<mo>+</mo>
<mi>&alpha;</mi>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>13</mn>
<mo>)</mo>
</mrow>
</mrow>
式中δ为权重因子,其取值依具体应用环境而定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410604018.2A CN104408643B (zh) | 2014-10-30 | 2014-10-30 | 一种行为感知偏好获取系统及其获取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410604018.2A CN104408643B (zh) | 2014-10-30 | 2014-10-30 | 一种行为感知偏好获取系统及其获取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104408643A CN104408643A (zh) | 2015-03-11 |
CN104408643B true CN104408643B (zh) | 2018-01-02 |
Family
ID=52646272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410604018.2A Expired - Fee Related CN104408643B (zh) | 2014-10-30 | 2014-10-30 | 一种行为感知偏好获取系统及其获取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104408643B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10235032B2 (en) * | 2015-08-05 | 2019-03-19 | Htc Corporation | Method for optimizing a captured photo or a recorded multi-media and system and electric device therefor |
CN106022511A (zh) * | 2016-05-11 | 2016-10-12 | 北京京东尚科信息技术有限公司 | 信息预测方法和装置 |
CN106202252A (zh) * | 2016-06-29 | 2016-12-07 | 厦门趣处网络科技有限公司 | 一种基于用户情绪分析的出行推荐方法、系统 |
CN107577698A (zh) * | 2017-07-21 | 2018-01-12 | 天津科技大学 | 一种基于用户间影响力的移动用户偏好预测方法 |
CN108491417B (zh) * | 2018-02-05 | 2021-12-03 | 武汉大学 | 一种基于用户访问行为的群体偏好上下文重构方法 |
CN108549707A (zh) * | 2018-04-18 | 2018-09-18 | 安徽智网信息科技有限公司 | 一种基于行为感知的大数据提取系统及方法 |
CN109388970B (zh) * | 2018-10-25 | 2020-08-21 | 麒麟合盛网络技术股份有限公司 | 数据处理方法和装置 |
CN113177657B (zh) * | 2021-04-20 | 2022-08-30 | 上海大学 | 轨道交通客流预测方法及装置 |
CN113537622B (zh) * | 2021-07-30 | 2022-04-29 | 烟台大学 | 基于动态信任感知的服务偏好预测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930052A (zh) * | 2012-11-19 | 2013-02-13 | 西北大学 | 一种基于多维度属性关注度的兴趣资源推荐方法 |
CN103559197A (zh) * | 2013-09-23 | 2014-02-05 | 浙江大学 | 基于上下文预过滤的实时音乐推荐方法 |
-
2014
- 2014-10-30 CN CN201410604018.2A patent/CN104408643B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930052A (zh) * | 2012-11-19 | 2013-02-13 | 西北大学 | 一种基于多维度属性关注度的兴趣资源推荐方法 |
CN103559197A (zh) * | 2013-09-23 | 2014-02-05 | 浙江大学 | 基于上下文预过滤的实时音乐推荐方法 |
Non-Patent Citations (2)
Title |
---|
"上下文感知推荐系统";王立才 等;《软件学报》;20110908(第1期);第4页 * |
"基于偏好的客户模糊聚类方法";张雨 等;《计算机工程与设计》;20081216;第29卷(第23期);第6017-6018页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104408643A (zh) | 2015-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104408643B (zh) | 一种行为感知偏好获取系统及其获取方法 | |
CN108733798B (zh) | 一种基于知识图谱的个性化推荐方法 | |
Peng | Regional earthquake vulnerability assessment using a combination of MCDM methods | |
CN103886047B (zh) | 面向流式数据的分布式在线推荐方法 | |
Budayan et al. | Comparing the performance of traditional cluster analysis, self-organizing maps and fuzzy C-means method for strategic grouping | |
CN103473291B (zh) | 一种基于隐语义概率模型的个性化服务推荐系统及方法 | |
CN106407349A (zh) | 一种产品推荐方法及装置 | |
Wang et al. | Case-based reasoning for product style construction and fuzzy analytic hierarchy process evaluation modeling using consumers linguistic variables | |
CN101986299A (zh) | 基于超图的多任务个性化网络服务方法 | |
Karande et al. | A facility layout selection model using MACBETH method | |
Kangas et al. | Multiple criteria decision support methods in forest management: an overview and comparative analyses | |
Ma | A new group ranking approach for ordinal preferences based on group maximum consensus sequences | |
CN107180088A (zh) | 基于模糊c均值聚类算法的新闻推荐方法 | |
CN105956093A (zh) | 一种基于多视图锚点图哈希技术的个性化推荐方法 | |
CN111666496A (zh) | 一种基于评论文本的组推荐方法 | |
Dodangeh et al. | Best project selection by using of Group TOPSIS method | |
Sarkar | Fuzzy decision making and its applications in cotton fibre grading | |
Marimin et al. | Hierarchical semi-numeric method for pairwise fuzzy group decision making | |
López-Herrera et al. | Applying multi-objective evolutionary algorithms to the automatic learning of extended Boolean queries in fuzzy ordinal linguistic information retrieval systems | |
Yi et al. | A novel recommender algorithm using information entropy and secondary-clustering | |
CN108846577B (zh) | 一种基于情境分析的群体任务分配方法 | |
CN113362034A (zh) | 一种职位推荐方法 | |
Changdar et al. | A modified ant colony optimisation based approach to solve sub-tour constant travelling salesman problem | |
Kovacevic et al. | Crex-wisdom framework for fusion of crowd and experts in crowd voting environment–machine learning approach | |
Gupta et al. | Empirical Analysis of Federated Learning Algorithms: A Federated Research Infrastructure Use Case. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180102 Termination date: 20211030 |
|
CF01 | Termination of patent right due to non-payment of annual fee |