CN114491095A - 基于时序漂移的潜在因子模型对项目的推荐方法 - Google Patents
基于时序漂移的潜在因子模型对项目的推荐方法 Download PDFInfo
- Publication number
- CN114491095A CN114491095A CN202210054508.4A CN202210054508A CN114491095A CN 114491095 A CN114491095 A CN 114491095A CN 202210054508 A CN202210054508 A CN 202210054508A CN 114491095 A CN114491095 A CN 114491095A
- Authority
- CN
- China
- Prior art keywords
- time
- matrix
- user
- drift
- time sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 95
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 17
- 230000000694 effects Effects 0.000 claims abstract description 7
- 230000006399 behavior Effects 0.000 claims description 13
- 239000000126 substance Substances 0.000 claims description 10
- 238000012546 transfer Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 2
- 238000012360 testing method Methods 0.000 abstract description 3
- 238000004088 simulation Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/489—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using time information
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
基于时序漂移的潜在因子模型对项目的推荐方法,通过采集所需要推荐项目的历史信息,构建时序漂移矩阵分解模型以及时序漂移联合目标函数后,对联合目标函数进行求解后得到基于时序漂移矩阵分解模型,输入的用户信息后可进行项目推荐。本发明考虑并结合了用户的时序动态偏好演变以及用户过去行为对当前行为的影响关系进行建模,通过构建辅助矩阵捕捉用户两个时期之间演变关系,引入时间影响因子平衡当前和过去行为的影响,并在三个实验数据集中和基线方法对比测试均取得较好的仿真推荐效果,以说明本发明具有更优越的有效性。
Description
技术领域
本发明属于多媒体信息处理技术领域,具体涉及基于时序漂移的潜在因子模型对项目的推荐方法。
背景技术
随着大数据时代的发展,推荐系统在生活中起着至关重要的作用,在推荐系统中,具有相似活动信息的用户往往会得到推荐,其中包括显示信息(例如评级或标记行为等)和隐式信息(时序行为特征等),往往隐式信息最为关键,因为隐式信息量更大并且更能反映出用户详实的行为关系。在实际环境中,随着时间的推移,用户偏好也发生隐式演变。为了解决这个问题,Vaca等人在2014年发表于《International Conference on World WideWeb.》的《A Time-based Collective Factorization for Topic Discovery andMonitoring in News》中提出了集体矩阵分解来给在线主题发现问题建模,使用了一种自适应的非负矩阵分解(NMF)方法,该方法通过映射矩阵来捕获两个时间段之间的兴趣转换来共同获得主题演变。然而,这种模式只专注于新闻的主题发现,无法在常规的推荐系统上运行。Rafailidis等人在2017年发表于《Expert Systems with Applications》的《Preference Dynamics with Multimodal User-Item Interactions in Social MediaRecommendation》中提出一种通过将多模态信息与得分相结合来减少数据稀疏性的推荐方案,该模型还考虑了多模态数据以解释每个时间步长的分数,但这些数据不能揭示评论者提供的内容主题因素。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供基于时序漂移的潜在因子模型推荐方法。
本发明采用如下的技术方案:
基于时序漂移的潜在因子模型对项目的推荐方法包括以下步骤:
步骤1,采集所需要推荐项目的历史信息;
步骤2,基于采集的历史信息构建时序漂移矩阵分解模型;
步骤3,基于时序漂移矩阵分解模型构建时序漂移联合目标函数;
步骤4,对步骤3构建的联合目标函数进行求解后得到基于时序漂移矩阵分解模型,输入的用户信息后可进行项目推荐。
在步骤1中,历史信息包括项目的用户信息与项目评级信息;
用户信息包括用户行为的时间信息;用户行为的时间信息包括用户在亚马逊网站上浏览这些项目的时长、收藏时间、加入购物车时间以及结账时间;
评级范围是1-5分的整数,并对数据集中用户评级数量小于等于1的数据进行筛除。
在步骤2中,所述时序漂移矩阵分解模型将每个用户ui的t时刻用户潜在因子矩阵与t-T时刻的用户潜在因子矩阵相联系,在t和t-T时刻之间定义一个辅助转移矩阵表示当前用户潜在因子矩阵可用t-T时刻的用户潜在因子矩阵通过辅助转移矩阵转移后表示;
所构建的时序漂移矩阵分解模型满足以下关系式:
其中,表示n维实数空间,表示当前时间t的评分矩阵,表示评分矩阵R(t)由i×j维的实数组成;表示t时刻目标矩阵R(t)的用户潜在因子矩阵,表示潜在用户潜在因子矩阵由i×l维的实数组成;表示t-T时刻目标矩阵R(t)的用户潜在因子矩阵;表示t时刻目标矩阵R(t)的项目潜在因子矩阵,表示项目潜在因子矩阵由l×j维的实数组成;表示和之间的辅助转换矩阵。
定义在t时刻和t-T时刻分别对应的评分矩阵R(t)和R(t-1)的最小化问题:
引入时间影响因子α,得到联合最小化问题:
对联合最小化问题进行求解,得到时序漂移联合目标函数,其满足以下关系式:
其中,表示预测数据与实际数据之间误差最小化, 表示由t-1时刻获得用户潜在因子矩阵的转换预测误差的最小化;U(t-T)的分解偏置度由时间正则化项控制,γ1,γ2为各项影响调节参数,当γ1值越高,则表示该模型对更偏向于辅助矩阵对其影响作用;||·||1表示L1范数。
使用一阶必要条件等式约束求解时序漂移联合目标函数,得到以下关系式:
本发明的有益效果在于,与现有技术相比,本发明考虑并结合了用户的时序动态偏好演变以及用户过去行为对当前行为的影响关系进行建模,通过构建辅助矩阵捕捉用户两个时期之间演变关系,引入时间影响因子平衡当前和过去行为的影响,并在三个实验数据集中和基线方法对比测试均取得较好的仿真推荐效果,说明本发明具有有效性。
附图说明
图1为本发明提出的基于时序漂移的潜在因子分解模型示意图;
图2为本发明时间影响因子α取值与精确度指标关系示意图;
图3为本发明模型与各基线模型在不同TopN中NDCG指标对比示意图;
图4为本发明模型与各基线模型在不同TopN中精确度指标对比示意图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
基于时序漂移的潜在因子模型推荐方法,包括以下步骤:
步骤1,采集所需要推荐项目的历史信息;
历史信息包括项目的用户信息与项目评级信息;在本发明中,选用了来自美国斯坦福大学收集的亚马逊数据集,数据集中包括家电、书籍以及电脑游戏的用户信息、项目评级;
用户信息包括用户行为的时间信息;用户行为的时间信息包括用户在亚马逊网站上浏览这些项目的时长、收藏时间、加入购物车时间以及评级时间;
评级范围是1-5分的整数,并对数据集中用户评级数量小于等于1的数据进行筛除;
具体数据如表1所示:
表1本发明实施例使用的数据规模
步骤2,基于采集的历史信息构建时序漂移矩阵分解模型;
如图1所示为时序漂移矩阵分解模型示意图,模型把于每个用户ui的t时刻用户潜在因子矩阵与t-T时刻的用户潜在因子矩阵的联系考虑在内,在t和t-T时刻之间定义一个辅助转移矩阵表示当前用户潜在因子矩阵可用过去用户潜在因子矩阵通过辅助转移矩阵转移后表示;另一方面,根据到t时刻的时间间隔长度,考虑引入影响因子表达对不同时刻用户特征因子矩阵的时间影响;
所构建的时序漂移矩阵分解模型满足以下关系式:
其中,表示n维实数空间,表示当前时间t的评分矩阵,表示评分矩阵R(t)由i×j维的实数组成;表示t时刻目标矩阵R(t)的用户潜在因子矩阵,表示用户潜在因子矩阵由i×l维的实数组成;表示t-T时刻目标矩阵R(t)的用户潜在因子矩阵;表示t时刻目标矩阵R(t)的项目潜在因子矩阵,表示项目潜在因子矩阵由l×j维的实数组成;表示和之间的辅助转换矩阵,用于捕捉和之间的多重潜在用户潜在因子时序变化关系
步骤3,基于时序漂移矩阵分解模型构建时序漂移联合目标函数;
首先定义在t时刻和t-T时刻分别对应的评分矩阵R(t)和R(t-1)的最小化问题:
对上述公式引入时间影响因子α(0<α<1),将其转化为联合最小化问题:
时间影响因子α用于平衡用户评级时间衰减影响;本发明将调节参数γ1,γ2均设置为0.5,并调整α的值对比效果,时间间隔参数T的取值范围为24个月。影响因子α取值范围是0.05到1.0,步进为0.05,结果如图2所示。可以看出,当α增加时,性能逐步提高,但当α超过0.55时,准确度开始下降。这一结果表明,如果α太大或者太小,准确度都偏低,无法准确预测用户偏好,因此性能的最优值为α=0.55时,这表示用户近期偏好产生了较大的影响。
在本实施例中,求解联合最小化问题的目标函数为:
表示预测数据与实际数据之间误差最小化, 表示由t-1时刻获得用户潜在因子矩阵的转换预测误差的最小化;U(t-T)的分解偏置度由时间正则化项控制,γ1,γ2为各项影响调节参数,当γ1值越高,则表示该模型对更偏向于辅助矩阵对其影响作用;||·||1表示L1范数;从简化算法实现复杂度考虑,本发明设定模型调节参数γ1=γ2;
优选地,γ1,γ2均设置为0.5;
步骤4,对步骤3构建的联合目标函数进行求解后得到基于时序漂移矩阵分解模型,输入的用户信息后可进行项目推荐;
本领域的技术人员可以利用现有的计算模型或商业求解软件进行求解,本实施例提供的方法仅为一优选方案,不能是本发明的必然约束:
根据一阶必要条件等式约束解决优化问题,得到以下关系式:
为了确定模型与推荐数量的关系,本发明将潜在因子的数量设定为20,并将推荐数量从100增加到500,步进为100。图3和图4分别显示了不同推荐方法在NDCG和精确度方面的性能。可以看出,在不同的Top-N推荐中,本发明所提出的TDMF模型优于所有其他基线模型,表明其在处理用户时序动态偏好问题方面具有较强的能力。
本发明使用NDCG(Normalized Discounted Cummulative Gain)、准确率P、召回率Recall和F1值作为主要实验评价指标,各指标定义如下:
NDCG表示归一化折损累计增益。前N个推荐结果中NDCG@N的定义如下式:
其中,bi表示如果项目i位于推荐结果集中,则为1,否则为0;IDCG@N定义如下式:
IDCG@N表示理想情况下推荐结果中最相关的结果列表,即按照推荐相关性从大到小的顺序排序,取前N个结果组成的集合。因此,推荐结果相关度越高,则NDCG值越大。
根据用户是否有兴趣购买的商品进行分类。假设推荐系统为目标用户提供一个包含N项的推荐列表,则精度定义如下:
其中BUY是测试集中目标用户购买的商品集,ALL是推荐列表中全部N个商品的推荐列表,|ALL∩BUY|是ALL和BUY之间的商品交集数量。
召回率Recall是在TopN位置返回的相关项目与实际返回的相关项目数量的比例,如下所示:
F1值是对准确率和召回率进行整体评价,可以防止出现其中一项指标偏高而另一项偏低的情况,其定义如下:
表1提供了更详细的数据集分析。各个模型的R@N、P@N、F1@N和NDCG@N(N=100和200)性能指标结果如表1所示。在各基线方法中,各个指标性能最好的是本文的TDMF模型。因此,与其它时序方法相比,本文方法能更好地捕捉识别用户偏好的时序动态变化。此外,与TCMF使用的辅助转换矩阵不同,本文辅助矩阵针对每个用户特征因子单独进行训练,因此本文方法较之能更好的提取用户个性化特征。因此,可以通过结合用户时序特征的潜在因子分解来实现推荐。
表1:本发明模型与各基线模型详细指标对比
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
Claims (12)
1.基于时序漂移的潜在因子模型对项目的推荐方法,其特征在于,所述方法包括:
步骤1,采集所需要推荐项目的历史信息;
步骤2,基于采集的历史信息构建时序漂移矩阵分解模型;
步骤3,基于时序漂移矩阵分解模型构建时序漂移联合目标函数;
步骤4,对步骤3构建的联合目标函数进行求解后得到基于时序漂移矩阵分解模型,输入的用户信息后可进行项目推荐。
2.根据权利要求1所述的基于时序漂移的潜在因子模型对项目的推荐方法,其特征在于,
在所述步骤1中,历史信息包括项目的用户信息与项目评级信息;
用户信息包括用户行为的时间信息;用户行为的时间信息包括用户在亚马逊网站上浏览这些项目的时长、收藏时间、加入购物车时间以及结账时间;
评级范围是1-5分的整数,并对数据集中用户评级数量小于等于1的数据进行筛除。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210054508.4A CN114491095A (zh) | 2022-01-18 | 2022-01-18 | 基于时序漂移的潜在因子模型对项目的推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210054508.4A CN114491095A (zh) | 2022-01-18 | 2022-01-18 | 基于时序漂移的潜在因子模型对项目的推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114491095A true CN114491095A (zh) | 2022-05-13 |
Family
ID=81511232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210054508.4A Pending CN114491095A (zh) | 2022-01-18 | 2022-01-18 | 基于时序漂移的潜在因子模型对项目的推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114491095A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740444A (zh) * | 2016-02-02 | 2016-07-06 | 桂林电子科技大学 | 基于用户评分的项目推荐方法 |
CN111125517A (zh) * | 2019-12-06 | 2020-05-08 | 陕西师范大学 | 一种基于差分隐私和时间感知的隐式矩阵分解推荐方法 |
CN111310033A (zh) * | 2020-01-23 | 2020-06-19 | 山西大学 | 基于用户兴趣漂移的推荐方法及推荐装置 |
CN113221019A (zh) * | 2021-04-02 | 2021-08-06 | 合肥工业大学 | 基于即时学习的个性化推荐方法和系统 |
CN113239271A (zh) * | 2021-05-11 | 2021-08-10 | 四川大学 | 一种基于兴趣漂移的推荐方法 |
CN113343077A (zh) * | 2021-04-30 | 2021-09-03 | 南京大学 | 一种融合用户兴趣时序波动的个性化推荐方法及系统 |
-
2022
- 2022-01-18 CN CN202210054508.4A patent/CN114491095A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740444A (zh) * | 2016-02-02 | 2016-07-06 | 桂林电子科技大学 | 基于用户评分的项目推荐方法 |
CN111125517A (zh) * | 2019-12-06 | 2020-05-08 | 陕西师范大学 | 一种基于差分隐私和时间感知的隐式矩阵分解推荐方法 |
CN111310033A (zh) * | 2020-01-23 | 2020-06-19 | 山西大学 | 基于用户兴趣漂移的推荐方法及推荐装置 |
CN113221019A (zh) * | 2021-04-02 | 2021-08-06 | 合肥工业大学 | 基于即时学习的个性化推荐方法和系统 |
CN113343077A (zh) * | 2021-04-30 | 2021-09-03 | 南京大学 | 一种融合用户兴趣时序波动的个性化推荐方法及系统 |
CN113239271A (zh) * | 2021-05-11 | 2021-08-10 | 四川大学 | 一种基于兴趣漂移的推荐方法 |
Non-Patent Citations (1)
Title |
---|
丁浩等: "融合用户兴趣波动时序的个性化推荐模型", 《数据分析与知识发现》, vol. 5, no. 11, 31 December 2021 (2021-12-31), pages 45 - 58 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108648049B (zh) | 一种基于用户行为区别建模的序列推荐方法 | |
CN110503531B (zh) | 时序感知的动态社交场景推荐方法 | |
Junqué de Fortuny et al. | Predictive modeling with big data: is bigger really better? | |
Kuo et al. | Building and evaluating a location-based service recommendation system with a preference adjustment mechanism | |
Shi et al. | Employing rough sets and association rule mining in KANSEI knowledge extraction | |
CN108460082B (zh) | 一种推荐方法及装置,电子设备 | |
CN111797321A (zh) | 一种面向不同场景的个性化知识推荐方法及系统 | |
CN107220365A (zh) | 基于协同过滤与关联规则并行处理的精准推荐系统及方法 | |
CN110148023A (zh) | 基于逻辑回归的电力积分商品推荐方法及系统 | |
CN112100512A (zh) | 一种基于用户聚类和项目关联分析的协同过滤推荐方法 | |
CN111737578A (zh) | 一种推荐方法及系统 | |
CN106157156A (zh) | 一种基于用户社区的协作推荐系统 | |
CN111949887A (zh) | 物品推荐方法、装置及计算机可读存储介质 | |
CN106897419A (zh) | 融合社交信息的对级排序学习推荐方法 | |
CN111695024A (zh) | 对象评估值的预测方法及系统、推荐方法及系统 | |
CN113157752A (zh) | 一种基于用户画像和情境的科技资源推荐方法及系统 | |
CN112612951A (zh) | 一种面向收益提升的无偏学习排序方法 | |
Duan et al. | A hybrid intelligent service recommendation by latent semantics and explicit ratings | |
Chen et al. | Language model based interactive estimation of distribution algorithm | |
CN115829683A (zh) | 一种基于逆奖赏学习优化的电力积分商品推荐方法及系统 | |
CN108960954B (zh) | 一种基于用户群行为反馈的内容推荐方法及推荐系统 | |
CN114491095A (zh) | 基于时序漂移的潜在因子模型对项目的推荐方法 | |
Mazarura | Topic modelling for short text | |
Ren et al. | A hybrid recommender approach based on widrow-hoff learning | |
CN110956528B (zh) | 一种电商平台的推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |