CN116108246A

CN116108246A - 考虑用户偏好一致性的语义非对称相似性推荐系统

Info

Publication number: CN116108246A
Application number: CN202211555099.2A
Authority: CN
Inventors: 邓江洲; 高炜煌; 王永; 陆聪; 唐仁泰; 郭琦; 胡良涛
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2022-12-06
Filing date: 2022-12-06
Publication date: 2023-05-12

Abstract

本发明涉及一种考虑用户偏好一致性的语义非对称相似性推荐系统，属于推荐技术领域。包括：获取和清洗数据信息；转化评分为模糊语言术语；获取对目标项目i有过评分行为的用户集合U_i；借助概率语言术语集理论，计算项目间的语义相似性；获取用户对项目i和j的偏好信息；利用巴氏系数方法计算项目间的用户偏好一致性；利用用户一致性结果去调整语义相似性；获取项目i和j的共同评价项数量和目标项目i的用户评价数量，利用Sigmoid函数来计算项目间的非对称关系；利用项目间的非对称关系来打破加权后的语义相似性的对称性；利用评分预测方法计算出目标用户u在未评分项目上的预测值；对预测集合排序，并将预测值最高的前n个项目推送给目标用户u。

Description

考虑用户偏好一致性的语义非对称相似性推荐系统

技术领域

本发明涉及推荐技术领域，特别涉及一种考虑用户偏好一致性的语义非对称相似性推荐系统。

背景技术

决策作为人们日常生活中各方面都涉及的重要活动，通常是根据相应的决策标准来对备选方案进行排序或者选择最感兴趣的方案的过程。然而，随着复杂性的增加，这使得个人根据自身经验做出既可靠又满意决定的频率随之降低。推荐系统的兴起，使得它能从超载信息中尽可能选择出最合适的产品或服务来支持在线用户的决策。一个有效的推荐系统可以极大地用户满意度和购买体验，同时增强他们对平台的黏性，从而增加平台的影响力。协同过滤目前是推荐系统中使用最为广泛的技术之一，其基本思想是利用“群体智慧”对系统中的大量信息进行过滤筛选，以产生一系列目标用户可能感兴趣的项目推荐。其中，相似性计算方法是推荐环节中最为重要的一环，其相似性结果的好坏将直接影响到最近邻居的选择，从而影响到评分预测与推荐结果。因此，如何设计一个可靠的相似性方法来提高推荐系统的性能就显得尤为重要。

目前，大多数相似性计算方法主要利用用户评分信息来进行后续推荐，而未从语言信息的角度来衡量项目间的相似性。在实际决策过程中，因获取特定和精准的定量信息的成本很高，人们通常更倾向于用语言定性的表达他们的意见或偏好。语言信息能充分反映用户在决策过程中对特定项目的偏好程度。因此，从定性的角度来评估项目间的相似性就十分有必要。

发明人在进行推荐系统中的相似性计算方法和邻居选择方法研究时，发现现有的基于项目相似性推荐方法只使用了用户评分数据来衡量项目间的相似性，且忽略了项目间的用户偏好一致性，同时在邻居筛选时也未考虑项目间的交互作用的问题，这会使得相似性计算结果不准确和邻居筛选不合适，从而导致预测结果不佳。

发明内容

针对上述问题，本发明提出一种考虑用户偏好一致性的语义非对称相似性推荐系统，包括：

数据采集及准备模块，用于对用户数据进行获取和清洗，以得到系统所需要的信息。

评分转换模块，用于转换用户评分信息为模糊语义信息以形成模糊语义矩阵S。

语义相似性计算模块，借助概率语言术语集相关定义，用于计算两两项目间的语义相似性。

用户一致性计算模块，用于获取用户对项目的积极和消极偏好，并利用巴氏系数从概率分布的角度去计算项目间的用户偏好一致性。

非对称关系计算模块，用于获取两项目间的共同评分用户项和目标项目的评分数量，并利用Sigmoid函数计算两两项目间的非对称相似性。

相似性整合模块，用于整合上述两种或三种相似性计算模块的结果。

邻居搜索模块，用于以三个相似性整合的结果为目标项目i寻找k个最近邻居项目集C_neii。

评分预测获取模块，用于计算目标用户u在未评分项目i上的预测评分值。

推荐结果获取模块，用于为目标用户u找到前n个预测评分值最大的项目集合进行个性化推荐。

本发明所述的相似性推荐系统，所述评分转换模块，用于通过语言术语集S＝{s_α|α＝0,1,...,τ}将用户-项目评分矩阵R中各数值转化为语言术语集中所对应的术语s_α。

本发明所述的相似性推荐系统，所述语义相似性计算模块，用于通过概率语言术语集相关定义计算获取两两项目间的语义相似性，具体包括：

(1)概率语言术语集构建模块，用于构建目标项目i的概率语言术语集。

其中

表示为语言术语I^(r)及其相应的概率

M为推荐系统中所有用户数量，#r_i为项目i被打分为r的用户数量，r_max是评分区间的最大值。根据

的值，对语言术语集中元素进行降序处理，得到重排序后的项目i的概率语言术语集

重复操作，可构建所有项目的概率语言术语集。

(2)语义偏差获取模块，用于计算两两项目间概率语言术语集的偏差程度。

其中k表示概率语言术语集中元素的重排序位置，r_i为项目i的语言术语s_r的下标，

为在

中语言术语的数量。

(3)语义相似性获取模块，用于计算基于概率语言术语集的项目间语义相似性

本发明所述的相似性推荐系统，所述用户一致性计算模块，用于通过巴氏系数方法计算获取两两项目间的用户偏好一致性，具体包括：

(1)用户偏好获取模块，用于获取用户对项目的评价偏好信息。以评分区间为1-5为例，计算用户对目标项目i的积极与消极偏好，公式如下：

其中m为项目i被用户评价的次数，I(r_k)为用户对项目i打分值为r的数量，r_ui为用户u对项目i的评分值。

(2)用户一致性获取模块，用于通过巴氏系数方法计算获得两两项目间的用户偏好一致性结果，公式如下：

其中t表示积极P或消极N的用户偏好，p_i,t为用户对项目i某种偏好t的概率，计算如下：

本发明所述的相似性推荐系统，所述非对称关系计算模块，用于获取共同评分项数量和目标项目评分数量，并通过Sigmoid函数计算获取两两项目间的非对称相似性，具体包括：

目标项目i与项目j的非对称相似性

其中U(i,j)表示为既对项目i又对项目j已评分的用户集合，即共同评分项；U_i表示所有对项目i有过评价的用户集合。

本发明所述的相似性推荐系统，所述相似性整合模块，用于整合以上两种或三种相似性计算模块的结果，具体包括：

(1)第一个相似性整合模块，用于获取考虑用户偏好一致性的语义相似性sim(i,j)_PLTS-BCIT＝sim(i,j)_PLTS·sim(i,j)_BCIT。该相似性结果用于评分预测获取模块。

(2)第二个相似性整合模块，用于获取考虑用户一致性的非对称语义相似性sim(i,j)_PLTS-BCIT-AR＝sim(i,j)_PLTS-BCIT×sim(i,j)_AR。该相似性结果用于邻居搜索模块。

本发明所述的相似性推荐系统，所述邻居搜索模块，用于为目标项目i找到最佳的最近邻居项目集合

具体包括：

(1)相似性排序模块，用于对第二个相似性整合模块所获取的结果进行降序排序，以得到目标项目i与其它项目的关联程度排序。

(2)邻居获取模块，用于获取目标项目i的最近邻居集合；其中包括设定系统所选取的最近邻居数量k，再从相似性排序模块中获取到与目标项目i相似程度最高的前k(为正整数)项目，以形成目标项目i的k个最近邻居项目集合

本发明所述的相似性推荐系统，所述评分预测获取模块，用于通过评分预测方法计算获取目标用户u在未评分项目i上的预测评分值，计算公式如下：

其中

为项目i的平均评分值，r_uj为用户u在项目j上的评分值，

为目标项目i的最近邻居集合。

本发明所述的相似性推荐系统，所述推荐结果获取模块，用于获取目标用户u的推荐列表；其中包括设定系统为目标用户所推荐的项目数量n，再从评分预测获取模块中获取到目标用户u在未评分项目上的预测评分集合，并将该集合内的预测评分值由大到小排序；选取前n个预测值最大的项目推荐给目标用户u，以形成目标用户u的个性化推荐列表。

本发明提出的相似性推荐方法及系统，既从定性又从定量的角度衡量了项目间的相似性，同时考虑了项目间的用户偏好一致性和项目间的非对称关系，这对提高相似性计算结果的准确性与可靠性以及在邻居筛选阶段为目标项目找到最佳邻居项目有着十分积极作用，从而进一步加强推荐系统的预测和推荐能力。

附图说明

图1是本发明的方法过程示意图；

图2是本发明的系统框架图；

图3是本发明在两个数据集下不同最近邻居集数量下的MAE值变化情况；

图4是本发明在两个数据集下不同最近邻居集数量下的F1值变化情况。

具体实施方式

为了使用本发明的目的、技术方案及优点更加清楚明白，以下结合附图，对本发明提出的一种考虑用户偏好一致性的语义非对称相似性推荐方法及系统进行详细说明。应当理解，此处所描述的具体实施方法仅仅用以解释本发明，并不用于限定本发明，本技术领域的普通技术人员在本发明的示值范围内所做出的变化、改动、添加修改或替换，其均应涵盖在本发明的权利要求范围之中。

图1是本发明的相似性推荐方法的过程示意图。从图1可以看出，本发明提出的相似性推荐方法，包括从数据库中获取和清理数据信息，以获得标准化的数据格式；对获取的评分信息进行转化，得到相对应的模糊语言术语；借助概率语言术语集相关定义，计算出项目间的语义相似性；从获取的标准化数据中，统计出用户对项目的偏好特征，再利用巴氏系统方法计算出项目间用户偏好一致性；从获取的标准化数据中，统计出共同评分项和目标项目被评次数，利用Sigmoid函数计算出项目间的非对称关系；将获得的用户一致性结果整合到到语义相似性上，得到加权后的语义相似性；将获得的加权后的语义相似性结果与项目间非对称关系整合在一起，根据整合后的值，筛选出目标项目的最近邻居集合；将获得的最近邻居集合和加权后的语义相似性结果作为输入，利用评分预测方法计算出目标用户在未评分项目上的预测评分值；对获取的预测评分集合进行排序，产生一系列目标用户最可能感兴趣的项目进行推送。

图2是本发明的相似性推荐系统的框架图。从图2可以看出，本发明提出的相似性推荐方法和系统，包括数据采集及准备模块、评分转化模块、语义相似性计算模块、用户一致性计算模块、非对称关系计算模块、相似性整合模块(含第一和第二相似性整合子模块)、邻居搜索模块(含相似性排序模块和邻居获取模块)、评分预测获取模块和推荐结果获取模块。所述数据采集及准备模块用于从数据库中提取数据，并对数据进行清洗和预处理等操作，将其处理为所述评分转化模块所需要的格式；所述评分转化模块用于将所述数据采集及准备模块提供的评分信息转化为模糊语言信息；所述语义相似性计算模块根据所述评分转化模块获取的数据信息来计算项目间的语义相似性；所述用户一致性计算模块根据所述数据采集及准备模块获取的数据信息来计算项目间用户偏好一致性；所述的非对称关系计算模块根据所述数据采集及准备模块获取的数据信息来计算项目间的非对称结果。所述相似性整合模块根据所述的三个计算模块获取的结果进行整合，其中第一相似性整合模块用于整合所述的语义相似性模块与用户一致性模块的结果，第二相似性整合模块用于整合所述的三个计算模块的结果；所述邻居搜索模块根据第二相似性整合模块获取的结果，先使用其中相似性排序模块对获取结果进行内部排序，再通过邻居获取模块来生成最近邻居集合；所述评分预测获取模块根据所述第一相似性整合模块获取的结果与所述邻居搜索模块获取的最近邻居集合进行项目评分预测；所述推荐结果获取模块根据所述评分预测获取模块得到的项目评分预测集合，对其进行内部排序，并将排名靠前的项目推荐给目标用户。

进一步地，以下述情况为例子进行说明：

假设有M个用户U＝{u₁,u₂,...,u_M}和N个项目I＝{i₁,i₂,...,i_N}，用户-项目评分矩阵用[R]^M×N表示；r_ui表示用户在项目i上的评分值，U(i,j)表示为既对项目i又对项目j有过评分行为的用户集合，即共同评分项；U_i表示所有对项目i有过评价的用户集合。

首先通过数据采集及准备模块对系统数据进行获取和清洗，得到假设中的各变量。整个所提相似性推荐系统的具体实施步骤如下所示：

S1：数据采集及准备模块从数据库中获取所需的数据信息，包括用户ID、项目ID和评分信息；

S2：评分转化模块把用户评分信息转为模糊语义信息；

语言术语集是语言决策的基础，决策者通常使用该术语集来表达他们对特定项目的意见或偏好。语言术语集是有限且有序的，其表达式如下：

S＝{s_αα＝0,1,...,τ}

其中，s_α表示某个语言术语的可能性值，s₀和s_τ分别表示语言术语的下限和上限，τ表示为正整数。常见的语言术语集合有：

S＝{s₀＝none,s₁＝very low,s₂＝low,s₃＝medium,s₄＝high,s₅＝very high,s₆＝perfect}

若以推荐系统中评分区间1-5分为例，则需要移除两个语言术语s₀和s₆，使得R中各评分数值转化为S集合中相对应的语言术语。

S3：语义相似性计算模块根据转化得到的语言术语信息，借助概率语言数据集相关定义，计算出项目间的语义相似性；

首先，构建目标项目i的概率语言术语集，公式如下：

其中，

表示为语言术语I^(r)及其相应的概率

其次，计算项目间概率语言术语集的偏差程度，计算公式如下：

其中，k表示概率语言术语集中元素的重排序位置，r_i为项目i的语言术语s_r的下标，

为在

中语言术语的数量。

最后，计算基于概率语言术语集的项目间语义相似性，公式如下：

其中，e^-x为指数函数，其相似性图像为类似遗忘曲线，能更好地区分两个偏差程度较小的项目。

S4：用户一致性计算模块根据获取的评分信息，利用巴氏系数方法来计算项目间用户偏好一致性；

语义相似性计算模块只考虑了项目间的语义相似性，而忽略了用户对项目的评分偏好(积极或消极)，这会导致不准确的相似性结果。该模块首先要评估用户对目标项目i的积极和消极偏好，公式如下：

其中，m为项目i被用户评价的次数，I(r_k)为用户对项目i评分为r的数量。

然后，采用巴氏系数方法从概率分布的角度来度量项目间用户偏好一致性，公式如下：

其中，t表示积极P或消极N的用户偏好，p_i,t为用户对项目i某种偏好t的概率，计算如下：

S5：非对称关系计算模块根据获取的评分信息，首先统计出共同评分项数量|U(i,j)|和目标项目i被评分次数|U_i|，再利用Sigmoid函数计算出目标项目i和项目j的非对称相似性，公式如下：

与传统的对称相似性方法相比，非对称相似性方法强调了项目间的相互影响，以及共同评分项的重要性，这对后续为目标项目筛选合适邻居起着至关重要的作用。

S6：相似性整合模块对上述S3、S4和S5中得到的各相似性结果进行有效整合；

其中包括第一个相似性整合模块，用来整合S3和S4的结果，以提高相似性计算结果的准确性和可靠性。

sim(i,j)_PLTS-BCIT＝sim(i,j)_PLTS·sim(i,j)_BCIT

第二个相似性整合模块，用来整合S3、S4和S5的结果，以打破项目间相似性结果的对称性，从而为目标项目找到更加合适的最近邻居项目集合。

sim(i,j)_PLTS-BCIT-AR＝sim(i,j)_PLTS-BCIT×sim(i,j)_AR

S7：邻居搜索模块根据第二个相似性整合模块所获取的相似性结果，先使用相似性排序模块对其结果进行内部从大到小排序，得到目标项目i与其它项目的关联程度排序；再根据系统设定的最近邻居数量k(为正整数)，从相似性排序模块中获取到与目标项目i相似程度最高的前k个项目，以形成目标项目i的k个最近邻居项目集合C_neii。

S8：评分预测获取模块根据第一个相似性整合模块所得到的相似性结果与邻居搜索模块所找到的最近邻居项目集合，可计算出目标用户u在未评分项目i上的预测值p_ui，公式如下：

其中，

为项目i的平均评分值。

S9：推荐结果获取模块根据S8所计算的一系列预测评分项目集合，以及系统设定的推荐项目数量n，先对预测集合内的评分值从大到小排序，再选取前n个预测值最大的项目推荐给目标用户u，以形成目标用户u的个性化推荐列表。

图2-3分别度量了提出的方法在两个方面的指标表现，两个度量分别是：平均绝对误差(MAE)和F1值。它们的计算方式及度量内容如下所示：

平均绝对误差：在本发明中衡量的是推荐方法的预测准确性，用来检验方法的预测值与真实值之间的偏差，可以更好地反映预测值误差的实际情况。平均绝对误差越小说明方法有更好的预测能力。其计算方法如下：

其中，m表示为系统中被测试的用户数量，n表示为被预测的项目数量；r_ui和p_ui分别用户u在项目i上的真实评分值与预测评分值。

F1值：是由精确率(Precision)和召回率(Recall)组合而成的指标，用于评估推荐系统准确率的综合性能。其中精确率在本发明中度量的是推荐给用户的项目列表中用户真正喜欢的项目比例；而召回率是在本发明中度量的是推荐给用户的项目列表中用户真正喜欢的项目个数占用户所有喜欢项目个数的比例。它们的计算公式如下：

其中，I_ar和I_pr分别表示真实推荐和预测推荐的项目数量。

Claims

1.一种考虑用户偏好一致性的语义非对称相似性推荐系统，其特征在于，包括：

数据采集及准备模块，用于对用户数据进行获取和清洗，以得到系统所需要的标准化数据信息；

评分转换模块，用于转换用户评分信息为模糊语义信息以形成模糊语义矩阵S；

语义相似性计算模块，借助概率语言术语集相关定义，用于计算两两项目间的语义相似性；

用户一致性计算模块，用于获取用户对项目的积极和消极偏好，并利用巴氏系数从概率分布的角度去计算项目间的用户偏好一致性；

非对称关系计算模块，用于获取两项目间的共同评分用户项和目标项目的评分数量，并计算两两项目间的非对称相似性；

相似性整合模块，用于整合上述两种或三种相似性计算模块的相似性结果；

邻居搜索模块，用于以三个相似性整合的结果为目标项目i寻找k个最近邻居项目集

评分预测获取模块，用于计算目标用户u在未评分项目i上的预测评分值；

2.如权利要求1所述的相似性推荐系统，其特征在于，所述评分转换模块，用于通过语言术语集S＝{s_α|α＝0,1,...,τ}将用户-项目评分矩阵R中各数值转化为语言术语集中所对应的术语s_α。

3.如权利要求1所述的相似性推荐系统，其特征在于，所述语义相似性计算模块，用于通过概率语言术语集相关定义计算获取两两项目间的语义相似性，具体包括：

其中

表示为语言术语I^(r)及其相应的概率

重复操作，可构建所有项目的概率语言术语集。

为在

中语言术语的数量。

4.如权利要求1所述的相似性推荐系统，其特征在于，所述用户一致性计算模块，用于通过巴氏系数方法计算获取两两项目间的用户偏好一致性，具体包括：

5.如权利要求1所述的相似性推荐系统，其特征在于，所述非对称关系计算模块，用于获取共同评分项数量和目标项目评分数量，并通过Sigmoid函数计算获取两两项目间的非对称相似性，具体包括：

目标项目i与项目j的非对称相似性

6.如权利要求1所述的相似性推荐系统，其特征在于，所述相似性整合模块，用于整合以上两种或三种相似性计算模块的结果，具体包括：

7.如权利要求1所述的相似性推荐系统，其特征在于，所述邻居搜索模块，用于为目标项目i找到最佳的最近邻居项目集合

具体包括：

(2)邻居获取模块，用于获取目标项目i的最近邻居集合；其中包括设定系统所选取的最近邻居数量k(为正整数)，再从相似性排序模块中获取到与目标项目i相似程度最高的前k个项目，以形成目标项目i的k个最近邻居项目集合

8.如权利要求1所述的相似性推荐系统，其特征在于，所述评分预测获取模块，用于通过评分预测方法计算获取目标用户u在未评分项目i上的预测评分值，计算公式如下：

其中

为项目i的平均评分值，r_uj为用户u在项目j上的评分值，

为目标项目i的最近邻居集合。

9.如权利要求1所述的相似性推荐系统，其特征在于，所述推荐结果获取模块，用于获取目标用户u的推荐列表；其中包括设定系统为目标用户所推荐的项目数量n，再从评分预测获取模块中获取到目标用户u在未评分项目上的预测评分集合，并将该集合内的预测评分值由大到小排序；选取前n个预测值最大的项目推荐给目标用户u，以形成目标用户u的个性化推荐列表。