CN114936890A

CN114936890A - 一种基于逆倾向加权方法的反事实公平的推荐方法

Info

Publication number: CN114936890A
Application number: CN202210345565.8A
Authority: CN
Inventors: 吴乐; 邵鹏阳; 张琨; 连德富; 洪日昌; 李勇; 汪萌
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2022-08-23

Abstract

本发明公开了一种基于逆倾向加权方法的反事实公平的推荐方法，包括：1.利用用户和产品的交互记录构建评分矩阵，利用用户的二值敏感属性构建敏感属性矩阵；2.提出推荐的反事实公平性定义；3.预训练推荐模型，获得用户和产品的表征；4.通过图卷积方式进行特征传播，构建特征到敏感属性的分类器；5.提出基于图的自监督学习正则化项；6.固定分类器参数，获得针对敏感属性取值的倾向分数；7.通过逆倾向加权技术构建推荐的损失函数，更新模型参数。本发明从因果影响估计的角度出发，避免从交互数据中构建因果图，以实现推荐的反事实公平性，同时兼顾推荐的准确度，保证推荐内容的质量，为促进推荐的公平性研究提供了有利基础。

Description

一种基于逆倾向加权方法的反事实公平的推荐方法

技术领域

本发明涉及推荐领域，具体来说是一种基于逆倾向加权方法的反事实公平的推荐方法。

技术背景

随着信息量的爆炸性增长，丰富的音视频、商品等等资源给用户带来了信息过载的难题。为了解决这个问题，个性化推荐系统技术受到了广泛研究。通过将挖掘用户的历史记录、语义特征等信息，个性化推荐系统技术建模用户潜在的偏好，并将用户潜在感兴趣的产品资源推荐给用户，提高了用户的浏览体验。

协同过滤的方法是一种被广泛采用的个性化推荐系统技术。具体地，协同过滤方法通过将用户和产品的ID映射到嵌入表征空间，比较用户和产品表征的相似性获得用户和产品的预测交互情况，然后通过缩小预测交互和历史交互的差距来优化嵌入表征空间的参数。近年来，由于用户-产品交互天然地构成一个二部图结构，通过挖掘二部图的用户和产品之间的高阶协同信息，基于图卷积的推荐系统显著提高了性能，成为了主流推荐系统算法之一。然而，传统协同过滤算法在挖掘协同信息时，往往忽略公平性的要求。基于不同的敏感属性取值，用户群体往往可以被分为多个不同的用户分组。不同用户分组往往在交互行为上有着显著的差距，因此得到的推荐结果也有非常明显的区别。这种推荐结果上的区别往往违反了法律和道德意义层面上的公平原则，比如，工作推荐系统会针对资质相似的男性用户和女性用户推荐截然不同的工作，有性别歧视的风险。

现有的以公平性为目标的协同过滤推荐模型大多从数据角度分析用户分组之间的差异；数据角度的公平性往往强烈依赖于公平性的定义，不同的公平性定义之间往往不统一，甚至有很强的冲突；因此，这些数据角度分析的公平并不是最优的公平性分析方式，反而因为强制约束不同的个体或者群体趋于一致，造成了明显的推荐系统的性能损失。

发明内容

本发明为了解决现有技术的不足之处，从因果影响估计的角度出发，避免从复杂的交互数据中构建因果图，提出一种基于逆倾向加权方法的反事实公平的推荐方法，以期能实现推荐的反事实公平性，即用户的敏感属性值变化不会对推荐结果产生影响；同时兼顾推荐的准确度性能，保证推荐内容的质量，从而为改善推荐的公平性提出简单有效的优化方式，为促进推荐系统的公平性研究发展提供有利基础。

本发明为达到上述发明目的，采用如下技术方案：

本发明一种基于逆倾向加权的反事实公平的推荐方法的特点是按如下步骤进行：

步骤1、利用用户和产品的交互记录构建评分矩阵，利用用户的二值敏感属性值构建二值敏感属性矩阵：

令U表示用户集合，且U＝{u₁,...,u_i,...,u_M},u_i表示第i个用户，M表示用户总数，1＜i＜M；令V表示产品集合V＝{v₁,...,v_j,...,v_N},v_j表示第j个产品，N表示产品总数，1＜j＜N；令r(u_i,v_j)表示第i个用户u_i对第j个产品v_j的评分值，则用户对产品的评分矩阵记为R＝{r(u_i,v_j)}_M×N，如果第i个用户u_i和第j个产品v_j有交互记录，则r(u_i,v_j)＝1，否则，r(u_i,v_j)＝0；

代表第i个用户u_i和第j个产品v_j之间的预测的交互关系；根据用户对产品的评分矩阵R，以用户和产品为节点，两者交互记录为边，构建用户-产品二部图G＝U,V,R；

令用户的二值敏感属性矩阵S＝[s₁,...,s_i,...,s_M]∈{0,1}，其中，s_i表示第i个用户u_i的敏感属性值；根据敏感属性值，用户集合U被拆分成三个子集，包括：U₀(|U₀|＝M₀)代表敏感属性值为0的用户子集，U₁(|U₁|＝M₁)表示敏感属性值为1的用户子集，U_wos(|U_wos|＝M-M₁-M₀)代表缺失敏感属性值的用户子集；

步骤2、基于估计二值敏感属性值对推荐结果的因果影响，提出反事实公平性的定义：

步骤2.1、以所有用户的二值敏感属性值为真实情况，利用式(1)表示事实世界中第i个用户u_i对第j个产品v_j的预测的用户偏好

以所述事实世界中所有用户的二值敏感属性值的相反值为想象情况，利用式(2)表示预测反事实世界中第i个用户u_i对第j个产品v_j的预测的用户偏好

式(1)和式(2)中，

代表当第i个用户u_i的敏感属性值s_i被强制赋为“1”时，第i个用户u_i对第j个产品v_j的潜在预测偏好，

代表当第i个用户u_i的敏感属性值s_i被强制赋为“0”时的潜在预测偏好；

步骤2.2、通过对比式(1)和式(2)，反映反事实世界和事实世界预测的用户偏好之间的区别，从而构建如式(3)所示的反事实公平性定义；

当满足式(3)时，事实世界和反事实世界的用户偏好完全相同，即二值敏感属性值对推荐结果没有任何因果影响；

式(3)中，p(u_i,v_j)表示训练数据的数据分布，

表示从训练数据中随机采样并计算数学期望；

步骤3、通过预训练的方式训练推荐模型，将用户对产品的评分矩阵R作为输入，对用户历史行为进行编码，获得用户和产品的表征：

步骤3.1、将用户和产品映射到预训练过程对应的用户嵌入表征Ρ＝[p₁,...,p_i,...,p_M]和产品嵌入表征Q＝[q₁,...,q_j,...,q_N]；其中，p_i表示第i个用户u_i的表征，共有M个用户；q_j表示第j个产品v_j的表征，共有N个用户；

步骤3.2、以用户的嵌入表征和产品的嵌入表征的内积作为预测的用户偏好

步骤3.3、建立如式(4)所示的损失函数

式(4)中，σ表示sigmoid激活函数；D_i表示第i个用户u_i的训练数据，包括评分矩阵R的对应的正样本和随机采样获得的负样本，即

代表第i个用户u_i交互过的产品，即第i个用户u_i在用户-产品二部图G中的一阶邻居；

代表第i个用户u_i没有交互过的产品；

表示第i个用户u_i对第w个产品v_w的预测评分，λ||·||²代表L2正则化项；

步骤3.4、通过随机梯度下降法对损失函数

进行求解，使得式(4)达到最小，从而得到用户和产品的最优表征矩阵P^*和Q^*，以完成推荐模型的预训练；

步骤4、构建图卷积模块f以传播特征，并构建传播后的用户特征到敏感属性的分类器d：

步骤4.1、定义总卷积层数为K，当前卷积层为k，初始化k＝0；

初始化第k层图卷积层的用户特征向量

为第i个用户u_i的预训练表征

初始化第k层图卷积层的产品特征向量

为第j个产品v_j的预训练表征

步骤4.2、通过图卷积方式传播用户特征，从而利用式(5)预测第k+1层图卷积层的第i个用户u_i的用户特征向量

和第j个产品v_j的产品特征向量

式(5)中，AGG代表图卷积操作，

代表第j个产品v_j在用户-产品二部图G的一阶邻居；步骤4.3、k+1赋值给k后，重复步骤4.2，对用户的节点特征进行传播，直到k＝K为止，从而获得第i个用户u_i的第K层表征

进而获得所有用户的第K层表征

步骤4.4、利用式(6)构建用户的第K层表征

到用户敏感属性标签S＝[s₁,...,s_i,...,s_M]的分类器d：

式(6)中，MLP代表多层感知机，用于将用户的表征映射H^K到预测的敏感属性

表示第i个用户u_i的预测的敏感属性；

步骤4.5、利用式(7)建立交叉熵损失函数

在不缺失敏感属性标签的用户节点U₀∪U₁上计算交叉熵损失

并最小化交叉熵损失函数

以更新优化分类器的参数：

式(7)中，Θ_d表示敏感属性分类器d的可训练参数，Θ_f表示图卷积模块f的可训练参数；

步骤5、构建图的自监督学习正则化项，以提升敏感属性分类器d的性能：

步骤5.1、在训练过程中随机删除所述用户-产品二部图G中的节点，从而构造损坏点的图

在训练过程中随机删除所述用户-产品二部图G的边，从而构造损坏边的图

步骤5.2、按照步骤4.1-步骤4.3的过程，对损坏的点图

和损坏边的图

中用户节点进行特征传播，分别获得用户在损坏的点图

中的第K层表征

和损坏边的图

中的第K层表征

表示第i个用户u_i在损坏的点图

中的第K层表征；

表示第i个用户u_i在损坏边的图

中的第K层表征；

步骤5.3、利用式(8)建立自监督学习正则化项

式(8)中，c(·)表示表征之间的余弦相似度，

代表标记函数，当[m≠i]的条件满足时，标记函数值为1，否则值为0；Ω_i表示在损坏边的图

和损坏点的图

之间，第i个用户u_i的表征与其他用户表征的相似度，并有：

步骤5.4、合并交叉熵损失函数

和自监督学习正则化项

使得式(9)所示的损失函数最小，以更新优化分类器的参数：

式(10)中，β是超参数，用于控制自监督学习正则化项

的所占权重；

步骤6、固定训练好的分类器参数，输入所有用户的第K层表征

获得针对敏感属性值的倾向分数

表示根据用户的历史交互记录，用户的敏感属性被分类器判定为“1”的概率；并获得针对敏感属性值的倾向分数

表示根据用户的历史交互记录，用户的敏感属性被分类器判定为“0”的概率；

步骤7、通过逆倾向加权方法估计式(3)中的潜在预测偏好的期望

和

从而估算出用户的敏感属性对于推荐预测结果的因果效应，如(11)所示；

步骤8、基于所述因果效应，提出一种额外的正则化项，来实现最小化因果效应的目标；

步骤8.1、基于额外的正则化项，建立如式(12)所示的损失函数：

式(15)中，

是额外的正则化项，μ表示控制损失函数和正则化项的平衡的超参数；Ε表示用户的总训练过程对应的嵌入表征向量，且Ε＝[e₁,...,e_i,...,e_M]，e_i表示第i个用户u_i的总训练过程对应的嵌入表征；T表示用户的总训练过程对应的嵌入表征向量，且T＝[t₁,...,t_j,...,t_N]，t_j表示第i个产品v_j的总训练过程对应的嵌入表征；

步骤8.2、使用随机梯度下降法对总损失函数

进行优化求解，使得式(12)达到最小，以获得最优化的嵌入矩阵E^*和T^*，从而实现反事实公平的推荐预测。

与已有技术相比，本发明有益效果体现在：

1.本发明采用了反事实公平性的定义，认为个体用户应当得到公平的推荐结果而不被其敏感属性取值所影响。具体地说，本发明假设了个体用户敏感属性改变的情况，估计了个体用户敏感属性改变与否在推荐结果上的影响，并将这种影响降低到最小，以此保证了推荐的公平性。相对于相互冲突的数据性定义，本发明的反事实公平性定义具有解释性强、不对推荐性能产生大的损失等优点；

2.本发明利用了潜在因果框架中的逆倾向加权的方法，模拟了理想的随机对照实验场景，实现了推荐场景下的反事实公平性；

3.本发明在估算逆倾向的过程中，以用户的预训练表征初始化特征，利用图卷积和自监督学习的方式捕捉二部图的结构信息，充分考虑了用户历史交互中的协同信息和二部图结构信息的重要性，使得逆倾向估算的精确性得到提高。

附图说明

图1为本发明基于逆倾向加权方法的反事实公平的推荐方法的流程图。

具体实施方式

本实施例中，一种基于逆倾向加权的反事实公平的推荐方法，如图1所示，是按如下步骤进行：

式(1)和式(2)中，

式(3)中，p(u_i,v_j)表示训练数据的数据分布，

表示从训练数据中随机采样并计算数学期望；

步骤3.3、建立如式(4)所示的损失函数

代表第i个用户u_i没有交互过的产品；

表示第i个用户u_i对第w个产品v_w的预测评分，λ||·||²代表L2正则化项，用来防止过拟合；

步骤3.4、通过随机梯度下降法对损失函数

步骤4.1、定义总卷积层数为K，当前卷积层为k，初始化k＝0；

初始化第k层图卷积层的用户特征向量

为第i个用户u_i的预训练表征

初始化第k层图卷积层的产品特征向量

为第j个产品v_j的预训练表征

和第j个产品v_j的产品特征向量

式(5)中，AGG代表图卷积操作，

代表第j个产品v_j在用户-产品二部图G的一阶邻居；

步骤4.3、k+1赋值给k后，重复步骤4.2，对用户的节点特征进行传播，直到k＝K为止；从而获得第i个用户u_i的第K层表征

进而获得所有用户的第K层表征

其中，从初始化的第0层特征向量进行图卷积传播，到获得所有用户第K层表征的全部卷积过程可用

来表示；

步骤4.4、利用式(6)构建用户的第K层表征

到用户敏感属性标签S＝[s₁,...,s_i,...,s_M]的分类器d：

表示第i个用户u_i的预测的敏感属性；

步骤4.5、利用式(7)建立交叉熵损失函数

并最小化交叉熵损失函数

以更新优化分类器的参数：

步骤5.2、按照步骤4.1-步骤4.3的过程，对损坏的点图

和损坏边的图

中用户节点进行特征传播，分别获得用户在损坏的点图

中的第K层表征

和损坏边的图

中的第K层表征

表示第i个用户u_i在损坏的点图

中的第K层表征；

表示第i个用户u_i在损坏边的图

中的第K层表征；

步骤5.3、利用式(8)建立自监督学习正则化项

式(8)中，c(·)表示表征之间的余弦相似度，

和损坏点的图

之间，第i个用户u_i的表征与其他用户表征的相似度，并有：

步骤5.4、合并交叉熵损失函数

和自监督学习正则化项

使得式(9)所示的损失函数最小，以更新优化分类器的参数：

式(10)中，β是超参数，用于控制自监督学习正则化项

的所占权重；

获得针对敏感属性值的倾向分数

和

估算出用户的敏感属性对于推荐预测结果的因果效应；

步骤7.1、根据贝叶斯法则

潜在预测偏好的期望

和

可转化为：

步骤7.2、用敏感属性值为1的用户子集U₁(|U₁|＝M₁)，占有敏感属性的用户子集U₁+U₀(|U₁+U₀|＝M₁+M₀)的比例来估计p(s_i＝1)的值

用敏感属性值为0的用户子集U₀(|U₀|＝M₀)占有敏感属性的用户子集U₁+U₀(|U₁+U₀|＝M₁+M₀)的比例来估计p(s_i＝0)的值

步骤7.3、因为用户的敏感属性只与用户有关，与对应产品无关，因此，使用根据针对敏感属性值的倾向分数

和

估计式(10)和式(11)中的条件概率p(s_i＝1|u_i,v_j)和p(s_i＝0|u_i,v_j)；则潜在预测偏好的期望

和

可以被估测为：

步骤7.4、基于估测的潜在预测偏好的期望，用户的敏感属性对于推荐预测结果的因果效应可以被表示为：

步骤8、基于式(14)的逆倾向加权方法估计的敏感属性对于推荐预测结果的因果效应，提出一种额外的正则化项，来实现最小化因果效应的目标；

步骤8.1、基于额外的正则化项，建立如式(15)所示的损失函数：

式(15)使得推荐系统的预测结果同时满足拟合用户和产品之间的真实评分的要求和反事实公平性的要求；式(15)中，

是额外的正则化项，最小化该正则化项可以使得式(14)最小，即满足敏感属性对于推荐结果的因果效应降低到最低的约束，以保证反事实的公平性。μ表示控制损失函数和正则化项的平衡的超参数；Ε表示用户的总训练过程对应的嵌入表征向量，且Ε＝[e₁,...,e_i,...,e_M]，e_i表示第i个用户u_i的总训练过程对应的嵌入表征；T表示用户的总训练过程对应的嵌入表征向量，且T＝[t₁,...,t_j,...,t_N]，t_j表示第i个产品v_j的总训练过程对应的嵌入表征。

步骤8.2、使用随机梯度下降法对总损失函数

进行优化求解，使得式(15)达到最小，以获得最优化的嵌入矩阵E^*和T^*；通过引入一个额外的正则化项，式(15)同时满足了推荐系统的精度需求和用户敏感属性对推荐系统的预测结果不存在因果效应的需求，从而实现反事实公平的推荐预测。

实施例：

为了验证本方法的有效性，本发明采用推荐系统公平性领域常用的公开数据集：Movielens-1M。本发明采用被广泛采用的HR和NDCG作为推荐系统的性能评价指标，越高的结果代表越优秀的推荐系统性能；同时，采用Demographic Parity原则、EqualOpportunity原则和Counterfactual Fairness原则在TopK产品的基础上分别定义了新的公平性评价指标DP@K,EO@K以及ATE指标。公平性指标值越低，代表推荐算法越公平。

表1本发明方法和对比方法在Movielens-1M上推荐性能结果

表2本发明方法和对比方法在Movielens-1M上推荐公平性结果

如表1所示，相比其他公平性方法(FairGo，FairGNN)，本发明(CFair-re、CFair-dn、CFair-dual)在Movielens-1M数据集上造成了更小的推荐系统的性能结果损失；如表2所示，本发明在Movielens-1M数据集上，取得了最优秀的公平性结果；实验结果充分验证了本发明的有效性。