CN116662674A

CN116662674A - 一种基于高效马尔科夫毯学习机制的服务推荐方法及系统

Info

Publication number: CN116662674A
Application number: CN202310940750.6A
Authority: CN
Inventors: 王愿; 曹骞; 冯松; 丁泽舟; 张以文
Original assignee: Anhui Pattern Recognition Information Technology Co ltd
Current assignee: Anhui Pattern Recognition Information Technology Co ltd
Priority date: 2023-07-28
Filing date: 2023-07-28
Publication date: 2023-08-29
Anticipated expiration: 2043-07-28
Also published as: CN116662674B

Abstract

本发明提供了一种基于高效马尔科夫毯学习机制的服务推荐方法，应用于服务推荐平台，其特征在于，包括：S1：从表征贝叶斯网络的数据集中获取两个节点之间的关系；S2：利用最大相关最小冗余MRMR方法，获取目标变量的父子变量；S3：结合S2中的父子变量确定非父子变量，计算节点之间互信息关系并保持降序排序；S4：结合S3中的结果，从非父子变量筛选出候选配偶变量；S5：从候选配偶变量中根据配偶变量的性质识别真实配偶节点，从而提升效率，并结合S2中获取的父子变量，得到目标变量的马尔科夫毯集合。所述方法减少了计算机资源的消耗，提升了运算平台的性能。

Description

一种基于高效马尔科夫毯学习机制的服务推荐方法及系统

技术领域

本发明涉及服务推荐领域，特别是一种基于高效马尔科夫毯学习机制的服务推荐方法及系统。

背景技术

随着互联网和信息技术的快速发展，电子商务、网上服务与交易等网络业务越来越普及，大量的信息聚集起来，形成海量信息。用户想要从海量信息中快速准确地寻找到自己感兴趣的信息已经变得越来越困难，特别是在各类电子商务领域中这点显得更加突出。为了解决这个问题，各类个性化服务推荐系统应运而生。

对于服务推荐，其关键技术之一是对大量用户数据进行准确的特征选择。其中，马尔科夫毯理论是常见的因果特征选择策略，相较于传统的特征选择方法，其更多专注特征之间的因果关系，而不是相关关系，从而能够提升推荐模型的可解释性和鲁棒性。在因果贝叶斯网络中，目标变量的马尔科夫毯集合暗示了变量的局部因果关系，从而能够应用于服务推荐模型。为了提升马尔科夫毯学习的效果，学者们从多种角度提出了不同的方案。然而现有的一些马尔科夫毯学习方法仍然具有高复杂度，效率较低的缺点，在一些节点数量较多的贝叶斯网络上难以取得理想的效果，而且会造成服务平台计算资源、存储空间的消耗较大。因此如何在降低计算机资源消耗的同时保证在多层网络中特征选择的正确性，是目前亟需解决的技术难题。

发明内容

针对现有方法的以上缺陷及改进需求，本发明的目的在于提供一种基于高效马尔科夫毯学习机制的服务推荐方法及系统。本发明使用互信息对变量关系的量化，我们使用两个参数δ₁和δ₂分别用来控制父子变量的候选配偶集合的大小，从而简化问题规模，提高效率。在方法的输入阶段需要将代表整个BN网络数据的数据集，以及感兴趣的目标变量作为输入。而经过算法的处理，在网络中暗含的目标变量的马尔科夫毯成为算法的输出，并成为服务推荐模型的一种可解释性与鲁棒性更高的一个特征集合，并使用该特征集合构建推荐过程。具体来说，本发明从马尔科夫毯学习的两阶段过程出发，使用分别简化两阶段学习过程的策略来实现高效的马尔科夫毯学习机制，降低了计算的复杂度，减少了计算机资源消耗，提高了推荐过程的速度和准确率。

根据本发明的目的，本发明提出了一种基于高效马尔科夫毯学习机制的服务推荐方法，应用于服务推荐平台，包括如下的步骤：

S1：从表征贝叶斯网络的数据集中获取两个节点之间的关系；

S2：利用最大相关最小冗余（Max-Relevance and Min-Redundancy，MRMR）方法，获取目标变量的父子变量；

S3：结合S2中的父子变量确定非父子变量，计算节点之间互信息关系并保持降序排序；

S4：结合S3中的结果，从非父子变量筛选出候选配偶变量；

S5：从候选配偶变量中根据配偶变量的性质识别真实配偶节点，从而提升效率，并结合S2中获取的父子变量，得到目标变量的马尔科夫毯集合。

其中，所述表征贝叶斯网络的数据集为用户行为信息的集合，所述马尔科夫毯集合用于服务推荐模型的用户特征选择，所述服务推荐模型依据前述选择出来的用户特征进行网络训练。

所述步骤S1-S5的具体实施方式参见下文。

本发明还提供了可编程的各类处理器（FPGA、ASIC或其他集成电路），所述处理器用于运行程序，其中，所述程序运行时执行上述方法中的步骤；本发明还提供了对应的计算机推荐系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法中的步骤。

本发明挖掘了因果网络中节点之间的因果关系以学习马尔科夫毯集合，利用父子节点和配偶节点识别过程的连续性，通过简化在因果网络中迭代识别目标变量父子变量和从其他变量中识别配偶变量的过程，结合新的识别节点之间的因果关系策略简化马尔科夫毯学习过程，降低了马尔科夫毯学习过程的复杂度，进而减少了计算机资源消耗，提高了推荐过程的速度和准确率。

本发明具备如下的有益效果：

1.传统马尔科夫毯学习具有极高的复杂度，本文提出的两阶段分别简化的方法简化了马尔科夫毯学习的过程，减少了计算机资源的消耗，提升了运算平台的性能。

2.在配偶变量的学习中，不仅利用了节点间的因果关系，还考虑了非相关节点的冗余性，在提升运算速度的同时提升了结果准确率。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本发明的技术方案，并不构成对本发明技术方案的限制。

图1是本发明一实施例所提供的应用于的服务推荐平台的高效马尔科夫毯学习机制的流程示意图；

图2是本发明一实施例所提供的父子变量的示意图；

图3是本发明一实施例所提供的配偶变量的示意图；

图4是本发明一实施例所提供的非配偶变量的示意图。

具体实施方式

为了更清楚地说明本发明的目的和技术方案，下面将结合本发明申请实施例中的附图，对本发明进行进一步介绍说明。显而易见地，下面描述的实施例仅是本发明一部分实施例，而不是全部的实施例。在没有创造性劳动前提下，本领域普通技术人员基于本发明的实施例所得到的其他实施例，都应属于本发明的保护范围。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

本发明主要用于提升服务推荐平台的性能。服务推荐平台中使用马尔科夫毯学习机制对用户数据进行挖掘和特征选择，而后完成服务推荐模型的构建。然而传统马尔科夫毯学习方法计算复杂，效率和准确性不足。为了解决现有学习方法的缺陷，本发明提出了先通过基于概率分布的互信息的方式度量节点之间的关系，再结合MRMR方法通过因果网络中的数据相关性识别目标变量的父子变量，最后基于上一个步骤的输出用候选配偶集合代替全集简化配偶变量识别的过程，从而实现高效马尔科夫毯学习过程，提升了运算速度，提高了计算机资源效率。

结合图1，本发明所提出的一种基于高效马尔科夫毯学习机制的服务推荐方法，包括如下的步骤：

S2：利用最大相关最小冗余（MRMR）方法，获取目标变量的父子变量；

S4：结合S3中的结果，从非父子变量筛选出候选配偶变量；

其中，所述表征贝叶斯网络的数据集为用户行为信息的集合，所述马尔科夫毯集合用于服务推荐模型的用户特征选择，所述服务推荐模型依据前述选择出来的用户特征进行网络训练。通过准确的特征选择进而能够提高服务推荐的针对性，提升用户体验。

进一步的，所述S1步骤包括：

S11：已知的贝叶斯网络是由节点表示变量，有向边表示节点关系的有向无环图，可以由BN=<U,G,P>表示，其中U表示一组节点，G表示有向无环图(DAG)，P表示图上的联合概率分布；

S12：与贝叶斯网络相对应的数据集D是与概率分布相统一的数据的集合，由分类取值表征，通过数据集内的数据，可以计算出贝叶斯网络三要素中的P，从而度量节点之间关系；

S13：基于变量的概率分布，互信息可以定义为变量X的信息熵（H(X)）减去以其他变量Y为条件的条件熵（），其中x和y分别为变量X和Y可能的取值，P(x)，P(y)，P(x,y)分别表示变量X取值为x的概率，变量Y取值为y的概率，以及两者的联合概率。

S14：从数据集计算变量的概率分布，从而计算变量之间的互信息，可以用来表征变量之间的关系，而贝叶斯网络中不只有两个节点之间的关系，在第三个节点介入做条件的条件互信息如下所示，其中代表以Y和Z变量为条件集的X的信息熵，/>表示在Z取值为z时，X和Y取值分别为x和y的概率：

S15：基于如上两个互信息相关的概念，通过计算变量之间的互信息来衡量变量之间的相关关系，可以将变量分为强相关变量，弱相关变量和冗余变量。

其中，强相关变量可以定义为满足如下条件的变量：>0，其中U表示变量全集；类似地，弱相关变量在满足如下条件时被定义：/>= 0且/>S/>U\{Y}，>0，其中S是U的一个子集；最后是冗余变量，需要满足/>S/>U\{Y}且/>= 0的条件。

所述S2步骤包括：

S21：父子变量被定义为与目标变量直接相连的变量，其中，如X->C结构中，X则为父变量，反之X<-C结构中，X则为子变量。如图2所示，为父子变量示意图。

S22：最大相关最小冗余MRMR是特征选择过程常用的规则，旨在于获得最大的相关关系最小的冗余关系，应用在贝叶斯网络中，定义父子变量与配偶变量为强相关变量，其他变量为弱相关或者冗余变量。

S23：假设C表示目标变量，X和Y表示随机变量，U表示整个变量集，S为U\C的一个子集，表示X与C在条件集S下的互信息。MRMR方法的目标函数为：

S24：互信息具有传递性质的链式法则，具体来说如下所示，其中I(X;Y;Z)表示X,Y和Z三个变量的联合互信息，I(X;Y|Z)等为S14所示的条件互信息：

S25：在公式(4)的基础上，替换其中一个变量为集合S，=I(X;S) -=I(X;C) -/>，目标函数被分解为：

其中，X ^*为目标变量，为满足等号右边最大取值的X变量。

S26：使用集合S参与运算的复杂度是较高的，根据互信息的链式法则，最终得到MRMR方法的实际目标函数为：

其中U _i表示当前所计算的变量；

S27：使用δ₁（预定义的父子集合规模参数，大于此参数，认定为父子变量）为强相关变量的分界线，根据目标函数，选择相关度最高，冗余度最低的变量，即目标变量的父子变量。

所述S3步骤包括：

S31：根据MRMR方法的目标函数，已经识别的父子变量被保存，而所有的变量都经历了与目标变量计算互信息的步骤。

S32：取得上一步骤的计算结果，将计算过的每个变量与目标变量对应的互信息保存到一个数组中，数组大小为1行n列，n为出去目标变量外变量全集的大小。

传统的方法在使用条件独立性测试判断变量是否是PC变量后，将独立变量与目标变量对应的分离集进行保存，但是由于条件集的指数级特性，保存每一个变量的独立性测试结果是不合理的。那么在下一个步骤时，如果用到这个结果还需要再进行一次条件独立性测试，造成了极大的时间空间资源的浪费。因此，在这个步骤，我们将互信息的计算结果用矩阵进行保存，采用以一个小空间代价换大时间消耗的策略，进一步提升方法的效率。

S33：从这个数组中经过MRMR的目标函数已经去除了目标变量的父子变量，将这个数组中剩余的非父子变量的互信息进行降序排序并保存。

所述S4步骤包括：

S41：根据马尔科夫毯相关定理，配偶节点同样是目标变量的强相关变量，同样可以通过比较筛选的方式找到候选配偶集合。

S42：与父子变量一样，配偶同样可以用阈值的方式筛查，模仿筛选父子变量的过程，通过实验方式确定预定义的第二个阈值为δ₂（预定义的候选配偶集合规模参数，大于此参数，认定为候选配偶变量）用以筛选候选配偶集合。

S43：从降序排序的互信息的数组中将值大于δ₂的变量取出并作为候选配偶集合，为下一步从候选配偶集合中选择配偶变量做准备。

优选地，δ₁和δ₂的取值分别为0.05与0.1。

所述S5步骤包括：

S51：配偶节点不仅保持着与目标变量的强相关关系，而且保持着与当前连接的子节点的强相关关系，基于这个性质本发明继续使用比较的方式（利用强相关变量的性质，S15）首先构建骨架结构如：C-X-Y，即使用>0与/>>0&&/>>/>的判断方式进行，其中/>表示条件集为空，从而识别配偶变量。

在构建骨架的步骤中，传统的方法需要从全集的非PC所有变量集合中选择变量，多变量的网络中，由于指数级的时间消耗，效率较低。而如图3所示，本发明首先识别X为目标变量的父子变量（S2），接下来从候选配偶集合中选择同样与X具有强相关关系的变量，利用S51所示的性质构建骨架结构。

S52：经过上个步骤（骨架结构的构建）的筛选，所有的候选配偶变量都具有与目标变量和对应父子变量的强相关性，然而这里面可能存在着干扰变量，如目标变量的兄弟节点、子孙节点和祖先节点，如图4所示，Y代表非配偶变量示意图，这样的变量会干扰马尔科夫毯的识别。

由于干扰变量的存在，需要对经过筛选的配偶变量进行进一步的筛选，即V结构（C->X<-Y）判断，而传统的方法在这个步骤需要在保存分离集的基础上进行指数级的变量关系判断。经研究发现，真实的配偶变量（Y）与目标变量（C）具有在互信息上的性质：>/>。

S53：根据S52中配偶变量的性质，即配偶变量与目标变量之间在公共子变量的条件下的互信息要大于在空集条件下的互信息，将其应用到从骨架结构中选择真实配偶变量，如果满足真实配偶变量的性质>/>，将其认定为真实的配偶变量。

S54：经过以上的操作，将识别出来的配偶节点与S2步骤学习到的父子节点结合为马尔科夫毯集合，完成输出。

步骤S5实现了用候选配偶集合代替全集简化配偶变量识别的过程。

本发明还提供了可编程的各类处理器（FPGA、ASIC或其他集成电路），所述处理器用于运行程序，其中，所述程序运行时执行上述实施例中的步骤。

本发明还提供了对应的服务推荐系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述存储器执行所述程序时实现上述实施例中的步骤。

虽然本发明所揭露的实施方式如上，但所述的内容仅为便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属领域内的技术人员，在不脱离本发明所揭露的精神和原则的前提下，可以在实施的形式及细节上进行任何的修改与变化、等同替换等，这些都属于本发明的保护范围。因此，本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种基于高效马尔科夫毯学习机制的服务推荐方法，应用于服务推荐平台，其特征在于，包括如下的步骤：

S2：利用最大相关最小冗余MRMR方法，获取目标变量的父子变量；

S4：结合S3中的结果，从非父子变量筛选出候选配偶变量；

S5：从候选配偶变量中根据配偶变量的性质识别真实配偶节点，从而提升效率，并结合S2中获取的父子变量，得到目标变量的马尔科夫毯集合；

其中，所述表征贝叶斯网络的数据集为用户行为信息的集合，目标变量为用户感兴趣的内容，所述马尔科夫毯集合用于服务推荐模型的用户特征选择，所述服务推荐模型依据选择出来的用户特征进行网络训练。

2.如权利要求1所述的方法，其特征在于，所述S1包括：

S11：已知的贝叶斯网络是由节点表示变量，有向边表示节点关系的有向无环图，可以由BN=<U,G,P>表示，其中U表示一组节点，G表示有向无环图DAG，P表示图上的联合概率分布；

S13：基于变量的概率分布，互信息I(X;Y)定义为变量X的信息熵H(X)减去以其他变量Y为条件的条件熵，其中x和y分别为变量X和Y可能的取值，P(x)、P(y)、P(x,y)分别表示变量X取值为x的概率、变量Y取值为y的概率以及两者的联合概率：

S14：从数据集计算变量的概率分布，从而计算变量之间的互信息，用来表征变量之间的关系，而贝叶斯网络中不只有两个节点之间的关系，在第三个节点介入做条件的条件互信息如下所示：

其中，H(X|Y,Z)代表以Y和Z变量为条件集的X的信息熵，为以变量Z为条件的条件熵，P(z)为变量Z取值为z的概率，/>表示在Z取值为z时，X和Y取值分别为x和y的概率；

S15：基于如上两个互信息相关的概念，通过计算变量之间的互信息来衡量变量之间的相关关系，将变量分为强相关变量，弱相关变量和冗余变量。

3.如权利要求2所述的方法，其特征在于，所述S2包括：

S21：父子变量被定义为与目标变量直接相连的变量，其中，X->C结构中，X则为父变量，C为子变量，反之X<-C结构中，X则为子变量，C为父变量；

S22：将最大相关最小冗余MRMR应用在贝叶斯网络中以获得最大的相关关系最小的冗余关系，定义父子变量与配偶变量为强相关变量，其他变量为弱相关或者冗余变量；

S23：假设C表示目标变量，X和Y表示随机变量，U表示整个变量集，S为UC的一个子集，UC表示不包含C变量的全集集合，表示X与C在条件集S下的互信息，MRMR方法的目标函数为：

S24：互信息具有传递性质的链式法则，具体来说是：

其中I(X;Y;Z)表示X,Y和Z三个变量的联合互信息，、/>、/>为S14所示的条件互信息，I(X;Z)为变量X和Z之间的互信息，I(Y;Z)为变量Y和Z之间的互信息，I(X;Y)为变量X和Y之间的互信息；

S25：在公式(4)的基础上，替换其中一个变量为集合S，= I(X;S) - /> =I(X;C) - />，目标函数被分解为：

其中，I(X;S;C)为三者之间的交叉互信息，I(X;S)为变量X和集合S之间的互信息，为给定变量C，变量X和集合S之间的互信息，I(X;C)为变量X和C之间的互信息，为以S为条件集，X和C之间的条件互信息，X ^*为目标变量，V为全集U除去当前变量X的所有节点集合，argmax{}表示取区间内括号里的参数最大值；

S26：使用集合S参与运算的复杂度是较高的，根据互信息的链式法则，化简公式（5），最终得到MRMR方法的实际目标函数为：

其中U _i表示当前所计算的变量，i表示从1到全集大小的下标数，I(U _i;X)为当前遍历到的变量和X之间的互信息；

S27：使用预定义的δ₁为强相关变量的分界线，根据目标函数，选择相关度最高，冗余度最低的变量，即目标变量的父子变量。

4.如权利要求3所述的方法，其特征在于，所述S3包括：

S31：根据MRMR方法的目标函数，已经识别的父子变量被保存，而所有的变量都经历了与目标变量计算互信息的步骤；

S32：取得上一步骤的计算结果，将计算过的每个变量与目标变量对应的互信息保存到一个数组中，数组大小为1行n列，n为除去目标变量外变量全集的大小；

5.如权利要求1所述的方法，其特征在于，所述S4包括：

S41：根据马尔科夫毯相关定理，配偶节点同样是目标变量的强相关变量，同样可以通过比较筛选的方式找到候选配偶集合；

S42：与父子变量一样，配偶同样用阈值的方式筛查，参照筛选父子变量的过程，通过实验方式确定预定义的第二个阈值为δ₂用以筛选候选配偶集合；

6.如权利要求1所述的方法，其特征在于，所述S5包括：

S51：配偶变量不仅保持着与目标变量的强相关关系，而且保持着与对应连接的子变量的强相关关系，基于这个性质继续使用比较的方式从候选配偶集合中构建骨架结构；

S52：经过上个步骤的筛选，所有的候选配偶变量都具有与目标变量和对应父子变量的强相关性，利用V结构判断对经过筛选的配偶变量进一步筛选去除干扰变量；

S53：根据配偶变量与目标变量之间在公共子变量的条件下的互信息要大于在空集条件下的互信息的性质，将其应用到从骨架结构中选择真实配偶变量，如果满足上述性质则将其认定为真实的配偶变量；

S54：经过以上步骤，将识别出来的目标变量的配偶变量与S2步骤学习到的目标变量的父子变量结合为马尔科夫毯集合，完成输出；

步骤S5实现了用候选配偶集合代替全集，并构建骨架简化配偶变量识别的过程。

7.如权利要求3或5所述的方法，其特征在于，δ₁和δ₂的取值分别为0.05与0.1。

8.一种服务推荐系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于：所述处理器执行所述程序时实现如权利要求1-6中任一项所述的方法。