CN114637923A

CN114637923A - 基于层次注意力图神经网络的数据信息推荐方法和装置

Info

Publication number: CN114637923A
Application number: CN202210541192.1A
Authority: CN
Inventors: 李超; 张钊; 李其明
Original assignee: Zhejiang Lab
Current assignee: Zhejiang Lab
Priority date: 2022-05-19
Filing date: 2022-05-19
Publication date: 2022-06-17
Anticipated expiration: 2042-05-19
Also published as: CN114637923B

Abstract

本发明公开一种基于层次注意力图神经网络的数据信息推荐方法和装置，该方法包括：步骤一，构建用户项目交互图和知识图谱；步骤二，合并用户项目交互图与知识图谱构成用户项目知识图；步骤三，将用户项目知识图输入到图神经网络中，采用层次注意力机制计算用户项目知识图的每个节点邻居的重要程度；步骤四，根据每个节点邻居的重要程度，对邻居进行聚合来更新节点表示；步骤五，设定输入图神经网络的用户项目知识图经过的网络层数，如果未到达设定的网络层，则执行步骤三，反之则根据节点的表示，计算图神经网络的损失函数值，经过迭代训练，得到训练好的图神经网络，为用户生成推荐的项目。本发明缓解了数据的稀疏性，提升了推荐的准确性。

Description

基于层次注意力图神经网络的数据信息推荐方法和装置

技术领域

本发明属于推荐算法应用技术领域，涉及一种基于层次注意力图神经网络的数据信息推荐方法和装置。

背景技术

随着互联网的快速发展，数据量呈指数级增长。由于信息的过载，用户很难在大量的选择中选出自己感兴趣的内容。为了提高用户体验，推荐系统已经应用于音乐推荐、电影推荐、和在线购物等场景。推荐方法利用交互数据中用户或商品的相似度来建模用户偏好，已经得到了广泛的应用，因为它可以有效地捕捉用户偏好，并且可以很容易地在多种场景中实现。然而，传统推荐方法存在数据稀疏性的问题，例如项目属性、用户配置文件和上下文，因此在用户和项目交互很少的稀疏情况下表现很差。并且，传统推荐方法将每个交互建模为独立的数据实例，而没有考虑它们之间的关系。这使得它们不足以从用户的集体行为中提取出基于属性的协作信号，因此为解决这一问题，需要引入辅助信息作为原始数据的补充，从而缓解数据的稀疏性，并且提供更多的高阶信息来进一步丰富用户和项目之间的联系。

但是，考虑到随着数据进一步丰富，与目标用户具有高阶关系的节点会急剧增加，这会给模型带来计算过载。基于路径的方法提取带有高阶信息的路径，并将其输入预测模型。然而路径选择对最终的性能有很大的影响，但它没有对推荐目标进行优化，此外定义有效的元路径需要领域知识，对于具有不同类型关系和实体的复杂图来说，是相当劳动密集型的工作，因为必须定义许多元路径以保持模型保真度图神经网络由于其可以能够高效、明确、端到端地利用图中信息。然而基于正则化的方法没有直接将高阶关系插入为推荐而优化的模型中，而是将其以隐式的方式进行编码。由于缺乏明确的建模，既不能保证捕获远程连通性，也不能解释高阶建模的结果。设计了附加的损失项来捕获图结构。图神经网络由于能够高效、明确、端到端地利用图中的高阶信息因此被广泛用于建模推荐方法的网络模型。然而现有图网络模型大都具有粗粒度性的问题，即计算过程中没有有效区分节点邻居的重要程度。

发明内容

为了解决现有技术中存在的上述技术问题，本发明提出了一种基于层次注意力图神经网络的数据信息推荐方法和装置，利用知识图谱作为用户和项目的辅助信息，来进一步强化用户和项目之间的潜在关系；之后通过层次注意力图神经网络以端到端的方式对于用户和项目的表示进行建模，其中层次注意力机制可以有效的区分图中不同邻居的重要性；最后通过多次迭代得到优化后的用户和项目表示，从而实现有效的推荐，缓解了数据稀疏性的问题，同时能够更好的区分图中邻域节点的重要程度，在推荐方法领域具有重要的作用，其具体技术方案如下：

一种基于层次注意力图神经网络的数据信息推荐方法，包括以下步骤：

步骤一，构建用户项目交互图和知识图谱；

步骤二，合并用户项目交互图与知识图谱构成用户项目知识图：将用户项目交互图中的项目与知识图谱中的实体进行匹配，然后将与匹配的实体直接相关的全部三元组与用户项目交互图进行合并，构成用户项目知识图；

步骤三，将用户项目知识图输入到图神经网络中，采用层次注意力机制计算用户项目知识图的每个节点邻居的重要程度；

步骤四，根据每个节点邻居的重要程度，对邻居进行聚合来更新节点表示；

步骤五，设定输入图神经网络的用户项目知识图经过的网络层数，如果未到达设定的网络层，则执行步骤三，反之则根据节点的表示，计算图神经网络的损失函数值，经过迭代训练，得到训练好的图神经网络，为用户生成推荐的项目。

进一步地，所述用户项目交互图是交互数据被表示为用户-项目的二部图

=

，

和

分别表示用户集和项目集，链接

表示观察到用户

和项目

之间存在交互，否则

；

所述知识图谱由辅助信息组织成，所述辅助信息由真实世界的实体及其之间的关系组成，以分析项目，则知识图谱是由主体-属性-客体三元组组成的有向图

=

表示有一个关系

从头实体

到尾实体t，

和

分别表示实体集和关系集。

进一步地，所述步骤二具体为：将每个用户的行为表示为一个三元组(

,

,

)，其中

表示为用户

和项目

之间的一个额外的交互关系；然后通过用户项目交互图中的项目与知识图谱中的实体进行匹配得到的项目-实体对齐集，并根据项目-实体对齐集，将用户项目交互图与知识图谱集成为用户项目知识图

=

,其中

，

。

进一步地，所述步骤三具体为：将用户项目知识图输入到图神经网络中，采用层次注意力机制，该机制包括：关系级别注意力和节点级别注意力，计算出用户项目知识图的关系级别注意力权重和节点级别注意力权重，后将关系级别注意力权重和节点级别注意力权重合并得到层次注意力权重，即得到每个节点邻居的重要程度。

进一步地，所述计算关系级别注意力，关系即为节点间的连接边，关系级别注意力计算公式如下：

,

,

其中，

代表拼接操作，

代表中心节点的向量表示，

，

代表可训练的参数；

代表可训练的参数，

代表所有与相连关系的种类，

代表激活函数，计算关系级别注意力被表示为

，代表了对于计算中心节点

表示时关系

的影响程度。

进一步地，所述计算节点级别注意力，公式如下：

,

,

其中，

代表邻居节点的向量表示，

代表可训练的参数；

代表可训练的参数，

代表关系类型

下的全部邻居节点，

可以被看作是三元组（

，

）的表示，

代表实体级别的注意力权重，代表了关系

下不同邻居的影响程度；

所述合并得到层次注意力权重，公式如下：

。

进一步地，所述步骤四具体为：首先根据层次注意力权重，通过聚合器将本地邻域的信息聚合到中心节点，得到节点h的基于邻域的表示，表达式为：

,

其次进一步聚合节点本身h和节点h的基于邻域的表示

得到更新的节点

。

进一步地，所述聚合节点本身h和节点h的基于邻域的表示

得到更新的节点

，采用包括如下三种聚合方式：

加法聚合方式，表达式为：

,

其中，

代表可训练的参数，将

和

的组合投影到输出空间，

是输出空间的维度；

乘法聚合方式，表达式为：

,

其中，

代表向量对应点乘，

代表可训练的参数；

组合聚合方式，基于加法聚合方式和乘法聚合方式，表达式为：

。

进一步地，所述步骤五具体为：

设定执行图神经网络中L个网络层数，若用户项目知识图未被执行达到L层网络，则返回步骤三，反之，用户项目知识图在通过

个网络层传播后，得到一个用户节点的多个表示，记作

，一个项目节点的多个表示，记作

，将每一步的表示连接到单个向量中，表达式为：

,

然后，对用户和项目表示进行内积，从而预测用户和项目的匹配分数：

,

再计算损失函数，表达式如下：

,

其中，

表示训练数据，

表示用户

和项目

之间观察到的交互集，

表示采样的未观测交互集；

最后设定图神经网络训练的迭代次数，如果到达设定的迭代次数，则结束训练，使用训练好的图神经网络模型为用户生成推荐的项目；如果未到达设定的迭代次数，则执行步骤三。

一种基于层次注意力图神经网络的数据信息推荐装置，包括一个或多个处理器，用于实现所述的基于层次注意力图神经网络的数据信息推荐方法。

有益效果：

本发明考虑到推荐方法存在的数据稀疏性问题和网络模型粗粒度问题，提出基于知识强化的层次注意力图神经网络实现项目推荐应用；将知识图谱作为辅助信息与原始数据合并可以解决数据稀疏性问题，并提高了学习节点表示的质量。同时结合层次注意力图神经网络算法，使网络可以进一步细化节点邻居的影响程度；本发明所提出的方法能够有效提高推荐精度；本发明可以通过适当改进拓展到多种推荐任务中，在推荐领域具有一定的应用前景。

附图说明

图1是本发明的方法流程示意图；

图2是本发明所提出的基于层次注意力图神经网络的数据信息推荐方法的算法执行流程示意图；

图3是本发明的基于层次注意力图神经网络的数据信息推荐装置结构示意图。

具体实施方式

为了使本发明的目的、技术方案和技术效果更加清楚明白，以下结合说明书附图和实施例，对本发明作进一步详细说明。

如图1和图2所示，本发明的一种基于层次注意力图神经网络的数据信息推荐方法，包括以下步骤：

步骤一，构建用户项目交互图和知识图谱。

具体的，考虑一个用户项目交互图, 在推荐场景中，通常有历史上的用户-项目交互，例如，购买和点击。在这里，交互数据被表示为一个用户-项目的二部图

，被定义为

，

和

分别表示用户集和项目集，链接

表示观察到用户

和项目

之间存在交互，否则

。

考虑一个知识图谱，除了交互之外，还拥有条目的辅助信息，例如，条目属性和外部知识。通常，所述辅助信息由真实世界的实体及其之间的关系组成，以分析一个项目。例如，可以通过导演、演员和类型来描述一部电影。辅助信息组织成知识图谱

，

是一个由主体-属性-客体三元组组成的有向图，被定义为

表示有一个关系

从头实体

到尾实体t，

和

分别表示实体集和关系集。例如，(杰克曼，是演员，洛根)表示杰克曼是电影洛根的演员。

步骤二，合并用户项目交互图与知识图谱构成用户项目知识图：将用户项目交互图中的项目与知识图谱中的实体进行匹配，然后将与匹配的实体直接相关的全部三元组与用户项目交互图进行合并，构成用户项目知识图，用户项目知识图即为用户的输入。

详细的，每个用户的行为表示为一个三元组(

,

,

)，其中

表示为用户

和项目

之间的一个额外的交互关系；然后通过用户项目交互图中的项目与知识图谱中的实体进行匹配得到的项目-实体对齐集，并根据项目-实体对齐集，将用户项目交互图与知识图谱无缝集成为统一用户项目知识图

，定义为

,其中

，

。

步骤三，将用户项目知识图输入到图神经网络中，采用层次注意力机制计算用户项目知识图的每个节点邻居的重要程度。

具体的，将用户项目知识图输入到图神经网络中，采用层次注意力机制，该机制包括：关系级别注意力和节点级别注意力，计算出关系级别注意力权重和节点级别注意力权重，后将关系级别注意力权重和节点级别注意力权重合并为层次注意力权重，即得到每个节点邻居的重要程度。

所述计算关系级别注意力，关系即为节点间的连接边，用户项目知识图中具有多种类型的关系，不同类型的关系在计算节点表示的影响程度是不同的。关系级别注意力计算公式如下：

,

,

其中，

代表拼接操作，

代表中心节点的向量表示，

，

代表可训练的参数；

代表可训练的参数，

代表所有与相连关系的种类，

代表激活函数，通过上述计算关系级别注意力被表示为

，代表了对于计算中心节点

表示时关系

的影响程度。

所述计算节点级别注意力，考虑到相同关系类型下不同的邻居的影响程度也不同，这里将同一关系下的邻居视为一组，节点级别注意力计算公式如下：

,

,

其中，

代表邻居节点的向量表示，

代表可训练的参数；

代表可训练的参数，

代表关系类型

下的全部邻居节点，

可以被看作是三元组（

，

）的表示，

代表实体级别的注意力权重，代表了关系

下不同邻居的影响程度。

在得到关系级注意力和节点级注意力权重后，将这两个分数进一步合并为最终的层次注意力权重，计算公式如下：

,

基于层次的注意机制为注意得分提供了一个细粒度的学习过程，可以有效的区分图中不同邻居的重要性，提高了模型的可解释性。值得注意的是，在关系

下，所有相邻三元组明显共享关系级注意力

，这有利于这些三元组之间的知识共享，并使具有关系

的相邻三元组的权值可以集体训练。

步骤四，根据每个节点邻居的重要程度，对邻居进行聚合来更新节点表示。

首先根据层次注意力权重，通过聚合器将本地邻域的信息聚合到中心节点，得到节点h的基于邻域的表示，其计算方法为：

,

其次进一步聚合节点本身h和节点h的基于邻域的表示

得到更新的节点

，本发明设计了三种聚合方式，聚合函数表达式为

，三种聚合方式的具体函数表达式如下：

加法聚合函数：

,

其中，

代表可训练的参数，将

和

的组合投影到输出空间，

是输出空间的维度。

乘法聚合函数：

,

其中，

代表向量对应点乘，

代表可训练的参数。

组合聚合函数：

,

该方法可以看作上述两种方法的集合；

为了探索高阶的节点间连接信息，图神经网络会进一步堆叠更多的传播层，从而收集从高跳邻居传播的信息；

设定执行L个网络层数，在执行L个网络层传播后，得到一个用户节点的多个表示，记作

，一个项目节点的多个表示，记作

。不同层次的输出强调不同层次的连通性信息。因此，本发明将每一步的表示连接到单个向量中，表达式为：

,

这样，可以通过执行嵌入传播操作来丰富初始嵌入，还可以通过调整网络层数

来控制传播的强度。然后，对用户和项目表示进行内积，从而预测用户和项目的匹配分数：

,

通过计算损失函数，其假设观察到的交互比未观察到的交互分配更高的预测值，计算公式如下：

,

其中，

表示训练数据，

表示用户

和项目

之间观察到的交互集，

表示采样的未观测交互集；

与前述一种基于层次注意力图神经网络的数据信息推荐方法的实施例相对应，本发明还提供了一种基于层次注意力图神经网络的数据信息推荐装置的实施例。

参见图3，本发明实施例提供的一种基于层次注意力图神经网络的数据信息推荐装置，包括一个或多个处理器，用于实现上述实施例中的一种基于层次注意力图神经网络的数据信息推荐方法。

本发明一种基于层次注意力图神经网络的数据信息推荐装置的实施例可以应用在任意具备数据处理能力的设备上，该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图3所示，为本发明一种基于层次注意力图神经网络的数据信息推荐装置所在任意具备数据处理能力的设备的一种硬件结构图，除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外，实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能，还可以包括其他硬件，对此不再赘述。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本发明实施例还提供一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时，实现上述实施例中的一种基于层次注意力图神经网络的数据信息推荐方法。

所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元，例如硬盘或内存。所述计算机可读存储介质也可以是风力发电机的外部存储设备，例如所述设备上配备的插接式硬盘、智能存储卡（Smart Media Card，SMC）、SD卡、闪存卡（Flash Card）等。进一步的，所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据，还可以用于暂时地存储已经输出或者将要输出的数据。

以上所述，仅为本发明的优选实施案例，并非对本发明做任何形式上的限制。虽然前文对本发明的实施过程进行了详细说明，对于熟悉本领域的人员来说，其依然可以对前述各实例记载的技术方案进行修改，或者对其中部分技术特征进行同等替换。凡在本发明精神和原则之内所做修改、同等替换等，均应包含在本发明的保护范围之内。

Claims

1.一种基于层次注意力图神经网络的数据信息推荐方法，其特征在于，包括以下步骤：

步骤一，构建用户项目交互图和知识图谱；

2.如权利要求1所述的一种基于层次注意力图神经网络的数据信息推荐方法，其特征在于，所述用户项目交互图是交互数据被表示为用户-项目的二部图

=

，

和

分别表示用户集和项目集，链接

表示观察到用户

和项目

之间存在交互，否则

；

=

表示有一个关系

从头实体

到尾实体t，

和

分别表示实体集和关系集。

3. 如权利要求2所述的一种基于层次注意力图神经网络的数据信息推荐方法，其特征在于，所述步骤二具体为：将每个用户的行为表示为一个三元组(

,

,

)，其中

表示为用户

和项目

=

, 其中

，

。

4.如权利要求3所述的一种基于层次注意力图神经网络的数据信息推荐方法，其特征在于，所述步骤三具体为：将用户项目知识图输入到图神经网络中，采用层次注意力机制，该机制包括：关系级别注意力和节点级别注意力，计算出用户项目知识图的关系级别注意力权重和节点级别注意力权重，后将关系级别注意力权重和节点级别注意力权重合并得到层次注意力权重，即得到每个节点邻居的重要程度。

5.如权利要求4所述的一种基于层次注意力图神经网络的数据信息推荐方法，其特征在于，所述计算关系级别注意力，关系即为节点间的连接边，关系级别注意力计算公式如下：