CN111475637B

CN111475637B - 用于推送知识点的数据处理、训练方法及装置

Info

Publication number: CN111475637B
Application number: CN202010588724.8A
Authority: CN
Inventors: 杨明晖; 陈晓军; 陈显玲; 崔恒斌
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-06-24
Filing date: 2020-06-24
Publication date: 2020-10-09
Anticipated expiration: 2040-06-24
Also published as: CN111475637A

Abstract

本说明书实施例提供一种用于推送知识点的数据处理、训练方法及装置，基于异构图提取符合预设格式的多组元路径，获取异构图中各个节点的对应的第一特征，然后将多组元路径输入预先训练得到的图神经网络模型，通过图神经网络模型对元路径上节点的第一特征进行聚合，至少输出作为路径端点的用户节点和/或知识点节点对应的第二特征，第二特征用于对用户节点和知识点节点进行匹配，以向用户推送相应知识点。该方案能够更精确地匹配用户需求。

Description

用于推送知识点的数据处理、训练方法及装置

技术领域

本说明书实施例涉及人工智能技术领域，具体地，涉及用于推送知识点的数据处理、训练方法及装置。

背景技术

客服系统是多数企业必备的基础服务设施，相比于人工客服，智能客服支持大规模知识管理、自然语言理解和自动问答等功能，不仅为企业提供精细化管理所需的统计分析信息，还为企业与海量用户之间的沟通建立一种基于自然语言的快捷有效的技术手段。例如，云客服作为一种重要的智能客服技术，云客服机器人能够负责解答用户的简单文本提问，且为方便用户求助，云客服机器人还可具有问题识别功能，也就是在用户进入客服系统时直接预测用户可能的提问，并将对应的知识点主动推荐给用户，使得用户可能无需输入问题即可得到答案，进一步提升了用户体验。

然而，在已有的知识点推送的方案中，例如一种基于SaaS（Software-as-a-Service，软件即服务）平台实现的热门问题推荐方案，定期统计一段时间内各个知识点的使用、点击和被提问的频率，并将筛选出的高频知识点统一推荐给用户。这种方案虽然能够满足一部分用户的初级需要，但对不同用户推荐的内容几乎相同，而用户需求是多样化的，对于很多用户来说，系统推送的高频知识点并不是其感兴趣的知识点，未能准确匹配用户需求。

鉴于此，希望能有一种改进的知识点推荐方案，以更精确地匹配用户需要。

发明内容

本说明书描述了一种用于推送知识点的数据处理、训练方法及装置，可针对不同用户推送不同的知识点，使得推送的知识点更精确地匹配用户需求，减少无效推送。

第一方面，本说明书实施例提供一种用于推送知识点的数据处理方法，该方法包括：

获取异构图，所述异构图至少包括，用于表示用户的用户节点，用于表示待推送知识点的知识点节点，和用于表示用户历史行为的行为节点，具备关联关系的不同类型节点之间建立有连接边；在所述异构图中查找符合预设格式的多组元路径，所述多组元路径至少包括以所述用户节点为端点的元路径，和以所述知识点节点为端点的元路径；获取所述异构图中各个节点的对应的第一特征，所述第一特征基于各个节点的原始属性特征获得；将所述多组元路径输入预先训练得到的图神经网络模型，通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，至少输出作为路径端点的用户节点和知识点节点对应的第二特征，所述第二特征用于对用户节点和知识点节点进行匹配，以向用户推送相应知识点。

在一个实施例中，至少输出作为路径端点的用户节点和知识点节点对应的第二特征之后，还包括：

计算各个用户节点与各个知识点节点对应的第二特征之间的相似度，将相似度达到预设要求的知识点确定为有待向相应用户推送的目标知识点。

在一个实施例中，将相似度达到预设要求的知识点确定为有待向相应用户推送的目标知识点之后，还包括：

将针对指定客服系统发起访问请求的用户确定为目标用户，获取与所述目标用户对应的目标知识点；向所述目标用户推送所述目标知识点。

将针对指定客服系统发起访问请求的用户确定为目标用户，获取与所述目标用户对应的用户节点的目标第二特征；计算所述目标第二特征与各个知识点节点的第二特征之间的相似度，将相似度达到预设要求的知识点确定为目标知识点；向所述目标用户推送所述目标知识点。

在一个实施例中，在所述异构图中，用户节点与该用户在预定时间段内访问过的知识点对应的知识点节点之间建立有第一类连接边；用户节点与该用户在所述预定时间段内实施的历史行为对应的行为节点之间建立有第二类连接边。

在一个实施例中，所述多组元路径包括第一元路径和第二元路径，所述第一元路径由所述第一类连接边构成，所述第二元路径由连接到同一行为节点的两条第二类连接边和一条第一类连接边构成。

在一个实施例中，所述多组元路径还包括第三元路径，所述第三元路径以行为节点作为路径端点，且包括至少一个用户节点；

通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，包括：通过所述图神经网络模型对所述第三元路径上节点的第一特征进行聚合，输出行为节点对应的第二特征。

在一个实施例中，输出行为节点对应的第二特征之后，所述方法还包括：

计算知识点节点与行为节点对应的第二特征之间的相似度，将相似度满足预设要求的行为节点的用户历史行为作为相应知识点的可解释性信息。

在一个实施例中，所述异构图还包括用于表示知识点所属类目的类目节点，类目节点与属于该类目的各个知识点对应的知识点节点之间建立有连接边；

所述多组元路径还包括第四元路径，所述第四元路径以知识点节点作为路径端点，且包括至少一个类目节点。

在一个实施例中，所述方法还包括：

获取新增知识点，在所述异构图中增加用于表示所述新增知识点的新增知识点节点；确定所述新增知识点所属的类目，将所述新增知识点节点通过连接边连接至所属的类目对应的类目节点。

在一个实施例中，所述方法还包括：

获取新增知识点，向多个用户随机推送所述新增知识点；在预定时间段内有用户针对所述新增知识点发出查阅指令时，则在所述异构图中增加用于表示所述新增知识点的新增知识点节点，在发出查阅指令的用户节点与所述新增知识点节点之间，建立连接边。

在一个实施例中，在所述异构图中查找符合预设格式的多组元路径，包括：

从用户节点或知识点节点出发，遍历所述异构图，查找符合所述预定格式的路径作为所述元路径。

在一个实施例中，所述预设格式包括，依次连接的至少两条预设类别的连接边；在所述异构图中查找符合预设格式的多组元路径，包括：

根据异构图中的节点类别确定节点间的连接边的类别；以两种不同类型的节点分别作为行元素或列元素，建立相应类别的连接边对应的边矩阵；在所述异构图中确定通过某个类别的连接边直接连接的节点对，在对应于该某个类别的边矩阵中，将所述节点对相应位置的元素设为第一值，其余元素设置为不同于所述第一值的第二值；按照所述预设格式，依次计算相邻的连接边对应的两个边矩阵的乘积，将乘积结果为所述第一值的平方值的元素对应的节点依次写入元路径。

在一个实施例中，获取所述异构图中各个节点的对应的第一特征，包括：

获取所述异构图中各个节点相应的原始属性特征，所述原始属性特征包括用户节点对应的个人属性信息、所述知识点节点对应的自然语言信息和所述行为节点对应的用户历史行为的行为类别信息；将各个节点对应的原始属性特征分别转换到指定维度的特征空间，得到各个节点对应的第一特征。

在一个实施例中，将各个节点对应的原始属性特征分别转换到指定维度的特征空间，得到各个节点对应的第一特征，包括：

将获取到的各个用户的所述个人属性信息采用One-Hot进行编码，得到各个用户分别对应的初级特征矩阵；将各个所述初级特征矩阵依次输入预先训练得到的深度神经网络DNN模型，通过所述DNN模型对各个所述初级特征矩阵依次进行降维处理，得到具有指定维度的各个用户节点对应的第一特征。

对获取到的各个知识点的自然语言信息，进行分词处理，得到各个知识点对应的分词序列；将各个所述分词序列分别输入预先训练得到的长短期记忆LSTM模型，通过所述LSTM模型，将各个所述分词序列分别转换为具有指定维度的各个知识点节点对应的第一特征。

在一个实施例中，所述图神经网络模型为异构图注意力网络HAN模型；所述HAN模型包括多个节点聚合单元和语义聚合单元，所述多个节点聚合单元分别对应于所述多组元路径；

将所述多组元路径输入预先训练得到的图神经网络模型，通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，包括：将所述多组元路径中各组元路径输入对应的节点聚合单元，通过该对应的节点聚合单元，对该组元路径内的每条元路径上节点的第一特征进行聚合，作为该条元路径上指定为输出节点的路径端点的第一嵌入向量；基于所述多个节点聚合单元输出的多个第一嵌入向量，通过所述语义聚合单元，针对同一个节点的第一嵌入向量进行聚合。

在一个实施例中，对该组元路径内的每条元路径上节点的第一特征进行聚合，包括：

根据预先训练得到的节点权重处理参数，计算该组元路径内的每条元路径上作为路径端点的两个节点的第一权重因子，基于所述第一权重因子将所述两个节点对应的第一特征进行加权求和。

在一个实施例中，通过所述语义聚合单元，针对同一个节点的第一嵌入向量进行聚合，包括：

通过所述语义聚合单元，从所述多个第一嵌入向量中，筛选出对应于同一个节点的若干第一嵌入向量，根据预先训练得到的路径权重处理参数，得到所述若干第一嵌入向量所对应的若干路径的第二权重因子，基于第二权重因子对所述若干第一嵌入向量进行加权求和，得到所述同一个节点对应的第二特征。

第二方面，本说明书实施例提供一种图神经网络模型训练方法，该方法包括：

获取异构图，所述异构图至少包括，用于表示用户的用户节点，用于表示知识点的知识点节点，和用于表示用户行为的行为节点，具备关联关系的不同类型节点之间建立有连接边；在所述异构图中查找符合预设格式的多组样本元路径，所述多组样本元路径至少包括以样本用户节点为端点的路径，和以样本知识点节点为端点的路径，所述样本用户节点和样本知识点节点之间具有标注的已知交互结果；获取所述异构图中各个节点的对应的第一特征，所述第一特征基于各个节点的原始属性特征获得；将所述多组样本元路径输入图神经网络模型，通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，至少输出作为路径端点的样本用户节点和样本知识点节点对应的第二特征；根据所述样本用户节点和样本知识点节点对应的第二特征，预测所述样本用户节点和样本知识点节点之间的交互，得到预测交互结果；基于所述已知交互结果和所述预测交互结果确定损失值，在所述损失值减小的方向，调节所述图神经网络模型。

第三方面，本说明书实施例还提供一种用于推送知识点的数据处理装置，该装置包括：

第一获取单元，被配置为获取异构图，所述异构图至少包括，用于表示用户的用户节点，用于表示待推送知识点的知识点节点，和用于表示用户历史行为的行为节点，具备关联关系的不同类型节点之间建立有连接边；

第一查找单元，被配置为在所述异构图中查找符合预设格式的多组元路径，所述多组元路径至少包括以所述用户节点为端点的元路径，和以所述知识点节点为端点的元路径；

第二获取单元，被配置为获取所述异构图中各个节点的对应的第一特征，所述第一特征基于各个节点的原始属性特征获得；

聚合单元，被配置为将所述多组元路径输入预先训练得到的图神经网络模型，通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，至少输出作为路径端点的用户节点和知识点节点对应的第二特征，所述第二特征用于对用户节点和知识点节点进行匹配，以向用户推送相应知识点。

第四方面，本说明书实施例还提供一种图神经网络模型训练装置，该装置包括：

第三获取单元，被配置为获取异构图，所述异构图至少包括，用于表示用户的用户节点，用于表示知识点的知识点节点，和用于表示用户行为的行为节点，具备关联关系的不同类型节点之间建立有连接边；

第二查找单元，被配置为在所述异构图中查找符合预设格式的多组样本元路径，所述多组样本元路径至少包括以样本用户节点为端点的路径，和以样本知识点节点为端点的路径，所述样本用户节点和样本知识点节点之间具有标注的已知交互结果；

第四获取单元，被配置为获取所述异构图中各个节点的对应的第一特征，所述第一特征基于各个节点的原始属性特征获得；

训练单元，被配置为将所述多组样本元路径输入图神经网络模型，通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，至少输出作为路径端点的样本用户节点和样本知识点节点对应的第二特征；根据所述样本用户节点和样本知识点节点对应的第二特征，预测所述样本用户节点和样本知识点节点之间的交互，得到预测交互结果；以及，基于所述已知交互结果和所述预测交互结果确定损失值，在所述损失值减小的方向，调节所述图神经网络模型。

第五方面，本说明书实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，当计算机程序在计算机中执行时，令计算机执行第一至第四方面的方法。

第六方面，本说明书实施例还提供了一种计算设备，包括存储器和处理器，存储器中存储有可执行代码，处理器执行可执行代码时，实现第一至第四方面的方法。

采用本说明书实施例提供的知识点信息推送方法，异构图中节点之间的拓扑结构直观地反映了用户与用户历史行为以及知识点之间的复杂关联关系，在异构图中查找出的元路径则携带有局部关联信息，从异构图中查找出多组元路径，实际上是将全局关联信息拆分为多组局部关联信息，多组元路径至少以用户节点和知识点节点为路径端点，以保证至少输出用户节点和知识点节点；第一特征基于各个类型节点的原始属性特征获得，携带有各节点的原始属性信息；用户、用户历史行为、知识点之间的关联关系，以及各节点的原始属性特征，从不同方面决定或者影响了用户未来需求某个或者某些知识点的可能性，通过具有图处理能力的神经网络模型，对元路径上节点的第一特征进行聚合，实际上是基于节点之间结构上的关联信息将局部相关联节点的原始属性特征聚合为一个综合特征，也就是聚合为路径端点的第二特征，基于第二特征可预测用户节点所表示的用户与知识点节点所表示的知识点之间是否匹配，例如基于第二特征进行相似度计算，相似度高，则说明该用户需求该知识点的可能性越大，如此，实现了面向不同用户针对性地推荐其实际需要的知识点，更精确地匹配用户的知识点需求，尤其是异构图中的一个用户节点对应一个用户时，则可更精确地匹配每个用户的个性化知识点需求，针对性地向每个用户推送其更可能需要的知识点，减少无效推送，提升了用户体验。

附图说明

为了更清楚地说明本说明书披露的多个实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书披露的多个实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出了本说明书第一方面披露的用于推送知识点的数据处理方法的一个实施例的系统架构图；

图2示出了本说明书披露的用于推送知识点的数据处理方法的一个实施例的流程示意图；

图3示出了本说明书实施例中一种示例样式的异构图；

图4示出了本说明书实施例中另一种示例样式的异构图；

图5示出了本说明书一个实施例中HAN模型进行特征聚合的流程框架示意图；

图6示出了本说明书一个实施例中针对一条元路径执行节点聚合的示意图；

图7示出了本说明书另一个实施例中针对一条元路径执行节点聚合的示意图；

图8示出了本说明书一个实施例中针对多条元路径执行语义聚合的示意图；

图9示出了本说明书实施例中加入类目节点后的一种示例样式的异构图；

图10示出了本说明书披露的图神经网络模型训练方法的一个实施例的流程示意图；

图11示出了本说明书披露的用于推送知识点的数据处理装置的一个实施例的结构示意图；

图12示出了本说明书披露的图神经网络模型训练装置的一个实施例的结构示意图。

具体实施方式

下面结合附图，对本说明书披露的多个实施例进行描述。

本说明书披露的用于推送知识点的数据处理方法，至少可应用于智能客服场景，例如可应用于云客服系统，为使用云客服的企业提供更智能化的客服系统解决方案，具体可应用于云客服机器人等产品中。

在智能客服场景中，除了前述将高频知识点统一推荐给用户的方案以外，其他一些知识点推送方案也存在待改进之处。例如发明人在研究过程中发现，一种客服机器人使用深度学习模型，通过分类算法进行问题识别，当用户进入系统时，深度学习模型会根据用户的业务状态、行为轨迹等信息，将用户特征编码为向量，并使用分类模型将该用户直接分类到单个的知识点，进而向该用户推送该单个的知识点。这种方法需要利用线上点击数据，也就是用户在以往一段时间内的对知识点的点击行为数据等进行训练，而较为低频的知识点或者新增知识点由于没有用户或者很少有用户点击，难以出现在训练数据中，导致这种基于深度学习模型的方案并不能够推荐新增知识点或者低频知识点。此外，深度学习模型通常可解释性较差，即深度学习预测向某个用户推送的知识点是无法解释的，当出现badcase时也很难发现。

基于以上的观察、分析和研究，发明人提出一种方案，参阅图1所示，图1示出了本说明书第一方面披露的用于推送知识点的数据处理方法的一个实施例的系统架构图。首先通过异构图来表达用户与用户历史行为以及知识点之间的关联关系，基于异构图获得多组元路径，例如U1-K1与Un-Kj属于一组元路径，U1-R1-U2-K2与Um-Ri-Un-Kj属于一组元路径。然后，结合元路径上节点的第一特征，通过图神经网络模型对多组元路径进行特征聚合，输出用户、知识点对应的第二特征，基于第二特征可判别用户与知识点之间是否匹配，进而确定向用户推送匹配的知识点。

图2示出了本说明书披露的用于推送知识点的数据处理方法的一个实施例的流程示意图。该数据处理方法可以由任何具有计算、处理能力的装置、设备、计算平台、计算集群来执行。具体地，该数据处理方法可以包括如下流程：

S202，获取异构图；S204，在异构图中查找符合预设格式的多组元路径，多组元路径至少包括以用户节点为端点的路径，和以知识点节点为端点的路径；S206，获取异构图中各个节点的对应的第一特征，第一特征基于各个节点的原始属性特征获得；S208，将多组元路径输入预先训练得到的图神经网络模型，通过图神经网络模型对元路径上节点的第一特征进行聚合，至少输出作为路径端点的用户节点和知识点节点对应的第二特征。第二特征用于对用户节点和知识点节点进行匹配，以向用户推送相应知识点。

其中，异构图中至少包括用于表示用户的用户节点、用于表示待推送知识点的知识点节点和用于表示用户历史行为的行为节点，且在异构图中，具备关联关系的不同类型节点之间建立有连接边。

用户历史行为即为用户在指定一段时间内的行为，由于用户行为是复杂多样的，在一部分实施例中，可以对用户行为数据进行分类，分类表示用户的不同行为，行为节点用于表示行为类别。例如，在一部分实施例中，可以将下单A类产品的行为用R1表示，下单B类产品的行为用R2表示，关注C类店铺的行为用R3表示，浏览D类产品的行为用R4表示等等。

知识点，可以由标题和正文组成，一般是标题作为问题，正文作为答案，正文或答案也就是要推荐给用户的具体内容，以向用户说明业务功能、规则或者产品简介。以往的检索型问答机器人中，可以用问题作为标题，以答案作为正文，机器人通过找出与用户问题最相似的知识点标题，给用户回复知识点正文，而对于支持主动推荐功能的问答机器人来说，则可以通过本说明书披露的数据处理方法预测当前到访的用户最可能感兴趣的知识点，进而推荐给用户。

关于用户节点，作为一种典型可实施方式，一个用户节点即表示一个用户，即用户节点与用户为一一对应关系；在另外的实施例中，当用户数量巨大，使得基于异构图的运算压力较大时，可以对用户进行分类，将用户分为多个类别，一个类别的用户可能具有相同的喜好和关注点，因此感兴趣的知识点一般较为近似，可以在异构图中以一个用户节点表示，即此种情形下，一个用户节点表示一类用户，而非单个用户。

具体地，一种示例样式的异构图参阅图1和图3所示，其中圆形节点即为用户节点U（U1、U2……Un），正方形节点即为知识点节点K（K1、K2……Kj），三角形节点即为行为节点R（R1、R2……Ri）。异构图的另一个示例样式如图4所示，该图中包括三个行为节点R1、R2、R3，三个用户节点U1、U2、U3，三个知识点节点K1、K2、K3。

其中，用户节点对应的用户与知识点节点所表示的知识点之间有过交互，例如用户点击或者主动查询过该知识点，则认为该用户节点与该知识点节点之间具备关联关系；以及，用户在以往一段时间内实施过某种行为，则该用户节点与该行为节点之间具备关联关系。

具体地，在一部分实施例中，在所述异构图中，用户节点与该用户在预定时间段内访问过的知识点对应的知识点节点之间建立有第一类连接边，即UK连接边；用户节点与该用户在所述预定时间段内实施的历史行为对应的行为节点之间建立有第二类连接边，即UR连接边。例如，如图3所示，用户节点U1和U2均与行为节点R1连接，则说明根据用户的历史行为数据，用户U1和用户U2在过去的一段时间内都实施了某种行为R1，用户节点U1与知识点节点K1和K2连接，则表示用户U1在同样的一段时间内点击或者查询过知识点K1和知识点K2。

实际上用户点击或者查询知识点的操作也是一种历史行为，需要说明的是，在本说明书各实施例中，用户历史行为指除与知识点进行直接交互以外的其他行为，即用户历史行为不包含针对知识点的点击、查询等行为。例如用户历史行为可以包括浏览某个产品的网页、观看某场直播或者关注某个店铺、下单某个产品等行为。

在部分实施例中，异构图可以预先建立，在实施本说明书披露的方法时直接获取，或者在已有的异构图基础上增加或者删减节点，以及调整节点间连接关系，获取的异构图能够准确表示用户与用户历史行为以及知识点之间的关联关系即可。此外，本说明书实施例中，异构图的可行样式有多种，用户节点和行为节点以及知识点节点可以采用多种不同的符号进行表示，并不仅限于图3和图4所示。实际上，包括用户节点、行为节点和知识点节点，且能够清楚表示用户节点与行为节点以及知识点节点之间连接关系的任何样式的结构图都可作为本说明书实施例中的异构图。

获取异构图后，接下来执行S204，在异构图中查找符合预设格式的多组元路径。

其中，本说明书实施例中的元路径（metapath）为至少一条连接边及其连接的至少两个节点形成的路径，且不包含重复的连接边和节点。例如，用户节点U经由一条连接边连接至一个知识点节点，则形成的路径U-K即为一条最短的元路径；图3中行为节点R2与用户节点U2、知识点节点K2以及之间的连接边形成一条元路径R2-U2-K2，用户节点U1与行为节点R1、用户节点U2、知识点节点K2以及之间的连接边形成了一条元路径U1-R1-U2-K2。

多组元路径所应符合的预设格式，指多组元路径中各组元路径上的节点个数、连接边条数以及节点类型应满足的格式要求，并不是随机任意的。例如应多组元路径至少包括以用户节点为端点的路径和以知识点节点为端点的路径，也就是至少有一组元路径以用户节点U为一个端点，且以知识点节点K为另一个端点，例如以用户节点U为起点，以知识点节点K为终点；或者至少有一组元路径以用户节点U为路径端点，而有另一组元路径以知识点节点K为路径端点。

在本说明书实施例中，一组元路径内的各条元路径在结构上是一致的，即组内各条元路径可能包含的具体节点不同，但节点个数和次序以及节点类型和连接边的类型都是一致的，例如U1-R1-U2-K2与Um-Ri-Un-Kj可作为一组元路径，而U1-R1-U2-R2与Um-Ri-Un-Kj不能归为一组元路径。

具体地，在一部分实施例中，符合预设格式的多组元路径至少包括第一元路径和第二元路径，所述第一元路径由所述第一类连接边构成，第一类连接边即UK连接边，所述第二元路径由连接到同一行为节点的两条第二类连接边和一条第一类连接边构成，第二类连接边即UR连接边。例如，第一元路径的格式为U-K，第二元路径的格式为U-R-U-K。U-K格式的元路径所表示的语义信息即为用户曾经访问过该知识点，U-R-U-K格式的元路径所表示的语义信息为：具有相同行为的用户可能遇到类似的问题，需要相关的知识点来解决。

并且，在一部分实施例中，多组元路径还可以包含第三元路径，第三元路径以行为节点作为路径端点，且包括至少一个用户节点，例如，U-R即可为第一条第三元路径，以使行为节点也作为输出节点。

在S204中，查找多组元路径，包括按照以下两种方式进行查找：

方式一、遍历

从用户节点或知识点节点出发，遍历所述异构图，查找符合所述预定格式的路径作为所述元路径。对于仅包含一条连接边的元路径，适合采用遍历法进行查找，当连接边条数较多时，采用遍历法进行查找会比较耗时，需要占用较多计算资源。

方式二、矩阵点乘

当多组元路径所应满足的预设格式包括依次连接的至少两条连接边时，也就是待查找的元路径所包括的连接边条数为两条以上时（两条以上连接边的类别可以是预设类别），则适用于采用矩阵点乘的方式进行查找，具体地，矩阵点乘方式包括：

根据异构图中的节点类别确定节点间的连接边的类别；以两种不同类型的节点分别作为行元素或列元素，建立相应类别的连接边对应的边矩阵；在所述异构图中确定通过某个类别的连接边直接连接的节点对，在对应于该某个类别的边矩阵中，将所述节点对相应位置的元素设为第一值，其余元素设置为不同于所述第一值的第二值；按照所述预设格式，依次计算相邻的连接边对应的两个边矩阵的乘积，将乘积结果为所述第一值的平方值的元素对应的节点依次写入元路径。其中，第一值的平方值，与第一值与第二值的乘积值以及第二值的平方值均应有所区别，例如第一值设为0、第二值设为1是不可行的，第一值与第二值互为相反数也不可行。

例如，待查找的元路径格式为U-R-U-K时，则分别建立U-R矩阵、R-U矩阵、U-K矩阵，针对图3所示的异构图，第一值设为1，第二值设为0，构建的U-R矩阵、R-U矩阵、U-K矩阵分别如下：

将U-R矩阵与R-U矩阵相乘，得到第一矩阵，再将R-U矩阵与U-K矩阵相乘，得到第二矩阵，再将第一矩阵与第二矩阵相乘，乘积值为1的元素位置所对应的各个节点即为元路径上的节点，按次序依次写入，得到如下两条符合格式要求的元路径：U1-R1-U2-K2、Un-1-Ri-Un-Kj，可归纳为一组元路径。

在S206中，第一特征基于各个节点的原始属性特征获得。作为一种可实施方式，原始属性特征包括用户节点对应的个人属性信息、知识点节点对应的自然语言信息和行为节点对应的用户历史行为的行为类别信息，首先确定各个节点对应的原始属性特征，然后将各个节点对应的原始属性特征分别转换到统一维度的特征空间，得到各个节点对应的第一特征，即转换后用户节点、知识点节点所对应的第一特征维度相同。

具体地，因为用户的一些个人信息决定了其所感兴趣的知识点，因此用户的个人信息作为用户的原始属性特征，进而提取出第一特征是有必要的，例如用户的年龄不同，则关注的知识点会有所不同，作为一种可实施方式，可以将用户的年龄划分为10个年龄段，不同的年龄段用不同的数值表示；用户所处的地理位置也影响了用户所关注的知识点，因此也将用户所处的地理位置进行分类，例如按照所处的城市进行划分，比如统计范围内的用户所处的城市有1000多个，则在第一特征中还应携带有其所处的城市编码信息，此外用户性别也对其可能关注的知识点有较大影响，男性和女性感兴趣的知识点往往有很大差别，因此，用户节点的原始属性特征，可以包含用户性别、年龄、位置等个人信息。并且，将相应的个人信息采用独热编码即One-Hot编码方式进行编码，经独热编码后，一个用户对应得到一个初级特征矩阵，一个初级特征矩阵的维度一般达到几千维，其中用户所处的城市信息就可占据1000多维。

而图神经网络模型所能处理的特征维度相对固定，很难直接对几千维度的特征进行聚合，因此还需要对各个节点的原始属性特征进行降维处理。

其中，对于用户节点的原始属性特征，在一部分实施例中，采用深度神经网络（DNN，Deep Neural Networks）模型对初级特征矩阵进行降维处理，基于稀疏的独热编码，学习性别、位置以及年龄等个人信息特征的向量表示，把不同的个人信息特征按不同权重组合起来，保留个人信息特征的同时降低特征表达的维度，形成用户节点对应的第一特征，该第一特征的维度应满足图神经网络模型对于输入数据的维度要求。例如，经DNN模型处理后，用户节点对应的第一特征的维度由几千维降至了几百维。

对于知识点节点，由于知识点实际上是带有自然语义信息的文本，知识点的原始属性特征也就是知识点所表示的语义信息，知识点实际上是由词序列组成，在一部分实施例中，则采用适用于处理序列数据的长短期记忆网络（LSTM，Long Short-Term Memory）模型来处理知识点，以获得知识点对应的第一特征。

具体地，对获取到的各个知识点的自然语言信息，进行分词处理，也就是提取关键词，去除“嗯”“哦”“啊”“的”等等辅助词，并根据预设词典中各个关键词的编号，对各个关键词进行标记，得到各个知识点对应的分词序列，该分词序列相当于一个由数字标记组成的分词向量。将各个所述分词序列依次输入预先训练得到的LSTM模型，通过所述LSTM模型，将各个所述分词序列依次转换为具有指定维度的各个知识点节点对应的第一特征。同上，指定维度即能够输入图神经网络模型的维度。

上述对于用户节点以及知识点节点原始属性特征的预处理操作，实际上是将用户节点和知识点节点的原始属性特征转换到统一维度的特征空间，以便于图神经网络模型进行聚合。

行为节点的作用之一在于连接相同行为的用户节点，用户节点与行为节点连接则表明用户实施了该种行为，因此对于行为节点，则可随机初始化其第一特征的值，例如行为节点的第一特征值全部设置为1或者全部设置为0，行为节点的第一特征的维度应与知识点节点以及用户节点的第一特征的维度保持一致。

需要说明的是，上述步骤编号仅为描述方便，不作为对于执行时序的限定，例如S204与S206两个步骤在执行时序上并无明确的先后顺序要求，S206可先于S204执行。

在得到了具有统一维度的各个节点的第一特征后，则执行S208，通过图神经网络模型对元路径上节点的第一特征进行聚合。

在本说明书实施例中，图神经网络模型包括各种具有图处理能力的神经网络模型，尤其是具有异构图处理能力的神经网络模型，例如HAN（异构图注意力网络，Heterogeneous Graph Attention Network ，也可译作Hierarchical AttentionNetwork）模型，或HeGNN（异构图神经网络，Heterogeneous Graph Neural Network）模型等等。

下面以HAN模型为例，对如何聚合第一特征加以说明。

本说明书一部分实施例中，采用的HAN模型包括多个节点聚合单元和语义聚合单元，基于HAN模型执行的特征聚合包括节点聚合阶段和语义聚合阶段。对于HAN模型而言，第一特征即各个节点的嵌入向量embedding的初始值。

参阅图5所示，在节点聚合阶段，将多组元路径分别输入不同的节点聚合单元，即一组元路径输入对应的一个节点聚合单元，例如将第一组元路径M1输入节点聚合单元N1，第二组元路径M2至第P组元路径Mp依次分别输入节点聚合单元N2至Np。通过各个节点聚合单元，分别对输入的一组元路径内的每条元路径上节点的第一特征进行聚合，作为该条元路径上指定为输出节点的路径端点的第一嵌入向量并输出。

然后，在语义聚合阶段，基于多个节点聚合单元输出的第一嵌入向量，通过语义聚合单元，针对同一个节点的第一嵌入向量进行聚合，得到第二特征。

具体地，可以采用多种方式对一组元路径内的每条元路径上节点的第一特征进行聚合。

在一个实施例中，采用邻接节点聚合的方式进行第一特征的聚合，即元路径上的各个节点均参与聚合。根据预先训练得到的节点权重处理参数，计算该组元路径内的每条元路径上每个节点的第一权重因子，聚合得到路径端点的第一嵌入向量。

更具体而言，图神经网络模型可以采用自注意力机制（self attention）确定某条路径上各个节点的权重因子，在进行自注意力运算过程中使用的网络参数在此统称为节点权重处理参数。节点权重处理参数可体现为对各个节点的第一特征进行注意力处理的参数矩阵，其中的参数值通过对图神经网络模型的训练而确定。各个节点聚合单元可训练得到各自对应的节点权重处理参数。

在各个节点聚合单元中进行第一特征的聚合时，基于训练得到的节点权重处理参数和输入的一条元路径上各个节点的第一特征，确定出该条元路径上各个节点的第一权重因子。然后，基于第一权重因子，对该条元路径上的各个节点对应的第一特征进行加权求和，得到指定为输出节点的节点对应的节点聚合特征（即第一嵌入向量）。作为一种可实施方式，元路径上的起始节点作为指定的输出节点。

例如，参阅图6所示，以一条元路径为例，假定该元路径的格式为U-R-U-K，其中节点U1、R1、U2和K2的第一特征分别为F1、F2、F3、F4。根据对应于该格式的元路径的节点聚合单元中训练得到的权重处理参数，基于F1、F2、F3、F4分别计算该条元路径上节点U1、R1、U2和K2对应的第一权重因子q1、q2、q3、q4，起始节点U1为指定的输出节点，对各个节点进行加权求和，作为节点U1经节点聚合得到的第一嵌入向量E1，E1=F1*q1+F2*q2+F3*q3+F4*q4。在一些实施例中，在加权求和的基础上还乘以调节系数，调节系数也可训练得到，E1=σ（F1*q1+F2*q2+F3*q3+F4*q4），调节系数也可预先训练确定。

在另一实施例中，采用端点聚合的方式进行第一特征的聚合，即仅仅是位于路径端点上的节点参与聚合运算，该种方式在保留了必要的特征信息的同时，运算量更小，更具实用性。具体地，根据预先训练得到节点权重处理参数以及端点节点的第一特征，计算两个路径端点的第一权重因子，然后基于第一权重因子对作为路径端点的两个节点对应的第一特征进行加权求和，作为指定为输出节点的路径端点对应的第一嵌入向量。例如，参阅图7所示，以一条元路径为例，该元路径的格式为U-R-U-K。根据预先训练得到的权重处理参数以及U1和K2分别对应的第一特征F1和F4，计算U1和K2的第一权重因子q1和q4，然后基于第一权重因子对U1和K2对应的第一特征进行加权求和，E1=F1*q1+F4*q4，得到节点U1对应的第一嵌入向量E1。在一些实施例中，在加权求和的基础上还乘以调节系数，调节系数也可训练得到，E1=σ（F1*q1+F4*q4）。

在语义聚合阶段，从多个嵌入向量中，筛选出对应于同一个节点的嵌入向量，根据预先训练得到的路径权重处理参数，计算得到若干第一嵌入向量所对应的若干路径的第二权重因子，第二权重因子用于描述不同元路径之间的相对权重，基于第二权重因子，对同一节点的多个第一嵌入向量进行加权求和，得到所述同一个节点对应的第二嵌入向量，也就是第二特征。其中，各第二权重因子可以基于路径权重处理参数和第一嵌入向量确定，即第二权重因子随输入的第一嵌入向量的变化而变化。

例如，参阅图8所示，对于用户节点U1，根据预先训练得到的路径权重处理参数和节点U1的各个第一嵌入向量E1计算得到第二权重因子Q1、Q2……Qk，其中k表示以U1为指定的输出节点的元路径条数，也就是节点聚合单元输出的U1的第一嵌入向量E1的个数，基于第二权重因子对U1的各个E1进行加权求和，即E2=E1₁*Q1+E1₂*Q2+……+ E1_k*Qk，得到用户节点U1对应的第二嵌入向量，即第二特征E2。

在本说明书实施例中，作为一种可实施方式，需要输出某个节点的第二特征，则以该节点作为元路径的路径端点，也就是指定该节点为输出节点，一般将起始节点作为输出节点。元路径反向输入，则原来的路径终点为输出节点。参照用户节点特征的聚合过程，可相应地针对知识点特征进行聚合，从而得到知识点节点对应的第二特征。以及，将行为节点作为路径端点，也可对应得到聚合后的行为节点对应的第二特征。

参照上述使用异构图注意力模型进行特征聚合的步骤，可采用其他具有异构图处理能力的图神经网络模型进行特征聚合，能够对元路径上的节点第一特征进行节点聚合后再执行路径间的语义聚合即可，并不仅限于采用HAN和HeGNN。

在得到各个节点的第二特征后，一部分实施例中，继续计算各个用户节点与各个知识点节点对应的第二特征之间的相似度，将相似度达到预设要求的知识点确定为有待向相应用户推送的目标知识点。图神经网络模型输出的第二特征多数情形下为一特征向量，计算向量之间的相似度的算法有多种，例如欧几里得距离算法、余弦相似度算法、曼哈顿距离算法等等。相似度达到预设要求的知识点可以是相似度排名前几位或相似度最大的知识点，例如相似度较大的前3个知识点或者相似度最大的1个知识点作为有待向用户推送的知识点。即在用户访问客服系统之前，即确定出将向该用户推送的知识点，在用户进入系统时直接推送给用户。

在另一部分实施例中，得到第二特征后，等待用户的访问请求，例如将用户点击客服系统入口的操作视为用户向指定客服系统发起访问请求，该用户即为目标用户，当目标用户进入了客服系统后，获取与该目标用户对应的用户节点的目标第二特征，计算所述目标第二特征与各个知识点节点的第二特征之间的相似度，将相似度达到预设要求的知识点确定为目标知识点；向所述目标用户推送所述目标知识点。计算向量之间的相似度的运算复杂度不高，因此占用的运算时间一般较短，因此，在用户进入系统后再基于第二特征进行相似度计算进而确定推送的知识点，也为一种可行方案。

由于用户的行为数据是不断更新的，用户所需要的知识点也是不断变化的，因此异构图和各节点的第一特征应不断更新，以使得聚合出的第二特征能够匹配用户当下的需求，在一部分实施例中，可以每隔预定时间，对异构图和第一特征进行更新，并基于图神经网络模型重新聚合以得到最新的第二特征，例如以1-3天为一个周期，在每个周期内定时更新第一特征、异构图以及图神经网络模型，重新聚合相关特征，这样，模型更新后，在用户进入客服系统时，系统能够向用户推送最新的知识点信息。甚至可以一天内设置两次更新，例如统计用户访问高峰时间点，在高峰时间点之前更新模型。

定期更新模型的方式，在用户访问客服系统之前就已经确定好了向用户推送的知识点，当用户进入客服系统时，客服机器人只需要将已经计算好的知识点推送给用户即可，相比于在用户进入客服系统之后，再去针对用户筛选相应的知识点的方式，能够更快地响应用户需求，是一种更为实用的运行方式。

在一些实施例中，异构图还包括用于表示知识点所属类目的类目节点，类目节点与属于该类目的各个知识点对应的知识点节点之间建立有连接边。例如，参阅图9所示，其中知识点节点K1和K2与类目节点C1连接，表示知识点节点K1和K2均属于类目C1，而知识点节点K3与类目节点C2连接，表示相应的知识点K3属于类目节点C2。

相应地，多组元路径还包括第四元路径，第四元路径以知识点节点作为路径端点，且包括至少一个类目节点，例如第四元路径的格式可以是K-C-K。K-C-K格式的元路径所携带的语义信息为：属于同一个类目的知识点解决相关的问题。

基于上述数据处理方法，对于低频知识点，可以根据用户的少量点击行为，建立低频知识点与相应的用户节点之间的连接边，从而使异构图携带低频知识点信息；对于新增知识点，则可以采用如下两种方式衔接：

第一种方式，通过新增知识点所属的类目将其连接到相应的类目节点下，以将新增知识点增加到异构图中。具体地，在所述异构图中增加用于表示所述新增知识点的新增知识点节点；确定所述新增知识点所属的类目，将所述新增知识点节点通过连接边连接至所属的类目对应的类目节点。

第二种方式，首先确定新增知识点，向多个用户随机推送所述新增知识点，若在预定时间段内有用户针对所述新增知识点发出查阅指令时，则在所述异构图中增加用于表示所述新增知识点的新增知识点节点，在发出查阅指令的用户节点与所述新增知识点节点之间，建立连接边。

如此，通过上述两种方式，将新增知识点也纳入了模型处理的对象范围内，当新增知识点至少与一个类目节点或者一个用户节点相连接，设置相应的元路径格式，即可输出新增知识点节点对应的第二特征。

此外，将行为节点指定为输出节点时，通过图神经网络模型输出行为节点对应的第二特征，计算知识点节点与行为节点对应的第二特征之间的相似度，将相似度满足预设要求的行为节点的用户历史行为作为相应知识点的可解释性信息。

例如，知识点节点K2所表示的知识点已被确定为向用户U1推送的知识点，则计算知识点节点K2的第二特征与各个行为节点对应的第二特征之间的相似度，挑选出与知识点节点K2最为匹配或者较为匹配的行为节点，这些行为节点对应的行为可作为该知识点节点的解释性信息，即当某个知识点确定为向用户推送的知识点时，可通过相匹配的行为节点所表示的行为，来判断该知识点的推送是否属于badcase的情形，进而有利于模型的进一步优化。

第二方面，本说明书实施例还提供一种图神经网络模型训练方法，参阅图10所示，该方法包括：

S1002,获取异构图；S1004，在异构图中查找符合预设格式的多组样本元路径，多组样本元路径至少包括以样本用户节点为端点的路径，和以样本知识点节点为端点的路径，样本用户节点和样本知识点节点之间具有标注的已知交互结果；S1006，获取异构图中各个节点的对应的第一特征，第一特征基于各个节点的原始属性特征获得；S1008，将多组样本元路径输入图神经网络模型，通过图神经网络模型对元路径上节点的第一特征进行聚合，至少输出作为路径端点的样本用户节点和样本知识点节点对应的第二特征；S1010，根据样本用户节点和样本知识点节点对应的第二特征，预测样本用户节点和样本知识点节点之间的交互，得到预测交互结果；以及，基于已知交互结果和预测交互结果确定损失值，在损失值减小的方向，调节图神经网络模型。

其中S1002-S1008请参照上述第一方面实施例。

关于S1010，根据样本用户节点和样本知识点节点对应的第二特征，预测样本用户节点和样本知识点节点之间的交互，得到预测交互结果，其中预测交互结果即预测样本用户节点是否会与样本知识点发生交互或者预测其交互的概率。

基于已知交互结果和预测交互结果，确定损失值的具体可行方式有多种，例如，计算概率分布之间的交叉熵损失等。

迭代执行通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，以及向损失值更小的方向调节模型的权重参数的步骤，以本次迭代调节出的权重参数作为下一次迭代中执行聚合的权重参数的初始值，直至计算出的损失值满足预设的要求，例如低于预设阈值，或者趋于稳定和收敛。如此，得到训练后的图神经网络模型。

第三方面，参阅图11所示，本说明书实施例还提供一种用于推送知识点的数据处理装置110，该装置包括：

第一获取单元1102，被配置为获取异构图，所述异构图至少包括，用于表示用户的用户节点，用于表示待推送知识点的知识点节点，和用于表示用户历史行为的行为节点，具备关联关系的不同类型节点之间建立有连接边；

第一查找单元1104，被配置为在所述异构图中查找符合预设格式的多组元路径，所述多组元路径中至少一组元路径以所述用户节点和/或所述知识点节点作为路径端点；

第二获取单元1106，被配置为获取所述异构图中各个节点的对应的第一特征，所述第一特征基于各个节点的原始属性特征获得；

聚合单元1108，被配置为将所述多组元路径输入预先训练得到的图神经网络模型，通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，至少输出作为路径端点的用户节点和/或知识点节点对应的第二特征，所述第二特征用于对用户节点和知识点节点进行匹配，以向用户推送相应知识点。

第四方面，参阅图12所示，本说明书实施例还提供一种图神经网络模型训练装置120，该装置包括：

第三获取单元1202，被配置为获取异构图，所述异构图至少包括，用于表示样本用户的用户节点，用于表示样本知识点的知识点节点，和用于表示用户样本行为的行为节点，具备关联关系的不同类型节点之间建立有连接边；

第二查找单元1204，被配置为在所述异构图中查找符合预设格式的多组元路径，所述多组元路径中至少一组元路径以所述用户节点或所述知识点节点作为路径端点；

第四获取单元1206，被配置为获取所述异构图中各个节点的对应的第一特征，所述第一特征基于各个节点的原始属性特征获得；

训练单元1208，被配置为将所述多组元路径输入图神经网络模型，通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，至少输出作为路径端点的用户节点和/或知识点节点对应的第二特征；以及，基于所述第二特征确定损失值，在所述损失值减小的方向，调节所述图神经网络模型，直至所述损失值低于预设阈值。

第五方面，本说明书实施例还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行上述任一实施例所描述的方法。

第六方面，本说明书实施例还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现上述任一实施例所描述的方法。

综上，本说明书披露的一种用于推送知识点的数据处理方法和装置，能够应用于云客服机器人，使云客服机器人支持“猜你问题”的问题预测功能，在用户进入客服系统时，预测用户可能的问题，并将对应的知识点推荐给用户，无需用户打字输入问题也能得到相关知识点，且推送的知识点可以基于单个用户的特征确定，即确定出的知识点所针对的对象可以精确到某一个用户，相比于统一推荐高频知识点的方案，更能满足用户个性化需求。

此外，相较于基于深度学习模型的方案，本说明书所披露的方案一方面对于新增知识点更具亲和力，新增知识点能够在不更改异构图的基础框架前提下较为方便地添加到异构图中，在加入新增知识点时，可以利用LSTM计算其第一特征的向量表示，并且基于本说明书实施例所披露的特征聚合以及推送机制，当新增知识点与某个用户的特征相似度较高时，新增知识点就能够得到曝光，不会被大量以往知识点训练样本所覆盖；另一方面，支持输出行为节点的第二特征，计算各个行为节点与目标知识点节点的第二特征之间的相似度，以行为节点用来解释将目标知识点节点作为推送的知识点节点的可解释性原因，以增强模型的可解释性。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本说明书披露的多个实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本说明书披露的多个实施例的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本说明书披露的多个实施例的具体实施方式而已，并不用于限定本说明书披露的多个实施例的保护范围，凡在本说明书披露的多个实施例的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本说明书披露的多个实施例的保护范围之内。

Claims

1.一种用于推送知识点的数据处理方法，所述方法包括：

获取异构图，所述异构图至少包括，用于表示用户的用户节点，用于表示待推送知识点的知识点节点，和用于表示用户历史行为的行为节点，具备关联关系的不同类型节点之间建立有连接边；

在所述异构图中查找符合预设格式的多组元路径，所述多组元路径至少包括以所述用户节点为端点的路径，和以所述知识点节点为端点的路径；

获取所述异构图中各个节点的对应的第一特征，所述第一特征基于各个节点的原始属性特征获得，所述原始属性特征包括用户节点对应的个人属性信息、所述知识点节点对应的自然语言信息和所述行为节点对应的用户历史行为的行为类别信息；

将所述多组元路径输入预先训练得到的图神经网络模型，通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，至少输出作为路径端点的用户节点和知识点节点对应的第二特征，所述第二特征用于对用户节点和知识点节点进行匹配，以向用户推送相应知识点。

2.根据权利要求1所述的方法，其中，至少输出作为路径端点的用户节点和知识点节点对应的第二特征之后，还包括：

3.根据权利要求2所述的方法，其中，将相似度达到预设要求的知识点确定为有待向相应用户推送的目标知识点之后，还包括：

将针对指定客服系统发起访问请求的用户确定为目标用户，获取与所述目标用户对应的目标知识点；

向所述目标用户推送所述目标知识点。

4.根据权利要求1所述的方法，其中，至少输出作为路径端点的用户节点和知识点节点对应的第二特征之后，还包括：

将针对指定客服系统发起访问请求的用户确定为目标用户，获取与所述目标用户对应的用户节点的目标第二特征；

计算所述目标第二特征与各个知识点节点的第二特征之间的相似度，将相似度达到预设要求的知识点确定为目标知识点；

向所述目标用户推送所述目标知识点。

5.根据权利要求1所述的方法，其中，在所述异构图中，用户节点与该用户在预定时间段内访问过的知识点对应的知识点节点之间建立有第一类连接边；用户节点与该用户在所述预定时间段内实施的历史行为对应的行为节点之间建立有第二类连接边。

6.根据权利要求5所述的方法，其中，所述多组元路径包括第一元路径和第二元路径，所述第一元路径由所述第一类连接边构成，所述第二元路径由连接到同一行为节点的两条第二类连接边和一条第一类连接边构成。

7.根据权利要求1所述的方法，其中，所述多组元路径还包括第三元路径，所述第三元路径以行为节点作为路径端点，且包括至少一个用户节点；

通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，包括：

通过所述图神经网络模型对所述第三元路径上节点的第一特征进行聚合，输出行为节点对应的第二特征。

8.根据权利要求7所述的方法，其中，输出行为节点对应的第二特征之后，所述方法还包括：

9.根据权利要求1所述的方法，其中，所述异构图还包括用于表示知识点所属类目的类目节点，类目节点与属于该类目的各个知识点对应的知识点节点之间建立有连接边；

10.根据权利要求9所述的方法，其中，所述方法还包括：

11.根据权利要求1所述的方法，其中，所述方法还包括：

获取新增知识点，向多个用户随机推送所述新增知识点；

在预定时间段内有用户针对所述新增知识点发出查阅指令时，则在所述异构图中增加用于表示所述新增知识点的新增知识点节点，在发出查阅指令的用户节点与所述新增知识点节点之间，建立连接边。

12.根据权利要求1所述的方法，其中，在所述异构图中查找符合预设格式的多组元路径，包括：

从用户节点或知识点节点出发，遍历所述异构图，查找符合预定格式的路径作为所述元路径。

13.根据权利要求1所述的方法，其中，所述预设格式包括，依次连接的至少两条预设类别的连接边；在所述异构图中查找符合预设格式的多组元路径，包括：

根据异构图中的节点类别确定节点间的连接边的类别；

以两种不同类型的节点分别作为行元素或列元素，建立相应类别的连接边对应的边矩阵；

在所述异构图中确定通过某个类别的连接边直接连接的节点对，在对应于该某个类别的边矩阵中，将所述节点对相应位置的元素设为第一值，其余元素设置为不同于所述第一值的第二值；

按照所述预设格式，依次计算相邻的连接边对应的两个边矩阵的乘积，将乘积结果为所述第一值的平方值的元素对应的节点依次写入元路径。

14.根据权利要求1所述的方法，其中，获取所述异构图中各个节点的对应的第一特征，包括：

获取所述异构图中各个节点相应的原始属性特征；

将各个节点对应的原始属性特征分别转换到指定维度的特征空间，得到各个节点对应的第一特征。

15.根据权利要求14所述的方法，其中，将各个节点对应的原始属性特征分别转换到指定维度的特征空间，得到各个节点对应的第一特征，包括：

将获取到的各个用户的所述个人属性信息采用One-Hot进行编码，得到各个用户分别对应的初级特征矩阵；

将各个所述初级特征矩阵依次输入预先训练得到的深度神经网络DNN模型，通过所述DNN模型对各个所述初级特征矩阵依次进行降维处理，得到具有指定维度的各个用户节点对应的第一特征。

16.根据权利要求15所述的方法，其中，将各个节点对应的原始属性特征分别转换到指定维度的特征空间，得到各个节点对应的第一特征，包括：

对获取到的各个知识点的自然语言信息，进行分词处理，得到各个知识点对应的分词序列；

将各个所述分词序列分别输入预先训练得到的长短期记忆LSTM模型，通过所述LSTM模型，将各个所述分词序列分别转换为具有指定维度的各个知识点节点对应的第一特征。

17.根据权利要求1所述的方法，其中，所述图神经网络模型为异构图注意力网络HAN模型；

所述HAN模型包括多个节点聚合单元，以及语义聚合单元，所述多个节点聚合单元分别对应于所述多组元路径；

将所述多组元路径输入预先训练得到的图神经网络模型，通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，包括：

将所述多组元路径中各组元路径输入对应的节点聚合单元，通过该对应的节点聚合单元，对该组元路径内的每条元路径上节点的第一特征进行聚合，作为该条元路径上指定为输出节点的路径端点的第一嵌入向量；

基于所述多个节点聚合单元输出的多个第一嵌入向量，通过所述语义聚合单元，针对同一个节点的第一嵌入向量进行聚合。

18.根据权利要求17所述的方法，其中，对该组元路径内的每条元路径上节点的第一特征进行聚合，包括：

19.根据权利要求17所述的方法，其中，通过所述语义聚合单元，针对同一个节点的第一嵌入向量进行聚合，包括：

20.一种图神经网络模型训练方法，所述方法包括：

获取异构图，所述异构图至少包括，用于表示用户的用户节点，用于表示知识点的知识点节点，和用于表示用户行为的行为节点，具备关联关系的不同类型节点之间建立有连接边；

在所述异构图中查找符合预设格式的多组样本元路径，所述多组样本元路径至少包括以样本用户节点为端点的路径，和以样本知识点节点为端点的路径，所述样本用户节点和样本知识点节点之间具有标注的已知交互结果；

将所述多组样本元路径输入图神经网络模型，通过所述图神经网络模型对所述元路径上节点的第一特征进行聚合，至少输出作为路径端点的样本用户节点和样本知识点节点对应的第二特征；

根据所述样本用户节点和样本知识点节点对应的第二特征，预测所述样本用户节点和样本知识点节点之间的交互，得到预测交互结果；

基于所述已知交互结果和所述预测交互结果确定损失值，在所述损失值减小的方向，调节所述图神经网络模型。

21.一种用于推送知识点的数据处理装置，所述装置包括：

第二获取单元，被配置为获取所述异构图中各个节点的对应的第一特征，所述第一特征基于各个节点的原始属性特征获得，所述原始属性特征包括用户节点对应的个人属性信息、所述知识点节点对应的自然语言信息和所述行为节点对应的用户历史行为的行为类别信息；

22.一种图神经网络模型训练装置，所述装置包括：

第四获取单元，被配置为获取所述异构图中各个节点的对应的第一特征，所述第一特征基于各个节点的原始属性特征获得，所述原始属性特征包括用户节点对应的个人属性信息、所述知识点节点对应的自然语言信息和所述行为节点对应的用户历史行为的行为类别信息；

23.一种计算机可读存储介质，其上存储有计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-20中任一项的所述的方法。

24.一种计算设备，包括存储器和处理器，其中，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-20中任一项所述的方法。