CN115982463A

CN115982463A - 资源推荐方法、装置、设备及存储介质

Info

Publication number: CN115982463A
Application number: CN202211717041.3A
Authority: CN
Inventors: 孟海涛
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2022-12-29
Filing date: 2022-12-29
Publication date: 2023-04-18

Abstract

本发明提供一种资源推荐方法、装置、设备及存储介质，方法包括：获取待推荐用户的用户特征信息，以及获取若干个候选资源的资源特征信息；将所述用户特征信息和所述资源特征信息输入至资源推荐模型，得到所述资源推荐模型输出的资源推荐结果；其中，所述资源推荐模型是基于不同用户对应的资源类型偏好信息和用户嵌入式向量、各个资源对应的资源交互统计信息和资源嵌入式向量进行训练得到。本发明通过根据用户嵌入式向量、各个资源对应的资源嵌入式向量，结合资源类型偏好信息和资源交互统计信息，训练得到资源推荐模型，从而利用资源推荐模型学习得到各个资源的下载量、评论量等统计信息以及用户的类型偏好，有效提高资源推荐的准确性。

Description

资源推荐方法、装置、设备及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种资源推荐方法、装置、设备及存储介质。

背景技术

随着人工智能的发展，由推荐系统带来的推荐服务基本上已经渗透到我们生活的方方面面。

目前，资源推荐方案一般是研究用户与各个资源的交互、序列，基于自然语言处理技术，对资源以及用户做嵌入式表示，进而基于资源的嵌入式向量以及用户的嵌入式向量，计算资源与用户之间的相似度，召回与搜索物品相似的待选资源，然后根据相似度的大小确定资源的推荐结果。然而，仅仅根据嵌入式向量之间的相似度来确定推荐结果，考虑因素过于单一，可能导致资源推荐的准确性较低。

发明内容

本发明提供一种资源推荐方法、装置、设备及存储介质，旨在提高资源推荐的准确性。

本发明提供一种资源推荐方法，包括：

获取待推荐用户的用户特征信息，以及获取若干个候选资源的资源特征信息；

将所述用户特征信息和所述资源特征信息输入至资源推荐模型，得到所述资源推荐模型输出的资源推荐结果；

其中，所述资源推荐模型是基于不同用户对应的资源类型偏好信息和用户嵌入式向量、各个资源对应的资源交互统计信息和资源嵌入式向量进行训练得到。

根据本发明提供的一种资源推荐方法，所述资源特征信息包括所述候选资源的目标资源交互统计信息以及目标资源嵌入式向量；所述用户特征信息包括所述待推荐用户的目标资源类型偏好信息以及目标用户嵌入式向量；

所述将所述用户特征信息和所述资源特征信息输入至至资源推荐模型，得到所述资源推荐模型输出的资源推荐结果，包括：

基于所述目标用户嵌入式向量与各所述候选资源对应的目标资源嵌入式向量，确定各所述候选资源分别对应的目标相似度；

对于任意一个候选资源，基于所述目标资源类型偏好信息、所述候选资源对应的目标相似度以及目标资源交互统计信息，形成待推荐特征信息；

将各所述待推荐特征信息输入至所述资源推荐模型，得到所述资源推荐模型输出的资源推荐结果。

根据本发明提供的一种资源推荐方法，所述获取若干个候选资源的资源特征信息，包括：

获取所述待推荐用户的资源查询请求；

基于所述资源查询请求，在资源特征数据库中查询得到各所述候选资源分别对应的资源特征信息；

所述资源特征数据库存储有基于不同用户的历史交互序列，利用资源嵌入式预测模型预测得到不同资源对应的资源嵌入式向量。

根据本发明提供的一种资源推荐方法，所述资源嵌入式预测模型是基于如下步骤训练得到：

获取不同用户对应的历史交互序列；

基于所述不同用户对应的历史交互序列，构建资源交互有向图，其中，所述资源交互有向图的图节点表征资源的资源标签；

对所述资源交互有向图中的各个图节点进行采样处理，得到若干个资源节点序列；

基于各所述资源节点序列以及各个资源对应的资源类别信息，构建得到若干个融合编码向量；

基于各所述融合编码向量，对所述资源嵌入式预测模型进行训练。

根据本发明提供的一种资源推荐方法，所述资源推荐模型是基于如下步骤训练得到：

获取不同用户的历史交互序列、资源类型偏好信息以及各个资源的资源交互统计信息；

对于任意一个用户的历史交互序列，将所述历史交互序列中各个资源对应的资源嵌入式向量进行聚合处理，得到用户嵌入式向量；

基于所述用户嵌入式向量和各所述资源对应的资源嵌入式向量，确定各个资源分别对应的相似度；

基于不同用户的资源类型偏好信息、各个资源分别对应的相似度以及资源交互统计信息，对所述资源推荐模型进行训练。

根据本发明提供的一种资源推荐方法，所述基于不同用户的资源类型偏好信息、各个资源分别对应的相似度以及资源交互统计信息，对所述资源推荐模型进行训练，包括；

基于任一用户的资源类型偏好信息、任一资源对应的相似度以及资源交互统计信息，形成若干个训练样本数据；

基于各所述用户的历史交互序列，确定各所述训练样本数据分别对应的样本标签；

基于各所述训练样本数据以及各所述训练样本数据对应的样本标签，对所述资源推荐模型进行训练。

根据本发明提供的一种资源推荐方法，所述对于任意一个用户的历史交互序列，将所述历史交互序列中各个资源对应的资源嵌入式向量进行聚合处理，得到用户嵌入式向量之后，还包括：

对于任意一个用户，将所述用户对应的用户基础信息、资源类型偏好信息以及用户嵌入式向量关联存储至用户特征数据库中；

相应地，所述获取待推荐用户的用户特征信息，包括：

根据所述待推荐用户的基础信息，在所述用户特征数据库中查询得到所述待推荐用户的用户特征信息；

若在所述用户特征数据库中查询不到所述待推荐用户的用户特征信息，则基于所述基础信息，在所述用户特征数据库中查询匹配得到各个相似用户；

将各所述相似用户的用户特征数据进行聚合处理，得到所述待推荐用户的用户特征信息。

本发明还提供一种资源推荐装置，包括：

获取模块，用于获取待推荐用户的用户特征信息，以及获取若干个候选资源的资源特征信息；

推荐模块，用于将所述用户特征信息和所述资源特征信息输入至资源推荐模型，得到所述资源推荐模型输出的资源推荐结果；

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述资源推荐方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述资源推荐方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述资源推荐方法。

本发明提供的资源推荐方法、装置、设备及存储介质，通过根据用户嵌入式向量、各个资源对应的资源嵌入式向量，结合资源类型偏好信息和资源交互统计信息，训练得到资源推荐模型，从而根据待推荐用户的用户特征信息以及若干个候选资源的资源特征信息，利用资源推荐模型学习得到各个资源的下载量、评论量等统计信息以及用户的类型偏好，有效提高资源推荐的准确性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图逐一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的资源推荐方法的流程示意图之一；

图2是本发明提供的资源推荐方法的流程示意图之二；

图3是本发明一个实施例提供的资源交互有向图；

图4是本发明提供的资源推荐方法的流程示意图之三；

图5是本发明提供的资源推荐装置的结构示意图；

图6是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明一个或多个实施例。在本发明一个或多个实施例中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本发明一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本发明一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本发明一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”。

针对上述问题，本发明提出以下各实施例。图1是本发明提供的资源推荐方法的流程示意图之一。如图1所示，该资源推荐方法包括：

步骤11，获取待推荐用户的用户特征信息，以及获取若干个候选资源的资源特征信息；

需要说明的是，所述资源可以是任意类型的物品，例如，可以是课件、商品、网页、歌曲、视频、以及图片等资源。本实施例对此没有限制。

进一步地，所述资源特征信息包括所述候选资源的目标资源交互统计信息以及目标资源嵌入式向量；可选地，目标资源交互统计信息包括与待推荐用户进行交互的各个候选资源对应的统计数据，例如，目标资源交互统计信息包括各个候选资源的下载量、评论量以及浏览量等数据，可选地，在预设间隔周期内，统计各个候选资源对应的统计数据，所述预设间隔周期可根据实际情况设置，在此不做具体赘述，例如，将所述预设间隔周期设置为一天，从而每一天均需要统计各个资源的下载量、评论量以及浏览量等统计数据。

在一个实施例中，具体地，获取待推荐用户与各个资源的交互序列，进而利用资源嵌入式预测模型预测得到交互序列中不同资源对应的资源嵌入式向量。

在另一个实施例中，在推荐过程中，推荐的资源往往是海量的，利用资源嵌入式预测模型预测实时计算资源特征会大大增加系统负担，导致每秒事务处理能力下降，最终影响用户体验。因此，在本实施例中，可获取所述待推荐用户的资源查询请求，可所述资源查询请求是根据待推荐用户的选择信息生成得到，例如，根据待推荐用户选择的学科、学段等信息，配合待推荐用户手动选择的书本和单元信息等信息，生成资源查询请求对应的检索语句，进而基于所述资源查询请求，在资源特征数据库中查询得到若干个候选资源的资源特征信息；可选地，候选资源的数量在此不做具体赘述，需要说明的是，所述资源特征数据库关联存储有任意一个资源对应的资源交互统计信息，以及基于不同用户的历史交互序列，利用资源嵌入式预测模型预测得到不同资源对应的资源嵌入式向量。可选地，所述资源嵌入式预测模型是基于不同用户对应的历史交互序列，以及各个资源对应的资源类别信息进行训练得到，可选地，资源类别信息表征资源的分类信息，例如，当资源是课件资源时，所述资源类别信息包括课件资源的年级、学科和教材等分类信息。

进一步需要说明的是，所述用户特征信息包括所述待推荐用户的目标资源类型偏好信息以及目标用户嵌入式向量。目标用户嵌入式向量是将与待推荐用户交互的各个资源对应的资源嵌入式向量进行聚合得到，目标资源类型偏好信息是基于待推荐用户与各个资源的资源交互统计信息统计得到，任一资源均配置有资源所属的类型标签，例如，课件资源的类型标签包括物理、编程技术、大数据等，购买的商品对应的类型标签包括分类标签包括上衣、裤子、裙子等。

在一个实施例中，预先将每一个用户对应的用户基础信息、资源类型偏好信息以及用户嵌入式向量关联存储至用户特征数据库中，从而根据待推荐用户的基础信息，可在用户特征数据库中快速查询得到该基础信息关联的目标资源类型偏好信息以及目标用户嵌入式向量，可选地，所述基础信息包括用户的用户标签、用户所处城市和地区等信息，可选地，若资源是课件资源，所述基础信息还可包括用户所处的学校以及年级等信息，所述用户标签表示用户的身份识别标识。

在另一个实施例中，若在所述用户特征数据库中查询不到所述待推荐用户的用户特征信息，则基于所述基础信息，在所述用户特征数据库中查询匹配得到各个相似用户，例如，将同一个城市同一个地区的各个用户作为相似用户，进一步地，将各所述相似用户的用户特征数据进行聚合处理，得到所述待推荐用户的用户特征信息。

步骤12，将所述用户特征信息和所述资源特征信息输入至资源推荐模型，得到所述资源推荐模型输出的资源推荐结果；

具体地，基于所述目标用户嵌入式向量与各所述候选资源对应的目标资源嵌入式向量，分别计算各所述候选资源分别对应的目标相似度，进而基于所述待推荐用户的目标资源类型偏好信息、任一候选资源对应的目标相似度以及目标资源交互统计信息，形成任一候选资源对应的待推荐特征信息，进一步地，分别将各所述待推荐特征信息输入至所述资源推荐模型，得到所述资源推荐模型输出的资源推荐结果。可以理解的是，所述资源推荐模型是基于不同用户对应的资源类型偏好信息和用户嵌入式向量、各个资源对应的资源交互统计信息和资源嵌入式向量进行训练得到，其中，所述资源类型偏好信息表征用户对资源的偏好类型，所述资源交互统计信息表征资源与用户之间交互的统计数量。更为具体地，对于任意一个用户，基于用户的历史交互序列，确定与用户交互的各个资源，基于用户的用户嵌入式向量、与用户交互的各个资源对应的资源嵌入式向量，确定各个资源的相似度，进而基于不同用户对应的资源类型偏好信息、各个资源对应的相似度以及资源交互统计信息训练得到资源推荐模型，从而可利用资源推荐模型学习得到各个资源的下载量、评论量等统计信息以及用户的类型偏好，有效提高资源推荐的准确性。

本发明实施例通过根据用户嵌入式向量、各个资源对应的资源嵌入式向量，结合资源类型偏好信息和资源交互统计信息，训练得到资源推荐模型，从而根据待推荐用户的用户特征信息以及若干个候选资源的资源特征信息，利用资源推荐模型学习得到各个资源的下载量、评论量等统计信息以及用户的类型偏好，有效提高资源推荐的准确性。

在本发明的一个实施例中，所述将所述用户特征信息和所述资源特征信息输入至至资源推荐模型，得到所述资源推荐模型输出的资源推荐结果，包括：

基于所述目标用户嵌入式向量与各所述候选资源对应的目标资源嵌入式向量，确定各所述候选资源对应的目标相似度；对于任意一个候选资源，基于所述目标资源类型偏好信息、所述候选资源对应的目标相似度以及目标资源交互统计信息，形成待推荐特征信息；将各所述待推荐特征信息输入至所述资源推荐模型，得到所述资源推荐模型输出的资源推荐结果。

具体地，基于所述目标用户嵌入式向量与各所述候选资源分别对应的目标资源嵌入式向量，确定各所述候选资源分别对应的目标相似度，例如，目标相似度可利用欧氏距离以及点积相似度算法等方法计算得到。

进一步地，对于任意一个候选资源均执行以下步骤：基于所述目标资源类型偏好信息、所述候选资源对应的目标相似度以及所述候选资源对应的目标资源交互统计信息，形成待推荐特征信息。

更进一步地，分别将各所述待推荐特征信息输入至所述资源推荐模型，得到所述资源推荐模型输出的资源推荐结果，可选地，基于资源推荐模型输出的各个候选资源对应的得分高低，对各个候选资源对应的得分进行排序处理，得到所述资源推荐结果。可选地，也可根据得分排序结果，选取预设资源数量的得分较高对应的各个候选资源作为所述资源推荐结果。

本发明实施例通过计算目标用户嵌入式向量与各个目标资源嵌入式向量之间的目标相似度，并且结合目标资源类型偏好信息和候选资源对应的目标资源交互统计信息，利用资源推荐模型学习得到各个资源的下载量、评论量等统计信息以及用户的资源类型偏好，从而得到资源推荐模型输出的资源推荐结果，提高资源推荐的准确性。

图2是本发明提供的资源推荐方法的流程示意图之二，如图2所示，在本发明的一个实施例中，所述资源嵌入式预测模型是基于如下步骤训练得到：

步骤21，获取不同用户对应的历史交互序列；

需要说明的是，历史交互序列表示在历史时间段中，与用户产生过交互的资源序列，可以理解为用户对资源的点击、浏览、搜索、购买、播放、分享、评论等等行为，可以理解的是，对于不同的资源，交互的行为类型可能不同，其中，所述历史时间段根据实际情况设定，在此不做具体赘述。

本实施例中，序列中的资源和目标用户的交互行为可以是相同的，例如，在同一个历史交互序列中，目标用户与资源的交互行为是目标用户对资源的下载行为。当然，在其他实施例中，序列中的资源和目标用户的交互行为可以是不同的，例如，在同一个历史交互序列中，目标用户对资源的交互行为包括目标用户对资源的浏览行为和下载行为。

具体地，获取各个用户在历史时间段内与各个资源的交互信息，进而按照交互时间的顺序，将用户与各个资源的交互信息，组成该用户的历史交互序列，可选地，历史交互序列是由资源的资源标签组成，所述资源标签表示资源的ID识别标识。可以理解地，用户U1最近浏览了课件资源A并下载了课件资源B和课件资源C，那么用户U1的历史交互序列{A，B，C}，并统计其他用户的历史交互序列，例如，用户U2的历史交互序列{C，A，D}，用户U2的历史交互序列{D，C，B}。

步骤22，基于所述不同用户对应的历史交互序列，构建资源交互有向图，其中，所述资源交互有向图的图节点表征资源的资源标签；

需要说明的是，资源交互有向图是有向图，具体地，基于任意一个用户对应的历史交互序列，利用有向边将所述历史交互序列中的资源标签进行连接，从而构建得到资源交互有向图，沿用上述步骤21的例子，资源交互有向图可如图3所示，图3是本发明一个实施例提供的资源交互有向图。可选地，所述资源交互有向图的图节点表征资源的资源标签，边的权重是结合所有用户对应的历史交互序列中两个图节点出现的频次次数确定。

步骤23，对所述资源交互有向图中的各个图节点进行采样处理，得到若干个资源节点序列；

需要说明的是，所述采样处理包括Node2Vec或DeepWalk等随机游走方法，优选地，选取DeepWalk等随机游走方法。具体地，在资源交互有向图中的各个图节点中随机选取得到开始节点，进而对开始节点对应的相邻节点进行采样，其中，若开始节点存在多个相邻节点，则依据预先设置的转移概率函数，计算各个相邻节点分别对应的概率，其中，所述概率是基于边的权重确定的，进而将概率最大的相邻节点作为最终的下一个节点。例如，假设记图节点i和图节点j之间的边的权重为W_i，j，转移概率函数如下：

其中，N₊(v_i)表示图节点vi对应的全部相邻节点，k表示全部相邻节点中的某一个图节点，图节点vi表示开始节点。

进一步地，将所述下一个节点作为当前节点，采样所述当前节点的下一个节点，直到当前节点不存在下一个节点，或者达到预设最大序列长度，得到所述资源节点序列，其中，所述预设最大序列长度可按照实际情况设置，在此不做具体赘述。

步骤24，基于各所述资源节点序列以及各个资源对应的资源类别信息，构建得到若干个融合编码向量；

需要说明的是，资源类别信息表征资源的分类信息，例如，当资源是课件资源时，所述资源类别信息包括课件资源的年级、学科和教材等类别信息。具体地，由于模型无法识别到资源节点序列的节点信息，需要对各资源节点序列进行向量编码，例如，进行one hot独热编码或者利用SkipGram模型学习资源节点序列中各个资源节点的embedding向量，从而得到资源初始向量，进而将任一所述资源对应的资源类别信息中的各个类别信息进行编码，得到类别编码向量，其中，各个类别信息的类别编码向量与资源初始向量的向量空间的维度相同。进一步地，基于任一所述资源节点序列的资源初始向量，以及所述资源节点序列中各个资源对应的类别信息的类别编码向量，形成所述融合编码向量。在一实施例中，由于不同类别信息的类别编码向量对资源的嵌入式向量的贡献不同，可预先配置各个类别信息对应的权重，进而将所有类别信息的类别编码向量和资源初始向量进行求和，得出融合编码向量。

步骤25，基于各所述融合编码向量，对所述资源嵌入式预测模型进行训练。

需要说明的是，所述资源嵌入式预测模型包括BGE、GES和EGES等模型，优选地，选取EGES模型。

具体地，基于各所述融合编码向量，对所述资源嵌入式预测模型进行迭代训练，从而可利用资源嵌入式向量输出各个资源对应的资源嵌入式向量。

另外地，将任一资源对应的资源交互统计信息、资源嵌入式向量以及资源基本信息关联存储在资源特征数据中，从而可在资源特征数据库中快速查找到各个资源的信息。

本发明实施例通过将历史交互序列以及各个资源对应的资源类别信息，从而资源嵌入式预测模型学习到各个资源类别信息，有效提高模型预测各个资源对应的资源嵌入式向量的准确性。

在本发明的一个实施例中，所述获取若干个候选资源的资源特征信息，包括：

获取所述待推荐用户的资源查询请求；基于所述资源查询请求，在资源特征数据库中查询得到各所述候选资源分别对应的资源特征信息；所述资源特征数据库存储有基于不同用户的历史交互序列，利用资源嵌入式预测模型预测得到不同资源对应的资源嵌入式向量。

在一实施例中，获取待推荐用户与各个资源的交互序列，利用训练好的资源嵌入式预测模型预测得到交互序列中各个资源对应的资源嵌入式向量。

在另一实施例中，在本实施例中，为了提高获取若干个候选资源的资源特征信息的效率，在利用资源嵌入式预测模型输出各个资源对应的资源嵌入式向量之后，将任一资源对应的资源嵌入式向量、资源基础信息以及资源交互统计信息关联存储至资源特征数据库中，例如，课件资源的资源基础信息包括课件资源对应的年级、学科、学段等基本信息，商品的资源基础信息包括商品对应的价格、商品分类等基本信息。另外地。资源交互统计信息包括资源的下载量、浏览量以及评论量等信息。

进一步地，在资源推荐过程中，可根据待推荐用户的选择信息，生成所述资源查询请求，例如，根据待推荐用户选择的学科、学段等信息，配合待推荐用户手动选择的书本和单元信息等信息，生成资源查询请求对应的检索语句，从而基于检索语句，快速在所述资源特征数据库进行检索，得到若干个候选资源对应的目标资源交互统计信息以及目标资源嵌入式向量，其中，所述目标资源交互统计信息包括资源的历史下载量、浏览量以及评论量等统计信息。

本发明实施例通过将任一资源对应的资源嵌入式向量以及资源基础信息以及资源交互统计信息关联存储至资源特征数据库中，从而可快速检索得到待推荐用户对应的若干个候选资源，提高资源推荐的效率。

图4是本发明提供的资源推荐方法的流程示意图之三，如图4所示，在本发明的一个实施例中，所述资源推荐模型是基于如下步骤训练得到：

步骤41，获取不同用户的历史交互序列、资源类型偏好信息以及各个资源的资源交互统计信息；

需要说明的是，所述资源类型偏好信息是基于用户与各个资源的目标资源交互统计信息统计得到，任一资源均配置有资源所属的分类标签。

具体地，基于用户与各个资源的交互数据，其中，所述交互数据包括资源交互的次数，选取预设数量的次数较多的资源作为目标资源，进而将各个目标资源对应的类型标签作为用户的资源类型偏好信息。此外，统计各个资源对应的资源交互统计信息，例如，统计各个资源分别对应的下载量、浏览数以及评论量等目标资源交互统计信息。

步骤42，对于任意一个用户的历史交互序列，将所述历史交互序列中各个资源对应的资源嵌入式向量进行聚合处理，得到用户嵌入式向量；

具体地，对于任意一个用户的历史交互序列均执行以下步骤：

由于历史交互序列是用户和各个资源的交互序列，可将所述历史交互序列中各个资源对应的资源嵌入式向量进行聚合处理，其中，所述聚合处理包括求取平均值或者最大值等处理方法，从而得到用户的用户嵌入式向量。

步骤43，基于所述用户嵌入式向量和各所述资源对应的资源嵌入式向量，确定各个资源对应的相似度；

具体地，对于任一所述用户对应的用户嵌入式向量均执行以下步骤：

基于所述用户嵌入式向量，以及与用户交互的各个资源对应的资源嵌入式向量，利用预先设置的相似度算法求得到各个资源对应的相似度，可选地，相似度算法包括欧式距离、马氏距离以及点相似度等算法，由于向量的长度本身对相似度有真实影响，优选地，本发明实施例采用点积相似度算法。

步骤44，基于不同用户的资源类型偏好信息、各个资源分别对应的相似度以及资源交互统计信息，对所述资源推荐模型进行训练。

具体地，对于任意一个用户均执行以下步骤：将所述用户对应的资源类型偏好信息，与任意一个资源对应的相似度以及资源交互统计信息，形成一个训练样本数据，进一步地，基于用户对应的历史交互序列，判断该用户与资源是否存在交互行为，也即，判断用户是否浏览、下载或者评论了资源，若存在交互行为，将该训练样本数据对应的样本标签设置为1；相反的，若不存在交互行为，则将该训练样本数据对应的样本标签设置为0。

进一步地，将任意一个所述训练样本数据输入至资源推荐模型，得到预测值，进而基于所述训练样本数据对应的预测值以及样本标签，确定模型损失值，进而基于所述模型损失值，对资源推荐模型中的模型参数进行更新，此次训练结束，进而进行下一次迭代训练，进而判断更新后的资源推荐模型是否满足预设结束结束，若满足，则将更新后的资源推荐模型作为最终的资源推荐模型，若不满足，则继续训练模型，所述预设结束结束包括资源推荐模型达到收敛或者训练次数达到预先设置的最高迭代次数。

本发明实施例通过有效根据资源与用户间的相似度，结合下载量、观看量及类型偏好等统计类信息，训练得到资源推荐模型，有效提升模型推荐的准确性。

在本发明的一个实施例中，所述将所述历史交互序列中各个资源对应的资源嵌入式向量进行聚合处理，得到用户嵌入式向量之后，还包括：

对于任意一个用户，将所述用户对应的用户基础信息、资源类型偏好信息以及用户嵌入式向量关联存储至用户特征数据库中。

需要说明的是，所述用户基础信息包括用户标签、用户所处城市、同校及年级等信息，进而对于任意一个用户，将所述用户对应的用户基础信息、资源类型偏好信息以及用户嵌入式向量关联存储至用户特征数据库中，从而可根据用户登录的用户标签准确查询得到用户对应的资源类型偏好信息以及用户嵌入式向量。

相应地，所述获取待推荐用户的用户特征信息，包括：

根据所述待推荐用户的基础信息，在所述用户特征数据库中查询得到所述待推荐用户的用户特征信息。

具体地，根据所述待推荐用户的基础信息，判断在所述用户特征数据库中是否查询得到所述待推荐用户的用户特征信息，若是，则获取得到所述待推荐用户的用户特征信息，例如，根据所述基础信息中待推荐用户对应的用户标签，在所述用户特征数据库中查询得到所述待推荐用户对应的目标资源类型偏好信息以及目标用户嵌入式向量。

另外地，在一实施例中，若在所述用户特征数据库中查询不到所述待推荐用户的用户特征信息，则基于所述基础信息，在所述用户特征数据库中查询匹配得到各个相似用户；将各所述相似用户的用户特征数据进行聚合处理，得到所述待推荐用户的用户特征信息。

具体地，如果待推荐用户在用户特征数据库中存在基础信息，但是待推荐用户的用户特征信息为空，此时，为保证系统鲁棒性，可基于所述基础信息，在所述用户特征数据库中查询匹配得到各个相似用户，例如，可以理解地，假设资源是课件资源，基于所述待推荐用户的基础信息，获取与待推荐用户同年级、同校或者同年级、同城市下对应的各个相似用户。进一步地，将各所述相似用户的用户特征数据进行聚合处理，例如，求平均，从而得到所述待推荐用户的用户特征信息。

另外地，如果无法从用户特征数据库中获取到待推荐用户对应的基础信息，则表示该待推荐为冷启动用户，也即，该待推荐用户是第一次使用资源推荐功能，可预先构建一个虚拟用户特征信息作为该冷启动用户的特征信息。

本发明实施例通过对于任意一个用户，将所述用户对应的用户基础信息、资源类型偏好信息以及用户嵌入式向量关联存储至用户特征数据库中，从而可在用户特征数据库中快速查询得到待推荐用户的用户特征信息。

下面对本发明提供的资源推荐装置进行描述，下文描述的资源推荐装置与上文描述的资源推荐方法可相互对应参照。

图5是本发明提供的资源推荐装置的结构示意图，如图5所示，本发明实施例的一种资源推荐装置，该装置包括：

获取模块51，用于获取待推荐用户的用户特征信息，以及获取若干个候选资源的资源特征信息；

推荐模块52，用于将所述用户特征信息和所述资源特征信息输入至资源推荐模型，得到所述资源推荐模型输出的资源推荐结果；

所述资源推荐装置还包括：所述资源特征信息包括所述候选资源的目标资源交互统计信息以及目标资源嵌入式向量；所述用户特征信息包括所述待推荐用户的目标资源类型偏好信息以及目标用户嵌入式向量。

所述推荐模块52还用于：

所述获取模块51还用于：

获取所述待推荐用户的资源查询请求；

所述资源推荐装置还包括：

获取不同用户对应的历史交互序列；

所述资源推荐装置还包括：

所述获取模块51还用于：

在此需要说明的是，本发明实施例提供的上述装置，能够实现上述方法实施例所实现的所有方法步骤，且能够达到相同技术效果，在此不再对本实施例中与方法实施例相同部分及有益效果进行具体赘述。

图6是本发明提供的电子设备的结构示意图，如图6所示，该电子设备可以包括：处理器(processor)610、存储器(memory)620、通信接口(Communications Interface)630和通信总线640，其中，处理器610，存储器620，通信接口630通过通信总线640完成相互间的通信。处理器610可以调用存储器620中的逻辑指令，以执行资源推荐方法，该方法包括：获取待推荐用户的用户特征信息，以及获取若干个候选资源的资源特征信息；将所述用户特征信息和所述资源特征信息输入至资源推荐模型，得到所述资源推荐模型输出的资源推荐结果；其中，所述资源推荐模型是基于不同用户对应的资源类型偏好信息和用户嵌入式向量、各个资源对应的资源交互统计信息和资源嵌入式向量进行训练得到。

此外，上述的存储器620中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的资源推荐方法，该方法包括：获取待推荐用户的用户特征信息，以及获取若干个候选资源的资源特征信息；将所述用户特征信息和所述资源特征信息输入至资源推荐模型，得到所述资源推荐模型输出的资源推荐结果；其中，所述资源推荐模型是基于不同用户对应的资源类型偏好信息和用户嵌入式向量、各个资源对应的资源交互统计信息和资源嵌入式向量进行训练得到。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的资源推荐方法，该方法包括：获取待推荐用户的用户特征信息，以及获取若干个候选资源的资源特征信息；将所述用户特征信息和所述资源特征信息输入至资源推荐模型，得到所述资源推荐模型输出的资源推荐结果；其中，所述资源推荐模型是基于不同用户对应的资源类型偏好信息和用户嵌入式向量、各个资源对应的资源交互统计信息和资源嵌入式向量进行训练得到。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种资源推荐方法，其特征在于，包括：

2.根据权利要求1所述的资源推荐方法，其特征在于，所述资源特征信息包括所述候选资源的目标资源交互统计信息以及目标资源嵌入式向量；所述用户特征信息包括所述待推荐用户的目标资源类型偏好信息以及目标用户嵌入式向量；

3.根据权利要求1所述的资源推荐方法，其特征在于，所述获取若干个候选资源的资源特征信息，包括：

获取所述待推荐用户的资源查询请求；

4.根据权利要求3所述的资源推荐方法，其特征在于，所述资源嵌入式预测模型是基于如下步骤训练得到：

获取不同用户对应的历史交互序列；

5.根据权利要求1所述的资源推荐方法，其特征在于，所述资源推荐模型是基于如下步骤训练得到：

6.根据权利要求5所述的资源推荐方法，其特征在于，所述基于不同用户的资源类型偏好信息、各个资源分别对应的相似度以及资源交互统计信息，对所述资源推荐模型进行训练，包括；

7.根据权利要求5所述的资源推荐方法，其特征在于，所述对于任意一个用户的历史交互序列，将所述历史交互序列中各个资源对应的资源嵌入式向量进行聚合处理，得到用户嵌入式向量之后，还包括：

相应地，所述获取待推荐用户的用户特征信息，包括：

8.一种资源推荐装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述资源推荐方法。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述资源推荐方法。