CN115757961A

CN115757961A - 评价推荐算法模型的方法、装置、设备以及存储介质

Info

Publication number: CN115757961A
Application number: CN202211482294.7A
Authority: CN
Inventors: 黎功辉; 李昆
Original assignee: Baidu com Times Technology Beijing Co Ltd
Current assignee: Baidu com Times Technology Beijing Co Ltd
Priority date: 2022-11-24
Filing date: 2022-11-24
Publication date: 2023-03-07

Abstract

本公开提供了评价推荐算法模型的方法、装置、设备以及存储介质，涉及计算机技术领域，尤其涉及机器学习、神经网络模型技术领域。具体实现方案为：获取推荐算法模型的召回链路中确定的多个推荐资源对象；采用深度编码网络模型对多个推荐资源对象进行向量化编码，得到多个推荐资源对象各自对应的向量化编码结果；根据多个推荐资源对象各自对应的向量化编码结果，分别计算不同的推荐资源对象之间的相似度；根据不同的推荐资源对象之间的相似度，评价推荐算法模型的推荐结果的多样性。以基于相似度度量实现自动化自评价，进而可以辅助推荐算法模型进行优化迭代。

Description

评价推荐算法模型的方法、装置、设备以及存储介质

技术领域

本公开涉及计算机技术领域，尤其是机器学习、神经网络模型技术领域。尤其涉及一种评价推荐算法模型的方法、装置、设备以及存储介质。

背景技术

目前，采用推荐算法模型，为用户推荐定制化的信息或者商品，极大地提高了信息的使用效率。

但是，随着推荐算法模型的发展，人们开始关注推荐算法模型的推荐结果的多样性。融入多样性的推荐结果能够保持用户活跃度，同时，多样性输出的推荐结果，能够更好的帮助克服推荐算法模型所带来的“信息茧房”效应，为用户提供更好的信息或商品推荐服务。

发明内容

本公开提供了一种评价推荐算法模型的方法、装置、设备以及存储介质。

根据本公开的第一方面，提供了一种评价推荐算法模型的方法，上述方法包括：

获取推荐算法模型的召回链路中确定的多个推荐资源对象；

采用深度编码网络模型对上述多个推荐资源对象进行向量化编码，得到上述多个推荐资源对象各自对应的向量化编码结果；

根据上述多个推荐资源对象各自对应的向量化编码结果，分别计算不同的上述推荐资源对象之间的相似度；

根据不同的上述推荐资源对象之间的相似度，评价上述推荐算法模型的推荐结果的多样性。

进一步地，上述获取推荐算法模型的召回链路中确定的多个推荐资源对象，包括：

采用黑盒测试方法和/或白盒测试方法，获取上述多个推荐资源对象，其中，上述黑盒测试方法至少包括采用机器人模拟访问的方式获取上述多个推荐资源对象，上述白盒测试方法至少包括在上述推荐算法模型直接获取上述多个推荐资源对象。

进一步地，上述向量化编码结果至少包括：每个上述推荐资源对象对应的n维向量，上述根据上述多个推荐资源对象各自对应的向量化编码结果，分别计算不同的上述推荐资源对象之间的相似度，包括：

根据每个上述推荐资源对象对应的n维向量，分别计算不同的上述推荐资源对象之间的空间距离，其中，上述空间距离包括如下至少之一：欧式距离、曼哈顿距离；

根据不同的上述推荐资源对象的空间距离，确定不同的上述推荐资源对象之间的相似度。

进一步地，上述根据不同的上述推荐资源对象之间的相似度，评价上述推荐算法模型的推荐结果的多样性，包括：

根据不同的上述推荐资源对象之间的相似度，计算得到相似度平均值；

基于上述相似度平均值确定不同的上述推荐资源对象之间的离散程度；

将上述不同的上述推荐资源对象之间的离散程度，作为评价指标，以得到上述推荐算法模型的推荐结果的多样性。

进一步地，上述方法还包括：

采用多组训练数据通过机器学习，对初始编码网络模型的节点参数进行预训练，得到上述深度编码网络模型，其中，多组训练数据中的每组数据包括：样本资源对象和上述样本资源对象对应的样本向量化编码结果。

根据本公开的第二方面，提供了一种评价推荐算法模型的装置，上述装置包括：

获取单元，用于获取推荐算法模型的召回链路中确定的多个推荐资源对象；

编码单元，用于采用深度编码网络模型对上述多个推荐资源对象进行向量化编码，得到上述多个推荐资源对象各自对应的向量化编码结果；

计算单元，用于根据上述多个推荐资源对象各自对应的向量化编码结果，分别计算不同的上述推荐资源对象之间的相似度；

评价单元，用于根据不同的上述推荐资源对象之间的相似度，评价上述推荐算法模型的推荐结果的多样性。

进一步地，上述获取单元包括：

获取模块，用于采用黑盒测试方法和/或白盒测试方法，获取上述多个推荐资源对象，其中，上述黑盒测试方法至少包括采用机器人模拟访问的方式获取上述多个推荐资源对象，上述白盒测试方法至少包括在上述推荐算法模型直接获取上述多个推荐资源对象。

进一步地，上述向量化编码结果至少包括：每个上述推荐资源对象对应的n维向量，上述编码单元，包括：

第一计算模块，用于根据每个上述推荐资源对象对应的n维向量，分别计算不同的上述推荐资源对象之间的空间距离，其中，上述空间距离包括如下至少之一：欧式距离、曼哈顿距离；

第一确定模块，用于根据不同的上述推荐资源对象的空间距离，确定不同的上述推荐资源对象之间的相似度。

进一步地，上述评价单元，包括：

第二计算模块，用于根据不同的上述推荐资源对象之间的相似度，计算得到相似度平均值；

第二确定模块，用于基于上述相似度平均值确定不同的上述推荐资源对象之间的离散程度；

评价模块，用于将上述不同的上述推荐资源对象之间的离散程度，作为评价指标，以得到上述推荐算法模型的推荐结果的多样性。

进一步地，上述装置还包括：

预训练模块，用于采用多组训练数据通过机器学习，对初始编码网络模型的节点参数进行预训练，得到上述深度编码网络模型，其中，多组训练数据中的每组数据包括：样本资源对象和上述样本资源对象对应的样本向量化编码结果。

根据本公开的第三方面，提供了一种电子设备，包括：

至少一个处理器；以及

与上述至少一个处理器通信连接的存储器；其中，

上述存储器存储有可被上述至少一个处理器执行的指令，上述指令被上述至少一个处理器执行，以使上述至少一个处理器能够执行任一项上述的方法。

根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，上述计算机指令用于使上述计算机执行根据中任一项上述的方法。

根据本公开的第五方面，提供了一种计算机程序产品，上述计算机程序产品包括：计算机程序，上述计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从上述可读存储介质读取上述计算机程序，上述至少一个处理器执行上述计算机程序使得电子设备执行第一方面上述的方法。

根据本公开的技术，获取推荐算法模型的召回链路中确定的多个推荐资源对象；采用深度编码网络模型对多个推荐资源对象进行向量化编码，得到多个推荐资源对象各自对应的向量化编码结果；根据多个推荐资源对象各自对应的向量化编码结果，分别计算不同的推荐资源对象之间的相似度；根据不同的推荐资源对象之间的相似度，评价推荐算法模型的推荐结果的多样性。

本公开实施例，针对推荐算法模型的推荐结果多样性，提出一种基于相似度度量的评价方法，可以实现自动化自评价，辅助推荐算法模型进行优化迭代，进而可以为用户提供更好的信息或商品推荐服务。解决了现有技术中无法对推荐算法模型的推荐结果多样性进行评价，或者需要依赖于对已有资源通道的划分进行评价的问题。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开实施例所提供的一种评价推荐算法模型的方法的流程图；

图2是可以实现本公开实施例的一种评价推荐算法模型的方法的流程图；

图3是根据本公开实施例所提供的一种评价推荐算法模型的方法的流程图；

图4是根据本公开实施例所提供的一种评价推荐算法模型的方法的流程图；

图5是根据本公开实施例所提供的一种评价推荐算法模型的方法的流程图；

图6是根据本公开实施例所提供的一种评价推荐算法模型的装置的框架示意图；

图7是用来实现本公开实施例的一种评价推荐算法模型的方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

随着互联网的快速发展，用户规模和内容规模均呈现迅猛发展。如何让海量用户在海量内容中找到自己喜欢的，以及如何让海量内容被海量用户精准消费，一直以来都是一个十分核心的问题。在这个背景下，推荐算法模型应运而生，主要解决内容推送给合适用户，为用户推荐定制化的信息或者商品，极大地提高了信息的使用效率。

面对几百上千万的推荐池物料规模，候选集十分庞大。由于后续有推荐算法模型中的排序模块作为保障，可以先采用召回模块从推荐池中进行召回，以保证不要遗漏和低延迟即可。目前主要采用多路召回方式，一方面各路可以并行计算，另一方面取长补短。

现有的技术方案为在推荐算法模型的召回阶段，人为地根据已有的不同资源通道，调节不同类型推荐资源的推荐比例和推荐策略。但是，现有技术中，仅能根据来自不同资源通道比例的差异来间接衡量模型的多样性。

现有方案的缺点在于，对于推荐算法模型的多样性评价，依赖于对已有资源通道的划分，缺乏对于模型输出多样性的客观、可量化、低资源的评价方法。

为解决上述问题，本公开提供了一种评价推荐算法模型的方法、装置、设备以及存储介质，应用于推荐算法模型的推荐结果的多样性进行评价的场景，以达到针对推荐算法模型的推荐结果多样性，提出一种客观、可量化、低资源的评价方法的目的。

图1是根据本公开的实施例所提供的一种评价推荐算法模型的方法的流程图，如图1所示，本公开提供的一种评价推荐算法模型的方法，包括如下方法步骤：

S101，获取推荐算法模型的召回链路中确定的多个推荐资源对象。

S102，采用深度编码网络模型对上述多个推荐资源对象进行向量化编码，得到上述多个推荐资源对象各自对应的向量化编码结果。

S103，根据上述多个推荐资源对象各自对应的向量化编码结果，分别计算不同的上述推荐资源对象之间的相似度。

S104，根据不同的上述推荐资源对象之间的相似度，评价上述推荐算法模型的推荐结果的多样性。

可选的，上述推荐算法模型可以为基于内容的推荐算法模型、协同过滤推荐算法模型和基于知识的推荐算法模型，等等。

可选的，本公开实施例中的推荐资源对象，在不同场景下可能包括不同内容，例如，在新闻推荐场景中，推荐资源对象可以为所推荐的新闻文章；在商品或服务推荐场景中，推荐资源对象可以为所推荐的商品或服务，等等。

本公开实施例的应用场合以及应用领域可以但不限于为，采用推荐算法模型多样性自评价方法，实现对于推荐结果多样性的自动化自评价，辅助推荐算法模型进行优化迭代，在推荐算法模型的更新迭代等领域开展应用。

一种示例中，基于计算和存储的考虑，一般而言，可以先从整体物料库(可能会有几十亿甚至百亿规模)中选择一些内容进入推荐池，再通过汰换规则定期进行更新。例如，电商平台可以基于近30天成交量、商品在所属类目、价格、档位等构建对应的推荐池，短视频平台可以基于发布时间、近N天播放量等构建对应的推荐池，等等。

本公开实施例中，推荐算法模型的召回链路则是负责从推荐池中选取几千上万的内容，推送给推荐算法模型中后续的排序链路。因此，本公开实施例中的召回链路中确定的多个推荐资源对象，即推荐算法模型输出的推荐结果。

在确定推荐算法模型输出的推荐结果之后，本公开实施例，可以采用预先训练得到的深度编码网络模型，对多个推荐资源对象进行向量化编码，得到多个推荐资源对象各自对应的向量化编码结果。

之后，根据多个推荐资源对象各自对应的向量化编码结果，分别计算不同的推荐资源对象之间的相似度，以基于该不同的推荐资源对象之间的相似度，评价推荐算法模型的推荐结果的多样性。

本公开实施例，针对推荐算法模型的推荐结果多样性，提出的基于相似度度量的评价方法，可以实现自动化自评价，辅助推荐算法模型进行优化迭代，进而可以为用户提供更好的信息或商品推荐服务。解决了现有技术中无法对推荐算法模型的推荐结果多样性进行评价，或者需要依赖于对已有资源通道的划分进行评价的问题。

通过本公开实施例，评价推荐算法模型的推荐结果的多样性之后，还可以基于评价结果针对性地融入多样性的推荐结果，以保持用户活跃度，同时，多样性的推荐结果，能够更好的帮助克服推荐算法模型所带来的“信息茧房”效应，为用户提供更好的信息或商品推荐服务。

一种示例中，图2是根据本公开的实施例所提供的一种可选的评价推荐算法模型的方法的流程图，如图2所示，上述获取推荐算法模型的召回链路中确定的多个推荐资源对象，包括：

S201，采用黑盒测试方法和/或白盒测试方法，获取上述多个推荐资源对象。

其中，上述黑盒测试方法至少包括采用机器人模拟访问的方式获取上述多个推荐资源对象，上述白盒测试方法至少包括在上述推荐算法模型直接获取上述多个推荐资源对象。

需要说明的是，黑盒测试方法着重测试软件的功能需求，是在程序接口上进行的测试，来检测每个功能是否都能正常使用。在测试中，把程序看作一个不能打开的黑盒子，在完全不考虑程序内部结构和内部特性的情况下，在程序接口进行测试，它只检查程序功能是否按照需求规格说明书的规定正常使用，程序是否能适当地接收输入数据而产生正确的输出信息。

由于黑盒测试方法是着眼于程序外部结构，不考虑内部逻辑结构，是以用户的角度，从输入数据与输出数据的对应关系出发进行测试的。因此，本公开实施例中，黑盒测试方法至少包括采用机器人模拟访问的方式获取多个推荐资源对象。

仍需要说明的是，白盒测试方法又称结构测试、透明盒测试、逻辑驱动测试或基于代码的测试。白盒测试方法是一种测试用例设计方法，盒子指的是被测试的软件，白盒指的是盒子是可视的，全面了解程序内部逻辑结构、对所有逻辑路径进行测试。因此，本公开实施例中，白盒测试方法至少包括在推荐算法模型直接获取多个推荐资源对象。

通过上述实施例，可以采用不同的测试方法，以基于多种方式获取多个推荐资源对象，进而可以提升对于推荐算法模型的推荐结果进行高效地自动化评价的效率。

在本公开实施例中，深度编码网络模型可以对输入内容进行向量化编码，例如，该深度神经网络模型的输入内容可以为：推荐算法模型输出的推荐列表中的推荐资源对象，该深度神经网络模型的输出内容可以为：每个上述推荐资源对象对应的n维向量。

在实现过程中，可以通过在深度编码网络模型的下游，接入下游分类任务并进行训练等方式，以调节深度编码网络模型的编码效果。同时，在深度编码网络模型中，还可以但不限于使用BERT等方法预训练该深度编码网络模型，以达到优化深度编码网络模型的输入内容的目的。

需要说明的是，根据深度编码网络模型的输入环境，还可以将推荐资源对象，例如新闻文章进行分词以及词向量等预处理后，再输入至深度编码网络模型。其中，BERT方法是年来一种比较新晋的字符向量表示方法，一些实验表明，使用此类模型的字符向量表示结果相比word2vec等表示方法，其下游任务表现更好。

一种示例中，上述向量化编码结果至少包括：每个上述推荐资源对象对应的n维向量。

图3是根据本公开的实施例所提供的一种可选的评价推荐算法模型的方法的流程图，如图3所示，上述S103，根据上述多个推荐资源对象各自对应的向量化编码结果，分别计算不同的上述推荐资源对象之间的相似度，包括：

S301，根据每个推荐资源对象对应的n维向量，分别计算不同的推荐资源对象之间的空间距离。

S302，根据不同的推荐资源对象的空间距离，确定不同的推荐资源对象之间的相似度。

其中，上述空间距离包括如下至少之一：欧式距离、曼哈顿距离。

本公开实施例中，根据深度编码网络模型的输出结果，得到多个推荐资源对象各自对应的n维向量之后，可以根据每个上述推荐资源对象对应的n维向量，分别计算不同的上述推荐资源对象之间的空间距离，例如，欧式距离、曼哈顿距离。

需要说明的是，空间距离可以用于描述或表示空间中任意两个或者多个推荐资源对象之间的位置关系。

此外，上述空间距离除欧式距离、曼哈顿距离之外，还可以为：闵可夫斯基距离、切比雪夫距离、标准化欧氏距离、马氏距离、汉明距离、余弦相似度、杰卡德相似系数，等等。

本公开实施例中，可以采用上述任意一种或的一种距离计算方式，以计算得到在编码空间上，不同的推荐资源对象之间的空间距离，进而可以根据不同的推荐资源对象的空间距离，确定不同的推荐资源对象之间的相似度。

采用本公开实施例，可以对推荐算法模型的推荐结果进行高效地自动化评价，以实现对于推荐结果多样性的自动化自评价，辅助推荐算法模型进行优化迭代。

一种示例中，图4是根据本公开的实施例所提供的一种可选的评价推荐算法模型的方法的流程图，如图4所示，上述根据不同的上述推荐资源对象之间的相似度，评价上述推荐算法模型的推荐结果的多样性，包括：

S401，根据不同的推荐资源对象之间的相似度，计算得到相似度平均值。

S402，基于相似度平均值确定不同的推荐资源对象之间的离散程度。

S403，将不同的推荐资源对象之间的离散程度，作为评价指标，以得到推荐算法模型的推荐结果的多样性。

本公开实施例中，通过计算不同的推荐资源对象之间的相似度的平均值，得到相似度平均值，由于该相似度平均值，可以确定不同的推荐资源对象之间的离散程度，或凝聚度，即相似度平均值可以在一定程度上可以反馈推荐结果内容上的离散程度。最后，将上述不同的上述推荐资源对象之间的离散程度，作为评价指标，即得到上述推荐算法模型的推荐结果的多样性。

本公开实施例，提出了一种基于深度编码网络的推荐算法多样性自评价方法，首先，通过获取推荐算法模型的召回链路中确定的多个推荐资源对象，并通过深度编码网络模型对于多个推荐资源对象进行向量化编码，得到多个向量化编码结果，之后，根据多个向量化编码结果，分别计算多个推荐资源对象间的相似度并以空间距离表示；最后，计算该推荐算法模型的推荐结果的空间距离的平均值，即凝聚度，作为该推荐算法模型的推荐结果多样性的评价指标，以得到上述推荐算法模型的推荐结果的多样性。

本公开所提供的一种示例中，上述方法还包括：

采用多组训练数据，对初始编码网络模型的节点参数进行预训练的过程中，可以通过在初始编码网络模型的下游，接入下游分类任务并进行训练的方式，达到调节编码网络模型的编码效果的目的。

本公开实施例中的预训练结构中，如图5所示的第1-4层的初始编码网络模型还可以连接softmax层，以待训练的推荐资源对象为新闻文章为例，可以利用已知分类的新闻文章，及其对应的样本向量化编码结果作为训练数据，使得训练得到的深度编码网络模型可以对未知文章类别的新闻文章，进行向量化编码处理。

并且，在训练完成后去掉softmax层，保留如图5所示的第1-4层(第1层为1、2…i，第2层为1、2…k，第3层为1、2…h，第4层为1、2…n)作为深度编码网络模型，对输入的未知类别文章进行向量化编码处理，得到向量化编码结果。

通过本发明实施例，采用预训练得到的深度编码网络模型，对多个推荐资源对象进行向量化编码，得到多个推荐资源对象各自对应的向量化编码结果，可以提升向量化编码结果的准确性。

此外，本公开还提供一种可选的实施例，可以基于已知推荐资源对象中的已知类别，继续进行精细化分类，并根据召回链路中推荐资源对象所属的分类类别进行多样性评价。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，图6是根据本公开实施例所提供的一种评价推荐算法模型的装置的框架示意图，如图6所示，本公开还提供了一种评价推荐算法模型的装置，该评价推荐算法模型的装置600，包括：

获取单元601，用于获取推荐算法模型的召回链路中确定的多个推荐资源对象。

编码单元602，用于采用深度编码网络模型对上述多个推荐资源对象进行向量化编码，得到上述多个推荐资源对象各自对应的向量化编码结果。

计算单元603，用于根据上述多个推荐资源对象各自对应的向量化编码结果，分别计算不同的上述推荐资源对象之间的相似度。

评价单元604，用于根据不同的上述推荐资源对象之间的相似度，评价上述推荐算法模型的推荐结果的多样性。

一种示例中，上述获取单元包括：

一种示例中，上述向量化编码结果至少包括：每个上述推荐资源对象对应的n维向量，上述编码单元，包括：

第一计算模块，用于根据每个上述推荐资源对象对应的n维向量，分别计算不同的上述推荐资源对象之间的空间距离，其中，上述空间距离包括如下至少之一：欧式距离、曼哈顿距离。

进一步地，上述评价单元，包括：

第二计算模块，用于根据不同的上述推荐资源对象之间的相似度，计算得到相似度平均值。

第二确定模块，用于基于上述相似度平均值确定不同的上述推荐资源对象之间的离散程度。

一种示例中，上述装置还包括：

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

根据本公开的实施例，本公开提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，上述计算机指令用于使上述计算机执行根据中任一项上述的方法。

根据本公开的实施例，本公开提供了一种计算机程序产品，计算机程序产品包括：计算机程序，计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从可读存储介质读取计算机程序，至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。

根据本公开的实施例，本公开还提供了一种电子设备，图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，设备700包括计算单元701，其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序，来执行各种适当的动作和处理。在RAM 703中，还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理，例如评价推荐算法模型的方法。例如，在一些实施例中，评价推荐算法模型的方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时，可以执行上文描述的评价推荐算法模型的方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行评价推荐算法模型的方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种评价推荐算法模型的方法，所述方法包括：

获取推荐算法模型的召回链路中确定的多个推荐资源对象；

采用深度编码网络模型对所述多个推荐资源对象进行向量化编码，得到所述多个推荐资源对象各自对应的向量化编码结果；

根据所述多个推荐资源对象各自对应的向量化编码结果，分别计算不同的所述推荐资源对象之间的相似度；

根据不同的所述推荐资源对象之间的相似度，评价所述推荐算法模型的推荐结果的多样性。

2.根据权利要求1所述的方法，其中，所述获取推荐算法模型的召回链路中确定的多个推荐资源对象，包括：

采用黑盒测试方法和/或白盒测试方法，获取所述多个推荐资源对象，其中，所述黑盒测试方法至少包括采用机器人模拟访问的方式获取所述多个推荐资源对象，所述白盒测试方法至少包括在所述推荐算法模型直接获取所述多个推荐资源对象。

3.根据权利要求1所述的方法，其中，所述向量化编码结果至少包括：每个所述推荐资源对象对应的n维向量，所述根据所述多个推荐资源对象各自对应的向量化编码结果，分别计算不同的所述推荐资源对象之间的相似度，包括：

根据每个所述推荐资源对象对应的n维向量，分别计算不同的所述推荐资源对象之间的空间距离，其中，所述空间距离包括如下至少之一：欧式距离、曼哈顿距离；

根据不同的所述推荐资源对象的空间距离，确定不同的所述推荐资源对象之间的相似度。

4.根据权利要求1所述的方法，其中，所述根据不同的所述推荐资源对象之间的相似度，评价所述推荐算法模型的推荐结果的多样性，包括：

根据不同的所述推荐资源对象之间的相似度，计算得到相似度平均值；

基于所述相似度平均值确定不同的所述推荐资源对象之间的离散程度；

将所述不同的所述推荐资源对象之间的离散程度，作为评价指标，以得到所述推荐算法模型的推荐结果的多样性。

5.根据权利要求1至4中任意一项所述的方法，其中，所述方法还包括：

采用多组训练数据通过机器学习，对初始编码网络模型的节点参数进行预训练，得到所述深度编码网络模型，其中，多组训练数据中的每组数据包括：样本资源对象和所述样本资源对象对应的样本向量化编码结果。

6.一种评价推荐算法模型的装置，所述装置包括：

编码单元，用于采用深度编码网络模型对所述多个推荐资源对象进行向量化编码，得到所述多个推荐资源对象各自对应的向量化编码结果；

计算单元，用于根据所述多个推荐资源对象各自对应的向量化编码结果，分别计算不同的所述推荐资源对象之间的相似度；

评价单元，用于根据不同的所述推荐资源对象之间的相似度，评价所述推荐算法模型的推荐结果的多样性。

7.根据权利要求6所述的装置，其中，所述获取单元包括：

获取模块，用于采用黑盒测试方法和/或白盒测试方法，获取所述多个推荐资源对象，其中，所述黑盒测试方法至少包括采用机器人模拟访问的方式获取所述多个推荐资源对象，所述白盒测试方法至少包括在所述推荐算法模型直接获取所述多个推荐资源对象。

8.根据权利要求6所述的装置，其中，所述向量化编码结果至少包括：每个所述推荐资源对象对应的n维向量，所述编码单元，包括：

第一计算模块，用于根据每个所述推荐资源对象对应的n维向量，分别计算不同的所述推荐资源对象之间的空间距离，其中，所述空间距离包括如下至少之一：欧式距离、曼哈顿距离；

第一确定模块，用于根据不同的所述推荐资源对象的空间距离，确定不同的所述推荐资源对象之间的相似度。

9.根据权利要求6所述的装置，其中，所述评价单元，包括：

第二计算模块，用于根据不同的所述推荐资源对象之间的相似度，计算得到相似度平均值；

第二确定模块，用于基于所述相似度平均值确定不同的所述推荐资源对象之间的离散程度；

评价模块，用于将所述不同的所述推荐资源对象之间的离散程度，作为评价指标，以得到所述推荐算法模型的推荐结果的多样性。

10.根据权利要求6至9中任意一项所述的装置，其中，所述方法还包括：

预训练模块，用于采用多组训练数据通过机器学习，对初始编码网络模型的节点参数进行预训练，得到所述深度编码网络模型，其中，多组训练数据中的每组数据包括：样本资源对象和所述样本资源对象对应的样本向量化编码结果。

11.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。

12.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法。

13.一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现权利要求1-5中任一项所述方法的步骤。