CN112989213B

CN112989213B - 内容推荐方法、装置、系统、电子设备及存储介质

Info

Publication number: CN112989213B
Application number: CN202110546891.0A
Authority: CN
Inventors: 殷弼民; 张思远
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-05-19
Filing date: 2021-05-19
Publication date: 2022-05-20
Anticipated expiration: 2041-05-19
Also published as: CN112989213A

Abstract

本申请实施例提供了一种内容推荐方法、装置、系统、电子设备及存储介质，涉及信息推荐技术领域。该方法包括：接收针对目标内容发起的人群定向请求，并根据人群定向请求从全量用户中选取目标内容的候选用户群；以候选用户群中的候选用户作为人群加强正样本，将人群加强正样本添加至训练集；根据训练集进行机器学习模型的训练，得到适用于目标内容的人群定向模型；调用人群定向模型，为候选用户群中的候选用户计算对应的推荐参数，以进行目标内容的推荐。结合人工智能领域中的机器学习等技术，本申请实施例解决了相关技术中信息推荐过程中人群定向的准确率不高的问题，在基于用户画像的人群定向基础上，实现了更加精细的人群定向策略。

Description

内容推荐方法、装置、系统、电子设备及存储介质

技术领域

本申请涉及信息推荐技术领域，具体而言，本申请涉及一种内容推荐方法、装置、系统、电子设备及存储介质。

背景技术

目前，在信息推荐过程中，往往需要为待推荐的内容确定候选人群作为定向条件，以基于该定向条件进行内容的推荐。由此可见，人群定向是信息推荐的一个非常重要的环节，而人群定向的准确性与信息推荐效果密切相关。

然而，相关技术中的人群定向方法，要么是缺乏针对性，例如仅能通过用户画像标签实现一群人的定向，无法体现不同个体之间的差异性，而影响人群定向的准确性；要么是针对新的内容发布方，可能因训练样本不足，导致基于模型的人群定向不够准确，进而造成内容发布方的转化成本过高，以此降低了内容发布方的ROI（Return On Investment，收入产出比）。

由此可见，如何提高人群定向的准确性仍亟待解决。

发明内容

本申请各实施例提供了一种内容推荐方法、装置、系统、电子设备及存储介质，可以解决相关技术中存在的信息推荐过程中人群定向的准确率不高的问题。所述技术方案如下：

根据本申请实施例的一个方面，一种内容推荐方法，包括：接收针对目标内容发起的人群定向请求，并根据人群定向请求从全量用户中选取目标内容的候选用户群；以候选用户群中的候选用户作为人群加强正样本，将人群加强正样本添加至训练集；根据训练集进行机器学习模型的训练，得到适用于目标内容的人群定向模型；调用人群定向模型，为候选用户群中的候选用户计算对应的推荐参数，以使客户端基于候选用户的推荐参数进行目标内容的推荐。

根据本申请实施例的一个方面，一种内容推荐装置，包括：请求接收模块，用于接收针对目标内容发起的人群定向请求，并根据人群定向请求从全量用户中选取目标内容的候选用户群；训练集生成模块，用于以候选用户群中的候选用户作为人群加强正样本，将人群加强正样本添加至训练集；模型训练模块，用于根据训练集进行机器学习模型的训练，得到适用于目标内容的人群定向模型；模型调用模块，用于调用人群定向模型，为候选用户群中的候选用户计算对应的推荐参数，以使客户端基于候选用户的推荐参数进行目标内容的推荐。

根据本申请实施例的一个方面，一种内容推荐系统，内容推荐系统包括前端设备、后端设备和客户端，其中，前端设备，用于针对目标内容向后端设备发起人群定向请求；后端设备，用于根据人群定向请求从全量用户中选取目标内容的候选用户群，并以候选用户群中的候选用户作为人群加强正样本，将人群加强正样本添加至训练集；后端设备，还用于根据训练集进行机器学习模型的训练，得到适用于目标内容的人群定向模型，并调用人群定向模型，为候选用户群中的候选用户计算对应的推荐参数；客户端，用于接收后端设备发送的候选用户的推荐参数，并基于候选用户的推荐参数进行目标内容的推荐。

根据本申请实施例的一个方面，一种电子设备，包括：至少一个处理器、至少一个存储器、以及至少一条通信总线，其中，存储器上存储有计算机程序，处理器通过通信总线读取存储器中的计算机程序；计算机程序被处理器执行时实现如上所述的内容推荐方法。

根据本申请实施例的一个方面，一种存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现如上所述的内容推荐方法。

根据本申请实施例的一个方面，一种计算机程序产品，计算机程序产品包括计算机程序，计算机程序存储在存储介质中，计算机设备的处理器从存储介质读取计算机程序，处理器执行计算机程序，使得计算机设备执行时实现如上所述的内容推荐方法。

本申请提供的技术方案带来的有益效果是：

在上述技术方案中，对于后端设备而言，将接收到前端设备针对目标内容发起的人群定向请求，以根据人群定向请求从全量用户中选取目标内容的候选用户群，将候选用户群中的候选用户作为人群加强正样本，将人群加强正样本添加至训练集，进而根据该训练集进行机器学习模型的训练，得到适用于目标内容的人群定向模型，并通过人群定向模型的调用，为候选用户群中的候选用户计算对应的推荐参数，以使客户端能够基于候选用户的推荐参数进行目标内容的推荐，由此可见，针对圈定的与目标内容相关的候选用户，都会计算得到一个对应的推荐参数，以此实现用户粒度的推荐参数，从而为内容发布方实现了更加精细的人群定向策略，即不同用户之间的推荐参数各不相同，而不同于相关技术中由同一个用户画像标签定向得到的人群的推荐参数相同，这就使得目标内容即使面向圈定的候选用户也存在千次展示期望收入eCPM的差别，从而能够有效地解决相关技术中存在的信息推荐过程中人群定向的准确率不高的问题。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对本申请实施例描述中所需要使用的附图作简单地介绍。

图1是根据本申请所涉及的实施环境的示意图；

图2是根据本申请所涉及的内容推荐系统的交互时序图；

图3是根据一示例性实施例示出的一种内容推荐方法的流程图；

图4是根据一示例性实施例示出的请求发起入口的示意图；

图5是图3对应实施例中S330在一个实施例的流程图；

图6是根据一示例性实施例示出的另一种内容推荐方法的流程图；

图7是根据一示例性实施例示出的向量表示模型的映射关系的示意图；

图8是图5对应实施例中S333在一个实施例的流程图；

图9是根据一示例性实施例示出的另一种内容推荐方法的流程图；

图10是图3对应实施例中S350在一个实施例的流程图；

图11是广告投放场景中一种内容推荐方法的实现示意图；

图12是根据一示例性实施例示出的一种内容推荐装置的结构框图；

图13是根据一示例性实施例示出的一种服务器的硬件结构图；

图14是根据一示例性实施例示出的一种电子设备的结构框图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能解释为对本申请的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

下面是对本申请涉及的几个名词进行的介绍和解释：

人群定向，以广告投放为例，在广告投放中，广告主在投放广告之前，需要为广告圈定候选人群作为定向条件，以便于客户端能够基于该定向条件进行广告的投放。由此可知，人群定向是信息推荐的一个非常重要的环节，人群定向的准确性与信息推荐效果密切相关。

人群加强，也认为是一种人群定向策略，针对人群定向中为待推荐的内容圈定的候选人群，分别添加推荐参数，以此实现用户粒度的推荐参数的生成。

eCPM，英文全称为Expected Cost per Mille（Impressions），中文含义为千次展示期望收入。例如，广告投放中，客户端在决定曝光哪只广告的时候，会计算用户针对不同广告的eCPM，以选择向用户展示eCPM最高的广告。

推荐参数，也可以认为是调价因子，在计算eCPM的时候，除了预估点击率、预估转化率和内容发布方的目标出价，还有内容发布方指定的一个推荐参数可以影响eCPM的计算。该推荐参数可以看做是内容发布方对用户的一个评分，分数越高说明该用户对内容发布方越有价值，也可以理解为，分数越高说明该用户越有可能成为待推荐的内容的潜在受众。

ROI，英文全称为Return on Investment，中文含义为收入产出比。

RTA，英文全称为Real Time API，是内容推荐系统提供的一个对外访问接口。例如，在直投广告竞价时，通过RTA，广告主可以向后端设备请求计算推荐参数，并返回针对于该次请求的推荐参数。

bad case，中文含义为坏例子，在广告行业中，是指广告主的转化成本超过目标出价的30%。

BERT模型，英文全拼为Bidirectional Encoder Representation fromTransformers。

用户画像，也可以认为是用户属性，是对用户具体形象的准确描述。例如，用户属性可以是年龄、性别、兴趣爱好等等。

聚类：就是按照某个特定标准（例如距离准则）把一个数据集中的数据对象分割成不同的类或簇，使得同一个类或簇内的数据对象的相似性尽可能大，同时不在同一个类或簇中的数据对象的差异性也尽可能地大。也可以理解为，聚类为同一类别的数据对象尽可能地聚集到一起，不同类别的数据对象尽可能地分离。

人工智能技术，是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。从硬件层面来看，人工智能技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。从软件层面来看，人工智能技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

如前所述，人群定向是信息推荐的一个非常重要的环节。人群定向是指从海量用户中筛选出与待推荐的内容最相关的潜在受众。

以广告投放中设置推荐参数的人群定向方法举例说明，一方面，此种方法缺乏针对性，广告主只能基于已有的用户画像标签设置推荐参数，即对于同一个用户画像标签的所有用户设置相同的推荐参数，而无法实现对不同用户指定不同的推荐参数的需求。

此外，具有用户画像标签的用户一般在千万量级，即使是粗粒度的推荐参数设置也会耗费广告主大量的时间，影响广告主创建广告的效率；并且推荐参数的设置依靠人工经验，难以保证基于此推荐参数进行的广告投放效果。

另一方面，对于新的广告主或者转化用户数量少的广告主来说，在基于模型进行人群定向时，可能因训练样本不足而导致模型训练匮乏，进而造成推荐参数预估不准确，容易出现广告主的转化成本过高的问题。

然而，人群定向的准确性又是与广告投放效果密切相关的，准确性不高的人群定向必然造成广告主的转化成本过高，最终降低了广告主的收入产出比，从而影响广告主关于人群定向的使用体验。

随着人工智能技术的研究和进步，人工智能技术在多个领域展开研究和应用，例如智能营销，有鉴于此，本申请将结合人工智能领域中的机器学习等技术，提供一种内容推荐方法、装置、系统、电子设备及存储介质，旨在解决相关技术的如上技术问题。

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

图1为一种内容推荐方法所涉及的实施环境的示意图。该实施环境应用于内容推荐系统，该内容推荐系统包括客户端100、后端设备200和前端设备300。

具体地，客户端100，具备媒体播放功能，以便于进行信息推荐，也即是向用户展示待推荐的内容，此客户端100部署于提供运行环境的电子设备中，例如，电子设备可以是台式电脑、笔记本电脑、平板电脑、智能手机、智能语音交互设备、智能家电等等，在此不进行限定。

其中，客户端100，具备媒体播放功能，例如，视频播放器、浏览器、即时通讯客户端等等，可以是应用程序形式，也可以是网页形式，相应地，客户端100向用户展示待推荐的内容的界面则可以是程序窗口形式，还可以是网页页面形式的，此处也并未加以限定。

后端设备200可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。例如，本实施环境中，后端设备200可以是为广告主提供广告投放服务的后台服务器，具体地，广告主向后端设备200发起人群定向请求，对应地，后端设备200返回针对于本次人群定向请求的推荐参数。

前端设备300，与后端设备200相对应，可以理解为是内容推荐系统的前台部分，可以是台式电脑、笔记本电脑、平板电脑、智能手机等等电子设备。例如，此前端设备300可向内容发布方展示可供浏览的页面，进而基于此页面实现人机交互的内容推荐系统。

其中，前端设备300中可运行的客户端，提供页面展示功能，例如，浏览器等，可以是应用程序形式，也可以是网页形式，相应地，提供页面展示功能的界面（即页面展示界面）可以是程序窗口形式，还可以是网页页面形式的，此处也并未加以限定。

后端设备200通过有线或者无线等通讯方式分别与客户端100所在电子设备、前端设备300之间预先建立通信连接，并通过此通信连接实现与客户端100、前端设备300之间的数据传输，以此实现向定向人群推荐内容。例如，传输的数据包括但不限于人群定向请求、推荐参数、历史流水记录等等。

值的一提的是，在上述内容推荐过程中，内容、推荐参数、历史流水记录等数据可存储于区块链上，以利用区块链中数据具有不可篡改的特性，充分地保证内容推荐的真实性和可信度。

现结合图2，以内容推荐系统为广告投放系统举例说明如下：

此广告投放系统至少包括：广告前端设备300、广告后端设备200、广告投放客户端100。

如图2所示，广告主想为目标广告进行人群定向时，可借由广告前端设备300的页面展示界面中展示的页面，向广告后端设备200发起人群定向请求，以请求广告后端设备200为广告主提供广告投放服务。

对于广告后端设备200而言，在接收到人群定向请求之后，便响应于该人群定向请求，从全量用户中选取目标广告的候选用户群，并以候选用户群中的候选用户作为人群加强正样本，将人群加强正样本添加至训练集。

同时，根据训练集进行机器学习模型的训练，得到适用于目标广告的人群定向模型，并调用人群定向模型，为候选用户群中的候选用户计算对应的推荐参数。

随着广告后端设备200与广告投放客户端100之间的交互，广告投放客户端100将接收到针对目标广告的候选用户的推荐参数，以便基于此候选用户的推荐参数进行目标广告的投放。

请参阅图3，本申请实施例提供了一种内容推荐方法，该方法适用于图1所示实施环境的后端设备200。

在下述方法实施例中，为了便于描述，以各步骤的执行主体为后端设备加以说明，但是并非对此构成具体限定。

如图3所示，该方法可以包括以下步骤：

步骤S310，接收为目标内容发起的人群定向请求，并根据人群定向请求从全量用户中选取目标内容的候选用户群。

其中，人群定向请求，用于向后端设备通知内容发布方期望为目标内容进行人群定向。具体地，前端设备会为内容发布方提供请求发起入口，以便于内容发布方在该请求发起入口触发相关操作，当前端设备检测到该操作，便会向后端设备发起关于目标内容的人群定向请求。

在此说明的是，目标内容可以是目标广告、目标视频、目标文本、目标新闻等等，本实施例并不对目标内容的类型作具体限定。相应地，由于目标内容的不同类型可对应不同的场景，例如，目标广告可对应广告投放场景，目标视频可对应视频观看场景，目标文本可对应小说阅读场景，目标新闻可对应新闻浏览场景，因此，本实施例提供的内容推荐方法可根据不同类型的目标内容适用于不同的场景。例如，在广告投放场景中，向用户投放的目标广告包括但不限于：电视广告、电影广告、网络广告、视频广告等等。

图4示例性示出了前端设备展示请求发起入口的示意图。在图4中，页面301中向内容发布方展示了两个按钮，分别是标签加强按钮302和人群加强按钮303。当内容发布方期望进行人群定向，可以选择点击人群加强按钮303，那么，前端设备便能够检测到针对人群加强按钮303相关的点击操作，以此向后端设备发起人群定向请求。其中，人群加强按钮303即视为前端设备所提供的请求发起入口，点击操作即视为在请求发起入口触发的相关操作。

需要说明的是，根据前端设备所配置输入组件（例如显示屏幕上铺盖的触摸层、鼠标、键盘等）的不同，内容发布方在请求发起入口触发的相关操作的具体行为也可以各不相同。例如，借由触摸层输入的智能手机而言，操作可以是点击、滑动、触摸等手势操作，而对于配置鼠标的笔记本电脑而言，操作则可以是拖拽、单击、双击等机械操作，在此不进行具体限定。

对应地，后端设备便会针对候选用户群中的每一个候选用户分别计算一个推荐参数，以此实现内容发布方对不同用户指定不同推荐参数的人群加强策略。当然，在其它应用场景中，内容发布方也可以点击标签加强按钮302，此时，后端设备仅针对用户图像标签所圈定的候选用户群设置一个统一的推荐参数，此处不展开详细地描述，本申请实施例所提及的人群定向都是基于人群加强策略为例进行说明的。

后端设备在接收到人群定向请求之后，便可响应于该人群定向请求圈定目标内容的候选用户群。其中，候选用户群中的候选用户是指目标内容的潜在受众。

在一种可能的实施方式，人群定向请求包括为目标内容指定的人群定向目标。该人群定向目标用于指示内容发布方期望圈定的候选用户的用户属性。其中，用户属性包括但不限于：年龄、性别、婚否、家庭人口、兴趣爱好、学历、籍贯、居住地、工作地、工作所属行业等等，在一些应用场景中，用户属性也可以认为是用户画像。例如，广告投放中，广告主期望发布化妆品广告，那么，该广告主为此化妆品广告指定的人群定向目标至少可以包括：18岁至50岁的女性。

那么，关于目标内容的候选用户群的圈定方式可以包括以下步骤：根据人群定向请求中包含的为目标内容指定的人群定向目标，从全量用户中选取用户属性符合人群定向目标的目标用户；将目标用户添加至候选用户群。

也就是说，目标用户，最符合内容发布方预期，是与目标内容最相关的潜在受众。

在一种可能的实施方式，人群定向请求包括指定转化类型。该指定转化类型用于指示内容发布方期望圈定的候选用户的转化行为。该转化行为包括但不限于：购买行为、下单行为、收藏行为等等，对应地，指定转化类型包括但不限于：购买类型、下单类型、收藏类型等等。例如，广告投放中，对于电商广告主而言，其所期望候选用户针对目标广告的转化行为至少可以包括：购买行为，那么，广告主针对目标广告设置的指定转化类型至少可以是购买类型。

那么，关于目标内容的候选用户群的圈定方式可以包括以下步骤：根据人群定向请求中包含的指定转化类型，从全量用户中选取转化行为符合指定转化类型的转化用户；将转化用户添加至候选用户群。

由此可见，转化用户，指的是有可能成为目标内容的潜在受众的用户。

当然，在其它实施例中，候选用户群还可以同时包括目标用户和转化用户，以此扩大可供内容发布方为目标内容圈定的候选用户的范围，从而有利于提高人群定向的准确性。

应当理解，内容所属行业不同，例如广告所在行业不同，即使是同一个用户的转化行为也可能存在较大差别。例如，广告投放中，某个未婚女性用户，其可能比较关注化妆品广告，却不太关心婴幼儿商品广告。因此，本申请实施例所提及的人群定向都是针对内容所属行业相同为例进行说明的。

S330，以候选用户群中的候选用户作为人群加强正样本，将人群加强正样本添加至训练集。

在获得候选用户群中的候选用户之后，便可直接以此作为训练集中的人群加强正样本，此处，人群加强正样本是指候选用户对目标内容可能产生正向反馈。例如，广告投放中，某商品广告向候选用户曝光之后，候选用户可能购买、下单、收藏该商品，即认为此候选用户产生了正向反馈。

如前所述，对于新的广告主或者转化用户数量少的广告主来说，在基于模型进行人群定向时，可能因训练样本不足而导致模型训练匮乏，进而造成人群定向不准确，因此，在一种可能的实施方式，将从全量用户中检索候选用户的相似用户，作为扩充的人群加强正样本，以此实现训练样本的自动扩充。

可选地，为了提高人群定向的准确性，同时进一步地实现训练样本的自动扩充，将人群加强负样本添加至训练集。此人群加强负样本则是指可能对目标内容产生负向反馈的用户。例如，广告投放中，某商品广告向某用户曝光之后，该用户不浏览也不点击甚至投诉或者差评该商品广告，即认为该用户产生了负向反馈。

在一种可能的实施方式，将全量用户中活跃度高的用户作为人群加强负样本。其中，活跃度高的用户是指全量用户中存在点击行为且点击次数多的用户。

以广告投放为例，可选地，假设用户针对任意一个广告发生点击行为的发生日期记录为（userid，clicktime），则活跃度的计算公式如下：

。

其中，ClickScore是用户userid点击活跃得分，表示此用户userid的活跃度；e是自然对数；a是时间衰减因子，默认为0.5；clicktime是此用户userid针对任意一个广告发生点击行为的发生日期；currenttime表示为此用户userid计算活跃度的当前日期。

在一种可能的实施方式，人群加强正样本和训练负样本之间的数量比例为1:2。当然，该数量比例也可以根据应用场景的实际需要灵活地调整，此处并非构成具体限定。

S350，根据训练集进行机器学习模型的训练，得到适用于目标内容的人群定向模型。

目前，人工智能领域中，核心技术之一是机器学习，此机器学习是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，例如智能营销。机器学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术，通过研究计算机怎样模拟或学习人类行为（例如可以是广告投放过程中的用户行为），获取新的知识或技能，以此重新组织已有的知识结构来不断地改善自身的性能。基于此，本实施例中，将基于机器学习模型来实现更加精细的人群定向策略。

其中，机器学习模型包括但不限于：监督学习模型和无监督学习模型。此监督学习模型进一步包括：支持向量机、朴素贝叶斯、K近邻、决策树、神经网络等等模型；此无监督学习模型进一步地包括：数据聚类、数据降维等等模型。

在一种可能的实施方式，机器学习模型为决策树模型中的XGBoost模型；在一种可能的实施方式，机器学习模型为LightGBM模型。

在获得训练集之后，便可基于该训练集对机器学习模型进行训练，下面以机器学习模型中的决策树模型对模型训练过程加以说明：

对初始构建的决策树模型的参数进行随机初始化，由随机化初始化的参数和训练集中的当前一个训练样本（人群加强正样本或人群加强负样本）构建相应的损失函数。该损失函数包括但不限于：激活分类函数、交叉熵函数、类内分布函数、类间分布函数等。

计算该损失函数的损失值并判断该损失值是否达到最小值。如果该损失值并未达到最小值，则该损失函数尚未收敛，此时，对训练过程中的决策树模型的参数进行更新，并由更新的参数和训练集中的后一个训练样本（人群加强正样本或人群加强负样本）构建相应的损失函数，继续计算该损失函数的损失值并判断该损失值是否达到最小值。

通过如此循环迭代，直至损失函数的损失值达到最小，视为损失函数收敛，也可以理解为，此时，模型训练完成，决策树模型收敛为适用于目标内容的人群定向模型。其中，迭代次数可以根据应用场景的实际需要灵活地调整，例如，对精准度要求较高的应用场景，设置较高的迭代次数。

基于上述过程，适用于目标内容的人群定向模型便具备了预测候选用户得分的能力。

在此说明的是，人群定向模型是针对目标内容而言的，随着目标内容不同，人群定向模型将有所区别，那么，即使是针对同一个候选用户进行得分预测，预测的得分也可能存在差异，从而为内容发布方实现更加精细的人群定向策略提供了有力保障。

值得一提的是，上述模型训练过程中，参与模型训练的是训练样本，既可以是直接将关于用户的向量表示输入机器学习模型中进行训练，也可以是将用户的用户特征输入机器学习模型中进行训练，此处并未加以限定。其中，关于用户的向量表示可以参照下文中向量表示模型的调用产生；用户的用户特征则可以包括但不限于：用户的用户属性、用户的用户标识、用户针对广告的转化行为的转化类型、随机选取的转化类型、转化行为对应广告所在行业的行业标识、点击行为对应广告所在行业的行业标识。

S370，调用人群定向模型，为候选用户群中的候选用户计算对应的推荐参数。

具体地，调用人群定向模型，得到各候选用户的实际预测得分；根据各候选用户的实际预测得分，计算各候选用户的推荐参数。

其中，候选用户的推荐参数的计算公式如下：

候选用户的推荐参数=1-c+2c×（候选用户的实际预测得分-最小实际预测得分）/（最大实际预测得分-最小实际预测得分）。

在此说明的是，最小实际预测得分和最大实际预测得分，是针对候选用户群中的所有候选用户的实际预测得分而言。

补充说明的是，c为计算公式中的超参数，可以根据应用场景的实际需要灵活地设置，在一种可能的实施方式，c可以由内容发布方确定，例如，内容发布方可以在（1-c，1+c）范围内调节推荐参数；在一种可能的实施方式，c可以由人群定向模型确定，例如，当人群定向模型为决策树模型，可以采用网格搜索方式寻找该决策树模型的最优树深度和正则化系数进行确定，此处不展开详细地描述。

此外，发明人意识到，由于候选用户的推荐参数会存储至客户端，受限于客户端所在电子设备的存储资源，如果候选用户的推荐参数占用了电子设备的大部分甚至全部存储资源，则会影响电子设备上运行的其余客户端的处理效率。

为此，在一种可能的实施方式，根据全量用户中活跃度高的用户更新候选用户群，也可以理解为，更新的候选用户群中的候选用户是活跃度高的用户与原候选用户群中候选用户之间的交集，以此方式来减少需要计算推荐参数的候选用户的数量，进而节省电子设备的存储资源，有利于提高电子设备中运行的客户端的处理效率，并最终提升内容发布方的ROI。

通过上述过程，针对圈定的与目标内容相关的候选用户，都会计算得到一个对应的推荐参数，以此实现用户粒度的推荐参数，从而为内容发布方实现了更加精细的人群定向策略，即不同用户之间的推荐参数各不相同，而不同于相关技术中由同一个用户画像标签定向得到的人群的推荐参数相同，这就使得目标内容即使面向圈定的候选用户也存在千次展示期望收入eCPM的差别，从而能够有效地解决相关技术中存在的信息推荐过程中人群定向的准确率不高的问题。

如前所述，人群定向不准确一方面是因为训练样本不足导致的，为此，本申请实施例中还提供了一种训练样本的自动扩充方案。下面对自动扩充训练样本的方案进行详细地说明：

请参阅图5，本申请实施例中提供了一种可能的实现方式，S330可以包括以下步骤：

S331，获取候选用户群中各候选用户的第一向量和第二向量。

其中，第一向量表示候选用户的用户属性，第二向量表示候选用户的转化行为的转化类型。也可以认为是，第一向量实现了对候选用户的用户属性的准确描述，进而从数字信息形式上唯一地标识候选用户的用户属性，同理，第二向量则实现了对候选用户的转化行为的转化类型的准确描述，进而从数字信息形式上唯一地标识候选用户的转化行为的转化类型。应当理解，如果候选用户的用户属性或者候选用户的转化行为的转化类型不同，则第一向量或者第二向量也将有所差别。

本实施例中，候选用户的第一向量和第二向量的生成，是通过向量表示模型的调用实现的。

下面对向量表示模型的生成过程进行详细地说明：

如图6所示，在一种可能的实施方式，向量表示模型的生成过程可以包括以下步骤：

S410，获取历史流水记录。

其中，历史流水记录至少包括：用户的行为数据，用户的行为数据用于指示用户是否存在用户行为，用户行为包括点击行为、转化行为。

广告投放中，在广告投放客户端，随着广告的投放，用户可以看到投放广告，如果用户对其所看到的广告感兴趣，可能点击此广告以查看更详细的内容，进而可能产生实际的转化行为，例如购买行为，相应地，便能够产生用户针对此广告的行为数据。

基于此，客户端可以定时地向后端设备发送携带了用户的行为数据的历史流水记录，在后端设备接收到历史流水记录之后，便能够为向量表示模型的训练提供充分的数据依据。

S430，基于历史流水记录中用户的行为数据，从全量用户中选取存在转化行为的用户作为训练正样本。

S450，从全量用户中选取存在点击行为的用户作为训练负样本。

在此说明的是，S430和S450的执行不局限于此，还可以是只执行S430，或者是先执行S450再执行S430，又或者是同时执行S430和S450，此处并非构成具体限定。

S470，根据训练正样本和训练负样本，对初始的向量表示模型进行训练，得到向量表示模型。

其中，初始的向量表示模型也可以认为是机器学习模型。在一种可能的实施方式，初始的向量表示模型可以是YoutubeDNN模型。当然，在其它实施例中，初始的向量表示模型还可以是Word2vec模型、BERT模型等。

此处的模型训练过程与前述人群定向模型的模型训练过程原理一致，在此不再重复赘述。

在模型训练完成之后，向量表示模型便具备了将用户特征转化为向量表示的能力。如图7所示，对于向量表示模型而言，输入为用户的用户特征，输出为用户的第三向量和第四向量，也可以理解为，向量表示模型实质上构建了输入与输出之间的数学映射关系。

其中，第三向量表示用户的用户属性，第四向量表示用户的转化行为的转化类型；用户的用户特征包括以下至少一项：用户的用户属性、用户的用户标识、用户的转化行为的转化类型、随机选取的转化类型、转化行为对应内容所属行业的行业标识、点击行为对应内容所属行业的行业标识。在一个可能的实施方式，用户的用户特征可以表示为上述内容的拼接结果，例如，候选用户的用户特征={用户标识、用户属性、候选用户的转化行为的转化类型、转化行为对应内容所属行业的行业标识}。

值得一提的是，对于训练负样本来说，是针对广告存在点击行为的用户，由于此用户并不存在转化行为，此时，用户的用户特征可以表示为：{用户标识、用户属性、随机选取的转化类型、点击行为对应内容所属行业的行业标识}。

由此可见，在遍历全量用户得到用户的第三向量和第四向量之后，便可相应地获取到候选用户的第一向量和第二向量。

S333，基于候选用户群中各候选用户的第一向量和第二向量，在全量用户中检索候选用户的相似用户，根据相似用户更新候选用户群。

具体地，如图8所示，在一种可能的实施方式，相似用户的检索过程可以包括以下步骤：

S3331，根据候选用户群中各候选用户的第一向量和第二向量，分别计算得到第一平均向量和第二平均向量。

其中，第一平均向量，是指候选用户群中所有候选用户的第一向量的平均值。第二平均向量，是指候选用户群中所有候选用户的第二向量的平均值。

S3333，获取全量用户中各用户的第三向量和第四向量。

其中，第三向量表示用户的用户属性，第四向量表示用户的转化行为的转化类型。

如前所述，通过向量表示模型的调用，即可得到用户的第三向量和第四向量，具体原理在此不再重复赘述。

S3335，遍历全量用户，得到第三向量与第一平均向量相似且第四向量与第二平均向量相似的相似用户。

在一种可能的实施方式，候选用户群包括目标用户，则相似用户是指：第三向量与针对所有目标用户的第一平均向量相似，并且第四向量与针对所有目标用户的第二平均向量相似的用户。

在一种可能的实施方式，候选用户群包括转化用户，则相似用户是指：第三向量与针对所有转化用户的第一平均向量相似，并且第四向量与针对所有转化用户的第二平均向量相似的用户。

在一种可能的实施方式，候选用户群包括目标用户和转化用户，对应地，相似用户也包括两部分，一部分是：第三向量与针对所有目标用户的第一平均向量相似，并且第四向量与针对所有目标用户的第二平均向量相似的用户；另一部分是：第三向量与针对所有转化用户的第一平均向量相似，并且第四向量与针对所有转化用户的第二平均向量相似的用户。

可选地，相似算法可以包括但不限于：欧氏距离、曼哈顿距离、皮尔逊相关系数、余弦相似度、Tanimoto系数，在此并未加以限定。

S3337，将相似用户添加至候选用户群。

也就是说，候选用户群中，不仅包含有响应于人群定向请求而圈定的候选用户，例如目标用户和转换用户，还包含有在全量用户中检索得到的候选用户的相似用户。

S335，将更新的候选用户群中的候选用户作为人群加强正样本。

在上述实施例的作用下，实现了训练样本的自动扩充，以此保证即使是新的内容发布方或者转化用户数量少的内容发布方也能够有足够的训练样本，从而充分地保证了人群定向的准确性。

通过训练样本的自动扩充，能够使得新的内容发布方或者转化用户数量少的内容发布方也获取到足够多的训练样本，然而，为了降低人群定向之后转化成本偏高的发生几率，本申请实施例中还提供了一种训练样本的过滤方案。

在一种可能的实施方式，当候选用户群中的候选用户的数量小于第一设定阈值（例如10000），执行训练样本的自动扩充；当候选用户群中的候选用户的数量大于第二设定阈值（例如100000），执行训练样本的过滤；否则，当候选用户群中的候选用户的数量在[10000，100000]范围内，不执行训练样本的自动扩充和过滤。

下面对训练样本的过滤方案进行详细地说明：

请参阅图9，本申请实施例中提供了一种可能的实现方式，该方法还可以包括以下步骤：

S510，对候选用户群中的各候选用户进行聚类，计算各候选用户与聚类中心之间的距离。

其中，聚类算法可以包括但不限于：划分法（Partitioning Methods）、层次法（Hierarchical Methods）、基于密度的方法（density-based methods）、基于网格的方法（grid-based methods）、基于模型的方法（Model-Based Methods），此处并未加以限定。

在一种可能的实施方式，聚类算法为划分法中的k-means算法。其中，k-means算法中的k值可以根据应用场景的实际需要灵活地设置，例如，k=10。

对应地，候选用户与聚类中心之间的距离，可以是指候选用户与聚类中心之间的欧式距离。

S530，基于计算得到的距离确定各候选用户的置信度，从候选用户群中选取高置信度的候选用户作为人群加强正样本。

其中，置信度，反映了候选用户成为目标内容的潜在受众的概率。应当理解，置信度越高，候选用户成为目标内容的潜在受众的概率越大，在训练样本的过滤过程中，被丢弃的可能性越低。

在一种可能的实施方式，置信度=1/候选用户与聚类中心之间的距离。

在上述实施例的作用下，实现了训练样本的过滤，以此降低人群定向之后转化成本偏高的发生几率，进而有利于提高人群定向的准确性。

如前所述，候选用户群中的候选用户可以同时包括目标用户和转化用户，此时，发明人意识到，如果目标用户与转化用户的特征分布偏差过大，也即是目标用户的第一向量和第二向量与转化用户的第一向量和第二向量之间存在较大偏差，则可能导致人群定向模型拟合程度偏低，进而影响人群定向的准确性，为此，本申请实施例中还提供了一种模型训练方案，下面对此模型训练方案进行详细地说明：

请参阅图10，本申请实施例中提供了一种可能的实现方式，S350可以包括以下步骤：

S351，根据训练集进行机器学习模型的初始训练，得到候选用户的初始预测得分。

S353，基于候选用户的初始预测得分构建验证集，如果验证集的曲线下面积AUC小于设定阈值，则根据候选用户的初始预测得分进行训练集的更新。

其中，训练集的更新，是指从候选用户群中重新选取候选用户形成训练集。

关于候选用户的重新选取方式，例如，在一种可能的实施方式，选取初始预测得分排前3000名和排后3000名的候选用户。

关于设定阈值，可以根据应用场景的实际需要灵活地调整，例如，本实施例中，设定阈值为0.75。

S355，根据更新的训练集进行机器学习模型的二次训练，得到适用于目标内容的人群定向模型。

在上述实施例的作用下，通过机器学习模型的两次训练，生成拟合度更高的人群定向模型，从而进一步充分地保障了人群定向的准确性。

图11是广告投放场景中一种内容推荐方法的实现示意图。此广告投放场景中，内容推荐方法适用于广告投放系统，此广告投放系统包括广告前端设备、广告后端设备和广告投放客户端。

上述各设备交互的具体过程，包括以下五部分：

第一部分，数据预处理：

广告后端设备接收广告投放客户端定时（例如每天凌晨两点）上报的用户的历史流水记录。

在广告后端设备中，基于历史流水记录中的用户的行为数据，将获知全量用户中哪些用户针对广告存在点击行为、以及哪些用户针对广告存在转化行为，以此从全量用户中选取指定周期（例如过去10天）内存在转化行为的用户作为训练正样本、以及存在点击行为的用户作为训练负样本，并对初始的向量表示模型进行训练，得到向量表示模型。

由此，通过向量表示模型，便能够实现用户特征与向量表示之间的映射，以便于为后续样本扩充和过滤提供数据依据。

例如，在目标广告的候选用户群确定之后，将候选用户A的用户特征输入向量表示模型，便能够获得候选用户A的第一向量（用户属性embedding）和第二向量（转化类型embedding），如图11所示。

第二部分，人群定向：

回请参阅图4所示，在广告前端设备中，如果广告主点击人群加强按钮303，将针对目标广告向广告后端设备发起人群定向请求。

对应地，广告后端设备便会接收到广告前端设备发起的人群定向请求。

在广告后端设备中，根据人群定向请求中携带的人群定向目标，从全量用户中选取目标用户；以及根据人群定向请求中携带的指定转化类型，从全量用户中选取转化用户。

由目标用户和转化用户形成目标广告的候选用户群，以此作为后续模型训练的人群加强正样本的基础。

第三部分，样本扩充和过滤：

在广告后端设备中，一方面，如果候选用户群中候选用户的数量少于10000，则执行训练样本的自动扩充。

如图11所示，自动扩充方式：根据转化类型embedding和用户属性embedding，在全量用户中检索候选用户的相似用户，将相似用户添加至候选用户群。

完成自动扩充之后，如果候选用户群中候选用户的数量多于100000，则执行训练样本的过滤：基于候选用户的置信度，对候选用户进行筛选。

由此，最终形成扩充后的人群加强正样本，如图11所示。

另一方面，基于用户的活跃度，从全量用户中选取活跃度高的用户（如图11中示出的行业点击活跃用户）作为人群加强负样本，如图11所示。

其中，人群加强正样本与人群加强负样本之间的数量比例为1:2。

第四部分，模型训练和调用：

在广告后端设备中，根据人群加强正样本和人群加强负样本，对XGBoost模型进行两次训练，以得到拟合度高的人群定向模型。

如图11所示，选取活跃度高的用户与候选用户群的交集（广告主的定向人群），参与最终调用人群定向模型进行推荐参数的计算，从而有利于在广告投放客户端存储空间增量可控的前提下有效地提升广告主的ROI。

通过人群加强，即使得广告主的定向人群中的每一个用户分别生成对应目标广告的一个推荐参数。

上述过程中，在面向广告主提供线上的广告投放服务时，当广告主发起人群定向请求，便能够得到关于定向人群中各个用户对应目标广告的推荐参数。相较于用户画像标签所圈定的定向人群对应的统一推荐参数（如图4中广告主点击标签加强按钮302时的人群定向方案），本应用场景可实现用户粒度的推荐参数方案。

第五部分，广告投放：

针对广告定向人群中的每一个用户，广告后端设备将发送对应目标广告的推荐参数至该每一个用户所在的广告投放客户端，回请参阅图1所示出的广告投放客户端100。

对应地，对于用户A所在的广告投放客户端，将接收到广告后端设备发送的用户A关于目标广告的推荐参数。

应当理解，用户A可能被圈定为不同行业不同广告的广告主的定向人群，那么，用户A所在广告投放客户端将存储多个不同行业不同广告对应的推荐参数。

举例来说，用户A为已婚大龄女性，其分别属于化妆品广告1、女装商品广告2、学习教育商品广告3、保险产品广告4、贷款产品广告5的定向人群。

那么，对于用户A所在广告投放客户端，相应地存储有广告1、广告2、广告3、广告4、广告5对应的推荐参数。

在用户A所在广告投放客户端决定向用户A曝光上述5个广告中的哪一个广告时，便会结合存储的上述5个广告所对应的推荐参数，分别计算用户A针对上述5个广告的eCPM，并最终选取cCPM最高的广告向用户A展示。

值得一提的是，用户A所在广告投放客户端可能会需要向用户A曝光其它行业的广告，该些广告（例如汽车产品广告）可能并未将用户A作为广告主的定向人群，那么，用户A针对该些广告就不存在对应的推荐参数，此时，为了便于用户A所在广告投放客户端进行广告投放，可以针对该些广告为用户A将对应的推荐参数设置为默认值，例如，默认值为1。

由此，即实现了基于用户粒度的推荐参数的广告投放。

在本应用场景中，为广告主实现了更为精细地人群定向策略，使得广告主平均ROI提升15%，bad case率下降70%。

下述为本申请装置实施例，可以用于执行本申请所涉及的内容推荐方法。对于本申请装置实施例中未披露的细节，请参照本申请所涉及的内容推荐方法的方法实施例。

请参阅图12，本申请实施例中提供了一种内容推荐装置900，包括但不限于：请求接收模块910、训练集生成模块930、模型训练模块950以及模型调用模块970。

其中，请求接收模块910，用于接收针对目标内容发起的人群定向请求，并根据人群定向请求从全量用户中选取目标内容的候选用户群。

训练集生成模块930，用于以候选用户群中的候选用户作为人群加强正样本，将人群加强正样本添加至训练集。

模型训练模块950，用于根据训练集进行机器学习模型的训练，得到适用于目标内容的人群定向模型。

模型调用模块970，用于调用人群定向模型，为候选用户群中的候选用户计算对应的推荐参数，以使客户端基于候选用户的推荐参数进行目标内容的推荐。

在一种可能的实施方式，内容推荐装置900包括的功能模块还用于执行以下步骤：

根据人群定向请求中包含的为目标内容指定的人群定向目标，从全量用户中选取用户属性符合人群定向目标的目标用户。将目标用户添加至候选用户群。

根据人群定向请求中包含的指定转化类型，从全量用户中选取转化行为符合指定转化类型的转化用户。将转化用户添加至候选用户群。

获取候选用户群中各候选用户的第一向量和第二向量，第一向量表示候选用户的用户属性，第二向量表示候选用户的转化行为的转化类型。基于候选用户群中各候选用户的第一向量和第二向量，在全量用户中检索候选用户的相似用户，根据相似用户更新候选用户群。将更新的候选用户群中的候选用户作为人群加强正样本。

根据候选用户群中各候选用户的第一向量和第二向量，分别计算得到第一平均向量和第二平均向量。获取全量用户中各用户的第三向量和第四向量，第三向量表示用户的用户属性，第四向量表示用户的转化行为的转化类型。遍历全量用户，得到第三向量与第一平均向量相似且第四向量与第二平均向量相似的相似用户。将相似用户添加至候选用户群。

调用向量表示模型，根据全量用户中各用户的用户特征，生成各用户的第三向量和第四向量。其中，用户的用户特征包括以下至少一项：用户的用户属性、用户的用户标识、用户的转化行为的转化类型、随机选取的转化类型、转化行为对应内容所属行业的行业标识、点击行为对应内容所属行业的行业标识。

获取历史流水记录，历史流水记录至少包括用户的行为数据，用户的行为数据用于指示用户是否存在用户行为，用户行为包括点击行为、转化行为。基于历史流水记录中用户的行为数据，从全量用户中选取存在转化行为的用户作为训练正样本。以及从全量用户中选取存在点击行为的用户作为训练负样本。根据训练正样本和训练负样本，对初始的向量表示模型进行训练，得到向量表示模型。

对候选用户群中的各候选用户进行聚类，计算各候选用户与聚类中心之间的距离。基于计算得到的距离确定各候选用户的置信度，从候选用户群中选取高置信度的候选用户作为人群加强正样本。

在全量用户中，为存在点击行为的用户计算对应的活跃度。从全量用户中选取活跃度高的用户作为人群加强负样本，将人群加强负样本添加至训练集。根据训练集进行机器学习模型的训练，得到适用于目标内容的人群定向模型，包括：根据添加人群加强负样本的训练集进行机器学习模型的训练，得到适用于目标内容的人群定向模型。

根据训练集进行机器学习模型的初始训练，得到候选用户的初始预测得分。基于候选用户的初始预测得分构建验证集，如果验证集的曲线下面积AUC小于设定阈值，则根据候选用户的初始预测得分进行训练集的更新。根据更新的训练集进行机器学习模型的二次训练，得到适用于目标内容的人群定向模型。

调用人群定向模型，得到各候选用户的实际预测得分。根据各候选用户的实际预测得分，计算各候选用户的推荐参数。

需要说明的是，上述实施例所提供的内容推荐装置在进行信息推荐时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即内容推荐装置的内部结构将划分为不同的功能模块，以完成以上描述的全部或者部分功能。

另外，上述实施例所提供的内容推荐装置与内容推荐方法的实施例属于同一构思，其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述，此处不再赘述。

本申请实施例中还提供了一种内容推荐系统，该内容推荐系统包括但不限于：前端设备、后端设备和客户端。

其中，前端设备，用于针对目标内容向后端设备发起人群定向请求。

后端设备，用于根据人群定向请求从全量用户中选取目标内容的候选用户群，并以候选用户群中的候选用户作为人群加强正样本，将人群加强正样本添加至训练集。

后端设备，还用于根据训练集进行机器学习模型的训练，得到适用于目标内容的人群定向模型，并调用人群定向模型，为候选用户群中的候选用户计算对应的推荐参数。

客户端，用于接收后端设备发送的候选用户的推荐参数，并基于候选用户的推荐参数进行目标内容的推荐。

由此，针对圈定的与目标内容相关的候选用户，都会计算得到一个对应的推荐参数，以此实现用户粒度的推荐参数，从而为内容发布方实现了更加精细的人群定向策略，即不同用户之间的推荐参数各不相同，而不同于相关技术中由同一个用户画像标签定向得到的人群的推荐参数相同，这就使得目标内容即使面向圈定的候选用户也存在千次展示期望收入eCPM的差别，从而能够有效地解决相关技术中存在的信息推荐过程中人群定向的准确率不高的问题。

图13根据一示例性实施例示出的一种服务器的结构示意。该服务器适用于图1所示出实施环境的后端设备200。

需要说明的是，该服务器只是一个适配于本申请的示例，不能认为是提供了对本申请的使用范围的任何限制。该服务器也不能解释为需要依赖于或者必须具有图13示出的示例性的服务器2000中的一个或者多个组件。

服务器2000的硬件结构可因配置或者性能的不同而产生较大的差异，如图13所示，服务器2000包括：电源210、接口230、至少一存储器250、以及至少一中央处理器（CPU，Central Processing Units）270。

具体地，电源210用于为服务器2000上的各硬件设备提供工作电压。

接口230包括至少一有线或无线网络接口231，用于与外部设备交互。例如，进行图1所示出实施环境中客户端100与后端设备200之间的交互，或者，进行图1所示出实施环境中前端设备300与后端设备200之间的交互。

当然，在其余本申请适配的示例中，接口230还可以进一步包括至少一串并转换接口233、至少一输入输出接口235以及至少一USB接口237等，如图11所示，在此并非对此构成具体限定。

存储器250作为资源存储的载体，可以是只读存储器、随机存储器、磁盘或者光盘等，其上所存储的资源包括操作系统251、应用程序253及数据255等，存储方式可以是短暂存储或者永久存储。

其中，操作系统251用于管理与控制服务器2000上的各硬件设备以及应用程序253，以实现中央处理器270对存储器250中海量数据255的运算与处理，其可以是WindowsServerTM、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTM等。

应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序，其可以包括至少一模块（图13未示出），每个模块都可以分别包含有对服务器2000的计算机程序。例如，内容推荐装置可视为部署于服务器2000的应用程序253。

数据255可以是存储于磁盘中的照片、图片等，还可以是推荐参数等等，存储于存储器250中。

中央处理器270可以包括一个或多个以上的处理器，并设置为通过至少一通信总线与存储器250通信，以读取存储器250中存储的计算机程序，进而实现对存储器250中海量数据255的运算与处理。例如，通过中央处理器270读取存储器250中存储的一系列计算机程序的形式来完成内容推荐方法。

此外，通过硬件电路或者硬件电路结合软件也能同样实现本申请，因此，实现本申请并不限于任何特定硬件电路、软件以及两者的组合。

请参阅图14，本申请实施例中提供了一种电子设备4000，该电子设备4000可以包括：台式电脑、笔记本电脑、平板电脑、智能手机等等。

在图14中，该电子设备4000包括至少一个处理器4001、至少一条通信总线4002以及至少一个存储器4003。

其中，处理器4001和存储器4003相连，如通过通信总线4002相连。可选地，电子设备4000还可以包括收发器4004，收发器4004可以用于该电子设备与其他电子设备之间的数据交互，如数据的发送和/或数据的接收等。需要说明的是，实际应用中收发器4004不限于一个，该电子设备4000的结构并不构成对本申请实施例的限定。

处理器4001可以是CPU（Central Processing Unit，中央处理器），通用处理器，DSP（Digital Signal Processor，数据信号处理器），ASIC（Application SpecificIntegrated Circuit，专用集成电路），FPGA（Field Programmable Gate Array，现场可编程门阵列）或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器4001也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

通信总线4002可包括一通路，在上述组件之间传送信息。通信总线4002可以是PCI（Peripheral Component Interconnect，外设部件互连标准）总线或EISA（ExtendedIndustry Standard Architecture，扩展工业标准结构）总线等。通信总线4002可以分为地址总线、数据总线、控制总线等。为便于表示，图14中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器4003可以是ROM（Read Only Memory，只读存储器）或可存储静态信息和指令的其他类型的静态存储设备，RAM（Random Access Memory，随机存取存储器）或者可存储信息和指令的其他类型的动态存储设备，也可以是EEPROM（Electrically ErasableProgrammable Read Only Memory，电可擦可编程只读存储器）、CD-ROM（Compact DiscRead Only Memory，只读光盘）或其他光盘存储、光碟存储（包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等）、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

存储器4003上存储有计算机程序，处理器4001通过通信总线4002读取存储器4003中存储的计算机程序。

该计算机程序被处理器4001执行时实现上述各实施例中的内容推荐方法。

此外，本申请实施例中提供了一种存储介质，该存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述各实施例中的内容推荐方法。

本申请实施例中提供了一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序存储在存储介质中。计算机设备的处理器从存储介质读取该计算机程序，处理器执行该计算机程序，使得该计算机设备执行上述各实施例中的内容推荐方法。

与相关技术相比，针对圈定的与目标内容相关的候选用户，都会计算得到一个对应的推荐参数，以此实现用户粒度的推荐参数，从而为内容发布方实现了更加精细的人群定向策略，即不同用户之间的推荐参数各不相同，而不同于相关技术中由同一个用户画像标签定向得到的人群的推荐参数相同，这就使得目标内容即使面向圈定的候选用户也存在千次展示期望收入eCPM的差别，从而能够有效地解决相关技术中存在的信息推荐过程中人群定向的准确率不高的问题。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述仅是本申请的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种内容推荐方法，其特征在于，包括：

接收针对目标内容发起的人群定向请求，并根据所述人群定向请求从全量用户中选取所述目标内容的候选用户群；

以所述候选用户群中的候选用户作为人群加强正样本，将所述人群加强正样本添加至训练集；将所述全量用户中的活跃度高的用户作为人群加强负样本添加至训练集中，所述活跃度与点击次数、点击行为发送时间与计算活跃度的时间相关；

根据所述训练集进行机器学习模型的初始训练，得到所述候选用户的初始预测得分；

基于所述候选用户的初始预测得分构建验证集，如果所述验证集的曲线下面积AUC小于设定阈值，则根据初始预测得分排名靠前的第一数量和排名靠后的第二数量的候选用户更新所述训练集；

根据更新的训练集进行机器学习模型的二次训练，得到适用于所述目标内容的人群定向模型；

调用所述人群定向模型，得到各所述候选用户的实际预测得分；

根据各所述候选用户的实际预测得分、最大实际预测得分、最小实际预测得分以及根据所述人群定向模型确定的超参数，计算各所述候选用户的推荐参数，以使客户端基于所述候选用户的推荐参数进行所述目标内容的推荐；

其中，所述推荐参数将被用于计算候选用户对目标内容的千次展示期望收入eCPM。

2.如权利要求1所述的方法，其特征在于，所述根据所述人群定向请求从全量用户中选取所述目标内容的候选用户群，包括：

根据所述人群定向请求中包含的为所述目标内容指定的人群定向目标，从所述全量用户中选取用户属性符合所述人群定向目标的目标用户；

将所述目标用户添加至所述候选用户群。

3.如权利要求1所述的方法，其特征在于，所述根据所述人群定向请求从全量用户中选取所述目标内容的候选用户群，包括：

根据所述人群定向请求中包含的指定转化类型，从所述全量用户中选取转化行为符合所述指定转化类型的转化用户；

将所述转化用户添加至所述候选用户群。

4.如权利要求1至3任一项所述的方法，其特征在于，所述以所述候选用户群中的候选用户作为人群加强正样本，包括：

获取所述候选用户群中各所述候选用户的第一向量和第二向量，所述第一向量表示所述候选用户的用户属性，所述第二向量表示所述候选用户的转化行为的转化类型；

基于所述候选用户群中各所述候选用户的第一向量和第二向量，在所述全量用户中检索候选用户的相似用户，根据所述相似用户更新所述候选用户群；

将更新的候选用户群中的候选用户作为所述人群加强正样本。

5.如权利要求4所述的方法，其特征在于，所述基于所述候选用户群中各所述候选用户的第一向量和第二向量，在所述全量用户中检索候选用户的相似用户，根据所述相似用户更新所述候选用户群，包括：

根据所述候选用户群中各所述候选用户的第一向量和第二向量，分别计算得到第一平均向量和第二平均向量；

获取所述全量用户中各用户的第三向量和第四向量，所述第三向量表示所述用户的用户属性，所述第四向量表示所述用户的转化行为的转化类型；

遍历所述全量用户，得到第三向量与第一平均向量相似且第四向量与第二平均向量相似的相似用户；

将所述相似用户添加至所述候选用户群。

6.如权利要求5所述的方法，其特征在于，所述获取所述全量用户中各用户的第三向量和第四向量之前，所述方法还包括：

调用向量表示模型，根据所述全量用户中各所述用户的用户特征，生成各所述用户的第三向量和第四向量；

其中，所述用户的用户特征包括以下至少一项：所述用户的用户属性、所述用户的用户标识、所述用户的转化行为的转化类型、随机选取的转化类型、转化行为对应内容所属行业的行业标识、点击行为对应内容所属行业的行业标识。

7.如权利要求6所述的方法，其特征在于，所述调用向量表示模型之前，所述方法还包括：

获取历史流水记录，所述历史流水记录至少包括所述用户的行为数据，所述用户的行为数据用于指示所述用户是否存在用户行为，所述用户行为包括点击行为、转化行为；

基于所述历史流水记录中所述用户的行为数据，从所述全量用户中选取存在转化行为的用户作为训练正样本；以及

从所述全量用户中选取存在点击行为的用户作为训练负样本；

根据所述训练正样本和所述训练负样本，对初始的向量表示模型进行训练，得到所述向量表示模型。

8.如权利要求1至3任一项所述的方法，其特征在于，所述以所述候选用户群中的候选用户作为人群加强正样本，包括：

对所述候选用户群中的各所述候选用户进行聚类，计算各所述候选用户与聚类中心之间的距离；

基于计算得到的距离确定各所述候选用户的置信度，从所述候选用户群中选取高置信度的候选用户作为所述人群加强正样本。

9.一种内容推荐装置，其特征在于，包括：

请求接收模块，用于接收针对目标内容发起的人群定向请求，并根据所述人群定向请求从全量用户中选取所述目标内容的候选用户群；

训练集生成模块，用于以所述候选用户群中的候选用户作为人群加强正样本，将所述人群加强正样本添加至训练集；将所述全量用户中的活跃度高的用户作为人群加强负样本添加至训练集中，所述活跃度与点击次数、点击行为发送时间与计算活跃度的时间相关；

初始得分确定模块，用于根据所述训练集进行机器学习模型的初始训练，得到所述候选用户的初始预测得分；

训练集更新模块，用于基于所述候选用户的初始预测得分构建验证集，如果所述验证集的曲线下面积AUC小于设定阈值，则根据初始预测得分排名靠前的第一数量和排名靠后的第二数量的候选用户更新所述训练集；

二次训练模块，用于根据更新的训练集进行机器学习模型的二次训练，得到适用于所述目标内容的人群定向模型；

实际得分确定模块，用于调用所述人群定向模型，得到各所述候选用户的实际预测得分；

推荐参数模块，用于根据各所述候选用户的实际预测得分、最大实际预测得分、最小实际预测得分以及根据所述人群定向模型确定的超参数，计算各所述候选用户的推荐参数，以使客户端基于所述候选用户的推荐参数进行所述目标内容的推荐；

10.一种内容推荐系统，其特征在于，所述内容推荐系统包括前端设备、后端设备和客户端，其中，

前端设备，用于针对目标内容向后端设备发起人群定向请求；

后端设备，用于根据所述人群定向请求从全量用户中选取所述目标内容的候选用户群，并以所述候选用户群中的候选用户作为人群加强正样本，将所述人群加强正样本添加至训练集；将所述全量用户中的活跃度高的用户作为人群加强负样本添加至训练集中，所述活跃度与点击次数、点击行为发送时间与计算活跃度的时间相关；

后端设备，还用于根据所述训练集进行机器学习模型的训练，得到适用于所述目标内容的人群定向模型，并调用所述人群定向模型，为所述候选用户群中的候选用户计算对应的推荐参数；其中，所述推荐参数将被用于计算候选用户对目标内容的千次展示期望收入eCPM；

客户端，用于接收所述后端设备发送的所述候选用户的推荐参数，并基于所述候选用户的推荐参数进行所述目标内容的推荐；

其中，所述后端设备调用所述人群定向模型，为所述候选用户群中的候选用户计算对应的推荐参数，包括：

根据各所述候选用户的实际预测得分、最大实际预测得分、最小实际预测得分以及根据所述人群定向模型确定的超参数，计算各所述候选用户的推荐参数；

所述根据所述训练集进行机器学习模型的训练，得到适用于所述目标内容的人群定向模型，包括：

基于所述候选用户的初始预测得分构建验证集，如果所述验证集的曲线下面积AUC小于设定阈值，则根据所述候选用户的初始预测得分进行所述训练集的更新；

根据更新的训练集进行机器学习模型的二次训练，得到适用于所述目标内容的人群定向模型。

11.一种电子设备，其特征在于，包括：至少一个处理器、至少一个存储器、以及至少一条通信总线，其中，

所述存储器上存储有计算机程序，所述处理器通过所述通信总线读取所述存储器中的所述计算机程序；

所述计算机程序被所述处理器执行时实现权利要求1至8中任一项所述的内容推荐方法。

12.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的内容推荐方法。