CN114282116A

CN114282116A - 内容推荐方法、预测模型的训练方法及装置

Info

Publication number: CN114282116A
Application number: CN202111638587.5A
Authority: CN
Inventors: 张妤溦; 胡旻皓
Original assignee: Shengdoushi Shanghai Technology Development Co Ltd
Current assignee: Shengdoushi Shanghai Science and Technology Development Co Ltd
Priority date: 2021-12-29
Filing date: 2021-12-29
Publication date: 2022-04-05

Abstract

本公开提供了一种内容推荐方法、预测模型的训练方法及装置，涉及计算机技术领域，尤其涉及智能推荐技术领域。实现方案为：响应于用户对目标页面的访问请求，获取所述用户的预测状态标签，所述预测状态标签是基于所预测的所述用户的预测行为信息而确定的；至少基于所述预测状态标签，确定向所述用户推荐的至少一个推荐内容；以及将所述至少一个推荐内容推送至所述目标页面以进行展示。

Description

内容推荐方法、预测模型的训练方法及装置

技术领域

本公开涉及计算机技术领域，尤其涉及智能推荐技术领域，具体涉及一种内容推荐方法及装置、预测模型的训练方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

背景技术

推荐系统被广泛应用于诸多场景中，用于向用户推荐其可能感兴趣的内容。例如，在产品及服务购买场景中，可以向用户推荐其可能感兴趣的产品或服务；在信息交互场景中，可以向用户推荐其可能感兴趣的广告、音频、视频、新闻等内容；在婚恋或交友场景中，可以向用户推荐其可能感兴趣或可能认识的人物；等等。

在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

发明内容

本公开提供了一种内容推荐方法及装置、预测模型的训练方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

根据本公开的一方面，提供了一种内容推荐方法，包括：响应于用户对目标页面的访问请求，获取所述用户的预测状态标签，所述预测状态标签是基于所预测的所述用户的预测行为信息而确定的；至少基于所述预测状态标签，确定向所述用户推荐的至少一个推荐内容；以及将所述至少一个推荐内容推送至所述目标页面以进行展示。

根据本公开的一方面，提供了一种预测模型的训练方法，包括：获取样本用户在第一时间段的第一行为信息和在第二时间段的第二行为信息，所述第二时间段位于所述第一时间段之后，并且所述第一时间段与所述第二时间段不发生重叠；将所述第一行为信息输入所述预测模型，以得到所述预测模型输出的预测行为信息；基于所述预测行为信息和所述第二行为信息，计算所述预测模型的损失值；以及基于所述损失值，调整所述预测模型的参数。

根据本公开的一方面，提供了一种内容推荐装置，包括：获取模块，被配置为响应于用户对目标页面的访问请求，获取所述用户的预测状态标签，所述预测状态标签是基于所预测的所述用户的预测行为信息而确定的；确定模块，被配置为至少基于所述预测状态标签，确定向所述用户推荐的至少一个推荐内容；以及推送模块，被配置为将所述至少一个推荐内容推送至所述目标页面以进行展示。

根据本公开的一方面，提供了获取模块，被配置为获取样本用户在第一时间段的第一行为信息和在第二时间段的第二行为信息，所述第二时间段位于所述第一时间段之后，并且所述第一时间段与所述第二时间段不发生重叠；预测模块，被配置为将所述第一行为信息输入所述预测模型，以得到所述预测模型输出的预测行为信息；计算模块，被配置为基于所述预测行为信息和所述第二行为信息，计算所述预测模型的损失值；以及调整模块，被配置为基于所述损失值，调整所述预测模型的参数。

根据本公开的一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述任一方面的方法。

根据本公开的一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使计算机执行上述任一方面的方法。

根据本公开的一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述任一方面的方法。

根据本公开的一个或多个实施例，可以提高内容推荐的针对性和准确性。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图示例性地示出了实施例并且构成说明书的一部分，与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的，并不限制权利要求的范围。在所有附图中，相同的附图标记指代类似但不一定相同的要素。

图1示出了根据本公开实施例的内容推荐方法的流程图；

图2示出了根据本公开实施例的预测模型的训练方法的流程图；

图3A、3B示出了根据本公开实施例的示例性内容推荐过程的示意图；

图4示出了根据本公开实施例的内容推荐装置的结构框图；

图5示出了根据本公开实施例的预测模型的训练装置的结构框图；以及

图6示出了根据本公开实施例的电子设备的结构框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在本公开中，除非另有说明，否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系，这种术语只是用于将一个元件与另一元件区分开。在一些示例中，第一要素和第二要素可以指向该要素的同一实例，而在某些情况下，基于上下文的描述，它们也可以指代不同实例。

在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的，而并非旨在进行限制。除非上下文另外明确地表明，如果不特意限定要素的数量，则该要素可以是一个也可以是多个。此外，本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。

在一些相关技术中，可以基于用户的历史行为情况(例如历史消费情况、历史浏览情况等)，按照一定的规则来将用户划分为多个群体，不同的群体享有固定的产品或服务推送。该方法的用户群体划分较为粗糙，并且属于静态的用户群体划分，没有考虑用户流失、活跃度改变等动态情况，仅能表达用户的历史行为情况，无法表达用户未来的行为情况，导致推荐结果不够准确，用户体验不好。

在另一些相关技术中，可以基于用户的客户终身价值来进行内容推荐。即，计算用户的客户终身价值(Customer Lifetime Value，CLTV，又称CLV、LTV)，然后根据客户终身价值来向用户推荐相应的产品或服务。但是，CLTV同样仅能表达用户的历史行为情况，无法表达用户未来的行为情况，导致推荐结果不够准确，用户体验不好。

为解决上述问题，本公开提供了一种内容推荐方法，能够预测用户未来的行为情况(即预测行为信息)，并基于预测的未来行为情况来进一步预测用户未来的状态标签(即预测状态标签)。当用户进行线上访问时(例如打开某个网页、小程序时)，可以获取用户的预测状态标签，并基于预测状态标签来向用户推荐内容，从而提高内容推荐的针对性和准确性。

本公开的内容推荐方法例如可以但不限于应用于线上点餐平台。通过采用本公开实施例的内容推荐方法，可以在用户进入线上点餐平台时，获取用户的预测状态标签，并基于预测状态标签来确定并向用户推荐其可能感兴趣的内容(例如优惠券、商家优惠消息、会员服务包等)，从而实现定制化的、准确的内容推荐，提高用户体验。

以下将结合附图，详细描述本公开的实施例。

图1示出了根据本公开实施例的内容推荐方法100的流程图。方法100通常在服务器处执行。如图1所示，方法100包括：

步骤S110、响应于用户对目标页面的访问请求，获取该用户的预测状态标签，预测状态标签是基于所预测的该用户的预测行为信息而确定的；

步骤S120、至少基于预测状态标签，确定向该用户推荐的至少一个推荐内容；以及

步骤S130、将上述至少一个推荐内容推送至目标页面以进行展示。

根据本公开的实施例，能够预测用户未来的行为情况(即预测行为信息)，并基于预测的未来行为情况来进一步预测用户未来的状态标签(即预测状态标签)。当用户进行线上访问时(例如打开某个网页、小程序时)，可以获取用户的预测状态标签，并基于预测状态标签来向用户推荐内容，从而提高内容推荐的针对性和准确性。

以下详细描述方法100的各个步骤。

在步骤S110中，响应于用户对目标页面的访问请求，获取该用户的预测状态标签。

目标页面可以是客户端应用中的预设的、用于进行内容推荐的页面。当用户通过点击、滑动等交互操作进入目标页面时，即触发对目标页面的访问请求，从而触发服务器执行本公开实施例的方法100。

例如，目标页面可以是客户端应用的首页，相应地，当用户启动客户端应用(即打开客户端应用的首页)时，触发对客户端应用首页的访问请求，从而触发执行本公开实施例的方法100。又例如，目标页面也可以是客户端应用中的频道页面，相应地，当用户点击进入频道页面时，触发对频道页面的访问请求，从而触发服务器执行本公开实施例的方法100。

需要说明的是，客户端应用可以是具有内容推荐功能的任意类型的应用，例如餐饮应用、购物应用、资讯应用、音视频应用等。此外，客户端应用可以以任意形式驻留于客户端设备(例如手机、平板电脑、智能可穿戴设备等)中，例如，客户端应用可以是运行前需要下载和安装的应用程序，也可以是可通过浏览器访问的网站，还可以是运行于宿主应用中的轻量化的小程序，等等。

响应于用户对目标页面的访问请求，获取该用户的预测状态标签。预测状态标签是预测的用于表达用户的未来状态的标签。根据一些实施例，预测状态标签可以用于指示用户的预测的消费行为级别。消费行为级别例如可以包括消费频次等级和/或消费金额等级。根据一些实施例，预测状态标签还可以用于指示用户偏好的产品类型。

在本公开的实施例中，预测状态标签是基于所预测的用户的预测行为信息而确定的。即，预测状态标签可以按照以下步骤得出：首先，对用户的未来行为信息进行预测，得到用户的预测行为信息；随后，基于所预测的预测行为信息来确定用户的预测状态标签。

根据一些实施例，预测行为信息是通过将用户的历史行为信息输入预设的预测模型而得到的。历史行为信息指的是用户在某一历史时间段内的行为信息。预测行为信息指的是预测的用户在某一未来时间段内的行为信息。可以理解，历史行为信息和预测行为信息可以是不同类型的行为信息。

例如，在点餐场景中，用户的历史行为信息可以是用户在某一历史时间段(例如去年上半年)的订单数量、平均订单金额、购买次数最多的产品、消费次数最多的餐期(早餐/午餐/下午茶/晚餐等)、消费次数最多的城市等。预测行为信息可以是用户在某一未来时间段(例如未来半年)的消费频次、消费金额、某种产品的购买频次、不同餐期的消费频次等。

又例如，在母婴产品购买场景中，用户的历史行为信息可以是用户在某一历史时间段购买的婴幼儿产品的订单数量、平均订单金额、产品类型等。预测行为信息可以是用户在某一未来时间段的孕妇类产品购买频次和婴幼儿产品购买频次。

预测模型的训练方法将于下文进行详述。

在得到用户的预测行为信息后，可以基于预设的规则来对用户的预测行为信息进行分类，预测行为信息对应的类别标签即为用户的预测状态标签。根据一些实施例，可以基于预设的规则(例如预设的阈值)来对用户的预测行为信息进行分类，从而得到用户的预测状态标签。

例如，在点餐场景中，预测行为信息可以是用户在某一未来时间段的消费频次，相应地，预测状态标签可以是用户在该未来时间段的消费频次等级。可以预设两个阈值thr1、thr2，并且thr1小于thr2。当预测的消费频次小于thr1时，将用户的预测状态标签确定为“低频”；当预测的消费频次大于等于thr1且小于thr2时，将用户的预测状态标签确定为“中频”；当预测的消费频次大于等于thr2时，将用户的预测状态标签确定为“高频”。

又例如，在母婴产品购买场景中，预测行为信息可以是用户在某一未来时间段的孕妇类产品购买频次和婴幼儿产品购买频次。预测状态标签可以是用户的孕期标签，孕期标签可以用于指示用户在未来时间段偏好的母婴产品类型。孕期标签可以包括备孕、怀孕初期、即将分娩、已分娩四种。可以分别设置孕妇类产品购买频次的阈值thr3和婴幼儿产品购买频次的阈值thr4。通过将预测的孕妇类产品购买频次与thr3比对，将预测的婴幼儿产品购买频次与thr4比对，可以确定该用户的孕期标签。

在步骤S120中，至少基于步骤S110中获取到的用户的预测状态标签，确定向该用户推荐的至少一个推荐内容。推荐内容的类型可以根据具体的应用场景来确定，本公开对推荐内容的类型不做限制。例如，在点餐场景中，推荐内容例如可以是优惠券(例如餐品优惠券、会员优惠券等)、餐品、服务提示消息(例如当前会员服务的到期时间等)等。在视频浏览场景中，推荐内容例如可以是电影、综艺节目、服务提示消息等。

在步骤S120中，确定至少一个推荐内容的方法有多种。

根据一些实施例，可以基于用户的预测状态标签和预设的规则来确定至少一个推荐内容。预设的规则例如可以是预设的预测状态标签与推荐内容的关联关系，相应地，可以基于预设的预测状态标签与推荐内容的关联关系，确定向用户推荐的至少一个推荐内容。预测状态标签与推荐内容的关联关系例如可以实现为二者的对应表。相应地，可以通过查表来确定预测状态标签对应的推荐内容。

根据一些实施例，可以基于用户的预测状态标签和预设的算法模型来确定至少一个推荐内容。预设的算法模型例如可以是经训练的第一推荐模型，该第一推荐模型可以以用户的预测状态标签和候选内容的特征信息为输入，输出候选内容的推荐程度。相应地，可以基于用户的预测状态标签，采用预设的第一推荐模型分别确定多个候选内容的推荐程度；将推荐程度最大的一个或多个候选内容作为至少一个推荐内容。

例如，在点餐优惠券推送的场景中，候选内容、推荐内容均为餐饮优惠券。优惠券的推荐程度可以是该优惠券的预期销售额、利润、点击率等。第一推荐模型可以以用户的预测状态标签、优惠券的类型标签、优惠券所对应的产品的标签为输入，输出该优惠券的推荐程度得分。将推荐程度得分最高的一个或多个优惠券作为推荐内容推荐给用户。

根据一些实施例，可以获取用户的历史状态标签，历史状态标签是基于用户的历史行为信息而确定的。然后基于历史状态标签和预测状态标签，确定向用户推荐的至少一个推荐内容。

历史状态标签和预测状态标签可以是不同时间段的相同类型的状态标签。例如，在点餐场景中，历史状态标签可以是用户在过去一年的消费频次等级标签(高频/中频/低频)，预测状态标签可以是预测的用户在未来一年的消费频次等级标签(高频/中频/低频)。

历史状态标签和预测状态标签也可以是不同时间段的不同类型的状态标签。例如，在点餐场景中，历史状态标签可以是用户在过去一年的消费频次等级标签(高频/中频/低频)，预测状态标签可以是预测的用户在未来一年的下午茶消费频次等级标签(高频/中频/低频)。

根据一些实施例，可以基于用户的预测状态标签、历史状态标签和预设的规则来确定至少一个推荐内容。预设的规则例如可以是预设的预测状态标签、历史状态标签、推荐内容三者之间的关联关系，相应地，可以基于预设的预测状态标签、历史状态标签、推荐内容三者之间的关联关系，确定向用户推荐的至少一个推荐内容。预测状态标签、历史状态标签、推荐内容三者之间的关联关系可以实现为三者的对应表，相应地，可以通过查表来确定预测状态标签、历史状态标签所对应的推荐内容。

例如，在点餐优惠券推送的场景中，历史状态标签可以是用户在过去一年的消费频次等级标签(高频/中频/低频)，预测状态标签可以是预测的用户在未来一年的下午茶消费频次等级标签(高频/中频/低频)，推荐内容为优惠券。历史状态标签、预测状态标签、优惠券三者之间的关联关系例如如下表所示：

相应地，通过对上表进行查找，可以确定向用户推荐的优惠券。例如，用户在过去一年的总消费频次等级为高频，预测的未来一年的下午茶消费频次等级为低频，通过查表，可以确定向用户推荐深折扣优惠券。

根据一些实施例，可以基于用户的预测状态标签、历史状态标签和预设的算法模型来确定至少一个推荐内容。预设的算法模型例如可以是经训练的第二推荐模型，该第二推荐模型可以以用户的预测状态标签、历史状态标签和候选内容的特征信息为输入，输出候选内容的推荐程度。相应地，可以基于用户的预测状态标签和历史状态标签，采用预设的第二推荐模型分别确定多个候选内容的推荐程度；将推荐程度最大的一个或多个候选内容作为至少一个推荐内容。

例如，在点餐优惠券推送的场景中，候选内容、推荐内容均为餐饮优惠券。优惠券的推荐程度可以是该优惠券的预期销售额、预期利润、点击率等。第二推荐模型可以以用户的预测状态标签、历史状态标签、优惠券的类型标签、优惠券所对应的产品的标签为输入，输出该优惠券的推荐程度得分。将推荐程度得分最高的一个或多个优惠券作为推荐内容推荐给用户。

如上文所述，在本公开的实施例中，可以预先确定客户端应用的每个用户的预测状态标签。预测状态标签是基于所预测的用户的预测行为信息来确定的，用户的预测行为信息是基于用户的历史行为信息来确定的。可以理解，对于客户端应用的新用户来说，由于新用户的历史行为较少，因此按照上述方法确定的预测状态标签可能不够准确。相应地，基于预测状态标签所确定的推荐内容可能不够准确，即推荐系统存在针对新用户的冷启动问题。

根据一些实施例，方法100还包括：基于用户的历史行为信息判断该用户是否为新用户；以及响应于确定该用户为新用户，采用至少一个推荐策略来确定向该用户推荐的一个或多个推荐内容。由此，可以避免推荐系统针对新用户的冷启动问题，提高新用户的推荐效果。

根据一些实施例，可以基于用户的历史行为的数量来判断该用户是否为新用户。例如，若用户在客户端应用中的历史行为(例如浏览、加购物车、付费购买等)较少(即历史行为的数量小于预设阈值)，则确定该用户为新用户。

在确定用户为新用户的情况下，可以采用至少一个预设的推荐策略来确定向该用户推荐的一个或多个推荐内容。预设的推荐策略例如可以是随机推荐策略(例如随机选择一个或多个内容作为推荐内容)、热搜推荐策略(例如将当前被用户搜索次数最多的一个或多个内容作为推荐内容)、促销推荐策略(例如将当前折扣力度最大的产品或优惠券作为推荐内容)等，但不限于此。

在采用一个推荐策略的情况下，可以直接将该推荐策略所得到的推荐内容推送给用户。在采用多个推荐策略的情况下，可以将每个推荐策略所得到的推荐内容进行汇总、排序(可选步骤)、筛选(可选步骤)后，再推送给用户。

在步骤S130中，将所确定的至少一个推荐内容推送至目标页面以进行展示。

具体地，服务器确定了向用户推荐的至少一个推荐内容后，可以将这些推荐内容推送给客户端应用，以便客户端应用在目标页面上展示这些推荐内容。推荐内容例如可以通过弹窗、动画等方式展示于目标页面上，本公开不限制推荐内容的展示方式。

根据本公开的另一方面，还提供一种预测模型的训练方法，该方法用于训练预测模型，预测模型能够基于用户的历史行为信息来预测用户未来的行为信息(即预测行为信息)。

图2示出了根据本公开实施例的预测模型的训练方法200的流程图。方法200通常在服务器处执行。可以理解，用于执行方法200的服务器与用于执行前述方法100的服务器可以是不同的服务器，也可以是相同的服务器。在一些实施例中，方法200也可以在客户端设备处执行。如图2所示，方法200包括：

步骤S210、获取样本用户在第一时间段的第一行为信息和在第二时间段的第二行为信息，第二时间段位于第一时间段之后，并且第一时间段与第二时间段不发生重叠；

步骤S220、将第一行为信息输入预测模型，以得到预测模型输出的预测行为信息；

步骤S230、基于预测行为信息和第二行为信息，计算预测模型的损失值；以及

步骤S240、基于损失值，调整预测模型的参数。

根据本公开的实施例，基于用户在不同时间段的行为信息来训练预测模型，从而使得训练后的预测模型能够对用户未来的行为信息进行预测，即得到用户的预测行为信息。通过预测模型来确定用户的预测行为信息，能够对用户的未来状态进行动态、准确的预测，从而能够提高用户的预测状态标签以及内容推荐的准确性。

以下详细介绍方法200的各个步骤。

在步骤S210中，获取样本用户在第一时间段的第一行为信息和在第二时间段的第二行为信息。

第二时间段位于第一时间段之后，并且第一时间段与第二时间段不发生重叠。例如，第一时间段可以是去年上半年，第二时间段可以是去年下半年。

在预测模型的训练过程中，每个样本用户的第一行为信息和第二行为信息的组合可以作为一个训练样本。在每个训练样本中，第一行为信息作为预测模型的输入特征，第二行为信息作为样本的真实标签。

第一行为信息、第二行为信息的类型可以根据具体的应用场景来设定。例如，在点餐场景中，第一行为信息可以是订单数量、平均订单金额、购买次数最多的产品、消费次数最多的餐期(早餐/午餐/下午茶/晚餐等)、消费次数最多的城市等。第二行为信息可以是消费频次、消费金额、某种产品的购买频次、不同餐期的消费频次等。

在步骤S220中，将第一行为信息输入预测模型，以得到预测模型输出的预测行为信息。

预测模型例如可以是GBRT(Gradient Boosting Regression Tree，梯度提升回归树)、SVM(Support Vector Machine，支持向量机)等，本公开不限制预测模型的具体结构。

在步骤S230中，通过基于预测行为信息和第二行为信息，计算预测模型的损失值。预测行为信息为预测模型输出的预测值，第二行为信息为训练样本的真实值，损失值用于表示预测值与真实值之间的差距。

损失值可以通过损失函数来计算。损失函数例如可以是均方误差(Mean SquareError，MSE)损失函数(又称L2损失)、平均绝对误差(Mean Absolute Error，MAE)损失函数(又称L1损失)、Huber损失函数等。本公开不限制损失函数的类型和表达式。

在步骤S240中，例如可以通过反向传播算法来调整预测模型的参数。

可以理解，上述步骤S210-S240可以循环执行多次，直至预测模型的损失值小于某一阈值时，预测模型训练完成。

此外，方法200可以按照预设的频率周期性地执行(例如每7天执行一次，每30天执行一次等)，从而不断更新预测模型，使预测模型能够贴合最新的用户数据，从而能够准确预测用户的预测行为信息。

图3A、3B示出了根据本公开实施例的示例性内容推荐过程。

如图3A所示，首先，在离线的算法模块中，根据业务场景筛选用户行为特征(对应于上文方法200中的第一行为信息)以及需预测的行为标签(对应于上文方法200中的第二行为信息)。然后，获取样本用户的行为特征和行为标签作为训练样本，训练预测模型。

例如，在点餐场景中，可以选择历史订单数量、平均订单金额、购买次数最多的产品、消费次数最多的餐期(早餐/午餐/下午茶/晚餐等)、消费次数最多的城市等用户行为特征。需预测的行为标签例如可以是用户未来的消费金额或消费频次。

在离线的运营模块中，采用训练好的预测模型，预测得出各个用户的预测行为信息，例如用户未来的消费金额、消费频次等。

随后，可以采用预设的业务阈值来对用户的预测行为信息进行划分，以得到各个用户的预测状态标签，例如用户未来的消费金额等级、消费频次等级等。在得到各用户的预测状态标签后，可以将各用户的预测状态标签存储至数据库中。根据一些实施例，数据库中除了存储有各用户的预测状态标签之外，还可以存储有用户的历史状态标签。

在线的业务端模块包括线下和线上两部分。

针对线下部分，可以向线下餐厅门店的POS(Point of sales)机器提供用于获取用户标签的接口，将数据库中存储的用户的预测状态标签和历史状态标签推送至线下POS机器(历史状态标签是可选的，因此在图3A中用虚线表示)，以便辅助餐厅的工作人员向用户提供个性化服务。

针对线上部分，可以响应于用户对目标页面的访问请求，获取用户的预测状态标签，在一些情况中，也可以同时获取用户的历史状态标签。随后，基于所获取的预测状态标签(和历史状态标签)，采用预设的规则或算法模型来确定向用户推荐的至少一个推荐内容，然后将推荐内容推送至目标页面以便展示给用户。

图3B示出了餐厅优惠券推送场景中，采用算法模型来确定推荐内容的示例性过程。如图3B所示，可以将用户的预测状态标签(用户未来的消费金额等级、消费频次等级等)、用户的历史状态标签(可选)、优惠券信息(例如优惠券的标识、折扣力度、优惠金额等)、优惠券相关的产品信息(例如优惠券可以使用的产品的标识、类型、餐期等)输入经训练的推荐模型，推荐模型可以输出优惠券对用户的推荐程度得分。然后将各优惠券按照推荐程度得分进行排序，将得分最高的一个或多个优惠券作为推荐内容推荐给用户。例如，如图3B所示，通过对优惠券进行打分和排序，确定将优惠券A、优惠券C推荐给用户1，将优惠券B、优惠券D推荐给用户2，将优惠券E、优惠券D推荐给用户3，等。

根据本公开的另一方面，还提供一种内容推荐装置。图4示出了根据本公开实施例的内容推荐装置400的结构框图。如图4所示，装置400包括：

获取模块410，被配置为响应于用户对目标页面的访问请求，获取所述用户的预测状态标签，其中，所述预测状态标签是基于所预测的所述用户的预测行为信息而确定的；

确定模块420，被配置为至少基于所述预测状态标签，确定向所述用户推荐的至少一个推荐内容；以及

推送模块430，被配置为将所述至少一个推荐内容推送至所述目标页面以进行展示。

根据本公开的另一方面，还提供一种预测模型的训练装置。图5示出了根据本公开实施例的预测模型的训练装置500的结构框图。如图5所示，装置500包括：

获取模块510，被配置为获取样本用户在第一时间段的第一行为信息和在第二时间段的第二行为信息，其中，所述第二时间段位于所述第一时间段之后，并且所述第一时间段与所述第二时间段不发生重叠；

预测模块520，被配置为将所述第一行为信息输入所述预测模型，以得到所述预测模型输出的预测行为信息；

计算模块530，被配置为基于所述预测行为信息和所述第二行为信息，计算所述预测模型的损失值；以及

调整模块540，被配置为基于所述损失值，调整所述预测模型的参数。

应当理解，图4中所示装置400的各个模块或单元可以与参考图1描述的方法100中的各个步骤相对应，图5中所示装置500的各个模块可以与参考图2描述的方法200中的各个步骤相对应。由此，上面针对方法100描述的操作、特征和优点同样适用于装置400及其包括的模块以及单元，上面针对方法200描述的操作、特征和优点同样适用于装置500及其包括的模块。为了简洁起见，某些操作、特征和优点在此不再赘述。

虽然上面参考特定模块讨论了特定功能，但是应当注意，本文讨论的各个模块的功能可以分为多个模块，和/或多个模块的至少一些功能可以组合成单个模块。例如，上面描述的计算模块530和调整模块540在一些实施例中可以组合成单个模块。

还应当理解，本文可以在软件硬件元件或程序模块的一般上下文中描述各种技术。上面关于图4、图5描述的各个模块可以在硬件中或在结合软件和/或固件的硬件中实现。例如，这些模块可以被实现为计算机程序代码/指令，该计算机程序代码/指令被配置为在一个或多个处理器中执行并存储在计算机可读存储介质中。可替换地，这些模块可以被实现为硬件逻辑/电路。例如，在一些实施例中，模块410-430、510-540中的一个或多个可以一起被实现在片上系统(System on Chip,SoC)中。SoC可以包括集成电路芯片(其包括处理器(例如，中央处理单元(Central Processing Unit,CPU)、微控制器、微处理器、数字信号处理器(Digital Signal Processor,DSP)等)、存储器、一个或多个通信接口、和/或其他电路中的一个或多个部件)，并且可以可选地执行所接收的程序代码和/或包括嵌入式固件以执行功能。

根据本公开的另一方面，还提供一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的内容推荐方法和/或预测模型的训练方法。

根据本公开的另一方面，还提供一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行上述的内容推荐方法和/或预测模型的训练方法。

根据本公开的另一方面，还提供一种计算机程序产品，包括计算机程序，其中，所述计算机程序再被处理器执行时实现上述的内容推荐方法和/或预测模型的训练方法。

参见图6，现将描述可以作为本公开的电子设备600的结构框图，其是可以应用于本公开的各方面的硬件设备的示例。电子设备可以是不同类型的计算机设备，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

图6示出了根据本公开实施例的电子设备的框图。如图6所示，电子设备600可以包括能够通过系统总线603彼此通信的至少一个处理器601、工作存储器602、I/O设备604、显示设备605、存储装置606和通信接口607。

处理器601可以是单个处理单元或多个处理单元，所有处理单元可以包括单个或多个计算单元或者多个核心。处理器601可以被实施成一个或更多微处理器、微型计算机、微控制器、数字信号处理器、中央处理单元、状态机、逻辑电路和/或基于操作指令来操纵信号的任何设备。处理器601可以被配置成获取并且执行存储在工作存储器602、存储装置606或者其他计算机可读介质中的计算机可读指令，诸如操作系统602a的程序代码、应用程序602b的程序代码等。

工作存储器602和存储装置606是用于存储指令的计算机可读存储介质的示例，指令由处理器601执行来实施前面所描述的各种功能。工作存储器602可以包括易失性存储器和非易失性存储器二者(例如RAM、ROM等等)。此外，存储装置606可以包括硬盘驱动器、固态驱动器、可移除介质、包括外部和可移除驱动器、存储器卡、闪存、软盘、光盘(例如CD、DVD)、存储阵列、网络附属存储、存储区域网等等。工作存储器602和存储装置606在本文中都可以被统称为存储器或计算机可读存储介质，并且可以是能够把计算机可读、处理器可执行程序指令存储为计算机程序代码的非暂态介质，计算机程序代码可以由处理器601作为被配置成实施在本文的示例中所描述的操作和功能的特定机器来执行。

I/O设备604可以包括输入设备和/或输出设备，输入设备可以是能向电子设备600输入信息的任何类型的设备，可以包括但不限于鼠标、键盘、触摸屏、轨迹板、轨迹球、操作杆、麦克风和/或遥控器。输出设备可以是能呈现信息的任何类型的设备，并且可以包括但不限于包括视频/音频输出终端、振动器和/或打印机。

通信接口607允许电子设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据，并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组，例如蓝牙^TM设备、802.11设备、Wi-Fi设备、WiMAX设备、蜂窝通信设备和/或类似物。

工作寄存器602中的应用程序602b可以被加载执行上文所描述的各个方法和处理，例如图1中的步骤S110-S130和/或图2中的步骤S210-S240。在一些实施例中，计算机程序的部分或者全部可以经由存储装置606和/或通信接口607而被载入和/或安装到电子设备600上。当计算机程序被加载并由处理器601执行时，可以执行上文描述的内容推荐方法或预测模型的训练方法的一个或多个步骤。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程内容推荐装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示设备(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行、也可以顺序地或以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

虽然已经参照附图描述了本公开的实施例或示例，但应理解，上述的方法、系统和设备仅仅是示例性的实施例或示例，本发明的范围并不由这些实施例或示例限制，而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外，可以通过不同于本公开中描述的次序来执行各步骤。进一步地，可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进，在此描述的很多要素可以由本公开之后出现的等同要素进行替换。

Claims

1.一种内容推荐方法，包括：

响应于用户对目标页面的访问请求，获取所述用户的预测状态标签，其中，所述预测状态标签是基于所预测的所述用户的预测行为信息而确定的；

至少基于所述预测状态标签，确定向所述用户推荐的至少一个推荐内容；以及

将所述至少一个推荐内容推送至所述目标页面以进行展示。

2.根据权利要求1所述的方法，其中，所述预测状态标签用于指示所述用户的预测的消费行为级别。

3.根据权利要求2所述的方法，其中，所述消费行为级别包括消费频次等级和/或消费金额等级。

4.根据权利要求2或3所述的方法，其中，所述预测状态标签还用于指示所述用户偏好的产品类型。

5.根据权利要求1-3中任一项所述的方法，其中，所述预测行为信息是通过将所述用户的历史行为信息输入预设的预测模型而得到的。

6.根据权利要求1-3中任一项所述的方法，其中，至少基于所述预测状态标签，确定向所述用户推荐的至少一个推荐内容包括：

基于预设的预测状态标签与推荐内容的关联关系，确定向所述用户推荐的至少一个推荐内容。

7.根据权利要求1-3中任一项所述的方法，其中，至少基于所述预测状态标签，确定向所述用户推荐的至少一个推荐内容包括：

基于所述预测状态标签，采用预设的第一推荐模型分别确定多个候选内容的推荐程度；以及

将推荐程度最大的一个或多个候选内容作为所述至少一个推荐内容。

8.根据权利要求1-3中任一项所述的方法，其中，至少基于所述预测状态标签，确定向所述用户推荐的至少一个推荐内容包括：

获取所述用户的历史状态标签，所述历史状态标签是基于所述用户的历史行为信息而确定的；

基于所述历史状态标签和所述预测状态标签，确定向所述用户推荐的至少一个推荐内容。

9.根据权利要求8所述的方法，其中，基于所述历史状态标签和所述预测状态标签，确定向所述用户推荐的至少一个推荐内容包括：

基于预设的预测状态标签、历史状态标签、推荐内容三者之间的关联关系，确定向所述用户推荐的至少一个推荐内容。

10.根据权利要求8所述的方法，其中，基于所述历史状态标签和所述预测状态标签，确定向所述用户推荐的至少一个推荐内容包括：

基于所述预测状态标签和所述历史状态标签，采用预设的第二推荐模型分别确定多个候选内容的推荐程度；以及

11.根据权利要求1-3中任一项所述的方法，还包括：

基于所述用户的历史行为信息判断所述用户是否为新用户；以及

响应于确定所述用户为新用户，采用至少一个推荐策略确定向所述用户推荐的一个或多个推荐内容。

12.一种预测模型的训练方法，包括：

获取样本用户在第一时间段的第一行为信息和在第二时间段的第二行为信息，其中，所述第二时间段位于所述第一时间段之后，并且所述第一时间段与所述第二时间段不发生重叠；

将所述第一行为信息输入所述预测模型，以得到所述预测模型输出的预测行为信息；

基于所述预测行为信息和所述第二行为信息，计算所述预测模型的损失值；以及

基于所述损失值，调整所述预测模型的参数。

13.一种内容推荐装置，包括：

获取模块，被配置为响应于用户对目标页面的访问请求，获取所述用户的预测状态标签，其中，所述预测状态标签是基于所预测的所述用户的预测行为信息而确定的；

确定模块，被配置为至少基于所述预测状态标签，确定向所述用户推荐的至少一个推荐内容；以及

推送模块，被配置为将所述至少一个推荐内容推送至所述目标页面以进行展示。

14.一种预测模型的训练装置，包括：

获取模块，被配置为获取样本用户在第一时间段的第一行为信息和在第二时间段的第二行为信息，其中，所述第二时间段位于所述第一时间段之后，并且所述第一时间段与所述第二时间段不发生重叠；

预测模块，被配置为将所述第一行为信息输入所述预测模型，以得到所述预测模型输出的预测行为信息；

计算模块，被配置为基于所述预测行为信息和所述第二行为信息，计算所述预测模型的损失值；以及

调整模块，被配置为基于所述损失值，调整所述预测模型的参数。

15.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行根据权利要求1-12中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使计算机执行根据权利要求1-12中任一项所述的方法。

17.一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被处理器执行时实现根据权利要求1-12中任一项所述的方法。