WO2023078226A1

WO2023078226A1 - 推荐方法、装置、服务器和计算机可读存储介质

Info

Publication number: WO2023078226A1
Application number: PCT/CN2022/128878
Authority: WO
Inventors: 王林翰
Original assignee: 中兴通讯股份有限公司
Priority date: 2021-11-04
Filing date: 2022-11-01
Publication date: 2023-05-11
Also published as: CN116070014A

Abstract

一种推荐方法、装置、服务器和计算机可读存储介质。上述推荐方法包括：在确定用户上线的情况下，从离线的数据库中获取针对所述用户离线构建的用户标签；根据所述用户标签和所述离线的数据库中存储的针对各待推荐内容离线构建的内容标签，进行标签匹配，并根据匹配结果在线生成对所述用户的推荐列表；向所述用户对应的终端推送所述推荐列表。

Description

推荐方法、装置、服务器和计算机可读存储介质

相关申请的交叉引用

本申请要求于2021年11月4日提交的中国专利申请NO.202111302296.9的优先权，该中国专利申请的内容通过引用的方式整体合并于此。

技术领域

本申请实施例涉及通信技术领域，特别涉及一种推荐方法、装置、服务器和计算机可读存储介质。

背景技术

随着互联网的快速发展，信息爆炸己成为常态，各大视频推荐平台为增加用户粘性会对每个用户进行有针对性的个性化推荐，这对服务端处理数据的能力要求越来越高。在相关技术中，个性化推荐系统面对海量数据时存在计算效率低下、推荐响应速度慢的问题。

发明内容

本申请实施例提供了一种推荐方法，包括：在确定用户上线的情况下，从离线的数据库中获取针对所述用户离线构建的用户标签；根据所述用户标签和所述离线的数据库中存储的针对各待推荐内容离线构建的内容标签，进行标签匹配，并根据匹配结果在线生成对所述用户的推荐列表；以及，向所述用户对应的终端推送所述推荐列表。

本申请实施例还提供了一种推荐装置，包括：离线用户标签获取模块，配置为在确定用户上线的情况下，从离线的数据库中获取针对所述用户离线构建的用户标签；在线匹配模块，配置为根据所述用户标签和所述离线的数据库中存储的针对各待推荐内容离线构建的内容标签，进行标签匹配，并根据匹配结果在线生成对所述用户的推荐列表；以及，在线推送模块，配置为向所述用户对应的终端推送所述推荐列表。

本申请实施例还提供了一种服务器，包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行；以使所述至少一个处理器能够执行上述的推荐方法。

为至少实现上述目的，本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述的推荐方法。

附图说明

图1是根据本申请实施例的推荐方法的流程图；

图2是根据本申请实施例的实现推荐方法的系统的架构图；

图3是根据本申请实施例的应用层的构成示意图；

图4是根据本申请实施例的推荐方法的在线和离线两个流程的示意图；

图5是根据本申请实施例的推荐装置的结构示意图；

图6是根据本申请实施例的服务器的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请的各实施例及其具体实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本申请各实施例和实施方式中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施例和实施方式的种种变化和修改，也可以实现本申请所要求保护的技术方案。以下各个实施例和实施方式的划分是为了描述方便，不应对本申请的具体实现方式构成任何限定，各个实施例和/或实施方式在不矛盾的前提下可以相互结合相互引用。

本申请的一个实施例提供了一种推荐方法，应用于服务器，该服务器可以为内容分发网络(Content Delivery Network，CDN)中的服务器。本实施例是为了对于CDN网络中的用户提供推荐内容，如用户进入电子节目指南(electrical program guide，EPG)页面后推荐用户观看的内容，用户观看完成影片后推荐用户观看的内容，等。参考图1所示的该推荐方法的流程图，该推荐方法可包括以下步骤101至103。

在步骤101中，在确定用户上线的情况下，从离线的数据库中获取针对用户离线构建的用户标签。

在步骤102中，根据用户标签和离线的数据库中存储的针对各待推荐内容离线构建的内容标签，进行标签匹配，并根据匹配结果在线生成对所述用户的推荐列表。

在步骤103中，向用户对应的终端推送推荐列表。

本申请的发明人发现，目前个性化推荐系统面对海量数据时出现的计算效率低下、推荐响应速度慢的问题的原因为：大多采用线上实时推荐，整个运算过程都在线上完成，因此线上会执行算力需求极大的机器学习算法全过程，机器学习算法执行速度慢，算力需求大的缺点也会被整个推荐系统继承，造成在线计算的压力大、推荐响应速度慢。基于此，本申请实施例中，将推荐方法分为离线部分和在线部分，在离线部分构建用户标签和内容标签，在线部分进行标签匹配和推荐列表的推送，有利于减小服务器的在线计算量，提升计算效率，加快推荐响应速度。本申请实施例适用于运算量节约的应用环境，通过离线和在线部分的拆分，节约算力，加快用户推荐响应速度。本申请实施例还适用于提高用户响应的应用环境，通过离线和在线部分的拆分，节约算力，提高用户推荐响应速度，在一次推荐的流程中在线部分可以只提供用户和待推荐内容的匹配，运算量极低，响应速度极快。

在步骤101中，服务器在确定用户上线观看音视频的情况下，可以从离线的数据库中获取针对该用户离线构建的用户标签。其中，离线的数据库中可以存储有大量用户的用户标签，上述大量用户可以包括曾经在线观看过音视频的用户，从而使得当某个用户上线后，服务器可以从离线的数据库中获取该用户的用户标签。离线的数据库可以为服务器中的数据库也可以为服务器之外的数据库。也就是说，用户标签可以离线构建，并存储在服务器中预设的数据库中，或者存储在服务器之外的预设的数据库中。用户标签可以用于表征用户的不同维度的特征数据，比如，用户的身份特征、观看记录特征、观看喜好特征等。由于服务器可以直接获取离线的数据库中针对该用户离线构建好的用户标签，而无需在线获取用户数据，基于在线获取的用户特征再在线构建用户标签，因此服务器可以快速得到该用户的用户标签。

在步骤102中，服务器可以根据用户标签和离线的数据库中存储的针对各待推荐内容离线构建的内容标签，进行标签匹配，并根据匹配结果在线生成对该用户的推荐列表。其中，服务器中可以存储大量待推荐内容的内容标签，待推荐内容可以包括视频、音频等可供用户观看或收听的对象。内容标签可以用于表征内容在不同维度的特征数据，内容标签可以为服务器根据待推荐内容的特征数据离线构建得到的，内容特征可以包括但不限于以下之一或其任意组合：内容的导演、内容中的演员，内容的类型、内容的评分、内容的收看群体、内容的收看时间段。

在一个实施方式中，标签匹配可以实现为：服务器通过逻辑回归(logistic regression，LR)技术对用户的用户标签和离线的数据库中存储的各待推荐内容的内容标签进行回归分类，获取用户对各待推荐内容的满意度值，并根据用户对各待推荐内容的满意度值的高低，生成对用户的推荐列表。比如，对各待推荐内容按照用户的满意度值进行从高到低的排序，将排序为前N个的待推荐内容作为对用户的推荐列表。其中，N的取值可以根据实际需要进行设置，比如可以为6、7、8等，然而，本申请实施例对此不做具体限定。

在步骤103中，服务器可以向用户对应的终端推送推荐列表。其中，用户对应的终端可以为用户在线所依附的终端，该终端可以为手机、电视机、平板电脑等。比如，用户在打开电视机联网观看后，服务器可以将针对该用户生成的推荐列表，发送至该用户所观看的电视机，从而使得该用户可以观看到服务器推荐的内容。

在一个实施方式中，步骤101中提到的用户标签通过以下方式离线构建得到：对用户的身份数据和用户的观看记录数据进行离线特征工程构造，以得到用户标签；其中，离线特征工程构造至少包括以下之一或其任意组合：离线特征细分、离线特征挖掘、离线特征组合。通过离线特征细分、离线特征挖掘、离线特征组合等，有利于得到精准微观且全面的用户标签，从而有利于提高在线匹配的精准度，进而提高推荐的精准度。

其中，用户的身份数据可以包括但不限于以下之一或其任意组合：用户的地理位置，用户的观看设备，用户的注册身份信息等。用户的观看记录数据可以包括但不限于以下之一或其任意组合：用户的搜索记录，用户的点击记录，用户的订阅记录等用户的行为记录数据。

在一个实施方式中，对用户的身份数据和用户的观看记录数据进行离线特征工程构造，以得到用户标签，可以包括：采用XGBOOST算法对用户的身份数据和用户的观看记录数据进行离线特征工程构造，以得到精准细化微观的用户标签。众多用户的用户标签的集合可以形成用户特征模型，即本实施方式中，可以从用户的身份数据和用户的观看记录数据中抽象出用户标签，由众多的用户标签的组合构建成用户特征模型。

在一个实施方式中，在对用户的身份数据和用户的观看记录数据进行离线特征工程构造之前，该推荐方法还可以包括：对用户的身份数据和用户的观看记录数据进行离线预处理，该离线预处理可以包括：1)对于用户的观看记录数据以及用户的身份数据进行整合，使得用户的观看记录数据与用户的身份数据匹配上，获得一个包含用户的观看记录数据以及用户的身份数据的整合数据，该整合数据可以供给算法系统进行训练。2)对于用户的观看记录数据以及用户的身份数据进行分类清洗(筛选)，使其成为可以被提供用于后续处理的数据格式，避免数据出现错漏，空缺，错误等情况，避免使得后续的机器学习算法学习过程被污染，或者运算数据被污染，导致模型训练出错，模型训练结果出错，无法执行推荐任务，执行推荐任务结果出错等情况。

在一个实施方式中，步骤102中提到的内容标签通过以下方式离线构建得到：对待推荐内容的内容数据和待推荐内容被观看的观看记录数据进行离线特征工程构造，以得到内容标签；其中，离线特征工程构造至少包括以下之一或其任意组合：离线特征细分、离线特征挖掘、离线特征组合。通过离线特征细分、离线特征挖掘、离线特征组合等，有利于得到精准微观且全面的内容标签，从而有利于提高在线匹配的精准度，进而提高推荐的精准度。

其中，待推荐内容的内容数据包括但不限于以下之一或其任意组合：待推荐内容的导演、待推荐内容中的演员，待推荐内容的类型、待推荐内容的评分。待推荐内容被观看的观看记录数据包括但不限于以下之一或其任意组合：待推荐内容被观看的观看群体(比如，儿童群体、上班族群体、老年人群体等)、被观看的时间段、被观看的地点等等。

在一个实施方式中，对待推荐内容的内容数据和待推荐内容被观看的观看记录数据进行离线特征工程构造，该推荐方法还可以包括：采用XGBOOST算法对待推荐内容的内容数据和待推荐内容被观看的观看记录数据进行离线特征工程构造，以得到精准细化微观的内容标签。众多待推荐内容的内容标签的集合可以形成内容特征模型，即本实施例中可以从待推荐内容的内容数据和待推荐内容被观看的观看记录数据中抽象出内容标签，众多的内容标签的组合构建成内容特征模型。

在一个实施方式中，在对待推荐内容的内容数据和待推荐内容被观看的观看记录数据进行离线特征工程构造之前，该推荐方法还可以包括：对待推荐内容的内容数据和待推荐内容被观看的观看记录数据进行分类清洗，使其可以成为被提供用于后续处理的数据格式，避免数据出现错漏，空缺，错误等情况，避免后续机器学习算法学习过程被污染，或者运算数据被污染，导致模型训练出错，模型训练结果出错，无法执行推荐任务，执行推荐任务结果出错等情况。

在一个实施方式中，在确定用户上线的情况下，服务器还可以在线获取用户的用户数据和用户在线观看的内容的内容数据。此外，在上述步骤103向用户对应的终端发送推荐列表之后，该推荐方法还包括：根据在线获取的用户数据，对用户标签进行离线更新；根据用户在线观看的内容的内容数据，对内容标签进行离线更新。可以理解的是，用户数据可能并不是一成不变的，因此本实施方式中根据在线获取的用户数据，对用户标签进行离线更新，有利于在得到最符合用户当前特征的最新的用户标签的同时，通过离线更新节约算力。类似的，内容的内容数据中也存在可能会变化的数据，比如内容的评分可能会随时间变化，因此，本实施方式中根据在线获取的内容数据，对内容标签进行离线更新，有利于在得到最符合当前内容特征的最新的内容标签的同时，通过离线更新节约算力。

上述的离线构建或离线更新可以理解为：在用户和服务器之间没有强连接的情况下进行的构建或更新，也可以理解为：服务器在不联网的情况下进行的构建或更新，还可以理解为：服务器在得到相关数据后，进行的非即时响应(即无需即时响应用户操作)的持续性工作。其中，在离线构建或更新用户标签的情况下，服务器得到的相关数据包括用户的身份数据和用户的观看记录数据；在离线构建或更新内容标签的情况下，服务器得到的相关数据包括内容的内容数据和内容被观看的观看记录数据。

下面以服务器离线构建或离线更新用户标签为例进行说明：

比如，用户今天在线看电视的过程中，服务器在线获取了用户的身份数据和用户的观看数据，然后，服务器可以根据在线获取的身份数据和观看记录数据，离线构建或更新用户标签。服务器进行的非即时响应的持续性工作，可以为：服务器在用户关了电视之后，依然持续根据用户的身份数据和观看记录数据离线构建或更新用户标签。可以理解的是，用户标签的离线构建是在服务器之前并未对该用户进行过用户标签构建的情况下进行的，即离线的数据库中还不存在该用户的用户标签；用户标签的离线更新，是在服务器之前对该用户进行过用户标签构建的情况下进行的，即离线的数据库中已经存在该用户的用户标签。

假设，用户看电视的时间段为晚上8点到10点之间，则服务器在8点到10点之间获取了用户的身份数据和观看数据后，可以在后面的任意一个时间点开始进行用户标签的离线构建或离线更新。离线构建或离线更新的持续时间可以持续到用户下次打开电视机的时间点，由于，用户通常在两次打开电视之间会间隔较长时间，比如1天，因此，服务器有较长的时间进行离线构建或离线更新。由于在线构建标签或更新标签，通常对时间的要求较高，比如需要在1秒之内构建或更新成功，所以需要的服务器的成本较高，而本发明实施例中，服务器可以有较长的时间进行离线构建或离线更新，因此可以采用成本较低的服务器完成，即本发明实施例中的离线构建或离线更新还可以达到降低成本的效果。

在一个实施方式中，每次新内容和新用户的产生均可以触发用户标签的更新和内容标签的更新，从而有利于实现实时训练用户特征模型和内容特征模型。

在一个实施方式中，服务器可以在确定用户上线后，就开始在线获取用户的用户数据和用户在线观看的内容的内容数据。在另一个实施方式中，服务器可以在给用户推送推荐列表之后再开始在线获取用户的用户数据和用户在线观看的内容的内容数据，有利于给在线推送推荐列表提供足够的计算空间，从而进一步提高推荐效率。

在一个实施方式中，步骤103中的终端处于目标场景下，目标场景对推荐的实时性要求低于预设要求，预设要求可以根据实际需要进行设置，即目标场景下用户对推荐的实时性要求较低，比如，目标场景可以为对推荐的实时性要求低于互联网场景的场景。可以理解的是互联网场景的短视频应用对于推荐实时性的要求通常较高。通过在目标场景下执行本申请实施方式中的推荐方法，有利于在目标场景下提高推荐效率的同时，不影响用户在目标场景下对实时性的要求。

在一个实施方式中，目标场景为终端进入EPG页面后的场景，终端可以为交互式网络电视(Internet Protocol TV，IPTV)，IPTV所提供的各种业务的索引及导航都是通过EPG系统来完成的。因此，目标场景可以理解为具有IPTV的场景，比如客厅场景。本实施方式中考虑到，在客厅场景中，对于推荐更新速度的要求较低，也可以理解为对于推荐的实时性要求较低，而对于推荐响应速度的要求较高。因此，对于客厅场景下的推荐，通过离线和在线部分的拆分，有利于节约算力，在不影响对于推荐更新速度的要求的情况下，加快推荐响应速度。比如，用户周一在客厅打开IPTV，对用户进行推荐时所利用的用户标签为离线的数据库中存储的该用户的用户标签，用户周二在客厅打开IPTV，对用户进行推荐时所利用的用户标签为离线的数据库中存储的利用周一在线获取的该用户的用户数据离线更新过的用户标签。也就是说，每次用户在线时，可以无需针对用户进行耗时较长的在线构建用户标签的流程，而是直接获取离线的数据库中存储的已经构建好或更新过的用户标签，极大的提高了在线推荐的效率。

图2示出了根据本发明实施例的实现上述推荐方法的系统的架构图。如图2所示，所述系统包括：数据层，数据预处理层，应用层和主控层。上述几个层级可以布设于CDN主网络的整体网络中，对于CDN的所有用户数据具有获取权限，对于CDN中所有内容数据具有获取权限。除数据层外，其他层级可以均运行在CDN主服务器中，数据层可以运行在CDN各分组服务器。以下将对这四个层级的功能架构进行展开说明：

数据层主要负责获取各类数据，包括但不限于用户数据和内容数据。该层可以作为一个实体网元(包括但不限于实体服务器，DOCKER容器等)存在于CDN系统中。数据层中包括：用户的身份数据获取模块、用户的观看记录数据获取模块、内容数据获取模块。

用户的身份数据获取模块，用于获取包括但不限于用户的地理位置，用户的观看设备，用户的注册身份信息等用户的身份信息，以此为核心构建用户身份标签。

用户的观看记录数据获取模块，用于获取包括但不限于用户的搜索记录，用户的点击记录，用户的订阅记录等用户的行为记录，以此来为核心构建用户的观看喜好标签。上述实施例中提到的用户标签可以包括用户身份标签和用户的观看喜好标签。

内容数据获取模块，用于获取包括但不限于内容的提供商，内容的导演，内容的演员，内容的分类，内容的评分等内容相关信息，以此为核心构建内容标签。

数据预处理层主要负责对于数据层获取的各类数据进行分类清洗，使其成为可以被提供用于应用层处理的数据格式，避免数据出现错漏，空缺，错误等情况，避免使得应用层的机器学习算法学习过程被污染，或者运算数据被污染，导致模型训练出错，模型训练结果出错，无法执行推荐任务，执行推荐任务结果出错等情况。该层作为一个实体网元(包括但不限于实体服务器，DOCKER容器等)存在于CDN系统中。数据预处理层中包括：用户数据预处理模块、内容数据预处理模块。

用户数据预处理模块，主要包括两个功能。1)对于用户的身份数据以及用户的观看记录数据进行整合，使得用户的观看记录数据与身份数据匹配上，获得一个包含用户的身份数据以及观看记录数据的整合数据供给算法系统进行训练。2)对于用户的观看记录以及身份数据进行分类清洗，使其成为可以被提供用于应用层处理的数据格式，避免数据出现错漏、空缺、错误等情况，避免使得应用层的机器学习算法学习过程被污染，或者运算数据被污染，导致模型训练出错，模型训练结果出错，无法执行推荐任务，执行推荐任务结果出错等情况。

内容数据预处理模块，主要用于对内容数据获取模块获取的内容数据进行分类清洗，使其成为可以被提供用于应用层处理的数据格式，避免数据出现错漏、空缺、错误等情况，避免使得应用层的机器学习算法学习过程被污染，或者运算数据被污染，导致模型训练出错，模型训练结果出错，无法执行推荐任务，执行推荐任务结果出错等情况。

应用层，主要包括：标签构建模块，用于标签构建；推荐内容生成模块，用于标签匹配以及推荐结果的生成。

在一个实施方式中，应用层的分层可以如图3所示，包括：原始数据层、挖掘特征组合层、预测评分层、输出层。图3中，LR标签匹配之前的流程为离线流程，LR标签匹配以及其之后的流程为在线流程。下面对图3中的各个层级进行说明：

原始数据层，主要从用户数据预处理模块和内容数据预处理模块中获取相关的数据并进行特征工程构造，从而得到用户标签和内容标签。其中，原始数据层主要包含三类主要数据：用户的身份数据(记为USER MAP)用户的观看记录数据(记为LINK MAP)以及待推荐内容的内容数据ITEM MAP。其中，USER MAP主要由用户数据预处理模块中的身份数据获取而来，包括但不限于用户的地理位置，用户的观看设备，用户的注册身份信息等用户的身份信息，以此为核心初步构建完成用户身份标签。LINK MAP主要由用户数据预处理模块中的观看记录数据获取而来，包括但不限于用户的搜索记录，用户的点击记录，用户的订阅记录等用户的行为记录，以此来为核心构建用户的观看喜好标签，使得用户的观看喜好标签能够与用户身份标签产生关联。ITEM MAP主要由内容数据预处理模块中的内容数据获取而来，包括但不限于内容的提供商，内容的导演，内容的演员，内容的分类，内容的评分等内容相关信息，以此为核心初步构建完成内容标签。

挖掘特征组合层：该层主要利用USER MAP，LINK MAP和ITEM MAP通过XGBOOST算法进行离线特征工程构造，比如进行特征细分，特征挖掘，以及自动特征组合，构建完成精准细化微观新用户标签和内容标签。对于单一用户的身份数据USER MAP以及观看记录数据LINK MAP进行自动信息挖掘和特征组合，构建用户的精准微观的用户标签。通过对待推荐内容的内容数据以及待推荐内容被观看的观看记录数据的XGBOOST特征细分，特征挖掘，以及自动特征组合，构建精准微观的内容标签。

预测评分层，用于当有目标用户在线观看时，获取离线的数据库中针对该目标用户构建的用户标签，通过LR技术对于目标用户的精准微观的用户标签以及数据库中各待推荐内容的精准微观的内容标签进行回归分类(即标签匹配)，预测目标用户对各待推荐内容的满意度值，并通过用户对各待推荐内容的满意度值排序，得到针对该目标用户的推荐列表。

输出层，用于将该推荐列表推送给用户使用的客户端。

主控层：主控层主要包括主控模块，用于对于推荐算法的运行控制，对于某些热点内容的全量下发，对于某些用户的黑白名单等，通过主控层进行统一调控。该层作为一个实体网元(包括但不限于实体服务器，DOCKER容器等)存在于CDN系统中。

在一个实施例中，上述的应用层所执行的流程主要分为在线和离线两个流程，该层作为一个实体网元(包括但不限于实体服务器，DOCKER容器等)存在于CDN系统中。其流程图如4所示，下面对该流程的实例进行简单说明：

当服务器检测到用户在线的情况下，在线流程中执行：基于用户生成推荐列表；将该推荐列表推送给用户。具体的，服务器从离线的数据库中获取针对该用户离线构建的用户标签；根据用户标签和离线的数据库中存储的各待推荐内容的内容标签，进行标签匹配，并根据匹配结果在线生成对该用户的推荐列表，将该推荐列表出推送给用户。

当服务器检测到用户在线的情况下，在线流程中还会执行：获取用户的身份数据、用户在线观看的观看记录数据、用户在线观看的内容的内容数据；

离线流程中执行：将数据导入离线的数据库；更新用户标签；更新内容标签。其中，导入离线的数据库中的数据包括在线流程中获取的用户的身份数据、用户在线观看的观看记录数据、用户在线观看的内容的内容数据；根据导入离线的数据库中用户的身份数据、用户在线观看的观看记录数据，可以进行用户标签的更新，根据用户在线观看的内容的内容数据，可以进行内容标签的更新。

本实施例中，采用离线+在线模式构建推荐算法系统，通过构建用户标签、内容标签，在线生成推荐列表，达到运算速率和计算资源的平衡。通过将构建用户标签、内容标签的机器学习布置到离线部分，降低在线算力压力，提高推荐列表生成速率，提升用户体验。通过将推荐列表生成布置到在线部分，实时更新推荐内容，确保推荐内容刷新速度，提升用户体验。系统运行过程中机器学习持续自我迭代，特征抽取能力持续自我加强，从而可以提高推荐成功率。

需要说明的是，本申请实施例中的上述各示例均为为方便理解进行的举例说明，并不对本发明的技术方案构成限定。

上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包括相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。

本申请的一个实施例提供了一种推荐装置，如图5所示，包括：离线用户标签获取模块501，配置为在确定用户上线的情况下，从离线的数据库中获取针对用户离线构建的用户标签；在线匹配模块502，配置为根据用户标签和离线的数据库中存储的针对各待推荐内容离线构建的内容标签，进行标签匹配，并根据匹配结果在线生成对用户的推荐列表；在线推送模块503，配置为向用户对应的终端推送推荐列表。

值得一提的是，本实施例所涉及到的各模块均为逻辑模块，在实际应用中，一个逻辑单元可以是一个物理单元，也可以是一个物理单元的一部分，还可以以多个物理单元的组合实现。此外，为了突出本发明的创新部分，本实施例中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入，但这并不表明本实施例中不存在其它的单元。

不难发现，本实施例为与上述方法实施例相对应的装置实施例，本实施例可与上述方法实施例互相配合实施。上述方法实施例中提到的相关技术细节和技术效果在本实施例中依然有效，为了减少重复，这里不再赘述。相应地，本实施例中提到的相关技术细节也可应用在上述方法实施例中。

本申请的一个实施例提供了一种服务器，如图6所示，包括：至少一个处理器601；以及，与至少一个处理器601通信连接的存储器602；其中，存储器602存储有可被至少一个处理器601执行的指令，指令被至少一个处理器601执行，以使至少一个处理器601能够执行上述推荐方法。

其中，存储器602和处理器601采用总线方式连接，总线可以包括任意数量的互联的总线和桥，总线将一个或多个处理器601和存储器602的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件，也可以是多个元件，比如多个接收器和发送器，提供用于在传输介质上与各种其他装置通信的单元。经处理器601处理的数据通过天线在无线介质上进行传输，进一步，天线还接收数据并将数据传送给处理器601。

处理器601负责管理总线和通常的处理，还可以提供各种功能，包括定时，外围接口，电压调节、电源管理以及其他控制功能。而存储器602可以被用于存储处理器601在执行操作时所使用的数据。

本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。

即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解，上述各实施方式是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。

Claims

一种推荐方法，包括：

在确定用户上线的情况下，从离线的数据库中获取针对所述用户离线构建的用户标签；

根据所述用户标签和所述离线的数据库中存储的针对各待推荐内容离线构建的内容标签，进行标签匹配，并根据匹配结果在线生成对所述用户的推荐列表；以及

向所述用户对应的终端推送所述推荐列表。
根据权利要求1所述的推荐方法，其中，

在确定用户上线的情况下，所述方法还包括：

在线获取所述用户的用户数据和所述用户在线观看的内容的内容数据；并且

在所述向所述用户对应的终端发送所述推荐列表之后，所述方法还包括：

根据在线获取的所述用户数据，对所述用户标签进行离线更新；以及

根据所述用户在线观看的内容的内容数据，对所述内容标签进行离线更新。
根据权利要求1所述的推荐方法，其中，所述用户标签通过以下方式离线构建得到：

对所述用户的身份数据和所述用户的观看记录数据进行离线特征工程构造，以得到所述用户标签；

其中，所述离线特征工程构造至少包括以下之一或其任意组合：离线特征细分、离线特征挖掘、离线特征组合。
根据权利要求1所述的推荐方法，其中，所述内容标签通过以下方式离线构建得到：

对所述待推荐内容的内容数据和所述待推荐内容被观看的观看记录数据进行离线特征工程构造，以得到所述内容标签；其中，所述离线特征工程构造至少包括以下之一或其任意组合：离线特征细分、离线特征挖掘、离线特征组合。
根据权利要求2所述的推荐方法，其中，在线获取的所述用户数据包括所述用户的身份数据和所述用户在线观看的观看记录数据。
根据权利要求2所述的推荐方法，其中，所述用户在线观看的内容的内容数据包括以下任意组合：

所述内容的导演、所述内容中的演员，所述内容的类型、所述内容的评分、所述内容的收看群体、所述内容的收看时间段。
根据权利要求1至6任一项所述的推荐方法，其中，所述终端处于目标场景下，所述目标场景对推荐的实时性要求低于预设要求。
根据权利要求7所述的推荐方法，其中，所述目标场景为所述终端进入电子节目指南EPG页面后的场景。
一种推荐装置，包括：

离线用户标签获取模块，配置为在确定用户上线的情况下，从离线的数据库中获取针对所述用户离线构建的用户标签；

在线匹配模块，配置为根据所述用户标签和所述离线的数据库中存储的针对各待推荐内容离线构建的内容标签，进行标签匹配，并根据匹配结果在线生成对所述用户的推荐列表；以及

在线推送模块，配置为向所述用户对应的终端推送所述推荐列表。
一种服务器，包括：至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行；以使所述至少一个处理器能够执行如权利要求1至8中任一所述的推荐方法。
一种计算机可读存储介质，存储有计算机程序，其中，所述计算机程序被处理器执行时实现权利要求1至8中任一所述的推荐方法。