CN111597446A

CN111597446A - 基于人工智能的内容推送方法、装置、服务器和存储介质

Info

Publication number: CN111597446A
Application number: CN202010406235.6A
Authority: CN
Inventors: 张晗
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-05-13
Filing date: 2020-05-13
Publication date: 2020-08-28
Anticipated expiration: 2040-05-13
Also published as: CN111597446B

Abstract

本发明实施例公开了一种基于人工智能的内容推送方法、装置、服务器和存储介质，其中，方法包括，获取关于待分析多媒体文件的第一特征集合，获取目标用户账号的历史行为数据，根据历史行为数据确定第二特征集合，将第一特征集合和第二特征集合作为评估模型的输入得到待分析多媒体文件的分析结果；根据分析结果和待推荐文件集合，向目标用户账号输出多媒体文件。通过加入机器学习模型对待推荐内容的特征以及用户的行为特征进行分析后，基于分析结果对内容推荐，使得服务器推荐的内容与用户兴趣更为匹配，提升推荐内容服务的智能性。

Description

基于人工智能的内容推送方法、装置、服务器和存储介质

技术领域

本发明涉及计算机应用技术领域，尤其涉及一种基于人工智能的内容推送方法、装置、服务器和存储介质。

背景技术

随着互联网技术的发展，用户可以通过浏览应用程序(如资讯程序、社交程序、公众号等)即时获取到网络中的内容(文章、视频、图片等)，通常情况下，应用程序的后台服务器会通过用户的历史浏览记录确定用户的兴趣，并基于用户的兴趣在应用程序中输出推荐内容，用户也会首先基于应用程序中的推荐内容进行浏览。

当前，应用程序的后台服务器在基于用户的兴趣输出推荐内容的过程中，往往是基于用户的长期兴趣来确定相应的推荐内容，如获取到用户历史浏览的所有内容，并基于上述内容确定用户的兴趣，进而推荐相应的内容，比如，基于历史浏览的所有内容，发现用户观看了某个电影的相关文章、音视频等文件的数量最多，因此持续推荐该电影的其他多媒体文件，但实际上该电影可能是用户一时兴起在短时间内持续搜索观看而致使对其观看数量最多，仅仅基于数量进行多媒体内容推荐，时常存在推荐内容与用户当前匹配度低的问题。

发明内容

本发明实施例提供了一种基于人工智能的内容推送方法、装置、服务器和存储介质，可较好地为用户匹配推荐内容。

一方面，本发明实施例提供了一种基于人工智能的内容推送方法，所述方法包括：

获取关于待分析多媒体文件的第一特征集合，所述第一特征集合包括：本次待推荐给目标用户账号的待推荐文件集合中待分析多媒体文件的文件特征、所述目标用户账号对应的用户特征；

获取所述目标用户账号的历史行为数据，所述历史行为数据包括：所述目标用户账号的已推荐集合中各多媒体文件的浏览信息，所述已推荐集合中包括：N个多媒体文件，每个多媒体文件被设置了M个分类级别，N为大于或等于2的整数，M为正整数；

根据所述历史行为数据确定第二特征集合，所述第二特征集合用于表示所述目标用户账号对于所述待分析多媒体文件所在分类级别的浏览特征；

将所述第一特征集合和所述第二特征集合作为评估模型的输入得到所述待分析多媒体文件的分析结果；

根据所述分析结果和待推荐文件集合，向所述目标用户账号输出多媒体文件。

另一方面，本发明实施例提供了一种基于人工智能的内容推送装置，所述装置包括：

获取模块，用于获取关于待分析多媒体文件的第一特征集合，所述第一特征集合包括：本次待推荐给目标用户账号的待推荐文件集合中待分析多媒体文件的文件特征、所述目标用户账号对应的用户特征；

所述获取模块，还用于获取所述目标用户账号的历史行为数据，所述历史行为数据包括：所述目标用户账号的已推荐集合中各多媒体文件的浏览信息，所述已推荐集合中包括：N个多媒体文件，每个多媒体文件被设置了M个分类级别，N为大于或等于2的整数，M为正整数；

确定模块，用于根据所述历史行为数据确定第二特征集合，所述第二特征集合用于表示所述目标用户账号对于所述待分析多媒体文件所在分类级别的浏览特征；

输入模块，用于将所述第一特征集合和所述第二特征集合作为评估模型的输入得到所述待分析多媒体文件的分析结果；

输出模块，用于根据所述分析结果和待推荐文件集合，向所述目标用户账号输出多媒体文件。

又一方面，本发明实施例提供了一种服务器，包括处理器和存储装置，所述存储装置用于存储计算机程序，所述计算机程序包括程序指令，所述处理器用于调用所述程序指令，执行所述基于人工智能的内容推送方法。

再一方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时，所述基于人工智能的内容推送方法将被实现。

本发明实施例中，从包括用户特征和多媒体文件特征的第一特征集合，以及基于历史数据的第二特征集合出发，结合训练好的评估模型，确定出用户对于某个多媒体文件的匹配分析结果，进行多个多媒体文件的推荐，可以使得服务器推荐的内容与用户兴趣更为匹配，提升推荐内容服务的智能性。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种基于人工智能的内容推送结构示意图；

图2是本发明实施例的提供的一种兴趣特征刻画流程示意图；

图3是本发明实施例的提供的一种基于人工智能的内容推送架构示意图；

图4是本发明实施例的提供的一种用户特征示意图；

图5是本发明实施例提供的一种基于人工智能的内容推送方法的流程示意图；

图6是本发明实施例提供的一种单特征数据的示意图；

图7a是本发明实施例提供的一种特征数据集合的示意图；

图7b是本发明实施例提供的另一种特征数据集合的示意图；

图7c是本发明实施例提供的又一种特征数据集合的示意图；

图7d是本发明实施例提供的又一种特征数据集合的示意图；

图7e是本发明实施例提供的又一种特征数据集合的示意图；

图8是本发明实施例提供的一种评估模型训练方法的流程示意图；

图9是本发明实施例提供的一种评估模型训练的架构示意图；

图10是本发明实施例提供的一种显示界面示意图；

图11是本发明实施例提供的一种视频推荐流程示意图；

图12是本发明实施例提供的一种点击率计算流程示意图；

图13是本发明实施例提供的一种基于人工智能的内容推送装置的结构示意图；

图14是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

当前的应用程序中，通常会基于用户的兴趣选取出推荐内容，并向用户进行推荐，该内容推荐过程可以帮助用户更快速的从应用程序中获取到感兴趣的内容，一方面可以满足用户多媒体文件的观看需求，另一方面也能够使得应用程序获得更高的点击量、点击率、日活量等。

基于此，本发明实施例提供了一种基于人工智能的内容推送方案，其中，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。在本发明实施例提出的基于人工智能的内容推送方案中，通过应用服务器等智能设备，获取待推荐文件集合中文件的特征和刻画用户长期兴趣的用户特征，以及从用户历史行为数据中提取出刻画用户短期兴趣的行为特征，基于上述文件的特征、用户特征、行为特征以及评估模型，对待推荐文件集合中的文件进行筛选排序后推荐，在一个实施例中，如图1所示，服务器可以是各类提供多媒体观看服务的应用服务器，用户终端则可以为个人电脑、智能手机、平板电脑等带网络功能的智能终端，而评估模型为预先训练好的一个神经网络模型。

在一个实施例中，如图2所示，可以从用户的历史行为数据中提取出描述用于实时兴趣变化的行为特征，行为特征的捕捉方式可以包括引入时间段信息，统计用户在某些时间段内对于多媒体文件的点击、展示情况，或者统计不同时间段的用户行为，以刻画用户的兴趣变化，以此更全面地为用户推荐多媒体文件。

在本发明实施例所涉及的方案中，主要分为在线部分和离线部分，其中，离线部分方案包括抽取用户的历史行为数据和历史已推荐的多媒体文件数据对初始评估模型进行训练，得到评估模型，在线部分方案包括抽取多媒体文件的文件特征、用户特征以及用户的短期行为特征，以及调用训练后的评估模型对上述抽取的特征进行计算，得到针对待推荐文件集合中各个多媒体文件的筛选排序结果，其中，多媒体文件具体可以为文章、视频、音乐等。

如图3所示，为本方案中在线部分与离线部分的架构示意图，其中，在线部分具体包括资源适配、特征抽取以及打分排序过程，资源适配过程即获取待推荐文件集合的过程，具体为找到与用户画像以及用户行为适配的多媒体文件资源，其中，用户画像用于体现用户的兴趣，用户历史行为具体为用户在各个时间段内对于不同分类多媒体文件点击行为和展示行为。特征抽取具体分为特征设计过程，特征索引计算过程和特征编码过程，该特征设计过程具体用于从用户的历史行为数据中抽取出描绘用户短期兴趣的特征，以及抽取出用户特征和多媒体文件中包含的文件特征，该用户特征用户刻画用户的长期兴趣，特征索引计算和特征编码计算过程用于转化抽取得到的特征的格式，使得抽取的特征能被评估模型所识别，以及防止特征间的冲突，打分排序过程具体为调用训练后的评估模型对上述抽取的特征进行计算，得到针对待推荐文件集合各个多媒体文件的筛选排序结果。

评估模型可以为逻辑回归(Logistic Regression，LR)模型，则打分排序过程可以包括前馈计算过程。离线部分主要包括模型训练过程，模型训练过程主要包括日志合并，特征抽取以及模型优化3个部分，其中，日志合并主要是根据点击日志、展示日志将一次请求的信息聚合在一起，其中，点击日志记录了用户一次请求操作对应的点击信息，展示日志记录了用户一次操作对应的展示信息，即获取样本数据的过程，特征抽取即抽取历史推荐给用户的多媒体文件的特征、用户特征以及用户历史短期兴趣特征，模型优化即将上述特征输入至模型中，检测模型输出的预测结果是否与真实结果相匹配，并基于检测结果不断调整模型中各参数的权重，实现对模型的优化，直至模型输出结果与真实结果的误差小于预设阈值。需要说明的是，本发明实施例中所提及的描绘用户短期兴趣的特征可以是指最近一次的多媒体刷新操作后确定的兴趣特征、最近数小时对推荐的多媒体文件的兴趣特征、最近一天或数天对推荐的多媒体文件的兴趣特征、最近一月或数月对推荐的多媒体文件的兴趣特征等，所谓的短为相对而言，本申请对此并不限定。

基于上述架构的描述，本发明以向目标用户账户的输出多媒体文件的方式对上述架构的流程进行说明，具体包括：首先，资源适配过程，该过程可以为，获取用户历史行为数据以及待推荐文件集合。其次，特征抽取过程，该过程可以为确定关于待分析多媒体文件的第一特征集合，以及确定目标用户账号的第二特征集合。其中，第一特征集合包括待分析多媒体文件的文件特征和目标用户账号对应的用户特征，文件特征包括多媒体文件对应的一级分类、二级分类、标签等，用户特征可以包括用户访问特征、用户身份特征以及用户环境特征中的任意一种或多种。

如图4所示，用户访问特征可以包括用户浏览的文件的特征，包括分类、话题、标签等，用户身份特征包括画像、人口学、深度兴趣等，用户环境特征包括网络、时间、地域等，上述特征具体可以从用户的历史行为数据中得到。第二特征集合具体用于表示目标用户账号短期内对于历史推荐的多媒体文件的浏览特征，针对上述第二特征集合，本方案提供了如下具体抽取方式，以目标用户账号每一次多媒体文件刷新操作为特征提取的单位，具体提取了目标用户账号在预设一刷下对于历史推荐的多媒体文件的浏览特征，以及，目标用户账号在不同预设时间段内的多刷下对于历史推荐的多媒体文件的浏览特征，对于历史推荐的多媒体文件的浏览特征具体可以为历史推荐的各个多媒体文件对应的分类级别的单特征数据，其中单特征数据可以包括对于各个已推荐的多媒体文件对应的分类级别的点击量、点击率和展示量，进一步的，服务器从上述单特征数据中找到待分析多媒体文件所在分类级别的目标单特征数据，以及基于待分析多媒体文件所在分类级别和目标单特征数据进行交叉，得到待分析多媒体文件对应的交叉特征数据，以及基于上述单特征数据得到待分析多媒体文件对应的分类特征数据，服务器将待分析多媒体文件对应的目标单特征数据、目标交叉特征数据和分类特征数据作为第二特征集合，并对上述第一特征集合和第二特征集合中的数据进行特征索引计算以及特征编码计算，使得特征能被评估模型所识别，以及防止特征间的冲突。

第三，打分排序过程，该过程可以为，将第一特征集合和第二特征集合作为评估模型的输入得到待分析多媒体文件的分析结果。评估模型具体为基于上述离线架构训练的评估模型，分析结果用于指示待分析多媒体文件在待推荐文件集合中的排序位置。最后在根据分析结果和待推荐文件集合，向目标用户账号输出多媒体文件。

上述基于人工智能的内容推送方案中，在基于用户兴趣进行内容推荐的过程中，不仅使用了包括待推荐文件集合中文件的特征以及用户的用户特征的第一特征集合，还使用了用于体现用户短期兴趣的第二特征集合，本方案相较于当前基于用户长期兴趣进行内容推荐的方案至少具有如下优点：(1)设计了描绘用户短期兴趣的第二特征集合，使得提取的特征能够体现用户的实时兴趣变化，进而提升对用户兴趣捕捉的准确性。(2)对获取的特征格式转换处理，可以便于模型对特征的理解，防止了特征间的冲突。

基于上述描述，本发明实施例提供一种基于人工智能的内容推送方法，请参见图5，该基于人工智能的内容推送过程可包括以下步骤S501-S505：

S501、服务器获取关于待分析多媒体文件的第一特征集合。

本发明实施例中，服务器具体可以为应用程序的后台服务器，应用程序具体可以为资讯平台、社交网站、信息推送平台等，服务器可以向不同用户账号推送多媒体文件，多媒体文件可以为文章、音乐、视频等，具体实现中，服务器每次进行多媒体文件推送时，需要基于每个用户账号对应的兴趣确定针对每个用户账号的待推荐文件集合，并对待推荐文件集合中的多媒体文件进行筛选排序后向用户进行推荐。

以目标用户账号为例，服务器对待推荐文件集合中的多媒体文件进行筛选排序的过程具体为，特征提取，并基于提取的特征进行计算，得到筛选排序结果。具体的，特征提取的过程中服务器需要获取关于待分析多媒体文件的第一特征集合，该第一特征集合包括：本次待推荐给目标用户账号的待推荐文件集合中待分析多媒体文件的文件特征、目标用户账号对应的用户特征，其中，多媒体文件的文件特征可以对应文件的一级分类、二级分类和标签，例如，待分析多媒体文件为文章“点球大战”，其对应的一级分类为“体育”，二级分类为“足球”，标签为“世界杯”，则该待分析多媒体文件的文件特征中包括“体育、足球和世界杯”。目标用户账号对应的用户特征可以为表示目标用户账号的长期兴趣的特征，如图4所示，该目标用户账号的用户特征具体可以为，用户访问特征、用户身份特征以及用户环境特征中的任意一种或多种，其中，用户访问特征可以包括用户浏览的文件的特征，包括分类、话题、标签等，用户身份特征包括画像、人口学、深度兴趣等，用户环境特征包括网络、时间、地域等。

在一种实现方式中，上述针对目标用户账号的待推荐文件集合具体可以基于目标用户账号对应的用户特征搜索得到，服务器获取关于待分析多媒体文件的第一特征集合的具体方式可以为，服务器获取目标用户账号对应的用户特征，并根据用户特征搜索多媒体文件，服务器根据搜索到的多媒体文件确定待推荐文件集合，并分析待推荐文件集合中待分析多媒体文件的文件特征，服务器将待推荐文件集合中待分析多媒体文件的文件特征和目标用户账号对应的用户特征作为第一特征集合，而待分析多媒体文件为待推荐文件集合中的任一文件。

S502、服务器获取目标用户账号的历史行为数据。

本发明实施例中，服务器对待推荐文件集合中的多媒体文件进行筛选排序的特征抽取过程中还需要获取目标用户账号的历史行为数据，以进一步从历史行为数据中描述目标用户账号短期兴趣的特征。其中，历史行为数据包括：目标用户账号的已推荐集合中各多媒体文件的浏览信息，已推荐集合中包括：N个多媒体文件，每个多媒体文件被设置了M个分类级别，N为大于或等于2的整数，M为正整数。具体实现中，M可以为3，例如，多媒体文件被设置的3个分类级别可以为“体育、足球和世界杯”，分别对应多媒体文件的一级分类、二级分类和标签，浏览信息可以为点击量和展示量，其中，展示量可以为应用程序中展示了的多媒体文件的数量，点击量为用户点击了的多媒体文件的数量，则已推荐集合中各多媒体文件的浏览信息具体可以为对于各多媒体文件的点击量和展示量。

需要说明的是，已推荐集合中各多媒体文件的浏览信息具体可以分段为每一次多媒体文件刷新操作所刷新展示的多媒体文件的浏览信息，和/或，在预设时间周期内刷新显示的多媒体文件的浏览信息。具体实施场景中，服务器获取到的已推荐集合中各多媒体文件的浏览信息具体可以为上一刷浏览信息、半小时浏览信息、当天浏览信息、3天浏览信息和30天浏览信息，其中上一刷浏览信息为目标用户账号对于上一次多媒体文件刷新操作所刷新展示的多媒体文件的浏览信息，半小时浏览信息为目标用户账号对于近半小时内多媒体文件刷新操作所刷新展示的多媒体文件的浏览信息，当天浏览信息为目标用户账号对于近1天内多媒体文件刷新操作所刷新展示的多媒体文件的浏览信息，3天浏览信息为目标用户账号对于近3天内多媒体文件刷新操作所刷新展示的多媒体文件的浏览信息，30天浏览信息为目标用户账号对于近30天内多媒体文件刷新操作所刷新展示的多媒体文件的浏览信息。

S503、服务器根据历史行为数据确定第二特征集合。

本发明实施例中，第二特征集合用于表示目标用户账号对于待分析多媒体文件所在分类级别的浏览特征，具体的，待分析多媒体文件可以对应3个分类级别，分别对应待分析多媒体文件的一级分类、二级分类和标签，其中，一级分类下可以包括多个二级分类，二级分类下可以包括多个标签，如一级分类“体育”下可以包括“足球”和“篮球”这两个二级分类，二级分类“足球”下可以包括“世界杯”、“欧冠”等标签。服务器可以基于目标用户账号的已推荐集合中各多媒体文件的浏览信息得到第二特征集合。

该第二特征集合可以包括待分析多媒体文件所在分类级别的单特征数据，其中，单特征数据包括点击量特征数据、点击率特征数据和展示量特征数据中的任意一种或多种，则第二特征集合包括了待分析多媒体文件的一级分类的点击量、点击率和展示量，待分析多媒体文件的二级分类的点击量、点击率和展示量，待分析多媒体文件的标签的点击量、点击率和展示量。例如，待分析多媒体文件为文章“足球明星”，其对应的一级分类为“体育”，二级分类为“足球”，标签为“欧冠”，则该待分析多媒体文件的第二特征集合中包括“体育”的点击量、点击率和展示量，“足球”的点击量、点击率和展示量，“西甲”的点击量、点击率和展示量，其中一种单特征数据具体如表1所示。

表1：

具体的，服务器获取待分析多媒体文件所在分类级别的单特征数据的具体方式可以为，服务器基于目标用户账号的已推荐集合中各多媒体文件的浏览信息，获取到关于各多媒体文件的M个分类级别中每一个分类级别的浏览信息，并确定M个分类级别中每一个分类级别的单特征数据，服务器从M个分类级别中每一个分类级别的单特征数据中找到待分析多媒体文件所在分类级别的目标单特征数据，可选的，服务器可以将上述各多媒体文件的每一个分类级别的单特征数据以图表的形式进行存储，服务器从存储的图表中获取到待分析多媒体文件所在分类级别的目标单特征数据。其中，各多媒体文件的每一个分类级别的单特征数据包括每个一级分类的点击量、点击率和展示量，每个二级分类的点击量、点击率和展示量，以及每个标签的点击量、点击率和展示量，每一个分类级别的点击量具体由目标用户账号对该级别下的多媒体文件的点击量确定，每一个分类级别的点击率具体由目标用户账号对该级别下的多媒体文件的点击量与展示量的比值确定，每一个分类级别的展示量具体由目标用户账号对该级别下的多媒体文件的展示量确定。

例如，已推荐集合中包括多媒体文件：文章“点球大战”、文章“罚球技巧”和文章“一杆清台”，其中，“点球大战”被设置了“体育”的一级分类、“足球”的二级分类和“欧冠”的标签，“罚球技巧”被设置了“体育”的一级分类、“篮球”的二级分类和“奥运会”的标签，“一杆清台”被设置了“体育”的一级分类、“桌球”的二级分类和“世锦赛”的标签。用户点击过1次文章“点球大战”、1次文章“罚球技巧”和0次文章“一杆清台”，且用户一共进行了2次点击操作，上述文章都被展示于应用程序中，则可以确定一级分类“体育”的点击量为2，展示量为3，点击率为0.67，二级分类“足球”的点击量为1，点击率为1，展示量为1，二级分类“篮球”的点击量为1，点击率为1，展示量为1，二级分类“桌球”的点击量为0，点击率为0，展示量为1，以及标签“欧冠”的点击量为1，点击率为1，展示量为1，标签“奥运会”的点击量为1，点击率为1，展示量为1，标签“世锦赛”的点击量为0，点击率为0，展示量为1，服务器将上述数据以图表的形式进行存储，得到图6中所示的图表。进一步的，服务器可以基于已推荐集合中各多媒体文件的每一个分类级别的单特征数据，得到待分析多媒体文件所在分类级别对应的目标单特征数据，例如，当待分析多媒体文件为上述文章“足球明星”时，可以确定该待分析多媒体文件的第二特征集合中包括“体育”的点击量为2，点击率为0.67，展示量为3，“足球”的点击量为1，点击率为1，展示量为1，“西甲”的点击量为0、点击率为0，展示量为0。

进一步的，第二特征集合还可以包括待分析多媒体文件所在分类级别的目标交叉特征数据，具体实现中，服务器将待分析多媒体文件所在分类级别的目标单特征数据与待分析多媒体文件所在分类级别进行交叉，得到待分析多媒体文件的分类级别对应的目标交叉特征数据，即该目标交叉特征数据为待分析多媒体文件所在分类级别的目标单特征数据与待分析多媒体文件所在分类级别的交叉，例如，待分析多媒体文件所在的一级分类为“体育”，二级分类为“足球”，标签为“西甲”，则可以得到目标交叉特征数据如表2所示。

表2：

在一个实施例中，第二特征集合还可以包括待分析多媒体文件对应的分类特征数据，该分类特征数据的具体计算方式包括，服务器对目标单特征数据进行计算，得到待分析多媒体文件所在分类级别的第一统计特征数据；以及服务器获取第二统计特征数据，并将第一统计特征数据与第二统计特征数据进行交叉，得到待分析多媒体文件对应的分类特征数据；服务器将待分析多媒体文件对应的分类特征数据加入至第二特征集合中。其中，目标单特征数据具体为待分析多媒体文件所在的分类级别的点击量、点击率和展示量，第一统计特征数据具体可以为基于上述点击量、点击率和展示量计算得到的点击熵、展示熵和兴趣分，即第一统计特征数据包括点击熵特征数据、展示熵特征数据和兴趣分特征数据中的一种或多种，所述第二统计特征数据由所述已推荐集合中每个多媒体文件被设置的M个分类级别的单特征数据计算得到，具体可以为对于已推荐集合的点击总量和展示总量，即第二统计特征数据包括点击总量特征数据和展示总量特征数据中的一种或两种。例如，待分析多媒体文件的分类级别为“体育”，服务器获取到“体育”的点击量、点击率和展示量，并基于上述数据计算得到“体育”的点击熵、展示熵和兴趣分，作为第一统计特征数据，以及服务器获取已推荐多媒体文件集合中各多媒体文件对应的点击量和展示量，并计算相应的点击总量和展示总量，作为第二统计特征数据，服务器将第一统计特征数据和第二统计特征数据进行交叉，得到待分析多媒体文件对应的分类统计特征数据。

点击熵具体可以体现目标用户账户对于目标分类级别下多媒体文件点击的分散度，点击熵越大，目标用户账户对应的点击越为分散，点击熵越小，目标用户账户对应的点击越为集中，展示熵具体可以体现目标用户账户对于目标分类级别下多媒体文件展示的分散度，展示熵越大，目标用户账户对应的展示越为分散，展示熵越小，目标用户账户对应的展示越为集中，兴趣分具体表示目标用户账号对于目标分类级别的兴趣，其可以基于目标用户账户对于目标分类级别的点击率确定，点击率越高，兴趣分越大，该目标分类级别可以为待分析多媒体文件所在的分类级别。

具体的，点击熵的计算公式可以为：

H(x)＝E[I(xi)]＝E[log(2,1/P(xi))]＝-∑P(xi)log(2,P(xi))，(i＝1,2,..n)；

其中，xi表示目标分类级别中的第i个多媒体文件，P(xi)表示目标用户账户对于第i个多媒体文件的点击率。

展示熵的计算公式可以为：

H(y)＝E[I(yi)]＝E[log(2,1/P(yi))]＝-∑P(yi)log(2,P(yi))，(i＝1,2,..n)；

其中，yi表示目标分类级别中的第i个多媒体文件，P(yi)表示目标用户账户对于第i个多媒体文件的展示率。具体实施场景中，本发明实施例从待分析多媒体文件对应的3个分类级别中选取了两个分类级别进行交叉，得到分类特征数据，具体选取了一级分类和二级分类，得到的分类特征数据可以如表3所示。

表3：

需要说明的是，待分析多媒体文件对应的目标单特征数据、目标交叉特征数据以及分类特征数据是由每一次多媒体文件刷新操作所刷新展示的多媒体文件的浏览信息确定，和/或，由在预设时间周期内刷新显示的多媒体文件的浏览信息确定，例如，第二特征集合具体可以包括上一刷特征数据(上一次刷新操作所刷新展示的多媒体文件对应的目标单特征数据、目标交叉特征数据以及分类特征数据)，半小时特征数据(最近半小时内刷新操作所刷新展示的多媒体文件对应的目标单特征数据、目标交叉特征数据以及分类特征数据)、当天特征数据(最近1天刷新操作所刷新展示的多媒体文件对应的目标单特征数据、目标交叉特征数据以及分类特征数据)、3天特征数据(最近3天刷新操作所刷新展示的多媒体文件对应的目标单特征数据、目标交叉特征数据以及分类特征数据)和30天特征数据(最近30天刷新操作所刷新展示的多媒体文件对应的目标单特征数据、目标交叉特征数据以及目标分类特征数据)。针对上一刷特征数据，服务器获取到上一次刷新操作所刷新展示的多媒体文件对应的目标单特征数据、目标交叉特征数据以及分类特征数据，得到的第二特征集合中则包括上一刷待分析多媒体文件所在分类级别的单特征数据、一级分类和二级分类的单特征数据、以及上述特征数据的交叉等，例如，待分析多媒体文件所在的一级分类为“体育”、二级分类为“足球”，标签为“西甲”，则可以得到上一刷特征数据如表4所示。

表4：

具体实现中，针对第二特征集合包括的上一刷特征数据、半小时特征数据、当天特征数据、3天特征数据、30天特征数据，本发明实施例具体在图7a、图7b、图7c、图7d和图7e中进行了示出，其中，上一刷特征数据如图7a所示，半小时特征数据如图7b所示，当天特征数据如图7c所示，3天特征数据如图7d所示，30天特征数据如图7e所示，在图7a、图7b、图7c、图7d和图7e中，一级分类具体指示待分析多媒体文件所在的一级分类，二级分类具体指示待分析多媒体文件所在的二级分类，标签具体指示待分析多媒体文件所在的标签。

S504、服务器将第一特征集合和第二特征集合作为评估模型的输入得到待分析多媒体文件的分析结果。

本发明实施例中，分析结果用于指示待分析多媒体文件在待推荐文件集合中的排序位置，服务器得到第一特征集合和第二特征集合之后，可以将第一特征集合和第二特征集合作为评估模型的输入得到待分析多媒体文件的分析结果，具体的，服务器对第一特征集合和第二特征集合分别进行格式转化处理，得到目标格式的第一特征集合和目标格式的第二特征集合，服务器对第一特征集合和第二特征集合分别进行格式转化处理的具体方式包括，服务器获取第一特征集合和第二特征集合中的第一数据，并确定第一数据中参数的格式类型，格式类型包括整型、浮点型或字符串型；服务器采用参数的格式类型对应的格式转化处理方式对第一数据中参数进行格式转化处理，得到目标格式的第一数据，其中，第一数据中包括单个参数，整型对应的格式转化处理方式包括直接输出，浮点型对应的格式转化处理方式包括与预设数相乘后输出，字符串型对应的格式转化处理方式包括编码后输出，例如，当第一数据为点击量、展示量等单个参数的整型(uint64_t类型)数据时，特征索引y＝x_{uint64_t}，其中，x_{uint64_t}表示整型参数，当第一数据为点击率、点击熵等单个参数的浮点型(float类型)数据时，特征索引y＝x_float*1000，其中，x_float表示输入的浮点型参数，当第一数据为手机号、身份证号等单个参数的字符串数据时，特征索引y＝hash(x_string)，其中，x_string表示输入的字符串型参数，特征索引y表示目标格式的第一数据。

以及，服务器对所述第一特征集合和所述第二特征集合分别进行格式转化处理的具体方式还包括，服务器获取第一特征集合和第二特征集合中包括的第二数据，并确定第二数据中各个参数的格式类型，服务器采用每个参数的格式类型对应的转化处理方式对第二数据中各个参数进行格式转化处理，得到目标格式的各个参数，进一步的，服务器将所述第二数据中目标格式的各个参数，与预设质数相乘后进行连接，得到目标格式的第二数据，其中，第二数据包括至少两个参数，整型参数对应的格式转化处理方式包括直接输出，浮点型参数对应的格式转化处理方式包括与预设数相乘后输出，字符串型参数对应的格式转化处理方式包括编码后输出。具体的，当第二数据为展示熵和展示总量的交叉、点击熵和点击总量的交叉等包括两个参数的数据时，特征索引y₁＝x₁*13131+x₂，其中，x₁表示目标格式的第一个参数，x₂表示目标格式的第二个参数，特征索引y₁表示目标格式的第二数据，13131为预设质数。同理，当第二数据为包括n个参数的数据时，特征索引y₁＝x₁*m₁+x₂*m_2+...x_n*m_n，其中，x_l(l＝1,2...n)表示第二数据中目标格式的各个参数，m_l(l＝1,2...n)表示预设的L个质数。

需要说明的是，针对字符串型的参数，特征索引hash(x_string)的具体方式可以为:

y＝hash(x_string)&0xFFFF<<48+hash(x_string)&0xFFFFFFFFFFFF

即在对第一数据和第二数据中字符串型的参数进行编码时，将字符串型的参数特征映射到64位哈希空间，使用64位哈希空间的前16位表示字符串型参数的特征类别，具体通过将字符串型参数的哈希值取低16位得到，后48位表示字符串型参数特征索引，通过将特征值哈希，取低48位得到，通过上述计算哈希特征的方式，可以减少特征之间的冲突，增加特征的区分性。

进一步的，服务器将目标格式的第一特征集合和目标格式的第二特征集合输入至的评估模型中，以使得评估模型对是目标格式的第二特征集合和目标格式的第一特征集合进行分析处理，得到分析结果，具体实现中，评估模型可以为逻辑回归模型，其具体基于第一特征集合和第二特征集合进行前馈计算，计算公式为：y＝wx+b，其中，y表示模型的输出，w表示模型中参数的权重，b为常量。评估可以基于接收到目标格式的第一特征集合和目标格式的第二特征集合进行计算，得到目标用户账号对于待推荐文件集合中待分析多媒体文件的参考点击率，作为分析结果。

S505、服务器根据分析结果和待推荐文件集合，向目标用户账号输出多媒体文件。

本发明实施例中，服务器获取上述分析结果，并根据分析结果中的参考点击率确定待分析多媒体文件在待推荐文件集合中的排序位置，将待分析多媒体文件置于待推荐文件集合中的排序位置处，并向目标用户账号输出待推荐文件集合，具体实现中，服务器可以基于步骤S501-S505中所述的方法计算得到待推荐文件集合中每一个多媒体文件的参考点击率，并基于参考点击率对待推荐文件集合中各个多媒体文件进行排序数据，其中，参考点击率越大，排列顺序越靠前。在一种实现方式中，当待分析多媒体文件对应的参考点击率小于预设点击率时，服务器可以将该待分析多媒体文件剔除出待推荐文件集合，并将待推荐文件集合中参考点击率大于预设点击率的多媒体文件进行排序输出，其中，参考点击率越大的多媒体文件排序越靠前。

本发明实施例中，服务器获取到包括用户特征和多媒体文件特征的第一特征集合，以及确定出描绘用户短期兴趣特征的第二特征集合，通过上述两个特征集合确定出用户对于多媒体文件的兴趣，进一步确定针对多媒体文件的推荐方式，并以该推荐方式对多媒体文件进行推荐，在内容推荐过程中加入了用于描绘实时兴趣变化的第二特征集合进行内容推荐，可以使得服务器推荐的内容与用户兴趣更为匹配，以及在对获取的特征格式转换处理，可以便于模型对特征的理解，防止了特征间的冲突，通过上述方式，提升服务器的智能性。

需要说明的是，服务器在调用评估模型对第一特征集合和第二特征集合进行处理之前，需要对评估模型进行训练，其训练过程具体如S801-S804所示：

S801、服务器获取样本集。

本发明实施例中，样本集是根据已经推荐给训练用户账号的多媒体文件集合中的多媒体文件确定的，具体实现中，样本集中包括了多个多媒体训练文件，该多媒体训练文件具体为服务器已经推荐给训练用户账号的多媒体文件集合中的多媒体文件。

S802、服务器根据样本集确定第一训练特征集合。

本发明实施例中，第一训练特征集合包括样本集中的多媒体训练文件的文件训练特征和用户训练特征，服务器可以对样本集中的多媒体训练文件进行特征抽取，以得到样本集中的多媒体训练文件的文件训练特征，多媒体训练文件的文件训练特征可以多媒体训练文件对应的一级分类、二级分类和标签，用户训练特征用于体现训练用户账号的长期兴趣的特征，具体可以包括用户训练访问特征、用户训练身份特征以及用户训练环境特征中的任意一种或多种，其中，用户训练访问特征可以包括用户浏览的文件的特征，包括分类、话题、标签等，用户训练身份特征包括画像、人口学、深度兴趣等，用户训练环境特征包括网络、时间、地域等，需要说明的是，在模型训练过程中，可以基于训练用户账号的操作不断对样本集和用户特征进行更新，其中，用户训练特征是以第一更新时长进行更新，样本集是以第二更新时长进行更新，第一更新时长和第二更新时长不相同，例如，样本集以分钟级进行更新，用户训练特征以天级进行更新，即每分钟对样本集进行更新，或者，每天对用户训练特征进行更新。

S803、服务器获取训练用户账号的第二训练特征集合。

本发明是实施例中，第二训练特征集合是根据训练用户账号的日志文件中记录的日志信息确定的，日志文件是根据点击日志、展示日志中任意一个或者多个确定的，具体的，点击日志记录了训练用户账号对于已经推荐给训练用户账号的多媒体文件点击情况，展示日志记录了训练用户账号对于已经推荐给训练用户账号的多媒体文件展示情况，服务器对上述点击日志和展示日志进行合并处理，该合并处理用于将训练用户账号一次请求的信息进行合并，服务器对合并处理后的日志进行特征提取，提取出用户描绘出训练用户账号短期兴趣的特征，具体包括多媒体训练文件对应的训练单特征数据、多媒体训练文件对应的训练交叉特征数据和多媒体训练文件对应的训练分类特征数据，其中，训练单特征数据包括点击量特征数据、点击率特征数据、展示量特征数据中的任意一种或多种；训练交叉特征数据包括训练单特征数据与多媒体训练文件对应的分类级别的交叉，训练分类特征数据包括多媒体训练文件的分类级别所属类型的第一训练统计特征数据与第二训练统计特征数据的交叉，其中，第一训练统计特征数据包括：点击熵特征数据、展示熵特征数据和兴趣分特征数据中的一种或多种，第二训练统计特征数据包括已推荐集合中各多媒体文件的点击总量特征数据和/或展示总量特征数据。

S804、服务器采用第一训练特征集合和第二训练特征集合，对已构建的初始评估模型进行训练，得到评估模型。

具体实现中，初始评估模型可以基于第一训练特征集合和第二训练特征集合计算出样本集中每个多媒体训练文件的参考点击率，进一步的，服务器基于记录的训练用户账号对于每个多媒体训练文件的被点击情况对初始评估模型进行训练优化。

在一种实现方式中，样本集中的各个多媒体训练文件都为正样本，即各个多媒体训练文件已被训练账户浏览，则服务器基于记录的训练用户账号对于每个多媒体训练文件的被点击情况对初始评估模型进行训练优化具体方式为，服务器获取参考点击率大于预设点击率的多媒体训练样本对应的第一数量，若所述第一数量大于预设阈值，则确定模型训练优化完成，若第一数量小于预设阈值，则调整模型中各个参数的权重，并重新计算针对每个媒体训练样本的参考点击率，直至第一数量大于预设数量。

在一种实现方式中，样本集中的各个多媒体训练文件都为负样本，即各个多媒体训练文件未被训练账户浏览，则服务器基于记录的训练用户账号对于每个多媒体训练文件的被点击情况对初始评估模型进行训练优化具体方式为，服务器获取参考点击率小于预设点击率的多媒体训练样本对应的第二数量，若所述第二数量大于预设阈值，则确定模型训练优化完成，若第二数量小于预设阈值，则调整模型中各个参数的权重，并重新计算针对每个媒体训练样本的参考点击率，直至第二数量大于预设数量。

在一种实现方式中，样本集中的各个多媒体训练文件包括正样本和负样本，正样本为已被训练用户账户浏览的多媒体训练文件，负样本为未被训练用户账户浏览的多媒体训练文件，则服务器基于记录的训练用户账号对于每个多媒体训练文件的被点击情况对初始评估模型进行训练优化具体方式为，服务器获取预测正确的多媒体训练文件的第三数量，若所述第三数量大于预设阈值，则确定模型训练优化完成，若第三数量小于预设阈值，则调整模型中各个参数的权重，并重新计算针对每个媒体训练样本的参考点击率，直至第三数量大于预设数量。其中，若正样本对应的参考点击率大于预设阈值，则确定被预测正确，若负样本的参考点击率小于预设阈值，则确定被预测正确。

如图9所示，为本发明实施例提供的评估模型训练架构图，图9中，首先获取到用户训练特征以及样本集，其中，用户训练特征可以每天进行更新，样本集可以每分钟进行更新，将上述数据存储于远程字典服务(Remote Dictionary Server，redis)集群中，以及获取到点击日志、展示日志，并将上述日志合并后存储于分布式消息系统(如kafak集群)中，进一步的，可以从redis集群和kafka集群中进行特征抽取，得到第一训练特征集合和第二训练特征集合，将上述特征集合导入至kafka集群中，并将kafka集群中的数据存入至Hadoop分布式文件系统(Hadoop Distributed File System，hdfs)中，以及将kafka集群或hdfs的数据导入至模型中进行训练，最终将训练好的模型应用于服务器对于多媒体文件在线推送的服务中。

在一种实施场景中，多媒体文件具体可以为视频文件，本发明具体用于应用程序中多媒体文件的推送，如图10所示，为本发明实施例提供的一种应用程序的主界面示意图，该推荐下包括了关注、推荐、视频等一级分类，服务器可以基于本方案所提供的方法得到针对待推荐文件集合中每个多媒体文件的参考点击率，并参考基于点击率确定集合中各个多媒体文件的排序位置，以及将各个参考多媒体文件在排序位置处进行推荐，图10中，视频1的参考点击率最高，则服务器将视频1放在首位进行推荐，文章“美食推荐”的参考点击率次高，则服务器将“美食推荐”放在第二位进行推荐。进一步的，用户可以对界面中的多媒体文件进行点击，当检测到用户点击了视频1之后，可以进入到视频1对应的视频界面，该视频界面中包括显示的用户点击的视频1，以及隐藏的多个待推荐视频文件，上述待推荐视频文件具体可以为基于用户对于视频1的点击行为以及用户兴趣召回的视频文件，进一步的，服务器提取各待推荐视频文件的文件特征、用户特征以及描述用户短期兴趣的特征，并基于上述特征确定用户对于每个待推荐视频文件的参考点击率，以及对基于每个视频文件的参考点击率确定排序位置后进行排序推荐，如视频2确定出的参考点击率最高，则服务器将视频2隐藏在视频1的后方，使得用户一次操作即可从视频1切换到视频2。如图11所示，为上述过程的具体流程示意图，上述流程具体包括在线部分和离线部分，其中，离线部分包括用户行为收集、用户画像计算和模型训练，其中，用户行为主要包含点击、展示、点赞、转发、评论、双击等，如获取到对1101中各个视频的点击、展示行为，用户画像计算根据用户的行为进行用户兴趣的计算，主要从标签、分类等不同维度刻画用户的兴趣，如得到1102中所示的对资讯的兴趣度为0.23，娱乐的兴趣度为0.13，模型训练则是根据用户的点击、展示历史进行特征的抽取，生成特征样本，训练评估模型，在线部分主要包括候选召回、排序打分以及多样性展示，其中，候选召回主要根据用户画像和用户行为进行多媒体文件的召回，如召回1103中的视频文件，排序打分具体为对召回的多媒体文件进行特征抽取和参考点击率计算，其中，特征可以是1104中的热度、时间、性别等，在排序打分的基础上，服务器结合多样性策略进行最后的展示，如1105中所示，将结合频道多样性和标签多样性对排序后的多媒体文件进行展示。具体实现中，针对上述参考点击率的具体计算流程如图12所示，首先基于点击、展示日志构建原始数据；然后从上述原始数据中提取出特征数据，包括多媒体文件的文件特征、用户特征、描述用户短期兴趣的行为特征，进一步将上述特征输入至模型中进行训练，并将训练完成的模型用于显示针对多媒体文件的推送中，其中线上对于多媒体文件的推送过程具体包括特征抽取，包括抽取媒体文件特征、用户特征、用户短期行为特征，将上述特征导入评估模型得到每个多媒体文件的参考点击率，并基于参考点击率进行排序推荐。可以使得提取的特征能够体现用户的实时兴趣变化，提升了推荐内容与用户兴趣的匹配度，进而让应用程序获得了更高的点击量、点击率、日活量等。

下面将结合附图13对本发明实施例提供的基于人工智能的内容推送装置进行详细介绍。需要说明的是，附图13所示的基于人工智能的内容推送装置，用于执行本发明图5和图8所示实施例的方法，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，经参照本发明图5和图8所示的实施例。

请参见图13，为本发明提供的一种基于人工智能的内容推送装置的结构示意图，该基于人工智能的内容推送装置130可包括：获取模块1301、确定模块1302、输入模块1303、输出模块1304和训练模块1305。

获取模块1301，用于获取关于待分析多媒体文件的第一特征集合，所述第一特征集合包括：本次待推荐给目标用户账号的待推荐文件集合中待分析多媒体文件的文件特征、所述目标用户账号对应的用户特征；

所述获取模块1301，还用于获取所述目标用户账号的历史行为数据，所述历史行为数据包括：所述目标用户账号的已推荐集合中各多媒体文件的浏览信息，所述已推荐集合中包括：N个多媒体文件，每个多媒体文件被设置了M个分类级别，N为大于或等于2的整数，M为正整数；

确定模块1302，用于根据所述历史行为数据确定第二特征集合，所述第二特征集合用于表示所述目标用户账号对于所述待分析多媒体文件所在分类级别的浏览特征；

输入模块1303，用于将所述第一特征集合和所述第二特征集合作为评估模型的输入得到所述待分析多媒体文件的分析结果；

输出模块1304，用于根据所述分析结果和待推荐文件集合，向所述目标用户账号输出多媒体文件。

在一种实现方式中，所述第二特征集合中包括所述待分析多媒体文件对应的目标单特征数据和目标交叉特征数据，所述确定模块1302，具体用于：

根据所述历史行为数据中包括的关于所述每个多媒体文件被设置的M个分类级别中每一个分类级别的浏览信息，确定所述每一个分类级别的单特征数据；

从所述每一个分类级别的单特征数据中找到所述待分析多媒体文件所在分类级别的目标单特征数据；

将所述目标单特征数据与所述待分析多媒体文件所在分类级别进行交叉，得到目标交叉特征数据；

将所述目标单特征数据和目标交叉特征数据加入至所述第二特征集合中。

在一种实现方式中，所述第二特征集合还包括待分析多媒体文件对应的分类特征数据，所述确定模块1302，具体用于：

对所述目标单特征数据进行计算，得到所述待分析多媒体文件所在分类级别的第一统计特征数据；

获取第二统计特征数据，所述第二统计特征数据由所述已推荐集合中每个多媒体文件被设置的M个分类级别的单特征数据计算得到；

将所述第一统计特征数据与第二统计特征数据进行交叉，得到所述待分析多媒体文件对应的分类特征数据；

将所述待分析多媒体文件对应的分类特征数据加入至所述第二特征集合中。

在一种实现方式中，所述目标单特征数据、目标交叉特征数据以及所述分类特征数据是由每一次多媒体文件刷新操作所刷新展示的多媒体文件的浏览信息确定，和/或，

所述目标单特征数据、目标交叉特征数据以及所述分类特征数据是由在预设时间周期内刷新显示的多媒体文件的浏览信息确定。

在一种实现方式中，所述获取模块1301，具体用于：

获取所述目标用户账号对应的用户特征；

根据所述用户特征搜索多媒体文件，并根据搜索到的多媒体文件确定待推荐文件集合；

分析所述待推荐文件集合中待分析多媒体文件的文件特征，所述待分析多媒体文件为所述待推荐文件集合中的任一文件；

将所述待推荐文件集合中待分析多媒体文件的文件特征和所述目标用户账号对应的用户特征作为第一特征集合。

在一种实现方式中，所述输入模块1303，具体用于：

对所述第一特征集合和所述第二特征集合分别进行格式转化处理，对应得到目标格式的第一特征集合和目标格式的第二特征集合；

将所述目标格式的第一特征集合和所述目标格式的第二特征集合输入至评估模型中，以使得所述评估模型对所述目标格式的第一特征集合和所述目标格式的第二特征集合进行处理，得到所述待分析多媒体文件的分析结果。

在一种实现方式中，所述输入模块1303，具体用于：

获取所述第一特征集合和所述第二特征集合中的第一数据，所述第一数据中包括单个参数；

确定所述第一数据中参数的格式类型，所述格式类型包括整型、浮点型或字符串型；

采用所述参数的格式类型对应的格式转化处理方式，对所述第一数据中参数进行格式转化处理，得到目标格式的第一数据；

其中，所述整型对应的格式转化处理方式包括直接输出，所述浮点型对应的格式转化处理方式包括与预设数相乘后输出，所述字符串型对应的格式转化处理方式包括编码后输出。

在一种实现方式中，所述输入模块1303，具体用于：

获取所述第一特征集合和所述第二特征集合中包括的第二数据，所述第二数据中包括至少两个参数；

确定所述第二数据中各个参数的格式类型，并采用每个参数的格式类型对应的转化处理方式，对所述第二数据中各个参数进行格式转化处理，得到目标格式的各个参数；

将所述第二数据中目标格式的各个参数，与预设质数相乘后进行连接，得到目标格式的第二数据。

在一种实现方式中，所述获取模块1301，还用于获取样本集，所述样本集是根据已经推荐给训练用户账号的多媒体文件集合中的多媒体文件确定的；

所述确定模块1302，还用于根据所述样本集确定第一训练特征集合；

获取所述训练用户账号的第二训练特征集合，所述第二训练特征集合是根据所述训练用户账号的日志文件中记录的日志信息确定的，日志文件是根据点击日志、展示日志中任意一个或者两个确定的，所述第二特征集合用于表示所述训练用户账号对于所述多媒体训练文件对应的分类级别的浏览特征；

采用所述第一训练特征集合和第二训练特征集合，对已构建的初始评估模型进行训练，得到评估模型。

所述获取模块1301，还用于获取所述训练用户账号的第二训练特征集合，所述第二训练特征集合是根据所述训练用户账号的日志文件中记录的日志信息确定的，日志文件是根据点击日志、展示日志中任意一个或者两个确定的，所述第二特征集合用于表示所述训练用户账号对于所述多媒体训练文件对应的分类级别的浏览特征；

所述训练模块1305，用于采用所述第一训练特征集合和第二训练特征集合，对已构建的初始评估模型进行训练，得到评估模型。

在一种实现方式中，所述第一训练特征集合包括：用户训练特征和所述样本集中的多媒体训练文件的文件训练特征，其中，用户训练特征是以第一更新时长进行更新，所述样本集是以第二更新时长进行更新，第一更新时长和第二更新时长不相同。

在一种实现方式中，所述分析结果指示了针对所述待分析多媒体文件的参考点击率，所述输出模块1304，具体用于：

根据所述参考点击率确定所述待分析多媒体文件在所述待推荐文件集合中的排序位置；

将所述待分析多媒体文件置于所述待推荐文件集合中的排序位置处，并向目标用户账号输出所述待推荐文件集合。

本发明实施例中，获取模块1301获取关于待分析多媒体文件的第一特征集合，并获取目标用户账号的历史行为数据，确定模块1302根据历史行为数据确定第二特征集合，输入模块1303将第一特征集合和第二特征集合作为评估模型的输入得到待分析多媒体文件的分析结果；输出模块1304根据分析结果和待推荐文件集合，向目标用户账号输出多媒体文件。通过使得服务器推荐的内容与用户兴趣更为匹配，提升推荐内容服务的智能性。

请参见图14，为本发明实施例提供的一种服务器的结构示意图。如图14所示，该服务器包括：至少一个处理器1401，输入接口1403，输出接口1404，存储装置1405，至少一个通信总线1402。其中，通信总线1402用于实现这些组件之间的连接通信。存储装置1405可以是高速RAM存储装置，也可以是非不稳定的存储装置(non-volatile memory)，例如至少一个磁盘存储装置。存储装置1405可选的还可以是至少一个位于远离前述处理器1401的存储装置。其中处理器1401可以结合图13所描述的装置，存储装置1405中存储一组程序代码，且处理器1401，输入接口1403，输出接口1404调用存储装置1405中存储的程序代码，用于执行以下操作：

处理器1401，用于获取关于待分析多媒体文件的第一特征集合，所述第一特征集合包括：本次待推荐给目标用户账号的待推荐文件集合中待分析多媒体文件的文件特征、所述目标用户账号对应的用户特征；

处理器1401，用于获取所述目标用户账号的历史行为数据，所述历史行为数据包括：所述目标用户账号的已推荐集合中各多媒体文件的浏览信息，所述已推荐集合中包括：N个多媒体文件，每个多媒体文件被设置了M个分类级别，N为大于或等于2的整数，M为正整数；

处理器1401，用于根据所述历史行为数据确定第二特征集合，所述第二特征集合用于表示所述目标用户账号对于所述待分析多媒体文件所在分类级别的浏览特征；

处理器1401，用于将所述第一特征集合和所述第二特征集合作为评估模型的输入得到所述待分析多媒体文件的分析结果；

处理器1401，用于根据每个所述候选敏感词的释义信息对所述至少一个候选敏感词进行筛选，得到目标敏感词；

处理器1401，用于根据所述分析结果和待推荐文件集合，向所述目标用户账号输出多媒体文件。

在一种实现方式中，所述第二特征集合中包括所述待分析多媒体文件对应的目标单特征数据和目标交叉特征数据，处理器1401，具体用于：

在一种实现方式中，所述第二特征集合还包括待分析多媒体文件对应的分类特征数据，处理器1401，具体用于：

在一种实现方式中，处理器1401，具体用于：

获取所述目标用户账号对应的用户特征；

在一种实现方式中，处理器1401，具体用于：

获取样本集，所述样本集是根据已经推荐给训练用户账号的多媒体文件集合中的多媒体文件确定的；

根据所述样本集确定第一训练特征集合；

在一种实现方式中，所述分析结果指示了针对所述待分析多媒体文件的参考点击率，处理器1401，具体用于：

本发明实施例中，处理器1401获取关于待分析多媒体文件的第一特征集合，并获取目标用户账号的历史行为数据，处理器1401根据历史行为数据确定第二特征集合，处理器1401将第一特征集合和第二特征集合作为评估模型的输入得到待分析多媒体文件的分析结果；处理器1401根据分析结果和待推荐文件集合，向目标用户账号输出多媒体文件。通过使得服务器推荐的内容与用户兴趣更为匹配，提升推荐内容服务的智能性。

应当理解，在本发明实施例中，所称处理器1401可以是中央处理模块(CentralProcessing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

总线1402可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互联(Peripheral Component，PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture，EISA)总线等，该总线1402可以分为地址总线、数据总线、控制总线等，为便于表示，图14仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于计算机可读存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(RandomAccess Memory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种基于人工智能的内容推送方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述第二特征集合中包括所述待分析多媒体文件对应的目标单特征数据和目标交叉特征数据，所述根据所述历史行为数据确定第二特征集合，包括：

3.如权利要求2所述的方法，其特征在于，所述第二特征集合还包括待分析多媒体文件对应的分类特征数据，所述从所述每一个分类级别的单特征数据中找到所述待分析多媒体文件所在分类级别的目标单特征数据之后，所述方法还包括：

4.如权利要求3所述的方法，其特征在于，

所述目标单特征数据、目标交叉特征数据以及所述分类特征数据是由每一次多媒体文件刷新操作所刷新展示的多媒体文件的浏览信息确定，和/或，

5.如权利要求1所述的方法，其特征在于，所述获取关于待分析多媒体文件的第一特征集合，包括：

获取所述目标用户账号对应的用户特征；

6.如权利要求1所述的方法，其特征在于，所述将所述第一特征集合和所述第二特征集合作为评估模型的输入得到所述待分析多媒体文件的分析结果，包括：

7.如权利要求6所述的方法，其特征在于，所述对所述第一特征集合和所述第二特征集合进行格式转化处理，包括：

8.如权利要求7所述的方法，其特征在于，所述方法还包括：

9.如权利要求1所述的方法，其特征在于，所述方法还包括：

根据所述样本集确定第一训练特征集合；

获取所述训练用户账号的第二训练特征集合，所述第二训练特征集合是根据所述训练用户账号的日志文件中记录的日志信息确定的，所述日志文件是根据点击日志、展示日志中任意一个或者两个确定的，所述第二特征集合用于表示所述训练用户账号对于所述多媒体训练文件对应的分类级别的浏览特征；

10.如权利要求9所述的方法，其特征在于，所述第一训练特征集合包括：用户训练特征和所述样本集中的多媒体训练文件的文件训练特征，其中，用户训练特征是以第一更新时长进行更新，所述样本集是以第二更新时长进行更新，第一更新时长和第二更新时长不相同。

11.如权利要求1-10任一项所述的方法，其特征在于，所述分析结果指示了针对所述待分析多媒体文件的参考点击率，所述根据所述分析结果和待推荐文件集合，向目标用户账号输出多媒体文件，包括：

12.一种基于人工智能的内容推送装置，其特征在于，所述装置包括：

13.一种服务器，其特征在于，包括处理器和存储装置，所述存储装置用于存储计算机程序，所述计算机程序包括程序指令，所述处理器用于调用所述程序指令，执行如权利要求1-11任一项所述的方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时，所述权利要求1-11任一项所述的方法将被实现。