CN112395489B

CN112395489B - 一种推荐方法及装置、设备和计算机存储介质

Info

Publication number: CN112395489B
Application number: CN201910755122.4A
Authority: CN
Inventors: 刘松; 龚双双; 陈敏
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Suzhou Software Technology Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Suzhou Software Technology Co Ltd
Priority date: 2019-08-15
Filing date: 2019-08-15
Publication date: 2023-04-11
Anticipated expiration: 2039-08-15
Also published as: CN112395489A

Abstract

本申请实施例提供了一种推荐方法及装置、设备和计算机存储介质，其中，所述推荐方法包括：基于获取到的待推荐用户的DPI数据，确定所述待推荐用户的兴趣标签；基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集；至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果；将所述目标推荐结果发送给所述待推荐用户的终端。如此，利用DPI数据挖掘用户的兴趣补充用户维度特征，解决了传统用户维度人口统计学信息的真实性问题；采用两种模型获取候选推荐集，以此保证召回率的同时提高候选推荐集的多样性；使用对用户分类的思想获取目标推荐结果，使得对用户进行推荐更具有针对性，提高了用户体验。

Description

一种推荐方法及装置、设备和计算机存储介质

技术领域

本申请属于信息处理技术领域，涉及但不限于一种推荐方法及装置、设备和计算机存储介质。

背景技术

随着移动通信技术的不断发展，人们可以随意在网上浏览各种信息，比如娱乐多媒体信息、或者家居日用品信息等，网络上也会按照各种物品的性价比或独特性等给用户推荐，以备用户选择。

现有的推荐系统中最为成熟的推荐算法有两个，分别为协同过滤算法和基于深度学习的推荐系统，其中协同过滤算法分为基于用户的协同过滤和基于物品的协同过滤，但这两种协同过滤都得在海量数据的前提下才能对相同喜好的用户进行商品推荐或者对用户进行相似物品的推荐，而在数据稀疏时很难找到相似物品或相同喜好的用户，并且存在多样性不足的问题，用户体验不高。

基于深度学习的推荐系统以Youtub为例，主要由两个神经网络组成，第一个神经网络用于生成候选视频列表，第二个神经网络用于对输入视频列表打分排名，以将排名靠前的视频推荐给用户。虽然使用两个神经网络可以处理海量视频且能够保证给用户进行个性化或有吸引力的推荐，但是由于该推荐系统的输入之一为用户统计学信息(年龄、职业、性别等)，而许多用户为了隐私安全通常不暴露真实信息，以此使得用户统计学信息的真实性无法保证，甚至对于存在数据稀疏性问题的非热门网站，也会给模型训练带来困难。

发明内容

有鉴于此，本申请实施例的主要目的在于提供一种推荐方法及装置、设备和计算机存储介质，至少能够解决用户统计学信息的真实性问题以及推荐内容多样性的问题，提高用户体验。

本申请实施例提供一种推荐方法，所述方法包括：

基于获取到的待推荐用户的深度报文检测(Deep Packet Inspection，DPI)数据，确定所述待推荐用户的兴趣标签；其中，所述DPI数据表征所述待推荐用户的浏览行为；

基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集；

至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果；

将所述目标推荐结果发送给所述待推荐用户的终端。

本申请实施例提供一种推荐装置，所述装置至少包括：第一确定模块、第二确定模块、第三确定模块和发送模块，其中：

所述第一确定模块，用于基于获取到的待推荐用户的DPI数据，确定所述待推荐用户的兴趣标签；其中，所述DPI数据表征所述待推荐用户的浏览行为；

所述第二确定模块，用于基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集；

所述第三确定模块，用于至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果；

所述发送模块，用于将所述目标推荐结果发送给所述待推荐用户的终端。

本申请实施例提供一种推荐设备，所述设备至少包括：存储器、通信总线及处理器，其中：

所述存储器，用于存储推荐程序；

所述通信总线，用于实现所述处理器和所述存储器之间的通信连接；

所述处理器，用于执行所述存储器中存储的推荐程序，以实现如上述的推荐方法的步骤。

本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有推荐程序，所述推荐程序被处理器执行时实现如上述的推荐方法的步骤。

本申请实施例提供了一种推荐方法及装置、设备和计算机存储介质，其中，所述推荐方法包括：基于获取到的待推荐用户的DPI数据，确定所述待推荐用户的兴趣标签；其中，所述DPI数据表征所述待推荐用户的浏览行为；基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集；至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果；将所述目标推荐结果发送给所述待推荐用户的终端。如此，利用DPI数据挖掘用户的兴趣补充用户维度特征，解决了传统用户维度人口统计学信息的真实性问题；采用两种模型获取候选推荐集，以此保证召回率的同时提高候选推荐集的多样性；使用对用户分类的思想获取目标推荐结果，使得对用户进行推荐更具有针对性，提高了用户体验。

附图说明

图1为本申请实施例提供的推荐方法的一种实现流程示意图；

图2为本申请实施例提供的推荐方法的另一实现流程示意图；

图3为本申请实施例提供的推荐方法的再一实现流程示意图；

图4为本申请实施例提供的推荐方法的又一实现流程示意图；

图5为本申请实施例提供的推荐方法的又一实现流程示意图；

图6A为本申请实施例提供的推荐装置的一种示意图；

图6B为本申请实施例提供的推荐装置中候选模块的结构示意图；

图6C为本申请实施例提供的推荐装置中隐语义模型的结构示意图；

图6D为本申请实施例提供的推荐装置中排序模块的结构示意图；

图7为本申请实施例提供的推荐装置的另一示意图；

图8为本申请实施例提供的推荐设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请的具体技术方案作进一步详细描述。以下实施例用于说明本申请，但不用来限制本申请的范围。

本申请实施例提供一种推荐方法，图1为本申请实施例提供的推荐方法的一种实现流程示意图，如图1所示，所述方法包括：

步骤S101：基于获取到的待推荐用户的DPI数据，确定所述待推荐用户的兴趣标签；其中，所述DPI数据表征所述待推荐用户的浏览行为。

这里，步骤S101可以是由服务器实现的，由于在运营商服务器中，存在着表征待推荐用户的浏览行为的DPI数据，其中所述浏览行为至少包括页面的停留时间和/或跳转来源等，而且所述DPI数据中的每条浏览条目数据都会对应一个类别。因此，通过挖掘所述DPI数据，能够获知所述待推荐用户经常浏览的网页或者停留时间长的网页，并以此分析所述待推荐用户自身的特色与兴趣偏好，从而确定出所述待推荐用户的兴趣标签，也就是所述待推荐用户最感兴趣的类别，比如动漫、武侠、教育等。

此外，由于所述DPI数据中存在的浏览行为都是真实存在的，那么根据所述浏览行为确定出的待推荐用户的兴趣标签也是真实可靠的，由此说明，利用DPI数据挖掘所述待推荐用户的兴趣标签以补充所述待推荐用户的维度特征，从而能够解决传统用户维度人口统计学信息的真实性问题，也能够达到很好的推荐效果。

步骤S102：基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集。

这里，步骤S102可以是由服务器实现的，其中，所述多媒体的特征信息是能够表征所述多媒体自身特征的信息，至少包括所述多媒体的标识、简介信息和评论信息，此处不作限定；并且，所述多媒体可以为视频、音乐、广告或新闻等，此处也不作限定。

所述两种模型至少包括第一模型和第二模型，通过所述第一模型、所述第二模型、所述兴趣标签以及待推荐多媒体的特征信息，可以对应得到第一候选推荐子集和第二候选推荐子集，再基于所述第一候选推荐子集和所述第二候选推荐子集，确定出候选推荐集。

因此，步骤S102在确定所述候选推荐集的实现过程中，通过利用所述两种模型来实现保证召回率的同时有效提高所确定出的候选推荐集的多样性的目的，并为后续确定出更具针对性的目标推荐结果奠定基础。

步骤S103：至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果。

这里，步骤S103可以是由服务器实现的，在步骤S103的实现过程中，根据所述待推荐用户的浏览行为确定所述待推荐用户的类别信息，可以通过分析所述待推荐用户最近观看多媒体的总时长或者打开多媒体网站的次数，确定所述待推荐用户是粘性用户还是一般用户，所述粘性用户为最近观看多媒体的总时长大于某个阈值或者打开多媒体网站的次数大于某个阈值的用户，所述一般用户为最近观看多媒体的总时长不大于某个阈值或者打开多媒体网站的次数不大于某个阈值的用户。由此说明，通过使用所述待推荐用户的类别信息从所述候选推荐集中确定目标推荐结果，使得对所述待推荐用户的推荐更具有针对性，从而用户体验也更高。

步骤S104：将所述目标推荐结果发送给所述待推荐用户的终端。

这里，步骤S104可以是由服务器实现的，当确定出了所述目标推荐结果时，将所述目标推荐结果发送给所述待推荐用户的终端，以将所述目标推荐结果有针对性进行推荐。

本申请实施例先利用DPI数据挖掘用户的兴趣标签补充，在补充了用户的维度特征的同时解决了传统用户维度人口统计学信息的真实性问题；再基于至少两种模型和待推荐多媒体的特征信息获取候选推荐集，以此保证召回率的同时有效提高候选推荐集的准确率和多样性；此外，使用对用户分类的思想从候选推荐集中确定目标推荐结果，使得对用户进行推荐更具有针对性，也提高了用户体验。

基于前述实施例，本实施例再提供一种推荐方法，图2为本申请实施例提供的推荐方法的另一实现流程示意图，如图2所示，所述方法包括：

步骤S201：基于获取到的待推荐用户的DPI数据，确定所述待推荐用户的兴趣标签；其中，所述DPI数据表征所述待推荐用户的浏览行为。

这里，步骤S201在实现时，包括：

步骤S2011：基于所述DPI数据中每个类别对应的浏览条目的浏览时间，确定所述每个类别对应的兴趣值。

其中，所述DPI数据中的每条浏览条目都对应一个类别，根据所述DPI数据中每个类别对应的浏览条目的浏览时间，所述浏览时间越长，说明所述待推荐用户对该浏览条目对应的类别越感兴趣，那么所述类别对应的兴趣值也就越大，从而在计算出每个类别对应的兴趣值后，可以根据所计算出来的各个兴趣值来确定所述待推荐用户感兴趣的类别。

步骤S2012：将所确定出的兴趣值中满足预设条件的类别，确定为所述待推荐用户的兴趣标签。

在这里，在统计出所述DPI数据中的每个类别的兴趣值后，将所得到的各个兴趣值筛选出满足预设条件的类别，以统计出所述待推荐用户关注最多的类别，即认为所述待推荐用户对此类别最感兴趣，比如可以是将所得到的各个兴趣值按从大到小排序后选出前K个兴趣值的类别，即TOPK对应的兴趣标签即为所述待推荐用户的兴趣标签；其中，K为正整数，例如K的值可以为3。

步骤S202：基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集。

这里，所述待推荐多媒体的特征信息至少包括所述待推荐媒体的标识、评论信息和简介信息；而所述两种模型包括第一模型和第二模型，所述第一模型是根据所述待推荐用户已浏览过的多媒体的特征信息，以及所确定出的待推荐用户的兴趣标签训练得到的模型，所述第二模型是基于所述待推荐用户已浏览过的多媒体在未看过的多媒体中预测其感兴趣的多媒体的模型，将使用这两种模型分别得到的第一候选推荐子集和第二候选推荐子集合并，作为候选推荐集。

步骤S202在实现时，使用两种模型结合的方法获取所述候选推荐集能够查漏补缺，在一定程度上也能够保证所述候选推荐集的准确率和多样性。

步骤S203：至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果。

步骤S204：将所述目标推荐结果发送给所述待推荐用户的终端。

在本申请实施例中，通过分析DPI数据中每个浏览条目的浏览时间，确定每个类别的兴趣值，以此获知待推荐用户自身的特色和兴趣爱好，并从所确定出的兴趣值中确定出符合预设条件的类别，从而确定出待推荐用户的兴趣标签，然后再结合两种模型获得的候选推荐集更能够查漏补缺，也能够保证候选推荐集的准确率和多样性，在此基础上根据待推荐用户的类别信息，从候选推荐集中确定目标推荐结果，以此实现有针对性的对待推荐用户进行推荐，提升用户的体验。

基于前述实施例，本实施例再提供一种推荐方法，图3为本申请实施例提供的推荐方法的再一实现流程示意图，如图3所示，所述方法包括：

步骤S301：基于获取到的待推荐用户的DPI数据，确定所述待推荐用户的兴趣标签；其中，所述DPI数据表征所述待推荐用户的浏览行为。

步骤S302：基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集。

这里，步骤S302在实现时，包括：

步骤S3021：至少基于第一模型、所述兴趣标签和第一多媒体集合的特征信息，确定第一候选推荐子集；其中，所述第一多媒体集合至少包括所述待推荐多媒体中未被所述待推荐用户浏览的第一多媒体。

其中，所述特征信息至少包括标识、评论信息和简介信息，对应地，步骤S3021在实现时，包括：

步骤S30211：将所述待推荐用户的用户标识和所述兴趣标签输入至所述第一模型，得到所述待推荐用户的第一用户特征向量。

步骤S30212：将所述第一多媒体集合中第一多媒体的标识、评论信息和简介信息输入至所述第一模型，得到所述第一多媒体的第一多媒体特征向量。

步骤S30213：基于所述第一用户特征向量和所述第一多媒体特征向量，确定第一候选推荐子集。

步骤S3022：基于第二模型、第二多媒体集合和所述第一多媒体集合，从所述第一多媒体集合中确定第二候选推荐子集；其中，所述第二多媒体集合至少包括已被所述待推荐用户浏览的第二多媒体。

步骤S3023：基于所述第一候选推荐子集和所述第二候选推荐子集，确定候选推荐集。

其中，步骤S3023在实现时，包括：

步骤S30231：基于所述第二模型、第二多媒体集合和所述第一多媒体集合，确定所述第二多媒体集合中第二多媒体与所述第一多媒体集合中第一多媒体之间的相似度。

步骤S30232：基于所述相似度，从所述第一多媒体集合中确定第二候选推荐子集。

步骤S30233：将所述第一候选推荐子集和所述第二候选推荐子集的并集，确定为候选推荐集。

步骤S303：至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果。

步骤S304：将所述目标推荐结果发送给所述待推荐用户的终端。

在本实施例中，基于推荐用户的兴趣标签、未浏览过的多媒体的标识、评论信息和简介信息和第一模型确定第一候选推荐子集，以此确保所获得的第一候选子集更加符合待推荐用户需求且内容更加真实和丰富；基于第二模型、待推荐用户浏览过和未浏览过的多媒体之间的相似度从未浏览的多媒体中确定第二候选推荐子集，使得获得的第二候选推荐子集也更加符合待推荐用户的兴趣爱好，因此由第一候选推荐子集和第二候选推荐子集确定的候选推荐集能够查缺补漏，也能够在保证候选推荐集的准确率和多样性的同时，验证第一模型和第二模型的可靠性和准确性，从而基于待推荐用户的类别信息从候选推荐集中确定出的目标推荐结果，也会更加具有针对性，有效提升了用户体验。

基于前述实施例，本实施例再提供一种推荐方法，图4为本申请实施例提供的推荐方法的又一实现流程示意图，如图4所示，所述方法包括：

步骤S401：基于获取到的待推荐用户的DPI数据，确定所述待推荐用户的兴趣标签；其中，所述DPI数据表征所述待推荐用户的浏览行为。

步骤S402：基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集；其中，所述候选推荐集包括第一候选推荐子集和第二候选推荐子集。

这里，步骤S402在实现时，所述两种模型包括第一模型和第二模型，所述第一模型是通过对预训练模型经过调整后得到的模型，包括：

步骤S4021：将所述待推荐用户的用户标识和所述兴趣标签输入至预训练模型，得到所述待推荐用户的第二用户特征向量。

步骤S4022：将所述第二多媒体集合中第二多媒体的标识、评论信息和简介信息输入至所述预训练模型，得到所述第二多媒体的第二多媒体特征向量。

这里，步骤S4022在实现时，包括：

步骤S40221：将所述第二多媒体的标识、评论信息和简介信息输入至所述预训练模型，获取所述第二多媒体的评论权重值和简介权重值。

步骤S40222：根据所述第二多媒体的标识、评论权重值和简介权重值，确定所述第二多媒体特征向量。

步骤S4023：基于第二用户特征向量和所述第二多媒体特征向量，确定所述第二多媒体的第一预测评分。

步骤S4024：当所述第一预测评分与实际评分不满足预设条件时，根据所述第一预测评分和所述实际评分对所述预训练模型进行调整。

步骤S4025：当所述第二预测评分与实际评分满足预设条件时，将经过调整后的预训练模型确定为第一模型。

步骤S4026：至少基于第一模型、所述兴趣标签和第一多媒体集合的特征信息，确定第一候选推荐子集；其中，所述第一多媒体集合至少包括所述待推荐多媒体中未被所述待推荐用户浏览的第一多媒体。

步骤S4027：基于第二模型、第二多媒体集合和所述第一多媒体集合，从所述第一多媒体集合中确定第二候选推荐子集；其中，所述第二多媒体集合至少包括已被所述待推荐用户浏览的第二多媒体。

步骤S4028：基于所述第一候选推荐子集和所述第二候选推荐子集，确定候选推荐集。

步骤S403：至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果。

步骤S404：将所述目标推荐结果发送给所述待推荐用户的终端。

在本实施例中，使用待推荐用户已浏览过的多媒体标识、评论信息和简介信息，结合待推荐用户的兴趣标签训练预训练模型，并在根据预训练模型得到的预测评分与实际评分不满足预设条件时调整预训练模型，直至满足预设条件时确定调整后的预训练模型为第一模型，以此确保所获得的第一模型更加精准和可靠，再从基于第一模型和第二模型获得的候选推荐集中基于待推荐用户的类别信息确定更加有针对性的目标推荐结果，进而使得该目标推荐结果更能符合待推荐用户的兴趣偏好和需求，提升用户体验。

基于前述实施例，本实施例再提供一种推荐方法，图5为本申请实施例提供的推荐方法的又一实现流程示意图，如图5所示，所述方法包括：

步骤S501：基于获取到的待推荐用户的DPI数据，确定所述待推荐用户的兴趣标签；其中，所述DPI数据表征所述待推荐用户的浏览行为。

步骤S502：基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集。

步骤S503：至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果。

步骤S5031：根据预设规则确定待推荐用户的用户类别；其中，所述用户类别可以为粘性用户或一般用户，可以根据待推荐用户最近浏览多媒体的总时长和打开多媒体视频网站的次数进行区分，将浏览多媒体总时长大于某个阈值或打开多媒体的次数大于某个阈值的对应用户，认为是粘性用户，反之为一般用户。

步骤S5032：基于所述待推荐用户的用户标识、所述兴趣标签、所述候选推荐集中候选多媒体的属性信息和观看时间戳，从所述候选推荐集中确定所述用户类别对应的目标推荐结果；其中，所述候选多媒体的属性信息至少包括所述候选多媒体的标识、时长信息和语言信息，所述观看时间戳至少表征所述候选多媒体的观看时刻。

其中，针对粘性用户，推荐的目的是进一步提高该粘性用户在多媒体上停留的时间，而对于一般用户，主要是通过向其推荐感兴趣的内容，以让该一般用户升级为粘性用户。

步骤S504：将所述目标推荐结果发送给所述待推荐用户的终端。

这里，步骤S504在实现时，可以为：当所述目标推荐结果是按百分比从大到小排序后的推荐内容，则所述待推荐用户为粘性用户，将所述目标推荐结果发送至粘性用户的终端；当所述目标推荐结果是按评分从大到小排序后的推荐内容，则所述待推荐用户为一般用户，将所述目标推荐结果发送至一般用户的终端。

在本实施例中，在基于DPI数据确定的待推荐用户的兴趣标签、两种模型以及待推荐多媒体的特征信息确定出候选推荐集时，根据待推荐用户是粘性用户还是一般用户来从候选视频集中确定出更具有针对性的推荐内容以进行推荐，使得待推荐用户能快速、精准地得到符合自身兴趣爱好和特色的推荐内容，有效提高了用户体验。

基于前述的实施例，本实施例再提供一种推荐装置，且所述推荐装置是一种基于DPI数据和用户在视频网站的行为数据，并使用多层网络模型的视频推荐融合方案的装置。

由于DPI数据中存在着大量的用户上网行为，而视频网站中的行为相对较少，比如用户最近经常浏览过母婴类的新闻，购买过母婴类的商品，这些行为无法体现在视频网站中，但是通过分析DPI数据可以很好得挖掘，据此可以在视频网站中给该用户推荐育儿相关的视频。另外，对于视频网站的新用户往往没有视频交互行为，这时候通过挖掘DPI数据，可以达到很好的推荐效果。

因此，本实施例提供的一种推荐装置，图6A为本申请实施例提供的推荐装置的一种示意图，如图6A所示，所述推荐装置600包括用户画像模块601、候选模块602和排序模块603，其中：

所述用户画像模块601是一种勾画目标用户、联系用户诉求与设计方向的有效工具，更能体现出用户自身的特色与兴趣偏好。由于用户兴趣的易变性及短期性，需要考虑时间衰减因子，类别中对应的浏览条目的兴趣的权重值可以表示为U＝N₀e^-αt，其中，N₀为基础兴趣权重，一般为常数，α为衰减因子，N为经过时间t之后的兴趣权重。

DPI数据中的每条数据都对应一个类别，从用户的浏览行为统计出用户关注最多的类别即可认为用户对此类别最感兴趣，可以使用公式

来计算,其中i∈c，i表示对应的浏览条目，c表示类别，α为衰减因子，t_i为当前时间与浏览时间的差值，据此可以统计出每个类别对应的兴趣值。取兴趣值最大的前3个类别，即TOP 3对应的兴趣标签。比如统计出用户浏览母婴，动漫，武侠的行为最多，则TOP3的兴趣标签为母婴，动漫，武侠。对于视频网站中出现的新用户，可以直接根据DPI数据中挖掘出的相关兴趣进行推荐。

此外，本实施例中的用户与前述实施例中的待推荐用户对应，本实施例中的TOP 3对应的兴趣标签与前述实施例中的所述待推荐用户的兴趣标签对应，本实施例中确定TOP3对应的兴趣标签的过程与前述实施例中确定所述待推荐用户的兴趣标签的过程对应。

图6B为本申请实施例提供的推荐装置中候选模块的结构示意图，如图6B所示，候选模块602主要基于交叉融合方法将多种结果组合起来，包括隐语义模型和item2Vec方法，将两者的结果取并集作为输出结果。

其中，图6C为本申请实施例提供的推荐装置中隐语义模型的结构示意图，如图6C所示，所述隐语义模型基于文本卷积网络挖掘用户级别的特征和视频级别的特征。在挖掘用户级别的特征时，本实施例加入的是用户ID和基于DPI数据挖掘的用户兴趣标签，通过挖掘DPI数据中相关数据更能准确地刻画用户特征。在挖掘视频级别的特征时，加入了该视频的所有评论信息及视频的简介，采用双通道的卷积网络训练方法能够将评论信息和视频信息的权重很好地训练出来，更能准确刻画电影特征。最后将表示用户的向量和视频的向量相乘计算得出预测评分；其中，本实施例中视频的所有评论信息及视频的简介与前述实施例中的所述第一多媒体集合中第一多媒体的评论信息和简介信息对应。

并且，所述隐语义模型是训练好的模型，在所述隐语义模型未训练好时为预训练语义模型，参照图6C，将用户ID、用户兴趣标签、已观看电影的ID、已观看电影的评论信息和已观看电影的简介信息作为所述预训练语义模型的输入，将用户ID、用户兴趣标签分别进行词嵌入操作，然后进行用户特征拼接，获取用户特征向量；其中，本实施例中的用户与前述实施例中的待推荐用户对应，本实施例中的已观看电影与前述实施例中的所述第二多媒体对应，本实施例中的ID与前述实施例中的所述标识对应，本实施例中的用户特征向量与前述实施例中的所述第二用户特征向量。

本实施例中对预训练语义模型进行训练和调整的过程与实施例中对所述预训练模型进行训练和调整的过程对应，并且所述预训练语义模型进行训练时利用的损失函数是经典的均方误差(MSE)，且在均方误差的基础上加入了L2正则项，用以防止模型过拟合。损失函数可以表示为：

其中，L(U,V)为损失函数，N为总用户数，M为总视频数，r_ij表示用户对视频的真实评分，u_i表示用户的特征向量，u_i ^T为u_i的转置矩阵，v_j表示视频的特征向量，

表示用户的特征向量与视频的特征向量做内积，即预测评分；λ_u为用户正则项的系数，是个常数，一般取1；λ_v为视频正则项的系数，可以取常数，一般为1。然后采用梯度下降法求解。

也可以参照图6C，将已观看电影的ID进行词嵌入操作，同时将电影评论信息和电影简介信息分别进行卷积操作和最大池化处理，分别获取电影特征1和电影特征2，将所述电影特征1、电影特征2以及已观看电影的ID进行拼接后，获取电影特征向量，再将所述用户特征向量和所述电影特征向量相乘，获取预测评分；其中，本实施例中的电影特征1、电影特征2与前述实施例中的所述第二多媒体的评论权重值和简介权重值对应，所述本实施例中的电影特征向量与前述实施例中的所述第二多媒体特征向量对应，本实施例中的预测评分与前述实施例中的所述第一预测评分对应。

当所述预测评分与所述实际评分的差值不小于一预设阈值时，则对所述预训练语义模型进行调整，直至所述预测评分与所述实际评分的差值小于所述预设阈值时，将经过调整的预训练语义模型确定为隐语义模型。

这里，所述预测评分与所述实际评分的差值越小，表明预测评分越接近实际评分，从而说明该隐语义模型是具备准确性和可靠性的用户兴趣推荐模型；其中，本实施例中的预测评分与所述实际评分的差值不小于一预设阈值与前述实施例中的所述第一预测评分与实际评分不满足预设条件对应，本实施例中的第i个用户与前述实施例中的所述待推荐用户对应，本实施例中的第j个视频与前述实施例中的第二多媒体对应，本实施例中的M个视频与前述实施例中的所述第二多媒体集合对应，本实施例中的u_i与前述实施例中的所述第二用户特征向量对应，本实施例中的v_j与前述实施例中的所述第二多媒体特征向量对应。

由于梯度下降是迭代法的一种，可以用于求解线性或非线性的最小二乘问题，因此本实施例在求解损失函数的最小值时，可以通过梯度下降法来一步步的迭代求解，从而得到最小化的损失函数和模型参考值。

此处可以参照图6C，将待推荐电影的ID、待推荐电影的评论信息和待推荐电影的简介信息，以及用户ID、用户兴趣标签作为所述隐语义模型的输入，得到待推荐电影的电影特征向量和表示用户的向量，将所述待推荐电影特征向量和表示用户的向量相乘，得到待推荐电影的预测评分。

如果所述预测评分与该待推荐电影的实际评分的差值小于预设阈值，将所述待推荐电影确定为候选视频，从而在所有待推荐电影中确定出用户感兴趣的H个电影作为TOPH个候选视频集，H为正整数；其中，本实施例中TOPH个候选视频集的确定过程与前述实施例中所述第一候选推荐子集的确定过程对应。

此外，本实施例中的待推荐电影特征向量与前述实施例中的所述第一多媒体特征向量对应，本实施例中的待推荐电影的预测评分与前述实施例中的所述第一预测评分对应，本实施例中的所有待推荐电影与前述实施例中的所述第一多媒体集合对应，本实施例中的待推荐电影与前述实施例中的所述第一多媒体对应，本实施例中的用户兴趣标签与前述实施例中的所述待推荐用户的兴趣标签对应，本实施例中的topH个候选视频集与前述实施例中的所述第一候选推荐子集对应。

Item2vec与word2vec的方法基本类似，可以将word2vec中的方法迁移到了推荐装置中，即其算法思想是通过输入用户观看的前L-1个视频的表示向量，来预测第L个视频的向量。

传统的YouTube提出的基于神经网络的个性化视频推荐系统中，是以用户人口统计学特征、用户行为特征及视频特征作为输入，以用户是否完成观看作为标签，通过训练得到用户特征向量，再以用户特征向量与视频特征向量的夹角余弦值作为相似度，以此获得的预测结果存在多样性不足的问题。

因此，为了增加候选集的多样性，本实施例借助item2vec思想，通过浅层神经网络结合(skip-gram with negative sampling，SGNS)训练之后，将用户观看的前L-1个视频映射到固定维度的向量空间中，通过向量的运算来衡量用户观看过的视频与未观看过的视频之间的相似度，从而从用户未观看的视频中确定出符合用户兴趣爱好的视频。

候选模块602利用隐语义模型和item2vec方法分别得出对应的topH和topG个候选视频集，然后将两种方法得到的视频集合并，作为最终的视频候选集。两种方法结合能够查漏补缺，在一定程度上保证了候选集的准确性和多样性；其中，H和G分别为大于0的正整数。

此外，本实施例中的topG个候选视频集的确定过程与实施例中的所述第二候选推荐子集的确定过程对应，本实施例中的topG个候选视频集与前述实施例中的所述第二候选推荐子集对应，本实施例中的隐语义模型与前述实施例中的所述第一模型对应，本实施例中的item2vec方法与前述实施例中的所述第二模型对应，本实施例中的预训练语义模型与前述实施例中的所述预训练模型对应，本实施例中的最终的视频候选集与前述实施例中的所述候选推荐集对应。

排序模块603首先根据特定的规则将用户分成二个类别，分别是粘性用户和一般用户，比如可以根据用户最近观影视频的总时长和打开视频网站的次数进行区分，当观影视频总时长大于某个阈值或者打开视频次数大于某个阈值，可以认为是粘性用户，反之为一般用户；其中，本实施例中的粘性用户或一般用户与前述实施例中的所述待推荐用户的用户类别对应。

针对粘性用户，推荐装置的目的是提高用户在视频上停留的时长，而对于一般用户主要是推荐他们很感兴趣的内容，让这些用户升级为粘性用户。

这里，排序模型603使用用户ID，用户的兴趣标签，视频的ID，视频时长，视频语言，导演主演，观影的时间戳，作为输入特征，对于粘性用户，可以将他们在视频上停留的时间占视频总时间的百分比作为标签，将时长百分比划为1,2,3,4,5共5个类别；而对于一般用户，将用户对电影的评分作为标签；其中，本实施例中的视频或电影与前述实施例中的所述第一多媒体对应。

图6D为本申请实施例提供的推荐装置中排序模块的结构示意图，如图6D所示，排序模型603的结构可以参考图6D所示的神经网络，该神经网络有4层，第一层是一个嵌入embedding拼接层，将用户特征、电影特征以及观影时间戳进行特征拼接，第二层和第三层均为全连接层，其神经元的个数可以分别为756和128，并且第二层和第三层的激活函数均为relu，最后一层是输出层，所述输出层使用的激活函数为softmax，整个深度排序模型使用的优化器为随机梯度下降(Stochastic Gradient Descent，SGD)，用以通过对已有的数据进行拟合迭代训练出相应的参数；其中，本实施例中的用户特征与前述实施例中的所述待推荐用户的用户标识、所述兴趣标签对应，本实施例中的电影特征与前述实施例中的所述候选推荐集中候选多媒体的属性信息对应，本实施例中的观影时间戳与前述实施例中的观看时间戳对应。

使用图6D所示的结构进行预测时，使用候选模块602的输出作为输入，如果是粘性用户，则预测其观影时长百分比，按百分比从大到小排列作为最终推荐结果；如果是一般用户则预测其对电影的评分，按评分从大到小排列作为最终推荐结果。

其中，本实施例中的最终推荐结果的确定过程与实施例中的所述目标推荐结果的确定过程对应，本实施例中的最终推荐结果与前述实施例中的目标推荐结果对应。

本实施例基于DPI数据挖掘用户的兴趣补充用户维度特征，解决了传统的用户维度人口统计学信息的真实性问题，并能够很好地解决视频网站中的新用户问题，也在候选模块的文本卷积网络中融入了用户的兴趣标签和视频的评论信息，并通过双通道模型训练出各自的权重，使得模型的特征更加真实和丰富，也使得采用的多策略融合在保证召回率的同时也提高了推荐集的多样性，此外，在排序模块使用对用户进行分类的思想，从而得到更符合用户兴趣爱好以及更具有针对性的推荐结果，有效提高了用户体验。

基于前述实施例的发明构思，本实施例提供一种推荐装置，图7为本申请实施例提供的推荐装置的另一示意图，如图7所示，所述装置700至少包括第一确定模块701、第二确定模块702、第三确定模块703和发送模块704，其中：

所述第一确定模块701，用于基于获取到的待推荐用户的DPI数据，确定所述待推荐用户的兴趣标签；其中，所述DPI数据表征所述待推荐用户的浏览行为；

所述第二确定模块702，用于基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集；

所述第三确定模块703，用于至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果；

所述发送模块704，用于将所述目标推荐结果发送给所述待推荐用户的终端。

在本实施例中，所述推荐装置700还包括第一确定单元和第二确定单元，其中：

所述第一确定单元，用于基于所述DPI数据中每个类别对应的浏览条目的浏览时间，确定所述每个类别对应的兴趣值。

所述第二确定单元，用于将所确定出的兴趣值中满足预设条件的类别，确定为所述待推荐用户的兴趣标签。

在本实施例中，所述推荐装置700还包括第三确定单元、第四确定单元和第五确定单元，其中：

所述第三确定单元，用于至少基于第一模型、所述兴趣标签和第一多媒体集合的特征信息，确定第一候选推荐子集；其中，所述第一多媒体集合至少包括所述待推荐多媒体中未被所述待推荐用户浏览的第一多媒体。

所述第四确定单元，用于基于第二模型、第二多媒体集合和所述第一多媒体集合，从所述第一多媒体集合中确定第二候选推荐子集；其中，所述第二多媒体集合至少包括已被所述待推荐用户浏览的第二多媒体。

所述第五确定单元，用于基于所述第一候选推荐子集和所述第二候选推荐子集，确定候选推荐集。

在本实施例中，所述特征信息至少包括标识、评论信息和简介信息，对应地，所述推荐装置700还包括第一获取单元、第二获取单元和第六确定单元，其中：

所述第一获取单元，用于将所述待推荐用户的用户标识和所述兴趣标签输入至所述第一模型，得到所述待推荐用户的第一用户特征向量。

所述第二获取单元，用于将所述第一多媒体集合中第一多媒体的标识、评论信息和简介信息输入至所述第一模型，得到所述第一多媒体的第一多媒体特征向量。

所述第六确定单元，用于基于所述第一用户特征向量和所述第一多媒体特征向量，确定第一候选推荐子集。

在本实施例中，所述推荐装置700还包括第三获取单元、第四获取单元、第七确定单元、第一调整单元和第八确定单元，其中：

所述第三获取单元，用于将所述待推荐用户的用户标识和所述兴趣标签输入至预训练模型，得到所述待推荐用户的第二用户特征向量。

所述第四获取单元，用于将所述第二多媒体集合中第二多媒体的标识、评论信息和简介信息输入至所述预训练模型，得到所述第二多媒体的第二多媒体特征向量。

所述第七确定单元，用于基于第二用户特征向量和所述第二多媒体特征向量，确定所述第二多媒体的第一预测评分。

所述第一调整单元，用于当所述第一预测评分与实际评分不满足预设条件时，根据所述第一预测评分和所述实际评分对所述预训练模型进行调整。

所述第八确定单元，用于当所述第二预测评分与实际评分满足预设条件时，将经过调整后的预训练模型确定为第一模型。

在本实施例中，所述推荐装置700还包括第五获取单元、第九确定单元，其中：

所述第五获取单元，用于将所述第二多媒体的标识、评论信息和简介信息输入至所述预训练模型，获取所述第二多媒体的评论权重值和简介权重值。

所述第九确定单元，用于根据所述第二多媒体的标识、评论权重值和简介权重值，确定所述第二多媒体特征向量。

在本实施例中，所述推荐装置700还包括第十确定单元、第十一确定单元，其中：

所述第十确定单元，用于基于所述第二模型、第二多媒体集合和所述第一多媒体集合，确定所述第二多媒体集合中第二多媒体与所述第一多媒体集合中第一多媒体之间的相似度。

所述第十一确定单元，用于基于所述相似度，从所述第一多媒体集合中确定第二候选推荐子集。

在本实施例中，所述推荐装置700还包括第十二确定单元、第十三确定单元，其中：

所述第十二确定单元，用于根据预设规则确定待推荐用户的用户类别。

所述第十三确定单元，用于基于所述待推荐用户的用户标识、所述兴趣标签、所述候选推荐集中候选多媒体的属性信息和观看时间戳，从所述候选推荐集中确定所述用户类别对应的目标推荐结果。

在实际应用中，上述第一确定模块701、第二确定模块702、第三确定模块703和发送模块704可由位于推荐装置700上的处理器实现，具体为中央处理器(CPU，CentralProcessing Unit)、微处理器(MPU，Microprocessor Unit)、数字信号处理器(DSP，DigitalSignal Processing)或现场可编程门阵列(FPGA，Field Programmable Gate Array)等实现。

基于前述实施例的发明构思，本实施例提供一种推荐设备，图8为本申请实施例提供的推荐设备的结构示意图，如图8所示，所述设备800至少包括：存储器801、通信总线802及处理器803，其中：

所述存储器801，用于存储推荐程序。

所述通信总线802，用于实现所述处理器和所述存储器之间的通信连接。

所述处理器803，用于执行所述存储器中存储的推荐程序，以实现如前述实施例中任一个实施例所述的推荐方法的步骤。

对应地，本实施例再提供一种计算机存储介质，所述计算机存储介质存储有推荐程序，所述推荐程序被处理器执行时实现如前述实施例中任一个实施例所述的推荐方法的步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、装置、或计算机程序产品。因此，本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、装置、设备、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。

Claims

1.一种推荐方法，其特征在于，所述方法包括：

基于获取到的待推荐用户的深度报文检测DPI数据，确定所述待推荐用户的兴趣标签；其中，所述DPI数据表征所述待推荐用户的浏览行为；

将所述目标推荐结果发送给所述待推荐用户的终端；

其中，所述基于获取到的待推荐用户的DPI数据，确定所述待推荐用户的兴趣标签，包括：基于所述DPI数据中每个类别对应的浏览条目的浏览时间，确定所述每个类别对应的兴趣值；将所确定出的兴趣值中满足预设条件的类别，确定为所述待推荐用户的兴趣标签；

其中，所述基于至少两种模型、所述兴趣标签和待推荐多媒体的特征信息，确定候选推荐集，包括：至少基于第一模型、所述兴趣标签和第一多媒体集合的特征信息，确定第一候选推荐子集；其中，所述第一多媒体集合至少包括所述待推荐多媒体中未被所述待推荐用户浏览的第一多媒体；基于第二模型、第二多媒体集合和所述第一多媒体集合，从所述第一多媒体集合中确定第二候选推荐子集；其中，所述第二多媒体集合至少包括已被所述待推荐用户浏览的第二多媒体；基于所述第一候选推荐子集和所述第二候选推荐子集，确定候选推荐集；

其中，所述特征信息至少包括标识、评论信息和简介信息，对应地，所述至少基于第一模型、所述兴趣标签和第一多媒体集合的特征信息，确定第一候选推荐子集，包括：将所述待推荐用户的用户标识和所述兴趣标签输入至所述第一模型，得到所述待推荐用户的第一用户特征向量；将所述第一多媒体集合中第一多媒体的标识、评论信息和简介信息输入至所述第一模型，得到所述第一多媒体的第一多媒体特征向量；基于所述第一用户特征向量和所述第一多媒体特征向量，确定第一候选推荐子集；

其中，所述方法还包括：将所述待推荐用户的用户标识和所述兴趣标签输入至预训练模型，得到所述待推荐用户的第二用户特征向量；将所述第二多媒体集合中第二多媒体的标识、评论信息和简介信息输入至所述预训练模型，得到所述第二多媒体的第二多媒体特征向量；基于第二用户特征向量和所述第二多媒体特征向量，确定所述第二多媒体的第一预测评分；当所述第一预测评分与实际评分不满足预设条件时，根据所述第一预测评分和所述实际评分对所述预训练模型进行调整；

当基于调整后的预训练模型得到的第二预测评分与实际评分满足预设条件时，将经过调整后的预训练模型确定为第一模型；

其中，所述基于第二模型、第二多媒体集合和所述第一多媒体集合，从所述第一多媒体集合中确定第二候选推荐子集，包括：基于所述第二模型、第二多媒体集合和所述第一多媒体集合，确定所述第二多媒体集合中第二多媒体与所述第一多媒体集合中第一多媒体之间的相似度；基于所述相似度，从所述第一多媒体集合中确定第二候选推荐子集；

其中，所述至少基于所述待推荐用户的类别信息，从所述候选推荐集中确定目标推荐结果，包括：根据预设规则确定待推荐用户的用户类别；基于所述待推荐用户的用户标识、所述兴趣标签、所述候选推荐集中候选多媒体的属性信息和观看时间戳，从所述候选推荐集中确定所述用户类别对应的目标推荐结果；其中，所述候选多媒体的属性信息至少包括所述候选多媒体的标识、时长信息和语言信息，所述观看时间戳至少表征所述候选多媒体的观看时刻。

2.根据权利要求1所述的方法，其特征在于，所述将所述第二多媒体集合中第二多媒体的标识、评论信息、简介信息输入至所述预训练模型，得到所述第二多媒体的第二多媒体特征向量，包括：

将所述第二多媒体的标识、评论信息和简介信息输入至所述预训练模型，获取所述第二多媒体的评论权重值和简介权重值；

根据所述第二多媒体的标识、评论权重值和简介权重值，确定所述第二多媒体特征向量。

3.一种推荐装置，其特征在于，所述装置至少包括：第一确定模块、第二确定模块、第三确定模块和发送模块，其中：

所述发送模块，用于将所述目标推荐结果发送给所述待推荐用户的终端；

其中，所述推荐装置还包括第一确定单元和第二确定单元，其中：所述第一确定单元，用于基于所述DPI数据中每个类别对应的浏览条目的浏览时间，确定所述每个类别对应的兴趣值；所述第二确定单元，用于将所确定出的兴趣值中满足预设条件的类别，确定为所述待推荐用户的兴趣标签；

其中，所述推荐装置还包括第三确定单元、第四确定单元和第五确定单元，其中：所述第三确定单元，用于至少基于第一模型、所述兴趣标签和第一多媒体集合的特征信息，确定第一候选推荐子集；其中，所述第一多媒体集合至少包括所述待推荐多媒体中未被所述待推荐用户浏览的第一多媒体；所述第四确定单元，用于基于第二模型、第二多媒体集合和所述第一多媒体集合，从所述第一多媒体集合中确定第二候选推荐子集；其中，所述第二多媒体集合至少包括已被所述待推荐用户浏览的第二多媒体；所述第五确定单元，用于基于所述第一候选推荐子集和所述第二候选推荐子集，确定候选推荐集；

其中，所述特征信息至少包括标识、评论信息和简介信息，对应地，所述推荐装置还包括第一获取单元、第二获取单元和第六确定单元，其中：所述第一获取单元，用于将所述待推荐用户的用户标识和所述兴趣标签输入至所述第一模型，得到所述待推荐用户的第一用户特征向量；所述第二获取单元，用于将所述第一多媒体集合中第一多媒体的标识、评论信息和简介信息输入至所述第一模型，得到所述第一多媒体的第一多媒体特征向量；所述第六确定单元，用于基于所述第一用户特征向量和所述第一多媒体特征向量，确定第一候选推荐子集；

其中，所述推荐装置还包括第三获取单元、第四获取单元、第七确定单元、第一调整单元和第八确定单元，其中：所述第三获取单元，用于将所述待推荐用户的用户标识和所述兴趣标签输入至预训练模型，得到所述待推荐用户的第二用户特征向量；所述第四获取单元，用于将所述第二多媒体集合中第二多媒体的标识、评论信息和简介信息输入至所述预训练模型，得到所述第二多媒体的第二多媒体特征向量；所述第七确定单元，用于基于第二用户特征向量和所述第二多媒体特征向量，确定所述第二多媒体的第一预测评分；所述第一调整单元，用于当所述第一预测评分与实际评分不满足预设条件时，根据所述第一预测评分和所述实际评分对所述预训练模型进行调整；所述第八确定单元，用于当基于调整后的预训练模型得到的第二预测评分与实际评分满足预设条件时，将经过调整后的预训练模型确定为第一模型；

其中，所述推荐装置还包括第十确定单元、第十一确定单元，其中：所述第十确定单元，用于基于所述第二模型、第二多媒体集合和所述第一多媒体集合，确定所述第二多媒体集合中第二多媒体与所述第一多媒体集合中第一多媒体之间的相似度；所述第十一确定单元，用于基于所述相似度，从所述第一多媒体集合中确定第二候选推荐子集；

其中，所述推荐装置还包括第十二确定单元、第十三确定单元，其中：所述第十二确定单元，用于根据预设规则确定待推荐用户的用户类别；所述第十三确定单元，用于基于所述待推荐用户的用户标识、所述兴趣标签、所述候选推荐集中候选多媒体的属性信息和观看时间戳，从所述候选推荐集中确定所述用户类别对应的目标推荐结果；其中，所述候选多媒体的属性信息至少包括所述候选多媒体的标识、时长信息和语言信息，所述观看时间戳至少表征所述候选多媒体的观看时刻。

4.一种推荐设备，其特征在于，所述设备至少包括：存储器、通信总线及处理器，其中：

所述存储器，用于存储推荐程序；

所述处理器，用于执行所述存储器中存储的推荐程序，以实现如权利要求1或2所述的推荐方法的步骤。

5.一种计算机存储介质，其特征在于，所述计算机存储介质存储有推荐程序，所述推荐程序被处理器执行时实现如权利要求1或2所述的推荐方法的步骤。