CN103577505B

CN103577505B - 媒体文件的兴趣度预测方法和系统

Info

Publication number: CN103577505B
Application number: CN201210285205.XA
Authority: CN
Inventors: 华有为
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd; Tencent Cloud Computing Beijing Co Ltd
Priority date: 2012-08-10
Filing date: 2012-08-10
Publication date: 2018-07-13
Anticipated expiration: 2032-08-10
Also published as: CN103577505A

Abstract

本发明提供了一种媒体文件的兴趣度预测方法和系统。所述方法包括：获取媒体文件的行为数据；根据所述行为数据估算所述媒体文件的兴趣度；向媒体文件的播放端反馈所述估算的兴趣度。所述系统包括：数据获取模块，用于获取媒体文件的行为数据；估算模块，用于根据所述行为数据估算所述媒体文件的兴趣度；反馈模块，用于向播放客户端反馈所述估算的兴趣度。采用本发明能提高兴趣度的准确性。

Description

媒体文件的兴趣度预测方法和系统

技术领域

本发明涉及互联网技术，特别是涉及一种媒体文件的兴趣度预测方法和系统。

背景技术

随着互联网的发展，人们可以通过互联网中各种资源网站等方式获取到所需要的资源。例如，视频在线播放网站提供了各种视频文件以供访问该网站的用户观看；音乐在线播放网站等音频资源网站也提供了各种音频文件。人们在通过资源网站访问视频文件以及音频文件等媒体文件时，还会根据自己的喜好对播放的媒体文件进行评分，进而将这一评价作为用户对该媒体文件的兴趣度。

兴趣度表征了大量用户对媒体文件的喜欢程度，而用户对媒体文件的评分是用户对媒体文件的主观评价，通常是用户随意输入的数值，进而使得资源网站所获取到的媒体文件兴趣度非常地不准确。

发明内容

基于此，提供一种能提高准确性的媒体文件的兴趣度预测方法。

此外，还有必要提供一种能提高准确性的媒体文件兴趣度预测系统。

一种媒体文件的兴趣度预测方法，包括如下步骤：

获取媒体文件的行为数据；

根据所述行为数据估算所述媒体文件的兴趣度；

向媒体文件的播放端反馈所述估算的兴趣度。

一种媒体文件的兴趣度预测系统，包括：

数据获取模块，用于获取媒体文件的行为数据；

估算模块，用于根据所述行为数据估算所述媒体文件的兴趣度；

反馈模块，用于向播放客户端反馈所述估算的兴趣度。

上述媒体文件的兴趣度预测方法和系统中，获取媒体文件所对应的行为数据，根据行为数据来进行兴趣度的估算，进而将估算得到的兴趣度反馈给播放端，由于兴趣度是通过行为数据估算得到的，用户在播放媒体文件中的操作反映了用户对媒体文件的喜好，因此，通过媒体文件的行为数据所估算得到的兴趣度更贴近用户的真实意图，提高了兴趣度的准确性。

附图说明

图1为一个实施例中媒体文件的兴趣度预测方法的流程图；

图2为一个实施例中根据行为数据估算媒体文件的兴趣度的方法流程图；

图3为另一个实施例中根据行为数据估算媒体文件的兴趣度的方法流程图；

图4为另一个实施例中向媒体文件的播放端反馈估算的兴趣度的方法流程图；

图5为一个实施例中媒体文件的兴趣度预测系统的结构示意图；

图6为一个实施例中估算模块的结构示意图；

图7为另一个实施例中估算模块的结构示意图；

图8为一个实施例中反馈模块的结构示意图。

具体实施方式

如图1所示，在一个实施例中，一种媒体文件的兴趣度预测方法，包括如下步骤：

步骤S110，获取媒体文件的行为数据。

本实施例中，媒体文件可以是音频文件或视频文件。行为数据记录了媒体文件播放过程中触发的各种操作行为，可以是媒体文件播放过程中产生的数据，例如，媒体文件的播放日志。

在另一个实施例中，上述步骤S110之前还包括：通过播放端采集播放的媒体文件中触发的操作行为，根据操作行为生成相应的行为数据，并上传生成的行为数据。

本实施例中，媒体文件的播放端用于播放媒体文件，可以是安装于终端设备中的播放客户端，例如，播放器，也可以是网页页面中的播放插件，用户可通过播放端所提供的播放界面实现媒体文件的观看或收听。在播放的媒体文件中触发的操作行为包括了对播放界面上进度条的拖动、停止播放的操作等，通过触发的操作行为生成相应的行为数据，该行为数据用于记录媒体文件的播放状况，例如，通过播放界面上进度条的拖动操作得到的进度条的拖动距离和拖动次数，通过停止播放的操作得到的用户在播放媒体文件过程中播放时长。

在根据操作行为得到相应的行为数据之后，还将通过互联网络进行行为数据的上传。

例如，媒体文件的播放端为资源网站中的播放插件，用户通过资源网站的播放插件进行媒体文件的播放。在媒体文件的播放过程中，播放插件将采集播放界面中触发的操作行为，进而根据操作行为得到相应的行为数据，并上传。由于通过资源网站的播放插件进行媒体文件播放的用户是海量的，因此，上传的行为数据也将是海量的，这将使得媒体文件的兴趣度预测得到了海量数据的支持，进而提高预测的准确性。

步骤S130，根据行为数据估算媒体文件的兴趣度。

本实施例中，通过每一媒体文件的行为数据可以获知多个用户对该媒体文件的喜欢程度，即兴趣度。例如，媒体文件的行为数据中包括了播放时长这一信息，播放时长的大小直接体现了用户对媒体文件的喜欢程度，若播放时长的数值较小，则说明该媒体文件可能缺乏吸引力，观看该媒体文件的用户不喜欢这一媒体文件，若播放时长的数值较大，则说明该媒体文件有吸引力，得到了用户的喜欢。因此根据行为数据可以准确地估算得到用户对媒体文件的兴趣度，进而实现媒体文件的客观评价。

如图2所示，在一个实施例中，上述步骤S130的具体过程为：

步骤S131，从行为数据提取媒体文件的影响因子。

本实施例中，从行为数据包含的信息中得到行为数据所对应的影响因子。具体的，行为数据中包括了进度条的拖动距离和拖动次数、播放时长等信息，相应的，进度条的拖动距离、拖动次数以及播放时长这些行为数据所包含的信息均为媒体文件的影响因子，该影响因子决定了媒体文件中兴趣度的大小。

步骤S133，对媒体文件的影响因子进行加权处理得到对应的兴趣度。

本实施例中，媒体文件的影响因子均有与其对应的权值，影响因子在兴趣度预测过程中重要程度将决定了权值的大小。在某一媒体文件的兴趣度预测中，从行为数据中提取得到影响因子之后，将获取每一影响因子对应的权值，进而通过权值对影响因子进行加权计算得到该媒体文件所对应的兴趣度。

如图3所示，在另一个实施例中，上述步骤S133之后还包括如下步骤：

步骤S135，获取播放端中通过用户操作得到的媒体文件评分，并根据媒体文件评分得到相应的阈值范围。

本实施例中，用户操作可以是用户在播放端所进行的媒体文件评分的输入操作、媒体文件评价的选定操作等。在用户通过播放端进行媒体文件的播放的过程中常常根据自己对媒体文件的评价输入相应的媒体文件评分，以供其他用户参考。而在兴趣度预测的初始阶段，由于权值所取数值是否合适还有待评估，因此需结合用户对媒体文件的评分进行权值所取数值的评估。

具体的，获取播放端中用户对媒体文件评分，以根据媒体文件评分确定阈值范围，兴趣度预测的初始阶段中预测得到的兴趣度应当处于阈值范围所限定的数值范围内，以避免由于权值所取数值不适当而造成兴趣度的预测出现较大偏差。例如，阈值范围可以是由媒体文件评分与一定系数之间的乘积所得到的上限值和下限值组成的。

步骤S137，判断媒体文件对应的兴趣度是否处于阈值范围，若否，则进入步骤S139，若是，则进入步骤S150。

本实施例中，若判断到预测得到的兴趣度处于阈值范围中，则说明该兴趣度是合适的，并且权值所取数值也是较为适当的，可以不对权值进行调整；若判断到预测得到的兴趣度未处于阈值范围中，则说明该兴趣度出现了偏差，需要对影响因子所对应的权值进行数值调整，进而保证兴趣度的准确性。

步骤S139，根据阈值范围调整媒体文件的影响因子所对应的权值。

本实施例中，按照阈值范围进行影响因子对应权值的数值调整，以使得根据媒体文件的影响因子和对应的权值进行加权计算所得到的兴趣度处于阈值范围中。在根据阈值范围进行了权值调整之后，将再次根据调整后的权值进行加权计算得到调整后的兴趣度。

步骤S150，向媒体文件的播放端反馈估算的兴趣度。

本实施例中，进行估算兴趣度的反馈，播放端在接收到反馈的兴趣度之后将进行展示，以便于用户可通过媒体文件的播放端查看其他用户对媒体文件的兴趣度。

如图4所示，在另一个实施例中，上述步骤S150包括：

步骤S210，对估算的兴趣度进行排序得到以兴趣度和对应的媒体文件名为表项的列表。

本实施例中，根据兴趣度的大小进行排序以得到顺序排列的兴趣度以及对应的媒体文件名，并将兴趣度和对应的媒体文件名形成列表的形式。

步骤S230，向播放端返回该列表。

本实施例中，将形成的列表返回至播放端中，以向用户进行展示。

如图5所示，在一个实施例中，一种媒体文件的兴趣度预测系统，包括数据获取模块110、估算模块130以及反馈模块150。

数据获取模块110，用于获取媒体文件的行为数据。

在另一个实施例中，上述媒体文件的兴趣度预测系统还包括播放客户端。播放客户端用于采集播放的媒体文件中触发的操作行为，根据操作行为生成相应的行为数据，并上传行为数据。

本实施例中，媒体文件的播放客户端用于播放媒体文件，可以是安装于终端设备中的播放客户端，例如，播放器，也可以是网页页面中的播放插件，用户可通过播放客户端所提供的播放界面实现媒体文件的观看或收听。在播放的媒体文件中触发的操作行为包括了对播放界面上进度条的拖动、停止播放的操作等，播放客户端通过触发的操作行为生成相应的行为数据，该行为数据用于记录媒体文件的播放状况，例如，通过播放界面上进度条的拖动操作得到的进度条的拖动距离和拖动次数，通过停止播放的操作得到的用户在播放媒体文件过程中播放时长。

在根据操作行为得到相应的行为数据之后，播放客户端还将通过互联网络进行行为数据的上传。

例如，媒体文件的播放客户端为资源网站中的播放插件，用户通过资源网站的播放插件进行媒体文件的播放。在媒体文件的播放过程中，播放插件将采集播放界面中触发的操作行为，进而根据操作行为得到相应的行为数据，并上传。由于通过资源网站的播放插件进行媒体文件播放的用户是海量的，因此，上传的行为数据也将是海量的，这将使得媒体文件的兴趣度预测得到了海量数据的支持，进而提高预测的准确性。

估算模块130，用于根据行为数据估算媒体文件的兴趣度。

本实施例中，估算模块130通过每一媒体文件的行为数据可以获知多个用户对该媒体文件的喜欢程度，即兴趣度。例如，媒体文件的行为数据中包括了播放时长这一信息，播放时长的大小直接体现了用户对媒体文件的喜欢程度，若播放时长的数值较小，则说明该媒体文件可能缺乏吸引力，观看该媒体文件的用户不喜欢这一媒体文件，若播放时长的数值较大，则说明该媒体文件有吸引力，得到了用户的喜欢。因此估算模块130根据行为数据可以准确地估算得到用户对媒体文件的兴趣度，进而实现媒体文件的客观评价。

如图6所示，在一个实施例中，上述估算模块130包括提取单元131以及加权处理单元133。

提取单元131，用于从行为数据提取媒体文件的影响因子。

本实施例中，提取单元131从行为数据包含的信息中得到行为数据所对应的影响因子。具体的，行为数据中包括了进度条的拖动距离和拖动次数、播放时长等信息，相应的，进度条的拖动距离、拖动次数以及播放时长这些行为数据所包含的信息均为媒体文件的影响因子，该影响因子决定了媒体文件中兴趣度的大小。

加权处理单元133，用于对媒体文件的影响因子进行加权处理得到对应的兴趣度。

本实施例中，媒体文件的影响因子均有与其对应的权值，影响因子在兴趣度预测过程中重要程度将决定了权值的大小。在某一媒体文件的兴趣度预测中，从行为数据中提取得到影响因子之后，加权处理单元133将获取每一影响因子对应的权值，进而通过权值对影响因子进行加权计算得到该媒体文件所对应的兴趣度。

如图7所示，在另一个实施例中，上述估算模块130还包括评分处理单元135、判断单元137以及调整单元139。

评分处理单元135，用于获取通过用户操作得到的媒体文件评分，并根据媒体文件评分得到相应的阈值范围。

本实施例中，用户操作可以是用户在播放客户端所进行的媒体文件评分的输入操作、媒体文件评价的选定操作等。在用户通过播放客户端进行媒体文件的播放的过程中常常根据自己对媒体文件的评价输入相应的媒体文件评分，以供其他用户参考。而在兴趣度预测的初始阶段，由于权值所取数值是否合适还有待评估，因此需结合用户对媒体文件的评分进行权值所取数值的评估。

具体的，评分处理单元135获取播放客户端中用户对媒体文件评分，以根据媒体文件评分确定阈值范围，兴趣度预测的初始阶段中预测得到的兴趣度应当处于阈值范围所限定的数值范围内，以避免由于权值所取数值不适当而造成兴趣度的预测出现较大偏差。例如，阈值范围可以是由媒体文件评分与一定系数之间的乘积所得到的上限值和下限值组成的。

判断单元137，用于判断媒体文件对应的兴趣度是否处于阈值范围，若否，则通知调整单元139，若是，则通知加权处理单元133。

本实施例中，若判断单元137判断到预测得到的兴趣度处于阈值范围中，则说明该兴趣度是合适的，并且权值所取数值也是较为适当的，可以不对权值进行调整；若判断单元137判断到预测得到的兴趣度未处于阈值范围中，则说明该兴趣度出现了偏差，需要对影响因子所对应的权值进行数值调整，进而保证兴趣度的准确性。

调整单元139，用于根据阈值范围调整媒体文件的影响因子所对应的权值。

本实施例中，调整单元139按照阈值范围进行影响因子对应权值的数值调整，以使得根据媒体文件的影响因子和对应的权值进行加权计算所得到的兴趣度处于阈值范围中。在根据阈值范围进行了权值调整之后，加权处理单元133将再次根据调整后的权值进行加权计算得到调整后的兴趣度。

反馈模块150，用于向播放客户端反馈估算的兴趣度。

本实施例中，反馈模块150进行估算兴趣度的反馈，播放客户端在接收到反馈的兴趣度之后将进行展示，以便于用户可通过媒体文件的播放客户端查看其他用户对媒体文件的兴趣度。

上述数据获取模块110、估算模块130以及反馈模块150设置于网络服务器中，与播放客户端进行交互。

如图8所示，在一个实施例中，上述反馈模块150包括排序单元151以及传输单元153。

排序单元151，用于对估算的兴趣度进行排序得到以兴趣度和对应的媒体文件名为表项的列表。

本实施例中，排序单元151根据兴趣度的大小进行排序以得到顺序排列的兴趣度以及对应的媒体文件名，并将兴趣度和对应的媒体文件名形成列表的形式。

传输单元153，用于向播放客户端返回列表。

本实施例中，传输单元153将形成的列表返回至播放客户端中，以向用户进行展示。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体（Read-Only Memory，ROM）或随机存储记忆体（Random AccessMemory，RAM）等。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种媒体文件的兴趣度预测方法，包括如下步骤：

获取媒体文件的行为数据；

从所述媒体文件的行为数据提取所述媒体文件的影响因子；

对所述媒体文件的影响因子进行加权处理得到对应的兴趣度；

获取播放端中通过用户操作得到的媒体文件评分，并根据所述媒体文件评分得到相应的阈值范围；判断所述媒体文件对应的兴趣度是否处于阈值范围；

若否，则根据所述阈值范围调整所述媒体文件的影响因子所对应的权值，并返回所述对所述媒体文件的影响因子进行加权处理得到对应的兴趣度的步骤；

若判断结果为是，向媒体文件的播放端反馈所述兴趣度。

2.根据权利要求1所述的媒体文件的兴趣度预测方法，其特征在于，所述获取媒体文件的行为数据的步骤之前还包括：

通过播放端采集播放的媒体文件中触发的操作行为，根据所述操作行为生成相应的行为数据，并上传所述行为数据。

3.根据权利要求1所述的媒体文件的兴趣度预测方法，其特征在于，所述向媒体文件的播放端反馈所述兴趣度的步骤为：

对估算的兴趣度进行排序得到以兴趣度和对应的媒体文件名为表项的列表；

向所述播放端返回所述列表。

4.一种媒体文件的兴趣度预测系统，其特征在于，包括：

数据获取模块，用于获取媒体文件的行为数据；

估算模块，用于根据所述行为数据估算所述媒体文件的兴趣度，包括：

提取单元，用于从所述行为数据提取所述媒体文件的影响因子；

加权处理单元，用于对所述媒体文件的影响因子进行加权处理得到对应的兴趣度；

评分处理单元，用于获取通过用户操作得到的媒体文件评分，并根据所述媒体文件评分得到相应的阈值范围；

判断单元，用于判断所述媒体文件对应的兴趣度是否处于阈值范围，若否，则通知调整单元，若是，则通知所述加权处理单元；

调整单元，用于根据所述阈值范围调整所述媒体文件的影响因子所对应的权值；

反馈模块，用于向播放客户端反馈所述估算的兴趣度。

5.根据权利要求4所述的兴趣度预测系统，其特征在于，还包括：

播放客户端，用于采集播放的媒体文件中触发的操作行为，根据所述操作行为生成相应的行为数据，并上传所述行为数据。

6.根据权利要求4所述的媒体文件的兴趣度预测系统，其特征在于，所述反馈模块包括：

排序单元，用于对所述估算的兴趣度进行排序得到以兴趣度和对应的媒体文件名为表项的列表；

传输单元，用于向所述播放客户端返回所述列表。