CN105589895A

CN105589895A - 资源排行数据生成方法和装置

Info

Publication number: CN105589895A
Application number: CN201410642481.6A
Authority: CN
Inventors: 蒋雷
Original assignee: Shenzhen Tencent Computer Systems Co Ltd
Current assignee: Shenzhen Tencent Computer Systems Co Ltd
Priority date: 2014-11-13
Filing date: 2014-11-13
Publication date: 2016-05-18
Anticipated expiration: 2034-11-13
Also published as: CN105589895B

Abstract

本发明提供了一种资源排行数据生成方法和装置，该方法包括：统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据；其中，第一预设时间段在第二预设时间段之后；根据待排行资源的第一操作统计数据计算待排行资源的热度值；根据待排行资源的第一操作统计数据和第二操作统计数据的统计分布变化计算待排行资源的时新度值；根据待排行资源的热度值和时新度值的结合生成用于据以形成资源排行榜单的资源排行数据。本发明提供的资源排行数据生成方法和装置，结合热度值和时新度值而生成的资源排行榜单，可以同时反映出待排行资源被关注的整体情况以及资源被关注的波动变化，准确性提高。

Description

资源排行数据生成方法和装置

技术领域

本发明涉及计算机信息处理技术领域，特别是涉及一种资源排行数据生成方法和装置。

背景技术

各个用户对视频资源的需求不同，呈现出用户群体对视频资源的关注程度不同的自然现象。进行宏观统计后，某些视频资源被频繁访问，用户关注程度高；某些视频资源被访问的频率非常低，用户关注程度低。目前可以用视频资源被播放的次数作为热度值来量化表示用户群体对于视频资源的关注程度，从而根据视频资源的热度值大小进行排序而生成视频资源排行榜单。该视频资源排行榜单可以直观反映出用户群体对于视频资源的关注程度，为其它用户选择资源或者视频资源供应方对视频资源进行统计分析提供准确的数据参考。

然而，目前根据热度值生成视频资源排行榜单，仅仅利用了视频资源的次数统计数据，依据单一，所生成的视频资源排行榜单只能够反映出视频资源的整体统计特性，导致视频资源排行榜单准确性不足。比如某一视频资源历史播放次数最高，那么它就会长时间处于视频资源排行榜单首位，这样视频资源排行榜单就不能反映出当下用户群体对于视频资源真实的关注程度，准确性不足。

发明内容

基于此，有必要针对目前根据热度值生成视频资源排行榜单导致视频资源排行榜单准确性不足的技术问题，提供一种资源排行数据生成方法和装置。

一种资源排行数据生成方法，所述方法包括：

统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据；其中，所述第一预设时间段在所述第二预设时间段之后；

根据待排行资源的所述第一操作统计数据计算待排行资源的热度值；

根据待排行资源的所述第一操作统计数据和所述第二操作统计数据的统计分布变化计算待排行资源的时新度值；

根据待排行资源的所述热度值和所述时新度值的结合生成用于据以形成资源排行榜单的资源排行数据。

一种资源排行数据生成装置，所述装置包括：

统计模块，用于统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据；其中，所述第一预设时间段在所述第二预设时间段之后；

热度值计算模块，用于根据待排行资源的所述第一操作统计数据计算待排行资源的热度值；

时新度值计算模块，用于根据待排行资源的所述第一操作统计数据和所述第二操作统计数据的统计分布变化计算待排行资源的时新度值；

资源排行数据生成模块，用于根据待排行资源的所述热度值和所述时新度值的结合生成用于据以形成资源排行榜单的资源排行数据。

上述资源排行数据生成方法和装置，通过两种参数来生成用于据以形成资源排行榜单的资源排行数据，两种参数分别为热度值和时新度值。其中热度值根据距离当前时间较近的第一预设时间段内的第一操作统计数据生成，可以反映这段时间内待排行资源被关注的整体统计特性。而时新度值根据距离当前时间较近的第一预设时间段内的第一操作统计数据以及距离当前稍远的第二预设时间段内的第二操作统计数据的统计分布变化生成，其表示的是待排行资源在第一预设时间段内相对于在第二预设时间段内的统计波动，可以反映出资源的突发情况。这样结合热度值和时新度值而生成的资源排行数据，据之生成资源排行榜单，可以同时反映出待排行资源被关注的整体情况以及资源被关注的波动变化，准确性提高。

附图说明

图1为一个实施例中用于实现资源排行数据生成方法的电子设备的内部结构示意图；

图2为一个实施例中资源排行数据生成方法的流程示意图；

图3为一个实施例中根据待排行资源的第一操作统计数据和第二操作统计数据的统计分布变化计算待排行资源的时新度值的步骤的流程示意图；

图4为一个实施例中统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据的步骤的流程示意图；

图5为另一个实施例中资源排行数据生成方法的流程示意图；

图6为一个具体应用场景中应用资源排行数据生成方法的流程示意图；

图7为一个实施例中资源排行数据生成装置的结构框图；

图8为一个实施例中图7中的时新度值计算模块的结构框图；

图9为一个实施例中图7中的统计模块的结构框图；

图10为一个实施例中图7中的资源排行数据生成模块的结构框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明的基本构思是，生成用于据以形成资源排行榜单的资源排行数据时所依据的因素不仅包括热度，还包括时新度。热度可以反映出资源的整体特性，而时新度可以反映出资源在不同时间段的统计波动特性，从而反映出资源被关注的突发情况，比如新资源的发布、突发事件导致的资源关注度上升等情况。这样结合热度值和时新度值而生成的资源排行数据，据之生成资源排行榜单，可以同时反映出资源被关注的整体情况以及资源被关注的波动变化，准确性提高。

如图1所示，在一个实施例中，提供了一种电子设备，该电子设备包括通过系统总线连接的处理器、内存和存储介质。其中，该电子设备的存储介质存储有操作系统、数据库和一种资源排行数据生成装置，该资源排行数据生成装置用于实现一种资源排行数据生成方法。该电子设备的处理器用于提供计算和控制能力，支撑整个电子设备的运行。该电子设备的内存为存储介质中的资源排行数据生成装置提供运行环境。该电子设备可以是一个独立的设备，或者可以是多个可互联通信的电子设备组成的电子设备群，资源排行数据生成装置的各个功能模块可分别分布在电子设备群中的各个电子设备上。该电子设备可以是台式计算机。

如图2所示，在一个实施例中，提供了一种资源排行数据生成方法，本实施例以该方法应用于上述图1中的电子设备来举例说明。该方法具体包括如下步骤：

步骤202，统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据；其中，第一预设时间段在第二预设时间段之后。

资源是指可操作的数据对象，比如可以是视频、音乐等多媒体资源，也可以是小说、应用程序等。待排行资源是指需要对其进行排序并将排序结果体现在资源排行榜单中的资源，资源排行榜单则是指可以体现待排行资源的排序结果的可视化数据。资源排行榜单可以采用指定的各种形式展示。操作统计数据是指对因操作资源而产生的数据的进行统计而获得的统计结果，第一操作统计数据和第二操作统计数据的描述用于区分不同的操作统计数据。

操作统计数据可以是操作次数统计值，是指对因操作资源而产生的次数数据进行统计而获得的次数统计结果。相应地，第一操作统计数据为第一操作次数统计值；第二操作统计数据为第二操作次数统计值。第一操作次数统计值和第二操作次数统计值可以取自待排行资源的搜索次数、访问次数、播放次数、下载次数、评价次数和分享次数中的一种。操作统计数据还可以是根据操作次数统计值生成的数据，比如操作统计频率或者对操作次数统计值进行归一化处理所获得的归一化数值。

第一预设时间段在第二预设时间段之后，是指第一预设时间段的最小边界值大于或者等于第二预设时间段的最大边界值，这样产生第一操作统计数据所依据的对待排行资源的操作发生在产生第二操作统计数据所依据的对待排行资源的操作之后。

在一个实施例中，第一预设时间段与第二预设时间段相邻，这样两个时间段是连续的，可以更好地反映两个时间段内操作统计数据的统计分布的波动。在一个实施例中，第一预设时间段所表示的时间范围小于第二预设时间段所表示的时间范围，比如第一预设时间段为1天，而第二预设时间段为7天，这样第二预设时间段内的第二操作统计数据能够更好地反映待排行资源以往的统计分布，从而可以更好地反映两个时间段内操作统计数据的统计分布的波动。

具体以待排行资源为视频为例对步骤202进行说明，对于每个待排行的视频，统计在最近1天之内其视频名称作为关键词被搜索的次数，并统计1天前起倒退的7天之内其视频名称作为关键词被搜索的次数。

步骤204，根据待排行资源的第一操作统计数据计算待排行资源的热度值。

热度是一种参数，是待排行资源被关注程度的量化累积表示，热度值则是体现热度大小的具体数值。具体地，可以将第一操作统计数据直接作为待排行资源的热度值，也可以对第一操作统计数据进行进一步处理，比如乘以预设系数、加上预设阈值，进行归一化处理等，从而将处理第一操作统计数据所获得的数据作为热度值。举例来说，对于一个名称为“离婚律师”的待排行的视频资源，可以将最近1天之内“离婚律师”这一关键词被搜索的次数作为该视频资源的热度值。

步骤206，根据待排行资源的第一操作统计数据和第二操作统计数据的统计分布变化计算待排行资源的时新度值。

时新度是用来反映待排行资源被关注程度的变化的量化参数，时新度值则是体现这种变化程度的具体数值。第一操作统计数据是距离当前时间较近的第一预设时间段内的操作统计数据，待排行资源的第一操作统计数据的统计分布则是指其第一操作统计数据相对于所有待排行资源的第一操作统计数据的统计分布情况。第二操作统计数据是距离当前时间较远的第二预设时间段内的操作统计数据，则待排行资源的第二操作统计数据的统计分布则是指其第二操作统计数据相对于所有待排行资源的第二操作统计数据的统计分布情况。

待排行资源的第一以及第二操作统计数据的统计分布变化体现的是待排行资源在第一预设时间段内相对于在第二预设时间段内的统计波动特性，可以反映待排行资源被关注程度的变化，于是可以用这种统计分布变化来计算时新度值。具体来说，计算出的时新度值和上述的统计分布变化程度是正相关的，第一操作统计数据和第二操作统计数据的统计分布变化大则相应的时新度值也大。

具体以待排行资源为视频为例对步骤206进行说明，对于一个名称为“离婚律师”的待排行的视频，计算“离婚律师”这一关键词在最近1天内相对于这1天内所有的待排行的视频的统计分布，还计算“离婚律师”这一关键词在1天前起倒退的7天之内相对于这7天内所有的待排行的视频的统计分布。这样计算该名称为“离婚律师”的视频的1天之内的统计分布与这7天的统计分布之间的统计分布变化就可以获得时新度值。而通过计算卡方值就可以直接体现出这种统计分布变化，从而将该卡方值作为该视频的时新度值。

步骤208，根据待排行资源的热度值和时新度值的结合生成用于据以形成资源排行榜单的资源排行数据。

具体地，可以将每个待排行资源的热度值和时新度值进行融合而获得排行得分，该排行得分为用于据以形成资源排行榜单的资源排行数据。可以通过计算该热度值和时新度值的直接求和、加权和或者平均值等方式来获得排行得分。一般可以采用排行得分的降序排列来生成用于据以形成资源排行榜单的资源排行数据，在一些特殊情况下，比如生成关注度最低资源排行榜单时可以采用排行得分的升序排列来生成用于据以形成资源排行榜单的资源排行数据。当然也可以根据排行得分对已有的资源排行榜单进行调整以实现生成用于据以形成资源排行榜单的资源排行数据，比如将待排行资源按照其排放得分插入一个已经过排序的资源排行榜单中生成新的资源排行榜单。

具体以待排行资源为视频为例，对于每一个待排行的视频，可以将其热度值和时新度值直接求和得到其排行得分，然后将所有的待排行的视频的排行得分按照从大到小的顺序排序，排序后的排序序号就可以作为资源排行数据。显示视频排行榜单时，按照指定的显示形式以排序序号从小到达的顺序显示每个待排行的视频的名称，就可以生成视频排行榜单。

上述资源排行数据生成方法，通过两种参数来生成用于据以形成资源排行榜单的资源排行数据，两种参数分别为热度值和时新度值。其中热度值根据距离当前时间较近的第一预设时间段内的第一操作统计数据生成，可以反映这段时间内待排行资源被关注的整体统计特性。而时新度值根据距离当前时间较近的第一预设时间段内的第一操作统计数据以及距离当前稍远的第二预设时间段内的第二操作统计数据的统计分布变化生成，其表示的是待排行资源在第一预设时间段内相对于在第二预设时间段内的统计波动，可以反映出资源的突发情况。这样结合热度值和时新度值而生成的资源排行数据，据之生成资源排行榜单，可以同时反映出待排行资源被关注的整体情况以及资源被关注的波动变化，准确性提高。

如图3所示，在一个实施例中，第一操作统计数据为第一操作次数统计值，第二操作统计数据为第二操作次数统计值。且步骤206中根据待排行资源的第一操作统计数据和第二操作统计数据的统计分布变化计算待排行资源的时新度值的步骤，具体包括以下步骤：

步骤302，对应于每个待排行资源，分别获取该待排行资源的第一操作次数统计值作为第一数值，计算所有待排行资源的第一操作次数统计值总数与该待排行资源的第一操作次数统计值的差作为第二数值，获取该待排行资源的第二操作次数统计值作为第三数值，以及计算所有待排行资源的第二操作次数统计值总数与该待排行资源的第二操作次数统计值的差作为第四数值。

本实施例中，对于每个待排行资源的时新度值，采用皮尔森卡方检定的方法，可简称卡方检验，它是一种假设检验方法，可以被用来检测统计量在两个组别的分布差异性变化，如果差异越显著那么计算得到的卡方值(χ²)也就会越大，可以根据该卡方值来确定相应的待排行资源的时新度值。

计算每个待排行资源所对应的卡方值可采用如下公式(1)：

公式(1)：

\begin{matrix} χ^{2} = \frac{{(a - \frac{(a + b) (a + c)}{n})}^{2}}{\frac{(a + b) (a + c)}{n}} + \frac{{(b - \frac{(a + b) (b + d)}{n})}^{2}}{\frac{(a + b) (b + d)}{n}} + \frac{{(c - \frac{(c + d) (a + c)}{n})}^{2}}{\frac{(c + d) (a + c)}{n}} + \frac{{(d - \frac{(c + d) (b + d)}{n})}^{2}}{\frac{(c + d) (b + d)}{n}} \\ = \frac{n {(ad - bc)}^{2}}{(a + b) (c + d) (a + c) (b + d)} \end{matrix}

其中，χ²表示卡方值，a为第一数值，等于该待排行资源的第一操作次数统计值；b为第二数值，等于所有待排行资源的第一操作次数统计值总数与该待排行资源的第一操作次数统计值的差；c为第三数值，等于该待排行资源的第二操作次数统计值；d为第四数值，等于所有待排行资源的第二操作次数统计值总数与该待排行资源的第二操作次数统计值的差；且n＝a+b+c+d，表示第一数值、第二数值、第三数值和第四数值的和。

步骤304，计算第一数值、第二数值、第三数值和第四数值的和作为第一中间值。

具体地，步骤304用来计算上述公式(1)中的n，作为第一中间值。中间值是指在计算卡方值的过程中所产生的数值，第一、第二以及第三中间值分别用来区分不同的中间值。

步骤306，计算第一数值和第四数值的乘积与第二数值和第三数值的乘积的差的平方作为第二中间值。

具体地，步骤306用来计算上述公式(1)中的(ad-bc)²，作为第二中间值。

步骤308，计算第一数值、第二数值、第三数值和第四数值两两之间的和的乘积作为第三中间值。

具体地，步骤308用来计算上述公式(1)中的(a+b)(c+d)(a+c)(b+d)，作为第三中间值。上述步骤304、步骤306和步骤308分别用来计算获得计算卡方值所需的中间值，可以同时计算获得也可以按照任意顺序依次计算而获得。

步骤310，将第一中间值和第二中间值的乘积再除以第三中间值以获得对应于每个待排行资源的时新度值。

具体地，将第一中间值乘以第二中间值再除以第三中间值就获得了对应于每个待排行资源的卡方值，根据该卡方值可以生成该待排行资源的时新度值。具体可以将该卡方值直接作为时新度值，或者可以对该卡方值进行归一化处理后作为时新度值。

本实施例中，若某个资源在第一预设时间段和第二预设时间段内统计波动很大，那么表示很可能存在突发事件，比如新资源发布了，或者发生了某些事件使得用户关注度提高，这些突发事件会带来统计波动。这样时新度值可以很准确地反映出资源的突发情况，为后续生成用于据以形成资源排行榜单的资源排行数据提供准确的计算依据。

如图4所示，在一个实施例中，第一操作统计数据为第一操作次数统计值，第二操作统计数据为第二操作次数统计值；步骤202中统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据的步骤，具体包括如下步骤：

步骤402，定时统计待排行资源其时的操作次数并与统计时间点对应记录。

第一操作次数统计值是指对待排行资源在第一预设时间段之内的操作次数进行统计而获得的统计值，第二操作次数统计值则是指对待排行资源在第二预设时间段之内的操作次数进行统计而获得的统计值。定时是指每隔预设时间间隔或者每到预设时间点，其时是指统计操作次数的当时。对应于每个待排行资源，将定时统计的操作次数与相应的统计时间点对应记录，其中统计时间点是指统计该操作次数的时间点。

步骤404，计算指定统计时间点所对应的操作次数与指定统计时间点前第一预设时间段长度的第一统计时间点所对应的操作次数的差作为第一操作次数统计值。

具体地，第一预设时间段长度是指第一预设时间段的时间长度。由于经过定时统计获得了作为历史数据的操作次数以及相应的统计时间点，将某两个时间点所对应的操作次数相减就可以求得这两个时间点所表示的时间段内的操作次数统计值。指定统计时间点按照资源排行需求确定，比如可以选定距离当前时间最近的统计时间点作为指定统计时间点，这里的当前时间是指执行步骤404的当下的时间。

举例来说，若指定统计时间点是今天15点，第一预设时间段长度是24小时，则与指定统计时间点前第一预设时间段长度的第一统计时间点为昨天15点，今天15点统计的操作次数减去昨天15点统计的操作次数即为昨天15点到今天15点的第一预设时间段内的第一操作次数统计值。

步骤406，计算第一统计时间点所对应的操作次数与第一统计时间点前第二预设时间段长度的第二统计时间点所对应的操作次数的差作为第二操作次数统计值。

举例来说，若第一统计时间点为昨天15点，第二预设时间段长度为7天，则与第一统计时间点前第二预设时间段长度的第二统计时间点为昨天15点起倒退7天的15点，将昨天15点统计的操作次数减去昨天15点起倒退7天的15点统计的操作次数就是第二预设时间段内的第二操作次数统计值。

本实施例中，通过定时统计待排行资源的操作次数以及统计时间点这样的历史数据，可以随时根据生成用于据以形成资源排行榜单的资源排行数据的实际需求来设定、调整第一预设时间段和第二预设时间段，从而生成相应的资源排行榜单。这样使得生成用于据以形成资源排行榜单的资源排行数据应用更加灵活，可用于生成各种类型的资源排行榜单，兼容性强。

如图5所示，在另一个实施例中，提供了一种资源排行数据生成方法，本实施例以该方法应用于上述图1中的电子设备来举例说明。该方法具体包括如下步骤：

步骤502，获取待排行资源多个来源的资源数据，并据以统计每个来源的待排行资源分别在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据；其中，第一预设时间段在第二预设时间段之后。

步骤502是步骤202的具体步骤，本实施例中获取待排行资源多个来源的资源数据，该资源数据包括资源标识和资源操作时间信息，用于统计相应来源的待排行资源的第一操作统计数据和第二操作统计数据。

在一个实施例中，多个来源包括资源搜索数据、资源操作客户端数据、资源提供服务器数据和第三方网络数据中的至少两种。资源搜索数据搜索资源所产生的数据，比如查询词；资源操作客户端数据是指用于操作资源的客户端所产生的数据，比如用户播放次数或者用户评价次数；资源提供服务器数据是指用于提供资源的服务器所产生的数据；第三方网络数据比如第三方资源排行网站或者第三方资源评价网站，资源评价网站比如电影评价网站。

在一个实施例中，资源搜索数据包括查询词，通过统计各个查询词分别在第一预设时间段和第二预设时间段内出现的次数，并将查询词与待排行资源名称进行映射而获得待排行资源分别在第一预设时间段内的第一操作统计数据和在第二预设时间段内的第二操作统计数据。

步骤504，根据每个来源的待排行资源的第一操作统计数据计算每个来源的待排行资源的热度值。

步骤504是步骤204的具体步骤，对于每个待排行资源的每个来源分别计算相应的热度值。

步骤506，根据每个来源的待排行资源的第一操作统计数据和第二操作统计数据的统计分布变化计算每个来源的待排行资源的时新度值。

步骤506是步骤206的具体步骤，对于每个待排行资源的每个来源分别计算相应的时新度值。计算时新度值时可以采用上述公式(1)计算获得每个来源的待排行资源的卡方值，从而根据该卡方值计算出每个来源的待排行资源的时新度值。

具体地，对应于每个来源的待排行资源，分别获取该待排行资源的第一操作次数统计值作为第一数值，计算所有待排行资源的第一操作次数统计值总数与该待排行资源的第一操作次数统计值的差作为第二数值，获取该待排行资源的第二操作次数统计值作为第三数值，以及计算所有待排行资源的第二操作次数统计值总数与该待排行资源的第二操作次数统计值的差作为第四数值。

进一步地，对应于每个来源的待排行资源，计算第一数值、第二数值、第三数值和第四数值的和作为第一中间值；计算第一数值和第四数值的乘积与第二数值和第三数值的乘积的差的平方作为第二中间值；计算第一数值、第二数值、第三数值和第四数值两两之间的和的乘积作为第三中间值；将第一中间值和第二中间值的乘积再除以第三中间值以获得对应于每个来源的待排行资源的时新度值。

以下步骤508～步骤512是步骤208的具体步骤。

步骤508，根据待排行资源的各个来源的热度值计算热度综合分值；

具体地，将每个来源的所有待排行资源分别按照热度值排序，从而根据待排行资源的各个来源的热度值排序值计算获得热度综合分值。更具体地，若按照热度值降序排序，则可将待排行资源的各个来源的热度值排序值的倒数加权求和或者加权求平均而获得热度综合分值；若按照热度值升序排序，则可将待排行资源的各个来源的热度值排序值加权求和或者加权求平均而获得热度综合分值。这里的热度值排序值是指待排行资源在相应的热度值排序序列中的序号。当然在其它实施例中也可以将待排行资源的各个来源的热度值进行加权求和或者加权求平均而获得热度综合分值。

举例来说，假设共有3个来源，则将每个来源的所有待排行资源分别按照热度值降序排序后，若一个资源对应这3个来源的排序值分别为p₁、p₂和p₃，那么相应的热度综合分值Hot(V)＝h₁/p₁+h₂/p₂+h₃/p₃,其中h₁、h₂和h₃分别为常系数，可根据需要选取，用来调整3个来源的热度值在计算热度综合分值时的比重，比如可以都取1。V用来唯一表示一个待排行资源。

步骤510，根据待排行资源的各个来源的时新度值计算时新度综合分值。

具体地，将每个来源的所有待排行资源分别按照时新度值排序，从而根据待排行资源的各个来源的时新度值排序值计算获得时新度综合分值。更具体地，若按照时新度值降序排序，则可将待排行资源的各个来源的时新度值排序值的倒数加权求和或者加权求平均而获得时新度综合分值；若按照时新度值升序排序，则可将待排行资源的各个来源的时新度值排序值加权求和或者加权求平均而获得时新度综合分值。这里的时新度值排序值是指待排行资源在相应的时新度值排序序列中的序号。当然在其它实施例中也可以将待排行资源的各个来源的时新度值进行加权求和而获得时新度综合分值。

举例来说，假设共有3个来源，则将每个来源的所有待排行资源分别按照时新度值降序排序后，若一个资源对应这3个来源的排序值分别为q₁、q₂和q₃，那么相应的时新度综合分值Fresh(V)＝f₁/p₁+f₂/p₂+f₃/p₃,其中f₁、f₂和f₃分别为常系数，可根据需要选取，用来调整3个来源的时新度值在计算时新度综合分值时的比重，比如可以都取1。V用来唯一表示一个待排行资源。

步骤512，根据待排行资源的热度综合分值和时新度综合分值的结合生成用于据以形成资源排行榜单的资源排行数据。

具体地，可以计算待排行资源的热度综合分值和时新度综合分值的加权和或者加权平均值作为待排行资源的综合排行得分，从而根据该综合排行得分进行对待排行资源进行排序而获得资源排行榜单。该综合排行得分为用于据以形成资源排行榜单的资源排行数据。比如，综合排行得分Score(V)＝w₁*Hot(V)+w₂*Fresh(V)，其中w₁和w₂分别为常系数，可以根据需要设定，比如可以都取1。

本实施例中，利用了多个来源的资源数据，统计获得的第一操作统计数据和第二操作统计数据更加准确，这样生成的资源排行榜单也更加准确、可靠。

下面用一个具体应用场景来说明上述资源排行数据生成方法的原理，参考图6，具体包括如下步骤：

分别从资源搜索侧获取与待排行资源名称匹配的查询词，从资源操作客户端获取待排行资源的资源播放次数以及从第三方资源网站获取待排行资源的资源播放次数或者资源评价次数，这些获取的数据统称为资源数据。根据每个来源的资源数据，统计每个来源的待排行资源分别在1天内的第一操作次数统计值以及1天前的7天内的第二操作次数统计值。

进一步地，根据每个来源的待排行资源的1天内的第一操作次数统计值计算各自的热度值，根据每个来源的待排行资源的第一操作次数统计值和第二操作次数统计值，计算卡方值作为每个来源的待排行资源的时新度值。将每个待排行资源的各个来源的热度值和时新度值分别融合，具体将每个来源的所有待排行资源分别按照热度值降序排序，将待排行资源的各个来源的热度值排序值的倒数加权求和或者加权求平均而获得热度综合分值；将每个来源的所有待排行资源分别按照时新度值降序排序，将待排行资源的各个来源的时新度值排序值的倒数加权求和或者加权求平均而获得时新度综合分值。

最后，计算待排行资源的热度综合分值和时新度综合分值的加权和或者加权平均值作为待排行资源的综合排行得分，该综合排行得分是用于据以形成资源排行榜单的资源排行数据。利用该综合排行得分，可以对资源分类后按照综合排行得分进行排序而获得各种分类的资源排行榜单，该资源排行榜单可以以各种形式展示在指定的网站、资源操作客户端或者上述电子设备本地。

如图7所示，在一个实施例中，提供了一种资源排行数据生成装置700，用于实现上述各个实施例的资源排行数据生成方法。该资源排行数据生成装置700包括统计模块701、热度值计算模块702、时新度值计算模块703和资源排行数据生成模块704。

统计模块701，用于统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据；其中，第一预设时间段在第二预设时间段之后。

在一个实施例中，第一预设时间段与第二预设时间段相邻，这样两个时间段是连续的，可以更好地反映两个时间段内操作统计数据的统计分布的波动。在一个实施例中，第一预设时间段所表示的时间范围小于第二预设时间段所表示的时间范围，这样第二预设时间段内的第二操作统计数据能够更好地反映待排行资源以往的统计分布，从而可以更好地反映两个时间段内操作统计数据的统计分布的波动。

热度值计算模块702，用于根据待排行资源的第一操作统计数据计算待排行资源的热度值。

具体地，热度值计算模块702可用于将第一操作统计数据直接作为待排行资源的热度值，也可以对第一操作统计数据进行进一步处理，比如乘以预设系数、加上预设阈值，进行归一化处理等，从而将处理第一操作统计数据所获得的数据作为热度值。

时新度值计算模块703，用于根据待排行资源的第一操作统计数据和第二操作统计数据的统计分布变化计算待排行资源的时新度值。

第一操作统计数据是距离当前时间较近的第一预设时间段内的操作统计数据，待排行资源的第一操作统计数据的统计分布则是指其第一操作统计数据相对于所有待排行资源的第一操作统计数据的统计分布情况。第二操作统计数据是距离当前时间较远的第二预设时间段内的操作统计数据，则待排行资源的第二操作统计数据的统计分布则是指其第二操作统计数据相对于所有待排行资源的第二操作统计数据的统计分布情况。具体来说，计算出的时新度值和上述的统计分布变化程度是正相关的。

资源排行数据生成模块704，用于根据待排行资源的热度值和时新度值的结合生成用于据以形成资源排行榜单的资源排行数据。

具体地，资源排行数据生成模块704可用于将每个待排行资源的热度值和时新度值进行融合而获得排行得分，该排行得分为用于据以形成资源排行榜单的资源排行数据。资源排行数据生成模块704可用于通过计算该热度值和时新度值的直接求和、加权和或者平均值等方式来获得排行得分。资源排行数据生成模块704可以用于采用排行得分的降序排列来生成用于据以形成资源排行榜单的资源排行数据，在一些特殊情况下，比如生成关注度最低资源排行榜单时资源排行数据生成模块704可以用于采用排行得分的升序排列来生成用于据以形成资源排行榜单的资源排行数据。当然资源排行数据生成模块704也可以用于根据排行得分对已有的资源排行榜单进行调整以实现生成用于据以形成资源排行榜单的资源排行数据，比如将待排行资源按照其排放得分插入一个已经过排序的资源排行榜单中生成新的资源排行榜单。

上述资源排行数据生成装置700，通过两种参数来生成用于据以形成资源排行榜单的资源排行数据，两种参数分别为热度值和时新度值。其中热度值根据距离当前时间较近的第一预设时间段内的第一操作统计数据生成，可以反映这段时间内待排行资源被关注的整体统计特性。而时新度值根据距离当前时间较近的第一预设时间段内的第一操作统计数据以及距离当前稍远的第二预设时间段内的第二操作统计数据的统计分布变化生成，其表示的是待排行资源在第一预设时间段内相对于在第二预设时间段内的统计波动，可以反映出资源的突发情况。这样结合热度值和时新度值而生成的资源排行数据，据之生成资源排行榜单，可以同时反映出待排行资源被关注的整体情况以及资源被关注的波动变化，准确性提高。

在一个实施例中，第一操作统计数据为第一操作次数统计值，第二操作统计数据为第二操作次数统计值，如图8所示，时新度值计算模块703包括：数值获取模块703a和计算模块703b。

数值获取模块703a，用于对应于每个待排行资源，分别获取该待排行资源的第一操作次数统计值作为第一数值，计算所有待排行资源的第一操作次数统计值总数与该待排行资源的第一操作次数统计值的差作为第二数值，获取该待排行资源的第二操作次数统计值作为第三数值，以及计算所有待排行资源的第二操作次数统计值总数与该待排行资源的第二操作次数统计值的差作为第四数值。

计算模块703b，用于计算第一数值、第二数值、第三数值和第四数值的和作为第一中间值；计算第一数值和第四数值的乘积与第二数值和第三数值的乘积的差的平方作为第二中间值；计算第一数值、第二数值、第三数值和第四数值两两之间的和的乘积作为第三中间值；将第一中间值和第二中间值的乘积再除以第三中间值以获得对应于每个待排行资源的时新度值。

在一个实施例中，第一操作统计数据为第一操作次数统计值，第二操作统计数据为第二操作次数统计值，如图9所示，统计模块701包括：定时统计模块701a、第一操作次数统计值统计模块701b和第二操作次数统计值统计模块701c。

定时统计模块701a，用于定时统计待排行资源其时的操作次数并与统计时间点对应记录。具体地，定时统计模块701a用于对应于每个待排行资源，将定时统计的操作次数与相应的统计时间点对应记录，其中统计时间点是指统计该操作次数的时间点。

第一操作次数统计值统计模块701b，用于计算指定统计时间点所对应的操作次数与指定统计时间点前第一预设时间段长度的第一统计时间点所对应的操作次数的差作为第一操作次数统计值。

第二操作次数统计值统计模块701c，用于计算第一统计时间点所对应的操作次数与第一统计时间点前第二预设时间段长度的第二统计时间点所对应的操作次数的差作为第二操作次数统计值。

如图10所示，在一个实施例中，资源排行数据生成模块704包括热度值融合模块704a、时新度值融合模块704b和资源排行数据生成执行模块704c。

统计模块701还用于获取待排行资源多个来源的资源数据，并据以统计每个来源的待排行资源分别在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据。

热度值计算模块702还用于根据每个来源的待排行资源的第一操作统计数据计算每个来源的待排行资源的热度值。

时新度值计算模块703还用于根据每个来源的待排行资源的第一操作统计数据和第二操作统计数据的统计分布变化计算每个来源的待排行资源的时新度值。

具体地，时新度值计算模块703用于对应于每个来源的待排行资源，分别获取该待排行资源的第一操作次数统计值作为第一数值，计算所有待排行资源的第一操作次数统计值总数与该待排行资源的第一操作次数统计值的差作为第二数值，获取该待排行资源的第二操作次数统计值作为第三数值，以及计算所有待排行资源的第二操作次数统计值总数与该待排行资源的第二操作次数统计值的差作为第四数值。

进一步地，时新度值计算模块703用于对应于每个来源的待排行资源，计算第一数值、第二数值、第三数值和第四数值的和作为第一中间值；计算第一数值和第四数值的乘积与第二数值和第三数值的乘积的差的平方作为第二中间值；计算第一数值、第二数值、第三数值和第四数值两两之间的和的乘积作为第三中间值；将第一中间值和第二中间值的乘积再除以第三中间值以获得对应于每个来源的待排行资源的时新度值。

热度值融合模块704a，用于根据待排行资源的各个来源的热度值计算热度综合分值。具体地，热度值融合模块704a可用于将每个来源的所有待排行资源分别按照热度值排序，从而根据待排行资源的各个来源的热度值排序值计算获得热度综合分值。更具体地，若按照热度值降序排序，则热度值融合模块704a可用于将待排行资源的各个来源的热度值排序值的倒数加权求和或者加权求平均而获得热度综合分值；若按照热度值升序排序，则热度值融合模块704a可用于将待排行资源的各个来源的热度值排序值加权求和或者加权求平均而获得热度综合分值。当然在其它实施例中热度值融合模块704a也可用于将待排行资源的各个来源的热度值进行加权求和或者加权求平均而获得热度综合分值。

时新度值融合模块704b，用于根据待排行资源的各个来源的时新度值计算时新度综合分值。具体地，时新度值融合模块704b可用于将每个来源的所有待排行资源分别按照时新度值排序，从而根据待排行资源的各个来源的时新度值排序值计算获得时新度综合分值。更具体地，若按照时新度值降序排序，则时新度值融合模块704b可用于将待排行资源的各个来源的时新度值排序值的倒数加权求和或者加权求平均而获得时新度综合分值；若按照时新度值升序排序，则时新度值融合模块704b可用于将待排行资源的各个来源的时新度值排序值加权求和或者加权求平均而获得时新度综合分值。当然在其它实施例中时新度值融合模块704b也可用于将待排行资源的各个来源的时新度值进行加权求和而获得时新度综合分值。

资源排行数据生成执行模块704c，用于根据待排行资源的热度综合分值和时新度综合分值的结合生成用于据以形成资源排行榜单的资源排行数据。

具体地，资源排行数据生成执行模块704c可用于计算待排行资源的热度综合分值和时新度综合分值的加权和或者加权平均值作为待排行资源的综合排行得分，从而根据该综合排行得分进行对待排行资源进行排序而获得资源排行榜单。该综合排行得分为用于据以形成资源排行榜单的资源排行数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory，ROM)或随机存储记忆体(RandomAccessMemory，RAM)等。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种资源排行数据生成方法，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据，包括：获取待排行资源多个来源的资源数据，并据以统计每个来源的待排行资源分别在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据；

所述根据待排行资源的所述第一操作统计数据计算待排行资源的热度值，包括：根据每个来源的待排行资源的所述第一操作统计数据计算每个来源的待排行资源的热度值；

所述根据待排行资源的所述第一操作统计数据和所述第二操作统计数据的统计分布变化计算待排行资源的时新度值，包括：根据每个来源的待排行资源的所述第一操作统计数据和所述第二操作统计数据的统计分布变化计算每个来源的待排行资源的时新度值；

所述根据待排行资源的所述热度值和所述时新度值的结合生成用于据以形成资源排行榜单的资源排行数据，包括：

根据待排行资源的各个来源的热度值计算热度综合分值；

根据待排行资源的各个来源的时新度值计算时新度综合分值；

根据待排行资源的所述热度综合分值和所述时新度综合分值的结合生成用于据以形成资源排行榜单的资源排行数据。

3.根据权利要求2所述的方法，其特征在于，所述多个来源包括资源搜索数据、资源操作客户端数据、资源提供服务器数据和第三方网络数据中的至少两种。

4.根据权利要求2所述的方法，其特征在于，所述根据待排行资源的各个来源的热度值计算热度综合分值，包括：

将每个来源的所有待排行资源分别按照热度值排序，从而根据待排行资源的各个来源的热度值排序值计算获得热度综合分值；

所述根据待排行资源的各个来源的时新度值计算时新度综合分值，包括：

将每个来源的所有待排行资源分别按照时新度值排序，从而根据待排行资源的各个来源的时新度值排序值计算获得时新度综合分值。

5.根据权利要求1所述的方法，其特征在于，所述第一操作统计数据为第一操作次数统计值，所述第二操作统计数据为第二操作次数统计值；所述根据待排行资源的所述第一操作统计数据和所述第二操作统计数据的统计分布变化计算待排行资源的时新度值，包括：

对应于每个待排行资源，分别获取该待排行资源的第一操作次数统计值作为第一数值，计算所有待排行资源的第一操作次数统计值总数与该待排行资源的第一操作次数统计值的差作为第二数值，获取该待排行资源的第二操作次数统计值作为第三数值，以及计算所有待排行资源的第二操作次数统计值总数与该待排行资源的第二操作次数统计值的差作为第四数值；

计算所述第一数值、所述第二数值、所述第三数值和所述第四数值的和作为第一中间值；

计算所述第一数值和所述第四数值的乘积与所述第二数值和所述第三数值的乘积的差的平方作为第二中间值；

计算所述第一数值、所述第二数值、所述第三数值和所述第四数值两两之间的和的乘积作为第三中间值；

将所述第一中间值和所述第二中间值的乘积再除以所述第三中间值以获得对应于每个待排行资源的时新度值。

6.根据权利要求1所述的方法，其特征在于，所述第一操作统计数据为第一操作次数统计值，所述第二操作统计数据为第二操作次数统计值；所述统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据，包括：

定时统计待排行资源其时的操作次数并与统计时间点对应记录；

计算指定统计时间点所对应的操作次数与所述指定统计时间点前第一预设时间段长度的第一统计时间点所对应的操作次数的差作为第一操作次数统计值；

计算所述第一统计时间点所对应的操作次数与所述第一统计时间点前第二预设时间段长度的第二统计时间点所对应的操作次数的差作为第二操作次数统计值。

7.根据权利要求5或6所述的方法，其特征在于，所述第一操作次数统计值和所述第二操作次数统计值取自所述待排行资源的搜索次数、访问次数、播放次数、下载次数、评价次数和分享次数中的一种。

8.一种资源排行数据生成装置，其特征在于，所述装置包括：

9.根据权利要求8所述的装置，其特征在于，所述统计模块还用于获取待排行资源多个来源的资源数据，并据以统计每个来源的待排行资源分别在第一预设时间段内的第一操作统计数据以及在第二预设时间段内的第二操作统计数据；

所述热度值计算模块还用于根据每个来源的待排行资源的所述第一操作统计数据计算每个来源的待排行资源的热度值；

所述时新度值计算模块还用于根据每个来源的待排行资源的所述第一操作统计数据和所述第二操作统计数据的统计分布变化计算每个来源的待排行资源的时新度值；

所述资源排行数据生成模块包括：

热度值融合模块，用于根据待排行资源的各个来源的热度值计算热度综合分值；

时新度值融合模块，用于根据待排行资源的各个来源的时新度值计算时新度综合分值；

资源排行数据生成执行模块，用于根据待排行资源的所述热度综合分值和所述时新度综合分值的结合生成用于据以形成资源排行榜单的资源排行数据。

10.根据权利要求9所述的装置，其特征在于，所述多个来源包括资源搜索数据、资源操作客户端数据、资源提供服务器数据和第三方网络数据中的至少两种。

11.根据权利要求9所述的装置，其特征在于，所述热度值融合模块具体用于将每个来源的所有待排行资源分别按照热度值排序，从而根据待排行资源的各个来源的热度值排序值计算获得热度综合分值；

所述时新度值融合模块具体用于将每个来源的所有待排行资源分别按照时新度值排序，从而根据待排行资源的各个来源的时新度值排序值计算获得时新度综合分值。

12.根据权利要求8所述的装置，其特征在于，所述第一操作统计数据为第一操作次数统计值，所述第二操作统计数据为第二操作次数统计值；所述时新度值计算模块包括：

数值获取模块，用于对应于每个待排行资源，分别获取该待排行资源的第一操作次数统计值作为第一数值，计算所有待排行资源的第一操作次数统计值总数与该待排行资源的第一操作次数统计值的差作为第二数值，获取该待排行资源的第二操作次数统计值作为第三数值，以及计算所有待排行资源的第二操作次数统计值总数与该待排行资源的第二操作次数统计值的差作为第四数值；

计算模块，用于计算所述第一数值、所述第二数值、所述第三数值和所述第四数值的和作为第一中间值；计算所述第一数值和所述第四数值的乘积与所述第二数值和所述第三数值的乘积的差的平方作为第二中间值；计算所述第一数值、所述第二数值、所述第三数值和所述第四数值两两之间的和的乘积作为第三中间值；将所述第一中间值和所述第二中间值的乘积再除以所述第三中间值以获得对应于每个待排行资源的时新度值。

13.根据权利要求8所述的装置，其特征在于，所述第一操作统计数据为第一操作次数统计值，所述第二操作统计数据为第二操作次数统计值；所述统计模块包括：

定时统计模块，用于定时统计待排行资源其时的操作次数并与统计时间点对应记录；

第一操作次数统计值统计模块，用于计算指定统计时间点所对应的操作次数与所述指定统计时间点前第一预设时间段长度的第一统计时间点所对应的操作次数的差作为第一操作次数统计值；

第二操作次数统计值统计模块，用于计算所述第一统计时间点所对应的操作次数与所述第一统计时间点前第二预设时间段长度的第二统计时间点所对应的操作次数的差作为第二操作次数统计值。

14.根据权利要求12或13所述的装置，其特征在于，所述第一操作次数统计值和所述第二操作次数统计值取自所述待排行资源的搜索次数、访问次数、播放次数、下载次数、评价次数和分享次数中的一种。