CN111782702A - 一种元数据热度排序方法、装置、设备及存储介质 - Google Patents
一种元数据热度排序方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111782702A CN111782702A CN202010609282.0A CN202010609282A CN111782702A CN 111782702 A CN111782702 A CN 111782702A CN 202010609282 A CN202010609282 A CN 202010609282A CN 111782702 A CN111782702 A CN 111782702A
- Authority
- CN
- China
- Prior art keywords
- metadata
- value
- heat value
- time period
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004364 calculation method Methods 0.000 claims abstract description 26
- 230000000737 periodic effect Effects 0.000 claims abstract description 13
- 238000004891 communication Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 11
- 235000019633 pungent taste Nutrition 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24573—Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Library & Information Science (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种元数据热度排序方法、装置、电子设备及存储介质,涉及云计算领域。分别获取预设排序时间段内各元数据的整体使用次数和预设排序子时间段包含的各统计周期内各元数据的周期使用次数;基于各元数据的整体使用次数,得到各元数据的第一热度值;根据各元数据的周期使用次数,得到各元数据的第二热度值;按照预设计算规则,对各元数据第一热度值和各元数据第二热度值进行计算,得到各元数据的总热度值;基于各元数据的总热度值,得到热度排序。本申请实施例既考虑了整体使用次数,同时还考虑了部分子时间段内的使用次数,因此,提高了热度排序的准确率。
Description
技术领域
本申请涉及一种元数据热度排序方法、装置、设备及存储介质。
背景技术
元数据又称为中介数据,或者中继数据,是用于描述数据仓库等系统的技术细节的数据。元数据热度值是用于表征,某个时间段内元数据被使用或者调用频繁程度的值。为了快速定位出指定时间段内,使用频繁程度较高的元数据,通常可以对上述指定时间段(排序时间段)内的元数据热度进行排序,即:计算出该排序时间段内各元数据的热度值,然后基于热度值,按照从大到小的顺序进行排序。
在热度排序之前,首先,需要统计元数据的使用次数,目前,通常会按照一定的统计周期,定期对元数据的使用次数进行统计。例如:以1天为一个统计周期,每天统计一次当天内各元数据的使用次数。
现阶段,热度排序方法为:在整个排序时间段内,按照上述统计周期,先分别统计各周期内各元数据的使用次数,然后进行累加,得到整个排序时间段内,各元数据的使用次数,然后将得到的整个排序时间段内,各元数据的使用次数作为整个排序时间段内,各元数据的热度值,进而按照热度值进行热度排序。
上述方法仅根据各元数据在整个排序时间段内的使用次数,进行热度排序的,排序的准确率较低。
发明内容
本申请实施例的目的在于提供一种元数据热度排序方法、装置、电子设备及存储介质,以提高热度排序的准确率。具体技术方案如下:
第一方面,本申请实施例提供了一种元数据热度排序方法,所述方法包括:
分别获取预设排序时间段内各元数据的整体使用次数和预设排序子时间段包含的各统计周期内各元数据的周期使用次数;所述预设排序子时间段为所述预设排序时间段中的子时间段;
基于所述各元数据的整体使用次数,得到所述各元数据的第一热度值;
根据所述各元数据的周期使用次数,得到所述各元数据的第二热度值;
按照预设计算规则,对所述各元数据的第一热度值和所述各元数据的第二热度值进行计算,得到所述各元数据的总热度值;
基于所述各元数据的总热度值,得到热度排序。
进一步的,所述根据所述各元数据的周期使用次数,得到所述各元数据的第二热度值,包括:
针对每个元数据,分别以各统计周期在所述预设排序子时间段中的周期序号与预设参数值之和作为真数,以所述预设排序子时间段内包含的统计周期的个数作为底,进行对数运算,得到各统计周期的对数运算结果;
计算各统计周期的对数运算结果和各统计周期内该元数据的周期使用次数的乘积,得到各统计周期的乘积运算结果;
对所述各统计周期的乘积运算结果求和,得到该元数据的子时间段使用次数;其中,第一个统计周期在所述预设排序子时间段中的周期序号为1,其他统计周期在所述预设排序子时间段中的周期序号为前一统计周期在所述预设排序子时间段中的周期序号加1;所述预设参数值为大于0的值;
将各元数据的子时间段使用次数与最大子时间段使用次数的比值,确定为所述各元数据的第二热度值;其中,所述最大子时间段使用次数为所述各元数据的子时间段使用次数中的最大值。
进一步的,所述基于所述各元数据的整体使用次数,得到所述各元数据的第一热度值,包括:
对所述各元数据的整体使用次数进行归一化,得到所述各元数据的第一热度值。
进一步的,所述按照预设计算规则,对所述各元数据的第一热度值和所述各元数据的第二热度值进行计算,得到所述各元数据的总热度值,包括:
对所述各元数据的第一热度值和所述各元数据的第二热度值求和,得到所述各元数据的总热度值;
或者,
确定与所述各元数据的第一热度值对应的第一权重值,以及与所述各元数据的第二热度值对应的第二权重值;
计算所述第一权重值与所述第一热度值的第一乘积值,以及所述第二权重值与所述第二热度值的第二乘积值;
对所述各元数据的所述第一乘积值与所述第二乘积值求和,得到所述各元数据的总热度值。
第二方面,本申请实施例提供了一种元数据热度排序装置,所述装置包括:
使用次数获取模块,用于分别获取预设排序时间段内各元数据的整体使用次数和预设排序子时间段包含的各统计周期内各元数据的周期使用次数;所述预设排序子时间段为所述预设排序时间段中的子时间段;
第一热度值得到模块,用于基于所述各元数据的整体使用次数,得到所述各元数据的第一热度值;
第二热度值得到模块,用于根据所述各元数据的周期使用次数,得到各元数据的第二热度值;
总热度值得到模块,用于按照预设计算规则,对所述各元数据的第一热度值和所述各元数据的第二热度值进行计算,得到所述各元数据的总热度值;
热度排序模块,用于基于所述各元数据的总热度值,得到热度排序。
进一步的,所述二热度值得到模块,具体用于:
针对每个元数据,分别以各统计周期在所述预设排序子时间段中的周期序号与预设参数值之和作为真数,以所述预设排序子时间段内包含的统计周期的个数作为底,进行对数运算,得到各统计周期的对数运算结果;
计算各统计周期的对数运算结果和各统计周期内该元数据的周期使用次数的乘积,得到各统计周期的乘积运算结果;
对所述各统计周期的乘积运算结果求和,得到该元数据的子时间段使用次数;其中,第一个统计周期在所述预设排序子时间段中的周期序号为1,其他统计周期在所述预设排序子时间段中的周期序号为前一统计周期在所述预设排序子时间段中的周期序号加1;所述预设参数值为大于0的值;
将各元数据的子时间段使用次数与最大子时间段使用次数的比值,确定为所述各元数据的第二热度值;其中,所述最大子时间段使用次数为所述各元数据的子时间段使用次数中的最大值。
进一步的,所述第一热度值得到模块,具体用于:
对所述各元数据的整体使用次数进行归一化,得到所述各元数据的第一热度值。
进一步的,所述总热度值得到模块,具体用于:
对所述各元数据的第一热度值和所述各元数据的第二热度值求和,得到所述各元数据的总热度值;
或者,
确定与所述各元数据的第一热度值对应的第一权重值,以及与所述各元数据的第二热度值对应的第二权重值;
计算所述第一权重值与所述第一热度值的第一乘积值,以及所述第二权重值与所述第二热度值的第二乘积值;
对所述各元数据的所述第一乘积值与所述第二乘积值求和,得到所述各元数据的总热度值。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面所述的元数据热度排序方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的元数据热度排序方法的步骤。
第五方面,本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的元数据热度排序方法的步骤。
本申请实施例提供的一种元数据热度排序方法、装置、电子设备及存储介质,分别获取预设排序时间段内各元数据的整体使用次数和预设排序子时间段包含的各统计周期内各元数据的周期使用次数;所述预设排序子时间段为所述预设排序时间段中的子时间段;基于所述各元数据的整体使用次数,得到所述各元数据的第一热度值;根据所述各元数据的周期使用次数,得到各元数据的第二热度值;按照预设计算规则,对所述各元数据的第一热度值和所述各元数据的第二热度值进行计算,得到所述各元数据的总热度值,并基于所述各元数据的总热度值,得到热度排序。
本申请实施例中,在计算各元数据的热度值时,是基于两种使用次数进行的:各元数据在整个排序时间段内的整体使用次数和各元数据在预设排序子时间段包含的各统计周期内各元数据的周期使用次数,也就是说,本申请实施例既考虑了各元数据的整体使用次数,同时还考虑了各元数据在部分子时间段(例如近期某个时间段)内的使用次数,因此,提高了热度排序的准确率。
当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的元数据热度排序方法的一种流程示意图;
图2为本申请实施例提供的元数据热度排序方法的另一种流程示意图;
图3为本申请实施例提供的元数据热度排序装置的一种结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了提高热度排序的准确率,本申请实施例提供了一种元数据热度排序方法、装置、电子设备及存储介质。
参见图1,图1为本申请实施例提供的元数据热度排序方法的一种流程示意图,具体包括如下步骤:
步骤101,分别获取预设排序时间段内各元数据的整体使用次数和预设排序子时间段包含的各统计周期内各元数据的周期使用次数。
其中,预设排序子时间段为预设排序时间段中的子时间段。例如,预设排序子时间段可以为预设排序时间段中接近于当前时刻的一个近期子时间段,例如:预设排序子时间段为近一周,预设排序子时间段则可以为近一天或者近两天等。具体的,在热度排序时,可以根据实际需要,对预设排序子时间段进行设定,此处,对于预设排序子时间段的设定方法不做限定。
在热度排序之前,首先,需要统计元数据的使用次数,目前,通常会按照一定的统计周期,定期对元数据的使用次数进行统计。例如:以1天为一个统计周期,每天统计一次当天内各元数据的使用次数。
本步骤中,可以获取预设排序时间段内各元数据的整体使用次数,即总体使用次数,同时还可以获取预设排序子时间段包含的各统计周期内各元数据的周期使用次数。例如,统计元数据的使用次数时,是以1天为一个统计周期的,当需要对近一周内各元数据进行热度排序时,则预设排序时间段为近一周,若设定预设排序子时间段为近两天,则预设排序子时间段包含2个统计周期:昨天和今天。按照本步骤,可以获取各元数据在近一周内的整体使用次数、昨天内各元数据使用次数和今天内各元数据使用次数,后两种使用次数即为:预设排序子时间段包含的各统计周期内各元数据的周期使用次数。
步骤102,基于各元数据的整体使用次数,得到各元数据的第一热度值。
本步骤中,得到各元数据的第一热度值的方式可以为:对各元数据的整体使用次数进行归一化,得到各元数据的第一热度值。例如,确定出各元数据中整体使用次数最多的使用次数作为基准使用次数,然后将各元数据的整体使用次数与上述基准使用次数的比值,分别作为各元数据的第一热度值,这样,得到的第一热度值则均为[0,1]之间的值。本步骤中,可以采用任一现有归一化方法对各元数据的整体使用次数进行归一化,此处,对于具体采用何种归一化方法不做限定。
步骤103,根据各元数据的周期使用次数,得到各元数据的第二热度值。
各元数据的第二热度值可以表征预设排序子时间段内各元数据被使用的频繁程度。
本步骤中,针对每个元数据,可以对该元数据的各周期使用次数求和,然后,再对上述求和结果进行归一化处理。具体的,将上述求和结果与最大求和结果的比值,作为该元数据的第二热度值。其中,最大求和结果为所有元数据对应的求和结果中,数值最大的求和结果。
另外,也可以通过如下方式得到各元数据的第二热度值:
针对每个元数据,分别以各统计周期在预设排序子时间段中的周期序号与预设参数值之和作为真数,以预设排序子时间段内包含的统计周期的个数作为底,进行对数运算,得到各统计周期的对数运算结果;
计算各统计周期的对数运算结果和各统计周期内该元数据的周期使用次数的乘积,得到各统计周期的乘积运算结果;
对各统计周期的乘积运算结果求和,得到该元数据的子时间段使用次数;其中,第一个统计周期在预设排序子时间段中的周期序号为1,其他统计周期在预设排序子时间段中的周期序号为前一统计周期在预设排序子时间段中的周期序号加1;预设参数值为大于0的值;
将各元数据的子时间段使用次数与最大子时间段使用次数的比值,确定为各元数据的第二热度值;其中,最大子时间段使用次数为各元数据的子时间段使用次数中的最大值。
具体的,针对每个元数据,可以采用如下公式,计算得到该元数据的子时间段使用次数:
在上述公式中,由于存在大于0的预设参数值C,因此,可以避免因当j=1时,无论dj i如何取值,得到的对数运算结果均为0,而导致的子时间段使用次数计算准确度低的问题。
由于C的取值约小,对子时间段使用次数的计算准确度影响则约小。因此,为了进一步降低C的取值对子时间段使用次数计算准确度的影响,可以将C的取值设定在(0,1)范围内,例如,可以取C=0.1。
本申请实施例中,对于基于根据各元数据的周期使用次数,得到各元数据的第二热度值的具体计算方法,不做限定。
步骤104,按照预设计算规则,对各元数据的第一热度值和各元数据的第二热度值进行计算,得到各元数据的总热度值。
例如,预设计算规则可以为:直接对各元数据的第一热度值和各元数据的第二热度值求和,得到各元数据的总热度值;也可以为:根据实际情况,分别为第一热度值以及第二热度值设定权重值(第一权重值和第二权重值),然后分别计算第一热度值与第一权重值的乘积,第二热度值与第二权重值的乘积,最后,再对上述两个乘积求和,得到各元数据的总热度值。本申请实施例中,对于预设计算规则的具体内容,不做限定。
步骤105,基于各元数据的总热度值,得到热度排序。
具体的,可以按照各元数据总热度值从大到小,或者从小到大的顺序,得到热度排序。
由上述实施例可见,在本申请实施例中,在计算各元数据的热度值时,是基于两种使用次数进行的:各元数据在整个排序时间段内的整体使用次数和各元数据在预设排序子时间段包含的各统计周期内各元数据的周期使用次数,也就是说,本申请实施例既考虑了各元数据的整体使用次数,同时还考虑了各元数据在部分子时间段内的使用次数,因此,提高了热度排序的准确率。
参见图2,图2为本申请实施例提供的元数据热度排序方法的另一种流程示意图,具体包括如下步骤:
步骤201,分别获取预设排序时间段内各元数据的整体使用次数和预设排序子时间段包含的各统计周期内各元数据的周期使用次数。
其中,预设排序子时间段为预设排序时间段中的子时间段。
步骤202,对各元数据的整体使用次数进行归一化,得到各元数据的第一热度值。
例如,确定出各元数据中整体使用次数最多的使用次数作为基准使用次数,然后将各元数据的整体使用次数与上述基准使用次数的比值,分别作为各元数据的第一热度值,这样,得到的第一热度值则均为[0,1]之间的值。本步骤中,可以采用任一现有归一化方法对各元数据的整体使用次数进行归一化,此处,对于具体采用何种归一化方法不做限定。
步骤203,针对每个元数据,分别以各统计周期在预设排序子时间段中的周期序号与预设参数值之和作为真数,以预设排序子时间段内包含的统计周期的个数作为底,进行对数运算,得到各统计周期的对数运算结果。
其中,第一个统计周期在预设排序子时间段中的周期序号为1,其他统计周期在预设排序子时间段中的周期序号为前一统计周期在预设排序子时间段中的周期序号加1。预设参数值为大于0的值。
还以步骤101中的例子进行说明:假设:统计元数据的使用次数时,是以1天为一个统计周期的,当需要对近一周内各元数据进行热度排序时,则预设排序时间段为近一周,若设定预设排序子时间段为近两天,则预设排序子时间段包含2个统计周期:昨天和今天。
步骤204,计算各统计周期的对数运算结果和各统计周期内该元数据的周期使用次数的乘积,得到各统计周期的乘积运算结果。
步骤205,对各统计周期的乘积运算结果求和,得到该元数据的子时间段使用次数。
步骤206,将各元数据的子时间段使用次数与最大子时间段使用次数的比值,确定为各元数据的第二热度值。
其中,最大子时间段使用次数为各元数据的子时间段使用次数中的最大值。
上述步骤203-步骤206,可以采用如下公式表述:
其中,Di为元数据i的第二热度值;为最大子时间段使用次数;为元数据i的子时间段使用次数;period为预设排序子时间段内包含的统计周期的个数;dj i为在预设排序子时间段中,第j个统计周期内,元数据i的周期使用次数;C为大于0的预设参数值。
在上述公式中,由于存在大于0的预设参数值C,因此,可以避免因当j=1时,无论dj i如何取值,得到的对数运算结果均为0,而导致的子时间段使用次数计算准确度低的问题。
由于C的取值约小,对子时间段使用次数的计算准确度影响则约小。因此,为了进一步降低C的取值对子时间段使用次数计算准确度的影响,可以将C的取值设定在(0,1)范围内,例如,可以取C=0.1。
步骤207,对各元数据的第一热度值和各元数据的第二热度值求和,得到各元数据的总热度值。
步骤208,基于各元数据的总热度值,得到热度排序。
在图2所示实施例中,在计算各元数据的热度值时,是基于两种使用次数进行的:各元数据在整个排序时间段内的整体使用次数和各元数据在预设排序子时间段包含的各统计周期内各元数据的周期使用次数,也就是说,本申请实施例既考虑了各元数据的整体使用次数,同时还考虑了各元数据在部分子时间段(例如近期某个时间段)内的使用次数,因此,提高了热度排序的准确率。
另外,在第二热度值计算时,是采用上述包含有log函数的预设公式进行的,log函数是基于统计周期的光滑衰减曲线,j表示在预设排序子时间段中,距离开始时间的长短。j越大,距离开始时间则越长,此时,基于dj i得到的[dj i×logperiod(j+C)]的值也越大。因此,对于最终得到的第二热度值而言,距离设排序子时间段开始时间越长,也就是,距离当前时间越近的统计周期内产生的查询次数,对最终第二热度值的影响越大。综上,相比于直接将整个排序时间段内,元数据的使用次数进行归一化之后,作为元数据的热度值的计算方式,采用上述包含有log函数的预设公式,得到的计算结果准确度更高,因此,基于准确度更高的第二热度值得到的总热度值也更高,进而使得按照上述总热度值得到的热度排序也更加准确,即:更能准确地反映出各元数据的使用频繁程度。
下面通过具体例子,说明相比于现有的热度排序方法,本申请实施例的得到的热度排序准确率更高:
假设共两个元数据:A和B,预设排序时间段为1个月(以2月份为例,1个月共28天),具体的,对于元数据A,在2月1日这一天,被使用次数为10000,之后,未被再次使用;而对于元数据B,在2月1日这一天,被使用次数仅为1000,之后未被再次使用,直至最后一周,每天被使用次数为100。
而采用本申请实施例的方案,若设定预设排序子时间段为最后一周,则可以得到A的第二热度值为:
B的第二热度值为:
由于本申请实施例中A和B的第一热度值与上述现有技术中得到的A和B的热度值相同,即:本实施例中,A的第一热度值为1,B的第一热度值为0.38,因此,计算可得:A的总热度值为1+0=1;B的总热度值为:0.38+1=1.38,即:B的热度排名超前于A。
相比可知,虽然A在整体时间段内使用次数较高,但是,使用次数主要集中在前期,而后期的使用次数均为0,而B虽然整体时间段内使用次数较低,但是后期(最后一周)内的使用次数相比于A均较多,从理论上讲,在热度排序时,应该同时考虑整体使用次数和近期使用次数,得到的结论应为:B的热度排名超前于A,即与本申请实施例的结果一致,因此,相比于现有热度排序方法,本申请实施例的准确率更高。
基于同一发明构思,根据本申请上述实施例提供的元数据热度排序方法,相应地,本申请一个实施例还提供了一种元数据热度排序装置,该装置的结构示意图如图3所示,包括:
使用次数获取模块301,用于分别获取预设排序时间段内各元数据的整体使用次数和预设排序子时间段包含的各统计周期内各元数据的周期使用次数;预设排序子时间段为预设排序时间段中的子时间段;
第一热度值得到模块302,用于基于各元数据的整体使用次数,得到各元数据的第一热度值;
第二热度值得到模块303,用于根据各元数据的周期使用次数,,得到各元数据的第二热度值;
总热度值得到模块304,用于按照预设计算规则,对各元数据的第一热度值和各元数据的第二热度值进行计算,得到各元数据的总热度值。
热度排序模块305,用于基于各元数据的总热度值,得到热度排序。
进一步的,第二热度值得到模块303具体用于:
针对每个元数据,分别以各统计周期在预设排序子时间段中的周期序号与预设参数值之和作为真数,以预设排序子时间段内包含的统计周期的个数作为底,进行对数运算,得到各统计周期的对数运算结果;
计算各统计周期的对数运算结果和各统计周期内该元数据的周期使用次数的乘积,得到各统计周期的乘积运算结果;
对各统计周期的乘积运算结果求和,得到该元数据的子时间段使用次数;其中,第一个统计周期在预设排序子时间段中的周期序号为1,其他统计周期在预设排序子时间段中的周期序号为前一统计周期在预设排序子时间段中的周期序号加1;预设参数值为大于0的值;
将各元数据的子时间段使用次数与最大子时间段使用次数的比值,分别确定为各元数据的第二热度值;其中,最大子时间段使用次数为各元数据的子时间段使用次数中的最大值。
进一步的,第一热度值得到模块302,具体用于:
对各元数据的整体使用次数进行归一化,得到各元数据的第一热度值。
进一步的,总热度值得到模块304,具体用于:
对各元数据的第一热度值和各元数据的第二热度值求和,得到各元数据的总热度值;
或者,
确定与各元数据的第一热度值对应的第一权重值,以及与各元数据的第二热度值对应的第二权重值;
计算第一权重值与第一热度值的第一乘积值,以及第二权重值与第二热度值的第二乘积值;
对各元数据的第一乘积值与第二乘积值求和,得到各元数据的总热度值。
在图3所示实施例中,在计算各元数据的热度值时,是基于两种使用次数进行的:各元数据在整个排序时间段内的整体使用次数和各元数据在预设排序子时间段包含的各统计周期内各元数据的周期使用次数,也就是说,本申请实施例既考虑了各元数据的整体使用次数,同时还考虑了各元数据在部分子时间段(例如近期某个时间段)内的使用次数,因此,提高了热度排序的准确率。
本申请实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现如下步骤:
分别获取预设排序时间段内各元数据的整体使用次数和预设排序子时间段包含的各统计周期内各元数据的周期使用次数;预设排序子时间段为预设排序时间段中的子时间段;
基于各元数据的整体使用次数,得到各元数据的第一热度值;
根据各元数据的周期使用次数,得到各元数据的第二热度值;
按照预设计算规则,对各元数据的第一热度值和各元数据的第二热度值进行计算,得到各元数据的总热度值;
基于各元数据的总热度值,得到热度排序。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的元数据热度排序方法。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的元数据热度排序方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备以及存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
Claims (10)
1.一种元数据热度排序方法,其特征在于,包括:
分别获取预设排序时间段内各元数据的整体使用次数和预设排序子时间段包含的各统计周期内各元数据的周期使用次数;所述预设排序子时间段为所述预设排序时间段中的子时间段;
基于所述各元数据的整体使用次数,得到所述各元数据的第一热度值;
根据所述各元数据的周期使用次数,得到所述各元数据的第二热度值;
按照预设计算规则,对所述各元数据的第一热度值和所述各元数据的第二热度值进行计算,得到所述各元数据的总热度值;
基于所述各元数据的总热度值,得到热度排序。
2.根据权利要求1所述的方法,其特征在于,所述根据所述各元数据的周期使用次数,得到所述各元数据的第二热度值,包括:
针对每个元数据,分别以各统计周期在所述预设排序子时间段中的周期序号与预设参数值之和作为真数,以所述预设排序子时间段内包含的统计周期的个数作为底,进行对数运算,得到各统计周期的对数运算结果;
计算各统计周期的对数运算结果和各统计周期内该元数据的周期使用次数的乘积,得到各统计周期的乘积运算结果;
对所述各统计周期的乘积运算结果求和,得到该元数据的子时间段使用次数;其中,第一个统计周期在所述预设排序子时间段中的周期序号为1,其他统计周期在所述预设排序子时间段中的周期序号为前一统计周期在所述预设排序子时间段中的周期序号加1;所述预设参数值为大于0的值;
将各元数据的子时间段使用次数与最大子时间段使用次数的比值,确定为所述各元数据的第二热度值;其中,所述最大子时间段使用次数为所述各元数据的子时间段使用次数中的最大值。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述各元数据的整体使用次数,得到所述各元数据的第一热度值,包括:
对所述各元数据的整体使用次数进行归一化,得到所述各元数据的第一热度值。
4.根据权利要求1或2所述的方法,其特征在于,所述按照预设计算规则,对所述各元数据的第一热度值和所述各元数据的第二热度值进行计算,得到所述各元数据的总热度值,包括:
对所述各元数据的第一热度值和所述各元数据的第二热度值求和,得到所述各元数据的总热度值;
或者,
确定与所述各元数据的第一热度值对应的第一权重值,以及与所述各元数据的第二热度值对应的第二权重值;
计算所述第一权重值与所述第一热度值的第一乘积值,以及所述第二权重值与所述第二热度值的第二乘积值;
对所述各元数据的所述第一乘积值与所述第二乘积值求和,得到所述各元数据的总热度值。
5.一种元数据热度排序装置,其特征在于,包括:
使用次数获取模块,用于分别获取预设排序时间段内各元数据的整体使用次数和预设排序子时间段包含的各统计周期内各元数据的周期使用次数;所述预设排序子时间段为所述预设排序时间段中的子时间段;
第一热度值得到模块,用于基于所述各元数据的整体使用次数,得到所述各元数据的第一热度值;
第二热度值得到模块,用于根据所述各元数据的周期使用次数,得到各元数据的第二热度值;
总热度值得到模块,用于按照预设计算规则,对所述各元数据的第一热度值和所述各元数据的第二热度值进行计算,得到所述各元数据的总热度值;
热度排序模块,用于基于所述各元数据的总热度值,得到热度排序。
6.根据权利要求5所述的装置,其特征在于,所述二热度值得到模块,具体用于:
针对每个元数据,分别以各统计周期在所述预设排序子时间段中的周期序号与预设参数值之和作为真数,以所述预设排序子时间段内包含的统计周期的个数作为底,进行对数运算,得到各统计周期的对数运算结果;
计算各统计周期的对数运算结果和各统计周期内该元数据的周期使用次数的乘积,得到各统计周期的乘积运算结果;
对所述各统计周期的乘积运算结果求和,得到该元数据的子时间段使用次数;其中,第一个统计周期在所述预设排序子时间段中的周期序号为1,其他统计周期在所述预设排序子时间段中的周期序号为前一统计周期在所述预设排序子时间段中的周期序号加1;所述预设参数值为大于0的值;
将各元数据的子时间段使用次数与最大子时间段使用次数的比值,确定为所述各元数据的第二热度值;其中,所述最大子时间段使用次数为所述各元数据的子时间段使用次数中的最大值。
7.根据权利要求5或6所述的装置,其特征在于,所述第一热度值得到模块,具体用于:
对所述各元数据的整体使用次数进行归一化,得到所述各元数据的第一热度值。
8.根据权利要求5或6所述的装置,其特征在于,所述总热度值得到模块,具体用于:
对所述各元数据的第一热度值和所述各元数据的第二热度值求和,得到所述各元数据的总热度值;
或者,
确定与所述各元数据的第一热度值对应的第一权重值,以及与所述各元数据的第二热度值对应的第二权重值;
计算所述第一权重值与所述第一热度值的第一乘积值,以及所述第二权重值与所述第二热度值的第二乘积值;
对所述各元数据的所述第一乘积值与所述第二乘积值求和,得到所述各元数据的总热度值。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010609282.0A CN111782702B (zh) | 2020-06-29 | 2020-06-29 | 一种元数据热度排序方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010609282.0A CN111782702B (zh) | 2020-06-29 | 2020-06-29 | 一种元数据热度排序方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111782702A true CN111782702A (zh) | 2020-10-16 |
CN111782702B CN111782702B (zh) | 2024-05-03 |
Family
ID=72761111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010609282.0A Active CN111782702B (zh) | 2020-06-29 | 2020-06-29 | 一种元数据热度排序方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111782702B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103327079A (zh) * | 2013-05-31 | 2013-09-25 | 青岛海信传媒网络技术有限公司 | 一种多媒体资源的缓存方法及装置 |
CN106502504A (zh) * | 2016-10-31 | 2017-03-15 | 维沃移动通信有限公司 | 一种图标排序的方法及移动终端 |
CN107229754A (zh) * | 2017-06-30 | 2017-10-03 | 北京金山安全软件有限公司 | 信息排序方法、装置、电子设备及存储介质 |
WO2018077092A1 (zh) * | 2016-10-31 | 2018-05-03 | 中兴通讯股份有限公司 | 应用于分布式文件系统的存盘方法、装置及分布式文件系统 |
CN109446419A (zh) * | 2018-10-17 | 2019-03-08 | 武汉斗鱼网络科技有限公司 | 一种推荐视频的方法以及装置 |
CN110008199A (zh) * | 2019-03-25 | 2019-07-12 | 华南理工大学 | 一种基于访问热度的数据迁移部署方法 |
CN110750682A (zh) * | 2018-07-06 | 2020-02-04 | 武汉斗鱼网络科技有限公司 | 一种标题热词自动计量方法、存储介质、电子设备及系统 |
-
2020
- 2020-06-29 CN CN202010609282.0A patent/CN111782702B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103327079A (zh) * | 2013-05-31 | 2013-09-25 | 青岛海信传媒网络技术有限公司 | 一种多媒体资源的缓存方法及装置 |
CN106502504A (zh) * | 2016-10-31 | 2017-03-15 | 维沃移动通信有限公司 | 一种图标排序的方法及移动终端 |
WO2018077092A1 (zh) * | 2016-10-31 | 2018-05-03 | 中兴通讯股份有限公司 | 应用于分布式文件系统的存盘方法、装置及分布式文件系统 |
CN107229754A (zh) * | 2017-06-30 | 2017-10-03 | 北京金山安全软件有限公司 | 信息排序方法、装置、电子设备及存储介质 |
CN110750682A (zh) * | 2018-07-06 | 2020-02-04 | 武汉斗鱼网络科技有限公司 | 一种标题热词自动计量方法、存储介质、电子设备及系统 |
CN109446419A (zh) * | 2018-10-17 | 2019-03-08 | 武汉斗鱼网络科技有限公司 | 一种推荐视频的方法以及装置 |
CN110008199A (zh) * | 2019-03-25 | 2019-07-12 | 华南理工大学 | 一种基于访问热度的数据迁移部署方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111782702B (zh) | 2024-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9317591B2 (en) | Ranking search results based on word weight | |
CN109040844B (zh) | 一种获取视频热度的方法、装置及电子设备 | |
US20190197416A1 (en) | Information recommendation method, apparatus, and server based on user data in an online forum | |
CN109241415B (zh) | 项目推荐方法、装置、计算机设备及存储介质 | |
WO2020037930A1 (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN109275031B (zh) | 一种视频的热度评估方法、装置及电子设备 | |
CN110825977A (zh) | 一种数据推荐方法及相关设备 | |
CN108062418B (zh) | 一种数据搜索方法、装置及服务器 | |
CN110442801B (zh) | 一种目标事件的关注用户的确定方法及装置 | |
CN110738508A (zh) | 一种数据分析方法和装置 | |
CN110909232A (zh) | 一种话题热度的确定方法和装置 | |
CN111782702A (zh) | 一种元数据热度排序方法、装置、设备及存储介质 | |
CN107590176B (zh) | 一种评价指标的获得方法、装置及电子设备 | |
CN112287208A (zh) | 用户画像生成方法、装置、电子设备及存储介质 | |
CN110717109B (zh) | 推荐数据的方法、装置、电子设备及存储介质 | |
CN110868622B (zh) | 一种卡顿分析方法、装置、电子设备及存储介质 | |
CN113836412A (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN110674412A (zh) | 资源的推荐信息推送方法及装置、电子设备 | |
CN112328081A (zh) | 一种文件查找方法、装置、电子设备及可读存储介质 | |
CN112465546A (zh) | 一种用户识别方法、装置及设备 | |
CN112395510A (zh) | 基于活跃度确定目标用户的方法和装置 | |
CN112035749A (zh) | 用户行为特征分析方法、推荐方法及相应装置 | |
CN112328878B (zh) | 事件推荐方法、装置、设备及存储介质 | |
CN112989276A (zh) | 信息推送系统的评价方法和装置 | |
CN110209690B (zh) | 数据获取方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |