CN106897449A - 排序方法及装置 - Google Patents
排序方法及装置 Download PDFInfo
- Publication number
- CN106897449A CN106897449A CN201710124355.5A CN201710124355A CN106897449A CN 106897449 A CN106897449 A CN 106897449A CN 201710124355 A CN201710124355 A CN 201710124355A CN 106897449 A CN106897449 A CN 106897449A
- Authority
- CN
- China
- Prior art keywords
- dimension
- network information
- data
- network
- per
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Abstract
本发明提供了一种排序方法及装置,是依据用户对各网络信息已经进行的实际操作产生的至少一个维度的数据,获得各网络信息相应的搜索热度值。不同的网络信息对应的每一维度的数据可能不同,即一网络信息相应的所述至少一个维度的数据,都是隶属于该网络信息的,与其他网络信息是没有关系的,与现有技术中使用关键词的方式相比,不会产生有歧义。因此,依据各网络信息相应的至少一个维度的数据,获得的各网络信息相应的搜索热度值更加精确,与现有技术相比,依据各网络信息相应的搜索热度值,对各网络信息进行排序更加准确。
Description
技术领域
本发明涉及通信技术领域,更具体的涉及排序方法及装置。
背景技术
随着互联网的普及,人们获得信息的途径多种多样。由于信息来源的多样化与信息的冗杂性,导致用户需要花费大量的精力进行信息检索,从而获得自己关注的网络信息,例如大家普遍关注的网络信息-网络热文。网络热文是对用户关注度较高的文章或新闻等信息的统称。
为了让用户快速找到网络热文,对网络信息的排序方法应运而生,目前的网络信息排序方法包括:统计一定时间内大量用户搜索的关键词,依据对大量的关键词的分析结果,对网络信息进行排序。
由于关键词的信息量较少,且有时关键词具有歧义,因此使用关键词对网络信息进行排序的结果不准确。
发明内容
有鉴于此,本发明提供了一种排序方法及装置,以克服现有技术中使用关键词对网络信息进行排序的结果不准确的问题。
为实现上述目的,本发明提供如下技术方案:
一种排序方法,包括:
获取各网络信息相应的至少一个维度的数据,其中,所述至少一个维度中每一维度为收藏维度或评论维度或曝光维度或点击维度或分享维度;
依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值;
依据各网络信息相应的搜索热度值,对各网络信息进行排序。
其中,所述依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值包括:
分别将每一维度对应的各网络信息相应的数据进行数据标准化,获得每一维度的各网络信息相应的标准数据;
依据各网络信息相应的所述至少一个维度相应的标准数据,获得各网络信息相应的搜索热度值。
其中,所述分别将每一维度对应的各网络信息相应的数据进行数据标准化,获得每一维度的各网络信息相应的标准数据包括:
依据每一维度对应的各网络信息相应的数据的平均值以及标准差,获得每一维度对应的各网络信息相应的标准数据。
其中,所述依据各网络信息相应的所述至少一个维度相应的标准数据,获得各网络信息相应的搜索热度值包括:
依据每一网络信息相应的每一维度的标准数据,以及预先设置的每一维度的权重,计算出每一网络信息相应的搜索热度值。
优选地,还包括:
分别依据每一维度对应的各网络信息相应的数据,对每一维度的各网络信息进行降序排序;
将每一维度中前预设数目个网络数据,确定为网络热文候选集合中的元素,所述网络热文候选集合中各网络数据均不相同;
所述依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值包括:
依据所述网络热文候选集合中各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值。
一种排序装置,包括:
第一获取模块,用于获取各网络信息相应的至少一个维度的数据,其中,所述至少一个维度中每一维度为收藏维度或评论维度或曝光维度或点击维度或分享维度;
第二获取模块,用于依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值;
第一排序模块,用于依据各网络信息相应的搜索热度值,对各网络信息进行排序。
其中,所述第二获取模块包括:
第一获取单元,用于分别将每一维度对应的各网络信息相应的数据进行数据标准化,获得每一维度的各网络信息相应的标准数据;
第二获取单元,用于依据各网络信息相应的所述至少一个维度相应的标准数据,获得各网络信息相应的搜索热度值。
其中,所述第一获取单元具体用于:
依据每一维度对应的各网络信息相应的数据的平均值以及标准差,获得每一维度对应的各网络信息相应的标准数据。
其中,所述第二获取单元具体用于:
依据每一网络信息相应的每一维度的标准数据,以及预先设置的每一维度的权重,计算出每一网络信息相应的搜索热度值。
优选的,还包括:
第二排序模块,用于分别依据每一维度对应的各网络信息相应的数据,对每一维度的各网络信息进行降序排序;
确定模块,用于将每一维度中前预设数目个网络数据,确定为网络热文候选集合中的元素,所述网络热文候选集合中各网络数据均不相同;
第二获取模块具体用于:依据所述网络热文候选集合中各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值。
经由上述的技术方案可知,与现有技术相比,本发明实施例提供了一种排序方法,是依据用户对各网络信息已经进行的实际操作产生的至少一个维度的数据,获得各网络信息相应的搜索热度值。不同的网络信息对应的每一维度的数据可能不同,即一网络信息相应的所述至少一个维度的数据,都是隶属于该网络信息的,与其他网络信息是没有关系的,与现有技术中使用关键词的方式相比,不会产生有歧义。因此,依据各网络信息相应的至少一个维度的数据,获得的各网络信息相应的搜索热度值更加精确,与现有技术相比,依据各网络信息相应的搜索热度值,对各网络信息进行排序更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种排序方法的流程示意图;
图2为本发明实施例提供的一种排序方法中依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值的一种实现方式的方法流程示意图;
图3为本发明实施例提供的一种排序装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所述,为本发明实施例提供的一种排序方法的流程示意图,该方法包括:
步骤S101:获取各网络信息相应的至少一个维度的数据。
其中,所述至少一个维度中每一维度为收藏维度,或,评论维度,或,曝光维度,或,点击维度,或,分享维度。
下面对本发明实施例中收藏维度、评论维度、曝光维度、点击维度、分享维度进行说明。
收藏维度-collect:网络信息(例如新闻)在客户端(例如新闻客户端)推送给用户,用户收藏该文章的行为。用户可以点击收藏按键,从而可以收藏相应的网络信息。收藏维度对应收藏数据,该网络信息的被收藏的次数,即为该网络信息相应的收藏数据。
评论维度-comment:网络信息在客户端推送给用户后,用户评论该网络信息的行为。评论维度对应评论数据,该网络信息被评论的次数,即为该网络信息相应的评论数据。
曝光维度-exposure:网络信息在客户端推送给用户后,该网络信息被曝光的行为,即用户点击该网络信息,该网络信息展示给用户的过程即为曝光行为。曝光维度对应曝光数据,曝光数据表示阅读该网络信息的次数。
点击维度-click:网络信息在客户端推送给用户后,该网络信息被用户点击的行为。点击维度对应点击数据。点击数据即为网络信息被用户点击的次数。
分享维度-share:网络信息在客户端推送给用户后,该网络信息被用户分享的行为。分享维度对应分享数据,即该网络信息被分享的次数,例如分享至某个好友,分享至朋友圈等等,都为分享行为。
由于用户执行上述行为都是在自己的终端上进行的,本发明实施例涉及的步骤S101中“各网络信息相应的至少一个维度的数据”,包括不同用户对同一网络信息执行的不同维度的操作,以及,不同用户对不同网络信息执行的不同维度的操作。因此,可选的,可以在客户端中设置埋点技术,这样当用户对安装有该客户端的终端中显示的网络信息进行不同维度的操作时,该终端就可以记录并保存用户对相应网络信息的不同维度的操作以及操作次数。并反馈至具有本发明实施例提供的排序方法功能的电子设备,例如服务器。
步骤S102:依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值。
假设,所述至少一个维度的数据包括收藏维度的数据、评论维度的数据、曝光维度的数据、点击维度的数据以及分享维度的数据五个维度的数据。
网络信息的搜索热度值可以=该网络信息的收藏维度的数据+该网络信息的评论维度的数据+该网络信息的曝光维度的数据+该网络信息的点击维度的数据+该网络信息的分享维度的数据。
网络信息的搜索热度值可以=(该网络信息的收藏维度的数据+该网络信息的评论维度的数据+该网络信息的曝光维度的数据+该网络信息的点击维度的数据+该网络信息的分享维度的数据)/5。
还可以预先设置不同维度的权重,例如收藏维度对应收藏权重,评论维度对应评论权重,曝光维度对应曝光权重,点击维度对应点击权重,分享维度对应分享权重。各维度相应的权重之和为1。
则网络信息的搜索热度值可以=该网络信息的收藏维度的数据*收藏权重+该网络信息的评论维度的数据*评论权重+该网络信息的曝光维度的数据*曝光权重+该网络信息的点击维度的数据*点击权重+该网络信息的分享维度的数据*分享权重。
网络信息的搜索热度值可以=(该网络信息的收藏维度的数据*收藏权重+该网络信息的评论维度的数据*评论权重+该网络信息的曝光维度的数据*曝光权重+该网络信息的点击维度的数据*点击权重+该网络信息的分享维度的数据*分享权重)/5。
步骤S103:依据各网络信息相应的搜索热度值,对各网络信息进行排序。
本发明实施例提供的排序方法,是依据用户对各网络信息已经进行的实际操作产生的至少一个维度的数据,获得各网络信息相应的搜索热度值。不同的网络信息对应的每一维度的数据可能不同,即一网络信息相应的所述至少一个维度的数据,都是隶属于该网络信息的,与其他网络信息是没有关系的,与现有技术中使用关键词的方式相比,不会产生有歧义。因此,依据各网络信息相应的至少一个维度的数据,获得的各网络信息相应的搜索热度值更加精确,与现有技术相比,依据各网络信息相应的搜索热度值,对各网络信息进行排序更加准确。
本发明实施例还可以包括:将排序后的各网络信息推荐至用户。可以保证网络信息的推荐质量,提高用户黏度,能够有效的保证用户阅读时长。
如图2所示,为本发明实施例提供的一种排序方法中依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值的一种实现方式的方法流程示意图,该方法包括:
步骤S201:分别将每一维度对应的各网络信息相应的数据进行数据标准化,获得每一维度的各网络信息相应的标准数据。
将每一维度对应的各网络信息相应的数据进行数据标准化的方法有多种,本发明实施例提供但不限于以下实现方式。
第一种,依据每一维度对应的各网络信息相应的数据的平均值以及标准差,获得每一维度对应的各网络信息相应的标准数据。
例如z-score标准化,假设一维度对应的各网络信息的数据的平均值为μ,标准差为σ,则该维度中各网络信息相应的标准数据X'的计算公式可以如下:
其中,x为相应维度下,相应网络信息标准化之前的数据。
假设曝光维度对应的各网络数据的平均值为1273,标准差为7分,网络信息1在曝光维度的数据为1336,则该网络信息1的标准数据
第一种方式适用于该维度的网络信息的个数大于等于预设值情况下。预设值可以根据实际情况而定。
可以理解的是,假设所述至少一个维度为5个维度。各网络信息都具有5个维度的数据,此时,每一维度的网络信息的个数是相同的。但是,可以理解的是,有的用户可能只是曝光了某一网络信息,但是并未进行评论,或者,评论了该网络信息,但是并未分享。所以,有的网络信息可能不具备5个维度的数据,可能只具备4个维度、3个维度、2个维度,甚至1个维度的数据。所以每一维度的网络信息的个数可能不同。
第二种,依据每一维度中各网络信息相应的数据的最大值和最小值,获得每一维度对应的各网络信息相应的标准数据。
例如,Min-max标准化,假设一维度中,各网络信息相应的数据的最大值为maxA,最小值为minA,则该维度中每一网络信息相应的标准数据X'的计算公式可以如下:
其中,x为相应维度下,相应网络信息标准化之前的数据。
步骤S202:依据各网络信息相应的所述至少一个维度相应的标准数据,获得各网络信息相应的搜索热度值。
步骤S202的实现方式有多种,本发明实施例提供但不限于以下几种。
假设所述至少一个维度包括收藏维度、评论维度、曝光维度、点击维度以及分享维度5个维度。
第一种,网络信息的搜索热度值=该网络信息的收藏维度的标准数据+该网络信息的评论维度的标准数据+该网络信息的曝光维度的标准数据+该网络信息的点击维度的标准数据+该网络信息的分享维度的标准数据。
第二种,网络信息的搜索热度值=(该网络信息的收藏维度的标准数据+该网络信息的评论维度的标准数据+该网络信息的曝光维度的标准数据+该网络信息的点击维度的标准数据+该网络信息的分享维度的标准数据)/5。
第三种,网络信息的搜索热度值=该网络信息的收藏维度的标准数据*收藏权重+该网络信息的评论维度的标准数据*评论权重+该网络信息的曝光维度的标准数据*曝光权重+该网络信息的点击维度的标准数据*点击权重+该网络信息的分享维度的标准数据*分享权重。
为了加快排序速度,本发明实施例通过下述方法巧妙的减少了需要计算搜索热度值的网络信息的数量。具体方法如下:
分别依据每一维度对应的各网络信息相应的数据,对每一维度的各网络信息进行降序排序;
将每一维度中前预设数目个网络数据,确定为网络热文候选集合中的元素,所述网络热文候选集合中各网络数据均不相同。
相应的,步骤S102具体为:依据所述网络热文候选集合中各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值。
假设,一共有50000个网络信息,所述至少一个维度包括收藏维度、评论维度、曝光维度、点击维度以及分享维度5个维度。每一网络信息都对应5个维度的数据。预设数目为1000。
对每一维度而言,都具有50000个网络信息;对于收藏维度而言,将50000个网络信息相应的收藏数据进行降序排序。并获取前1000个网络信息;对于评论维度而言,将50000个网络信息相应的评论数据进行降序排序,并获得前1000个网络信息;对于曝光维度而言,将50000个网络信息相应的曝光数据进行降序排序,并获得前1000个网络信息;对于点击维度而言,将50000个网络信息相应的点击数据进行降序排序,并获得前1000个网络信息;对于分享维度而言,将50000个网络信息相应的分享数据进行降序排序,并获得前1000个网络信息。
这样就获得了5000个网络信息,但是在每个维度的前1000名中,可能有重复的网络信息,每一网络信息可以具有一标识ID,可以将依据各网络信息的标识ID进行去重,即去除重复的网络信息。所以网络热文候选集合中元素的个数小于等于所述至少一个维度的中维度的个数*预设数目=5*1000=5000。
本发明实施例还提供了一种与排序方法对应的排序装置,下面对排序装置中各模块和各单元进行说明,排序装置中各模块和各单元的详细说明可以参见排序方法中相应步骤的说明,下面就不再进行赘述。
如图3所示,为本发明实施例提供的一种排序装置的结构示意图,该排序装置包括:
第一获取模块31,用于获取各网络信息相应的至少一个维度的数据,其中,所述至少一个维度中每一维度为收藏维度或评论维度或曝光维度或点击维度或分享维度;
下面对本发明实施例中收藏维度、评论维度、曝光维度、点击维度、分享维度进行说明。
收藏维度-collect:网络信息(例如新闻)在客户端(例如新闻客户端)推送给用户,用户收藏该文章的行为。用户可以点击收藏按键,从而可以收藏相应的网络信息。收藏维度对应收藏数据,该网络信息的被收藏的次数,即为该网络信息相应的收藏数据。
评论维度-comment:网络信息在客户端推送给用户后,用户评论该网络信息的行为。评论维度对应评论数据,该网络信息被评论的次数,即为该网络信息相应的评论数据。
曝光维度-exposure:网络信息在客户端推送给用户后,该网络信息被曝光的行为,即用户点击该网络信息,该网络信息展示给用户的过程即为曝光行为。曝光维度对应曝光数据,曝光数据表示阅读该网络信息的次数。
点击维度-click:网络信息在客户端推送给用户后,该网络信息被用户点击的行为。点击维度对应点击数据。点击数据即为网络信息被用户点击的次数。
分享维度-share:网络信息在客户端推送给用户后,该网络信息被用户分享的行为。分享维度对应分享数据,即该网络信息被分享的次数,例如分享至某个好友,分享至朋友圈等等,都为分享行为。
由于用户执行上述行为都是在自己的终端上进行的,本发明实施例涉及的第一获取模块31中“各网络信息相应的至少一个维度的数据”,包括不同用户对同一网络信息执行的不同维度的操作,以及,不同用户对不同网络信息执行的不同维度的操作。因此,可选的,可以在客户端中设置埋点技术,这样当用户对安装有该客户端的终端中显示的网络信息进行不同维度的操作时,该终端就可以记录并保存用户对相应网络信息的不同维度的操作以及操作次数。并反馈至具有本发明实施例提供的排序方法功能的电子设备,例如服务器。
第二获取模块32,用于依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值;
假设,所述至少一个维度的数据包括收藏维度的数据、评论维度的数据、曝光维度的数据、点击维度的数据以及分享维度的数据五个维度的数据。
网络信息的搜索热度值可以=该网络信息的收藏维度的数据+该网络信息的评论维度的数据+该网络信息的曝光维度的数据+该网络信息的点击维度的数据+该网络信息的分享维度的数据。
网络信息的搜索热度值可以=(该网络信息的收藏维度的数据+该网络信息的评论维度的数据+该网络信息的曝光维度的数据+该网络信息的点击维度的数据+该网络信息的分享维度的数据)/5。
还可以预先设置不同维度的权重,例如收藏维度对应收藏权重,评论维度对应评论权重,曝光维度对应曝光权重,点击维度对应点击权重,分享维度对应分享权重。各维度相应的权重之和为1。
则网络信息的搜索热度值可以=该网络信息的收藏维度的数据*收藏权重+该网络信息的评论维度的数据*评论权重+该网络信息的曝光维度的数据*曝光权重+该网络信息的点击维度的数据*点击权重+该网络信息的分享维度的数据*分享权重。
网络信息的搜索热度值可以=(该网络信息的收藏维度的数据*收藏权重+该网络信息的评论维度的数据*评论权重+该网络信息的曝光维度的数据*曝光权重+该网络信息的点击维度的数据*点击权重+该网络信息的分享维度的数据*分享权重)/5。
第一排序模块33,用于依据各网络信息相应的搜索热度值,对各网络信息进行排序。
本发明实施例提供的排序装置,第二获取模块32是依据用户对各网络信息已经进行的实际操作产生的至少一个维度的数据,获得各网络信息相应的搜索热度值。不同的网络信息对应的每一维度的数据可能不同,即一网络信息相应的所述至少一个维度的数据,都是隶属于该网络信息的,与其他网络信息是没有关系的,与现有技术中使用关键词的方式相比,不会产生有歧义。因此,依据各网络信息相应的至少一个维度的数据,获得的各网络信息相应的搜索热度值更加精确,与现有技术相比,第一排序模块33依据各网络信息相应的搜索热度值,对各网络信息进行排序更加准确。
可选的,所述第二获取模块包括:
第一获取单元,用于分别将每一维度对应的各网络信息相应的数据进行数据标准化,获得每一维度的各网络信息相应的标准数据;
第二获取单元,用于依据各网络信息相应的所述至少一个维度相应的标准数据,获得各网络信息相应的搜索热度值。
将每一维度对应的各网络信息相应的数据进行数据标准化的方法有多种,本发明实施例提供但不限于以下实现方式。
第一种,依据每一维度对应的各网络信息相应的数据的平均值以及标准差,获得每一维度对应的各网络信息相应的标准数据。
例如z-score标准化,假设一维度对应的各网络信息的数据的平均值为μ,标准差为σ,则该维度中各网络信息相应的标准数据X'的计算公式可以如下:
其中,x为相应维度下,相应网络信息标准化之前的数据。
假设曝光维度对应的各网络数据的平均值为1273,标准差为7分,网络信息1在曝光维度的数据为1336,则该网络信息1的标准数据
第一种方式适用于该维度的网络信息的个数大于等于预设值情况下。预设值可以根据实际情况而定。
可以理解的是,假设所述至少一个维度为5个维度。各网络信息都具有5个维度的数据,此时,每一维度的网络信息的个数是相同的。但是,可以理解的是,有的用户可能只是曝光了某一网络信息,但是并未进行评论,或者,评论了该网络信息,但是并未分享。所以,有的网络信息可能不具备5个维度的数据,可能只具备4个维度、3个维度、2个维度,甚至1个维度的数据。所以每一维度的网络信息的个数可能不同。
第二种,依据每一维度中各网络信息相应的数据的最大值和最小值,获得每一维度对应的各网络信息相应的标准数据。
例如,Min-max标准化,假设一维度中,各网络信息相应的数据的最大值为maxA,最小值为minA,则该维度中每一网络信息相应的标准数据X'的计算公式可以如下:
其中,x为相应维度下,相应网络信息标准化之前的数据。
可选的,所述第一获取单元具体用于:
依据每一维度对应的各网络信息相应的数据的平均值以及标准差,获得每一维度对应的各网络信息相应的标准数据。
可选的,所述第二获取单元具体用于:
依据每一网络信息相应的每一维度的标准数据,以及预先设置的每一维度的权重,计算出每一网络信息相应的搜索热度值。
可选的,还包括:
第二排序模块,用于分别依据每一维度对应的各网络信息相应的数据,对每一维度的各网络信息进行降序排序;
确定模块,用于将每一维度中前预设数目个网络数据,确定为网络热文候选集合中的元素,所述网络热文候选集合中各网络数据均不相同;
第二获取模块具体用于:依据所述网络热文候选集合中各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值。
本发明实施例还提供了一种电子设备,如图4所示,为本发明实施例提供的一种电子设备的结构示意图,该电子设备包括:
处理器41、通信接口42、存储器43和通信总线44。
其中处理器41、通信接口42、存储器43通过通信总线44完成相互间的通信。
可选的,通信接口42可以为通信模块的接口,如GSM模块的接口。
处理器41,用于执行程序。
处理器41可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器43,用于存放程序。
程序可以包括程序代码,所述程序代码包括计算机操作指令。
存储器43可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
其中,程序可具体用于:
获取各网络信息相应的至少一个维度的数据,其中,所述至少一个维度中每一维度为收藏维度或评论维度或曝光维度或点击维度或分享维度;
依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值;
依据各网络信息相应的搜索热度值,对各网络信息进行排序。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种排序方法,其特征在于,包括:
获取各网络信息相应的至少一个维度的数据,其中,所述至少一个维度中每一维度为收藏维度或评论维度或曝光维度或点击维度或分享维度;
依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值;
依据各网络信息相应的搜索热度值,对各网络信息进行排序。
2.根据权利要求1所述排序方法,其特征在于,所述依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值包括:
分别将每一维度对应的各网络信息相应的数据进行数据标准化,获得每一维度的各网络信息相应的标准数据;
依据各网络信息相应的所述至少一个维度相应的标准数据,获得各网络信息相应的搜索热度值。
3.根据权利要求2所述排序方法,其特征在于,所述分别将每一维度对应的各网络信息相应的数据进行数据标准化,获得每一维度的各网络信息相应的标准数据包括:
依据每一维度对应的各网络信息相应的数据的平均值以及标准差,获得每一维度对应的各网络信息相应的标准数据。
4.根据权利要求2或3所述排序方法,其特征在于,所述依据各网络信息相应的所述至少一个维度相应的标准数据,获得各网络信息相应的搜索热度值包括:
依据每一网络信息相应的每一维度的标准数据,以及预先设置的每一维度的权重,计算出每一网络信息相应的搜索热度值。
5.根据权利要求1至4任一所述排序方法,其特征在于,还包括:
分别依据每一维度对应的各网络信息相应的数据,对每一维度的各网络信息进行降序排序;
将每一维度中前预设数目个网络数据,确定为网络热文候选集合中的元素,所述网络热文候选集合中各网络数据均不相同;
所述依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值包括:
依据所述网络热文候选集合中各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值。
6.一种排序装置,其特征在于,包括:
第一获取模块,用于获取各网络信息相应的至少一个维度的数据,其中,所述至少一个维度中每一维度为收藏维度或评论维度或曝光维度或点击维度或分享维度;
第二获取模块,用于依据各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值;
第一排序模块,用于依据各网络信息相应的搜索热度值,对各网络信息进行排序。
7.根据权利要求6所述排序装置,其特征在于,所述第二获取模块包括:
第一获取单元,用于分别将每一维度对应的各网络信息相应的数据进行数据标准化,获得每一维度的各网络信息相应的标准数据;
第二获取单元,用于依据各网络信息相应的所述至少一个维度相应的标准数据,获得各网络信息相应的搜索热度值。
8.根据权利要求7所述排序装置,其特征在于,所述第一获取单元具体用于:
依据每一维度对应的各网络信息相应的数据的平均值以及标准差,获得每一维度对应的各网络信息相应的标准数据。
9.根据权利要求7或8所述排序装置,其特征在于,所述第二获取单元具体用于:
依据每一网络信息相应的每一维度的标准数据,以及预先设置的每一维度的权重,计算出每一网络信息相应的搜索热度值。
10.根据权利要求6至9任一所述排序装置,其特征在于,还包括:
第二排序模块,用于分别依据每一维度对应的各网络信息相应的数据,对每一维度的各网络信息进行降序排序;
确定模块,用于将每一维度中前预设数目个网络数据,确定为网络热文候选集合中的元素,所述网络热文候选集合中各网络数据均不相同;
第二获取模块具体用于:依据所述网络热文候选集合中各网络信息相应的所述至少一个维度的数据,获得各网络信息相应的搜索热度值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710124355.5A CN106897449A (zh) | 2017-03-03 | 2017-03-03 | 排序方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710124355.5A CN106897449A (zh) | 2017-03-03 | 2017-03-03 | 排序方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106897449A true CN106897449A (zh) | 2017-06-27 |
Family
ID=59184846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710124355.5A Pending CN106897449A (zh) | 2017-03-03 | 2017-03-03 | 排序方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106897449A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020095A (zh) * | 2017-07-21 | 2019-07-16 | 北京搜狗科技发展有限公司 | 热度提醒方法、装置以及用于热度提醒的装置 |
CN110147487A (zh) * | 2017-10-17 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 一种确定对象热度的方法及系统、处理设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281619A (zh) * | 2013-07-11 | 2015-01-14 | 鸿富锦精密工业(深圳)有限公司 | 搜索结果排序系统及方法 |
CN105512183A (zh) * | 2015-11-24 | 2016-04-20 | 中国科学院重庆绿色智能技术研究院 | 一种基于用户自主选择的个性化推荐方法和系统 |
CN105868332A (zh) * | 2016-03-28 | 2016-08-17 | 百度在线网络技术(北京)有限公司 | 一种热点概念的推荐方法和装置 |
CN106225799A (zh) * | 2016-07-18 | 2016-12-14 | 北京天下游信息技术有限公司 | 旅游信息动态导航系统及方法 |
-
2017
- 2017-03-03 CN CN201710124355.5A patent/CN106897449A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281619A (zh) * | 2013-07-11 | 2015-01-14 | 鸿富锦精密工业(深圳)有限公司 | 搜索结果排序系统及方法 |
CN105512183A (zh) * | 2015-11-24 | 2016-04-20 | 中国科学院重庆绿色智能技术研究院 | 一种基于用户自主选择的个性化推荐方法和系统 |
CN105868332A (zh) * | 2016-03-28 | 2016-08-17 | 百度在线网络技术(北京)有限公司 | 一种热点概念的推荐方法和装置 |
CN106225799A (zh) * | 2016-07-18 | 2016-12-14 | 北京天下游信息技术有限公司 | 旅游信息动态导航系统及方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020095A (zh) * | 2017-07-21 | 2019-07-16 | 北京搜狗科技发展有限公司 | 热度提醒方法、装置以及用于热度提醒的装置 |
CN110147487A (zh) * | 2017-10-17 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 一种确定对象热度的方法及系统、处理设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104572889B (zh) | 一种搜索词推荐方法、装置和系统 | |
CN108197330B (zh) | 基于社交平台的数据挖掘方法及装置 | |
CN107526807B (zh) | 信息推荐方法及装置 | |
CN102667761B (zh) | 可扩展的集群数据库 | |
CN109190043A (zh) | 推荐方法及装置,存储介质,电子设备及推荐系统 | |
Yang et al. | Using the comprehensive patent citation network (CPC) to evaluate patent value | |
CN104077402B (zh) | 数据处理方法和数据处理系统 | |
US20080270549A1 (en) | Extracting link spam using random walks and spam seeds | |
CN108763274B (zh) | 访问请求的识别方法、装置、电子设备及存储介质 | |
CN102314443B (zh) | 搜索引擎的修正方法和系统 | |
CN111581513B (zh) | 一种网站智能信息聚合系统 | |
CN102750346A (zh) | 软件推荐方法和系统、终端设备 | |
CN102043811A (zh) | 一种医疗信息的评估方法及系统 | |
CN102214183A (zh) | 按页面反馈内容与固定排名相结合的搜索引擎查询方法 | |
CN110232126A (zh) | 热点挖掘方法及服务器和计算机可读存储介质 | |
CN109636682A (zh) | 一种教学资源自动收集系统 | |
CN104462096B (zh) | 舆情监测分析方法和装置 | |
CN106897449A (zh) | 排序方法及装置 | |
CN115757689A (zh) | 一种信息查询系统、方法及设备 | |
CN113360661B (zh) | 多租户的媒体大数据应用云服务平台 | |
CN102982035B (zh) | 一种社区用户的搜索排序方法及系统 | |
CN110502680A (zh) | 一种中标公告相关字段的抽取方法及装置 | |
CN109510857B (zh) | 数据存储方法、装置、服务器和系统 | |
CN112532755B (zh) | 一种基于异构信息网络的兴趣列表推送系统 | |
CN102567340A (zh) | 一种过滤微博信息的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170627 |