CN103544327A - 一种微博话题的热度统计方法及相关装置 - Google Patents

一种微博话题的热度统计方法及相关装置 Download PDF

Info

Publication number
CN103544327A
CN103544327A CN201310568033.1A CN201310568033A CN103544327A CN 103544327 A CN103544327 A CN 103544327A CN 201310568033 A CN201310568033 A CN 201310568033A CN 103544327 A CN103544327 A CN 103544327A
Authority
CN
China
Prior art keywords
topic
temperature
unit interval
microblogging
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310568033.1A
Other languages
English (en)
Inventor
康大强
林立安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN YUNZHIJIA NETWORK CO., LTD.
Original Assignee
Kingdee Software China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kingdee Software China Co Ltd filed Critical Kingdee Software China Co Ltd
Priority to CN201310568033.1A priority Critical patent/CN103544327A/zh
Publication of CN103544327A publication Critical patent/CN103544327A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/489Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using time information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例公开了一种微博话题的热度统计方法及相关装置,其中,一种微博话题的热度统计方法,包括:在检测出用户发布的微博与至少一个话题相关联时,对每一个与微博相关联的话题:针对每一个单位时间n,检查是否存在以该话题和单位时间n为主键的热度记录,单位时间1至单位时间k分别表示当前单位时间以及当前单位时间之后的k-1个单位时间;若存在以该话题和单位时间n为主键的热度记录,则将该热度记录的值加上该微博的热度;若不存在以该话题和单位时间n为主键的热度记录,则新增一条以该话题和单位时间n为主键的热度记录,该热度记录的值为上述微博的热度。本发明提供的技术方案能够有效减少微博话题的热度统计的运算量。

Description

一种微博话题的热度统计方法及相关装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种微博话题的热度统计方法及相关装置。
背景技术
微博,即微博客的简称,是一种通过关注机制分享简短实时信息的广播式的社交网络平台,用户通过组建个人的微博社区,可以在个人的微博社区发布简短文字信息,或者,也可以在个人的微博社区发布图片,分享视频等。由于用户在微博社区发布的内容一般较短(例如文字信息不多于140字的限制),因此,通常将用户在微博社区发布的信息称为“微博”。
用户发布的微博或者针对某个微博的回复可能与一个或多个话题相关联,为便于用户查看到热度较高(即受关注程度较高)的话题,当用户需要查看某个话题最近n个单位时间的热度(如某个话题最近7天的热度)或最近n个单位时间的话题的热度排行(如最近7天的话题热度排行)时,需要微博服务器能够快速返回话题的热度数据。
目前,统计最近n个单位时间内话题的热度的方案如下:
当用户发布关联话题的微博时,微博服务器通过对用户发布的微博进行分析获知该微博所关联的话题,微博服务器以该话题和当前时间(精确到统计的时间单位)为主键,在话题热度表中检查是否存在该话题的热度记录,如果不存在该话题的热度记录,则新增一条以该话题和当前时间为主键的热度记录,热度记录的值为该微博的热度;如果存在该话题的热度记录,则更新热度记录,更新后的热度记录的值为更新前的热度记录的值加上该微博的热度。
当用户查看某个话题最近n个单位时间的热度时,微博服务器从数据库中获取指定话题(或全部话题)在指定时间及指定时间之前共n个单位时间的热度记录,把n个热度记录的值相加得出指定话题(或全部话题)在指定时间最近n个单位时间的热度,之后向用户返回统计结果。或者,当用户查看最近n个单位时间话题的热度排行时,微博服务器从数据库中获取所有话题在指定时间及指定时间之前共n个单位时间的热度记录,把n个热度记录的值相加得出所有话题在指定时间最近n个单位时间的热度,并根据所有话题在指定时间最近n个单位时间的热度,按照热度由大到小的顺序对所有话题进行排名,之后向用户返回统计结果。
在上述方案中,用户每次查询话题的热度时,微博服务器都要进行一次统计,当话度的热度被频繁查询时,会对微博服务器造成较大的压力,另外,很多场景中都需要按话题的热度对话题进行排序,此时微博服务器需要对所有话题的热度都进行计算,运算量大。可见,上述方案会对使得微博服务器压力大,从而使得系统反应变慢,降低了系统的性能。
发明内容
本发明实施例提供了一种微博话题的热度统计方法及相关装置,用于减少微博话题的热度统计的运算量,提高系统性能。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明一方面提供一种微博话题的热度统计方法,包括:
检测用户发布的微博是否与至少一个话题相关联;
若检测出上述微博与至少一个话题相关联,则对于每一个与上述微博相关联的话题:
针对每一个单位时间n,检查是否存在以上述话题和单位时间n为主键的热度记录,其中,上述n∈[1,2,...,k],单位时间1至单位时间k分别表示当前单位时间以及当前单位时间之后的k-1个单位时间;
若存在以上述话题和单位时间n为主键的热度记录,则将该热度记录的值加上上述微博的热度,以更新该热度记录;
若不存在以上述话题和单位时间n为主键的热度记录,则新增一条以上述话题和单位时间n为主键的热度记录,该热度记录的值为上述微博的热度。
基于本发明第一方面,在第一种可能的实现方式中,若检测到用户发布的微博评论与至少一个话题相关联,则上述方法还包括:
对于每一个与上述微博评论相关联的话题:
针对每一个单位时间n,检查是否存在以上述话题和单位时间n为主键的热度记录;
若存在以上述话题和单位时间n为主键的热度记录,则将该热度记录的值加上上述微博评论的热度,以更新该热度记录;
若不存在以上述话题和单位时间n为主键的热度记录,则新增一条以上述话题和单位时间n为主键的热度记录,该热度记录的值为上述微博评论的热度。
基于本发明第一方面,或本发明第一方面的第一种可能的实现方式,在第二种可能的实现方式中,若接收到用户查询指定话题在最近k个单位时间内的热度的请求,则上述方法还包括:向上述用户反馈上述指定话题在当前单位时间的热度记录。
基于本发明第一方面,或本发明第一方面的第一种可能的实现方式,在第三种可能的实现方式中,若接收到用户查询最近k个单位时间内所有话题的热度排行的请求,则上述方法还包括:按照热度由大到小的顺序,根据上述所有话题在当前单位时间的热度记录,对上述所有话题进行排序;向上述用户反馈排序后的结果。
基于本发明第一方面,或本发明第一方面的第一种可能的实现方式,在第四种可能的实现方式中,上述检查是否存在以上述话题和单位时间n为主键的热度记录,具体为:检查本地存储的话题热度表中是否存在以上述话题和单位时间n为主键的热度记录。
本发明第二方面提供一种微博话题热度统计装置,包括:
第一检测单元,用于检测用户发布的微博是否与至少一个话题相关联;
第二检测单元,用于当上述第一检测单元检测出上述微博与至少一个话题相关联时,对于每一个与上述微博相关联的话题,针对每一个单位时间n检查是否存在以上述话题和单位时间n为主键的热度记录,其中,上述n∈[1,2,...,k],单位时间1至单位时间k分别表示当前单位时间以及当前单位时间之后的k-1个单位时间;
更新单元,用于当上述第二检测单元检测出存在以上述话题和单位时间n为主键的热度记录时,将该热度记录的值加上上述微博的热度,以更新该热度记录;
热度记录创建单元,用于当上述第二检测单元检测出不存在以上述话题和单位时间n为主键的热度记录时,新增一条以上述话题和单位时间n为主键的热度记录,该热度记录的值为上述微博的热度。
基于本发明第二方面,在第一种可能的实现方式中,
上述第一检测单元还用于:检测用户发布的微博评论是否与至少一个话题相关联;
上述第二检测单元还用于:当上述第一检测单元检测到用户发布的微博评论与至少一个话题相关联时,对于每一个与上述微博评论相关联的话题,针对每一个单位时间n检查是否存在以上述话题和单位时间n为主键的热度记录;
上述更新单元还用于:当上述第二检测单元检测出存在以上述话题和单位时间n为主键的热度记录时,将该热度记录的值加上上述微博评论的热度,以更新该热度记录;
上述热度记录创建单元还用于:当上述第二检测单元检测出不存在以上述话题和单位时间n为主键的热度记录时,新增一条以上述话题和单位时间n为主键的热度记录,该热度记录的值为上述微博评论的热度。
基于本发明第二方面,或者本发明第二方面的第一种可能的实现方式,在第二种可能的实现方式中,
上述热度统计装置还包括:
第一接收单元,用于接收用户查询指定话题在最近k个单位时间内的热度的请求;
第一发送单元,用于当上述接收单元接收到用户查询指定话题在最近k个单位时间内的热度的请求时,向上述用户反馈上述指定话题在当前单位时间的热度记录。
基于本发明第二方面,或者本发明第二方面的第一种可能的实现方式,在第三种可能的实现方式中,
上述热度统计装置还包括:
第二接收单元,用于接收用户查询最近k个单位时间内所有话题的热度排行的请求;
排序单元,用于当上述第二接收单元接收到用户查询最近k个单位时间内所有话题的热度排行的请求时,按照热度由大到小的顺序,根据上述所有话题在当前单位时间的热度记录,对上述所有话题进行排序;
第二发送单元,用于向上述用户反馈上述排序单元排序后的结果。
基于本发明第二方面,或者本发明第二方面的第一种可能的实现方式,在第四种可能的实现方式中,上述第二检测单元具体用于:检查本地存储的话题热度表中是否存在以上述话题和单位时间n为主键的热度记录。
由上可见,本发明实施例中在用户发布关联话题的微博时,通过实时检测当前单位时间及当前单位时间之后共k个单位时间关于该话题的热度记录,在存在相应热度记录时,更新该热度记录,在不存在相应热度记录时,新增热度记录,并使该热度记录的值为该微博的热度,使得用户在查询指定话题在最近k个单位时间的热度或者查询在最近k个单位时间所有话题的热度排行时,只需调用当前单位时间的热度记录,而不需要调用多个单位时间的热度记录进行统计计算,从而避免了用户多次查询时需要对话题热度进行多次重复计算的问题,有效减少了微博话题的热度统计的运算量,缓解了微博服务器的压力,进而提高了系统性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的微博话题的热度统计方法一个实施例流程示意图;
图2为本发明提供的微博话题的热度统计方法另一个实施例流程示意图;
图3为本发明提供的微博话题的热度统计方法另一个实施例流程示意图;
图4为本发明提供的微博话题的热度统计方法再一个实施例流程示意图;
图5为本发明提供的微博话题热度统计装置一个实施例结构示意图;
图6为本发明提供的微博话题热度统计装置另一个实施例结构示意图;
图7为本发明提供的微博话题热度统计装置再一个实施例结构示意图。
具体实施方式
本发明实施例提供了一种微博话题的热度统计方法及相关装置。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面对本发明实施例中的一种微博话题的热度统计方法进行描述,请参见图1,本发明实施例中的微博话题的热度统计方法,包括:
101、检测用户发布的微博是否与至少一个话题相关联;
在本发明实施例中,“话题”是指微博搜索时的关键字,其书写形式是将关键词放在特定字符之间(如两个“#”号之间),后面再加上想发布的内容上,其中,#号内的关键词即为话题词。
一条微博中可以关联一个或者多个话题,即一条微博的内容中可以包括一个或者多个话题词。
当用户发布微博时,微博话题热度统计装置通过检测该微博中是否包含话题词来判定该微博是否与话题相关联,当该微博包含N个话题词时(N大于或等于1),表明该微博与N个话题相关联,当该微博包含N个话题词时,表明该微博与N个话题词相关联。
102、若检测出上述微博与至少一个话题相关联,则对于每一个与上述微博相关联的话题:针对每一个单位时间n,检查是否存在以上述话题和单位时间n为主键的热度记录;
其中,上述n∈[1,2,...,k],单位时间1至单位时间k分别表示当前单位时间以及当前单位时间之后的k-1个单位时间。
若存在以上述话题和单位时间n为主键的热度记录,则执行步骤103;
若不存在以上述话题和单位时间n为主键的热度记录,则执行步骤104。
举例说明,假设本发明实施例中设置“天”为时间单位,上述n等于3,则当上述微博与话题1相关联时,微博话题热度统计装置检测是否存在如下热度记录:以话题1和今天为主键的热度记录,以话题1和明天为主键的热度记录,以话题1和后天为主键的热度记录;针对检测到的热度记录,分别执行步骤103,针对检测不到的热度记录,分别执行步骤104。当上述微博除了关联话题1,还关联话题2时,微博话题热度统计装置检测是否存在如下热度记录:以话题1和今天为主键的热度记录,以话题1和明天为主键的热度记录,以话题1和后天为主键的热度记录,以话题2和今天为主键的热度记录,以话题2和明天为主键的热度记录,以话题2和后天为主键的热度记录;针对检测到的热度记录,分别执行步骤103,针对检测不到的热度记录,分别执行步骤104。
可选地,上述热度记录以话题热度表的形式存储在微博话题热度统计装置本地,则微博话题热度统计装置可以通过检查本地存储的话题热度表来判断是否存在以上述话题和单位时间n为主键的热度记录。或者,上述热度记录也可以存储在其它设备(如云端服务器),则微博话题热度装置需要与其它设置进行通讯来检测是否存在以上述话题和单位时间n为主键的热度记录。
103、将该热度记录的值加上上述微博的热度,以更新该热度记录;
本发明实施例中,与话题关联的微博的热度可以根据实际情况进行设定,例如,可以设定一条与话题关联的微博的热度为M(其中,M为大于1的自然数),则在步骤103中,将该热度记录的值加上M。
当然,与话题关联的微博的热度也可以是根据预定算法计算得到,则在步骤103中,将该热度记录的值加上根据预定算法计算得到的值,此处不作限定。
104、新增一条以上述话题和单位时间n为主键的热度记录,该热度记录的值为上述微博的热度。
以步骤102中的举例进一步进行说明,当检测不到以话题1和后天为主键的热度记录时,微博话题热度统计装置新增一条热度记录,该热度记录以话题1和后天为主键,并且,使该新增的热度记录的值为上述微博的热度。
需要说明的是,本发明实施例中的话题的热度记录主要用于表征该话题的受关注程度。在上述实施例中,话题的热度记录与关联该话题的微博的发布相关,在其它实施例方式中,话题的热度记录除了与关联该话题的微博的发布相关,还可以与关联该话题的微博评论的发布相关。
需要说明的是,本发明实施例中的时间单位可以有多少设定,如可以设定“天”作为时间单元,或者设定“月”作为时间单位,或者设定“时”作为时间单元,具体地,可以根据实际情况对时间单位进行设定,进一步,上述k的取值可以根据实际情况进行设置,此处不作限定。
需要说明的是,本发明实施例中的微博话题热度统计装置可以是微博服务器,或者,也可以是独立于微博服务器的装置,此处不作限定。
由上可见,本发明实施例中在用户发布关联话题的微博时,通过实时检测当前单位时间及当前单位时间之后共k个单位时间关于该话题的热度记录,在存在相应热度记录时,更新该热度记录,在不存在相应热度记录时,新增热度记录,并使该热度记录的值为该微博的热度,使得用户在查询指定话题在最近k个单位时间的热度或者查询在最近k个单位时间所有话题的热度排行时,只需调用当前单位时间的热度记录,而不需要调用多个单位时间的热度记录进行统计计算,从而避免了用户多次查询时需要对话题热度进行多次重复计算的问题,有效减少了微博话题的热度统计的运算量,缓解了微博服务器的压力,进而提高了系统性能。
在上述实施例中,话题的热度记录与关联该话题的微博的发布相关,在本发明实施例方式中,话题的热度记录还可以与关联该话题的微博评论的发布相关,请参阅图2,本发明实施例中的微博话题的热度统计方法,包括:
201、检测用户发布的微博评论是否与至少一个话题相关联;
在本发明实施例中,“话题”是指微博搜索时的关键字,其书写形式是将关键词放在特定字符之间(如两个“#”号之间),后面再加上想发布的内容上,其中,#号内的关键词即为话题词。
一条微博评论中可以关联一个或者多个话题,即一条微博评论的内容中可以包括一个或者多个话题词。
当用户发布微博评论时,微博话题热度统计装置通过检测该微博评论中是否包含话题词来判定该微博评论是否与话题相关联,当该微博评论包含N个话题词时(N大于或等于1),表明该微博评论与N个话题相关联,当该微博评论包含N个话题词时,表明该微博评论与N个话题词相关联。
202、若检测出上述微博评论与至少一个话题相关联,则对于每一个与上述微博评论相关联的话题:针对每一个单位时间n,检查是否存在以上述话题和单位时间n为主键的热度记录;
其中,上述n∈[1,2,...,k],单位时间1至单位时间k分别表示当前单位时间以及当前单位时间之后的k-1个单位时间。
若存在以上述话题和单位时间n为主键的热度记录,则执行步骤203;
若不存在以上述话题和单位时间n为主键的热度记录,则执行步骤204。
可选地,上述热度记录以话题热度表的形式存储在微博话题热度统计装置本地,则微博话题热度统计装置可以通过检查本地存储的话题热度表来判断是否存在以上述话题和单位时间n为主键的热度记录。或者,上述热度记录也可以存储在其它设备(如云端服务器),则微博话题热度装置需要与其它设置进行通讯来检测是否存在以上述话题和单位时间n为主键的热度记录。
203、将该热度记录的值加上上述微博评论的热度,以更新该热度记录;
本发明实施例中,与话题关联的微博评论的热度可以根据实际情况进行设定,例如,可以设定一条与话题关联的微博评论的热度为S(其中,S为大于1的自然数),则在步骤203中,将该热度记录的值加上S。
当然,与话题关联的微博评论的热度也可以是根据预定算法计算得到,则在步骤203中,将该热度记录的值加上根据预定算法计算得到的值,此处不作限定。
204、新增一条以上述话题和单位时间n为主键的热度记录,该热度记录的值为上述微博的热度。
以步骤202中的举例进一步进行说明,当检测不到以话题1和后天为主键的热度记录时,微博话题热度统计装置新增一条热度记录,该热度记录以话题1和后天为主键,并且,使该新增的热度记录的值为上述微博评论的热度。
需要说明的是,本发明实施例中的微博话题热度统计装置可以是微博服务器,或者,也可以是独立于微博服务器的装置,此处不作限定。
需要说明的是,本发明实施例中的时间单位可以有多少设定,如可以设定“天”作为时间单元,或者设定“月”作为时间单位,或者设定“时”作为时间单元,具体地,可以根据实际情况对时间单位进行设定,进一步,上述k的取值可以根据实际情况进行设置,此处不作限定。
由上可见,本发明实施例中在用户发布关联话题的微博评论时,也通过实时检测当前单位时间及当前单位时间之后共k个单位时间关于该话题的热度记录,在存在相应热度记录时,更新该热度记录,在不存在相应热度记录时,新增热度记录,并使该热度记录的值为该微博评论的热度,从而进一步使得话题的热度记录更真实,即更能表现话题的受关注程度。
在图1或图2所示实施例的基础上,本发明实施例还提供用户查询指定话题的热度的方案,请参阅图3,包括:
301、接收用户查询指定话题在最近k个单位时间内的热度的请求;
本发明实施例中,用户可以通过用户设备(UE,User Equipment)随时向微博话题热度统计装置发送查询指定话题在最近k个单位时间内的热度的请求,当微博话题热度统计装置接收用户查询指定话题在最近k个单位时间内的热度的请求时,执行步骤302。
302、向上述用户反馈上述指定话题在当前单位时间的热度记录;
微博话题热度统计装置调取上述指定话题在当前单位时间的热度记录,并向用户反馈上述指定话题在当前单位时间的热度记录。
在图1或图2或图3所示实施例的基础上,本发明实施例还提供用户查询最近k个单位时间内所有话题的热度排行的请求,请参阅图4,包括:
401、接收用户查询最近k个单位时间内所有话题的热度排行的请求;
本发明实施例中,用户可以通过UE随时向微博话题热度统计装置发送查询最近k个单位时间内所有话题的热度排行的请求,当微博话题热度统计装置接收用户查询最近k个单位时间内所有话题的热度排行的请求时,执行步骤402。
402、按照热度由大到小的顺序,根据上述所有话题在当前单位时间的热度记录,对上述所有话题进行排序。
403、向上述用户反馈排序后的结果;
微博话题热度统计装置向用户反馈步骤402排序后的结果,进一步,微博话题热度统计装置反馈的结果中还可以包括各个话题的热度记录。
下面以一具体应用场景对本发明实施例中的微博话题的热度统计方法进行描述。假设以“天”为时间单位,与话题X相关联的微博的发布日期和发布数量如表1所示:
表1
话题 发布日期 相关联的微博发布数量
话题X 2013.08.14 14
话题X 2013.08.15 15
话题X 2013.08.16 16
话题X 2013.08.17 17
设定每条与话题X关联的微博的热度为1,k为7,假设2013.08.14之前以及2013.08.17以后都没有与话题X关联的微博的发布,则2013.08.14~2013.08.23话题X的热度记录如表2所示:
表2
假设当前时间(精确到当前单位时间)是2013.08.20,则话题X的最近7天热度为62。
本发明实施例还提供一种微博话题热度统计装置,请参阅图5,本发明实施例中的微博话题热度统计装置500,包括:
第一检测单元501,用于检测用户发布的微博是否与至少一个话题相关联。
第二检测单元502,用于当第一检测单元501检测出上述微博与至少一个话题相关联时,对于每一个与上述微博相关联的话题,针对每一个单位时间n检查是否存在以上述话题和单位时间n为主键的热度记录,其中,上述n∈[1,2,...,k],单位时间1至单位时间k分别表示当前单位时间以及当前单位时间之后的k-1个单位时间。
更新单元503,用于当第二检测单元502检测出存在以上述话题和单位时间n为主键的热度记录时,将该热度记录的值加上上述微博的热度,以更新该热度记录。
热度记录创建单元504,用于当第二检测单元502检测出不存在以上述话题和单位时间n为主键的热度记录时,新增一条以上述话题和单位时间n为主键的热度记录,该热度记录的值为上述微博的热度。
可选地,第二检测单元502具体用于:检查本地存储的话题热度表中是否存在以上述话题和单位时间n为主键的热度记录。
可选地,第一检测单元501还用于:检测用户发布的微博评论是否与至少一个话题相关联;第二检测单元502还用于:当第一检测单元501检测到用户发布的微博评论与至少一个话题相关联时,对于每一个与上述微博评论相关联的话题,针对每一个单位时间n检查是否存在以上述话题和单位时间n为主键的热度记录;更新单元503,还用于当第二检测单元502检测出存在以上述话题和单位时间n为主键的热度记录时,将该热度记录的值加上上述微博评论的热度,以更新该热度记录;热度记录创建单元504,还用于当第二检测单元502检测出不存在以上述话题和单位时间n为主键的热度记录时,新增一条以上述话题和单位时间n为主键的热度记录,该热度记录的值为上述微博评论的热度。
可选地,在图5所示实施例的基础上,如图6所示,微博话题热度统计装置600还包括:第一接收单元505,用于接收用户查询指定话题在最近k个单位时间内的热度的请求;第一发送单元506,用于当接收单元505接收到用户查询指定话题在最近k个单位时间内的热度的请求时,向上述用户反馈上述指定话题在当前单位时间的热度记录。
可选地,在图5或图6所示实施例的基础上,微博话题热度统计装置还可以包括:第二接收单元,排序单元和第二发送单元,如图7所示(图7以图5为基础)的微博话题热度统计装置700,其中,第二接收单元507,用于接收用户查询最近k个单位时间内所有话题的热度排行的请求;排序单元508,用于当第二接收单元507接收到用户查询最近k个单位时间内所有话题的热度排行的请求时,按照热度由大到小的顺序,根据上述所有话题在当前单位时间的热度记录,对上述所有话题进行排序;第二发送单元509,用于向上述用户反馈上述排序单元排序后的结果。
需要说明的是,本发明实施例中的话题的热度记录主要用于表征该话题的受关注程度。在上述实施例中,话题的热度记录与关联该话题的微博的发布相关,在其它实施例方式中,话题的热度记录除了与关联该话题的微博的发布相关,还可以与关联该话题的微博评论的发布相关。
需要说明的是,本发明实施例中的时间单位可以有多少设定,如可以设定“天”作为时间单元,或者设定“月”作为时间单位,或者设定“时”作为时间单元,具体地,可以根据实际情况对时间单位进行设定,进一步,上述k的取值可以根据实际情况进行设置,此处不作限定。
需要说明的是,本发明实施例中的微博话题热度统计装置可以是微博服务器,或者,也可以是独立于微博服务器的装置,此处不作限定。
需要说明的是,本实施例的微博话题热度统计装置可以如上述方法实施例中的微博话题热度统计装置,可以用于实现上述方法实施例中的全部技术方案,其各个功能模块的功能可以根据上述方法实施例中的方法具体实现,其具体实现过程可参照上述实施例中的相关描述,此处不再赘述。
由上可见,本发明实施例中在用户发布关联话题的微博时,通过实时检测当前单位时间及当前单位时间之后共k个单位时间关于该话题的热度记录,在存在相应热度记录时,更新该热度记录,在不存在相应热度记录时,新增热度记录,并使该热度记录的值为该微博的热度,使得用户在查询指定话题在最近k个单位时间的热度或者查询在最近k个单位时间所有话题的热度排行时,只需调用当前单位时间的热度记录,而不需要调用多个单位时间的热度记录进行统计计算,从而避免了用户多次查询时需要对话题热度进行多次重复计算的问题,有效减少了微博话题的热度统计的运算量,缓解了微博服务器的压力,进而提高了系统性能。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明所提供的一种微博话题的热度统计方法及相关装置进行了详细介绍,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种微博话题的热度统计方法,其特征在于,包括:
检测用户发布的微博是否与至少一个话题相关联;
若检测出所述微博与至少一个话题相关联,则对于每一个与所述微博相关联的话题:
针对每一个单位时间n,检查是否存在以所述话题和单位时间n为主键的热度记录,其中,所述n∈[1,2,...,k],单位时间1至单位时间k分别表示当前单位时间以及当前单位时间之后的k-1个单位时间;
若存在以所述话题和单位时间n为主键的热度记录,则将该热度记录的值加上所述微博的热度,以更新该热度记录;
若不存在以所述话题和单位时间n为主键的热度记录,则新增一条以所述话题和单位时间n为主键的热度记录,该热度记录的值为所述微博的热度。
2.根据权利要求1所述的方法,其特征在于,
若检测到用户发布的微博评论与至少一个话题相关联,则所述方法还包括:
对于每一个与所述微博评论相关联的话题:
针对每一个单位时间n,检查是否存在以所述话题和单位时间n为主键的热度记录;
若存在以所述话题和单位时间n为主键的热度记录,则将该热度记录的值加上所述微博评论的热度,以更新该热度记录;
若不存在以所述话题和单位时间n为主键的热度记录,则新增一条以所述话题和单位时间n为主键的热度记录,该热度记录的值为所述微博评论的热度。
3.根据权利要求1或2所述的方法,其特征在于,
若接收到用户查询指定话题在最近k个单位时间内的热度的请求,则所述方法还包括:
向所述用户反馈所述指定话题在当前单位时间的热度记录。
4.根据权利要求1或2所述的方法,其特征在于,
若接收到用户查询最近k个单位时间内所有话题的热度排行的请求,则所述方法还包括:
按照热度由大到小的顺序,根据所述所有话题在当前单位时间的热度记录,对所述所有话题进行排序;
向所述用户反馈排序后的结果。
5.根据权利要求1或2所述的方法,其特征在于,
所述检查是否存在以所述话题和单位时间n为主键的热度记录,具体为:
检查本地存储的话题热度表中是否存在以所述话题和单位时间n为主键的热度记录。
6.一种微博话题热度统计装置,其特征在,包括:
第一检测单元,用于检测用户发布的微博是否与至少一个话题相关联;
第二检测单元,用于当所述第一检测单元检测出所述微博与至少一个话题相关联时,对于每一个与所述微博相关联的话题,针对每一个单位时间n检查是否存在以所述话题和单位时间n为主键的热度记录,其中,所述n∈[1,2,...,k],单位时间1至单位时间k分别表示当前单位时间以及当前单位时间之后的k-1个单位时间;
更新单元,用于当所述第二检测单元检测出存在以所述话题和单位时间n为主键的热度记录时,将该热度记录的值加上所述微博的热度,以更新该热度记录;
热度记录创建单元,用于当所述第二检测单元检测出不存在以所述话题和单位时间n为主键的热度记录时,新增一条以所述话题和单位时间n为主键的热度记录,该热度记录的值为所述微博的热度。
7.根据权利要求6所述的热度统计装置,其特征在于,
所述第一检测单元还用于:检测用户发布的微博评论是否与至少一个话题相关联;
所述第二检测单元还用于:当所述第一检测单元检测到用户发布的微博评论与至少一个话题相关联时,对于每一个与所述微博评论相关联的话题,针对每一个单位时间n检查是否存在以所述话题和单位时间n为主键的热度记录;
所述更新单元还用于:当所述第二检测单元检测出存在以所述话题和单位时间n为主键的热度记录时,将该热度记录的值加上所述微博评论的热度,以更新该热度记录;
所述热度记录创建单元还用于:当所述第二检测单元检测出不存在以所述话题和单位时间n为主键的热度记录时,新增一条以所述话题和单位时间n为主键的热度记录,该热度记录的值为所述微博评论的热度。
8.根据权利要求6或7所述的热度统计装置,其特征在于,
所述热度统计装置还包括:
第一接收单元,用于接收用户查询指定话题在最近k个单位时间内的热度的请求;
第一发送单元,用于当所述接收单元接收到用户查询指定话题在最近k个单位时间内的热度的请求时,向所述用户反馈所述指定话题在当前单位时间的热度记录。
9.根据权利要求6或7所述的热度统计装置,其特征在于,
所述热度统计装置还包括:
第二接收单元,用于接收用户查询最近k个单位时间内所有话题的热度排行的请求;
排序单元,用于当所述第二接收单元接收到用户查询最近k个单位时间内所有话题的热度排行的请求时,按照热度由大到小的顺序,根据所述所有话题在当前单位时间的热度记录,对所述所有话题进行排序;
第二发送单元,用于向所述用户反馈所述排序单元排序后的结果。
10.根据权利要求6或7所述的热度统计装置,其特征在于,
所述第二检测单元具体用于:检查本地存储的话题热度表中是否存在以所述话题和单位时间n为主键的热度记录。
CN201310568033.1A 2013-11-14 2013-11-14 一种微博话题的热度统计方法及相关装置 Pending CN103544327A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310568033.1A CN103544327A (zh) 2013-11-14 2013-11-14 一种微博话题的热度统计方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310568033.1A CN103544327A (zh) 2013-11-14 2013-11-14 一种微博话题的热度统计方法及相关装置

Publications (1)

Publication Number Publication Date
CN103544327A true CN103544327A (zh) 2014-01-29

Family

ID=49967779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310568033.1A Pending CN103544327A (zh) 2013-11-14 2013-11-14 一种微博话题的热度统计方法及相关装置

Country Status (1)

Country Link
CN (1) CN103544327A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292167A (zh) * 2020-02-03 2020-06-16 山东爱城市网信息技术有限公司 基于大数据的竞品分析方法、系统、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070136287A1 (en) * 2005-11-08 2007-06-14 Lycos Europe Gmbh Method for sorting data files
CN102982157A (zh) * 2012-12-03 2013-03-20 北京奇虎科技有限公司 用于挖掘微博热点话题的装置及方法
CN103324718A (zh) * 2013-06-25 2013-09-25 百度在线网络技术(北京)有限公司 基于海量搜索日志挖掘话题脉络的方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070136287A1 (en) * 2005-11-08 2007-06-14 Lycos Europe Gmbh Method for sorting data files
CN102982157A (zh) * 2012-12-03 2013-03-20 北京奇虎科技有限公司 用于挖掘微博热点话题的装置及方法
CN103324718A (zh) * 2013-06-25 2013-09-25 百度在线网络技术(北京)有限公司 基于海量搜索日志挖掘话题脉络的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢安: ""中国人口老龄化的现状、变化趋势及特点"", 《统计研究》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292167A (zh) * 2020-02-03 2020-06-16 山东爱城市网信息技术有限公司 基于大数据的竞品分析方法、系统、存储介质及电子设备

Similar Documents

Publication Publication Date Title
US12001439B2 (en) Information service for facts extracted from differing sources on a wide area network
CN102402605B (zh) 用于搜索引擎索引的混合分布模型
CN109254966B (zh) 数据表查询方法、装置、计算机设备及存储介质
CN102782681B (zh) 用于支持用户内容馈送的机制
US9405746B2 (en) User behavior models based on source domain
WO2019024496A1 (zh) 企业推荐方法及应用服务器
US8583685B2 (en) Determination of category information using multiple stages
US20120233209A1 (en) Enterprise search over private and public data
CN102567408A (zh) 推荐搜索关键词的方法和装置
CN103748579A (zh) 在映射化简框架中处理数据
CN105630847A (zh) 数据存储方法、数据查询方法、装置及系统
WO2014143018A1 (en) Efficient and fault-tolerant distributed algorithm for learning latent factor models through matrix factorization
US11107093B2 (en) Distributed node cluster for establishing a digital touchpoint across multiple devices on a digital communications network
US10664481B2 (en) Computer system programmed to identify common subsequences in logs
Tuncel et al. System reliability under δ-shock model
CN109710611B (zh) 存储表数据的方法、查询表数据的方法、装置及存储介质
CN102646108A (zh) 使用主题意识文件评级器的信息检索
US20170357987A1 (en) Online platform for predicting consumer interest level
CN104092567A (zh) 确定用户的影响力排序的方法与装置
JP5373818B2 (ja) 集中型ソーシャル・ネットワーク応答追跡
CN103838798A (zh) 页面分类系统及页面分类方法
US10248696B2 (en) Methods and systems for searching enterprise data
CN104750760A (zh) 一种推荐应用软件的实现方法及装置
CN110222074A (zh) 索引查找方法、查找装置、电子设备及存储介质
WO2014161426A1 (en) Knowledge graph mining method and system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: SHENZHEN YUNZHIJIA NETWORK CO., LTD.

Free format text: FORMER OWNER: KINGDEE SOFTWARE (CHINA) COMPANY LTD.

Effective date: 20150629

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150629

Address after: 518052 Guangdong city of Shenzhen province Nanshan District Qianhai Shenzhen Hong Kong cooperation zone before the Bay Road No. 1 building 201 room A (located in Shenzhen Qianhai business secretary Co. Ltd.)

Applicant after: SHENZHEN YUNZHIJIA NETWORK CO., LTD.

Address before: 518057 Guangdong city of Shenzhen province science and technology science and Technology Park of Nanshan District twelve South Road No. 2, Kingdee Software Park A block 1-8

Applicant before: Kingdee Software (China) Co., Ltd.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140129

RJ01 Rejection of invention patent application after publication