CN111104586A - 信息增长度的确定方法、装置、存储介质及处理器 - Google Patents

信息增长度的确定方法、装置、存储介质及处理器 Download PDF

Info

Publication number
CN111104586A
CN111104586A CN201811253410.1A CN201811253410A CN111104586A CN 111104586 A CN111104586 A CN 111104586A CN 201811253410 A CN201811253410 A CN 201811253410A CN 111104586 A CN111104586 A CN 111104586A
Authority
CN
China
Prior art keywords
information
detected
amount
piece
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811253410.1A
Other languages
English (en)
Other versions
CN111104586B (zh
Inventor
焦张波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201811253410.1A priority Critical patent/CN111104586B/zh
Publication of CN111104586A publication Critical patent/CN111104586A/zh
Application granted granted Critical
Publication of CN111104586B publication Critical patent/CN111104586B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息增长度的确定方法、装置、存储介质及处理器。其中,该方法包括:获取每个待检测信息在第一周期内的第一增长量;获取每个信息标识所包含的每个待检测信息在第二周期内的第二增长量,其中,第二周期大于第一周期;根据第一增长量和第二增长量确定每个待检测信息的周期增长率;根据每个待检测信息的周期增长率确定每个待检测信息的信息增长度。本发明解决了现有技术无法准确确定信息走势的技术问题。

Description

信息增长度的确定方法、装置、存储介质及处理器
技术领域
本发明涉及信息处理领域,具体而言,涉及一种信息增长度的确定方法、装置、存储介质及处理器。
背景技术
随着互联网技术的快速发展,人们获取信息的途径越来越多,由此,人们得到的信息也越来越多。在媒体行业中,工作人员(例如,新闻记者)为了得到最新、最快、最有价值的资料,需要对各个新闻热点的走势进行预测。虽然,工作人员可以采用各种分析算法对得到资料进行分析,但根据这些算法易收到干扰因素的影响,工作人员无法准确的把握各个新闻热点的走势,进而快速准确得到价值度较高的信息。
针对上述现有技术无法准确确定信息走势的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种信息增长度的确定方法、装置、存储介质及处理器,以至少解决现有技术无法准确确定信息走势的技术问题。
根据本发明实施例的一个方面,提供了一种信息增长度的确定方法,包括:获取每个待检测信息在第一周期内的第一增长量;获取每个信息标识所包含的每个待检测信息在第二周期内的第二增长量,其中,第二周期大于第一周期;根据第一增长量和第二增长量确定每个待检测信息的周期增长率;根据每个待检测信息的周期增长率确定每个待检测信息的信息增长度。
进一步地,信息增长度的确定方法还包括:确定每个待检测信息对应的样本类型;基于样本类型确定样本数据;存储样本数据至信息表中。
进一步地,信息增长度的确定方法还包括:获取信息表中当前第一周期内的每个待检测信息的第一指标信息以及上一个第一周期内的每个待检测信息的第二指标信息,其中,第一指标信息和/或第二指标信息包括如下至少之一:每个待检测信息的转发量、每个待检测信息的评论量、每个待检测信息的支持量以及每个待检测信息的总热度;比对第一指标信息与第二指标信息,得到比对结果;根据比对结果确定每个待检测信息的第一增长量,其中,第一增长量包括如下至少之一:每个待检测信息的转发增长量、每个待检测信息的评论增长量、每个待检测信息的支持增长量以及每个待检测信息的总热度增长量。
进一步地,信息增长度的确定方法还包括:获取信息表中第二周期内每个信息标识所对应的第三指标信息,其中,第三指标信息包括如下至少之一:每个信息标识所对应的待检测信息的总量、每个信息标识所对应的待检测信息的总转发量、每个信息标识所对应的待检测信息的总评论量、每个信息标识所对应的待检测信息的总支持量;根据第三指标信息确定第二增长量,其中,第二增长量包括如下至少之一:平均转发量、平均评论量、平均支持量。
进一步地,信息增长度的确定方法还包括:根据总转发量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均转发量;根据总评论量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均评论量;根据总支持量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均支持量。
进一步地,信息增长度的确定方法还包括:根据转发增长量以及平均转发量得到每个待检测信息的转发增长率;根据评论增长量以及平均评论量得到每个待检测信息的评论增长率;根据支持增长量以及平均支持量得到每个待检测信息的支持增长率。
进一步地,信息增长度的确定方法还包括:确定每个待检测信息的信息增长度所对应的标识信息;确定标识信息所对应的关注量;在关注量处于修正表中的预设关注范围内的情况下,获取修正表中的最小关注量;基于关注量与最小关注量对信息增长度进行修正。
根据本发明实施例的另一方面,还提供了一种信息增长度的确定装置,包括:第一获取模块,用于获取每个待检测信息在第一周期内的第一增长量;第二获取模块,用于获取每个信息标识所包含的每个待检测信息在第二周期内的第二增长量,其中,第二周期大于第一周期;第一确定模块,用于根据第一增长量和第二增长量确定每个待检测信息的周期增长率;第二确定模块,用于根据每个待检测信息的周期增长率确定每个待检测信息的信息增长度。
根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,程序执行信息增长度的确定方法。
根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行信息增长度的确定方法。
在本发明实施例中,采用预设周期对信息进行定时分析的方式,在获取每个待检测信息在第一周期内的第一增长量以及每个信息标识所包含的每个待检测信息在第二周期内的第二增长量之后,根据第一增长量和第二增长量确定每个待检测信息的周期增长率,最后,根据每个待检测信息的周期增长率确定每个待检测信息的信息增长度。在上述过程中,从多个周期对待检测信息进行分析,确定每个待检测信息的信息增长度,从而可以得到较为准确的信息增长度。另外,在计算信息增长度的过程中,从每个待检测信息以及每个信息标识所包含的待检测信息两个方面进行分析,可以提高信息增长度的准确度。进一步地,在得到待检测信息的增长度之后,工作人员可对增长度进行分析得到该待检测信息的信息走势,从而得到更有价值的信息。由此可见,本申请所提供的方案可以解决现有技术无法准确确定信息走势的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种信息增长度的确定方法流程图;以及
图2是根据本发明实施例的一种信息增长度的确定装置结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种信息增长度的确定方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的信息增长度的确定方法流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取每个待检测信息在第一周期内的第一增长量。
需要说明的是,信息表中存储有每个待检测信息的相关信息,不同的媒介可以具有不同的信息表,其中,存储服务器可存储有每个媒介的信息表,例如,服务器中存储有微博对应的微博信息表,每个信息表中可存储有每个待检测信息的相关信息,可以包括但不限于每个待检测信息的转发时间、转发数量、评论数量、点赞数量等。
另外,步骤S102中的每个待检测信息为单独的一条信息,例如,“成都110家美食攻略”为一条待检测信息。上述第一周期为对每个待检测信息进行分析的周期,其中,第一周期越短,得到的每个待检测信息在第一周期内的第一增长量的实时性也就越高,可选的,上述第一周期可以选择为30分钟。
可选的,信息分析平台可基于互联网对待检测信息的增长度进行计算,其中,待检测信息的互联网来源不限于单一来源(例如,仅从微博上统计信息),还可以为多个互联网来源(例如,微博、微信)。
步骤S104,获取每个信息标识所包含的每个待检测信息在第二周期内的第二增长量。
需要说明的是,每个信息标识可以对应多个待检测信息,其中,信息标识可以为对待检测信息进行操作的对象标识,例如,对于微博媒介,上述信息标识可以为微博账号。另外,信息表中还可存储有多个信息标识、每个信息标识对待检测信息的操作信息,例如,微博信息表中存储有多个微博账号,以及每个微博账号对待检测信息的转发信息(例如,转发时间、转发次数)、点赞信息(例如,点赞时间)、评论信息(例如,评论时间、评论次数、评论内容)等。
此外,还需要说明的是,上述第二周期为以每个标识信息为单位对待检测信息进行分析的周期,其中,第二周期大于第一周期,可选的,第二周期可以以月为单元。
步骤S106,根据第一增长量和第二增长量确定每个待检测信息的周期增长率。
需要说明的是,每个待检测信息的周期增长率包括如下至少之一:每个待检测信息的转发增长率、每个待检测信息的评论增长率、每个待检测信息的支持增长率。其中,待检测信息的支持增长率可以为待检测信息的点赞率。
步骤S108,根据每个待检测信息的周期增长率确定每个待检测信息的信息增长度。
需要说明的是,待检测信息的信息增长度的大小表征了该信息的走势,其中,待检测信息的信息增长度越大表明该信息的热门程度较高。
可选的,在得到每个待检测信息的周期增长率之后,可根据下式计算得到每个待检测信息的周期增长度:
T=a*Rate(R)+b*Rate(C)+c*Rate(A)
在上式中,T为当前的待检测信息的周期增长度,Rate(R)、Rate(C)以及Rate(A)分别表示当前的待检测信息的转发增长率、评论增长率以及支持增长率,a、b、c分别表示Rate(R)、Rate(C)以及Rate(A)的权重值。可选的,a、b、c可以分别取0.4、0.4和0.2。
基于上述步骤S102至步骤S108所限定的方案,可以获知,采用预设周期对信息进行定时分析的方式,在获取每个待检测信息在第一周期内的第一增长量以及每个信息标识所包含的每个待检测信息在第二周期内的第二增长量之后,根据第一增长量和第二增长量确定每个待检测信息的周期增长率,最后,根据每个待检测信息的周期增长率确定每个待检测信息的信息增长度。
容易注意到的是,从多个周期对待检测信息进行分析,确定每个待检测信息的信息增长度,从而可以得到较为准确的信息增长度。另外,在计算信息增长度的过程中,从每个待检测信息以及每个信息标识所包含的待检测信息两个方面进行分析,可以提高信息增长度的准确度。进一步地,在得到待检测信息的增长度之后,工作人员可对增长度进行分析得到该待检测信息的信息走势,从而得到更有价值的信息。由此可见,本申请所提供的方案可以解决现有技术无法准确确定信息走势的技术问题。
需要说明的是,为了确定用户的关注点,节约分析成本,在获取信息表中每个待检测信息在第一周期内的第一增长量之前,信息分析平台将样本数据存储至信息表中,具体步骤如下:
步骤S10,确定每个待检测信息对应的样本类型;
步骤S12,基于样本类型确定样本数据;
步骤S14,存储样本数据至信息表中。
可选的,用户可通过信息分析平台输入所要检测信息的样本类型,例如,用户在信息分析平台中输入“新闻媒体”,则信息分析平台确定用户所要筛选的信息的样本类型为新闻媒体。在确定了样本类型之后,信息分析平台从互联网中获取样本数据,例如,信息分析平台可从微博中获取“新闻媒体”的相关数据,并对样本数据进行统计,例如,统计待检测信息“成都110家美食攻略”的转发量、点赞量以及评论量等,然后再将统计后的样本数据存储至信息表中。
需要说明的是,为了保证待检测信息的时效性,在基于样本类型确定样本数据之后,信息分析平台还可对样本数据进行更新。具体的,信息分析平台在检测到样本类型对应的数据发生更新的情况下,获取更新后的数据,并基于更新后的数据更新样本数据。例如,信息分析平台获取微博上最新的一条有关农民工的信息,并将该信息添加至样本数据中,最后将更新后的样本数据更新在信息表中。
在一种可选的方案中,在计算每个待检测信息的周期增长率之前,信息分析平台需要获取第一增长量和第二增长量。可选的,信息分析平台首先获取信息表中每个待检测信息在第一周期内的第一增长量,并获取当前第一周期内的每个待检测信息的第一指标信息以及上一个第一周期内的每个待检测信息的第二指标信息,然后再比对第一指标信息与第二指标信息,得到比对结果,最后根据比对结果确定每个待检测信息的第一增长量。其中,第一指标信息和/或第二指标信息包括如下至少之一:每个待检测信息的转发量、每个待检测信息的评论量、每个待检测信息的支持量以及每个待检测信息的总热度,第一增长量包括如下至少之一:每个待检测信息的转发增长量、每个待检测信息的评论增长量、每个待检测信息的支持增长量以及每个待检测信息的总热度增长量。
可选的,当前第一周期为P1,当前第一周期内每个待检测信息的转发量、每个待检测信息的评论量、每个待检测信息的支持量以及每个待检测信息的总热度分别为R1、C1、A1和T1;上一个第一周期为P2,上一个第一周期内每个待检测信息的转发量、每个待检测信息的评论量、每个待检测信息的支持量以及每个待检测信息的总热度分别为R2、C2、A2和T2,则每个待检测信息的转发增长量、每个待检测信息的评论增长量、每个待检测信息的支持增长量以及每个待检测信息的总热度增长量分别为:
Add(R)=|R1-R2|
Add(C)=|C1-C2|
Add(A)=|A1-A2|
Add(T)=|T1-T2|
在上式中,Add(R)表示每个待检测信息的转发增长量,Add(C)表示每个待检测信息的评论增长量,Add(A)表示每个待检测信息的支持增长量,Add(T)表示每个待检测信息的总热度增长量。
需要说明的是,为了保证信息的准确性,在获取信息表中每个待检测信息在第一周期内的第一增长量之前,信息分析平台还对信息表中的样本数据进行筛选。可选的,信息分析平台根据样本类型对样本数据进行筛选,其中,不同的样本类型对应不同的筛选规则。例如,微博文章A为新闻类的样本类型,其在13:10分布,信息分析平台在13:30第一次抓取微博文章A,在14:00第二次抓取微博文章A,在14:30第三次抓取微博文章A。由于活动类的信息的增长度一般出现在信息发布的前期,而新闻类的信息的增长度一般出现在信息发布的中期,因此,信息分析平台在确定微博文章A为新闻类的样本类型之后,剔除第一次抓取到的数据,从而避免了活动类信息的干扰。
在一种可选的方案中,信息分析平台还可获取待检测信息的第二增长量。具体的,信息分析平台首先获取信息表中第二周期内每个信息标识所对应的第三指标信息,然后再根据第三指标信息确定第二增长量,其中,第三指标信息包括如下至少之一:每个信息标识所对应的待检测信息的总量、每个信息标识所对应的待检测信息的总转发量、每个信息标识所对应的待检测信息的总评论量、每个信息标识所对应的待检测信息的总支持量,第二增长量包括如下至少之一:平均转发量、平均评论量、平均支持量。
可选的,信息分析平台可根据总转发量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均转发量;根据总评论量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均评论量;根据总支持量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均支持量。
其中,平均转发量满足下式:
Figure BDA0001842217330000071
其中,Avg(R)表示平均转发量,RM表示总转发量,M表示每个信息标识所对应的待检测信息的总量,S表示第二周期内信息表所包含待检测信息的总量。
平均评论量满足下式:
Figure BDA0001842217330000072
其中,Avg(C)表示平均评论量,CM表示总评论量,M表示每个信息标识所对应的待检测信息的总量,S表示第二周期内信息表所包含待检测信息的总量。
平均支持量满足下式:
Figure BDA0001842217330000081
其中,Avg(A)表示平均支持量,AM表示总支持量,M表示每个信息标识所对应的待检测信息的总量,S表示第二周期内信息表所包含待检测信息的总量。
需要说明的是,根据上述内容得到第一增长量和第二增长量之后,信息分析平台可进一步根据第一增长量和第二增长量确定每个待检测信息的周期增长率,其中,每个待检测信息的周期增长率包括:转发增长率、评论增长率以及支持增长率。具体的,信息分析平台根据转发增长量以及平均转发量得到每个待检测信息的转发增长率,其中,转发增长率可满足下式:
Figure BDA0001842217330000082
其中,Rate(R)表示转发增长率。
根据评论增长量以及平均评论量得到每个待检测信息的评论增长率,其中,评论增长率可满足下式:
Figure BDA0001842217330000083
其中,Rate(C)表示评论增长率。
根据支持增长量以及平均支持量得到每个待检测信息的支持增长率,其中,支持增长率可满足下式:
Figure BDA0001842217330000084
其中,Rate(A)表示支持增长率。
进一步地,在得到上述三个增长率之后,信息分析平台根据下式得到每个待检测信息的增长度:
T=a*Rate(R)+b*Rate(C)+c*Rate(A)
需要说明的是,为了使待检测信息的增长度更加准确,在得到每个待检测信息的增长度之后,信息分析平台可对信息增长度进行修正。具体步骤如下:
步骤S20,确定每个待检测信息的信息增长度所对应的标识信息;
步骤S22,确定标识信息所对应的关注量;
步骤S24,在关注量处于修正表中的预设关注范围内的情况下,获取修正表中的最小关注量;
步骤S26,基于关注量与最小关注量对信息增长度进行修正。
需要说明的是,上述修正表可以存储在存储服务器中,其中,修正表中记录有每个标识信息所对应的关注量范围,其可根据预设算法以及历史数据验算得到。
可选的,以标识信息为微博账号进行说明,上述标识信息对应的关注量可以为微博账号的粉丝量。具体的,在得到每个待检测信息的信息增长度之后,信息分析平台确定每个信息增长度对应的微博账号(即上述信息标识),然后根据微博账号从修正表中确定该微博账号所对应的粉丝量范围(即关注量范围)。如果该微博账号的当前粉丝量处于粉丝量范围之内,则比较该微博账号对应的增长度与修正表中该微博账号所对应的增长度的最小值,如果该微博账号对应的增长度大于修正表中增长度的最小值,则将该微博账号对应的增长度作为最终的增长度,否则,将修正表中增长度的最小值作为最终的增长度。
进一步地,在得到每个待检测信息的信息增长度之后,信息分析平台可每个待检测信息的信息增长度保存至信息表中,其中,信息表中每个信息标识均对应有一条记录,每条记录对应有相应字段用来记录增长度列表。
需要说明的是,增长度列表不仅可以记录每个信息标识在第一周期内的增长度,还可记录增长度列表,其中,增长度列表按照预设周期定时更新。
实施例2
根据本发明实施例,还提供了一种信息增长度的确定装置实施例,该装置可执行实施例1中的信息增长度的确定方法。其中,图2是根据本发明实施例的信息增长度的确定装置结构示意图,如图2所示,该装置包括:第一获取模块201、第二获取模块203、第一确定模块205以及第二确定模块207。
其中,第一获取模块201,用于获取每个待检测信息在第一周期内的第一增长量;第二获取模块203,用于获取每个信息标识所包含的每个待检测信息在第二周期内的第二增长量,其中,第二周期大于第一周期;第一确定模块205,用于根据第一增长量和第二增长量确定每个待检测信息的周期增长率;第二确定模块207,用于根据每个待检测信息的周期增长率确定每个待检测信息的信息增长度。
需要说明的是,上述第一获取模块201、第二获取模块203、第一确定模块205以及第二确定模块207对应于实施例1中的步骤S102至步骤S108,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
在一种可选的方案中,信息增长度的确定装置还包括:第三确定模块、第四确定模块以及存储模块。其中,第三确定模块,用于确定每个待检测信息对应的样本类型;第四确定模块,用于基于样本类型确定样本数据;存储模块,用于存储样本数据至信息表中。
需要说明的是,上述第三确定模块、第四确定模块以及存储模块对应于实施例1中的步骤S10至步骤S14,三个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
在一种可选的方案中,第一获取模块包括:第三获取模块、比对模块以及第五确定模块。其中,第三获取模块,用于获取信息表中当前第一周期内的每个待检测信息的第一指标信息以及上一个第一周期内的每个待检测信息的第二指标信息,其中,第一指标信息和/或第二指标信息包括如下至少之一:每个待检测信息的转发量、每个待检测信息的评论量、每个待检测信息的支持量以及每个待检测信息的总热度;比对模块,用于比对第一指标信息与第二指标信息,得到比对结果;第五确定模块,用于根据比对结果确定每个待检测信息的第一增长量,其中,第一增长量包括如下至少之一:每个待检测信息的转发增长量、每个待检测信息的评论增长量、每个待检测信息的支持增长量以及每个待检测信息的总热度增长量。
在一种可选的方案中,第二获取模块包括:第四获取模块以及第六确定模块。其中,第四获取模块,用于获取信息表中第二周期内每个信息标识所对应的第三指标信息,其中,第三指标信息包括如下至少之一:每个信息标识所对应的待检测信息的总量、每个信息标识所对应的待检测信息的总转发量、每个信息标识所对应的待检测信息的总评论量、每个信息标识所对应的待检测信息的总支持量;第六确定模块,用于根据第三指标信息确定第二增长量,其中,第二增长量包括如下至少之一:平均转发量、平均评论量、平均支持量。
在一种可选的方案中,第六确定模块包括:第七确定模块、第八确定模块以及第九确定模块。其中,第七确定模块,用于根据总转发量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均转发量;第八确定模块,用于根据总评论量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均评论量;第九确定模块,用于根据总支持量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均支持量。
在一种可选的方案中,每个待检测信息的周期增长率包括如下至少之一:每个待检测信息的转发增长率、每个待检测信息的评论增长率、每个待检测信息的支持增长率,其中,第一确定模块包括:第一处理模块、第二处理模块以及第三处理模块。其中,第一处理模块,用于根据转发增长量以及平均转发量得到每个待检测信息的转发增长率;第二处理模块,用于根据评论增长量以及平均评论量得到每个待检测信息的评论增长率;第三处理模块,用于根据支持增长量以及平均支持量得到每个待检测信息的支持增长率。
在一种可选的方案中,信息增长度的确定装置还包括:第十确定模块、第十一确定模块、第五获取模块以及修正模块。其中,第十确定模块,用于确定每个待检测信息的信息增长度所对应的标识信息;第十一确定模块,用于确定标识信息所对应的关注量;第五获取模块,用于在关注量处于修正表中的预设关注范围内的情况下,获取修正表中的最小关注量;修正模块,用于基于关注量与最小关注量对信息增长度进行修正。
需要说明的是,上述第十确定模块、第十一确定模块、第五获取模块以及修正模块对应于实施例1中的步骤S20至步骤S26,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
另外,上述信息增长度的确定装置包括处理器和存储器,上述第一获取模块、第二获取模块、第一确定模块和第二确定模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来确定每个待检测信息的信息增长度,从而可以得到较为准确的信息增长度。另外,在计算信息增长度的过程中,从每个待检测信息以及每个信息标识所包含的待检测信息两个方面进行分析,可以提高信息增长度的准确度。进一步地,在得到待检测信息的增长度之后,工作人员可对增长度进行分析得到该待检测信息的信息走势,从而得到更有价值的信息。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现信息增长度的确定方法。
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行信息增长度的确定方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取每个待检测信息在第一周期内的第一增长量;获取每个信息标识所包含的每个待检测信息在第二周期内的第二增长量,其中,第二周期大于第一周期;根据第一增长量和第二增长量确定每个待检测信息的周期增长率;根据每个待检测信息的周期增长率确定每个待检测信息的信息增长度。
可选的,在处理器上运行的程序,处理器执行程序时还实现以下步骤:确定每个待检测信息对应的样本类型;基于样本类型确定样本数据;存储样本数据至信息表中。
可选的,在处理器上运行的程序,处理器执行程序时还实现以下步骤:获取信息表中当前第一周期内的每个待检测信息的第一指标信息以及上一个第一周期内的每个待检测信息的第二指标信息,其中,第一指标信息和/或第二指标信息包括如下至少之一:每个待检测信息的转发量、每个待检测信息的评论量、每个待检测信息的支持量以及每个待检测信息的总热度;比对第一指标信息与第二指标信息,得到比对结果;根据比对结果确定每个待检测信息的第一增长量,其中,第一增长量包括如下至少之一:每个待检测信息的转发增长量、每个待检测信息的评论增长量、每个待检测信息的支持增长量以及每个待检测信息的总热度增长量。
可选的,在处理器上运行的程序,处理器执行程序时还实现以下步骤:获取信息表中第二周期内每个信息标识所对应的第三指标信息,其中,第三指标信息包括如下至少之一:每个信息标识所对应的待检测信息的总量、每个信息标识所对应的待检测信息的总转发量、每个信息标识所对应的待检测信息的总评论量、每个信息标识所对应的待检测信息的总支持量;根据第三指标信息确定第二增长量,其中,第二增长量包括如下至少之一:平均转发量、平均评论量、平均支持量。
可选的,在处理器上运行的程序,处理器执行程序时还实现以下步骤:根据总转发量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均转发量;根据总评论量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均评论量;根据总支持量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均支持量。
可选的,在处理器上运行的程序,处理器执行程序时还实现以下步骤:根据转发增长量以及平均转发量得到每个待检测信息的转发增长率;根据评论增长量以及平均评论量得到每个待检测信息的评论增长率;根据支持增长量以及平均支持量得到每个待检测信息的支持增长率。
可选的,在处理器上运行的程序,处理器执行程序时还实现以下步骤:确定每个待检测信息的信息增长度所对应的标识信息;确定标识信息所对应的关注量;在关注量处于修正表中的预设关注范围内的情况下,获取修正表中的最小关注量;基于关注量与最小关注量对信息增长度进行修正。
需要说明的是,本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取每个待检测信息在第一周期内的第一增长量;获取每个信息标识所包含的每个待检测信息在第二周期内的第二增长量,其中,第二周期大于第一周期;根据第一增长量和第二增长量确定每个待检测信息的周期增长率;根据每个待检测信息的周期增长率确定每个待检测信息的信息增长度。
可选的,在程序运行时控制存储介质所在设备还执行以下功能:确定每个待检测信息对应的样本类型;基于样本类型确定样本数据;存储样本数据至信息表中。
可选的,在程序运行时控制存储介质所在设备还执行以下功能:获取信息表中当前第一周期内的每个待检测信息的第一指标信息以及上一个第一周期内的每个待检测信息的第二指标信息,其中,第一指标信息和/或第二指标信息包括如下至少之一:每个待检测信息的转发量、每个待检测信息的评论量、每个待检测信息的支持量以及每个待检测信息的总热度;比对第一指标信息与第二指标信息,得到比对结果;根据比对结果确定每个待检测信息的第一增长量,其中,第一增长量包括如下至少之一:每个待检测信息的转发增长量、每个待检测信息的评论增长量、每个待检测信息的支持增长量以及每个待检测信息的总热度增长量。
可选的,在程序运行时控制存储介质所在设备还执行以下功能:获取信息表中第二周期内每个信息标识所对应的第三指标信息,其中,第三指标信息包括如下至少之一:每个信息标识所对应的待检测信息的总量、每个信息标识所对应的待检测信息的总转发量、每个信息标识所对应的待检测信息的总评论量、每个信息标识所对应的待检测信息的总支持量;根据第三指标信息确定第二增长量,其中,第二增长量包括如下至少之一:平均转发量、平均评论量、平均支持量。
可选的,在程序运行时控制存储介质所在设备还执行以下功能:根据总转发量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均转发量;根据总评论量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均评论量;根据总支持量、每个信息标识所对应的待检测信息的总量以及第二周期内信息表所包含待检测信息的总量确定平均支持量。
可选的,在程序运行时控制存储介质所在设备还执行以下功能:根据转发增长量以及平均转发量得到每个待检测信息的转发增长率;根据评论增长量以及平均评论量得到每个待检测信息的评论增长率;根据支持增长量以及平均支持量得到每个待检测信息的支持增长率。
可选的,在程序运行时控制存储介质所在设备还执行以下功能:确定每个待检测信息的信息增长度所对应的标识信息;确定标识信息所对应的关注量;在关注量处于修正表中的预设关注范围内的情况下,获取修正表中的最小关注量;基于关注量与最小关注量对信息增长度进行修正。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种信息增长度的确定方法,其特征在于,包括:
获取每个待检测信息在第一周期内的第一增长量;
获取每个信息标识所包含的所述每个待检测信息在第二周期内的第二增长量,其中,所述第二周期大于所述第一周期;
根据所述第一增长量和所述第二增长量确定所述每个待检测信息的周期增长率;
根据所述每个待检测信息的周期增长率确定所述每个待检测信息的信息增长度。
2.根据权利要求1所述的方法,其特征在于,在获取每个待检测信息在第一周期内的第一增长量之前,所述方法还包括:
确定所述每个待检测信息对应的样本类型;
基于所述样本类型确定样本数据;
存储所述样本数据至信息表中。
3.根据权利要求2所述的方法,其特征在于,获取每个待检测信息在第一周期内的第一增长量,包括:
获取所述信息表中当前第一周期内的每个待检测信息的第一指标信息以及上一个第一周期内的每个待检测信息的第二指标信息,其中,所述第一指标信息和/或所述第二指标信息包括如下至少之一:所述每个待检测信息的转发量、所述每个待检测信息的评论量、所述每个待检测信息的支持量以及所述每个待检测信息的总热度;
比对所述第一指标信息与所述第二指标信息,得到比对结果;
根据所述比对结果确定所述每个待检测信息的第一增长量,其中,所述第一增长量包括如下至少之一:所述每个待检测信息的转发增长量、所述每个待检测信息的评论增长量、所述每个待检测信息的支持增长量以及所述每个待检测信息的总热度增长量。
4.根据权利要求3所述的方法,其特征在于,获取每个信息标识所包含的待检测信息在第二周期内的第二增长量,包括:
获取所述信息表中所述第二周期内所述每个信息标识所对应的第三指标信息,其中,所述第三指标信息包括如下至少之一:所述每个信息标识所对应的待检测信息的总量、所述每个信息标识所对应的待检测信息的总转发量、所述每个信息标识所对应的待检测信息的总评论量、所述每个信息标识所对应的待检测信息的总支持量;
根据所述第三指标信息确定所述第二增长量,其中,所述第二增长量包括如下至少之一:平均转发量、平均评论量、平均支持量。
5.根据权利要求4所述的方法,其特征在于,根据所述第三指标信息确定所述第二增长量,包括:
根据所述总转发量、所述每个信息标识所对应的待检测信息的总量以及所述第二周期内所述信息表所包含待检测信息的总量确定所述平均转发量;
根据所述总评论量、所述每个信息标识所对应的待检测信息的总量以及所述第二周期内所述信息表所包含待检测信息的总量确定所述平均评论量;
根据所述总支持量、所述每个信息标识所对应的待检测信息的总量以及所述第二周期内所述信息表所包含待检测信息的总量确定所述平均支持量。
6.根据权利要求5所述的方法,其特征在于,所述每个待检测信息的周期增长率包括如下至少之一:所述每个待检测信息的转发增长率、所述每个待检测信息的评论增长率、所述每个待检测信息的支持增长率,其中,根据所述第一增长量和所述第二增长量确定所述每个待检测信息的周期增长率,包括:
根据所述转发增长量以及所述平均转发量得到所述每个待检测信息的转发增长率;
根据所述评论增长量以及所述平均评论量得到所述每个待检测信息的评论增长率;
根据所述支持增长量以及所述平均支持量得到所述每个待检测信息的支持增长率。
7.根据权利要求1所述的方法,其特征在于,在根据所述每个待检测信息的周期增长率确定所述每个待检测信息的信息增长度之后,所述方法还包括:
确定所述每个待检测信息的信息增长度所对应的标识信息;
确定所述标识信息所对应的关注量;
在所述关注量处于修正表中的预设关注范围内的情况下,获取所述修正表中的最小关注量;
基于所述关注量与所述最小关注量对所述信息增长度进行修正。
8.一种信息增长度的确定装置,其特征在于,包括:
第一获取模块,用于获取每个待检测信息在第一周期内的第一增长量;
第二获取模块,用于获取每个信息标识所包含的所述每个待检测信息在第二周期内的第二增长量,其中,所述第二周期大于所述第一周期;
第一确定模块,用于根据所述第一增长量和所述第二增长量确定所述每个待检测信息的周期增长率;
第二确定模块,用于根据所述每个待检测信息的周期增长率确定所述每个待检测信息的信息增长度。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至7中任意一项所述的信息增长度的确定方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的信息增长度的确定方法。
CN201811253410.1A 2018-10-25 2018-10-25 信息增长度的确定方法、装置、存储介质及处理器 Active CN111104586B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811253410.1A CN111104586B (zh) 2018-10-25 2018-10-25 信息增长度的确定方法、装置、存储介质及处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811253410.1A CN111104586B (zh) 2018-10-25 2018-10-25 信息增长度的确定方法、装置、存储介质及处理器

Publications (2)

Publication Number Publication Date
CN111104586A true CN111104586A (zh) 2020-05-05
CN111104586B CN111104586B (zh) 2023-04-07

Family

ID=70418345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811253410.1A Active CN111104586B (zh) 2018-10-25 2018-10-25 信息增长度的确定方法、装置、存储介质及处理器

Country Status (1)

Country Link
CN (1) CN111104586B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104516962A (zh) * 2014-12-18 2015-04-15 北京牡丹电子集团有限责任公司数字电视技术中心 一种微博舆情监控方法及监控系统
CN105868017A (zh) * 2015-01-21 2016-08-17 方正宽带网络服务有限公司 一种资源缓存方法及装置
US20170286978A1 (en) * 2016-03-30 2017-10-05 Salesforce.Com, Inc. Identifying trending topics
CN107451689A (zh) * 2017-07-25 2017-12-08 中国联合网络通信集团有限公司 基于微博的话题趋势预测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104516962A (zh) * 2014-12-18 2015-04-15 北京牡丹电子集团有限责任公司数字电视技术中心 一种微博舆情监控方法及监控系统
CN105868017A (zh) * 2015-01-21 2016-08-17 方正宽带网络服务有限公司 一种资源缓存方法及装置
US20170286978A1 (en) * 2016-03-30 2017-10-05 Salesforce.Com, Inc. Identifying trending topics
CN107451689A (zh) * 2017-07-25 2017-12-08 中国联合网络通信集团有限公司 基于微博的话题趋势预测方法及装置

Also Published As

Publication number Publication date
CN111104586B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
JP7004661B2 (ja) 機械学習システムのトレーニング方法及びトレーニングシステム
CN110929965A (zh) 一种项目风险评估方法及装置
US20190004790A1 (en) Measuring similarity of software components
CN110019261B (zh) 数据查询方法和装置
CN112583944B (zh) 一种更新域名证书的处理方法和装置
CN106874293B (zh) 一种数据处理方法及装置
CN104067120A (zh) 一种湿度传感器数值补偿方法、装置及空气质量检测仪
CN106937173B (zh) 视频播放方法及装置
CN111104586B (zh) 信息增长度的确定方法、装置、存储介质及处理器
CN107515807A (zh) 一种存储监控数据的方法及装置
CN116680494A (zh) 应用推荐页面的生成方法、装置、存储介质以及电子设备
CN110969379B (zh) 一种替代物料的筛选方法及相关装置
CN108667893B (zh) 数据推荐方法、装置和电子设备
CN105760383B (zh) 一种etl任务中指标变更的检测方法和装置
EP3289446A1 (en) Classification of application events using call stacks
CN113360553B (zh) 一种数据冷热程度评估方法及服务器
CN113919683A (zh) 工艺工时的计算方法、装置、存储介质及处理器
CN110782276B (zh) 一种访问分流策略干扰判断方法、装置及电子设备
CN111104584A (zh) 信息价值度的确定方法、装置、存储介质和处理器
CN110991945B (zh) 设备备件的信息处理方法及装置、存储介质和处理器
CN108270834B (zh) 数据传输方法及装置
CN107544968B (zh) 一种确定网站可用性的方法及装置
CN106557469B (zh) 一种处理数据仓库中数据的方法及装置
CN110968754A (zh) 一种爬虫翻页策略的检测方法及装置
CN108255892B (zh) Cookie生命周期的计算方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant