CN106383867A - 一种公众号的健康度排序方法及其排序系统 - Google Patents
一种公众号的健康度排序方法及其排序系统 Download PDFInfo
- Publication number
- CN106383867A CN106383867A CN201610801566.3A CN201610801566A CN106383867A CN 106383867 A CN106383867 A CN 106383867A CN 201610801566 A CN201610801566 A CN 201610801566A CN 106383867 A CN106383867 A CN 106383867A
- Authority
- CN
- China
- Prior art keywords
- public number
- health degree
- public
- interaction parameters
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种公众号的健康度排序方法及其排序系统,其方法包括:收集多个公众号在第一时间段内各自发布的所有公众号信息的总数量F、每条公众号信息的间隔时间B(N)、间隔时间的平均值A、标准差V、平均影响力S、以及最后一次发布公众号信息与观测日期的间隔天数T;当公众号在第一时间段内发布的公众号信息的总数量F等于1时,健康度参考值E=S/exp(T)*exp(A)*10000;当公众号在第一时间段内发布的公众号信息的总数量F大于1时,健康度参考值E=S/exp(T)*exp(A)*exp(V);以及对健康度参考值E作数据0‑1标准化,并乘以100,映射到[0,100]内的帐号健康度G。
Description
技术领域
本发明涉及网络信息处理,尤其涉及一种公众号的健康度排序方法及其排序系统。
背景技术
随着社交网络及大数据时代的迅速发展,越来越多的社交网络将用户进行区分。以微信为例,除了一般用户可注册的一般账号,其还设置公众号账号供用户进行注册。
注册一般账号的用户通常以该账号作为个人的联络、通讯及分享来使用。一般账号可在一对一、或群组的聊天场景中,发送聊天信息,聊天信息可以是文字、图片、音频或视频。然而,聊天信息由于其实时性、交互频率快等特点,通常不会使用文字、图片、音频或视频的组合信息。同时,一般账号仅能在朋友圈(社交网络交互场景)发布共享信息,共享信息可以同时被该一般账号的所有“好友”,或可选地部分“好友”所看到。一般账号所发布的共享信息可以是文字、图片及小视频,其文字字数、图片数量及小视频的数量都有限制。
而个人、组织或者公司可注册公众号账号,来直接向其他用户发布公众号信息,公众号信息一般可发布在上述一对一聊天场景中,公众号信息也可以发布在朋友圈(社交网络交互场景)中。公众号信息可以是文本、图片、音频、视频或者他们的组合。同时,公众号信息的文本不限字数、图片、音频及视频不限数量。
由此可见,一般账号用于进行社交行动,一般账号的交互对象是注册该一般账号的用户的好友、家人等。而公众号账号则用于推广、传播等,公众号账号的交互对象可以是任何关注该公众号账号的人。本文中所述的公众号账号也可以至其他社交网络中的一些账号类型。例如,公众号账号也可以指微博中的加“V”账号。
然而,用户如何选取公众号账号来关注,内容提供者如何选取公众号账号来发布内容,通常都是根据公众号账号的几个维度的评估值来进行选取。这几个维度可以包括公众号账号发布公众号信息的活跃度、公众号信息的影响力、公众号账号的影响力等。由于显示网络状态中存在灌水、刷票等恶劣行为,现有技术无法综合考虑账号所发文章的平均影响力、发表文章的间隔时间及其稳定性,来考虑账号的健康度。
发明内容
本发明的目的在于提供一种公众号的健康度排序方法及其排序系统,克服了现有技术的困难,能有效准确地通过基于多个数据的排序计算获得总和反应账号所发文章的平均影响力、发表文章的间隔时间及其稳定性的账号健康度。
根据本发明的一个方面,提供一种公众号的健康度排序方法,包括:
收集多个公众号在第一时间段内各自发布的所有公众号信息的总数量F、每条所述公众号信息的间隔时间B(N)、全部所述公众号信息的间隔时间的平均值A、间隔时间的标准差V、平均影响力S、以及最后一次发布所述公众号信息与观测日期的间隔天数T;其中,每条所述公众号信息与在第一时间段内的第一天的间隔天数作为每条所述公众号信息的间隔时间B(N),总数量F、间隔时间B(N)和间隔天数T都属于大于0的整数;
当所述公众号在第一时间段内发布的所述公众号信息的总数量F等于1时,健康度参考值E=S/exp(T)*exp(A)*10000;当所述公众号在第一时间段内发布的所述公众号信息的总数量F大于1时,健康度参考值E=S/exp(T)*exp(A)*exp(V);以及
对所述健康度参考值E作数据0-1标准化,并乘以100,映射到[0,100]内的帐号健康度G,G属于[0,100]内的有理数。
优选地,所述第一时间段是最近一个月的时间跨度。
优选地,所述公众号帐号的健康度G=100*[该帐号健康度值–min(所有帐号健康度值)]/[max(所有帐号健康度值)–min(所有帐号健康度值)]。
优选地,获得所有公众号信息的平均影响力S包括以下步骤:
抓取对应多个公众号信息的第一互动参数Y和第二互动参数D;
基于所述公众号信息的第一互动参数Y和第二互动参数D,按下述步骤计算所述公众号信息的影响力W:
当所述公众号信息的第一互动参数Y大于等于第一阈值时,
计算所述公众号信息的修正第二互动参数:
Dm(DT)=exp[1/(DT+1)]*D(DT),
其中,DT为所述公众号信息的第一互动参数达到所述第一阈值的日期与当前日期之间的间隔天数,Dm(DT)为公众号信息的当前日期的修正第二互动参数,D(DT)为当前日期的公众号信息的第二互动参数;
当DT大于0时,按如下公式计算公众号信息的影响力W:
W=aY(DT)+(1-a)[Dm(DT)+Dm(DT-1)-D(DT-1)],
其中,a为有理数,Y(DT)为公众号信息的当前日期的第一互动参数,Dm(DT-1)为当前日期前一天的公众号信息的修正第二互动参数,D(DT-1)为当前日期前一天的公众号信息的第二互动参数;
最后,按如下公式计算公众号信息的平均响力S:S=W/F。
优选地,当所述公众号信息的第一互动参数Y小于所述第一阈值时,按如下公式计算公众号信息的影响力W:
W=aY+(1-a)D。
优选地,当为DT等于0时,按如下公式计算公众号信息的影响力W:
W=aY(0)+(1-a)[Dm(0)],
其中,Y(0)为所述公众号信息的当前第一互动参数,Dm(0)为所述公众号信息的当前修正第二互动参数,其中,Dm(0)=exp(1)*D(0),D(0)为所述公众号信息的当前第二互动参数。
优选地,所述第一阈值为9000至11000中的整数。
优选地,还包括:
按照所述公众号的健康度G对公众号进行排序;
按照所述公众号的健康度G的排序结果将所述公众号向用户推送。
优选地,按照排序结果向用户推送所述公众号的步骤包括:
将健康度G排在前R%的公众号推送给用户,R为0至30中的整数。
优选地,还包括:
所抓取的多个公众号被划分为多个分类,每一个所述分类包括多个公众号;
在每一个所述分类下,按照所述公众号的健康度G对公众号进行排序;
按照所述公众号的所属分类及所述公众号的健康度G的排序结果向用户推送所述公众号。
优选地,用户具有一个或多个标签,每个所述标签对应一个所述分类,按照所述公众号的所属分类及所述公众号的健康度G的排序结果将向用户推送所述公众号的步骤包括:
在一个所述分类下,将健康度G排在前R%的公众号推送给具有对应于该分类的标签的用户,R为0至30中的整数。
优选地,所述第一互动参数和所述第二互动参数是阅读数、点赞数、转发数、评论数、收藏数及关注数中的任意两个。
优选地,所述第一互动参数为阅读数,所述第二互动参数为点赞数。
优选地,所述第一互动参数为阅读数,所述第二互动参数为转发数。
优选地,所述第一互动参数为阅读数,所述第二互动参数为评论数。
优选地,其特征在于,a的取值范围为0.01至0.1。
优选地,所述公众号信息为社交网络平台的公众号发布的文章、图片、音频和/或视频。
优选地,通过一个或多个所述社交网络平台的API接口收集所述公众号信息的第一互动参数和第二互动参数。
根据本发明的一个方面,还提供一种公众号的健康度排序系统,根据上述的公众号的健康度排序方法,对多个所述公众号进行排序,并根据所述公众号的健康度的排序结果向用户推送所述公众号。
优选地,还包括:将健康度G排在前R%的公众号推送给用户,R为0至30中的整数。
由于采用了以上技术,本发明公众号的健康度排序方法及其排序系统能有效准确地通过基于多个数据的排序计算获得总和反应账号所发文章的平均影响力、发表文章的间隔时间及其稳定性的账号健康度,并且重新利用健康度来推送有价值信息。
附图说明
以下结合附图和具体实施例对本发明的技术方案进行详细的说明,以使本发明的特性和优点更为明显。
图1为本发明第一实施例的公众号的健康度排序方法的流程图;
图2示出了根据本发明的公众号的健康度排序系统推送公众号的一种拓扑图;以及
图3示出了根据本发明的公众号的健康度排序系统推送公众号的另一种拓扑图。
具体实施方式
以下将对本发明的实施例给出详细的说明。尽管本发明将结合一些具体实施方式进行阐述和说明,但需要注意的是本发明并不仅仅只局限于这些实施方式。相反,对本发明进行的修改或者等同替换,均应涵盖在本发明的权利要求范围当中。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员将理解,没有这些具体细节,本发明同样可以实施。在另外一些实例中,对于大家熟知的结构和部件未作详细描述,以便于凸显本发明的主旨。
图1为本发明第一实施例的公众号的健康度排序方法的流程图。如图1所示,根据本发明的一个方面,提供一种公众号的健康度排序方法,包括:步骤S10至步骤S50,以下按照流程顺序逐步介绍相关步骤。本实施例中,将收集多个公众号的第一时间段的长度设定为最近一个月,但不以此为限,在不同的变化例中,可以根据不同的需求改变这个数据。
其中,步骤S10:收集多个公众号最近一个月各自发布的所有公众号信息的总数量F、每条所述公众号信息的间隔时间B(N)、全部所述公众号信息的间隔时间的平均值A、间隔时间的标准差V、平均影响力S、以及最后一次发布所述公众号信息与观测日期的间隔天数T。其中,每条所述公众号信息与月初第一天的间隔天数作为每条所述公众号信息的间隔时间B(N),总数量F、间隔时间B(N)和间隔天数T都属于大于0的整数。
步骤S10中,获得所有公众号信息的平均影响力S包括以下步骤:
抓取对应多个公众号信息的第一互动参数Y和第二互动参数D;
基于所述公众号信息的第一互动参数Y和第二互动参数D,按下述步骤计算所述公众号信息的影响力W:
当所述公众号信息的第一互动参数Y大于等于第一阈值时,
计算所述公众号信息的修正第二互动参数:
Dm(DT)=exp[1/(DT+1)]*D(DT),
其中,DT为所述公众号信息的第一互动参数达到所述第一阈值的日期与当前日期之间的间隔天数,Dm(DT)为公众号信息的当前日期的修正第二互动参数,D(DT)为当前日期的公众号信息的第二互动参数;
当DT大于0时,按如下公式计算公众号信息的影响力W:
W=aY(DT)+(1-a)[Dm(DT)+Dm(DT-1)-D(DT-1)],
其中,a为有理数,Y(DT)为公众号信息的当前日期的第一互动参数,Dm(DT-1)为当前日期前一天的公众号信息的修正第二互动参数,D(DT-1)为当前日期前一天的公众号信息的第二互动参数;
最后,按如下公式计算公众号信息的平均响力S:S=W/F。
第一互动参数Y和第二互动参数D可以是阅读数、点赞数、转发数、评论数、收藏数及关注数中的任意两个。优选地,第二互动参数D相比第一互动参数Y互动性更强。例如,在一些实施例中,第一互动参数Y为阅读数,第二互动参数D为点赞数;在又一些实施例中,第一互动参数Y为阅读数,第二互动参数D为转发数;在另一些实施例中,第一互动参数Y为阅读数,第二互动参数D为评论数。本领域技术人员可以理解,上述点赞数、转发数、评论数相比阅读数互动性更强,更能表现出用户对于该公众号信息的关注。
当所述公众号信息的第一互动参数Y小于所述第一阈值时,按如下公式计算公众号信息的影响力W:W=aY+(1-a)D。所述第一阈值为9000至11000中的整数。
或者,当为DT等于0时,按如下公式计算公众号信息的影响力W:W=aY(0)+(1-a)[Dm(0)],其中,Y(0)为所述公众号信息的当前第一互动参数,Dm(0)为所述公众号信息的当前修正第二互动参数,其中,Dm(0)=exp(1)*D(0),D(0)为所述公众号信息的当前第二互动参数。所述第一阈值为9000至11000中的整数。
由于计算公众号信息的影响力W的过程相对复杂,以下通过进行具体介绍计算过程:包括步骤S110抓取对应多个公众号信息的第一互动参数Y和第二互动参数D。以及步骤S120中,以一互动参数Y为阅读数,第二互动参数D为点赞数为例,说明公众号信息的影响力的计算。
在步骤S110中,公众号信息可以指社交网络平台的公众号账户发布的文章、图片、音频和/或视频。具体而言,在步骤S110中,从多个公众号信息所在的服务器中抓取每个公众号信息的实时第一互动参数Y和第二互动参数D。优选地,通过一个或多个社交网络平台的API接口抓取一个或多个社交网络平台的服务器中,每个公众号信息的第一互动参数和第二互动参数。在一些实施例中,抓取多个公众号信息的第一互动参数Y和第二互动参数D的步骤可以每天定时执行。在又一些实施例中,抓取多个公众号信息的第一互动参数Y和第二互动参数D的步骤可以随用户需求来执行。
具体而言,在步骤S120中,以一互动参数Y为阅读数,第二互动参数D为点赞数为例,说明公众号信息的影响力的计算。首先判断公众号信息的阅读数Y是否大于等于第一阈值。第一阈值可以为9000至11000中的整数。例如,在本实施例中,第一阈值取10000。
当公众号信息的阅读数Y是否大于等于10000时,首先通过如下公式计算公众号信息的修正点赞数(也就是修正第二互动参数):
Dm(DT)=e[1/(DT+1)]*D(DT),
其中,DT为公众号信息的阅读数Y达到10000的日期与当前日期之间的间隔天数。例如,公众号信息的阅读数Y达到10000的日期Data1为2016-4-20,获取公众号信息的阅读数的日期Data2为2016-4-22,则DT=Data2-Data1=2天。Dm(DT)为公众号信息的当前日期的修正点赞数。D(DT)为当前日期的公众号信息的点赞数D,也就是Data2时,公众号信息的点赞数D。
本领域技术人员可以理解,上述阅读数Y及点赞数D在一个天中会有变化,因此,所述的“当前日期的公众号信息的点赞数”、“当前日期的公众号信息的阅读数”均指当前日期获取公众号信息时的点赞数D及阅读数Y。即,若在2016-4-22上午10点获取公众号信息的点赞数D及阅读数Y,则以10点获取的公众号信息的点赞数D及阅读数Y作为2016-4-22的公众号信息的点赞数D及阅读数Y;若在2016-4-22下午2点获取公众号信息的点赞数D及阅读数Y,则将2点获取的公众号信息的点赞数D及阅读数Y替换10点获取的公众号信息的点赞数D及阅读数Y作为2016-4-22的公众号信息的点赞数D及阅读数Y。
当阅读数Y达到10000的日期与当前日期之间的间隔天数DT大于0时,按如下公式计算公众号信息的影响力W:
W=aY(DT)+(1-a)[Dm(DT)+Dm(DT-1)-D(DT-1)],
其中,Y(DT)为公众号信息的当前日期的阅读数,Dm(DT-1)为当前日期前一天的公众号信息的修正点赞数,D(DT-1)为当前日期前一天的公众号信息的点赞数。a为有理数。由于点赞数D相比阅读数Y互动性更强,因此,a的取值范围可以是0.01至0.1,以表示点赞数D在计算影响力W中的权重比阅读数Y的权重大的多。优选地,a取0.027。
下面以a取0.027为例,描述不同DT数值的多个实施例:
例如,当阅读数Y达到10000的日期与当前日期之间的间隔天数DT=1时,
当前日期的修正点赞数Dm(1)=e[1/(1+1)]*D(1)=e(1/2)*D(1);
当前日期前一天的修正点赞数Dm(0)=e[1/(1+0)]*D(0)=e 1*D(0);
计算公众号信息的影响力W的公式为:
W=0.027*Y(1)+0.973*[Dm(1)+Dm(0)-D(0)]。
又例如,当阅读数Y达到10000的日期与当前日期之间的间隔天数DT=2时,
当前日期的修正点赞数Dm(2)=e[1/(1+2)]*D(2)=e(1/3)*D(2);
当前日期前一天的修正点赞数Dm(1)=e[1/(1+1)]*D(1)=e(1/2)*D(1);
计算公众号信息的影响力W的公式为:
W=0.027*Y(2)+0.973*[Dm(2)+Dm(1)-D(1)]。
再例如,当阅读数Y达到10000的日期与当前日期之间的间隔天数DT=k时,
当前日期的修正点赞数Dm(k)=e[1/(1+k)]*D(k);
当前日期前一天的修正点赞数Dm(k-1)=e[1/(k)]*D(k-1);
计算公众号信息的影响力W的公式为:
W=0.027*Y(k)+0.973*[Dm(k)+Dm(k-1)-D(k-1)]。
具体而言,上述几个实施例说明了DT大于0时,公众号信息的影响力W的计算公式。下面描述当为阅读数Y达到10000的日期与当前日期之间的间隔天数DT=0时,公众号信息的影响力W的计算公式:
W=aY(0)+(1-a)Dm(0),
其中,Y(0)为公众号信息的阅读数,Dm(0)为所述公众号信息的当前修正点赞数,其中,Dm(0)=e1*D(0),D(0)为所述公众号信息的当前点赞数。该公式中a的取值可以与DT大于0时公众号信息的影响力W的计算公式中a的取值相同。
进一步地,当公众号信息的阅读数Y小于10000时,按如下公式计算公众号信息的影响力W:
W=aY+(1-a)D,
其中,该公式中a的取值可以与DT大于0时公众号信息的影响力W的计算公式中a的取值相同。
步骤S20:当所述公众号最近一个月发布的所述公众号信息的总数量F等于1时,健康度参考值E=S/exp(T)*exp(A)*10000;当所述公众号最近一个月发布的所述公众号信息的总数量F大于1时,健康度参考值E=S/exp(T)*exp(A)*exp(V)。由于总数量F的取值范围定义为大于0的整数,所以,总数量F必然是等于1,或者大于1的。
步骤S30:对所述健康度参考值E作数据0-1标准化,并乘以100,映射到[0,100]内的帐号健康度G,G属于[0,100]内的有理数。所述公众号帐号的健康度G=100*[该帐号健康度值–min(所有帐号健康度值)]/[max(所有帐号健康度值)–min(所有帐号健康度值)]。
步骤S40:按照所述公众号的健康度G对公众号进行排序。例如,在一个实施例中,将涉及到的公账号的健康度G按照从大到小进行排列,得到一个健康度G的数列。
步骤S50:按照所述公众号的健康度G的排序结果将所述公众号向用户推送。将步骤S40的数列中,健康度G排在前R%(从大到小排列的前R%)的公众号推送给用户,R为0至30中的整数。这里所指的用户可以是从公众号获取信息的用户,也可以是要通过公众号发布信息的用户。通过这样的方式可以向用户推送健康度G较高的多个公众号,以提高用户获取影响力变化率更高、有价值、有影响力的信息,或者使发布信息的用户了解所发布的公众号健康度G以进行下一步决策等。
并且,在本发明的公众号的健康度排序方法的其他变化例中,还可以包括以下步骤:首先,将所抓取的多个公众号被划分为多个分类,每一个所述分类包括多个公众号。多个公众号的划分可以在本发明提供的步骤中执行,也可以从该多个公众号所在的服务器中获取。具体而言,在一些实施例中,公众号发布公众号信息时,可以增加该公众号的所属分类。在又一些实施例中,可以根据公众号的分类判断该公众号发布的公众号信息的所属分类。在另一些实施例中,可以对公众号进行分析以判断该公众号所属分类。例如,根据公众号中出现最多的关键词、对公众号中的图片进行分析进而通过分析训练系统判断该公众号所属分类。之后,在每一个分类下,按照公众号健康度G对公众号进行排序。
在每一个所述分类下,按照所述公众号的健康度G对公众号进行排序;然后按照所述公众号的所属分类及所述公众号的健康度G的排序结果向用户推送所述公众号。具体而言,在一些实施例中,用户具有一个或多个标签,每个标签对应一个分类,该步骤可以包括在一个分类下,将健康度G排在前R%(从大到小排列的前R%)的公众号推送给具有对应于该分类的标签的用户,R为0至30中的整数。进一步地,用户具有的标签可以是用户自行选择的标签。例如,用户可以选择关注某个或多个分类的公众号。在一些变化例中,用户具有的标签是通过用户行为分析获得的。
根据本发明的一个方面,还提供一种公众号的健康度排序系统,根据上述的公众号的健康度排序方法,对多个所述公众号进行排序,并根据所述公众号的健康度G的排序结果向用户推送所述公众号。
图2和图3分别示出了公众号的健康度排序系统推送公众号的两个实施例。
首先参见图2,图2示出了根据本发明的公众号的健康度排序系统推送公众号的一种拓扑图。图2示出了排序系统310、服务器320及多个终端330。排序系统310、服务器320及多个终端330通过网络相互通信。多个终端330分别在服务器320上注册了公众号,并分别发布其公众号信息。排序系统310从服务器320上获取多个终端330注册的公众号发布的公众号信息的数据,并根据本发明所提供的公众号的健康度排序方法计算公众号的健康度,根据计算所得的公众号的健康度对公众号进行排序。通过排序,排序系统310通过服务器320将健康度较高的多个公众号推送给终端330注册的一般账号。
图3示出了根据本发明的公众号的健康度排序系统推送公众号的另一种拓扑图。图3示出了根据本发明第二实施例的公众号账号的健康度排序系统推送公众号的拓扑图。在图3中,与图2所示的拓扑图类似,多个终端330A在服务器320上注册公众号账号。排序系统310从服务器320上获取公众号发布的公众号信息的数据,计算公众号的健康度,并根据计算所得的公众号的健康度对公众号进行排序。在本实施例中,排序系统310直接向终端330B推送健康度较高的多个公众号。终端330B可以是未在服务器320上注册账号的终端。终端330B也可以是在服务器320上注册一般账号的终端。终端330B可以根据所推送的公众号获取公众号信息,或者通过所推送的公众号来发布信息。
上述图2及图3仅仅是示意性地示出本发明提供的公众号的健康度排序系统推送公众号的拓扑图。排序系统、服务器及终端的数量并非以此为限,本领域技术人员还可以实现更多的通信连接方式,在此不予赘述。基于上述公众号健康度计算的公众号信息排序系统、基于上述公众号信息热度计算的公众号信息排序系统也可类似地设置。在一些变化例中,基于上述公众号健康度计算的公众号信息排序系统、基于上述公众号信息热度计算的公众号信息排序系统、基于上述公众号健康度计算的公众号排序系统都集成在一个处理系统中。在又一些变化例中,基于上述公众号健康度计算的公众号信息排序系统、基于上述公众号信息热度计算的公众号信息排序系统、基于上述公众号健康度计算的公众号排序系统可以是分别单独的处理系统。本领域技术人员还可以实现更多的变化方式,在此不予赘述。
综上可知,本发明公众号的健康度排序方法及其排序系统能有效准确地通过基于多个数据的排序计算获得总和反应账号所发文章的平均影响力、发表文章的间隔时间及其稳定性的账号健康度,并且重新利用健康度来推送有价值信息。
以上仅是本发明的具体应用范例,对本发明的保护范围不构成任何限制。除上述实施例外,本发明还可以有其它实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明所要求保护的范围之内。
Claims (20)
1.一种公众号的健康度排序方法,其特征在于,包括:
收集多个公众号在第一时间段内各自发布的所有公众号信息的总数量F、每条所述公众号信息的间隔时间B(N)、全部所述公众号信息的间隔时间的平均值A、间隔时间的标准差V、平均影响力S、以及最后一次发布所述公众号信息与观测日期的间隔天数T;其中,每条所述公众号信息与在第一时间段内的第一天的间隔天数作为每条所述公众号信息的间隔时间B(N),总数量F、间隔时间B(N)和间隔天数T都属于大于0的整数;
当所述公众号在第一时间段内发布的所述公众号信息的总数量F等于1时,健康度参考值E=S/exp(T)*exp(A)*10000;当所述公众号在第一时间段内发布的所述公众号信息的总数量F大于1时,健康度参考值E=S/exp(T)*exp(A)*exp(V);以及
对所述健康度参考值E作数据0-1标准化,并乘以100,映射到[0,100]内的帐号健康度G,G属于[0,100]内的有理数。
2.如权利要求1所述的公众号的健康度排序方法,其特征在于,所述第一时间段是最近一个月的时间跨度。
3.如权利要求2所述的公众号的健康度排序方法,其特征在于,所述公众号帐号的健康度G=100*[该帐号健康度值–min(所有帐号健康度值)]/[max(所有帐号健康度值)–min(所有帐号健康度值)]。
4.如权利要求2所述的公众号的健康度排序方法,其特征在于,获得所有公众号信息的平均影响力S包括以下步骤:
抓取对应多个公众号信息的第一互动参数Y和第二互动参数D;
基于所述公众号信息的第一互动参数Y和第二互动参数D,按下述步骤计算所述公众号信息的影响力W:
当所述公众号信息的第一互动参数Y大于等于第一阈值时,
计算所述公众号信息的修正第二互动参数:
Dm(DT)=exp[1/(DT+1)]*D(DT),
其中,DT为所述公众号信息的第一互动参数达到所述第一阈值的日期与当前日期之间的间隔天数,Dm(DT)为公众号信息的当前日期的修正第二互动参数,D(DT)为当前日期的公众号信息的第二互动参数;
当DT大于0时,按如下公式计算公众号信息的影响力W:
W=aY(DT)+(1-a)[Dm(DT)+Dm(DT-1)-D(DT-1)],
其中,a为有理数,Y(DT)为公众号信息的当前日期的第一互动参数,Dm(DT-1)为当前日期前一天的公众号信息的修正第二互动参数,D(DT-1)为当前日期前一天的公众号信息的第二互动参数;
最后,按如下公式计算公众号信息的平均响力S:S=W/F。
5.如权利要求4所述的公众号的健康度排序方法,其特征在于,
当所述公众号信息的第一互动参数Y小于所述第一阈值时,按如下公式计算公众号信息的影响力W:
W=aY+(1-a)D。
6.如权利要求4所述的公众号的健康度排序方法,其特征在于,当为DT等于0时,按如下公式计算公众号信息的影响力W:
W=aY(0)+(1-a)[Dm(0)],
其中,Y(0)为所述公众号信息的当前第一互动参数,Dm(0)为所述公众号信息的当前修正第二互动参数,其中,Dm(0)=exp(1)*D(0),D(0)为所述公众号信息的当前第二互动参数。
7.如权利要求4所述的公众号的健康度排序方法,其特征在于,所述第一阈值为9000至11000中的整数。
8.如权利要求1至7任一项所述的公众号的健康度排序方法,其特征在于,还包括:
按照所述公众号的健康度G对公众号进行排序;
按照所述公众号的健康度G的排序结果将所述公众号向用户推送。
9.如权利要求8所述的公众号的健康度排序方法,其特征在于,按照排序结果向用户推送所述公众号的步骤包括:
将健康度G排在前R%的公众号推送给用户,R为0至30中的整数。
10.如权利要求1至7任一项所述的公众号的健康度排序方法,其特征在于,还包括:
所抓取的多个公众号被划分为多个分类,每一个所述分类包括多个公众号;
在每一个所述分类下,按照所述公众号的健康度G对公众号进行排序;
按照所述公众号的所属分类及所述公众号的健康度G的排序结果向用户推送所述公众号。
11.如权利要求10所述的公众号的健康度排序方法,其特征在于,用户具有一个或多个标签,每个所述标签对应一个所述分类,按照所述公众号的所属分类及所述公众号的健康度G的排序结果将向用户推送所述公众号的步骤包括:
在一个所述分类下,将健康度G排在前R%的公众号推送给具有对应于该分类的标签的用户,R为0至30中的整数。
12.如权利要求4至7任一项所述的公众号的健康度排序方法,其特征在于,所述第一互动参数和所述第二互动参数是阅读数、点赞数、转发数、评论数、收藏数及关注数中的任意两个。
13.如权利要求12所述的公众号的健康度排序方法,其特征在于,所述第一互动参数为阅读数,所述第二互动参数为点赞数。
14.如权利要求12所述的公众号的健康度排序方法,其特征在于,所述第一互动参数为阅读数,所述第二互动参数为转发数。
15.如权利要求12所述的公众号的健康度排序方法,其特征在于,所述第一互动参数为阅读数,所述第二互动参数为评论数。
16.如权利要求4至7任一项所述的公众号的健康度排序方法,其特征在于,a的取值范围为0.01至0.1。
17.如权利要求4至7任一项所述的公众号的健康度排序方法,其特征在于,所述公众号信息为社交网络平台的公众号发布的文章、图片、音频和/或视频。
18.如权利要求4至7任一项所述的公众号的健康度排序方法,其特征在于,通过一个或多个所述社交网络平台的API接口收集所述公众号信息的第一互动参数和第二互动参数。
19.一种公众号的健康度排序系统,其特征在于,根据如权利要求1至18任一项所述的公众号的健康度排序方法,对多个所述公众号进行排序,并根据所述公众号的健康度的排序结果向用户推送所述公众号。
20.如权利要求19所述的公众号影响力排序方法,其特征在于,还包括:将健康度G排在前R%的公众号推送给用户,R为0至30中的整数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610801566.3A CN106383867A (zh) | 2016-09-05 | 2016-09-05 | 一种公众号的健康度排序方法及其排序系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610801566.3A CN106383867A (zh) | 2016-09-05 | 2016-09-05 | 一种公众号的健康度排序方法及其排序系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106383867A true CN106383867A (zh) | 2017-02-08 |
Family
ID=57938075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610801566.3A Pending CN106383867A (zh) | 2016-09-05 | 2016-09-05 | 一种公众号的健康度排序方法及其排序系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106383867A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455615A (zh) * | 2013-09-10 | 2013-12-18 | 中国地质大学(武汉) | 一种微信帐号的排序过滤检索方法 |
CN104834731A (zh) * | 2015-05-15 | 2015-08-12 | 百度在线网络技术(北京)有限公司 | 一种自媒体信息的推荐方法及装置 |
GB2535629A (en) * | 2015-01-27 | 2016-08-24 | Ibm | Search-based detection, link, and acquisition of data |
-
2016
- 2016-09-05 CN CN201610801566.3A patent/CN106383867A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455615A (zh) * | 2013-09-10 | 2013-12-18 | 中国地质大学(武汉) | 一种微信帐号的排序过滤检索方法 |
GB2535629A (en) * | 2015-01-27 | 2016-08-24 | Ibm | Search-based detection, link, and acquisition of data |
CN104834731A (zh) * | 2015-05-15 | 2015-08-12 | 百度在线网络技术(北京)有限公司 | 一种自媒体信息的推荐方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104424235B (zh) | 实现用户信息聚类的方法和装置 | |
CN106372207A (zh) | 公众号信息的影响力排序方法及排序系统 | |
CN104933622A (zh) | 一种基于用户和微博主题的微博流行度预测方法及系统 | |
CN103530428B (zh) | 一种基于开发者实践技能相似性的同行推荐方法 | |
CN109299265A (zh) | 潜在回流用户筛选方法、装置以及电子设备 | |
Moody | Matrix methods for calculating the triad census | |
CN103116611A (zh) | 社交网络意见领袖识别方法 | |
CN105933920A (zh) | 一种预测用户满意度的方法及装置 | |
CN106777946A (zh) | 基于层级模型的个性化健康服务推荐方法 | |
CN110796331A (zh) | 基于c4.5决策树算法的电力业务协同分类方法及系统 | |
Chen et al. | Detecting the temporal gaps of technology fronts: A case study of smart grid field | |
CN105760449A (zh) | 一种面向多源异构数据的云推送方法 | |
CN105376223A (zh) | 网络身份关系的可靠度计算方法 | |
CN102799616B (zh) | 大规模社会网络中的离群点检测方法 | |
CN117436679B (zh) | 一种元宇宙资源匹配方法及其系统 | |
CN106296315A (zh) | 基于用户用电数据的情境感知系统 | |
CN103198432B (zh) | 在线社会网络中网络群体的检测方法及系统 | |
CN110502670A (zh) | 基于人工智能的网络社交关系知识图谱生成方法和系统 | |
Kim et al. | Activity recognition for a smartphone and web based travel survey | |
CN109670998A (zh) | 基于校园大数据环境下的精准资助多级认定方法及系统 | |
CN110213209A (zh) | 一种推送信息点击的作弊检测方法、装置及存储介质 | |
CN106156123A (zh) | 活跃值计算方法及装置 | |
CN106383867A (zh) | 一种公众号的健康度排序方法及其排序系统 | |
CN103399919A (zh) | 基于社会关系网的信任增强服务推送方法 | |
CN105718564A (zh) | 推广行为的检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170208 |
|
RJ01 | Rejection of invention patent application after publication |