CN110334270A - 一种新闻排序方法、服务器及计算机可读存储介质 - Google Patents
一种新闻排序方法、服务器及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110334270A CN110334270A CN201810239342.7A CN201810239342A CN110334270A CN 110334270 A CN110334270 A CN 110334270A CN 201810239342 A CN201810239342 A CN 201810239342A CN 110334270 A CN110334270 A CN 110334270A
- Authority
- CN
- China
- Prior art keywords
- news
- content
- shows
- small flow
- flow bucket
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种新闻排序方法、服务器及计算机可读存储介质,用于对部分用户关联的新闻进行实时排序,向全部用户推送排序结果对应的新闻展示内容,实现对新闻的动态管理,提高了新闻的实时性。本发明实施例方法包括:将目标用户集合划分为多个小流量桶和1个主流量桶;获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备。
Description
技术领域
本发明涉及通信领域,尤其涉及一种新闻排序方法、服务器及计算机可读存储介质。
背景技术
随着互联网的发展,越来越多的人通过互联网获取新闻消息。在与用户交互的新闻展示产品中,新闻的实时排序方法和多样性是决定用户体验的重要要素,一般通过新闻的热度来决定新闻的展示优先级。新闻的热度可以通过新闻展示后用户的点击行为准确测量,但由于新闻的时效性,以及新闻的巨大总量,在有限的展示空间下,工作人员无法准确而实时地测量多个新闻应有的热度,尤其是当大量新闻同时出现时。
现有方案中,主要依据新闻搜索排序以及关于新闻源静态特性(例如可靠性,信誉等)进行新闻排序。例如,通过在一定时间内一家新闻机构创作的文章数量、新闻文章篇幅、新闻的报道的影响力、突发性新闻报道数量、新闻展现形式、作者观点、转发发行量、以及与新闻运营员工规模、新闻员工规模、新闻来源的报导宽度、来自国外的流量,以及写作方式等途径确定一篇新闻的优先等级。
新闻源是一个动态流,大部分新闻都是动态的,而新闻的重要性在不停实时更新,现有方案只能对处于静态状态下的新闻进行排序,并不能对动态的新闻进行统计和排序,实时性差。
发明内容
本发明实施例提供了一种新闻排序方法、服务器及计算机可读存储介质,用于对部分用户关联的新闻进行实时排序,向全部用户推送排序结果对应的新闻展示内容,实现对新闻的动态管理,提高了新闻的实时性。
本发明第一方面提供了一种新闻排序方法,包括:
将目标用户集合划分为多个小流量桶和1个主流量桶;
获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;
根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;
将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备。
本发明第二方面提供了一种服务器,包括:
划分单元,用于将目标用户集合划分为多个小流量桶和1个主流量桶;
获取单元,用于获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;
排序单元,用于根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;
推送单元,用于将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备。
本发明第三方面提供了一种服务器,包括:存储器、收发器、处理器以及总线系统;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括如下步骤:
将目标用户集合划分为多个小流量桶和1个主流量桶;
获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;
根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;
将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备;
所述总线系统用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
本发明第四方面提供了一种计算机存储介质,其包括指令,当其在计算机上运行时,使得计算机执行上述各方面所述的操作。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,提供了一种新闻排序方法,包括:将目标用户集合划分为多个小流量桶和1个主流量桶;获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备。本发明实施例中,通过对部分用户关联的新闻展示内容进行实时排序,再根据排序结果向全部用户推送排序结果对应的新闻展示内容,实现对新闻的动态管理,提高了新闻的实时性,提高用户体验。
附图说明
图1为本发明实施例应用的网络框架示意图;
图2为本发明实施例中新闻排序方法的一个流程示意图;
图3为本发明实施例中新闻元对应的新闻展示内容的示意图;
图4为本发明实施例中小流量桶和新闻元的对应关系示意图;
图5为本发明实施例中小流量桶对应新闻展示内容的一个示意图;
图6为本发明实施例中有向图的一个应用场景示意图;
图7A为本发明实施例中连通图的一个应用场景示意图;
图7B为本发明实施例中连通图对应的图矩阵的一个示意图;
图8为本发明实施例中图矩阵和连通图对应关系的一个示意图;
图9为本发明实施例中将用户划分为流量桶的一个示意图;
图10为本发明实施例中服务器的一个结构示意图;
图11为本发明实施例中服务器的另一个结构示意图;
图12为本发明实施例中服务器的另一个结构示意图。
具体实施方式
本发明实施例提供了一种新闻排序方法、服务器及计算机可读存储介质,用于对部分用户关联的新闻进行实时排序,向全部用户推送排序结果对应的新闻展示内容,实现对新闻的动态管理,提高了新闻的实时性。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
可以理解的是,本发明实施例主要应用在新闻展示领域,可以应用到与用户交互的新闻展示产品中,例如,新闻客户端等,新闻的实时性和多样性是决定用户体验的重要要素,新闻的提供方需要向用户提供具有热度的新闻,因此需要对新闻进行热度统计,新闻的热度可以通过新闻展示后用户的点击行为(浏览数)准确测量,但由于新闻的时效性,以及新闻数量的庞大,在有限的展示空间下,很难准确且实时地测量每个新闻应有的热度,尤其是当大量新闻同时出现时。于此同时,每条新闻的不同报道方式以及标题的不同风格,都会引起对同一篇新闻有不同的新闻热度和用户体验。其中,用户是指浏览新闻的自然人;新闻是指网络媒体所报道的新近发生事件的各种文字、图片、视频信息;新闻客户端是指用户在浏览新闻时用的移动设备或桌面电脑程序;新闻展示是指对同一个新闻元做的不同方式的报道或评论,包括不同标题的描述总结等。
因此,本发明通过对部分用户关联的新闻展示内容进行实时排序,再根据排序结果向全部用户推送排序结果对应的新闻展示内容,实现对新闻的动态管理,提高了新闻的实时性,提高用户体验。本发明可以应用在图1所示的网络架构中,服务器向多个用户设备(包括用户设备A、用户设备B、用户设备C、用户设备D、用户设备E、)推送新闻,并获取多个用户设备发送的用户对新闻的点击次数,将多个用户设备的全部用户划分为需要进行采样统计的小流量桶和不需要进行统计的主流量桶,其中,流量桶为通过用户ID进行哈希取余操作得到的用户子集,通过统计小流量桶中对应的新闻展示内容的热度,确定最优的排序方式,并按照该排序方式向全部用户的用户设备推送对应的新闻展示内容,以提高推送的新闻的实时性。为了便于介绍,下面以一款名为“天天快报”的交互式应用为例进行介绍。
为便于说明,下面对本发明实施例的具体流程进行描述,请参阅图2,本发明实施例中新闻排序方法的一个实施例包括:
201、将目标用户集合划分为多个小流量桶和1个主流量桶。
将目标用户集合划分为多个小流量桶和1个主流量桶。具体的,将通过“天天快报”新闻客户端访问服务器的目标用户集合划分为多个小流量桶和1个主流量桶,其中,目标用户集合是访问目标应用的用户的集合,新闻客户端为用户在浏览新闻时使用的用户设备或桌面电脑程序。
需要说明的是,本发明将用户划分为多个小流量桶和1个主流量桶,其中,主流量桶为能获得一个高质量的新闻热度排序的大部分新闻用户,但这个高质量的排序能展示的新闻数目是非常少的(例如最多几百个),以天天快报为例,每天更新的新闻可以多达几十万条,因此采用小流量桶的方式同时对多个新闻的热度做测试,以使得新闻排序既实时又有多样性。
202、获取每个小流量桶中关联的多个新闻展示内容的热度统计结果。
获取每个小流量桶中关联的多个新闻展示内容的热度统计结果,每个新闻展示内容对应不同的新闻元。其中,新闻展示内容为对同一个新闻元做的不同方式的报道或评论,包括不同标题的描述总结等。
具体的,服务器统计在上个周期中与每个小流量桶关联的多个新闻展示内容,每一个小流量桶对应多个新闻元,每一个新闻元可以包括多个新闻展示内容。可以理解的是,不同小流量桶中可以具有相同个数的新闻元,不同小流量桶中相同的新闻元对应的新闻展示内容可能相同也可能不同。
例如,每个小流量桶都包括m个新闻元,即新闻元1至新闻元m,小流量桶1中的新闻元1对应新闻展示内容1.1,而小流量桶2中的新闻元1可以对应新闻展示内容1.2,也可以对应新闻展示内容1.1,其中,新闻展示内容1.1和新闻展示内容1.2都是对应新闻元1。
需要说明的是,本发明将具有同样新闻内容的新闻命名为新闻元,同一个新闻元可以有不同的新闻展示内容(例如同样的新闻内容具有不同的新闻标题),不同的新闻展示内容可以吸引不同的用户进行点击,进一步丰富了新闻的多样性,并使新闻的点击率可以进一步的提升。
203、根据热度统计结果对多个新闻展示内容进行排序,得到排序结果。
根据热度统计结果对多个新闻展示内容进行排序,得到排序结果。
本实施例中,服务器根据获取到的每个新闻展示内容的热度统计结果,按照热度值从高到低的顺序进行排列,得到一个最优的排序结果,该最优排序结果中包括每个新闻元中热度最高的一个新闻展示内容。
204、将排序结果对应的新闻展示内容推送至目标用户集合对应的用户设备。
将排序结果对应的新闻展示内容推送至目标用户集合对应的用户设备。具体的,将多个新闻元的最优排序结果作为推送参考,即将每个新闻元对应的多个新闻展示内容中热度值最高的一个新闻展示内容进行排序,在下一个周期开始时,根据排序结果向新闻客户端的所有用户推送相关新闻展示内容。
本发明实施例中,先将新闻客户端的用户划分为多个部分,从中选取部分用户进行新闻热度采样,对该部分用户关联的新闻展示内容进行实时排序,再根据排序结果向新闻客户端的全部用户推送排序结果对应的新闻展示内容,以便在下个周期进行展示,实现对新闻的动态管理,提高了新闻的实时性。
可选地,在上述图2对应的实施例的基础上,本发明实施例提供的新闻排序方法的可选实施例中,所述根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果包括:
根据热度统计结果构建多个有向图,多个有向图与多个小流量桶一一对应;
根据多个有向图确定多个新闻展示内容的图矩阵;
根据图矩阵对多个新闻展示内容进行排序,得到排序结果。
本实施例中,服务器先根据获取到的热度统计结果构建多个有向图,每个小流量桶中的各个新闻展示内容的热度值不同,再根据获得的多个有向图构建图矩阵,根据该图矩阵得到多个新闻展示内容的排序结果。提供了具体的排序方法,利用有向图的方向性,使低热度的新闻展示内容指向高热度的新闻展示内容,使得排序结果更准确,向用户提高热度更高的新闻,提高了新闻的实用性。
具体的,服务器提供有m个新闻元,每个新闻元有n条新闻展示内容,具体如图3所示,每一个新闻展示内容进行编号,例如,新闻元1的n种新闻展示方式分别为新闻展示内容1.1至新闻展示内容1.n。服务器将可以选择每个新闻元的n个新闻展示内容中的任意一个作为某一个小流量桶的关联新闻展示内容。以小流量桶k为例进行说明,如图4所示,小流量桶k中包括n个新闻元,分别为新闻元k.1至新闻元k.n,小流量桶k中包括的新闻元可以是上述图3中的任意一种新闻展示内容,例如,新闻源k.1可以在图3中的新闻展示内容1.1至新闻展示内容1.n中任意选择一个进行展示。
下面以一个应用场景为例进行说明,例如,本发明提供的新闻排序方法应用在“天天快报”中时,假设存在2个小流量桶,分别为小流量桶1和小流量桶2,每个小流量桶包括3个不同的新闻元,分别为,新闻元1、新闻元2和新闻元3,每个新闻元均包含2个新闻展示内容,其中,新闻元1包括新闻展示内容1.1和新闻展示内容1.2,新闻元2包括新闻展示内容2.1和新闻展示内容2.2,新闻元3包括新闻展示内容3.1和新闻展示内容3.2。一种可行的实施方式中,小流量桶1对应新闻展示内容1.1、新闻展示内容2.1和新闻展示内容3.2;小流量桶2中对应新闻展示内容1.2、新闻展示内容2.2和新闻展示内容3.2,如图5所示,每个小流量桶中的新闻展示内容可能相同也可能不同。其中,新闻展示内容1.1的浏览数为100,新闻展示内容2.1的浏览数为90,新闻展示内容3.2的浏览数为60,新闻展示内容1.2的浏览数为80,新闻展示内容2.2的浏览数为95,新闻展示内容3.2的浏览数为60,分别构建小流量桶1和小流量桶1的有向图,如图6所示。再根据图6所示的两个有向图确定上述5个新闻展示内容的图矩阵;根据图矩阵对上述5个新闻展示内容进行排序,得到排序结果。
可选地,在上述图2对应的实施例的基础上,本发明实施例提供的新闻排序方法的可选实施例中,获取每个小流量桶中关联的多个新闻展示内容的热度统计结果,每个新闻展示内容对应不同的新闻元,包括:
确定与每个小流量桶关联的多个新闻展示内容,多个新闻展示内容中每个新闻展示内容对应不同的新闻元;
获取多个新闻展示内容的热度统计结果,热度统计结果包括多个新闻展示内容的浏览数和展示时长。
本实施例中,确定每个小流量桶中对应的新闻展示内容,再根据确定的新闻展示内容获取对应的浏览数和展示时长,提供了具体的统计结果,对同一个新闻元的多个不同新闻展示内容做统计和自动实时优化,增加了本发明的实现方式。
需要说明的是,热度统计结果除了可以包括新闻展示内容的浏览数和展示时长,还可包括其他等体现新闻热度的数据,例如,新闻的评论数量或新闻的点赞次数等,具体此处不做限定。本发明并不限制新闻元和新闻展示方式的选取,可用一些基于机器学习方法的过滤器来帅选初始新闻,进一步提高帅选效率。
可选地,在上述图2对应的实施例的基础上,本发明实施例提供的新闻排序方法的可选实施例中,获取多个新闻展示内容的热度统计结果,热度统计结果包括多个新闻展示内容的浏览数和展示时长,包括:
获取多个新闻展示内容的热度统计结果,热度统计结果满足其中,Smi为第m个小流量桶的第i个新闻展示内容的热度值,Vmi为第m个小流量桶的第i个新闻展示内容的浏览数,tmi为第m个小流量桶的第i个新闻展示内容的展示时长,α和β为大于0的实数。
本实施例中,根据新闻的展示时长和浏览数计算新闻的热度值,当浏览数相同时,即Vmi相同,展示时长短的(即新闻更新,创建的时间更短)新闻的热度值大。如果新闻是一个热点新闻,就会在排序当中浮到靠前的位置,而那些冷门的新闻很快就会沉到底部,不再被展示,提高了新闻的实时性。
需要说明的是,流量和时间衰减两项之间不一定用加法,也可以用乘法或者其他单调相关函数,只要能体现更近的新闻有相对更多的机会曝光即可。
可选地,在上述图2对应的实施例的基础上,本发明实施例提供的新闻排序方法的可选实施例中,根据热度统计结果构建多个有向图,多个有向图与多个小流量桶一一对应,包括:
根据热度统计结果获取多个小流量桶中每个小流量桶中各个新闻展示内容的热度值;
根据多个小流量桶中每个小流量桶中各个新闻展示内容的热度值构建多个小流量桶中每个小流量桶的有向图;
获取多个有向图,多个有向图与多个小流量桶一一对应。
本实施例中,具体描述了获取多个有向图的过程,获取更多的新闻展示内容样本,提高了新闻的多样性。
需要说明的是,有向图有特定的表达方式G(E,V),,其中,G表示一个图,V是图中顶点的集合,E是图中边的集合。其中,有向图由顶点和弧构成,把有向图中的那条边称之为弧,弧是从弧尾指向弧头。弧(有向边)指的是顶点Vi到Vj之间的边有方向,用有序偶<Vi,Vj>来表示,其中Vi是弧尾,Vj是弧头。
可选地,在上述图2对应的实施例的基础上,本发明实施例提供的新闻排序方法的可选实施例中,根据多个有向图确定多个新闻展示内容的图矩阵包括:
将多个有向图中相同的新闻展示内容连通得到一个连通图;
计算连通图中各个新闻展示内容之间的权重值;
根据权重值构建多个新闻展示内容的图矩阵。
本实施例中,细化了根据有向图得到连通图,在得到连通图对应的图矩阵的过程,通过图矩阵的合并,可以任意扩大和控制新闻的多样性。
具体的,可以将多个有向图合并为一个连通图,例如,在图6的基础上,将相同的新闻展示内容3.2连接起来,得到一个连通图,如图7A所示,根据得到的连通图,确定对应的图矩阵,图7A对应的图矩阵如图7B所示。
需要说明的是,假设一个图有V个节点,那么这个图矩阵就是一个VxV的矩阵A,其值A(i,j)就是Vi指向Vj的权重值,其中,i表示图矩阵的行,j表示图矩阵的列,例如,如图8所示,节点B到节点A的权重值为1,节点C到节点B的权重值为2,节点C到节点A的权重值为2。
可选地,在上述图2对应的实施例的基础上,本发明实施例提供的新闻排序方法的可选实施例中,计算所述连通图中各个展示内容之间的权重值包括,包括:
确定连通图中任意两个新闻展示内容的浏览数的比值,比值大于或等于1;
将比值作为权重值,权重值用于指示任意两个新闻展示内容之间的关联性。
本实施例中,将浏览次数的比值作为权重值,当一个新闻被多次(高权重值)指向的时候,新闻的绝对热度就会很高,被高热度新闻所指向的新闻热度也高,提高了新闻的有效性和准确性。
需要说明的是,有向图权重值计算中,不一定实用浏览数的比值,还可以是其他形式,只要能代表流量大小的相对关系即可。
可选地,在上述图2对应的实施例的基础上,本发明实施例提供的新闻排序方法的可选实施例中,根据图矩阵对多个新闻元的多个展示内容进行排序,得到排序结果包括:
对所述图矩阵进行奇异值分解;
获取所述图矩阵的最大奇异值;
将所述最大奇异值的左奇异向量作为所述多个新闻元的排序分数;
在所述排序分数中选择所述每个新闻元的最大排序分数作为目标排序分数;
根据所述目标排序分数进行排序得到排序结果。
需要说明的是,奇异值分解(singular value decomposition,SVD)是线性代数中一种重要的矩阵分解,是能适用于任意的矩阵的一种分解的方法。假设M是一个m*n的矩阵,其中的元素全部属于域K,也就是实数域或复数域,那么得到的U是一个m*m阶酉矩阵(U里面的向量是正交的,U里面的向量称为左奇异向量),Σ是一个m*n阶非负实数对角矩阵(除了对角线的元素都是0,对角线上的元素称为奇异值),VT(即V的转置矩阵)是一个n*n阶酉矩阵(VT里面的向量也是正交的,VT里面的向量称为右奇异向量),可知,存在一个分解使得M=UΣVT,Σ对角线上的元素Σi,i即为M的奇异值。在很多情况下,前10%甚至1%的奇异值的和就占了全部的奇异值之和的99%以上了。奇异值按照从大到小的顺序进行排列,也就是说,我们也可以用排序靠前的奇异值来近似描述矩阵。奇异值分解中的三个矩阵有非常清楚的物理含义。左奇异向量可以表示每一个新闻展示内容的热度值,根据热度值的高低进行排序得到排序分数,其中,排序分数为用于新闻排序的参考值,因此,将最大奇异值的左奇异向量作为排序分数,可以最大限度的提高排序的准确性。
本实施例中,通过对图矩阵进行奇异值分解,获取到每个新闻展示方式的排序分数,根据排序分数进行排序,增加了本发明的实现方式和新闻的实时性和针对性。
具体的,本发明为了便于描述,以3个新闻元为例进行说明。3个不同新闻按照排序分数从高到低进行排列,TOP1至TOP3,其中,新闻1为:“冬奥会召开”,排序分数80,新闻2为:“春运正式开始”,排序分数为100,新闻3为“美股遭遇黑色星期五”,排序分数为70,则将排序分数最高的新闻2作为排序的TOP1,将排序分数稍低的新闻1作为排序的TOP2,将排序分数最低的新闻3作为排序的TOP3。
可选地,在上述图2对应的实施例的基础上,本发明实施例提供的新闻排序方法的可选实施例中,将目标用户集合划分为多个小流量桶和1个主流量桶包括:
获取目标用户集合中每个用户的标识;
获取每个用户的标识的哈希函数值;
对哈希函数值进行取余操作得到每个用户的哈希函数余值;
根据哈希函数余值将目标用户集合划分为多个小流量桶和1个主流量桶,多个小流量桶中每个小流量桶对应的哈希函数余值不同。
本实施例中,通过对用户进行小流量采样,获取新闻的热度,并推送至全部用户,在大型新闻服务器上无需对大量的真实用户做低质量的流量测试,减少对用户的干扰,提高了新闻的有效性和用户体验。
在一种可行的实施方式中,服务器为每一个使用“天天快报”新闻客户端的用户分配一个唯一的标识,并为每一个标识取哈希函数值,再对得到的哈希函数值进行取余操作,将用户进行等分,每一个哈希函数值的余值对应的用户数量相同,保证每个用户在不同时候落在同一个等分流量桶中。
例如,用户的标识(identity,ID)为u,哈希函数H为64位哈希函数,H(u)%表示对u的哈希函数H(u)进行取余值操作,100表示把u的哈希函数H(u)分成100等分,k表示u的哈希函数H(u)被100除后所得余数,u满足关系式:
Bk={u:H(u)%100=k},k=0,1,2,...,99。
如图9所示,访问该服务器的全部用户可以划分为100个等分流量桶,将哈希函数的余值为0的用户划分为等分流量桶1,将哈希函数值的余值为1的用户划分为等分流量桶2,依次类推,将哈希函数值的余值为k的用户划分为等分流量桶k+1,其中,将部分等分流量桶合并成主流量桶。例如,本发明实施例中,等分流量桶1至等分流量桶10作为小流量桶,每一个小流量桶占目标用户集合的用户总数的1%,等分流量桶11至等分流量桶100合并为主流量桶,其中k=10,11,…,99,主流量桶占目标用户集合的用户总数的90%。
以上对本发明中一种新闻排序方法进行说明,以下对执行上述新闻排序方法的服务器进行说明。
请参阅图10,本申请实施例中服务器的一个实施例包括:
划分单元1001,用于将目标用户集合划分为多个小流量桶和1个主流量桶;
获取单元1002,用于获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;
排序单元1003,用于根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;
推送单元1004,用于将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备。
本发明实施例中,先将新闻客户端的用户划分为多个部分,从中选取部分用户进行新闻热度采样,对该部分用户关联的新闻展示内容进行实时排序,再根据排序结果向新闻客户端的全部用户推送排序结果对应的新闻展示内容,以便在下个周期进行展示,实现对新闻的动态管理,提高了新闻的实时性。
请参阅图11,本发明实施例中服务器的另一个实施例包括:
划分单元1101,用于将目标用户集合划分为多个小流量桶和1个主流量桶;
获取单元1102,用于获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;
排序单元1103,用于根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;
推送单元1104,用于将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备。
可选地,排序单元1103包括:
构建模块11031,用于根据所述热度统计结果构建多个有向图,所述多个有向图与所述多个小流量桶一一对应;
第一确定模块11032,用于根据所述多个有向图确定所述多个新闻展示内容的图矩阵;
排序模块11033,用于根据所述图矩阵对所述多个新闻展示内容进行排序,得到排序结果。
可选地,获取单元1102包括:
第二确定模块11021,用于确定与每个所述小流量桶关联的多个新闻展示内容,所述多个新闻展示内容中每个新闻展示内容对应不同的新闻元;
获取模块11022,用于获取所述多个新闻展示内容的热度统计结果,所述热度统计结果包括所述多个新闻展示内容的浏览数和展示时长。
可选地,获取模块11022具体用于:
获取所述多个新闻展示内容的热度统计结果,所述热度统计结果满足其中,所述Smi为第m个小流量桶的第i个新闻展示内容的热度值,所述Vmi为第m个小流量桶的第i个新闻展示内容的浏览数,所述tmi为第m个小流量桶的第i个新闻展示内容的展示时长,所述α和所述β为大于0的实数。
可选地,构建模块11031具体用于:
根据所述热度统计结果获取所述多个小流量桶中每个小流量桶中各个新闻展示内容的热度值;
根据所述多个小流量桶中每个小流量桶中各个新闻展示内容的热度值构建所述多个小流量桶中每个小流量桶的有向图;
获取多个有向图,所述多个有向图与所述多个小流量桶一一对应。
可选地,第一确定模块11032具体用于:
将所述多个有向图中相同的新闻展示内容连通得到一个连通图;
计算所述连通图中各个新闻展示内容之间的权重值;
根据所述权重值构建所述多个新闻展示内容的图矩阵。
可选地,第一确定模块11032具体还用于:
确定所述连通图中任意两个新闻展示内容的浏览数的比值,所述比值大于或等于1;
将所述比值作为权重值,所述权重值用于指示任意两个新闻展示内容之间的关联性。
可选地,排序单元1103具体用于:
对所述图矩阵进行奇异值分解;
获取所述图矩阵的最大奇异值;
将所述最大奇异值的左奇异向量作为所述多个新闻元的排序分数;
在所述排序分数中选择所述每个新闻元的最大排序分数作为目标排序分数;
根据所述目标排序分数进行排序得到排序结果。
可选地,划分单元1101具体还用于:
获取所述目标用户集合中每个用户的标识;
获取所述每个用户的标识的哈希函数值;
对所述哈希函数值进行取余操作得到所述每个用户的哈希函数余值;
根据所述哈希函数余值将所述目标用户集合划分为所述多个小流量桶和所述1个主流量桶,所述多个小流量桶中每个小流量桶对应的所述哈希函数余值不同。
上面从模块化功能实体的角度对本发明实施例中的服务器进行了描述,下面从硬件处理的角度对本发明实施例中的服务器进行描述。请参阅图12,本发明实施例中服务器的另一个实施例包括:
图12所示的服务器可以具有如图12所示的结构。图12中的存储器存储处理器执行上述新闻排序方法时需要调用的程序代码。
图12是本发明实施例提供的一种服务器的结构示意图,该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(英文全称:centralprocessing units,英文简称:CPU)1201(例如,一个或一个以上处理器)和存储器1202,一个或一个以上存储应用程序1204或数据1205的存储介质1203(例如一个或一个以上海量存储设备)。其中,存储器1202和存储介质1203可以是短暂存储或持久存储。存储在存储介质1203的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1201可以设置为与存储介质1203通信,在服务器1200上执行存储介质1203中的一系列指令操作。
服务器1200还可以包括一个或一个以上电源1206,一个或一个以上有线或无线网络接口1207,一个或一个以上输入输出接口1208,和/或,一个或一个以上操作系统1209,例如Windows Server,Mac OS X,Unix,Linux,FreeBSD等。
上述实施例中由服务器所执行的步骤可以基于该图12所示的服务器的结构。
例如,所述中央处理器1201可以调用存储介质1203中存储的指令执行如下操作:
将目标用户集合划分为多个小流量桶和1个主流量桶;
获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;
根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;
将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
以上对本发明所提供的技术方案进行了详细介绍,本申请中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (15)
1.一种新闻排序方法,其特征在于,包括:
将目标用户集合划分为多个小流量桶和1个主流量桶;
获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;
根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;
将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备。
2.根据权利要求1所述的方法,其特征在于,所述根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果包括:
根据所述热度统计结果构建多个有向图,所述多个有向图与所述多个小流量桶一一对应;
根据所述多个有向图确定所述多个新闻展示内容的图矩阵;
根据所述图矩阵对所述多个新闻展示内容进行排序,得到排序结果。
3.根据权利要求2所述的方法,其特征在于,所述获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元,包括:
确定与每个所述小流量桶关联的多个新闻展示内容,所述多个新闻展示内容中每个新闻展示内容对应不同的新闻元;
获取所述多个新闻展示内容的热度统计结果,所述热度统计结果包括所述多个新闻展示内容的浏览数和展示时长。
4.根据权利要求3所述的方法,其特征在于,所述获取所述多个新闻展示内容的热度统计结果,所述热度统计结果包括所述多个新闻展示内容的浏览数和展示时长,包括:
获取所述多个新闻展示内容的热度统计结果,所述热度统计结果满足其中,所述Smi为第m个小流量桶的第i个新闻展示内容的热度值,所述Vmi为第m个小流量桶的第i个新闻展示内容的浏览数,所述tmi为第m个小流量桶的第i个新闻展示内容的展示时长,所述α和所述β为大于0的实数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述热度统计结果构建多个有向图,所述多个有向图与所述多个小流量桶一一对应,包括:
根据所述热度统计结果获取所述多个小流量桶中每个小流量桶中各个新闻展示内容的热度值;
根据所述多个小流量桶中每个小流量桶中各个新闻展示内容的热度值构建所述多个小流量桶中每个小流量桶的有向图;
获取多个有向图,所述多个有向图与所述多个小流量桶一一对应。
6.根据权利要求3-5中任一项所述的方法,其特征在于,所述根据所述多个有向图确定所述多个新闻展示内容的图矩阵包括:
将所述多个有向图中相同的新闻展示内容连通得到一个连通图;
计算所述连通图中各个新闻展示内容之间的权重值;
根据所述权重值构建所述多个新闻展示内容的图矩阵。
7.根据权利要求6所述的方法,其特征在于,所述计算所述连通图中各个展示内容之间的权重值包括:
确定所述连通图中任意两个新闻展示内容的浏览数的比值,所述比值大于或等于1;
将所述比值作为权重值,所述权重值用于指示任意两个新闻展示内容之间的关联性。
8.根据权利要求2-5中任一项所述的方法,其特征在于,所述根据所述图矩阵对所述多个新闻元的多个展示内容进行排序,得到排序结果包括:
对所述图矩阵进行奇异值分解;
获取所述图矩阵的最大奇异值;
将所述最大奇异值的左奇异向量作为所述多个新闻元的排序分数;
在所述排序分数中选择所述每个新闻元的最大排序分数作为目标排序分数;
根据所述目标排序分数进行排序得到排序结果。
9.根据权利要求1-5中任一项所述的方法,其特征在于,所述将目标用户集合划分为多个小流量桶和1个主流量桶包括:
获取所述目标用户集合中每个用户的标识;
获取所述每个用户的标识的哈希函数值;
对所述哈希函数值进行取余操作得到所述每个用户的哈希函数余值;
根据所述哈希函数余值将所述目标用户集合划分为所述多个小流量桶和所述1个主流量桶,所述多个小流量桶中每个小流量桶对应的所述哈希函数余值不同。
10.一种服务器,其特征在于,包括:
划分单元,用于将目标用户集合划分为多个小流量桶和1个主流量桶;
获取单元,用于获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;
排序单元,用于根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;
推送单元,用于将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备。
11.根据权利要求10所述的服务器,其特征在于,所述排序单元包括:
构建模块,用于根据所述热度统计结果构建多个有向图,所述多个有向图与所述多个小流量桶一一对应;
第一确定模块,用于根据所述多个有向图确定所述多个新闻展示内容的图矩阵;
排序模块,用于根据所述图矩阵对所述多个新闻展示内容进行排序,得到排序结果。
12.根据权利要求11所述的服务器,其特征在于,所述获取单元包括:
第二确定模块,用于确定与每个所述小流量桶关联的多个新闻展示内容,所述多个新闻展示内容中每个新闻展示内容对应不同的新闻元;
获取模块,用于获取所述多个新闻展示内容的热度统计结果,所述热度统计结果包括所述多个新闻展示内容的浏览数和展示时长。
13.根据权利要求12所述的服务器,其特征在于,所述获取模块具体用于:
获取所述多个新闻展示内容的热度统计结果,所述热度统计结果满足其中,所述Smi为第m个小流量桶的第i个新闻展示内容的热度值,所述Vmi为第m个小流量桶的第i个新闻展示内容的浏览数,所述tmi为第m个小流量桶的第i个新闻展示内容的展示时长,所述α和所述β为大于0的实数。
14.一种服务器,其特征在于,包括:存储器、收发器、处理器以及总线系统;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括如下步骤:
将目标用户集合划分为多个小流量桶和1个主流量桶;
获取每个所述小流量桶中关联的多个新闻展示内容的热度统计结果,每个所述新闻展示内容对应不同的新闻元;
根据所述热度统计结果对所述多个新闻展示内容进行排序,得到排序结果;
将所述排序结果对应的新闻展示内容推送至所述目标用户集合对应的用户设备;
所述总线系统用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
15.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1至9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810239342.7A CN110334270B (zh) | 2018-03-21 | 2018-03-21 | 一种新闻排序方法、服务器及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810239342.7A CN110334270B (zh) | 2018-03-21 | 2018-03-21 | 一种新闻排序方法、服务器及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110334270A true CN110334270A (zh) | 2019-10-15 |
CN110334270B CN110334270B (zh) | 2023-07-11 |
Family
ID=68138817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810239342.7A Active CN110334270B (zh) | 2018-03-21 | 2018-03-21 | 一种新闻排序方法、服务器及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110334270B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080359A (zh) * | 2019-12-13 | 2020-04-28 | 北京搜狐新媒体信息技术有限公司 | 一种标签算法确定方法、装置、服务器及存储介质 |
CN111475727A (zh) * | 2020-04-07 | 2020-07-31 | 上海优扬新媒信息技术有限公司 | 一种落地页的推送方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890725A (zh) * | 2012-11-02 | 2013-01-23 | 瑞庭网络技术(上海)有限公司 | 搜索引擎的结果排序方法 |
CN103530402A (zh) * | 2013-10-23 | 2014-01-22 | 北京航空航天大学 | 一种基于改进的PageRank的微博关键用户识别方法 |
CN107222566A (zh) * | 2017-07-06 | 2017-09-29 | 广州优视网络科技有限公司 | 信息推送方法、装置及服务器 |
-
2018
- 2018-03-21 CN CN201810239342.7A patent/CN110334270B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890725A (zh) * | 2012-11-02 | 2013-01-23 | 瑞庭网络技术(上海)有限公司 | 搜索引擎的结果排序方法 |
CN103530402A (zh) * | 2013-10-23 | 2014-01-22 | 北京航空航天大学 | 一种基于改进的PageRank的微博关键用户识别方法 |
CN107222566A (zh) * | 2017-07-06 | 2017-09-29 | 广州优视网络科技有限公司 | 信息推送方法、装置及服务器 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080359A (zh) * | 2019-12-13 | 2020-04-28 | 北京搜狐新媒体信息技术有限公司 | 一种标签算法确定方法、装置、服务器及存储介质 |
CN111475727A (zh) * | 2020-04-07 | 2020-07-31 | 上海优扬新媒信息技术有限公司 | 一种落地页的推送方法及装置 |
CN111475727B (zh) * | 2020-04-07 | 2024-03-01 | 度小满科技(北京)有限公司 | 一种落地页的推送方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110334270B (zh) | 2023-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105701216B (zh) | 一种信息推送方法及装置 | |
US20190197416A1 (en) | Information recommendation method, apparatus, and server based on user data in an online forum | |
CN105956161B (zh) | 一种信息推荐方法和装置 | |
CN105224606B (zh) | 一种用户标识的处理方法及装置 | |
US8751511B2 (en) | Ranking of search results based on microblog data | |
CN102054003B (zh) | 网络信息推荐、建立网络资源索引的方法及系统 | |
CN110019396A (zh) | 一种基于分布式多维分析的数据分析系统及方法 | |
CN110378434A (zh) | 点击率预测模型的训练方法、推荐方法、装置及电子设备 | |
CN110458220A (zh) | 人群定向方法、装置、服务器及存储介质 | |
CN104021163A (zh) | 产品推荐系统及方法 | |
CN105159910A (zh) | 信息推荐方法和装置 | |
CN104050197B (zh) | 一种信息检索系统评测方法和装置 | |
CN109388760A (zh) | 推荐标签获取方法、媒体内容推荐方法、装置及存储介质 | |
CN110490625A (zh) | 用户偏好确定方法及装置、电子设备、存储介质 | |
US11914622B2 (en) | Efficient factor analysis on large datasets using categorical variables | |
US11663172B2 (en) | Cascading payload replication | |
CN110297990A (zh) | 众包营销微博与水军的联合检测方法及系统 | |
CN110096614A (zh) | 信息推荐方法及装置、电子设备 | |
CN108288208A (zh) | 基于图像内容的展示对象确定方法、装置、介质及设备 | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
WO2018200156A1 (en) | Named entity-based category tagging of documents | |
CN110334270A (zh) | 一种新闻排序方法、服务器及计算机可读存储介质 | |
CN110851708B (zh) | 负样本的抽取方法、装置、计算机设备和存储介质 | |
CN109672706A (zh) | 一种信息推荐方法、装置、服务器及存储介质 | |
CN111340601A (zh) | 商品信息的推荐方法和装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20221209 Address after: 1402, Floor 14, Block A, Haina Baichuan Headquarters Building, No. 6, Baoxing Road, Haibin Community, Xin'an Street, Bao'an District, Shenzhen, Guangdong 518000 Applicant after: Shenzhen Yayue Technology Co.,Ltd. Address before: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors Applicant before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |