CN104834731A - 一种自媒体信息的推荐方法及装置 - Google Patents

一种自媒体信息的推荐方法及装置 Download PDF

Info

Publication number
CN104834731A
CN104834731A CN201510249785.0A CN201510249785A CN104834731A CN 104834731 A CN104834731 A CN 104834731A CN 201510249785 A CN201510249785 A CN 201510249785A CN 104834731 A CN104834731 A CN 104834731A
Authority
CN
China
Prior art keywords
media information
data group
information
achievement data
quality index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510249785.0A
Other languages
English (en)
Other versions
CN104834731B (zh
Inventor
司学峰
李鹏
戴欢
何戬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510249785.0A priority Critical patent/CN104834731B/zh
Publication of CN104834731A publication Critical patent/CN104834731A/zh
Application granted granted Critical
Publication of CN104834731B publication Critical patent/CN104834731B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了自媒体信息的推荐方法和装置。所述方法包括:获取所述自媒体信息的多个指标数据;根据所述指标数据的重要性级别,将所述多个指标数据划分为多个指标数据组;分别确定每个所述指标数据组的优质指数;根据所述多个指标数据组的优质指数和权重系数,确定所述自媒体信息的优质指数;以及基于所述自媒体信息的优质指数,将至少一个所述自媒体信息确定为推荐信息。本申请通过多个指标数据确定自媒体信息的优质指数并据此进行信息推荐,实现了从海量自媒体信息中快速获得推荐信息的目的。

Description

一种自媒体信息的推荐方法及装置
技术领域
本申请涉及互联网技术领域,具体涉及信息推荐技术领域,尤其涉及自媒体信息的推荐方法及装置。
背景技术
自媒体又可以称为“公民媒体”或“个人媒体”,是指私人化、平民化、普泛化、自主化的传播者,以现代化、电子化的手段,向不特定的大多数或者特定的单个人传递规范性及非规范性信息的新媒体的总称。常见的自媒体平台包括:博客、微博、微信、百度官方贴吧、BBS(Bulletin Board System,电子公告牌系统)等网络社区。随着互联网技术的飞速发展,用户在这些自媒体信息发布平台所发布的自媒体信息的数量也出现爆炸式增长。如何从海量的数据中获取可以推荐给用户的优质自媒体信息,以增强用户的访问活跃度与黏性,已经成为各类自媒体信息发布平台需要重点解决的技术难题之一。
在现有技术中,网络社交平台普遍通过人工筛选的方式为用户推荐优质的自媒体信息。这种推荐方式需要平台的工作人员去浏览用户发布的几乎所有信息,会耗费大量的人力和时间成本,导致推荐效率极低。并且,人工推荐的标准会带有较强的主观色彩,从而限制了推荐信息的全面性和丰富性。
发明内容
鉴于现有技术中的上述缺陷或不足,期望能够提供一种推荐效率高、推荐信息全面的方案。为了实现上述一个或多个目的,本申请提供了自媒体信息的推荐方法及装置。
第一方面,本申请提供了一种自媒体信息的推荐方法,包括:获取所述自媒体信息的多个指标数据;根据所述指标数据的重要性级别,将所述多个指标数据划分为多个指标数据组;分别确定每个所述指标数据组的优质指数;根据所述多个指标数据组的优质指数和权重系数,确定所述自媒体信息的优质指数;以及基于所述自媒体信息的优质指数,将至少一个所述自媒体信息确定为推荐信息。
第二方面,本申请提供了一种自媒体信息的推荐装置,包括数据获取模块,用于获取所述自媒体信息的多个指标数据;数据分组模块,用于根据所述指标数据的重要性级别,将所述多个指标数据划分为多个指标数据组;各组确定模块,用于分别确定每个所述指标数据组的优质指数;指数确定模块,用于根据所述多个指标数据组的优质指数和权重系数,确定所述自媒体信息的优质指数;以及信息推荐模块,用于基于所述自媒体信息的优质指数,将至少一个所述自媒体信息确定为推荐信息。
本申请提供的自媒体信息的推荐方法及装置,首先可以根据所获取的自媒体信息的多个指标数据的重要性,将其分为多个指标数据组,然后可以根据各个数据组的优质指数确定出自媒体信息的优质指数,最后基于优质指数确定出可以作为推荐信息的自媒体信息。通过对多个指标数据先分组统计,再基于重要性合并计算,可以得到用于评价自媒体信息质量高低的优质指数,从而可以实现对海量自媒体信息的快速评价和推荐,大幅提高了自媒体信息的推荐效率,并且通过对指标数据的客观统计,确保了推荐信息的全面性和丰富性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请自媒体信息的推荐方法的一个实施例的流程图;
图2是本申请自媒体信息的推荐方法的另一个实施例的流程图;
图3是本申请自媒体信息的推荐装置的一个实施例的功能模块构架示意图;
图4是本申请自媒体信息的推荐装置的另一个实施例的功能模块构架示意图;
图5是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,其示出了本申请自媒体信息的推荐方法的一个实施例的流程100。本实施例主要以该方法应用于自媒体信息发布平台的服务器中来举例说明,本实施例的自媒体信息的推荐方法,包括以下步骤:
如图1所示,在步骤101中,获取自媒体信息的多个指标数据。
在本实施例中,当获取自媒体信息的多个指标数据时,可以对围绕一个自媒体信息产生的用户行为日志进行统计,得到与该自媒体信息相关的多个指标数据。自媒体信息的指标数据可以是能够代表自媒体信息本身的特点,或者自媒体信息被发布者操作的情况,或者自媒体信息被其他用户浏览或操作的情况的数据。在一种可能的实现方式中,指标数据可以包括自媒体信息本身的文字长度和图片数量。在另一种可能的实现方式中,指标数据可以包括自媒体信息的发布时间、更新次数、最后一次更新的时间、发布者与其他回复用户的互动情况等。在又一种可能的实现方式中,指标数据可以包括自媒体信息的浏览量、被收藏或转发的次数、被加精或置顶的次数等。指标数据还可以同时包括但不限于上述三种实现方式中的所有数据。本领域技术人员可以理解,与自媒体信息相关的数据都能够在不同程度上反映出自媒体信息的质量优劣情况,因此这些数据都可以作为本实施例中的指标数据。
接着,在步骤102中,根据指标数据的重要性级别,将多个指标数据划分为多个指标数据组。
当在上述步骤101中获得到自媒体信息的多个指标数据后,可以进一步根据各个指标数据的重要性级别,对指标数据进行分组。指标数据的重要性级别,代表了每个指标数据在评价自媒体信息时的重要程度。在本实施例中,这种重要程度可以是一种整体上的划分,例如,可以将多个指标数据划分为重要和次重要两类,也可以将其划分为最重要、次重要、较重要和不重要四类。这样,就可以得到多个指标数据组。
继而,在步骤103中,分别确定每个指标数据组的优质指数。
当在上述步骤102中得到多个指标数据组后,可以分别计算每一个指标数据组的优质指数。具体地,对于一个指标数据组来说,可以首先根据本数据组中的每一个指标数据,分别对自媒体信息的质量进行评价,得到多个评价结果。然后再对这多个评价结果进行综合分析,就可以得到本指标数据组对自媒体信息的评估结果,该评估结果可以用优质指数来表示。一般情况下,自媒体信息的质量与优质指数成正比,优质指数越高自媒体信息的质量就越好。分别对各个指标数据组执行上述评价分析过程,就可以确定出每个指标数据组的优质指数。
接着,在步骤104中,根据多个指标数据组的优质指数和权重系数,确定自媒体信息的优质指数。
当在上述步骤103中确定出每个指标数据组的优质指数后,还可以进一步确定出每个指标数据组的权重系数。权重系数代表了一个指标数据组,在评价自媒体信息质量时的重要程度。一般情况下,权重系数与重要程度成正比,权重系数越大就越重要。由于在上述步骤102中是根据指标数据的重要性级别进行数据分组的,因此可以为重要性级别较高的指标数据组确定一个较大的权重系数,而为重要性级别较低的指标数据组确定一个较小的权重系数。在得到各个指标数据组的权重系数后,就可以基于权重系数对所有指标数据组的优质指数进行综合评价,从而得到自媒体信息的优质指数。例如,可以将每个指标数据组的优质指数与权重系数相乘,再将得到的多个乘积相加就可以得到自媒体信息的优质指数。
最后,在步骤105中,基于自媒体信息的优质指数,将至少一个自媒体信息确定为推荐信息。
当从上述步骤104中得到自媒体信息的优质指数后,可以首先根据优质指数的大小对一定范围内的自媒体信息进行排序,然后根据排序结果确定出一个或多个自媒体信息,作为在该范围内的推荐信息。例如,可以首先确定某个自媒体信息发布平台内的全部自媒体信息的优质指数,然后按照优质指数从大到小的顺序排列这些自媒体信息,最后可以将排在前面的十个或二十个自媒体信息,作为该自媒体信息发布平台内的推荐信息。
本实施例提供的自媒体信息的推荐方法,首先可以根据所获取的自媒体信息的多个指标数据的重要性,将其分为多个指标数据组,然后可以根据各个数据组的优质指数确定出自媒体信息的优质指数,最后基于优质指数确定出可以作为推荐信息的自媒体信息。通过对多个指标数据先分组统计,再基于重要性合并计算,可以得到用于评价自媒体信息质量高低的优质指数,从而可以实现对海量自媒体信息的快速评价和推荐,大幅提高了自媒体信息的推荐效率,并且通过对指标数据的客观统计,确保了推荐信息的全面性和丰富性。
请进一步参考图2,其示出了本申请自媒体信息的推荐方法的另一个实施例的流程200。
如图2所示,在步骤201中,获取自媒体信息的多个指标数据。本步骤与图1中的步骤101相同,在此不再赘述。
接着,在步骤202中,根据指标数据的重要性级别,将多个指标数据划分为核心指标数据组、重要指标数据组和次要指标数据组。
在本实施例中,根据指标数据的重要性级别,将从上述步骤201中得到的多个指标数据划分为了三个指标数据组,即核心指标数据组、重要指标数据组和次要指标数据组,并且这三个指标数据组的重要性级别依次递减。
在本实施例的一个可选实现方式中,核心指标数据组中包括自媒体信息在预设时间段内的人均页面浏览量、独立访客数、登录用户率、收藏量、点赞量、文字长度和图片数量中的一项或多项。核心指标数据组中的指标数据可以是自媒体信息在一定时间段内,例如最近7天内或30天内的指标数据。具体地,当统计自媒体信息在最近7天内的核心指标数据时,可以统计自媒体信息在最近7天内每个独立访客平均浏览的页面量,作为人均页面浏览量。独立访客数可以是指最近7天内访问自媒体信息的终端设备的数量,具体可以通过记录统计COOKIE的方式来记录独立访客数。也可以统计在最近7天内浏览过自媒体信息的用户中登录用户所占的比例即登录用户率。还可以分别统计自媒体信息在最近7天内被收藏和点赞的次数,作为收藏量和点赞量。还可以统计自媒体信息当前所包括的文字和图片的数量作为文字长度和图片数量。
在本实施例的一个可选实现方式中,重要指标数据组中包括自媒体信息在预设时间段内的累计更新次数、累计更新天数、发布者回复次数、发布日期距离当前日期的天数和最后更新日期距离当前日期的天数中的一项或多项。与核心指标数据组中的指标数据类似,重要指标数据组中的数据也可以是自媒体信息在一定时间段内,例如最近7天内或30天内的指标数据。具体地,当统计自媒体信息在最近30天内的重要指标数据时,可以统计自媒体信息在最近30天内的更新次数和更新天数,作为累计更新次数和累计更新天数。也可以统计自媒体信息的发布者在最近30天内对该自媒体信息进行回复的次数,作为发布者回复次数。还可以统计自媒体信息的发布日期和最后一次的更新日期距离当前日期的天数。
在本实施例的一个可选实现方式中,次要指标数据组中包括自媒体信息在预设时间段内的页面浏览量、回复次数、人均回复次数、置顶次数、加精次数和分享次数中的一项或多项。与上述两个指标数据组中的指标数据类似,次要指标数据组中的数据也可以是自媒体信息在一定时间段内,例如最近7天内或3天内的指标数据。具体地,当统计自媒体信息在最近3天内的次要指标数据时,可以统计自媒体信息在最近3天内被浏览的次数,作为页面浏览量。也可以统计自媒体信息在最近3天内的回复次数,并且用回复次数除以回复人数就可以得到人均回复次数。还可以分别统计自媒体信息在最近3天内被自媒体信息发布平台的管理者置顶和加精的次数,以及被其他用户分享的次数。
需要说明的是,如果上述统计的指标数据不在统计的周期内,则可以将该项指标记为零。例如,如果当前统计的是在最近7天内,最后一次的更新日期距离当前日期的天数,而自媒体信息最后一次更新的时间是在10天前,则可以将该项指标数据记为零。
继而,在步骤203中,分别确定核心指标数据组、重要指标数据组和次要指标数据组的优质指数。
当在上述步骤202中分别确定出核心指标数据组、重要指标数据组和次要指标数据组中所包含的指标数据后,可以进一步依据每个组中指标数据的数值,计算各组的优质指数。
在本实施例的一个可选实现方式中,核心指标数据组的优质指数Q1可以根据下式确定:
Q1=人均页面浏览量*log(独立访客数)*(M+登录用户率)*C11+(收藏量+点赞量/N)*C12+文字长度*C13+图片数量*C14
其中,M、N>0,C11、C12、C13、C14为重要性系数,且C11、C12大于C13、C14。重要性系数代表每一组数据的重要性程度。由于人均页面浏览量、独立访客数、登录用户率、收藏量和点赞量与文字长度和图片数量相比,更能体现自媒体信息的质量好坏。因此系数C11和C12可以设置的较大一些,而系数C13和C14可以设置的较小一些。由于自媒体信息通常会发布在网络社区的某一个主题版块中,而主题版块本身的流量会对自媒体信息的流量产生较大影响,因此,为了消除流量的指数效应差异,可以对基础流量指标如独立访客数进行指数处理。登录用户率是一个在0-1之间的重要性较高的指标数据,因此可以将其与一个大于0的数值M相加,以适当增加登录用户率的影响力。可选地,M的值可以取为1。当将收藏量和点赞量作为一组数据进行计算时,由于点赞量的数值通常是收藏量的数倍,但是二者重要程度相当,因此可以通过用点赞量除以N来适当减少点赞量的数值。可选地,N的值可以取为3。
需要说明的是,M、N以及C11、C12、C13和C14的具体取值均可以根据实际需要进行调整,本申请对此不做限定。
在本实施例的一个可选实现方式中,重要指标数据组的优质指数Q2根据下式确定:
Q2=累计更新次数*C21+累计更新天数*C22+发布者回复次数*C23+发布日期距离当前日期的天数*C24+最后更新日期距离当前日期的天数*C25,
其中,C21、C22、C23、C24、C25为重要性系数,且C22、C25大于C21、C24,C21、C24大于C23。重要性系数代表每一个指标数据的重要性程度。由于累计更新天数和最后更新日期距离当前日期的天数对自媒体信息的质量好坏程度的影响更大,而累计更新次数和发布日期距离当前日期的天数的影响次之,发布者回复次数的影响最小。因此,系数C22和C25可以设置的较大一些,而系数C21和C24可以设置的较小一些,系数C23则可以设置的更小一些。
需要说明的是,C21、C22、C23、C24、C25的具体取值均可以根据实际需要进行调整,本申请对此不做限定。
在本实施例的一个可选实现方式中,次要指标数据组的优质指数Q3根据下式确定:
Q3=log(页面浏览量)*C31+回复次数*人均回复次数*C32+(置顶次数+加精次数)*C33+分享次数*C34
其中,C31、C32、C33、C34为重要性系数,且C32、C33、C34大于C31。重要性系数代表每一组数据的重要性程度。由于回复次数、人均回复次数、置顶次数、加精次数和分享次数与页面浏览量相比,更能体现自媒体信息的质量好坏。因此系数C32、C33、C34可以设置比系数C31更大一些。同时,由于自媒体信息通常会发布在网络社区的某一个主题版块中,而主题版块本身的流量会对自媒体信息的流量产生较大影响,因此,为了消除流量的指数效应差异,可以对基础流量指标如页面浏览量进行指数处理。置顶次数和加精次数都是社区管理者对自媒体信息进行的操作,并且二者的数值通常不会太大,因此可以作为一组数据进行计算。
需要说明的是,C31、C32、C33、C34的具体取值均可以根据实际需要进行调整,本申请对此不做限定。
接着,在步骤204中,根据核心指标数据组、重要指标数据组和次要指标数据组的优质指数和权重系数,确定自媒体信息的优质指数。
当在上述步骤203中分别计算得到核心指标数据组、重要指标数据组和次要指标数据组的优质指数后,可以进一步基于各组的权重系数,对三个组的优质指数进行综合计算,从而得到自媒体信息的优质指数。
在本实施例的一个可选实现方式中,自媒体信息的优质指数Q根据下式确定:
Q=Q1*R1+Q2*R2+Q3*R3
其中,Q1、Q2和Q3分别为核心指标数据组、重要指标数据组和次要指标数据组的优质指数,R1、R2和R3分别为核心指标数据组、重要指标数据组和次要指标数据组的权重系数。由于上述三个指标数据的重要性级别依次递减,因此权重系数R1>R2>R3,且R1+R2+R3=1。例如,权重系数的取值可以为R1=0.7,R2=0.2,R3=0.1。
需要说明的是,R1、R2和R3的具体取值均可以根据实际需要进行调整,本申请对此不做限定。
最后,在步骤205中,基于自媒体信息的优质指数,将至少一个自媒体信息确定为推荐信息。本步骤与图1中的步骤105相同,在此不再赘述。
在得到了优质指数较高的多个推荐信息后,可以进一步采用以下一种或多种方法对这多个推荐信息进行优化,以获得更优的推荐结果。
在本实施例的一个可选实现方式中,可以去除推荐信息中标题重复的自媒体信息。具体地,在目前的自媒体信息发布平台中,很可能出现不同用户账号发布同样标题的自媒体信息,或者同一用户账号在不同的主题版块发布同样标题的自媒体信息的现象。在这种情况下,如果该自媒体信息的质量很高,那么最终确定的推荐信息中很可能重复出现这个自媒体信息,导致推荐信息中出现信息重复现象,降低了信息推荐的准确性。为了避免这一问题,可以通过信息的标题对推荐信息进行筛选,将推荐信息中标题重复的自媒体信息进行剔除。
在本实施例的另一个可选实现方式中,可以去除推荐信息中发布者相同的自媒体信息。具体地,本申请在确定推荐信息时,是以各个自媒体信息的优质指数作为确定依据的,而没有考虑这些推荐信息的发布者情况。因此,当某个用户所发布的自媒体信息的质量都比较高时,在最终确定的推荐信息中很可能出现这个用户所发布的多个自媒体信息。通常情况下,可以认为同一个用户所发布的自媒体信息经常都是属于相同或相近领域的。为了确保推荐信息的丰富性和全面性,可以在推荐信息中尽量推荐不同用户发布的自媒体信息。因此,对于同一发布者可只保留一条推荐信息,而去除该发布者的其他推荐信息。一般情况下,可以保留该发布者优质指数最高的那条自媒体信息。
在本实施例的又一个可选实现方式中,根据自媒体信息发布平台中各主题版块的版块信息,确定推荐信息中各主题版块的自媒体信息数量。在现有技术中,一个自媒体信息发布平台通常可以包括有多个主题板块,例如,在一个贴吧中可以包括很多个话题吧。由于每个主题板块的板块信息,包括板块的规模、自媒体信息的数量和用户活跃度等信息,都是不一样的。因此,在对整个自媒体信息发布平台范围内的信息进行推荐时,还可以根据版块信息确定推荐信息中各主题版块的自媒体信息数量。例如,如果一个主题板块的规模大、自媒体信息数量多,则可以适当提高该板块的自媒体信息在推荐信息中所占的数量比例。
表1是在对一个贴吧内的所有主题帖应用本申请的推荐方法后得到的推荐信息,即推荐主题帖列表。从表1中可以看出,该贴吧包括有三个话题吧,即第一吧、第二吧和第三吧。在获取全吧中每一个主题帖在最近七天内的指标数据后,可以根据上述方法确定出每一个主题帖的优质指数,并将各话题吧内优质指数最高的前10个主题帖,作为本吧的推荐贴。还可以将全吧范围内优质指数最高的前10个主题帖,作为全吧的推荐贴。贴吧的服务器在得到如表1所示的推荐结果后,可以直接将该表中的全部或部分内容推荐给贴吧用户。也可以由贴吧的运营人员对该表中的内容进行进一步筛选,然后再推荐给贴吧用户。
表1
应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
与图1中所示的方法相比,本实施例提供的自媒体信息的推荐方法在对多个指标数据分组时,可以将其分为核心指标数据组、重要指标数据组和次要指标数据组,然后综合三个组的优质指数和权重系数得到自媒体信息的优质指数。通过对指标数据的精确分组,得到的优质指数能够更加准确地反映出自媒体信息的质量状况,因此提高了自媒体信息推荐的准确性。
进一步参考图3,其示出了本申请自媒体信息的推荐装置的一个实施例的结构示意图。
如图3所示,本实施例的自媒体信息的推荐装置300包括:数据获取模块310、数据分组模块320、各组确定模块330、指数确定模块340和信息推荐模块350。
数据获取模块310,用于获取自媒体信息的多个指标数据。
数据分组模块320,用于根据指标数据的重要性级别,将获取的多个指标数据划分为多个指标数据组。
各组确定模块330,用于分别确定每个指标数据组的优质指数。
指数确定模块340,用于根据多个指标数据组的优质指数和权重系数,确定自媒体信息的优质指数。以及
信息推荐模块350,用于基于自媒体信息的优质指数,将至少一个自媒体信息确定为推荐信息。
在本实施例的一个可选实现方式中,多个指标数据组包括核心指标数据组、重要指标数据组和次要指标数据组。
在本实施例的一个可选实现方式中,核心指标数据组中包括自媒体信息在预设时间段内的人均页面浏览量、独立访客数、登录用户率、收藏量、点赞量、文字长度和图片数量中的一项或多项。
在本实施例的一个可选实现方式中,核心指标数据组的优质指数Q1根据下式确定:
Q1=人均页面浏览量*log(独立访客数)*(M+登录用户率)*C11+(收藏量+点赞量/N)*C12+文字长度*C13+图片数量*C14,
其中,M>0、N>0,C11、C12、C13、C14为重要性系数,且C11、C12大于C13、C14。
在本实施例的一个可选实现方式中,重要指标数据组中包括自媒体信息在预设时间段内的累计更新次数、累计更新天数、发布者回复次数、发布日期距离当前日期的天数和最后更新日期距离当前日期的天数中的一项或多项。
在本实施例的一个可选实现方式中,重要指标数据组的优质指数Q2根据下式确定:
Q2=累计更新次数*C21+累计更新天数*C22+发布者回复次数*C23+发布日期距离当前日期的天数*C24+最后更新日期距离当前日期的天数*C25,
其中,C21、C22、C23、C24、C25为重要性系数,且C22、C25大于C21、C24,C21、C24大于C23。
在本实施例的一个可选实现方式中,次要指标数据组中包括自媒体信息在预设时间段内的页面浏览量、回复次数、人均回复次数、置顶次数、加精次数和分享次数中的一项或多项。
在本实施例的一个可选实现方式中,次要指标数据组的优质指数Q3根据下式确定:
Q3=log(页面浏览量)*C31+回复次数*人均回复次数*C32+(置顶次数+加精次数)*C33+分享次数*C34
其中,C31、C32、C33、C34为重要性系数,且C32、C33、C34大于C31。
在本实施例的一个可选实现方式中,自媒体信息的优质指数Q根据下式确定:
Q=Q1*R1+Q2*R2+Q3*R3
其中,Q1、Q2和Q3分别为核心指标数据组、重要指标数据组和次要指标数据组的优质指数,R1、R2和R3分别为核心指标数据组、重要指标数据组和次要指标数据组的权重系数,R1>R2>R3,且R1+R2+R3=1。
在本实施例的一个可选实现方式中,如图4所示,上述装置300还可以包括第一去重模块360、第二去重模块370和数量确定模块380中的一个或多个。
第一去重模块360,用于去除推荐信息中标题重复的自媒体信息。
第二去重模块370,用于去除推荐信息中发布者相同的自媒体信息。
数量确定模块380,用于根据自媒体信息发布平台中各主题版块的版块信息,确定推荐信息中各主题版块的自媒体信息数量。
应当理解,图3-4中记载的诸单元或模块与参考图1-2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于图3-4中的装置及其中包含的单元或模块,在此不再赘述。
本申请提供的自媒体信息的推荐装置,数据分组模块可以根据数据获取模块所获取的自媒体信息的多个指标数据的重要性,将其分为多个指标数据组,然后指数确定模块可以根据各组确定模块确定出的各个数据组的优质指数得到自媒体信息的优质指数,最后信息推荐模块基于优质指数确定出可以作为推荐信息的自媒体信息。通过对多个指标数据先分组统计,再基于重要性合并计算,可以得到用于评价自媒体信息质量高低的优质指数,从而可以实现对海量自媒体信息的快速评价和推荐,大幅提高了自媒体信息的推荐效率,并且通过对指标数据的客观统计,确保了推荐信息的全面性和丰富性。
下面参考图5,其示出了适于用实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括数据获取模块、数据分组模块、各组确定模块、指数确定模块和信息推荐模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,数据获取模块还可以被描述为“用于获取自媒体信息的多个指标数据的模块”。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。所述计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本申请的自媒体信息的推荐方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (17)

1.一种自媒体信息的推荐方法,其特征在于,包括:
获取所述自媒体信息的多个指标数据;
根据所述指标数据的重要性级别,将所述多个指标数据划分为多个指标数据组;
分别确定每个所述指标数据组的优质指数;
根据所述多个指标数据组的优质指数和权重系数,确定所述自媒体信息的优质指数;以及
基于所述自媒体信息的优质指数,将至少一个所述自媒体信息确定为推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述多个指标数据组包括核心指标数据组、重要指标数据组和次要指标数据组。
3.根据权利要求2所述的方法,其特征在于,所述核心指标数据组中包括所述自媒体信息在预设时间段内的人均页面浏览量、独立访客数、登录用户率、收藏量、点赞量、文字长度和图片数量中的一项或多项。
4.根据权利要求3所述的方法,其特征在于,所述核心指标数据组的优质指数Q1根据下式确定:
Q1=人均页面浏览量*log(独立访客数)*(M+登录用户率)*C11+(收藏量+点赞量/N)*C12+文字长度*C13+图片数量*C14,
其中,M>0、N>0,C11、C12、C13、C14为重要性系数,且C11、C12大于C13、C14。
5.根据权利要求2所述的方法,其特征在于,所述重要指标数据组中包括所述自媒体信息在预设时间段内的累计更新次数、累计更新天数、发布者回复次数、发布日期距离当前日期的天数和最后更新日期距离当前日期的天数中的一项或多项。
6.根据权利要求5所述的方法,其特征在于,所述重要指标数据组的优质指数Q2根据下式确定:
Q2=累计更新次数*C21+累计更新天数*C22+发布者回复次数*C23+发布日期距离当前日期的天数*C24+最后更新日期距离当前日期的天数*C25,
其中,C21、C22、C23、C24、C25为重要性系数,且C22、C25大于C21、C24,C21、C24大于C23。
7.根据权利要求2所述的方法,其特征在于,所述次要指标数据组中包括所述自媒体信息在预设时间段内的页面浏览量、回复次数、人均回复次数、置顶次数、加精次数和分享次数中的一项或多项。
8.根据权利要求7所述的方法,其特征在于,所述次要指标数据组的优质指数Q3根据下式确定:
Q3=log(页面浏览量)*C31+回复次数*人均回复次数*C32+(置顶次数+加精次数)*C33+分享次数*C34
其中,C31、C32、C33、C34为重要性系数,且C32、C33、C34大于C31。
9.根据权利要求2所述的方法,其特征在于,所述自媒体信息的优质指数Q根据下式确定:
Q=Q1*R1+Q2*R2+Q3*R3
其中,Q1、Q2和Q3分别为所述核心指标数据组、重要指标数据组和次要指标数据组的优质指数,R1、R2和R3分别为所述核心指标数据组、重要指标数据组和次要指标数据组的权重系数,R1>R2>R3,且R1+R2+R3=1。
10.根据权利要求1所述的方法,其特征在于,还包括以下一项或多项:
去除所述推荐信息中标题重复的自媒体信息;
去除所述推荐信息中发布者相同的自媒体信息;
根据自媒体信息发布平台中各主题版块的版块信息,确定所述推荐信息中各主题版块的自媒体信息数量。
11.一种自媒体信息的推荐装置,其特征在于,包括:
数据获取模块,用于获取所述自媒体信息的多个指标数据;
数据分组模块,用于根据所述指标数据的重要性级别,将所述多个指标数据划分为多个指标数据组;
各组确定模块,用于分别确定每个所述指标数据组的优质指数;
指数确定模块,用于根据所述多个指标数据组的优质指数和权重系数,确定所述自媒体信息的优质指数;以及
信息推荐模块,用于基于所述自媒体信息的优质指数,将至少一个所述自媒体信息确定为推荐信息。
12.根据权利要求11所述的装置,其特征在于,所述多个指标数据组包括核心指标数据组、重要指标数据组和次要指标数据组。
13.根据权利要求12所述的装置,其特征在于,所述核心指标数据组中包括所述自媒体信息在预设时间段内的人均页面浏览量、独立访客数、登录用户率、收藏量、点赞量、文字长度和图片数量中的一项或多项。
14.根据权利要求12所述的装置,其特征在于,所述重要指标数据组中包括所述自媒体信息在预设时间段内的累计更新次数、累计更新天数、发布者回复次数、发布日期距离当前日期的天数和最后更新日期距离当前日期的天数中的一项或多项。
15.根据权利要求12所述的装置,其特征在于,所述次要指标数据组中包括所述自媒体信息在预设时间段内的页面浏览量、回复次数、人均回复次数、置顶次数、加精次数和分享次数中的一项或多项。
16.根据权利要求12所述的装置,其特征在于,所述自媒体信息的优质指数Q根据下式确定:
Q=Q1*R1+Q2*R2+Q3*R3
其中,Q1、Q2和Q3分别为所述核心指标数据组、重要指标数据组和次要指标数据组的优质指数,R1、R2和R3分别为所述核心指标数据组、重要指标数据组和次要指标数据组的权重系数,R1>R2>R3,且R1+R2+R3=1。
17.根据权利要求1所述的装置,其特征在于,还包括以下一项或多项:
第一去重模块,用于去除所述推荐信息中标题重复的自媒体信息;
第二去重模块,用于去除所述推荐信息中发布者相同的自媒体信息;
数量确定模块,用于根据自媒体信息发布平台中各主题版块的版块信息,确定所述推荐信息中各主题版块的自媒体信息数量。
CN201510249785.0A 2015-05-15 2015-05-15 一种自媒体信息的推荐方法及装置 Active CN104834731B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510249785.0A CN104834731B (zh) 2015-05-15 2015-05-15 一种自媒体信息的推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510249785.0A CN104834731B (zh) 2015-05-15 2015-05-15 一种自媒体信息的推荐方法及装置

Publications (2)

Publication Number Publication Date
CN104834731A true CN104834731A (zh) 2015-08-12
CN104834731B CN104834731B (zh) 2019-02-26

Family

ID=53812617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510249785.0A Active CN104834731B (zh) 2015-05-15 2015-05-15 一种自媒体信息的推荐方法及装置

Country Status (1)

Country Link
CN (1) CN104834731B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183856A (zh) * 2015-09-08 2015-12-23 百度在线网络技术(北京)有限公司 一种评价信息内容质量的方法及装置
CN105677920A (zh) * 2016-03-04 2016-06-15 百度在线网络技术(北京)有限公司 基于人工智能的自媒体质量指标反馈方法和装置
CN106383867A (zh) * 2016-09-05 2017-02-08 北京蓝色光标品牌管理顾问股份有限公司 一种公众号的健康度排序方法及其排序系统
CN106528724A (zh) * 2016-10-27 2017-03-22 武汉斗鱼网络科技有限公司 一种推送信息的方法及装置
WO2017054582A1 (zh) * 2015-09-30 2017-04-06 北京金山安全软件有限公司 一种信息推送方法、装置及电子设备
CN107045693A (zh) * 2017-05-05 2017-08-15 北京媒立方传媒科技有限公司 媒体特征确定、媒体推荐方法及装置
CN107870912A (zh) * 2016-09-22 2018-04-03 广州市动景计算机科技有限公司 文章质量评分方法、设备、客户端、服务器及可编程设备
CN107992548A (zh) * 2017-11-27 2018-05-04 网易传媒科技(北京)有限公司 信息处理方法、系统、介质和计算设备
CN108259317A (zh) * 2017-12-21 2018-07-06 杭州传送门网络科技有限公司 一种基于创投圈子智能精准化内容推荐及过滤方法
CN108268534A (zh) * 2016-12-30 2018-07-10 北京国双科技有限公司 传播影响力计算方法及装置
CN108429666A (zh) * 2017-02-13 2018-08-21 南京侨拓信息科技有限公司 一种自媒体管理系统
CN108881968A (zh) * 2017-05-15 2018-11-23 北京国双科技有限公司 一种网络视频广告投放方法和系统
CN109241475A (zh) * 2017-07-11 2019-01-18 周武增 一种智能化信息发布系统及方法
CN110162678A (zh) * 2019-05-27 2019-08-23 北京亿生生网络科技有限公司 一种基于区块链的媒体号聚合管理方法、系统及存储介质
CN110633376A (zh) * 2019-08-22 2019-12-31 北京奇艺世纪科技有限公司 一种媒体对象排序方法、装置、设备及存储介质
CN110895590A (zh) * 2019-11-29 2020-03-20 贝壳技术有限公司 候选对象的获取方法和装置、电子设备和存储介质
CN113468402A (zh) * 2021-05-25 2021-10-01 北京达佳互联信息技术有限公司 目标对象确定方法、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101446950A (zh) * 2007-11-26 2009-06-03 音乐会技术公司 对具有时间段的媒体类别进行分组及加权
JP2012027757A (ja) * 2010-07-26 2012-02-09 Dainippon Printing Co Ltd 商品推薦装置、商品推薦システム、商品推薦方法、及びプログラム
CN102841908A (zh) * 2011-06-21 2012-12-26 富士通株式会社 微博内容排序方法和微博内容排序装置
CN103544314A (zh) * 2013-11-04 2014-01-29 北京中搜网络技术股份有限公司 一种搜索数据质量统计方法
CN103593355A (zh) * 2012-08-15 2014-02-19 腾讯科技(深圳)有限公司 用户原创内容的推荐方法及推荐装置
CN103744918A (zh) * 2013-12-27 2014-04-23 东软集团股份有限公司 基于垂直领域的微博搜索排序方法及系统
CN103823906A (zh) * 2014-03-19 2014-05-28 北京邮电大学 一种基于微博数据的多维度检索排序优化算法和工具

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101446950A (zh) * 2007-11-26 2009-06-03 音乐会技术公司 对具有时间段的媒体类别进行分组及加权
JP2012027757A (ja) * 2010-07-26 2012-02-09 Dainippon Printing Co Ltd 商品推薦装置、商品推薦システム、商品推薦方法、及びプログラム
CN102841908A (zh) * 2011-06-21 2012-12-26 富士通株式会社 微博内容排序方法和微博内容排序装置
CN103593355A (zh) * 2012-08-15 2014-02-19 腾讯科技(深圳)有限公司 用户原创内容的推荐方法及推荐装置
CN103544314A (zh) * 2013-11-04 2014-01-29 北京中搜网络技术股份有限公司 一种搜索数据质量统计方法
CN103744918A (zh) * 2013-12-27 2014-04-23 东软集团股份有限公司 基于垂直领域的微博搜索排序方法及系统
CN103823906A (zh) * 2014-03-19 2014-05-28 北京邮电大学 一种基于微博数据的多维度检索排序优化算法和工具

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183856A (zh) * 2015-09-08 2015-12-23 百度在线网络技术(北京)有限公司 一种评价信息内容质量的方法及装置
US10686903B2 (en) 2015-09-30 2020-06-16 Beijing Kingsoft Internet Security Software Co., Ltd. Information push method and electronic device
WO2017054582A1 (zh) * 2015-09-30 2017-04-06 北京金山安全软件有限公司 一种信息推送方法、装置及电子设备
CN105677920A (zh) * 2016-03-04 2016-06-15 百度在线网络技术(北京)有限公司 基于人工智能的自媒体质量指标反馈方法和装置
CN106383867A (zh) * 2016-09-05 2017-02-08 北京蓝色光标品牌管理顾问股份有限公司 一种公众号的健康度排序方法及其排序系统
US10956473B2 (en) 2016-09-22 2021-03-23 Guangzhou Ucweb Computer Technology Co., Ltd. Article quality scoring method and device, client, server, and programmable device
CN107870912A (zh) * 2016-09-22 2018-04-03 广州市动景计算机科技有限公司 文章质量评分方法、设备、客户端、服务器及可编程设备
CN106528724A (zh) * 2016-10-27 2017-03-22 武汉斗鱼网络科技有限公司 一种推送信息的方法及装置
CN106528724B (zh) * 2016-10-27 2019-09-10 武汉斗鱼网络科技有限公司 一种推送信息的方法及装置
CN108268534A (zh) * 2016-12-30 2018-07-10 北京国双科技有限公司 传播影响力计算方法及装置
CN108429666B (zh) * 2017-02-13 2021-06-15 江苏侨拓信息科技有限公司 一种自媒体管理系统
CN108429666A (zh) * 2017-02-13 2018-08-21 南京侨拓信息科技有限公司 一种自媒体管理系统
CN107045693A (zh) * 2017-05-05 2017-08-15 北京媒立方传媒科技有限公司 媒体特征确定、媒体推荐方法及装置
CN108881968B (zh) * 2017-05-15 2020-10-30 北京国双科技有限公司 一种网络视频广告投放方法和系统
CN108881968A (zh) * 2017-05-15 2018-11-23 北京国双科技有限公司 一种网络视频广告投放方法和系统
CN109241475A (zh) * 2017-07-11 2019-01-18 周武增 一种智能化信息发布系统及方法
CN109241475B (zh) * 2017-07-11 2022-01-14 周武增 一种智能化信息发布系统及方法
CN107992548A (zh) * 2017-11-27 2018-05-04 网易传媒科技(北京)有限公司 信息处理方法、系统、介质和计算设备
CN107992548B (zh) * 2017-11-27 2021-08-03 网易传媒科技(北京)有限公司 信息处理方法、系统、介质和计算设备
CN108259317A (zh) * 2017-12-21 2018-07-06 杭州传送门网络科技有限公司 一种基于创投圈子智能精准化内容推荐及过滤方法
CN108259317B (zh) * 2017-12-21 2021-07-06 杭州传送门网络科技有限公司 一种基于创投圈子智能精准化内容推荐及过滤方法
CN110162678A (zh) * 2019-05-27 2019-08-23 北京亿生生网络科技有限公司 一种基于区块链的媒体号聚合管理方法、系统及存储介质
CN110162678B (zh) * 2019-05-27 2022-04-15 朱志文 一种基于区块链的媒体号聚合管理方法、系统及存储介质
CN110633376A (zh) * 2019-08-22 2019-12-31 北京奇艺世纪科技有限公司 一种媒体对象排序方法、装置、设备及存储介质
CN110895590A (zh) * 2019-11-29 2020-03-20 贝壳技术有限公司 候选对象的获取方法和装置、电子设备和存储介质
CN113468402A (zh) * 2021-05-25 2021-10-01 北京达佳互联信息技术有限公司 目标对象确定方法、装置及存储介质
CN113468402B (zh) * 2021-05-25 2024-05-17 北京达佳互联信息技术有限公司 目标对象确定方法、装置及存储介质

Also Published As

Publication number Publication date
CN104834731B (zh) 2019-02-26

Similar Documents

Publication Publication Date Title
CN104834731A (zh) 一种自媒体信息的推荐方法及装置
CN111352962B (zh) 客户画像构建方法及装置
US20160232474A1 (en) Methods and systems for recommending crowdsourcing tasks
CN106940703B (zh) 推送信息粗选排序方法及装置
CN110110201B (zh) 一种内容推荐方法和系统
CN108734405A (zh) 一种数据价值评估平台和方法
US8768866B2 (en) Computer-implemented systems and methods for forecasting and estimation using grid regression
US20190163327A1 (en) Display and analysis system for media content
CN111612581A (zh) 一种物品推荐的方法、装置、设备及存储介质
DE202017100386U1 (de) Latenzreduzierung bei der feedbackbasierten Ermittlung einer Systemperformance
CN111966915A (zh) 信息巡检方法、计算机设备及存储介质
CN115203496A (zh) 基于大数据的项目智能预测及评估方法、系统及可读存储介质
CN110659810A (zh) 一种计算分析员可信程度的方法
CN105138897A (zh) 确定用户权限的方法及装置
CN113704236A (zh) 政务系统数据质量评估方法、装置、终端及存储介质
CN112862264A (zh) 企业经营状况分析方法、计算机设备及计算机存储介质
Nijholt et al. Following fashion: Visible progressiveness and the social construction of firm value
CN106027291B (zh) 基于韦伯费希纳定理的BE业务QoE评价方法
CN104050595A (zh) 一种根据流量供应方的质量选择流量供应的装置和方法
CN114490154A (zh) 数据异常的原因展示方法、装置、电子设备及存储介质
CN106067082A (zh) 一种企业信用评估方法及装置
CN116402398A (zh) 房屋租赁潜力评估方法、装置、计算机设备及存储介质
US20140207530A1 (en) Fairly calibrated distribution matrix modeling
US20150193377A1 (en) Sensitivity Analysis of an Independent Variable Based on Regression
CN116127733A (zh) 基于数字孪生技术的产品设计、预测方法及相关装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant