CN110198460B - 媒体信息的选取方法和装置、存储介质、电子装置 - Google Patents

媒体信息的选取方法和装置、存储介质、电子装置 Download PDF

Info

Publication number
CN110198460B
CN110198460B CN201810276717.7A CN201810276717A CN110198460B CN 110198460 B CN110198460 B CN 110198460B CN 201810276717 A CN201810276717 A CN 201810276717A CN 110198460 B CN110198460 B CN 110198460B
Authority
CN
China
Prior art keywords
target
media information
access record
access
account
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810276717.7A
Other languages
English (en)
Other versions
CN110198460A (zh
Inventor
黄宙舒
连博
万明月
黄嘉雯
孙刚
汪景福
朱成芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810276717.7A priority Critical patent/CN110198460B/zh
Publication of CN110198460A publication Critical patent/CN110198460A/zh
Application granted granted Critical
Publication of CN110198460B publication Critical patent/CN110198460B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Graphics (AREA)
  • Computing Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种媒体信息的选取方法和装置、存储介质、电子装置。其中,该方法包括:获取日志信息,其中,日志信息中记录有对目标媒体信息的访问记录,目标媒体信息为携带有目标对象的媒体信息;根据日志信息中记录的目标帐号对目标媒体信息的访问次数确定目标对象的第一特征,其中,目标帐号为通过使用虚拟资源来获得对目标媒体信息的访问权限的帐号;选取待推送的第一媒体信息,其中,第一媒体信息为携带有第一对象的媒体信息,第一对象为根据第一特征从目标对象中确定的对象。本发明解决了相关技术中根据用户需求推荐媒体信息的效率较低的技术问题。

Description

媒体信息的选取方法和装置、存储介质、电子装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种媒体信息的选取方法和装置、存储介质、电子装置。
背景技术
随着互联网的发展,用户对媒体信息的需求越来越大,商家、视频制作公司等往往需要在互联网平台、电视等媒介上投放大量的媒体信息,这些媒体信息包括但不局限于:电影、电视剧、短片、广告视频、广告图片、宣传片、动漫视频等。
由于用户喜好不同,推出的媒体信息不一定能够得到用户的喜好。在相关技术中,往往采用过线下定性的方式来进行分析,从而根据调查出的信息来投放上述的媒体信息。
利用线下定性方式虽然可以准确联系并区分出用户的需求,但线下以小组讨论的模式所需时间长,沟通成本高昂,样本量局限较大,且存在被采访对象在现场不据实回答真实想法的可能性。对于上述获取媒体信息的方式,利用线下定性方式来分析,存在成本较高、效率较低、样本量小、准确度较低等问题。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种媒体信息的选取方法和装置、存储介质、电子装置,以至少解决相关技术中根据用户需求推荐媒体信息的效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种媒体信息的选取方法,包括:获取日志信息,其中,日志信息中记录有对目标媒体信息的访问记录,目标媒体信息为携带有目标对象的媒体信息;根据日志信息中记录的目标帐号对目标媒体信息的访问次数确定目标对象的第一特征,其中,目标帐号为通过使用虚拟资源来获得对目标媒体信息的访问权限的帐号;选取待推送的第一媒体信息,其中,第一媒体信息为携带有第一对象的媒体信息,第一对象为根据第一特征从目标对象中确定的对象。
根据本发明实施例的另一方面,还提供了一种媒体信息的选取装置,包括:获取单元,用于获取日志信息,其中,日志信息中记录有对目标媒体信息的访问记录,目标媒体信息为携带有目标对象的媒体信息;确定单元,用于根据日志信息中记录的目标帐号对目标媒体信息的访问次数确定目标对象的第一特征,其中,目标帐号为通过使用虚拟资源来获得对目标媒体信息的访问权限的帐号;选取单元,用于选取待推送的第一媒体信息,其中,第一媒体信息为携带有第一对象的媒体信息,第一对象为根据第一特征从目标对象中确定的对象。
根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。
在本发明实施例中,通过日志信息中记录的访问记录确定目标对象中每个对象的第一特征,并基于目标对象中每个对象的第一特征确定目标对象中的第一对象,然后选取待推送的第一媒体信息,第一媒体信息为信息集合中携带有第一对象的媒体信息,由于这些步骤均是由机器自动执行,从而无需通过线下调研的方式来选取媒体信息,可以解决相关技术中根据用户需求推荐媒体信息的效率较低的技术问题,进而达到快速选取媒体信息的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的媒体信息的选取方法的硬件环境的示意图;
图2是根据本发明实施例的一种可选的媒体信息的选取方法的流程图;
图3是根据本发明实施例的一种可选的决策树模型的示意图;
图4是根据本发明实施例的一种可选的媒体信息的选取方式的示意图;
图5是根据本发明实施例的一种可选的媒体信息的选取方式的示意图;
图6是根据本发明实施例的一种可选的神经网络模型的示意图;
图7是根据本发明实施例的一种可选的媒体信息的选取方法的流程图;
图8是根据本发明实施例的一种可选的用户分类的示意图;
图9是根据本发明实施例的一种可选的网页客户端的示意图;
图10是根据本发明实施例的一种可选的媒体信息的选取装置的示意图;以及,
图11是根据本发明实施例的一种终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
对于媒体信息的传输平台而言,存在选取媒体信息的需求,其主要是根据体现观众需求的热点(指的是比较受广大群众关注或者欢迎的新闻或者信息或指某时期引人注目的地方或问题等)进行选取,相关技术中,在热度识别方面主要是人工发现社交网络等能够引起讨论的话题、热点,通过线下调研或者网络调研的方式人工获取热点,进而推荐属于热点方面的内容。
若始终由运营人员关注网络上面的流行的,有话题性的热点明星,这种人工发现热点题材存在工作量大,人力资源浪费,覆盖面不够全面,判断带有个人主观喜好,人工的专业程度参差不齐等问题。
在本申请的实施例中,还提供了一种可选的实施方式,可辅助以比如说视频网站的播放数据,如观察评论数据、口碑评分数据、用户分享数据等等发现近期的明星热度,付费购买数据等等计算明星热度。具体地,通过正面数据(也即通过官方渠道充值的用户的数据,如观看记录)统计分析,如将用户在网站上面播放剧集相关的明星,按照播放量、播放比例、分享、转发、评论、付费等数据进行统计,按照给定的指标排序得到头部明星(即统计出来的分数靠前的明星),从而得到明星热度。
但是在上述方案中,使用正面数据按照统计的方法进行明星热度分析,能够解决人工工作量大的问题;但是,使用机器统计分析数据,会存在水军、恶意刷分、恶意提高播放量等误判断的问题,同时由于流量入口有限,对于用户的偏好会存在偏差,覆盖的热点范围也不够广泛;同时,使用正面数据会使得一些用户日常需求的明星题材进入热度统计,造成热度偏差,比如说代言广告、娱乐新闻等。
根据本发明实施例的一方面,提供了一种媒体信息的选取方法的方法实施例。
可选地,在本实施例中,上述媒体信息的选取方法可以应用于如图1所示的由服务器102和终端104所构成的硬件环境中。如图1所示,服务器102通过网络与终端104进行连接,可用于为终端或终端上安装的客户端提供服务(如游戏服务、应用服务、通讯服务、内容服务等),在服务器上或独立于服务器设置数据库106,上述网络包括但不限于:广域网、城域网或局域网,终端104并不限定于PC、手机、平板电脑等。
图2是根据本发明实施例的一种可选的媒体信息的选取方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,服务器获取日志信息,日志信息中记录有对目标媒体信息的访问记录,目标媒体信息为携带有目标对象的媒体信息。
上述的目标媒体信息可以为多条(换言之,目标媒体信息存在的形式可以为一个信息集合,记为第一集合),日志信息中可记录对目标媒体信息中任意一条媒体信息的访问记录,目标媒体信息中的媒体信息为携带有目标对象中任意一个对象的媒体信息。
上述的日志信息可保存在数据库中,一种可选的访问记录的结构如图1所示,包括“记录ID”、“所访问的媒体信息ID”、“对象ID”三个关键字段,当然也可包括更多的字段,以记录每条访问记录的详细信息。
上述的媒体信息可以文本信息、图片信息、视频信息、音频信息等多种类型的信息中的一种,如网页、图文、电视剧、广告、歌曲等,也可为上述多种类型中的至少两种的混合。
上述目标对象也可为多个,换言之,目标对象可以为实体的对象或者抽象的对象的集合,实体的对象可以为电视剧的演员、明星、导演、编剧等,广告中的代言人等,歌曲的主唱、谱曲作者、作词作者等;抽象的对象可以为电视剧的类型、电子书的类型,歌曲风格、歌曲流派等。
步骤S204,服务器根据日志信息中记录的目标帐号对目标媒体信息的访问次数确定目标对象的第一特征,目标帐号为通过使用虚拟资源来获得对目标媒体信息的访问权限的帐号。根据日志信息确定目标对象中每个对象的第一特征。
目标对象中一个对象的第一特征是根据目标帐号对第二媒体信息的访问次数确定的,第二媒体信息为目标媒体信息中携带有上述的一个对象的媒体信息,换言之,每个对象可存在相应的第二媒体信息,进而可确定其对应的第一特征。
上述的目标帐号为通过使用虚拟资源来获得对目标媒体信息中的媒体信息的访问权限的帐号,虚拟资源如优惠券、代金券、虚拟货币、电子货币、现金等,目标帐号,即充值帐号,可通过虚拟资源来换取媒体信息的访问权限,这里的访问权限包括但不局限于:访问未充值帐号不可访问的媒体信息、可免广告地访问媒体信息。
目标帐号,即充值用户的帐号,由于在市场方面的原因,这类帐号会更加倾向于具有商业化价值的话题,像日常播报娱乐新闻、广告等免费题材很少在这类数据中出现,从而使得明星热度更加倾向具有商业价值的指标,从而根据这类用户的习惯选取出相似的媒体信息,一方面可以更加满足这类用户的需求,同时,由于这类媒体信息的增多,可以促进有这方面需求的用户成为充值用户。
步骤S206,服务器选取待推送的第一媒体信息,第一媒体信息为携带有第一对象的媒体信息,第一对象为根据第一特征从目标对象中确定的对象。
可选地,服务器可基于目标对象中每个对象的第一特征确定目标对象中的第一对象,进而根据第一对象从信息集合(可记为第二集合)中选取待推送的第一媒体信息,第一媒体信息为信息集合中携带有第一对象的媒体信息,第一对象的第一特征表示其受欢迎程度不小于目标对象中其他对象的第一特征所表示的受欢迎程度。
可选地,上述的第二集合可为与第一集合相同的集合,此时相当于,根据观众在一段时间(如试放映)内的反响,择其优者(受欢迎的)而播放,以便于利用有限的播放资源(如可播放时间段)播放更加受欢迎的媒体信息,从而提高用户的观看率,增加流量、广告等收益;第二集合可为与第一集合不相同的集合,第一集合中的媒体内容为播放过的媒体信息,第二集合为未播放过的媒体信息,其相当于根据历史播放情况来选取待播放的第一媒体信息,以便选取出更加受观众欢迎的媒体信息。
在上述实施例中,本发明实施例的媒体信息的选取方法可以由服务器102来执行,也可以由终端104来执行,即上述步骤的执行主体为终端,还可以是由服务器102和终端104共同执行,如由终端为服务器提供日志供服务器执行上述方法,或由服务器为终端提供日志供终端执行上述方法。其中,终端104执行本发明实施例的媒体信息的选取方法也可以是由安装在其上的客户端来执行。
通过上述步骤S202至步骤S206,通过日志信息中记录的访问记录确定目标对象中每个对象的第一特征,并基于目标对象中每个对象的第一特征确定目标对象中的第一对象,然后选取待推送的第一媒体信息,第一媒体信息为信息集合中携带有第一对象的媒体信息,由于这些步骤均是由机器自动执行,从而无需通过线下调研的方式来选取媒体信息,可以解决相关技术中根据用户需求推荐媒体信息的效率较低的技术问题,进而达到快速选取媒体信息的技术效果。
在本申请的上述技术方案中,使用媒体信息的贵宾vip(very important person)帐号(即目标帐号)的产业链数据预测明星(即第一对象)热度;由于这类数据更加隐式化,能够解决比如说水军(在网络中针对特定内容发布特定信息的、被雇佣的网络写手)评论数据等造成的数据偏差,可以更加精确的得到有价值的明星热度内容。
对于获取帐号的访问权限的产业链渠道可以为官方渠道(即目标渠道)和其他非官方渠道。一般而言,官方渠道购买价格相对较贵,而其他非官方渠道的价格相对较为便宜。媒体信息的vip帐号的产业链相比普通数据具有更加专业的形成方式,这类用户对于付费vip有更加直接的诉求,因此在对付费电视剧等和明星热度有直接关系的题材挖掘更加精准,如图8所示,在大盘人群中,通过官方购买的用户相当于已购买人群,通过非官方渠道购买的用户相当于潜客人群,通过本申请的方法通过挖掘已购买人群的观看行为为其推送满足其需求的视频可以进一步巩固这部分人群,通过挖掘潜客人群的观看行为为其推送满足其需求的视频可以吸引其通过官方渠道付费购买。下面结合步骤S202至步骤S206进一步详述本申请的技术方案,需要说明的是,后续以媒体信息为视频,对象为视频中的演员明星为例进行说明,对于其余类型的媒体信息或其余类型的对象,与此类似。
在步骤S202提供的技术方案中,主流视频网站在进行内容购买预研时,或者选取待上线的视频时,如沟通或上线视频、影视剧、娱乐综艺等,需要对视频中明星的热度进行发掘,从根据内容、版权IP(intellectual property)中的明星的热度来对内容、版权IP的购买进行决策,因此,对于明星的热度的精准识别占据着重要的地位,在挖掘明星对象的热度时,服务器可从数据库中获取日志信息,日志信息中记录有对目标媒体信息中的媒体信息的访问记录,目标媒体信息中的媒体信息为携带有目标对象中明星对象的媒体信息。
在步骤S204提供的技术方案中,目标对象包括多个对象,目标媒体信息包括多条媒体信息,在获取到日志信息之后,服务器根据日志信息确定目标对象中每个对象的第一特征,具体地,可先获取日志信息中的目标访问记录,其中,目标访问记录为日志信息中的目标帐号对多条媒体信息的访问记录,也即仅获取充值用户的访问记录;然后根据目标访问记录中记录的对第二媒体信息的访问次数确定多个对象中任一对象的第一特征,其中,第二媒体信息为多条媒体信息中携带有任一对象的媒体信息。
在一个可选的实施例中,步骤S204中的获取日志信息中的目标访问记录包括对日志信息中的每条访问记录执行如下操作:
步骤1,获取日志信息中的第一访问记录,第一访问记录为当前从日志信息中获取的任意一条访问记录,具体的方式可以是随机获取、或者按照从队首到队尾、或从队尾到对首的方式获取。
步骤2,判断第一访问记录与第二访问记录满足目标条件,第二访问记录为目标访问记录中的任意一条访问记录。
上述的目标条件包括:第一访问记录中记录的目标帐号与第二访问记录中记录的帐号相同、且第一访问记录中记录的所访问的媒体信息与第二访问记录中记录的所访问的媒体信息相同,也即查看是否存在相同用户多次访问同一视频的情况。
之所以此处需要设置目标条件,原因有二:其一是由于现在用户的休闲时间趋于碎片化,所以不太可能有较长时间一次性观看完一个视频,虽然用户多次打开同一视频,但是可能是观看同一视频;其二是防止水军恶意刷播放量。
步骤3,在第一访问记录与第二访问记录满足目标条件的情况下,删除第一访问记录。
可选地,若某视频播放时长较长,一次性看不完,需要分为多次才能看完,而有的用户仅观看了其中的一段,而其余用户多次观看的其中不同的视频段,为了区域二者对视频热度的贡献,可以允许记录同一用户的多次播放行为,但是正常用户是不会超过第一阈值(如10次)的,因此,上述的目标条件可转换为:第一访问记录中记录的目标帐号与第二访问记录中记录的帐号相同、第一访问记录中记录的所访问的媒体信息与第二访问记录中记录的所访问的媒体信息相同、且记录同一帐号访问同一媒体信息的访问记录的条数达到第一阈值。
需要说明的是,上述将第一阈值内的记录也即为一条有效的目标记录,是考虑到用户的不同观看时长对视频的贡献,如观看一次十分钟和观看五次共计五十分钟对于这个视频的热度的共享是不同的,能够吸引观众回来继续观看说明这个视频较受欢迎。
步骤4,在第一访问记录与第二访问记录不满足目标条件的情况下,如第一访问记录中记录的目标帐号与第二访问记录中记录的帐号不相同、或第一访问记录中记录的目标帐号与第二访问记录中记录的帐号相同但第一访问记录中记录的所访问的媒体信息与第二访问记录中记录的所访问的媒体信息不相同、或虽然帐号相同且所访问的媒体信息相同但同一帐号访问同一媒体信息的访问记录的条数未达到第一阈值,则将第一访问记录作为一条目标访问记录。
可选地,有的用户观看视频可能仅仅打开看一下就跳过了,而并未实质性地观看该视频,为了过滤此类观看行为,可以在判定目标条件前补入如下判定条件:优先判断读取的第一访问记录中记录的播放时长是否达到目标阈值(如1分钟),若未达到,则当做无效访问行为,若达到再按照上述方式进行判定。
在又一个可选的实施例中,步骤S204中的根据目标访问记录中记录的对第二媒体信息的访问次数确定多个对象中任一对象的第一特征包括以下至少之一:
(1)获取参数之一,目标访问记录中第一类帐号,即灰黑色产业链上数据记录的在第一时间段t内对该对象的访问次数mt(x)(可将目标访问记录中第一类帐号在第一时间段t内对第二媒体信息的访问次数作为对该对象的访问次数),也即通过灰黑色产业链来充值观看的用户对该明星对象所演出的视频的访问次数,这类用户更加能够体现用户诉求。
上述的目标帐号包括在目标渠道,即官方渠道上使用虚拟资源来获得对目标媒体信息中的媒体信息的访问权限的第二类帐号和不是通过在目标渠道,即灰黑色产业链上使用虚拟资源来获得对目标媒体信息中的媒体信息的访问权限的第一类帐号;换言之,本申请可使用媒体信息的媒体信息的贵宾vip帐号(即目标帐号)的灰黑色产业链数据预测明星热度;由于这类数据更加隐式化,能够解决比如说水军评论数据等造成的数据偏差,在对付费电视剧等和明星热度有直接关系的题材挖掘更加精准;同时,vip帐号的灰黑色产业链由于在市场方面的原因,会更加倾向于具有商业化价值的话题,像日常播报娱乐新闻、广告等免费题材很少在这类数据中出现,从而使得明星热度更加倾向具有商业价值的指标。
(2)获取参数之二,上述对象x的上升指数
Figure BDA0001613792010000111
mt-1(x)为目标访问记录中第一类帐号在第二时间段(t-1)内对第二媒体信息的访问次数,第二时间段为在第一时间段之前的时间段,α为上升指数的平滑因子,α的取值可以根据实际需求进行选取,如取值为1、2、5等。
上述第一时间段和第二时间段可以为时间长度相同的时间段,如一周、一个月等,第二时间段可为与第一时间段紧邻的时间段。
(3)获取参数之三,即目标访问记录中第一类帐号和第二类帐号在第一时间段内对该对象的访问次数bt(x)(可将目标访问记录中第一类帐号和第二类帐号在第一时间段内对第二媒体信息的访问次数作为对任一对象的访问次数),也即是所有充值用户对该明星对象所演出的视频的访问次数,可选地,bt(x)除了可包括第一类帐号和第二类帐号在第一时间段内对该对象的访问次数外,还可以非充值用户对第二媒体信息的访问次数。
(4)获取参数之四,上述对象的热度指数
Figure BDA0001613792010000112
β为热度指数的平滑因子,β可以和α相同,也可是区别于α的取值。
使用正面数据会使得一些用户日常需求的明星题材进入热度统计,造成热度偏差,比如说代言广告、娱乐新闻等题材进入热度统计,而本申请使用网络视频vip的产业链的识别数据,分析识别灰黑色产业链中的热点剧集,训练出明星热度智能预测模型(即目标模型),供以运营使用,可以避免上述缺陷。具体地,在步骤S206提供的技术方案中,服务器可按照如下几种方式,基于目标对象中每个对象的第一特征确定目标对象中的第一对象:
(1)方式一,直接根据第一特征的数值进行选取
可以根据上述四个第一特征中的任意一个来进行第一对象的选取,如将所有对象按照第一特征的数值从大到小排列,选取其中第一特征最大的一个或多个对象为第一对象;
可以根据上述四个第一特征中的至少两个来进行第一对象的选取,如计算这至少两个第一特征的数值的平均值,将所有对象按照平均值从大到小排列,选取其中平均值最大的一个或多个对象为第一对象;或为每个第一特征分配相应的权重,然后计算第一特征的数值与相应的权重的乘积,然后将各个第一特征的数值与相应的权重的乘积相加,得到一个用来表示热度的参数,然后将所有对象按照参数从大到小排列,选取其中参数值最大的一个或多个对象为第一对象。
(2)方式二,通过机器学习模型来识别热度
步骤1,将目标对象中每个对象的第一特征归一化处理后作为目标模型的输入,得到目标模型输出的目标对象中每个对象的第一特征参数。
目标模型是使用标注有第二特征参数的第二特征进行训练得到的,第二特征可以是从第三媒体信息中提取的特征(可与第一特征属于相同类型的特征,具体提取方式参见前文),第二特征参数相当于是为第三媒体信息的热点评分;训练完之后的目标模型相当于学习到的特征与热点评分直接的映射关系,第一特征参数就相当于是目标模型对对象的媒体信息的热点评分。
可选地,为了避免单个模型出现欠拟合或过拟合造成热点评分不准确,或者某些模型不适于用于评判特定类型的媒体信息,目标模型可包括多个模型,将目标对象中每个对象的第一特征归一化处理后作为目标模型的输入,得到目标模型输出的目标对象中每个对象的第一特征参数可包括:将目标对象中每个对象的第一特征归一化后分别作为各个模型的输入,得到各个模型输出的多个第三特征参数(每个模型输出一个第三特征参数),并根据多个第三特征参数确定目标对象中每个对象的第一特征参数
Figure BDA0001613792010000131
ki是为多个模型中第i个模型输出的第三特征参数pi配置的权重,n为多个模型的模型个数。
上述的第三特征参数相当于是单个模型输出的热点评分,为了避免上述单个模型出现欠拟合或过拟合造成热点评分不准确,或者某些模型不适于用于评判特定类型的媒体信息这些情况,可以对输出的多个第三特征参数进行比较,求这些第三特征参数的平均值,去除距离平均值较大的(如与平均值的差值的绝对值,超过了平均值的1/Q(Q的取值为整数),如1/3),利用剩下的第三特征参数求取第一特征参数。
可选地,将目标对象中每个对象的第一特征归一化处理后作为目标模型的输入可包括:将目标对象中每个对象的第一特征的特征值与第一特征的历史平均值之间的比值作为目标模型的输入。
对于上述计算得到的4个第一特征,mt(x)、bt(x)、mRatiot(x)、mCondRatiot(x),将4个第一特征标准化,将4个指标变换为:
Figure BDA0001613792010000132
Figure BDA0001613792010000133
μm表示历史时间段内计算得到的多个m(x)的平均值,μmr表示相同时间段内计算得到的多个mRatio(x)的平均值,μb表示相同时间段内计算得到的多个b(x)的平均值,μmc表示相同时间段内计算得到的多个mCondRatio(x)的平均值。
在一个可选的实施例中,上述的目标模型可以为线性回归(linear regression)、决策树(decision tree)、因子分解机回归(factorization machine regression)、神经网络回归(nerual network regression)以及深度学习(deep learning)中的一个或多个。下面以其中部分模型为例进行说明:
(1)线性回归的模型可以如下公式描述:
y=xβ,
其中y表示预测的明星热度,x表示明星当前的4个指标
Figure BDA0001613792010000141
Figure BDA0001613792010000142
的列向量,β也相当于是一个列向量,如4维的列向量(每一位的数值为预先确定好的),从而通过向量乘法可以计算出一个第三特征参数y的数值。
(2)决策树的模型的表现形式如图3所示:
根据4个指标
Figure BDA0001613792010000143
判断走势并得到预测结果,实际上是一棵回归树,表现形式如图3所示:
先判断
Figure BDA0001613792010000144
是否小于参数A(如0.5),若是则第三特征参数y的值为0.56;
否则继续判断
Figure BDA0001613792010000145
是否小于参数B(如0.2),若是则第三特征参数y的值为0.32,否则为0.88。
(3)因子分解机回归的模型可以如下公式描述:
Figure BDA0001613792010000151
其中y表示预测的明星热度(第三特征参数),可以将4个指标
Figure BDA0001613792010000152
Figure BDA0001613792010000153
分别用x1、x2、x3、x4(即xi)表示,vi和vj表示相应指标xi和xj分解出来的向量因子,i和j的取值为1到4,具有具体的数值。
步骤2,根据第一特征参数从目标对象中选取第一对象,第一对象的第一特征参数不小于目标对象中除第一对象以外的对象的第一特征参数,即从中选取出第一特征参数(即热点评分)最大的一个或多个为第一对象。
在步骤S206提供的技术方案中,在选取好第一对象(如演员明星)后,服务器根据第一对象从信息集合中选取待推送的第一媒体信息,第一媒体信息为信息集合中携带有第一对象的媒体信息。
在上述实施例中,若获取的日志信息是记录有在目标平台上对目标媒体信息中的媒体信息的访问记录的日志信息,也即是针对目标平台(如视频应用、视频网站等)获取的其访问记录;那么在根据第一对象从信息集合中选取待在目标平台上推送的第一媒体信息时,可根据第一对象从信息集合中选取待在目标平台上推送的第一媒体信息,信息集合中的媒体信息为未在目标平台上推送过的媒体信息,也即也是在该目标平台上进行媒体信息的推送。
可选地,上述的目标平台可以为一个或多个,也即可以综合几个平台的数据,利用这些数据来评选热点评分较高的明星,进而选取这些明星的视频进行播放;本申请的方法也可以不区分平台,直接根据所有的访问记录来评选热点评分较高的明星,进而选取这些明星的视频进行播放。
在前述实施例中,访问权限包括但不局限于:访问未充值帐号不可访问的媒体信息、可免广告地访问媒体信息,也即此处的访问权限也可间接的理解为充值行为,如某用户观看某个视频时引发了其充值行为,通过统计用户的这种行为数据,可以更好的选出能够诱发用户的充值行为(也即能够满足其喜好)的媒体信息;换言之,本申请不局限于帐号对于明星页面的访问数据;使用场景可以用于任何需要预测热度指数的场景;同时热度也可以替换成收益充值等数据,进行更加直接的预测决策。
作为一种可选的实施例,下面结合更为具体的实施方式详述本申请的实施例。
产品侧方案如图4所示:
产品和运营人员可以通过前端输入限定条件,如选定指定的明星、时间段、视频题材等,系统将提取限定的数据特征使用模型进行热度预测。如果没有条件输入,系统将使用默认的条件进行计算(全量明星、全量vip视频题材、最近半年的时间段等),对结果进行排序,并在前端输出。
同时,产品和运营侧可以根据系统得到的明星热度结果直接进行热度运营以及用于参考版权购买,也可以参考系统结果后人工判断再使用。同时,运营侧也能根据人工判断的标准为系统分析得到的结果进行标记反馈,从而提升机器分析的准确度。
更进一步,如若在运营层面,将明星热度的数据和其运营收入挂钩,热度预测便可以转换成收益预测,这种转换能够让产品和运营侧更加直接的考虑内容运营、购买等决策问题,从而得到更加精细化的产品和运营策略。
技术侧实现如图5所示:
可以利用帐号染色模块来对目标帐号进行分类(包括第一类帐号和第二类帐号),整个系统的精确性可依赖于帐号染色模块的帐号精准分类得到保障。
通过以上的描述可以发现,本方案通过对视频vip产业链染色中积累的灰黑色产业链数据(即日志信息,包括但不局限于:对外服务日志、服务器状态日志、网络流量日志、安全验证日志等)进行分析;在进行数据整理后,进行特征提取、模型训练,并通过灰黑色产业链的用户行为数据进行分析(包括帐号染色),进而进行明星热度的预测,从而得到相应的分析报告。
同时,优化了数据来源,去除噪声数据,运营实时反馈等措施,进行模型调优和数据调优,优化了模型分类效果和性能,比如,全网播放量的统计方式可以针对每个用户增加阈值,即同一个用户对同一个视频的播放最高不能超过10次,防止由于网络、循环播放等因素引起的大批量增加视频播放次数的问题,去掉整天不间断播放的用户的播放记录,防止轮播造成的虚假播放数据,提高了明星热度预测系统的各项指标的准确度。
本方案可同时使用灰黑染色帐号数据与正面帐号播放(评论、付费购买)数据判断明星热点;计算染色帐号相关的vip明星视频访问数量,计算正常帐号相关的vip明星视频访问数量,同时按照不同时间维度给出热度指数:
mt(x),表示x这个明星的视频在时间t被灰黑染色帐号访问的次数;
Figure BDA0001613792010000171
表示x这个明星的在时间t相对于时间t-1的上升指数,其中α是平滑因子;
bt(x),表示x这个明星的视频在时间t的总访问次数;
Figure BDA0001613792010000172
表示x这个明星在时间t内的热度指数;
单独使用mt(x)对不同的明星排序后已经可以得到一些比较不错的头部明星;综合mRatiot(x)指数可以得到更加有潜力的,新型的明星热点数据;根据mCondRatiot(x)指数可以得到一些在平台上面有潜力的并且没有被重视的明星。
通过上述方案可以发掘在全网或外部不太火但是能够吸引用户开通vip的明星题材,有些电视剧在半年前就已经结档了,且明星都是一些比较新的面孔,但是通过vip黑产数据发现这些电视剧仍旧比较受欢迎,有的全网数据规模较大,会掩盖这些信息,但是通过vip黑产数据能够重新发现这些信息。
可选地,可将mt(x)、bt(x)、mRatiot(x)、mCondRatiot(x)作为4个指标特征,抓取历史标注数据,使用回归算法来预测明星热度指数,能够得到更加准确的结果,这里以神经网络为例,如图6所示,神经网络模型可包括输入(如1至t),一个或多个卷基层,一个全连接层,输出层y,下面结合图7说明训练明星热度预测模型的一个过程:
步骤S702,服务器从数据库拉取历史数据。
步骤S704,将专家历史标注的明星热度(第二特征参数)作为明星历史热度,同时计算这些明星在当时的4个指标mt(x)、bt(x)、mRatiot(x)、mCondRatiot(x)。
步骤S706,将4个指标标准化,将4个指标变换为:
Figure BDA0001613792010000181
Figure BDA0001613792010000182
其中μ表示各项指标的历史均值。
步骤S708,训练神经网络模型,将处理好的数据按照历史明星热度进行标注,训练神经网络模型。
这里使用卷积操作对时序数据进行处理,能够更好的获取明星在不同时间上的热度趋势,从而得到更精确的预测模型。
步骤S710,将训练出来的模型供以线上使用,预测明星热度(即第一特征参数)。
模型可以采用成熟的机器学习数值预测算法(即目标模型),也可以自行推导能够具有数据预测性质的训练算法,本案例中,预测算法包括但不限于:线性回归、决策树、因子分解机回归、神经网络回归、深度学习,以及由所有上述算法组合起来的ensemble组合算法(随机森林,gradient boost等)。
步骤S712,根据预测的明星热度选取目标视频,并推送目标视频给终端。
在前述实施例中,虽然以将本申请的技术方案应用于视频应用为例进行描述,但是本申请的技术方案至少还可应用于网页客户端(如图9所示的浏览器的HTML网页)、微博、朋友圈、智能电视、电视盒等场景。
采用本申请的技术方案,发现生成的明星热点不再是简单的依照平台播放量所产生的热度排序;方案往往会给出一些比较有惊喜的明星,这类明星往往不是非常火热的偶像明星,但是其拍摄的电视剧常常具有不错的口碑且付费率也不低,并且,按照这种方式提供素材也能节省大量人力来进行明星热度的分析,提升了决策效率。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种用于实施上述媒体信息的选取方法的媒体信息的选取装置。图10是根据本发明实施例的一种可选的媒体信息的选取装置的示意图,如图10所示,该装置可以包括:
获取单元1001,用于获取日志信息,其中,日志信息中记录有对目标媒体信息的访问记录,目标媒体信息为携带有目标对象的媒体信息;
确定单元1003,用于根据日志信息中记录的目标帐号对目标媒体信息的访问次数确定目标对象的第一特征,其中,目标帐号为通过使用虚拟资源来获得对目标媒体信息的访问权限的帐号;
选取单元1005,用于选取待推送的第一媒体信息,其中,第一媒体信息为携带有第一对象的媒体信息,第一对象为根据第一特征从目标对象中确定的对象。
需要说明的是,该实施例中的获取单元1001可以用于执行本申请实施例中的步骤S202,该实施例中的确定单元1003可以用于执行本申请实施例中的步骤S204,该实施例中的选取单元1005可以用于执行本申请实施例中的步骤S206。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,通过日志信息中记录的访问记录确定目标对象中每个对象的第一特征,并基于目标对象中每个对象的第一特征确定目标对象中的第一对象,然后选取待推送的第一媒体信息,第一媒体信息为信息集合中携带有第一对象的媒体信息,由于这些步骤均是由机器自动执行,从而无需通过线下调研的方式来选取媒体信息,可以解决相关技术中根据用户需求推荐媒体信息的效率较低的技术问题,进而达到快速选取媒体信息的技术效果。
上述的确定单元包括:获取模块,用于获取日志信息中的目标访问记录,其中,目标访问记录为日志信息中的目标帐号对多条媒体信息的访问记录;确定模块,用于根据目标访问记录中记录的对第二媒体信息的访问次数确定多个对象中任一对象的第一特征,其中,第二媒体信息为多条媒体信息中携带有任一对象的媒体信息。
可选地,上述获取模块还用于对日志信息中的每条访问记录执行如下操作:获取日志信息中的第一访问记录,其中,第一访问记录为当前从日志信息中获取的访问记录;在第一访问记录与第二访问记录满足目标条件的情况下,删除第一访问记录,其中,第二访问记录为目标访问记录中的任意一条访问记录,目标条件包括:第一访问记录中记录的目标帐号与第二访问记录中记录的帐号相同、且第一访问记录中记录的所访问的媒体信息与第二访问记录中记录的所访问的媒体信息相同;在第一访问记录与第二访问记录不满足目标条件的情况下,将第一访问记录作为一条目标访问记录。
可选地,上述获取模块可包括:
第一获取子模块,用于获取目标访问记录中第一类帐号在第一时间段t内对该对象的访问次数mt(x),其中,目标帐号包括在目标渠道上使用虚拟资源来获得对目标媒体信息中的媒体信息的访问权限的第二类帐号和不是通过在目标渠道上使用虚拟资源来获得对目标媒体信息中的媒体信息的访问权限的第一类帐号;
第一获取子模块,用于将目标访问记录中第一类帐号在第一时间段t内对第二媒体信息的访问次数作为对任一对象的访问次数mt(x),其中,目标帐号包括在目标渠道上使用虚拟资源来获得对多条媒体信息的访问权限的第二类帐号和不是通过在目标渠道上使用虚拟资源来获得对多条媒体信息的访问权限的第一类帐号;
第二获取子模块,用于获取任一对象x的上升指数
Figure BDA0001613792010000221
其中,mt-1(x)为目标访问记录中第一类帐号在第二时间段(t-1)内对第二媒体信息的访问次数,第二时间段为在第一时间段之前的时间段,α为上升指数的平滑因子;
第三获取子模块,用于将目标访问记录中第一类帐号和第二类帐号在第一时间段内对第二媒体信息的访问次数作为对任一对象的访问次数bt(x);
第四获取子模块,用于获取任一对象的热度指数
Figure BDA0001613792010000222
其中,β为热度指数的平滑因子。
上述的确定单元还用于确定目标对象中的第一对象,可包括:处理模块,用于将目标对象中每个对象的第一特征归一化处理后作为目标模型的输入,得到目标模型输出的目标对象中每个对象的第一特征参数,其中,目标模型是使用标注有第二特征参数的第二特征进行训练得到的;选取模块,用于根据第一特征参数从目标对象中选取第一对象,其中,第一对象的第一特征参数不小于目标对象中除第一对象以外的对象的第一特征参数。
上述的目标模型可包括多个模型,上述处理模块还可用于:将目标对象中每个对象的第一特征归一化后作为多个模型的输入,得到多个模型输出的多个第三特征参数,并根据多个第三特征参数确定目标对象中每个对象的第一特征参数
Figure BDA0001613792010000223
其中,ki是为多个模型中第i个模型输出的第三特征参数pi配置的权重,n为多个模型的模型个数。
上述的处理模块还可用于:将目标对象中每个对象的第一特征的特征值与第一特征的历史平均值之间的比值作为目标模型的输入。
可选地,获取单元还可用于获取记录有在目标平台上对目标媒体信息中的媒体信息的访问记录的日志信息;
选取单元还可用于根据第一对象从信息集合中选取待在目标平台上推送的第一媒体信息,信息集合中的媒体信息为未在目标平台上推送过的媒体信息。
在本申请的上述技术方案中,使用媒体信息的贵宾vip(very important person)帐号(即目标帐号)的产业链数据预测明星(即第一对象)热度;由于这类数据更加隐式化,能够解决比如说水军评论数据等造成的数据偏差,可以更加精确的得到有价值的明星热度内容;同时,媒体信息的vip帐号的产业链相比普通数据具有更加专业的形成方式,这类用户对于付费vip有更加直接的诉求,因此在对付费电视剧等和明星热度有直接关系的题材挖掘更加精准。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本发明实施例的另一个方面,还提供了一种用于实施上述媒体信息的选取方法的服务器或终端。
图11是根据本发明实施例的一种终端的结构框图,如图11所示,该终端可以包括:一个或多个(图11中仅示出一个)处理器1101、存储器1103、以及传输装置1105(如上述实施例中的发送装置),如图11所示,该终端还可以包括输入输出设备1107。
其中,存储器1103可用于存储软件程序以及模块,如本发明实施例中的媒体信息的选取方法和装置对应的程序指令/模块,处理器1101通过运行存储在存储器1103内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的媒体信息的选取方法。存储器1103可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1103可进一步包括相对于处理器1101远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置1105用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1105包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1105为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器1103用于存储应用程序。
处理器1101可以通过传输装置1105调用存储器1103存储的应用程序,以执行下述步骤:
获取日志信息,其中,日志信息中记录有对目标媒体信息的访问记录,目标媒体信息为携带有目标对象的媒体信息;
根据日志信息中记录的目标帐号对目标媒体信息的访问次数确定目标对象的第一特征,其中,目标帐号为通过使用虚拟资源来获得对目标媒体信息的访问权限的帐号;
选取待推送的第一媒体信息,其中,第一媒体信息为携带有第一对象的媒体信息,第一对象为根据第一特征从目标对象中确定的对象。
处理器1101还用于执行下述步骤:
获取日志信息中的第一访问记录,其中,第一访问记录为当前从日志信息中获取的访问记录;
在第一访问记录与第二访问记录满足目标条件的情况下,删除第一访问记录,其中,第二访问记录为目标访问记录中的任意一条访问记录,目标条件包括:第一访问记录中记录的目标帐号与第二访问记录中记录的帐号相同、且第一访问记录中记录的所访问的媒体信息与第二访问记录中记录的所访问的媒体信息相同;
在第一访问记录与第二访问记录不满足目标条件的情况下,将第一访问记录作为一条目标访问记录。
采用本发明实施例,通过日志信息中记录的访问记录确定目标对象中每个对象的第一特征,并基于目标对象中每个对象的第一特征确定目标对象中的第一对象,然后选取待推送的第一媒体信息,第一媒体信息为信息集合中携带有第一对象的媒体信息,由于这些步骤均是由机器自动执行,从而无需通过线下调研的方式来选取媒体信息,可以解决相关技术中根据用户需求推荐媒体信息的效率较低的技术问题,进而达到快速选取媒体信息的技术效果。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图11所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices,MID)、PAD等终端设备。图11其并不对上述电子装置的结构造成限定。例如,终端还可包括比图11中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图11所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行媒体信息的选取方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S12,获取日志信息,其中,日志信息中记录有对目标媒体信息的访问记录,目标媒体信息为携带有目标对象的媒体信息;
S14,根据日志信息中记录的目标帐号对目标媒体信息的访问次数确定目标对象的第一特征,其中,目标帐号为通过使用虚拟资源来获得对目标媒体信息的访问权限的帐号;
S16,选取待推送的第一媒体信息,其中,第一媒体信息为携带有第一对象的媒体信息,第一对象为根据第一特征从目标对象中确定的对象。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:
S22,获取日志信息中的第一访问记录,其中,第一访问记录为当前从日志信息中获取的访问记录;
S24,在第一访问记录与第二访问记录满足目标条件的情况下,删除第一访问记录,其中,第二访问记录为目标访问记录中的任意一条访问记录,目标条件包括:第一访问记录中记录的目标帐号与第二访问记录中记录的帐号相同、且第一访问记录中记录的所访问的媒体信息与第二访问记录中记录的所访问的媒体信息相同;
S26,在第一访问记录与第二访问记录不满足目标条件的情况下,将第一访问记录作为一条目标访问记录。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (13)

1.一种媒体信息的选取方法,其特征在于,包括:
获取日志信息,其中,所述日志信息中记录有对目标媒体信息的访问记录,所述目标媒体信息为携带有目标对象的媒体信息;
根据所述日志信息中记录的目标帐号对所述目标媒体信息的访问次数确定所述目标对象的第一特征,其中,所述目标帐号为通过使用虚拟资源来获得对所述目标媒体信息的访问权限的帐号;
选取待推送的第一媒体信息,其中,所述第一媒体信息为携带有第一对象的媒体信息,所述第一对象为根据所述第一特征从所述目标对象中确定的对象;
所述目标对象包括多个对象,所述目标媒体信息包括多条媒体信息,其中,根据所述日志信息中记录的目标帐号对所述目标媒体信息的访问次数确定所述目标对象的第一特征包括:获取所述日志信息中的目标访问记录,其中,所述目标访问记录为所述日志信息中的所述目标帐号对所述多条媒体信息的访问记录;根据所述目标访问记录中记录的对第二媒体信息的访问次数确定所述多个对象中任一对象的第一特征,其中,所述第二媒体信息为所述多条媒体信息中携带有所述任一对象的媒体信息;
获取所述日志信息中的目标访问记录包括对所述日志信息中的每条访问记录执行如下操作:获取所述日志信息中的第一访问记录,其中,所述第一访问记录为当前从所述日志信息中获取的访问记录;在所述第一访问记录与第二访问记录满足目标条件的情况下,删除所述第一访问记录,其中,所述第二访问记录为所述目标访问记录中的任意一条访问记录,所述目标条件包括:所述第一访问记录中记录的所述目标帐号与所述第二访问记录中记录的帐号相同、所述第一访问记录中记录的所访问的媒体信息与所述第二访问记录中记录的所访问的媒体信息相同,且记录同一帐号访问同一媒体信息的访问记录的条数达到第一阈值。
2.根据权利要求1所述的方法,其特征在于,获取所述日志信息中的目标访问记录包括对所述日志信息中的每条访问记录执行如下操作:
在所述第一访问记录与所述第二访问记录不满足所述目标条件的情况下,将所述第一访问记录作为一条所述目标访问记录。
3.根据权利要求1所述的方法,其特征在于,根据所述目标访问记录中记录的对第二媒体信息的访问次数确定所述多个对象中任一对象的第一特征包括以下至少之一:
将所述目标访问记录中第一类帐号在第一时间段t内对所述第二媒体信息的访问次数作为对所述任一对象的访问次数
Figure DEST_PATH_IMAGE002
,其中,所述目标帐号包括在目标渠道上使用虚拟资源来获得对所述多条媒体信息的访问权限的第二类帐号和不是通过在所述目标渠道上使用虚拟资源来获得对所述多条媒体信息的访问权限的所述第一类帐号;
获取所述任一对象x的上升指数
Figure DEST_PATH_IMAGE004
,其中,
Figure DEST_PATH_IMAGE006
为所述目标访问记录中所述第一类帐号在第二时间段(t-1)内对所述第二媒体信息的访问次数,所述第二时间段为在所述第一时间段之前的时间段,α为上升指数的平滑因子;
将所述目标访问记录中所述第一类帐号和所述第二类帐号在所述第一时间段内对所述第二媒体信息的访问次数作为对所述任一对象的访问次数
Figure DEST_PATH_IMAGE008
获取所述任一对象的热度指数
Figure DEST_PATH_IMAGE010
,其中,β为热度指数的平滑因子。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括按照如下方式确定所述目标对象中的所述第一对象:
将所述目标对象中每个对象的第一特征归一化处理后作为目标模型的输入,得到所述目标模型输出的所述目标对象中每个对象的第一特征参数,其中,所述目标模型是使用标注有第二特征参数的第二特征进行训练得到的;
根据所述第一特征参数从所述目标对象中选取所述第一对象,其中,所述第一对象的所述第一特征参数不小于所述目标对象中除所述第一对象以外的对象的所述第一特征参数。
5.根据权利要求4所述的方法,其特征在于,所述目标模型包括多个模型,其中,将所述目标对象中每个对象的第一特征归一化处理后作为目标模型的输入,得到所述目标模型输出的所述目标对象中每个对象的第一特征参数包括:
将所述目标对象中每个对象的第一特征归一化后作为所述多个模型的输入,得到所述多个模型输出的多个第三特征参数,并根据所述多个第三特征参数确定所述目标对象中每个对象的第一特征参数
Figure DEST_PATH_IMAGE012
,其中,ki是为所述多个模型中第i个模型输出的第三特征参数pi配置的权重,n为所述多个模型的模型个数。
6.根据权利要求4所述的方法,其特征在于,将所述目标对象中每个对象的第一特征归一化处理后作为目标模型的输入包括:
将所述目标对象中每个对象的第一特征的特征值与所述第一特征的历史平均值之间的比值作为所述目标模型的输入。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,
获取日志信息包括:获取记录有在目标平台上对所述目标媒体信息中的媒体信息的访问记录的所述日志信息;
选取待推送的第一媒体信息包括:根据所述第一对象从信息集合中选取待在所述目标平台上推送的第一媒体信息,其中,所述信息集合中的媒体信息为未在所述目标平台上推送过的媒体信息。
8.一种媒体信息的选取装置,其特征在于,包括:
获取单元,用于获取日志信息,其中,所述日志信息中记录有对目标媒体信息的访问记录,所述目标媒体信息为携带有目标对象的媒体信息;
确定单元,用于根据所述日志信息中记录的目标帐号对所述目标媒体信息的访问次数确定所述目标对象的第一特征,其中,所述目标帐号为通过使用虚拟资源来获得对所述目标媒体信息的访问权限的帐号;
选取单元,用于选取待推送的第一媒体信息,其中,所述第一媒体信息为携带有第一对象的媒体信息,所述第一对象为根据所述第一特征从所述目标对象中确定的对象;
所述目标对象包括多个对象,所述目标媒体信息包括多条媒体信息,其中,所述确定单元包括:
获取模块,用于获取所述日志信息中的目标访问记录,其中,所述目标访问记录为所述日志信息中的所述目标帐号对所述多条媒体信息的访问记录;
确定模块,用于根据所述目标访问记录中记录的对第二媒体信息的访问次数确定所述多个对象中任一对象的第一特征,其中,所述第二媒体信息为所述多条媒体信息中携带有所述任一对象的媒体信息;
所述获取模块还用于对所述日志信息中的每条访问记录执行如下操作:获取所述日志信息中的第一访问记录,其中,所述第一访问记录为当前从所述日志信息中获取的访问记录;在所述第一访问记录与第二访问记录满足目标条件的情况下,删除所述第一访问记录,其中,所述第二访问记录为所述目标访问记录中的任意一条访问记录,所述目标条件包括:所述第一访问记录中记录的所述目标帐号与所述第二访问记录中记录的帐号相同、所述第一访问记录中记录的所访问的媒体信息与所述第二访问记录中记录的所访问的媒体信息相同,且记录同一帐号访问同一媒体信息的访问记录的条数达到第一阈值。
9.根据权利要求8所述的装置,其特征在于,所述获取模块还用于对所述日志信息中的每条访问记录执行如下操作:
在所述第一访问记录与所述第二访问记录不满足所述目标条件的情况下,将所述第一访问记录作为一条所述目标访问记录。
10.根据权利要求8所述的装置,其特征在于,所述获取模块包括:
第一获取子模块,用于将所述目标访问记录中第一类帐号在第一时间段t内对所述第二媒体信息的访问次数作为对所述任一对象的访问次数
Figure DEST_PATH_IMAGE013
,其中,所述目标帐号包括在目标渠道上使用虚拟资源来获得对所述多条媒体信息的访问权限的第二类帐号和不是通过在所述目标渠道上使用虚拟资源来获得对所述多条媒体信息的访问权限的所述第一类帐号;
第二获取子模块,用于获取所述任一对象x的上升指数
Figure 776196DEST_PATH_IMAGE004
,其中,
Figure DEST_PATH_IMAGE014
为所述目标访问记录中所述第一类帐号在第二时间段(t-1)内对所述第二媒体信息的访问次数,所述第二时间段为在所述第一时间段之前的时间段,α为上升指数的平滑因子;
第三获取子模块,用于将所述目标访问记录中所述第一类帐号和所述第二类帐号在所述第一时间段内对所述第二媒体信息的访问次数作为对所述任一对象的访问次数
Figure DEST_PATH_IMAGE015
第四获取子模块,用于获取所述任一对象的热度指数
Figure DEST_PATH_IMAGE016
,其中,β为热度指数的平滑因子。
11.根据权利要求8所述的装置,其特征在于,所述确定单元还用于按照如下方式确定所述目标对象中的所述第一对象:
将所述目标对象中每个对象的第一特征归一化处理后作为目标模型的输入,得到所述目标模型输出的所述目标对象中每个对象的第一特征参数,其中,所述目标模型是使用标注有第二特征参数的第二特征进行训练得到的;
根据所述第一特征参数从所述目标对象中选取所述第一对象,其中,所述第一对象的所述第一特征参数不小于所述目标对象中除所述第一对象以外的对象的所述第一特征参数。
12.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序可被终端设备或计算机运行时执行上述权利要求1至7任一项中所述的方法。
13.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序执行上述权利要求1至7任一项中所述的方法。
CN201810276717.7A 2018-03-30 2018-03-30 媒体信息的选取方法和装置、存储介质、电子装置 Active CN110198460B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810276717.7A CN110198460B (zh) 2018-03-30 2018-03-30 媒体信息的选取方法和装置、存储介质、电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810276717.7A CN110198460B (zh) 2018-03-30 2018-03-30 媒体信息的选取方法和装置、存储介质、电子装置

Publications (2)

Publication Number Publication Date
CN110198460A CN110198460A (zh) 2019-09-03
CN110198460B true CN110198460B (zh) 2021-10-15

Family

ID=67751006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810276717.7A Active CN110198460B (zh) 2018-03-30 2018-03-30 媒体信息的选取方法和装置、存储介质、电子装置

Country Status (1)

Country Link
CN (1) CN110198460B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765537B (zh) * 2019-11-01 2024-08-23 中科寒武纪科技股份有限公司 数据处理方法、装置、计算机设备和存储介质
TWI752546B (zh) * 2020-07-09 2022-01-11 多利曼股份有限公司 評估系統及評估方法
CN113468402B (zh) * 2021-05-25 2024-05-17 北京达佳互联信息技术有限公司 目标对象确定方法、装置及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103648031B (zh) * 2013-11-15 2017-01-25 乐视致新电子科技(天津)有限公司 一种智能电视的节目推荐方法及装置
CN106844359A (zh) * 2015-12-04 2017-06-13 深圳富泰宏精密工业有限公司 服务器及其音乐服务系统及方法
CN106407401A (zh) * 2016-09-21 2017-02-15 乐视控股(北京)有限公司 一种视频推荐方法及装置
CN106953935B (zh) * 2017-05-19 2022-05-17 腾讯科技(深圳)有限公司 一种媒体信息推送方法、装置及存储介质
CN107426620B (zh) * 2017-08-31 2020-02-11 江西博瑞彤芸科技有限公司 一种节目内容推荐方法

Also Published As

Publication number Publication date
CN110198460A (zh) 2019-09-03

Similar Documents

Publication Publication Date Title
US20210201349A1 (en) Media and marketing optimization with cross platform consumer and content intelligence
US20200058088A1 (en) Method and system for determining content treatment
CN111178970B (zh) 广告投放的方法及装置、电子设备和计算机可读存储介质
US11030190B2 (en) Experience analytic objects, systems and methods
WO2017096877A1 (zh) 一种推荐方法和装置
US10223438B1 (en) System and method for digital-content-grouping, playlist-creation, and collaborator-recommendation
US11158013B2 (en) Aggregated media rights platform with media item identification across media sharing platforms
US20090271417A1 (en) Identifying User Relationships from Situational Analysis of User Comments Made on Media Content
US20170134181A1 (en) Method and device for data push
CN110198460B (zh) 媒体信息的选取方法和装置、存储介质、电子装置
CN108595492B (zh) 内容的推送方法和装置、存储介质、电子装置
US11769172B2 (en) Display device for transmitting advertisement content and method for controlling same
CN115066906A (zh) 用于基于用户提供的标准进行推荐的方法和系统
CN102216945A (zh) 通过媒体指纹进行联网
CN108876517A (zh) 基于人工智能的用户喜好分析方法及系统
CN113742567A (zh) 一种多媒体资源的推荐方法、装置、电子设备及存储介质
CN115618024A (zh) 多媒体推荐方法、装置及电子设备
CN104871547A (zh) 用于有效地编译用于媒体点播平台的媒体内容项目的方法和系统
KR102547942B1 (ko) 비디오 커머스 시스템에서 숏폼 비디오를 제작하기 위한 동영상 특수 효과를 제공하기 위한 방법 및 장치
Knees et al. Bias and Feedback Loops in Music Recommendation: Studies on Record Label Impact.
KR102673493B1 (ko) 비디오 커머스 시스템에서 블록체인 기술을 이용하여 영상 방송을 판매하기 위한 방법 및 장치
US11849184B2 (en) System for dynamic multimedia analysis, matching and decision-making
CN113676770B (zh) 会员权益预测方法、装置、电子设备及存储介质
CN114996553A (zh) 一种动态视频封面生成方法
KR102184206B1 (ko) 동영상 플랫폼 서비스를 제공하는 서버 및 그 동작 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant