CN110782290A - 媒体文件的处理方法、装置、存储介质和处理器 - Google Patents

媒体文件的处理方法、装置、存储介质和处理器 Download PDF

Info

Publication number
CN110782290A
CN110782290A CN201911032386.3A CN201911032386A CN110782290A CN 110782290 A CN110782290 A CN 110782290A CN 201911032386 A CN201911032386 A CN 201911032386A CN 110782290 A CN110782290 A CN 110782290A
Authority
CN
China
Prior art keywords
target
media file
flow
deep learning
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911032386.3A
Other languages
English (en)
Inventor
孙雨田
李东军
王冉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Yue Meng Mdt Infotech Ltd
Original Assignee
Suzhou Yue Meng Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Yue Meng Mdt Infotech Ltd filed Critical Suzhou Yue Meng Mdt Infotech Ltd
Priority to CN201911032386.3A priority Critical patent/CN110782290A/zh
Publication of CN110782290A publication Critical patent/CN110782290A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0245Surveys
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0273Determination of fees for advertising

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种媒体文件的处理方法、装置、存储介质和处理器。该方法包括:获取目标媒体文件;基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时消耗的目标预估流量,其中,深度学习模型用于通过历史媒体文件的数据,建立不同的媒体文件与不同的媒体文件在投放时所需消耗的预估流量之间的映射关系;获取目标媒体文件在实际投放时消耗的实际流量;基于实际流量和目标预估流量之间的差异量,确定目标媒体文件展现的概率,其中,差异量小于目标阈值。通过本发明,达到了提高媒体文件的投放效率的技术效果。

Description

媒体文件的处理方法、装置、存储介质和处理器
技术领域
本发明涉及媒体文件领域,具体而言,涉及一种媒体文件的处理方法、装置、存储介质和处理器。
背景技术
目前,对于媒体文件的处理,预算平滑的应用可以有效地控制预算超额或预算不能耗尽的情况。相关技术中的预算平滑方式主要有匀速平滑、按照流量模式平滑和按照媒体文件的投放效果进行平滑。其中,匀速平滑使流量按照投放时间平均分布分配,流量模式平滑按照流量的时间分布分配,按照媒体文件的投放效果进行平滑,在投放时设置投放目标,当投放效果偏离投放目标,预算控制模块会反馈给投放系统,调整广告投放的概率或者直接修改广告出价,以使投放效果趋于稳定。
但是,上述对媒体文件的广告预算控制在先验的流量模型做得不够精细,没有根据每个广告主和流量的对应关系进行训练。在投放过程中,预算平滑的动态调整需要一个过程,如果预测结果和实际结果差距较大,可能出现后续的调整较慢,此时间段的广告主预算就被迅速消耗,从而出现很快退出投放的情况,降低了媒体文件的投放效率。
针对现有技术中媒体文件的投放效率低的技术问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种媒体文件的处理方法、装置、存储介质和处理器,以至少解决相关技术中的媒体文件的投放效率低的技术问题。
为了实现上述目的,根据本发明的一个方面,提供了一种媒体文件的处理方法。该方法可以包括:获取目标媒体文件;基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时消耗的目标预估流量,其中,深度学习模型用于通过历史媒体文件的数据,建立不同的媒体文件与不同的媒体文件在投放时所需消耗的预估流量之间的映射关系;获取目标媒体文件在实际投放时消耗的实际流量;基于实际流量和目标预估流量之间的差异量,确定目标媒体文件展现的概率,其中,差异量小于目标阈值。
可选地,在基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时所需消耗的目标预估流量之后,该方法还包括:将目标预估流量缓存至预算平滑模块,其中,预算平滑模块用于将不同的媒体文件的预估流量分配至对应的投放时间段,且控制不同的媒体文件的预估流量保持在流量阈值范围内;基于预算平滑模块,将目标预估流量分配至对应的目标投放时间段,且将目标预估流量控制在流量阈值范围内。
可选地,该方法还包括:在目标媒体文件冷启动的情况下,控制目标媒体文件以低于概率阈值的投放概率进行投放。
可选地,该方法还包括:通过竞价实时交易平台针对目标媒体文件返回的竞价成功标识,对预算平滑模块中存储的目标预估流量进行更新。
可选地,预算平滑模块通过内存存储方式存储目标媒体文件在更新时间段对应的流量消耗数据,通过本地存储方式存储目标媒体文件对应的历史流量消耗数据。
可选地,在基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时所需消耗的目标预估流量之前,该方法还包括:通过历史媒体文件的数据和投放历史媒体文件所需要的流量对子深度学习模型进行训练,得到深度学习模型,其中,历史媒体文件的数据为子深度学习模型的输入,历史媒体文件所需要的流量为深度学习模型的输出。
可选地,历史媒体文件的数据包括以下至少之一:历史媒体文件的特征数据;历史媒体文件的主题数据;历史媒体文件的投放时序数据。
为了实现上述目的,根据本发明的另一方面,还提供了一种媒体文件的处理装置。该装置可以包括:第一获取单元,用于获取目标媒体文件;预估单元,用于基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时消耗的目标预估流量,其中,深度学习模型用于通过历史媒体文件的数据,建立不同的媒体文件与不同的媒体文件在投放时所需消耗的预估流量之间的映射关系;第二获取单元,用于获取目标媒体文件在实际投放时消耗的实际流量;确定单元,用于基于实际流量和目标预估流量之间的差异量,确定目标媒体文件展现的概率,其中,差异量小于目标阈值。
为了实现上述目的,根据本发明的另一方面,还提供了一种存储介质。该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行本发明实施例的媒体文件的处理方法。
为了实现上述目的,根据本发明的另一方面,还提供了一种处理器。该处理器用于运行程序,其中,程序运行时执行本发明实施例的媒体文件的处理方法。
本发明的媒体文件的处理方法,通过获取目标媒体文件;基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时消耗的目标预估流量,其中,深度学习模型用于通过历史媒体文件的数据,建立不同的媒体文件与不同的媒体文件在投放时所需消耗的预估流量之间的映射关系;获取目标媒体文件在实际投放时消耗的实际流量;基于实际流量和目标预估流量之间的差异量,确定目标媒体文件展现的概率,其中,差异量小于目标阈值。也就是说,本发明基于通过历史媒体文件的数据训练得到的深度学习模型,对输入的目标媒体文件进行预估,准确得到在投放目标媒体文件时所需要消耗目标流量,这样实际流量和离线训练模型中目标预估流量的差异量就小,计算此条广告展现的概率,可以避免出现媒体文件很快退出投放的情况,从而提高了媒体文件的投放效率,解决了相关技术中的媒体文件的投放效率低的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种媒体文件的处理方法的流程图;
图2是根据相关技术中的一种基于概率的节流的方法的流程图;
图3是根据相关技术中的一种修改出价的方法的流程图;
图4是根据本发明实施例的一种媒体文件的处理的示意图;以及
图5是根据本发明实施例的一种媒体文件的处理装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
本发明实施例提供了一种媒体文件的处理方法。
图1是根据本发明实施例的一种媒体文件的处理方法的流程图。如图1所示,该方法可以包括以下步骤:
步骤S102,获取目标媒体文件。
在本发明上述步骤S102提供的技术方案中,目标媒体文件可以为广告,广告投放系统可以通过向服务器发送请求来获取到上述目标媒体文件。
步骤S104,基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时消耗的目标预估流量,其中,深度学习模型用于通过历史媒体文件的数据,建立不同的媒体文件与不同的媒体文件在投放时所需消耗的预估流量之间的映射关系。
在本发明上述步骤S104提供的技术方案中,在该实施例中,在获取到目标媒体文件之后,可以将目标媒体文件输入至预先训练好的深度学习模型中,该深度学习模型为采用深度学习的方法训练出的用于进行流量模式预测的流量模型,可以通过采集到的大量的历史媒体文件的数据进行训练,从而建立不同的媒体文件与不同的媒体文件在实际投放时所需消耗的预估流量之间的映射关系,这样深度学习模型可以对输入的目标媒体文件进行处理,从而准确预估出目标媒体文件在投放时在每个时间段所需消耗的目标预估流量,该预估流量也即广告主投放广告预估的花费,为预估结果。
步骤S106,获取目标媒体文件在实际投放时消耗的实际流量。
在本发明上述步骤S106提供的技术方案中,获取目标媒体文件在实际投放时消耗的流量,可以是向服务器发送请求,从媒体文件数据库中请求召回合适的多个媒体文件和排序,可以对多个媒体文件按照预设条件进行过滤,得到目标媒体文件,其中,预设条件可以为创意素材、出价、预估点击率、预估转化率的条件。该实施例可以获取目标媒体文件在实际投放时所消耗的流量,实际投放时所消耗的流量为广告主对目标媒体文件在投放时的真实花费,也即,为实际结果,用于和上述由深度学习模型得到的目标预估结果进行对比。
步骤S108,基于实际流量和目标预估流量之间的差异量,确定目标媒体文件展现的概率,其中,差异量小于目标阈值。
在本发明上述步骤S108提供的技术方案中,在获取目标媒体文件在实际投放时消耗的实际流量之后,可以通过预算平滑模块将目标媒体文件的实际流量和目标预估流量进行对比,得到实际流量和目标预估流量之间的差异量。由于深度学习模型可以准确预估目标媒体文件在投放时所需要的目标预估流量,因而目标媒体文件在投放时所消耗的实际流量和预估流量之间的差异量小于目标阈值,该目标阈值用于衡量差异量小的临界值。在获取目标媒体文件在投放时所消耗的实际流量和预估流量之间的差异量之后,可以基于该差异量计算目标媒体文件展现的概率。
需要说明的是,该实施例对媒体文件的类型不做具体限定,该媒体文件可以是视频文件、音频文件、图片文件或者文本文件等,也可以是这几种文件的任意组合,例如,文本文件和图片文件的组合,视频文件和文本文件的组合。具体的产品形态可以是例如视频广告、原生广告、搜索广告等。
通过上述步骤S102至步骤S108,通过获取目标媒体文件;基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时消耗的目标预估流量,其中,深度学习模型用于通过历史媒体文件的数据,建立不同的媒体文件与不同的媒体文件在投放时所需消耗的预估流量之间的映射关系;获取目标媒体文件在实际投放时消耗的实际流量;基于实际流量和目标预估流量之间的差异量,确定目标媒体文件展现的概率,其中,差异量小于目标阈值。也就是说,基于通过历史媒体文件的数据训练得到的深度学习模型,对输入的目标媒体文件进行预估,准确得到在投放目标媒体文件时所需要消耗目标流量,这样实际流量和离线训练模型中目标预估流量的差异量就小,计算此条广告展现的概率,可以避免出现媒体文件很快退出投放的情况,从而提高了媒体文件的投放效率,解决了相关技术中的媒体文件的投放效率低的技术问题。
下面对该实施例的上述方法进行进一步地说明。
作为一种可选的实施方式,在步骤S104,基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时所需消耗的目标预估流量之后,该方法还包括:将目标预估流量缓存至预算平滑模块,其中,预算平滑模块用于将不同的媒体文件的预估流量分配至对应的投放时间段,且控制不同的媒体文件的预估流量保持在流量阈值范围内;基于预算平滑模块,将目标预估流量分配至对应的目标投放时间段,且将目标预估流量控制在流量阈值范围内。
在该实施例中,由于不能在第一时间获取目标媒体文件在实际投放时所需消耗的实际流量,因而该实施例在基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时所需消耗的目标预估流量之后,可以将目标预估流量先缓存至预算平滑模块的数据库中,该预算平滑模块用于将不同的媒体文件的预估流量分配至对应的投放时间段,且控制不同的媒体文件的预估流量保持在流量阈值范围内,以防预估流量过大,可以保证媒体文件平台延迟返回不会超过预算的情况,还可以避免预算不能耗尽的情况,从而使用该预算平滑模块达到了将目标预估流量分配至对应的目标投放时间段,且将目标预估流量控制在流量阈值范围内的目的。
可选地,该实施例的上述预算平滑模块统计已有投放的媒体文件,可以结合深度学习模型得到预估投放比例以及广告投放比例。
作为一种可选的实施方式,该方法还包括:在目标媒体文件冷启动的情况下,控制目标媒体文件以低于概率阈值的投放概率进行投放。
在该实施例中,目标媒体文件可以为没有先验数据的媒体文件,在目标媒体文件冷启动的时候,可以控制目标媒体文件慢启动,为目标媒体文件设定一个较低的概率阈值,控制目标媒体文件以低于概率阈值的投放概率进行投放,以防流量过大超过预算,同时方便后续对目标媒体文件的动态调整。
作为一种可选的实施方式,该方法还包括:通过竞价实时交易平台针对目标媒体文件返回的竞价成功标识,对预算平滑模块中存储的目标预估流量进行更新。
在该实施例中,在将目标预估流量缓存至预算平滑模块,直至通过竞价实时交易平台(ADX)针对目标媒体文件返回的竞价成功标识(win-notice),对预算平滑模块中存储的目标预估流量进行更新,可以通过竞价成功标识覆盖掉目标预估流量。
作为一种可选的实施方式,预算平滑模块通过内存存储方式存储目标媒体文件在更新时间段对应的流量消耗数据,通过本地存储方式存储目标媒体文件对应的历史流量消耗数据。
在该实施例中,预算平滑模块的数据存储可以采用内存存储方式(redis)和本地存储方式(rocksdb),预算平滑模块通过内存存储方式存储目标媒体文件在更新时间段对应的流量消耗数据,比如,正在更新时间段的广告主花费会从redis中读取。该实施例的预算平滑模块还可以通过本地存储方式存储目标媒体文件对应的历史流量消耗数据,其中,历史流量消耗数据为不会修改的历史花费数据,其采用了rocksdb的本地存储方式。
该实施例上述内存存储方式和本地存储方式的响应速度都可以在1毫秒以下,从而保证了投放系统的运行效率。
作为一种可选的实施方式,在基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时所需消耗的目标预估流量之前,该方法还包括:通过历史媒体文件的数据和投放历史媒体文件所需要的流量对子深度学习模型进行训练,得到深度学习模型,其中,历史媒体文件的数据为子深度学习模型的输入,历史媒体文件所需要的流量为深度学习模型的输出。
在该实施例中,在基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时所需消耗的目标预估流量之前,预先训练深度学习模型。该实施例可以采集大量的历史媒体文件的数据以及在投放历史媒体文件所需要的流量对子深度学习模型进行训练,其中,大量的历史媒体文件的数据也即过去统计的数据,子深度学习模型为初始建立的神经网络模型,可以为长短记忆网络(Long Short-Term Memory,简称为LSTM)模型,可以历史媒体文件的数据以及在投放历史媒体文件所需要的流量对子深度学习模型进行训练,得到模型参数,然后通过模型参数和子深度学习模型共同建立深度学习模型,以得到可以准确输出不同的媒体文件的预估流量的深度学习模型。
可选地,该实施例的上述深度学习模型可以输出目标媒体文件计划在下个阶段的应投放的流量比例。
作为一种可选的实施方式,历史媒体文件的数据包括以下至少之一:历史媒体文件的特征数据;历史媒体文件的主题数据;历史媒体文件的投放时序数据。
在该实施例中,历史媒体文件的数据可以包括历史媒体文件的特征数据,比如,为竞价词、人群定向等条件;还可以为历史媒体文件的主题数据,比如,为历史媒体文件的投放主题;还可以为历史媒体文件的投放时序数据等,以使训练出的深度学习模型可以提高整体的媒体文件转化为投放目标的概率。其中,投放目标可以为预计每次点击费用(Estimated cost per click,简称为eCPC)或者每次操作和获取的有效成本(EffectiveCost Per Action or Acquisition,简称为eCPA)。
该实施例基于通过历史媒体文件的数据训练得到的深度学习模型,对输入的目标媒体文件进行预估,准确得到在投放目标媒体文件时所需要消耗目标流量,这样实际流量和离线训练模型中目标预估流量的差异量就小,计算此条广告展现的概率,可以避免出现媒体文件很快退出投放的情况;该实施例的媒体文件的处理方法更可以应用在媒体文件的投放系统中,在低耦合的情况下,保持了原有广告投放系统的快速响应和高可用,提高了用户流量模型的先验准确性;该实施例对返回时目标预估流量进行缓存,保证广告平台延迟返回不会让用户预算超额;线下的深度学习模型拟合了现实中的流量分布以达到人群更大的覆盖面积,通过基于投放目标的动态调整,广告主可以通过更小的流量达到对媒体文件进行更好地投放,从而提高了媒体文件的投放效率,进而解决了相关技术中的媒体文件的投放效率低的技术问题。
实施例2
下面结合优选的实施方式对本发明实施例的目标对象的媒体文件的处理方法进行举例说明,具体以媒体文件为广告进行举例说明。
目前,广告行业正处于高速发展的阶段,互联网广告的整体占比提升,在规模上保持两位数的增长。但是,就整体而言,互联网广告已进入了存量时代,出现诸多广告竞价实时交易平台(ADX)以及需求方平台(DSP),竞争日趋激烈。预算平滑是ADX和DSP中重要的组成部分,用于将广告主的预算按照一定的方式分配到不同的时段,可以将流量有效地覆盖到更多人群,从而减少广告主之间的竞争。
由于实时竞价模式(Real time Bidding,简称为RTB)返回给DSP的竞价成功标识(win-notice)有延迟,如果对其控制不当,在投放过程中就会出现广告主预算花费超额的情况。由于广告主之间的竞争也会导致一些广告主的预算无法耗尽,而通过预算平滑的应用能够有效地控制预算超额或预算不能耗尽的情况。
相关技术中的预算平滑方式主要有匀速平滑、按照流量模式平滑和按照广告投放效果平滑。匀速平滑使流量按照投放时间平均分布分配,而流量模式平滑按照流量的时间分布分配,按照广告投放效果平滑为在投放时设置投放目标,当投放效果偏离投放目标,则预算控制模块会反馈给投放系统,调整广告投放的概率或者直接修改广告出价,以使投放效果趋于稳定。
图2是根据相关技术中的一种基于概率的节流的方法的流程图。如图2所示,发送请求,获得广告的返回率,基于返回率进行广告投放设置,得到竞价,可以请求根据竞价得到竞得率,还可以基于返回率计算得到广告调整率,最终根据调整率和竞得率计算得到预算花费,该预算花费可以用于进一步对调整率进行调整,从而实现了基于概率的节流目的。
图3是根据相关技术中的一种修改出价的方法的流程图。如图3所示,发送请求,获得广告的返回率,基于返回率进行广告投放设置,得到竞价,可以请求根据竞价得到竞得率,根据竞得率得到预算花费,该预算花费可以用于对竞价进行进一步调整,达到了修改出价的目的。
在对广告进行处理的方法中,现有的广告预算控制在先验的流量模型还不够精细,没有根据每个广告主和流量的对应进行训练。在投放过程中,预算平滑的动态调整需要一个过程。如果预估结果和实际结果之间的差距较大,则可能会出现后续的调整较慢,此时间段的广告主预算被迅速消耗的情况,从而导致广告很快退出投放的问题。
针对上述问题,该实施例提出一种基于深度学习的流量模型,以较为精准地预测出用户每个时间段的流量,使得广告得以更精细化地进行投放。
图4是根据本发明实施例的一种媒体文件的处理的示意图。如图4所示,在投放系统中,广告请求会先从广告库召回合适的广告和排序,随后根据创意素材,出价、预估点击率、预估转化率等多条件等对召回的广告进行过滤。在对召回的广告进行过滤的过程中,预算平滑模块会根据实际结果和由流量模型对广告进行预估得到的预估结果之间的差异,计算此条广告展现的概率,进而确定广告出价,还可以调整广告出价,调整后的广告出价可以进一步在预算平滑模块中进行处理。
该实施例的预算平滑模块的数据存储采用了redis的内存存储和rocksdb的本地文件存储。可选地,正在更新时间段的广告主花费会从redis读取,而不会修改的历史花费数据可以采用rocksdb的本地存储方式,上述两者的响应速度都可以在1毫秒以下,从而保证了投放系统的运行效率。
由于不能在第一时间获取广告主的真实花费,该实施例可以将广告返回时的预估结果会被缓存至预算平滑数据库,直至后续广告竞价实时交易平台ADX真实的竞价成功标识返回将预估数据进行更新。
该实施例在预算平滑模块中统计已有投放,结合训练出的流量模型得到预估投放比例以及广告投放比例。没有先验数据的广告在冷启动的时候,会进行慢启动,给予广告一个较低的广告投放概率,以防流量过大超过预算,同时也方便后续的动态调整。
在该实施例中,在离线的流量模型中,可以采用深度学习的方法进行流量模式预测。可选地,使用过去的统计数据,输入广告特征如竞价词、人群定向等条件、投放主题、时序等数据,已提高整体广告转化为目标(比如,eCPA,eCPC),输出广告计划在下个阶段的应投放的流量比例,使用长短记忆网络(LSTM)训练深度学习模型,以得到较为准确的预估结果。
该实施例的投放系统在低耦合的情况下,保持了原有广告系统的快速响应和高可用,提高了用户流量模型的先验准确性;系统对返回时预估结果的缓存可以保证广告平台延迟返回不会让用户预算超额;线下的流量模型拟合了现实中流量分布以达到人群更大的覆盖面积;通过基于投放目标的动态调整,广告主可能通过更小的流量达到更好的投放效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例3
本发明实施例还提供了一种媒体文件的处理装置。需要说明的是,该实施例的媒体文件的处理装置可以用于执行本发明实施例的媒体文件的处理方法。
图5是根据本发明实施例的一种媒体文件的处理装置的示意图。如图5所示,该媒体文件的处理装置50可以包括:第一获取单元51、预估单元52、第二获取单元53和确定单元54。
第一获取单元51,用于获取目标媒体文件。
预估单元52,用于基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时消耗的目标预估流量,其中,深度学习模型用于通过历史媒体文件的数据,建立不同的媒体文件与不同的媒体文件在投放时所需消耗的预估流量之间的映射关系。
第二获取单元53,用于获取目标媒体文件在实际投放时消耗的实际流量。
确定单元54,用于基于实际流量和搜书目标预估流量之间的差异,确定目标媒体文件展现的概率。
可选地,该装置还包括:缓存单元,用于在基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时所需消耗的目标预估流量之后,将目标预估流量缓存至预算平滑模块,其中,预算平滑模块用于将不同的媒体文件的预估流量分配至对应的投放时间段,且控制不同的媒体文件的预估流量保持在流量阈值范围内;分配模块,用于基于预算平滑模块,将目标预估流量分配至对应的目标投放时间段,且将目标预估流量控制在流量阈值范围内。
可选地,该装置还包括:控制单元,用于在目标媒体文件冷启动的情况下,控制目标媒体文件以低于概率阈值的投放概率进行投放。
可选地,该装置还包括:更新单元,用于通过竞价实时交易平台针对目标媒体文件返回的竞价成功标识,对预算平滑模块中存储的目标预估流量进行更新。
可选地,预算平滑模块通过内存存储方式存储目标媒体文件在更新时间段对应的流量消耗数据,通过本地存储方式存储目标媒体文件对应的历史流量消耗数据。
可选地,该装置还包括:训练单元,用于在基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时所需消耗的目标预估流量之前,通过历史媒体文件的数据和投放历史媒体文件所需要的流量对子深度学习模型进行训练,得到深度学习模型,其中,历史媒体文件的数据为子深度学习模型的输入,历史媒体文件所需要的流量为深度学习模型的输出。
可选地,历史媒体文件的数据包括以下至少之一:历史媒体文件的特征数据;历史媒体文件的主题数据;历史媒体文件的投放时序数据。
在该实施例中,通过第一获取单元51获取目标媒体文件;通过预估单元52基于深度学习模型,对目标媒体文件进行预估,得到目标媒体文件在投放时消耗的目标预估流量,其中,深度学习模型用于通过历史媒体文件的数据,建立不同的媒体文件与不同的媒体文件在投放时所需消耗的预估流量之间的映射关系;通过第二获取单元53获取目标媒体文件在实际投放时消耗的实际流量;通过确定单元54基于实际流量和搜书目标预估流量之间的差异,确定目标媒体文件展现的概率。也就是说,本发明基于通过历史媒体文件的数据训练得到的深度学习模型,对输入的目标媒体文件进行预估,准确得到在投放目标媒体文件时所需要消耗目标流量,这样实际流量和离线训练模型中目标预估流量的差异量就小,计算此条广告展现的概率,可以避免出现媒体文件很快退出投放的情况,从而提高了媒体文件的投放效率,解决了相关技术中的媒体文件的投放效率低的技术问题。
实施例4
根据本发明的另一方面,还提供了一种存储介质。该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行本发明实施例的媒体文件的处理方法。
实施例5
为了实现上述目的,根据本发明的另一方面,还提供了一种处理器。该处理器用于运行程序,其中,程序运行时执行本发明实施例的媒体文件的处理方法。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种媒体文件的处理方法,其特征在于,包括:
获取目标媒体文件;
基于深度学习模型,对所述目标媒体文件进行预估,得到所述目标媒体文件在投放时消耗的目标预估流量,其中,所述深度学习模型用于通过历史媒体文件的数据,建立不同的媒体文件与所述不同的媒体文件在投放时所需消耗的预估流量之间的映射关系;
获取所述目标媒体文件在实际投放时消耗的实际流量;
基于所述实际流量和所述目标预估流量之间的差异量,确定所述目标媒体文件展现的概率,其中,所述差异量小于目标阈值。
2.根据权利要求1所述的方法,其特征在于,在基于深度学习模型,对所述目标媒体文件进行预估,得到所述目标媒体文件在投放时所需消耗的目标预估流量之后,所述方法还包括:
将所述目标预估流量缓存至预算平滑模块,其中,所述预算平滑模块用于将所述不同的媒体文件的预估流量分配至对应的投放时间段,且控制所述不同的媒体文件的预估流量保持在流量阈值范围内;
基于所述预算平滑模块,将所述目标预估流量分配至对应的目标投放时间段,且将所述目标预估流量控制在所述流量阈值范围内。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在所述目标媒体文件冷启动的情况下,控制所述目标媒体文件以低于概率阈值的投放概率进行投放。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
通过竞价实时交易平台针对所述目标媒体文件返回的竞价成功标识,对所述预算平滑模块中存储的所述目标预估流量进行更新。
5.根据权利要求2所述的方法,其特征在于,所述预算平滑模块通过内存存储方式存储所述目标媒体文件在更新时间段对应的流量消耗数据,通过本地存储方式存储所述目标媒体文件对应的历史流量消耗数据。
6.根据权利要求1至5中任意一项所述的方法,其特征在于,在基于深度学习模型,对所述目标媒体文件进行预估,得到所述目标媒体文件在投放时所需消耗的目标预估流量之前,所述方法还包括:
通过所述历史媒体文件的数据和投放所述历史媒体文件所需要的流量对子深度学习模型进行训练,得到所述深度学习模型,其中,所述历史媒体文件的数据为所述子深度学习模型的输入,所述历史媒体文件所需要的流量为所述深度学习模型的输出。
7.根据权利要求6所述的方法,其特征在于,历史媒体文件的数据包括以下至少之一:
所述历史媒体文件的特征数据;
所述历史媒体文件的主题数据;
所述历史媒体文件的投放时序数据。
8.一种媒体文件的投放装置,其特征在于,包括:
第一获取单元,用于获取目标媒体文件;
预估单元,用于基于深度学习模型,对所述目标媒体文件进行预估,得到所述目标媒体文件在投放时消耗的目标预估流量,其中,所述深度学习模型用于通过历史媒体文件的数据,建立不同的媒体文件与所述不同的媒体文件在投放时所需消耗的预估流量之间的映射关系;
第二获取单元,用于获取所述目标媒体文件在实际投放时消耗的实际流量;
确定单元,用于基于所述实际流量和所述目标预估流量之间的差异量,确定所述目标媒体文件展现的概率,其中,所述差异量小于目标阈值。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的方法。
CN201911032386.3A 2019-10-28 2019-10-28 媒体文件的处理方法、装置、存储介质和处理器 Pending CN110782290A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911032386.3A CN110782290A (zh) 2019-10-28 2019-10-28 媒体文件的处理方法、装置、存储介质和处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911032386.3A CN110782290A (zh) 2019-10-28 2019-10-28 媒体文件的处理方法、装置、存储介质和处理器

Publications (1)

Publication Number Publication Date
CN110782290A true CN110782290A (zh) 2020-02-11

Family

ID=69387126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911032386.3A Pending CN110782290A (zh) 2019-10-28 2019-10-28 媒体文件的处理方法、装置、存储介质和处理器

Country Status (1)

Country Link
CN (1) CN110782290A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112258207A (zh) * 2020-06-16 2021-01-22 北京沃东天骏信息技术有限公司 一种广告流量确定方法、装置、设备及存储介质
CN113450131A (zh) * 2020-12-30 2021-09-28 北京新氧科技有限公司 内容投放控制方法、装置及设备
CN113743703A (zh) * 2021-02-03 2021-12-03 北京沃东天骏信息技术有限公司 一种信息处理方法及装置、存储介质
CN113807897A (zh) * 2021-09-26 2021-12-17 北京沃东天骏信息技术有限公司 参竞控制方法、系统和存储介质
CN116647601A (zh) * 2023-07-26 2023-08-25 北京创智汇聚科技有限公司 基于填充率动态调整推广内容请求量的方法及系统
CN117094774A (zh) * 2023-10-19 2023-11-21 北京搜狐新媒体信息技术有限公司 一种广告投放速率控制方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120158456A1 (en) * 2010-12-20 2012-06-21 Xuerui Wang Forecasting Ad Traffic Based on Business Metrics in Performance-based Display Advertising
CN106096999A (zh) * 2016-06-02 2016-11-09 腾讯科技(深圳)有限公司 媒体文件的投放方法和装置
CN108427708A (zh) * 2018-01-25 2018-08-21 腾讯科技(深圳)有限公司 数据处理方法、装置、存储介质和电子装置
CN109559147A (zh) * 2018-10-11 2019-04-02 北京奇虎科技有限公司 广告流量的预估方法、装置、服务器及可读存储介质
CN110110201A (zh) * 2018-01-09 2019-08-09 苏州跃盟信息科技有限公司 一种内容推荐方法和系统
CN110348908A (zh) * 2019-07-15 2019-10-18 西安点告网络科技有限公司 广告投放预算控制方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120158456A1 (en) * 2010-12-20 2012-06-21 Xuerui Wang Forecasting Ad Traffic Based on Business Metrics in Performance-based Display Advertising
CN106096999A (zh) * 2016-06-02 2016-11-09 腾讯科技(深圳)有限公司 媒体文件的投放方法和装置
CN110110201A (zh) * 2018-01-09 2019-08-09 苏州跃盟信息科技有限公司 一种内容推荐方法和系统
CN108427708A (zh) * 2018-01-25 2018-08-21 腾讯科技(深圳)有限公司 数据处理方法、装置、存储介质和电子装置
CN109559147A (zh) * 2018-10-11 2019-04-02 北京奇虎科技有限公司 广告流量的预估方法、装置、服务器及可读存储介质
CN110348908A (zh) * 2019-07-15 2019-10-18 西安点告网络科技有限公司 广告投放预算控制方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112258207A (zh) * 2020-06-16 2021-01-22 北京沃东天骏信息技术有限公司 一种广告流量确定方法、装置、设备及存储介质
CN113450131A (zh) * 2020-12-30 2021-09-28 北京新氧科技有限公司 内容投放控制方法、装置及设备
CN113743703A (zh) * 2021-02-03 2021-12-03 北京沃东天骏信息技术有限公司 一种信息处理方法及装置、存储介质
CN113807897A (zh) * 2021-09-26 2021-12-17 北京沃东天骏信息技术有限公司 参竞控制方法、系统和存储介质
CN116647601A (zh) * 2023-07-26 2023-08-25 北京创智汇聚科技有限公司 基于填充率动态调整推广内容请求量的方法及系统
CN116647601B (zh) * 2023-07-26 2023-09-29 北京创智汇聚科技有限公司 基于填充率动态调整推广内容请求量的方法及系统
CN117094774A (zh) * 2023-10-19 2023-11-21 北京搜狐新媒体信息技术有限公司 一种广告投放速率控制方法及装置
CN117094774B (zh) * 2023-10-19 2024-03-08 北京搜狐新媒体信息技术有限公司 一种广告投放速率控制方法及装置

Similar Documents

Publication Publication Date Title
CN110782290A (zh) 媒体文件的处理方法、装置、存储介质和处理器
US11288702B1 (en) Exploration in a real time messaging platform
US11409717B1 (en) Overspend control in a messaging platform
US9892431B1 (en) Temporal features in a messaging platform
Xu et al. Smart pacing for effective online ad campaign optimization
US11010794B2 (en) Methods for viewer modeling and bidding in an online advertising campaign
CN105074743B (zh) 向移动客户端分派广告的方法和装置
CN105306539B (zh) 业务信息展现控制方法、装置和互联网业务信息显示平台
US10769677B1 (en) Temporal features in a messaging platform
US20170358000A1 (en) Intraday modeling to adjust online ad distribution
CN108269109A (zh) 一种广告排期投放量均衡方法及装置
CN108932627B (zh) Cpa广告的消耗速度的预估方法、装置及可读存储介质
CN110969490A (zh) 一种广告投放方法和装置
CN109615442A (zh) 基于激励视频广告的rtb实时竞价方法
US20100185484A1 (en) Allocation of internet advertising inventory
CN111553740B (zh) 流量分配方法及装置、电子设备、计算机存储介质
CN107025575A (zh) 程序化广告投放中品牌客户kpi预估方法
US20100185515A1 (en) Allocation of internet advertising inventory
CN114066532A (zh) 服务器及广告投放控量方法
CN115018528A (zh) 一种任务推送方法、装置及电子设备
US20130085862A1 (en) System and method for distributing advertisements on a network in accordance with a tiered periodic delivery goal
US20210272152A1 (en) Managing impressions of an advertisement campaign
CN117094774B (zh) 一种广告投放速率控制方法及装置
US20100185485A1 (en) Allocation of internet advertising inventory
US11475478B2 (en) Location-specific digital media advertising

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200211