CN113312582B - 一种媒体数据投放方法 - Google Patents
一种媒体数据投放方法 Download PDFInfo
- Publication number
- CN113312582B CN113312582B CN202110882288.XA CN202110882288A CN113312582B CN 113312582 B CN113312582 B CN 113312582B CN 202110882288 A CN202110882288 A CN 202110882288A CN 113312582 B CN113312582 B CN 113312582B
- Authority
- CN
- China
- Prior art keywords
- conversion rate
- media data
- target
- actual
- available data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0243—Comparative campaigns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Economics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请涉及一种媒体数据投放方法,由媒体数据投放端和实际转化率检测端分别地承担一定程度的数据处理职能,媒体数据投放端在行使其数据处理职能时涉及的部分数据不会泄露至实际转化率检测端,该部分数据例如确定中间转化率时采用的可用数据。实际转化率检测端在行使其数据处理职能时,可以在不直接地接触到可用数据的情况下,检测出目标触点的实际转化率,有利于实现隐私保护。在此基础之上,基于目标触点的实际转化率,进行媒体数据的投放,有利于解决现有技术中存在的投放的媒体数据难以实现预期的转化效果的问题。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种媒体数据投放方法。
背景技术
随着互联网技术的发展,数据的量日益增多,每天都有大量的数据向投放对象投放,向投放对象投放的各数据中,可能包括媒体数据。
媒体数据的投放者向投放对象投放媒体数据的目的是希望通过投放对象对媒体数据的操作,实现媒体数据对应的转化效果。为实现该目的,媒体数据的投放者多预先的对触点进行部署,使得投放对象在接触到触点时,能够对媒体数据执行操作。
发明内容
本申请提供了一种媒体数据投放方法,以解决现有技术中存在的投放的媒体数据难以实现预期的转化效果的问题。
第一方面,本申请提供了第一种该方法应用于媒体数据投放端,该方法包括:确定目标触点,目标触点用于表征媒体数据的投放对象的至少部分属性;根据可用数据集合中的可用数据,确定中间转化率,其中,可用数据用于从若干个维度对目标触点进行表征;将中间转化率,发送至实际转化率检测端,其中,中间转化率与指定比例正相关,指定比例是可用数据集合中的可用数据对应的投放对象中,针对媒体数据执行指定处理方式的投放对象的比例;根据实际转化率检测端返回的目标触点的实际转化率,投放媒体数据。
在本说明书一个可选的实施例中,维度包括以下至少一种:媒体数据的投放渠道、投放媒体数据的地理位置、接收媒体数据的投放对象的属性。
在本说明书一个可选的实施例中,指定处理方式包括以下至少一种:观看媒体数据、点击媒体数据对应的控件、根据媒体数据执行下单。
在本说明书一个可选的实施例中,根据可用数据集合中的可用数据,确定中间转化率之前,该方法还包括:确定维度之一,作为目标维度;根据目标维度对可用数据进行采样,得到可用数据集合。
在本说明书一个可选的实施例中,将中间转化率,发送至实际转化率检测端之前,该方法还包括:针对可用数据表示出的每个投放对象,确定投放对象的目标触点时序图,其中,目标触点时序图表示出投放对象经历各目标触点、投放对象经历各目标触点的次序、以及投放对象在目标触点对媒体数据的处理方式;采用马尔科夫方法,对每个投放对象的目标触点时序图进行处理,得到每个目标触点的参照贡献值。
在本说明书一个可选的实施例中,将中间转化率,发送至实际转化率检测端,包括:将各中间转化率和每个目标触点的参照贡献值,发送至实际转化率检测端。
在本说明书一个可选的实施例中,确定目标触点,包括:确定第一数量个目标触点。
在本说明书一个可选的实施例中,根据可用数据集合中的可用数据,确定中间转化率之前,该方法还包括:确定第二数量个可用数据集合,每个可用数据集合中的数据,对应于第一数量个目标触点中的至少部分。
在本说明书一个可选的实施例中,根据可用数据集合中的可用数据,确定中间转化率,包括:针对每个可用数据集合,确定可用数据集合的中间转化率。
在本说明书一个可选的实施例中,根据实际转化率检测端返回的目标触点的实际转化率,投放媒体数据,包括:从第一数量个目标触点中,筛选出的实际转化率最高的第三数量个目标触点,投放媒体数据。
第二方面,本申请提供了第二种媒体数据投放方法,其特征在于,该方法应用于实际转化率检测端,该方法包括:接收中间转化率,其中,中间转化率是根据第一方面中任意一种方法得到的;采用实际转化率确定模型,对中间转化率进行处理,得到媒体数据在目标触点的实际转化率;将实际转化率返回至媒体数据投放端。
在本说明书一个可选的实施例中,实际转化率确定模型包括盲源分离模型,接收到的中间转化率为第二数量个,第二数量个中间转化率是根据第一数量个目标触点对应的可用数据得到的,其中,采用实际转化率确定模型,对中间转化率进行处理,得到媒体数据在目标触点的实际转化率,包括:根据第二数量个中间转化率,建立观测信号矩阵;采用FastICA工具对输入观测信号矩阵后的盲源分离模型进行处理,得到对应于所述观测信号矩阵的处理结果;根据对应于所述观测信号矩阵的处理结果,得到媒体数据分别在第一数量个目标触点的实际转化率。
在本说明书一个可选的实施例中,接收中间转化率,包括:接收第二数量个中间转化率和参照贡献值。
在本说明书一个可选的实施例中,得到媒体数据在目标触点的实际转化率之后,该方法还包括:针对每个目标触点,确定出实际转化率确定模型在目标触点的模型效率,其中,模型效率是根据第一数量个目标触点的实际贡献值与参照贡献值之间的差值得到的,第i个目标触点的实际贡献值是采用以下公式得到的:
在本说明书一个可选的实施例中,采用实际转化率确定模型,对中间转化率进行处理,得到媒体数据在目标触点的实际转化率之前,方法还包括:根据历史数据,生成得到若干个样本,其中,每个样本中包括观测样本矩阵、和与观测样本矩阵对应的源样本信号矩阵;针对每个样本,采用FastICA工具对输入样本的观测样本矩阵、和样本的源样本信号矩阵后的盲源分离模型进行处理,得到样本对应的处理结果;根据基于个样本得到的处理结果,得到参照矩阵;
根据对应于观测信号矩阵的处理结果,得到媒体数据分别在第一数量个目标触点的实际转化率包括:在混淆矩阵与参照矩阵的第二相似度大于第二相似度阈值的情况下,根据对应于观测信号矩阵的处理结果,得到媒体数据分别在第一数量个目标触点的实际转化率,其中,混淆矩阵是采用FastICA工具对输入观测信号矩阵后的盲源分离模型进行处理得到的。
第三方面,本申请提供了第一种媒体数据投放装置,该用于实现前述第一方面中任一种方法。
第四方面,本申请提供了第二种媒体数据投放装置,该用于实现前述第二方面中任一种方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
本说明书中的媒体数据投放方法可以应用于营销智能技术领域进行预测与优化。本说明书中的方法,由媒体数据投放端和实际转化率检测端分别地承担一定程度的数据处理职能,媒体数据投放端在行使其数据处理职能时涉及的部分数据不会泄露至实际转化率检测端,该部分数据例如确定中间转化率时采用的可用数据。实际转化率检测端在行使其数据处理职能时,可以在不直接地接触到可用数据的情况下,检测出目标触点的实际转化率,有利于实现隐私保护。在此基础之上,基于目标触点的实际转化率,进行媒体数据的投放,有利于解决现有技术中存在的投放的媒体数据难以实现预期的转化效果的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种媒体数据投放过程涉及的场景示意图;
图2为本申请实施例提供的一种媒体数据投放过程的流程示意图;
图3为对应于图2方法过程部分步骤的第一种媒体数据投放装置示意图;
图4为对应于图2方法过程部分步骤的第二种媒体数据投放装置示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为解决现有技术存在的投放的媒体数据难以实现预期的转化效果的问题,本说明书提供一种媒体数据投放方法。本说明书中的媒体数据投放方法涉及媒体数据投放端和实际转化率检测端。媒体数据投放方法涉及媒体数据投放端和实际转化率检测端之间的交互场景如图1所示。
在如1所示的场景中,媒体数据投放端1至媒体数据投放端n分别的与实际转化率检测端交互。为便于说明,下文以各媒体数据投放端之一与实际转化率检测端之间的交互为例。
其中,媒体数据投放端可以是用于投放媒体数据的数据投放平台,则本说明书的过程涉及的可用数据,可以由数据投放平台采集得到;此外,媒体数据投放端也可以是生成媒体数据的一端,媒体数据投放端将生成的媒体数据发送至数据投放平台,之后,从数据投放平台获取由数据投放平台采集可用数据。
在本说明书中的过程之前,可以预先的确定出若干个(一个或一个以上)触点,示例性的,该确定触点的步骤可以由媒体数据投放端执行,也可以由除媒体数据投放端以外的其他端执行。
触点可以表示出媒体数据的投放对象(示例性的,投放对象可以是个人、企业、团体等)的至少部分属性。示例性的,触点1可以表示为“投放对象所处的投放渠道是a1、和/或投放对象所处地理位置为b1、和/或投放对象的属性包括c1”。
其中,投放渠道可以通过以下至少一种加以区分:投放渠道的标识(例如,投放渠道“电商平台A”,其中“A”即为投放渠道的标识)、投放渠道的类型(例如,投放渠道“电商平台A”,其中“电商平台”即为投放渠道的类型)、渠道投放媒体信息时采用的投放方式(例如,开屏投放、贴片投放等)。
在投放对象是个人的情况下,投放对象的属性可以包括以下至少一种:投放对象的年龄、性别、职业、收入情况等。
本说明书中,媒体数据可以是承载一定量的信息、用于对投放对象进行引流的数据,示例性的,媒体数据可以是广告。此外,媒体数据还可以是获取用户关注的数据,例如综艺节目、电视剧等。
常情况下,一数据通可以通过若干个维度进行表征,该维度可以包括数据的生成者的标识(示例性的,若数据是广告,则生成者的标识可以是该数据的广告主的标识和/或投放该数据的数据投放平台的标识等)、数据对应的业务对象的标识(示例性的,若数据是广告,则业务对象的标识可以是商品的标识)、数据对应的业务的标识(示例性的,若数据是广告,则业务可以是该广告对应的商品参与的某次商品推广活动)、数据的投放时间段等。则一数据是否是本说明书中的媒体数据,可以通过以上个维度进行识别。具体地,可以预先的确定基准维度(例如,数据对应的业务对象的标识)的基准参数,若一数据对应于该基准维度的实际参数与该基准参数的第一相似度大于第一相似度阈值,则确定该数据是本说明书中的媒体数据。
在一触点向投放对象投放媒体数据的过程中,若投放对象针对媒体数据执行了指定处理方式,则表明媒体数据在该触点实现了转化。针对不同的媒体数据,指定处理方式可以不同。示例性地,在媒体数据是广告时,指定处理方式可以是点击所述媒体数据对应的控件、或执行下单等;在媒体数据是综艺节目、电视剧时,指定处理方式可以是观看操作等。
本说明书中的实际转化率检测端用于基于媒体数据投放端生成的至少部分数据,检测媒体数据在触点的实际转化率。实际转化率用于对触点在媒体数据转化过程中做出的贡献进行表征。实际转化率可以用于指导对媒体数据的投放。
本说明书中的媒体数据投放方法适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法。
如图2所示,本说明书中的媒体数据投放方法包括以下步骤:
S200:媒体数据投放端确定目标触点。
由前述内容可知,在媒体数据投放过程中,可能存在确定出的触点不唯一的情形,则有可能存在媒体数据投放过程涉及的某些触点,不需要对实际转化率进行确定。本步骤确定出的目标触点是需要确定实际转化的触点。
本步骤中确定出的目标触点可以是一个,也可以是一个以上。
S202:媒体数据投放端根据可用数据集合中的可用数据,确定中间转化率。
在本说明书中,可用数据可以包括在媒体数据投放过程中采集到的数据,可用数据是可以从若干个维度对所述目标触点进行表征。在本说明书一个可选的实施例中,所述维度包括以下至少一种:所述媒体数据的投放渠道、投放所述媒体数据的地理位置、接收所述媒体数据的投放对象的属性。此外,可用数据还可以表征出媒体数据在目标触点的投放效果,该投放效果可以根据投放对象在目标触点对所述媒体数据的处理方式表征。示例性的,可用数据包括记录投放对象是否对媒体数据执行指定操作的字段。
其中,维度的数量,可以根据实际的需求确定。示例性的,触点2表示为“投放对象所处的投放渠道是a2、投放对象所处地理位置为b2、投放对象的属性包括c2”,触点2的对应的维度是3个。
可用数据集合即为包括若干个可用数据的集合。本步骤确定出的可用数据集合,可以根据实际的需求确定。
在本说明书中,中间转化率y与指定比例正相关。指定比例是所述可用数据集合中的可用数据对应的投放对象中,针对所述媒体数据执行指定处理方式的投放对象,在可用数据集合中占所有投放对象的比例。
在本说明书一个可选的实施例中,可以直接将指定比例确定为中间转化率。则中间转化率可以通过以下公式计算得到:
公式(一)
其中,p是所述可用数据集合中的可用数据对应的投放对象中,针对所述媒体数据执行指定处理方式的投放对象的数量;k是所述可用数据集合中的可用数据对应的投放对象的数量。
在本说明书另一个可选的实施例中,可以对指定比例进行处理(例如,对指定比例进行加权,加权时采用的权重与可用数据集合中包含的数量的量正相关,且该权重不大于1),将处理的结果确定为中间转化率。
S204:媒体数据投放端将所述中间转化率,发送至实际转化率检测端。
在本说明书中,相较于可用数据,中间转化率是经过处理后的数据,中间转化率能够体现出可用数据的特征,但是无法体现出可用数据的原貌。媒体数据投放端将中间转化率发送至实际转化率检测端,而不是将可用数据发送至实际转化率检测端,实际转化率检测端无法从媒体数据投放端获取到可用数据,实现了可用数据与实际转化率检测端之间的隔离,有利于实现隐私保护。
但是,中间转化率中包含了确定实际转化率所需的至少部分信息,使得实际转化率检测端在无法获得可用数据的情况下,能够确定出实际转化率,以对目标触点在媒体数据投放过程中做出的贡献进行衡量。
S206:实际转化率检测端接收中间转化率。
S208:实际转化率检测端采用实际转化率确定模型,对所述中间转化率进行处理,得到所述媒体数据在所述目标触点的实际转化率。
实际转化率确定模型可以是预设的模型。在本说明书一个可选的实施例中,实际转化率确定模型可以是基于统计学数据处理方法建立的模型。在本说明书另一可选的实施例中,实际转化率确定模型可以是经过训练获得的人工智能模型。
则可以将中间转化率输入实际转化率确定模型,或者对中间转化率进行处理,将处理得到的结果输入实际转化率确定模型,得到实际转化率确定模型输出的实际转化率,或者对实际转化率确定模型输出的结果进行处理,得到实际转化率。
S210:实际转化率检测端将所述实际转化率返回至媒体数据投放端。
S212:媒体数据投放端根据实际转化率检测端返回的目标触点的实际转化率,投放媒体数据。
由前述内容可知,本说明书中的媒体数据投放方法由媒体数据投放端和实际转化率检测端分别地承担一定程度的数据处理职能,媒体数据投放端在行使其数据处理职能时涉及的部分数据不会泄露至实际转化率检测端。该数据例如确定中间转化率时采用的可用数据。实际转化率检测端在行使其数据处理职能时,可以在不直接的接触到可用数据的情况下,检测出目标触点的实际转化率,在此基础之上,基于目标触点的实际转化率,进行媒体数据的投放,有利于解决现有技术中存在的投放的媒体数据难以实现预期的转化效果的问题。
在媒体数据投放过程中采集到的数据的量可能较大,导致可用数据也可能较多。在本说明书一个可选的实施例中,媒体数据投放端可以将可用数据用于表示目标触点的维度之一,作为目标维度。然后,根据所述目标维度对所述可用数据进行采样(示例性地,采样的方式可以是随机采样),得到可用数据集合。为便于说明,下文以投放对象作为目标维度,对本说明书中的过程进行说明。
在实际的广告投放场景中,投放对象在最终针对某一触点执行指定处理方法之前,可能已经经历了对应于媒体数据的其他某些触点。示例性地,在媒体数据是d产品的广告时,投放对象在基于媒体数据执行了针对d产品的下单操作之前,按照时间顺序,共经历了触点3、触点4和触点5,最终,在触点5执行了下单。
触点3可以表示为“投放对象所处的投放渠道是a3、投放对象所处地理位置为b3、投放对象的属性包括c3”,触点4可以表示为“投放对象所处的投放渠道是A3、投放对象所处地理位置为b3、投放对象的属性包括c3”,触点5可以表示为“投放对象所处的投放渠道是A3、投放对象所处地理位置为B3、投放对象的属性包括c3”。
在投放对象在触点5执行下单之前经历的触点3和触点4也对该投放对象起到了一定的影响,对投放对象在触点5执行的下单操作也具有一定的贡献。若在基于投放相对本次的下单操作,确定触点3至触点5的转化率时,将触点3和触点4的转化率置为0,将会造成确定出的触点3和触点4的转化率不准确。
有鉴于此,在本说明书一个可选的实施例中,确定出的目标触点的数量是第一数量(第一数量是大于1的整数),即,确定出的目标触点不唯一,以将媒体数据的某次转化过程中,不同目标触点之间的相互关系、共同为本次转化做出的贡献进行衡量。然后,根据各可用数据,确定出第二数量个可用数据集合,每个可用数据集合中的数据,对应于第一数量个目标触点中的至少部分。不同的可用数据集合中的可用数据不完全相同,则能够基于可用数据的分布,对各目标触点各自对转化做出的贡献进行衡量。之后,针对每个可用数据集合,确定所述可用数据集合的中间转化率。
具体地,确定第二数量个可用数据集合的过程可以是:在各可用数据用于表示目标维度的字段中,确定出第一指定数量m个字段,作为目标字段。对各可用数据中,包含目标字段的可用数据进行第二数量k次采样,得到第二数量个可用数据集合。
在本说明书一个可选的实施例中,在确定出第二数量个可用数据集合之后,将该第二数量个可用数据集合作为一个组。之后,再次对各可用数据中,包含目标字段的可用数据进行第二数量k次采样,再次得到一个组,直至得到第二指定数量R个组。
此后,在各可用数据用于表示目标维度的字段中,重新确定出第一指定数量m个字段,作为新的目标字段。基于和前述过程相似的步骤,根据新的目标字段,再次确定出第二指定数量R个组。直至得到的所有组的数量为第三指定数量,第三指定数量是第二指定数量R的整数倍T,T即为下文所述的轮次。
示例性的,在第一数量为30的情况下,某次媒体数据投放过程得到的各可用数据集合group如下表1所示:
表1
group | tpid1 | tpid2 | tpidi | tpid30 | y |
group1,1 | 0.01102 | 0 | … | 0.05369 | 0.26666 |
group1,2 | 0.01385 | 0 | … | 0.06158 | 0.27400 |
group1,R | … | … | … | … | … |
group2,1 | 0.01082 | 0.00035 | … | 0.06332 | 0.26509 |
group2,2 | 0.01011 | 0.00027 | … | 0.06321 | 0.27309 |
group2,R | … | … | … | … | … |
groupT,1 | 0.01021 | 0.00022 | … | 0.05418 | 0.23509 |
groupT,2 | 0.01334 | 0.00235 | … | 0.05516 | 0.24507 |
groupT,R | … | … | … | … | … |
表1中,tpid1至tpid30是目标触点的标识。group1.1至groupT.R是各可用数据集合的标识。y是各可用数据集合对应的中间转化率。表1中对应于tpid1至tpid30的数据,是tpid1至tpid30分别在不同可用数据集合中的参照贡献值。
在得到中间转化率之后,媒体数据投放端可以将中间转化率发送至实际转化率检测端。可选地,媒体数据投放端向实际转化率检测端发送的中间转化率中,添加有中间转化率对应的可用数据集合的标识,可用数据集合的标识示出该可用数据集合属于哪个组(即R的取值),还示出了该可用数据集合是哪个采样轮次(即T的取值)得到的。
媒体数据投放端在接收到各中间转化率,可以执行基于中间转化率确定实际转化率的步骤。
S表示源信号矩阵,大小为O×T它的每一列表示O个源在某一时刻的取值,总共有T个时刻(T即为前述的整倍数)。A表示混淆矩阵,大小R×O,每一行代表对每一时刻的源信号的一个加权值。
在本说明书中,由于触点之间的关联性较小,特别是在确定可用数据集合时采用随机采样的情况下,在每个采样轮次中触点的贡献值很难符合高斯分布。本说明书中的过程采用盲源分离模型,则能够从较为离散的数据中,确定出目标触点的转化率。
在本说明一个可选的实施例中,采用FastICA工具对输入所述观测信号矩阵后的盲源分离模型进行处理,得到所述媒体数据分别在所述第一数量个目标触点的实际转化率。
FastICA工具可以是python的MNE包提供的。
在进一步可选的实施例中,本说明书中的过程还可以用于确定实际转化率确定模型的性能。在实际转化率确定模型是盲源分离模型时,模型的性能一定程度的由混淆矩阵A决定。
具体地,首先由媒体数据投放端针对所述可用数据表示出的每个投放对象,确定所述投放对象的目标触点时序图。其中,所述目标触点时序图表示出所述投放对象经历各目标触点、所述投放对象经历各目标触点的次序、以及所述投放对象在所述目标触点对所述媒体数据的处理方式。示例性地,投放对象在基于媒体数据执行了针对d产品的下单操作对应的目标触点时序图是“触点3→触点4→触点5(转化)”。
然后,采用马尔科夫方法,对每个所述投放对象的目标触点时序图进行处理,得到每个所述目标触点的参照贡献值。示例性的,得到的参照贡献值可以如前述的表1所示,其中,目标触点时序图中未涉及的目标触点的参照贡献值默认为0。马尔科夫方法可以采用Python的内置包arkovattribution实现。对应于目标触点i(即,第i个目标触点),每个可用数据集合均能够确定出一个参照贡献值。
之后,媒体数据投放端将确定出的参照贡献值发送至实际转化率检测端。
实际转化率检测端在接收到参照贡献值之后,针对每个目标触点,确定出所述实际转化率确定模型在所述目标触点的模型效率,其中,所述模型效率是根据第一数量个目标触点的实际贡献值与参照贡献值之间的差值得到的,任一批次中第i个目标触点的实际贡献值是采用以下公式(二)得到的:
公式(二)
公式(三)
由盲源分离模型的性质决定的,在已知观测信号矩阵Y的情况下,求解混淆矩阵A和源信号矩阵S,不同的观测信号矩阵Y求解得到的解混淆矩阵A有可能不同。此外,混淆矩阵A和源信号矩阵S均为针对盲源分离模型的求解得到的,若混淆矩阵A不准确,则源信号矩阵S也有可能不准确。
有鉴于此,在本说明书一个可选的实施例中,在实际转化率确定模型是盲源分离模型时,在执行前述的步骤S200之前,预先的根据历史的数据,得到若干个样本。每个样本中包括一个观测样本矩阵Y’、和与观测样本矩阵Y’对应的一个源样本信号矩阵S’。观测样本矩阵Y’可以是对历史的数据采样得到的,源样本信号矩阵S’可以是根据对历史的数据采样的结果,通过人工标定的方法得到的。
然后,针对每个样本,将该样本输入盲源分离模型,进行求解,得到该样本对应的混淆待定矩阵A’。之后,对各混淆待定矩阵A’求平均,得到参照矩阵A”。
此后,在线上使用时,通过前述各实施例中的任意一个得到混淆矩阵A和源信号矩阵S之后,确定混淆矩阵A与参照矩阵A”的第二相似度。若得到的第二相似度大于预设的第二相似度阈值,则确定源信号矩阵S是有效矩阵,根据有效矩阵,确定目标触点的实际转化率。若得到的第二相似度不大于预设的第二相似度阈值(可以是人工设定的),则确定源信号矩阵S是无效矩阵,可选地舍弃本次确定的源信号矩阵S,重新确定观测信号矩阵Y,并基于观测信号矩阵Y重新确定源信号矩阵S。
在实际场景中,参照矩阵A”是否合理,和确定参照矩阵A”的过程中采用的历史数据有关。若采用的历史数据不合理,有可能造成参照矩阵A”是不合理的。则可以通过前述的确定模型效率的过程,衡量参照矩阵A”是否合理。若根据参照矩阵A”确定出的模型效率低于预设的效率阈值(可以是人工设定的),则重新基于历史数据确定参照矩阵A”。
基于同样的思路,本说明书进一步提供第一种媒体数据投放装置,应用于媒体数据投放端,如图3所示,该第一种媒体数据投放装置包括以下模块中的一个或多个:
目标触点确定模块300,配置为:确定目标触点,所述目标触点用于表征媒体数据的投放对象的至少部分属性;
中间转化率确定模块302,配置为:根据可用数据集合中的可用数据,确定中间转化率,其中,所述可用数据用于从若干个维度对所述目标触点进行表征;
中间转化率发送模块304,配置为:将所述中间转化率,发送至实际转化率检测端,其中,所述中间转化率与指定比例正相关,所述指定比例是所述可用数据集合中的可用数据对应的投放对象中,针对所述媒体数据执行指定处理方式的投放对象的比例;
媒体数据投放模块306,配置为:根据实际转化率检测端返回的目标触点的实际转化率,投放媒体数据。
在本说明书一个可选的实施例中,所述维度包括以下至少一种:所述媒体数据的投放渠道、投放所述媒体数据的地理位置、接收所述媒体数据的投放对象的属性;和/或,所述指定处理方式包括以下至少一种:观看所述媒体数据、点击所述媒体数据对应的控件、根据所述媒体数据执行下单。
在本说明书一个可选的实施例中,第一种媒体数据投放装置还可以包括可用数据集合确定模块308,配置为确定所述维度之一,作为目标维度;根据所述目标维度对所述可用数据进行采样,得到可用数据集合。
在本说明书一个可选的实施例中,第一种媒体数据投放装置还可以包括参照贡献值确定模块310,配置为:将所述中间转化率,发送至实际转化率检测端之前,所述方法还包括:针对所述可用数据表示出的每个投放对象,确定所述投放对象的目标触点时序图,其中,所述目标触点时序图表示出所述投放对象经历各目标触点、所述投放对象经历各目标触点的次序、以及所述投放对象在所述目标触点对所述媒体数据的处理方式;采用马尔科夫方法,对每个所述投放对象的目标触点时序图进行处理,得到每个所述目标触点的参照贡献值。
中间转化率发送模块304,具体配置为:将所述中间转化率,发送至实际转化率检测端,包括:将各中间转化率和每个所述目标触点的参照贡献值,发送至实际转化率检测端。
在本说明书一个可选的实施例中,目标触点确定模块300,具体配置为:确定第一数量个目标触点。
在本说明书一个可选的实施例中,可用数据集合确定模块308,具体配置为:确定第二数量个可用数据集合,每个可用数据集合中的数据,对应于第一数量个目标触点中的至少部分。
在本说明书一个可选的实施例中,中间转化率确定模块302,具体配置为:根据可用数据集合中的可用数据,确定中间转化率,包括:针对每个可用数据集合,确定所述可用数据集合的中间转化率。
在本说明书一个可选的实施例中,媒体数据投放模块306,具体配置为:从所述第一数量个目标触点中,筛选出的实际转化率最高的第三数量个目标触点,投放媒体数据。
基于同样的思路,本说明书进一步提供第二种媒体数据投放装置,应用于媒体数据投放端,如图4所示,该第二种媒体数据投放装置包括以下模块中的一个或多个:
中间转化率接收模块400,配置为:接收中间转化率。
实际转化率确定模块402,配置为:采用实际转化率确定模型,对所述中间转化率进行处理,得到所述媒体数据在所述目标触点的实际转化率。
实际转化率返回模块404,配置为:将所述实际转化率返回至媒体数据投放端。
在本说明书一个可选的实施例中,所述实际转化率确定模型包括盲源分离模型,接收到的中间转化率为第二数量个,第二数量个中间转化率是根据第一数量个目标触点对应的可用数据得到的。
在本说明书一个可选的实施例中,实际转化率确定模块402,具体配置为:根据第二数量个中间转化率,建立观测信号矩阵;采用FastICA工具对输入所述观测信号矩阵后的盲源分离模型进行处理,得到对应于所述观测信号矩阵的处理结果;根据对应于所述观测信号矩阵的处理结果,得到所述媒体数据分别在所述第一数量个目标触点的实际转化率。
在本说明书一个可选的实施例中,中间转化率接收模块400,具体配置为:接收第二数量个中间转化率和参照贡献值。
在本说明书一个可选的实施例中,第二种媒体数据投放装置还可以包括模型效率确定模块406,配置为:针对每个目标触点,确定出所述实际转化率确定模型在所述目标触点的模型效率,其中,所述模型效率是根据第一数量个目标触点的实际贡献值与参照贡献值之间的差值得到的,第i个目标触点的实际贡献值是采用以下公式得到的:
在本说明书一个可选的实施例中,第二种媒体数据投放装置还可以包括参照矩阵确定模块,配置为:采用实际转化率确定模型,对中间转化率进行处理,得到媒体数据在目标触点的实际转化率之前,方法还包括:根据历史数据,生成得到若干个样本,其中,每个样本中包括观测样本矩阵、和与观测样本矩阵对应的源样本信号矩阵;针对每个样本,采用FastICA工具对输入样本的观测样本矩阵、和样本的源样本信号矩阵后的盲源分离模型进行处理,得到样本对应的处理结果;根据基于个样本得到的处理结果,得到参照矩阵。
在本说明书一个可选的实施例中,实际转化率确定模块402具体配置为:在混淆矩阵与参照矩阵的第二相似度大于第二相似度阈值的情况下,根据对应于观测信号矩阵的处理结果,得到媒体数据分别在第一数量个目标触点的实际转化率,其中,混淆矩阵是采用FastICA工具对输入观测信号矩阵后的盲源分离模型进行处理得到的。
如图5所示,本申请实施例提供了一种媒体数据投放设备,包括处理器111、通信接口112、存储器113和通信总线114,其中,处理器111,通信接口112,存储器113通过通信总线114完成相互间的通信,
存储器113,用于存放计算机程序;
在本申请一个实施例中,处理器111,用于执行存储器113上所存放的程序时,实现前述任意一个方法实施例提供的媒体数据投放的控制方法,包括:
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如前述任意一个方法实施例提供的媒体数据投放的步骤。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.一种媒体数据投放方法,其特征在于,所述方法应用于媒体数据投放端,所述方法包括:
确定目标触点,所述目标触点用于表征媒体数据的投放对象的至少部分属性;
根据可用数据集合中的可用数据,确定中间转化率,其中,所述可用数据用于从若干个维度对所述目标触点进行表征;
将所述中间转化率,发送至实际转化率检测端,其中,所述中间转化率与指定比例正相关,所述指定比例是所述可用数据集合中的可用数据对应的投放对象中,针对所述媒体数据执行指定处理方式的投放对象的比例;
根据实际转化率检测端返回的目标触点的实际转化率,投放媒体数据,其中,所述实际转化率是根据对应于观测信号矩阵的处理结果,得到的所述媒体数据分别在第一数量个目标触点的实际转化率,所述处理结果是采用FastICA工具对输入所述观测信号矩阵后的盲源分离模型进行处理得到的,所述观测信号矩阵是根据第二数量个中间转化率得到的。
2.根据权利要求1所述的方法,其特征在于,
所述维度包括以下至少一种:所述媒体数据的投放渠道、投放所述媒体数据的地理位置、接收所述媒体数据的投放对象的属性;和/或,
所述指定处理方式包括以下至少一种:观看所述媒体数据、点击所述媒体数据对应的控件、根据所述媒体数据执行下单。
3.根据权利要求1所述的方法,其特征在于,根据可用数据集合中的可用数据,确定中间转化率之前,所述方法还包括:
确定所述维度之一,作为目标维度;
根据所述目标维度对所述可用数据进行采样,得到可用数据集合。
4.根据权利要求1所述的方法,其特征在于,
将所述中间转化率,发送至实际转化率检测端之前,所述方法还包括:针对所述可用数据表示出的每个投放对象,确定所述投放对象的目标触点时序图,其中,所述目标触点时序图表示出所述投放对象经历各目标触点、所述投放对象经历各目标触点的次序、以及所述投放对象在所述目标触点对所述媒体数据的处理方式;采用马尔科夫方法,对每个所述投放对象的目标触点时序图进行处理,得到每个所述目标触点的参照贡献值;
将所述中间转化率,发送至实际转化率检测端,包括:将各中间转化率和每个所述目标触点的参照贡献值,发送至实际转化率检测端。
5.根据权利要求1所述的方法,其特征在于,
确定目标触点,包括:确定第一数量个目标触点;
根据可用数据集合中的可用数据,确定中间转化率之前,所述方法还包括:确定第二数量个可用数据集合,每个可用数据集合中的数据,对应于第一数量个目标触点中的至少部分;
根据可用数据集合中的可用数据,确定中间转化率,包括:针对每个可用数据集合,确定所述可用数据集合的中间转化率。
6.根据权利要求5所述的方法,其特征在于,根据实际转化率检测端返回的目标触点的实际转化率,投放媒体数据,包括:
从所述第一数量个目标触点中,筛选出的实际转化率最高的第三数量个目标触点,投放媒体数据。
7.一种媒体数据投放方法,其特征在于,所述方法应用于实际转化率检测端,所述方法包括:
接收第二数量个中间转化率,其中,所述中间转化率是根据权利要求1至6任一所述的方法得到的,其中,第二数量个中间转化率是根据第一数量个目标触点对应的可用数据得到的;
根据所述第二数量个中间转化率,建立观测信号矩阵;
采用FastICA工具对输入所述观测信号矩阵后的盲源分离模型进行处理,得到对应于所述观测信号矩阵的处理结果;
根据对应于所述观测信号矩阵的处理结果,得到所述媒体数据分别在所述第一数量个目标触点的实际转化率;
将所述实际转化率返回至媒体数据投放端。
9.根据权利要求7所述的方法,其特征在于,
采用实际转化率确定模型,对所述中间转化率进行处理,得到所述媒体数据在所述目标触点的实际转化率之前,所述方法还包括:根据历史数据,生成得到若干个样本,其中,每个所述样本中包括观测样本矩阵、和与所述观测样本矩阵对应的源样本信号矩阵;针对每个样本,采用FastICA工具对输入所述样本的观测样本矩阵、和所述样本的源样本信号矩阵后的盲源分离模型进行处理,得到所述样本对应的处理结果;根据基于个样本得到的处理结果,得到参照矩阵;
根据对应于所述观测信号矩阵的处理结果,得到所述媒体数据分别在所述第一数量个目标触点的实际转化率包括:在混淆矩阵与所述参照矩阵的第二相似度大于第二相似度阈值的情况下,根据对应于所述观测信号矩阵的处理结果,得到所述媒体数据分别在所述第一数量个目标触点的实际转化率,其中,所述混淆矩阵是采用FastICA工具对输入所述观测信号矩阵后的盲源分离模型进行处理得到的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110882288.XA CN113312582B (zh) | 2021-08-02 | 2021-08-02 | 一种媒体数据投放方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110882288.XA CN113312582B (zh) | 2021-08-02 | 2021-08-02 | 一种媒体数据投放方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113312582A CN113312582A (zh) | 2021-08-27 |
CN113312582B true CN113312582B (zh) | 2021-11-23 |
Family
ID=77382455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110882288.XA Active CN113312582B (zh) | 2021-08-02 | 2021-08-02 | 一种媒体数据投放方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113312582B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101551892A (zh) * | 2009-05-09 | 2009-10-07 | 刘念龙 | 一种城市生活信息平台及实现方法 |
CN102663616A (zh) * | 2012-03-19 | 2012-09-12 | 北京国双科技有限公司 | 一种基于多触点归因模型的网络广告效果衡量方法和系统 |
CN103987011A (zh) * | 2014-05-30 | 2014-08-13 | 石家庄铁道大学 | 基于位置服务中无需用户精确位置的隐私保护方法 |
CN107563781A (zh) * | 2016-06-30 | 2018-01-09 | 阿里巴巴集团控股有限公司 | 一种信息投放效果归因方法及装置 |
CN110197387A (zh) * | 2018-04-18 | 2019-09-03 | 腾讯科技(北京)有限公司 | 一种定向投放媒体信息的处理方法及装置 |
CN110197084A (zh) * | 2019-06-12 | 2019-09-03 | 上海联息生物科技有限公司 | 基于可信计算及隐私保护的医疗数据联合学习系统及方法 |
CN110675213A (zh) * | 2019-08-22 | 2020-01-10 | 阿里巴巴集团控股有限公司 | 投放信用服务产品的方法、装置及电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160210658A1 (en) * | 2014-12-31 | 2016-07-21 | Anto Chittilappilly | Determining touchpoint attributions in a segmented media campaign |
-
2021
- 2021-08-02 CN CN202110882288.XA patent/CN113312582B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101551892A (zh) * | 2009-05-09 | 2009-10-07 | 刘念龙 | 一种城市生活信息平台及实现方法 |
CN102663616A (zh) * | 2012-03-19 | 2012-09-12 | 北京国双科技有限公司 | 一种基于多触点归因模型的网络广告效果衡量方法和系统 |
CN103987011A (zh) * | 2014-05-30 | 2014-08-13 | 石家庄铁道大学 | 基于位置服务中无需用户精确位置的隐私保护方法 |
CN107563781A (zh) * | 2016-06-30 | 2018-01-09 | 阿里巴巴集团控股有限公司 | 一种信息投放效果归因方法及装置 |
CN110197387A (zh) * | 2018-04-18 | 2019-09-03 | 腾讯科技(北京)有限公司 | 一种定向投放媒体信息的处理方法及装置 |
CN110197084A (zh) * | 2019-06-12 | 2019-09-03 | 上海联息生物科技有限公司 | 基于可信计算及隐私保护的医疗数据联合学习系统及方法 |
CN110675213A (zh) * | 2019-08-22 | 2020-01-10 | 阿里巴巴集团控股有限公司 | 投放信用服务产品的方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113312582A (zh) | 2021-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11574139B2 (en) | Information pushing method, storage medium and server | |
CN110458220B (zh) | 人群定向方法、装置、服务器及存储介质 | |
US20210049622A1 (en) | Marketing method and apparatus based on deep reinforcement learning | |
CN103793484B (zh) | 分类信息网站中的基于机器学习的欺诈行为识别系统 | |
CN106294508B (zh) | 一种刷量工具检测方法及装置 | |
CN108427690B (zh) | 信息投放方法及装置 | |
US20190034492A1 (en) | Methods and apparatus to partition data | |
CN105574538A (zh) | 分类模型训练方法及装置 | |
US20160055320A1 (en) | Method and system for measuring effectiveness of user treatment | |
CN103218355A (zh) | 一种为用户生成标签的方法和装置 | |
CN109658120B (zh) | 一种业务数据处理方法以及装置 | |
US20170091794A1 (en) | Methods and apparatus to determine ratings data from population sample data having unreliable demographic classifications | |
CN109685537B (zh) | 用户行为的分析方法、装置、介质和电子设备 | |
CN110728323A (zh) | 目标类型用户的识别方法、装置、电子设备及存储介质 | |
CN105550295A (zh) | 分类模型优化方法及装置 | |
CN112445699A (zh) | 策略匹配方法、装置、电子设备及存储介质 | |
CN113222653A (zh) | 一种程序化广告用户受众扩展方法、系统、设备及存储介质 | |
CN106919692B (zh) | 一种推送消息的方法和装置 | |
CN114245185A (zh) | 视频推荐方法、模型训练方法、装置、电子设备及介质 | |
CN113297486B (zh) | 一种点击率预测方法及相关装置 | |
CN111292108A (zh) | 订单统计方法、装置、设备及计算机可读存储介质 | |
CN114091684A (zh) | 增强业务结果可解释性的方法及装置 | |
CN113312582B (zh) | 一种媒体数据投放方法 | |
CN108460630B (zh) | 基于用户数据进行分类分析的方法和装置 | |
CN110555168A (zh) | 信息推送的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |