CN112231369A - 一种到达率曲线的拟合方法和装置 - Google Patents

一种到达率曲线的拟合方法和装置 Download PDF

Info

Publication number
CN112231369A
CN112231369A CN202011003747.4A CN202011003747A CN112231369A CN 112231369 A CN112231369 A CN 112231369A CN 202011003747 A CN202011003747 A CN 202011003747A CN 112231369 A CN112231369 A CN 112231369A
Authority
CN
China
Prior art keywords
target
information
data
fitting
original data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011003747.4A
Other languages
English (en)
Inventor
赵思捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Minglue Zhaohui Technology Co Ltd
Original Assignee
Beijing Minglue Zhaohui Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Minglue Zhaohui Technology Co Ltd filed Critical Beijing Minglue Zhaohui Technology Co Ltd
Priority to CN202011003747.4A priority Critical patent/CN112231369A/zh
Publication of CN112231369A publication Critical patent/CN112231369A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/183Tabulation, i.e. one-dimensional positioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及一种到达率曲线的拟合方法和装置,其中,该方法包括:从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据;根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对原始数据进行筛选,得到目标原始数据;通过样条插值拟合模型对目标原始数据进行拟合,得到目标到达率曲线。本申请解决了相关技术中到达率曲线的拟合准确率较低的技术问题。

Description

一种到达率曲线的拟合方法和装置
技术领域
本申请涉及计算机领域,尤其涉及一种到达率曲线的拟合方法和装置。
背景技术
随着对Mixreach系统中reach(到达率)拟合曲线的跟进研究,发现使用现有算法拟合生成的曲线中,相同GRP(Gross Rating Points,总收视点)的条件下,原始数据点位和reach拟合曲线点位有时会出现较大的间隔gap(reach值>0.25%),最终导致mix计算的结果不太准确。现有的reach曲线拟合方法是基于最小二乘法实现的线性回归方程,将现有原始数据的点位进行线性回归,拟合出reach curve曲线。目前方式拟合出的reach曲线原始点位(散点)和曲线点位之前有较大的差异(曲线没有完全穿过原始点位),这样的reachcurve曲线缺乏了一定的可信度,对最终的多屏整合结果(Mixreach)的准确度也产生了较大影响。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供了一种到达率曲线的拟合方法和装置,以至少解决相关技术中到达率曲线的拟合准确率较低的技术问题。
根据本申请实施例的一个方面,提供了一种到达率曲线的拟合方法,包括:
从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据;
根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对所述原始数据进行筛选,得到目标原始数据;
通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线。
可选地,根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对所述原始数据进行筛选,得到目标原始数据包括:
确定每组具有对应关系的互联网毛评点和信息到达率对应的第一用户数和目标人群数,或者,第二用户数和信息曝光量,其中,所述第一用户数为浏览信息N次及N次以上的用户数,N为正整数,所述第二用户数为浏览信息M次及M次以上的用户数,M为正整数;
计算所述第一用户数和所述目标人群数的第一比值,或者,所述第二用户数和所述信息曝光量的第二比值;
从所述原始数据中删除所述第一比值大于第一目标值,或者,所述第二比值小于或者等于第二目标值的数据,得到所述目标原始数据。
可选地,通过所述样条插值拟合模型对所述目标原始数据进行拟合,得到所述目标到达率曲线包括:
确定所述目标原始数据中与原点最近的数据与所述原点之间的距离;
在所述距离超过一个总收视点间隔的情况下,在所述原点与所述与原点最近的数据之间每隔一个所述总收视点间隔添加一个补充数据;
将所述补充数据和所述目标原始数据输入所述样条插值拟合模型;
获取所述样条插值拟合模型输出的所述目标到达率曲线。
可选地,在获取所述样条插值拟合模型输出的所述目标到达率曲线之后,所述方法还包括:
将所述目标到达率曲线转换为整合到达效果曲线;
按照所述总收视点间隔在所述整合到达效果曲线上获取展示数据;
在展示界面上显示的目标坐标系中展示所述展示数据,其中,所述目标坐标系用于指示信息的曝光量与信息的到达率之间的对应关系。
可选地,通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线包括:
确定所述目标原始数据的数据量;
在所述数据量小于或者等于目标数据量的情况下,展示提示信息,其中,所述提示信息用于指示拟合过程中数据量不足;
在所述数据量大于所述目标数据量的情况下,通过所述样条插值拟合模型对所述目标原始数据进行拟合,得到所述目标到达率曲线。
可选地,从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据包括:
从条件筛选界面获取目标筛选条件,其中,所述目标筛选条件包括以下至少之一:地域,活动时间,信息位类型,媒体类型和目标人群;
从所述数据库中筛选与所述目标筛选条件匹配的所述多组具有对应关系的互联网毛评点和信息到达率作为所述原始数据。
根据本申请实施例的另一方面,还提供了一种到达率曲线的拟合装置,包括:
第一获取模块,用于从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据;
筛选模块,用于根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对所述原始数据进行筛选,得到目标原始数据;
拟合模块,用于通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线。
可选地,所述筛选模块包括:
第一确定单元,用于确定每组具有对应关系的互联网毛评点和信息到达率对应的第一用户数和目标人群数,或者,第二用户数和信息曝光量,其中,所述第一用户数为浏览信息N次及N次以上的用户数,N为正整数,所述第二用户数为浏览信息M次及M次以上的用户数,M为正整数;
计算单元,用于计算所述第一用户数和所述目标人群数的第一比值,或者,所述第二用户数和所述信息曝光量的第二比值;
删除单元,用于从所述原始数据中删除所述第一比值大于第一目标值,或者,所述第二比值小于或者等于第二目标值的数据,得到所述目标原始数据。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。
根据本申请实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。
在本申请实施例中,采用从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据;根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对原始数据进行筛选,得到目标原始数据;通过样条插值拟合模型对目标原始数据进行拟合,得到目标到达率曲线的方式,从数据库中获取原始数据,通过信息曝光参数对原始数据进行筛选得到目标原始数据,采用样条插值拟合的方式对目标原始数据进行拟合得到目标到达率曲线,达到了通过数据的筛选使得样条插值拟合方式能够适用于到达率曲线的拟合过程的目的,利用样条插值拟合方式能够拟合出平滑准确的到达率曲线,从而实现了提高到达率曲线的拟合准确率的技术效果,进而解决了相关技术中到达率曲线的拟合准确率较低的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的到达率曲线的拟合方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的到达率曲线的拟合方法的流程图;
图3是根据本申请实施例的一种可选的整合到达效果曲线上展示数据的示意图;
图4是根据本申请可选实施例的一种到达率曲线拟合过程的示意图;
图5是根据本申请实施例的一种可选的到达率曲线的拟合装置的示意图;
图6是根据本申请实施例的一种电子装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一方面,提供了一种到达率曲线的拟合的方法实施例。
可选地,在本实施例中,上述到达率曲线的拟合方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如游戏服务、应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101并不限定于PC、手机、平板电脑等。本申请实施例的到达率曲线的拟合方法可以由服务器103来执行,也可以由终端101来执行,还可以是由服务器103和终端101共同执行。其中,终端101执行本申请实施例的到达率曲线的拟合方法也可以是由安装在其上的客户端来执行。
图2是根据本申请实施例的一种可选的到达率曲线的拟合方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据;
步骤S204,根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对所述原始数据进行筛选,得到目标原始数据;
步骤S206,通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线。
通过上述步骤S202至步骤S206,从数据库中获取原始数据,通过信息曝光参数对原始数据进行筛选得到目标原始数据,采用样条插值拟合的方式对目标原始数据进行拟合得到目标到达率曲线,达到了通过数据的筛选使得样条插值拟合方式能够适用于到达率曲线的拟合过程的目的,利用样条插值拟合方式能够拟合出平滑准确的到达率曲线,从而实现了提高到达率曲线的拟合准确率的技术效果,进而解决了相关技术中到达率曲线的拟合准确率较低的技术问题。
在步骤S202提供的技术方案中,原始数据(rawdata)可以但不限于为具有对应关系的互联网毛评点(iGRP)和信息到达率(reach),其可以通过坐标的形式来表示,互联网毛评点(iGRP)作为X值,信息到达率(reach)作为Y值。
可选地,在本实施例中,互联网毛评点(iGRP)=到达率×频次,监测体系于2009年开始向市场提供服务,它提供了一个与已有的电视媒体评估体系GRP(总收视点)相结合的互联网广告效果评估体系。
可选地,在本实施例中,数据库中存储大量对于信息推广活动的监测值,该信息可以但不限于包括任何形式的需要统计到达率的信息,比如:广告,视频,音乐,产品,文章,新闻等等。
作为一种可选的实施例,在上述步骤S202中,可以但不限于通过以下方式获取原始数据:
S11,从条件筛选界面获取目标筛选条件,其中,所述目标筛选条件包括以下至少之一:地域,活动时间,信息位类型,媒体类型和目标人群;
S12,从所述数据库中筛选与所述目标筛选条件匹配的所述多组具有对应关系的互联网毛评点和信息到达率作为所述原始数据。
可选地,在本实施例中,条件筛选界面可以用于对数据的筛选条件进行选择,选择维度可以但不限于包括地域,活动时间,信息位类型,媒体类型和目标人群等等。地域可以但不限于指广告等信息投放的地域,活动时间可以但不限于指广告等信息的活动时间,信息位类型可以但不限于指发布广告等信息的位置的类型,比如网页,客户端,广告牌,公交车等等。媒体类型可以但不限于指发布广告等信息的媒体的类型,比如:报纸等旧媒体,视频等新媒体。目标人群可以但不限于指投放广告等信息的目标人群,比如:老人,青年等等。
可选地,在本实施例中,目标筛选条件可以但不限于是由提出需求的人员设置的,系统根据条件筛选界面上的设置从数据库中筛选满足条件的数据。
在步骤S204提供的技术方案中,信息曝光参数可以但不限于包括:第一用户数,目标人群数,第二用户数,信息曝光量等等。第一用户数为浏览信息N次及N次以上的用户数,N为正整数,N可以为1。第二用户数为浏览信息M次及M次以上的用户数,M为正整数,M可以为10。
作为一种可选的实施例,在上述步骤S204中,可以但不限于通过以下方式对原始数据进行筛选,得到目标原始数据:
S21,确定每组具有对应关系的互联网毛评点和信息到达率对应的第一用户数和目标人群数,或者,第二用户数和信息曝光量,其中,所述第一用户数为浏览信息N次及N次以上的用户数,N为正整数,所述第二用户数为浏览信息M次及M次以上的用户数,M为正整数;
S22,计算所述第一用户数和所述目标人群数的第一比值,或者,所述第二用户数和所述信息曝光量的第二比值;
S23,从所述原始数据中删除所述第一比值大于第一目标值,或者,所述第二比值小于或者等于第二目标值的数据,得到所述目标原始数据。
可选地,在本实施例中,将第一用户数(uv1)和目标人群数(universe)的第一比值大于第一目标值(可以是1等等)的数据筛除是由于点击一次或一次以上的人群超过了目标人群数是脏数据导致的,影响计算准确性,因此可以忽略掉。
可选地,在本实施例中,将第二用户数(uv10)和信息曝光量(Imp)的第二比值小于或者等于第二目标值(可以是0.005等等)的数据筛除是由于uv10太小了,有可能是脏数据(一次点击由于网络延迟等原因计算成了多次),同时实际上这部分点击是可以忽略不计的。
可选地,在本实施例中,对原始数据的筛查可以把样条插值法的误差规避掉,从而提高拟合过程的准确度。
在步骤S206提供的技术方案中,样条插值拟合模型可以但不限于是通过Akima插值算法实现的。
作为一种可选的实施例,在上述步骤S206中,可以但不限于通过以下方式对目标原始数据进行拟合,得到目标到达率曲线:
S31,确定所述目标原始数据中与原点最近的数据与所述原点之间的距离;
S32,在所述距离超过一个总收视点间隔的情况下,在所述原点与所述与原点最近的数据之间每隔一个所述总收视点间隔添加一个补充数据;
S33,将所述补充数据和所述目标原始数据输入所述样条插值拟合模型;
S34,获取所述样条插值拟合模型输出的所述目标到达率曲线。
可选地,在本实施例中,总收视点间隔即GRP间隔,可以根据实际的业务需求对其进行设定,比如:GRP间隔可以但不限于为1,5,10,20,50等等。
可选地,在本实施例中,拟合曲线可以是以原点(0,0)点为起点拟合的,因为有时候数据与原点相距过远,导致这两点之间的曲线拟合不准,补充点位可以优化这两点之间的拟合曲线的准确性。
可选地,在本实施例中,每个GRP间隔上补充的补充数据可以但不限于为一个坐标为(GRP,0)的点。
作为一种可选的实施例,在获取所述样条插值拟合模型输出的所述目标到达率曲线之后,还包括:
S41,将所述目标到达率曲线转换为整合到达效果曲线;
S42,按照所述总收视点间隔在所述整合到达效果曲线上获取展示数据;
S43,在展示界面上显示的目标坐标系中展示所述展示数据,其中,所述目标坐标系用于指示信息的曝光量与信息的到达率之间的对应关系。
可选地,在本实施例中,目标到达率曲线转换为整合到达效果曲线后,可以根据实际的业务需求确定需要展示的数据,并在展示界面上以坐标系的形式进行展示。
可选地,在本实施例中,由于原始数据是根据现有信息推广(比如广告发布)活动采集的,可能不是规范化的数据,将原始数据拟合曲线之后人为取点(如GRP间隔10取一点)更可以直观的看到效果,以便客户优化后期的广告投放策略。图3是根据本申请实施例的一种可选的整合到达效果曲线上展示数据的示意图,如图3所示,通过上述过程得到的展示数据与原始数据之间偏差很小,几乎能够达到重合。
作为一种可选的实施例,通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线包括:
S51,确定所述目标原始数据的数据量;
S52,在所述数据量小于或者等于目标数据量的情况下,展示提示信息,其中,所述提示信息用于指示拟合过程中数据量不足;
S53,在所述数据量大于所述目标数据量的情况下,通过所述样条插值拟合模型对所述目标原始数据进行拟合,得到所述目标到达率曲线。
可选地,在本实施例中,为了保证拟合过程的准确性,还可以在拟合之前对目标原始数据的数据量进行监控,当目标原始数据的数据量满足要求(比如大于目标数据量)时,则执行拟合操作,否则展示用于指示拟合过程中数据量不足的提示信息。
本申请还提供了一种可选实施例,该可选实施例提供了一种基于Akima样条插值法进行reach curve拟合的方法,可以应用于互联网广告监测领域,在本领域中提供了一种Mixreach系统,其将同一目标人群在同一市场的不同屏(如在线视频,电视广告)广告的到达率曲线(reach curve)整合到一起,通过对目标人群在该市场的媒体使用重叠特征的分析,计算出电视和在线视频在不同GRP/iGRP购买水平下获得的整合到达效果(Mixreach曲线)。因此最终到达效果计算的准确性可能依赖于到达率曲线(reach curve)的准确程度,目前Mixreach系统的reach curve算法拟合准确程度比较低,原始数据的点位(igrp,reach)和拟合曲线上的点位有较大差异,导致最终整合到达效果的准确性较低,难以服务于对准确度要求较高的用户。
在本可选实施例中,修改了到达率曲线(reach curve)的拟合过程,基本消除了原始数据与拟合曲线间的差异,使得最终的多屏整合到达效果准确性得到提升。图4是根据本申请可选实施例的一种到达率曲线拟合过程的示意图,如图4所示,首先可以根据所选择的条件取得原始数据,再使用筛选条件(比如:uv10/imp<=0.005或uv1/universe>1)过滤掉无意义的原始数据,得到目标原始数据,过滤之后的数据不足5个,则确定为数据太少,拟合曲线没有价值,可以直接输出数据不足的提示,并结束流程。过滤之后的数据大于或者等于5个时,判断第一个目标原始数据的点位与0点之间差值是否大于一个第一GRP间隔,如果大于,则在每个第一GRP间隔点上补充一个坐标为(grp,0)的点。对数据进行基于Akima插值算法的拟合,得到拟合曲线,将拟合曲线转换为整合到达效果曲线,并按第二GRP间隔取点输出展示数据。
通过上述过程,解决了拟合reach curve时,原始数据和拟合curve点位gap值较大的问题。利用Akima样条插值算法,结合实际业务中的数据处理(过滤无用原始数据、较大区间补充数据点等),保障了原始数据和拟合曲线上点位之间基本上消除了gap。满足了很多对准确性要求较高的广告主客户的要求。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台电子设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述到达率曲线的拟合方法的到达率曲线的拟合装置。图5是根据本申请实施例的一种可选的到达率曲线的拟合装置的示意图,如图5所示,该装置可以包括:
第一获取模块52,用于从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据;
筛选模块54,用于根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对所述原始数据进行筛选,得到目标原始数据;
拟合模块56,用于通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线。
需要说明的是,该实施例中的第一获取模块52可以用于执行本申请实施例中的步骤S202,该实施例中的筛选模块54可以用于执行本申请实施例中的步骤S204,该实施例中的拟合模块56可以用于执行本申请实施例中的步骤S206。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,从数据库中获取原始数据,通过信息曝光参数对原始数据进行筛选得到目标原始数据,采用样条插值拟合的方式对目标原始数据进行拟合得到目标到达率曲线,达到了通过数据的筛选使得样条插值拟合方式能够适用于到达率曲线的拟合过程的目的,利用样条插值拟合方式能够拟合出平滑准确的到达率曲线,从而实现了提高到达率曲线的拟合准确率的技术效果,进而解决了相关技术中到达率曲线的拟合准确率较低的技术问题。
作为一种可选的实施例,所述筛选模块包括:
第一确定单元,用于确定每组具有对应关系的互联网毛评点和信息到达率对应的第一用户数和目标人群数,或者,第二用户数和信息曝光量,其中,所述第一用户数为浏览信息N次及N次以上的用户数,N为正整数,所述第二用户数为浏览信息M次及M次以上的用户数,M为正整数;
计算单元,用于计算所述第一用户数和所述目标人群数的第一比值,或者,所述第二用户数和所述信息曝光量的第二比值;
删除单元,用于从所述原始数据中删除所述第一比值大于第一目标值,或者,所述第二比值小于或者等于第二目标值的数据,得到所述目标原始数据。
作为一种可选的实施例,所述拟合模块包括:
第二确定单元,用于确定所述目标原始数据中与原点最近的数据与所述原点之间的距离;
添加单元用于在所述距离超过一个总收视点间隔的情况下,在所述原点与所述与原点最近的数据之间每隔一个所述总收视点间隔添加一个补充数据;
输入单元,用于将所述补充数据和所述目标原始数据输入所述样条插值拟合模型;
第一获取单元,用于获取所述样条插值拟合模型输出的所述目标到达率曲线。
作为一种可选的实施例,所述装置还包括:
转换模块,用于在获取所述样条插值拟合模型输出的所述目标到达率曲线之后,将所述目标到达率曲线转换为整合到达效果曲线;
第二获取模块,用于按照所述总收视点间隔在所述整合到达效果曲线上获取展示数据;
展示模块,用于在展示界面上显示的目标坐标系中展示所述展示数据,其中,所述目标坐标系用于指示信息的曝光量与信息的到达率之间的对应关系。
作为一种可选的实施例,所述拟合模块包括:
第三确定单元,用于确定所述目标原始数据的数据量;
展示单元,用于在所述数据量小于或者等于目标数据量的情况下,展示提示信息,其中,所述提示信息用于指示拟合过程中数据量不足;
拟合单元,用于在所述数据量大于所述目标数据量的情况下,通过所述样条插值拟合模型对所述目标原始数据进行拟合,得到所述目标到达率曲线。
作为一种可选的实施例,所述第一获取模块包括:
第二获取单元,用于从条件筛选界面获取目标筛选条件,其中,所述目标筛选条件包括以下至少之一:地域,活动时间,信息位类型,媒体类型和目标人群;
筛选单元,用于从所述数据库中筛选与所述目标筛选条件匹配的所述多组具有对应关系的互联网毛评点和信息到达率作为所述原始数据。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的另一个方面,还提供了一种用于实施上述到达率曲线的拟合方法的电子装置。
图6是根据本申请实施例的一种电子装置的结构框图,如图6所示,该电子装置可以包括:一个或多个(图中仅示出一个)处理器601、存储器603、以及传输装置605,如图6所示,该电子装置还可以包括输入输出设备607。
其中,存储器603可用于存储软件程序以及模块,如本申请实施例中的到达率曲线的拟合方法和装置对应的程序指令/模块,处理器601通过运行存储在存储器603内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的到达率曲线的拟合方法。存储器603可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器603可进一步包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至电子装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置605用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置605包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置605为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器603用于存储应用程序。
处理器601可以通过传输装置605调用存储器603存储的应用程序,以执行下述步骤:
从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据;
根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对所述原始数据进行筛选,得到目标原始数据;
通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线。
采用本申请实施例,提供了一种到达率曲线的拟合的方案。从数据库中获取原始数据,通过信息曝光参数对原始数据进行筛选得到目标原始数据,采用样条插值拟合的方式对目标原始数据进行拟合得到目标到达率曲线,达到了通过数据的筛选使得样条插值拟合方式能够适用于到达率曲线的拟合过程的目的,利用样条插值拟合方式能够拟合出平滑准确的到达率曲线,从而实现了提高到达率曲线的拟合准确率的技术效果,进而解决了相关技术中到达率曲线的拟合准确率较低的技术问题。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图6所示的结构仅为示意,电子装置可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等电子设备。图6其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令电子设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行到达率曲线的拟合方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据;
根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对所述原始数据进行筛选,得到目标原始数据;
通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种到达率曲线的拟合方法,其特征在于,包括:
从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据;
根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对所述原始数据进行筛选,得到目标原始数据;
通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线。
2.根据权利要求1所述的方法,其特征在于,根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对所述原始数据进行筛选,得到目标原始数据包括:
确定每组具有对应关系的互联网毛评点和信息到达率对应的第一用户数和目标人群数,或者,第二用户数和信息曝光量,其中,所述第一用户数为浏览信息N次及N次以上的用户数,N为正整数,所述第二用户数为浏览信息M次及M次以上的用户数,M为正整数;
计算所述第一用户数和所述目标人群数的第一比值,或者,所述第二用户数和所述信息曝光量的第二比值;
从所述原始数据中删除所述第一比值大于第一目标值,或者,所述第二比值小于或者等于第二目标值的数据,得到所述目标原始数据。
3.根据权利要求1所述的方法,其特征在于,通过所述样条插值拟合模型对所述目标原始数据进行拟合,得到所述目标到达率曲线包括:
确定所述目标原始数据中与原点最近的数据与所述原点之间的距离;
在所述距离超过一个总收视点间隔的情况下,在所述原点与所述与原点最近的数据之间每隔一个所述总收视点间隔添加一个补充数据;
将所述补充数据和所述目标原始数据输入所述样条插值拟合模型;
获取所述样条插值拟合模型输出的所述目标到达率曲线。
4.根据权利要求3所述的方法,其特征在于,在获取所述样条插值拟合模型输出的所述目标到达率曲线之后,所述方法还包括:
将所述目标到达率曲线转换为整合到达效果曲线;
按照所述总收视点间隔在所述整合到达效果曲线上获取展示数据;
在展示界面上显示的目标坐标系中展示所述展示数据,其中,所述目标坐标系用于指示信息的曝光量与信息的到达率之间的对应关系。
5.根据权利要求1所述的方法,其特征在于,通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线包括:
确定所述目标原始数据的数据量;
在所述数据量小于或者等于目标数据量的情况下,展示提示信息,其中,所述提示信息用于指示拟合过程中数据量不足;
在所述数据量大于所述目标数据量的情况下,通过所述样条插值拟合模型对所述目标原始数据进行拟合,得到所述目标到达率曲线。
6.根据权利要求1所述的方法,其特征在于,从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据包括:
从条件筛选界面获取目标筛选条件,其中,所述目标筛选条件包括以下至少之一:地域,活动时间,信息位类型,媒体类型和目标人群;
从所述数据库中筛选与所述目标筛选条件匹配的所述多组具有对应关系的互联网毛评点和信息到达率作为所述原始数据。
7.一种到达率曲线的拟合装置,其特征在于,包括:
第一获取模块,用于从数据库中获取监测到的多组具有对应关系的互联网毛评点和信息到达率作为原始数据;
筛选模块,用于根据每组具有对应关系的互联网毛评点和信息到达率对应的信息曝光参数对所述原始数据进行筛选,得到目标原始数据;
拟合模块,用于通过样条插值拟合模型对所述目标原始数据进行拟合,得到目标到达率曲线。
8.根据权利要求7所述的装置,其特征在于,所述筛选模块包括:
第一确定单元,用于确定每组具有对应关系的互联网毛评点和信息到达率对应的第一用户数和目标人群数,或者,第二用户数和信息曝光量,其中,所述第一用户数为浏览信息N次及N次以上的用户数,N为正整数,所述第二用户数为浏览信息M次及M次以上的用户数,M为正整数;
计算单元,用于计算所述第一用户数和所述目标人群数的第一比值,或者,所述第二用户数和所述信息曝光量的第二比值;
删除单元,用于从所述原始数据中删除所述第一比值大于第一目标值,或者,所述第二比值小于或者等于第二目标值的数据,得到所述目标原始数据。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至6任一项中所述的方法。
10.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序执行上述权利要求1至6任一项中所述的方法。
CN202011003747.4A 2020-09-22 2020-09-22 一种到达率曲线的拟合方法和装置 Pending CN112231369A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011003747.4A CN112231369A (zh) 2020-09-22 2020-09-22 一种到达率曲线的拟合方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011003747.4A CN112231369A (zh) 2020-09-22 2020-09-22 一种到达率曲线的拟合方法和装置

Publications (1)

Publication Number Publication Date
CN112231369A true CN112231369A (zh) 2021-01-15

Family

ID=74107409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011003747.4A Pending CN112231369A (zh) 2020-09-22 2020-09-22 一种到达率曲线的拟合方法和装置

Country Status (1)

Country Link
CN (1) CN112231369A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113037568A (zh) * 2021-04-16 2021-06-25 黄元涛 一种物联网设备的信息分配方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113037568A (zh) * 2021-04-16 2021-06-25 黄元涛 一种物联网设备的信息分配方法
CN113037568B (zh) * 2021-04-16 2022-11-08 重庆中源绿蓝能源科技有限公司 一种物联网设备的信息分配方法

Similar Documents

Publication Publication Date Title
JP7006985B2 (ja) クライアントデバイス、記憶媒体及び方法
US11729285B2 (en) Systems and methods for matching online users across devices
CN102880688B (zh) 一种用于对网页进行评估的方法、装置和设备
US11238119B2 (en) Device identification for multiple device IDs
CN103069413A (zh) 基于另一个用户的用户偏好为一个用户定制显示内容
CN105447724A (zh) 内容项推荐方法及装置
CN104035926B (zh) 一种互联网信息的投放和系统
US11288710B2 (en) Analyzing the advertisement bidding-chain
CN101119223A (zh) 一种投放在线广告的实现方法、系统及相关装置
CN113127723A (zh) 用户画像处理方法、装置、服务器及存储介质
CN111865753B (zh) 媒体信息的参数确定方法和装置、存储介质、电子装置
CN112231369A (zh) 一种到达率曲线的拟合方法和装置
CN108810056B (zh) 信息推送方法及装置
CN115375339A (zh) 多媒体信息推荐方法、装置和设备及计算机存储介质
KR102336157B1 (ko) 소셜 네트워크 서비스를 이용한 리워드 제공 시스템 및 제공 방법
CN111259242B (zh) 数据处理方法、装置、存储介质及设备
KR20150111027A (ko) 광고 제공 장치 및 방법
US20100217647A1 (en) Determining share of voice
CN112819515A (zh) 资源的推送方法、装置、电子设备和存储介质
CN107171949B (zh) 一种信息推送方法、装置及系统
US20190197567A1 (en) Consumer behavioral research-as-a-service platform
KR20160076374A (ko) Crm 마케팅 정보를 제공하는 방법 및 장치
CN113570409B (zh) 转换事件权重值的确定方法、装置、存储介质和电子装置
CN113988940A (zh) 数据处理方法、其装置及电子设备
CN113761344A (zh) 一种信息推荐的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination