CN112529605A - 一种广告异常曝光识别系统及方法 - Google Patents
一种广告异常曝光识别系统及方法 Download PDFInfo
- Publication number
- CN112529605A CN112529605A CN201910875915.XA CN201910875915A CN112529605A CN 112529605 A CN112529605 A CN 112529605A CN 201910875915 A CN201910875915 A CN 201910875915A CN 112529605 A CN112529605 A CN 112529605A
- Authority
- CN
- China
- Prior art keywords
- exposure
- data
- behavior
- advertisement
- behavior data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 78
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000008569 process Effects 0.000 claims abstract description 9
- 238000012795 verification Methods 0.000 claims description 5
- 230000006399 behavior Effects 0.000 description 120
- 230000009471 action Effects 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000001680 brushing effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0248—Avoiding fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0245—Surveys
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/436—Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
- H04N21/43615—Interfacing a Home Network, e.g. for connecting the client to a plurality of peripherals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/436—Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
- H04N21/4363—Adapting the video stream to a specific local network, e.g. a Bluetooth® network
- H04N21/43637—Adapting the video stream to a specific local network, e.g. a Bluetooth® network involving a wireless protocol, e.g. Bluetooth, RF or wireless LAN [IEEE 802.11]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/812—Monomedia components thereof involving advertisement data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于互联网广告领域,公开了一种广告异常曝光识别系统及方法,系统包括基础数据采集模块、广告曝光数据采集模块和异常曝光识别模块;基础数据采集模块用于采集家庭无线局域网应用场景的基础数据,基础数据包括家庭无线局域网的物理地址、接入该无线局域网内的OTT智能终端的ID及OTT智能终端每次运行过程中的一系列以发生时间的先后为顺序的第一行为数据;广告曝光数据采集模块用于采集OTT智能终端的广告曝光数据,广告曝光数据为OTT智能终端播放广告的第二行为数据,其为第一行为数据的子集;异常曝光识别模块用于从第二行为数据中识别异常曝光,若第二行为数据是无上下文行为的孤立行为事件,则判定第二行为数据为异常曝光;否则为正常曝光。
Description
技术领域
本发明涉及一种广告异常曝光识别系统及方法,属于互联网广告领域。
背景技术
OTT(Over The Top,互联网视频服务)广告是继传统PC广告和移动终端广告发展而来的家庭大屏广告,它具有传统广播视频广告的大屏和家庭共享特性,又兼具互联网广告交互、精准定向和准确计量的特性,在商业化运作中,当前完全是以互联网视频广告的方式运作,要求有强交互性、精准定向能力和精准计量能力。互联网广告的一大特性是准确计量,计量的方式有CPM、CPS、CPC和CPA等,不同的业务场景选用不同的计量方式。
以CPM(Cost Per Mille,每千人成本)计量方式举例来说,传统的CPM计量原理完全是基于OTT智能终端应用层汇报的广告曝光数据,通过长期多项目监测积累数据,然后分析并建立合法的终端ID库,或是媒体方提供终端ID库。终端ID库是静态数据,首先,静态数据更新难度较大,在未更新前无法有效识别正常的新增终端;其次,新增终端中哪些是合法的,哪些非法的,由于没有历史数据作参考,所以无法辨识;再者,对于一个真实存在的终端,即合法的终端ID,曝光信息是否真实,根本没有有效的验证办法。因为曝光的终端IP、时段、地域和曝光频次等信息极易程序化模拟伪造;最后,曝光信息本身受投放时段限制,数据连续性较差,从碎片化的数据中发现规律较为困难。
目前,OTT领域的异常广告曝光识别主要通过白名单(不合法终端)、频次异常(即同一IP/DEVICE或同一ID/MAC重复曝光)、定向异常(曝光的时间、地域等异常)、单位时间内曝光次数异常和曝光时段分布异常等传统的手段来判断曝光是否正常。但目前的作弊手段高明,刷量方可以廉价地通过技术手段将上述所有行为模拟伪造成正常,必须将这些伪造的异常曝光识别出来才能准确反应广告的真实曝光量。
目前识别异常曝光的技术手段主要有以下三种:一是基于C2S(Client toServer,终端到服务器),通过终端直接汇报广告曝光数据;二是终端植入SDK(SoftwareDevelopment Kit,软件开发工具包),广告曝光时,通过SDK汇报广告曝光数据;三是基于S2S(Server to Server,服务器到服务器)方式离线汇报曝光数据。无论是哪种识别手段,都是基于汇报数据进行清洗识别,能采集到的数据字段非常有限,基本仅限于终端ID标识和终端尺寸信息,获取的数据信息有限,无法准确识别异常曝光。
发明内容
本发明的目的是提供一种广告异常曝光识别系统及方法,通过长期采集家庭成员操作智能终端的行为数据,结合广告曝光时点数据,基于家庭使用场景,利用大数据分析技术和机器学习算法,准确识别广告曝光异常数据。
为了实现上述目的,本发明第一方面提供一种广告异常曝光识别系统,包括基础数据采集模块、广告曝光数据采集模块和异常曝光识别模块;所述基础数据采集模块用于采集家庭无线局域网应用场景的基础数据,所述基础数据包括家庭无线局域网的物理地址、接入该无线局域网内的智能终端的ID及智能终端每次运行过程中的一系列以发生时间的先后为顺序的第一行为数据;所述广告曝光数据采集模块用于采集智能终端的广告曝光数据,所述广告曝光数据为智能终端播放广告的第二行为数据,其为所述第一行为数据的子集;所述异常曝光识别模块用于从所述第二行为数据中识别异常曝光,若第二行为数据是无上下文行为事件的孤立行为事件,则判定第二行为数据为异常曝光;否则为正常曝光。
进一步地,还包括第一校验模块;所述第一校验模块用于在所述异常曝光识别模块判定所述第二行为数据为正常曝光时对第二行为数据进行校验,将第二行为数据所属的OTT智能终端的广告曝光时间段与该智能终端的开机次数、开机时段习惯和开机率的历史行为数据进行比较,若二者相差超过第一预设值,则判定第二行为数据为异常曝光;否则为正常曝光。
进一步地,还包括第二校验模块;所述第二校验模块用于在所述第一校验模块判定所述第二行为数据为正常曝光时对第二行为数据进行进一步校验,获取第二行为数据所属的OTT智能终端所在的无线局域网中的其他智能终端数量,若数量为0,则判定第二行为数据为异常曝光;否则为正常曝光。
进一步地,所述基础数据由内嵌于所述OTT智能终端的第三方SDK采集,所述广告曝光数据由其所属的OTT智能终端通过C2S方式采集。
进一步地,所述第一行为数据至少包括开机行为事件、开机广告曝光行为事件、直播行为事件或视频点播应用启动行为事件、应用启动时的开屏广告行为事件、内容浏览/选择行为事件、EPG广告曝光行为事件、视频播放行为事件、贴片广告曝光行为事件和关机/待机行为事件。
进一步地,所述第二行为数据至少包括开机广告曝光行为事件、应用启动时的开屏广告行为事件、EPG广告曝光行为事件和贴片广告曝光行为事件。
本发明第二方面提供一种广告异常曝光识别方法,包括如下步骤:(1)采集家庭无线局域网应用场景的基础数据,所述基础数据包括家庭无线局域网的物理地址、接入该无线局域网内的智能终端的ID及OTT智能终端每次运行过程中的一系列以发生时间的先后为顺序的第一行为数据;(2)采集智能终端的广告曝光数据,所述广告曝光数据为智能终端播放广告的第二行为数据,其为所述第一行为数据的子集;(3)从所述第二行为数据中识别异常曝光,若第二行为数据是无上下文行为事件的孤立行为事件,则判定第二行为数据为异常曝光;否则为正常曝光。
进一步地,还包括步骤(4):当步骤(3)中所述第二行为数据为正常曝光时,对第二行为数据进行校验,将第二行为数据所属的智能终端的广告曝光时间段与该智能终端的开机次数、开机时间习惯和开机率的历史行为数据进行比较,若二者相差超过第一预设值,则判定第二行为数据为异常曝光;否则为正常曝光。
进一步地,还包括步骤(5):当步骤(4)中所述第二行为数据为正常曝光时对第二行为数据进行进一步校验,获取第二行为数据所属的智能终端所在的无线局域网中的智能终端数量,若数量为0,则判定第二行为数据为异常曝光;否则为正常曝光。
进一步地,所述基础数据由内嵌于所述智能终端的第三方SDK采集,所述广告曝光数据由其所属的智能终端采集。
通过本发明的上述技术方案,独立采集基础数据和广告曝光数据,基础数据采集粒度细、维度多,其中包含的基于家庭无线局域网应用场景的用户行为数据遵守时间序列规则,采用行为数据关联规则算法,对广告曝光数据利用时间序列规则识别其中的异常,并通过用户行为习惯对识别结果进行校验,有效保证识别的完整性和准确性。通过广告曝光的智能终端ID与基础数据融合打通之后,可以详细反映曝光终端的行为轨迹,并全面和系统地分析受众特征。曝光异常鉴定不是简单地使用媒体单方上报的曝光数据,而是将曝光数据与基础数据融合打通之后进行综合分析,提高了异常曝光识别的客观性和准确性。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1为本发明系统一实施例的原理框图;
图2为本发明系统另一实施例的原理框图;
图3为本发明系统又一实施例的原理框图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
如图1所示,本发明广告异常曝光识别系统的一个实施例,包括基础数据采集模块、广告曝光数据采集模块和异常曝光识别模块;所述基础数据采集模块用于采集家庭无线局域网应用场景的基础数据,所述基础数据包括家庭无线局域网的物理地址、接入该无线局域网内的智能终端的ID及OTT智能终端每次运行过程中的一系列以发生时间的先后为顺序的第一行为数据;所述广告曝光数据采集模块用于采集智能终端的广告曝光数据,所述广告曝光数据为智能终端播放广告的第二行为数据,其为所述第一行为数据的子集;所述异常曝光识别模块用于从所述第二行为数据中识别异常曝光,若第二行为数据是无上下文行为的孤立行为事件,则判定第二行为数据为异常曝光;否则为正常曝光。无线局域网一般为WIFI,其物理地址即为BSSID(BasicService Set Identifier),智能终端包括移动终端、PC终端和OTT智能终端等。
如图2所示,本发明广告异常曝光识别系统的一个实施例,在图1实施例的基础上,还包括第一校验模块;所述第一校验模块用于在所述异常曝光识别模块判定所述第二行为数据为正常曝光时对第二行为数据进行校验,将第二行为数据所属的OTT智能终端的广告曝光时间段与该智能终端的开机次数、开机时段习惯和开机率的历史行为数据进行比较,若二者相差超过第一预设值,则判定第二行为数据为异常曝光;否则为正常曝光。
如图3所示,本发明广告异常曝光识别系统的一个实施例,在图3实施例的基础上,还包括第二校验模块;所述第二校验模块用于在所述第一校验模块判定所述第二行为数据为正常曝光时对第二行为数据进行进一步校验,获取第二行为数据所属的OTT智能终端所在的无线局域网中的其它智能终端数量,若数量为0,则判定第二行为数据为异常曝光;否则为正常曝光。也就是说,如果在家庭无线网络环境中,除进行广告曝光的OTT智能终端之外,无其它智能终端设备,这不符合真实场景情况,说明该OTT终端设备可能是伪造的。因为一般的家庭无线网络环境中无线联网的智能终端设备是有多台的,包括手机、电视和电脑等。
上述本发明广告异常曝光识别系统实施例的具体工作过程参见以下本发明广告异常曝光识别方法的实施例。
在本发明广告异常曝光识别方法的一个实施例中,通过两种完全不同的路径和产品分别持续采集基础数据和广告曝光数据,其中基础数据是通过在OTT智能终端植入SDK来采集,长期和稳定地收集OTT智能终端的开关机行为数据、终端应用活跃数据、终端视频点播行为数据、终端直播数据、家庭无线局域网的物理地址(如WIFI的MAC地址)及在网的智能终端唯一标识(ID),基础数据和当前是否有广告投放没有关系;广告曝光数据是有广告投放时,智能终端采集后及时向广告监测系统汇报的广告曝光信息。用户使用智能终端的各种行为有其自身习惯,在同一智能终端上的所有操作和任何信息的播放展示均有时间上的先后顺序。因此,曝光数据只是基础数据在某个时段内的一个子集,根据曝光时点或时间段,可以从基础数据中找出与该曝光时点对应的上下文行为事件,如果曝光前后没有上下文行为事件进行铺垫和对应,仅仅只是一个孤立的曝光事件,则该曝光即为异常曝光。具体的异常曝光识别过程举例说明如下:
OTT智能终端行为事件时间序列如下:
1)开机行为事件;2)开机广告曝光行为事件;3)直播行为事件或视频点播应用启动行为事件;3`)应用启动时的开屏广告行为事件;4)内容浏览/选择行为事件;4`)EPG(Electronic Program Guide,电子节目菜单)广告曝光行为事件;5)视频播放行为事件;5`)贴片广告行为事件;6)关机/待机行为事件。即先有前一行为事件,才能有后一行为事件发生,前一行为事件是后一行为事件发生的必要条件。如,必须先开机才会有开机广告曝光行为事件,即必须先有1)才会有2)。如果在没有发生1)的情况下出现了2),则可判定2)是模拟伪造的异常曝光。下面对其中几种广告曝光数据的识别过程进行详细说明。
(一)、对开机广告曝光数据的识别步骤如下:
(1)对于某一次具体曝光,根据广告曝光时间,可寻找1)开机行为事件和3)直播行为事件或是视频点播用应启动行为事件,其它行为事件及关机行为事件;比较上述事件时间序列,如果没有事件1)和事件3),只有独立的广告曝光事件2),理论上是不存在的;如果只有事件1)没有事件2)之后的事件,相当于一个用户开机之后,没有其它任何使用行为,可确定是不存在的,可识别为异常曝光,否则为正常曝光。
(2)如果完全满足上述时间序列,即第(1)步识别为正常曝光,则通过同比或环比该智能终端的历史行为指标进行校验,历史行为指标至少包括:开机次数、开机时间习惯和开机率。如果开机广告投放期的相关指标与历史行为指标偏差较大,如将广告投放期的开机率与历史开机率进行比较,根据经验值,波动在20%以上时,则判定该智能终端为异常曝光,否则为正常曝光。
(3)如果第(2)步判定为正常曝光,则通过统计曝光期间该智能终端所在家庭WIFI环境下是否存在其它智能终端。如果相同WIFI环境下智能终端数为0,则判定该智能终端为异常曝光,否则为正常曝光。
(二)、EPG广告曝光数据的识别步骤如下:
(1)对于某一次具体曝光,根据广告曝光时间,可寻找1)开机行为事件和3)视频点播用应启动行为事件,其它行为事件及关机行为事件;根据上述事件时间序列,如果没有4)之前的行为事件,就相当于一个终端没有开机,没有点播应用启动,却有EPG广告行为,可确定是不可能的,可识别为异常曝光,否则为正常曝光。
(2)如果完全满足上述时间序列,即第(1)步识别为正常曝光,则通过同比或是环比该智能终端的历史行为指标进行校验,历史行为指标至少包括:EPG浏览的行为习惯及次数、点播率。如果EPG广告投放期的相关指标与历史行为指标偏差较大,如将广告投放期的点播率与历史点播率进行比较,根据经验值,根据经验值,波动在30%以上时,则判定该智能终端为异常曝光,否则为正常曝光。
(3)如果第(2)步判定为正常曝光,则通过统计曝光期间该智能终端所在家庭WIFI环境下是否存在其它智能终端。如果相同WIFI环境下智能终端数为0,则判定该智能终端为异常曝光,否则为正常曝光。
(三)、贴片广告曝光数据的识别步骤如下:
(1)对于某一次具体曝光,根据广告曝光时间,可寻找1)开机行为事件,5)视频播放行为事件,其它行为事件及关机行为事件;根据上述事件时间序列,如果没有5)之前的行为事件,就相当于一个终端没有开机,没有点播应用启动,没有视频点播行为,却有视频点播广告行为,可确定是不可能的,可识别为异常曝光,否则为正常曝光。
(2)如果完全满足上述时间序列,即第(1)步识别为正常曝光,则通过同比或是环比该智能终端的历史行为指标,历史行为指标至少包括:视频点播率、点播内容偏好和点播时间习惯。如果贴片广告投放期的相关指标与历史行为指标偏差较大,如将广告投放期的视频点播率与历史视频点播率进行比较,根据经验值,波动在20%以上时,则判定该智能终端为异常曝光,否则为正常曝光。
(3)如果第(2)步判定为正常曝光,则通过统计曝光期间该智能终端所在家庭WIFI环境下是否存在其它智能终端。如果相同WIFI环境下智能终端数为0,该判定该智能终端为异常曝光,否则为正常曝光。
其他种类广告的异常曝光识别与上述三种类似,此处不再赘述。
本发明的实施例中,利用大数据分析挖掘技术和机器学习算法,识别鉴定智能终端广告(包括开机、开屏、贴片、EPG、角标、Launcher图片等等)曝光的异常流量。具体地,采用关联规则挖掘算法FPGrowth和随机森林决策树分类算法。其中,关联规则挖掘算法可用于计算开机之后看点播的概率、开机之后看直播的概率、开机之后使用其它应用的概率和纯开机的概率等;随机森林决策树分类算法用于将第一行为数据和第二行为数据按终端ID和时间序列合并成完整的终端行为数据,然后建模训练,使用训练好的模型和训练集即可对曝光行为数据进行分类,即分类成正常曝光和异常曝光。
由于基础数据采集和曝光数据采集由不同的产品通过不同渠道采集上传,对于造假者而言,要伪造一个合法终端模拟上述各环节的真实行为所需的技术难度和成本是极大的,因此该方法能有效鉴定曝光流量的真实性,对广告曝光进行精确计量。
以上结合附图详细描述了本发明实施例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。
此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。
Claims (10)
1.广告异常曝光识别系统,其特征在于,包括基础数据采集模块、广告曝光数据采集模块和异常曝光识别模块;
所述基础数据采集模块用于采集家庭无线局域网应用场景的基础数据,所述基础数据包括家庭无线局域网的物理地址、接入该无线局域网内的智能终端的ID及OTT智能终端每次运行过程中的一系列以发生时间的先后为顺序的第一行为数据;
所述广告曝光数据采集模块用于采集智能终端的广告曝光数据,所述广告曝光数据为智能终端播放广告的第二行为数据,其为所述第一行为数据的子集;
所述异常曝光识别模块用于从所述第二行为数据中识别异常曝光,若第二行为数据是无上下文行为事件的孤立行为事件,则判定第二行为数据为异常曝光;否则为正常曝光。
2.根据权利要求1所述的广告异常曝光识别系统,其特征在于,还包括第一校验模块;所述第一校验模块用于在所述异常曝光识别模块判定所述第二行为数据为正常曝光时对第二行为数据进行校验,将第二行为数据所属的OTT智能终端的广告曝光时间段与该智能终端的开机次数、开机时段习惯和开机率的历史行为数据进行比较,若二者相差超过第一预设值,则判定第二行为数据为异常曝光;否则为正常曝光。
3.根据权利要求2所述的广告异常曝光识别系统,其特征在于,还包括第二校验模块;所述第二校验模块用于在所述第一校验模块判定所述第二行为数据为正常曝光时对第二行为数据进行进一步校验,获取第二行为数据所属的OTT智能终端所在的无线局域网中的其它智能终端数量,若数量为0,则判定第二行为数据为异常曝光;否则为正常曝光。
4.根据权利要求1所述的广告异常曝光识别系统,其特征在于,所述基础数据由内嵌于所述OTT智能终端的第三方SDK采集,所述广告曝光数据由其所属的OTT智能终端通过C2S方式采集。
5.根据权利要求1所述的广告异常曝光识别系统,其特征在于,所述第一行为数据至少包括开机行为事件、开机广告曝光行为事件、直播行为事件或视频点播应用启动行为事件、应用启动时的开屏广告行为事件、内容浏览/选择行为事件、EPG广告曝光行为事件、视频播放行为事件、贴片广告曝光行为事件和关机/待机行为事件。
6.根据权利要求1所述的广告异常曝光识别系统,其特征在于,所述第二行为数据至少包括开机广告曝光行为事件、应用启动时的开屏广告行为事件、EPG广告曝光行为事件和贴片广告曝光行为事件。
7.广告异常曝光识别方法,其特征在于,包括如下步骤:
(1)采集家庭无线局域网应用场景的基础数据,所述基础数据包括家庭无线局域网的物理地址、接入该无线局域网内的智能终端的ID及OTT智能终端每次运行过程中的一系列以发生时间的先后为顺序的第一行为数据;
(2)采集智能终端的广告曝光数据,所述广告曝光数据为智能终端播放广告的第二行为数据,其为所述第一行为数据的子集;
(3)从所述第二行为数据中识别异常曝光,若第二行为数据是无上下文行为事件的孤立行为事件,则判定第二行为数据为异常曝光;否则为正常曝光。
8.根据权利要求7所述的广告异常曝光识别方法,其特征在于,还包括步骤(4):当步骤(3)中所述第二行为数据为正常曝光时,对第二行为数据进行校验,将第二行为数据所属的智能终端的广告曝光时间段与该智能终端的开机次数、开机时间习惯和开机率的历史行为数据进行比较,若二者相差超过第一预设值,则判定第二行为数据为异常曝光;否则为正常曝光。
9.根据权利要求8所述的广告异常曝光识别方法,其特征在于,还包括步骤(5):当步骤(4)中所述第二行为数据为正常曝光时对第二行为数据进行进一步校验,获取第二行为数据所属的智能终端所在的无线局域网中的智能终端数量,若数量为0,则判定第二行为数据为异常曝光;否则为正常曝光。
10.根据权利要求7-9任一项所述的广告异常曝光识别方法,其特征在于,所述基础数据由内嵌于所述智能终端的第三方SDK采集,所述广告曝光数据由其所属的智能终端采集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910875915.XA CN112529605B (zh) | 2019-09-17 | 2019-09-17 | 一种广告异常曝光识别系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910875915.XA CN112529605B (zh) | 2019-09-17 | 2019-09-17 | 一种广告异常曝光识别系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112529605A true CN112529605A (zh) | 2021-03-19 |
CN112529605B CN112529605B (zh) | 2023-12-22 |
Family
ID=74974597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910875915.XA Active CN112529605B (zh) | 2019-09-17 | 2019-09-17 | 一种广告异常曝光识别系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112529605B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113538054A (zh) * | 2021-07-20 | 2021-10-22 | 深圳市炆石数据有限公司 | Ott信息呈现位的价值计算分类方法、系统及存储介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080288303A1 (en) * | 2006-03-17 | 2008-11-20 | Claria Corporation | Method for Detecting and Preventing Fraudulent Internet Advertising Activity |
CN103593415A (zh) * | 2013-10-29 | 2014-02-19 | 北京国双科技有限公司 | 网页访问量作弊的检测方法和装置 |
CN104025573A (zh) * | 2011-07-29 | 2014-09-03 | 松下电器产业株式会社 | 用于站点异常记录和通知的系统和方法 |
CN105046529A (zh) * | 2015-07-30 | 2015-11-11 | 华南理工大学 | 一种移动广告作弊识别方法 |
CN106022834A (zh) * | 2016-05-24 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 广告反作弊方法及装置 |
CN107623605A (zh) * | 2016-07-14 | 2018-01-23 | 精硕科技(北京)股份有限公司 | 网络流量去重的方法和系统 |
CN108009844A (zh) * | 2017-11-20 | 2018-05-08 | 北京智钥科技有限公司 | 确定广告作弊行为的方法、装置及云服务器 |
CN108027888A (zh) * | 2015-09-16 | 2018-05-11 | 微软技术许可有限责任公司 | 使用上下文信号的局部异常检测 |
CN109003137A (zh) * | 2018-07-23 | 2018-12-14 | 广州至真信息科技有限公司 | 一种广告反作弊的方法及装置 |
CN109146546A (zh) * | 2018-07-23 | 2019-01-04 | 广州至真信息科技有限公司 | 一种作弊行为检测的方法及装置 |
CN109587008A (zh) * | 2018-12-28 | 2019-04-05 | 华为技术服务有限公司 | 检测异常流量数据的方法、装置及存储介质 |
CN110097389A (zh) * | 2018-01-31 | 2019-08-06 | 上海甚术网络科技有限公司 | 一种广告流量反作弊方法 |
CN110213220A (zh) * | 2018-12-26 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 检测流量数据的方法、装置、电子设备及计算机存储介质 |
-
2019
- 2019-09-17 CN CN201910875915.XA patent/CN112529605B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080288303A1 (en) * | 2006-03-17 | 2008-11-20 | Claria Corporation | Method for Detecting and Preventing Fraudulent Internet Advertising Activity |
CN104025573A (zh) * | 2011-07-29 | 2014-09-03 | 松下电器产业株式会社 | 用于站点异常记录和通知的系统和方法 |
CN103593415A (zh) * | 2013-10-29 | 2014-02-19 | 北京国双科技有限公司 | 网页访问量作弊的检测方法和装置 |
CN105046529A (zh) * | 2015-07-30 | 2015-11-11 | 华南理工大学 | 一种移动广告作弊识别方法 |
CN108027888A (zh) * | 2015-09-16 | 2018-05-11 | 微软技术许可有限责任公司 | 使用上下文信号的局部异常检测 |
CN106022834A (zh) * | 2016-05-24 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 广告反作弊方法及装置 |
CN107623605A (zh) * | 2016-07-14 | 2018-01-23 | 精硕科技(北京)股份有限公司 | 网络流量去重的方法和系统 |
CN108009844A (zh) * | 2017-11-20 | 2018-05-08 | 北京智钥科技有限公司 | 确定广告作弊行为的方法、装置及云服务器 |
CN110097389A (zh) * | 2018-01-31 | 2019-08-06 | 上海甚术网络科技有限公司 | 一种广告流量反作弊方法 |
CN109003137A (zh) * | 2018-07-23 | 2018-12-14 | 广州至真信息科技有限公司 | 一种广告反作弊的方法及装置 |
CN109146546A (zh) * | 2018-07-23 | 2019-01-04 | 广州至真信息科技有限公司 | 一种作弊行为检测的方法及装置 |
CN110213220A (zh) * | 2018-12-26 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 检测流量数据的方法、装置、电子设备及计算机存储介质 |
CN109587008A (zh) * | 2018-12-28 | 2019-04-05 | 华为技术服务有限公司 | 检测异常流量数据的方法、装置及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113538054A (zh) * | 2021-07-20 | 2021-10-22 | 深圳市炆石数据有限公司 | Ott信息呈现位的价值计算分类方法、系统及存储介质 |
CN113538054B (zh) * | 2021-07-20 | 2023-09-01 | 深圳市爱易讯数据有限公司 | Ott信息呈现位的价值计算分类方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112529605B (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230115894A1 (en) | Methods, apparatus, and systems to collect audience measurement data | |
US11423437B2 (en) | Methods and apparatus to detect advertisements embedded in online media | |
US9979990B2 (en) | Determining user engagement with media content based on separate device usage | |
US10945043B2 (en) | Methods and apparatus to create a panel of media device users | |
JP6179907B2 (ja) | メディア提示をモニタリングするための方法及び装置 | |
US10469902B2 (en) | Apparatus and method for confirming content viewing | |
US8898696B2 (en) | System and method for allocating advertisements | |
CN104091277A (zh) | 用户身份标识的关联方法和装置、广告投放方法和装置 | |
CN109034906A (zh) | 广告转化的反作弊方法、装置、电子设备及存储介质 | |
CN109003137A (zh) | 一种广告反作弊的方法及装置 | |
US20160366478A1 (en) | View rate measurement method and apparatus | |
EP2559237A1 (en) | Platform-independent interactivity with media broadcasts | |
CN104836781A (zh) | 区分访问用户身份的方法及装置 | |
CN105046529A (zh) | 一种移动广告作弊识别方法 | |
CN105471935B (zh) | 信息提示方法和装置 | |
US10855803B2 (en) | Performance evaluation in a network community | |
CN108521582B (zh) | 一种基于区块链技术的版权视频全网收视纪录系统 | |
US11468479B2 (en) | Methods and apparatus for generating information about portable device advertising | |
CN116797282A (zh) | 一种用于广告投放的实时监控系统以及监控方法 | |
US20170134806A1 (en) | Selecting content based on media detected in environment | |
CN112529605B (zh) | 一种广告异常曝光识别系统及方法 | |
WO2020046438A1 (en) | Evaluating media content using monte carlo attribution | |
CN106101765A (zh) | 一种基于b2c的实时广告推送系统与方法 | |
US11675775B2 (en) | Systems and methods for improving accuracy of device maps using media viewing data | |
KR102601485B1 (ko) | Acr 텔레비전 모니터링 시스템에서의 작업 부하 관리를 개선하기 위한 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Building 46, No. 69 Yanfu Road, Fangshan District, Beijing, 102425, 1st to 4th floors, 101 and 4th floors, 08 Applicant after: Beijing Aowei Mutual Entertainment Technology Co.,Ltd. Address before: 102425 1-4 / F 101 4 / F 08, building 46, Yanfu Road, Fangshan District, Beijing Applicant before: Beijing Aowei mutual Entertainment Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |