CN106651475A - 一种移动视频广告假量识别方法和系统 - Google Patents
一种移动视频广告假量识别方法和系统 Download PDFInfo
- Publication number
- CN106651475A CN106651475A CN201710097508.1A CN201710097508A CN106651475A CN 106651475 A CN106651475 A CN 106651475A CN 201710097508 A CN201710097508 A CN 201710097508A CN 106651475 A CN106651475 A CN 106651475A
- Authority
- CN
- China
- Prior art keywords
- terminal
- terminal unit
- video
- information
- false
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种移动视频广告假量识别方法和系统,涉及移动互联网广告领域,移动视频广告假量识别系统包括接收模块、特征提取模块、特征匹配模块和流量造假特征数据库,移动视频广告假量识别方法包括以下步骤:接收模块收到终端设备的软硬件信息和多个播放进度点的快照信息,特征提取模块将接收模块获取的终端设备的软硬件信息和多个播放进度点的快照信息转化为一定特征,并将一定特征传送给特征匹配模块分析匹配,特征匹配模块从流量造假特征数据库中搜索与一定特征相匹配的数据,进行分析检测,判断是否为假量,具有检测的维度和组合多样、能够优化流量造假特征数据库内的信息、提高假量识别的准确率的优点。
Description
技术领域
本发明涉及移动互联网广告领域,具体是一种移动视频广告假量识别方法和系统。
背景技术
时代的发展推动了社会的进步,PC时代的互联网入口为浏览器,在当前移动互联的井喷式发展下,移动终端设备已慢慢作为互联网主流入口。
APP广告,即以APP为载体的广告,是终端用户在使用其安装在移动终端上的APP时播放的广告。这种形式的广告已受到越来越多广告主的青睐。起初受限于移动网络环境,APP广告的形式主要是图文广告,随着WIFI、4G网络的普及,以视频作为展现形式的移动视频广告也慢慢火热起来。视频广告具有直观、感观性强的优势,已越来越受广告主的重视。
与此同时,在暴利的驱使下,大量渠道、媒体都或多或少存在着“假量”现象。所谓“假量”,即流量造假,是流量造假者为了能提高广告收益而千方百计作弊所得到的流量。例如,通过编写计算机脚本在移动终端或移动终端模拟器模拟真实用户观看或点击广告,通过技术手段修改终端硬件参数冒充多个不同用户观看或点击广告等。这种“假量”现象成为了广告主头痛的主要来源,如何辨别假量也是广告主根本需求之一。
现有的移动假量识别方法是通过查看IMEI(国际移动设备身份码)、IDFA(广告标识符)、IP、地域等信息进行筛查,具体为:
步骤1:终端设备IP是否存在于黑名单中;
步骤2:终端设备号是否存在于黑名单中;
步骤3:终端手机号码是否非法,是否在黑名单。
该方法存在以下不足:
1、数据来源单一,仅通过IP、终端设备号或终端手机号码等几个有限的数据来识别假量,流量造假者可以通过篡改硬件信息来轻松通过筛查,导致筛查准确率低;
2、特征识别依据相对孤立,仅依靠IP、终端设备号或终端手机号码的黑名单匹配方式,不能有效组建起多层次的特征组合;
3、技术生硬、只能不断扩充黑名单库,可优化空间不足。
发明内容
针对现有技术中存在的不足,本发明的目的在于提供一种移动视频广告假量识别方法和系统,其检测的维度和组合多样,流量造假特征数据库内信息的优化效果好,假量识别的准确率高。
为实现上述目的,本发明通过以下技术方案予以实现:
一种移动视频广告假量识别方法和系统,包括一种移动视频广告假量识别方法和系统,移动视频广告假量识别系统包括接收模块、特征提取模块、特征匹配模块和流量造假特征数据库,特征提取模块连接接收模块和特征匹配模块,特征匹配模块与流量造假特征数据库连接,移动视频广告假量识别方法包括以下步骤:
步骤1:获取终端设备的软硬件信息,传输到接收模块上,特征提取模块将接收模块收到的终端设备的软硬件信息提取一定特征,并将一定特征传送给特征匹配模块分析匹配;
步骤2:获取视频广告的播放期间的多个播放进度点的快照信息,传输到接收模块上,特征提取模块将接收模块收到的多个播放进度点的快照信息提取一定特征,并将一定特征传送给特征匹配模块分析匹配;
步骤3:所述特征匹配模块从流量造假特征数据库中搜索与一定特征相匹配的数据,进行分析检测,判断是否为假量。
进一步,所述流量被判断为假量时,特征匹配模块中的一定特征被录入到流量造假特征数据库中。
进一步,所述接收模块,用于对外部系统提供接口,并对外接收带有终端设备信息的分析请求。
进一步,所述流量造假特征数据库,用于存储各种流量造假的特征。
进一步,所述特征提取模块,用于终端设备的软硬件信息、在视频广告的播放期间的多个播放进度点的快照信息的分析请求中提取出特征数据形成一定特征。
进一步,所述特征匹配模块,用于从该流量造假特征数据库中搜索与一定特征进行匹配,求出匹配程度并对外输出分析结果。
进一步,所述获取终端设备的软硬件信息,传输到接收模块上,所述传输是指终端设备通过HTTP请求直接将所述终端设备的软硬件信息上传到接收模块中;或者先上传到其他服务器,再转发到传到接收模块中;或者先上传到其他服务器,其他服务器存储到数据库,并通知传到接收模块中到指定数据库获取数据。
进一步,所述终端设备的软硬件信息包括:终端设备品牌、终端设备型号、终端设备操作系统及其版本、终端设备IP地址、终端设备网络连接方式及其网络运营商、终端设备所支持的硬件传感器、终端设备屏幕分辨率及其屏幕密度、系统语言、时区。
进一步,所述多个播放进度点至少包括五个进度点,所述的五个进度点分别为视频播放开始、视频已播放四分之一、视频已播放一半、视频已播放四分之三、视频已播放完成。
进一步,所述多个播放进度点的快照信息,包括:终端设备的操作系统本地时间、捕获到的终端设备的硬件传感器信息、广告视频总时长、广告视频已播放时间、广告视频剩余时间、网络连接方式变更信息、APP激活挂起变更信息、终端用户的交互行为信息。
进一步,所述APP激活挂起变更信息,是指在广告视频播放期间,承载视频广告的APP由激活状态变更为挂起状态,或由挂起状态变更为激活状态。
进一步,所述捕获到的终端设备的硬件传感器信息,包括:加速度传感器信息、磁力传感器信息、方向传感器信息、陀螺仪传感器信息、光线感应传感器信息、压力传感器信息、温度传感器信息、接近传感器信息。
进一步,所述终端用户的交互行为信息,是指在广告视频播放期间,记录终端用户对广告视频或视频广告相关可视元素进行的交互动作,包括:终端用户对广告视频的音量调节行为、对广告视频的播放或暂停行为,对下载按钮的点击行为。
进一步,所述一定特征指的是在终端设备的软硬件信息、在视频广告的播放期间的多个播放进度点的快照信息的分析请求中提取的多个关键词组成的一个关键词的集合。
进一步,所述步骤3中分析检测包括初步检测和一般检测,初步检测包括:1)终端设备硬件初步异常检测;2)终端设备网络初步异常检测;3)终端用户行为初步异常检测;4)综合以上3步,计算出初步异常值,与假量阈值对比,得出检测结果。
进一步,所述终端设备硬件初步异常检测,包括:模拟器异常检测、硬件信息一致性异常检测、系统权限提升异常检测,通过各自的单独检测,最终合并算出终端设备硬件异常值,用公式表示为a=a1wa1+a2wa2+a3wa3,其中:a是指终端设备硬件异常值;a1是指模拟器异常值,wa1是指模拟器异常检测权重值;a2是指硬件信息一致性异常值,wa2是指硬件信息一致性异常检测权重值;a3是指系统权限提升异常值,wa3是指系统权限提升异常检测权重值。
进一步,所述模拟器异常检测,是指通过移动视频广告假量识别系统对接收到的终端软硬件信息和多个播放进度点的快照信息进行多维度匹配特征库,最终判断终端设备是否为模拟器,如果判断为模拟器,则标记为终端设备硬件异常,模拟器异常值a1加大;所述硬件信息一致性异常检测,是指通过移动视频广告假量识别系统对接收到的终端软硬件信息进行多维度匹配特征库,最终判断终端设备的硬件信息是否与该设备厂商发布的信息一致,如果判断为硬件信息不一致,则标记为终端设备硬件异常,硬件信息一致性异常值a2加大;所述系统权限提升异常检测,是指通过移动视频广告假量识别系统对接收到的终端软硬件信息进行多维度匹配特征库,最终判断终端设备的系统权限是否被提升过,如果判断终端设备的系统权限被提升过,则标记为终端设备硬件异常,系统权限提升异常值a3加大。
进一步,所述通过移动视频广告假量识别系统对接收到的终端软硬件信息和多个播放进度点的快照信息进行多维度匹配,是指从流量造假特征数据库收录到的多种数据对检测样本进行匹配。
进一步,所述终端设备网络异常检测,包括:网络运营商异常检测、IP地域异常检测。通过各自的单独检测,最终合并算出终端设备网络异常值,用公式表示为b=b1wb1+b2wb2,其中:b是指终端设备网络异常值;b1是指网络运营商异常值,wb1是指网络运营商异常检测权重值;b2是指IP地域异常值,wb2是指IP地域异常检测权重值。
进一步,所述网络运营商异常检测,是指通过所述假量识别系统对接收到的终端软硬件信息和多个播放进度点的快照信息进行多维度匹配特征库,最终判断终端设备的网络环境与其网络运营商是否一致,如果判断为网络运营商不一致,则标记为终端设备网络异常,网络运营商异常值b1加大;所述IP地域异常检测,是指通过所述假量识别系统对接收到的终端软硬件信息和多个播放进度点的快照信息,以及广告主所投放的该广告的目标地域进行多维度匹配特征库,最终判断终端设备的IP地域是否异常,如果判断为终端设备的IP地域出现异常,则标记为终端设备网络异常,IP地域异常值b2加大。
进一步,所述终端用户行为异常检测,是指通过所述假量识别系统对接收到的终端软硬件信息和多个播放进度快照信息进行多维度匹配特征库,最终判断终端用户行为是否存在异常,如果判断为终端用户行为异常,则标记为终端户行为异常,终端用户行为异常值c加大。
进一步,所述综合以上3步,计算出初步异常值,与假量阈值对比,具体为将所述终端设备硬件异常值a、终端设备网络异常值b,终端用户行为异常值c三个异常值乘以各自对应的异常检测权重值wa、wb、wc,然后取和,其值大于假量阈值k1时,则判断该流量为假量,用公式表示为awa+bwb+cwc-k1>0,其中:a是指终端设备硬件异常值,wa是指终端设备硬件异常检测权重值;b是指终端设备网络异常值,wb是指终端设备网络异常检测权重值;c是指终端用户行为异常值,wc是指终端用户行为异常检测权重值;k1是指假量阈值。
进一步,所述一般检测是指针对一个APP在一段时间内一类移动终端的视频广告观看行为是否为假量的检测。
进一步,所述一般检测包括终端机型分布异常检测、终端设备号分布异常检测、终端设备号厂商分布异常检测和网络运营商分布异常检测。
进一步,所述一般检测通过终端机型分布异常检测、终端设备号分布异常检测、终端设备号厂商分布异常检测、网络运营商分布异常检测各自的单独相似度检测,最终合并算出终端设备的综合相似度值d,用公式表示为d=d1wd1+d2wd2+d3wd3+d4wd4,其中:d是指终端设备的综合相似度值;d1是指终端机型分布相似度值,wd1是指终端机型分布相似度权重值;d2是指终端设备号分布相似度值,wd2是指终端设备号分布相似度权重值;d3是指终端设备号厂商分布相似度值,wd3是指终端设备号厂商分布相似度权重值;d4是指网络运营商分布相似度值,wd4是指网络运营商分布相似度权重值。
进一步,所述一般检测中的分布,指地域分布,地域分布包括:国内的省份分布和海外市场的分布。
进一步,所述终端机型分布异常检测,是指终端机型分布是否符合先验数据,终端机型出货量的比例是否符合先验数据。具体为通过获取一段时间内的一类终端设备的地域分布数据与该类终端设备的机型先验数据,通过相似度函数计算出所述一段时间内的一类移动终端的地域分布数据与先验数据的相似度值d1,数据值越大,相似度值d1越小。
进一步,所述终端设备号分布异常检测,是指终端设备号的地域分布是否符合先验数据。具体为通过获取一段时间内的一类移动终端的终端的地域分布数据与该类终端设备所对应的设备号先验数据,通过相似度函数计算出所述一段时间内的一类移动终端的地域分布数据与先验数据的相似度值d2,数据值越大,相似度值d2越小。
进一步,所述终端设备号厂商分布异常检测,是指终端设备号厂商的地域分布是否符合先验数据。具体为通过获取一段时间内的一类终端设备的地域分布数据与该类终端设备所对应的设备号厂商先验数据,通过相似度函数计算出所述一段时间内的一类移动终端的地域分布数据与先验数据的相似度值d3,数据值越大,相似度值d3越小。
进一步,所述网络运营商分布异常检测,是指网络运营商的数据分布是否足够随机,是否符合国内或海外网络运营商的正常分布,具体为通过获取一段时间内的一类终端设备所对应的网络运营商地域分布数据与该类终端设备所对应的网络运营商先验数据,通过相似度函数计算出所述一段时间内的一类移动终端所对应的网络运营商地域分布数据与先验数据的相似度值d4,数据值越大,相似度值d4越小。
进一步,所述终端设备的综合相似度值d大于相似度阈值k2,说明分布出现异常。
综上所述,本发明的有益效果是:本发明检测时的维度和组合多样,伪造数据难度高,使用起来更加的安全可靠,同时流量造假特征数据库内的信息在不断的被优化,假量识别的准确率得到了有效的提高。
附图说明
图1是本发明移动视频广告移动视频广告假量识别系统的结构示意图。
具体实施方式
下面将结合附图以及具体实施方式对本发明作进一步的说明:
如图1所示,一种移动视频广告假量识别方法和系统中移动视频广告假量识别系统包括接收模块、特征提取模块、特征匹配模块和流量造假特征数据库,特征提取模块连接接收模块和特征匹配模块,特征匹配模块与流量造假特征数据库连接。
移动视频广告假量识别方法包括以下步骤:
步骤1:获取终端设备的软硬件信息,传输到接收模块上,特征提取模块将接收模块收到的终端设备的软硬件信息提取一定特征,并将一定特征传送给特征匹配模块分析匹配;
步骤2:获取视频广告的播放期间的多个播放进度点的快照信息,传输到接收模块上,特征提取模块将接收模块收到的多个播放进度点的快照信息提取一定特征,并将一定特征传送给特征匹配模块分析匹配;
步骤3:所述特征匹配模块从流量造假特征数据库中搜索与一定特征相匹配的数据,进行分析检测,具体的分析检测包括初步检测和一般检测,初步检测包括:
1)终端设备硬件初步异常检测,终端设备硬件初步异常检测,包括:模拟器异常检测、硬件信息一致性异常检测、系统权限提升异常检测,通过各自的单独检测,最终合并算出终端设备硬件异常值,用公式表示为a=a1wa1+a2wa2+a3wa3,其中:a是指终端设备硬件异常值;a1是指模拟器异常值,wa1是指模拟器异常检测权重值;a2是指硬件信息一致性异常值,wa2是指硬件信息一致性异常检测权重值;a3是指系统权限提升异常值,wa3是指系统权限提升异常检测权重值;
2)终端设备网络初步异常检测,终端设备网络异常检测,包括:网络运营商异常检测、IP地域异常检测。通过各自的单独检测,最终合并算出终端设备网络异常值,用公式表示为b=b1wb1+b2wb2,其中:b是指终端设备网络异常值;b1是指网络运营商异常值,wb1是指网络运营商异常检测权重值;b2是指IP地域异常值,wb2是指IP地域异常检测权重值;
3)终端用户行为初步异常检测,是指通过所述假量识别系统对接收到的终端软硬件信息和多个播放进度快照信息进行多维度匹配特征库,最终判断终端用户行为是否存在异常,如果判断为终端用户行为异常,则标记为终端户行为异常,终端用户行为异常值c加大;
4)综合以上3步,计算出初步异常值,与假量阈值对比,得出检测结果,具体为将所述终端设备硬件异常值a、终端设备网络异常值b,终端用户行为异常值c三个异常值乘以各自对应的异常检测权重值wa、wb、wc,然后取和,其值大于假量阈值k1时,则判断该流量为假量,用公式表示为awa+bwb+cwc-k1>0,其中:a是指终端设备硬件异常值,wa是指终端设备硬件异常检测权重值;b是指终端设备网络异常值,wb是指终端设备网络异常检测权重值;c是指终端用户行为异常值,wc是指终端用户行为异常检测权重值;k1是指假量阈值。
一般检测一般检测是指针对一个APP在一段时间内一类移动终端的视频广告观看行为是否为假量的检测,通过终端机型分布异常检测、终端设备号分布异常检测、终端设备号厂商分布异常检测、网络运营商分布异常检测各自的单独相似度检测,最终合并算出终端设备的综合相似度值d,用公式表示为d=d1wd1+d2wd2+d3wd3+d4wd4,其中:d是指终端设备的综合相似度值;d1是指终端机型分布相似度值,wd1是指终端机型分布相似度权重值;d2是指终端设备号分布相似度值,wd2是指终端设备号分布相似度权重值;d3是指终端设备号厂商分布相似度值,wd3是指终端设备号厂商分布相似度权重值;d4是指网络运营商分布相似度值,wd4是指网络运营商分布相似度权重值。
终端设备的综合相似度值d大于相似度阈值k2,即d-k2>0时说明分布出现异常,流量被判定为假量,特征匹配模块中的一定特征被录入到流量造假特征数据库中形成新的特征数据记录。反之d-k2≤0,流量被判定为正常。
其中所述接收模块,用于对外部系统提供接口,并对外接收带有终端设备信息的分析请求。
所述流量造假特征数据库,用于存储各种流量造假的特征,为特征匹配模块提供流量造假特征数据。
所述特征提取模块,用于终端设备的软硬件信息、在视频广告的播放期间的多个播放进度点的快照信息的分析请求中提取出特征数据形成一定特征。
所述特征匹配模块,用于从该流量造假特征数据库中搜索与一定特征匹配,求出匹配程度并对外输出分析结果。
所述获取终端设备的软硬件信息,传输到接收模块上,所述传输是指终端设备通过HTTP请求直接将所述终端设备的软硬件信息上传到接收模块中;或者先上传到其他服务器,再转发到传到接收模块中;或者先上传到其他服务器,其他服务器存储到数据库,并通知传到接收模块中到指定数据库获取数据。
所述终端设备的软硬件信息包括:终端设备品牌、终端设备型号、终端设备操作系统及其版本、终端设备IP地址、终端设备网络连接方式及其网络运营商、终端设备所支持的硬件传感器、终端设备屏幕分辨率及其屏幕密度、系统语言、时区。
所述多个播放进度点至少包括五个进度点,所述的五个进度点分别为视频播放开始、视频已播放四分之一、视频已播放一半、视频已播放四分之三、视频已播放完成。
所述多个播放进度点的快照信息,包括:终端设备的操作系统本地时间、捕获到的终端设备的硬件传感器信息、广告视频总时长、广告视频已播放时间、广告视频剩余时间、网络连接方式变更信息、APP激活挂起变更信息、终端用户的交互行为信息。
所述APP激活挂起变更信息,是指在广告视频播放期间,承载视频广告的APP由激活状态变更为挂起状态,或由挂起状态变更为激活状态。
所述捕获到的终端设备的硬件传感器信息,包括:加速度传感器信息、磁力传感器信息、方向传感器信息、陀螺仪传感器信息、光线感应传感器信息、压力传感器信息、温度传感器信息、接近传感器信息。
所述终端用户的交互行为信息,是指在广告视频播放期间,记录终端用户对广告视频或视频广告相关可视元素进行的交互动作,包括:终端用户对广告视频的音量调节行为、对广告视频的播放或暂停行为,对下载按钮的点击行为。
所述一定特征指的是在终端设备的软硬件信息、在视频广告的播放期间的多个播放进度点的快照信息的分析请求中提取的多个关键词组成的一个关键词的集合。
所述模拟器异常检测,是指通过移动视频广告假量识别系统对接收到的终端软硬件信息和多个播放进度点的快照信息进行多维度匹配特征库,最终判断终端设备是否为模拟器,如果判断为模拟器,则标记为终端设备硬件异常,模拟器异常值a1加大;所述硬件信息一致性异常检测,是指通过移动视频广告假量识别系统对接收到的终端软硬件信息进行多维度匹配特征库,最终判断终端设备的硬件信息是否与该设备厂商发布的信息一致,如果判断为硬件信息不一致,则标记为终端设备硬件异常,硬件信息一致性异常值a2加大;所述系统权限提升异常检测,是指通过移动视频广告假量识别系统对接收到的终端软硬件信息进行多维度匹配特征库,最终判断终端设备的系统权限是否被提升过,如果判断终端设备的系统权限被提升过,则标记为终端设备硬件异常,系统权限提升异常值a3加大。
所述通过移动视频广告假量识别系统对接收到的终端软硬件信息和多个播放进度点的快照信息进行多维度匹配,是指从流量造假特征数据库收录到的多种数据对检测样本进行匹配。
所述网络运营商异常检测,是指通过所述假量识别系统对接收到的终端软硬件信息和多个播放进度点的快照信息进行多维度匹配特征库,最终判断终端设备的网络环境与其网络运营商是否一致,如果判断为网络运营商不一致,则标记为终端设备网络异常,网络运营商异常值b1加大;所述IP地域异常检测,是指通过所述假量识别系统对接收到的终端软硬件信息和多个播放进度点的快照信息,以及广告主所投放的该广告的目标地域进行多维度匹配特征库,最终判断终端设备的IP地域是否异常,如果判断为终端设备的IP地域出现异常,则标记为终端设备网络异常,IP地域异常值b2加大。
进一步,所述一般检测中的分布,指地域分布,地域分布包括:国内的省份分布和海外市场的分布。
进一步,所述终端机型分布异常检测,是指终端机型分布是否符合先验数据,终端机型出货量的比例是否符合先验数据。具体为通过获取一段时间内的一类终端设备的地域分布数据与该类终端设备的机型先验数据,通过相似度函数计算出所述一段时间内的一类移动终端的地域分布数据与先验数据的相似度值d1,数据值越大,相似度值d1越小。例如,时间设为1天内,通过欧氏距离求出相似度值d1。
进一步,所述终端设备号分布异常检测,是指终端设备号的地域分布是否符合先验数据。具体为通过获取一段时间内的一类移动终端的终端的地域分布数据与该类终端设备所对应的设备号先验数据,通过相似度函数计算出所述一段时间内的一类移动终端的地域分布数据与先验数据的相似度值d2,数据值越大,相似度值d2越小。例如,时间设为1天内,通过欧氏距离求出相似度值d2。
进一步,所述终端设备号厂商分布异常检测,是指终端设备号厂商的地域分布是否符合先验数据。具体为通过获取一段时间内的一类终端设备的地域分布数据与该类终端设备所对应的设备号厂商先验数据,通过相似度函数计算出所述一段时间内的一类移动终端的地域分布数据与先验数据的相似度值d3,数据值越大,相似度值d3越小。例如,时间设为1天内,通过欧氏距离求出相似度值d3。
进一步,所述网络运营商分布异常检测,是指网络运营商的数据分布是否足够随机,是否符合国内或海外网络运营商的正常分布,具体为通过获取一段时间内的一类终端设备所对应的网络运营商地域分布数据与该类终端设备所对应的网络运营商先验数据,通过相似度函数计算出所述一段时间内的一类移动终端所对应的网络运营商地域分布数据与先验数据的相似度值d4,数据值越大,相似度值d4越小。例如,时间设为1天内,通过欧氏距离求出相似度值d4。
该移动视频广告假量识别方法和系统在检测时的维度和组合多样,伪造数据难度高,使用起来更加的安全可靠;在判断流量是否为假量时,如果流量为假量,特征匹配模块中的一定特征被录入到流量造假特征数据库中形成新的特征数据记录,从而达到不断优化流量造假特征数据库内信息,提高假量识别准确率的目的。
对于本领域的技术人员来说,可根据以上技术方案以及构思,做出其他各种相应的改变以及变形,而所有的这些改变和变形都应该属于本发明权利要求的保护范围之内。
Claims (10)
1.一种移动视频广告假量识别方法和系统,其特征在于:移动视频广告假量识别系统包括接收模块、特征提取模块、特征匹配模块和流量造假特征数据库,特征提取模块连接接收模块和特征匹配模块,特征匹配模块与流量造假特征数据库连接,移动视频广告假量识别方法包括以下步骤:
步骤1:获取终端设备的软硬件信息,传输到接收模块上,特征提取模块将接收模块收到的终端设备的软硬件信息提取一定特征,并将一定特征传送给特征匹配模块分析匹配;
步骤2:获取视频广告的播放期间的多个播放进度点的快照信息,传输到接收模块上,特征提取模块将接收模块收到的多个播放进度点的快照信息提取一定特征,并将一定特征传送给特征匹配模块分析匹配;
步骤3:所述特征匹配模块从流量造假特征数据库中搜索与一定特征相匹配的数据,进行分析检测,判断是否为假量。
2.根据权利要求1所述的移动视频广告假量识别方法和系统,其特征在于:所述获取终端设备的软硬件信息,传输到接收模块上,所述传输是指终端设备通过HTTP请求直接将所述终端设备的软硬件信息上传到接收模块中;或者先上传到其他服务器,再转发到传到接收模块中;或者先上传到其他服务器,其他服务器存储到数据库,并通知传到接收模块中到指定数据库获取数据。
3.根据权利要求1或2所述的移动视频广告假量识别方法和系统,其特征在于:所述终端设备的软硬件信息包括:终端设备品牌、终端设备型号、终端设备操作系统及其版本、终端设备IP地址、终端设备网络连接方式及其网络运营商、终端设备所支持的硬件传感器、终端设备屏幕分辨率及其屏幕密度、系统语言、时区。
4.根据权利要求1所述的移动视频广告假量识别方法和系统,其特征在于:所述多个播放进度点至少包括五个进度点,所述的五个进度点分别为视频播放开始、视频已播放四分之一、视频已播放一半、视频已播放四分之三、视频已播放完成。
5.根据权利要求1所述的移动视频广告假量识别方法和系统,其特征在于:所述多个播放进度点的快照信息,包括:终端设备的操作系统本地时间、捕获到的终端设备的硬件传感器信息、广告视频总时长、广告视频已播放时间、广告视频剩余时间、网络连接方式变更信息、APP激活挂起变更信息、终端用户的交互行为信息。
6.根据权利要求4所述的移动视频广告假量识别方法和系统,其特征在于:所述捕获到的终端设备的硬件传感器信息,包括:加速度传感器信息、磁力传感器信息、方向传感器信息、陀螺仪传感器信息、光线感应传感器信息、压力传感器信息、温度传感器信息、接近传感器信息。
7.根据权利要求4所述的移动视频广告假量识别方法和系统,其特征在于:所述终端用户的交互行为信息,是指在广告视频播放期间,记录终端用户对广告视频或视频广告相关可视元素进行的交互动作,包括:终端用户对广告视频的音量调节行为、对广告视频的播放或暂停行为,对下载按钮的点击行为。
8.根据权利要求1所述的移动视频广告假量识别方法和系统,其特征在于:所述一定特征指的是在终端设备的软硬件信息、在视频广告的播放期间的多个播放进度点的快照信息的分析请求中提取的多个关键词组成的一个关键词的集合。
9.根据权利要求1所述的移动视频广告假量识别方法和系统,其特征在于:所述步骤3中分析检测包括初步检测和一般检测,初步检测包括:1)终端设备硬件初步异常检测;2)终端设备网络初步异常检测;3)终端用户行为初步异常检测;4)综合以上3步,计算出初步异常值,与假量阈值对比,得出检测结果。
10.根据权利要求9所述的移动视频广告假量识别方法和系统,其特征在于:所述一般检测包括终端机型分布异常检测、终端设备号分布异常检测、终端设备号厂商分布异常检测和网络运营商分布异常检测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710097508.1A CN106651475A (zh) | 2017-02-22 | 2017-02-22 | 一种移动视频广告假量识别方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710097508.1A CN106651475A (zh) | 2017-02-22 | 2017-02-22 | 一种移动视频广告假量识别方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106651475A true CN106651475A (zh) | 2017-05-10 |
Family
ID=58844697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710097508.1A Pending CN106651475A (zh) | 2017-02-22 | 2017-02-22 | 一种移动视频广告假量识别方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106651475A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108053247A (zh) * | 2017-12-15 | 2018-05-18 | 北京知道创宇信息技术有限公司 | 一种假量识别模型生成方法、假量识别方法及计算设备 |
CN109089173A (zh) * | 2018-10-08 | 2018-12-25 | 四川长虹电器股份有限公司 | 一种检测智能电视终端广告投放的方法及系统 |
CN109167698A (zh) * | 2018-07-10 | 2019-01-08 | 百度在线网络技术(北京)有限公司 | 人机流量鉴别方法、装置、计算机设备及存储介质 |
CN110381342A (zh) * | 2018-04-13 | 2019-10-25 | 武汉斗鱼网络科技有限公司 | 一种信息处理方法及相关设备 |
CN110381377A (zh) * | 2019-07-23 | 2019-10-25 | 秒针信息技术有限公司 | 一种资讯播放的检测方法、装置、电子设备及存储介质 |
CN110380843A (zh) * | 2018-04-13 | 2019-10-25 | 武汉斗鱼网络科技有限公司 | 一种信息处理方法及相关设备 |
CN110770724A (zh) * | 2017-08-30 | 2020-02-07 | 深圳市欢太科技有限公司 | 刷量资源确定方法及装置 |
CN111105259A (zh) * | 2018-10-29 | 2020-05-05 | 北京奇虎科技有限公司 | 一种用户识别方法、装置、电子设备和存储介质 |
WO2020257991A1 (zh) * | 2019-06-24 | 2020-12-30 | 深圳市欢太科技有限公司 | 用户识别方法及相关产品 |
CN112288499A (zh) * | 2020-11-20 | 2021-01-29 | 广州欢网科技有限责任公司 | 一种实现反广告刷量的方法、可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714057A (zh) * | 2012-09-28 | 2014-04-09 | 北京亿赞普网络技术有限公司 | 一种在线网页信息的实时监测方法和装置 |
CN104050178A (zh) * | 2013-03-13 | 2014-09-17 | 北京思博途信息技术有限公司 | 一种互联网监测反作弊方法和装置 |
CN106022834A (zh) * | 2016-05-24 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 广告反作弊方法及装置 |
-
2017
- 2017-02-22 CN CN201710097508.1A patent/CN106651475A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714057A (zh) * | 2012-09-28 | 2014-04-09 | 北京亿赞普网络技术有限公司 | 一种在线网页信息的实时监测方法和装置 |
CN104050178A (zh) * | 2013-03-13 | 2014-09-17 | 北京思博途信息技术有限公司 | 一种互联网监测反作弊方法和装置 |
CN106022834A (zh) * | 2016-05-24 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 广告反作弊方法及装置 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110770724A (zh) * | 2017-08-30 | 2020-02-07 | 深圳市欢太科技有限公司 | 刷量资源确定方法及装置 |
CN108053247A (zh) * | 2017-12-15 | 2018-05-18 | 北京知道创宇信息技术有限公司 | 一种假量识别模型生成方法、假量识别方法及计算设备 |
CN110381342A (zh) * | 2018-04-13 | 2019-10-25 | 武汉斗鱼网络科技有限公司 | 一种信息处理方法及相关设备 |
CN110380843A (zh) * | 2018-04-13 | 2019-10-25 | 武汉斗鱼网络科技有限公司 | 一种信息处理方法及相关设备 |
CN110380843B (zh) * | 2018-04-13 | 2022-12-02 | 武汉斗鱼网络科技有限公司 | 一种信息处理方法及相关设备 |
CN109167698A (zh) * | 2018-07-10 | 2019-01-08 | 百度在线网络技术(北京)有限公司 | 人机流量鉴别方法、装置、计算机设备及存储介质 |
CN109089173A (zh) * | 2018-10-08 | 2018-12-25 | 四川长虹电器股份有限公司 | 一种检测智能电视终端广告投放的方法及系统 |
CN109089173B (zh) * | 2018-10-08 | 2020-12-15 | 四川长虹电器股份有限公司 | 一种检测智能电视终端广告投放的方法及系统 |
CN111105259A (zh) * | 2018-10-29 | 2020-05-05 | 北京奇虎科技有限公司 | 一种用户识别方法、装置、电子设备和存储介质 |
CN111105259B (zh) * | 2018-10-29 | 2024-04-02 | 北京奇虎科技有限公司 | 一种用户识别方法、装置、电子设备和存储介质 |
WO2020257991A1 (zh) * | 2019-06-24 | 2020-12-30 | 深圳市欢太科技有限公司 | 用户识别方法及相关产品 |
CN110381377A (zh) * | 2019-07-23 | 2019-10-25 | 秒针信息技术有限公司 | 一种资讯播放的检测方法、装置、电子设备及存储介质 |
CN110381377B (zh) * | 2019-07-23 | 2021-07-27 | 秒针信息技术有限公司 | 一种资讯播放的检测方法、装置、电子设备及存储介质 |
CN112288499A (zh) * | 2020-11-20 | 2021-01-29 | 广州欢网科技有限责任公司 | 一种实现反广告刷量的方法、可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106651475A (zh) | 一种移动视频广告假量识别方法和系统 | |
US11570495B2 (en) | Methods and apparatus for crediting a media presentation device | |
US11423437B2 (en) | Methods and apparatus to detect advertisements embedded in online media | |
CN104429091B (zh) | 用于识别媒体的方法和装置 | |
CN105165016B (zh) | 区分本地媒体与溢出媒体的方法、装置及存储介质 | |
AU2013204946B2 (en) | Methods and apparatus to measure audience engagement with media | |
CN110475155B (zh) | 直播视频热度状态识别方法、装置、设备及可读介质 | |
WO2016032555A1 (en) | Methods and apparatus to identify remote presentation of streaming media | |
WO2009152157A2 (en) | Measuring exposure to media | |
CN110019954A (zh) | 一种作弊用户的识别方法及系统 | |
US9148695B2 (en) | Methods and apparatus to collect media identifying data | |
CN104160714A (zh) | 内容提供系统、内容提供方法、内容编辑装置、内容解析系统、以及播送站id放音装置 | |
US11558661B2 (en) | Methods and apparatus to identify streaming media sources | |
WO2009069840A1 (en) | Method and system for providing information based on logo included in digital contents | |
US11245960B2 (en) | Methods and apparatus of media device detection for minimally invasive media meters | |
AU2015255256B2 (en) | Methods and apparatus for crediting a media presentation device | |
CN105100837A (zh) | 基于手机的广告投放效果评价方法及系统 | |
US20160088367A1 (en) | Program event detection method, apparatus, and program data transmission system | |
TW201436544A (zh) | 一種基於語音辨識之收視率統計系統及方法 | |
AU2016213749A1 (en) | Methods and apparatus to characterize households with media meter data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170510 |