CN112866142A - 移动互联网真实流量识别方法和装置 - Google Patents
移动互联网真实流量识别方法和装置 Download PDFInfo
- Publication number
- CN112866142A CN112866142A CN202110046457.6A CN202110046457A CN112866142A CN 112866142 A CN112866142 A CN 112866142A CN 202110046457 A CN202110046457 A CN 202110046457A CN 112866142 A CN112866142 A CN 112866142A
- Authority
- CN
- China
- Prior art keywords
- information
- current
- data
- flow
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
- H04L47/2483—Traffic characterised by specific attributes, e.g. priority or QoS involving identification of individual flows
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Navigation (AREA)
Abstract
本申请涉及一种移动互联网真实流量识别方法和装置,其中方法包括:在接收到触发信号后,收集当前触发的电子终端的设备信息;基于当前收集到的设备信息,由数据库中获取相应的历史信息;将当前收集到的设备信息添加至对应的历史信息中,得到综合信息;对综合信息进行区间划分,根据区间划分结果分析判断各区间之间的规律,并根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量。其通过对当前收集到的设备信息与之前存储的历史信息进行综合,实现了从当前收集到的设备信息为基础,结合历史信息为参考,使得最终的识别结果更加准确。
Description
技术领域
本申请涉及移动互联网技术领域,尤其涉及一种移动互联网真实流量识别方法和装置。
背景技术
移动互联网发展越来越快,技术也在同步发展,每种新事物的发展都会带来双面性,移动用户的流量也越来越有价值,同时也引起了很多企业开始使用技术手段伪造用户流量进行售卖。通常,技术工程师的工作基本上都是电脑操作,移动互联网APP的开发也基本是在电脑上处理,相关的官方会提供各种调试模拟工具,而基于调试模拟工具所产生的模拟的用户流量信息和真实用户的流量信息差异很小,识别难度很大,对于广告投放的企业客户来说,不能有效识别模拟用户流量和真实用户流量的话,很容易导致广告投放失误从而造成经济损失。
发明内容
有鉴于此,本申请提出了一种移动互联网真实流量识别方法,能够有效实现真实流量的识别,从而在进行广告投放时能够更加精准的进行投放。
根据本申请的一方面,提供了一种移动互联网真实流量识别方法,包括:
在接收到触发信号后,收集当前触发的电子终端的设备信息;其中,所述设备信息包括所述电子终端的当前陀螺仪数据、当前屏幕亮度、当前电量和当前是否充电中的至少一种;
基于当前收集到的所述设备信息,由数据库中获取相应的历史信息;
将当前收集到的所述设备信息添加至对应的所述历史信息中,得到综合信息;
对所述综合信息进行区间划分,根据区间划分结果分析判断各区间之间的规律,并根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量。
在一种可能的实现方式中,根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量时,包括:
在各区间之间的规律呈预设规律时,识别出当前触发信号产生的流量为异常流量;
在各区间之间的规律未呈现出所述预设规律时,则识别出当前触发信息所产生的流量为真实流量;
其中,所述预设规律包括以下任意一种:
对所述综合信息划分后所得到的各区间之间的大小关系符合预设关系;
对所述综合信息划分后得到的各区间之间的数值变化符合预设变化;
对所述综合信息划分后得到的各区间中存在预设个数的区间的数值均在同一预设取值范围内。
在一种可能的实现方式中,基于当前收集到的所述设备信息,由数据库中获取相应的历史信息,包括:
将当前收集到的所述设备信息进行格式组装,并将所述触发信号所触发的触发对象的唯一标识封装至所述设备信息中;
根据所述唯一标识,由所述数据库中提取出与相应的历史信息;
其中,所述触发对象包括所述电子终端和安装在所述电子终端上的应用中的任意一种。
在一种可能的实现方式中,将当前收集到的所述设备信息添加至所述历史信息中得到综合信息时,包括:将当前收集到的所述设备信息按照不同属性添加至对应的所述历史信息中,得到多组综合信息;
其中,所述当前陀螺仪数据添加至所述历史信息中所记录的陀螺仪历史数据中,得到相应的陀螺仪数据组;
所述当前屏幕亮度添加至所述历史信息中所记录的屏幕亮度历史数据中,得到相应的屏幕亮度数据组;
所述当前电量添加至所述历史信息中所记录的电量历史数据中,得到相应的当前电量数据组;
所述当前是否充电添加至所述历史信息中所记录的充电历史数据中,得到相应的是否充电数据组。
在一种可能的实现方式中,将当前收集到的所述设备信息添加至对应的所述历史信息中,得到综合信息后,还包括:
确定所述综合信息的数据维度;对数据维度为二维以上的综合信息进行区间划分,得到相应的区间划分结果;
对数据维度为一维的综合信息,使用线性回归算法进行预测分析得到相应的分析结果。
在一种可能的实现方式中,对数据维度为二维以上的综合信息进行区间划分时,基于N宫格的形式进行;
其中,基于N宫格的形式对所述综合信息进行区间划分时,根据所述N宫格中每个宫格所对应的数据区间,将所述综合信息中的各信息数据对应划分至相应的宫格内。
在一种可能的实现方式中,在所述设备信息的维度为二维以上时,基于N宫格的形式对所述综合信息进行区间划分后,根据区间划分结果分析判断各区间之间的规律,包括:
对所述N宫格中各宫格内的信息数据进行数学逻辑运算,得到相应的运算结果,对各运算结果进行统计分析得到各区间之间的规律;
其中,所述数学逻辑运算包括均值、总数和、方差和均差中的任意一种。
在一种可能的实现方式中,在所述设备信息包括所述当前陀螺仪数据、所述当前屏幕亮度、所述当前电量和所述当前是否充电中的两种以上时,还包括:
分析判断不同种类的所述设备信息所对应的综合信息中各区间之间的规律,得到不同种类的所述设备信息所对应的流量识别结果;
在所述流量识别结果中,存在两个以上的流量识别结果为异常流量时,得出当前触发信息所产生的流量最终为异常流量。
在一种可能的实现方式中,还包括:
获取当前触发信号所产生的流量是否为真实流量的反馈结果;
在所述反馈结果为当前触发信号所产生的流量为真实流量时,进行广告匹配;
根据所述广告匹配的结果,接收相应的广告信息并推送相应的广告至所述电子终端,以在所述电子终端展示所述广告;
在展示所述广告时,收集所述电子终端的第二陀螺仪数据和当前时间戳,以及对所述广告点击时的点击坐标数据;
根据所述当前时间戳获取所述广告的当前曝光时间差;其中,所述当前曝光时间差为由所述触发信号被触发至展示所述广告时的时间;
基于所述第二陀螺仪数据、所述曝光时间差和所述点击坐标数据,由所述数据库中提取相应的第二历史信息;
将所述第二陀螺仪数据、所述曝光时间差和所述点击坐标数据添加至对应的所述第二历史信息中得到对应的第二综合信息;
对各所述第二综合信息进行区间划分,并根据区间划分结果对展示所述广告时所产生的流量进行是否为真实流量的识别。
根据本申请的另一方面,还提供了一种移动互联网真实流量识别装置,包括:信息收集模块、历史信息获取模块、信息添加模块和流量识别模块;
所述信息收集模块,被配置为在接收到触发信号后,收集当前触发的电子终端的设备信息;其中,所述设备信息包括所述电子终端的当前陀螺仪数据、当前屏幕亮度、当前电量和当前是否充电中的至少一种;
所述历史信息获取模块,被配置为基于当前收集到的所述设备信息,由数据库中获取相应的历史信息;
所述信息添加模块,被配置为将当前收集到的所述设备信息添加至对应的所述历史信息中,得到综合信息;
所述流量识别模块,被配置为对所述综合信息进行区间划分,根据区间划分结果分析判断各区间之间的规律,并根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量。
通过在接收到触发信号后及时收集当前触发的电子终端的相关设备信息(即,电子终端的当前陀螺仪数据A1、当前屏幕亮度B1、当前电量C1和当前是否充电D1中的至少一种),并根据当前触发信号所触发的对象,由数据库中提取出对应的历史信息,进而将当前收集到的电子终端的设备信息与由数据库中提取出的相关历史信息综合到一起,并通过对综合后的信息进行区间划分,分析判断划分后各区间之间的规律,由各区间之间的规律进行当前触发信号所产生的流量是否为真实流量的识别判断,实现了对移动互联网中真实流量的自动识别功能。同时,在进行真实流量的自动识别过程中,对当前收集到的设备信息与之前存储的历史信息进行综合,对综合后的信息进行统计分析,实现了从当前收集到的设备信息为基础,结合历史信息为参考,使得最终的识别结果更加准确。
根据下面参考附图对示例性实施例的详细说明,本申请的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本申请的示例性实施例、特征和方面,并且用于解释本申请的原理。
图1示出本申请一实施例的移动互联网真实流量识别方法的流程图;
图2示出用于实现本申请一实施例的移动互联网真实流量识别方法时所涉及到的各主体之间的连接关系图;
图3示出本申请另一实施例的移动互联网真实流量识别方法的流程示意图;
图4示出本申请一实施例的移动互联网真实流量识别方法中基于九宫格对综合信息进行区间划分时的示意图;
图5示出本申请一实施例的移动互联网真实流量识别装置的结构框图。
具体实施方式
以下将参考附图详细说明本申请的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本申请,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本申请的主旨。
图1示出根据本申请一实施例的移动互联网真实流量识别方法的流程图。如图1所示,该方法包括:步骤S100,在接收到触发信号后,收集当前触发的电子终端的设备信息。此处,需要说明的是,该触发信号可以为对电子终端的触发,也可以为对安装在电子终端中的某一款应用软件的触发。即,触发信号所触发的触发对象可以为某一电子终端,也可以为安装在电子终端上的某一款APP。电子终端可以为手机、平板电脑和台式电脑等电子设备。同时,所收集到的设备信息包括电子终端的当前陀螺仪数据A1、当前屏幕亮度B1、当前电量C1和当前是否充电D1中的至少一种。
步骤S200,基于当前收集到的设备信息,由数据库中获取与当前触发信号所触发的触发对象相应的历史信息。此处,需要指出的是,在本申请实施例的方法中,该数据库中存储有多个被触发对象被触发时的历史信息。具体的,可以通过大数据技术来实现数据库的建立。即,通过大数据技术,收集不同的电子设备和APP被触发时的相关设备信息,并将收集到的这些信息按照一定的格式进行分门别类的存储。
其中,由于数据库中所记录的数据量很多,因此为便于数据的查找匹配,在进行各设备信息的存储时,对于每一组设备信息均对应标记唯一的标识,该标识用于表征该组数据所对应的被触发对象。即,对于不同的电子终端,通过各电子终端的唯一标识对其被触发时的设备信息进行标记,对于电子终端中安装的不同应用,同样也通过该APP的唯一标识对其被触发时的相关设备信息进行标记。
对应的,由数据库中获取与当前触发信号所触发的触发对象相应的历史信息时,可以根据被触发对象的唯一标识进行信息匹配。即,在接收到触发信号后,确定该触发信号所触发对象的唯一标识,并基于所确定的唯一标识由所述数据库中提取出该标识下的历史信息。
如:在当前触发信号对应的触发对象为电子终端时,该唯一标识可以为电子终端的ID,在收集电子终端的设备信息时,该设备信息以该电子终端的ID作为标识,并根据该ID由数据库中提取出标记有相同ID的历史信息。
在当前触发信号对应的触发对象为安装在电子终端上的APP时,则该唯一标识可以为该APP的唯一标识符,此时所收集到的设备信息则以该电子终端的ID以及该APP的唯一标识符作为标记,由数据库中提取出同时标记有该ID和该APP的唯一标识符的历史信息。
进而,通过步骤S300,将当前收集到的设备信息添加至对应的历史信息中,得到综合信息。即,将当前收集到的设备信息添加到由数据库中提取出来的对应的历史信息中,从而将当前的设备信息与对应的历史信息进行组合。
最后,再通过步骤S400,对综合信息进行区间划分,根据区间划分结果分析判断各区间之间的规律,并根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量。
即,将当前收集到的设备信息融合到相应的历史信息中后,在对融合后的综合信息进行区间划分,将综合信息划分为多个不同的区间,然后再根据各个区间之间的规律对当前触发信号所产生的流量是否为真实流量进行判断识别。
由此,本申请实施例的移动互联网真实流量识别方法,通过在接收到触发信号后及时收集当前触发的电子终端的相关设备信息(即,电子终端的当前陀螺仪数据A1、当前屏幕亮度B1、当前电量C1和当前是否充电D1中的至少一种),并根据当前触发信号所触发的对象,由数据库中提取出相对应的历史信息,进而将当前收集到的电子终端的设备信息与由数据库中提取出的相关历史信息综合到一起,并通过对综合后的信息进行区间划分,分析判断划分后各区间之间的规律,由各区间之间的规律进行当前触发信号所产生的流量是否为真实流量的识别判断,实现了对移动互联网中真实流量的自动识别功能。同时,在进行真实流量的自动识别过程中,对当前收集到的设备信息与之前存储的历史信息进行综合,对综合后的信息进行统计分析,实现了从当前收集到的设备信息为基础,结合历史信息为参考,使得最终的识别结果更加准确。
其中,在步骤S400中,根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量时,可以通过以下方式来实现。
即,在各区间之间的规律呈预设规律时,识别出当前触发信号产生的流量为异常流量。在各区间之间的规律未呈现出预设规律时,则识别出当前触发信息所产生的流量为真实流量。
此处,需要说明的是,预设规律可以通过实际情况进行灵活设置。举例来说,预设规律可以为对综合信息划分后所得到的各区间之间的大小关系符合预设关系,或者是,对综合信息划分后得到的各区间之间的数值变化符合预设变化,还可以为对综合信息划分后得到的各区间中存在预设个数的区间的数值均在同一预设取值范围内等。
同时,还需要指出的是,在本申请实施例的方法中,对电子终端的设备信息的收集可以通过SDK来实现。即,参阅图2,在实现本申请实施例的方法时,可以通过以下主体来实现。
电子终端的设备信息的收集由SDK进行,收集完设备信息后进行设备信息的发送传输则由广告服务来进行,进行设备信息所对应的历史信息的提取、对设备信息和历史信息进行综合,并对综合后的信息进行区间划分和分析判断则通过分析服务器进行。
其中,参阅图2和图3,在进行设备信息的收集时,通过将被触发对象与SDK相关联,从而在接收到触发信号(即,用户打开电子终端或打开安装在电子终端上所装载的某一款APP)时,此时电子终端或该APP会加载初始化相关联的SDK,进而再通过运行该SDK,由SDK收集电子终端的设备信息。
此处,还需要指出的是,所收集的设备信息可以为非敏感数据,从而避免涉及侵犯用户隐私的现象。具体的,根据前面所述,设备信息可以包括陀螺仪数据、屏幕亮度数据、当前电量数据和是否充电数据等中的至少一种。
在收集到上述的设备信息后,即可执行步骤S200,基于当前收集到的设备信息,由数据库中获取与当前触发信号相对应的历史信息。其中,基于图2和图3所示,在一种可能的实现方式中,当收集到设备信息后,首先由SDK将当前收集到的设备信息进行格式组装,然后发请求至广告服务,以将组装后的设备信息发送至广告服务。
此处,需要说明的是,在SDK对当前收集到的设备信息进行格式组装时,需要将触发信号所触发的触发对象的唯一标识封装至设备信息中,从而便于与数据库中相关的历史信息进行匹配。
广告服务接收到组装的设备信息后,对设备信息进行反格式处理并按照内部格式协议将反格式处理后的设备信息传输给分析服务器。
分析服务器接收并记录下该设备信息,同时由接收到的设备信息中提取出唯一标识,然后根据提取到的唯一标识,由数据库中提取出与当前触发信号所触发的触发对象的历史信息。
此处,应当指出的是,在SDK收集的设备信息包括当前陀螺仪数据A1、当前屏幕亮度B1、当前电量C1和当前是否充电D1这四项信息数据时,由数据库中提取出的历史信息同样也对应包括上述四项的历史记录。
在SDK收集的设备信息只包括当前陀螺仪数据A1时,则由数据库中提取出的历史信息则对应只是之前所记录的陀螺仪的历史记录。
也就是说,由数据库中所提取出的历史信息应当与SDK当前所收集的设备信息的属性相对应。
在分析服务器由数据库中提取出与设备信息相对应的各历史信息之后,即可执行步骤S300,将当前收集到的设备信息添加至历史信息中得到综合信息。
其中,根据前面所述,由于SDK所收集的设备信息可以包含有多种信息数据,因此在进行信息添加时,需要按照不同的属性进行设备信息的添加。即,将当前收集到的设备信息按照不同属性添加至对应的历史信息中,得到多组综合信息。
具体的,当前陀螺仪数据A1添加至历史信息中所记录的陀螺仪历史数据(A2、A3、A4、……、Am)中,得到相应的陀螺仪数据组。当前屏幕亮度B1添加至历史信息中所记录的屏幕亮度历史数据(B2、B3、B4、……、Bn)中,得到相应的屏幕亮度数据组。当前电量C1添加至历史信息中所记录的电量历史数据(C2、C3、C4、……、Cp)中,得到相应的当前电量数据组。当前是否充电D1添加至历史信息中所记录的充电历史数据(D2、D3、D4、……、Dq)中,得到相应的是否充电数据组。其中,m、n、p和q的取值均为正整数。
在将当前收集到的设备信息对应添加至历史信息中,得到综合信息之后,即可通过步骤S400,对综合信息进行区间划分,根据区间划分结果分析判断各区间之间的规律,并根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量。
其中,在对综合信息进行区间划分之前,在一种可能的实现方式中,还需要对所得到的各组综合信息的维度进行确定,从而在综合信息中的数据维度为二维以上时,执行对综合信息进行区间划分的处理操作,在综合信息中的数据维度为一维时,则采用线性回归算法对该综合信息进行预测分析。
具体的,陀螺仪数据、屏幕亮度和当前电量的数据维度均为二维数据,因此,对于陀螺仪数据组(A1、A2、A3、A4、……、Am)、屏幕亮度数组(B1、B2、B3、B4、……、Bn)和当前电量数据组(C1、C2、C3、C4、……、Cp)均采用区间划分的方式进行处理。而对于是否充电数据组(D1、D2、D3、D4、……、Dq)由于其取值只能为1(充电)或0(未充电),其为一维数据,因此对于该综合信息可以采用线性回归的方式进行处理。
更加具体的,对于数据维度为二维以上的综合信息,在进行区间划分时可以采用N宫格的方式来实现。具体的,N宫格的每个宫格对应一个数据区间,在基于N宫格的形式对综合信息进行区间划分时,则主要是根据N宫格中每个宫格所对应的数据区间,将综合信息中的各设备信息对应划分至相应的宫格内的。
其中,在一种可能的实现方式中,N宫格可以为九宫格,还可以为四宫格等。也就是说,对综合信息进行区间划分时所采用的N宫格的宫格数可以根据实际情况灵活设置,一般来说,宫格数越多(即,N的取值越大),识别结果越准确。
举例来说,参阅图4,为采用九宫格对陀螺仪数据组进行区间划分时的示例。其中,该九宫格中每个宫格局对应设置有不同的数据区间。然后,按照不同的数据区间,将陀螺仪数据组中的各信息对应划分至相应的宫格内。如:在陀螺仪数据组中,对于当前陀螺仪数据A1(1.1,1.2),其落在了最中间的宫格(即,第5宫格,按照由左至右,由上至下的顺序排序)的数据区间内,因此可直接将A1划分至第5宫格内。同样的,对于陀螺仪数据组中的其他陀螺仪数据,按照上述操作分别对应划分至相应的宫格内,最终将该九宫格更新为陀螺仪数据组的九宫格。
其中,在更新后的九宫格中,不同宫格内的信息数据的个数有所不同,有的宫格内可能没有信息数据,有的宫格内则可能划分有两个以上的信息数据。其具体由初始的九宫格的各宫格的数据区间以及陀螺仪数据组中的各信息数据的取值来决定。
在通过上述方式将综合信息划分为多个不同的区间之后,即可根据区间划分结果分析判断各区间之间的规律。在一种可能的实现方式中,可以通过对N宫格中各宫格内所包含的信息数据进行数学逻辑运算,得到相应的运算结果,对各运算结果进行统计分析得到各区间之间的规律。其中,数学逻辑运算包括均值、总数和、方差和均差中的任意一种。
举例来说,以陀螺仪数据组为例,如图4所示,将陀螺仪数据组这一综合信息划分至九宫格后,通过对每个宫格内的信息数据进行求和运算、或者是进行均值运算,得到相应的运算结果。然后再将各宫格计算得到的运算结果进行分析比较,如果所得到的运算结果中存在7个运算结果在同一取值范围内(即,9个宫格内有7个宫格的运算结果处于同一取值范围内),此时则可以认为当前触发信号所产生的流量为异常流量,其可能是伪造或恶意流量。如果得到的运算结果中只有2个运算结果在同一取值范围内,其他7个宫格的运算结果各不相同且差异较大,则可以判断出当前触发信息所产生的流量为真实流量。
其中,需要指出的是,对于N宫格中没有划分到信息数据的宫格,其取值可以直接按零处理。
进一步的,由于SDK所收集的设备信息还可以包括有屏幕亮度、当前电量和是否充电等信息。因此,在所收集到的设备信息为两种以上时,此时则可以综合每一组综合信息的区间划分结果进行真实流量的识别判断。
也就是说,在设备信息包括当前陀螺仪数据A1、当前屏幕亮度B1、当前电量C1和当前是否充电D1中的两种以上时,根据区间划分结果分析判断各区间之间的规律,包括:
分析判断不同种类的设备信息所对应的综合信息中各区间之间的规律,得到不同种类的设备信息所对应的流量识别结果;
在流量识别结果中,存在两个以上的流量识别结果为异常流量时,得出当前触发信息所产生的流量最终为异常流量。
举例来说,在设备信息包括当前陀螺仪数据A1、当前屏幕亮度B1、当前电量C1和当前是否充电D1这四种信息时,通过对陀螺仪数据组、屏幕亮度数据组和当前电量数据组进行区间划分,将陀螺仪数据组、屏幕亮度数据组和当前电量数据组分别划分为不同的N宫格,得到陀螺仪N宫格,屏幕亮度N宫格和当前电量N宫格。此处,需要说明的是,陀螺仪N宫格,屏幕亮度N宫格和当前电量N宫格的宫格数可以相同,也可以不同。
然后,分别对陀螺仪N宫格,屏幕亮度N宫格和当前电量N宫格中每一个宫格进行数学逻辑运算(如:求和、均值或均差等),得到相应的运算结果,并分别对陀螺仪N宫格,屏幕亮度N宫格和当前电量N宫格中各宫格之间的运算结果进行分析判断,得到流量是否为真实流量的判断结果。其中,基于陀螺仪数据组得出的流量识别结果记录为:R1,基于屏幕亮度数据组得出的流量识别结果记录为R2,基于当前电量数据组得出的流量识别结果记录为R3。
同时,由于是否充电数据组这一综合信息中的数据维度为一维的,因此对于是否充电数据组的分析判断可以采用线性回归算法进行,并根据线性回归算法的结果判断出当前触发信号所产生的流量是否为真实流量。其中,基于是否充电数据组得出的流量识别结果记录为R4。
最后,再对基于上述四种综合信息得到的结果(即,R1、R2、R3和R4)进行分析,如果R1、R2、R3和R4中存在两个以上为异常流量,则可最终检测识别出当前触发信号所产生的流量为异常流量(如:伪造流量或恶意流量)。
进一步的,在本申请实施例中,在通过前面任一方式检测识别出当前触发信号所产生的流量为真实流量时,还包括以下步骤:
获取当前触发信号所产生的流量是否为真实流量的反馈结果;在反馈结果为当前触发信号所产生的流量为真实流量时,进行广告匹配。
根据广告匹配的结果,接收相应的广告信息并推送相应的广告至电子终端,以在电子终端展示广告。
在展示广告时,收集电子终端的第二陀螺仪数据和当前时间戳,以及对广告点击时的点击坐标数据。此处,本领域技术人员可以理解的是,第二陀螺仪数据指的是在当前展示广告时电子终端的陀螺仪数据。
根据当前时间戳获取广告的当前曝光时间差;其中,当前曝光时间差为由触发信号被触发至展示广告时的时间。
基于第二陀螺仪数据、曝光时间差和点击坐标数据,由数据库中提取相应的第二历史信息。
将第二陀螺仪数据、曝光时间差和点击坐标数据添加至对应的第二历史信息中得到第二综合信息。
对第二综合信息进行区间划分,并根据区间划分结果对展示广告时所产生的流量进行是否为真实流量的识别。
即,参阅图3,广告服务收到反馈后,如果识别出当前触发所产生的流量为真实流量,则进行广告匹配返回处理,如果为非真实流量,则暂停后续响应。
SDK接收到广告后进行展示。展示时收集当前电子终端的陀螺仪数据(即,第二陀螺仪数据)和当前时间戳。同时,如果当前展示的广告被点击,则同时多收集点击的坐标数据。然后,将收集到的第二陀螺仪数据、当前时间戳和点击坐标数据请求给广告服务,并由广告服务传给分析服务器以记录信息。
分析服务器通过关联该电子终端的历史数据,获取历史点击坐标、历史请求和历史时间差,然后按照前面任一所述的方式,将点击坐标数据组(即,包含有点击坐标数据和历史点击坐标的数据组)统一划分为N宫格,并把曝光时间差数据组(即,包含有当前收集得到的曝光时间差和历史时间差的数据组)统一划分为N个区间,通过类似陀螺仪数据组等系列的分析判断方式,对当前点击广告所产生的流量进行是否为真实流量的识别判断。
由于在进行点击广告所产生的流量是否为真实流量的判断时,所采用的识别判断方式的原理与前面任一所述的对触发信号所产生的流量的识别判断原理相同或相似,因此此处不再赘述。
由此,通过本申请实施例的移动互联网真实流量识别方法,实现了对真实流量和异常流量的有效识别,并且在识别过程中,通过综合当前触发流量时的设备信息和之前触发流量时的历史信息,并基于综合后的信息进行流量的识别判断,更进一步地提高了识别结果的准确度。
需要说明的是,尽管以图1至图4作为示例介绍了如上所述的移动互联网真实流量识别方法,但本领域技术人员能够理解,本申请应不限于此。事实上,用户完全可根据个人喜好和/或实际应用场景灵活设定各步骤的实现方式,只要能够实现真实流量的有效识别即可。
同时,还需要指出的是,本申请实施例的移动互联网真实流量识别方法,可以在服务器上处理,也可以在SDK、APP端处理。同时,通过本申请实施例的方法,实现了对流量的真实有效性进行了判别,由此在广告服务器进行投放广告的时候,可以对只对真实流量进行投放,提升后续的效果的同时,节省了广告预算,减少了客户的损失。
相应的,基于前面任一所述的移动互联网真实流量识别方法,本申请还提供了一种移动互联网真实流量识别装置。由于本申请提供的移动互联网真实流量识别装置的工作原理与本申请的移动互联网真实流量识别方法的原理相同或相似,因此重复之处不再赘述。
参阅图5,本申请提供的移动互联网真实流量识别装置100,包括信息收集模块110、历史信息获取模块120、信息添加模块130和流量识别模块140。其中,信息收集模块110,被配置为在接收到触发信号后,收集当前触发的电子终端的设备信息;其中,设备信息包括电子终端的当前陀螺仪数据、当前屏幕亮度、当前电量和当前是否充电中的至少一种。历史信息获取模块120,被配置为基于当前收集到的设备信息,由数据库中获取相应的历史信息。信息添加模块130,被配置为将当前收集到的设备信息添加至对应的历史信息中,得到综合信息。流量识别模块140,被配置为对综合信息进行区间划分,根据区间划分结果分析判断各区间之间的规律,并根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (10)
1.一种移动互联网真实流量识别方法,其特征在于,包括:
在接收到触发信号后,收集当前触发的电子终端的设备信息;其中,所述设备信息包括所述电子终端的当前陀螺仪数据、当前屏幕亮度、当前电量和当前是否充电中的至少一种;
基于当前收集到的所述设备信息,由数据库中获取相应的历史信息;
将当前收集到的所述设备信息添加至对应的所述历史信息中,得到综合信息;
对所述综合信息进行区间划分,根据区间划分结果分析判断各区间之间的规律,并根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量。
2.根据权利要求1所述的方法,其特征在于,根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量时,包括:
在各区间之间的规律呈预设规律时,识别出当前触发信号产生的流量为异常流量;
在各区间之间的规律未呈现出所述预设规律时,则识别出当前触发信息所产生的流量为真实流量;
其中,所述预设规律包括以下任意一种:
对所述综合信息划分后所得到的各区间之间的大小关系符合预设关系;
对所述综合信息划分后得到的各区间之间的数值变化符合预设变化;
对所述综合信息划分后得到的各区间中存在预设个数的区间的数值均在同一预设取值范围内。
3.根据权利要求1所述的方法,其特征在于,基于当前收集到的所述设备信息,由数据库中获取相应的历史信息,包括:
将当前收集到的所述设备信息进行格式组装,并将所述触发信号所触发的触发对象的唯一标识封装至所述设备信息中;
根据所述唯一标识,由所述数据库中提取出与相应的历史信息;
其中,所述触发对象包括所述电子终端和安装在所述电子终端上的应用中的任意一种。
4.根据权利要求1所述的方法,其特征在于,将当前收集到的所述设备信息添加至所述历史信息中得到综合信息时,包括:将当前收集到的所述设备信息按照不同属性添加至对应的所述历史信息中,得到多组综合信息;
其中,所述当前陀螺仪数据添加至所述历史信息中所记录的陀螺仪历史数据中,得到相应的陀螺仪数据组;
所述当前屏幕亮度添加至所述历史信息中所记录的屏幕亮度历史数据中,得到相应的屏幕亮度数据组;
所述当前电量添加至所述历史信息中所记录的电量历史数据中,得到相应的当前电量数据组;
所述当前是否充电添加至所述历史信息中所记录的充电历史数据中,得到相应的是否充电数据组。
5.根据权利要求1所述的方法,其特征在于,将当前收集到的所述设备信息添加至对应的所述历史信息中,得到综合信息后,还包括:
确定所述综合信息的数据维度;对数据维度为二维以上的综合信息进行区间划分,得到相应的区间划分结果;
对数据维度为一维的综合信息,使用线性回归算法进行预测分析得到相应的分析结果。
6.根据权利要求5所述的方法,其特征在于,对数据维度为二维以上的综合信息进行区间划分时,基于N宫格的形式进行;
其中,基于N宫格的形式对所述综合信息进行区间划分时,根据所述N宫格中每个宫格所对应的数据区间,将所述综合信息中的各信息数据对应划分至相应的宫格内。
7.根据权利要求5所述的方法,其特征在于,在所述设备信息的维度为二维以上时,基于N宫格的形式对所述综合信息进行区间划分后,根据区间划分结果分析判断各区间之间的规律,包括:
对所述N宫格中各宫格内的信息数据进行数学逻辑运算,得到相应的运算结果,对各运算结果进行统计分析得到各区间之间的规律;
其中,所述数学逻辑运算包括均值、总数和、方差和均差中的任意一种。
8.根据权利要求1所述的方法,其特征在于,在所述设备信息包括所述当前陀螺仪数据、所述当前屏幕亮度、所述当前电量和所述当前是否充电中的两种以上时,还包括:
分析判断不同种类的所述设备信息所对应的综合信息中各区间之间的规律,得到不同种类的所述设备信息所对应的流量识别结果;
在所述流量识别结果中,存在两个以上的流量识别结果为异常流量时,得出当前触发信息所产生的流量最终为异常流量。
9.根据权利要求1至8任一项所述的方法,其特征在于,还包括:
获取当前触发信号所产生的流量是否为真实流量的反馈结果;
在所述反馈结果为当前触发信号所产生的流量为真实流量时,进行广告匹配;
根据所述广告匹配的结果,接收相应的广告信息并推送相应的广告至所述电子终端,以在所述电子终端展示所述广告;
在展示所述广告时,收集所述电子终端的第二陀螺仪数据和当前时间戳,以及对所述广告点击时的点击坐标数据;
根据所述当前时间戳获取所述广告的当前曝光时间差;其中,所述当前曝光时间差为由所述触发信号被触发至展示所述广告时的时间;
基于所述第二陀螺仪数据、所述曝光时间差和所述点击坐标数据,由所述数据库中提取相应的第二历史信息;
将所述第二陀螺仪数据、所述曝光时间差和所述点击坐标数据添加至对应的所述第二历史信息中得到对应的第二综合信息;
对各所述第二综合信息进行区间划分,并根据区间划分结果对展示所述广告时所产生的流量进行是否为真实流量的识别。
10.一种移动互联网真实流量识别装置,其特征在于,包括:信息收集模块、历史信息获取模块、信息添加模块和流量识别模块;
所述信息收集模块,被配置为在接收到触发信号后,收集当前触发的电子终端的设备信息;其中,所述设备信息包括所述电子终端的当前陀螺仪数据、当前屏幕亮度、当前电量和当前是否充电中的至少一种;
所述历史信息获取模块,被配置为基于当前收集到的所述设备信息,由数据库中获取相应的历史信息;
所述信息添加模块,被配置为将当前收集到的所述设备信息添加至对应的所述历史信息中,得到综合信息;
所述流量识别模块,被配置为对所述综合信息进行区间划分,根据区间划分结果分析判断各区间之间的规律,并根据各区间之间的规律识别判断当前触发信号所产生的流量是否为真实流量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110046457.6A CN112866142B (zh) | 2021-01-14 | 2021-01-14 | 移动互联网真实流量识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110046457.6A CN112866142B (zh) | 2021-01-14 | 2021-01-14 | 移动互联网真实流量识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112866142A true CN112866142A (zh) | 2021-05-28 |
CN112866142B CN112866142B (zh) | 2023-04-07 |
Family
ID=76003674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110046457.6A Active CN112866142B (zh) | 2021-01-14 | 2021-01-14 | 移动互联网真实流量识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112866142B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115065644A (zh) * | 2022-06-20 | 2022-09-16 | 支付宝(杭州)信息技术有限公司 | 用于阻止机器流量的方法和系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050249125A1 (en) * | 2002-12-13 | 2005-11-10 | Yoon Seung H | Traffic measurement system and traffic analysis method thereof |
CN106651458A (zh) * | 2016-12-29 | 2017-05-10 | 腾讯科技(深圳)有限公司 | 一种广告反作弊方法和装置 |
CN108681908A (zh) * | 2018-05-17 | 2018-10-19 | 广州爱九游信息技术有限公司 | 反作弊方法、装置、计算设备及存储介质 |
CN108810947A (zh) * | 2018-05-29 | 2018-11-13 | 浙江每日互动网络科技股份有限公司 | 基于ip地址的鉴别真实流量的服务器 |
CN109146546A (zh) * | 2018-07-23 | 2019-01-04 | 广州至真信息科技有限公司 | 一种作弊行为检测的方法及装置 |
CN110097389A (zh) * | 2018-01-31 | 2019-08-06 | 上海甚术网络科技有限公司 | 一种广告流量反作弊方法 |
CN110365682A (zh) * | 2019-07-17 | 2019-10-22 | 秒针信息技术有限公司 | 一种反作弊方法及装置 |
CN110414547A (zh) * | 2019-05-07 | 2019-11-05 | 腾讯科技(深圳)有限公司 | 一种行为检测方法、装置、计算机设备和存储介质 |
-
2021
- 2021-01-14 CN CN202110046457.6A patent/CN112866142B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050249125A1 (en) * | 2002-12-13 | 2005-11-10 | Yoon Seung H | Traffic measurement system and traffic analysis method thereof |
CN106651458A (zh) * | 2016-12-29 | 2017-05-10 | 腾讯科技(深圳)有限公司 | 一种广告反作弊方法和装置 |
CN110097389A (zh) * | 2018-01-31 | 2019-08-06 | 上海甚术网络科技有限公司 | 一种广告流量反作弊方法 |
CN108681908A (zh) * | 2018-05-17 | 2018-10-19 | 广州爱九游信息技术有限公司 | 反作弊方法、装置、计算设备及存储介质 |
CN108810947A (zh) * | 2018-05-29 | 2018-11-13 | 浙江每日互动网络科技股份有限公司 | 基于ip地址的鉴别真实流量的服务器 |
CN109146546A (zh) * | 2018-07-23 | 2019-01-04 | 广州至真信息科技有限公司 | 一种作弊行为检测的方法及装置 |
CN110414547A (zh) * | 2019-05-07 | 2019-11-05 | 腾讯科技(深圳)有限公司 | 一种行为检测方法、装置、计算机设备和存储介质 |
CN110365682A (zh) * | 2019-07-17 | 2019-10-22 | 秒针信息技术有限公司 | 一种反作弊方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115065644A (zh) * | 2022-06-20 | 2022-09-16 | 支付宝(杭州)信息技术有限公司 | 用于阻止机器流量的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112866142B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110198310B (zh) | 一种网络行为反作弊方法、装置及存储介质 | |
CN109271420B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN109656973B (zh) | 一种目标对象关联分析方法及装置 | |
CN111026853B (zh) | 目标问题的确定方法、装置、服务器和客服机器人 | |
US20190149344A1 (en) | Intelligent search system for service cost and method thereof | |
CN112463859B (zh) | 基于大数据和业务分析的用户数据处理方法及服务器 | |
CN106998336B (zh) | 渠道中的用户检测方法和装置 | |
CN112866142B (zh) | 移动互联网真实流量识别方法和装置 | |
CN111148018A (zh) | 基于通信数据识别定位区域价值的方法和装置 | |
KR101724302B1 (ko) | 특허분쟁예보장치 및 그 방법 | |
Gueguen et al. | Mapping human settlements and population at country scale from VHR images | |
CN113568934A (zh) | 一种数据查询方法、装置、电子设备和存储介质 | |
US9087298B2 (en) | Inference of anomalous behavior of members of cohorts and associate actors related to the anomalous behavior based on divergent movement from the cohort context centroid | |
CN110967036B (zh) | 导航产品的测试方法和设备 | |
CN111738558A (zh) | 行为风险识别的可视化方法、装置、设备及存储介质 | |
CN113254335B (zh) | 测试数据的处理方法、装置、服务器及存储介质 | |
CN110209575A (zh) | 测试文档生成方法、装置、电子设备及存储介质 | |
CN104394435A (zh) | 数字机顶盒开机检测方法和装置 | |
CN113051127B (zh) | 异常功耗检测方法、装置、电子设备及存储介质 | |
CN112256836A (zh) | 记录数据的处理方法、装置和服务器 | |
CN111400568B (zh) | 行为意图分析方法、装置、电子设备及存储介质 | |
CN110909188A (zh) | 检查图片确定方法及装置 | |
CN113743692B (zh) | 业务风险评估方法、装置、计算机设备和存储介质 | |
CN116842238B (zh) | 基于大数据分析的企业数据可视化实现方法及系统 | |
CN113051128B (zh) | 功耗检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |