CN110661794B - 流量识别方法、装置、电子设备及可读存储介质 - Google Patents

流量识别方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN110661794B
CN110661794B CN201910896532.0A CN201910896532A CN110661794B CN 110661794 B CN110661794 B CN 110661794B CN 201910896532 A CN201910896532 A CN 201910896532A CN 110661794 B CN110661794 B CN 110661794B
Authority
CN
China
Prior art keywords
flow
traffic
target
target flow
advertisement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910896532.0A
Other languages
English (en)
Other versions
CN110661794A (zh
Inventor
董文菁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miaozhen Information Technology Co Ltd
Original Assignee
Miaozhen Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miaozhen Information Technology Co Ltd filed Critical Miaozhen Information Technology Co Ltd
Priority to CN201910896532.0A priority Critical patent/CN110661794B/zh
Publication of CN110661794A publication Critical patent/CN110661794A/zh
Application granted granted Critical
Publication of CN110661794B publication Critical patent/CN110661794B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2483Traffic characterised by specific attributes, e.g. priority or QoS involving identification of individual flows

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Signal Processing (AREA)
  • Finance (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Strategic Management (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种流量识别方法、装置、电子设备及可读存储介质,涉及互联网领域。该方法包括:确定获取的广告流量中包含有通用唯一识别码UUID为第一预设值的第一目标流量,并将所述第一目标流量识别为疑似异常流量;确定所述第一目标流量中包含有第二设备标识信息为第二预设值的第二目标流量,并将所述第二目标流量识别为正常流量。该方案通过先从广告流量中识别出疑似异常的第一目标流量,然后再从第一目标流量中识别出由于用户设备开启了限制广告追踪功能产生的第二目标流量,从而可以从疑似异常流量中识别出正常流量,进而可以区分疑似异常流量中的正常流量和异常流量,提高了识别异常流量的准确性。

Description

流量识别方法、装置、电子设备及可读存储介质
技术领域
本申请涉及互联网领域,具体而言,涉及一种流量识别方法、装置、电子设备及可读存储介质。
背景技术
为了分析广告投放效果,需要对获取的大量广告流量进行分析,以分析出其中的异常流量。而目前认为用户设备的设备标识缺失的流量为异常流量,设备标识缺失通常是由于媒体作弊或者媒体获取不到设备标识而导致的。
但实际上若用户设备开启了限制广告追踪功能,媒体也获取不到用户设备的设备标识,那么这部分流量也会被统计进异常流量中,而这部分流量应为正常流量,所以在进行广告投放效果分析时,应该排除掉这部分流量。而目前未针对上述的异常流量进行进一步区分,使得异常流量的统计并不准确。
发明内容
本申请实施例的目的在于提供一种流量识别方法、装置、电子设备及可读存储介质,用以改善现有技术中异常流量统计不准确的问题。
第一方面,本申请实施例提供了一种流量识别方法,包括:确定获取的广告流量中包含有通用唯一识别码UUID为第一预设值的第一目标流量,并将所述第一目标流量识别为疑似异常流量;其中,所述UUID为第一预设值表示用户设备的第一设备标识信息缺失;确定所述第一目标流量中包含有第二设备标识信息为第二预设值的第二目标流量,并将所述第二目标流量识别为正常流量;其中,所述第二设备标识信息为第二预设值表示所述用户设备开启了限制广告追踪功能。
在上述实现过程中,可以先从广告流量中识别出疑似异常的第一目标流量,然后再从第一目标流量中识别出由于用户设备开启了限制广告追踪功能产生的第二目标流量,从而可以从疑似异常流量中识别出正常流量,进而可以区分疑似异常流量中的正常流量和异常流量,提高了识别异常流量的准确性。
可选地,所述第二设备标识信息为广告标识符IDFA。通过广告标识符的值可以更加准确地确定出正常流量。
可选地,所述确定所述第一目标流量中的包含有第二设备标识信息为第二预设值的第二目标流量之后,还包括:计算获得所述第二目标流量与所述第一目标流量的数量比值;根据所述数量比值分析用户的隐私重视程度。
在上述实现过程中,通过从第一目标流量中区分出第二目标流量则可分析第一目标流量中第二目标流量的占比,从而可分析出用户的隐私重视程度,进而可调整广告的投放比例。
可选地,所述确定所述第一目标流量中的包含有第二设备标识信息为第二预设值的第二目标流量之后,还包括:确定所述第一目标流量中除所述第二目标流量外剩余的第三目标流量,并将所述第三目标流量识别为异常流量;确定所述第三目标流量中各条流量对应的媒体来源;向所述媒体来源发送对应的流量为异常流量的提示信息。
在上述实现过程中,通过从第一目标流量中区分出第二目标流量和第三目标流量,且向第三目标流量对应的媒体来源发送提示信息,以提示该媒体来源针对其异常流量进行分析其异常原因等。
可选地,所述确定所述第三目标流量中各条流量的对应的媒体来源,包括:获取所述第三目标流量中各条流量的来源地址信息;根据所述来源地址信息确定各条流量对应的媒体来源。
可选地,所述确定所述第一目标流量中的包含有第二设备标识信息为第二预设值的第二目标流量之后,还包括:确定所述第一目标流量中除所述第二目标流量外剩余的第三目标流量,并将所述第三目标流量识别为异常流量;根据所述第三目标流量中各条流量的来源地址信息获取所述第三目标流量中每个媒体来源对应的第四目标流量;获取每个媒体来源对应的广告流量;计算获得每个媒体来源的广告流量与对应的第四目标流量的数量比值;根据所述数量比值分析各个媒体来源是否异常。
在上述实现过程中,通过确定媒体来源的异常流量以及对应的广告流量,然后计算获得其异常流量在其广告流量中的占比,以此可分析出其媒体来源是否异常,如在异常时,可通知媒体来源进行流量分析,或者通知媒体来源告知其异常的原因。
第二方面,本申请实施例提供了一种流量识别装置,包括:
第一流量识别模块,用于确定获取的广告流量中包含有通用唯一识别码UUID为第一预设值的第一目标流量,并将所述第一目标流量识别为疑似异常流量;其中,所述UUID为第一预设值表示用户设备的第一设备标识信息缺失;
第二流量识别模块,用于确定所述第一目标流量中包含有第二设备标识信息为第二预设值的第二目标流量,并将所述第二目标流量识别为正常流量;其中,所述第二设备标识信息为第二预设值表示所述用户设备开启了限制广告追踪功能。
可选地,所述第二设备标识信息为广告标识符IDFA。
可选地,所述装置还包括:
第一分析模块,用于计算获得所述第二目标流量与所述第一目标流量的数量比值;根据所述数量比值分析用户的隐私重视程度。
可选地,所述装置还包括:
第二分析模块,用于确定所述第一目标流量中除所述第二目标流量外剩余的第三目标流量,并将所述第三目标流量识别为异常流量;确定所述第三目标流量中各条流量对应的媒体来源;向所述媒体来源发送对应的流量为异常流量的提示信息。
可选地,所述第二分析模块,用于获取所述第三目标流量中各条流量的来源地址信息;根据所述来源地址信息确定各条流量对应的媒体来源。
可选地,所述装置还包括:
第三分析模块,用于:
确定所述第一目标流量中除所述第二目标流量外剩余的第三目标流量,并将所述第三目标流量识别为异常流量;
根据所述第三目标流量中各条流量的来源地址信息获取所述第三目标流量中每个媒体来源对应的第四目标流量;
获取每个媒体来源对应的广告流量;
计算获得每个媒体来源的广告流量与对应的第四目标流量的数量比值;
根据所述数量比值分析各个媒体来源是否异常。
第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种电子设备的结构示意图;
图2为本申请实施例提供的一种流量识别方法的流程图;
图3为本申请实施例提供的一种流量识别装置的结构框图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种流量识别方法,该方法通过从广告流量中确定包含有UUID为第一预设值的第一目标流量,然后将第一目标流量识别为疑似异常流量,第一目标流量表示用户设备的设备标识信息缺失的流量,再从第一目标流量中确定包含有第二设备标识信息为第二预设值的第二目标流量,将第二目标流量识别为正常流量,第二目标流量表示用户设备开启了限制广告追踪功能的流量,从而可以从疑似异常流量中识别出正常流量,进而可以区分疑似异常流量中的正常流量和异常流量,提高了识别异常流量的准确性。下面结合附图对本申请实施例提供的流量识别方法进行详细介绍。
请参照图1,图1为本申请实施例提供的一种电子设备的结构示意图,该电子设备即可以为下述的服务器端,所述电子设备可以包括:至少一个处理器110,例如CPU,至少一个通信接口120,至少一个存储器130和至少一个通信总线140。其中,通信总线140用于实现这些组件直接的连接通信。其中,本申请实施例中设备的通信接口120用于与其他节点设备进行信令或数据的通信。存储器130可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器130可选的还可以是至少一个位于远离前述处理器的存储装置。存储器130中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器110执行时,电子设备执行下述图2所示方法过程。例如,存储器130可以用于存储各种流量,如广告流量、第一目标流量以及第二目标流量等,处理器110可用于从疑似异常流量中识别出正常流量,进而可以区分疑似异常流量中的正常流量和异常流量,提高了识别异常流量的准确性。
请参照图2,图2为本申请实施例提供的一种流量识别方法的流程图,该方法包括如下步骤:
步骤S110:确定获取的广告流量中包含有通用唯一识别码UUID为第一预设值的第一目标流量,并将第一目标流量识别为疑似异常流量。
其中,广告流量是指广告的访问量、点击量、曝光量等,也称为广告浏览量。在获得第一目标流量之前,可以先统计网页端产生的广告流量,例如,可以设置网站页面上的广告作为被监控点,然后在网页端添加被监控点相应的监控代码,通过该监控代码记录被监控点的相关信息,如包括广告ID、广告点击记录等。当用户触发了被监控点,例如用户点击了被监控的广告,网页端响应该点击操作将被监控点的监控信息发送至服务器端,监控信息包括客户端地址、访问的域名、访问时间、访问网址、协议版本号、媒体来源、以及其他等信息,如用户设备标识等,服务器端接收到这些监控信息后可进行记录并生成对应的日志文件。
当然,服务器端获得的日志文件中还包括有其他被监控点的记录,如网页浏览记录等。服务器端在生成日志文件后,若需要进行广告流量统计,则可以从日志文件中识别出广告流量,即日志文件中的每条记录为一条流量,每条记录中标识了对应的监控类型,如对于广告流量,其监控类型为广告展示或广告点击等,这些记录中还记录了对应的广告ID,所以可根据监控类型以及广告ID来确定这类型流量即为广告流量。
在统计出广告流量后,为了从广告流量中识别出第一目标流量,则可根据用户设备的设备标识信息来识别。由于不同的用户通过不同的用户设备访问网页端时,不同用户设备的设备标识信息也会记录在日志文件中,即网页端在向服务器端发送对应的监控信息时,也会将获取的用户设备的设备标识信息一并发送给服务器端。对于不同的设备,不同的网页端获取的设备标识信息可以不同,每个设备的设备标识信息可以有多个,网页端可以将获得的所有设备标识信息发送给服务器端,其设备标识信息采用如下表1中所示的字段名进行携带。
表1
Figure BDA0002208538920000071
Figure BDA0002208538920000081
其中,广告标识符(Identifier For Advertising,IDFA)是一个跟设备相关的唯一标识符,可以用来打通不同应用之间的广告,其是一个16进制32位字符串,可用于广告追踪。
唯一设备标识符(Unique Device Identifier,UDID)为唯一识别设备的标识符,移动广告商和游戏网络运营商往往需要通过UDID来识别玩家用户,并对用户活动进行跟踪。OpenUDID是UDID的一个开源解决方案。
国际移动设备识别码(International Mobile Equipment Identity,IMEI),是国际移动设备识别码的缩写,俗称“手机串号”,用于在GSN移动网络中识别每一部独立的手机,相当于手机的身份证号码。
Android ID是Android系统第一次启动时产生的一个64bit数,如果设备被清除还原后,该ID将被重置(即Android ID会发生变化)。
媒体访问控制地址(Media Access Control Address,MAC)列表是指MAC地址列表,也称为以太网地址,每个移动设备拥有唯一的MAC地址。
而为了便于服务器端进行流量统计,在进行流量统计时,可以先将所有的用户设备的设备标识信息转换为通用唯一识别码(Universally Unique Identifier,UUID),通过其UUID来进行流量统计。由于每个设备可能有多个设备标识信息,所以UUID的取值可以按照一定的取值顺序进行取值,如UUID的取值顺序依次为m5,m2,m3,m10,m11,m1a,m1,m0,m0a,m6,m6a,ai,na,ny,m9,m8,a。例如,若某个用户设备的设备标识信息包括UDID、IMEI,则依照UUID的取值顺序,其UUID的取值应为m2字段携带的IMEI的值。
但是,在某些情况下,用户设备的设备标识信息缺失,则使得日志文件中有一些自定义的设备标识信息,如IDFA,IMEI,{IDFA},%IMEI%等宏参数的设备标识信息,即只有宏参数,没有具体的值,产生这些宏参数的设备标识信息有很多原因,主要原因是在用户访问互联网时,媒体端没有成功进行真正设备标识信息的替换,或者是媒体回传的设备标识信息为默认值,比如用户在通过网页端浏览某个应用时,网页端无法获取用户设备的正常的设备标识信息或者获取到的设备标识信息不规范,此时网页端发送至服务器端的监控信息中的设备标识信息为空,或者网页端作弊将用户设备的设备标识信息设置为默认值,然后发送给服务器端,则服务器端按照UUID的取值顺序获取UUID的值时,先获取到m5,m2等字段的设备标识信息为默认值、或者不规范、或者为空时,按照取值顺序UUID将取值为设备标识信息中的m9字段携带的信息。
在进行异常流量统计时,将UUID取值为m9携带的信息识别为异常流量,表示该流量中的设备标识缺失。
所以,可以从广告流量中统计UUID为第一预设值的第一目标流量,该第一预设值表示用户设备的第一设备标识信息缺失,即第一预设值的取值为上述表中m9对应的信息,所以,可识别出广告流量中UUID取值为m9字段所携带的信息的第一目标流量,该第一目标流量为疑似异常流量。
步骤S120:确定所述第一目标流量中的包含有第二设备标识信息为第二预设值的第二目标流量,并将所述第二目标流量识别为正常流量。
实际情况下,由于用户设备可能开启了限制广告追踪功能后,网页端获取的有些设备标识信息可能为默认值,如对于iOS用户端,其设备标识信息IDFA值为全0的字符串,如m5字段的取值为00000000-0000-0000-0000-000000000000,此时,由于其是全0字符,则在进行UUID取值时,UUID按照顺序还是会取值为m9字段所携带的信息,所以,该流量也会被识别为第一目标流量,但是这部分流量实际为正常流量。在进行广告投放效果分析时,应该除去这部分正常流量后对异常流量进行分析。
所以,为了对这部分的正常流量进行识别,还可以从第一目标流量中确定包含有第二设备标识信息为第二预设值的第二目标流量,第二设备标识信息为第二预设值即表示用户设备开启了限制广告追踪功能。
其中,第二设备标识信息可以根据不同的用户设备设置对应的设备标识信息,如对于iOS设备,其第二设备标识信息可以为IDFA,则第二预设值为全0字符串;对于安卓设备,其第二设备标识信息可以为IMEI,其第二预设值可以根据用户设备的设置为定。
在上述实现过程中,可以先从广告流量中识别出疑似异常的第一目标流量,然后再从第一目标流量中识别出由于用户设备开启了限制广告追踪功能产生的第二目标流量,从而可以从疑似异常流量中识别出正常流量,进而可以区分疑似异常流量中的正常流量和异常流量,提高了识别异常流量的准确性。
在上述从第一目标流量中识别出正常的第二目标流量后,即还可以计算获得第二目标流量与第一目标流量的数量比值,根据该数量比值分析用户的隐私重视程度。
例如,若第一目标流量包括150条流量,其中有50条流量为第二目标流量,这50条流量为正常流量,则第二目标流量与第一目标流量的数量比值为1/3,由此,可设定该数量比值若小于或等于某一预设值时,表明用户的隐私重视程度不是特别高,若该数量比值大于该预设值时,表明用户的隐私重视程度相对较高。
若在某一定时间段内发现用户的隐私重视程度较高时,可通知广告商调整广告的投放比例,如减少广告的投放。
当然,还可针对这一部分流量的用户不同的用户设备关于限制广告追踪方面的优势分析。
在上述实现过程中,通过从第一目标流量中区分出第二目标流量则可分析第一目标流量中第二目标流量的占比,从而可分析出用户的隐私重视程度,进而可调整广告的投放比例。
作为另一种示例,还可以确定第一目标流量中除第二目标流量外剩余的第三目标流量,将第三目标流量识别为异常流量,然后确定第三流量中各条流量对应的媒体来源,向这些媒体来源发送对应的流量为异常流量的提示信息。
具体地,在每条流量记录中记录了该流量的来源,比如浏览器信息、媒介标识以及媒体来源的来源地址信息等。所以,还可以获取第三目标流量中各条流量的来源地址信息,然后根据来源地址信息确定各条流量对应的媒体来源。
在确定各条流量对应的媒体来源后,可以向该流量对应的媒体来源发送对应的提示信息,如提示其获得的流量为异常流量,或者提示其需要积极回传正确的设备标识信息。若这些异常流量为媒体作弊产生的异常流量,则该提示信息可对媒体进行作弊提醒,若该流量不是媒体作弊产生的异常流量,则该提示信息可提醒媒体对该流量对应的用户设备进行分析或者着重监测等。
在上述实现过程中,通过从第一目标流量中区分出第二目标流量和第三目标流量,且向第三目标流量对应的媒体来源发送提示信息,以提示该媒体来源针对其异常流量进行分析其异常原因等。
另外,还可以在确定出第三目标流量后,根据第三目标流量中各条流量的来源地址信息获取所述第三目标流量中每个媒体来源对应的第四目标流量,然后获取每个媒体来源对应的广告流量,计算获得每个媒体来源的广告流量与对应的第四目标流量的数量比值,根据该数量比值分析各个媒体来源是否异常。
例如,在第三目标流量包括150条流量时,获取各条流量中记录的来源地址信息,然后根据来源地址信息查找每个媒体来源对应的第四目标流量,例如对于媒体来源1,其第四目标流量包括5条,对于媒体来源2,其第四目标流量包括100条,以此,可获得各个媒体来源对应的第四目标流量。然后针对每个媒体来源,可以从广告流量中获取每个媒体来源对应的广告流量,例如,对于媒体来源1,其广告流量包括300条流量,对于媒体来源2,其广告流量包括200条流量,此时获得媒体来源1的广告流量与其第四目标流量的数量比值为1/60,而媒体来源2的广告流量与其第四目标量流量的数量比值为1/2,可见,媒体来源2的数量比值较大,则可表明媒体来源2很可能是因为作弊回传了大量的异常流量,表明该媒体来源2可能为异常网站,后续可以向媒体来源2发送提示信息,提示其异常流量的数量较大,督促其不能作弊,或者告知其提供异常的具体原因。
在上述实现过程中,通过确定媒体来源的异常流量以及对应的广告流量,然后计算获得其异常流量在其广告流量中的占比,以此可分析出其媒体来源是否异常,如在异常时,可通知媒体来源进行流量分析,或者通知媒体来源告知其异常的原因。
请参照图3,图3为本申请实施例提供的一种流量识别装置200的结构框,该装置200可以是电子设备上的模块、程序段或代码。应理解,该装置200与上述图2方法实施例对应,能够执行图2方法实施例涉及的各个步骤,该装置200具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。
可选地,该装置200包括:
第一流量识别模块210,用于确定获取的广告流量中包含有通用唯一识别码UUID为第一预设值的第一目标流量,并将所述第一目标流量识别为疑似异常流量;其中,所述UUID为第一预设值表示用户设备的第一设备标识信息缺失;
第二流量识别模块220,用于确定所述第一目标流量中包含有第二设备标识信息为第二预设值的第二目标流量,并将所述第二目标流量识别为正常流量;其中,所述第二设备标识信息为第二预设值表示所述用户设备开启了限制广告追踪功能。
可选地,所述第二设备标识信息为广告标识符IDFA。
可选地,所述装置200还包括:
第一分析模块,用于计算获得所述第二目标流量与所述第一目标流量的数量比值;根据所述数量比值分析用户的隐私重视程度。
可选地,所述装置200还包括:
第二分析模块,用于确定所述第一目标流量中除所述第二目标流量外剩余的第三目标流量,并将所述第三目标流量识别为异常流量;确定所述第三目标流量中各条流量对应的媒体来源;向所述媒体来源发送对应的流量为异常流量的提示信息。
可选地,所述第二分析模块,用于获取所述第三目标流量中各条流量的来源地址信息;根据所述来源地址信息确定各条流量对应的媒体来源。
可选地,所述装置200还包括:
第三分析模块,用于:
确定所述第一目标流量中除所述第二目标流量外剩余的第三目标流量,并将所述第三目标流量识别为异常流量;
根据所述第三目标流量中各条流量的来源地址信息获取所述第三目标流量中每个媒体来源对应的第四目标流量;
获取每个媒体来源对应的广告流量;
计算获得每个媒体来源的广告流量与对应的第四目标流量的数量比值;
根据所述数量比值分析各个媒体来源是否异常。
本申请实施例提供一种可读存储介质,所述计算机程序被处理器执行时,执行如图2所示方法实施例中电子设备所执行的方法过程。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如,包括:确定获取的广告流量中包含有通用唯一识别码UUID为第一预设值的第一目标流量,并将所述第一目标流量识别为疑似异常流量;其中,所述UUID为第一预设值表示用户设备的第一设备标识信息缺失;确定所述第一目标流量中包含有第二设备标识信息为第二预设值的第二目标流量,并将所述第二目标流量识别为正常流量;其中,所述第二设备标识信息为第二预设值表示所述用户设备开启了限制广告追踪功能。
综上所述,本申请实施例提供一种流量识别方法、装置、电子设备及可读存储介质,该方法通过先从广告流量中识别出疑似异常的第一目标流量,然后再从第一目标流量中识别出由于用户设备开启了限制广告追踪功能产生的第二目标流量,从而可以从疑似异常流量中识别出正常流量,进而可以区分疑似异常流量中的正常流量和异常流量,提高了识别异常流量的准确性。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种流量识别方法,其特征在于,包括:
确定获取的广告流量中包含有通用唯一识别码UUID为第一预设值的第一目标流量,并将所述第一目标流量识别为疑似异常流量;其中,所述UUID为第一预设值表示用户设备的第一设备标识信息缺失;
确定所述第一目标流量中包含有第二设备标识信息为第二预设值的第二目标流量,并将所述第二目标流量识别为正常流量;其中,所述第二设备标识信息为第二预设值表示所述用户设备开启了限制广告追踪功能。
2.根据权利要求1所述的方法,其特征在于,所述第二设备标识信息为广告标识符IDFA。
3.根据权利要求1所述的方法,其特征在于,所述确定所述第一目标流量中的包含有第二设备标识信息为第二预设值的第二目标流量之后,还包括:
计算获得所述第二目标流量与所述第一目标流量的数量比值;
根据所述数量比值分析用户的隐私重视程度。
4.根据权利要求1所述的方法,其特征在于,所述确定所述第一目标流量中的包含有第二设备标识信息为第二预设值的第二目标流量之后,还包括:
确定所述第一目标流量中除所述第二目标流量外剩余的第三目标流量,并将所述第三目标流量识别为异常流量;
确定所述第三目标流量中各条流量对应的媒体来源;
向所述媒体来源发送对应的流量为异常流量的提示信息。
5.根据权利要求4所述的方法,其特征在于,所述确定所述第三目标流量中各条流量的对应的媒体来源,包括:
获取所述第三目标流量中各条流量的来源地址信息;
根据所述来源地址信息确定各条流量对应的媒体来源。
6.根据权利要求1所述的方法,其特征在于,所述确定所述第一目标流量中的包含有第二设备标识信息为第二预设值的第二目标流量之后,还包括:
确定所述第一目标流量中除所述第二目标流量外剩余的第三目标流量,并将所述第三目标流量识别为异常流量;
根据所述第三目标流量中各条流量的来源地址信息获取所述第三目标流量中每个媒体来源对应的第四目标流量;
获取每个媒体来源对应的广告流量;
计算获得每个媒体来源的广告流量与对应的第四目标流量的数量比值;
根据所述数量比值分析各个媒体来源是否异常。
7.一种流量识别装置,其特征在于,包括:
第一流量识别模块,用于确定获取的广告流量中包含有通用唯一识别码UUID为第一预设值的第一目标流量,并将所述第一目标流量识别为疑似异常流量;其中,所述UUID为第一预设值表示用户设备的第一设备标识信息缺失;
第二流量识别模块,用于确定所述第一目标流量中包含有第二设备标识信息为第二预设值的第二目标流量,并将所述第二目标流量识别为正常流量;其中,所述第二设备标识信息为第二预设值表示所述用户设备开启了限制广告追踪功能。
8.根据权利要求7所述的装置,其特征在于,所述第二设备标识信息为广告标识符IDFA。
9.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-6任一所述方法中的步骤。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-6任一所述方法中的步骤。
CN201910896532.0A 2019-09-20 2019-09-20 流量识别方法、装置、电子设备及可读存储介质 Active CN110661794B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910896532.0A CN110661794B (zh) 2019-09-20 2019-09-20 流量识别方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910896532.0A CN110661794B (zh) 2019-09-20 2019-09-20 流量识别方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN110661794A CN110661794A (zh) 2020-01-07
CN110661794B true CN110661794B (zh) 2021-07-27

Family

ID=69037520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910896532.0A Active CN110661794B (zh) 2019-09-20 2019-09-20 流量识别方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110661794B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111277453A (zh) * 2020-01-14 2020-06-12 恩亿科(北京)数据科技有限公司 一种端对端打通方法和数据监测系统
CN111652212A (zh) * 2020-05-21 2020-09-11 哈尔滨市科佳通用机电股份有限公司 基于深度学习的交叉杆端部紧固螺栓丢失故障检测方法
CN111756716A (zh) * 2020-06-15 2020-10-09 深信服科技股份有限公司 流量检测方法、装置及计算机可读存储介质
CN112188291B (zh) * 2020-09-24 2022-11-29 北京明略昭辉科技有限公司 广告位异常的识别方法和装置
CN113220741B (zh) * 2021-04-29 2024-04-05 北京华艺世嘉网络有限公司 互联网广告虚假流量识别方法、系统、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103685223A (zh) * 2012-09-11 2014-03-26 波音公司 经由分析无响应出站网络流量来检测感染的网络设备
CN104038929A (zh) * 2014-05-09 2014-09-10 宇龙计算机通信科技(深圳)有限公司 网络访问异常识别方法和网络访问异常识别装置
CN106650519A (zh) * 2016-12-08 2017-05-10 同盾科技有限公司 一种设备追踪方法和系统
US10324956B1 (en) * 2015-11-11 2019-06-18 Microsoft Technology Licensing, Llc Automatically mapping organizations to addresses
CN110163654A (zh) * 2019-04-15 2019-08-23 上海基分文化传播有限公司 一种广告投放数据追踪方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090172035A1 (en) * 2007-12-31 2009-07-02 Pieter Lessing System and method for capturing and storing casino information in a relational database system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103685223A (zh) * 2012-09-11 2014-03-26 波音公司 经由分析无响应出站网络流量来检测感染的网络设备
CN104038929A (zh) * 2014-05-09 2014-09-10 宇龙计算机通信科技(深圳)有限公司 网络访问异常识别方法和网络访问异常识别装置
US10324956B1 (en) * 2015-11-11 2019-06-18 Microsoft Technology Licensing, Llc Automatically mapping organizations to addresses
CN106650519A (zh) * 2016-12-08 2017-05-10 同盾科技有限公司 一种设备追踪方法和系统
CN110163654A (zh) * 2019-04-15 2019-08-23 上海基分文化传播有限公司 一种广告投放数据追踪方法和系统

Also Published As

Publication number Publication date
CN110661794A (zh) 2020-01-07

Similar Documents

Publication Publication Date Title
CN110661794B (zh) 流量识别方法、装置、电子设备及可读存储介质
CN108494799B (zh) 数据共享方法和系统
CN107092544B (zh) 监控方法及装置
CN108322350B (zh) 业务监控方法及装置和电子设备
CN110688598B (zh) 业务参数采集方法、装置、计算机设备和存储介质
JP6780655B2 (ja) ログ分析システム、方法およびプログラム
JP6787340B2 (ja) ログ分析システム、ログ分析方法及びプログラム
CN110891197A (zh) 视频广告投放状况检测方法、装置、电子设备及存储介质
CN112433705A (zh) 脚本生成方法、装置、电子设备及存储介质
CN112069425A (zh) 日志管理方法、装置、电子设备及可读存储介质
CN112948418A (zh) 动态查询方法、装置、设备及存储介质
CN110188276B (zh) 数据发送装置、方法、电子设备及计算机可读存储介质
CN110851334A (zh) 流量统计方法、电子设备、系统及介质
CN109189809B (zh) 一种股东名称关联匹配的方法和装置
CN111340062A (zh) 一种映射关系确定方法及装置
CN110943989A (zh) 一种设备鉴别方法、装置、电子设备及可读存储介质
CN110830314B (zh) 一种异常流量的确定方法及装置
CN111552566B (zh) 一种数据处理系统、方法、电子设备及存储介质
CN112882758B (zh) 一种iOS设备标识符的生成方法及系统
CN114218011A (zh) 测试仿真方法、装置、终端设备及存储介质
CN112685253A (zh) 前端报错日志采集方法、装置、设备及存储介质
CN113051178A (zh) 测试数据构造方法、装置、设备及介质
CN110019262B (zh) 数据更新方法及装置
CN110837454A (zh) 接口监控的处理方法及服务器
CN113923189B (zh) 基于数据流的ip地址备案信息核查方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant