CN113837318A - 流量判定方案的确定方法和装置、电子设备和存储介质 - Google Patents

流量判定方案的确定方法和装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113837318A
CN113837318A CN202111222486.XA CN202111222486A CN113837318A CN 113837318 A CN113837318 A CN 113837318A CN 202111222486 A CN202111222486 A CN 202111222486A CN 113837318 A CN113837318 A CN 113837318A
Authority
CN
China
Prior art keywords
target
preset time
target service
accounts
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111222486.XA
Other languages
English (en)
Inventor
江金陵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mininglamp Software System Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN202111222486.XA priority Critical patent/CN113837318A/zh
Publication of CN113837318A publication Critical patent/CN113837318A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/24765Rule-based classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0248Avoiding fraud

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种流量判定方案的确定方法和装置、电子设备和存储介质,其中,该方法包括:获取在目标业务被触发的情况下所产生的目标流量,其中,目标业务为广告提供者在提供广告时对应生成的广告业务,目标流量为运行目标业务所消耗的流量;根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征,其中,参考特征用于表征目标业务在多个预设时间单位内被执行的数量;利用目标模型确定参考特征的重要度数值;根据重要度数值确定目标特征,得到更新后的流量判定方案,其中,目标特征为参考特征的子集。通过本申请,解决了相关技术中存在的异常流量判定不充分的问题。

Description

流量判定方案的确定方法和装置、电子设备和存储介质
技术领域
本申请涉及数据处理领域,尤其涉及一种流量判定方案的确定方法和装置、电子设备和存储介质。
背景技术
广告是互联网行业的主要营收手段之一。在短视频、社交媒体、移动互联网越来越发达的今天,广告主们开始向着互联网进军的步伐已不可逆转。与此同时,异常流量及数据造假是数字营销行业的顽疾,伴随着流量转化变现和数据资产化的趋势,广告异常、虚假流量、广告作弊、用户数据滥用和隐私信息泄露等问题时常出现,造成社会资源浪费和财产损失,对广告行业提出了新的挑战。为保障广告主利益,广告行业需要第三方数据服务供应商保障品牌方广告的真实性,为品牌方和消费者打造高透明度的广告环境。
相关技术主要基于在数字广告领域总结出来的异常流量业务规则,比如明显异常的高速、连续或重复请求流量,或者多时间窗口下,同一用户在同一广告位上的曝光数过高或点击次数过多等规则来作为异常流量业务的判断。还有一类技术是设置反爬虫机制,检测到来自机器人和爬虫伪装成合法用户的曝光/点击,即判定为异常流量。但是,人工分析和判断的广告异常流量规则相对简单粗暴,且现成的常用异常流量业务规则易被异常流量侦破,即当很多作弊软件升级后会出现检测或判定不到异常流量的情况。
因此,相关技术中存在异常流量判定不充分的问题。
发明内容
本申请提供了一种异常流量的流量判定方案的确定方法和装置、电子设备和存储介质,以至少解决相关技术中存在异常流量判定不充分的问题。
根据本申请实施例的一个方面,提供了一种流量判定方案的确定方法,该方法包括:获取在目标业务被触发的情况下所产生的目标流量,其中,目标业务为广告提供者在提供广告时对应生成的广告业务,目标流量为运行目标业务所消耗的流量;根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征,其中,参考特征用于表征目标业务在多个预设时间单位内被执行的数量;利用目标模型确定参考特征的重要度数值;根据重要度数值确定目标特征,得到更新后的流量判定方案,其中,目标特征为参考特征的子集。
根据本申请实施例的另一个方面,还提供了一种流量判定方案的确定装置,该装置包括:第一获取单元,用于获取在目标业务被触发的情况下所产生的目标流量,其中,目标业务为广告提供者在提供广告时对应生成的广告业务,目标流量为运行目标业务所消耗的流量;提取单元,用于根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征,其中,参考特征用于表征目标业务在多个预设时间单位内被执行的数量;确定单元,用于利用目标模型确定参考特征的重要度数值;得到单元,用于根据重要度数值确定目标特征,得到更新后的流量判定方案,其中,目标特征为参考特征的子集。
可选地,得到单元包括:第一得到模块,用于根据目标业务所处的业务场景,得到业务场景对应的历史分析数据,其中,历史分析数据为业务人员评判目标业务所关联的数据;排序模块,用于根据历史分析数据,对重要度数值进行排序,得到排序结果;
筛选模块,用于利用排序结果,从参考特征中筛选出目标特征。
可选地,得到单元包括:第二得到模块,用于利用目标特征,生成对应的第一规则,将第一规则增加到流量判定数据库内,得到更新后的流量判定方案;
或者,
第三得到模块,用于利用目标特征,修改初始的流量判定方案内设置的判定条件阈值,根据修改后的判定条件阈值,生成对应的第二规则,将第二规则增加到流量判定数据库内,得到更新后的流量判定方案。
可选地,预设时间单位为预设时间窗,提取单元包括:第一确定模块,用于确定多个预设时间窗,其中,预设时间窗包括:日期时间窗、小时时间窗、分钟时间窗、秒时间窗;第一获取模块,用于获取每个预设时间窗内执行目标业务的设备帐号的数量;第一设置模块,用于将设备帐号的数量设置为参考特征。
可选地,该装置还包括:第二获取单元,用于在获取每个预设时间窗内执行目标业务的设备帐号的数量之后,获取每个预设时间窗内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值;第一设置单元,用于将每个预设时间窗内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值设置为参考特征。
可选地,预设时间单位为预设时间段,提取单元包括:第二确定模块,用于确定多个预设时间段,其中,预设时间段包括:日期时间段、小时时间段、分钟时间段、秒时间段;第二获取模块,用于获取每个预设时间段内执行目标业务的设备帐号的数量;第二设置模块,用于将设备帐号的数量设置为参考特征。
可选地,该装置还包括:第三获取单元,用于在获取每个预设时间段内执行目标业务的设备帐号的数量之后,获取每个预设时间段内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值;第二设置单元,用于将每个预设时间段内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值设置为参考特征。
根据本申请实施例的又一个方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;其中,存储器,用于存储计算机程序;处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行上述任一实施例中的方法步骤。
根据本申请实施例的又一个方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一实施例中的方法步骤。
本申请可以应用于数据能力领域进行数据挖掘,在本申请实施例中,通过获取在目标业务被触发的情况下所产生的目标流量,其中,目标业务为广告提供者在提供广告时对应生成的广告业务,目标流量为运行目标业务所消耗的流量;根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征,其中,参考特征用于表征目标业务在多个预设时间单位内被执行的数量;利用目标模型确定参考特征的重要度数值;根据重要度数值确定目标特征,得到更新后的流量判定方案,其中,目标特征为参考特征的子集。由于本申请实施例利用多个预设时间单位内执行目标业务的数量,输入目标模型内,得到各个预设时间单位对应参考特征的重要度,然后利用该重要度去筛选出一些目标特征更新已有的流量判定方案,得到更新后的流量判定方案,利用该更新后的流量判定方案作为最终的异常流量判定规则,从而实现对已有广告异常流量规则的补充,使得已有的流量判定方案判定异常流量的规则更加丰富,提高异常流量的判断准确度,进而解决了相关技术中存在的异常流量判定不充分的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种可选的流量判定方案的确定方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的流量判定方案的确定方法的流程示意图;
图3是根据本申请实施例提供的针对一目标特征形成新的流量判定规则的界面示意图;
图4是根据本申请实施例提供的在不同预设时间单位内包含的记录数量的部分示意图;
图5是根据本申请实施例的一种可选的流量判定方案的确定装置的结构框图;
图6是根据本申请实施例的一种可选的电子设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种流量判定方案的确定方法。可选地,在本实施例中,上述流量判定方案的确定方法可以应用于如图1所示的硬件环境中。如图1所示,终端102中可以包含有存储器104、处理器106和显示器108(可选部件)。终端102可以通过网络110与服务器112进行通信连接,该服务器112可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器112上或独立于服务器112设置数据库114,用于为服务器112提供数据存储服务。此外,服务器112中可以运行有处理引擎116,该处理引擎116可以用于执行由服务器112所执行的步骤。
可选地,终端102可以但不限于为可以计算数据的终端,如移动终端(例如手机、平板电脑)、笔记本电脑、PC(Personal Computer,个人计算机)机等终端上,上述网络可以包括但不限于无线网络或有线网络。其中,该无线网络包括:蓝牙、WIFI(Wireless Fidelity,无线保真)及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述服务器112可以包括但不限于任何可以进行计算的硬件设备。
此外,在本实施例中,上述流量判定方案的确定方法还可以但不限于应用于处理能力较强大的独立的处理设备中,而无需进行数据交互。例如,该处理设备可以但不限于为处理能力较强大的终端设备,即,上述流量判定方案的确定方法中的各个操作可以集成在一个独立的处理设备中。上述仅是一种示例,本实施例中对此不作任何限定。
可选地,在本实施例中,上述流量判定方案的确定方法可以由服务器112来执行,也可以由终端102来执行,还可以是由服务器112和终端102共同执行。其中,终端102执行本申请实施例的流量判定方案的确定方法也可以是由安装在其上的客户端来执行。
以运行在服务器为例,图2是根据本申请实施例的一种可选的流量判定方案的确定方法的流程示意图,如图2所示,该方法的流程可以包括以下步骤:
步骤S201,获取在目标业务被触发的情况下所产生的目标流量,其中,目标业务为广告提供者在提供广告时对应生成的广告业务,目标流量为运行目标业务所消耗的流量。
可选地,在本申请实施例中,是对广告领域中,存在的各种短视频、社交媒体等出现时所产生的流量进行判定的场景。所以,本申请实施例利用服务器获取到一目标业务在被触发的情况下所产生的目标流量,可以理解的是,这里的目标业务可以是广告提供者对任一广告的投放业务,比如xxx广告宣传业务。然后,在运行该广告业务时,需要一定的数据流量来支撑,所以在目标业务被触发的同时,会产生目标流量,而该目标流量正是运行该目标业务所需要消耗的流量。
另外,该目标流量内包含正常流量样本和异常流量样本,异常流量样本可以由种子黑名单以及已有业务规则导出,正常流量样本可以在除去已知异常流量的数据中随机采样。正常和异常流量样本比例可以为2:1。
步骤S202,根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征,其中,参考特征用于表征目标业务在多个预设时间单位内被执行的数量。
可选地,本申请实施例提前设置多个预设时间单位,利用该多个预设时间单位提取出上述目标业务对应的多个参考特征,其中,该参考特征为目标业务被触发(或执行)时对应的次数(或数量)。可以理解的是,预设时间单位可以是任意单位时间,其数值可以是根据业务人员历史经验获得的等,比如30天,18小时等,本申请实施例不对预设时间单位的数值做具体限定。
步骤S203,利用目标模型确定参考特征的重要度数值。
可选地,通过目标模型得到参考特征重要程度,得到重要度数值,例如随机森林算法在数据训练结束后可以输出提取的各个参考特征重要程度。
步骤S204,根据重要度数值确定目标特征,得到更新后的流量判定方案,其中,目标特征为参考特征的子集。
可选地,利用各个参考特征的重要度数值(即重要程度),筛选出目标特征,其中,目标特征是参考特征的子集,比如参考特征有200个,目标特征是从参考特征里面选取的其中100个等。
再利用目标特征作为新特征添加到已有的流量判定方案中,得到更新后的流量判定方案。可以理解的是,流量判定方案是用于判定异常流量的,所以更新后的流量判定方案也具备异常流量判断的功能。
在本申请实施例中,通过获取在目标业务被触发的情况下所产生的目标流量,其中,目标业务为广告提供者在提供广告时对应生成的广告业务,目标流量为运行目标业务所消耗的流量;根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征,其中,参考特征用于表征目标业务在多个预设时间单位内被执行的数量;利用目标模型确定参考特征的重要度数值;根据重要度数值确定目标特征,得到更新后的流量判定方案,其中,目标特征为参考特征的子集。由于本申请实施例利用多个预设时间单位内执行目标业务的数量,输入目标模型内,得到各个预设时间单位对应参考特征的重要度,然后利用该重要度去筛选出一些目标特征更新已有的流量判定方案(即规则),得到更新后的流量判定方案,利用该更新后的流量判定方案作为最终的异常流量判定规则,从而实现对已有广告异常流量规则的补充,使得已有的流量判定方案判定异常流量的规则更加丰富,提高异常流量的判断准确度,进而解决了相关技术中存在的异常流量判定不充分的问题。
作为一种可选实施例,根据重要度数值确定目标特征包括:
根据目标业务所处的业务场景,得到业务场景对应的历史分析数据,其中,历史分析数据为业务人员评判目标业务所关联的数据;
根据历史分析数据,对重要度数值进行排序,得到排序结果;
利用排序结果,从参考特征中筛选出目标特征。
可选地,本申请实施例可以获取到目标业务当前所处在的业务场景,然后获取到该业务场景下业务人员的日常历史分析数据,这样可以使得业务人员根据自身业务经验对得到的多个重要度数值进行从大到小或者从小到大的排序,得到排序结果。
比如,得到5个参考特征,分别是每个目标业务在广告播放设备上30天内出现的数量a、50小时内出现的数量b、600分钟内出现的数量c、1000秒内出现的数量d、30天内出现的数量的均值e。然后目标模型可以对上述5个参考特征进行排序,得到eabcd。
然后再参照业务人员的历史分析数据,从上述eabcd中,针对每个特征,在正常和异常流量样本中检测分布,比如筛选出3个特征eab作为目标特征。
作为一种可选实施例,根据重要度数值确定目标特征,得到更新后的流量判定方案包括:
利用目标特征,生成对应的第一规则,将第一规则增加到流量判定数据库内,得到更新后的流量判定方案;
或者,
利用目标特征,修改初始的流量判定方案内设置的判定条件阈值,根据修改后的判定条件阈值,生成对应的第二规则,将第二规则增加到流量判定数据库内,得到更新后的流量判定方案。
可选地,如图3,业务人员可以直接将得到的目标特征作为新的规则,直接增加到已有的流量判定数据库内,然后得到扩充后的流量判定方案。
另外,也可以利用目标特征,修改初始(即已有)的流量判定方案内设置的判定条件阈值,比如初始的流量判定方案内设置的判定条件阈值为7天内目标业务被执行时出现数量大于等于50,后来改为7天内目标业务被执行时出现数量大于等于80等。这时,将7天内目标业务被执行时出现数量大于等于80作为一条新规则增加到流量判定数据库内,得到更新后的流量判定方案。本申请实施例不对判定条件阈值的具体数值设定作限定,其可根据实际情况灵活变动。
作为一种可选实施例,预设时间单位为预设时间窗,根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征包括:
确定多个预设时间窗,其中,预设时间窗包括:日期时间窗、小时时间窗、分钟时间窗、秒时间窗;
获取每个预设时间窗内执行目标业务的设备帐号的数量;将设备帐号的数量设置为参考特征。
在获取每个预设时间窗内执行目标业务的设备帐号的数量之后,获取每个预设时间窗内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值;
将每个预设时间窗内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值设置为参考特征。
可选地,在本申请实施例中,可以提前设置多个预设时间窗,比如日期时间窗、小时时间窗、分钟时间窗、秒时间窗,其中时间窗是一可滑动设置的步长数值,如果预设时间窗为日期时间窗,而此时需要任意30天内记录的数量,这时,可以是指1月15日到2月15日这种日期作为所需的日期时间窗。
然后获取到每个预设时间窗内执行目标业务的设备帐号的数量,然后将设备帐号的数量设置为参考特征。
也可以在获取到目标业务的设备帐号的数量之后,计算每个预设时间窗内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值等,然后将这些最大值、最小值、均值以及方差值作为上述参考特征。
作为一种可选实施例,预设时间单位为预设时间段,根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征包括:
确定多个预设时间段,其中,预设时间段包括:日期时间段、小时时间段、分钟时间段、秒时间段;
获取每个预设时间段内执行目标业务的设备帐号的数量;将设备帐号的数量设置为参考特征。
获取每个预设时间段内执行目标业务的设备帐号的数量之后,获取每个预设时间段内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值;
将每个预设时间段内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值设置为参考特征。
可选地,在本申请实施例中,可以提前设置多个预设时间段,比如日期时间段、小时时间段、分钟时间段、秒时间段,其中时间段是以固定的时长数值,如果预设时间段为日期时间段,而此时需要任意30天内记录的数量,这时,可以是指1月、2月这种日期作为所需的日期时间段。
然后获取到每个预设时间段内执行目标业务的设备帐号的数量,然后将设备帐号的数量设置为参考特征。
也可以在获取到目标业务的设备帐号的数量之后,计算每个预设时间段内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值等,参见图4,然后将这些最大值、最小值、均值以及方差值作为上述参考特征。其中,图4中id指设备帐号,date指日期、hour指小时、minute指分钟、second指秒。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM(Read-Only Memory,只读存储器)/RAM(Random Access Memory,随机存取存储器)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述流量判定方案的确定方法的流量判定方案的确定装置。图5是根据本申请实施例的一种可选的流量判定方案的确定装置的结构框图,如图5所示,该装置可以包括:第一获取单元501,用于获取在目标业务被触发的情况下所产生的目标流量,其中,目标业务为广告提供者在提供广告时对应生成的广告业务,目标流量为运行目标业务所消耗的流量;提取单元502,与第一获取单元501相连,用于根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征,其中,参考特征用于表征目标业务在多个预设时间单位内被执行的数量;确定单元503,与提取单元502相连,用于利用目标模型确定参考特征的重要度数值;得到单元504,与确定单元503相连,用于根据重要度数值确定目标特征,得到更新后的流量判定方案,其中,目标特征为参考特征的子集。
需要说明的是,该实施例中的第一获取单元501可以用于执行上述步骤S201,该实施例中的提取单元502可以用于执行上述步骤S202,该实施例中的确定单元503可以用于执行上述步骤S203,该实施例中的得到单元504可以用于执行上述步骤S204。
通过上述模块,由于利用多个预设时间单位内执行目标业务的数量,输入目标模型内,得到各个预设时间单位对应参考特征的重要度,然后利用该重要度去筛选出一些目标特征更新已有的流量判定方案,得到更新后的流量判定方案,利用该更新后的流量判定方案作为最终的异常流量判定规则,从而实现对已有广告异常流量规则的补充,使得已有的流量判定方案判定异常流量的规则更加丰富,提高异常流量的判断准确度,进而解决了相关技术中存在的异常流量判定不充分的问题。
作为一种可选实施例,得到单元504包括:第一得到模块,用于根据目标业务所处的业务场景,得到业务场景对应的历史分析数据,其中,历史分析数据为业务人员评判目标业务所关联的数据;排序模块,用于根据历史分析数据,对重要度数值进行排序,得到排序结果;筛选模块,用于利用排序结果,从参考特征中筛选出目标特征。
作为一种可选实施例,得到单元504包括:第二得到模块,用于利用目标特征,生成对应的第一规则,将第一规则增加到流量判定数据库内,得到更新后的流量判定方案;
或者,
第三得到模块,用于利用目标特征,修改初始的流量判定方案内设置的判定条件阈值,根据修改后的判定条件阈值,生成对应的第二规则,将第二规则增加到流量判定数据库内,得到更新后的流量判定方案。
作为一种可选实施例,预设时间单位为预设时间窗,提取单元503包括:第一确定模块,用于确定多个预设时间窗,其中,预设时间窗包括:日期时间窗、小时时间窗、分钟时间窗、秒时间窗;第一获取模块,用于获取每个预设时间窗内执行目标业务的设备帐号的数量;第一设置模块,用于将设备帐号的数量设置为参考特征。
作为一种可选实施例,该装置还包括:第二获取单元,用于在获取每个预设时间窗内执行目标业务的设备帐号的数量之后,获取每个预设时间窗内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值;第一设置单元,用于将每个预设时间窗内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值设置为参考特征。
作为一种可选实施例,预设时间单位为预设时间段,提取单元503包括:第二确定模块,用于确定多个预设时间段,其中,预设时间段包括:日期时间段、小时时间段、分钟时间段、秒时间段;第二获取模块,用于获取每个预设时间段内执行目标业务的设备帐号的数量;第二设置模块,用于将设备帐号的数量设置为参考特征。
作为一种可选实施例,该装置还包括:第三获取单元,用于在获取每个预设时间段内执行目标业务的设备帐号的数量之后,获取每个预设时间段内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值;第二设置单元,用于将每个预设时间段内设备帐号的数量的最大值、设备帐号的数量的最小值、设备帐号的数量的均值以及设备帐号的数量的方差值设置为参考特征。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的又一个方面,还提供了一种用于实施上述流量判定方案的确定方法的电子设备,该电子设备可以是服务器、终端、或者其组合。
图6是根据本申请实施例的一种可选的电子设备的结构框图,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601、通信接口602和存储器603通过通信总线604完成相互间的通信,其中,
存储器603,用于存储计算机程序;
处理器601,用于执行存储器603上所存放的计算机程序时,实现如下步骤:
获取在目标业务被触发的情况下所产生的目标流量,其中,目标业务为广告提供者在提供广告时对应生成的广告业务,目标流量为运行目标业务所消耗的流量;
根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征,其中,参考特征用于表征目标业务在多个预设时间单位内被执行的数量;
利用目标模型确定参考特征的重要度数值;
根据重要度数值确定目标特征,得到更新后的流量判定方案,其中,目标特征为参考特征的子集。
可选地,在本实施例中,上述的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线、或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM,也可以包括非易失性存储器(non-volatile memory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
作为一种示例,如图6所示,上述存储器603中可以但不限于包括上述流量判定方案的确定装置中的第一获取单元501、提取单元502、确定单元503、得到单元504。此外,还可以包括但不限于上述流量判定方案的确定装置中的其他模块单元,本示例中不再赘述。
上述处理器可以是通用处理器,可以包含但不限于:CPU(Central ProcessingUnit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(DigitalSignal Processing,数字信号处理器)、ASIC(Application Specific IntegratedCircuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
此外,上述电子设备还包括:显示器,用于显示流量判定方案的确定结果。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图6所示的结构仅为示意,实施上述流量判定方案的确定方法的设备可以是终端设备,该终端设备可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图6其并不对上述电子设备的结构造成限定。例如,终端设备还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示的不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
根据本申请实施例的又一个方面,还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行流量判定方案的确定方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
获取在目标业务被触发的情况下所产生的目标流量,其中,目标业务为广告提供者在提供广告时对应生成的广告业务,目标流量为运行目标业务所消耗的流量;
根据多个预设时间单位,提取出执行目标业务时所对应的多个参考特征,其中,参考特征用于表征目标业务在多个预设时间单位内被执行的数量;
利用目标模型确定参考特征的重要度数值;
根据重要度数值确定目标特征,得到更新后的流量判定方案,其中,目标特征为参考特征的子集。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例中对此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
根据本申请实施例的又一个方面,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中;计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一个实施例中的流量判定方案的确定方法步骤。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例流量判定方案的确定方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例中所提供的方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种流量判定方案的确定方法,其特征在于,所述方法包括:
获取在目标业务被触发的情况下所产生的目标流量,其中,所述目标业务为广告提供者在提供广告时对应生成的广告业务,所述目标流量为运行所述目标业务所消耗的流量;
根据多个预设时间单位,提取出执行所述目标业务时所对应的多个参考特征,其中,所述参考特征用于表征所述目标业务在多个所述预设时间单位内被执行的数量;
利用目标模型确定所述参考特征的重要度数值;
根据所述重要度数值确定目标特征,得到更新后的流量判定方案,其中,所述目标特征为所述参考特征的子集。
2.根据权利要求1所述的方法,其特征在于,所述根据所述重要度数值确定目标特征包括:
根据所述目标业务所处的业务场景,得到所述业务场景对应的历史分析数据,其中,所述历史分析数据为业务人员评判所述目标业务所关联的数据;
根据所述历史分析数据,对所述重要度数值进行排序,得到排序结果;
利用所述排序结果,从所述参考特征中筛选出所述目标特征。
3.根据权利要求2所述的方法,其特征在于,所述根据所述重要度数值确定目标特征,得到更新后的流量判定方案包括:
利用所述目标特征,生成对应的第一规则,将所述第一规则增加到所述流量判定数据库内,得到所述更新后的流量判定方案;
或者,
利用所述目标特征,修改初始的流量判定方案内设置的判定条件阈值,根据修改后的判定条件阈值,生成对应的第二规则,将所述第二规则增加到所述流量判定数据库内,得到所述更新后的流量判定方案。
4.根据权利要求1所述的方法,其特征在于,所述预设时间单位为预设时间窗,所述根据多个预设时间单位,提取出执行所述目标业务时所对应的多个参考特征包括:
确定多个所述预设时间窗,其中,所述预设时间窗包括:日期时间窗、小时时间窗、分钟时间窗、秒时间窗;
获取每个所述预设时间窗内执行所述目标业务的设备帐号的数量;
将所述设备帐号的数量设置为所述参考特征。
5.根据权利要求4所述的方法,其特征在于,在所述获取每个所述预设时间窗内执行所述目标业务的设备帐号的数量之后,所述方法还包括:
获取每个所述预设时间窗内所述设备帐号的数量的最大值、所述设备帐号的数量的最小值、所述设备帐号的数量的均值以及所述设备帐号的数量的方差值;
将每个所述预设时间窗内所述设备帐号的数量的最大值、所述设备帐号的数量的最小值、所述设备帐号的数量的均值以及所述设备帐号的数量的方差值设置为所述参考特征。
6.根据权利要求1所述的方法,其特征在于,所述预设时间单位为预设时间段,所述根据多个预设时间单位,提取出执行所述目标业务时所对应的多个参考特征包括:
确定多个所述预设时间段,其中,所述预设时间段包括:日期时间段、小时时间段、分钟时间段、秒时间段;
获取每个所述预设时间段内执行所述目标业务的设备帐号的数量;
将所述设备帐号的数量设置为所述参考特征。
7.根据权利要求6所述的方法,其特征在于,在所述获取每个所述预设时间段内执行所述目标业务的设备帐号的数量之后,所述方法还包括:
获取每个所述预设时间段内所述设备帐号的数量的最大值、所述设备帐号的数量的最小值、所述设备帐号的数量的均值以及所述设备帐号的数量的方差值;
将每个所述预设时间段内所述设备帐号的数量的最大值、所述设备帐号的数量的最小值、所述设备帐号的数量的均值以及所述设备帐号的数量的方差值设置为所述参考特征。
8.一种流量判定方案的确定装置,其特征在于,所述装置包括:
第一获取单元,用于获取在目标业务被触发的情况下所产生的目标流量,其中,所述目标业务为广告提供者在提供广告时对应生成的广告业务,所述目标流量为运行所述目标业务所消耗的流量;
提取单元,用于根据多个预设时间单位,提取出执行所述目标业务时所对应的多个参考特征,其中,所述参考特征用于表征所述目标业务在多个所述预设时间单位内被执行的数量;
确定单元,用于利用目标模型确定所述参考特征的重要度数值;
得到单元,用于根据所述重要度数值确定目标特征,得到更新后的流量判定方案,其中,所述目标特征为所述参考特征的子集。
9.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信,其特征在于,
所述存储器,用于存储计算机程序;
所述处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行权利要求1至7中任一项所述的方法步骤。
10.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至7中任一项中所述的方法步骤。
CN202111222486.XA 2021-10-20 2021-10-20 流量判定方案的确定方法和装置、电子设备和存储介质 Pending CN113837318A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111222486.XA CN113837318A (zh) 2021-10-20 2021-10-20 流量判定方案的确定方法和装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111222486.XA CN113837318A (zh) 2021-10-20 2021-10-20 流量判定方案的确定方法和装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113837318A true CN113837318A (zh) 2021-12-24

Family

ID=78965578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111222486.XA Pending CN113837318A (zh) 2021-10-20 2021-10-20 流量判定方案的确定方法和装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113837318A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114637474A (zh) * 2022-04-07 2022-06-17 苏州浪潮智能科技有限公司 数据块处理的方法、装置、电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105262722A (zh) * 2015-09-07 2016-01-20 深信服网络科技(深圳)有限公司 终端恶意流量规则更新方法、云端服务器和安全网关
CN106815741A (zh) * 2016-12-02 2017-06-09 乐视控股(北京)有限公司 一种广告投放方法、装置及电子设备
CN110505232A (zh) * 2019-08-27 2019-11-26 百度在线网络技术(北京)有限公司 网络攻击的检测方法及装置、电子设备、存储介质
CN110784458A (zh) * 2019-10-21 2020-02-11 新华三信息安全技术有限公司 流量异常检测方法、装置及网络设备
WO2020062803A1 (zh) * 2018-09-25 2020-04-02 平安科技(深圳)有限公司 基于模型树算法的异常流量分析方法、装置、电子设备及非易失性可读存储介质
US20200267176A1 (en) * 2019-02-15 2020-08-20 Verizon Patent And Licensing Inc. User-determined network traffic filtering
CN112187653A (zh) * 2020-09-28 2021-01-05 北京嘀嘀无限科技发展有限公司 一种网络流量判定方法和系统
CN113364702A (zh) * 2021-06-04 2021-09-07 上海明略人工智能(集团)有限公司 广告流量异常检测方法、系统、存储介质及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105262722A (zh) * 2015-09-07 2016-01-20 深信服网络科技(深圳)有限公司 终端恶意流量规则更新方法、云端服务器和安全网关
CN106815741A (zh) * 2016-12-02 2017-06-09 乐视控股(北京)有限公司 一种广告投放方法、装置及电子设备
WO2020062803A1 (zh) * 2018-09-25 2020-04-02 平安科技(深圳)有限公司 基于模型树算法的异常流量分析方法、装置、电子设备及非易失性可读存储介质
US20200267176A1 (en) * 2019-02-15 2020-08-20 Verizon Patent And Licensing Inc. User-determined network traffic filtering
CN110505232A (zh) * 2019-08-27 2019-11-26 百度在线网络技术(北京)有限公司 网络攻击的检测方法及装置、电子设备、存储介质
CN110784458A (zh) * 2019-10-21 2020-02-11 新华三信息安全技术有限公司 流量异常检测方法、装置及网络设备
CN112187653A (zh) * 2020-09-28 2021-01-05 北京嘀嘀无限科技发展有限公司 一种网络流量判定方法和系统
CN113364702A (zh) * 2021-06-04 2021-09-07 上海明略人工智能(集团)有限公司 广告流量异常检测方法、系统、存储介质及电子设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘海峰: "基于数据挖掘的网络流量异常检测系统的研究与实现", 西安电子科技大学, 15 April 2018 (2018-04-15), pages 1 - 92 *
刘祺 等: "基于异常感知的威胁综合防护模型研究", 湖北电力, vol. 40, no. 7, 28 July 2016 (2016-07-28), pages 42 - 46 *
吴浩明 等: "一种基于特征选择的网络流量异常检测方法", 信息工程大学学报, vol. 21, no. 6, 31 December 2020 (2020-12-31), pages 711 - 718 *
陈兴蜀 等: "基于多维时间序列分析的网络异常检测", 工程科学与技术, vol. 49, no. 1, 20 January 2017 (2017-01-20), pages 144 - 150 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114637474A (zh) * 2022-04-07 2022-06-17 苏州浪潮智能科技有限公司 数据块处理的方法、装置、电子设备

Similar Documents

Publication Publication Date Title
JP6878450B2 (ja) 広告に関する不正行為を防止するための方法及びデバイス並びに記憶媒体
CN108733706B (zh) 热度信息的生成方法和装置
CN110366041B (zh) 媒体数据分享方法、装置及设备
CN112418932B (zh) 一种基于用户标签的营销信息推送方法及装置
CN104091276A (zh) 在线分析点击流数据的方法和相关装置及系统
CN111160624B (zh) 一种用户意向预测方法、用户意向预测装置及终端设备
CN113271322B (zh) 异常流量的检测方法和装置、电子设备和存储介质
CN108256894B (zh) 广告展示控制方法、设备、服务器及客户端
CN114868119A (zh) 信息推送方法、装置、服务器及存储介质
CN113127723B (zh) 用户画像处理方法、装置、服务器及存储介质
CN111522724A (zh) 异常账号的确定方法、装置、服务器及存储介质
CN109714393A (zh) 一种应用程序推荐的方法及装置
CN111340062A (zh) 一种映射关系确定方法及装置
CN105959403A (zh) 一种壁纸的推荐方法、服务器及移动终端
CN111865753B (zh) 媒体信息的参数确定方法和装置、存储介质、电子装置
CN110188276B (zh) 数据发送装置、方法、电子设备及计算机可读存储介质
CN113837318A (zh) 流量判定方案的确定方法和装置、电子设备和存储介质
CN113535994B (zh) 用户对多媒体的兴趣指标的确定方法和装置
CN111401395A (zh) 一种数据处理方法、终端设备及存储介质
CN111918323B (zh) 数据的校准方法、装置、设备以及存储介质
CN108629610B (zh) 推广信息曝光量的确定方法和装置
CN114663139A (zh) 资源位的处理方法、装置、存储介质和处理器
CN114595390A (zh) 用于推送信息的方法、设备和介质
CN107368597B (zh) 信息输出方法和装置
CN112819515A (zh) 资源的推送方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination