CN110119340A - 异常监测方法、装置、电子设备和存储介质 - Google Patents

异常监测方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN110119340A
CN110119340A CN201910414901.8A CN201910414901A CN110119340A CN 110119340 A CN110119340 A CN 110119340A CN 201910414901 A CN201910414901 A CN 201910414901A CN 110119340 A CN110119340 A CN 110119340A
Authority
CN
China
Prior art keywords
data
field
setting
monitoring
target data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910414901.8A
Other languages
English (en)
Inventor
张怡
张威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201910414901.8A priority Critical patent/CN110119340A/zh
Publication of CN110119340A publication Critical patent/CN110119340A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Computing Systems (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开实施例公开了一种异常监测方法、装置、电子设备和存储介质,其中该方法包括:获取原始上报数据;对原始上报数据按照配置的设定属性维度识别关联字段;根据关联字段从原始上报数据中提取目标数据;对目标数据进行异常监测。本公开实施例避免了对原始上报数据中所有字段的监测指标阈值的配置,优化了数据异常分析监测过程的指标配置方案,减少了配置工作量,提高了数据异常监测的效率。

Description

异常监测方法、装置、电子设备和存储介质
技术领域
本公开实施例涉及数据处理技术领域,尤其涉及一种异常监测方法、装置、电子设备和存储介质。
背景技术
随着互联网和智能终端的发展,为了更加有针对性地对用户投放广告,需要对业务平台或客户端上推送的广告,通过广告系统进行广告数据指标的监控。其中广告数据指标可以包括:广告信息展示行为、用户点击广告信息以跳转到广告服务器的行为、和用户通过浏览广告信息而促成的购买行为等诸多与广告相关的行为数据。这些广告数据指标可用于广告业务计费,也可作为优化后续广告投放策略的依据。
现有技术中,为了获得这些广告数据指标,是通过在客户端的程序代码中形成埋点来实现的。例如,在程序代码中设置埋点程序,用于在监控到用户对广告的点击行为时产生日志或直接上报给服务器。对于从海量客户端等途径获取到的广告相关的原始上报数据,需要根据监测目标进行统计分析,例如,监测某个广告主发布的广告,是否点击率非常低,则有可能是推送策略不当;如果某个广告在某一天的点击率剧增,超出历史时期正常的点击率数值,则有可能是因为客户端改版而导致原始上报数据错误,或者是广告内容出现了作弊行为等。诸如此类,大量异常情况都需要通过对原始上报数据进行统计分析,并监测获取。
为了减少人的工作量,一般是通过广告系统来进行统计分析,并在监测到异常时报警的。但是,目前所采用的监控方案,是为各种采集到的原始上报数据配置异常监测阈值,例如,对于某个广告的点击率,可配置点击率的阈值范围,如果超出此阈值范围,则视为异常。那么,一般有多少广告,每个广告有多少监控目标,就要配置多少监控指标阈值。工作量很大,且在上线新的广告或监控目标时,或客户端改版升级后,需要调整配置的工作量很大。
发明内容
本公开实施例提供一种异常监测方法、装置、电子设备和存储介质,以优化数据异常分析监测过程的指标配置方案,减少配置工作量。
第一方面,本公开实施例提供了一种异常监测方法,包括:
获取原始上报数据;
对所述原始上报数据按照配置的设定属性维度识别关联字段;
根据所述关联字段从所述原始上报数据中提取目标数据;
对所述目标数据进行异常监测。
第二方面,本公开实施例还提供了一种异常监测装置,该装置包括:
原始数据获取模块,用于获取原始上报数据;
关联字段识别模块,用于对所述原始上报数据按照配置的设定属性维度识别关联字段;
目标数据提取模块,用于根据所述关联字段从所述原始上报数据中提取目标数据;
异常监测模块,用于对所述目标数据进行异常监测。
进一步的,所述关联字段识别模块具体用于:
按照设定属性维度的关键字,在所述原始上报数据的各个字段中进行关键字相似度匹配,以确定相似度满足设定要求的关联字段。
进一步的,所述关联字段识别模块具体用于:
按照设定属性维度的字段提取规则,在所述原始上报数据的各个字段中提取符合所述字段提取规则的至少一个字段,作为关联字段。
进一步的,所述字段提取规则包括设定用户画像和设定字段列表中的至少一个。
进一步的,所述设定属性维度包括广告属性维度和非广告属性维度。
进一步的,所述广告属性维度包括广告主名称、广告数据格式、广告投放位置和广告投放客户端中的至少一个。
进一步的,所述关联字段的数量为至少一个,所述关联字段中的字段数量为至少一个;
所述目标数据提取模块具体用于:
按照所述关联字段,在所述原始上报数据中提取至少一个所述关联字段中至少一个字段的数据,作为目标数据。
进一步的,所述异常监测模块具体用于:
按照设定指标将所述目标数据输入孤立森林模型,以确定异常数据。
进一步的,所述异常监测模块具体用于:
通过设定指标的目标阈值对所述目标数据进行异常监测,所述设定指标为浮动数据。
进一步的,所述装置还包括:
动态阈值模块,用于在通过设定指标的目标阈值对所述目标数据进行异常监测之前,根据历史阈值、时间和位置中的至少一项生成与所述设定指标对应的动态阈值规则,并根据所述动态阈值规则确定所述设定指标对应的目标阈值。
第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的异常监测方法。
第四方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的异常监测方法。
本公开实施例通过获取原始上报数据,对原始上报数据按照配置的设定属性维度识别关联字段,并根据关联字段从原始上报数据中提取目标数据,对目标数据进行异常监测。本公开实施例通过仅仅配置设定属性维度,并基于设定属性维度识别的关联字段对原始上报数据进行统计分类,进而提取目标数据,仅对目标数据配置监测指标方案进行异常监测,避免了对原始上报数据中所有字段的监测指标阈值的配置,优化了数据异常分析监测过程的指标配置方案,减少了配置工作量,提高了数据异常监测的效率。
附图说明
图1为本公开实施例提供的异常监测方法的流程图;
图2为本公开实施例提供的异常监测方法的示意图;
图3为本公开实施例提供的另一种异常监测方法的流程图;
图4为本公开实施例提供的又一种异常监测方法的流程图;
图5为本公开实施例提供的异常监测装置的结构示意图;
图6为本公开实施例提供的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本公开,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分而非全部结构。
实施例
图1为本公开实施例提供的异常监测方法的流程图,本实施例可适用于对海量的原始上报数据实现常监测的情况,该方法可以由异常监测装置执行,该装置可以采用软件和/或硬件的方式实现,该装置可配置于电子设备中,该电子设备可以是两个或多个物理实体构成,也可以是一个物理实体构成,该电子设备可以是智能手机、平板或电脑等。
图2为本公开实施例提供的异常监测方法的示意图,图中A中包括的是海量的原始上报数据,原始上报数据中包括各个字段的上报数据,通过配置的设定属性维度在A中的原始上报数据中进行关联字段的识别,基于关联字段对原始上报数据进行统计分类,得到图中B,B中包括B1、B2和B3等等关联字段,B1、B2和B3分别代表三种关联字段,每种关联字段中可以包括不同数量的字段,在B中提取目标数据,并对目标数据配置监测指标方案进行异常监测。
如图1所示,该方法具体可以包括:
S110、获取原始上报数据。
其中,原始上报数据可以包括与用户行为相关的数据,对具体的用户行为不作限定,例如用户行为可以为点击、浏览或分享等行为。原始上报数据通常为粒度较细的数据,例如当用户行为是用户对一个广告的点击行为,则原始上报数据可以包括该用户的用户信息(例如用户名)、点击行为的时间、位置、广告的相关信息等等。
具体的,异常监测装置可以获取客户端或业务平台采集的原始上报数据,客户端或业务平台可以通过其代码程序中设置的埋点程序来采集该原始上报数据。本实施例中对原始上报数据的来源不作限定,可以根据实际情况进行设定。
S120、对原始上报数据按照配置的设定属性维度识别关联字段。
其中,设定属性维度可以为对原始上报数据配置的分类统计方向,代表一个分类的标准或含义。关联字段可以为对原始上报数据的具体分类依据,根据关联字段可以对原始上报数据进行分类统计。关联字段可以代表一种属性的字段,对关联字段的数量不作限定,并且一个关联字段中包括的字段数量为至少一个。
示例性的,设定属性维度可以配置为城市,表示对原始上报数据分类统计时根据城市进行分类,关联字段可以为直辖市或自治区等具体的分类依据。
在本方案中,设定属性维度可以包括广告属性维度和非广告属性维度。其中,广告属性维度为与广告相关的属性维度,广告属性维度中包括的具体维度本实施例中不作限定,广告属性维度可以包括广告主名称、广告数据格式、广告投放位置和广告投放客户端中的至少一个,广告数据格式可以包括图像或视频等。非广告属性维度为与广告无关的属性维度,由于原始上报数据中除广告相关的上报数据之外还可以包括其他种类的数据,当需要对其他种类的数据进行异常监测时,设定属性维度为非广告属性维度,非广告属性维度中包括的具体维度可以根据实际情况进行设定。
具体的,异常监测装置可以按照设定属性维度的关键字,在原始上报数据的各个字段中进行关键字相似度匹配,以确定相似度满足设定要求的关联字段。其中,设定属性维度的关键字和关键字的数量可以根据实际情况进行设定,关键字能够表示一种属性。设定要求可以为相似度阈值,当原始上报数据中一个字段与设定属性维度的关键字的相似度大于或等于相似度阈值时,则确定该字段属于该关键字对应的关联字段,该关联字段中可以包括多个字段。示例性的,若设定属性维度为广告主名称,关键字设置为汽车,则将汽车与各个字段进行相似度匹配,可以确定所有汽车的广告主名称均属于关键字为汽车的关联字段。
S130、根据关联字段从原始上报数据中提取目标数据。
其中,关联字段的数量为至少一个,关联字段中的字段数量为至少一个。
具体的,异常监测装置对原始上报数据按照配置的设定属性维度识别到关联字段之后,可以按照关联字段,对原始上报数据进行分类统计,并且在分类统计之后的上报数据中提取至少一个关联字段中至少一个字段的数据,作为目标数据。本实施例中对每个字段提取的数据数量不作限定,例如当设定属性维度为城市,一个关联字段为直辖市,对其中的一个字段上海可以设置数据的数量阈值,当上海的数据数量超过数量阈值时,提取上海的数据,否则对上海的数据不进行提取。本实施例中对最终提取的目标数据的数量也不作限定,可以根据实际需要进行设定。例如,图2中可以提取B1、B2和B3这三个关联字段中的所有字段的数据作为目标数据,也可以提取B1和B2这两个关联字段中部分字段的数据作为目标数据。
S140、对目标数据进行异常监测。
具体的,异常监测装置提取到目标数据之后,可以通过设定指标的目标阈值对目标数据进行异常监测。其中设定指标为需要进行监测的数据指标,设定指标为浮动数据,例如广告收入或广告点击率等。由于目标数据中的数据基于关联字段进行了分类,目标阈值可以为基于关联字段设置的阈值。根据目标数据中各关联字段对应的设定指标的目标阈值,对属于各关联字段中的数据进行异常监测,当其中一个关联字段中的数据超过该关联字段对应的目标阈值,则确定该关联字段存在异常。
示例性的,当设定指标为广告点击率,目标数据中包括三个关联字段,这三个关联字段对应的广告点击率的目标阈值分别为10%、20%和30%,若三个关联字段中存在广告点击率超过对应的目标阈值的数据,则该关联字段存在异常。
在本方案中,通过获取原始上报数据,对原始上报数据按照配置的设定属性维度识别关联字段,并根据关联字段从原始上报数据中提取目标数据,对目标数据进行异常监测。在实施例中,通过仅仅配置设定属性维度,并基于设定属性维度识别的关联字段对原始上报数据进行统计分类,进而提取目标数据,仅对目标数据配置监测指标方案进行异常监测,避免了对原始上报数据中所有字段的监测指标阈值的配置,优化了数据异常分析监测过程的指标配置方案,减少了配置工作量,提高了数据异常监测的效率。
图3为本公开实施例提供的另一种异常监测方法的流程图。本实施例在上述实施例的基础上,进一步优化了上述异常监测方法。相应的,如图3所示,本实施例的方法具体包括:
S210、获取原始上报数据。
S220、对原始上报数据按照配置的设定属性维度识别关联字段。
本方案中,设定属性维度可以包括广告属性维度和非广告属性维度。其中,广告属性维度为与广告相关的属性维度,广告属性维度中包括的具体维度本实施例中不作限定,广告属性维度可以包括广告主名称、广告数据格式、广告投放位置和广告投放客户端中的至少一个。
具体的,对原始上报数据按照配置的设定属性维度识别关联字段,可以包括:按照设定属性维度的关键字,在原始上报数据的各个字段中进行关键字相似度匹配,以确定相似度满足设定要求的关联字段,或者,按照设定属性维度的字段提取规则,在原始上报数据的各个字段中提取符合字段提取规则的至少一个字段,作为关联字段。
其中,字段提取规则可以为根据实际需求或者历史经验设置的规则,具体的规则内容本实施例中不作限定。例如,字段提取规则可以包括设定用户画像和设定字段列表等规则中的至少一个,其中设定用户画像可以包括用户年龄、性别或者用户所属地域等用户的特定标签,设定字段列表可以为根据历史经验设置的具有相同属性的字段,其中可以包括至少一个字段。
按照设定属性维度的字段提取规则,在原始上报数据的各个字段中提取符合字段提取规则的至少一个字段,作为关联字段,具体包括:若原始上报数据的一个字段符合设定属性维度的字段提取规则,则该字段属于该字段提取规则对应的关联字段,该关联字段中的字段数量可以为多个。本实施例中的字段提取规则的数量也可以为多个。示例性的,若设定属性维度为用户年龄,字段提取规则为用户年龄20岁到30岁,则带有用户年龄20岁到30岁标签的字段均属于该字段提取规则对应的关联字段。
本方案中关联字段的识别的方式除关键字相似度匹配之外,还增加了字段提取规则,使得关联字段的识别更加多样化及有针对性,在实际使用过程中,可以更加便捷地根据需要调整关联字段,以得到相关的目标数据。
S230、按照关联字段,在原始上报数据中提取至少一个关联字段中至少一个字段的数据,作为目标数据。
其中,关联字段的数量为至少一个,关联字段中的字段数量为至少一个。
S240、根据历史阈值、时间和位置中的至少一项生成与设定指标对应的动态阈值规则,并根据动态阈值规则确定设定指标对应的目标阈值。
其中,历史阈值可以为当前时刻之前预设时间内该设定指标的监测阈值,其中预设时间可以根据实际情况进行设定,例如当设定指标波动较为严重时,预设时间可以设置较短,反之预设时间可以设置较长。动态阈值规则可以为用于自动确定目标阈值的规则,具体可以根据影响因素进行确定,影响因素可以包括历史阈值、时间和位置中的至少一项。
根据历史阈值生成与设定指标对应的动态阈值规则,可以包括:将动态阈值规则确定为计算历史阈值与当前时刻之前预设时间内设定指标的方差之和。根据时间生成与设定指标对应的动态阈值规则,可以包括:根据工作日和节假日分布设置对应的动态阈值规则,或者根据白天和晚上分别设置对应的动态阈值规则。例如,工作日时设置的动态阈值规则可以为统计当前时刻之前预设时间内设定指标的均值,节假日时设置的动态阈值规则可以为统计当前时刻之前预设时间内设定指标的中位数的值。根据位置生成与设定指标对应的动态阈值规则,可以包括:根据不同位置设置对应的动态阈值规则。例如在设定指标的数据量较为稳定的位置,动态阈值规则可以为计算当前时刻之前预设时间内设定指标的均值的十分之一;而在设定指标的数据量较为波动的位置,动态阈值规则可以为计算当前时刻之前预设时间内设定指标的均值的一半。
具体的,根据动态阈值规则确定设定指标对应的目标阈值,可以包括:根据当前时间、当前位置以及至少一种动态阈值规则确定设定指标对应的目标阈值。本实施例中,目标阈值可以自动根据动态阈值规则进行确定,不用在新增广告或客户端改版等情况出现时,针对每个具体变更的情况重新配置异常监测目标,进一步节省了时间,提高了配置效率。
S250、通过设定指标的目标阈值对目标数据进行异常监测。
具体的,根据动态阈值规则确定设定指标对应的目标阈值之后,通过该目标阈值对目标数据进行异常监测。
在本方案中,通过获取原始上报数据,对原始上报数据按照配置的设定属性维度识别关联字段,按照关联字段,在原始上报数据中提取至少一个关联字段中至少一个字段的数据,作为目标数据,根据历史阈值、时间和位置中的至少一项生成与设定指标对应的动态阈值规则,并根据动态阈值规则确定设定指标对应的目标阈值,通过设定指标的目标阈值对目标数据进行异常监测。在实施例中,通过仅仅配置设定属性维度,并基于设定属性维度识别的关联字段对原始上报数据进行分类统计,进而提取目标数据进行异常监测,避免了对原始上报数据中所有字段的监测指标阈值的配置,优化了数据异常分析监测过程的指标配置方案,减少了配置工作量,提高了数据异常监测的效率;并且,对目标数据的异常监测采用动态阈值规则确定的阈值进行监测,异常监测的阈值可以根据实际情况进行自动调整,不需要人工进行配置,进一步节省了配置时间。
图4为本公开实施例提供的又一种异常监测方法的流程图,本实施例在上述实施例的基础上,进一步优化了上述异常监测方法。相应的,如图4所示,本实施例的方法具体包括:
S310、获取原始上报数据。
S320、对原始上报数据按照配置的设定属性维度识别关联字段。
具体的,对原始上报数据按照配置的设定属性维度识别关联字段,可以包括:按照设定属性维度的关键字,在原始上报数据的各个字段中进行关键字相似度匹配,以确定相似度满足设定要求的关联字段,或者,按照设定属性维度的字段提取规则,在原始上报数据的各个字段中提取符合字段提取规则的至少一个字段,作为关联字段。
S330、按照关联字段,在原始上报数据中提取至少一个关联字段中至少一个字段的数据,作为目标数据,
其中,关联字段的数量为至少一个,关联字段中的字段数量为至少一个。
S340、按照设定指标将目标数据输入孤立森林模型,以确定异常数据。
其中,设定指标为需要进行监测的数据指标,设定指标为浮动数据,例如广告收入、广告点击率、广告购买率或者广告浏览率等。孤立森林模型为基于孤立森林算法的异常监测模型,异常(Anomaly Detection)的定义有很多种,在孤立森林(Isolation Forest)中,异常可以定义为容易被孤立的离群点,可以将其理解为分布稀疏且离密度高的群体较远的点,即通过孤立森林算法,在连续的数据中,识别出少量并且明显远离其他数据的数据,作为异常数据。
具体的,异常监测装置可以提取设定指标的目标数据,得到提取之后的目标数据,并将该提取之后的目标数据输入孤立森林模型中进行异常监测,可以输出该提取之后的目标数据的出现概率。当该提取之后的目标数据中的一个数据的出现概率低于设定概率阈值时,确定该数据为异常数据。
进一步的,按照设定指标将目标数据输入孤立森林模型,以确定异常数据之后,还包括:对异常数据进行后处理。其中,具体的后处理的方式本实施例中不作限定,后处理可以包括统计分析异常数据以及人工介入进行原因查找和埋点调整等等。示例性的,当对异常数据进行统计之后确定在多个客户端版本中异常数据高度匹配,则说明此异常数据并非因为客户端版本的原因而产生;又如,当对异常数据进行统计之后确定异常数据均出现在同一个客户端版本中,则说明该客户端版本存在异常,需要后续进行原因查找等处理。
进一步的,按照设定指标将目标数据输入孤立森林模型,以确定异常数据之后,还包括:对异常数据的监测准确性进行打分评估。具体的,确定异常数据之后,可以采用人工标定异常数据的准确性分数,进而优化孤立森林模型中的参数。通过对孤立森林模型的优化,可以提高异常监测的准确性。
在本方案中,通过获取原始上报数据,对原始上报数据按照配置的设定属性维度识别关联字段,按照关联字段,在原始上报数据中提取至少一个关联字段中至少一个字段的数据,作为目标数据,按照设定指标将目标数据输入孤立森林模型,以确定异常数据。在实施例中,通过仅仅配置设定属性维度,并基于设定属性维度识别的关联字段对原始上报数据进行分类统计,进而提取目标数据进行异常监测,避免了对原始上报数据中所有字段的监测指标阈值的配置,优化了数据异常分析监测过程的指标配置方案,减少了配置工作量,提高了数据异常监测的效率;并且,采用孤立森林模型进行异常监测,由于孤立森林模型是一种无监督的异常监测模型,能够快速实现对大量数据的异常监测,提高异常监测的准确性。
图5为本公开实施例提供的异常监测装置的结构示意图,本实施例可适用于对海量的原始上报数据实现常监测的情况,该装置可以采用软件和/或硬件的方式实现,该装置可配置于电子设备中,例如典型的是手机、平板电脑和电脑等。。本公开实施例所提供的异常监测装置可执行本公开任意实施例所提供的异常监测方法,具备执行方法相应的功能模块和有益效果。该装置具体包括原始数据获取模块410、关联字段识别模块420、目标数据提取模块430和异常监测模块440,其中:
原始数据获取模块410,用于获取原始上报数据;
关联字段识别模块420,用于对原始上报数据按照配置的设定属性维度识别关联字段;
目标数据提取模块430,用于根据关联字段从原始上报数据中提取目标数据;
异常监测模块440,用于对目标数据进行异常监测。
本公开实施例通过获取原始上报数据,对原始上报数据按照配置的设定属性维度识别关联字段,并根据关联字段从原始上报数据中提取目标数据,对目标数据进行异常监测。本公开实施例通过仅仅配置设定属性维度,并基于设定属性维度识别的关联字段对原始上报数据进行分类统计,进而提取目标数据进行异常监测,避免了对原始上报数据中所有字段的监测指标阈值的配置,优化了数据异常分析监测过程的指标配置方案,减少了配置工作量,提高了数据异常监测的效率。
进一步的,关联字段识别模块420具体用于:
按照设定属性维度的关键字,在原始上报数据的各个字段中进行关键字相似度匹配,以确定相似度满足设定要求的关联字段。
进一步的,关联字段识别模块420具体用于:
按照设定属性维度的字段提取规则,在原始上报数据的各个字段中提取符合字段提取规则的至少一个字段,作为关联字段。
进一步的,字段提取规则包括设定用户画像和设定字段列表中的至少一个。
进一步的,设定属性维度包括广告属性维度和非广告属性维度。
进一步的,广告属性维度包括广告主名称、广告数据格式、广告投放位置和广告投放客户端中的至少一个。
进一步的,关联字段的数量为至少一个,关联字段中的字段数量为至少一个;
目标数据提取模块430具体用于:
按照关联字段,在原始上报数据中提取至少一个关联字段中至少一个字段的数据,作为目标数据。
进一步的,异常监测模块具体用于:
按照设定指标将目标数据输入孤立森林模型,以确定异常数据。
进一步的,异常监测模块440具体用于:
通过设定指标的目标阈值对目标数据进行异常监测,设定指标为浮动数据。
进一步的,该装置还包括:
动态阈值模块,用于在通过设定指标的目标阈值对目标数据进行异常监测之前,根据历史阈值、时间和位置中的至少一项生成与设定指标对应的动态阈值规则,并根据动态阈值规则确定设定指标对应的目标阈值。
本公开实施例所提供的异常监测装置可执行本公开任意实施例所提供的异常监测方法,具备执行方法相应的功能模块和有益效果。
图6为本公开实施例提供的电子设备的结构示意图。参考图6,其示出了适于用来实现本公开实施例的电子设备(例如终端设备或服务器)500的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的异常监测方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取原始上报数据;对原始上报数据按照配置的设定属性维度识别关联字段;根据关联字段从原始上报数据中提取目标数据;对目标数据进行异常监测。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (13)

1.一种异常监测方法,其特征在于,包括:
获取原始上报数据;
对所述原始上报数据按照配置的设定属性维度识别关联字段;
根据所述关联字段从所述原始上报数据中提取目标数据;
对所述目标数据进行异常监测。
2.根据权利要求1所述的方法,其特征在于,对所述原始上报数据按照配置的设定属性维度识别关联字段,包括:
按照设定属性维度的关键字,在所述原始上报数据的各个字段中进行关键字相似度匹配,以确定相似度满足设定要求的关联字段。
3.根据权利要求1所述的方法,其特征在于,对所述原始上报数据按照配置的设定属性维度识别关联字段,包括:
按照设定属性维度的字段提取规则,在所述原始上报数据的各个字段中提取符合所述字段提取规则的至少一个字段,作为关联字段。
4.根据权利要求3所述的方法,其特征在于,所述字段提取规则包括设定用户画像和设定字段列表中的至少一个。
5.根据权利要求1所述的方法,其特征在于,所述设定属性维度包括广告属性维度和非广告属性维度。
6.根据权利要求5所述的方法,其特征在于,所述广告属性维度包括广告主名称、广告数据格式、广告投放位置和广告投放客户端中的至少一个。
7.根据权利要求1所述的方法,其特征在于,所述关联字段的数量为至少一个,所述关联字段中的字段数量为至少一个;
根据所述关联字段从所述原始上报数据中提取目标数据,包括:
按照所述关联字段,在所述原始上报数据中提取至少一个所述关联字段中至少一个字段的数据,作为目标数据。
8.根据权利要求1所述的方法,其特征在于,对所述目标数据进行异常监测,包括:
按照设定指标将所述目标数据输入孤立森林模型,以确定异常数据。
9.根据权利要求1所述的方法,其特征在于,对所述目标数据进行异常监测,包括:
通过设定指标的目标阈值对所述目标数据进行异常监测,所述设定指标为浮动数据。
10.根据权利要求9所述的方法,其特征在于,通过设定指标的目标阈值对所述目标数据进行异常监测之前,还包括:
根据历史阈值、时间和位置中的至少一项生成与所述设定指标对应的动态阈值规则,并根据所述动态阈值规则确定所述设定指标对应的目标阈值。
11.一种异常监测装置,其特征在于,包括:
原始数据获取模块,用于获取原始上报数据;
关联字段识别模块,用于对所述原始上报数据按照配置的设定属性维度识别关联字段;
目标数据提取模块,用于根据所述关联字段从所述原始上报数据中提取目标数据;
异常监测模块,用于对所述目标数据进行异常监测。
12.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一所述的异常监测方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10中任一所述的异常监测方法。
CN201910414901.8A 2019-05-17 2019-05-17 异常监测方法、装置、电子设备和存储介质 Pending CN110119340A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910414901.8A CN110119340A (zh) 2019-05-17 2019-05-17 异常监测方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910414901.8A CN110119340A (zh) 2019-05-17 2019-05-17 异常监测方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN110119340A true CN110119340A (zh) 2019-08-13

Family

ID=67522794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910414901.8A Pending CN110119340A (zh) 2019-05-17 2019-05-17 异常监测方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN110119340A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110879805A (zh) * 2019-11-22 2020-03-13 北京锐安科技有限公司 一种数据异常发现方法、装置、服务器及存储介质
CN111444189A (zh) * 2020-04-17 2020-07-24 贝壳技术有限公司 数据处理方法、装置、介质和电子设备
CN111641532A (zh) * 2020-03-30 2020-09-08 北京红山信息科技研究院有限公司 一种通信质量检测方法、装置、服务器及存储介质
CN112256548A (zh) * 2020-11-06 2021-01-22 微医云(杭州)控股有限公司 异常数据的监听方法、装置、服务器及存储介质
CN113034204A (zh) * 2021-04-19 2021-06-25 广州欢网科技有限责任公司 Ott广告订单完成度自动预警的方法、装置及电子设备
CN113538130A (zh) * 2021-07-22 2021-10-22 浙江网商银行股份有限公司 异常检测方法、装置及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150128111A1 (en) * 2013-08-26 2015-05-07 Tencent Technology (Shenzhen) Company Limited Devices and Methods for Acquiring Abnormal Information
CN109034906A (zh) * 2018-08-03 2018-12-18 北京木瓜移动科技股份有限公司 广告转化的反作弊方法、装置、电子设备及存储介质
CN109213654A (zh) * 2018-07-05 2019-01-15 北京奇艺世纪科技有限公司 一种异常检测方法及装置
CN109543765A (zh) * 2018-08-23 2019-03-29 江苏海平面数据科技有限公司 一种基于改进IForest的工业数据去噪方法
CN109634805A (zh) * 2018-11-19 2019-04-16 平安科技(深圳)有限公司 监控数据处理方法、装置、电子设备及存储介质
CN109727050A (zh) * 2017-10-31 2019-05-07 北京国双科技有限公司 一种获取广告监测分析数据的方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150128111A1 (en) * 2013-08-26 2015-05-07 Tencent Technology (Shenzhen) Company Limited Devices and Methods for Acquiring Abnormal Information
CN109727050A (zh) * 2017-10-31 2019-05-07 北京国双科技有限公司 一种获取广告监测分析数据的方法及系统
CN109213654A (zh) * 2018-07-05 2019-01-15 北京奇艺世纪科技有限公司 一种异常检测方法及装置
CN109034906A (zh) * 2018-08-03 2018-12-18 北京木瓜移动科技股份有限公司 广告转化的反作弊方法、装置、电子设备及存储介质
CN109543765A (zh) * 2018-08-23 2019-03-29 江苏海平面数据科技有限公司 一种基于改进IForest的工业数据去噪方法
CN109634805A (zh) * 2018-11-19 2019-04-16 平安科技(深圳)有限公司 监控数据处理方法、装置、电子设备及存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110879805A (zh) * 2019-11-22 2020-03-13 北京锐安科技有限公司 一种数据异常发现方法、装置、服务器及存储介质
CN110879805B (zh) * 2019-11-22 2022-04-05 北京锐安科技有限公司 一种数据异常发现方法、装置、服务器及存储介质
CN111641532A (zh) * 2020-03-30 2020-09-08 北京红山信息科技研究院有限公司 一种通信质量检测方法、装置、服务器及存储介质
CN111641532B (zh) * 2020-03-30 2022-02-18 北京红山信息科技研究院有限公司 一种通信质量检测方法、装置、服务器及存储介质
CN111444189A (zh) * 2020-04-17 2020-07-24 贝壳技术有限公司 数据处理方法、装置、介质和电子设备
CN112256548A (zh) * 2020-11-06 2021-01-22 微医云(杭州)控股有限公司 异常数据的监听方法、装置、服务器及存储介质
CN112256548B (zh) * 2020-11-06 2022-08-09 微医云(杭州)控股有限公司 异常数据的监听方法、装置、服务器及存储介质
CN113034204A (zh) * 2021-04-19 2021-06-25 广州欢网科技有限责任公司 Ott广告订单完成度自动预警的方法、装置及电子设备
CN113538130A (zh) * 2021-07-22 2021-10-22 浙江网商银行股份有限公司 异常检测方法、装置及系统
CN113538130B (zh) * 2021-07-22 2024-05-24 浙江网商银行股份有限公司 异常检测方法、装置及系统

Similar Documents

Publication Publication Date Title
CN110119340A (zh) 异常监测方法、装置、电子设备和存储介质
CN112148987B (zh) 基于目标对象活跃度的消息推送方法及相关设备
CN108509569B (zh) 企业画像的生成方法、装置、电子设备以及存储介质
CN106911697B (zh) 访问权限设置方法、装置、服务器及存储介质
CN109299348A (zh) 一种数据查询方法、装置、电子设备及存储介质
WO2020156389A1 (zh) 信息推送方法和装置
CN108416003A (zh) 一种图片分类方法和装置、终端、存储介质
CN107392801B (zh) 控制扰乱订单的方法及其装置、存储介质、电子设备
CN107133263B (zh) Poi推荐方法、装置、设备及计算机可读存储介质
CN110472154A (zh) 一种资源推送方法、装置、电子设备及可读存储介质
CN110633423A (zh) 目标账号识别方法、装置、设备及存储介质
CN109598304B (zh) 分类模型校准方法、装置、设备及可读介质
CN113360580A (zh) 基于知识图谱的异常事件检测方法、装置、设备及介质
CN110278447A (zh) 基于连续特征的视频推送方法、装置及电子设备
CN111291071A (zh) 数据处理方法、装置及电子设备
CN109284367A (zh) 用于处理文本的方法和装置
CN114140947A (zh) 界面展示方法、装置、电子设备、存储介质和程序产品
WO2022017082A1 (zh) 用于检测虚假交易订单的方法和装置
CN113392920B (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
CN109165077A (zh) 一种网页处理方法、装置、电子设备及存储介质
CN108021713B (zh) 一种文档聚类的方法和装置
CN111415168B (zh) 一种交易告警的方法和装置
CN112035334B (zh) 异常设备检测方法、装置、存储介质与电子设备
WO2019095569A1 (zh) 基于微博财经事件的金融分析方法、应用服务器及计算机可读存储介质
CN113746780B (zh) 基于主机画像的异常主机检测方法、装置、介质和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination