CN117290380A - 异常维度数据生成方法、装置、设备和计算机可读介质 - Google Patents
异常维度数据生成方法、装置、设备和计算机可读介质 Download PDFInfo
- Publication number
- CN117290380A CN117290380A CN202311508660.6A CN202311508660A CN117290380A CN 117290380 A CN117290380 A CN 117290380A CN 202311508660 A CN202311508660 A CN 202311508660A CN 117290380 A CN117290380 A CN 117290380A
- Authority
- CN
- China
- Prior art keywords
- dimension data
- value
- abnormal
- filling
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 203
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 67
- 238000012360 testing method Methods 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 18
- 239000006185 dispersion Substances 0.000 claims description 20
- 230000004044 response Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 230000005856 abnormality Effects 0.000 claims description 8
- 230000035945 sensitivity Effects 0.000 claims description 4
- 239000002699 waste material Substances 0.000 abstract description 11
- 230000008859 change Effects 0.000 description 22
- 230000008569 process Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000005429 filling process Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本公开的实施例公开了异常维度数据生成方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:确定告警时间段;确定待查询正常时间段;获取与告警时间段对应的价值操作数据组作为初始异常数据组;获取与待查询正常时间段对应的价值操作数据组作为初始正常数据组;生成各个维度数据字段数量组集;对维度数据字段数量组集进行填充处理;对各个填充维度数据字段数量组集进行频率分布测试处理;将概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合;对与目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据;显示所生成的各个异常维度数据。该实施方式减少了计算机算力资源和显卡资源浪费。
Description
技术领域
本公开的实施例涉及计算机技术领域,具体涉及异常维度数据生成方法、装置、设备和计算机可读介质。
背景技术
随着计算机和网络技术的发展,线上物品价值操作平台在对物品价值操作进行异常数据检测时,检测出的异常维度数据准确率较低。异常维度数据生成,是确定价值操作过程中异常的维度数据的一项技术。目前,在生成异常维度数据时,通常采用的方式为:通过将异常时间段的维度数据与对应类型相同的正常时间段的维度数据对应的字段值数量变化趋势对比,生成异常维度数据。
然而,当采用上述方式生成异常维度数据时,经常会存在如下技术问题:
第一,将异常时间段的维度数据与对应类型相同的正常时间段的维度数据对应的字段值数量变化趋势不同的维度数据确定为异常维度数据,未考虑字段值数量波动频率对系统运行的影响。根据正常维度数据与异常维度数据对应的字段值数量变化趋势对比,生成各个异常维度数据,所生成的各个异常维度数据中存在较多的字段值数量变化趋势不同且波动频率较低的正常维度数据,导致告警页面中显示的各个异常数据的准确性较低,需要对告警页面中显示的各个异常维度数据再次检测和重新显示,浪费计算机的算力资源和显卡资源。
第二,对于异常时间段的各个维度数据进行异常检测时,未对离散度较低即变化显著性较低的正常维度数据进行剔除,计算复杂度较高,数据处理量较大,导致计算机算力资源浪费。
该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了异常维度数据生成方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种异常维度数据生成方法,该方法包括:响应于接收到对应价值操作异常信息的告警通知信息,确定对应上述告警通知信息的告警时间段;将在上述告警时间段之前满足预设条件的时间段确定为待查询正常时间段;从预设数据库获取与上述告警时间段对应的价值操作数据组作为初始异常数据组,其中,上述价值操作数据组包括各个维度数据,上述各个维度数据包括以下至少一项:价值信息、源网络地址信息、目标网络地址信息,上述各个维度数据中的每个维度数据包括至少一个字段值;从上述预设数据库获取与上述待查询正常时间段对应的价值操作数据组作为初始正常数据组;对上述初始异常数据组与上述初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组;基于上述异常维度数据组与上述正常维度数据组,生成各个维度数据字段数量组集;对于上述各个维度数据字段数量组集中的每个维度数据字段数量组集,对上述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集;对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合,其中,上述各个填充维度数据字段数量组集中的填充维度数据字段数量组集对应概率值集合中的概率值;将上述概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合;对于上述目标概率值集合中每个目标概率值,对与上述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据;在价值操作告警页面中显示所生成的各个异常维度数据。
第二方面,本公开的一些实施例提供了一种异常维度数据生成装置,装置包括:第一确定单元,被配置成响应于接收到对应价值操作异常信息的告警通知信息,确定对应上述告警通知信息的告警时间段;第二确定单元,被配置成将在上述告警时间段之前满足预设条件的时间段确定为待查询正常时间段;第一获取单元,被配置成从预设数据库获取与上述告警时间段对应的价值操作数据组作为初始异常数据组,其中,上述价值操作数据组包括各个维度数据,上述各个维度数据包括以下至少一项:价值信息、源网络地址信息、目标网络地址信息,上述各个维度数据中的每个维度数据包括至少一个字段值;第二获取单元,被配置成从上述预设数据库获取与上述待查询正常时间段对应的价值操作数据组作为初始正常数据组;去除处理单元,被配置成对上述初始异常数据组与上述初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组;生成单元,被配置成基于上述异常维度数据组与上述正常维度数据组,生成各个维度数据字段数量组集;填充处理单元,被配置成对于上述各个维度数据字段数量组集中的每个维度数据字段数量组集,对上述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集;频率分布测试处理单元,被配置成对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合,其中,上述各个填充维度数据字段数量组集中的填充维度数据字段数量组集对应概率值集合中的概率值;第三确定单元,被配置成将上述概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合;异常维度预测单元,被配置成对于上述目标概率值集合中每个目标概率值,对与上述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据;显示单元,被配置成在价值操作告警页面中显示所生成的各个异常维度数据。
第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的异常维度数据生成方法,提高了生成的异常维度数据的准确性,减少了计算机算力资源与显卡资源的浪费。具体来说,造成计算机算力资源和显卡资源浪费的原因在于:将异常时间段的维度数据与对应类型相同的正常时间段的维度数据对应的字段值数量变化趋势不同的维度数据确定为异常维度数据,未考虑字段值数量波动频率对系统运行的影响。根据正常维度数据与异常维度数据对应的字段值数量变化趋势对比,生成各个异常维度数据,所生成的各个异常维度数据中存在较多的字段值数量变化趋势不同且波动频率较低的正常维度数据,导致告警页面中显示的各个异常数据的准确性较低,需要对告警页面中显示的各个异常维度数据再次检测和重新显示,浪费计算机的算力资源和显卡资源。基于此,本公开的一些实施例的异常维度数据生成方法,首先,响应于接收到对应价值操作异常信息的告警通知信息,确定对应上述告警通知信息的告警时间段。由此,可以得到用于获取表征存在异常维度数据的与初始异常数据组对应的告警时间段。然后,将在上述告警时间段之前满足预设条件的时间段确定为待查询正常时间段。由此,可以得到用于生成正常维度数据组与初始正常数据组对应的正常时间段。接着,从预设数据库获取与上述告警时间段对应的价值操作数据组作为初始异常数据组,其中,上述价值操作数据组包括各个维度数据,上述各个维度数据包括以下至少一项:价值信息、源网络地址信息、目标网络地址信息,上述各个维度数据中的每个维度数据包括至少一个字段值。由此,可以得到用于生成异常维度数据组的初始异常数据组。然后,从上述预设数据库获取与上述待查询正常时间段对应的价值操作数据组作为初始正常数据组。由此,可以获取用于生成正常维度数据组的初始正常数据组。接着,对上述初始异常数据组与上述初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组。由此,可以对上述初始异常数据组与上述初始正常数据组进行低离散度维度数据去除处理,得到去除离散程度较低的维度数据后的异常维度数据组与正常维度数据组。然后,基于上述异常维度数据组与上述正常维度数据组,生成各个维度数据字段数量组集。由此,可以得到用于生成各个填充维度数据字段数量组集的各个维度数据字段数量组集。上述各个维度数据字段数量组集中的维度数据字段数量组集表征各个维度数据中维度数据在正常时间段和异常时间段对应的正常维度字段数量组和异常维度字段数量组。再然后,对于上述各个维度数据字段数量组集中的每个维度数据字段数量组集,对上述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集。由此,可以对各个维度数据字段数量组集中的每个维度数据字段数量组集进行填充处理,得到填充维度数据字段数量组集以便后续频率分布测试处理。接着,对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合,其中,上述各个填充维度数据字段数量组集中的填充维度数据字段数量组集对应概率值集合中的概率值。由此,可以得到概率值集合。上述概率值集合中的每个概率值表征对应上述概率值的填充维度数据字段数量组集中正常填充维度数据字段数量组与异常填充维度数据字段数量组变化趋势相同的概率。之后,将上述概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合。由此,可以得到表征字段值数量变化趋势不相同的各个概率值,即目标概率值集合。然后,对于上述目标概率值集合中每个目标概率值,对与上述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据。由此,可以对字段值数量变化趋势不相同的各个填充维度数据字段数量组集中的每个填充维度数据字段数量组集,根据其数据波动频率进行异常维度预测,生成异常维度数据。由此,可以得到检测数据更加准确的各个异常维度数据。在价值操作告警页面中显示所生成的各个异常维度数据。也因为采用了根据初始异常数据组与初始异常数据组生成了各个填充维度数据字段数量组集。对上述各个填充数量组集进行了频率分布测试处理,得到了字段值数量变化趋势不相同的各个填充维度数据字段数量组集。对字段值数量变化趋势不相同的各个填充维度数据字段数量组集中的每个填充维度数据字段数量组集,根据其数据波动频率进行异常维度预测,以生成异常维度数据,得到检测数据更加准确的各个异常维度数据。减少了对准确性较低的异常维度数据的重新检测与显示的次数。进而,减少了计算机的算力资源和显卡资源浪费。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本公开的异常维度数据生成方法的一些实施例的流程图;
图2是根据本公开的异常维度数据生成装置的一些实施例的结构示意图;
图3是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本公开。
图1示出了根据本公开的异常维度数据生成方法的一些实施例的流程100。该异常维度数据生成方法,包括以下步骤:
步骤101,响应于接收到对应价值操作异常信息的告警通知信息,确定对应告警通知信息的告警时间段。
在一些实施例中,异常维度数据生成方法的执行主体(例如计算设备)可以响应于接收到对应价值操作异常信息的告警通知信息,确定对应上述告警通知信息的告警时间段。其中,上述执行主体可以为服务端。上述价值操作异常信息可以表征预设时间段内价值操作总量大于第一预设阈值或表征预设时间段内价值操作总量小于第二预设阈值。上述告警通知信息可以为在预设时间段内价值操作总量满足告警条件时,由预设数据库发出的用于告警的通知信息。上述告警条件可以为上述价值操作总量超出第一预设阈值或上述价值操作总量低于第二预设阈值。上述价值操作总量可以为在预设时间段内价值操作数值(交易量)的总和。上述告警时间段可以为上述告警通知信息对应的预设时间段。例如,2023年10月16日10点15分中上述15分对应的各个价值操作值为500、1000、500,上述15分对应的价值操作总量可以为2000。上述第一预设阈值可以为1400,则上述告警通知信息可以为在价值操作值总和2000大于1400时由预设数据库发出的通知信息。则上述告警时间段可以为2023年10月16日10点15分中上述15分对应的时间段。
步骤102,将在告警时间段之前满足预设条件的时间段确定为待查询正常时间段。
在一些实施例中,上述执行主体可以将在上述告警时间段之前满足预设条件的时间段确定为待查询正常时间段。其中,上述预设条件可以为上述告警时间段之前的时间段为预设时间段。例如,上述告警时间段可以为2023年10月16日10点15分中上述15分对应的时间段。上述待查询正常时间段可以为2023年10月16日10点14分中上述14分对应的时间段。
步骤103,从预设数据库获取与告警时间段对应的价值操作数据组作为初始异常数据组。
在一些实施例中,上述执行主体可以从预设数据库获取与上述告警时间段对应的价值操作数据组作为初始异常数据组。其中,上述价值操作数据组包括各个维度数据,上述各个维度数据包括以下至少一项:价值信息、源网络地址信息、目标网络地址信息,上述各个维度数据中的每个维度数据包括至少一个字段值。上述价值信息可以表示与上述告警时间段对应的各个价值操作的各个价值。上述预设数据库可以为MySQL数据库。例如,上述价值信息可以为{33、34、35、36}。上述价值信息包括的至少一个字段值可以为33、34、35、36。上述源网络地址信息可以为与各个价值操作对应的各个客户端设备(例如,个人电脑、手机)的IP地址(Internet Protocol Address)。上述目标网络地址信息可以为与上述各个价值操作对应的服务端的IP地址(Internet Protocol Address)。上述各个价值操作中的价值操作可以为物品价值流转操作(物品在线交易)。
步骤104,从预设数据库获取与待查询正常时间段对应的价值操作数据组作为初始正常数据组。
在一些实施例中,上述执行主体可以从上述预设数据库获取与上述待查询正常时间段对应的价值操作数据组作为初始正常数据组。其中,上述预设数据库可以为MySQL数据库。
步骤105,对初始异常数据组与初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组。
在一些实施例中,上述执行主体可以对上述初始异常数据组与上述初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组。其中,上述低离散度维度数据可以为维度数据内不同字段值的数量小于第三预设阈值的维度数据。例如,上述第三预设阈值可以为4,维度数据可以为维度数据{33、33、34、33、35},上述维度数据内不同字段值可以为33、34、35,则维度数据内不同字段值的数量可以为3。由于3小于4,则维度数据{33、33、34、33、35}可以为低离散度维度数据。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤对上述初始异常数据组与上述初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组:
第一步,对于上述初始异常数据组中每个维度数据,执行以下去除步骤:
子步骤一,将上述维度数据中所包括字段值的数量确定为第一目标数量。
子步骤二,对上述维度数据进行字段值去重处理,得到去重维度数据。实践中,上述执行主体可以通过排序去重算法将上述维度数据包括的各个字段值中重复的字段值去除,得到去重维度数据。例如,上述维度数据可以为{32、33、32、34}。去重维度数据可以为{32、33、34}。
子步骤三,将上述去重维度数据中的所包括字段值的数量确定为第二目标数量。例如,上述第二目标数量可以为3。
子步骤四,基于上述第一目标数量与上述第二目标数量,生成去除因子值。实践中,上述执行主体可以将上述第二目标数量与上述第一目标数量的比值确定为去除因子值。
子步骤五,响应于确定上述去除因子值小于第四预设阈值,将上述维度数据从初始异常数据组中删除,以对初始异常数据组进行更新。
第二步,将更新后的初始异常数据组确定为异常维度数据组。
第三步,将与上述异常维度数据组对应的各个维度数据类型确定为维度类型集合。上述各个维度数据类型中的维度数据类型可以表示用于区分各个维度数据的类别标识。例如,上述各个维度数据中的维度数据可以为价值信息,则上述维度数据类型可以为价值信息类型。
第四步,将上述初始正常数据组中与上述维度类型集合对应的维度数据确定为各个待去除维度数据。其中,上述维度类型集合中的维度类型与上述各个待去除维度数据中的维度数据对应。
第五步,将上述各个待去除维度数据从上述初始正常数据组中删除,以对初始正常数据组进行更新。
第六步,将更新后的初始正常数据组确定为正常维度数据组。
上述技术方案结合步骤106至步骤110及其相关内容作为本公开的实施例的一个发明点,解决了背景技术提及的技术问题二“对于异常时间段的各个维度数据进行异常检测时,未对离散度较低即变化显著性较低的正常维度数据进行剔除,计算复杂度较高,数据处理量较大,导致计算机算力资源浪费”。导致计算机算力资源浪费的因素往往如下:对于异常时间段的各个维度数据进行异常检测时,未对离散度较低即变化显著性较低的正常维度数据进行剔除,计算复杂度较高,数据处理量较大,导致计算机算力资源浪费。如果解决了上述因素,就能达到减少计算机算力资源的浪费。为了达到这一效果,本公开通过以下步骤首先,对于上述初始异常数据组中每个维度数据,执行以下去除步骤:子步骤一,将上述维度数据中所包括字段值的数量确定为第一目标数量。由此,可以得到用于生成去除因子值的第一目标数量。子步骤二,对上述维度数据进行字段值去重处理,得到去重维度数据。由此,可以对维度数据去重得到用于确定第二目标数量的去重维度数据。子步骤三,将上述去重维度数据中的所包括字段值的数量确定为第二目标数量。由此,可以得到用于生成去除因子值的第二目标数量。子步骤四,基于上述第一目标数量与上述第二目标数量,生成去除因子值。由此可以得到去除因子值。子步骤五,响应于确定上述去除因子值小于预设阈值,将上述维度数据从初始异常数据组中删除,以对初始异常数据组进行更新。由此,可以减少初始异常数据组中变化显著性较低的正常维度数据,减少了后续数据处理量与计算复杂度。然后,将更新后的初始异常数据组确定为异常维度数据组。接着,将与上述异常维度数据组对应的各个维度数据类型确定为维度类型集合。再然后,将上述初始正常数据组中与上述维度类型集合对应的维度数据确定为各个待去除维度数据。由此,可以得到各个待去除维度数据。接着,将上述各个待去除维度数据从上述初始正常数据组中删除,以对初始正常数据组进行更新。由此,可以将各个待去除维度数据从上述初始正常数据组中删除。减少了初始正常数据组中与初始异常数据组中变化显著性较低对应的待去除维度数据。最后,将更新后的初始正常数据组确定为正常维度数据组。由此,可以得到减少数据处理量的正常维度数据组。结合步骤106至步骤110,通过去除变化显著性较低的维度数据后的异常维度数据组与正常维度数据组,生成数据处理量减少的各个维度数据字段数量组集。减少了对变化显著性较低的各个维度数据的填充处理以及后续异常维度预测处理,减少了计算复杂度,减少了后续填充处理以及后续异常维度预测处理的数据处理量。进而,减少了计算机算力资源的浪费。
步骤106,基于异常维度数据组与正常维度数据组,生成各个维度数据字段数量组集。
在一些实施例中,上述执行主体可以基于上述异常维度数据组与上述正常维度数据组,生成各个维度数据字段数量组集。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤基于上述异常维度数据组与上述正常维度数据组,生成各个维度数据字段数量组集:
第一步,对于上述正常维度数据组中的每个维度数据,执行以下步骤:
子步骤一,确定对应上述维度数据的各个第一字段值。实践中,首先,上述执行主体可以将上述维度数据所包括的各个字段值确定为第一待去重字段值集合。然后,上述执行主体可以对上述第一待去重字段集合进行去重处理。最后,上述执行主体可以将去重处理后得到的各个字段值确定为各个第一字段值。例如,上述维度数据所包括的各个字段值可以为1个字段值33,2个字段值34,3个字段值35,4个字段值36,5个字段值37与11个字段值38。上述各个第一字段值可以为33、34、35、36、37、38。
子步骤二,确定对应上述各个第一字段值的第一字段数量组。其中,上述第一字段数量组中每个第一字段数量可以表示上述各个第一字段值中每个第一字段值的数量。例如,上述第一字段数量组可以为第一字段数量组可以为{1,2,3,4,5,11},上述第一字段数量组中的3对应第一字段值35。
子步骤三,将上述正常维度数据的维度类型确定为目标维度类型。其中,上述维度类型可以表示用于区分各个维度数据的类别标识。上述维度类型可以包括但不限于以下至少一项:价值信息类型、源网络地址信息类型与目标网络地址信息类型。上述价值信息类型表示维度数据用于表示价值信息。上述源网络地址信息类型表示维度数据用于表示源网络地址信息。上述目标网络地址信息类型表示维度数据用于表示目标网络地址信息。
子步骤四,将上述异常维度数据组中与上述目标维度类型对应的维度数据确定为目标维度数据。
子步骤五,确定与上述目标维度数据对应的各个第二字段值。实践中,首先,上述执行主体可以将上述目标维度数据所包括的各个字段值确定为第二待去重字段值集合。然后,上述执行主体可以对上述第二待去重字段集合进行去重处理。最后,上述执行主体可以将上述第二待去重字段集合进行去重处理后得到的各个字段值确定为各个第二字段值。作为示例,上述目标维度数据包括的各个字段值可以为1个字段值33,2个字段值34,7个字段值35,2个字段值36,9个字段值37,11个字段值38。上述各个第二字段值可以为33、34、35、36、37、38。
子步骤六,确定对应上述各个第二字段值的第二字段数量组。其中,上述各个第二字段值中每个第二字段值与第二字段数量组中每个第二字段数量对应。上述第二字段数量组中的每个第二字段数量可以表示上述各个第二字段值中每个第二字段值的数量。例如,上述各个第二字段值可以为33、34、35、36、37、38。上述第二字段数量组可以为{1,2,7,2,9,11},上述第二字段数量组中的11表示第二字段值38的数量。
子步骤七,将上述第一字段数量组与上述第二字段数量组确定为初始维度数据字段数量组集。
第二步,将所确定的各个初始维度数据字段数量组集中的每个初始维度数据字段数量组集确定为维度数据字段数量组集,得到各个维度数据字段数量组集。
步骤107,对于各个维度数据字段数量组集中的每个维度数据字段数量组集,对维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集。
在一些实施例中,上述执行主体可以对于上述各个维度数据字段数量组集中的每个维度数据字段数量组集,对上述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤对上述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集:
第一步,对于上述维度数据字段数量组集中所包括的各个字段数量,将上述各个字段数量中满足第二预设筛选条件的各个字段数量替换为各个预设数值,以对上述维度数据字段数量组集进行更新。其中,上述第二预设筛选条件可以为字段数量小于等于预设数量。
第二步,将更新后的维度数据字段数量组集确定为填充维度数据字段数量组集。
步骤108,对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合。
在一些实施例中,上述执行主体可以对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合。其中,上述各个填充维度数据字段数量组集中的填充维度数据字段数量组集对应概率值集合中的概率值。实践中,上述执行主体可以通过卡方检验技术对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合。上述概率值集合中的概率值表示填充维度数据字段数量组集中正常填充维度数据字段数量组与异常填充维度数据字段数量组变化趋势相同的概率。上述正常填充维度数据字段数量组可以为对初始维度数据字段数量组集中第一字段数量组进行上述填充处理,得到的填充处理后第一字段数量组即第一填充数量组。上述异常填充维度数据字段数量组可以为对初始维度数据字段数量组集中第二字段数量组进行上述填充处理,得到填充处理后第二字段数量组即第二填充数量组。
步骤109,将概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合。
在一些实施例中,上述执行主体可以将上述概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合。其中,上述第一预设筛选条件可以为概率值小于第五预设阈值。
步骤110,对于目标概率值集合中每个目标概率值,对与目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据。
在一些实施例中,对于上述目标概率值集合中每个目标概率值,上述执行主体可以对与上述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据。其中,上述与上述目标概率值对应的填充维度数据字段数量组集包括第一填充数量组与第二填充数量组。上述第一填充数量组可以为对初始维度数据字段数量组集中第一字段数量组进行上述填充处理,得到的填充处理后第一字段数量组。例如,第一填充数量组可以为{1,2,3,4,5,11}。上述第二填充数量组可以为对初始维度数据字段数量组集中第二字段数量组进行上述填充处理,得到填充处理后第二字段数量组。例如,上述第二填充数量组可以为{1,2,7,2,9,11}。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤对与上述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据:
第一步,对上述第一填充数量组进行归一化处理,得到归一化第一填充数量组。
第二步,对上述第二填充数量组进行归一化处理,得到归一化第二填充数量组。
第三步,基于上述归一化第一填充数量组与上述归一化第二填充数量组,生成目标归一化填充数量组。实践中,上述执行主体可以将上述归一化第二填充数量组与上述归一化第一填充数量组的对应位置的各个差值确定为各个目标归一化填充数量作为目标归一化填充数量组。作为示例,上述归一化第一填充数量组可以为{0,0.1,0.2,0.3,0.4、1}。归一化第二填充数量组可以为{0,0.1,0.6,0.1,0.7,1}。上述归一化第二填充数量组与上述归一化第一填充数量组对应位置的各个差值可以为0.0,0.0,0.4,﹣0.2,0.3,0.0。上述目标归一化填充数量组可以为{0.0,0.0,0.4,﹣0.2,0.3,0.0}。
第四步,对上述目标归一化填充数量组进行初始化,得到初始化填充数量组。实践中,上述执行主体可以将目标归一化填充数量组中的每个目标归一化填充数量进行取绝对值以对上述目标归一化填充数量组进行初始化,得到初始化填充数量组。例如,上述初始化填充数量组可以为{0.0,0.0,0.4,0.2,0.3,0.0}。
第五步,基于上述初始化填充数量组,生成差分值组。实践中,上述执行主体可以将上述初始化填充数量组中每个初始化填充数量与其前面的初始化填充数量相减,生成各个差分值。需要说明的是初始化填充数量组中第一个初始化填充数量的差分值可以为第一个初始化填充数量。作为示例,上述差分值组可以为{0.0,0.0,0.4,﹣0.2,0.1,﹣0.3}。
第六步,将上述差分值组中满足第三预设筛选条件的各个差分值确定为目标差分值集合。其中,上述第三预设筛选条件可以为差分值大于前一个差分值且大于后一个差分值。例如,上述目标差分值集合可以为{0.4,0.1}。
第七步,对于上述目标差分值集合中的每一个目标差分值,执行以下步骤:
子步骤一,将上述差分值组中与上述目标差分值对应的差分值确定为第一差分值。
子步骤二,将上述差分值组中第一差分值的下一个差分值确定为第二差分值。
子步骤三,基于上述目标差分值与预设灵敏度,生成局部阈值。实践中,首先,上述执行主体可以将差分值组中差分值的个数确定为差分值数量。然后,上述执行主体可以将上述目标差分值与预设灵敏度的差确定为第一数值。然后,上述执行主体可以将差分值数量与1的差确定为第二数值。接着,上述执行主体可以将上述第一数值与上述第二数值的比值确定为局部阈值。作为示例,上述目标差分值可以为0.4。上述预设灵敏度可以为0.1。上述局部阈值可以为(0.4-0.1)/(6-1)=0.06。
子步骤四,响应于确定上述第二差分值小于上述局部阈值,将上述第二填充数量组中与上述目标差分值对应的第二填充数量确定为目标填充数量。例如,目标差分值0.4对应的第二填充数量可以为第二填充数量组中的第四位填充数量2。上述目标填充数量可以为第四位填充数量2。
子步骤五,将与上述目标填充数量对应的字段值确定为异常字段值。实践中,首先,上述执行主体可以将初始异常数据组与上述目标填充数量对应的维度数据确定为目标维度数据。然后,上述执行主体可以将上述目标维度数据中与上述目标填充数量对应的字段值确定为异常字段值。作为示例,上述第二填充数量组可以为{1,2,7,2,9,11},上述异常字段值可以为上述第二填充数量组中的第四位填充数量2。上述目标维度数据可以为{33,34,35,36,37,38},则上述异常字段值可以为字段值36。
第八步,将所确定的各个异常字段值确定为异常字段值集合。
第九步,对于上述初始异常数据组中的各个维度数据,将与上述异常字段值集合对应的维度数据确定为异常维度数据。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤对上述第一填充数量组进行归一化处理,得到归一化第一填充数量组:
第一步,将上述第一填充数量组中数值最大的第一填充数量确定为第一目标数值。例如,上述第一填充数量组可以为{1,2,3,4,5,11},上述第一目标数值可以为11。
第二步,将上述第一填充数量组中数值最小的第一填充数量确定为第二目标数值。例如,上述第二目标数值可以为1。
第三步,对于上述第一填充数量组中的每一个第一填充数量,执行以下更新步骤:
子步骤一,基于上述第一填充数量、上述第一目标数值与上述第二目标数值,生成更新数值。实践中,首先,上述执行主体可以将上述第一填充数量与上述第二目标数值的差确定为第三数值。然后,上述执行主体可以将上述第一目标数值与上述第二目标数值的差确定为第四数值。最后,上述执行主体可以将上述第三数值与上述第四数值的比值确定为更新数值。作为示例,上述第一目标数值可以为11,上述第二目标数值可以为1,上述第一填充数量可以为4,则上述第三数值可以为4-1=3,上述第四数值可以为11-1=10,上述更新数值可以为3/10=0.3。
子步骤二,将上述第一填充数量替换为上述更新数值,以对第一填充数量进行更新。
第四步,将更新后的各个第一填充数量确定为归一化第一填充数量组。
步骤111,在价值操作告警页面中显示所生成的各个异常维度数据。
在一些实施例中,上述执行主体可以在价值操作告警页面中显示所生成的各个异常维度数据。其中,上述价值操作告警页面可以为价值操作系统的管理人员用于预测查看异常维度数据的界面。价值操作系统可以为用于进行价值操作(物品在线交易或金融交易)的系统或平台。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤在价值操作告警页面中显示所生成的各个异常维度数据:
第一步,将上述价值操作告警页面的显示尺寸确定为页面显示大小。其中,上述页面显示大小包括页面显示长度与页面显示宽度。
第二步,基于上述页面显示大小,确定展示上述各个异常维度数据的弹窗大小。实践中,首先,上述执行主体可以将上述页面显示大小包括的页面显示长度与第一预设值的乘积确定为弹窗长度。然后,上述执行主体可以将上述页面显示大小包括的页面显示宽度与第二预设值的乘积确定为弹窗宽度。最后,上述执行主体可以将上述弹窗长度与上述弹窗宽度确定为弹窗大小。
第三步,基于上述页面显示大小与上述弹窗大小,确定弹窗在上述价值操作告警页面中的显示位置。实践中,首先,上述执行主体可以将上述页面显示大小包括的页面显示宽度的中点值确定为中心点纵坐标。然后,上述执行主体可以将上述页面显示大小包括的页面显示长度的中点值确定为中心点横坐标。然后,上述执行主体可以将上述弹窗大小包括的弹窗宽度的中心点值确定为第一目标值,将弹窗大小包括的弹窗长度的中心点值确定为第二目标值。接着,上述执行主体可以将中心点纵坐标与第一目标值的和确定为第一坐标点的纵坐标,上述执行主体可以将中心点横坐标与第二目标值的差确定为第一坐标点的横坐标。上述执行主体可以将中心点纵坐标与第一目标值的和确定为第二坐标点的纵坐标,上述执行主体可以将中心点横坐标与第二目标值的和确定为第二坐标点的横坐标。上述执行主体可以将中心点纵坐标与第一目标值的差确定为第三坐标点的纵坐标,上述执行主体可以将中心点横坐标与第二目标值的差确定为第三坐标点的横坐标。上述执行主体可以将中心点纵坐标与第一目标值的差确定为第四坐标点的纵坐标,上述执行主体可以将中心点横坐标与第二目标值的和确定为第四坐标点的横坐标。最后,上述执行主体可以将上述第一坐标点、上述第二坐标点、上述第三坐标点与上述第四坐标点对应的四边形位置确定为显示位置。作为示例,上述页面显示宽度可以为8,上述页面显示宽度可以为8,上述弹窗宽度可以为4,上述弹窗长度可以为4,则上述第一坐标点可以为(2,6),上述第二坐标点可以为(6,6),上述第三坐标点可以为(2,2),上述第四坐标点可以为(6,2)。
第四步,将弹窗在上述价值操作告警页面中的显示位置确定为弹窗位置。
第五步,在上述价值操作告警页面中的上述弹窗位置显示包含上述各个异常维度数据的告警弹窗。
本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的异常维度数据生成方法,提高了生成的异常维度数据的准确性,减少了计算机算力资源与显卡资源的浪费。具体来说,造成计算机算力资源和显卡资源浪费的原因在于:将异常时间段的维度数据与对应类型相同的正常时间段的维度数据对应的字段值数量变化趋势不同的维度数据确定为异常维度数据,未考虑字段值数量波动频率对系统运行的影响。根据正常维度数据与异常维度数据对应的字段值数量变化趋势对比,生成各个异常维度数据,所生成的各个异常维度数据中存在较多的字段值数量变化趋势不同且波动频率较低的正常维度数据,导致告警页面中显示的各个异常数据的准确性较低,需要对告警页面中显示的各个异常维度数据再次检测和重新显示,浪费计算机的算力资源和显卡资源。基于此,本公开的一些实施例的异常维度数据生成方法,首先,响应于接收到对应价值操作异常信息的告警通知信息,确定对应上述告警通知信息的告警时间段。由此,可以得到用于获取表征存在异常维度数据的与初始异常数据组对应的告警时间段。然后,将在上述告警时间段之前满足预设条件的时间段确定为待查询正常时间段。由此,可以得到用于生成正常维度数据组与初始正常数据组对应的正常时间段。接着,从预设数据库获取与上述告警时间段对应的价值操作数据组作为初始异常数据组,其中,上述价值操作数据组包括各个维度数据,上述各个维度数据包括以下至少一项:价值信息、源网络地址信息、目标网络地址信息,上述各个维度数据中的每个维度数据包括至少一个字段值。由此,可以得到用于生成异常维度数据组的初始异常数据组。然后,从上述预设数据库获取与上述待查询正常时间段对应的价值操作数据组作为初始正常数据组。由此,可以获取用于生成正常维度数据组的初始正常数据组。接着,对上述初始异常数据组与上述初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组。由此,可以对上述初始异常数据组与上述初始正常数据组进行低离散度维度数据去除处理,得到去除离散程度较低的维度数据后的异常维度数据组与正常维度数据组。然后,基于上述异常维度数据组与上述正常维度数据组,生成各个维度数据字段数量组集。由此,可以得到用于生成各个填充维度数据字段数量组集的各个维度数据字段数量组集。上述各个维度数据字段数量组集中的维度数据字段数量组集表征各个维度数据中维度数据在正常时间段和异常时间段对应的正常维度字段数量组和异常维度字段数量组。再然后,对于上述各个维度数据字段数量组集中的每个维度数据字段数量组集,对上述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集。由此,可以对各个维度数据字段数量组集中的每个维度数据字段数量组集进行填充处理,得到填充维度数据字段数量组集以便后续频率分布测试处理。接着,对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合,其中,上述各个填充维度数据字段数量组集中的填充维度数据字段数量组集对应概率值集合中的概率值。由此,可以得到概率值集合。上述概率值集合中的每个概率值表征对应上述概率值的填充维度数据字段数量组集中正常填充维度数据字段数量组与异常填充维度数据字段数量组变化趋势相同的概率。之后,将上述概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合。由此,可以得到表征字段值数量变化趋势不相同的各个概率值,即目标概率值集合。然后,对于上述目标概率值集合中每个目标概率值,对与上述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据。由此,可以对字段值数量变化趋势不相同的各个填充维度数据字段数量组集中的每个填充维度数据字段数量组集,根据其数据波动频率进行异常维度预测,生成异常维度数据。由此,可以得到检测数据更加准确的各个异常维度数据。在价值操作告警页面中显示所生成的各个异常维度数据。也因为采用了根据初始异常数据组与初始异常数据组生成了各个填充维度数据字段数量组集。对上述各个填充数量组集进行了频率分布测试处理,得到了字段值数量变化趋势不相同的各个填充维度数据字段数量组集。对字段值数量变化趋势不相同的各个填充维度数据字段数量组集中的每个填充维度数据字段数量组集,根据其数据波动频率进行异常维度预测,以生成异常维度数据,得到检测数据更加准确的各个异常维度数据。减少了对准确性较低的异常维度数据的重新检测与显示的次数。进而,减少了计算机的算力资源和显卡资源浪费。
进一步参考图2,作为对各图所示方法的实现,本公开提供了一种异常维度数据生成装置的一些实施例,这些装置实施例与图1所示的那些方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图2所示,一些实施例的异常维度数据生成装置200包括:第一确定单元201、第二确定单元202、第一获取单元203、第二获取单元204、去除处理单元205、生成单元206、填充处理单元207、频率分布测试处理单元208、第三确定单元209、异常维度预测单元210和显示单元211。其中,第一确定单元201被配置成响应于接收到对应价值操作异常信息的告警通知信息,确定对应上述告警通知信息的告警时间段;第二确定单元202被配置成将在上述告警时间段之前满足预设条件的时间段确定为待查询正常时间段;第一获取单元203被配置成从预设数据库获取与上述告警时间段对应的价值操作数据组作为初始异常数据组,其中,上述价值操作数据组包括各个维度数据,上述各个维度数据包括以下至少一项:价值信息、源网络地址信息、目标网络地址信息,上述各个维度数据中的每个维度数据包括至少一个字段值;第二获取单元204被配置成从上述预设数据库获取与上述待查询正常时间段对应的价值操作数据组作为初始正常数据组;去除处理单元205被配置成对上述初始异常数据组与上述初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组;生成单元206被配置成基于上述异常维度数据组与上述正常维度数据组,生成各个维度数据字段数量组集;填充处理单元207被配置成对于上述各个维度数据字段数量组集中的每个维度数据字段数量组集,对上述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集;频率分布测试处理单元208被配置成对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合,其中,上述各个填充维度数据字段数量组集中的填充维度数据字段数量组集对应概率值集合中的概率值;第三确定单元209被配置成将上述概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合;异常维度预测单元210被配置成对于上述目标概率值集合中每个目标概率值,对与上述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据;显示单元211被配置成在价值操作告警页面中显示所生成的各个异常维度数据。可以理解的是,该装置200中记载的诸单元与参考图1述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置200及其中包含的单元,在此不再赘述。
下面参考图3,其示出了适于用来实现本公开的一些实施例的电子设备300的结构示意图。图3示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图3中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开的一些实施例的方法中限定的功能。
需要说明的是,本公开的一些实施例中记载的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
计算机可读介质可以是电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。计算机可读介质承载有一个或者多个程序,当一个或者多个程序被该电子设备执行时,使得该电子设备:响应于接收到对应价值操作异常信息的告警通知信息,确定对应上述告警通知信息的告警时间段;将在上述告警时间段之前满足预设条件的时间段确定为待查询正常时间段;从预设数据库获取与上述告警时间段对应的价值操作数据组作为初始异常数据组,其中,上述价值操作数据组包括各个维度数据,上述各个维度数据包括以下至少一项:价值信息、源网络地址信息、目标网络地址信息,上述各个维度数据中的每个维度数据包括至少一个字段值;从上述预设数据库获取与上述待查询正常时间段对应的价值操作数据组作为初始正常数据组;对上述初始异常数据组与上述初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组;基于上述异常维度数据组与上述正常维度数据组,生成各个维度数据字段数量组集;对于上述各个维度数据字段数量组集中的每个维度数据字段数量组集,对上述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集;对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合,其中,上述各个填充维度数据字段数量组集中的填充维度数据字段数量组集对应概率值集合中的概率值;将上述概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合;对于上述目标概率值集合中每个目标概率值,对与上述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据;在价值操作告警页面中显示所生成的各个异常维度数据。可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一确定单元、第二确定单元、第一获取单元、第二获取单元、去除处理单元、生成单元、填充处理单元、频率分布测试处理单元、第三确定单元、异常维度预测单元和显示单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,第二获取单元还可以被描述为“从上述预设数据库获取与上述待查询正常时间段对应的价值操作数据组作为初始正常数据组的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离发明构思的情况下,由技术特征或其等同特征进行任意组合而形成的其它技术方案。例如特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (9)
1.一种异常维度数据生成方法,包括:
响应于接收到对应价值操作异常信息的告警通知信息,确定对应所述告警通知信息的告警时间段;
将在所述告警时间段之前满足预设条件的时间段确定为待查询正常时间段;
从预设数据库获取与所述告警时间段对应的价值操作数据组作为初始异常数据组,其中,所述价值操作数据组包括各个维度数据,所述各个维度数据包括以下至少一项:价值信息、源网络地址信息、目标网络地址信息,所述各个维度数据中的每个维度数据包括至少一个字段值;
从所述预设数据库获取与所述待查询正常时间段对应的价值操作数据组作为初始正常数据组;
对所述初始异常数据组与所述初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组;
基于所述异常维度数据组与所述正常维度数据组,生成各个维度数据字段数量组集;
对于所述各个维度数据字段数量组集中的每个维度数据字段数量组集,对所述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集;
对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合,其中,所述各个填充维度数据字段数量组集中的填充维度数据字段数量组集对应概率值集合中的概率值;
将所述概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合;
对于所述目标概率值集合中每个目标概率值,对与所述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据;
在价值操作告警页面中显示所生成的各个异常维度数据。
2.根据权利要求1所述的方法,其中,所述基于所述异常维度数据组与所述正常维度数据组,生成各个维度数据字段数量组集,包括:
对于所述正常维度数据组中的每个维度数据,执行以下步骤:
确定对应所述维度数据的各个第一字段值;
确定对应所述各个第一字段值的第一字段数量组;
将所述正常维度数据的维度类型确定为目标维度类型;
将所述异常维度数据组中与所述目标维度类型对应的维度数据确定为目标维度数据;
确定与所述目标维度数据对应的各个第二字段值;
确定对应所述各个第二字段值的第二字段数量组;
将所述第一字段数量组与所述第二字段数量组确定为初始维度数据字段数量组集;
将所确定的各个初始维度数据字段数量组集中的每个初始维度数据字段数量组集确定为维度数据字段数量组集,得到各个维度数据字段数量组集。
3.根据权利要求1所述的方法,其中,所述对所述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集,包括:
对于所述维度数据字段数量组集中所包括的各个字段数量,将所述各个字段数量中满足第二预设筛选条件的各个字段数量替换为各个预设数值,以对所述维度数据字段数量组集进行更新;
将更新后的维度数据字段数量组集确定为填充维度数据字段数量组集。
4.根据权利要求1所述的方法,其中,所述与所述目标概率值对应的填充维度数据字段数量组集包括第一填充数量组与第二填充数量组;以及
所述对与所述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据,包括:
对所述第一填充数量组进行归一化处理,得到归一化第一填充数量组;
对所述第二填充数量组进行归一化处理,得到归一化第二填充数量组;
基于所述归一化第一填充数量组与所述归一化第二填充数量组,生成目标归一化填充数量组;
对所述目标归一化填充数量组进行初始化,得到初始化填充数量组;
基于所述初始化填充数量组,生成差分值组;
将所述差分值组中满足第三预设筛选条件的各个差分值确定为目标差分值集合;
对于所述目标差分值集合中的每一个目标差分值,执行以下步骤:
将所述差分值组中与所述目标差分值对应的差分值确定为第一差分值;
将所述差分值组中第一差分值的下一个差分值确定为第二差分值;
基于所述目标差分值与预设灵敏度,生成局部阈值;
响应于确定所述第二差分值小于所述局部阈值,将所述第二填充数量组中与所述目标差分值对应的第二填充数量确定为目标填充数量;
将与所述目标填充数量对应的字段值确定为异常字段值;
将所确定的各个异常字段值确定为异常字段值集合;
对于所述初始异常数据组中的各个维度数据,将与所述异常字段值集合对应的维度数据确定为异常维度数据。
5.根据权利要求4所述的方法,其中,所述对所述第一填充数量组进行归一化处理,得到归一化第一填充数量组,包括:
将所述第一填充数量组中数值最大的第一填充数量确定为第一目标数值;
将所述第一填充数量组中数值最小的第一填充数量确定为第二目标数值;
对于所述第一填充数量组中的每一个第一填充数量,执行以下更新步骤:
基于所述第一填充数量、所述第一目标数值与所述第二目标数值,生成更新数值;
将所述第一填充数量替换为所述更新数值,以对第一填充数量进行更新;
将更新后的各个第一填充数量确定为归一化第一填充数量组。
6.根据权利要求1所述的方法,其中,所述在价值操作告警页面中显示所生成的各个异常维度数据,包括:
将所述价值操作告警页面的显示尺寸确定为页面显示大小;
基于所述页面显示大小,确定展示所述各个异常维度数据的弹窗大小;
基于所述页面显示大小与所述弹窗大小,确定弹窗在所述价值操作告警页面中的显示位置;
将弹窗在所述价值操作告警页面中的显示位置确定为弹窗位置;
在所述价值操作告警页面中的所述弹窗位置显示包含所述各个异常维度数据的告警弹窗。
7.一种异常维度数据生成装置,包括:
第一确定单元,被配置成响应于接收到对应价值操作异常信息的告警通知信息,确定对应所述告警通知信息的告警时间段;
第二确定单元,被配置成将在所述告警时间段之前满足预设条件的时间段确定为待查询正常时间段;
第一获取单元,被配置成从预设数据库获取与所述告警时间段对应的价值操作数据组作为初始异常数据组,其中,所述价值操作数据组包括各个维度数据,所述各个维度数据包括以下至少一项:价值信息、源网络地址信息、目标网络地址信息,所述各个维度数据中的每个维度数据包括至少一个字段值;
第二获取单元,被配置成从所述预设数据库获取与所述待查询正常时间段对应的价值操作数据组作为初始正常数据组;
去除处理单元,被配置成对所述初始异常数据组与所述初始正常数据组进行低离散度维度数据去除处理,得到异常维度数据组与正常维度数据组;
生成单元,被配置成基于所述异常维度数据组与所述正常维度数据组,生成各个维度数据字段数量组集;
填充处理单元,被配置成对于所述各个维度数据字段数量组集中的每个维度数据字段数量组集,对所述维度数据字段数量组集进行填充处理,以生成填充维度数据字段数量组集;
频率分布测试处理单元,被配置成对所生成的各个填充维度数据字段数量组集进行频率分布测试处理,得到概率值集合,其中,所述各个填充维度数据字段数量组集中的填充维度数据字段数量组集对应概率值集合中的概率值;
第三确定单元,被配置成将所述概率值集合中满足第一预设筛选条件的各个概率值确定为目标概率值集合;
异常维度预测单元,被配置成对于所述目标概率值集合中每个目标概率值,对与所述目标概率值对应的填充维度数据字段数量组集进行异常维度预测,以生成异常维度数据;
显示单元,被配置成在价值操作告警页面中显示所生成的各个异常维度数据。
8.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6中任一所述的方法。
9.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1至6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311508660.6A CN117290380B (zh) | 2023-11-14 | 2023-11-14 | 异常维度数据生成方法、装置、设备和计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311508660.6A CN117290380B (zh) | 2023-11-14 | 2023-11-14 | 异常维度数据生成方法、装置、设备和计算机可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117290380A true CN117290380A (zh) | 2023-12-26 |
CN117290380B CN117290380B (zh) | 2024-02-06 |
Family
ID=89248268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311508660.6A Active CN117290380B (zh) | 2023-11-14 | 2023-11-14 | 异常维度数据生成方法、装置、设备和计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117290380B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110830450A (zh) * | 2019-10-18 | 2020-02-21 | 平安科技(深圳)有限公司 | 基于统计的异常流量监测方法、装置、设备及存储介质 |
WO2021139235A1 (zh) * | 2020-06-30 | 2021-07-15 | 平安科技(深圳)有限公司 | 系统异常检测方法、装置、设备及存储介质 |
US11170022B1 (en) * | 2020-06-03 | 2021-11-09 | Shanghai Icekredit, Inc. | Method and device for processing multi-source heterogeneous data |
CN115687432A (zh) * | 2022-10-19 | 2023-02-03 | 中国建设银行股份有限公司上海市分行 | 用于监测异常交易数据的方法、设备和介质 |
-
2023
- 2023-11-14 CN CN202311508660.6A patent/CN117290380B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110830450A (zh) * | 2019-10-18 | 2020-02-21 | 平安科技(深圳)有限公司 | 基于统计的异常流量监测方法、装置、设备及存储介质 |
US11170022B1 (en) * | 2020-06-03 | 2021-11-09 | Shanghai Icekredit, Inc. | Method and device for processing multi-source heterogeneous data |
WO2021139235A1 (zh) * | 2020-06-30 | 2021-07-15 | 平安科技(深圳)有限公司 | 系统异常检测方法、装置、设备及存储介质 |
CN115687432A (zh) * | 2022-10-19 | 2023-02-03 | 中国建设银行股份有限公司上海市分行 | 用于监测异常交易数据的方法、设备和介质 |
Non-Patent Citations (3)
Title |
---|
YINLI HANG ET AL.: "A New Method of Detect the Abnormal Electricity Consumption of Public Tranform Area", 《IEEE XPLORE》 * |
孙毅刚 等: "面向数据挖掘的静态电源综合故障诊断研究", 计算机测量与控制, no. 10 * |
罗长银 等: "数据预处理技术在异构数据中的应用", 软件, no. 05 * |
Also Published As
Publication number | Publication date |
---|---|
CN117290380B (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110704751B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN111488285A (zh) | 接口测试方法、装置、电子设备及计算机可读存储介质 | |
EP3846083A1 (en) | Method and apparatus for parallel processing of information | |
CN115277261B (zh) | 基于工控网络病毒的异常机器智能识别方法、装置、设备 | |
CN114780338A (zh) | 主机信息处理方法、装置、电子设备和计算机可读介质 | |
CN112182374B (zh) | 库存控制方法、装置、电子设备和计算机可读介质 | |
CN110378660A (zh) | 库存处理方法、装置、电子设备和计算机可读存储介质 | |
CN112836128A (zh) | 信息推荐方法、装置、设备和存储介质 | |
CN112016284A (zh) | 电子表格的处理方法及设备 | |
CN116225886A (zh) | 测试用例生成方法、装置、设备、存储介质及程序产品 | |
CN111932348B (zh) | 针对异常订单的报警方法、装置、电子设备和可读介质 | |
CN110688295A (zh) | 数据测试方法和装置 | |
CN117290380B (zh) | 异常维度数据生成方法、装置、设备和计算机可读介质 | |
CN113111165A (zh) | 基于深度学习模型的接警警情类别确定方法和装置 | |
CN118262188A (zh) | 目标检测模型训练方法、物体检测信息生成方法和装置 | |
CN114185463B (zh) | 表格处理方法、装置、电子设备和存储介质 | |
CN111026629A (zh) | 一种测试脚本自动生成的方法和装置 | |
CN111737040B (zh) | 程序代码修复方法及装置 | |
CN112860999A (zh) | 信息推荐方法、装置、设备和存储介质 | |
CN111930704B (zh) | 业务报警设备控制方法、装置、设备和计算机可读介质 | |
CN113111897A (zh) | 基于支持向量机的接警警情类别确定方法和装置 | |
CN111932323B (zh) | 物品信息界面显示方法、装置、设备和计算机可读介质 | |
CN116467178B (zh) | 数据库检测方法、装置、电子设备和计算机可读介质 | |
CN112650528B (zh) | 个性化算法生成方法、装置、电子设备和计算机可读介质 | |
CN113704322B (zh) | 基于云边协同的数据采集方法、装置和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |