CN117372076A - 一种异常交易数据监控方法、装置、设备及存储介质 - Google Patents
一种异常交易数据监控方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117372076A CN117372076A CN202311068906.2A CN202311068906A CN117372076A CN 117372076 A CN117372076 A CN 117372076A CN 202311068906 A CN202311068906 A CN 202311068906A CN 117372076 A CN117372076 A CN 117372076A
- Authority
- CN
- China
- Prior art keywords
- transaction data
- sliding window
- order
- abnormal
- abnormal transaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 111
- 238000012544 monitoring process Methods 0.000 title claims abstract description 85
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000002131 composite material Substances 0.000 claims description 73
- 238000004891 communication Methods 0.000 claims description 21
- 238000007781 pre-processing Methods 0.000 claims description 13
- 230000008030 elimination Effects 0.000 claims description 9
- 238000003379 elimination reaction Methods 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000013329 compounding Methods 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012806 monitoring device Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 10
- 241000208125 Nicotiana Species 0.000 description 6
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 6
- 238000004080 punching Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 235000019504 cigarettes Nutrition 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000011229 interlayer Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Computer Security & Cryptography (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Manufacturing & Machinery (AREA)
- Game Theory and Decision Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提出一种异常交易数据监控方法、装置、设备及存储介质,涉及异常交易数据监控的技术领域,解决了现有异常数据监控方法监控效率低、监控过程过于机械化和灵活性差的问题,首先获取待监控用户的交易数据,然后通过构建并优化用于检测异常交易数据的复合滑动窗口模型,提高复合滑动窗口模型检测异常交易数据的效率,并利用优化后的复合滑动窗口模型检测预处理完的交易数据中的异常交易数据,降低了数据监控过程的机械性,提高了数据监控效率和数据监控过程的灵活性,实现数据的精细化监控。
Description
技术领域
本发明涉及异常交易数据监控的技术领域,特别涉及一种异常交易数据监控方法、装置、设备及存储介质。
背景技术
异常交易是零售、金融和物流等行业的重点关注对象,它是指当前运行状况较以往存在显著差别的交易,其出现与市场波动、客户人群和经营环境变化等因素息息相关。随着异常交易行为的日益增加和计算机技术的不断提高,监控异常交易数据对保障用户交易体验具有重要意义。
以烟草零售行业为例,烟草局为促进烟草销售业务的增长,不仅开拓了许多支烟草公司的零售门店市场和自行经营门店零售业务,还开展了会员积分制度及其他购买激励等模式,但伴随着烟草门店销售业务的增多,许多门店员工利用自己个人的门店会员,将普通消费者购买卷烟记录挂入自己个人会员,从而获得购买商品的活动积分的异常交易行为,主要表现在门店购买卷烟的订单时间相对集中,短时间内出现多笔交易订单,即消费交易的时间集中与高金额订单集中。传统烟草零售行业的异常交易数据监控方法主要通过检查人员的检查经验、抽查小部分销售流水数据的方式,这对规范经营的监管,提出了非常大的挑战,有监管盲点存在可能性,让门店员工存在“监守自盗”的盲区。现有技术公开了一种系统数据监控方法,获取测试维度数据;计算测试维度数据的异常概率;当测试维度数据的异常概率大于预设概率时,确定测试维度数据为异常维度数据;计算异常维度数据的影响力值;当影响力值大于预设阈值时,确定异常维度数据为目标异常维度数据;但在面对大量的异常交易数据时,仅依赖预设概率和预设阈值来判断监控的数据是否为异常数据,数据监控效率低,监控过程机械性强,灵活性差,难以实现异常交易数据的精细化监控。
发明内容
为解决现有异常数据监控方法监控效率低、监控过程过于机械化和灵活性差的问题,本发明提出一种异常交易数据监控方法、装置、设备及存储介质,降低了数据监控过程的机械性,提高了数据监控效率和数据监控过程的灵活性,实现数据的精细化监控。
为了达到上述技术效果,本发明的技术方案如下:
一种异常交易数据监控方法,包括以下步骤:
S1.获取待监控用户的交易数据;
S2.对所述交易数据进行预处理;
S3.构建用于检测所述交易数据中的异常交易数据的复合滑动窗口模型,对构建的复合滑动窗口模型进行优化;
S4.利用优化后的复合滑动窗口模型,对预处理完的交易数据进行检测,得到异常交易数据。
优选地,所述交易数据包括零售门店、客户编码、会员编号、许可证编号、销售年月、订单时间和订单号。
优选地,所述对所述交易数据进行预处理,具体为:
S21.利用去重函数distinct对交易数据中的所有零售门店进行去重抽取,得到去重交易数据;
S22.遍历去重交易数据中的每一个零售门店,抽取获得n个零售门店目录数据,其中n表示正整数。
优选地,所述构建用于检测所述交易数据中的异常交易数据的复合滑动窗口模型,具体包括以下步骤:
S31.以预设时间区间为时间滑动窗口,建立时间滑动窗口模型f(x)的表达式为:
f(x)=A1x+B1
其中,A1表示第一窗口参数,x表示在时间滑动窗口内订单单数满足第一订单选择条件的总数,B1表示第二窗口参数;
S32.以预设连续订单数量为订单滑动窗口,建立订单滑动窗口模型f(y)的表达式为:
f(y)=A2y+B2
其中,A2表示第三窗口参数,y表示在订单滑动窗口内订单单数满足第二订单选择条件的时间跨度,B2表示第四窗口参数;
S33.将所述时间滑动窗口模型f(x)和订单滑动窗口模型f(y)进行复合,得到所述复合滑动窗口模型f(x,y)的表达式为:
f(x,y)=A3x+B3y+C
其中,A3表示第五窗口参数,B3表示第六窗口参数,C表示第七窗口参数。
优选地,所述第一订单选择条件为预设时间区间超过预设订单记录的订单,若预设时间区间超过预设订单记录的订单,在时间滑动窗口的预设时间区间内的订单为异常交易数据,否则,在时间滑动窗口的预设时间区间内的订单为正常交易数据;所述第二订单选择条件为预设连续订单记录低于预设时间区间,若预设连续订单记录低于预设时间区间,在订单滑动窗口内的预设连续订单为异常交易数据,否则,在订单滑动窗口的预设连续订单为正常交易数据。
优选地,所述对构建的复合滑动窗口模型进行优化,具体为:引入修正函数f(z)=z,对复合滑动窗口模型f(x,y)进行优化,得到优化的复合滑动窗口模型f(x,y,z)的表达式为:
f(x,y,z)=f(z)*(A3x+B3y+C)
=z*(A3x+B3y+C)
=A3xz+B3yz+Cz
其中,z表示修正变量。
优选地,所述对预处理完的交易数据进行检测,具体包括:
S41.设置复合滑动窗口的在预处理完的交易数据上的初始坐标,其中所述复合滑动窗口包括时间滑动窗口和订单滑动窗口;
S42.将所述时间滑动窗口和订单滑动窗口设置为可变长度滑动窗口,所述可变长度滑动窗口从所述初始坐标开始在预处理完的交易数据上滑动;
S43.在所述可变长度滑动窗口滑动后,确定滑动过程中所述可变长度滑动窗口的窗口值,将所述窗口值输入优化后的复合滑动窗口模型,输出异常交易数据结果,将异常交易数据结果进行展示。
本发明还提出了一种异常交易数据监控装置,包括:
数据获取单元,用于获取待监控用户的交易数据;
预处理单元,用于对所述交易数据进行预处理;
复合滑动窗口模型构建单元,用于构建检测所述交易数据中的异常交易数据的复合滑动窗口模型,对构建的复合滑动窗口模型进行优化;
异常交易数据检测单元,用于利用优化后的复合滑动窗口模型,对预处理完的交易数据进行检测,得到异常交易数据。
本发明还提出了一种计算机设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行所述的异常交易数据监控方法的操作。
优选地,所述存储介质中存储有至少一可执行指令,所述可执行指令在计算机设备上运行时,使得计算机设备执行所述的异常交易数据监控方法的操作。
与现有技术相比,本发明技术方案的有益效果是:
本发明提出一种异常交易数据监控方法、装置、设备及存储介质,考虑现有异常数据监控方法监控效率低、监控过程过于机械化和灵活性差的问题,对数据监控方法进行了改进,首先获取待监控用户的交易数据,然后通过构建并优化用于检测异常交易数据的复合滑动窗口模型,提高复合滑动窗口模型检测异常交易数据的效率,并利用优化后的复合滑动窗口模型检测预处理完的交易数据中的异常交易数据,降低了数据监控过程的机械性,提高了数据监控效率和数据监控过程的灵活性,实现数据的精细化监控。
附图说明
图1表示本发明实施例中提出的一种异常交易数据监控方法的流程示意图;
图2表示本发明实施例中提出的待监控用户的交易数据的流水图;
图3表示本发明实施例中提出的时间滑动窗口模型的结构图;
图4表示本发明实施例中提出的时间滑动窗口模式图;
图5表示本发明实施例中提出的订单滑动窗口模型的结构图;
图6表示本发明实施例中提出的订单滑动窗口模式图;
图7表示本发明实施例中提出的复合滑动窗口模型的二维结构图;
图8表示本发明实施例中提出的复合滑动窗口模型的三维结构图;
图9表示本发明实施例中提出的复合滑动窗口模型的第一种检测结果图;
图10表示本发明实施例中提出的复合滑动窗口模型的第二种检测结果图;
图11表示本发明实施例中提出的一种异常交易数据监控方法的装置图;
图12表示本发明实施例中提出的一种计算机设备的结构示意图;
11.异常交易数据监控装置;111.数据获取单元;112.预处理单元;113.复合滑动窗口模型构建单元;114.异常交易数据检测单元;121.处理器;122.存储器;123.通信接口;124.通信总线;125.可执行指令。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好地说明本实施例,附图某些部位会有省略、放大或缩小,并不代表实际尺寸,“上”“下”等部位方向的描述非对本专利的限制;
对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
参见图1,本发明提出了一种异常交易数据监控方法,包括以下步骤:
S1.获取待监控用户的交易数据;
在步骤S1中,参见图2,所述交易数据包括零售门店、客户编码、会员编号、许可证编号、销售年月、订单时间和订单号,按日期能排序的订单时间,认同为连续的时间区间,对于一个订单有多个订单明细的,则认为是同一个订单同一个日期。
S2.对所述交易数据进行预处理;
在步骤S2中,考虑到交易数据量的巨大,如果在数据库端用partition by门店的语法分类,有可能会大大影响后台数据响应效率,故本步骤采用稳定方案,对所述交易数据进行预处理,具体为:
S21.利用去重函数distinct对交易数据中的所有零售门店进行去重抽取,得到去重交易数据;
S22.遍历去重交易数据中的每一个零售门店,抽取获得n=61个零售门店目录数据,其中n表示正整数;
S3.构建用于检测所述交易数据中的异常交易数据的复合滑动窗口模型,对构建的复合滑动窗口模型进行优化;
在步骤S3中,所述构建用于检测所述交易数据中的异常交易数据的复合滑动窗口模型,具体包括以下步骤:
S31.以预设时间区间为时间滑动窗口,建立时间滑动窗口模型f(x)的表达式为:
f(x)=A1x+B1
其中,A1表示第一窗口参数,x表示在时间滑动窗口内订单单数满足第一订单选择条件的总数,B1表示第二窗口参数;所述第一订单选择条件为预设时间区间超过预设订单记录的订单,参见图3及图4,将预设时间区间设置为20分钟,预设订单记录为15,即第一订单选择条件为:“20分钟内超过15条订单记录”,这里是以20分钟作为时间滑动窗口区间,记录时间滑动窗口区间内的订单总数,在这里标记“20分钟”为x变量时间窗口;若20分钟内超过15条订单记录,在时间滑动窗口的20分钟内超过15条订单为异常交易数据,否则,在时间滑动窗口的20分钟内不超过15条订单为正常交易数据;在本步骤中,以订单时间2021年2月4号的交易数据为例,从图3中得知,x轴在3-5之间的时间位,均有20分钟内超过18条订单的数据,记这些订单数据为异常交易数据,经过复查2021年2月4号的交易数据,x轴在3-5之间的时间位,都满足了20分钟刷卡次数都高于18次,因此,时间滑动窗口模型f(x)的值越大,说明刷卡购买订单的次数越集中,异常交易数据越容易出现。
S32.以预设连续订单数量为订单滑动窗口,建立订单滑动窗口模型f(y)的表达式为:
f(y)=A2y+B2
其中,A2表示第三窗口参数,y表示在订单滑动窗口内订单单数满足第二订单选择条件的时间跨度,B2表示第四窗口参数;所述第二订单选择条件为预设连续订单记录低于预设时间区间,参见图5及图6将预设连续订单记录设为16个,预设时间区间为20分钟,即第二订单选择条件为:“连续的16个订单记录低于20分钟”,这里是以变化窗口“订单数量”16次为计算横坐标,计算窗口的时间跨度,在这里标记“订单数量”为y变量的数量窗口;若连续的16个订单记录低于20分钟,在订单滑动窗口内的连续的16个订单记录为异常交易数据,否则,在订单滑动窗口的连续的16个订单记录为正常交易数据;在本步骤中,同样以订单时间2021年2月4号的交易数据为例,从图5中得知,x轴在3-6之间的时间位,均有连续的16个订单记录低于15分钟,记这些订单记录为异常交易数据,经过复查2021年2月4号的交易数据,x轴在3-6之间的时间位,平均16次刷卡次数都低于15分钟,因此,f(y)值越小,16个订单需要的时间越少,说明刷卡次数越集中,异常交易数据越容易出现,综上分析,反应出刷卡的集中时间段,为第3-6个窗口区间最集中,也就是第三个时间开始后的窗口连续集中。
S33.将所述时间滑动窗口模型f(x)和订单滑动窗口模型f(y)进行复合,参见图7,得到所述复合滑动窗口模型f(x,y)的表达式为:
f(x,y)=A3x+B3y+C
其中,A3表示第五窗口参数,B3表示第六窗口参数,C表示第七窗口参数;
所述对构建的复合滑动窗口模型进行优化,具体为:引入修正函数f(z)=z,对复合滑动窗口模型f(x,y)进行优化,得到优化的复合滑动窗口模型f(x,y,z)的表达式为:
f(x,y,z)=f(z)*(A3x+B3y+C)
=z*(A3x+B3y+C)
=A3xz+B3yz+Cz
其中,z表示修正变量;引入f(z)=z是为了保证复合滑动窗口模型的简便性和可理解对比性,复合滑动窗口模型要解决的问题是“预设时间区间超过预设订单记录的订单”和“预设连续订单记录低于预设时间区间”的集合,本实施例提出的复合滑动窗口模型是以时间区间为自变量x,以订单次数区间为自变量y,通过双线逼近来查找“最集中刷单的区域”的区域解,由于时间滑动窗口模型f(x)的值越大,说明刷卡购买订单的次数越集中;f(y)值越小,16个订单需要的时间越少,说明刷卡越集中,是负相关的关系,所以时间滑动窗口模型f(x)和订单滑动窗口模型f(y)的集中程度交际是两者曲线之间的夹层面积,参见图7,夹层面积高度越高、面积越大,说明集中刷卡越严重,越能反映异常交易数据;该公式理解为上述复合滑动窗口模型在可变后区间基数的方案,从而带来了修正变量z作为分析变量,参见图8,复合滑动窗口模型演变为三维空间模型靠近查找异常交易数据的时间与空间区域。
S4.利用优化后的复合滑动窗口模型,对预处理完的交易数据进行检测,得到异常交易数据结果。
在步骤S4中,所述对预处理完的交易数据进行检测,具体包括:
S41.设置复合滑动窗口的在预处理完的交易数据上的初始坐标,其中所述复合滑动窗口包括时间滑动窗口和订单滑动窗口;
S42.将所述时间滑动窗口和订单滑动窗口设置为可变长度滑动窗口,所述可变长度滑动窗口从所述初始坐标开始在预处理完的交易数据上滑动;
在步骤S42中,复合滑动窗口模型的条件20分钟的订单数量的f(x),和订单数为16个的时间区间f(y)并不是固定不变的,即x变量和y变量都是可变的;
S43.在所述可变长度滑动窗口滑动后,确定滑动过程中所述可变长度滑动窗口的窗口值,将所述窗口值输入优化后的复合滑动窗口模型,输出异常交易数据结果,将异常交易数据结果进行展示。
在步骤S43中,参见图9显示的异常交易数据结果,发现某个门店在2021年7月14日,短时间内进行了多笔交易,并且是同一个会员进行了多笔交易;参见图10显示的异常交易数据结果,同样发现某个会员在2021年2月4日春季假期期间到了多个零售门店进行了购买商品,并且地域跨度比较大。另外,关于对预处理完的交易数据进行检测的控制流程,采用以下IDE代码执行,具体程序代码为:
data=obj.Query(sql)
pd_data=pd.DataFrame(data,columns=['门店','开单时间','订单号'])
#第一次查询非空,并且大于15条
if len(pd_data)>=15and len(pd_data)!=0:
result=get_again_data(pd_data,shopName,status=1)
while True:
if result:
pd_data=result(0)
shopName=result(1)
status=result(2)
stop_time=result(3)
result=get_again_data(pd_data,shopName,status,stop_time)
else:
break
#查询内容非空,并且小于15条
else:
result=get_again_data(pd_data,shopName,status=0)
while True:
if result:
pd_data=result[0]
shopName=result[1]
status=result[2]
stop_time=result[3]
result=get_again_data(pd_data,shopName,status,stop_time)
else:
break
在本实施例中,由于可变滑动窗口的窗口区间由实际需要出发而变化,一般不会有非常巨大的区间,比如“2000分钟内订单量超过15次”的需求不太现实,本实施例提出的异常交易数据监控方法忽略外层滑动窗口区间的循环时间复杂度,而零售门店数量和门店会员的中间层循环的时间复杂度也可以折算计算,只需要计算最内层滑动窗口的遍历的时间复杂度,本实施例基于可变滑动窗口算法与理论构建了一种异常交易数据监控方法,直接获取待监控用户的交易数据,如零售门店订单明细的订单号和交易时间等基础信息,利用复合滑动窗口模型查找交易数据中异常交易数据的线索,然后判断交易数据中是否存在异常交易数据,确认异常交易数据结果,经过验算,本实施例构建的复合滑动窗口模型的时间复杂度约等于O(N2)级别;本实施例提出的异常交易数据监控方法主要针对具体零售门店为主体,查询具体零售门店的交易数据是否存在异常交易数据,不仅适用于监控零售门店的交易数据,也适用于某个会员进行交易时是否存在异常交易情况,能够达到降低了数据监控过程的机械性,提高了数据监控效率和数据监控过程的灵活性,实现数据的精细化监控的目的。
实施例2
参见图11,本发明提出了一种异常交易数据监控装置11,包括:
数据获取单元111,用于获取待监控用户的交易数据;
预处理单元112,用于对所述交易数据进行预处理;
复合滑动窗口模型构建单元113,用于构建检测所述交易数据中的异常交易数据的复合滑动窗口模型,对构建的复合滑动窗口模型进行优化;
异常交易数据检测单元114,用于利用优化后的复合滑动窗口模型,对预处理完的交易数据进行检测,得到异常交易数据。
在本实施例中,考虑现有异常数据监控方法监控效率低、监控过程过于机械化和灵活性差的问题,对数据监控方法进行了改进,首先获取待监控用户的交易数据,然后通过构建并优化用于检测异常交易数据的复合滑动窗口模型,提高复合滑动窗口模型检测异常交易数据的效率,并利用优化后的复合滑动窗口模型检测预处理完的交易数据中的异常交易数据,降低了数据监控过程的机械性,提高了数据监控效率和数据监控过程的灵活性,实现数据的精细化监控。
实施例3
本实施例还提出了一种计算机设备,参见图12,包括:处理器121、存储器122、通信接口123和通信总线124,所述处理器121、所述存储器122和所述通信接口123通过所述通信总线124完成相互间的通信;
其中:处理器121、存储器122以及通信接口123通过通信总线124完成相互间的通信。通信接口123,用于与其它设备比如客户端或其它服务器等的网元通信。处理器121,用于执行可执行指令125,具体可以执行所述的异常交易数据监控方法的操作。具体地,可执行指令125可以包括程序代码。处理器121可能是中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器122,用于存放可执行指令125。存储器122可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
可执行指令125具体可以被处理器121调用使计算机设备执行以下操作:
S1.获取待监控用户的交易数据;
S2.对所述交易数据进行预处理;
S3.构建用于检测所述交易数据中的异常交易数据的复合滑动窗口模型,对构建的复合滑动窗口模型进行优化;
S4.利用优化后的复合滑动窗口模型,对预处理完的交易数据进行检测,得到异常交易数据结果。
在本实施例中,考虑现有异常数据监控方法监控效率低、监控过程过于机械化和灵活性差的问题,对数据监控方法进行了改进,首先获取待监控用户的交易数据,然后通过构建并优化用于检测异常交易数据的复合滑动窗口模型,提高复合滑动窗口模型检测异常交易数据的效率,并利用优化后的复合滑动窗口模型检测预处理完的交易数据中的异常交易数据,降低了数据监控过程的机械性,提高了数据监控效率和数据监控过程的灵活性,实现数据的精细化监控。
实施例4
本实施例还提出了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令在计算机设备上运行时,使得计算机设备执行所述的基于定时器监控linux系统的方法的操作,具体包括以下步骤:
S1.获取待监控用户的交易数据;
S2.对所述交易数据进行预处理;
S3.构建用于检测所述交易数据中的异常交易数据的复合滑动窗口模型,对构建的复合滑动窗口模型进行优化;
S4.利用优化后的复合滑动窗口模型,对预处理完的交易数据进行检测,得到异常交易数据结果。
在本实施例中,考虑现有异常数据监控方法监控效率低、监控过程过于机械化和灵活性差的问题,对数据监控方法进行了改进,首先获取待监控用户的交易数据,然后通过构建并优化用于检测异常交易数据的复合滑动窗口模型,提高复合滑动窗口模型检测异常交易数据的效率,并利用优化后的复合滑动窗口模型检测预处理完的交易数据中的异常交易数据,降低了数据监控过程的机械性,提高了数据监控效率和数据监控过程的灵活性,实现数据的精细化监控。
显然,本发明的上述实施例仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种异常交易数据监控方法,其特征在于,包括以下步骤:
S1.获取待监控用户的交易数据;
S2.对所述交易数据进行预处理;
S3.构建用于检测所述交易数据中的异常交易数据的复合滑动窗口模型,对构建的复合滑动窗口模型进行优化;
S4.利用优化后的复合滑动窗口模型,对预处理完的交易数据进行检测,得到异常交易数据结果。
2.根据权利要求1所述的异常交易数据监控方法,其特征在于,所述交易数据包括零售门店、客户编码、会员编号、许可证编号、销售年月、订单时间和订单号。
3.根据权利要求2所述的异常交易数据监控方法,其特征在于,所述对所述交易数据进行预处理,具体为:
S21.利用去重函数distinct对交易数据中的所有零售门店进行去重抽取,得到去重交易数据;
S22.遍历去重交易数据中的每一个零售门店,抽取获得n个零售门店目录数据,其中n表示正整数。
4.根据权利要求3所述的异常交易数据监控方法,其特征在于,所述构建用于检测所述交易数据中的异常交易数据的复合滑动窗口模型,具体包括以下步骤:
S31.以预设时间区间为时间滑动窗口,建立时间滑动窗口模型f(x)的表达式为:
f(x)=A1x+B1
其中,A1表示第一窗口参数,x表示在时间滑动窗口内订单单数满足第一订单选择条件的总数,B1表示第二窗口参数;
S32.以预设连续订单数量为订单滑动窗口,建立订单滑动窗口模型f(y)的表达式为:
f(y)=A2y+B2
其中,A2表示第三窗口参数,y表示在订单滑动窗口内订单单数满足第二订单选择条件的时间跨度,B2表示第四窗口参数;
S33.将所述时间滑动窗口模型f(x)和订单滑动窗口模型f(y)进行复合,得到所述复合滑动窗口模型f(x,y)的表达式为:
f(x,y)=A3x+B3y+C
其中,A3表示第五窗口参数,B3表示第六窗口参数,C表示第七窗口参数。
5.根据权利要求4所述的异常交易数据监控方法,其特征在于,所述第一订单选择条件为预设时间区间超过预设订单记录的订单,若预设时间区间超过预设订单记录的订单,在时间滑动窗口的预设时间区间内的订单为异常交易数据,否则,在时间滑动窗口的预设时间区间内的订单为正常交易数据;所述第二订单选择条件为预设连续订单记录低于预设时间区间,若预设连续订单记录低于预设时间区间,在订单滑动窗口内的预设连续订单为异常交易数据,否则,在订单滑动窗口的预设连续订单为正常交易数据。
6.根据权利要求5所述的异常交易数据监控方法,其特征在于,所述对构建的复合滑动窗口模型进行优化,具体为:引入修正函数f(z)=z,对复合滑动窗口模型f(x,y)进行优化,得到优化的复合滑动窗口模型f(x,y,z)的表达式为:
f(x,y,z)=f(z)*(A3x+B3y+C)
=z*(A3x+B3y+C)
=A3xz+B3yz+Cz
其中,z表示修正变量。
7.根据权利要求6所述的异常交易数据监控方法,其特征在于,所述对预处理完的交易数据进行检测,具体包括:
S41.设置复合滑动窗口的在预处理完的交易数据上的初始坐标,其中所述复合滑动窗口包括时间滑动窗口和订单滑动窗口;
S42.将所述时间滑动窗口和订单滑动窗口设置为可变长度滑动窗口,所述可变长度滑动窗口从所述初始坐标开始在预处理完的交易数据上滑动;
S43.在所述可变长度滑动窗口滑动后,确定滑动过程中所述可变长度滑动窗口的窗口值,将所述窗口值输入优化后的复合滑动窗口模型,输出异常交易数据结果,将异常交易数据结果进行展示。
8.一种异常交易数据监控装置,其特征在于,包括:
数据获取单元,用于获取待监控用户的交易数据;
预处理单元,用于对所述交易数据进行预处理;
复合滑动窗口模型构建单元,用于构建检测所述交易数据中的异常交易数据的复合滑动窗口模型,对构建的复合滑动窗口模型进行优化;
异常交易数据检测单元,用于利用优化后的复合滑动窗口模型,对预处理完的交易数据进行检测,得到异常交易数据。
9.一种计算机设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7任意一项所述的异常交易数据监控方法的操作。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令在计算机设备上运行时,使得计算机设备执行如权利要求1-7任意一项所述的异常交易数据监控方法的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311068906.2A CN117372076B (zh) | 2023-08-23 | 2023-08-23 | 一种异常交易数据监控方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311068906.2A CN117372076B (zh) | 2023-08-23 | 2023-08-23 | 一种异常交易数据监控方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117372076A true CN117372076A (zh) | 2024-01-09 |
CN117372076B CN117372076B (zh) | 2024-07-26 |
Family
ID=89401050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311068906.2A Active CN117372076B (zh) | 2023-08-23 | 2023-08-23 | 一种异常交易数据监控方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117372076B (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110029554A1 (en) * | 2009-07-31 | 2011-02-03 | Hitachi, Ltd. | Method and computing system for distributed stream data processing using plural of computers |
US20110145125A1 (en) * | 2009-12-15 | 2011-06-16 | Trading Technologies International, Inc. | System and Methods for Risk-Based Prioritized Transaction Message Flow |
US20120137367A1 (en) * | 2009-11-06 | 2012-05-31 | Cataphora, Inc. | Continuous anomaly detection based on behavior modeling and heterogeneous information analysis |
US20140310149A1 (en) * | 2011-12-23 | 2014-10-16 | Chicago Mercantile Exchange Inc. | Method and apparatus for publishing market information |
CN107589984A (zh) * | 2017-08-18 | 2018-01-16 | 中国人民大学 | 一种事务数据处理方法以及处理器 |
US20180204169A1 (en) * | 2017-01-17 | 2018-07-19 | International Business Machines Corporation | Estimation of node processing capacity for order fulfillment |
US20190079965A1 (en) * | 2017-09-08 | 2019-03-14 | Striim, Inc. | Apparatus and method for real time analysis, predicting and reporting of anomalous database transaction log activity |
CN109509097A (zh) * | 2018-11-27 | 2019-03-22 | 深圳华锐金融技术股份有限公司 | 异常交易行为监控方法、装置、计算机设备及存储介质 |
CN110473084A (zh) * | 2019-07-17 | 2019-11-19 | 中国银行股份有限公司 | 一种异常检测方法和装置 |
CN112348261A (zh) * | 2020-11-09 | 2021-02-09 | 招商银行股份有限公司 | 一种交易量预测方法、设备、装置及存储介质 |
CN113516529A (zh) * | 2021-04-26 | 2021-10-19 | 新东方教育科技集团有限公司 | 异常订单确定方法、装置、存储介质及电子设备 |
CN113688923A (zh) * | 2021-08-31 | 2021-11-23 | 中国平安财产保险股份有限公司 | 订单异常智能检测方法、装置、电子设备及存储介质 |
CN114138865A (zh) * | 2021-11-30 | 2022-03-04 | 平安科技(深圳)有限公司 | 客户投诉数据分析方法、装置、设备及存储介质 |
CN114140248A (zh) * | 2021-12-14 | 2022-03-04 | 重庆忽米网络科技有限公司 | 一种基于ai人工智能技术的异常交易识别方法 |
CN114925808A (zh) * | 2022-04-15 | 2022-08-19 | 北京理工大学 | 一种基于云网端资源中不完整时间序列的异常检测方法 |
CN116166999A (zh) * | 2022-12-08 | 2023-05-26 | 中国平安财产保险股份有限公司 | 异常交易数据识别方法、装置、计算机设备及存储介质 |
CN116308472A (zh) * | 2022-11-23 | 2023-06-23 | 平安银行股份有限公司 | 银行设备的交易量预测方法、装置、设备和存储介质 |
-
2023
- 2023-08-23 CN CN202311068906.2A patent/CN117372076B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110029554A1 (en) * | 2009-07-31 | 2011-02-03 | Hitachi, Ltd. | Method and computing system for distributed stream data processing using plural of computers |
US20120137367A1 (en) * | 2009-11-06 | 2012-05-31 | Cataphora, Inc. | Continuous anomaly detection based on behavior modeling and heterogeneous information analysis |
US20110145125A1 (en) * | 2009-12-15 | 2011-06-16 | Trading Technologies International, Inc. | System and Methods for Risk-Based Prioritized Transaction Message Flow |
US20140310149A1 (en) * | 2011-12-23 | 2014-10-16 | Chicago Mercantile Exchange Inc. | Method and apparatus for publishing market information |
US20180204169A1 (en) * | 2017-01-17 | 2018-07-19 | International Business Machines Corporation | Estimation of node processing capacity for order fulfillment |
CN107589984A (zh) * | 2017-08-18 | 2018-01-16 | 中国人民大学 | 一种事务数据处理方法以及处理器 |
US20190079965A1 (en) * | 2017-09-08 | 2019-03-14 | Striim, Inc. | Apparatus and method for real time analysis, predicting and reporting of anomalous database transaction log activity |
CN109509097A (zh) * | 2018-11-27 | 2019-03-22 | 深圳华锐金融技术股份有限公司 | 异常交易行为监控方法、装置、计算机设备及存储介质 |
CN110473084A (zh) * | 2019-07-17 | 2019-11-19 | 中国银行股份有限公司 | 一种异常检测方法和装置 |
CN112348261A (zh) * | 2020-11-09 | 2021-02-09 | 招商银行股份有限公司 | 一种交易量预测方法、设备、装置及存储介质 |
CN113516529A (zh) * | 2021-04-26 | 2021-10-19 | 新东方教育科技集团有限公司 | 异常订单确定方法、装置、存储介质及电子设备 |
CN113688923A (zh) * | 2021-08-31 | 2021-11-23 | 中国平安财产保险股份有限公司 | 订单异常智能检测方法、装置、电子设备及存储介质 |
CN114138865A (zh) * | 2021-11-30 | 2022-03-04 | 平安科技(深圳)有限公司 | 客户投诉数据分析方法、装置、设备及存储介质 |
CN114140248A (zh) * | 2021-12-14 | 2022-03-04 | 重庆忽米网络科技有限公司 | 一种基于ai人工智能技术的异常交易识别方法 |
CN114925808A (zh) * | 2022-04-15 | 2022-08-19 | 北京理工大学 | 一种基于云网端资源中不完整时间序列的异常检测方法 |
CN116308472A (zh) * | 2022-11-23 | 2023-06-23 | 平安银行股份有限公司 | 银行设备的交易量预测方法、装置、设备和存储介质 |
CN116166999A (zh) * | 2022-12-08 | 2023-05-26 | 中国平安财产保险股份有限公司 | 异常交易数据识别方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117372076B (zh) | 2024-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11477220B2 (en) | Adaptive threshold estimation for streaming data | |
US6834266B2 (en) | Methods for estimating the seasonality of groups of similar items of commerce data sets based on historical sales data values and associated error information | |
CN113487359B (zh) | 基于多模态特征的商品销量预测方法、装置及相关设备 | |
CN108537544A (zh) | 一种交易系统实时监控方法及其监控系统 | |
CN111652654A (zh) | 销量预测及神经网络构建的方法、装置、设备、存储介质 | |
Hand et al. | Prospecting for gems in credit card data | |
US20100257092A1 (en) | System and method for predicting a measure of anomalousness and similarity of records in relation to a set of reference records | |
US12079312B2 (en) | Machine learning outlier detection using weighted histogram-based outlier scoring (W-HBOS) | |
JP2016143334A (ja) | 購買分析装置及び購買分析方法 | |
CN113240518A (zh) | 基于机器学习的银行对公客户流失预测方法 | |
CN112182071B (zh) | 数据关联关系挖掘方法、装置、电子设备及存储介质 | |
JP6366529B2 (ja) | 動線処理システム及び動線処理方法 | |
US20160125337A1 (en) | Transaction derived in-business probability modeling apparatus and method | |
CN103597485A (zh) | 模式提取装置及其方法 | |
CN110991650A (zh) | 训练养卡识别模型、识别养卡行为的方法及装置 | |
CN117372076B (zh) | 一种异常交易数据监控方法、装置、设备及存储介质 | |
CN113962806A (zh) | 金融产品的回测方法及其回测装置、电子设备 | |
CN116610821A (zh) | 一种基于知识图谱的企业风险分析方法、系统和存储介质 | |
CN111177657B (zh) | 需求确定方法、系统、电子设备及存储介质 | |
CN114741617A (zh) | 一种企业财务数据采集分析方法、系统及计算机存储介质 | |
Jethva et al. | Stock analyzer and bot using machine learning | |
Smets et al. | Discovering novelty in spatio/temporal data using one-class support vector machines | |
CN116453141B (zh) | 票据潜客的识别方法、装置和电子设备 | |
CN113887969A (zh) | 一种零售户终端设备使用行为的智能评价方法 | |
CN115809355A (zh) | 用于电子商务管理系统的数据存储方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |