CN114429367A - 异常检测方法、装置、计算机设备和存储介质 - Google Patents
异常检测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN114429367A CN114429367A CN202210059717.8A CN202210059717A CN114429367A CN 114429367 A CN114429367 A CN 114429367A CN 202210059717 A CN202210059717 A CN 202210059717A CN 114429367 A CN114429367 A CN 114429367A
- Authority
- CN
- China
- Prior art keywords
- store
- target
- data
- probability distribution
- passenger flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种异常检测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据;根据进店客流以及历史交易行为数据,计算目标店铺的预测交易资源数据的概率分布特征;根据预测交易资源数据的概率分布特征以及上报交易资源数据,计算目标店铺的异常概率;如果异常概率满足预设异常条件,则确定目标店铺为异常店铺。本发明实施例所提供的方法,可以通过多种手段采集店铺的交易数据,数据较为完整,可以准确掌握店铺的交易数据,通过统计分布的方式预估店铺的异常概率的方式来及时地判断该店铺是否存在异常。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种异常检测方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的快速发展,各种与互联网技术相关的支付手段的应用越来越广泛。相关技术可以通过智能终端采集各店铺的销售资源数据,与店铺主动上报的销售资源数据进行比较,从而确定上报销售资源数据存在异常的店铺。
相关技术中,智能终端是接入到POS(Point of sales,销售点)终端与打印机之间,在目标对象要求打印小票的情况下,智能终端可以自动获取消费资源数据,完成销售资源数据的统计。但是,随着支付手段越来越多,而智能终端的采集方式较为单一,导致销售资源数据的缺失率较高,查找异常店铺的准确性较差。
发明内容
基于此,有必要针对上述技术问题,提供一种能够准确查找异常店铺的异常检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种异常检测方法。所述方法包括:
获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据;
根据所述进店客流以及所述历史交易行为数据,计算所述目标店铺的预测交易资源数据的概率分布特征;
根据所述预测交易资源数据的概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率;
如果所述异常概率满足预设异常条件,则确定所述目标店铺为异常店铺。
在其中一个实施例中,在所述历史交易行为数据包括所述目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数的情况下,所述根据所述进店客流以及所述历史交易行为数据,计算所述目标店铺的预测交易资源数据的概率分布特征,包括:
根据所述目标店铺的进店客流、所述目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数,计算所述目标店铺的预测交易资源数据的概率分布函数、期望以及方差,所述概率分布函数、所述期望以及所述方差为所述概率分布特征。
在其中一个实施例中,在所述历史交易行为数据包括所述进店客流在目标区域的行为数据以及所述进店客流的平均消费资源的概率分布函数,所述目标区域包括多个店铺的情况下,所述根据所述进店客流以及所述历史交易行为数据,计算所述目标店铺的预测交易资源数据的概率分布特征,包括:
将所述目标店铺的进店客流以及所述进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到所述目标店铺的预测消费数量;
根据所述预测消费数量以及所述平均消费资源的概率分布函数,计算所述目标店铺的预测交易资源数据的概率分布函数、期望以及方差,所述概率分布函数、所述期望以及所述方差为所述概率分布特征。
在其中一个实施例中,所述进店客流包括至少一个目标对象;
所述将所述目标店铺的进店客流以及所述进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到所述目标店铺的预测消费数量,包括:
将所述目标店铺的进店客流以及所述进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到所述进店客流中各目标对象的预测消费概率;
对所述进店客流中各目标对象的预测消费概率进行求和处理,得到所述目标店铺的预测消费数量。
在其中一个实施例中,在所述历史交易行为数据包括所述目标店铺的转化率的概率分布函数、平均消费资源的概率分布函数、以及所述进店客流在目标区域的行为数据的情况下,所述目标店铺的预测交易资源数据的概率分布特征包括根据所述转化率的概率分布函数和平均消费资源的概率分布函数得到的第一概率分布特征,以及根据所述进店客流在目标区域的行为数据和所述平均消费资源的概率分布函数得到的第二概率分布特征。
在其中一个实施例中,所述根据所述预测交易资源数据的概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率,包括:
对所述第一概率分布特征和所述第二概率分布特征进行加权计算,得到合并概率分布特征;
根据所述合并概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率。
在其中一个实施例中,所述异常概率包括所述第一概率分布特征对应的第一异常概率,以及所述第二概率分布特征对应的第二异常概率;所述如果所述异常概率满足预设异常条件,则确定所述目标店铺为异常店铺,包括:
如果所述第一异常概率满足预设异常条件,且所述第二异常概率满足预设异常条件,则确定所述目标店铺为异常店铺。
在其中一个实施例中,所述方法还包括:
获取训练数据,所述训练数据包括所述目标店铺的样本进店客流的样本行为特征数据以及所述样本进店客流的样本消费标注数据;
将所述样本进店客流的样本行为特征数据输入至待训练的消费预测模型,得到所述样本进店客流对应的预测消费数据;
根据所述样本消费标注数据以及预测消费数据,计算损失值;
根据所述损失值更新所述待训练的消费预测模型的网络参数,并返回执行所述获取训练数据的步骤,直到所述损失值满足预设训练完成条件,得到训练完成的消费预测模型。
在其中一个实施例中,在所述获取训练数据的步骤之前,所述方法还包括:
获取所述样本进店客流在目标区域的行为数据以及所述样本进店客流在目标店铺的样本视频数据;
对所述样本进店客流在目标区域的行为数据进行特征提取处理,得到所述样本进店客流对应的样本行为特征数据;
对所述样本进店客流在目标店铺的样本视频数据进行标注,得到所述样本进店客流的样本消费标注数据。
第二方面,本申请还提供了一种异常检测装置。所述装置包括:
获取模块,用于获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据;
第一计算模块,用于根据所述进店客流以及所述历史交易行为数据,计算所述目标店铺的预测交易资源数据的概率分布特征;
第二计算模块,用于根据所述预测交易资源数据的概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率;
确定模块,用于如果所述异常概率满足预设异常条件,则确定所述目标店铺为异常店铺。
在其中一个实施例中,在所述历史交易行为数据包括所述目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数的情况下,所述第一计算模块具体用于:
根据所述目标店铺的进店客流、所述目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数,计算所述目标店铺的预测交易资源数据的概率分布函数、期望以及方差,所述概率分布函数、所述期望以及所述方差为所述概率分布特征。
在其中一个实施例中,在所述历史交易行为数据包括所述进店客流在目标区域的行为数据以及所述进店客流的平均消费资源的概率分布函数,所述目标区域包括多个店铺的情况下,所述第一计算模块还具体用于:
将所述目标店铺的进店客流以及所述进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到所述目标店铺的预测消费数量;
根据所述预测消费数量以及所述平均消费资源的概率分布函数,计算所述目标店铺的预测交易资源数据的概率分布函数、期望以及方差,所述概率分布函数、所述期望以及所述方差为所述概率分布特征。
在其中一个实施例中,所述进店客流包括至少一个目标对象;
所述第一计算模块还具体用于:
将所述目标店铺的进店客流以及所述进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到所述进店客流中各目标对象的预测消费概率;
对所述进店客流中各目标对象的预测消费概率进行求和处理,得到所述目标店铺的预测消费数量。
在其中一个实施例中,在所述历史交易行为数据包括所述目标店铺的转化率的概率分布函数、平均消费资源的概率分布函数、以及所述进店客流在目标区域的行为数据的情况下,所述目标店铺的预测交易资源数据的概率分布特征包括根据所述转化率的概率分布函数和平均消费资源的概率分布函数得到的第一概率分布特征,以及根据所述进店客流在目标区域的行为数据和所述平均消费资源的概率分布函数得到的第二概率分布特征。
在其中一个实施例中,所述第二计算模块具体用于:
对所述第一概率分布特征和所述第二概率分布特征进行加权计算,得到合并概率分布特征;
根据所述合并概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率。
在其中一个实施例中,所述异常概率包括所述第一概率分布特征对应的第一异常概率,以及所述第二概率分布特征对应的第二异常概率;所述确定模块具体用于:
如果所述第一异常概率满足预设异常条件,且所述第二异常概率满足预设异常条件,则确定所述目标店铺为异常店铺。
在其中一个实施例中,所述装置还包括:
训练模块,用于获取训练数据,所述训练数据包括所述目标店铺的样本进店客流的样本行为特征数据以及所述样本进店客流的样本消费标注数据;
输入模块,用于将所述样本进店客流的样本行为特征数据输入至待训练的消费预测模型,得到所述样本进店客流对应的预测消费数据;
损失值计算模块,用于根据所述样本消费标注数据以及预测消费数据,计算损失值;
更新模块,用于根据所述损失值更新所述待训练的消费预测模型的网络参数,并返回执行所述获取训练数据的步骤,直到所述损失值满足预设训练完成条件,得到训练完成的消费预测模型。
在其中一个实施例中,所述装置还包括:
样本数据模块,用于获取所述样本进店客流在目标区域的行为数据以及所述样本进店客流在目标店铺的样本视频数据;
特征提取模块,用于对所述样本进店客流在目标区域的行为数据进行特征提取处理,得到所述样本进店客流对应的样本行为特征数据;
标注模块,用于对所述样本进店客流在目标店铺的样本视频数据进行标注,得到所述样本进店客流的样本消费标注数据。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据;
根据所述进店客流以及所述历史交易行为数据,计算所述目标店铺的预测交易资源数据的概率分布特征;
根据所述预测交易资源数据的概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率;
如果所述异常概率满足预设异常条件,则确定所述目标店铺为异常店铺。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据;
根据所述进店客流以及所述历史交易行为数据,计算所述目标店铺的预测交易资源数据的概率分布特征;
根据所述预测交易资源数据的概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率;
如果所述异常概率满足预设异常条件,则确定所述目标店铺为异常店铺。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据;
根据所述进店客流以及所述历史交易行为数据,计算所述目标店铺的预测交易资源数据的概率分布特征;
根据所述预测交易资源数据的概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率;
如果所述异常概率满足预设异常条件,则确定所述目标店铺为异常店铺。
上述异常检测方法、装置、计算机设备、存储介质和计算机程序产品,通过获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据;根据进店客流以及历史交易行为数据,计算目标店铺的预测交易资源数据的概率分布特征;根据预测交易资源数据的概率分布特征以及上报交易资源数据,计算目标店铺的异常概率;如果异常概率满足预设异常条件,则确定目标店铺为异常店铺。本发明实施例所提供的方法,可以通过多种手段采集店铺的交易数据,数据较为完整,可以准确掌握店铺的交易数据,通过统计分布的方式预估店铺的异常概率的方式来及时地判断该店铺是否存在异常。
附图说明
图1为一个实施例中异常检测方法的流程示意图;
图2为一个实施例中计算预测交易资源数据步骤的流程示意图;
图3为另一个实施例中计算预测交易资源数据步骤的流程示意图;
图4为一个实施例中计算异常概率步骤的流程示意图;
图5为一个实施例中训练模型步骤的流程示意图;
图6为一个实施例中得到训练数据步骤的流程示意图;
图7为一个实施例中异常检测系统的示意图;
图8为一个实施例中异常检测装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
各项目的交易资源数据审核一直是商管集团的工作重点之一,而无法掌控店铺准确的交易资源数据会对目标区域内的扣点租金的收取造成影响,也是城市公司营运的长期痛点。如何以有效手段监控店铺,尤其是扣点为主的店铺的交易资源数据掌控成为业务高优需求。
当前在交易资源数据审核时存在三大痛点:首先是审核方式单一,目前以商家手工上报,运营手工审核为主,工作量大,管理方式较为粗放;其次是审核准确性不高:由于支付方式的多元性和分散性,单纯依靠POS收银系统,很难看出商家账目问题,需要结合多种手段交叉验证;最后是取证难:只有pos和上报数据,关键数据的缺失,导致很难有完整的证据作为博弈的有力支撑。
智能终端是接入到POS(Point of sales,销售点)终端与打印机之间,在目标对象要求打印小票的情况下,智能终端可以自动获取消费资源数据,完成销售资源数据的统计。但是,随着支付手段越来越多,而智能终端的采集方式较为单一,导致销售资源数据的缺失率较高,查找异常店铺的准确性较差。
在一个实施例中,如图1所示,提供了一种异常检测方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现,上述终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,该异常检测方法包括以下步骤:
步骤102,获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据。
具体地,目标店铺可以是任意类型的店铺;进店客流是访问过目标店铺的总人数,终端可以通过商业智能系统(Business Intelligence,BI)获取该进店客流,例如可以获取目标时间段内访问过目标店铺的总人数,终端可以根据实际应用场景的需求确定目标时间段的具体时长。历史交易行为数据是在预设时间段内,与用户在目标店铺进行交易相关的数据,包括目标店铺的交易数据以及用户在目标店铺以及该目标的店铺所属于的目标区域的行为数据,预设时间段可以是指定时间段,例如可以是指定24小时内、指定一个月内、指定一个季度内或者是指定一年内等等。上报交易资源数据是目标店铺的管理人员上报至终端的该目标店铺的交易资源数据(销售额)。
可选地,预设时间段早于目标时间段。
步骤104,根据进店客流以及历史交易行为数据,计算目标店铺的预测交易资源数据的概率分布特征。
具体地,历史交易行为数据包括用于计算目标店铺的进店客流中交易预测人数的数据以及目标店铺的平均消费资源的概率分布函数,这样,终端可以根据目标店铺的进店客流中交易预测人数以及目标店铺的平均消费资源的概率分布函数,计算目标店铺的预测交易资源数据的概率分布特征。平均消费资源的概率分布函数是price~N(u2,σ2),其中,u2表示目标店铺的平均消费资源,σ2表示目标店铺的平均消费资源的标准差,目标店铺的平均消费资源在一定的范围内变动。
可选地,用于计算目标店铺的进店客流中交易预测人数的数据可以包括该目标店铺的转换率的概率分布函数。这样,终端可以通过目标店铺的进店客流以及该目标店铺的转换率的概率分布函数,计算目标店铺的进店客流中交易预测人数,这样,终端根据目标店铺的进店客流中交易预测人数以及目标店铺的平均消费资源的概率分布函数,计算目标店铺的预测交易资源数据的概率分布特征。目标店铺的转换率的概率分布函数是rate~N(u1,σ1),其中,u1表示目标店铺的转化率,σ1表示目标店铺的转化率的标准差,目标店铺的转化率在一定的范围内变动。
可选地,用于计算目标店铺的进店客流中交易预测人数的数据可以包括进店客流在目标区域的行为数据,其中,目标区域中可以包含多个目标店铺,进店客流中包含多个目标对象。进店客流在目标区域的行为数据是进店客流中的各个目标对象在目标区域内的行为数据。
这样,终端根据进店客流在目标区域的行为数据、预先训练的消费预测模型以及目标店铺的进店客流,计算目标店铺的进店客流中交易预测人数。这样,终端根据目标店铺的进店客流中交易预测人数以及目标店铺的平均消费资源的概率分布函数,计算目标店铺的预测交易资源数据的概率分布特征。
步骤106,根据预测交易资源数据的概率分布特征以及上报交易资源数据,计算目标店铺的异常概率。
具体地,预测交易资源数据的概率分布特征包括预测资源交易数据的概率分布函数、期望以及方差。终端可以通过预设的概率计算算法,根据预设交易资源数据的概率分布特征以及目标店铺的上报交易资源数据,得到该目标店铺的预测交易资源数据与上报交易资源数据相一致的概率,即异常概率。
举例来说,标准差可以是10,那么通过预设的概率计算算法可以得到,理论的预测交易资源数据是在80-120之间波动。如果客户的上报交易资源数据是50,则终端可以通过查概率表以及python的cipy.stats计算方法等方式,计算在(100,10)这个参数下,gmv<=50的概率。如果这个概率很小,小于预设概率阈值(符合预设的异常条件),则说明上报交易资源数据明显偏小,则可以确定目标店铺是异常店铺。
步骤108,如果异常概率满足预设异常条件,则确定目标店铺为异常店铺。
具体地,预设异常条件可以是异常概率小于预设概率阈值,该预设概率阈值可以是终端根据实际应用场景具体确定的。这样,终端可以将异常概率小于预设概率阈值的目标店铺,确定为异常店铺,也就是存在上报交易资源数与该店铺的实际交易资源数据不相符,存在瞒报、漏报等风险的异常店铺。
上述异常检测方法中,结合获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据;根据进店客流以及历史交易行为数据,计算目标店铺的预测交易资源数据的概率分布特征;根据预测交易资源数据的概率分布特征以及上报交易资源数据,计算目标店铺的异常概率;如果异常概率满足预设异常条件,则确定目标店铺为异常店铺。本发明实施例所提供的方法,可以通过多种手段采集店铺的交易数据,数据较为完整,可以准确掌握店铺的交易数据,通过统计分布的方式预估店铺的异常概率的方式来及时地判断该店铺是否存在异常。
在一个实施例中,在历史交易行为数据包括目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数的情况下,步骤104“根据进店客流以及历史交易行为数据,计算目标店铺的预测交易资源数据的概率分布特征”的具体处理过程,包括:
根据目标店铺的进店客流、目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数,计算目标店铺的预测交易资源数据的概率分布函数、期望以及方差,概率分布函数、期望以及方差为概率分布特征。
具体地,各个目标店铺的转化率的概率分布函数,可以根据历史时间段内各个目标店铺的进店客流以及统计得到的该历史时间段内的进行交易的人数得到。目标店铺在不同的时间段内转化率的分布函数也可以不同,例如上午时间段与下午时间段,工作日时间段与非工作日时间段等等。终端可以根据目标店铺的进店客流所对应的统计时间段,确定与该统计时间段一致的时间段内的转换率的概率分布函数。平均消费资源的概率分布函数与转化率的概率分布函数类似,在此不再赘述。
具体地,转化率是目标店铺的进店客流(traffic)中会进行交易的人群比例,转化率的概率分布函数是rate~N(u1,σ1),其中,u1表示目标店铺的转化率,σ1表示目标店铺的转化率的标准差。平均消费资源是目标店铺在统计时间段内每个目标对象的交易平均资源数值,平均消费资源的概率分布函数是price~N(u2,σ2),其中,u2表示目标店铺的平均消费资源,σ2表示目标店铺的平均消费资源的标准差。
可选地,进店客流(traffic)通过目标区域预先设置的BI系统或第三方BI系统或其他人数统计方式来获取到的。
具体地,根据目标店铺的进店客流、目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数,计算目标店铺的预测交易资源数据的概率分布函数、期望以及方差,目标店铺的预测交易资源数据的概率分布特征包括概率分布函数、期望以及方差。
例如,可以通过以下公式计算预测交易资源数据(gmv):
gmv=进店客流x转化率x平均消费资源。
例如,可以通过以下公式计算目标店铺的预测交易资源数据(Gross MerchandiseVolume,gmv)的期望E(gmv)以及方差Var(gmv):
E(gmv)=traffic*u1*u2,,
其中,E(gmv)是目标店铺的预测交易资源数据的期望,Var(gmv)是目标店铺的预测交易资源数据的方差,traffic是目标店铺的进店客流,即目标店铺的实际进店人数,u1是转化率,u2是目标店铺的平均消费资源(即,客单价)。σ1是转化率的标准差,σ2是客单价的标准差。
本实施例中,通过目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数以及进店客流,能够达到准确计算目标店铺的预测交易资源数据的概率分布特征的效果。
在一个实施例中,在历史交易行为数据包括进店客流在目标区域的行为数据以及进店客流的平均消费资源的概率分布函数,目标区域包括多个店铺的情况下,具体地,针对于每一目标对象,该进店客流在目标区域的行为数据包括该目标对象在目标区域内的每一店铺内的停留时间数据、该目标对象是否存在多次(如,2次)进入目标店铺的数据、该目标对象进入目标店铺的时间段与店铺闭店时间的距离数据、目标对象在目标区域的游览时长数据以及该目标对象是否访问与目标店铺相同业态的其他店铺的数据等等。
相应地,如图2所示,步骤104“根据进店客流以及历史交易行为数据,计算目标店铺的预测交易资源数据的概率分布特征”的具体处理过程,包括:
步骤202,将目标店铺的进店客流以及进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到目标店铺的预测消费数量。
具体地,进店客流在目标区域的行为数据是进店客流中各目标对象在目标区域的行为数据的集合。终端可以将目标店铺的进店客流中各目标对象在目标区域的行为数据输入至预先训练的消费预测模型,得到目标店铺的进店客流在目标店铺的预测消费数量,即预测消费人数的数量。
步骤204,根据预测消费数量以及平均消费资源的概率分布函数,计算目标店铺的预测交易资源数据的概率分布函数、期望以及方差。
其中,概率分布函数、期望以及方差为概率分布特征。
具体地,根据目标店铺的进店客流、目标店铺的预测消费数量以及平均消费资源的概率分布函数,计算目标店铺的预测交易资源数据的概率分布函数、期望以及方差。
例如,可以通过以下公式计算目标店铺的预测交易资源数据(gmv):
GMV=预测消费数量*平均消费资源。
例如,可以通过以下公式计算目标店铺的预测交易资源数据(Gross MerchandiseVolume,gmv)的期望E(gmv)以及方差Var(gmv):
E(gmv)=u3*u2
其中,u3是预测消费数量的期望,u2是平均消费资源。σ3是预测消费数量的标准差,σ2是平均消费资源的标准差。
在一个实施例中,由于进店客流统计的是在一段时间内进入目标店铺的人流数量,因此,目标店铺的进店客流包括至少一个目标对象。相应地,如图3所示,步骤202“将目标店铺的进店客流以及进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到目标店铺的预测消费数量”,包括:
步骤302,将目标店铺的进店客流以及进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到进店客流中各目标对象的预测消费概率。
具体地,预先训练的消费预测模型输出的是进店客流中各目标对象会在目标店铺的消费概率值,即预测消费概率。
步骤304,对进店客流中各目标对象的预测消费概率进行求和处理,得到目标店铺的预测消费数量。
具体地,终端可以对消费预测模型输出的进店客流中各目标对象的预测消费概率进行求和处理,得到该目标店铺的预测消费数量。
在一个实施例中,在历史交易行为数据包括目标店铺的转化率的概率分布函数、平均消费资源的概率分布函数、以及进店客流在目标区域的行为数据的情况下,目标店铺的预测交易资源数据的概率分布特征包括根据转化率的概率分布函数和平均消费资源的概率分布函数得到的第一概率分布特征,以及根据进店客流在目标区域的行为数据和平均消费资源的概率分布函数得到的第二概率分布特征。
在一个实施例中,如图4所示,步骤106“根据预测交易资源数据的概率分布特征以及上报交易资源数据,计算目标店铺的异常概率”的具体处理过程,包括:
步骤402,对第一概率分布特征和第二概率分布特征进行加权计算,得到合并概率分布特征。
具体地,第一概率分布特征包括第一预测交易资源数据的第一概率分布函数、第一期望以及第一方差,该第一概率分布特征是根据转化率的概率分布函数以及平均消费资源的概率分布函数得到的。第二概率分布特征包括第二预测交易资源数据的第二概率分布函数、第二期望以及第二方差,该第二概率分布特征是根据进店客流在目标区域的行为数据、预先训练的消费预测模型以及平均消费资源的概率分布函数得到的。
终端可以根据预先设置的第一概率分布特征对应的第一权重以及第二概率分布特征对应的第二权重,分别对第一概率分布函数以及第二概率分布函数进行加权计算,得到合并概率分布函数;终端通过类似的过程,得到合并期望以及合并方差,即合并概率分布特征。例如可以通过以下公式表示:
gmv(策略i)~N(ui,σi)。
其中,策略i表示通过第i种策略计算预测交易资源数据。ui表示通过第i种策略得到的预测交易资源数据的期望值;σi表示通过第i种策略得到的预测交易资源数据的标准差。
步骤404,根据合并概率分布特征以及上报交易资源数据,计算目标店铺的异常概率。
具体地,预测交易资源数据的合并概率分布特征包括预测资源交易数据的合并概率分布函数、合并期望以及合并方差。终端可以通过预设的概率计算算法,根据预设交易资源数据的合并概率分布特征以及目标店铺的上报交易资源数据,得到该目标店铺的预测交易资源数据是上报交易资源数据相一致的概率,即异常概率。
在一个实施例中,异常概率包括第一概率分布特征对应的第一异常概率,以及第二概率分布特征对应的第二异常概率。
相应地,步骤108“如果异常概率满足预设异常条件,则确定目标店铺为异常店铺”的具体处理过程,包括:如果第一异常概率满足预设异常条件,且第二异常概率满足预设异常条件,则确定目标店铺为异常店铺。
本实施例中,通过不同的方式分别计算目标店铺的预测交易资源数据,并通过多种方法同时判断目标店铺是否为异常店铺,能够达到对目标店铺进行双重验证的效果,使异常检测结果更加准确、可信度更高。
在一个实施例中,如图5所示,该异常检测方法还包括:
步骤502,获取训练数据。
其中,训练数据包括目标店铺的样本进店客流的样本行为特征数据以及样本进店客流的样本消费标注数据。
具体地,终端可以获取目标店铺在历史时间段内的样本进店客流的样本行为特征数据以及样本进店客流的样本消费标注数据。样本进店客流可以是历史时间段对目标店铺进行访问过的目标对象,样本进店客流的样本消费标注数据可以是根据历史时间段内的视频图像数据确定的样本进店客流中各目标对象在走出目标店铺后,是否存在消费的标识。例如可以是通过该目标对象是否提袋来判断的。
也就是说,终端获取历史时间段内访问目标店铺的进店客流中各目标对象的样本行为特征数据,该样本行为特征数据包括该目标对象在目标区域内的每一店铺内的停留时间数据、该目标对象是否存在多次(如,2次)进入目标店铺的数据、该目标对象进入目标店铺的时间段与店铺闭店时间的距离数据、目标对象在目标区域的游览时长数据以及该目标对象是否访问与目标店铺相同业态的其他店铺的数据等等。样本进店客流的样本消费标注数据是该样本进店客流中各目标对象是否有消费的标识信息。
步骤504,将样本进店客流的样本行为特征数据输入至待训练的消费预测模型,得到样本进店客流对应的预测消费数据。
步骤506,根据样本消费标注数据以及预测消费数据,计算损失值。
步骤508,根据损失值更新待训练的消费预测模型的网络参数,并返回执行获取训练数据的步骤,直到损失值满足预设训练完成条件,得到训练完成的消费预测模型。
本实施例中,通过对不同目标店铺分别进行消费预测模型的训练,可以得到反映线下进店客流的真实交易行为的消费预测模型,符合各种不同业态的真实交易情况,模型的输出结果更真实,更准确。
在一个实施例中,如图6所示,该异常检测方法还包括:
步骤602,获取样本进店客流在目标区域的行为数据以及样本进店客流在目标店铺的样本视频数据。
步骤604,对样本进店客流在目标区域的行为数据进行特征提取处理,得到样本进店客流对应的样本行为特征数据。
步骤606,对样本进店客流在目标店铺的样本视频数据进行标注,得到样本进店客流的样本消费标注数据。
以下,如图7所示,结合一详细实施例,详细描述上述异常检测方法的具体实现过程:
其中异常识别系统涉及的主要模块包括:input模块、策略预估模块、业务规则模块以及输出模块。其中:input模块是目标店铺的上报交易数据,即客户上报交易数据。策略预估模块,包括多个预估策略分别对应的GMV预估单元,其中:
第一个预估策略对应的GMV预估单元可以是:GMV=进店客流x转化率x客单价。
具体地,进店客流可以通过BI系统获取到准确的进店人数,转化率表示的是是进店人群中有交易的人群比例,客单价是衡量该店铺一段时间内的平均每人的成交价格。进店客流可以通过目标区域预先设置的BI系统或者是第三方BI系统、或者是其他人数计数方式来获取到的。假设统计时间范围内的客流为traffic。目标店铺的转化率会在一个大致的范围内进行波动,统计时间范围对应的历史时间段的转化率的概率分布函数可以是rate~N(u1,σ1);平均消费资源(客单价)受到进店人群或者时间因素等的影响,在一定的范围内变动。统计时间范围对应的历史时间段的平均消费资源的概率分布函数可以是price~N(u2,σ2)。
这样,通过以下公式计算目标店铺的预测交易资源数据的概率分布函数、期望以及方差:
GMV=进店客流x转化率x客单价,
E(gmv)=troffic*u1*u2
这样,根据目标店铺的预测交易资源数据的概率分布函数,终端可以针对客户上报的交易额进行异常检测,终端可以计算在给定预测交易资源数据的期望和方差的条件下,预测交易资源数据<=上报交易资源数据的概率。即:
P(gmv<=用户实际上报额|E(gmv),Var(gmv))。
也就是说,终端根据预测交易资源数据的概率分布函数,可以计算上报交易资源数据符合预测交易资源数据的概率分布函数的概率。
第二个预估策略对应的GMV预估单元可以是:GMV=估计提袋数*客单价。
通过以下公式计算目标店铺的预测交易资源数据的概率分布函数、期望以方差:
E(gmv)=u3*u2
其中,u3是估计提袋数(预测消费数量)的期望,u2是客单价。σ3是估计提袋数的标准差,σ2是客单价的标准差。
这样,根据目标店铺的预测交易资源数据的概率分布函数,终端可以针对客户上报的交易额进行异常检测,终端可以计算在给定预测交易资源数据的期望和方差的条件下,预测交易资源数据<=上报交易资源数据的概率。即:
P(gmv<=用户实际上报额|E(gmv),Var(gmv))。
举例来说,终端得到的目标店铺的预测交易资源数据的期望可以是100,标准差可以是10,那么通过预设的概率计算算法可以得到,理论的预测交易资源数据是在80-120之间波动。如果客户的上报交易资源数据是50,则终端可以通过查概率表以及python的cipy.stats计算方法等方式,计算在(100,10)这个参数下,gmv<=50的概率。如果这个概率很小,小于预设概率阈值(符合预设的异常条件),则说明上报交易资源数据明显偏小,则可以确定目标店铺是异常店铺。
其中,估计提袋数是根据消费预测模型(机器学习模型)得到的。
具体地,标注人员可以在终端上,通过视频信息标注每名目标对象走出店铺后是否有提袋,得到标注数据;根据客流数据(目标对象在线下商场的行为数据)构建行为特征,包括该目标对象在目标区域内的每一店铺内的停留时间数据、该目标对象是否存在多次(如,2次)进入目标店铺的数据、该目标对象进入目标店铺的时间段与店铺闭店时间的距离数据、目标对象在目标区域的游览时长数据以及该目标对象是否访问与目标店铺相同业态的其他店铺的数据等等。样本进店客流的样本消费标注数据是该样本进店客流中各目标对象是否有消费的标识信息;终端可以通过上述的客流数据,进行数据预处理,提取出其行为特征数据。
将标注数据与行为特征数据进行合并,构建训练集,设定任务为预测进入每家店铺的目标对象是否会提袋,然后用机器学习模型进行训练,在满足预设的训练完成条件的情况下,得到训练完成的消费预测模型(提袋预估模型)。
预测时,消费预测模型(提袋预估模型)输出每个进入店铺的目标对象的提袋的概率值,将概率值相加得到目标店铺的预测消费数量(预估提袋数)。
该异常检测系统还包括策略融合模块,可以对通过不同策略得到的目标店铺的预测交易资源数据进行合并。
可选地,终端可以结果投票方式,对每种策略识别结果取交集,即多个策略均认为目标店铺是异常店铺,才确定目标店铺是异常店铺。
可选地,终端可以通过模型融合策略方式,确定目标店铺是否为异常店铺。终端得到每种策略对应的目标店铺的预测交易资源数据的期望和方差。终端可以对每种策略对应的目标店铺的预测交易资源数据的期望和方差分别进行加权平均计算,得到合并策略的加权后分布的期望和方差,根据加权后分布的期望和方差计算目标店铺的异常概率,判断该异常概率是否符合预设异常条件。
该异常检测系统还包括业务规则模块。
其中,可以通过上报与明细数据对比的方式判断目标店铺是否为异常店铺。
GMV=sum(明细汇总),
由于在目标区域内中对于通过pos机交易的记录是会直接记录到crm系统的,通过对crm系统上的明细的交易数据汇总可以得到该店铺在某周期内的总的交易额,与上报gmv对比。如果上报gmv<交易金额汇总,则该店铺为异常店铺。。
另外,还可以通过成本侧对比的方式判断目标店铺是否为异常店铺。成本侧对比主要是指通过店铺经营的租金、水电费、税费、人工成本等来计算能保证该店铺营收平衡的最低销售额下限。
另外,有些店铺在和商场签订租约合同时,约定最低的保底销售额,还可以通过连续多次没达到保底销售额来判断目标店铺是否为异常店铺。
也就是说,异常检测系统可以通过输出模块输出目标区域年内可能存在异常的店铺、以及该异常店铺的置信度等辅助判断数据。
本实施例所述的异常检测方法可以通过策略识别和业务规则方式,进行双重验证,能让识别结果更加可信;在策略识别方面,面对的是无监督结果,对于真实的交易额是未知。通过统计分布的方式估计风险率来进行识别;在模型层面,考虑线下客流的真实行为,如停留时长、进店数等等,按照不同业态进行单独建模,使模型输出结果更准确。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的异常检测方法的异常检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个异常检测装置实施例中的具体限定可以参见上文中对于异常检测方法的限定,在此不再赘述。
在一个实施例中,如图8所示,提供了一种异常检测装置700,包括:获取模块701、第一计算模块702、第二计算模块703和确定模块704,其中:
获取模块701,用于获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据。
第一计算模块702,用于根据进店客流以及历史交易行为数据,计算目标店铺的预测交易资源数据的概率分布特征。
第二计算模块703,用于根据预测交易资源数据的概率分布特征以及上报交易资源数据,计算目标店铺的异常概率。
确定模块704,用于如果异常概率满足预设异常条件,则确定目标店铺为异常店铺。
在其中一个实施例中,在所述历史交易行为数据包括所述目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数的情况下,所述第一计算模块具体用于:
根据所述目标店铺的进店客流、所述目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数,计算所述目标店铺的预测交易资源数据的概率分布函数、期望以及方差,所述概率分布函数、所述期望以及所述方差为所述概率分布特征。
在其中一个实施例中,在所述历史交易行为数据包括所述进店客流在目标区域的行为数据以及所述进店客流的平均消费资源的概率分布函数,所述目标区域包括多个店铺的情况下,所述第一计算模块还具体用于:
将所述目标店铺的进店客流以及所述进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到所述目标店铺的预测消费数量;
根据所述预测消费数量以及所述平均消费资源的概率分布函数,计算所述目标店铺的预测交易资源数据的概率分布函数、期望以及方差,所述概率分布函数、所述期望以及所述方差为所述概率分布特征。
在其中一个实施例中,所述进店客流包括至少一个目标对象;
所述第一计算模块还具体用于:
将所述目标店铺的进店客流以及所述进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到所述进店客流中各目标对象的预测消费概率;
对所述进店客流中各目标对象的预测消费概率进行求和处理,得到所述目标店铺的预测消费数量。
在其中一个实施例中,在所述历史交易行为数据包括所述目标店铺的转化率的概率分布函数、平均消费资源的概率分布函数、以及所述进店客流在目标区域的行为数据的情况下,所述目标店铺的预测交易资源数据的概率分布特征包括根据所述转化率的概率分布函数和平均消费资源的概率分布函数得到的第一概率分布特征,以及根据所述进店客流在目标区域的行为数据和所述平均消费资源的概率分布函数得到的第二概率分布特征。
在其中一个实施例中,所述第二计算模块具体用于:
对所述第一概率分布特征和所述第二概率分布特征进行加权计算,得到合并概率分布特征;
根据所述合并概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率。
在其中一个实施例中,所述异常概率包括所述第一概率分布特征对应的第一异常概率,以及所述第二概率分布特征对应的第二异常概率;所述确定模块具体用于:
如果所述第一异常概率满足预设异常条件,且所述第二异常概率满足预设异常条件,则确定所述目标店铺为异常店铺。
在其中一个实施例中,所述装置还包括:
训练模块,用于获取训练数据,所述训练数据包括所述目标店铺的样本进店客流的样本行为特征数据以及所述样本进店客流的样本消费标注数据;
输入模块,用于将所述样本进店客流的样本行为特征数据输入至待训练的消费预测模型,得到所述样本进店客流对应的预测消费数据;
损失值计算模块,用于根据所述样本消费标注数据以及预测消费数据,计算损失值;
更新模块,用于根据所述损失值更新所述待训练的消费预测模型的网络参数,并返回执行所述获取训练数据的步骤,直到所述损失值满足预设训练完成条件,得到训练完成的消费预测模型。
在其中一个实施例中,所述装置还包括:
样本数据模块,用于获取所述样本进店客流在目标区域的行为数据以及所述样本进店客流在目标店铺的样本视频数据;
特征提取模块,用于对所述样本进店客流在目标区域的行为数据进行特征提取处理,得到所述样本进店客流对应的样本行为特征数据;
标注模块,用于对所述样本进店客流在目标店铺的样本视频数据进行标注,得到所述样本进店客流的样本消费标注数据。
上述异常检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储确定是否为异常店铺的相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常检测方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种异常店铺的检测方法,其特征在于,所述方法包括:
获取目标店铺的进店客流、历史交易行为数据以及上报交易资源数据;
根据所述进店客流以及所述历史交易行为数据,计算所述目标店铺的预测交易资源数据的概率分布特征;
根据所述预测交易资源数据的概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率;
如果所述异常概率满足预设异常条件,则确定所述目标店铺为异常店铺。
2.根据权利要求1所述的方法,其特征在于,在所述历史交易行为数据包括所述目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数的情况下,所述根据所述进店客流以及所述历史交易行为数据,计算所述目标店铺的预测交易资源数据的概率分布特征,包括:
根据所述目标店铺的进店客流、所述目标店铺的转化率的概率分布函数以及平均消费资源的概率分布函数,计算所述目标店铺的预测交易资源数据的概率分布函数、期望以及方差,计算出的概率分布函数、期望以及方差为所述概率分布特征。
3.根据权利要求1所述的方法,其特征在于,在所述历史交易行为数据包括所述进店客流在目标区域的行为数据以及所述进店客流的平均消费资源的概率分布函数,所述目标区域包括多个店铺的情况下,所述根据所述进店客流以及所述历史交易行为数据,计算所述目标店铺的预测交易资源数据的概率分布特征,包括:
将所述目标店铺的进店客流以及所述进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到所述目标店铺的预测消费数量;
根据所述预测消费数量以及所述平均消费资源的概率分布函数,计算所述目标店铺的预测交易资源数据的概率分布函数、期望以及方差,计算出的概率分布函数、期望以及方差为所述概率分布特征。
4.根据权利要求3所述的方法,其特征在于,所述进店客流包括至少一个目标对象;
所述将所述目标店铺的进店客流以及所述进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到所述目标店铺的预测消费数量,包括:
将所述目标店铺的进店客流以及所述进店客流在目标区域的行为数据,输入至预先训练的消费预测模型,得到所述进店客流中各目标对象的预测消费概率;
对所述进店客流中各目标对象的预测消费概率进行求和处理,得到所述目标店铺的预测消费数量。
5.根据权利要求1-4任一项所述的方法,其特征在于,在所述历史交易行为数据包括所述目标店铺的转化率的概率分布函数、平均消费资源的概率分布函数、以及所述进店客流在目标区域的行为数据的情况下,所述目标店铺的预测交易资源数据的概率分布特征包括根据所述转化率的概率分布函数和平均消费资源的概率分布函数得到的第一概率分布特征,以及根据所述进店客流在目标区域的行为数据和所述平均消费资源的概率分布函数得到的第二概率分布特征。
6.根据权利要求5所述的方法,其特征在于,所述根据所述预测交易资源数据的概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率,包括:
对所述第一概率分布特征和所述第二概率分布特征进行加权计算,得到合并概率分布特征;
根据所述合并概率分布特征以及所述上报交易资源数据,计算所述目标店铺的异常概率。
7.根据权利要求5所述的方法,其特征在于,所述异常概率包括所述第一概率分布特征对应的第一异常概率,以及所述第二概率分布特征对应的第二异常概率;所述如果所述异常概率满足预设异常条件,则确定所述目标店铺为异常店铺,包括:
如果所述第一异常概率满足预设异常条件,且所述第二异常概率满足预设异常条件,则确定所述目标店铺为异常店铺。
8.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取训练数据,所述训练数据包括所述目标店铺的样本进店客流的样本行为特征数据以及所述样本进店客流的样本消费标注数据;
将所述样本进店客流的样本行为特征数据输入至待训练的消费预测模型,得到所述样本进店客流对应的预测消费数据;
根据所述样本消费标注数据以及预测消费数据,计算损失值;
根据所述损失值更新所述待训练的消费预测模型的网络参数,并返回执行所述获取训练数据的步骤,直到所述损失值满足预设训练完成条件,得到训练完成的消费预测模型。
9.根据权利要求8所述的方法,其特征在于,在所述获取训练数据的步骤之前,所述方法还包括:
获取所述样本进店客流在目标区域的行为数据以及所述样本进店客流在目标店铺的样本视频数据;
对所述样本进店客流在目标区域的行为数据进行特征提取处理,得到所述样本进店客流对应的样本行为特征数据;
对所述样本进店客流在目标店铺的样本视频数据进行标注,得到所述样本进店客流的样本消费标注数据。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210059717.8A CN114429367A (zh) | 2022-01-19 | 2022-01-19 | 异常检测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210059717.8A CN114429367A (zh) | 2022-01-19 | 2022-01-19 | 异常检测方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114429367A true CN114429367A (zh) | 2022-05-03 |
Family
ID=81313587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210059717.8A Pending CN114429367A (zh) | 2022-01-19 | 2022-01-19 | 异常检测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114429367A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116611796A (zh) * | 2023-07-20 | 2023-08-18 | 广州淘通科技股份有限公司 | 一种店铺交易数据的异常检测方法及装置 |
-
2022
- 2022-01-19 CN CN202210059717.8A patent/CN114429367A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116611796A (zh) * | 2023-07-20 | 2023-08-18 | 广州淘通科技股份有限公司 | 一种店铺交易数据的异常检测方法及装置 |
CN116611796B (zh) * | 2023-07-20 | 2024-06-07 | 广州淘通科技股份有限公司 | 一种店铺交易数据的异常检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11281969B1 (en) | Artificial intelligence system combining state space models and neural networks for time series forecasting | |
CN108133013B (zh) | 信息处理方法、装置、计算机设备和存储介质 | |
WO2020226937A1 (en) | System and method for determining credit and issuing a business loan using tokens and machine learning | |
CN108876133A (zh) | 基于业务信息的风险评估处理方法、装置、服务器和介质 | |
CN112163963B (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
WO2020024718A1 (zh) | 外汇交易量预测方法和装置 | |
US11361335B2 (en) | Machine learning engine for demand-based pricing | |
CN110992097A (zh) | 营收产品价格的处理方法、装置、计算机设备及存储介质 | |
Li et al. | Credit scoring by incorporating dynamic networked information | |
JP2023546849A (ja) | 通貨市場において証券を予想、推奨、および売買するための機械学習 | |
WO2021077226A1 (en) | Method and system for individual demand forecasting | |
Qian et al. | Short-term demand forecasting for on-demand mobility service | |
Tanaka | Firm heterogeneity and FDI in distribution services | |
CN114429367A (zh) | 异常检测方法、装置、计算机设备和存储介质 | |
Jiang et al. | Intertemporal pricing via nonparametric estimation: Integrating reference effects and consumer heterogeneity | |
CN110796379B (zh) | 业务渠道的风险评估方法、装置、设备及存储介质 | |
AU2020443019A1 (en) | Systems, computer-implemented methods and computer programs for capital management | |
CN117273800A (zh) | 营销策略生成方法、装置、设备及存储介质 | |
US20240161117A1 (en) | Trigger-Based Electronic Fund Transfers | |
CN116664306A (zh) | 风控规则的智能推荐方法、装置、电子设备及介质 | |
CN110910241A (zh) | 现金流评估方法、装置、服务器设备及存储介质 | |
CN115719275A (zh) | 基于交易数据的风险监测方法及装置、电子设备 | |
US11838170B1 (en) | Messaging segmentation based on data flow informatics | |
US20240029153A1 (en) | Trade and Mobility Data-driven Credit Performance Prediction | |
US20240257135A1 (en) | System and method for risk evaluation for store transactions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |