CN116611796A - 一种店铺交易数据的异常检测方法及装置 - Google Patents
一种店铺交易数据的异常检测方法及装置 Download PDFInfo
- Publication number
- CN116611796A CN116611796A CN202310889825.2A CN202310889825A CN116611796A CN 116611796 A CN116611796 A CN 116611796A CN 202310889825 A CN202310889825 A CN 202310889825A CN 116611796 A CN116611796 A CN 116611796A
- Authority
- CN
- China
- Prior art keywords
- value
- data
- store
- transaction data
- sales
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 33
- 238000004364 calculation method Methods 0.000 claims abstract description 46
- 230000002159 abnormal effect Effects 0.000 claims abstract description 40
- 230000005856 abnormality Effects 0.000 claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 28
- 230000004044 response Effects 0.000 claims description 27
- 235000013305 food Nutrition 0.000 claims description 13
- 238000003491 array Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 7
- 230000000007 visual effect Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 8
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种店铺交易数据的异常检测方法及装置,所述方法适用于线上平台,所述方法包括:在获取店铺的交易数据和商品类型信息后,基于商品类型从预设数据库中查找店铺的特征数据;基于交易数据和商品类型信息确定特征数据的计算权重值;采用计算权重值计算店铺的特征评分值,当特征评分值大于评分阈值时,确定交易数据为异常数据。本发明可以在确定店铺商品的售货单量和商品类型后采集店铺的交易特征数据,根据售货单量和商品类型给不同的交易特征数据分配对应的计算权重值并进行综合计算,根据计算结果确定店铺及其数据是否有异常;既可以降低出错概率以提升检测与核对的精度,又可以减少处理的工作量,提高核算的处理效率。
Description
技术领域
本发明涉及线上平台异常数据检测的技术领域,尤其涉及一种店铺交易数据的异常检测方法及装置。
背景技术
随着各种线上交易平台普及与相关的支付手段的应用快速发展,越来越多商家在线上开设店铺进行线上交易和售货,以拓展其商业版图。
由于线上交易平台的各种约束规范暂不完善,所以电商平台的刷单行为比较严重,严重危害了网络市场平衡。因此在线上交易后,线上平台需要汇总和统计交易数据,通过分析数据来确定店铺交易是否有异常。目前常用的方法是从支付系统或线上商家中提取交易数据,再通过人工逐一将交易数据和后台的货物出入库数据进行核对,以确定商家的线上操作是否异常或者是否存在恶意刷单的情况。
但目前常用的方法有如下技术问题:随着支付手段越来越多,需要采集不同支付系统的数据并进行整合和汇总,再通过人工方式逐一对汇总后的数据进行核对。由于核对的数据量较大,且人工核对容易出错,导致核对的准确率较低,难以满足现有的核对需求。
发明内容
本发明提出一种店铺交易数据的异常检测方法及装置,所述方法可以在确定店铺商品的售货单量和商品类型后采集店铺的交易特征数据,根据售货单量和商品类型给不同的交易特征数据分配对应的计算权重值并进行综合计算,根据计算结果确定店铺及其数据是否有异常;一方面降低出错概率以提升检测与核对的精度,另一方面可以减少处理的工作量,提高核算的处理效率。
本发明实施例的第一方面提供了一种店铺交易数据的异常检测方法,所述方法适用于线上平台,所述方法包括:
在获取店铺的交易数据和商品类型信息后,基于所述商品类型从预设数据库中查找店铺的特征数据;
基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值;
采用所述计算权重值计算店铺的特征评分值,当所述特征评分值大于评分阈值时,确定所述交易数据为异常数据。
在第一方面的一种可能的实现方式中,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、商品原价及折扣价、商品运输时长和错发漏发投诉率;
所述基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值,包括:
若所述商品类型信息为食品类型,按照所述食品类型提取若干个参考单量,每个所述参考单量为不同销售榜单的销售平均单量;
计算所述销售单量与每个所述参考单量的差值,并筛选数值最小的差值对应销售榜单的商家信息;
分别计算所述商家信息与所述特征数据的词性匹配值,并以所述词性匹配值为所述特征数据的计算权重值。
在第一方面的一种可能的实现方式中,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、客服评分及响应速度、物流评分和错发漏发投诉率;
所述基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值,包括:
若所述商品类型信息为消费品类型,按照预设的时间间隔将所述销售单量划分成多个单量数组;
利用所述多个单量数组转换成单量密度分布曲线,并计算所述单量密度分布曲线最高点对应的分布比例值;
按照所述消费品类型分别查找所述店铺所在平台的综合评分、所述客服评分及响应速度、所述物流评分和所述错发漏发投诉率对应的计算比例值,将所述分布比例值与每个所述计算比例值相乘得到计算权重值。
在第一方面的一种可能的实现方式中,所述交易数据包括销售单量,店铺所在平台的综合评分、客服评分及响应速度、物流评分和退货退款数量;
所述基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值,包括:
若所述商品类型信息为服装类型,分别获取所述店铺所在平台的综合评分、所述客服评分及响应速度、所述物流评分和所述退货退款数量对应的销量区间值;
若所述销售单量在所述销量区间值内,则计算所述销量区间值的平均值,将所述销量区间值的平均值与预设的第一区间阈值相乘得到所述特征数据的计算权重值;
若所述销售单量大于所述销量区间值的最大值,则将所述销售单量与预设的第二区间阈值相乘得到所述特征数据的计算权重值;
若所述销售单量小于所述销量区间值的最小值,则将所述销售单量与预设的第三区间阈值相乘得到所述特征数据的计算权重值。
在第一方面的一种可能的实现方式中,在所述基于所述商品类型从预设数据库中查找店铺的特征数据的步骤后,所述方法还包括:
若所述销售单量小于所述特征数据包含的店铺评分数量时,则确定所述交易数据为异常数据。
在第一方面的一种可能的实现方式中,所述采用所述计算权重值计算店铺的特征评分值,包括:
采用所述特征数据内每个数据的占比值,得到特征占比值;
将每个所述特征占比值与对应的计算权重值相乘,并将每个乘积相加得到特征评分值。
在第一方面的一种可能的实现方式中,在所述确定所述交易数据为异常数据的步骤后,所述方法还包括:
将所述异常数据对应的店铺信息添加至预设的异常信息列表中,并按照所述异常数据进行可视化标注。
本发明实施例的第二方面提供了一种店铺交易数据的异常检测装置,所述装置适用于线上平台,所述装置包括:
查找特征数据模块,用于在获取店铺的交易数据和商品类型信息后,基于所述商品类型从预设数据库中查找店铺的特征数据;
确定计算权重模块,用于基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值;
异常检测模块,用于采用所述计算权重值计算店铺的特征评分值,当所述特征评分值大于评分阈值时,确定所述交易数据为异常数据。
相比于现有技术,本发明实施例提供的一种店铺交易数据的异常检测方法及装置,其有益效果在于:本发明可以在确定店铺商品的售货单量和商品类型后采集店铺的交易特征数据,根据售货单量和商品类型给不同的交易特征数据分配对应的计算权重值并进行综合计算,根据计算结果确定店铺及其数据是否有异常;既可以降低出错概率以提升检测与核对的精度,又可以减少处理的工作量,提高核算的处理效率。
附图说明
图1是本发明一实施例提供的一种店铺交易数据的异常检测方法的流程示意图;
图2是本发明一实施例提供的一种店铺交易数据的异常检测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
但目前常用的方法有如下技术问题:随着支付手段越来越多,需要采集不同支付系统的数据并进行整合和汇总,再通过人工方式逐一对汇总后的数据进行核对。由于核对的数据量较大,且人工核对容易出错,导致核对的准确率较低,难以满足现有的核对需求。
为了解决上述问题,下面将通过以下具体的实施例对本申请实施例提供的一种店铺交易数据的异常检测方法进行详细介绍和说明。
参照图1,示出了本发明一实施例提供的一种店铺交易数据的异常检测方法的流程示意图。
在一实施例中,所述方法适用于线上交易平台,该平台提供了不同的商铺或给不同商户运营其商铺。例如,x宝、x东等。
其中,作为示例的,所述店铺交易数据的异常检测方法,可以包括:
S11、在获取店铺的交易数据和商品类型信息后,基于所述商品类型从预设数据库中查找店铺的特征数据。
在一实施例中,交易数据可以是商铺进行商品交易的相关数据,例如,销量、销售时间、销售价格等等。商品类型信息可以是商铺所销量的商品的类型,例如食品、电子产品、服装等等。
不同的商品对应有不同的特征数据,特征数据可以是商品交易或销售时的相关数据,也可以是商品交易或销售后,客户反馈的数据。
在一实施例中,用户可以通过其智能终端与线上平台通信,可以通过其智能终端向线上平台发送检测请求。线上平台响应后,用户再通过其智能终端向线上平台发送所要检测的店铺的交易数据和商品类型信息。
在一实施例中,获取店铺的交易数据和商品类型信息后,可以获取商品类型信息的编号,该编号可以是用户预先设定的,不同的编号可以对应不同类型,如001对应食品、002对应电子产品等等。线上平台可以设置不同的存储区域存储不同的数据,不同的编号可以对应不同的数据存储区域。
接着,可以按照商品类型信息的编号在对应的存储区域中提取对应的特征数据。
具体地,用户可以在检测请中添加其所要提取的特征数据的种类,当线上平台获取商品类型信息后,可以基于商品类型信息的编号在对应存储区域内提取的用户所要的种类的数据,得到特征数据。
S12、基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值。
在一实施例中,不同的交易数据和商品类型信息,对应的特征数据不同。而不同的特征数据其计算的权重也不同,因此,需要结合交易数据和商品类型信息的具体内容,再给特征数据所包含的每个种类的数据分配计算权重,从而能根据其计算权重值进行后续计算。
在一可选的实施例中,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、商品原价及折扣价、商品运输时长和错发漏发投诉率;
在本实施例中,销售单量为店铺销售商品的成交单量;店铺所在平台的综合评分是指多个买家用户在店铺进行评分后,多个评分的平均值;商品原价及折扣价是店铺销售的商品的价格,若是原价出售则商品原价及折扣价是原价,若是折扣价出售则是折扣价;商品运输时长是商品的运输时长;错发漏发投诉率是某一时段内投诉店铺的买家用户数量与某一时段内店铺的买家用户数量的比值。
其中,作为示例的,步骤S12可以包括以下子步骤:
S21、若所述商品类型信息为食品类型,按照所述食品类型提取若干个参考单量,每个所述参考单量为不同销售榜单的销售平均单量。
S22、计算所述销售单量与每个所述参考单量的差值,并筛选数值最小的差值对应销售榜单的排序条件,得到排序条件信息。
S23、分别计算所述排序条件信息与所述店铺评分数量、所述客服评分数量、所述物流评分数量和所述投诉数量的词性匹配值,并以所述词性匹配值为所述特征数据的计算权重值。
在一实施例中,若商品类型信息为食品类型,说明店铺销售的商品是食品。可以获取多个不同销售榜单,每个销售榜单是按照不同评价标准的榜单,榜单内的店铺销售的食品相同。例如,榜单是优惠商家榜单、好评优先榜单、距离优先榜单、销量优先榜单等。
每个榜单的商铺销售的商品相同,可以以此作为参考数量进行后续的权重分配计算。
在一实施例中,可以获取每个榜单内前10个商铺的商品销售量,然后计算10个商品销售量的平均值,以该平均值作为这个榜单的参考单量。
接着可以计算销售单量与每个参考单量的差值。假如,榜单有3个,分别为好评优先榜单、距离优先榜单、销量优先榜单。对应的参考单量有3个,可以计算销售单量与3个参考单量的差值,得到3个差值。从3个差值中筛选数值最小的差值,以该数值最小的差值对应的榜单为筛选得到的榜单,然后获取该榜单的排序标准。假如筛选得到的榜单为好评优先榜单,则可以获取该榜单内任意一个商家的商家信息。
可选地,可以获取该榜单前10个商家内任意一个商家的商家信息,也可以获取该榜单内排第一的商家的信息。
然后可以分别计算商家信息与店铺所在平台的综合评分、商品原价及折扣价、商品运输时长和错发漏发投诉率的词性匹配值,并以词性匹配值为计算权重值。
例如,可以根据词性计算该商家信息中店铺评分数量与特征数据的店铺评分数量的数据匹配值,以该匹配值为店铺评分数量的计算权重值;可以根据词性计算该商家信息中商品单价与特征数据的商品单价的数据匹配值。
具体可以调用预设的神经网络计算两个相似度,以此作为匹配值,从而得到对应的计算权重值。
在一可选的实施例中,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、客服评分及响应速度、物流评分和错发漏发投诉率;
在本实施例中,销售单量为店铺销售商品的成交单量;店铺所在平台的综合评分是指多个买家用户在店铺进行评分后,多个评分的平均值;客服评分及响应速度是店铺的人工客服对买家进行评分后向买家提供反馈的反应时长与预设的单位时长的比值,以这两个时长的比值作为响应速率;物流评分是买家用户对商品运输物流进行评分;错发漏发投诉率是某一时段内投诉店铺的买家用户数量与某一时段内店铺的买家用户数量的比值。
其中,作为示例的,步骤S12可以包括以下子步骤:
S31、若所述商品类型信息为消费品类型,按照预设的时间间隔将所述销售单量划分成多个单量数组。
S32、利用所述多个单量数组转换成单量密度分布曲线,并计算所述单量密度分布曲线最高点对应的分布比例值。
S33、按照所述消费品类型分别查找所述店铺所在平台的综合评分、所述客服评分及响应速度、所述物流评分和所述错发漏发投诉率对应的计算比例值,将所述分布比例值与每个所述计算比例值相乘得到计算权重值。
在一实施例中,若商品类型信息为消费品类型,说明店铺销售的商品是消费品,该消费品可以是电子消费品或医疗消费品或家居消费品等等。
由于商品类型信息为消费品类型,用户购买的数量及较多,且购买的用户数量也较多,为了综合多个用户的购买数量,在本实施例中,销售数量可以是一端时间的销售数量,例如,一个月或一个季度。
然后按照预设的时间间隔将销售单量划分成多个单量数组,每个单量数组对应一个时间间隔。例如,销售数量可以是3月份的销售数量,预设的时间间隔可以一天,则可以以天为单位将3月份的销售数量划分为31个单量数组,每个单量数组为一天的销售量。
接着,可以以单量为纵坐标,以时间为横坐标,构建一个坐标轴,将各个单量数组作为坐标点添加在坐标轴内,并将各个坐标点连接在一起,形成单量密度分布曲线。再从单量密度分布曲线提取最高点的值,以该数值为分布比例值。
然后可以按照消费品类型在预设的数据库中分别查找店铺所在平台的综合评分、客服评分及响应速度、物流评分和错发漏发投诉率对应的计算比例值。该计算比例值是在先一次对相同的消费品类型的特征数据进行计算时用户设定的数值。该计算比例值也可以是对在先相同的消费品类型的特征数据进行一定比例的转换后得到的数值。计算比例值也可以根据实际需要进行调整。
例如,所述店铺所在平台的综合评分对应的计算比例值为0.1;所述客服评分及响应速度对应的计算比例值为0.2;所述物流评分对应的计算比例值为0.3;所述错发漏发投诉率对应的计算比例值为0.4;分布比例值为10;将分布比例值与每个计算比例值相乘,分别得到1、2、3、4,得到4个计算权重值。
在一可选的实施例中,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、客服评分及响应速度、物流评分和退货退款数量;
在本实施例中,销售单量为店铺销售商品的成交单量;店铺所在平台的综合评分是指多个买家用户在店铺进行评分后,多个评分的平均值;客服评分及响应速度是店铺的人工客服对买家进行评分后向买家提供反馈的反应时长与预设的单位时长的比值,以这两个时长的比值作为响应速率;物流评分是买家用户对商品运输物流进行评分;退货退款数量是买家用户要求退回商品或者要求退款的数量。
其中,作为示例的,步骤S12可以包括以下子步骤:
S41、若所述商品类型信息为服装类型,分别获取所述店铺所在平台的综合评分、所述客服评分及响应速度、所述物流评分和所述退货退款数量对应的销量区间值。
S42、若所述销售单量在所述销量区间值内,则计算所述销量区间值的平均值,将所述销量区间值的平均值与预设的第一区间阈值相乘得到所述特征数据的计算权重值。
S43、若所述销售单量大于所述销量区间值的最大值,则将所述销售单量与预设的第二区间阈值相乘得到所述特征数据的计算权重值。
S44、若所述销售单量小于所述销量区间值的最小值,则将所述销售单量与预设的第三区间阈值相乘得到所述特征数据的计算权重值。
在一实施例中,若商品类型信息为服装类型,说明店铺销售的商品是服装,该服装可以是男装和女装。
在一实施例中,销量区间值可以是用户预先设定的销量区间值。
在一可选的实施例中,销量区间值也可以线上平台内服装类型相关店铺对其进行排序后,计算得到的区间值。例如,以店铺评分高低对服装类型相关店铺进行排序,然后取榜单中间10间店铺的销售量作为一个区间段,得到店铺所在平台的综合评分对应的销量区间值。
同理,客服评分及响应速度的销量区间值,可以以客服响应速率的高低对服装类型相关店铺进行排序,然后取榜单中间10间店铺的销售量作为一个区间段,得到客服评分及响应速度对应的销量区间值。
接着可以分别判断销售单量是否在店铺评分数量对应的销量区间值;销售单量是否在客服评分数量对应的销量区间值;销售单量是否在物流评分数量对应的销量区间值;销售单量是否在投诉数量对应的销量区间值。
若销售单量在销量区间值,说明其销量与特征数量的中位区间的店铺的效率相同,可以将销量区间值的平均值与预设的第一区间阈值相乘得到该特征数据的计算权重值。
若销售单量大于销量区间值的最大值,则将销售单量与预设的第二区间阈值相乘得到特征数据的计算权重值。
若销售单量小于销量区间值的最小值,则将销售单量与预设的第三区间阈值相乘得到特征数据的计算权重值。
其中,区间阈值可以根据实际需要进行调整。每个特征数据的区间阈值可以相同也可以不同。
例如,销售单量为20,店铺所在平台的综合评分的销量区间值为15-25,其对应的第一区间阈值、第二区间阈值和第三区间阈值分别为1、3和0.5。
销售单量为20在销量区间值为15-25内,则其对应的计算权重为1*20=20。
在一可选的实施例中,不同商品类型的所述特征数据均包括店铺所在平台的综合评分,该数量是店铺在销售商品后,其买家用户对该店铺进行评分的数量。而每个买家用户在购买商品后可能对商品进行评分可能不评分,可以以评分数量作为一个异常检测的条件,确定是否有恶意评论或刷单好评的情况。
其中,作为示例的,在步骤S11后,所述方法还可以包括以下步骤:
若所述销售单量小于所述特征数据包含的店铺评分数量时,则确定所述交易数据为异常数据。
在具体实现时,若销售单量小于特征数据包含的店铺评分数量时,评分的数量还大于销售的单量,说明可能存在恶意刷好评的情况,可以确定交易数据为异常数据,该店铺可能存在恶意刷好评的情况。
S13、采用所述计算权重值计算店铺的特征评分值,当所述特征评分值大于评分阈值时,确定所述交易数据为异常数据。
在确定计算权重值后,可以基于计算权重值和特征数据的数量计算店铺的特征评分值,如果特征评分值大于评分阈值时,则可以确定交易数据为异常数据。其中,评分阈值可以根据实际需要进行调整。
在一实施例中,步骤S3可以包括以下子步骤:
S131、采用所述特征数据内每个数据的占比值,得到特征占比值。
S132、将每个所述特征占比值与对应的计算权重值相乘,并将每个乘积相加得到特征评分值。
具体地,可以计算特征数据中每个数据在多个数据的占比值,然后将该占比值与其对应的计算权重相乘,最后将各个乘积相加得到特征评分值。
在其中一种的实施例中,所述特征数据包括:店铺评分数量、客服评分数量、物流评分数量和投诉数量,对应的,所述特征评分值的计算如下式所示:
上式中,C为特征评分值,Pi为店铺评分数量,Pk为客服评分数量,Pl为物流评分数量,Pj为投诉数量,Ai为店铺评分数量的计算权重值,Ak为客服评分数量的计算权重值,Al为物流评分数量的计算权重值,Aj为投诉数量的计算权重值。
又例如,所述特征数据包括:店铺评分数量、商品单价、商品运输时长和投诉数量;所述特征评分值的计算也可以如上式所示,其中,C为特征评分值,Pi为店铺评分数量,Pk为商品单价,Pl为商品运输时长,Pj为投诉数量,Ai为店铺评分数量的计算权重值,Ak为商品单价的计算权重值,Al为商品运输时长的计算权重值,Aj为投诉数量的计算权重值。
需要说明的是,在计算时可以直接代入数值进行计算。若是时长,则可以直接代入时长的数量,例如,时长是的单位是天,商品运输时长是3天,则直接代入3进行计算。
在确定异常的交易数据以及店铺后,为了方便用户查看异常的店铺,其中,作为示例的,所述方法还可以包括:
S14、将所述异常数据对应的店铺信息添加至预设的异常信息列表中,并按照所述异常数据进行可视化标注。
具体地,具体地,可以将异常数据对应的店铺信息至预设的异常信息列表内,该预设的异常信息列表罗列多个异常数据对应的店铺信息,并记录了每次异常检测的时间以及店铺的相关内容。
为了方便用户查看,可以将不同的异常数据进行高亮标注,最后再可视化展示在平台的界面或屏幕中,供用户查看。
在本实施例中,本发明实施例提供了一种店铺交易数据的异常检测方法,其有益效果在于:本发明可以在确定店铺商品的售货单量和商品类型后采集店铺的交易特征数据,根据售货单量和商品类型给不同的交易特征数据分配对应的计算权重值并进行综合计算,根据计算结果确定店铺及其数据是否有异常;既可以降低出错概率以提升检测与核对的精度,又可以减少处理的工作量,提高核算的处理效率。
本发明实施例还提供了一种店铺交易数据的异常检测装置,参见图2,示出了本发明一实施例提供的一种店铺交易数据的异常检测装置的结构示意图。
所述装置适用于线上平台,其中,作为示例的,所述店铺交易数据的异常检测装置可以包括:
查找特征数据模块201,用于在获取店铺的交易数据和商品类型信息后,基于所述商品类型从预设数据库中查找店铺的特征数据;
确定计算权重模块202,用于基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值;
异常检测模块203,用于采用所述计算权重值计算店铺的特征评分值,当所述特征评分值大于评分阈值时,确定所述交易数据为异常数据。
可选地,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、商品原价及折扣价、商品运输时长和错发漏发投诉率;
所述确定计算权重模块,还用于:
若所述商品类型信息为食品类型,按照所述食品类型提取若干个参考单量,每个所述参考单量为不同销售榜单的销售平均单量;
计算所述销售单量与每个所述参考单量的差值,并筛选数值最小的差值对应销售榜单的商家信息;
分别计算所述商家信息与所述特征数据的词性匹配值,并以所述词性匹配值为所述特征数据的计算权重值。
可选地,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、客服评分及响应速度、物流评分和错发漏发投诉率;
所述确定计算权重模块,还用于:
若所述商品类型信息为消费品类型,按照预设的时间间隔将所述销售单量划分成多个单量数组;
利用所述多个单量数组转换成单量密度分布曲线,并计算所述单量密度分布曲线最高点对应的分布比例值;
按照所述消费品类型分别查找所述店铺所在平台的综合评分、所述客服评分及响应速度、所述物流评分和所述错发漏发投诉率对应的计算比例值,将所述分布比例值与每个所述计算比例值相乘得到计算权重值。
可选地,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、客服评分及响应速度、物流评分和退货退款数量;
所述确定计算权重模块,还用于:
若所述商品类型信息为服装类型,分别获取所述店铺所在平台的综合评分、所述客服评分及响应速度、所述物流评分和所述退货退款数量对应的销量区间值;
若所述销售单量在所述销量区间值内,则计算所述销量区间值的平均值,将所述销量区间值的平均值与预设的第一区间阈值相乘得到所述特征数据的计算权重值;
若所述销售单量大于所述销量区间值的最大值,则将所述销售单量与预设的第二区间阈值相乘得到所述特征数据的计算权重值;
若所述销售单量小于所述销量区间值的最小值,则将所述销售单量与预设的第三区间阈值相乘得到所述特征数据的计算权重值。
可选地,所述装置还包括:
确定异常模块,用于若所述销售单量小于所述特征数据包含的店铺评分数量时,则确定所述交易数据为异常数据。
可选地,所述异常检测模块,还用于:
采用所述特征数据内每个数据的占比值,得到特征占比值;
将每个所述特征占比值与对应的计算权重值相乘,并将每个乘积相加得到特征评分值。
可选地,所述装置还包括:
信息添加模块,用于将所述异常数据对应的店铺信息添加至预设的异常信息列表中,并按照所述异常数据进行可视化标注。
所属技术领域的技术人员可以清楚地了解到,为方便的描述和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
进一步的,本申请实施例还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例所述的店铺交易数据的异常检测方法。
进一步的,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行如上述实施例所述的店铺交易数据的异常检测方法。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种店铺交易数据的异常检测方法,其特征在于,所述方法适用于线上平台,所述方法包括:
在获取店铺的交易数据和商品类型信息后,基于所述商品类型从预设数据库中查找店铺的特征数据;
基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值;
采用所述计算权重值计算店铺的特征评分值,当所述特征评分值大于评分阈值时,确定所述交易数据为异常数据。
2.根据权利要求1所述的店铺交易数据的异常检测方法,其特征在于,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、商品原价及折扣价、商品运输时长和错发漏发投诉率;
所述基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值,包括:
若所述商品类型信息为食品类型,按照所述食品类型提取若干个参考单量,每个所述参考单量为不同销售榜单的销售平均单量;
计算所述销售单量与每个所述参考单量的差值,并筛选数值最小的差值对应销售榜单的商家信息;
分别计算所述商家信息与所述特征数据的词性匹配值,并以所述词性匹配值为所述特征数据的计算权重值。
3.根据权利要求1所述的店铺交易数据的异常检测方法,其特征在于,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、客服评分及响应速度、物流评分和错发漏发投诉率;
所述基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值,包括:
若所述商品类型信息为消费品类型,按照预设的时间间隔将所述销售单量划分成多个单量数组;
利用所述多个单量数组转换成单量密度分布曲线,并计算所述单量密度分布曲线最高点对应的分布比例值;
按照所述消费品类型分别查找所述店铺所在平台的综合评分、所述客服评分及响应速度、所述物流评分和所述错发漏发投诉率对应的计算比例值,将所述分布比例值与每个所述计算比例值相乘得到计算权重值。
4.根据权利要求1所述的店铺交易数据的异常检测方法,其特征在于,所述交易数据包括销售单量,所述特征数据包括:店铺所在平台的综合评分、客服评分及响应速度、物流评分和退货退款数量;
所述基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值,包括:
若所述商品类型信息为服装类型,分别获取所述店铺所在平台的综合评分、所述客服评分及响应速度、所述物流评分和所述退货退款数量对应的销量区间值;
若所述销售单量在所述销量区间值内,则计算所述销量区间值的平均值,将所述销量区间值的平均值与预设的第一区间阈值相乘得到所述特征数据的计算权重值;
若所述销售单量大于所述销量区间值的最大值,则将所述销售单量与预设的第二区间阈值相乘得到所述特征数据的计算权重值;
若所述销售单量小于所述销量区间值的最小值,则将所述销售单量与预设的第三区间阈值相乘得到所述特征数据的计算权重值。
5.根据权利要求2-4任意一项所述的店铺交易数据的异常检测方法,其特征在于,在所述基于所述商品类型从预设数据库中查找店铺的特征数据的步骤后,所述方法还包括:
若所述销售单量小于所述特征数据包含的店铺评分数量时,则确定所述交易数据为异常数据。
6.根据权利要求2-4任意一项所述的店铺交易数据的异常检测方法,其特征在于,所述采用所述计算权重值计算店铺的特征评分值,包括:
采用所述特征数据内每个数据的占比值,得到特征占比值;
将每个所述特征占比值与对应的计算权重值相乘,并将每个乘积相加得到特征评分值。
7.根据权利要求1所述的店铺交易数据的异常检测方法,其特征在于,在所述确定所述交易数据为异常数据的步骤后,所述方法还包括:
将所述异常数据对应的店铺信息添加至预设的异常信息列表中,并按照所述异常数据进行可视化标注。
8.一种店铺交易数据的异常检测装置,其特征在于,所述装置适用于线上平台,所述装置包括:
查找特征数据模块,用于在获取店铺的交易数据和商品类型信息后,基于所述商品类型从预设数据库中查找店铺的特征数据;
确定计算权重模块,用于基于所述交易数据和所述商品类型信息确定所述特征数据的计算权重值;
异常检测模块,用于采用所述计算权重值计算店铺的特征评分值,当所述特征评分值大于评分阈值时,确定所述交易数据为异常数据。
9.一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述的店铺交易数据的异常检测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行如权利要求1-7任意一项所述的店铺交易数据的异常检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310889825.2A CN116611796B (zh) | 2023-07-20 | 2023-07-20 | 一种店铺交易数据的异常检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310889825.2A CN116611796B (zh) | 2023-07-20 | 2023-07-20 | 一种店铺交易数据的异常检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116611796A true CN116611796A (zh) | 2023-08-18 |
CN116611796B CN116611796B (zh) | 2024-06-07 |
Family
ID=87685732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310889825.2A Active CN116611796B (zh) | 2023-07-20 | 2023-07-20 | 一种店铺交易数据的异常检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116611796B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116542693A (zh) * | 2023-05-06 | 2023-08-04 | 徐州大成环境科技有限公司 | 一种基于物联网的建筑材料销售管理系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108573432A (zh) * | 2018-04-23 | 2018-09-25 | 重庆南米电子商务有限公司 | 用于电子商务的交易监管系统和方法 |
CN110365672A (zh) * | 2019-07-09 | 2019-10-22 | 葛晓滨 | 一种电子商务异常攻击的检测方法 |
CN113469789A (zh) * | 2021-07-01 | 2021-10-01 | 易纳购科技(北京)有限公司 | 异常订单的检测方法、装置及计算机设备 |
CN114429367A (zh) * | 2022-01-19 | 2022-05-03 | 北京爱笔科技有限公司 | 异常检测方法、装置、计算机设备和存储介质 |
CN114626899A (zh) * | 2022-05-13 | 2022-06-14 | 南京铋悠数据技术有限公司 | 基于大数据的产品销售数据采集方法和系统 |
CN115146729A (zh) * | 2022-07-11 | 2022-10-04 | 北京爱笔科技有限公司 | 异常店铺识别方法、装置、计算机设备和存储介质 |
-
2023
- 2023-07-20 CN CN202310889825.2A patent/CN116611796B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108573432A (zh) * | 2018-04-23 | 2018-09-25 | 重庆南米电子商务有限公司 | 用于电子商务的交易监管系统和方法 |
CN110365672A (zh) * | 2019-07-09 | 2019-10-22 | 葛晓滨 | 一种电子商务异常攻击的检测方法 |
CN113469789A (zh) * | 2021-07-01 | 2021-10-01 | 易纳购科技(北京)有限公司 | 异常订单的检测方法、装置及计算机设备 |
CN114429367A (zh) * | 2022-01-19 | 2022-05-03 | 北京爱笔科技有限公司 | 异常检测方法、装置、计算机设备和存储介质 |
CN114626899A (zh) * | 2022-05-13 | 2022-06-14 | 南京铋悠数据技术有限公司 | 基于大数据的产品销售数据采集方法和系统 |
CN115146729A (zh) * | 2022-07-11 | 2022-10-04 | 北京爱笔科技有限公司 | 异常店铺识别方法、装置、计算机设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116542693A (zh) * | 2023-05-06 | 2023-08-04 | 徐州大成环境科技有限公司 | 一种基于物联网的建筑材料销售管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116611796B (zh) | 2024-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108573432B (zh) | 用于电子商务的交易监管系统和方法 | |
CN108038696B (zh) | 基于设备标识码和社交群组信息的刷单检测方法及系统 | |
US20100169174A1 (en) | Methods and apparatus to determine the effects of trade promotions on competitive products | |
CN110443687B (zh) | 一种基于大数据的电子商务平台 | |
CN116611796B (zh) | 一种店铺交易数据的异常检测方法及装置 | |
CN111768243A (zh) | 销量预测方法、预测模型构建方法、装置、设备及介质 | |
CN110175883A (zh) | 一种排序方法、装置、电子设备和非易失性存储介质 | |
CN116739652A (zh) | 一种服装电商销量预测建模方法 | |
CN112085537A (zh) | 一种基于大数据分析商品的方法及系统 | |
CN114493361A (zh) | 一种商品推荐算法的有效性评估方法和装置 | |
CN113988970A (zh) | 一种购物推荐方法及网购平台 | |
CN117236996B (zh) | 一种基于大数据分析的用户行为预测方法和系统 | |
CN109460505A (zh) | 一种推荐购物袋的方法 | |
KR20190056075A (ko) | 사업자에 의해 제공되는 서비스 평가 시스템, 서버 및 방법 | |
CN116911865A (zh) | 一种用于珠宝首饰的服务管理平台 | |
JP6682585B2 (ja) | 情報処理装置及び情報処理方法 | |
CN114219547B (zh) | 一种门店订货量的确定方法、装置、设备及存储介质 | |
Zhang et al. | Research on Factors Affecting Consumers' Purchase Intentions: Fresh Hema based on New Retail | |
CN111143575B (zh) | 一种店铺商品结构的优化方法及系统 | |
CN114266594A (zh) | 一种基于东南亚跨境电商平台的大数据分析方法 | |
CN114626888A (zh) | 网络购物平台的恶意刷单行为预测方法 | |
JP6472206B2 (ja) | 商品提案システムおよび商品提案方法ならびに商品提案プログラム | |
CN116308466B (zh) | 数据信息采集与智能分析方法、系统、设备和存储介质 | |
JP3377771B2 (ja) | 顧客分析システム及び顧客分析方法及び顧客分析プログラムを記録した記録媒体 | |
CN116883121B (zh) | 基于大数据分析的pos机用户推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |