CN111242695A - 数据处理方法、装置、设备及计算机可读存储介质 - Google Patents

数据处理方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111242695A
CN111242695A CN202010057250.4A CN202010057250A CN111242695A CN 111242695 A CN111242695 A CN 111242695A CN 202010057250 A CN202010057250 A CN 202010057250A CN 111242695 A CN111242695 A CN 111242695A
Authority
CN
China
Prior art keywords
preset
data
store
commodities
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010057250.4A
Other languages
English (en)
Inventor
林焕彬
李�权
陈天健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010057250.4A priority Critical patent/CN111242695A/zh
Publication of CN111242695A publication Critical patent/CN111242695A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据处理方法,包括以下步骤:获取预设期间的各时间段中,预设门店对应各种商品的多个维度的销售数据;对销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据;基于各个子数据,获取预设门店对应各种商品的基础分矩阵;基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品。本发明还公开了一种数据处理装置、设备及计算机可读存储介质。本发明分析和挖掘出某种商品或者某个品类在过去的销售中所发生的异常情况,准确确定销售数据中的异常点,提高异常点的确定效率以及准确率。

Description

数据处理方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、设备及计算机可读存储介质。
背景技术
在线下门店零售场景中,由于天气、季节、区域、人们喜好等原因,商品在销售中难免会出现一些销量骤升或下降等情况,价格成本控制不好导致亏损等。
目前,为了避免门店在某些商品或者品类出现亏损的情况,通常需要分析出销售数据中的异常情况,目前,通常需要采用人工方式分析出销售数据中的异常点(离群商品),然而,由于销售数据中涉及的信息量较大,通过人工方式分析,会消耗大量的人力成本和资源,导致异常点的确定效率较低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种数据处理方法、装置、设备及计算机可读存储介质,旨在解决现有销售数据中的异常点的确定效率较低的技术问题。
为实现上述目的,本发明提供一种数据处理方法,所述数据处理方法包括以下步骤:
获取预设期间的各时间段中,预设门店对应各种商品的多个维度的销售数据;
对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据;
基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵;
基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品。
进一步地,所述基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品的步骤包括:
对所述基础分矩阵进行降维处理,以获得预设门店对应各种商品对应的二维矩阵;
基于所述二维矩阵,确定预设门店对应各种商品在各个维度中的离群商品。
进一步地,所述基于所述二维矩阵,确定预设门店对应各种商品在各个维度中的离群商品的步骤包括:
基于离群点检测算法对所述二维矩阵进行处理,以获得预设门店对应各种商品对应各个维度的局部离群因子;
基于所述局部离群因子,确定各个维度的二维矩阵对应的离群矩阵,并基于所述离群矩阵确定预设门店对应各种商品在各个维度中的离群商品。
进一步地,所述对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据的步骤包括:
基于各种商品对应的预设销售期间以及所述销售数据,确定预设门店对应各种商品的目标销售数据;
对所述目标销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据。
进一步地,所述子数据包括各个维度对应的平均季节数据、趋势数据以及残差数据,所述基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵:
分别对各个所述子数据进行归一化,以获得归一化后的子数据;
基于归一化后的子数据,确定预设门店对应各种商品的各个维度对应的平均季节数据基础分、趋势数据基础分以及残差数据基础分,以获得预设门店对应各种商品的基础分矩阵。
进一步地,所述基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵的步骤之后,所述数据处理方法还包括:
基于归一化后的子数据中的归一化残差数据,确定各个预设门店对应各个品类的综合分数;
基于所述综合分数,确定各个预设门店对应的门店分数;
基于所述门店分数展示各个预设门店的第一状态图形,并基于所述综合分数分别在第一状态图形中展示各个预设门店对应各个品类的第二状态图形。
进一步地,所述基于归一化后的子数据中的归一化残差数据,确定各个预设门店对应各个品类的综合分数的步骤包括:
分别将预设门店对应各个品类所包括的各种商品的归一化残差数据相加,以获得预设门店对应各个品类的初始分数;
将各个初始分数进行归一化,以获得各个预设门店对应各个品类的综合分数。
进一步地,所述基于所述综合分数,确定各个预设门店对应的门店分数的步骤包括:
获取各个品类对应的预设权重,并基于所述预设权重以及所述综合分数,分别确定各个预设门店对应的门店分数。
进一步地,所述基于所述门店分数展示各个预设门店的第一状态图形,并基于所述综合分数分别在第一状态图形中展示各个预设门店对应各个品类的第二状态图形的步骤之后,所述数据处理方法还包括:
在检测到基于各个所述第二状态图形中的第一目标状态图形触发的第一显示指令时,获取第一目标状态图形对应的品类中各种目标商品的局部离群因子;
基于所述局部离群因子中预设维度的离群因子,展示各种目标商品的第三状态图形。
进一步地,所述基于所述局部离群因子中预设维度的离群因子,展示各种目标商品的第三状态图形的步骤之后,所述数据处理方法还包括:
在检测到维度切换指令时,确定维度切换指令对应的目标维度;
基于所述局部离群因子中目标维度的离群因子,展示各种目标商品的第四状态图形。
进一步地,所述基于所述局部离群因子中预设维度的离群因子,展示各种目标商品的第三状态图形的步骤之后,所述数据处理方法还包括:
在检测到基于各个所述第三状态图形中的第二目标状态图形触发的第二显示指令时,基于所述第二目标状态图形对应的预设维度的残差数据,确定第二目标状态图形对应的异常数据点;
按照残差数据的时间顺序,通过曲线图展示预设维度的残差数据以及所述异常数据点。
此外,为实现上述目的,本发明还提供一种数据处理装置,所述数据处理装置包括:
获取模块,用于获取预设期间的各时间段中,预设门店对应各种商品的多个维度的销售数据;
拆分模块,用于对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据;
第一确定模块,用于基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵;
第二确定模块,用于基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品。
此外,为实现上述目的,本发明还提供一种数据处理设备,所述数据处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现前述的数据处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现前述的数据处理方法的步骤。
本发明通过获取预设期间的各时间段中,预设门店对应各种商品的多个维度的销售数据;接着对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据,而后基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵;然后基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品,能够自动的从海量数据中挖掘出可能存在的异常点(离群商品),准确确定销售数据中的异常点,提高异常点的确定效率以及准确率,进而分析和挖掘出某种商品或者某个品类在过去的销售中所发生的异常情况,便于根据离群商品进行预警,以防止门店在某些商品或者品类的销售中出现过多的亏损。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的数据处理设备的结构示意图;
图2为本发明数据处理方法第一实施例的流程示意图;
图3为本发明数据处理方法一实施例中的显示场景示意图;
图4为本发明数据处理方法另一实施例中的显示场景示意图;
图5为本发明数据处理方法又一实施例中的显示场景示意图;
图6为本发明数据处理方法再一实施例中的显示场景示意图;
图7为本发明数据处理装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的数据处理设备的结构示意图。
本发明实施例数据处理设备可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该数据处理设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,数据处理设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。
本领域技术人员可以理解,图1中示出的数据处理设备结构并不构成对数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及数据处理程序。
在图1所示的数据处理设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的数据处理程序。
在本实施例中,数据处理设备包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的数据处理程序,其中,处理器1001调用存储器1005中存储的数据处理程序时,并执行下述数据处理方法中的操作。
本发明还提供一种数据处理方法,参照图2,图2为本发明数据处理方法第一实施例的流程示意图。
本实施例中,该数据处理方法包括:
步骤S110,获取预设期间的各时间段中,预设门店对应各种商品的多个维度的销售数据;
本实施例中,可以对单个或多个门店下不同品类的商品进行处理,也就是说预设门店包括一个或多个,先获取预设期间的各天中,预设门店对应各种商品的多个维度的销售数据,例如收集预设门店每天的营业数据,营业数据包括门店ID、品类ID、商品ID、销售额、销量、毛利率、销量差、销量率等,其中,维度包括销售额、销量、毛利率、销量差、销量率中的至少三个,例如该维度包括销售额、销量以及毛利率。
需要说明的是,预设期间可进行合理设置,例如预设期间为1年、两年等,时间段可以为一天、两天或者一周等,也就是说,各个时间段的持续时长相同且包括整数天。
步骤S120,对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据;
本实施例中,在获取到销售数据时,对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据,具体地,可采用STL算法对预设门店对应各种商品的销售数据中各个维度的数据进行拆分,得到各个维度对应的平均季节数据、趋势数据以及残差数据。
需要说明的是,采用STL算法按照预设比例对各个维度的数据进行拆分,例如,一预设门店的商品A在某一天的销售额为100,则该销售额对应的平均季节数据、趋势数据以及残差数据分比为50、30、20。
步骤S130,基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵;
本实施例中,在得到各个维度的多个子数据时,获取预设门店对应各种商品的基础分矩阵,例如,基于各个所述子数据,分别确定各种商品的各个维度对应的平均季节数据基础分、趋势数据基础分以及残差数据基础分,而后根据各个维度对应的平均季节数据基础分、趋势数据基础分以及残差数据基础分,生成预设门店对应各种商品的各个维度的基础分矩阵,根据各个门店的每一种商品每个维度的平均季节数据基础分、趋势数据基础分以及残差数据基础分,生成各个门店的每一种商品对应的该维度的基础分矩阵,其中,各个门店的每一种商品所对应的基础分矩阵的数量与维度的数量一致。
具体地,可分别对各个子数据进行归一化,以获得归一化后的子数据,具体地,可采用的是min-max归一化算法,将不同维度的数据归一化到(0,1)范围内。而后,基于公式min(|(Kn-Kn-1)/Kn-1|,1)以及归一化后的子数据,确定平均季节数据基础分以及趋势数据基础分,基于公式min(|(Rnn-1-3σn-1)/3σn-1|,1)以及归一化后的子数据确定残差数据基础分,其中,Kn为某一维度的归一化后的子数据中第n个数据,Kn-1为某一维度的归一化后的子数据中第n-1个数据,Rn为某一维度的归一化后的子数据中第n个数据,μn-1为某一维度的归一化后的子数据的均值,σn-1为某一维度的归一化后的子数据的方差。
步骤S140,基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品。
本实施例中,在获取到预设门店对应各种商品的基础分矩阵时,基于基础分矩阵确定预设门店对应各种商品在各个维度中的离群商品,具体地,分别采用离群点检测算法对各个维度的基础分矩阵进行处理,得到各个维度的基础分矩阵对应的离群矩阵(离群点),该离群矩阵所对应的商品即为预设门店对应各种商品在各个维度中的离群商品。
本实施例的技术方案,可以自动的从海量数据中挖掘出可能存在的异常点(离群商品),能够分析和挖掘出某种商品或者某个品类在过去的销售中所发生的异常情况,进而根据销售数据的异常情况进行预警,方便运营方在异常时间点之前做好准备,预防过多的亏损。
本实施例提出的数据处理方法,通过获取预设期间的各时间段中,预设门店对应各种商品的多个维度的销售数据;接着对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据,而后基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵;然后基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品,自动的从海量数据中挖掘出可能存在的异常点(离群商品),准确确定销售数据中的异常点,提高异常点的确定效率以及准确率,进而分析和挖掘出某种商品或者某个品类在过去的销售中所发生的异常情况,便于根据离群商品进行预警,以防止门店在某些商品或者品类的销售中出现过多的亏损。
基于第一实施例,提出本发明数据处理方法的第二实施例,在本实施例中,步骤S120包括:
步骤S121,基于各种商品对应的预设销售期间以及所述销售数据,确定预设门店对应各种商品的目标销售数据;
步骤S122,对所述目标销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据。
需要说明的是,预设销售期间可以为各种商品的销售旺季的持续期间,例如,对于雪糕而言,其预设销售期间可以为6月-8月。
本实施例中,先获取各种商品对应的预设销售期间,然后根据预设销售期间以及销售数据,确定预设门店对应各种商品的目标销售数据,该目标销售数据仅包括各种商品在其对应的预设销售期间内的销售数据。
而后,对所述目标销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据,具体地,可采用STL算法对预设门店对应各种商品的目标销售数据中各个维度的数据进行拆分,得到各个维度对应的平均季节数据、趋势数据以及残差数据。
本实施例提出的数据处理方法,通过基于各种商品对应的预设销售期间以及所述销售数据,确定预设门店对应各种商品的目标销售数据;接着对所述目标销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据,通过采用预设销售期间的销售数据进行分析,能够提高离群商品检测的准确率,进而提高异常点的确定效率以及准确率。
基于第一实施例,提出本发明数据处理方法的第三实施例,在本实施例中,步骤S140包括:
步骤S141,对所述基础分矩阵进行降维处理,以获得预设门店对应各种商品对应的二维矩阵;
步骤S142,基于所述二维矩阵,确定预设门店对应各种商品在各个维度中的离群商品。
本实施例中,为便于处理,先对基础分矩阵进行降维处理,以获得预设门店对应各种商品对应的二维矩阵,具体地,可采用T-SNE算法对基础分矩阵进行降维处理,其中,T-SNE算法是一种用于降维的机器学习方法,其能够识别相关联的模式,T-SNE算法主要的优势就是保持局部结构的能力,也就是说,高维数据空间中距离相近的点投影到低维中仍然相近。
而后基于所述二维矩阵,确定预设门店对应各种商品在各个维度中的离群商品,具体地,分别采用离群点检测算法对各个维度的二维矩阵进行处理,得到各个维度的二维矩阵对应的离群矩阵(离群点),该离群矩阵所对应的商品即为预设门店对应各种商品在各个维度中的离群商品。
本实施例提出的数据处理方法,通过对所述基础分矩阵进行降维处理,以获得预设门店对应各种商品对应的二维矩阵;接着基于所述二维矩阵,确定预设门店对应各种商品在各个维度中的离群商品,通过对基础分矩阵进行降维处理,以提高数据处理效率,进而提高离群商品检测的效率。
基于第三实施例,提出本发明数据处理方法的第四实施例,在本实施例中,步骤S142包括:
步骤S1421,基于离群点检测算法对所述二维矩阵进行处理,以获得预设门店对应各种商品对应各个维度的局部离群因子;
步骤S1422,基于所述局部离群因子,确定各个维度的二维矩阵对应的离群矩阵,并基于所述离群矩阵确定预设门店对应各种商品在各个维度中的离群商品。
本实施例中,在获取到预设门店对应各种商品对应各个维度的二维矩阵,分别采用离群点检测算法对各个二维矩阵进行处理,以获得预设门店对应各种商品对应各个维度的局部离群因子。具体地,可采用LOF离群点检测算法对各个二维矩阵进行处理,LOF离群点检测算法是基于密度的算法,其最核心的部分是关于数据点密度的刻画,一个样本点周围的样本点所处位置的平均密度比上该样本点所在位置的密度。局部离群因子越大于1,则该点所在位置的密度越小于其周围样本所在位置的密度,这个点就越有可能是异常点。因此,预设门店对应各种商品对应各个维度的局部离群因子中大于1的局部离群因子所对应的矩阵为离群矩阵,进而确定各个维度的二维矩阵对应的离群矩阵,而后基于所述离群矩阵确定预设门店对应各种商品在各个维度中的离群商品,即该离群矩阵所对应的商品即为预设门店对应各种商品在各个维度中的离群商品。
本实施例提出的数据处理方法,通过基于离群点检测算法对所述二维矩阵进行处理,以获得预设门店对应各种商品对应各个维度的局部离群因子;接着于所述局部离群因子,确定各个维度的二维矩阵对应的离群矩阵,并基于所述离群矩阵确定预设门店对应各种商品在各个维度中的离群商品,能够根据局部离群因子准确确定离群商品,进而提高离群商品检测的准确性。
基于上述各个实施例,提出本发明数据处理方法的第五实施例,在本实施例中,子数据包括各个维度对应的平均季节数据、趋势数据以及残差数据,步骤S130包括:
步骤S131,分别对各个所述子数据进行归一化,以获得归一化后的子数据;
步骤S132,基于归一化后的子数据,确定预设门店对应各种商品的各个维度对应的平均季节数据基础分、趋势数据基础分以及残差数据基础分,以获得预设门店对应各种商品的基础分矩阵。
本实施例中,分别对各个子数据进行归一化,以获得归一化后的子数据,具体地,可采用的是min-max归一化算法,将不同维度的数据归一化到(0,1)范围内。
而后,基于归一化后的子数据,分别确定各种商品的各个维度对应的平均季节数据基础分、趋势数据基础分以及残差数据基础分,具体地,而后,基于公式min(|(Kn-Kn-1)/Kn-1|,1)以及归一化后的子数据中的平均季节数据和趋势数据,分别确定各个维度对应的平均季节数据基础分以及趋势数据基础分,基于公式min(|(Rnn-1-3σn-1)/3σn-1|,1)以及归一化后的子数据中的残差数据,确定各个维度对应的残差数据基础分。
需要说明的是,归一化后的子数据中各个维度的数据均包括预设期间中各天的归一化数据,而采用公式min(|(Kn-Kn-1)/Kn-1|,1)以及公式min(|(Rnn-1-3σn-1)/3σn-1|,1)处理后,各种商品的各个维度的数据仅包括一个数据即平均季节数据基础分、趋势数据基础分以及残差数据基础分。
本实施例提出的数据处理方法,通过分别对各个所述子数据进行归一化,以获得归一化后的子数据;基于归一化后的子数据,确定预设门店对应各种商品的各个维度对应的平均季节数据基础分、趋势数据基础分以及残差数据基础分,以获得预设门店对应各种商品的基础分矩阵,能够准确得到平均季节数据基础分、趋势数据基础分以及残差数据基础分,进而准确得到基础分矩阵,进一步提升离群商品检测的准确性。
基于第五实施例,提出本发明数据处理方法的第六实施例,在本实施例中,步骤S130之后,该数据处理方法还包括:
步骤S150,基于归一化后的子数据中的归一化残差数据,确定各个预设门店对应各个品类的综合分数;
本实施例中,可将预设门店对应各个品类的归一化残差数据相加,根据相加的结果确定各个预设门店对应各个品类的综合分数。
具体地,步骤S150包括:
步骤S151,分别将预设门店对应各个品类所包括的各种商品的归一化残差数据相加,以获得预设门店对应各个品类的初始分数;
步骤S152,将各个初始分数进行归一化,以获得各个预设门店对应各个品类的综合分数。
本实施例中,分别将预设门店对应各个品类所包括的各种商品的归一化残差数据相加,得到相加的结果即预设门店对应各个品类的初始分数,而后将各个初始分数进行归一化,以获得各个预设门店对应各个品类的综合分数。
步骤S160,基于所述综合分数,确定各个预设门店对应的门店分数;
步骤S170,基于所述门店分数展示各个预设门店的第一状态图形,并基于所述综合分数分别在第一状态图形中展示各个预设门店对应各个品类的第二状态图形。
进一步地,又一实施例中,步骤S160包括:
获取各个品类对应的预设权重,并基于所述预设权重以及所述综合分数,分别确定各个预设门店对应的门店分数。
本实施例中,在获取到各个预设门店对应各个品类的综合分数时,基于所述综合分数,确定各个预设门店对应的门店分数,具体地,先获取各个品类对应的预设权重,再根据预设权重以及所述综合分数确定各个预设门店对应的门店分数,即每一个门店对应的门店分数为其所包括品类的综合分数与各个品类对应的预设权重相差的和,例如,一门店包括B、C、D三个品类,其对应的预设权重分别为b、c、d,则该门店的门店分数=B*b+C*c+D*d。
而后,基于所述门店分数展示各个预设门店的第一状态图形,并基于所述综合分数分别在第一状态图形中展示各个预设门店对应各个品类的第二状态图形,参照图3,图3中,大圆分别为各个预设门店的第一状态图形,其中,门店分数越大,其对应的第一状态图形的面积越大,各个大圆内的小圆点为各个预设门店对应各个品类的第二状态图形,在显示时刻若品类的综合分数越大,则其对应的第二状态图形的颜色越深,或者,品类的综合分数越大,其对应的第二状态图形的颜色越红;品类的综合分数越低,其对应的第二状态图形的颜色越绿。
本实施例提出的数据处理方法,通过基于归一化后的子数据中的归一化残差数据,确定各个预设门店对应各个品类的综合分数;接着基于所述综合分数,确定各个预设门店对应的门店分数;而后基于所述门店分数展示各个预设门店的第一状态图形,并基于所述综合分数分别在第一状态图形中展示各个预设门店对应各个品类的第二状态图形,进而能够直观显示不同门店下有中各个品类的信息,以便于根据第一状态图形以及第二状态图形查看各个品类异常信息。
基于第六实施例,提出本发明数据处理方法的第七实施例,在本实施例中,步骤S170之后,该数据处理方法还包括:
步骤S180,在检测到基于各个所述第二状态图形中的第一目标状态图形触发的第一显示指令时,获取第一目标状态图形对应的品类中各种目标商品的局部离群因子;
步骤S190,基于所述局部离群因子中预设维度的离群因子,展示各种目标商品的第三状态图形。
本实施例中,在展示第一状态图形以及第二状态图形时,可对第二状态图形进行操作,例如通过单击、双击等操作触发第一显示指令,在检测到基于第一显示指令时,在各个所述第二状态图形中确定触发第一显示指令的第一目标状态图形,并获取第一目标状态图形对应的品类中各种目标商品的局部离群因子,而后基于所述局部离群因子中预设维度的离群因子,展示各种目标商品的第三状态图形,参照图4以及图5,离群因子越大其对应的第三状态图形的面积越大。
进一步地,一实施例中,步骤S190之后,该数据处理方法还包括:
步骤S200,在检测到维度切换指令时,确定维度切换指令对应的目标维度;
步骤S210,基于所述局部离群因子中目标维度的离群因子,展示各种目标商品的第四状态图形。
参照图4或图5,可在第三状态图形的上方显示各个维度对应的切换按键,可通过该切换按键触发维度切换指令,在检测到维度切换指令时,确定维度切换指令对应的目标维度,而后基于所述局部离群因子中目标维度的离群因子,展示各种目标商品的第四状态图形,使得用户可以查看不同维度的状态图形,进而查看该目标商品在不同维度的分布情况。
本实施例提出的数据处理方法,通过在检测到基于各个所述第二状态图形中的第一目标状态图形触发的第一显示指令时,获取第一目标状态图形对应的品类中各种目标商品的局部离群因子;接着基于所述局部离群因子中预设维度的离群因子,展示各种目标商品的第三状态图形,以便于查看目标商品的信息,以便于根据展示的信息调整门店的商品。
基于第七实施例,提出本发明数据处理方法的第八实施例,在本实施例中,步骤S190之后,该数据处理方法还包括:
步骤S220,在检测到基于各个所述第三状态图形中的第二目标状态图形触发的第二显示指令时,基于所述第二目标状态图形对应的预设维度的残差数据,确定第二目标状态图形对应的异常数据点;
步骤S230,按照残差数据的时间顺序,通过曲线图展示预设维度的残差数据以及所述异常数据点。
本实施例中,可通过点击、双击第三状态图形等操作触发第二显示指令,在检测到基于各个所述第三状态图形中的第二目标状态图形触发的第二显示指令时,获取所述第二目标状态图形对应的预设维度的残差数据,并基于预设维度的残差数据确定第二目标状态图形对应的异常数据点,而后按照残差数据的时间顺序,通过曲线图展示预设维度的残差数据以及所述异常数据点,参照图6,图6中第一行的曲线图为销售量的残差数据的曲线图,曲线图中的圆点为异常数据点。
需要说明的是,3sigma算法是指:若数据服从正态分布,则异常值被定义为一组结果值中与平均值的偏差超过三倍标准差的值,因此,可采用3sigma算法计算预设维度的残差数据中可能存在的异常数据点。
可以理解的是,还可以对不同门店的同种商品进行同个周期的分数差值计算,获得每个门店在第二目标状态图形对应的商品的偏离分数,得知其他门店对于这个商品可能存在的异常情况,以便于更好的分析商品本身异常的严重程度,进行更精确的分析。
本实施例提出的数据处理方法,通过在检测到基于各个所述第三状态图形中的第二目标状态图形触发的第二显示指令时,基于所述第二目标状态图形对应的预设维度的残差数据,确定第二目标状态图形对应的异常数据点;接着按照残差数据的时间顺序,通过曲线图展示预设维度的残差数据以及所述异常数据点,通过曲线图显示第二目标状态图形对应商品的残差数据和异常数据点,便于直观查看商品的残差数据和异常数据点。
本发明实施例还提供一种数据处理装置,参照图7,所述数据处理装置包括:
获取模块110,用于获取预设期间的各时间段中,预设门店对应各种商品的多个维度的销售数据;
拆分模块120,用于对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据;
第一确定模块130,用于基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵;
第二确定模块140,用于基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品。
进一步地,拆分模块120还用于:
基于各种商品对应的预设销售期间以及所述销售数据,确定预设门店对应各种商品的目标销售数据;
对所述目标销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据。
进一步地,第二确定模块140还用于:
对所述基础分矩阵进行降维处理,以获得预设门店对应各种商品对应的二维矩阵;
基于所述二维矩阵,确定预设门店对应各种商品在各个维度中的离群商品。
进一步地,第二确定模块140还用于:
基于离群点检测算法对所述二维矩阵进行处理,以获得预设门店对应各种商品对应各个维度的局部离群因子;
基于所述局部离群因子,确定各个维度的二维矩阵对应的离群矩阵,并基于所述离群矩阵确定预设门店对应各种商品在各个维度中的离群商品。
进一步地,第一确定模块130还用于:
分别对各个所述子数据进行归一化,以获得归一化后的子数据;
基于归一化后的子数据,确定预设门店对应各种商品的各个维度对应的平均季节数据基础分、趋势数据基础分以及残差数据基础分,以获得预设门店对应各种商品的基础分矩阵。
进一步地,所述数据处理装置还包括:
基于归一化后的子数据中的归一化残差数据,确定各个预设门店对应各个品类的综合分数;
基于所述综合分数,确定各个预设门店对应的门店分数;
基于所述门店分数展示各个预设门店的第一状态图形,并基于所述综合分数分别在第一状态图形中展示各个预设门店对应各个品类的第二状态图形。
进一步地,所述数据处理装置还包括:
分别将预设门店对应各个品类所包括的各种商品的归一化残差数据相加,以获得预设门店对应各个品类的初始分数;
将各个初始分数进行归一化,以获得各个预设门店对应各个品类的综合分数。
进一步地,所述数据处理装置还包括:
获取各个品类对应的预设权重,并基于所述预设权重以及所述综合分数,分别确定各个预设门店对应的门店分数。
进一步地,所述数据处理装置还包括:
在检测到基于各个所述第二状态图形中的第一目标状态图形触发的第一显示指令时,获取第一目标状态图形对应的品类中各种目标商品的局部离群因子;
基于所述局部离群因子中预设维度的离群因子,展示各种目标商品的第三状态图形。
进一步地,所述数据处理装置还包括:
在检测到维度切换指令时,确定维度切换指令对应的目标维度;
基于所述局部离群因子中目标维度的离群因子,展示各种目标商品的第四状态图形。
进一步地,所述数据处理装置还包括:
在检测到基于各个所述第三状态图形中的第二目标状态图形触发的第二显示指令时,基于所述第二目标状态图形对应的预设维度的残差数据,确定第二目标状态图形对应的异常数据点;
按照残差数据的时间顺序,通过曲线图展示预设维度的残差数据以及所述异常数据点。
上述各程序模块所执行的方法可参照本发明数据处理方法各个实施例,此处不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质。
所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如上所述的数据处理方法的步骤。
其中,在所述处理器上运行的数据处理程序被执行时所实现的方法可参照本发明数据处理方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (14)

1.一种数据处理方法,其特征在于,所述数据处理方法包括以下步骤:
获取预设期间的各时间段中,预设门店对应各种商品的多个维度的销售数据;
对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据;
基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵;
基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品。
2.如权利要求1所述的数据处理方法,其特征在于,所述基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品的步骤包括:
对所述基础分矩阵进行降维处理,以获得预设门店对应各种商品对应的二维矩阵;
基于所述二维矩阵,确定预设门店对应各种商品在各个维度中的离群商品。
3.如权利要求2所述的数据处理方法,其特征在于,所述基于所述二维矩阵,确定预设门店对应各种商品在各个维度中的离群商品的步骤包括:
基于离群点检测算法对所述二维矩阵进行处理,以获得预设门店对应各种商品对应各个维度的局部离群因子;
基于所述局部离群因子,确定各个维度的二维矩阵对应的离群矩阵,并基于所述离群矩阵确定预设门店对应各种商品在各个维度中的离群商品。
4.如权利要求1所述的数据处理方法,其特征在于,所述对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据的步骤包括:
基于各种商品对应的预设销售期间以及所述销售数据,确定预设门店对应各种商品的目标销售数据;
对所述目标销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据。
5.如权利要求1至4任一项所述的数据处理方法,其特征在于,所述子数据包括各个维度对应的平均季节数据、趋势数据以及残差数据,所述基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵的步骤包括:
分别对各个所述子数据进行归一化,以获得归一化后的子数据;
基于归一化后的子数据,确定预设门店对应各种商品的各个维度对应的平均季节数据基础分、趋势数据基础分以及残差数据基础分,以获得预设门店对应各种商品的基础分矩阵。
6.如权利要求5所述的数据处理方法,其特征在于,所述基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵的步骤之后,所述数据处理方法还包括:
基于归一化后的子数据中的归一化残差数据,确定各个预设门店对应各个品类的综合分数;
基于所述综合分数,确定各个预设门店对应的门店分数;
基于所述门店分数展示各个预设门店的第一状态图形,并基于所述综合分数分别在第一状态图形中展示各个预设门店对应各个品类的第二状态图形。
7.如权利要求6所述的数据处理方法,其特征在于,所述基于归一化后的子数据中的归一化残差数据,确定各个预设门店对应各个品类的综合分数的步骤包括:
分别将预设门店对应各个品类所包括的各种商品的归一化残差数据相加,以获得预设门店对应各个品类的初始分数;
将各个初始分数进行归一化,以获得各个预设门店对应各个品类的综合分数。
8.如权利要求6所述的数据处理方法,其特征在于,所述基于所述综合分数,确定各个预设门店对应的门店分数的步骤包括:
获取各个品类对应的预设权重,并基于所述预设权重以及所述综合分数,分别确定各个预设门店对应的门店分数。
9.如权利要求6所述的数据处理方法,其特征在于,所述基于所述门店分数展示各个预设门店的第一状态图形,并基于所述综合分数分别在第一状态图形中展示各个预设门店对应各个品类的第二状态图形的步骤之后,所述数据处理方法还包括:
在检测到基于各个所述第二状态图形中的第一目标状态图形触发的第一显示指令时,获取第一目标状态图形对应的品类中各种目标商品的局部离群因子;
基于所述局部离群因子中预设维度的离群因子,展示各种目标商品的第三状态图形。
10.如权利要求9所述的数据处理方法,其特征在于,所述基于所述局部离群因子中预设维度的离群因子,展示各种目标商品的第三状态图形的步骤之后,所述数据处理方法还包括:
在检测到维度切换指令时,确定维度切换指令对应的目标维度;
基于所述局部离群因子中目标维度的离群因子,展示各种目标商品的第四状态图形。
11.如权利要求9所述的数据处理方法,其特征在于,所述基于所述局部离群因子中预设维度的离群因子,展示各种目标商品的第三状态图形的步骤之后,所述数据处理方法还包括:
在检测到基于各个所述第三状态图形中的第二目标状态图形触发的第二显示指令时,基于所述第二目标状态图形对应的预设维度的残差数据,确定第二目标状态图形对应的异常数据点;
按照残差数据的时间顺序,通过曲线图展示预设维度的残差数据以及所述异常数据点。
12.一种数据处理装置,其特征在于,所述数据处理装置包括:
获取模块,用于获取预设期间的各时间段中,预设门店对应各种商品的多个维度的销售数据;
拆分模块,用于对所述销售数据进行拆分,以获得预设门店对应各种商品的各个维度的多个子数据;
第一确定模块,用于基于各个所述子数据,获取预设门店对应各种商品的基础分矩阵;
第二确定模块,用于基于所述基础分矩阵,确定预设门店对应各种商品在各个维度中的离群商品。
13.一种数据处理设备,其特征在于,所述数据处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现如权利要求1至11中任一项所述的数据处理方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如权利要求1至11中任一项所述的数据处理方法的步骤。
CN202010057250.4A 2020-01-17 2020-01-17 数据处理方法、装置、设备及计算机可读存储介质 Pending CN111242695A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010057250.4A CN111242695A (zh) 2020-01-17 2020-01-17 数据处理方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010057250.4A CN111242695A (zh) 2020-01-17 2020-01-17 数据处理方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111242695A true CN111242695A (zh) 2020-06-05

Family

ID=70872791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010057250.4A Pending CN111242695A (zh) 2020-01-17 2020-01-17 数据处理方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111242695A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021143337A1 (zh) * 2020-01-17 2021-07-22 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN113269607A (zh) * 2021-05-21 2021-08-17 深圳市方圆展示制品有限公司 一种线上线下体验智慧展示系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408341A (zh) * 2016-09-21 2017-02-15 北京小米移动软件有限公司 货品销量的预测方法及装置、电子设备
CN108079554A (zh) * 2017-11-28 2018-05-29 浙江工业大学 一种运动测试型身体素质指标评价方法及系统
CN108400972A (zh) * 2018-01-30 2018-08-14 北京兰云科技有限公司 一种异常检测方法和装置
CN109064299A (zh) * 2018-06-20 2018-12-21 上海百林通信网络科技服务股份有限公司 一种基于移动大数据的热力图应用于甄别公司虚假财报的对比分析方法
CN109818942A (zh) * 2019-01-07 2019-05-28 微梦创科网络科技(中国)有限公司 一种基于时序特征的用户帐号异常检测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408341A (zh) * 2016-09-21 2017-02-15 北京小米移动软件有限公司 货品销量的预测方法及装置、电子设备
CN108079554A (zh) * 2017-11-28 2018-05-29 浙江工业大学 一种运动测试型身体素质指标评价方法及系统
CN108400972A (zh) * 2018-01-30 2018-08-14 北京兰云科技有限公司 一种异常检测方法和装置
CN109064299A (zh) * 2018-06-20 2018-12-21 上海百林通信网络科技服务股份有限公司 一种基于移动大数据的热力图应用于甄别公司虚假财报的对比分析方法
CN109818942A (zh) * 2019-01-07 2019-05-28 微梦创科网络科技(中国)有限公司 一种基于时序特征的用户帐号异常检测方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021143337A1 (zh) * 2020-01-17 2021-07-22 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN113269607A (zh) * 2021-05-21 2021-08-17 深圳市方圆展示制品有限公司 一种线上线下体验智慧展示系统

Similar Documents

Publication Publication Date Title
WO2020192013A1 (zh) 定向广告投放方法和装置、设备及存储介质
CN111210071A (zh) 业务对象预测方法、装置、设备及可读存储介质
CN111242695A (zh) 数据处理方法、装置、设备及计算机可读存储介质
US20170154268A1 (en) An automatic statistical processing tool
CN110264093B (zh) 信用模型的建立方法、装置、设备及可读存储介质
US8036922B2 (en) Apparatus and computer-readable program for estimating man-hours for software tests
EP3543943A1 (en) Purchase information utilization system, purchase information utilization method, and program
CN110717806A (zh) 产品信息推送方法、装置、设备及存储介质
CN112765003A (zh) 一种基于app行为日志的风险预测方法
CN113569070B (zh) 图像检测方法和装置、电子设备、存储介质
US11467943B2 (en) System and method for struggle identification
CN112005257A (zh) 预测装置、预测方法以及程序
CN114692889A (zh) 用于机器学习算法的元特征训练模型
WO2022090609A1 (en) Building an ensemble of anomaly detection models for analyzing measurement results
CN111400663B (zh) 模型训练方法、装置、设备及计算机可读存储介质
CN112115182A (zh) 时序数据的处理方法、装置、设备及存储介质
US20160357708A1 (en) Data analysis method, data analysis apparatus, and recording medium having recorded program
US20240220383A1 (en) Analyzing measurement results of a communications network or other target system
CN115375484A (zh) 基于矩阵分解的保险产品提取方法和装置、设备及介质
CN113222624B (zh) 一种反窃电智能分析方法及系统
CN113886628A (zh) 一种图像检索方法、装置及存储介质
CN114266601A (zh) 营销策略确定方法、装置、终端设备及存储介质
AU2013101587A4 (en) System and Method for Management and Tracking of Vehicles
CN111695743A (zh) 工厂化食品安全生产监控方法、装置、设备及存储介质
JP2022002029A (ja) データ解析システム、データ解析方法及びデータ解析プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200605