CN114912944A - 业务数据处理方法、装置、计算机可读介质及计算机设备 - Google Patents
业务数据处理方法、装置、计算机可读介质及计算机设备 Download PDFInfo
- Publication number
- CN114912944A CN114912944A CN202210398098.5A CN202210398098A CN114912944A CN 114912944 A CN114912944 A CN 114912944A CN 202210398098 A CN202210398098 A CN 202210398098A CN 114912944 A CN114912944 A CN 114912944A
- Authority
- CN
- China
- Prior art keywords
- service
- data
- service data
- target
- business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 230000002159 abnormal effect Effects 0.000 claims abstract description 84
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000012937 correction Methods 0.000 claims description 28
- 230000000875 corresponding effect Effects 0.000 claims description 16
- 230000002596 correlated effect Effects 0.000 claims description 8
- 230000015654 memory Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 15
- 238000004378 air conditioning Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000005856 abnormality Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004753 textile Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请的实施例提供了一种业务数据处理方法、装置、计算机可读介质及计算机设备。该方法包括:获取至少一种业务分别在多个历史周期内的总业务数据,得到多个总业务数据,所述至少一种业务具有至少一个相同的业务属性;获取所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,得到所述多个目标业务数据;基于所述目标业务数据和所述总业务数据,确定所述目标业务分别在所述多个历史周期内的业务数据占比;基于各个业务数据占比,在所述多个目标业务数据中确定异常业务数据,并对所述异常业务数据进行修正,以得到所述目标业务分别在所述多个历史周期内的合理业务数据。本申请实施例的技术方案可以提高业务数据的准确性。
Description
技术领域
本申请涉及计算机及数据处理技术领域,具体而言,涉及一种业务数据处理方法、装置、计算机可读介质及计算机设备。
背景技术
在业务数据处理场景中,比如在业务数据预测场景中,通常需要获取历史业务数据,以便于根据历史业务数据进行业务数据的预测,然而,在实际操作中,可能会出现在历史业务数据中存在异常数据的情况,这就会导致针对业务数据的预测结果不准确。基于此,如何提高业务数据的准确性是亟待解决的技术问题。
发明内容
本申请的实施例提供了一种业务数据处理方法、装置、计算机程序产品或计算机程序、计算机可读介质及计算机设备,进而至少在一定程度上可以提高业务数据的准确性。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种业务数据处理方法,所述方法包括:获取至少一种业务分别在多个历史周期内的总业务数据,得到多个总业务数据,所述至少一种业务具有相同的业务属性;获取所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,得到所述多个目标业务数据;基于所述目标业务数据和所述总业务数据,确定所述目标业务分别在所述多个历史周期内的业务数据占比;基于各个业务数据占比,在所述多个目标业务数据中确定异常业务数据,并对所述异常业务数据进行修正,以得到所述目标业务分别在所述多个历史周期内的合理业务数据。
根据本申请实施例的一个方面,提供了一种业务数据处理装置,所述装置包括:第一获取单元,用于获取至少一种业务分别在多个历史周期内的总业务数据,得到多个总业务数据,所述至少一种业务具有相同的业务属性;第二获取单元,用于获取所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,得到所述多个目标业务数据;第一确定单元,用于基于所述目标业务数据和所述总业务数据,确定所述目标业务分别在所述多个历史周期内的业务数据占比;第二确定单元,用于基于各个业务数据占比,在所述多个目标业务数据中确定异常业务数据,并对所述异常业务数据进行修正,以得到所述目标业务分别在所述多个历史周期内的合理业务数据。
在本申请的一些实施例中,基于前述方案,所述第二确定单元配置为:基于各个业务数据占比,确定针对所述各个业务数据占比的占比基准值,并确定用于确定异常业务数据的异常判定值;确定所述各个业务数据占比与所述占比基准值之间的差值绝对值;将所述差值绝对值超过所述异常判定值的目标业务数据确定为异常业务数据。
在本申请的一些实施例中,基于前述方案,所述第二确定单元配置为如下任意一种:将所述各个业务数据占比的平均值确定为所述占比基准值;将所述各个业务数据占比的中位值确定为所述占比基准值。
在本申请的一些实施例中,基于前述方案,所述第二确定单元配置为:确定所述各个业务数据占比的标准差;按照所述标准差的预定倍数,确定用于确定异常业务数据的异常判定值。
在本申请的一些实施例中,基于前述方案,所述第二确定单元配置为:基于所述占比基准值和所述异常业务数据对应的业务数据占比,确定修正系数,所述修正系数与所述占比基准值正相关,所述修正系数与所述异常业务数据对应的业务数据占比负相关;通过所述修正系数对所述异常业务数据进行修正。
在本申请的一些实施例中,基于前述方案,所述装置还包括:第三获取单元,用于在对所述异常业务数据进行修正之后,获取所述至少一种业务中各种业务分别在所述多个历史周期内的合理业务数据;预测单元,用于基于所述合理业务数据,通过预先构建的业务数据预测模型对所述各种业务分别在待测周期内的业务数据进行预测。
在本申请的一些实施例中,基于前述方案,所述业务包括商品销售业务,所述总业务数据包括至少一种商品销售业务的总销量数据,所述目标业务数据包括目标商品销售业务的目标销量数据。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中所述的业务数据处理方法。
根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的业务数据处理方法。
根据本申请实施例的一个方面,提供了一种计算机设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的业务数据处理方法。
在本申请的一些实施例所提供的技术方案中,通过至少一种业务分别在多个历史周期内的总业务数据,以及所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,可以确定目标业务分别在所述多个历史周期内的业务数据占比,由于所述至少一种业务中的各个业务之间具有相同的业务属性,所以所述目标业务与至少一种业务在整体上具有较强的关联性,从而可以根据目标业务分别在所述多个历史周期内的业务数据占比,在所述多个目标业务数据中确定异常业务数据,通过进一步对所述异常业务数据进行修正,故可以得到所述目标业务分别在所述多个历史周期内的合理业务数据,进而使得可以提高业务数据的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图;
图2示出了根据本申请一个实施例的业务数据处理方法的流程图;
图3示出了根据本申请一个实施例的在所述多个目标业务数据中确定异常业务数据的细节流程图;
图4示出了根据本申请一个实施例的确定用于确定异常业务数据的异常判定值的细节流程图;
图5示出了根据本申请一个实施例的对所述异常业务数据进行修正的细节流程图;
图6示出了根据本申请一个实施例的在对所述异常业务数据进行修正之后的方法流程图;
图7示出了根据本申请一个实施例的业务数据处理装置的框图;
图8示出了适于用来实现本申请实施例的计算机设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
需要说明的是:在本文中提及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
需要注意的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的对象在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在图示或描述的那些以外的顺序实施。
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
如图1所示,系统架构可以包括终端设备(如图1中所示智能手机101、平板电脑102和便携式计算机103中的一种或多种,当然也可以是台式计算机等等,但并不局限于此,本申请在此不做限制)、网络104和服务器105。网络104用以在终端设备和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线通信链路、无线通信链路等等。
在本申请的一个实施例中,服务器105可以从终端设备中获取至少一种业务分别在多个历史周期内的总业务数据,得到多个总业务数据,其中,所述至少一种业务具有相同的业务属性,并获取所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,得到所述多个目标业务数据,然后,服务器105可以基于所述目标业务数据和所述总业务数据,确定所述目标业务分别在所述多个历史周期内的业务数据占比,最后,服务器105可以基于各个业务数据占比,在所述多个目标业务数据中确定异常业务数据,并对所述异常业务数据进行修正,以得到所述目标业务分别在所述多个历史周期内的合理业务数据。
在本实施例中,通过至少一种业务分别在多个历史周期内的总业务数据,以及所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,可以确定目标业务分别在所述多个历史周期内的业务数据占比,由于所述至少一种业务中的各个业务之间具有相同的业务属性,所以所述目标业务与至少一种业务在整体上具有较强的关联性,从而可以根据目标业务分别在所述多个历史周期内的业务数据占比,在所述多个目标业务数据中确定异常业务数据,通过进一步对所述异常业务数据进行修正,故可以得到所述目标业务分别在所述多个历史周期内的合理业务数据,进而使得可以提高业务数据的准确性。
需要说明的是,本申请实施例所提供的业务数据处理方法可以由服务器105执行,相应地,业务数据处理装置一般设置于服务器105中。但是,在本申请的其它实施例中,终端设备也可以与服务器具有相似的功能,从而执行本申请实施例所提供的业务数据处理方案。
还需要说明的是,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
需要解释的是,如上所述的云计算(cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展。通过建立云计算资源池(简称云平台,一般称为IaaS(Infrastructure as a Service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作系统)、存储设备、网络设备。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
图2示出了根据本申请一个实施例的业务数据处理方法的流程图,该业务数据处理方法可以由具有计算处理功能的设备来执行,比如可以由图1中所示的服务器105或者终端设备来执行。参照图2所示,该业务数据处理方法至少包括步骤210至步骤270,详细介绍如下:
在步骤210中,获取至少一种业务分别在多个历史周期内的总业务数据,得到多个总业务数据,所述至少一种业务具有相同的业务属性。
在本申请中,可以定义为一个业务为库存或销售管理中的最小可用单元,例如纺织品中一个业务通常表示规格、颜色、款式,而在连锁零售门店中有时称单品为一个业务。最小库存或销售管理单元可以区分不同商品销售的最小单元,是科学管理商品的采购、销售、物流和财务管理以及POS和MIS系统的数据统计的需求。
为了使本领域技术人员更好的理解本申请,下面将以一个具体的示例进行辅助说明。
在本申请的一个具体示例中,所述业务可以包括商品销售业务,所述总业务数据可以包括至少一种商品销售业务的总销量数据,所述目标业务数据可以包括目标商品销售业务的目标销量数据。
比如,至少一种业务可以包括空调销售业务和风扇销售业务,至少一种业务分别在多个历史周期内的总业务数据可以是指空调销售业务和风扇销售业务在历史上12个月内的总销量数据。例如,空调销售业务和风扇销售业务在历史上12个月内的总销量分别为1月销售10台,2月销售20台,3月销售30台,4月销售40台,5月销售50台,6月销售60台,7月销售60台,8月销售50台,9月销售40台,10月销售30台,11月销售20台,12月销售10台。
可以理解是的,空调销售业务和风扇销售业务具有相同的业务属性,即二者的销售旺季均在夏季,销售淡季均在冬季。
需要说明的是,步骤210所述的历史周期可以是以月为单位,也可以是以周为单位,还可以是以天为单位。
继续参照图2,在步骤230中,获取所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,得到所述多个目标业务数据。
下面将继续以至少一种业务为空调销售业务和风扇销售业务作为示例进行说明。
若目标业务为空调销售业务,则空调销售业务分别在历史上12个月内的目标销量数据(即目标业务数据)可以为1月销售5台,2月销售10台,3月销售15台,4月销售10台,5月销售25台,6月销售30台,7月销售30台,8月销售40台,9月销售20台,10月销售15台,11月销售10台,12月销售5台。
继续参照图2,在步骤250中,基于所述目标业务数据和所述总业务数据,确定所述目标业务分别在所述多个历史周期内的业务数据占比。
下面将继续以至少一种业务为空调销售业务和风扇销售业务作为示例进行说明。
若目标业务为空调销售业务,则基于空调销售业务分别在历史上12个月内的目标销量数据,以及空调销售业务和风扇销售业务在历史上12个月内的总销量数据,可以确定所述空调销售业务分别在历史上12个月内的业务数据占比为:“1月:50%”,“2月:50%”,“3月:50%”,“4月:25%”,“5月:50%”,“6月:50%”,“7月:50%”,“8月:80%”,“9月:50%”,“10月:50%”,“11月:50%”,“12月:50%”。
继续参照图2,在步骤270中,基于各个业务数据占比,在所述多个目标业务数据中确定异常业务数据,并对所述异常业务数据进行修正,以得到所述目标业务分别在所述多个历史周期内的合理业务数据。
在本申请的一个实施例中,基于各个业务数据占比,在所述多个目标业务数据中确定异常业务数据,可以按照如图3所示的步骤执行。
参见图3,示出了根据本申请一个实施例的在所述多个目标业务数据中确定异常业务数据的细节流程图。具体包括步骤271至步骤273:
在步骤271中,基于各个业务数据占比,确定针对所述各个业务数据占比的占比基准值,并确定用于确定异常业务数据的异常判定值。
在如图3所示步骤271的一个实施例中,基于各个业务数据占比,确定针对所述各个业务数据占比的占比基准值,可以按照如下任意一种方式执行:
第一种,将所述各个业务数据占比的平均值确定为所述占比基准值。
下面继续以至少一种业务为空调销售业务和风扇销售业务为示例。具体的,由于空调销售业务分别在历史上12个月内的业务数据占比为:“1月:50%”,“2月:50%”,“3月:50%”,“4月:25%”,“5月:50%”,“6月:50%”,“7月:50%”,“8月:80%”,“9月:50%”,“10月:50%”,“11月:50%”,“12月:50%”,因此,空调销售业务在历史上12个月内的业务数据占比平均值为:(50%+50%+50%+25%+50%+50%+50%+80%+50%+50%+50%+50%+)/12=50.4%。可见,可以将50.4%确定为所述占比基准值。
第二种,将所述各个业务数据占比的中位值确定为所述占比基准值。
在本申请中,继续以至少一种业务为空调销售业务和风扇销售业务作为示例,具体的,由于空调销售业务分别在历史上12个月内的业务数据占比为:“1月:50%”,“2月:50%”,“3月:50%”,“4月:25%”,“5月:50%”,“6月:50%”,“7月:50%”,“8月:80%”,“9月:50%”,“10月:50%”,“11月:50%”,“12月:50%”,因此,空调销售业务在历史上12个月内的业务数据占比的中位值为50%。可见,可以将50%确定为所述占比基准值。
在如图3所示步骤271的一个实施例中,确定用于确定异常业务数据的异常判定值,可以按照如图4所示的步骤执行。
参见图4,示出了根据本申请一个实施例的确定用于确定异常业务数据的异常判定值的细节流程图。具体包括步骤2711至步骤2712:
步骤2711,确定所述各个业务数据占比的标准差。
步骤2712,按照所述标准差的预定倍数,确定用于确定异常业务数据的异常判定值。
在本申请中,继续以至少一种业务为空调销售业务和风扇销售业务作为示例,具体的,由于空调销售业务分别在历史上12个月内的业务数据占比为:“1月:50%”,“2月:50%”,“3月:50%”,“4月:25%”,“5月:50%”,“6月:50%”,“7月:50%”,“8月:80%”,“9月:50%”,“10月:50%”,“11月:50%”,“12月:50%”,因此,空调销售业务在历史上12个月内的业务数据占比的标准差为39%。
进一步的,若所述预定倍数设定为0.5,则可以确定异常业务数据的异常判定值为39%×0.5=19.5%。
继续参照图3,在步骤272中,确定所述各个业务数据占比与所述占比基准值之间的差值绝对值。
在本申请中,继续以至少一种业务为空调销售业务和风扇销售业务作为示例进行说明。
具体的,由于空调销售业务分别在历史上12个月内的业务数据占比为:“1月:50%”,“2月:50%”,“3月:50%”,“4月:25%”,“5月:50%”,“6月:50%”,“7月:50%”,“8月:80%”,“9月:50%”,“10月:50%”,“11月:50%”,“12月:50%”,若占比基准值取50.4%。则空调销售业务分别在历史上12个月内的业务数据占比与所述占比基准值之间的差值绝对值为:“1月:0.4%”,“2月:0.4%”,“3月:0.4%”,“4月:24.6%”,“5月:0.4%”,“6月:0.4%”,“7月:0.4%”,“8月:29.6%”,“9月:0.4%”,“10月:0.4%”,“11月:0.4%”,“12月:0.4%”。
继续参照图3,在步骤273中,将所述差值绝对值超过所述异常判定值的目标业务数据确定为异常业务数据。
继续以至少一种业务为空调销售业务和风扇销售业务作为示例进行说明。
具体的,由于空调销售业务分别在历史上12个月内的业务数据占比与所述占比基准值之间的差值绝对值为:“1月:0.4%”,“2月:0.4%”,“3月:0.4%”,“4月:24.6%”,“5月:0.4%”,“6月:0.4%”,“7月:0.4%”,“8月:29.6%”,“9月:0.4%”,“10月:0.4%”,“11月:0.4%”,“12月:0.4%”,而异常判定值为19.5%,可见,4月和8月对应的差值绝对值超过了所述异常判定值,因此,可以将4月和8月的目标销量数据(即目标业务数据)确定为异常业务数据。
在本申请的一个实施例中,对所述异常业务数据进行修正,可以按照如图5所示的步骤执行。
参见图5,示出了根据本申请一个实施例的对所述异常业务数据进行修正的细节流程图。具体包括步骤274至步骤275:
步骤274,基于所述占比基准值和所述异常业务数据对应的业务数据占比,确定修正系数,所述修正系数与所述占比基准值正相关,所述修正系数与所述异常业务数据对应的业务数据占比负相关。
步骤275,通过所述修正系数对所述异常业务数据进行修正。
在本实施例中,基于所述占比基准值和所述异常业务数据对应的业务数据占比,确定修正系数,可以按照如下公式确定修正系数:
修正系数=占比基准值/业务数据占比
继续以至少一种业务为空调销售业务和风扇销售业务作为示例进行说明。
比如,4月和8月空调销售业务的目标销量数据(即目标业务数据)为异常业务数据。其中,4月空调销售业务对应的业务数据占比为25%,8月空调销售业务对应的业务数据占比为80%,若占比基准值取50.4%,则4月空调销售业务对应的目标销量数据的修正系数为50.4%/25%=2.016,8月空调销售业务对应的目标销量数据的修正系数为50.4%/80%=0.63。
进一步的,通过所述修正系数对所述异常业务数据进行修正,可以按照如下公式进行修正:
修正后业务数据=修正系数×异常业务数据
继续以至少一种业务为空调销售业务和风扇销售业务作为示例进行说明。
比如,4月空调销售业务对应的目标销量数据为10台,其目标销量数据的修正系数为2.016,因此,4月空调销售业务对应的目标销量数据在修正之后的销量数据为:10×2.016=20.16。
再比如,8月空调销售业务对应的目标销量数据为40台,其目标销量数据的修正系数为0.63,因此,8月空调销售业务对应的目标销量数据在修正之后的销量数据为:40×0.63=25.2。
可见,空调销售业务分别在历史上12个月内修正后的合理业务数据可以为1月销售5台,2月销售10台,3月销售15台,4月销售20.16台,5月销售25台,6月销售30台,7月销售35台,8月销售25.2台,9月销售20台,10月销售15台,11月销售10台,12月销售5台。
在本申请的一个实施例中,在对所述异常业务数据进行修正之后,还可以执行如图6所示的步骤。
参见图6,示出了根据本申请一个实施例的在对所述异常业务数据进行修正之后的方法流程图。具体包括步骤280至步骤290:
步骤280,获取所述至少一种业务中各种业务分别在所述多个历史周期内的合理业务数据。
步骤290,基于所述合理业务数据,通过预先构建的业务数据预测模型对所述各种业务分别在待测周期内的业务数据进行预测。
在本申请的应用场景中,例如在销量预测场景中,如果同一品类中有销售业务有缺货问题出现或者其他因素导致该业务销量异常,会对同品类其余业务产生影响(如蚕食效应),结果是同一个品类中部分业务实际销量被低估,部分业务实际销量被高估,如果不进行业务销量还原,在对未来业务进行预测时易受到这些历史异常销量影响,通过本申请提出的业务数据处理方法,能快速地识别此类异常并对异常值进行销量还原,进而使得运营者能更好的认识记录历史真实销量,且能够提升后续预测模型的准确率。
在本申请的一些实施例所提供的技术方案中,通过至少一种业务分别在多个历史周期内的总业务数据,以及所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,可以确定目标业务分别在所述多个历史周期内的业务数据占比,由于所述至少一种业务中的各个业务之间具有相同的业务属性,所以所述目标业务与至少一种业务在整体上具有较强的关联性,从而可以根据目标业务分别在所述多个历史周期内的业务数据占比,在所述多个目标业务数据中确定异常业务数据,通过进一步对所述异常业务数据进行修正,故可以得到所述目标业务分别在所述多个历史周期内的合理业务数据,进而使得可以提高业务数据的准确性。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的业务数据处理方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的业务数据处理方法的实施例。
图7示出了根据本申请一个实施例的业务数据处理装置的框图。
参照图7所示,根据本申请一个实施例的业务数据处理装置700,包括:第一获取单元701、第二获取单元702、第一确定单元703和第二确定单元704。
其中,第一获取单元701,用于获取至少一种业务分别在多个历史周期内的总业务数据,得到多个总业务数据,所述至少一种业务具有相同的业务属性;第二获取单元702,用于获取所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,得到所述多个目标业务数据;第一确定单元703,用于基于所述目标业务数据和所述总业务数据,确定所述目标业务分别在所述多个历史周期内的业务数据占比;第二确定单元704,用于基于各个业务数据占比,在所述多个目标业务数据中确定异常业务数据,并对所述异常业务数据进行修正,以得到所述目标业务分别在所述多个历史周期内的合理业务数据。
在本申请的一些实施例中,基于前述方案,所述第二确定单元704配置为:基于各个业务数据占比,确定针对所述各个业务数据占比的占比基准值,并确定用于确定异常业务数据的异常判定值;确定所述各个业务数据占比与所述占比基准值之间的差值绝对值;将所述差值绝对值超过所述异常判定值的目标业务数据确定为异常业务数据。
在本申请的一些实施例中,基于前述方案,所述第二确定单元704配置为如下任意一种:将所述各个业务数据占比的平均值确定为所述占比基准值;将所述各个业务数据占比的中位值确定为所述占比基准值。
在本申请的一些实施例中,基于前述方案,所述第二确定单元704配置为:确定所述各个业务数据占比的标准差;按照所述标准差的预定倍数,确定用于确定异常业务数据的异常判定值。
在本申请的一些实施例中,基于前述方案,所述第二确定单元704配置为:基于所述占比基准值和所述异常业务数据对应的业务数据占比,确定修正系数,所述修正系数与所述占比基准值正相关,所述修正系数与所述异常业务数据对应的业务数据占比负相关;通过所述修正系数对所述异常业务数据进行修正。
在本申请的一些实施例中,基于前述方案,所述装置还包括:第三获取单元,用于在对所述异常业务数据进行修正之后,获取所述至少一种业务中各种业务分别在所述多个历史周期内的合理业务数据;预测单元,用于基于所述合理业务数据,通过预先构建的业务数据预测模型对所述各种业务分别在待测周期内的业务数据进行预测。
在本申请的一些实施例中,基于前述方案,所述业务包括商品销售业务,所述总业务数据包括至少一种商品销售业务的总销量数据,所述目标业务数据包括目标商品销售业务的目标销量数据。
图8示出了适于用来实现本申请实施例的计算机设备的计算机系统的结构示意图。
需要说明的是,图8示出的计算机设备的计算机系统800仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(Central Processing Unit,CPU)801,其可以根据存储在只读存储器(Read-Only Memory,ROM)802中的程序或者从储存部分808加载到随机访问存储器(Random Access Memory,RAM)803中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 803中,还存储有系统操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(Input/Output,I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分807;包括硬盘等的储存部分808;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入储存部分808。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中所述的业务数据处理方法。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的计算机设备中所包含的;也可以是单独存在,而未装配入该计算机设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该计算机设备执行时,使得该计算机设备实现上述实施例中所述的业务数据处理方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (10)
1.一种业务数据处理方法,其特征在于,所述方法包括:
获取至少一种业务分别在多个历史周期内的总业务数据,得到多个总业务数据,所述至少一种业务具有相同的业务属性;
获取所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,得到所述多个目标业务数据;
基于所述目标业务数据和所述总业务数据,确定所述目标业务分别在所述多个历史周期内的业务数据占比;
基于各个业务数据占比,在所述多个目标业务数据中确定异常业务数据,并对所述异常业务数据进行修正,以得到所述目标业务分别在所述多个历史周期内的合理业务数据。
2.根据权利要求1所述的方法,其特征在于,所述基于各个业务数据占比,在所述多个目标业务数据中确定异常业务数据,包括:
基于各个业务数据占比,确定针对所述各个业务数据占比的占比基准值,并确定用于确定异常业务数据的异常判定值;
确定所述各个业务数据占比与所述占比基准值之间的差值绝对值;
将所述差值绝对值超过所述异常判定值的目标业务数据确定为异常业务数据。
3.根据权利要求2所述的方法,其特征在于,所述基于各个业务数据占比,确定针对所述各个业务数据占比的占比基准值,包括如下任意一种:
将所述各个业务数据占比的平均值确定为所述占比基准值;
将所述各个业务数据占比的中位值确定为所述占比基准值。
4.根据权利要求2所述的方法,其特征在于,所述确定用于确定异常业务数据的异常判定值,包括:
确定所述各个业务数据占比的标准差;
按照所述标准差的预定倍数,确定用于确定异常业务数据的异常判定值。
5.根据权利要求2所述的方法,其特征在于,所述对所述异常业务数据进行修正,包括:
基于所述占比基准值和所述异常业务数据对应的业务数据占比,确定修正系数,所述修正系数与所述占比基准值正相关,所述修正系数与所述异常业务数据对应的业务数据占比负相关;
通过所述修正系数对所述异常业务数据进行修正。
6.根据权利要求1所述的方法,其特征在于,在对所述异常业务数据进行修正之后,所述方法还包括:
获取所述至少一种业务中各种业务分别在所述多个历史周期内的合理业务数据;
基于所述合理业务数据,通过预先构建的业务数据预测模型对所述各种业务分别在待测周期内的业务数据进行预测。
7.根据权利要求1至6任一项所述方法,其特征在于,所述业务包括商品销售业务,所述总业务数据包括至少一种商品销售业务的总销量数据,所述目标业务数据包括目标商品销售业务的目标销量数据。
8.一种业务数据处理装置,其特征在于,所述装置包括:
第一获取单元,用于获取至少一种业务分别在多个历史周期内的总业务数据,得到多个总业务数据,所述至少一种业务具有相同的业务属性;
第二获取单元,用于获取所述至少一种业务中的目标业务分别在所述多个历史周期内的目标业务数据,得到所述多个目标业务数据;
第一确定单元,用于基于所述目标业务数据和所述总业务数据,确定所述目标业务分别在所述多个历史周期内的业务数据占比;
第二确定单元,用于基于各个业务数据占比,在所述多个目标业务数据中确定异常业务数据,并对所述异常业务数据进行修正,以得到所述目标业务分别在所述多个历史周期内的合理业务数据。
9.一种计算机设备,其特征在于,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述至少一条程序代码由所述一个或多个处理器加载并执行以实现如权利要求1至7任一项所述的业务数据处理方法所执行的操作。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行以实现如权利要求1至7任一项所述的业务数据处理方法所执行的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210398098.5A CN114912944A (zh) | 2022-04-12 | 2022-04-12 | 业务数据处理方法、装置、计算机可读介质及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210398098.5A CN114912944A (zh) | 2022-04-12 | 2022-04-12 | 业务数据处理方法、装置、计算机可读介质及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114912944A true CN114912944A (zh) | 2022-08-16 |
Family
ID=82764431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210398098.5A Pending CN114912944A (zh) | 2022-04-12 | 2022-04-12 | 业务数据处理方法、装置、计算机可读介质及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114912944A (zh) |
-
2022
- 2022-04-12 CN CN202210398098.5A patent/CN114912944A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108230162B (zh) | 保险服务推荐的方法、装置、存储介质及电子设备 | |
CN109344154B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN112016796B (zh) | 综合风险评分请求处理方法、装置及电子设备 | |
CN110689395B (zh) | 用于推送信息的方法和装置 | |
CN112017042A (zh) | 基于tweedie分布的资源配额确定方法、装置和电子设备 | |
CN114663015A (zh) | 补货方法和装置 | |
CN109492831B (zh) | 营销路径的推荐方法、装置、介质及电子设备 | |
CN111209281A (zh) | 年金数据处理方法、装置、介质及电子设备 | |
CN115983902A (zh) | 基于用户实时事件的信息推送方法及系统 | |
CN107562461B (zh) | 特征计算系统及方法、存储介质和电子设备 | |
CN115268734A (zh) | 基于报价工具的报价生成方法、装置、设备及存储介质 | |
CN114912944A (zh) | 业务数据处理方法、装置、计算机可读介质及计算机设备 | |
CN111967806B (zh) | 基于定期回扫的用户风险更新方法、装置和电子设备 | |
CN115293291A (zh) | 排序模型的训练方法、排序方法、装置、电子设备及介质 | |
CN112016791B (zh) | 资源分配方法、装置及电子设备 | |
CN115099865A (zh) | 一种数据处理方法和装置 | |
CN114925275A (zh) | 产品推荐方法、装置、计算机设备及存储介质 | |
CN112836971A (zh) | 配额资源的确定方法和装置、电子设备和存储介质 | |
CN113537893A (zh) | 订单处理方法、装置、设备和计算机可读介质 | |
CN113780611A (zh) | 一种库存管理方法和装置 | |
CN112131468A (zh) | 推荐系统中的数据处理方法、装置 | |
CN113434754A (zh) | 确定推荐api服务的方法、装置、电子设备和存储介质 | |
CN117592885A (zh) | 基于供应链的供需数据处理方法、装置、介质及电子设备 | |
CN112085426A (zh) | 订单下发控制方法、装置、存储介质及电子设备 | |
CN112348298A (zh) | 设计师管理方法、装置、电子终端、及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |