CN108399170A - 数据挖掘方法以及装置 - Google Patents
数据挖掘方法以及装置 Download PDFInfo
- Publication number
- CN108399170A CN108399170A CN201710066296.0A CN201710066296A CN108399170A CN 108399170 A CN108399170 A CN 108399170A CN 201710066296 A CN201710066296 A CN 201710066296A CN 108399170 A CN108399170 A CN 108399170A
- Authority
- CN
- China
- Prior art keywords
- independent variable
- information
- random error
- time period
- goods
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000005457 optimization Methods 0.000 claims abstract description 60
- 230000001419 dependent effect Effects 0.000 claims description 133
- 230000002354 daily effect Effects 0.000 claims description 45
- 238000005070 sampling Methods 0.000 claims description 41
- 238000009826 distribution Methods 0.000 claims description 39
- 238000007418 data mining Methods 0.000 claims description 36
- 230000003203 everyday effect Effects 0.000 claims description 15
- 238000003860 storage Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012417 linear regression Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 12
- 238000007405 data analysis Methods 0.000 abstract description 6
- 241001269238 Data Species 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 20
- 238000004140 cleaning Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000009467 reduction Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/219—Managing data history or versioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种数据挖掘方法以及装置,涉及大数据技术领域。本发明的方法应用于制定货物的清仓价格的场景时,获取货物的销量和价格等历史数据,利用数据挖掘方法自动对货物销售的海量数据进行大数据分析,利用货物销量受价格等因素影响的客观规律,构建影响清仓的各变量间的关系表示以及优化目标关系表示,制定能够在给定时间内完成清仓目标的清仓价格,提高了在给定时间内完成清仓目标的概率,提高了货物清仓的效果。
Description
技术领域
本发明涉及大数据技术领域,特别涉及一种数据挖掘方法以及装置。
背景技术
过去十几年来,互联网在人类各生活领域不断深化,人们的生活在互联网的影响下变得越来越方便,尤其实在电子商务上,人们已经逐渐习惯了通过网络购买各种货物和服务。
在电商运营中,维持货物的健康库存是运营部门的重要工作目标。与此同时,受到服务水平需求及市场波动等不确定因素的影响,电商所经营的大量货物长期处于库存不健康状态,即货物库存量大于健康库存量。当该问题被监控系统发现,电商运营部门迫切需要找到将货物库存快速降低到健康库存线以下的方法。
现行的清仓策略中,主要由采销人员根据货物销售的实际情况和对货物未来因变量的判断,依据经验,人工决定是否对特定货物进行降价清仓。对于被判定为适合进行降价清仓的货物,采销人员通过人工设定的方式修改网页第一自变量并发布。随后,采销人员人工观察该货物在降价后的销售情况,判断将货物的价格回调或者退货。
上述对货物清仓的方法,整个清仓过程主要依赖于采销人员的经验,没有针对销量受价格等因素影响的客观变化情况进行量化分析,清仓效果难以保证。
发明内容
本发明所要实现的一个目的是:提出一种对货物销量和价格等因素进行客观大数据分析从而确定清仓价格的方法,能够提高在给定时间内完成清仓目标的概率。
根据本发明的一个方面,提供的一种数据挖掘方法,包括:获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;根据待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系;确定预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示;根据待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对优化目标关系表示中的预设时间段内因变量总值进行替换,确定优化目标关系表示中的第一自变量值。
在一个实施例中,确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系包括:建立待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;利用待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据对线性关系进行线性回归拟合,确定线性关系中第一自变量信息的系数、第二自变量的系数、常数项以及随机误差项的分布,进而确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。
在一个实施例中,根据待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系包括:将待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系转换为待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差项的指数关系;按照预设时间段的时长,将预设时间段内待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差的指数关系相加,得到预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系。
在一个实施例中,根据待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系,对优化目标关系表示中的预设时间段内因变量总值进行替换,确定优化目标关系表示中的第一自变量值包括:利用待清仓货物在预设时间段内因变量总值与第二自变量和预设时间段内随机误差信息项的关系中的预设时间段内第一自变量信息、第二自变量、常数项以及预设时间段内随机误差信息项,对优化目标关系表示中的预设时间段内因变量总值进行替换;在给定第二自变量值的情况下,根据预设时间段内随机误差信息项的分布情况,确定优化目标关系表示中的第一自变量值。
在一个实施例中,预设时间段内随机误差信息项的分布情况采用以下方法确定:利用蒙特卡洛算法根据随机误差的正态分布对每天的随机误差进行采样;对每天的随机误差采样值进行指数运算,得到每天的随机误差指数项的采样值,按照预设时间段的时长,将每天的随机误差指数项的采样值进行分组,并将每组内的每天的随机误差指数项的采样值进行加和,得到预设时间段内随机误差指数项的多个加和值,对所述预设时间段内随机误差指数项的多个加和值分别进行对数运算,得到预设时间段内随机误差信息项的多个采样值,进而确定所述预设时间段内随机误差信息项的分布情况。
在一个实施例中,该方法还包括:确定货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;将货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系中第一自变量信息的系数作为第一自变量弹性系数,并与第一自变量弹性阈值进行比对,如果第一自变量弹性系数小于第一自变量弹性阈值,则将货物确定为待清仓货物。
在一个实施例中,该方法还包括:将确定的优化目标关系表示中的第一自变量值与清仓最低阈值进行比对,如果确定的优化目标关系表示中的第一自变量大于或等于清仓最低阈值,则按照确定的优化目标关系表示中第一自变量进行清仓;或者,将确定的优化目标关系表示中第一自变量与清仓最高阈值进行比对,如果确定的优化目标关系表示中第一自变量大于或等于清仓最高阈值,则对待清仓货物按照清仓最高阈值进行清仓。
在一个实施例中,因变量为销量,第一自变量为价格,第二自变量为库存状态,因变量信息为销量的自然对数值,第一自变量信息为价格的自然对数值。
根据本发明的第二个方面,提供的一种数据挖掘装置,包括:第一关系确定模块,用于获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;第二关系确定模块,用于根据待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系;优化目标关系表示确定模块,用于确定预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示;第一自变量确定模块,用于根据待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对优化目标关系表示中的预设时间段内因变量总值进行替换,确定优化目标关系表示中的第一自变量值。
在一个实施例中,第一关系确定模块,用于建立待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,利用待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据对线性关系进行线性回归拟合,确定线性关系中第一自变量信息的系数、第二自变量的系数、常数项以及随机误差项的分布,进而确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。
在一个实施例中,第二关系确定模块,用于将待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系转换为待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差项的指数关系,按照预设时间段的时长,将预设时间段内待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差的指数关系相加,得到预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系。
在一个实施例中,第一自变量确定模块,用于利用待清仓货物在预设时间段内因变量总值与第二自变量和预设时间段内随机误差信息项的关系中的预设时间段内第一自变量信息、第二自变量、常数项以及预设时间段内随机误差信息项,对优化目标关系表示中的预设时间段内因变量总值进行替换,在给定第二自变量值的情况下,根据预设时间段内随机误差信息项的分布情况,确定优化目标关系表示中的第一自变量值。
在一个实施例中,该装置还包括:随机误差信息项分布确定模块,用于利用蒙特卡洛算法根据随机误差的正态分布对每天的随机误差进行采样,对每天的随机误差采样值进行指数运算,得到每天的随机误差指数项的采样值,按照预设时间段的时长,将每天的随机误差指数项的采样值进行分组,并将每组内的每天的随机误差指数项的采样值进行加和,得到预设时间段内随机误差指数项的多个加和值,对所述预设时间段内随机误差指数项的多个加和值分别进行对数运算,得到预设时间段内随机误差信息项的多个采样值,进而确定所述预设时间段内随机误差信息项的分布情况。
在一个实施例中,该装置还包括:清仓货物确定模块,用于确定货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,将货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系中第一自变量信息的系数作为第一自变量弹性系数,并与第一自变量弹性阈值进行比对,如果第一自变量弹性系数小于第一自变量弹性阈值,则将货物确定为待清仓货物。
在一个实施例中,该装置还包括:第一自变量复选模块,用于将确定的优化目标关系表示中的第一自变量值与清仓最低阈值进行比对,如果确定的优化目标关系表示中的第一自变量大于或等于清仓最低阈值,则按照确定的优化目标关系表示中第一自变量进行清仓,或者,将确定的优化目标关系表示中第一自变量与清仓最高阈值进行比对,如果确定的优化目标关系表示中第一自变量大于或等于清仓最高阈值,则对待清仓货物按照清仓最高阈值进行清仓。
根据本发明的第三个方面,提供的一种数据挖掘装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器设备中的指令,执行如前述任一个实施例中的数据挖掘方法。
根据本发明的第四个方面,提供的一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任一个实施例中的数据挖掘方法的步骤。
本发明中获取货物的销量和价格等历史数据,利用数据挖掘方法自动对货物销售的海量数据进行大数据分析,利用货物销量受价格等因素影响的客观规律,构建影响清仓的各变量间的关系表示以及优化目标关系表示,制定能够在给定时间内完成清仓目标的清仓价格,提高了在给定时间内完成清仓目标的概率,提高了货物清仓的效果。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明的一个实施例的数据挖掘装置的结构示意图。
图2示出本发明的另一个实施例的数据挖掘装置的结构示意图。
图3示出本发明的一个实施例的数据挖掘方法的流程示意图。
图4示出本发明的另一个实施例的数据挖掘方法的流程示意图。
图5示出本发明的又一个实施例的数据挖掘方法的流程示意图。
图6示出本发明的再一个实施例的数据挖掘方法的流程示意图。
图7示出本发明的又一个实施例的数据挖掘装置的结构示意图。
图8示出本发明的再一个实施例的数据挖掘装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对现有技术中清仓价格的制定依赖于采销人员的经验,没有针对销量受价格等因素影响的客观变化情况进行量化分析,清仓效果难以保证的问题,提出本方案
本发明的实施例中的数据挖掘装置可各由各种计算设备或计算机系统来实现,下面结合图1以及图2进行描述。
图1为本发明数据挖掘装置的一个实施例的结构图。如图1所示,该实施例的装置10包括:存储器110以及耦接至该存储器110的处理器120,处理器120被配置为基于存储在存储器110中的指令,执行本发明中任意一个实施例中的数据挖掘方法。
其中,存储器110例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。
图2为本发明数据挖掘装置的另一个实施例的结构图。如图2所示,该实施例的装置10包括:存储器110以及处理器120,还可以包括输入输出接口230、网络接口240、存储接口250等。这些接口230,240,250以及存储器110和处理器120之间例如可以通过总线260连接。其中,输入输出接口230为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口240为各种联网设备提供连接接口,例如可以连接到数据库服务器或者云端存储服务器等。存储接口250为SD卡、U盘等外置存储设备提供连接接口。
下面结合图3描述本发明的数据挖掘方法。
图3为本发明数据挖掘方法一个实施例的流程图。如图3所示,该实施例的方法包括:
步骤S302,获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。
其中,确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,即确定待清仓货物的每天的因变量信息同时受第一自变量信息、第二自变量和随机误差项三者影响而产生变化的客观规律。具体的,建立待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,利用待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据对线性关系进行线性回归拟合,确定线性关系中第一自变量信息的系数、第二自变量的系数、常数项以及随机误差项的分布,进而确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。
步骤S304,根据待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系。
具体的,将待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系转换为待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差项的指数关系;按照预设时间段的时长,将预设时间段内待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差的指数关系相加,得到预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系。
步骤S306,确定预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示。
步骤S308,根据待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对优化目标关系表示中的预设时间段内因变量总值进行替换,确定优化目标关系表示中的第一自变量值。
具体的,利用待清仓货物在预设时间段内因变量总值与第二自变量和预设时间段内随机误差信息项的关系中的预设时间段内第一自变量信息、第二自变量、常数项以及预设时间段内随机误差信息项,对优化目标关系表示中的预设时间段内因变量总值进行替换;在给定第二自变量值的情况下,根据预设时间段内随机误差信息项的分布情况,确定优化目标关系表示中的第一自变量值。
其中,预设时间段内随机误差信息项的分布情况采用以下方法确定:利用蒙特卡洛算法根据随机误差的正态分布对每天的随机误差进行采样;对每天的随机误差采样值进行指数运算,得到每天的随机误差指数项的采样值;按照预设时间段的时长,将每天的随机误差指数项的采样值进行分组,并将每组内的每天的随机误差指数项的采样值进行加和,得到预设时间段内随机误差指数项的多个加和值,对预设时间段内随机误差指数项的多个加和值分别进行对数运算,得到预设时间段内随机误差信息项的多个采样值,进而确定预设时间段内随机误差信息项的分布情况。
上述实施例的方法应用在货物清仓价格的制定时,因变量为销量,第一自变量为价格,第二自变量为库存状态,因变量信息为销量的自然对数值,第一自变量信息为价格的自然对数值。
上述实施例的方法应用在货物清仓价格的制定时,能够获取货物的销量和价格等历史数据,利用数据挖掘方法自动对货物销售的海量数据进行大数据分析,利用货物销量受价格等因素影响的客观规律,构建影响清仓的各变量间的关系表示以及优化目标关系表示,制定能够在给定时间内完成清仓目标的清仓价格,提高了在给定时间内完成清仓目标的概率,提高了货物清仓的效果。
本发明的方案适用于货物清仓价格的制定,下面以货物清仓价格的制定的场景为例描述本发明的数据挖掘方法。
图4为本发明数据挖掘方法另一个实施例的流程图。如图4所示,该实施例的方法包括:
步骤S402,获取待清仓货物的每天的销量信息、价格信息和库存状态的历史数据,确定待清仓货物的每天的销量信息与价格信息、库存状态和随机误差项的线性关系。
具体的,首先构建待清仓货物的每天的销量信息与价格信息、库存状态和随机误差项的线性关系模型如下:
ln(Q)=β0+β1ln(P)+β2Sinv+∈ (1)
其中,Q表示货物每天的销量,ln(Q)表示每天的销量信息即每天销量的自然对数,β0为常数项,P表示货物的价格,ln(P)表示价格信息即价格的自然对数,β1为价格信息的系数,Sinv表示库存状态,β2为库存状态的系数,∈表示随机误差项,是不能被模型描述的部分,是指以上三部分拟合完真实数据后剩余的部分,即真实销量的对数与模型拟合的销量的对数的差异,理想的拟合模型其误差项应该服从正态分布(均值为0),表示模型已经把可以描述的特征信息完全表达出来,剩余的全是随机噪声。
其中,库存状态Sinv可以采用以下公式计算:
公式(2)中,对于一种货物存储于N个仓库中,wi为仓库i的权重,Si为仓库i的库存状态,Si取值为1表示库存充足,取值为0表示缺货。N为总仓库数。wi是一定历史时期内的仓库i的销量除以该历史时期内货物的总销量的比值。
然后,利用获取的待清仓货物的每天的销量信息、价格信息和库存状态的历史数据对线性关系模型进行线性回归拟合,确定线性关系中价格信息的系数、库存状态的系数、常数项以及随机误差项的分布,进而确定待清仓货物的每天的销量信息与价格信息、库存状态和随机误差项的线性关系模型。
具体的,采用线性回归的方法对线性关系模型进行拟合:预设β0、β1、β2的初始值,将货物的价格P、库存状态Sinv代入线性关系模型中得到使得最小的β0、β1、β2确定为该线性模型的各个系数和常数项,β0、β1、β2调整过程可以按照预设步长以及计算获得的参数调整方向即梯度进行调整,经过多次迭代最终使最小。拟合过程中还可以得到随机误差项∈的正态分布的均值和方差。
步骤S404,根据待清仓货物的每天的销量信息与价格信息、库存状态和随机误差项的线性关系,确定待清仓货物在预设清仓时间段内销量总值与价格信息、库存状态和预设清仓时间段内的随机误差信息项的关系。
具体的,首先将待清仓货物的每天的销量信息与价格信息、库存状态和随机误差项的线性关系转换为待清仓货物的每天的销量与价格信息、库存状态和随机误差项的指数关系,即根据公式(1)进行转换得到公式(3)如下:
然后,按照预设清仓时间段的时长,将预设清仓时间段内待清仓货物的每天的销量与价格信息、库存状态和随机误差的指数关系相加,得到销量总值与价格信息、库存状态和预设清仓时间段内随机误差信息项的关系,即将预设清仓时间段内每天的销量按照公式(3)进行相加得到公式(4)如下:
公式(4)中T表示预设清仓时间段包含的天数,Qi表示预设清仓时间段内第i天的销量,表示预设清仓时间段内的销量总值,1≤i≤T,且i为正整数,对于不同天数的销量∈i的值不同,表示预设清仓时间段内随机误差指数项。
步骤S406,确定预设清仓时间段内销量总值不小于目标清仓量的概率达到预设概率的优化目标关系表示。
其中,以在预设清仓时间段内完成清仓目标即销量总值不小于目标清仓量,达到预设概率为优化目标,例如在7天内完成销售100件货物的清仓目标,要保证概率在90%以上,确定此时的清仓价格。
优化目标关系表示如公式(5):
其中,P(·)表示求概率,Qtarget表示目标清仓量,α表示预设概率。
步骤S408,根据待清仓货物在预设清仓时间段内销量总值与价格信息、库存状态和预设清仓时间段内的随机误差信息项的关系,对优化目标关系表示中的预设清仓时间段内销量总值进行替换,确定优化目标关系表示中的价格值,作为清仓价格。
具体的,首先利用待清仓货物在预设清仓时间段内销量总值与库存状态和预设清仓时间段内随机误差信息项的关系中的预设清仓时间段内价格信息、库存状态、常数项以及预设清仓时间段内随机误差信息项,对优化目标关系表示中的预设清仓时间段内销量总值进行替换。即将公式(4)中预设清仓时间段内的销量总值的表达式代入公式(5)得到如下公式(6):
然后,在给定库存状态值的情况下,根据预设清仓时间段内随机误差信息项的分布情况,确定优化目标关系中的价格值。在清仓时通常各个仓库的库存充足,库存状态为1,因此,Sinv=1,设C=β0+β2Sinv,在给定库存状态值的情况下,C为常数,对公式(6)进行如下变换:
将常数C代入公式(6)得到公式(7):
对不等式两边进行对数运算得到公式(8):
对公式(8)根据分位数的概念进行进一步变换得到公式(9):
其中,表示表示的α分位数。
根据公式(9)可以看出只需要求出的α分位数即可求得价格值。欲求的α分位数需要求出的分布情况,为预设时间段内随机误差信息项。
预设时间段内随机误差信息项的分布情况采用以下方法确定:
利用蒙特卡洛算法根据随机误差∈i的正态分布对每天的随机误差进行采样,例如采样70000个点,对每天的随机误差采样值进行指数运算,得到每天的随机误差指数项的采样值例如70000个采样值,按照预设时间段的时长,例如7天,将每天的随机误差指数项的采样值进行分组,分为10000组,并将每组内的每天的随机误差指数项的采样值进行加和,得到预设时间段内随机误差指数项的多个加和值例如10000个随机误差指数项的加和值,对预设时间段内随机误差指数项的多个加和值分别进行对数运算,得到预设时间段内随机误差信息项的多个采样值即10000个的采样值,根据预设时间段内随机误差信息项的多个采样值即可描绘出分布曲线进而确定预设时间段内随机误差信息项的分布情况。
本发明在对待清仓的货物进行清仓价格的制定之前,还提供一种对于待清仓的货物进行初选的方法,下面结合图5进行描述。
图5为本发明数据挖掘方法又一个实施例的流程图。如图5所示,该实施例的方法包括:
步骤S502,可选的,确定货物的不健康库存量,当货物的不健康库存量高于不健康库存阈值时,将该货物确定为待清仓货物,将该货物的不健康库存量确定为目标清仓量。
具体的,货物的不健康库存量采用以下方法确定:满足前库存量加预设清仓时间段内的到货期望再减去不健康库存量不高于健康库存量阈值即清仓后的库存量不高于健康库存量阈值的条件时的不健康库存量的值,其中,预设清仓时间段内的到货期望为根据历史数据统计预设清仓时间段的时长内到货的期望值,健康库存量阈值为根据历史数据进行统计分析获得的能够使得货物不积压的健康库存量阈值。货物的不健康库存量可以采用以下公式计算:
Inventoryt+Qarrive,t-Dt·salest≤Inventorysafe,t+1 (10)
公式(10)中,t表示第t个预设清仓时间段,Qarrive,t表示预设清仓时间段内到货数量的望值。Inventoryt为调用接口时的总库存。Dt为预设清仓时间段,Inventorysafr,t+1表示下一个预设清仓时间段内的健康库存量阈值。
其中,Inventorysafe,t+1根据以下公式计算:
其中,Dt表示预设清仓时间段;DT为健康库存量阈值计算所需历史数据时间,例如为28天,Da为统计经验数据例如60天或90天,salesT-t表示预设清仓时间段内与健康库存量阈值计算所需历史数据时间差内的历史销量(日平均销量)。
将公式(11)代入公式(10)得到如下公式:
根据公式(12)即可求得不健康库存量Dt·salest的最小值,与不健康库存阈值进行比对,如果高于不健康库存阈值,将该货物确定为待清仓货物,将该货物的不健康库存量确定为目标清仓量,可以设置待清仓货物集合,将货物的SKU加入该集合中即表示该货物被设置为清仓货物,后续可根据SKU获取货物的历史数据用于后续清仓价格的确定过程。
上述方法,根据历史数据进行客观的统计分析,对货物的不健康库存量进行估计,选择合适的货物进行清仓,进一步提高清仓的效果。
步骤S504,获取待清仓货物的每天的销量信息、价格信息和库存状态的历史数据,确定待清仓货物的每天的销量信息与价格信息、库存状态和随机误差项的线性关系。
步骤S506,可选的,将待清仓货物的每天的销量信息与价格信息、库存状态和随机误差项的线性关系中的价格信息的系数确定为价格弹性,将价格弹性与价格弹性阈值进行比对,如果小于价格弹性阈值,则不再对该待清仓货物进行后续的清仓过程。
其中,根据公式(1),设D=β0+β2Sinv+∈,则有且根据价格弹性的定义则:
当P与P0接近时,可近似认为β1为货物在P0附近的价格弹性。货物的价格弹性可以反映销量受价格影响的灵敏度,价格弹性低的货物调整价格也不会对销量产生较大的影响,因此这类货物不适合降价清仓,不应作为待清仓货物,即将货物的SKU从待清仓货物集合中删除。发明人根据数据分析得出,价格弹性阈值可设置为-0.5。
上述方法,客观分析货物的价格弹性,对于价格弹性低不适合进行降价清仓的商品不进行降价处理,避免对这类货物进行无效的清仓活动,节约资源,提高整体的清仓效果。
步骤S508,可选的,确定对待清仓货物的每天的销量信息与价格信息、库存状态和随机误差项的线性关系进行拟合的拟合度,将拟合度与拟合度阈值进行比对,如果小于拟合度阈值,则不对该待清仓货物进行后续的清仓过程。
线性关系拟合度低的货物的销量信息受价格信息和库存状态等因素的影响不符合线性关系,不适用于本方案的方法,则不对这类货物进行后续的清仓处理,即将货物的SKU从待清仓货物集合中删除,这类货物属于少数,通常需要单独对这类货物进行数据分析确定销量信息与价格信息和库存状态的关系后,再进行相应的处理。上述方法避免了进行无效的清仓活动,节约资源,提高整体的清仓效果。
步骤S510,根据待清仓货物的每天的销量信息与价格信息、库存状态和随机误差项的线性关系,确定待清仓货物在预设清仓时间段内销量总值与价格信息、库存状态和预设清仓时间段内的随机误差信息项的关系。
步骤S512,确定预设清仓时间段内销量总值不小于目标清仓量的概率达到预设概率的优化目标关系表示。
步骤S514,根据待清仓货物在预设清仓时间段内销量总值与价格信息、库存状态和预设清仓时间段内的随机误差信息项的关系,对优化目标关系表示中的预设清仓时间段内销量总值进行替换,确定优化目标关系表示中的价格值,作为清仓价格。
步骤S510至S514参考图4的实施例中的描述。
本发明在对待清仓的货物进行清仓价格的制定之后,还提供一种对于清仓价格进行复选和约束的方法,下面结合图6进行描述。
图6为本发明数据挖掘方法又一个实施例的流程图。如图6所示,在步骤S514之后还包括:
步骤S616,可选的,将确定的清仓价格与清仓最低阈值进行比对,如果清仓价格大于或等于清仓最低阈值,则按照清仓价格进行清仓,否则,不对该待清仓货物进行清仓。
步骤S618,可选的,将确定的清仓价格与清仓最高阈值进行比对,如果清仓价格大于清仓最高阈值,则将清仓最高阈值设置为清仓价格。
步骤S620,可选的,将目标清仓量与日均销量和预设清仓时间段的乘积进行比对,如果符合预设条件,则对待清仓货物按照清仓价格进行清仓,否则,不对待清仓货物进行清仓。
该步骤也可以在步骤S502之后执行。发明人根据数据统计得到,目标清仓量与日均销量和预设清仓时间段的乘积的比值应不小于2且不大于15,即日均销量为根据该货物的历史销量进行统计得出的。
上述实施例的方法,可以使货物的清仓活动符合正常的销售行为,避免出现不合理的销售行为以及无效的清仓活动。
本发明还提供一种数据挖掘装置,下面结合图7进行描述。
图7为本发明数据挖掘装置又一个实施例的结构图。,如图7所示,该装置70包括:
第一关系确定模块702,用于获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。
其中,第一关系确定模块702,用于建立待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,利用待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据对线性关系进行线性回归拟合,确定线性关系中第一自变量信息的系数、第二自变量的系数、常数项以及随机误差项的分布,进而确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。
第二关系确定模块704,用于根据待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系。
其中,第二关系确定模块,用于将待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系转换为待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差项的指数关系,按照预设时间段的时长,将预设时间段内待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差的指数关系相加,得到预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系。
优化目标关系表示确定模块706,用于确定预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示。
第一自变量确定模块708,用于根据待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对优化目标关系表示中的预设时间段内因变量总值进行替换,确定优化目标关系表示中的第一自变量值。
其中,第一自变量确定模块708,用于利用待清仓货物在预设时间段内因变量总值与第二自变量和预设时间段内随机误差信息项的关系中的预设时间段内第一自变量信息、第二自变量、常数项以及预设时间段内随机误差信息项,对优化目标关系表示中的预设时间段内因变量总值进行替换,在给定第二自变量值的情况下,根据预设时间段内随机误差信息项的分布情况,确定优化目标关系表示中的第一自变量值。
进一步的,还包括:随机误差信息项分布确定模块710,用于利用蒙特卡洛算法根据随机误差的正态分布对每天的随机误差进行采样,对每天的随机误差采样值进行指数运算,得到每天的随机误差指数项的采样值,按照预设时间段的时长,将每天的随机误差指数项的采样值进行分组,并将每组内的每天的随机误差指数项的采样值进行加和,得到预设时间段内随机误差指数项的多个加和值,对预设时间段内随机误差指数项的多个加和值分别进行对数运算,得到预设时间段内随机误差信息项的多个采样值,进而确定预设时间段内随机误差信息项的分布情况。
上述实施例的装置应用在货物清仓价格的制定时,因变量为销量,第一自变量为价格,第二自变量为库存状态,因变量信息为销量的自然对数值,第一自变量信息为价格的自然对数值。
下面结合图8描述本发明数据挖掘装置的另一个实施例。
图8为本发明数据挖掘装置再一个实施例的结构图。,如图8所示,该装置70还包括:
清仓货物确定模块810,用于确定货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,将货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系中第一自变量信息的系数作为第一自变量弹性系数,并与第一自变量弹性阈值进行比对,如果第一自变量弹性系数小于第一自变量弹性阈值,则将货物确定为待清仓货物。
第一自变量复选模块812,用于将确定的优化目标关系表示中的第一自变量值与清仓最低阈值进行比对,如果确定的优化目标关系表示中的第一自变量大于或等于清仓最低阈值,则按照确定的优化目标关系表示中第一自变量进行清仓,或者,将确定的优化目标关系表示中第一自变量与清仓最高阈值进行比对,如果确定的优化目标关系表示中第一自变量大于或等于清仓最高阈值,则对待清仓货物按照清仓最高阈值进行清仓。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任一个实施例中的数据挖掘方法的步骤。
本领域内的技术人员应当明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (17)
1.一种数据挖掘方法,其特征在于,包括:
获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;
根据所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系;
确定所述预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示;
根据所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换,确定所述优化目标关系表示中的第一自变量值。
2.根据权利要求1所述的方法,其特征在于,
所述确定待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系包括:
建立所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;
利用所述待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据对所述线性关系进行线性回归拟合,确定所述线性关系中第一自变量信息的系数、第二自变量的系数、常数项以及随机误差项的分布,进而确定所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。
3.根据权利要求1所述的方法,其特征在于,
所述根据所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系包括:
将所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系转换为所述待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差项的指数关系;
按照预设时间段的时长,将预设时间段内所述待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差的指数关系相加,得到预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系。
4.根据权利要求1所述的方法,其特征在于,
所述根据所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换,确定所述优化目标关系表示中的第一自变量值包括:
利用所述待清仓货物在预设时间段内因变量总值与第二自变量和预设时间段内随机误差信息项的关系中的所述预设时间段内第一自变量信息、第二自变量、常数项以及所述预设时间段内随机误差信息项,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换;
在给定第二自变量值的情况下,根据所述预设时间段内随机误差信息项的分布情况,确定所述优化目标关系表示中的第一自变量值。
5.根据权利要求4所述的方法,其特征在于,
所述预设时间段内随机误差信息项的分布情况采用以下方法确定:
利用蒙特卡洛算法根据所述随机误差的正态分布对每天的随机误差进行采样;
对每天的随机误差采样值进行指数运算,得到每天的随机误差指数项的采样值;
按照预设时间段的时长,将每天的随机误差指数项的采样值进行分组,并将每组内的每天的随机误差指数项的采样值进行加和,得到预设时间段内随机误差指数项的多个加和值,对所述预设时间段内随机误差指数项的多个加和值分别进行对数运算,得到预设时间段内随机误差信息项的多个采样值,进而确定所述预设时间段内随机误差信息项的分布情况。
6.根据权利要求1所述的方法,其特征在于,还包括:
确定货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;
将货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系中第一自变量信息的系数作为第一自变量弹性系数,并与第一自变量弹性阈值进行比对,如果所述第一自变量弹性系数小于所述第一自变量弹性阈值,则将所述货物确定为待清仓货物。
7.根据权利要求1所述的方法,其特征在于,还包括:
将确定的所述优化目标关系表示中的第一自变量值与清仓最低阈值进行比对,如果确定的所述优化目标关系表示中的第一自变量大于或等于所述清仓最低阈值,则按照确定的所述优化目标关系表示中第一自变量进行清仓;
或者,将确定的所述优化目标关系表示中第一自变量与清仓最高阈值进行比对,如果确定的所述优化目标关系表示中第一自变量大于或等于所述清仓最高阈值,则对所述待清仓货物按照所述清仓最高阈值进行清仓。
8.根据权利要求1-7任一项所述的方法,其特征在于,
所述因变量为销量,所述第一自变量为价格,所述第二自变量为库存状态,所述因变量信息为销量的自然对数值,所述第一自变量信息为价格的自然对数值。
9.一种数据挖掘装置,其特征在于,包括:
第一关系确定模块,用于获取待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据,确定所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系;
第二关系确定模块,用于根据所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,确定所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系;
优化目标关系表示确定模块,用于确定所述预设时间段内因变量总值不小于目标因变量总值的概率达到预设概率的优化目标关系表示;
第一自变量确定模块,用于根据所述待清仓货物在预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内的随机误差信息项的关系,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换,确定所述优化目标关系表示中的第一自变量值。
10.根据权利要求9所述的装置,其特征在于,
所述第一关系确定模块,用于建立所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,利用所述待清仓货物的每天的因变量信息的历史数据、第一自变量信息的历史数据和第二自变量的历史数据对所述线性关系进行线性回归拟合,确定所述线性关系中第一自变量信息的系数、第二自变量的系数、常数项以及随机误差项的分布,进而确定所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系。
11.根据权利要求9所述的装置,其特征在于,
所述第二关系确定模块,用于将所述待清仓货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系转换为所述待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差项的指数关系,按照预设时间段的时长,将预设时间段内所述待清仓货物的每天的因变量与第一自变量信息、第二自变量和随机误差的指数关系相加,得到预设时间段内因变量总值与第一自变量信息、第二自变量和预设时间段内随机误差信息项的关系。
12.根据权利要求9所述的装置,其特征在于,
所述第一自变量确定模块,用于利用所述待清仓货物在预设时间段内因变量总值与第二自变量和预设时间段内随机误差信息项的关系中的所述预设时间段内第一自变量信息、第二自变量、常数项以及所述预设时间段内随机误差信息项,对所述优化目标关系表示中的所述预设时间段内因变量总值进行替换,在给定第二自变量值的情况下,根据所述预设时间段内随机误差信息项的分布情况,确定所述优化目标关系表示中的第一自变量值。
13.根据权利要求9所述的装置,其特征在于,还包括:
随机误差信息项分布确定模块,用于利用蒙特卡洛算法根据所述随机误差的正态分布对每天的随机误差进行采样,对每天的随机误差采样值进行指数运算,得到每天的随机误差指数项的采样值,按照预设时间段的时长,将每天的随机误差指数项的采样值进行分组,并将每组内的每天的随机误差指数项的采样值进行加和,得到预设时间段内随机误差指数项的多个加和值,对所述预设时间段内随机误差指数项的多个加和值分别进行对数运算,得到预设时间段内随机误差信息项的多个采样值,进而确定所述预设时间段内随机误差信息项的分布情况。
14.根据权利要求1所述的装置,其特征在于,还包括:
清仓货物确定模块,用于确定货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系,将货物的每天的因变量信息与第一自变量信息、第二自变量和随机误差项的线性关系中第一自变量信息的系数作为第一自变量弹性系数,并与第一自变量弹性阈值进行比对,如果所述第一自变量弹性系数小于所述第一自变量弹性阈值,则将所述货物确定为待清仓货物。
15.根据权利要求1所述的装置,其特征在于,还包括:
第一自变量复选模块,用于将确定的所述优化目标关系表示中的第一自变量值与清仓最低阈值进行比对,如果确定的所述优化目标关系表示中的第一自变量大于或等于所述清仓最低阈值,则按照确定的所述优化目标关系表示中第一自变量进行清仓,或者,将确定的所述优化目标关系表示中第一自变量与清仓最高阈值进行比对,如果确定的所述优化目标关系表示中第一自变量大于或等于所述清仓最高阈值,则对所述待清仓货物按照所述清仓最高阈值进行清仓。
16.一种数据挖掘装置,其特征在于,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器设备中的指令,执行如权利要求1-8任一项所述的数据挖掘方法。
17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-8任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710066296.0A CN108399170A (zh) | 2017-02-07 | 2017-02-07 | 数据挖掘方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710066296.0A CN108399170A (zh) | 2017-02-07 | 2017-02-07 | 数据挖掘方法以及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108399170A true CN108399170A (zh) | 2018-08-14 |
Family
ID=63093646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710066296.0A Pending CN108399170A (zh) | 2017-02-07 | 2017-02-07 | 数据挖掘方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108399170A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245989A (zh) * | 2019-06-18 | 2019-09-17 | 杉数科技(北京)有限公司 | 一种商品资源配置的方法及系统 |
CN112784213A (zh) * | 2019-11-08 | 2021-05-11 | 北京沃东天骏信息技术有限公司 | 一种生成信息的方法和装置 |
-
2017
- 2017-02-07 CN CN201710066296.0A patent/CN108399170A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245989A (zh) * | 2019-06-18 | 2019-09-17 | 杉数科技(北京)有限公司 | 一种商品资源配置的方法及系统 |
CN112784213A (zh) * | 2019-11-08 | 2021-05-11 | 北京沃东天骏信息技术有限公司 | 一种生成信息的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ferrier et al. | A new predictor of the irreplaceability of areas for achieving a conservation goal, its application to real-world planning, and a research agenda for further refinement | |
WO2020048051A1 (zh) | 理财产品推荐方法、服务器及计算机可读存储介质 | |
CN109961165B (zh) | 件量预测方法、装置、设备及其存储介质 | |
CN110689395B (zh) | 用于推送信息的方法和装置 | |
CN110930179A (zh) | 任务评估方法、系统、设备和计算机可读存储介质 | |
CN110766184A (zh) | 订单量预测方法和装置 | |
CN110795324B (zh) | 一种数据处理方法及装置 | |
CN113869768A (zh) | 产业链强弱度的评价方法、装置、设备及可读介质 | |
CN110866625A (zh) | 促销指标信息生成方法和装置 | |
CN108399170A (zh) | 数据挖掘方法以及装置 | |
Truong et al. | Modeling non-compensatory preferences in environmental valuation | |
CN118485444A (zh) | 一种基于大数据的智能客户关系管理系统 | |
AU2021204470A1 (en) | Benefit surrender prediction | |
CN110874640B (zh) | 使用机器学习(ml)的间歇数据的分布选择和模拟 | |
CN112581181A (zh) | 申报价格的异常挖掘方法、装置、电子设备及可读介质 | |
CN112785443A (zh) | 基于客户群体的理财产品推送方法及装置 | |
Stevenson et al. | Methods for handling uncertainty within pharmaceutical funding decisions | |
CN115713384A (zh) | 推荐物品的方法、装置、存储介质及电子设备 | |
CN116228284A (zh) | 货品需求预测方法、训练方法、装置、计算机系统及介质 | |
CN115062687A (zh) | 企业信用监控方法、装置、设备及存储介质 | |
Rahman et al. | Forecasting ASEAN countries exchange rates using auto regression model based on triangular fuzzy number | |
CN114723239A (zh) | 一种多方协同建模方法、装置、设备、介质及程序产品 | |
CN114239985A (zh) | 汇率预测方法、装置、电子设备及存储介质 | |
CN109754175B (zh) | 用于对行政审批事项的办结时限进行压缩预测的计算模型及其应用 | |
CN109934604B (zh) | 销量数据的处理方法、系统、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180814 |
|
RJ01 | Rejection of invention patent application after publication |