CN112115129A - 一种基于机器学习的零售终端样本抽样方法 - Google Patents

一种基于机器学习的零售终端样本抽样方法 Download PDF

Info

Publication number
CN112115129A
CN112115129A CN202010972202.8A CN202010972202A CN112115129A CN 112115129 A CN112115129 A CN 112115129A CN 202010972202 A CN202010972202 A CN 202010972202A CN 112115129 A CN112115129 A CN 112115129A
Authority
CN
China
Prior art keywords
retail
sample
sales
user
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010972202.8A
Other languages
English (en)
Other versions
CN112115129B (zh
Inventor
周凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Software Co Ltd
Original Assignee
Inspur Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Co Ltd filed Critical Inspur Software Co Ltd
Priority to CN202010972202.8A priority Critical patent/CN112115129B/zh
Publication of CN112115129A publication Critical patent/CN112115129A/zh
Application granted granted Critical
Publication of CN112115129B publication Critical patent/CN112115129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于机器学习的零售终端样本抽样方法,涉及数据处理技术领域,其包括:采集某区域零售终端的零售户基本信息及销售数据;基于零售户的基本信息及销售数据,设定阈值,清洗去除异常零售户;根据所采集的零售户基本信息及销售数据,选取既有特征或自定义特征;基于机器学习算法,根据零售户的既有特征或自定义特征,确定样本分层数;基于零售户的销售数据,获取购进量,确定每层样本量并随机抽样得出样本列表;将清洗后的零售户划分为样本零售户组和非样本零售户组,以每一样本零售户为质心,计算同层其余零售户与该样本零售户的距离,选定多个替换样本并存储于替换样本库。本发明可以提高分层的准确性和分析的鲁棒性。

Description

一种基于机器学习的零售终端样本抽样方法
技术领域
本发明涉及数据处理技术领域,具体的说是一种基于机器学习的零售终端样本抽样方法。
背景技术
随着现代零售终端的不断发展,客户数和客户质量越来越高,利用好这些数据的价值就能得到对市场环境的清醒洞察,从而便于企业进一步有效制定营销手段、进行货品精准投放、指导现代终端客户合理布局等策略。但是零售客户众多,信息量庞大且信息内容参差不齐,分析起来较为困难,而对部分优质客户的分析便能还原出整体的市场状态,所以,如何从庞大的零售客户中选出优质样本显得尤为重要。
目前对于零售终端样本选取的方法中,大多还是使用简单随机抽样方法或分层抽样方法。使用简单随机抽样方法将会忽略样本的特殊性,存在数据代表性不足的缺点,分层抽样方法虽然弥补了简单随机抽样方法的缺点,但分层的合理性严重影响着分析结果的正确性,依然存在较大的改进空间。故需要结合样本较为全面的特征,开发一整套样本抽样与维护的方法,从而能在一个较为准确的起点开展对市场状况的分析。
发明内容
本发明为了克服现有零售终端样本抽样方法存在的数据代表性不足、分层可靠性较低等不足,提供一种基于机器学习的零售终端样本抽样方法。
本发明的一种基于机器学习的零售终端样本抽样方法,解决上述技术问题采用的技术方案如下:
一种基于机器学习的零售终端样本抽样方法,该方法包括如下内容:
S1、数据采集阶段:采集某区域零售终端的零售户基本信息及销售数据;
S2、数据清洗阶段:基于零售户的基本信息及销售数据,设定阈值,对零售户进行清洗,去除异常零售户;
S3、特征选取阶段:根据所采集的零售户基本信息及销售数据,选取既有特征或自定义特征;
S4、数据分层阶段:基于机器学习算法,根据零售户的既有特征或自定义特征,确定样本分层数;
S5、样本选取阶段:基于零售户的销售数据,获取该零售户的购进量,进而确定每层样本量并随机抽样得出样本列表;
S6、替换样本预备阶段:将经过数据清洗阶段的零售户划分为样本零售户组和非样本零售户组,以每一样本零售户为质心,计算与该样本零售户同一分层下所有零售户与该样本零售户的距离,选定多个替换样本并存储于替换样本库。
可选的,在步骤S1的数据采集阶段,
某区域的零售终端选取可支持线上销售的设备,包括但不限于电脑和手机;
零售户的基本信息及销售数据包括且不限于零售户的档位、类型、区域、销售笔数、销量、销额、期末库存、购进量各信息。
可选的,在步骤S2的数据清洗阶段,根据步骤S1采集的零售户基本信息及销售数据,对对各项销售指标设定阈值,根据设定的阈值,过滤去掉销售数据异常的零售户。
可选的,在步骤S3的特征选取阶段,
所述既有特征是基于所采集零售户基本信息及销售数据直接得到的特征数据,包括且不限于包括销量、结余库存、销售笔数、销售金额、在线时长;
所述自定义特征是基于所采集零售户基本信息及销售数据人工计算或总结得到的特征数据,包括且不限于包括存销比、扫码集中度、时间拟合度。
可选的,在步骤S4的数据分层阶段,基于K-Means算法或神经网络算法,对既有特征或自定义特征进行归一化操作,去除奇异值,加速收敛过程,确定样本分层数。
可选的,在步骤S5的样本选取阶段,将经过数据清洗阶段的零售户作为总体样本量按比例分配至各层,对各层零售户分别确定样本量,然后基于规则在每层中进行样本选取,其中,样本选取规则可采用等距随机抽样或简单随机抽样。
可选的,每个样本的替换样本须与该样本属于同一层,各样本的替换样本可以重复,但是进行替换后该替换样本不可再次替换,保证样本库的互异性。
可选的,当增加样本或进行样本替换后应与原样本列表进行对比,偏离度需满足一定误差范围。
本发明的一种基于机器学习的零售终端样本抽样方法,与现有技术相比具有的有益效果是:
本发明在考虑了异常零售户的基础上,对零售户既有维度和自定义维度选定的特征基于机器学习算法进行分层,达到科学均衡的分层分组,并且提高了分层的准确性,对每层进行样本选定,并对选定的样本预备替换样本库,提高分析的鲁棒性。
具体实施方式
为使本发明的技术方案、解决的技术问题和技术效果更加清楚明白,以下结合具体实施例,对本发明的技术方案进行清楚、完整的描述。
实施例一:
本实施例提出一种基于机器学习的零售终端样本抽样方法,其包括数据采集、数据清洗、特征选取、数据分层、样本选取、替换样本预备六个阶段。
S1、数据采集阶段:采集某区域零售终端的零售户基本信息及销售数据。
在步骤S1的数据采集阶段,
所采集的区域可以自行选定,如华东、华中、华北等地区,也可选定山东、江苏、广西等省市;
零售终端选取可支持线上销售的设备,包括但不限于电脑和手机;
零售户的基本信息及销售数据包括且不限于零售户的档位、类型、区域、销售笔数、销量、销额、期末库存、购进量各信息。
S2、数据清洗阶段:基于零售户的基本信息及销售数据,设定阈值,对零售户进行清洗,去除异常零售户。
在步骤S2的数据清洗阶段,根据步骤S1采集的零售户基本信息及销售数据,对对各项销售指标设定阈值,根据设定的阈值,过滤去掉销售数据异常的零售户。
S3、特征选取阶段:根据所采集的零售户基本信息及销售数据,选取既有特征或自定义特征。
既有特征是基于所采集零售户基本信息及销售数据直接得到的特征数据,包括且不限于包括销量、结余库存、销售笔数、销售金额、在线时长;
自定义特征是基于所采集零售户基本信息及销售数据人工计算或总结得到的特征数据,包括且不限于包括存销比、扫码集中度、时间拟合度。
S4、数据分层阶段:基于机器学习算法,根据零售户的既有特征或自定义特征,确定样本分层数。
在步骤S4的数据分层阶段,采用的机器学习算法为K-Means算法或神经网络算法,K-Means算法或神经网络算法对零售户的既有特征或自定义特征进行归一化操作,去除奇异值,并加速收敛过程,确定样本分层数。
S5、样本选取阶段:基于零售户的销售数据,获取该零售户的购进量,进而确定每层样本量并随机抽样得出样本列表。
在步骤S5的样本选取阶段,将经过数据清洗阶段的零售户作为总体样本量按比例分配至各层,对各层零售户分别确定样本量,然后基于规则在每层中进行样本选取,其中,样本选取规则可采用等距随机抽样或简单随机抽样。
S6、替换样本预备阶段:将经过数据清洗阶段的零售户划分为样本零售户组和非样本零售户组,以每一样本零售户为质心,计算与该样本零售户同一分层下所有零售户与该样本零售户的距离,选定多个替换样本并存储于替换样本库。
在步骤S6的替换样本预备阶段,在进行样本替换时,每个样本的替换样本须与该样本属于同一层,各样本的替换样本可以重复,但是进行替换后该替换样本不可再次替换,从而保证样本库的互异性。
另外,需要注意的时,当增加样本或进行样本替换后应与原样本列表进行对比,偏离度需满足一定误差范围。
基于上述内容,本实施例结合云POS机零售终端对山东省进行年度存量分析的样本抽样实例对本发明进行详细说明。
(一)数据采集阶段:采集山东省的云POS机零售终端的零售户基本信息及销售数据,包括且不限于零售户的档位、类型、区域、销售笔数、销量、销额、期末库存、购进量各信息。
(二)数据清洗阶段:设定过滤条件,过滤去掉销售数据异常的零售户。如以存销比为例,存销比=库存值/销量,自定义的将存销比大于3.5的期末库存设定为3.5*销量,将单号为空、商品编号为空、成本单价大于10000的销售单及入库单过滤,将1分钟内连续扫码超8笔以及单笔卷烟规格超10条的销售单过滤。
(三)特征选取阶段:根据所采集的零售户基本信息及销售数据,选取既有特征或自定义特征。既有特征包括且不限于包括销量、结余库存、销售笔数、销售金额、在线时长;自定义特征包括且不限于包括存销比、扫码集中度、时间拟合度。需要注意的是,零售户的基本信息中可能包含对自身规模及档位的划分,如“大、中、小”、“食杂店、烟酒店、超市、“便利店”等,这些描述自身规模及档位的信息应该与既有特征、自定义特征进行组合并选优,从而确定样本的最终特征。
(四)数据分层阶段:根据确定的既有特征或自定义特征,具体选择购销比、档位、区域、类型、库存值为特征的零售户进行K-Means聚类,基于代价函数进行多次迭代,得出代价函数减小幅度变弱的拐点作为样本分层数。
(五)样本选取阶段:基于零售户的销售数据,获取该零售户的购进量,进而确定每层样本量并随机抽样得出样本列表。本实施例由于零售终端对于零售户的购进量能有较准确的统计,故基于零售户购进量进行样本分层数量的确定,其中,有效零售户数量为N,在置信水平1-α的情况下,样本误差不超过
Figure BDA0002684496790000066
,则样本规模n可由下式表示:
Figure BDA0002684496790000061
其中,n为最终计算得到的应抽取样本数量;N为进行抽样计算的零售户数,此处为有效零售户数;σ2为购进量方差;
Figure BDA0002684496790000062
为正态分布在
Figure BDA0002684496790000063
处分位数;
Figure BDA0002684496790000064
为购进量误差量,此处用抽样误差乘以所有零售户购进量均值得出:
Figure BDA0002684496790000065
Mi为i层零售户数量,σi为i层客户购进量标准差,如此可得各分层所需样本量。最后基于样本量在各层内等距抽样得出样本列表。
(六)替换样本预备阶段:将经过数据清洗阶段的零售户划分为样本零售户组和非样本零售户组,以每一样本零售户为质心,计算与该样本零售户同一分层下所有零售户与该样本零售户的距离,选取距离最小的P个零售户作为备选样本。其中,样本中较小体量分层的零售户设置3个备选样本,中等体量分层的零售户样本设置5个备选样本,较大体量分层的零售户样本设置8个备选样本。当需要进行样本替换时,基于与样本的距离依次替换,距离越小,替换优先级越高,替换后的样本不允许重复。有时也需要进行样本新增处理,样本替换和新增后引入变异系数校验,变异系数定义为样本数据的标准差除以均值,对于较小、中等、较大体量分层的零售户样本变异系数差异需分别小于4%、6%和8%。
综上可知,采用本发明的一种基于机器学习的零售终端样本抽样方法,可以提高样本的可靠性,使得样本选取更加科学均衡,并且分层准确性更高,可以进行样本替换,提高了鲁棒性。
以上应用具体个例对本发明的原理及实施方式进行了详细阐述,这些实施例只是用于帮助理解本发明的核心技术内容。基于本发明的上述具体实施例,本技术领域的技术人员在不脱离本发明原理的前提下,对本发明所作出的任何改进和修饰,皆应落入本发明的专利保护范围。

Claims (8)

1.一种基于机器学习的零售终端样本抽样方法,其特征在于,该方法包括如下内容:
S1、数据采集阶段:采集某区域零售终端的零售户基本信息及销售数据;
S2、数据清洗阶段:基于零售户的基本信息及销售数据,设定阈值,对零售户进行清洗,去除异常零售户;
S3、特征选取阶段:根据所采集的零售户基本信息及销售数据,选取既有特征或自定义特征;
S4、数据分层阶段:基于机器学习算法,根据零售户的既有特征或自定义特征,确定样本分层数;
S5、样本选取阶段:基于零售户的销售数据,获取该零售户的购进量,进而确定每层样本量并随机抽样得出样本列表;
S6、替换样本预备阶段:将经过数据清洗阶段的零售户划分为样本零售户组和非样本零售户组,以每一样本零售户为质心,计算与该样本零售户同一分层下所有零售户与该样本零售户的距离,选定多个替换样本并存储于替换样本库。
2.根据权利要求1所述的一种基于机器学习的零售终端样本抽样方法,其特征在于,在步骤S1的数据采集阶段,
某区域的零售终端选取可支持线上销售的设备,包括但不限于电脑和手机;
零售户的基本信息及销售数据包括且不限于零售户的档位、类型、区域、销售笔数、销量、销额、期末库存、购进量各信息。
3.根据权利要求2所述的一种基于机器学习的零售终端样本抽样方法,其特征在于,在步骤S2的数据清洗阶段,根据步骤S1采集的零售户基本信息及销售数据,对对各项销售指标设定阈值,根据设定的阈值,过滤去掉销售数据异常的零售户。
4.根据权利要求3所述的一种基于机器学习的零售终端样本抽样方法,其特征在于,在步骤S3的特征选取阶段,
所述既有特征是基于所采集零售户基本信息及销售数据直接得到的特征数据,包括且不限于包括销量、结余库存、销售笔数、销售金额、在线时长;
所述自定义特征是基于所采集零售户基本信息及销售数据人工计算或总结得到的特征数据,包括且不限于包括存销比、扫码集中度、时间拟合度。
5.根据权利要求4所述的一种基于机器学习的零售终端样本抽样方法,其特征在于,在步骤S4的数据分层阶段,基于K-Means算法或神经网络算法,对既有特征或自定义特征进行归一化操作,去除奇异值,加速收敛过程,确定样本分层数。
6.根据权利要求5所述的一种基于机器学习的零售终端样本抽样方法,其特征在于,在步骤S5的样本选取阶段,将经过数据清洗阶段的零售户作为总体样本量按比例分配至各层,对各层零售户分别确定样本量,然后基于规则在每层中进行样本选取,其中,样本选取规则可采用等距随机抽样或简单随机抽样。
7.根据权利要求6所述的一种基于机器学习的零售终端样本抽样方法,其特征在于,每个样本的替换样本须与该样本属于同一层,各样本的替换样本可以重复,但是进行替换后该替换样本不可再次替换,保证样本库的互异性。
8.根据权利要求7所述的一种基于机器学习的零售终端样本抽样方法,其特征在于,当增加样本或进行样本替换后应与原样本列表进行对比,偏离度需满足一定误差范围。
CN202010972202.8A 2020-09-16 2020-09-16 一种基于机器学习的零售终端样本抽样方法 Active CN112115129B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010972202.8A CN112115129B (zh) 2020-09-16 2020-09-16 一种基于机器学习的零售终端样本抽样方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010972202.8A CN112115129B (zh) 2020-09-16 2020-09-16 一种基于机器学习的零售终端样本抽样方法

Publications (2)

Publication Number Publication Date
CN112115129A true CN112115129A (zh) 2020-12-22
CN112115129B CN112115129B (zh) 2024-05-10

Family

ID=73803604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010972202.8A Active CN112115129B (zh) 2020-09-16 2020-09-16 一种基于机器学习的零售终端样本抽样方法

Country Status (1)

Country Link
CN (1) CN112115129B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114387017A (zh) * 2022-01-04 2022-04-22 河南省烟草公司开封市公司 一种基于客户域的零售客户需求信息样本选取方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102955823A (zh) * 2011-08-30 2013-03-06 方方 一种对电视节目评估调研样本数据的处理方法
US20150095136A1 (en) * 2013-10-02 2015-04-02 Turn Inc. Adaptive fuzzy fallback stratified sampling for fast reporting and forecasting
US20170052960A1 (en) * 2015-08-20 2017-02-23 Skyhook Wireless, Inc. Techniques for measuring a property of interest in a dataset of location samples
CN108446771A (zh) * 2018-04-02 2018-08-24 四川长虹电器股份有限公司 一种防止销售预测模型过拟合的方法
US20180308051A1 (en) * 2017-04-24 2018-10-25 Walmart Apollo, Llc System and Method for Using Stores as Receiving Points for Third Party, E-Commerce Suppliers
CN109408268A (zh) * 2018-10-09 2019-03-01 浪潮软件股份有限公司 一种基于云pos机的新零售扫码数据异常检测方法
CN110956272A (zh) * 2019-11-01 2020-04-03 第四范式(北京)技术有限公司 实现数据处理的方法和系统
CN110991657A (zh) * 2019-11-22 2020-04-10 深圳市魔数智擎人工智能有限公司 一种基于机器学习的异常样本检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102955823A (zh) * 2011-08-30 2013-03-06 方方 一种对电视节目评估调研样本数据的处理方法
US20150095136A1 (en) * 2013-10-02 2015-04-02 Turn Inc. Adaptive fuzzy fallback stratified sampling for fast reporting and forecasting
US20170052960A1 (en) * 2015-08-20 2017-02-23 Skyhook Wireless, Inc. Techniques for measuring a property of interest in a dataset of location samples
US20180308051A1 (en) * 2017-04-24 2018-10-25 Walmart Apollo, Llc System and Method for Using Stores as Receiving Points for Third Party, E-Commerce Suppliers
CN108446771A (zh) * 2018-04-02 2018-08-24 四川长虹电器股份有限公司 一种防止销售预测模型过拟合的方法
CN109408268A (zh) * 2018-10-09 2019-03-01 浪潮软件股份有限公司 一种基于云pos机的新零售扫码数据异常检测方法
CN110956272A (zh) * 2019-11-01 2020-04-03 第四范式(北京)技术有限公司 实现数据处理的方法和系统
CN110991657A (zh) * 2019-11-22 2020-04-10 深圳市魔数智擎人工智能有限公司 一种基于机器学习的异常样本检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
盛剑;樊红;龚天任;程幸福;: "K-Means算法及其在卷烟零售门店库存聚类分析中的应用", 商业经济, no. 03, 20 March 2017 (2017-03-20) *
苏月;景博;余思奇;黄以锋;羌晓清;: "基于理想度的故障样本集评估优选方法研究", 测控技术, no. 11 *
蒋轩;周坚华;: "针对分层分类和多描述符空间的城镇植被群分类", 遥感信息, no. 02 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114387017A (zh) * 2022-01-04 2022-04-22 河南省烟草公司开封市公司 一种基于客户域的零售客户需求信息样本选取方法及装置

Also Published As

Publication number Publication date
CN112115129B (zh) 2024-05-10

Similar Documents

Publication Publication Date Title
CN107562818A (zh) 信息推荐系统及方法
CN106529968B (zh) 一种基于交易数据的客户分类方法及其系统
CN111724211A (zh) 一种线下门店商品销量预测方法、装置和设备
CN112102037B (zh) 一种基于大数据的直播电商平台商品内容智能推送管理系统
US6834266B2 (en) Methods for estimating the seasonality of groups of similar items of commerce data sets based on historical sales data values and associated error information
WO2022257459A1 (zh) 用户行为异常分析方法、装置、设备及存储介质
CN111062757A (zh) 基于多路径寻优匹配的信息推荐方法及系统
CN104239335B (zh) 特定用户信息获取方法及装置
CN115496566B (zh) 基于大数据的地区特产推荐方法及系统
CN108364191A (zh) 基于随机森林和逻辑回归的优质客户优化识别方法及装置
CN112115129A (zh) 一种基于机器学习的零售终端样本抽样方法
CN114782076A (zh) 一种线上商城消费平台奖券积分兑换智能管理方法、系统及计算机存储介质
CN106997350A (zh) 一种数据处理的方法及装置
CN106502881B (zh) 一种商品排序规则的测试方法和装置
CN113919865B (zh) 一种网络零售额统计方法
CN114399367A (zh) 保险产品推荐方法、装置、设备及存储介质
CN111177581A (zh) 一种基于多平台的社交电商网站商品推荐方法及装置
CN110968670A (zh) 一种流行商品的属性获取方法、装置、设备及存储介质
CN116579842A (zh) 基于用户行为数据的信用数据分析方法及系统
CN115860865A (zh) 商品组合构造方法及其装置、设备、介质、产品
CN113589034A (zh) 一种配电系统的窃电检测方法、装置、设备和介质
CN110427558B (zh) 资源处理事件的推送方法及装置
CN112614005B (zh) 企业复工状态的处理方法和装置
CN114723516A (zh) 基于成单数据的用户相似度计算方法及系统
CN112418652A (zh) 一种风险识别方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Country or region after: China

Address after: 271000 Langchao science and Technology Park, 527 Dongyue street, Tai'an City, Shandong Province

Applicant after: INSPUR SOFTWARE Co.,Ltd.

Address before: No. 1036, Shandong high tech Zone wave road, Ji'nan, Shandong

Applicant before: INSPUR SOFTWARE Co.,Ltd.

Country or region before: China

GR01 Patent grant
GR01 Patent grant