CN101493925A - 一种采用增量式挖掘的零售行业折扣券生成方法 - Google Patents
一种采用增量式挖掘的零售行业折扣券生成方法 Download PDFInfo
- Publication number
- CN101493925A CN101493925A CNA2009100965649A CN200910096564A CN101493925A CN 101493925 A CN101493925 A CN 101493925A CN A2009100965649 A CNA2009100965649 A CN A2009100965649A CN 200910096564 A CN200910096564 A CN 200910096564A CN 101493925 A CN101493925 A CN 101493925A
- Authority
- CN
- China
- Prior art keywords
- frequent
- database
- collection
- commodity
- customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明提供了一种采用增量式挖掘的零售行业折扣券生成方法。主要包括从刷卡到数据流挖掘及知识库存取和打印折扣券一系列过程。每个顾客有一个会员卡,该会员卡可免费办理。顾客每次购物时刷卡,计算机自动检查该类顾客的购物模式,如满足一定条件则在购物小票后自动打印出针对该顾客的优惠券。具体步骤如下:1.首先建立零售企业商品集、折扣商品数据库、建立顾客资源数据库;2.日常数据库信息的收集以及长期性的数据挖掘工作;3.扫描输入所购商品,各个POS机将顾客购物单传送至数据挖掘工具中经过数据预处理后生成顾客消费记录;4.打印习惯消费商品或推测购买商品的折扣券,同时将折扣信息存入客户资源数据库中。
Description
技术领域
本发明涉及一种零售行业折扣券生成方法。
背景技术
在零售行业,计算机和信息技术的应用已经越来越普及,POS系统和管理信息系统MIS记录了大量的客户交易数据,并且每天都在以极大的数据量更新着。而传统的商业数据挖掘又存在着以下缺陷:
(1)使用的挖掘方法较为陈旧,传统的数据挖掘方法基于历史数据库的信息,在信息爆炸性增长的今天,数据库扫描数据量日益增加,挖掘任务随之加重,挖掘效率日趋降低。
(2)采用数据流挖掘可以提高分析的效率,但是现有方法在准确度上存在缺陷。
(3)即使采用较为先进的商业数据流进行挖掘,也没有找到一个行之有效的算法,动态地将营销行为与数据流进行整合。
本发明旨在解决零售业商业决策效率低下,准确度不足以及算法与商业决策结合不畅等缺陷,同时动态收集数据,增加数据的准确性的。使得零售企业可以通过数据挖掘了解特定客户的兴趣,并以此为基础向他们发送特定产品的优惠券,并为他们推荐符合客户品味和状况的商品。
发明内容
本发明的主要目的在于克服现有技术中的不足,通过研究商业数据流的动态最大频繁模式算法SMFP和动态闭合频繁模式挖掘算法SCFP,提供一种采用增量式挖掘的零售行业折扣券生成方法。
本增量式挖掘的零售行业折扣券生成方法主要包括从刷卡到数据流挖掘及知识库存取和打印折扣券一系列过程。每个顾客有一个会员卡,该会员卡可免费办理。顾客每次购物时刷卡,计算机自动检查该类顾客的购物模式,如满足一定条件则在购物小票后自动打印出针对该顾客的优惠券,此即为个性化销售。
一种采用增量式挖掘的零售行业折扣券生成方法,包括以下步骤:
1、首先建立零售企业商品集,即数据库,对商品的各个属性进行登记和描述;同时建立折扣商品数据库;顾客信息输入,建立顾客资源数据库;
在此部分对本企业内商品的资料信息进行完整的记录,包括对商品基本资料、各个属性、类别进行详尽的记录;建立折扣商品的数据库,将需要打折的商品存入该数据库中,另外对会员顾客的个人信息进行记录,建立顾客资源数据库,库中空出字段用于保存消费模式;
2、日常数据库信息的收集以及长期性的数据挖掘工作;
本方法将需要的挖掘工作分为两部分,一部分是通过将日常销售中POS机收集信息,存入销售数据库,利用MFP算法和CFP算法对销售记录进行挖掘,得到已有的历史数据库中的顾客购买模式并存入客户资源数据库;MFP和CFP算法采取前馈搜索策略来构造最大频繁项目集,并启发式地按照支持率大小对项目进行重排;另一部分是对顾客购买产生的数据流的即时挖掘,服务器通过顾客资源数据库提供的资料,调用算法库中的相应算法,即动态最大频繁模式挖掘算法SMFP和闭合频繁模式挖掘算法SCFP,设定要挖掘的对象及时间段,得到顾客最新的购买模式,在顾客资源数据库中搜寻已有的购物模式,发现未购买的习惯消费商品或推测购买商品;
其中:
SMFP算法:
(1)扫描事务数据库中的每个事务,根据最小支持度Min_Sup,产生频繁1-项集的集合F1;
(2)对k=0,令I0=Φ,C0=F1,MFI0=Φ;
(3)对Ck中每个元素x进行如下操作:
IK+1=IK∪x,Pk+1={y:y∈Ck∩y>x};
(4)判断Ik+1∪Pk+1在MFIk中是否存在超集,若存在则进行剪枝操作,否则继续下一步;
(5)进行合并操作Ck+1=FI-combine(Ik+1∪Pk+1),得出Pk+1中使Ik+1∪Pk+1频繁的元素,并将其并到候选集合Ck+1中;
(7)根据最小置信度minconf,由频繁项集产生强关联规则,结束;
SCFP算法:
首先初始化一棵SCFP-Tree,然后对滑动窗口中的每一个基本窗口进行处理,采用已有的频繁闭合模式算法生成每个窗口的临界频繁闭合项集,将临界频繁闭合项集和它的子集按字母排序后加入到SCFP-Tree中临界频繁闭合项集是滑动窗口中频繁闭合项集的候选项,在SCFP-Tree中对临界频繁闭合项集进行标注,从构造算法看出,SCFP-Tree包含了所有的临界频繁闭合项集和它的子集,对滑动窗口中的频繁闭合项集的挖掘和更新直接在SCFP-Tree上进行;
(1)扫描一个基本窗口的数据流,以ε为支持度,采用已有的频繁闭合模式挖掘算法生成该窗口的所有临界频繁闭合项集,更新SCFP-Tree;
(2)以S为支持度遍历SCFP-Tree,得到滑动窗口中的候选频繁闭合项集,建立一棵索引模式树,将这些项集插入到模式树中;
(3)根据模式树输出频繁闭合模式,删除模式树;
3、扫描输入所购商品,各个POS机将顾客购物单传送至数据挖掘工具中经过数据预处理后生成顾客消费记录;
4、打印习惯消费商品或推测购买商品的折扣券,同时将折扣信息存入客户资源数据库中。
与现有技术相比,本发明的有益效果是:
1、高效,步骤2中用到的动态最大频繁模式挖掘算法SMFP和闭合频繁模式挖掘算法SCFP为自创算法。针对商业数据流系统BDSMS中商业数据流的挖掘特性,就其时间序列模型进行研究分析。该算法克服了其它算法对原数据库重复扫描多遍、搜索空间过大、搜索时间长、算法效率低等缺点,优化了对计算机系统资源的利用。采用新型数据流的挖掘算法动态的最大频繁模式挖掘算法SMFP和动态闭合频繁模式挖掘算法SCFP,极大提高了挖掘效率,节省顾客等待时间。
2、准确,该方法采用高效的算法同时,能够保证结果的准确性。
3、实用,该方法获得的针对不同顾客得到不同促销的折扣卡,可以帮助零售企业抓住潜在商机,提高销售额,提高顾客满意度和忠诚度,并在一定程度上促进了零售企业库存的流动。例如有些商品如快过期的牛奶等对任何顾客都可放入折扣券中,同时附上过期日。
附图说明
图1是本发明的具体实施例中的顾客购物后折扣券生成顾客消费记录表;
图2是本发明的具体实施例中的顾客购物后折扣券生成后台挖掘数据表。
具体实施方式
结合附图,通过具体实施例对本发明进一步说明。
1、建立零售企业商品集,建立折扣商品数据库,建立顾客资源数据库。
2、利用MFP算法和CFP算法对销售记录进行挖掘,得到已有的历史数据库中的顾客购买模式并存入数据库。
3、顾客购物,在收银台扫描输入所购商品,POS机将本次购物清单以数据流形式发送回服务器。
4、分析最新数据流,对于所选顾客,在选定时间段内,商品A、商品B、商品D、商品F和商品G形成的组合ABDFG是最大频繁模式,其支持度计数为123;商品F、商品I和商品P的组合FIP也是最大频繁模式,支持度计数为120等,如图1。同时,由图2可以看出,购买了商品F和商品P的该类顾客有100%的可能性,即置信度购买商品I;而购买了商品I和商品P的该类顾客则有80.76%的可能性购买商品F。故对于该类顾客,若购买了商品I和商品P,则可实时地在其购物单上打印出商品F的折扣券,以引发其80.76%的可能性,刺激该类顾客进行消费。
5、打印商品F的折扣券,将此次折扣信息记录到该名顾客资源库中。
最后,还需要注意的是,以上列举的仅是本发明的具体实施例子。显然,本发明不限于以上实施例子,还可以有许多变形。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形,均应认为是本发明的保护范围。
Claims (1)
1、一种采用增量式挖掘的零售行业折扣券生成方法,其特征在于,包括以下步骤:
一、首先建立零售企业商品集,即数据库,对商品的各个属性进行登记和描述;同时建立折扣商品数据库;顾客信息输入,建立顾客资源数据库;
在此部分对本企业内商品的资料信息进行完整的记录,包括对商品基本资料、各个属性、类别进行详尽的记录;建立折扣商品的数据库,将需要打折的商品存入该数据库中,另外对会员顾客的个人信息进行记录,建立顾客资源数据库,库中空出字段用于保存消费模式;
二、日常数据库信息的收集以及长期性的数据挖掘工作;
本方法将需要的挖掘工作分为两部分,一部分是通过将日常销售中POS机收集信息,存入销售数据库,利用MFP算法和CFP算法对销售记录进行挖掘,得到已有的历史数据库中的顾客购买模式并存入客户资源数据库;MFP和CFP算法采取前馈搜索策略来构造最大频繁项目集,并启发式地按照支持率大小对项目进行重排;另一部分是对顾客购买产生的数据流的即时挖掘,服务器通过顾客资源数据库提供的资料,调用算法库中的相应算法,即动态最大频繁模式挖掘算法SMFP和闭合频繁模式挖掘算法SCFP,设定要挖掘的对象及时间段,得到顾客最新的购买模式,在顾客资源数据库中搜寻已有的购物模式,发现未购买的习惯消费商品或推测购买商品;
其中:
SMFP算法:
(1)扫描事务数据库中的每个事务,根据最小支持度Min_Sup,产生频繁1-项集的集合F1;
(2)对k=0,令I0=Φ,C0=F1,MFI0=Φ;
(3)对Ck中每个元素x进行如下操作:
IK+1=IK∪x,
(4)判断Ik+1∪Pk+1在MFIk中是否存在超集,若存在则进行剪枝操作,否则继续下一步;
(5)进行合并操作Ck+1=FI-combine(Ik+1∪Pk+1),得出Pk+1中使Ik+1∪Pk+1频繁的元素,并将其并到候选集合Ck+1中;
(7)根据最小置信度minconf,由频繁项集产生强关联规则,结束;
SCFP算法:
首先初始化一棵SCFP-Tree,然后对滑动窗口中的每一个基本窗口进行处理,采用已有的频繁闭合模式算法生成每个窗口的临界频繁闭合项集,将临界频繁闭合项集和它的子集按字母排序后加入到SCFP-Tree中临界频繁闭合项集是滑动窗口中频繁闭合项集的候选项,在SCFP-Tree中对临界频繁闭合项集进行标注,从构造算法看出,SCFP-Tree包含了所有的临界频繁闭合项集和它的子集,对滑动窗口中的频繁闭合项集的挖掘和更新直接在SCFP-Tree上进行;
(1)扫描一个基本窗口的数据流,以ε为支持度,采用已有的频繁闭合模式挖掘算法生成该窗口的所有临界频繁闭合项集,更新SCFP-Tree;
(2)以S为支持度遍历SCFP-Tree,得到滑动窗口中的候选频繁闭合项集,建立一棵索引模式树,将这些项集插入到模式树中;
(3)根据模式树输出频繁闭合模式,删除模式树;
三、扫描输入所购商品,各个POS机将顾客购物单传送至数据挖掘工具中经过数据预处理后生成顾客消费记录;
四、打印习惯消费商品或推测购买商品的折扣券,同时将折扣信息存入客户资源数据库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2009100965649A CN101493925A (zh) | 2009-03-09 | 2009-03-09 | 一种采用增量式挖掘的零售行业折扣券生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2009100965649A CN101493925A (zh) | 2009-03-09 | 2009-03-09 | 一种采用增量式挖掘的零售行业折扣券生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101493925A true CN101493925A (zh) | 2009-07-29 |
Family
ID=40924510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2009100965649A Pending CN101493925A (zh) | 2009-03-09 | 2009-03-09 | 一种采用增量式挖掘的零售行业折扣券生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101493925A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102542474A (zh) * | 2010-12-07 | 2012-07-04 | 阿里巴巴集团控股有限公司 | 查询结果排序方法及装置 |
CN103337029A (zh) * | 2013-07-15 | 2013-10-02 | 运筹信息科技(上海)有限公司 | 一种基于射频识别的会员管理方法和系统 |
CN103927373A (zh) * | 2014-04-24 | 2014-07-16 | 湖北航云端科技有限公司 | 基于增量式关联规则技术的动态大数据模型高效建立方法 |
CN104424582A (zh) * | 2013-09-09 | 2015-03-18 | 李策 | 使用电子优惠券的方法 |
CN104537553A (zh) * | 2015-01-19 | 2015-04-22 | 齐鲁工业大学 | 重复负序列模式在客户购买行为分析中的应用 |
CN104574153A (zh) * | 2015-01-19 | 2015-04-29 | 齐鲁工业大学 | 快速的负序列挖掘模式在客户购买行为分析中的应用 |
CN104732419A (zh) * | 2015-01-19 | 2015-06-24 | 齐鲁工业大学 | 正负序列模式筛选方法在客户购买行为分析中的应用 |
CN105493126A (zh) * | 2014-01-14 | 2016-04-13 | 秀投徐富粦株式会社 | 反映卡使用信息来自动调整每个客户的卡优惠的卡优惠提供系统及其提供方法 |
CN105825600A (zh) * | 2016-03-14 | 2016-08-03 | 北京怡美假日信息科技有限公司 | Pos系统的控制方法、pos控制系统和商贸系统 |
US9449175B2 (en) | 2010-06-03 | 2016-09-20 | Nokia Technologies Oy | Method and apparatus for analyzing and detecting malicious software |
CN106156321A (zh) * | 2016-06-29 | 2016-11-23 | 浙江理工大学 | 一种面向分布异构安全数据流的数据挖掘模型系统 |
CN106384253A (zh) * | 2016-09-30 | 2017-02-08 | 中国银联股份有限公司 | 一种银行卡交易中消费行为分析方法及装置 |
WO2017041226A1 (zh) * | 2015-09-08 | 2017-03-16 | 深圳市赛亿科技开发有限公司 | 一种商品信息推送方法 |
CN106910132A (zh) * | 2017-01-11 | 2017-06-30 | 齐鲁工业大学 | Top‑k可决策的负序列模式在客户投保行为分析中的应用 |
WO2017124414A1 (zh) * | 2016-01-21 | 2017-07-27 | 赵政荣 | 自动推荐优惠劵的方法以及推荐系统 |
CN107085757A (zh) * | 2016-02-16 | 2017-08-22 | 中国移动通信集团江苏有限公司 | 一种稽核模型生成方法及装置 |
CN110009418A (zh) * | 2019-04-03 | 2019-07-12 | 南通环典计算机技术有限公司 | 积分兑换系统 |
CN110457286A (zh) * | 2019-06-27 | 2019-11-15 | 安徽鸿途创智图文快印有限公司 | 一种数字印刷企业信息管理方法 |
-
2009
- 2009-03-09 CN CNA2009100965649A patent/CN101493925A/zh active Pending
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9449175B2 (en) | 2010-06-03 | 2016-09-20 | Nokia Technologies Oy | Method and apparatus for analyzing and detecting malicious software |
CN102542474B (zh) * | 2010-12-07 | 2015-10-21 | 阿里巴巴集团控股有限公司 | 查询结果排序方法及装置 |
CN102542474A (zh) * | 2010-12-07 | 2012-07-04 | 阿里巴巴集团控股有限公司 | 查询结果排序方法及装置 |
CN103337029A (zh) * | 2013-07-15 | 2013-10-02 | 运筹信息科技(上海)有限公司 | 一种基于射频识别的会员管理方法和系统 |
CN104424582A (zh) * | 2013-09-09 | 2015-03-18 | 李策 | 使用电子优惠券的方法 |
CN105493126A (zh) * | 2014-01-14 | 2016-04-13 | 秀投徐富粦株式会社 | 反映卡使用信息来自动调整每个客户的卡优惠的卡优惠提供系统及其提供方法 |
CN103927373A (zh) * | 2014-04-24 | 2014-07-16 | 湖北航云端科技有限公司 | 基于增量式关联规则技术的动态大数据模型高效建立方法 |
CN104537553B (zh) * | 2015-01-19 | 2018-02-23 | 齐鲁工业大学 | 重复负序列模式在客户购买行为分析中的应用 |
CN104574153A (zh) * | 2015-01-19 | 2015-04-29 | 齐鲁工业大学 | 快速的负序列挖掘模式在客户购买行为分析中的应用 |
CN104732419A (zh) * | 2015-01-19 | 2015-06-24 | 齐鲁工业大学 | 正负序列模式筛选方法在客户购买行为分析中的应用 |
CN104537553A (zh) * | 2015-01-19 | 2015-04-22 | 齐鲁工业大学 | 重复负序列模式在客户购买行为分析中的应用 |
CN104732419B (zh) * | 2015-01-19 | 2018-04-27 | 齐鲁工业大学 | 正负序列模式筛选方法在客户购买行为分析中的应用 |
WO2017041226A1 (zh) * | 2015-09-08 | 2017-03-16 | 深圳市赛亿科技开发有限公司 | 一种商品信息推送方法 |
CN107251075A (zh) * | 2015-09-08 | 2017-10-13 | 深圳市赛亿科技开发有限公司 | 一种商品信息推送方法 |
WO2017124414A1 (zh) * | 2016-01-21 | 2017-07-27 | 赵政荣 | 自动推荐优惠劵的方法以及推荐系统 |
CN107085757B (zh) * | 2016-02-16 | 2021-06-29 | 中国移动通信集团江苏有限公司 | 一种确定风险类用户的方法及装置 |
CN107085757A (zh) * | 2016-02-16 | 2017-08-22 | 中国移动通信集团江苏有限公司 | 一种稽核模型生成方法及装置 |
CN105825600A (zh) * | 2016-03-14 | 2016-08-03 | 北京怡美假日信息科技有限公司 | Pos系统的控制方法、pos控制系统和商贸系统 |
CN106156321B (zh) * | 2016-06-29 | 2019-07-19 | 北京亿欧网盟科技有限公司 | 一种面向分布异构安全数据流的数据挖掘模型系统 |
CN106156321A (zh) * | 2016-06-29 | 2016-11-23 | 浙江理工大学 | 一种面向分布异构安全数据流的数据挖掘模型系统 |
CN106384253A (zh) * | 2016-09-30 | 2017-02-08 | 中国银联股份有限公司 | 一种银行卡交易中消费行为分析方法及装置 |
CN106910132A (zh) * | 2017-01-11 | 2017-06-30 | 齐鲁工业大学 | Top‑k可决策的负序列模式在客户投保行为分析中的应用 |
CN110009418A (zh) * | 2019-04-03 | 2019-07-12 | 南通环典计算机技术有限公司 | 积分兑换系统 |
CN110457286A (zh) * | 2019-06-27 | 2019-11-15 | 安徽鸿途创智图文快印有限公司 | 一种数字印刷企业信息管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101493925A (zh) | 一种采用增量式挖掘的零售行业折扣券生成方法 | |
AU2008229695B2 (en) | Method and system for using a point-of sale system to correlate transactions to a coupon database | |
JP5620565B1 (ja) | 商品販売データ処理装置およびプログラム | |
AU2008202919B2 (en) | Method and system for providing relevant coupons to consumers based on financial transaction history and internet browsing activity | |
US20090187462A1 (en) | Method and system for providing relevant coupons to consumers based on financial transaction history and network search activity | |
JP2015052957A (ja) | クーポン発行支援システム | |
EP2221759A2 (en) | Shop terminal and information processing server | |
US20190026720A1 (en) | Electronic receipt management system including server that generates unified expressions for product names across a plurality of stores | |
JP5740035B1 (ja) | サーバー、販売データ処理装置およびプログラム | |
CN104574153A (zh) | 快速的负序列挖掘模式在客户购买行为分析中的应用 | |
US20210027268A1 (en) | Commodity sales data processing apparatus and commodity sales data processing method | |
US20190073649A1 (en) | Transaction data processing apparatus connected to an external device for data communication | |
JP2022016658A (ja) | 口座管理システム、口座管理方法、プログラム、および情報提供システム | |
JP2015225532A (ja) | 電子レシート管理サーバおよびプログラム | |
JP2016042236A (ja) | 家計簿作成システムおよび家計簿作成方法 | |
JP6224777B2 (ja) | 商品販売データ処理装置およびプログラム | |
JP2006236297A (ja) | ネットワーク型クーポン発券システムおよびネットワーク型クーポン発券装置のクーポン発券方法 | |
JP2003091632A (ja) | 会員管理システム | |
JP5814432B1 (ja) | サーバ、販売データ処理装置、プログラムおよび電子レシート送信方法 | |
JP5814429B1 (ja) | サーバ、販売データ処理装置、プログラムおよび電子レシート送信方法 | |
US20160260076A1 (en) | Commodity information processing apparatus and system | |
JP6745865B2 (ja) | 電子レシート管理サーバおよびプログラム | |
JP6457610B2 (ja) | 電子レシートシステム | |
JP6395888B2 (ja) | 販売データ処理装置、及びプログラム | |
JP5739046B2 (ja) | サーバー、プログラム、情報処理装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20090729 |