CN104636956B - 基于移动交易序列模式的用户行为模式增益挖掘方法 - Google Patents
基于移动交易序列模式的用户行为模式增益挖掘方法 Download PDFInfo
- Publication number
- CN104636956B CN104636956B CN201510036301.4A CN201510036301A CN104636956B CN 104636956 B CN104636956 B CN 104636956B CN 201510036301 A CN201510036301 A CN 201510036301A CN 104636956 B CN104636956 B CN 104636956B
- Authority
- CN
- China
- Prior art keywords
- gain
- tree
- sequence
- node
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于移动交易序列模式的用户行为模式增益挖掘,首先是基于增益模式集成移动模式挖掘高增益移动行为序列模式,其次是依赖频次模式挖掘解决不同类型商务模式的顾客行为序列模式,然后是在各种复杂环境下验证评价算法的执行效率。通过高增益模式与动态行为路径的集成探索出高效益的移动序列模式处理。本发明提出基于移动商务行为特征数据信息构造树算法,挖掘移动商务行为数据的品类特征信息,在同类算法结果比较中具有能较高水准地表达发掘移动序列行为模式。
Description
技术领域:本发明涉及一种增益挖掘方法,特别是一种基于移动交易序列模式的用户行为模式增益挖掘方法
背景技术:数据挖掘的行为是指在大数据库中发现潜在有用的信息的过程。在行为信息学中,早期的研究集中在不同类别的应用中发掘各种用户行为模式,例如在电子商务领域中的交叉营销模式,电子商务网站设计与管理,规划移动商务框架。自从移动传媒设备及无线移动应用成为最流行最重要的传播媒介之后,这些移动商务事务议题,如移动框架下挖掘移动用户商业行为模式,在过去10几年发展中日趋成为热点研究课题。现有的移动设备通过GPS设备功能服务日志记录了移动用户个性化系列行为路径,因此,商业体会及时和准确获取移动用户移动行为路径细节。结合行为日志与支付记录分析,用户这种移动购买事务动态路径序列能够激发某种个性化的序列行为模式,在这些移动事务序列中暗含着有潜质的有用信息。有学者提出基于移动框架下的动态路径及序列模式发掘移动用户行为序列模式,即该序列模式包含用户动态路径计算及移动商务事务序列。比如一个移动序列模式pattern{|¥A:(trousers)|;|¥B:(shoes)|;@¥A→¥B},这种移动序列模式揭示出客户的移动商务事务路径模式经常是{@¥A→…¥B},顾客习惯性的沿着该行为序列模式路径{@¥A→…¥B}分别在¥A买trousers在¥B买shoes,假设店主捕获了这些客户序列行为模式,那么¥A店老板就会针对shoes搞促销活动,迎合顾客的个性商业事务行为需求,在本店内努力培养顾客的购买预期。
然而,在现实商业事务处理中,移动序列模式不能真实发掘数据库中商品实际利润,这种序列行为挖掘客户行为信息存在一定的缺陷,如购买黄金珠宝等饰品的顾客高价值商务行为,由于这些顾客的低频率购买行为,因而这些给商家带来丰厚利润的高增益顾客没有被发掘出来。据此,在传统商业事务数据库处理中增益挖掘被提出用于解决此类实际商业问题。常用的处理手段是事先设定增益阈值,该值的设计可以考虑商品的特性、价值、增益,希冀这种增益挖掘能在商务事务数据库中发掘出具有高利润的高效益商务行为模式。所以按此观点,将增益挖掘加进移动模式挖掘框架结构中用于发掘潜在的价值客户行为模式。这些有用的信息反馈给行为模式的决策者,他们基于此就可制定反应敏捷的商务行为模式。假设存在如下两种客户商务行为模式,如pattern1{|¥a:(skirts)|;|¥f:(shoes)|;@¥a→¥c→¥e→¥f},和pattern2{|¥a:(skirts)|;|¥f:(gold jewelry)|;@¥a→¥b→¥c→¥d→¥e→¥f}。两种客户商务行为模式的路径起点和终点虽然相同,但是行为模式的路径不同,因而客户最终购买模式也可能存在差异。从客户购买模式来看,通常都会认识到两种商品shoes和gold jewelry的利润价值差异较大。现实商务管理中,如果商店老板能事先发现客户的这两种购买行为模式,依此商家就会基于模式pattern2的行为路径中搞商品促销与展销活动,以便吸引和培养客户在¥a购买skirts之后能在¥f购买高利润的gold jewelry商品。
从现有的研究文献看,虽然针对移动模式挖掘与增益挖掘都有相关的研究成果,目前国内还没有实现两者相融合的研究,国外针对两者在移动商务模式中的潜在信息挖掘研究开展的也不够深入与系统,离实际应用还有差距。本文旨在基于增益挖掘集成移动序列模式行为发掘高增益移动序列模式。为解决此问题,本文提出了逐层扩展算法与构造树算法两种类型算法,逐层扩展算法属于过程处理发现,构造树算法属于深度优先搜索与宽度优先策略,构造树算法树形结构表述了移动商务行为数据的品类特征信息,如产地、产品名目、行为路径及利润等商务数据库相关的信息。从实验结果分析,构造树算法能充分表示客户商务行为特征,在同类算法结果比较中具有能较高水准地表达发掘移动序列行为模式。
发明内容:针对上述现有技术的不足,本发明基于增益挖掘、集成挖掘移动序列交易数据,发现高增益电子商务移动序列模式,挖掘发现移动商业交易框架下的用户事务行为路径与综合挖掘用户倾向性的交易行为,提供了一种用户行为模式增益挖掘方法。
为实现上述目的,本发明采用的技术方案是:基于移动交易序列模式的用户行为模式增益挖掘方法,先对符号表示及语义做出说明:
表1符号表示及语义
其具体步骤是:
一、算法的输入
序列增益模式USP(Ti)树的构造过程是一遍扫描源数据库,在USP(Ti)树中每个节点P都包含节点位置、项目集、节点标号及路径列表等信息,采用公式P|location,[itemseti],TID,Pathlist|表示构造树节点完整信息。Plocation记录节点位置,相同节点可以具有多个项目集P[itemseti],PTID表示移动序列交易标识,路径列表表示节点项目集交易路线图,算法中的头表的作用能有效连接USP(Ti)树的每个节点,是算法的输入。
树形算法的处理过程是基于移动交易序列数据库Dsite及其高增益表2,具体假设的最小支持度阈值Athreshold与最小增益阈值Uthreshold的设定可以参照移动序列加权位置项集交易事务映射表3。项目模式挖掘框架及模式挖掘流程框架如图1和图2。
表2商品分类增益
表3基于移动序列加权位置项集交易事务映射
图4序列增益模式USP(Ti)树的构造过程是一遍扫描源数据库,在USP(Ti)树中每个节点P都包含节点位置、项目集、节点标号及路径列表等信息,采用公式P|location,[itemseti],TID,Pathlist|表示构造树节点完整信息。Plocation记录节点位置,相同节点可以具有多个项目集P[itemseti],PTID表示移动序列交易标识,路径列表表示节点项目集交易路线图,算法中的头表的作用能有效连接USP(Ti)树的每个节点,是算法的输入。图5是USP(Ti)树构造图。
二、构造树节点插入
构造树的过程是逐层读取移动交易数据库Dsite,开始时第一个交易序列T1被读取,接着读取该序列中第一个交易|¥a:[Citem-1,1]|,其中包含位置商品信息¥a:[Citem-1],按照移动序列加权位置项集交易事物映射表,基于移动序列加权位置项集交易事务映射转化为¥a:t1,然后插入USP(Ti)构造树。通过相应的方式构造其余节点,数据库Dsite中所有的序列点被插入后,得到构造树。
三、基于构造树加权高增益挖掘
现在介绍构造树USP(Ti)后算法中发掘移动序列加权高增益SPweighted。基本思路是依赖USP(Ti)构造树,采用深度优先策略发掘增益SPweighted。首先是回溯USP(Ti)构造树的输入头表Htable,产生基于加权位置项集高增益USP,然后是在满足条件的USP(Ti)构造树中产生基于移动序列加权高增益SPweighted,有效地压缩存储在基于移动序列加权高增益SPweighted构造树节点i-itemset中。
四、通过剪枝减少构造树搜索空间
在处理节点i-itemset过程中,如果回溯检测路径过长,则调整检测技术进行剪枝以适应用户设定的阈值,表4为序列加权位置项集高增益剪枝数据库映射集。即对itemset形成SPweighted 时,相对于SUP(2-ProfitItemset-x)≥Athreshold及USP(2-ProfitItemset-x)≥Uthreshold时,则被剪掉。经过这种动态剪枝,剪掉无用的输入节点,从而减少搜索空间,提高了挖掘效率。图3给出了剪枝过程。
表4序列加权位置项集高增益剪枝数据库映射
本发明提出了基于移动序列商业环境下高增益新数据挖掘算法,涉及两方面的主题,即移动交易序列模式及增益挖掘,同时做了代表算法效果的比较。未来算法还要在算法执行效率及其商业实现环境扩展方面努力实现扩展与提升。实验结果表明,基于树形移动用户交易序列模式挖掘算法能发现交易事物行为路径与用户交易倾向性行为,提高移动电子商务交易平台管理与规划。
附图说明
图1模式挖掘框架。
图2基于深度优先的树形移动序列高增益模式挖掘流程框架。
图3基于数据库Dsite的移动序列加权高增益候选树的剪枝过程。
图4USP(Ti)构造树算法流程。
图5USP(Ti)算法构造图。
具体实施方式:
如图4所示:USP(Ti)树的构造过程是一遍扫描源数据库,在USP(Ti)树中每个节点P都包含节点位置、项目集、节点标号及路径列表等信息,采用公式P|location,[itemseti],TID,Pathlist|表示构造树节点完整信息。Plocation记录节点位置,相同节点可以具有多个项目集P[itemseti],PTID表示移动序列交易标识,路径列表表示节点项目集交易路线图,算法中的头表的作用能有效连接USP(Ti)树的每个节点,是算法的输入。
如图5所示:构造树的过程是逐层读取移动交易数据库Dsite,开始时第一个交易序列T1被读取,接着读取该序列中第一个交易|¥a:[Citem-1,1]|,其中包含位置商品信息¥a:[Citem-1],按照表4基于移动序列加权位置项集交易事务映射转化为¥a:t1,然后插入USP(Ti)构造树。通过相应的方式构造其余节点,数据库Dsite中所有的序列点被插入后,得到图5的构造树。
实验结果:
实验是对两种算法的执行效果验证,算法的优劣必须从执行时间与占用系统内存等方面反映出来。试验环境配置为Pentium(R)Dual-Core CPU E6500@2.93GHz,内存2GB,操作系统Microsoft windows XP Professional Service Pack3。移动商业环境参数设置具有限制增益挖掘效果,要求环境一致下变更参数阈值与移动序列规模比较算法效果。两类算法在系统限定内存及不同移动序列模式下挖掘高增益SPweighted时的执行时间与内存需求占用等方面效果看,在相同实验环境与商业环境下,在执行时间方面构造树法相对要优化于逐层法,但是在占用内存方面构造树法由于在节点构造和回溯时占用更多的内存空间。如表5算法执行效率比较。
表5算法执行效率比较
从实验结果看,构造树法在阶段I、II中算法模式与算法参数阈值的规划有助于挖掘过程中的剪枝处理,因而从实验效果看相对于逐层法较优化。
本发明提出了两类基于移动序列商业环境下高增益新数据挖掘算法,涉及两方面的主题,即移动交易序列模式及增益挖掘,同时做了两类算法效果的比较。未来算法还要在算法执行效率及其商业实现环境扩展方面努力实现扩展与提升。
Claims (1)
1.基于移动交易序列模式的用户行为模式增益挖掘,其具体步骤是:
一、算法的输入
序列增益模式USP(Ti)树的构造过程是一遍扫描源数据库,在USP(Ti)树中每个节点P都包含节点位置、项目集、节点标号及路径列表信息,采用公式P|location,[itemseti],TID,Pathlist|表示构造树节点完整信息,Plocation记录节点位置,相同节点具有多个项目集P[itemseti],PTID表示移动序列交易标识,路径列表表示节点项目集交易路线图,算法中的头表的作用能有效连接USP(Ti)树的每个节点,是算法的输入;
二、构造树节点插入
构造树的过程是逐层读取移动交易数据库Dsite,开始时第一个交易序列T1被读取,接着读取该序列中第一个交易|¥a:[Citem-1,1]|,其中包含位置商品信息¥a:[Citem-1],按照移动序列加权位置项集交易事物映射表,基于移动序列加权位置项集交易事务映射转化为¥a:t1,然后插入USP(Ti)构造树,通过相应的方式构造其余节点,数据库Dsite中所有的序列点被插入后,得到构造树;
三、基于构造树加权高增益挖掘
依赖USP(Ti)构造树,采用深度优先策略发掘增益SPweighted,首先是回溯USP(Ti)构造树的输入头表Htable,产生基于加权位置项集高增益USP,然后是在满足条件的USP(Ti)构造树中产生基于移动序列加权高增益SPweighted,有效地压缩存储在基于移动序列加权高增益SPweighted构造树节点i-itemset中;
四、通过剪枝减少构造树搜索空间
在处理节点i-itemset过程中,如果回溯检测路径过长,则调整检测技术进行剪枝以适应用户设定的阈值,即对itemset形成SPweighted 时,相对于SUP(2-ProfitItemset-x)≥Athreshold及USP(2-ProfitItemset-x)≥Uthreshold时,则被剪掉,经过这种动态剪枝,剪掉无用的输入节点,从而减少搜索空间,提高了挖掘效率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510036301.4A CN104636956B (zh) | 2015-01-26 | 2015-01-26 | 基于移动交易序列模式的用户行为模式增益挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510036301.4A CN104636956B (zh) | 2015-01-26 | 2015-01-26 | 基于移动交易序列模式的用户行为模式增益挖掘方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104636956A CN104636956A (zh) | 2015-05-20 |
CN104636956B true CN104636956B (zh) | 2018-02-13 |
Family
ID=53215668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510036301.4A Expired - Fee Related CN104636956B (zh) | 2015-01-26 | 2015-01-26 | 基于移动交易序列模式的用户行为模式增益挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104636956B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853282A (zh) * | 2010-05-20 | 2010-10-06 | 清华大学 | 用户跨网站购物模式信息的抽取系统和方法 |
CN103258049A (zh) * | 2013-05-27 | 2013-08-21 | 重庆邮电大学 | 一种基于海量数据的关联规则挖掘方法 |
CN103714139A (zh) * | 2013-12-20 | 2014-04-09 | 华南理工大学 | 一种移动海量客户群识别的并行数据挖掘方法 |
CN104134108A (zh) * | 2014-06-25 | 2014-11-05 | 上海艾瑞市场咨询有限公司 | 电子商务网站销售数据分析方法 |
-
2015
- 2015-01-26 CN CN201510036301.4A patent/CN104636956B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853282A (zh) * | 2010-05-20 | 2010-10-06 | 清华大学 | 用户跨网站购物模式信息的抽取系统和方法 |
CN103258049A (zh) * | 2013-05-27 | 2013-08-21 | 重庆邮电大学 | 一种基于海量数据的关联规则挖掘方法 |
CN103714139A (zh) * | 2013-12-20 | 2014-04-09 | 华南理工大学 | 一种移动海量客户群识别的并行数据挖掘方法 |
CN104134108A (zh) * | 2014-06-25 | 2014-11-05 | 上海艾瑞市场咨询有限公司 | 电子商务网站销售数据分析方法 |
Non-Patent Citations (2)
Title |
---|
Mining High Utility Mobile Sequential Patterns in Mobile Commerce Environments;Shie Bai-En;《Springer Berlin Heidelberg》;20111231;第224-238页 * |
Mining Mobile Sequential Patterns in a Mobile Commerce Environment;YUN Ching-Huang;《IEEE Trans Systems,Man, and Cybernetics-Part C:Applications and Reviews》;20070331;第37卷(第2期);第278-295页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104636956A (zh) | 2015-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cil | Consumption universes based supermarket layout through association rule mining and multidimensional scaling | |
US10311475B2 (en) | Digital information gathering and analyzing method and apparatus | |
Cheng et al. | Customer lifetime value prediction by a Markov chain based data mining model: Application to an auto repair and maintenance company in Taiwan | |
CN107292672A (zh) | 一种餐饮行业销售预测的实现系统与方法 | |
CN109784979A (zh) | 一种大数据驱动的供应链需求预测方法 | |
CN106327227A (zh) | 一种信息推荐系统及信息推荐方法 | |
Cabena et al. | Intelligent miner for data applications guide | |
CN107332910A (zh) | 信息推送方法和装置 | |
CN105590237A (zh) | 带负利润项的高效用序列模式在电子商务决策制定中的应用 | |
EP3281167A1 (en) | Qualitatively planning, measuring, making effecient and capitalizing on marketing strategy | |
CN104537553A (zh) | 重复负序列模式在客户购买行为分析中的应用 | |
CN106327211A (zh) | 一种基于社交媒体的scrm系统及其开发方法 | |
CN105023178A (zh) | 一种基于本体的电子商务推荐方法 | |
Najmi et al. | The evaluation of Business Intelligence maturity level in Iranian banking industry | |
CN112215630A (zh) | 一种全渠道渐进式会员精准营销方法 | |
CN104636956B (zh) | 基于移动交易序列模式的用户行为模式增益挖掘方法 | |
TW202141386A (zh) | 消費數據處理方法與系統 | |
CN116308562A (zh) | 线下零售用户智能筛选方法 | |
CN108182596A (zh) | 一种基于大数据环境下企业销售管理方法 | |
Mesir | The role of artificial intelligence in decision making in small businesses | |
Kumar et al. | Role of Business Analytics in Effective CRM Implementation in Retail Sector: A Cross Sectional Research | |
Osondu | Tourism Digitization Using the Main Components of Industry 4.0 | |
Chen et al. | Artificial intelligence: Creating more possibilities for programmatic advertising | |
Andjarwati et al. | Conceptual models for integration of Data Mining and SEO to Improve E-Commerce Performance | |
OgrajenSek | Use of customer data analysis in continuous quality improvement of service processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180213 Termination date: 20210126 |
|
CF01 | Termination of patent right due to non-payment of annual fee |