CN103700005B - 一种基于自适应多最小支持度的关联规则推荐方法 - Google Patents

一种基于自适应多最小支持度的关联规则推荐方法 Download PDF

Info

Publication number
CN103700005B
CN103700005B CN201310688735.3A CN201310688735A CN103700005B CN 103700005 B CN103700005 B CN 103700005B CN 201310688735 A CN201310688735 A CN 201310688735A CN 103700005 B CN103700005 B CN 103700005B
Authority
CN
China
Prior art keywords
item
commodity
classification
rule
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310688735.3A
Other languages
English (en)
Other versions
CN103700005A (zh
Inventor
马廷淮
周金娟
朱节中
曹杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yingzhi Information Technology Co ltd
Shanghai Zhenke Information Technology Service Co ltd
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201310688735.3A priority Critical patent/CN103700005B/zh
Publication of CN103700005A publication Critical patent/CN103700005A/zh
Application granted granted Critical
Publication of CN103700005B publication Critical patent/CN103700005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于自适应多最小支持度的关联规则推荐方法,首先根据商品分类建立商品分类层次树,并根据分类层次树对具体商品进行归类;接下来分别为每个具体商品和具体商品层上一层的类别进行最小支持度阈值设置,阈值设置涉及时间因素、具体商品价格因素以及具体商品品牌因素的影响,在支持度阈值设定基础上,再利用多最小支持度关联规则扩展算法挖掘频繁项集和产生规则;最后采用Top‑N推荐方法为每位用户生成推荐。本发明在为用户做个性化推荐时,考虑了多种因素对具体商品和类别的多最小支持度阈值设定的影响,能较好的体现不同物品的特征,同时缓解了推荐系统中数据稀疏性问题和冷启动问题,能更加准确的为用户进行个性化推荐。

Description

一种基于自适应多最小支持度的关联规则推荐方法
技术领域
本发明公开了一种基于自适应多最小支持度的关联规则推荐方法,具体涉及一种给特定用户推荐个性化商品的方法,属于推荐系统技术领域。
背景技术
个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。目前主要的个性化推荐方法主要有基于内容的推荐,协同过滤推荐和混合推荐。孙多[1]结合兴趣度和聚类技术对客户的个人兴趣进行评价,提出了基于兴趣度的聚类协同过滤推荐系统,该方法有效缓解了整个用户矩阵数据极端稀疏并且实时性效果不理想的问题。李忠俊等人[2]提出了一种基于对基于内容的推荐系统和协同过滤系统同构化整合的推荐模型,该算法同时拥有协同过滤推荐系统和基于内容推荐系统的优点,并且在一定程度上避免了基于内容或协同过滤的传统推荐系统各自的缺点。陈泽等人[3]结合用户-项目评分矩阵和项目-类别关联矩阵,提出了一种新的混合推荐模型。该模型提出一种新的项目关联度度量方法,并分别以项目关联度和用户项目评分信息为权值构建一个基于用户-项目的加权两层图模型,结合随机游走算法给出了基于加权两层图的推荐算法。
关联规则是数据挖掘领域的一个重要分支,主要用来挖掘数据集中数据项之间有趣的关联关系,广泛应用于零售业,通过挖掘具有较高概率被消费者同时购买的商品,为商品陈列和促销提供决策依据。施平安等人[4]提出关联规则的时间适用性概念,设置时间段相关的支持度阈值。毛宇星等人[5]通过对分类数据的深入研究,提出了一种高效的多层关联规则挖掘方法。李杰等人[6]提出了适用于个性化推荐的强关联规则的概念,并给出了一种基于矩阵的强关联规则挖掘算法,提高了规则挖掘效率。刘枚莲等人[7]针对用户评分数据稀疏性问题,通过对事务数据库项目空间关联性分析,提出基于双向关联规则项目评分预测的推荐算法,推荐精度和效率明显优于传统的推荐算法。
但是关联规则挖掘算法的效果容易受支持度设置的影响。统一的最小支持度设置,或仅仅依赖项目出现频率设置项目最小支持度阈值,使得关联规则算法挖掘规则时有很多局限性。支持度阈值设置过低容易导致规则数目指数级增长,设置过高使得算法不能发现更多有意义的规则。本发明针对关联规则算法的支持度设置问题,提出了根据具体商品的信息计算商品自适应支持度的方法,并结合多最小支持度关联规则算法挖掘有意义的规则,从而为用户进行个性化推荐。
参考文献:
[1].孙多.基于兴趣度的聚类协同过滤推荐系统的设计.安徽大学学报:自然科学版,2007,31(5):19-22;
[2].李忠俊,周启海,帅青红.一种基于内容和协同过滤同构化整合的推荐系统模型.计算机科学,2009,36(12):142-145;
[3].陈泽,王国胤,胡峰.基于加权两层图的混合推荐方法.计算机科学,2012,39(12):171-176;
[4].施平安,陈文伟,黄金才.关联规则时间适用性及其发现方法.计算机应用研究,2001(6):18-20;
[5].毛宇星,陈彤兵,施伯乐.一种高效的多层和概化关联规则挖掘方法.软件学报,2011,22(12):2965-2980;
[6].李杰,徐勇,王云峰,朱昭贤.面向个性化推荐的强关联规则挖掘.系统工程理论与实践,2009,29(8):144-152;
[7].刘枚莲,刘同存,张峰.基于双向关联规则项目评分预测的推荐算法研究.武汉理工大学学报,2011,33(9):150-155;
[8].Bing Liu著,俞勇,薛贵荣,韩定一译.Web数据挖掘.北京:清华大学出版社,2012:20-27。
发明内容
本发明所要解决的技术问题是:针对传统推荐算法依赖用户评分、推荐结果对数据稀疏问题和冷启动问题敏感问题,以及传统关联规则算法为所有商品设置单一的且仅仅依赖商品出现频率的统一支持度的问题,提出一种基于自适应多最小支持度的关联规则推荐方法,过程中为每个商品和类别产生自适应的支持度阈值,挖掘出更多有意义的关联规则,对用户做出更加准确的推荐。
本发明为解决上述技术问题采用以下技术方案:
一种基于自适应多最小支持度的关联规则推荐方法,包括以下步骤:
步骤一、根据商品分类信息建立商品分类层次树,并将数据集中商品按照商品分类层次树进行归类;
步骤二、在每类商品中设置商品最小支持度阈值:
MIS X k = count ( X k ) total ( X i ) × [ ( 1 - price ( X k ) p max ) × α + 1 brand ( X k ) × ( 1 - α ) ]
其中,count(Xk)是t时段内商品Xk的交易量,total(Xi)为是t时段内类别Xi的交易量,且Xk∈Xi,price(Xk)为商品Xk的价格,pmax为类别Xi中商品的最高价格,brand(Xk)即为商品Xk的品牌权重,α为商品价格因素对计算商品最小支持度阈值的影响权重,1-α为商品品牌对计算商品最小支持度阈值的影响权重;
步骤三、以分类层次树中具体商品层的上一层为类别,为每个类别设置类别最小支持度阈值:
MIS X i = count ( X i ) Σ X j ∈ X ′ count ( X j ) × λ
其中,X‘、Xi、Xj均为商品的类别,Xi和Xj为X‘的子类别,λ为类别最小支持度阈值的影响参数;
步骤四、根据步骤二和步骤三中得到的商品最小支持度阈值和类别最小支持度阈值,利用多最小支持度关联规则算法分别挖掘商品频繁项集和类别频繁项集,并产生相应的规则,具体如下:
(401)将所有商品按照自身的商品最小支持度阈值MIS进行升序排序,并存储于项目集合M中;
(402)设I={i1,i2,...,im}为所有商品item的集合,事务数据集T=<T1,T2,...,Tn>表示网站所有用户历史商品交易记录,其中每个事务Ti是用户一次商品交易记录,Ti是商品的集合,并且每个事务Ti都有一个唯一的标识符TID,m、n为正整数,扫描事务数据集T,计算其中每个商品的实际支持度sup(item);
(403)按存储顺序从项目集合M中找出第一个满足sup(itemi)≥MIS(itemi)的项目itemi,将其加入集合L中,对于项目集合M中itemi之后的每个项目itemj,如果sup(itemj)≥MIS(itemi),则将itemj加入集合L中;
(404)在集合L中找到满足sup(iteml)≥MIS(iteml)的所有商品iteml,并将iteml加入频繁1项集F1中,并设定频繁项集的基数k=2;
(405)判断频繁k-1项集Fk-1是否为空,若空则跳转到步骤(408),否则进入步骤(406);
(406)若参数k=2,则按存储顺序遍历集合L,对每个items∈L,若items满足sup(items)≥MIS(items),对于集合L中items之后的每个itemh,在itemh满足sup(itemh)≥MIS(items)且时,将候选项集{items,itemh}加入候选k项集Ck中,其中,为最大支持度差别;
若k≠2,则在频繁k-1项集Fk-1中遍历查找所有只有最后一项元素不同的频繁项集对f1,f2
f1={item1,item2,…,itemk-2,itemk-1},
f2={item1,item2,…,itemk-2,item′k-1},
若MIS(itemk-1)<MIS(item′k-1)且 则将候选项集c={item1,item2,…,itemk-2,itemk-1,item′k-1}加入候选k项集Ck中;
接着遍历c中每个(k-1)大小的子集s,当c[1]∈s或者MIS(c[2])=MIS(c[1])时,如果则将候选k项集Ck中候选项集c删除,其中,c[1]为候选项集c的第1个元素,c[2]为候选项集c的第2个元素;
(407)遍历事务数据集T,计算候选k项集Ck中每个候选项集c的支持度sup(c),若候选项集c满足sup(c)≥MIS(c[1]),则将候选项集c加入频繁k项集Fk中,将参数k值加1,并跳转到步骤(405);
(408)将各级频繁项集Fk加入频繁项集集合F中;
(409)由频繁项集集合F产生关联规则,对于k频繁项集集合Fk∈F,其中k=2,3,...,对于每个k频繁项集fk∈Fk,fk={item1,item2,...,itemk},由k频繁项集fk生成的关联规则过程如下:
对任一itemi∈fk,产生的关联规则r形式为fk-itemi→itemi,此规则的真实置信度conf_of_r计算公式为:
conf_of_r=sup(fk)/sup(fk-itemi),
其中(fk-itemi)是k频繁项集fk中去除itemi后剩余的所有item集合;由所有k频繁项集集合Fk生成的关联规则中,若关联规则r的置信度conf_of_r≥minconf,则将此规则r加入到规则集R中;
步骤五、利用具体商品的规则为用户进行个性化推荐,具体如下:
根据用户的历史购物记录匹配商品关联规则,当规则的前项A中的商品都是用户曾经感兴趣过的商品,且后项B中的商品不是用户曾经感兴趣过的商品时,将此规则加入候选规则集合,此规则后项B对应的商品itemf作为候选推荐商品;
对每个候选推荐商品itemf,计算分值 score item f = &Sigma; r &Element; rules conf _ of _ r , 其中rules是匹配到的所有规则中后项为itemf的规则集合,conf_of_r则是rules中每个规则的实际置信度,将所有候选推荐商品按照分值进行降序排序,取前N个商品进行推荐,N的取值为自然数。
作为本发明的进一步优选方案,若所述步骤五中用户得到的商品推荐数目不足N个,则利用类别关联规则进行补充推荐。
作为本发明的进一步优选方案,所述步骤二中,对每类商品根据时间段t、商品价格、商品品牌,设置具体商品的最小支持度阈值。
作为本发明的进一步优选方案,所述步骤四中,利用多最小支持度关联规则算法挖掘商品分类层次树中最底层商品层和该商品层上一层类别层的频繁项集,不涉及商品分类层次树中其他层次的频繁项集。
作为本发明的进一步优选方案,利用类别关联规则进行补充推荐时,首先根据用户兴趣匹配类别关联规则,根据匹配到的用户感兴趣的类别,将此类别中最受其他用户欢迎的商品推荐给该用户。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明针对电子商务中的个性化推荐,结合时间、商品价格以及商品品牌因素设置具体商品和类别最小支持度阈值,基于自适应多最小支持度关联规则算法,有助于发现更多有意义的关联规则,为用户做出更加准确的个性化推荐。该方法充分考虑了不同类别物品的交易特点,并按照时间段挖掘关联规则,缓解了数据稀疏性问题,使得在一定时间段内数据特征更加明显。同时,考虑商品价格、品牌对商品最小支持度阈值设置的影响,并由用户决定价格和品牌两种效应对支持度的影响权重,使得每个商品有自适应最小支持度阈值。该方法挖掘商品和类别两种关联规则,能够提供不同层次的指导意义,也一定程度上缓解了推荐系统的冷启动问题。相对于传统的基于关联规则推荐的算法,能在电子商务系统中发现更多更有意义的规则,特别适合电子商务中对用户做个性化推荐。
附图说明
图1是基于自适应多最小支持度的关联规则推荐方法的流程图。
图2是商品分类层次树示意图。
图3是多最小支持度的关联规则算法详细流程图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本实施案例采用自适应多最小支持度的关联规则推荐方法分别挖掘商品和类别的关联规则,进而对用户做出个性化推荐。如图1所示,本方法包含如下步骤:
步骤10,设置时间片参数t=2,表示两个月为一个时间段,设置商品价格因素对计算商品最小支持度阈值的影响权重α=0.5,则商品品牌对计算商品最小支持度阈值的影响权重1-α=0.5,设置类别最小支持度阈值影响参数λ=0.3,设置为用户推荐的商品数目N=10,并根据淘宝网天猫首页商品分类信息建立商品分类层次树,树的高度为5,如图2所示,并将数据集中商品按照商品分类层次树进行归类。
步骤20,在每类商品中,读取天猫网页上方推荐的商品品牌列表,按照各品牌的先后顺序,分别赋予品牌权重为1,2,3...n(n为正整数),再根据用户设定的时间片t,在t时段内依据商品的价格、品牌为每个商品设置特定的支持度阈值,设Xk为某一具体商品,则其对应的商品最小支持度阈值计算公式如下:
MIS X k = count ( X k ) total ( X i ) &times; [ ( 1 - price ( X k ) p max ) &times; &alpha; + 1 brand ( X k ) &times; ( 1 - &alpha; ) ] ,
其中count(Xk)是t时段内商品Xk的交易量,total(Xi)为是t时段内类别Xi的交易量,且Xk∈Xi,price(Xk)为商品Xk的价格,pmax为类别Xi中商品的最高价格,brand(Xk)即为商品Xk的品牌权重。
步骤30,设置类别支持度阈值时,在t时间段内,考虑类别Xi的交易量占所有同属于同一大类X‘的类别的交易量的总和的比例,类别最小支持度阈值计算公式为:
MIS X i = count ( X i ) &Sigma; X j &Element; X &prime; count ( X j ) &times; &lambda; ,
其中类别X‘是类别Xi上一层的类别,Xi即为类别X‘的一个子类别,Xj表示类别X‘下任意一个子类别,类别层次如图2所示。
步骤40,根据步骤20和步骤30中得到的每个商品和类别的最小支持度阈值,设置最小置信度阈值minconf为0.9,设置最大支持度差别采用BingLiu[8]提出的多最小支持度的关联规则算法分别挖掘商品和类别的频繁项集,并产生相应的规则,其中,产生的规则形如:A→B,其中B只含一个物品或者一个类别。
如图3所示,多最小支持度的关联规则算法流程如下:
步骤401,将所有商品基于自身的商品最小支持度阈值(MIS)进行升序排序,并存储于项目集合M中。
步骤402,设I={i1,i2,...,im}(m为正整数)为所有项item的集合,事务数据集T=<T1,T2,...,Tn>,其中每个事务Ti是项的集合,并且每个事务Ti都有一个唯一的标识符TID。扫描事务数据集T,计算每个项目itemi的实际支持度sup(itemi),其中实际支持度sup(itemi)为itemi在事务数据集T中出现的次数除以事务数据集总的事务的数目。
步骤403,按存储顺序在项目集合M中找出第一个满足sup(itemi)≥MIS(itemi)的项目itemi,将其加入集合L中,对于项目集合M中itemi之后的每个项目itemj,如果sup(itemj)≥MIS(itemi),则将itemj加入集合L中。
步骤404,在集合L中找到所有商品iteml,满足sup(iteml)≥MIS(iteml),并将iteml加入频繁1项集F1中,并设参数k=2。
步骤405,判断频繁k-1项集Fk-1是否为空,若空则跳转到步骤408,否则跳到步骤406。
步骤406,若参数k=2,则按存储顺序遍历集合L,对每个items∈L,若items满足sup(items)≥MIS(items),则对于集合L中items之后的每个itemh,若itemh满足sup(itemh)≥MIS(items)且则将候选项集{items,itemh}加入候选k项集Ck中。若参数k≠2,则在频繁k-1项集Fk-1中遍历查找所有只有最后一项元素不同的频繁项集对f1,f2
f1={item1,item2,…,itemk-2,itemk-1},f2={item1,item2,…,itemk-2,itemk-1},
若MIS(itemk-1)<MIS(item′k-1)且 则将候选项集c={item1,item2,…,itemk-2,itemk-1,item′k-1}加入候选k项集Ck中。接着遍历c中每个(k-1)大小的子集s,当
c[1]∈s(其中c[1]为候选项集c的第1个元素,c[2]以此类推)或者
MIS(c[2])=MIS(c[1])时,如果则将候选k项集Ck中候选项集c删除。
步骤407,遍历事务数据集T,计算候选k项集Ck中每个候选项集c的支持度sup(c),若候选项集c满足
sup(c)≥MIS(c[1])(c[1]为候选项集c的第1个元素),则将c加入频繁k项集Fk中,将参数k值加1,并跳转到步骤405.
步骤408,将各级频繁项集Fk(k=1,2,...)加入频繁项集集合F中。
步骤409,由频繁项集集合F产生关联规则。对于k频繁项集集合Fk∈F,其中k=2,3,...(注:此处k不取1,因为频繁1项集不能产生规则,频繁1项集中只有一个item),对于每个k频繁项集fk∈Fk,fk={item1,item2,...,itemk},由k频繁项集fk生成的关联规则过程如下:对任一itemi∈fk,产生的关联规则r形式为fk-itemi→itemi,此规则的真实置信度conf_of_r计算公式为conf_of_r=sup(fk)/sup(fk-itemi),其中(fk-itemi)是k频繁项集fk中去除itemi后剩余的所有item集合。由所有k频繁项集集合Fk生成的关联规则中,若关联规则r的置信度conf_of_r≥minconf,则将此规则r加入到规则集R中。
步骤50,根据用户的历史购物记录,匹配商品关联规则,若某一规则的前项A中的商品都是用户曾经感兴趣过的商品,且后项B中的商品不是用户曾经感兴趣过的商品,则将此规则加入候选规则集合,此规则后项B对应的商品itemf作为候选推荐商品。对每个候选推荐商品itemf,计算分值 其中rules是匹配到的所有规则中后项为itemf的规则集合,conf_of_r则是rules中每个规则的实际置信度。将所有候选推荐商品按照分值进行降序排序,取前N个商品进行推荐。
步骤60,若步骤5)中给用户的推荐不足N个,假设已经推荐了m个商品,根据用户的历史数据匹配类别关联规则,得到用户可能感兴趣的商品类别,并将此类别中最受其他用户欢迎的商品,即此类别中在t时段内交易量最大的前(N-m)个商品推荐给该用户,从而满足N个推荐。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (5)

1.一种基于自适应多最小支持度的关联规则推荐方法,其特征在于,包括以下步骤:
步骤一、根据商品分类信息建立商品分类层次树,并将数据集中商品按照商品分类层次树进行归类;
步骤二、在每类商品中设置商品最小支持度阈值:
MIS X k = c o u n t ( X k ) t o t a l ( X i ) &times; &lsqb; ( 1 - p r i c e ( X k ) p m a x ) &times; &alpha; + 1 b r a n d ( X k ) &times; ( 1 - &alpha; ) &rsqb;
其中,count(Xk)是t时段内商品Xk的交易量,total(Xi)为是t时段内类别Xi的交易量,且Xk∈Xi,price(Xk)为商品Xk的价格,pmax为类别Xi中商品的最高价格,brand(Xk)即为商品Xk的品牌权重,α为商品价格因素对计算商品最小支持度阈值的影响权重,1-α为商品品牌对计算商品最小支持度阈值的影响权重;
步骤三、以分类层次树中具体商品层的上一层为类别,为每个类别设置类别最小支持度阈值:
其中,X‘、Xi、Xj均为商品的类别,Xi和Xj为X‘的子类别,λ为类别最小支持度阈值的影响参数;
步骤四、根据步骤二和步骤三中得到的商品最小支持度阈值和类别最小支持度阈值,利用多最小支持度关联规则算法分别挖掘商品频繁项集和类别频繁项集,并产生相应的规则,其中利用多最小支持度关联规则算法挖掘商品频繁项集并产生相应的规则过程具体如下:
(401)将所有商品按照自身的商品最小支持度阈值MIS进行升序排序,并存储于项目集合M中;
(402)设I={i1,i2,…,im}为所有商品item的集合,事务数据集T=<T1,T2,…,Tn>表示网站所有用户历史商品交易记录,其中每个事务Ti是用户一次商品交易记录,Ti是商品的集合,并且每个事务Ti都有一个唯一的标识符TID,m、n为正整数,扫描事务数据集T,计算其中每个商品的实际支持度sup(item);
(403)按存储顺序从项目集合M中找出第一个满足sup(itemi)≥MIS(itemi)的项目itemi,将其加入集合L中,对于项目集合M中itemi之后的每个项目itej,如果sup(itemj)≥MIS(itei),则将itemj加入集合L中;
(404)在集合L中找到满足sup(iteml)≥MIS(iteml)的所有商品iteml,并将iteml加入频繁1项集F1中,并设定频繁项集的基数k=2;
(405)判断频繁k-1项集Fk-1是否为空,若空则跳转到步骤(408),否则进入步骤(406);
(406)若参数k=2,则按存储顺序遍历集合L,对每个items∈L,若ites满足sup(items)≥MIS(items),对于集合L中items之后的每个itemh,在itemh满足sup(itemh)≥MIS(items)且时,将候选项集{items,itemh}加入候选k项集Ck中,其中,为最大支持度差别;
若k≠2,则在频繁k-1项集Fk-1中遍历查找所有只有最后一项元素不同的频繁项集对f1,f2
f1={item1,item2,…,itemk-2,itemk-1},
f2={item1,item2,…,itemk-2,item′k-1},
若MIS(itemk-1)<MIS(item′k-1)且则将候选项集c={item1,item2,…,itemk-2,itemk-1,item′k-1}加入候选k项集Ck中;
接着遍历c中每个(k-1)大小的子集s,当c[1]∈s或者MIS(c[2])=MIS(c[1])时,如果则将候选k项集Ck中候选项集c删除,其中,c[1]为候选项集c的第1个元素,c[2]为候选项集c的第2个元素;
(407)遍历事务数据集T,计算候选k项集Ck中每个候选项集c的支持度sup(c),若候选项集c满足sup(c)≥MIS(c[1]),则将候选项集c加入频繁k项集Fk中,将参数k值加1,并跳转到步骤(405);
(408)将各级频繁项集Fk加入频繁项集集合F中;
(409)由频繁项集集合F产生关联规则,对于k频繁项集集合Fk∈F,其中k=2,3,…,对于每个k频繁项集fk∈Fk,fk={item1,item2,…,itemk},由k频繁项集fk生成的关联规则过程如下:
对任一itemi∈fk,产生的关联规则r形式为fk-itemi→itemi,此规则的真实置信度conf_of_r计算公式为:
conf_of_r=sup(fk)/sup(fk-itemi),
其中(fk-itemi)是k频繁项集fk中去除itemi后剩余的所有item集合;由所有k频繁项集集合Fk生成的关联规则中,若关联规则r的置信度conf_of_r≥minconf,minconf为设定的最小置信度阈值,则将此规则r加入到规则集R中;
步骤五、利用具体商品的规则为用户进行个性化推荐,具体如下:
根据用户的历史购物记录匹配商品关联规则,当规则的前项A中的商品都是用户曾经感兴趣过的商品,且后项B中的商品不是用户曾经感兴趣过的商品时,将此规则加入候选规则集合,此规则后项B对应的商品itemf作为候选推荐商品;
对每个候选推荐商品itemf,计算分值其中rules是匹配到的所有规则中后项为itemf的规则集合,conf_of_r则是rules中每个规则的实际置信度,将所有候选推荐商品按照分值进行降序排序,取前N个商品进行推荐,N的取值为自然数。
2.根据权利要求1所述的基于自适应多最小支持度的关联规则推荐方法,其特征在于:若所述步骤五中用户得到的商品推荐数目不足N个,则利用类别关联规则进行补充推荐。
3.根据权利要求1所述的基于自适应多最小支持度的关联规则推荐方法,其特征在于:所述步骤二中,对每类商品根据时间段t、商品价格、商品品牌,设置具体商品的最小支持度阈值。
4.根据权利要求1所述的基于自适应多最小支持度的关联规则推荐方法,其特征在于:所述步骤四中,利用多最小支持度关联规则算法挖掘商品分类层次树中最底层商品层和该商品层上一层类别层的频繁项集,不涉及商品分类层次树中其他层次的频繁项集。
5.根据权利要求2所述的基于自适应多最小支持度的关联规则推荐方法,其特征在于:利用类别关联规则进行补充推荐时,首先根据用户兴趣匹配类别关联规则,根据匹配到的用户感兴趣的类别,将此类别中最受其他用户欢迎的商品推荐给该用户。
CN201310688735.3A 2013-12-17 2013-12-17 一种基于自适应多最小支持度的关联规则推荐方法 Active CN103700005B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310688735.3A CN103700005B (zh) 2013-12-17 2013-12-17 一种基于自适应多最小支持度的关联规则推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310688735.3A CN103700005B (zh) 2013-12-17 2013-12-17 一种基于自适应多最小支持度的关联规则推荐方法

Publications (2)

Publication Number Publication Date
CN103700005A CN103700005A (zh) 2014-04-02
CN103700005B true CN103700005B (zh) 2016-08-31

Family

ID=50361526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310688735.3A Active CN103700005B (zh) 2013-12-17 2013-12-17 一种基于自适应多最小支持度的关联规则推荐方法

Country Status (1)

Country Link
CN (1) CN103700005B (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105321089A (zh) * 2014-07-16 2016-02-10 苏宁云商集团股份有限公司 基于多算法融合的电子商务推荐方法和系统
CN104504159B (zh) * 2015-01-19 2018-10-02 齐鲁工业大学 多支持度的正负序列模式在客户购买行为分析中的应用
CN106445975B (zh) * 2015-08-12 2020-04-21 哈尔滨工业大学深圳研究生院 项集挖掘方法及装置
CN106503000B (zh) * 2015-09-03 2019-10-29 菜鸟智能物流控股有限公司 对网上交互平台上的物品进行移动的方法和装置
CN107085757B (zh) * 2016-02-16 2021-06-29 中国移动通信集团江苏有限公司 一种确定风险类用户的方法及装置
CN107730336A (zh) * 2016-08-12 2018-02-23 苏宁云商集团股份有限公司 一种在线交易中的商品推送方法及装置
CN106650273B (zh) * 2016-12-28 2019-08-23 东方网力科技股份有限公司 一种行为预测方法和装置
CN108267962B (zh) * 2016-12-30 2021-08-06 中国移动通信有限公司研究院 一种控制方法和装置
CN107481183B (zh) * 2017-07-14 2020-10-02 南京理工大学 一种基于多维数据关联规则的微光图像彩色化方法
CN109426998B (zh) * 2017-08-29 2022-01-07 北京京东尚科信息技术有限公司 信息推送方法和装置
CN108198051A (zh) * 2018-03-01 2018-06-22 口碑(上海)信息技术有限公司 跨商品类别的商品推荐方法及装置
CN108629665B (zh) * 2018-05-08 2021-07-16 北京邮电大学 一种个性化商品推荐方法和系统
CN108805191A (zh) * 2018-05-31 2018-11-13 广东欣薇尔服装有限公司 一种根据损耗规则自动补数的跟单管理方法
CN108898459B (zh) * 2018-06-25 2020-12-01 中国联合网络通信集团有限公司 一种商品推荐方法及装置
CN109034554B (zh) * 2018-07-05 2021-04-02 龙马智芯(珠海横琴)科技有限公司 相关性计算方法及系统
CN109410008B (zh) * 2018-10-31 2021-06-04 中国石油大学(华东) 一种融合频繁项集的油田业务服务推荐方法
CN109656540B (zh) * 2018-11-16 2022-07-26 浙江心怡供应链管理有限公司 一种基于Apriori算法的补货库位推荐方法
CN110110225B (zh) * 2019-04-17 2020-08-07 重庆第二师范学院 基于用户行为数据分析的在线教育推荐模型及构建方法
CN110096646A (zh) * 2019-05-08 2019-08-06 广州虎牙信息科技有限公司 品类关联信息的生成及其视频推送方法和相关设备
CN110334133B (zh) * 2019-07-11 2020-11-20 北京京东智能城市大数据研究院 规则挖掘方法和装置、电子设备和计算机可读存储介质
CN110442640B (zh) * 2019-08-05 2021-08-31 西南交通大学 基于先验权重和多层tfp算法的地铁故障关联推荐方法
CN110489652B (zh) * 2019-08-23 2022-06-03 重庆邮电大学 基于用户行为检测的新闻推荐方法、系统及计算机设备
CN110909238B (zh) * 2019-10-25 2022-06-07 北京比财数据科技有限公司 一种考虑竞争模式的关联挖掘算法
CN110866047A (zh) * 2019-11-13 2020-03-06 辽宁工程技术大学 一种基于改进关联规则的社团发现算法
CN110852863B (zh) * 2019-11-15 2023-06-23 安徽海汇金融投资集团有限公司 一种基于关联分析的应收账款流转推荐方法及系统
CN111159545A (zh) * 2019-12-24 2020-05-15 贝壳技术有限公司 推荐房源确定方法及装置、房源推荐方法及装置
CN111274504B (zh) * 2020-01-20 2023-09-26 浙江中国轻纺城网络有限公司 电商平台的商品分类方法、装置及设备
CN111914163A (zh) * 2020-06-20 2020-11-10 武汉海云健康科技股份有限公司 一种药品组合推荐方法、装置、电子设备及存储介质
CN112699174B (zh) * 2021-03-23 2021-08-17 中建电子商务有限责任公司 一种大数据建筑用品驱动链图生成方法
CN113420214B (zh) * 2021-06-23 2023-01-10 青岛海信智慧生活科技股份有限公司 一种电子交易对象推荐方法和装置及设备
CN113342855B (zh) * 2021-06-24 2022-03-01 汇付天下有限公司 一种基于大数据的数据匹配方法及装置
CN115983921B (zh) * 2022-12-29 2023-11-14 广州市玄武无线科技股份有限公司 一种线下门店商品关联组合方法、装置、设备及存储介质
CN118295846B (zh) * 2024-06-06 2024-08-20 中电云计算技术有限公司 基于FP-Growth的云平台告警分析方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402757A (zh) * 2010-09-15 2012-04-04 阿里巴巴集团控股有限公司 信息提供方法及装置、综合关联度确定方法及装置
CN102592223A (zh) * 2011-01-18 2012-07-18 卓望数码技术(深圳)有限公司 一种商品推荐方法和商品推荐系统
CN102609860A (zh) * 2012-01-20 2012-07-25 彭立发 一种适用于电子商务的商品与信息分类推荐方法及系统
CN102629360A (zh) * 2012-03-13 2012-08-08 浙江大学 一种有效的动态商品推荐方法及商品推荐系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402757A (zh) * 2010-09-15 2012-04-04 阿里巴巴集团控股有限公司 信息提供方法及装置、综合关联度确定方法及装置
CN102592223A (zh) * 2011-01-18 2012-07-18 卓望数码技术(深圳)有限公司 一种商品推荐方法和商品推荐系统
CN102609860A (zh) * 2012-01-20 2012-07-25 彭立发 一种适用于电子商务的商品与信息分类推荐方法及系统
CN102629360A (zh) * 2012-03-13 2012-08-08 浙江大学 一种有效的动态商品推荐方法及商品推荐系统

Also Published As

Publication number Publication date
CN103700005A (zh) 2014-04-02

Similar Documents

Publication Publication Date Title
CN103700005B (zh) 一种基于自适应多最小支持度的关联规则推荐方法
CN107909433A (zh) 一种基于大数据移动电子商务的商品推荐方法
Staikos et al. A decision-making model for waste management in the footwear industry
CN103995882B (zh) 基于MapReduce的概率频繁项集挖掘方法
Jana et al. Multi-item partial backlogging inventory models over random planninghorizon in random fuzzy environment
CN106485562A (zh) 一种基于用户历史行为的商品信息推荐方法及系统
CN109741113A (zh) 一种基于大数据的用户购买意向预测方法
Montazar et al. A fuzzy analytical hierarchy methodology for the performance assessment of irrigation projects
CN102541899B (zh) 一种信息识别方法及设备
CN102841929A (zh) 一种综合用户和项目评分及特征因素的推荐方法
Hossein Javaheri Response modeling in direct marketing: a data mining based approach for target selection
CN105590237A (zh) 带负利润项的高效用序列模式在电子商务决策制定中的应用
CN115496566B (zh) 基于大数据的地区特产推荐方法及系统
CN109740624A (zh) 一种基于大数据的物流供应链需求预测方法
CN108765042A (zh) 一种基于用户与商铺网络-物理空间交互行为的商铺推荐算法
Hemalatha Market basket analysis–a data mining application in Indian retailing
Mesforoush et al. Customer profitability segmentation for SMEs case study: network equipment company
CN108615177A (zh) 基于加权提取兴趣度的电子终端个性化推荐方法
Bhattacharya et al. High utility itemset mining
CN107133726A (zh) 基于专利信息的产品方案竞争力评价方法
CN105740415A (zh) 基于标签位置权重与自学习的招投标好友推荐系统
CN107491988A (zh) 一种基于遗传算法和改进兴趣度的智慧零售数据挖掘方法
CN118134553B (zh) 一种电商爆款多平台协同推送系统、方法、设备及介质
CN115858800A (zh) 一种基于类比推理的增强知识图谱补全方法
CN105654342A (zh) 社会网络合作影响传播最大化的初始用户选择方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190718

Address after: Room 9951, Building 3, 1800, Panyuan Road, Changxing Town, Chongming District, Shanghai, 202150 (Shanghai Tai and Economic Development Zone)

Patentee after: Shanghai Zhenke Information Technology Service Co.,Ltd.

Address before: Room J3259, 1st floor E, Building 358_368 Kefu Road, Jiading District, Shanghai, 201800

Patentee before: SHANGHAI YINGZHI INFORMATION TECHNOLOGY Co.,Ltd.

Effective date of registration: 20190718

Address after: Room J3259, 1st floor E, Building 358_368 Kefu Road, Jiading District, Shanghai, 201800

Patentee after: SHANGHAI YINGZHI INFORMATION TECHNOLOGY Co.,Ltd.

Address before: Zhongshan road Wuzhong District Mudu town of Suzhou city in Jiangsu province 215101 No. 70 Wuzhong Science Park Building 2 room 2310

Patentee before: Nanjing University of Information Science and Technology

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: An Association Rule Recommendation Method Based on Adaptive Multi Minimum Support

Effective date of registration: 20231113

Granted publication date: 20160831

Pledgee: Industrial Bank Co.,Ltd. Shanghai Longbai Branch

Pledgor: Shanghai Zhenke Information Technology Service Co.,Ltd.

Registration number: Y2023310000725