CN111949711A - 一种基于可决策的高效用负序列规则挖掘的商品推荐系统及其工作方法 - Google Patents

一种基于可决策的高效用负序列规则挖掘的商品推荐系统及其工作方法 Download PDF

Info

Publication number
CN111949711A
CN111949711A CN202010832287.XA CN202010832287A CN111949711A CN 111949711 A CN111949711 A CN 111949711A CN 202010832287 A CN202010832287 A CN 202010832287A CN 111949711 A CN111949711 A CN 111949711A
Authority
CN
China
Prior art keywords
utility
customer
module
commodity
negative sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010832287.XA
Other languages
English (en)
Other versions
CN111949711B (zh
Inventor
董祥军
张孟姣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yuanjing Information Technology Co ltd
Original Assignee
Qilu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology filed Critical Qilu University of Technology
Priority to CN202010832287.XA priority Critical patent/CN111949711B/zh
Priority to AU2020103191A priority patent/AU2020103191A4/en
Priority to JP2021562005A priority patent/JP2022548435A/ja
Priority to PCT/CN2020/129274 priority patent/WO2022036894A1/zh
Priority to KR1020217034665A priority patent/KR20220023331A/ko
Priority to CA3130784A priority patent/CA3130784A1/en
Publication of CN111949711A publication Critical patent/CN111949711A/zh
Priority to LU102311A priority patent/LU102311B1/de
Application granted granted Critical
Publication of CN111949711B publication Critical patent/CN111949711B/zh
Priority to US17/458,829 priority patent/US20220058716A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于可决策的高效用负序列规则挖掘的商品推荐系统及其工作方法,包括依次连接的信息采集模块、商品推荐模块、商品销售模块;实时提取并保存顾客的行为数据,传输至商品推荐模块;对采集的顾客的行为数据进行数据清理、数据分类;对顾客的购物行为进行分析和预测;建立与顾客ID对应的购物行为序列,性别相同并在同一年龄区间的顾客的购物行为数据构成一个序列数据库;对序列数据库进行挖掘,得到符合要求的可决策的高效用负序列规则,即符合该顾客的商品推荐;本发明不仅考虑了事物之间的统计相关性,还将事物之间的语义含义考虑在内,能删除掉很多无用规则,得到更多有意义的并且可以直接用来决策的规则。

Description

一种基于可决策的高效用负序列规则挖掘的商品推荐系统及 其工作方法
技术领域
本发明涉及一种基于可决策的高效用负序列规则挖掘的商品推荐系统及其工作方法,属于可决策的高效用负序列规则的应用技术领域。
背景技术
互联网技术的普及促进了线上电商的飞速发展。线上电商的优势在于可以根据用户账号、浏览器cookie等识别不同的用户,进而根据用户的历史浏览、购买记录向用户推荐商品。然而,其中一个不足之处是有时候为用户提供的推荐商品明显的不符合顾客的需求。另外,线下门店仍然是商品销售的一个重要途径,但是由于其智能化的不足,无法实现如同线上电商的商品推荐及相应的用户体验。如何在线下门店利用智能化手段为用户进行精准的商品推荐使其获得和线上电商类似的用户体验是一个亟待解决的问题。现有的商品推荐方法虽然可以得到很多信息,但是其中很大一部分信息是冗余的,甚至是相互矛盾的,如何过滤掉这些无用信息是非常困难的;另外,如何利用线下门店的优势,采集顾客的相关信息,并对其进行高效的分析,进而得到直接可以用来决策的推荐信息是需要攻克的技术难题。
数据挖掘旨在从大量数据中发现有效的、新颖的、有潜在应用价值的和最终可理解的模式,是数据库知识发现(Knowledge-Discovery in Databases,KDD)中的一个步骤。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。数据挖掘是目前有效处理和利用海量数字信息的主要计算机手段,是解决信息时代信息过载而知识缺乏问题的主体方法。
高效用负序列规则挖掘是数据挖掘中一个十分重要的研究领域。相较于传统的关联规则挖掘,它不仅考虑了项的统计意义,也考虑了项的语义度量,能更清晰的表达现实世界的需求。因为在挖掘算法中,每个项目可以被赋予不同的效用权值,每个项出现的次数会被记录,而且项可以在每一条事务中重复出现,更符合现实世界的供应和需求。
发明内容
针对现有技术的不足,为了发现更多可用于决策的高效用负序列规则,本发明提供了一种基于可决策的高效用负序列规则挖掘的商品推荐系统。
本发明还提供了上述基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法。
本发明提出了一个名为AUNSRM的高效算法来挖掘可决策的高效用负序列规则。将AUNSRM算法应用到商品推荐中,可以发现商品间的负相关关系,从而为顾客商品推荐提供决策支持。
术语解释:
1、e-HUNSR算法:一种非常高效的高效用负序列规则挖掘算法,该算法首次定义了如何挖掘高效用负序列规则,并利用效用置信度衡量规则的有用性。给出了如何生成候选规则、如何存储必要信息、如何修剪无用规则的具体实现方法。
2、哈希表:散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。
3、效用值:utility,表示一条序列中每个项的数量与项的单位效用的乘积和。
4、最小效用阈值:minimum utility,简称min_utility,是一条高效用序列满足的最小效用值,区分高效用序列和低效用序列的临界值,是由用户设定的。
5、效用置信度:uconf,在高效用序列规则R:X→Y中,项集X在项集X∪Y中的局部效用值与项集X在数据库中的效用值的比值,含义为项集X为促成项集X∪Y的发生做出的效用贡献占自身总效用的比率。
6、最小效用置信度阈值:minimum uconf,简称min_uconf,是一条高效用负序列规则所满足的效用置信度的最小值。
7、支持度:support,表示一条序列或者规则在数据库中出现的数目与数据库总序列数目的比值。
8、高效用负序列规则:High Utility Negative Sequential Rule,简称HUNSR,是同时满足最小效用阈值、最小效用置信度阈值的负序列规则。例如负序列规则
Figure BDA0002638416340000021
的效用值、效用置信度分别是420、1,若设定的最小效用阈值、最小效用置信度阈值分别是200、0.25,那么
Figure BDA0002638416340000022
就是一条高效用负序列规则。
本发明的技术方案如下:
一种基于可决策的高效用负序列规则挖掘的商品推荐系统,包括通过传输网络通信依次连接的信息采集模块、商品推荐模块、商品销售模块;
所述信息采集模块包括依次连接的信息提取模块、第一信息传输模块;
所述信息提取模块用于:实时提取并保存顾客的行为数据,顾客的行为数据包括顾客ID、人脸标志、性别、年龄、时间戳、顾客浏览的商品标志;所述第一信息传输模块用于:通过传输网络将顾客的行为数据传输至所述商品推荐模块;
所述商品推荐模块包括依次连接的信息处理模块、信息分析模块、显示模块和第二信息传输模块;所述商品推荐模块设置在云服务器内,所述第一信息传输模块连接所述信息处理模块;
所述信息处理模块用于:对采集的顾客的行为数据进行数据清理,因为现实世界的数据一般是不完整的、有噪声的和不一致的。并对数据清理后的数据进行数据分类;所述信息分析模块用于:根据所述信息处理模块的处理结果,对顾客的购物行为进行分析和预测;是指:所述信息分析模块基于所述信息处理模块处理后的顾客的行为数据,建立与顾客ID对应的购物行为序列,并对购物行为进行分析和预测,性别相同并在同一年龄区间的顾客的购物行为数据构成一个序列数据库,每个顾客ID对应一条顾客在某个时间段内所有的购物记录构成一个有序的序列;对序列数据库进行挖掘,得到符合要求的可决策的高效用负序列规则,即符合该顾客的商品推荐;所述显示模块用于:为顾客展示推荐结果,包括商品ID、型号、数量、单价,若顾客满意,则添加至购物车;若不满意,则放弃该推荐结果;所述第二信息传输模块用于:通过传输网络将所述商品推荐模块的处理结果传输至所述商品销售模块;
所述商品销售模块包括依次连接的结算模块、库存更新模块和第三信息传输模块;
所述商品销售模块设置在云服务器内,所述第三信息传输模块连接所述商品推荐模块;所述结算模块用于:当顾客去收银台结算时,依据所述商品推荐模块的处理结果对其购物车内的商品进行结算;所述库存更新模块用于:当本次结算订单成功后,实时更新商品的库存;此外,所述商品销售模块还对本次顾客的购物行为数据进行缓存,并将本次的购物记录通过所述第三信息传输模块实时反馈给所述商品推荐模块。这样才能保证商品推荐模块中的数据是最新的,这样才能保证系统推荐的结果更加准确,符合顾客需求。
根据本发明优选的,所述传输网络为有线网、局域网、Wi-Fi、个人网或4G/5G网络。
本发明采用云端管理平台设计,商品推荐模块和商品销售模块都设置在云服务器内,无需进行复杂的线下硬件配置,简洁易行。线下门店网点不需要单独配置服务器,直接租用本系统云端管理平台服务器,就能随时随地进行数据上传、下载、调取信息云端数据保存,不但能够降低资料丢失率,还能降低企业运营成本减少不必要的开支。本系统也可在公司内部私有化云部署,可部署在公司数据中心的防火墙内,也可以将部署在一个安全的主机托管场所,在不影响现有的公司IT管理的流程前提下充分利用现有硬件资源和软件资源,极大地降低公司的成本,提供对数据、安全性和服务质量的最有效控制。
上述基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,包括步骤如下:
(1)所述信息提取模块实时提取并保存顾客的行为数据,顾客的行为数据包括顾客ID、人脸标志、性别、年龄、时间戳、顾客浏览的商品标志;其中,人脸标志例如是否戴眼镜、眼睛坐标位置。
(2)所述第一信息传输模块通过传输网络将步骤(1)所述信息采集模块提取的顾客的行为数据传输至所述商品推荐模块;
(3)所述信息处理模块对采集的顾客的行为数据进行数据清理,并对数据清理后的数据进行数据分类;
(4)根据所述信息处理模块的处理结果,所述信息分析模块对顾客的购物行为进行分析和预测;是指:所述信息分析模块基于所述信息处理模块处理后的顾客的行为数据,建立与顾客ID对应的购物行为序列,并对购物行为进行分析和预测,性别相同并在同一年龄区间的顾客的购物行为数据构成一个序列数据库,每个顾客ID对应一条顾客在某个时间段内所有的购物记录构成一个有序的序列;对序列数据库进行挖掘,得到符合要求的可决策的高效用负序列规则,即符合该顾客的商品推荐;
(5)根据步骤(4)得到的符合顾客的商品推荐,所述显示模块为顾客展示推荐结果,包括商品ID、型号、数量、单价,若顾客满意,则添加至购物车;若不满意,则放弃该推荐结果;
(6)所述第二信息传输模块通过传输网络将所述商品推荐模块的处理结果传输至所述商品销售模块;
(7)当顾客去收银台结算时,所述结算模块依据所述商品推荐模块的处理结果对其购物车内的商品进行结算;当本次结算订单成功后,所述库存更新模块实时更新商品的库存;所述商品销售模块对本次顾客的购物行为数据进行缓存,并将本次的购物记录通过所述第三信息传输模块实时反馈给所述商品推荐模块。
根据本发明优选的,步骤(3)中,因为现实世界的数据一般是不完整的、有噪声的和不一致的。通过信息采集模块对顾客的行为数据进行采集时,可能出现缺失值、重复和不一致数据等情况,例如顾客C2和C3的信息交叉等情况。所述信息处理模块对采集的顾客的行为数据进行数据清理,是指:对于缺失值,依次确定缺失值范围、去除不需要的字段、填充缺失内容;对于重复数据,删除保留一条信息;对于不一致数据,进行数据填充。
根据本发明优选的,步骤(3)中,按照顾客的性别和年龄对数据清理后的数据进行数据分类,是指:将具有同一性别并在同一年龄区间的顾客的行为数据组成一个数据库;不同性别或不同年龄区间的顾客的行为数据组成的数据库之间相互独立,每个数据库内包含该类顾客的所有行为数据。例如,女性并且年龄在20-25岁区间内的数据库包含的顾客购物记录为:C1,2010.11.20,女性,21岁,质感流行链条手提包,棕色,数量1;C2,2010.11.21,女性,25岁,夏款碎花连衣裙,蓝色,数量1。
根据本发明优选的,步骤(4)中,所述信息分析模块通过AUNSRM算法对顾客行为数据进行分析和预测,包括步骤如下:
A、通过高效用负序列规则挖掘方法e-HUNSR算法,从效用序列数据库中挖掘得到所有的高效用负序列规则,即顾客的购物序列中价值大于一定值的规则,并计算每个高效用负序列规则的效用值和效用置信度;将得到的高效用负序列规则的信息分别存储在两个哈希表中,在第一个哈希表中,key1值代表高效用负序列规则,value1值代表对应高效用负序列规则的效用值;在第二个哈希表中,key2值代表高效用负序列规则,value2值代表对应高效用负序列规则的效用置信度;例如,对于一条高效用负序列规则
Figure BDA0002638416340000051
(utility=1350,uconf=80%),它表示在该效用序列数据库中先购买商品a,接着没有购买商品b,最后又购买了商品d的顾客总共花费了1350元,效用置信度是80%。在最小效用阈值是1000,最小效用置信度是60%的前提下,我们可得结论:当发现顾客购买了商品a但没购买商品b的时候,如果及时地向其推荐商品d,我们将有80%的可能性会获得较高利润。
根据本发明优选的,步骤A中,效用序列数据库由步骤(3)数据分类后得到的数据库转化而来,方法如下:首先,以顾客ID作为主键,先从数据库中找到所有包含该顾客ID的购物行为数据,顾客的购物行为数据是指所述商品销售模块通过所述第三信息传输模块反馈给所述商品推荐模块的数据,包含时间戳、顾客ID、商品ID、数量、单价;然后,将顾客ID相同的购物行为数据进行合并,即:去掉时间戳(购物时间),保留顾客ID作为第一个字段,将该顾客购买的商品ID以及数量按照时间顺序排序组成第二个字段;另外,每种商品的单价将进行独立保存;由此,得到不同性别不同年龄区间对应的效用序列数据库;
根据本发明优选的,步骤A中,通过高效用负序列规则挖掘方法e-HUNSR算法从效用序列数据库中挖掘高效用负序列规则,包括步骤如下:
a、通过HUNSPM算法从效用序列数据库中挖掘得到所有的高效用负序列模式,并保存其效用值,高效用负序列模式指的是效用值大于或等于最小效用阈值的效用负序列模式;例如
Figure BDA0002638416340000052
的效用值是20,在最小效用阈值是18的前提下,它就是一条高效用负序列模式。
b、基于步骤a生成的高效用负序列模式得到所有的候选规则,具体方法是:将该条高效用负序列模式分成前后两部分,即前件和后件;例如,
Figure BDA0002638416340000053
对应的候选规则为:
Figure BDA0002638416340000054
Figure BDA0002638416340000055
c、删除前件或者后件只有一个负项的候选规则;例如,在
Figure BDA0002638416340000056
对应的候选规则中,应该删除
Figure BDA0002638416340000057
因为它的后件只有一个负项,保留其他的候选规则。
d、计算剩余候选规则的效用置信度,大于最小效用置信度阈值的规则就是所求的高效用负序列规则。
B、筛选可决策的高效用负序列规则:基于支持度、规则包含条件、效用值对高效用负序列规则进行筛选;按照支持度、规则包含条件、效用值的次序依次对每个高效用负序列规则进行筛选,包括步骤如下:
假设存在高效用负序列规则
Figure BDA0002638416340000061
Figure BDA0002638416340000062
R和Ri分别代表两条不同的高效用负序列规则,X代表R的前件,Y代表R的后件,Xi代表Ri的前件,Yi代表Ri的后件,当满足以下三个条件①、②及③时,则高效用负序列规则R是相对于Ri的可决策的高效用负序列规则,删除所有Ri,保留R,得到所有满足条件①、②及③的可决策的高效用负序列规则,即符合该顾客的商品推荐;
①:R和Ri的支持度相等;
②:
Figure BDA0002638416340000063
Figure BDA0002638416340000064
进行比较,
Figure BDA0002638416340000065
③:u(Ri)≤u(R);u(Ri)是指Ri的效用值,u(R)是指R的效用值;
进一步优选的,条件①中,R的支持度的计算公式如式(Ⅰ)所示:
Figure BDA0002638416340000066
式(Ⅰ)中,|D|表示序列数据库D中的元组数目,元组表示为<sid(sequence-ID),ds(data sequence)>,sequence-ID指每条序列的ID号,简称为sid,例如表2中的C1、C2、C3;data sequence指对应的序列,简称为ds,例如C1对应的ds是<(a,1){(c,3)(e,5}>,C2对应的ds是<{(b,2)(c,3)(d,1)}{(a,2)(d,5)}>,C3对应的ds是<{(b,5)(e,3)}(a,3)>;
Figure BDA00026384163400000614
表示X和Y的连接,
Figure BDA00026384163400000615
表示序列数据库D中包含
Figure BDA00026384163400000616
的元组个数;
Ri的支持度的计算公式如式(Ⅱ)所示:
Figure BDA0002638416340000067
式(Ⅱ)中,
Figure BDA00026384163400000617
表示Xi和Yi的连接,
Figure BDA00026384163400000618
表示序列数据库D中包含
Figure BDA00026384163400000619
的元组个数。
进一步优选的,条件②中,假设
Figure BDA0002638416340000068
Figure BDA0002638416340000069
Figure BDA00026384163400000610
其中R和Ri分别代表两条不同的高效用负序列规则,ac代表R的前件,be代表R的后件,ac代表Ri的前件,b代表Ri的后件,则这两条规则满足条件②。
进一步优选的,条件③中,规则
Figure BDA00026384163400000611
设定<e1e2e3…ei-1>表示前件X,<ei…ek>表示后件Y,则该条规则表示为
Figure BDA00026384163400000612
规则R的效用值u(R)计算公式如式(Ⅲ)所示:
Figure BDA00026384163400000613
式(Ⅲ)中,i=1,2,3…k,ei∈R,u(ei)=q(ei,R)×p(ei),q(ei,R)为项ei的内部效用,p(ei)为项ei的外部效用;
在规则
Figure BDA0002638416340000071
中,设定<e1e2e3…ej-1>表示前件Xi,<ej…ek>表示后件Yi,则该条规则表示为
Figure BDA0002638416340000072
规则Ri的效用值u(Ri)计算公式如式(Ⅳ)所示:
Figure BDA0002638416340000073
式(Ⅳ)中,j=1,2,3…k,ej∈Ri,u(ej)=q(ej,R)×p(ej),q(ej,R)为项ej的内部效用,p(ej)为项ej的外部效用。
本发明的有益效果为:
1、现有的挖掘高效用负序列规则的算法得到的规则数量特别大,并且有很多相互矛盾的规则或者冗余规则,它们对于决策没有意义反而使得有用的规则更难被发现。本发明提出了一个可决策的高效用负序列规则挖掘算法-AUNSRM算法,该算法不仅考虑了事物之间的统计相关性,还将事物之间的语义含义考虑在内,能删除掉很多无用规则,得到更多有意义的并且可以直接用来决策的规则。对于商品推荐行为分析这个行业,可以为顾客的下一步购物提供科学的决策支持。
2、本发明应用在商品推荐行为分析中,适应了商品推荐行业不仅关注商品类型还关注商品价值的特点,当为顾客提供建议时,本发明可以从历史购物记录中发现有趣的规则,为顾客的下一步购物行为进行预测并提供支持。
附图说明
图1为本发明基于可决策的高效用负序列规则挖掘的商品推荐系统的结构框图。
具体实施方式
下面结合说明书附图和实施例对本发明作进一步限定,但不限于此。
实施例1
一种基于可决策的高效用负序列规则挖掘的商品推荐系统,如图1所示,包括通过传输网络通信依次连接的信息采集模块、商品推荐模块、商品销售模块;
信息采集模块包括依次连接的信息提取模块、第一信息传输模块;信息提取模块用于:实时提取并保存顾客的行为数据,顾客的行为数据包括顾客ID、人脸标志、性别、年龄、时间戳、顾客浏览的商品标志;第一信息传输模块用于:通过传输网络将顾客的行为数据传输至商品推荐模块;
商品推荐模块包括依次连接的信息处理模块、信息分析模块、显示模块和第二信息传输模块;商品推荐模块设置在云服务器内,第一信息传输模块连接信息处理模块;信息处理模块用于:对采集的顾客的行为数据进行数据清理,因为现实世界的数据一般是不完整的、有噪声的和不一致的。并对数据清理后的数据进行数据分类;信息分析模块用于:根据信息处理模块的处理结果,对顾客的购物行为进行分析和预测;是指:信息分析模块基于信息处理模块处理后的顾客的行为数据,建立与顾客ID对应的购物行为序列,并对购物行为进行分析和预测,性别相同并在同一年龄区间的顾客的购物行为数据构成一个序列数据库,每个顾客ID对应一条顾客在某个时间段内所有的购物记录构成一个有序的序列;对序列数据库进行挖掘,得到符合要求的可决策的高效用负序列规则,即符合该顾客的商品推荐;显示模块用于:为顾客展示推荐结果,包括商品ID、型号、数量、单价,若顾客满意,则添加至购物车;若不满意,则放弃该推荐结果;第二信息传输模块用于:通过传输网络将商品推荐模块的处理结果传输至商品销售模块;
商品销售模块包括依次连接的结算模块、库存更新模块和第三信息传输模块;商品销售模块设置在云服务器内,第三信息传输模块连接商品推荐模块;结算模块用于:当顾客去收银台结算时,依据商品推荐模块的处理结果对其购物车内的商品进行结算;库存更新模块用于:当本次结算订单成功后,实时更新商品的库存;此外,商品销售模块还对本次顾客的购物行为数据进行缓存,并将本次的购物记录通过第三信息传输模块实时反馈给商品推荐模块。这样才能保证商品推荐模块中的数据是最新的,这样才能保证系统推荐的结果更加准确,符合顾客需求。
传输网络为有线网、局域网、Wi-Fi、个人网或4G/5G网络。
本发明采用云端管理平台设计,商品推荐模块和商品销售模块都设置在云服务器内,无需进行复杂的线下硬件配置,简洁易行。线下门店网点不需要单独配置服务器,直接租用本系统云端管理平台服务器,就能随时随地进行数据上传、下载、调取信息云端数据保存,不但能够降低资料丢失率,还能降低企业运营成本减少不必要的开支。本系统也可在公司内部私有化云部署,可部署在公司数据中心的防火墙内,也可以将部署在一个安全的主机托管场所,在不影响现有的公司IT管理的流程前提下充分利用现有硬件资源和软件资源,极大地降低公司的成本,提供对数据、安全性和服务质量的最有效控制。
实施例2
实施例1所述基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,包括步骤如下:
(1)信息提取模块实时提取并保存顾客的行为数据,顾客的行为数据包括顾客ID、人脸标志、性别、年龄、时间戳、顾客浏览的商品标志;其中,人脸标志例如是否戴眼镜、眼睛坐标位置。
(2)第一信息传输模块通过传输网络将步骤(1)信息采集模块提取的顾客的行为数据传输至商品推荐模块;
(3)信息处理模块对采集的顾客的行为数据进行数据清理,并对数据清理后的数据进行数据分类;
(4)根据信息处理模块的处理结果,信息分析模块对顾客的购物行为进行分析和预测;是指:信息分析模块基于信息处理模块处理后的顾客的行为数据,建立与顾客ID对应的购物行为序列,并对购物行为进行分析和预测,性别相同并在同一年龄区间的顾客的购物行为数据构成一个序列数据库,每个顾客ID对应一条顾客在某个时间段内所有的购物记录构成一个有序的序列;对序列数据库进行挖掘,得到符合要求的可决策的高效用负序列规则,即符合该顾客的商品推荐;
(5)根据步骤(4)得到的符合顾客的商品推荐,显示模块为顾客展示推荐结果,包括商品ID、型号、数量、单价,若顾客满意,则添加至购物车;若不满意,则放弃该推荐结果;
(6)第二信息传输模块通过传输网络将商品推荐模块的处理结果传输至商品销售模块;
(7)当顾客去收银台结算时,结算模块依据商品推荐模块的处理结果对其购物车内的商品进行结算;当本次结算订单成功后,库存更新模块实时更新商品的库存;商品销售模块对本次顾客的购物行为数据进行缓存,并将本次的购物记录通过第三信息传输模块实时反馈给商品推荐模块。
实施例3
根据实施例2所述基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,包括步骤如下:
本实施例以某商场线下门店销售零食的购物数据记录作为实验数据,表1、表2分别是将顾客购物行为数据预处理后整理为效用序列数据库和效用表的部分结果,
表1
顾客ID 购物序列
C1 <(核桃仁,1000g)(巴旦木,3000g)>
C2 <(碧根果,2000g)(核桃仁,1000g)(麻辣豆干,200g)>
C3 <(芒果干,500g)(草莓干,300g)>
表2
核桃仁 碧根果 草莓干 麻辣豆干 芒果干
单位效用(元/1kg) 166.9 146 150 113 216
步骤(3)中,因为现实世界的数据一般是不完整的、有噪声的和不一致的。通过信息采集模块对顾客的行为数据进行采集时,可能出现缺失值、重复和不一致数据等情况,例如顾客C2和C3的信息交叉等情况。信息处理模块对采集的顾客的行为数据进行数据清理,是指:对于缺失值,依次确定缺失值范围、去除不需要的字段、填充缺失内容;对于重复数据,删除保留一条信息;对于不一致数据,进行数据填充。
步骤(3)中,按照顾客的性别和年龄对数据清理后的数据进行数据分类,是指:将具有同一性别并在同一年龄区间的顾客的行为数据组成一个数据库;不同性别或不同年龄区间的顾客的行为数据组成的数据库之间相互独立,每个数据库内包含该类顾客的所有行为数据。例如,女性并且年龄在18-22岁区间内的数据库包含的顾客购物记录为:C1,2019.10.20,女性,20岁,草莓干,1000g;C2,2020.1.14,女性,22岁,麻辣豆干,2000g;
步骤(4)中,信息分析模块通过AUNSRM算法对顾客行为数据进行分析和预测,最小效用阈值min_util=300,最小效用置信度min_uconf=0.55。包括步骤如下:
A、通过高效用负序列规则挖掘方法e-HUNSR算法,从效用序列数据库中挖掘得到所有的高效用负序列规则,即顾客的购物序列中价值大于一定值的规则,并计算每个高效用负序列规则的效用值和效用置信度;将得到的高效用负序列规则的信息分别存储在两个哈希表中,在第一个哈希表中,key1值代表高效用负序列规则,value1值代表对应高效用负序列规则的效用值;在第二个哈希表中,key2值代表高效用负序列规则,value2值代表对应高效用负序列规则的效用置信度;例如,对于一条高效用负序列规则
Figure BDA0002638416340000101
(utility=1350,uconf=80%),它表示在该效用序列数据库中先购买商品a,接着没有购买商品b,最后又购买了商品d的顾客总共花费了1350元,效用置信度是80%。在最小效用阈值是1000,最小效用置信度是60%的前提下,我们可得结论:当发现顾客购买了商品a但没购买商品b的时候,如果及时地向其推荐商品d,我们将有80%的可能性会获得较高利润。
步骤A中,效用序列数据库由步骤(3)数据分类后得到的数据库转化而来,方法如下:首先,以顾客ID作为主键,先从数据库中找到所有包含该顾客ID的购物行为数据,顾客的购物行为数据是指所述商品销售模块通过所述第三信息传输模块反馈给所述商品推荐模块的数据,包含时间戳、顾客ID、商品ID、数量、单价;然后,将顾客ID相同的购物行为数据进行合并,即:去掉时间戳(购物时间),保留顾客ID作为第一个字段,将该顾客购买的商品ID以及数量按照时间顺序排序组成第二个字段;另外,每种商品的单价将进行独立保存;由此,得到不同性别不同年龄区间对应的效用序列数据库;
下面,举例说明如何从顾客的购物行为数据得到效用序列数据库。如表1是由交易ID、交易时间、顾客ID、商品、数量和单价为关键字所排序的事务数据库。在一个事务数据库中,一个事务代表一次购物记录,一个单项代表购买的商品,单项属性中的字母记录的是商品ID。例如,T3表示,顾客C3在12-4-2019 8:02:12购买了5个b,3个e,其中,商品b和e的单价分别为5和6。
将包含顾客的购物行为数据的事务数据库以时间为序转变为效用序列数据库,例如将表3事务数据库中的事务数据库转换为表4中的序列数据库以及表5的效用表。
表3
Figure BDA0002638416340000111
表4
顾客ID 顾客购物序列
C1 <(a,1){(c,3)(e,5}>
C2 <{(b,2)(c,3)(d,1)}{(a,2)(d,5)}>
C3 <{(b,5)(e,3)}(a,3)>
表5
a b c d e
单位效用 9 5 2 1 6
在表4中,一位顾客在一定时间内所有的购物记录构成一条有序的序列,序列用<>表示。在序列中,项/元素是有时间顺序的,每个项都代表一种商品,而元素则是指该顾客在某一个具体的时间点同时购买的商品,用{}表示,例如{(c,3)(e,5}表示,同时购买了3个c和5个e。每个项后面都有一个数字,称为内部效用,代表该顾客在该时间购买的商品的数量;每个项都有自己的价值,称为单位效用(外部效用),如表5所示,例如每个a价值是9元。
步骤A中,通过高效用负序列规则挖掘方法e-HUNSR算法从效用序列数据库中挖掘高效用负序列规则,包括步骤如下:
a、通过HUNSPM算法从效用序列数据库中挖掘得到所有的高效用负序列模式,并保存其效用值,高效用负序列模式指的是效用值大于或等于最小效用阈值的效用负序列模式;例如
Figure BDA0002638416340000112
的效用值是20,在最小效用阈值是18的前提下,它就是一条高效用负序列模式。
b、基于步骤a生成的高效用负序列模式得到所有的候选规则,具体方法是:将该条高效用负序列模式分成前后两部分,即前件和后件;例如,
Figure BDA0002638416340000121
对应的候选规则为:
Figure BDA0002638416340000122
Figure BDA0002638416340000123
c、删除前件或者后件只有一个负项的候选规则;例如,在
Figure BDA0002638416340000124
对应的候选规则中,应该删除
Figure BDA0002638416340000125
因为它的后件只有一个负项,保留其他的候选规则。
d、计算剩余候选规则的效用置信度,大于最小效用置信度阈值的规则就是所求的高效用负序列规则。
表6显示了部分高效用负序列规则及其效用值和效用置信度;例如,对于一条高效用负序列规则
Figure BDA0002638416340000126
(utility=534,uconf=0.64),它表示在该效用序列数据库中先购买核桃仁,接着没有购买麻辣豆干,最后又购买了碧根果和核桃仁的顾客总共花费了534元,效用置信度是0.64。在最小效用阈值是300,最小效用置信度是0.55的前提下,我们可得结论:当发现顾客购买了核桃仁但没购买麻辣豆干的时候,如果及时地向其推荐碧根果和核桃仁,我们将有64%的可能性会获得较高利润。效用序列数据库由数据分类的数据库转化而来,方法如下:以顾客ID作为主键,先从数据库中找到所有包含该顾客ID的购物行为数据;将顾客ID相同的购物行为数据进行合并,即去掉时间戳(购物时间),保留顾客ID,将该顾客购买的商品ID以及数量按照时间顺序排序组成第二个字段,由此得到不同性别不同年龄区间对应的效用序列数据库;
表6
Figure BDA0002638416340000127
将步骤A得到的高效用负序列规则存储在哈希表中,key值代表高效用负序列规则,value值代表对应的效用值和效用置信度;
B、筛选可决策的高效用负序列规则:基于支持度、规则包含条件、效用值对高效用负序列规则进行筛选;按照支持度、规则包含条件、效用值的次序依次对每个高效用负序列规则进行筛选,包括步骤如下:
假设存在高效用负序列规则
Figure BDA0002638416340000131
Figure BDA0002638416340000132
R和Ri分别代表两条不同的高效用负序列规则,X代表R的前件,Y代表R的后件,Xi代表Ri的前件,Yi代表Ri的后件,当满足以下三个条件①、②及③时,则高效用负序列规则R是相对于Ri的可决策的高效用负序列规则,删除所有Ri,保留R,得到所有满足条件①、②及③的可决策的高效用负序列规则,即符合该顾客的商品推荐;
①:R和Ri的支持度相等;
②:
Figure BDA0002638416340000133
Figure BDA0002638416340000134
进行比较,
Figure BDA0002638416340000135
③:u(Ri)≤u(R);u(Ri)是指Ri的效用值,u(R)是指R的效用值;
例如,存在规则
Figure BDA0002638416340000136
Figure BDA0002638416340000137
根据步骤①,R1的支持度和R2的支持度相等,进行步骤②;根据步骤②,
Figure BDA0002638416340000138
R1的前件含于R2的前件,即
Figure BDA0002638416340000139
R1的后件包含R2的后件,即
Figure BDA00026384163400001310
进行步骤③;根据步骤③,R1的效用大于R2的效用;综上,R1是相对于R2的可决策的规则,应该删除R2,保留R1。删除所有类似于的R2的规则,保留所有类似于的R1的规则,则由所有的R1组成的可决策的高效用负序列规则就是我们所求的可以直接为顾客进行商品推荐的规则。
条件①中,R的支持度的计算公式如式(Ⅰ)所示:
Figure BDA00026384163400001311
式(Ⅰ)中,|D|表示序列数据库D中的元组数目,元组表示为<sid(sequence-ID),ds(data sequence)>,sequence-ID指每条序列的ID号,简称为sid,例如表2中的C1、C2、C3;data sequence指对应的序列,简称为ds,例如C1对应的ds是<(a,1){(c,3)(e,5}>,C2对应的ds是<{(b,2)(c,3)(d,1)}{(a,2)(d,5)}>,C3对应的ds是<{(b,5)(e,3)}(a,3)>;
Figure BDA00026384163400001312
表示X和Y的连接,
Figure BDA00026384163400001313
表示序列数据库D中包含
Figure BDA00026384163400001314
的元组个数;
Ri的支持度的计算公式如式(Ⅱ)所示:
Figure BDA00026384163400001315
式(Ⅱ)中,
Figure BDA00026384163400001316
表示Xi和Yi的连接,
Figure BDA00026384163400001317
表示序列数据库D中包含
Figure BDA00026384163400001318
的元组个数。
条件②中,假设
Figure BDA00026384163400001319
Figure BDA00026384163400001320
其中R和Ri分别代表两条不同的高效用负序列规则,ac代表R的前件,be代表R的后件,ac代表Ri的前件,b代表Ri的后件,则这两条规则满足条件②。
条件③中,规则
Figure BDA00026384163400001321
设定<e1e2e3…ei-1>表示前件X,<ei…ek>表示后件Y,则该条规则表示为
Figure BDA0002638416340000141
规则R的效用值u(R)计算公式如式(Ⅲ)所示:
Figure BDA0002638416340000142
式(Ⅲ)中,i=1,2,3…k,ei∈R,u(ei)=q(ei,R)×p(ei),q(ei,R)为项ei的内部效用,p(ei)为项ei的外部效用;
在规则
Figure BDA0002638416340000143
中,设定<e1e2e3…ej-1>表示前件Xi,<ej…ek>表示后件Yi,则该条规则表示为
Figure BDA0002638416340000144
规则Ri的效用值u(Ri)计算公式如式(Ⅳ)所示:
Figure BDA0002638416340000145
式(Ⅳ)中,j=1,2,3…k,ej∈Ri,u(ej)=q(ej,R)×p(ej),q(ej,R)为项ej的内部效用,p(ej)为项ej的外部效用。
按照此方法产生所有的高效用负序列规则。表7展示了部分可决策的高效用负序列规则。例如:
Figure BDA0002638416340000146
Figure BDA0002638416340000147
等等。标注删除线的规则
Figure BDA0002638416340000148
表示该规则经过步骤①-③的筛选后,已经被删除。删除原因如下所示:
Figure BDA0002638416340000149
称作R1,
Figure BDA00026384163400001410
称为R2。根据步骤①,R1的支持度和R2的支持度相等,进行步骤②;根据步骤②,R1的前件和R2的前件相同,R1的后件包含R2的后件,进行步骤③;根据步骤③,R1的效用大于R2的效用;综上,R1是相对于R2的可决策的规则,应该删除R2,保留R1。
表7
Figure BDA00026384163400001411
算法伪代码
Figure BDA0002638416340000153
步骤(1)通过e-HUNSR算法挖掘得到所有的高效用负序列规则;
步骤(2)将所有的高效用负序列规则存储在AUNSRset集合中;
步骤(4)根据支持度对规则进行筛选;
步骤(5)根据规则包含条件对规则进行筛选;
步骤(6)根据效用值对规则进行筛选;
步骤(7)删除掉冗余的规则;
步骤(12)返回AUNSRset集合。

Claims (10)

1.一种基于可决策的高效用负序列规则挖掘的商品推荐系统,其特征在于,包括通过传输网络通信依次连接的信息采集模块、商品推荐模块、商品销售模块;
所述信息采集模块包括依次连接的信息提取模块、第一信息传输模块;
所述信息提取模块用于:实时提取并保存顾客的行为数据,顾客的行为数据包括顾客ID、人脸标志、性别、年龄、时间戳、顾客浏览的商品标志;所述第一信息传输模块用于:通过传输网络将顾客的行为数据传输至所述商品推荐模块;
所述商品推荐模块包括依次连接的信息处理模块、信息分析模块、显示模块和第二信息传输模块;所述商品推荐模块设置在云服务器内,所述第一信息传输模块连接所述信息处理模块;
所述信息处理模块用于:对采集的顾客的行为数据进行数据清理,并对数据清理后的数据进行数据分类;所述信息分析模块用于:根据所述信息处理模块的处理结果,对顾客的购物行为进行分析和预测;是指:所述信息分析模块基于所述信息处理模块处理后的顾客的行为数据,建立与顾客ID对应的购物行为序列,并对购物行为进行分析和预测,性别相同并在同一年龄区间的顾客的购物行为数据构成一个序列数据库,每个顾客ID对应一条顾客在某个时间段内所有的购物记录构成一个有序的序列;对序列数据库进行挖掘,得到符合要求的可决策的高效用负序列规则,即符合该顾客的商品推荐;所述显示模块用于:为顾客展示推荐结果,包括商品ID、型号、数量、单价,若顾客满意,则添加至购物车;若不满意,则放弃该推荐结果;所述第二信息传输模块用于:通过传输网络将所述商品推荐模块的处理结果传输至所述商品销售模块;
所述商品销售模块包括依次连接的结算模块、库存更新模块和第三信息传输模块;
所述商品销售模块设置在云服务器内,所述第三信息传输模块连接所述商品推荐模块;所述结算模块用于:当顾客去收银台结算时,依据所述商品推荐模块的处理结果对其购物车内的商品进行结算;所述库存更新模块用于:当本次结算订单成功后,实时更新商品的库存;此外,所述商品销售模块还对本次顾客的购物行为数据进行缓存,并将本次的购物记录通过所述第三信息传输模块实时反馈给所述商品推荐模块。
2.根据权利要求1所述的一种基于可决策的高效用负序列规则挖掘的商品推荐系统,其特征在于,所述传输网络为有线网、局域网、Wi-Fi、个人网或4G/5G网络。
3.权利要求1或2所述的基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,其特征在于,包括步骤如下:
(1)所述信息提取模块实时提取并保存顾客的行为数据,顾客的行为数据包括顾客ID、人脸标志、性别、年龄、时间戳、顾客浏览的商品标志;其中,人脸标志例如是否戴眼镜、眼睛坐标位置。
(2)所述第一信息传输模块通过传输网络将步骤(1)所述信息采集模块提取的顾客的行为数据传输至所述商品推荐模块;
(3)所述信息处理模块对采集的顾客的行为数据进行数据清理,并对数据清理后的数据进行数据分类;
(4)根据所述信息处理模块的处理结果,所述信息分析模块对顾客的购物行为进行分析和预测;是指:所述信息分析模块基于所述信息处理模块处理后的顾客的行为数据,建立与顾客ID对应的购物行为序列,并对购物行为进行分析和预测,性别相同并在同一年龄区间的顾客的购物行为数据构成一个序列数据库,每个顾客ID对应一条顾客在某个时间段内所有的购物记录构成一个有序的序列;对序列数据库进行挖掘,得到符合要求的可决策的高效用负序列规则,即符合该顾客的商品推荐;
(5)根据步骤(4)得到的符合顾客的商品推荐,所述显示模块为顾客展示推荐结果,包括商品ID、型号、数量、单价,若顾客满意,则添加至购物车;若不满意,则放弃该推荐结果;
(6)所述第二信息传输模块通过传输网络将所述商品推荐模块的处理结果传输至所述商品销售模块;
(7)当顾客去收银台结算时,所述结算模块依据所述商品推荐模块的处理结果对其购物车内的商品进行结算;当本次结算订单成功后,所述库存更新模块实时更新商品的库存;所述商品销售模块对本次顾客的购物行为数据进行缓存,并将本次的购物记录通过所述第三信息传输模块实时反馈给所述商品推荐模块。
4.根据权利要求3所述的基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,其特征在于,步骤(4)中,所述信息分析模块通过AUNSRM算法对顾客行为数据进行分析和预测,包括步骤如下:
A、通过高效用负序列规则挖掘方法e-HUNSR算法,从效用序列数据库中挖掘得到所有的高效用负序列规则,即顾客的购物序列中价值大于一定值的规则,并计算每个高效用负序列规则的效用值和效用置信度;将得到的高效用负序列规则的信息分别存储在两个哈希表中,在第一个哈希表中,key1值代表高效用负序列规则,value1值代表对应高效用负序列规则的效用值;在第二个哈希表中,key2值代表高效用负序列规则,value2值代表对应高效用负序列规则的效用置信度;
B、筛选可决策的高效用负序列规则:基于支持度、规则包含条件、效用值对高效用负序列规则进行筛选;按照支持度、规则包含条件、效用值的次序依次对每个高效用负序列规则进行筛选,包括步骤如下:
假设存在高效用负序列规则
Figure FDA0002638416330000031
Figure FDA0002638416330000032
R和Ri分别代表两条不同的高效用负序列规则,X代表R的前件,Y代表R的后件,Xi代表Ri的前件,Yi代表Ri的后件,当满足以下三个条件①、②及③时,则高效用负序列规则R是相对于Ri的可决策的高效用负序列规则,删除所有Ri,保留R,得到所有满足条件①、②及③的可决策的高效用负序列规则,即符合该顾客的商品推荐;
①:R和Ri的支持度相等;
②:
Figure FDA0002638416330000033
Figure FDA0002638416330000034
进行比较,
Figure FDA0002638416330000035
③:u(Ri)≤u(R);u(Ri)是指Ri的效用值,u(R)是指R的效用值。
5.根据权利要求4所述的基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,其特征在于,步骤A中,效用序列数据库由步骤(3)数据分类后得到的数据库转化而来,方法如下:首先,以顾客ID作为主键,先从数据库中找到所有包含该顾客ID的购物行为数据,顾客的购物行为数据是指所述商品销售模块通过所述第三信息传输模块反馈给所述商品推荐模块的数据,包含时间戳、顾客ID、商品ID、数量、单价;然后,将顾客ID相同的购物行为数据进行合并,即:去掉时间戳,保留顾客ID作为第一个字段,将该顾客购买的商品ID以及数量按照时间顺序排序组成第二个字段;另外,每种商品的单价将进行独立保存;由此,得到不同性别不同年龄区间对应的效用序列数据库。
6.根据权利要求4所述的基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,其特征在于,步骤A中,通过高效用负序列规则挖掘方法e-HUNSR算法从效用序列数据库中挖掘高效用负序列规则,包括步骤如下:
a、通过HUNSPM算法从效用序列数据库中挖掘得到所有的高效用负序列模式,并保存其效用值,高效用负序列模式指的是效用值大于或等于最小效用阈值的效用负序列模式;
b、基于步骤a生成的高效用负序列模式得到所有的候选规则,具体方法是:将该条高效用负序列模式分成前后两部分,即前件和后件;
c、删除前件或者后件只有一个负项的候选规则;
d、计算剩余候选规则的效用置信度,大于最小效用置信度阈值的规则就是所求的高效用负序列规则。
7.根据权利要求4所述的基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,其特征在于,条件①中,R的支持度的计算公式如式(Ⅰ)所示:
Figure FDA0002638416330000036
式(Ⅰ)中,|D|表示序列数据库D中的元组数目,元组表示为<sid(sequence-ID),ds(data sequence)>,sequence-ID指每条序列的ID号,简称为sid,data sequence指对应的序列,简称为ds,
Figure FDA0002638416330000041
表示X和Y的连接,
Figure FDA0002638416330000042
表示序列数据库D中包含
Figure FDA0002638416330000043
的元组个数;
Ri的支持度的计算公式如式(Ⅱ)所示:
Figure FDA0002638416330000044
式(Ⅱ)中,
Figure FDA0002638416330000045
表示Xi和Yi的连接,
Figure FDA0002638416330000046
表示序列数据库D中包含
Figure FDA0002638416330000047
的元组个数。
8.根据权利要求4所述的基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,其特征在于,条件②中,假设
Figure FDA0002638416330000048
Figure FDA0002638416330000049
其中R和Ri分别代表两条不同的高效用负序列规则,ac代表R的前件,be代表R的后件,ac代表Ri的前件,b代表Ri的后件,则这两条规则满足条件②。
9.根据权利要求4所述的基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,其特征在于,条件③中,规则
Figure FDA00026384163300000410
设定<e1e2e3…ei-1>表示前件X,<ei…e*>表示后件Y,则该条规则表示为
Figure FDA00026384163300000411
规则R的效用值u(R)计算公式如式(Ⅲ)所示:
Figure FDA00026384163300000412
式(Ⅲ)中,i=1,2,3…k,ei∈R,u(ei)=q(ei,R)×p(ei),q(ei,R)为项ei的内部效用,p(ei)为项ei的外部效用;
在规则
Figure FDA00026384163300000413
中,设定<e1e2e3…ej-1>表示前件Xi,<ej…ek>表示后件Yi,则该条规则表示为
Figure FDA00026384163300000414
规则Ri的效用值u(Ri)计算公式如式(Ⅳ)所示:
Figure FDA00026384163300000415
式(Ⅳ)中,j=1,2,3…k,ej∈Ri,u(ej)=q(ej,R)×p(ej),q(ej,R)为项ej的内部效用,p(ej)为项ej的外部效用。
10.根据权利要求4所述的基于可决策的高效用负序列规则挖掘的商品推荐系统的工作方法,其特征在于,步骤(3)中,所述信息处理模块对采集的顾客的行为数据进行数据清理,是指:对于缺失值,依次确定缺失值范围、去除不需要的字段、填充缺失内容;对于重复数据,删除保留一条信息;对于不一致数据,进行数据填充;
步骤(3)中,按照顾客的性别和年龄对数据清理后的数据进行数据分类,是指:将具有同一性别并在同一年龄区间的顾客的行为数据组成一个数据库;不同性别或不同年龄区间的顾客的行为数据组成的数据库之间相互独立,每个数据库内包含该类顾客的所有行为数据。
CN202010832287.XA 2020-08-18 2020-08-18 一种基于可决策的高效用负序列规则挖掘的商品推荐系统及其工作方法 Active CN111949711B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN202010832287.XA CN111949711B (zh) 2020-08-18 2020-08-18 一种基于可决策的高效用负序列规则挖掘的商品推荐系统及其工作方法
AU2020103191A AU2020103191A4 (en) 2020-08-18 2020-11-03 A commodity recommendation system based on actionable high utility negative sequential rules mining and its working method
PCT/CN2020/129274 WO2022036894A1 (zh) 2020-08-18 2020-11-17 一种基于可决策的高效用负序列规则挖掘的商品推荐系统及其工作方法
KR1020217034665A KR20220023331A (ko) 2020-08-18 2020-11-17 의사결정 가능한 고효용 네거티브 시퀀스 규칙 마이닝 기반의 상품 추천 시스템 및 그 작업 방법
JP2021562005A JP2022548435A (ja) 2020-08-18 2020-11-17 実用的な高効用負の配列ルールマイニングに基づく商品推奨システムとその動作方法
CA3130784A CA3130784A1 (en) 2020-08-18 2020-11-17 A system and method of commodity recommendation based on actionable high utility negative sequential rule mining
LU102311A LU102311B1 (de) 2020-08-18 2020-12-18 Ein warenempfehlungssystem, das auf den entscheidbaren effizienten negativsequenzregeln basiert, und seine arbeitsmethode
US17/458,829 US20220058716A1 (en) 2020-08-18 2021-08-27 Commodity recommendation system based on actionable high utility negative sequential rules mining and its working method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010832287.XA CN111949711B (zh) 2020-08-18 2020-08-18 一种基于可决策的高效用负序列规则挖掘的商品推荐系统及其工作方法

Publications (2)

Publication Number Publication Date
CN111949711A true CN111949711A (zh) 2020-11-17
CN111949711B CN111949711B (zh) 2021-06-01

Family

ID=73343077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010832287.XA Active CN111949711B (zh) 2020-08-18 2020-08-18 一种基于可决策的高效用负序列规则挖掘的商品推荐系统及其工作方法

Country Status (4)

Country Link
CN (1) CN111949711B (zh)
AU (1) AU2020103191A4 (zh)
LU (1) LU102311B1 (zh)
WO (1) WO2022036894A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905702A (zh) * 2022-12-06 2023-04-04 鄄城县馨宁网络科技有限公司 基于用户需求分析的数据推荐方法及系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113961051B (zh) * 2021-11-03 2022-07-01 南昌工程学院 一种基于人工智能的新闻媒体数据推荐管理系统
CN115563192B (zh) * 2022-11-22 2023-03-10 山东科技大学 一种应用于购买模式下的高效用周期频繁模式挖掘的方法
CN115935068B (zh) * 2022-12-12 2023-09-05 杭州洋驼网络科技有限公司 互联网平台的商品推荐方法以及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590237A (zh) * 2015-12-18 2016-05-18 齐鲁工业大学 带负利润项的高效用序列模式在电子商务决策制定中的应用
CN106910104A (zh) * 2017-01-11 2017-06-30 齐鲁工业大学 基于单项缺失的负序列模式在商品推荐中的应用
CN106910132A (zh) * 2017-01-11 2017-06-30 齐鲁工业大学 Top‑k可决策的负序列模式在客户投保行为分析中的应用
US9959563B1 (en) * 2013-12-19 2018-05-01 Amazon Technologies, Inc. Recommendation generation for infrequently accessed items
US20180218436A1 (en) * 2013-05-18 2018-08-02 Chaya Cooper Virtual Personal Shopping System
CN109146542A (zh) * 2018-07-10 2019-01-04 齐鲁工业大学 一种挖掘正负序列规则的方法
CN110349678A (zh) * 2019-07-19 2019-10-18 齐鲁工业大学 一种基于高效用正负序列规则挖掘的中药销售系统及其工作方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110277172A (zh) * 2019-06-27 2019-09-24 齐鲁工业大学 一种基于高效的负序列挖掘模式的临床用药行为分析系统及其工作方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180218436A1 (en) * 2013-05-18 2018-08-02 Chaya Cooper Virtual Personal Shopping System
US9959563B1 (en) * 2013-12-19 2018-05-01 Amazon Technologies, Inc. Recommendation generation for infrequently accessed items
CN105590237A (zh) * 2015-12-18 2016-05-18 齐鲁工业大学 带负利润项的高效用序列模式在电子商务决策制定中的应用
CN106910104A (zh) * 2017-01-11 2017-06-30 齐鲁工业大学 基于单项缺失的负序列模式在商品推荐中的应用
CN106910132A (zh) * 2017-01-11 2017-06-30 齐鲁工业大学 Top‑k可决策的负序列模式在客户投保行为分析中的应用
CN109146542A (zh) * 2018-07-10 2019-01-04 齐鲁工业大学 一种挖掘正负序列规则的方法
CN110349678A (zh) * 2019-07-19 2019-10-18 齐鲁工业大学 一种基于高效用正负序列规则挖掘的中药销售系统及其工作方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MENGJIAO ZHANG等: "《e-HUNSR: An Efficient Algorithm for Mining High》", 《SYMMETRY》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905702A (zh) * 2022-12-06 2023-04-04 鄄城县馨宁网络科技有限公司 基于用户需求分析的数据推荐方法及系统
CN115905702B (zh) * 2022-12-06 2023-10-10 雨果跨境(厦门)科技有限公司 基于用户需求分析的数据推荐方法及系统

Also Published As

Publication number Publication date
CN111949711B (zh) 2021-06-01
AU2020103191A4 (en) 2021-01-14
WO2022036894A1 (zh) 2022-02-24
LU102311B1 (de) 2021-06-25

Similar Documents

Publication Publication Date Title
CN111949711B (zh) 一种基于可决策的高效用负序列规则挖掘的商品推荐系统及其工作方法
CN110222272B (zh) 一种潜在客户挖掘与推荐方法
US7603331B2 (en) System and method for dynamic profiling of users in one-to-one applications and for validating user rules
Aldino et al. Comparison of market basket analysis to determine consumer purchasing patterns using fp-growth and apriori algorithm
US20220058716A1 (en) Commodity recommendation system based on actionable high utility negative sequential rules mining and its working method
CN108665333A (zh) 商品推荐方法、装置、电子设备和存储介质
US20030055707A1 (en) Method and system for integrating spatial analysis and data mining analysis to ascertain favorable positioning of products in a retail environment
CN104820879A (zh) 一种用户行为信息的分析方法和装置
CN106296290A (zh) 一种基于大数据和数据挖掘的个性化订单推荐方法
JP2020537220A (ja) ユーザの外形に基づいて小売店の衣服在庫を最適化するためのコンピュータシステム
CN115796924A (zh) 一种基于大数据的云平台电子商务数据处理方法及系统
CN115760202A (zh) 一种基于人工智能的产品运营管理系统及方法
CN110232589B (zh) 一种基于大数据的意向客户分析系统
CN111460300B (zh) 网络内容推送方法、装置及存储介质
CN113052381A (zh) 一种基于大数据的电子商务营销及管理系统
Dissanayake et al. Association Mining Approach for Customer Behavior Analytics
Rajesh et al. Customer Behavior Prediction for E-Commerce Sites Using Machine Learning Techniques: An Investigation
CN117035947B (zh) 基于大数据处理的农产品数据分析方法及云平台
Yang et al. Consumers’ Purchase Behavior Preference in E-Commerce Platform Based on Data Mining Algorithm
CN112069419B (zh) 一种融合用户弱痕迹行为偏好的互相关协同过滤方法
Fan E-Commerce Data Mining Analysis based on User Preferences and Association Rules
Dissanayake Decision support system for fast food marketing
Sreelakshmi et al. An optimized approach towards increasing the sale rate in a Grocery Mart by using Association Rule Mining Approaches
CN118071258A (zh) 一种用于商品销售的数据处理系统及方法
CN114387058A (zh) 一种商品推荐方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230301

Address after: Room 1799, 17/F, No. A7-4, Hanyu Financial and Business Center, No. 7000 Jingshi Road, Jinan Area, China (Shandong) Free Trade Pilot Zone, Jinan, Shandong Province, 250000

Patentee after: Shandong Yuanjing Information Technology Co.,Ltd.

Address before: 250353 University Road, Changqing District, Ji'nan, Shandong Province, No. 3501

Patentee before: Qilu University of Technology