CN106779926A - 关联规则生成方法、装置及终端 - Google Patents

关联规则生成方法、装置及终端 Download PDF

Info

Publication number
CN106779926A
CN106779926A CN201611097211.7A CN201611097211A CN106779926A CN 106779926 A CN106779926 A CN 106779926A CN 201611097211 A CN201611097211 A CN 201611097211A CN 106779926 A CN106779926 A CN 106779926A
Authority
CN
China
Prior art keywords
feature
objects
fixed reference
characteristic
correlation rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611097211.7A
Other languages
English (en)
Inventor
彭立
曾凡信
代相成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leshi Zhixin Electronic Technology Tianjin Co Ltd
LeTV Holding Beijing Co Ltd
Original Assignee
Leshi Zhixin Electronic Technology Tianjin Co Ltd
LeTV Holding Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leshi Zhixin Electronic Technology Tianjin Co Ltd, LeTV Holding Beijing Co Ltd filed Critical Leshi Zhixin Electronic Technology Tianjin Co Ltd
Priority to CN201611097211.7A priority Critical patent/CN106779926A/zh
Publication of CN106779926A publication Critical patent/CN106779926A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种关联规则生成方法、装置及终端,所述方法包括:获取包含多个相关联的第一对象的频繁项集合;提取每个所述第一对象的多个特征,得到多个特征集合,每个所述特征集合包含对应的第一对象的多个特征;如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则;根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。本发明实施例提供的该方法,在推荐系统初建时或者在用户活跃度不高的推荐系统中,本发明实施例可以生成更多的泛化能力更好的关联规则,能够解决推荐系统冷启动问题,进而提高推荐质量,提高用户信任度,提高产品销售量。

Description

关联规则生成方法、装置及终端
技术领域
本发明涉及大数据技术领域,尤其涉及关联规则生成方法、装置及终端。
背景技术
个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,推荐系统应运而生。
关联规则是推荐系统中一个比较常用也比较重要的算法,特别是在购物推荐系统中,用来向用户推荐商品的搭配从而提高用户购物积极性。这个算法分为两个基本步骤,首先从历史行为中挖掘出频繁项集,即发现有哪些物品是经常在一起购买的;挖掘出频繁项集之后,根据设定的支持度和置信度从频繁项集生产关联规则,例如如果购买了物品A,则很可能购买物品B。
发明人在实现本发明实施例的过程中发现,相关技术中的这种方案至少存在如下缺点:在实现推荐系统的初期或者在一些用户活跃度不高的系统中,由于用户的历史行为数据非常少,会出现数据稀疏的情况,然而,传统的关联规则算法在数据非常稀疏的情况下,一方面是可能生成的规则非常少,这样对于大部分训练集合中的物品实例来说可能都没有相应关联规则,影响推荐效果;另一方面是生成的规则都是训练集合中物品实例之间的规则,例如只生成A->B的关联规则,无法生成与A具有类似特征的A’和与B具有类似特征的B’的关联规则,而实际上用户在购买A后,很可能也购买B或B’,推荐范围不够全面。
发明内容
为克服相关技术中存在的问题,本发明提供一种关联规则生成方法、装置及终端。
根据本发明实施例的第一方面,提供一种关联规则生成方法,包括:
获取包含多个相关联的第一对象的频繁项集合;
提取每个所述第一对象的多个特征,得到多个特征集合,每个所述特征集合包含对应的第一对象的多个特征;
如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则;
根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。
本发明实施例提供的该方法,在推荐系统初建时或者在用户活跃度不高的推荐系统中,本发明实施例可以生成更多的泛化能力更好的关联规则,能够解决推荐系统冷启动问题,进而提高推荐质量,提高用户信任度,提高产品销售量。
可选地,所述方法还包括:
获取包含多个对象组合的对象集合,每个所述对象组合中包含多个对象;
如果存在至少两个对象同时位于多个对象组合中,确定所述至少两个对象相关联;
统计包含相关联的至少两个对象的对象组合的数量;
如果统计得到的对象组合的数量超过预设阈值,将相关联的至少两个对象分别确定为第一对象;
构建包含多个所述第一对象的频繁项集合。
本发明实施例提供的该方法,能够自动构建频繁项集合,便于根据频繁项集合进行特征提取以及根据特征生成关联规则。
可选地,所述提取每个所述第一对象的多个特征,得到多个特征集合,包括:
获取预设的特征提取集合,所述特征提取集合包含多个参考特征;
在所述特征提取集合中选择第一预设数量个参考特征;
按照第一预设数量个参考特征,分别提取每个所述第一对象的特征;
为每个所述第一对象构建包含提取的多个特征的特征集合。
本发明实施例提供的该方法,能够自动为每个第一对象构建特征集合,便于根据特征集合生成关联规则等。
可选地,所述提取每个所述第一对象的多个特征,得到多个特征集合,包括:
获取预设的特征提取集合对应的多个特征类别,所述特征类别对应多个参考特征;
在多个特征类别中确定至少一个参考特征类别;
根据参考特征类别的数量,在每个所述参考特征类别中提取第二预设数量个参考特征;
根据至少一个参考特征类别和每个参考特征类别中的第二预设数量个参考特征,提取每个所述第一对象的特征;
为每个所述第一对象构建包含提取的多个特征的特征集合。
本发明实施例提供的该方法,能够自动为每个第一对象构建特征集合,便于根据特征集合生成关联规则等。
可选地,所述根据所述参考关联规则确定多个第二对象的目标关联规则,包括:
根据所述参考关联规则对应的多个所述特征集合,在预设对象集合中确定每个所述特征集合对应的多个第二对象,所述第二对象具有对应的所述特征集合中的多个特征;
根据多个第二对象生成目标关联规则。
本发明实施例提供的该方法,能够自动根据特征集合生成目标关联规则,自动生成频繁项集合之外的物品实例的关联规则,提高关联规则的泛化能力,便于提高推荐质量。
根据本发明实施例的第二方面,提供一种关联规则生成装置,包括:
第一获取模块,用于获取包含多个相关联的第一对象的频繁项集合;
提取模块,用于提取每个所述第一对象的多个特征,得到多个特征集合,每个所述特征集合包含对应的第一对象的多个特征;
建立模块,用于如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则;
第一确定模块,用于根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。
可选地,所述装置还包括:
第二获取模块,用于获取包含多个对象组合的对象集合,每个所述对象组合中包含多个对象;
第二确定模块,用于如果存在至少两个对象同时位于多个对象组合中,确定所述至少两个对象相关联;
统计模块,用于统计包含相关联的至少两个对象的对象组合的数量;
第三确定模块,用于如果统计得到的对象组合的数量超过预设阈值,将相关联的至少两个对象分别确定为第一对象;
构建模块,用于构建包含多个所述第一对象的频繁项集合。
可选地,所述提取模块,包括:
第一获取单元,用于获取预设的特征提取集合,所述特征提取集合包含多个参考特征;
选择单元,用于在所述特征提取集合中选择第一预设数量个参考特征;
第一提取单元,按照第一预设数量个参考特征,分别提取每个所述第一对象的特征;
第二提取单元,用于为每个所述第一对象构建包含提取的多个特征的特征集合。
可选地,所述提取模块,包括:
第二获取单元,用于获取预设的特征提取集合对应的多个特征类别,所述特征类别对应多个参考特征;
第一确定单元,用于在多个特征类别中确定至少一个参考特征类别;
第三提取单元,用于根据参考特征类别的数量,在每个所述参考特征类别中提取第二预设数量个参考特征;
第四提取单元,用于根据至少一个参考特征类别和每个参考特征类别中的第二预设数量个参考特征,提取每个所述第一对象的特征;
为每个所述第一对象构建包含提取的多个特征的特征集合。
可选地,所述第一确定模块,包括:
第二确定单元,用于根据所述参考关联规则对应的多个所述特征集合,在预设对象集合中确定每个所述特征集合对应的多个第二对象,所述第二对象具有对应的所述特征集合中的多个特征;
生成单元,用于根据多个第二对象生成目标关联规则。
根据本发明实施例的第三方面,提供一种终端,所述终端包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取包含多个相关联的第一对象的频繁项集合;
提取每个所述第一对象的多个特征,得到多个特征集合,每个所述特征集合包含对应的第一对象的多个特征;
如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则;
根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。
第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述第一方面任意一个实施例提供的所述关联规则生成方法。
第五方面,本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述第一方面任意一个实施例提供的所述关联规则生成方法。
本发明的实施例提供的技术方案可以包括以下有益效果:
本发明实施例通过获取包含多个相关联的第一对象的频繁项集合,提取每个所述第一对象的多个特征,得到多个特征集合,如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则,可以根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。
本发明实施例提供的该方法,在推荐系统初建时或者在用户活跃度不高的推荐系统中,本发明实施例可以生成更多的泛化能力更好的关联规则,能够解决推荐系统冷启动问题,进而提高推荐质量,提高用户信任度,提高产品销售量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种关联规则生成方法的一种流程图;
图2是根据一示例性实施例示出的一种关联规则生成方法的另一种流程图;
图3是图1中步骤S102的一种流程图;
图4是图1中步骤S102的另一种流程图;
图5是根据一示例性实施例示出的一种关联规则生成装置的一种结构示意图;
图6是根据一示例性实施例示出的一种终端的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
由于在数据稀疏情况下,推荐系统一方面生成的关联规则比较少,不能涵盖现有的所有物品实例,另一方面是生成的规则都是现有的物品实例之间的规则,无法引申出相关联的物品的规则,关联规则生成不够广泛,导致推荐效果不好,为此,如图1所示,在本发明的一个实施例中,提供一种关联规则生成方法,包括以下步骤。
在步骤S101中,获取包含多个相关联的第一对象的频繁项集合。
在本发明实施例中,多个相关联的第一对象可以指多次一起购买的物品,例如,用户在一家或者多家网络超市多次消费产生的多个购物订单中均包含薯片和饼干,则可以认为薯片和饼干为相关联的第一对象。
在该步骤中,可以在现有技术的推荐系统的挖掘频繁项之后,获取挖掘的频繁项集合。
在步骤S102中,提取每个所述第一对象的多个特征,得到多个特征集合。
在本发明实施例中,特征可以指物品类目、品牌、功能描述关键词和/或价格等,每个所述特征集合包含对应的第一对象的多个特征。
在该步骤中,可以对于每个第一对象,分别提取一定数量的特征,在提取特征时,特征的提取粒度应控制在合适的范围内,粒度不能太大,也不能太小,一般在实际应用中,每个第一对象可以提取2到10个特征,优选的特征提取数量可以为3到5个,将从第一对象提取出来的多个特征构建特征集合,这样,多个第一对象即对应多个特征集合。
在步骤S103中,如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则。
在本发明实施例中,还可以包括计算多个第一对象的置信度,置信度用于表示A发生条件下B发生的概率,例如:用户购买物品A时购买物品B的概率,参考关联规则可以指多个特征集合之间的关联关系,例如,如果物品A和物品B相关联,且物品A和物品B相关联的置信度超过预设阈值,则可以认为,包含物品A的多个特征的集合A与包含物品B的多个特征的集合B存在关联关系。
在步骤S104中,根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。
在该步骤中,可以首先在预设对象集合中查找包含任一特征集合中多个特征的第二特征,例如,假设参考关联规则为特征集合M和特征集合N之间的关联关系,特征集合M包含特征m和特征n,特征集合N包含特征p和特征q,则当存在一个物品X包含特征m和特征n,物品Y包含特征p和特征q,则物品X和物品Y即分别为第二对象,然后可以建立物品X和物品Y之间的目标关联关联规则。
本发明实施例通过获取包含多个相关联的第一对象的频繁项集合,提取每个所述第一对象的多个特征,得到多个特征集合,如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则,可以根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。
本发明实施例提供的该方法,在推荐系统初建时或者在用户活跃度不高的推荐系统中,本发明实施例可以生成更多的泛化能力更好的关联规则,能够解决推荐系统冷启动问题,进而提高推荐质量,提高用户信任度,提高产品销售量。
如图2所示,在本发明的又一实施例中,所述方法还包括以下步骤。
在步骤S201中,获取包含多个对象组合的对象集合。
在本发明实施例中,每个所述对象组合中包含多个对象,对象可以指用户购买的物品等,例如:在某网络超市购买的薯片、钢笔和/或笔记本等等,对象组合可以指用户购买物品后的购物订单,例如:用户在选择完物品后提交的商品订单等,对象集合可以指包含多个购物订单的集合,在用户每次提交商品订单后,均可以将商品订单与用户标识存储到预设的存储区域,这个用于存储用户提交的多个商品订单的存储区域即可认为是该用户对应的对象集合,用户标识可以指用户的登录名、用户绑定的手机或者用户设备的终端识别码等等。
在该步骤中,可以获取某一用户标识对应的对象集合中的多个对象组合。
在步骤S202中,如果存在至少两个对象同时位于多个对象组合中,确定所述至少两个对象相关联。
在本发明实施例中,可以将多个对象组合中的对象进行对比,以确定是否存在至少两个对象同时出现在多个对象组合中,也就是说,用户同时购买的物品1……物品N是否存在多个商品订单中,N大于等于2,例如:用户是否在多个订单中同时购买的薯片、钢笔和笔记本,用户是否在多个订单中同时购买薯片和笔记本等等。
在该步骤中,如果确定存在至少两个对象同时出现在多个对象组合中,可以将同时出现在多个对象组合中的至少两个对象确定为相关联。
在步骤S203中,统计包含相关联的至少两个对象的对象组合的数量。
在本发明实施例中,可以首先筛选包含相关联的至少两个对象的对象组合,然后再统计对象组合的数量。
在步骤S204中,如果统计得到的对象组合的数量超过预设阈值,将相关联的至少两个对象分别确定为第一对象。
在本发明实施例中,预设阈值可以为预先设置的阈值,可以为所有对象组合的总数量的一半,也可以为所有对象组合的总数量的三分之一等等,具体可以根据实际情况设置,本发明实施例中不做限定。
在该步骤中,可以将统计得到的对象组合的数量与预设阈值进行比较,若超过预设阈值,可以将至少两个相关联对象中的每个对象分别确定为第一对象。
在步骤S205中,构建包含多个所述第一对象的频繁项集合。
在该步骤中,可以根据多个第一对象构建频繁项集合。
本发明实施例通过获取包含多个对象组合的对象集合,如果存在至少两个对象同时位于多个对象组合中,确定所述至少两个对象相关联,统计包含相关联的至少两个对象的对象组合的数量,如果统计得到的对象组合的数量超过预设阈值,可以将相关联的至少两个对象分别确定为第一对象,进而可以构建包含多个所述第一对象的频繁项集合。
本发明实施例提供的该方法,能够自动构建频繁项集合,便于根据频繁项集合进行特征提取以及根据特征生成关联规则。
如图3所示,在本发明的又一实施例中,所述步骤S102包括以下步骤。
在步骤S301中,获取预设的特征提取集合。
在本发明实施例中,所述特征提取集合包含多个参考特征,参考特征可以指预先设定的根据物品的各种属性信息确定的特征,例如,名称属性,如:关键字等,品牌属性,如:A品牌、B品牌等和/或价格属性等,如:100元、500元等等。
在步骤S302中,在所述特征提取集合中选择第一预设数量个参考特征。
在该步骤中,可以通过随机方式选择第一预设数量个参考特征,也可以通过人工选择的方式选择第一预设数量个参考特征,第一预设数量个可以根据实际情况调整,本发明实施例不做限定。
在步骤S303中,按照第一预设数量个参考特征,分别提取每个所述第一对象的特征。
在该步骤中,分别根据选择的参考特征提取第一对象的特征,例如,第一对象为某中老年奶粉,则该奶粉提取的参考特征为中老年、奶粉、A品牌和80元至120元等等。
在步骤S304中,为每个所述第一对象构建包含提取的多个特征的特征集合。
在该步骤中,可以根据每个第一对象提取出的多个特征构建多个特征集合,每个特征集合用于存储一个第一对象的特征。
本发明实施例通过获取预设的特征提取集合,在所述特征提取集合中选择第一预设数量个参考特征,按照第一预设数量个参考特征,可以分别提取每个所述第一对象的特征。
本发明实施例提供的该方法,能够自动为每个第一对象构建特征集合,便于根据特征集合生成关联规则等。
如图4所示,在本发明的又一实施例中,所述步骤S102包括以下步骤。
在步骤S401中,获取预设的特征提取集合对应的多个特征类别。
在本发明实施例中,所述特征类别对应多个参考特征,参考特征可以参见步骤S301中的描述。
在步骤S402中,在多个特征类别中确定至少一个参考特征类别。
在该步骤中,可以随机确定参考特征类别的数量,也可以根据关心程度人工确定参考特征类别等。
在步骤S403中,根据参考特征类别的数量,在每个所述参考特征类别中提取第二预设数量个参考特征。
在该步骤中,可以根据参考特征类别的数量在每个参考特征类别中提取第二预设数量个参考特征,这样,将参考特征类别的数量乘以第二预设数量可以得到每个第一对象待提取的特征的数量。
在步骤S404中,根据至少一个参考特征类别和每个参考特征类别中的第二预设数量个参考特征,提取每个所述第一对象的特征。
在该步骤中,按照步骤S403确定的数量提取每个第一对象的特征。
在步骤S405中,为每个所述第一对象构建包含提取的多个特征的特征集合。
在该步骤中,可以根据每个第一对象提取出的多个特征构建多个特征集合,每个特征集合用于存储一个第一对象的特征。
本发明实施例通过获取预设的特征提取集合对应的多个特征类别,在多个特征类别中确定至少一个参考特征类别,根据参考特征类别的数量,在每个所述参考特征类别中提取第二预设数量个参考特征,根据至少一个参考特征类别和每个参考特征类别中的第二预设数量个参考特征,提取每个所述第一对象的特征,可以为每个所述第一对象构建包含提取的多个特征的特征集合。
本发明实施例提供的该方法,能够自动为每个第一对象构建特征集合,便于根据特征集合生成关联规则等。
在本发明的又一实施例中,所述步骤S104包括以下步骤。
根据所述参考关联规则对应的多个所述特征集合,在预设对象集合中确定每个所述特征集合对应的多个第二对象。
在本发明实施例中,所述第二对象具有对应的所述特征集合中的多个特征,预设对象集合中可以包含多个物品实例。
在该步骤中,可以在预设对象集合中查找具有任一特征集合中的所有特征的物品实例,如果存在具有任一特征集合中的所有特征的物品实例,则该物品实例可以确定为第二对象,例如:某特征结合中包含M特征、N特征和P特征,若找到一个物品实例同时具有M特征、N特征和P特征,则可以将该物品实例确定为第二对象。
根据多个第二对象生成目标关联规则。
在该步骤中,可以根据确定的多个第二对象,建立多个第二对象之间的目标关联规则,例如,假设第二对象分别为X、Y和Z,则目标关联规则为X、Y和Z之间的关联规则。
本发明实施例通过根据所述参考关联规则对应的多个所述特征集合,在预设对象集合中确定每个所述特征集合对应的多个第二对象,可以根据多个第二对象生成目标关联规则。
本发明实施例提供的该方法,能够自动根据特征集合生成目标关联规则,自动生成频繁项集合之外的物品实例的关联规则,提高关联规则的泛化能力,便于提高推荐质量。
如图5所示,在本发明的一个实施例中,提供一种关联规则生成装置,包括:第一获取模块11、提取模块12、建立模块13和第一确定模块14;
第一获取模块11,用于获取包含多个相关联的第一对象的频繁项集合;
提取模块12,用于提取每个所述第一对象的多个特征,得到多个特征集合,每个所述特征集合包含对应的第一对象的多个特征;
建立模块13,用于如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则;
第一确定模块14,用于根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。
本发明实施例提供的该装置,在推荐系统初建时或者在用户活跃度不高的推荐系统中,本发明实施例可以生成更多的泛化能力更好的关联规则,能够解决推荐系统冷启动问题,进而提高推荐质量,提高用户信任度,提高产品销售量。
在本发明的又一实施例中,所述装置还包括:
第二获取模块,用于获取包含多个对象组合的对象集合,每个所述对象组合中包含多个对象;
第二确定模块,用于如果存在至少两个对象同时位于多个对象组合中,确定所述至少两个对象相关联;
统计模块,用于统计包含相关联的至少两个对象的对象组合的数量;
第三确定模块,用于如果统计得到的对象组合的数量超过预设阈值,将相关联的至少两个对象分别确定为第一对象;
构建模块,用于构建包含多个所述第一对象的频繁项集合。
本发明实施例提供的该装置,能够自动构建频繁项集合,便于根据频繁项集合进行特征提取以及根据特征生成关联规则。
在本发明的又一实施例中,所述提取模块,包括:
第一获取单元,用于获取预设的特征提取集合,所述特征提取集合包含多个参考特征;
选择单元,用于在所述特征提取集合中选择第一预设数量个参考特征;
第一提取单元,按照第一预设数量个参考特征,分别提取每个所述第一对象的特征;
第二提取单元,用于为每个所述第一对象构建包含提取的多个特征的特征集合。
本发明实施例提供的该装置,能够自动为每个第一对象构建特征集合,便于根据特征集合生成关联规则等。
在本发明的又一实施例中,所述提取模块,包括:
第二获取单元,用于获取预设的特征提取集合对应的多个特征类别,所述特征类别对应多个参考特征;
第一确定单元,用于在多个特征类别中确定至少一个参考特征类别;
第三提取单元,用于根据参考特征类别的数量,在每个所述参考特征类别中提取第二预设数量个参考特征;
第四提取单元,用于根据至少一个参考特征类别和每个参考特征类别中的第二预设数量个参考特征,提取每个所述第一对象的特征;
为每个所述第一对象构建包含提取的多个特征的特征集合。
本发明实施例提供的该装置,能够自动为每个第一对象构建特征集合,便于根据特征集合生成关联规则等。
在本发明的又一实施例中,所述第一确定模块,包括:
第二确定单元,用于根据所述参考关联规则对应的多个所述特征集合,在预设对象集合中确定每个所述特征集合对应的多个第二对象,所述第二对象具有对应的所述特征集合中的多个特征;
生成单元,用于根据多个第二对象生成目标关联规则。
本发明实施例提供的该装置,能够自动根据特征集合生成目标关联规则,自动生成频繁项集合之外的物品实例的关联规则,提高关联规则的泛化能力,便于提高推荐质量。
本发明实施例提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的关联规则生成方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
图6是本发明又一实施例提供的执行关联规则生成方法的电子设备的硬件结构示意图,如图6所示,该设备包括:
一个或多个处理器610以及存储器620,图6中以一个处理器610为例。
执行关联规则生成方法的设备还可以包括:输入装置630和输出装置640。
处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接,图6中以通过总线连接为例。
存储器620作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的关联规则生成方法对应的程序指令/模块(例如,附图5所示的第一获取模块11、提取模块12、建立模块13和第一确定模块14)。处理器610通过运行存储在存储器620中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例关联规则生成方法。
存储器620可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据关联规则生成装置的使用所创建的数据等。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器620可选包括相对于处理器610远程设置的存储器,这些远程存储器可以通过网络连接至关联规则生成装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置630可接收输入的数字或字符信息,以及产生与关联规则生成装置的用户设置以及功能控制有关的键信号输入。输出装置640可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器620中,当被所述一个或者多个处理器610执行时,执行上述任意方法实施例中的关联规则生成方法。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
本发明实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如i Pad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (11)

1.一种关联规则生成方法,其特征在于,包括:
获取包含多个相关联的第一对象的频繁项集合;
提取每个所述第一对象的多个特征,得到多个特征集合,每个所述特征集合包含对应的第一对象的多个特征;
如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则;
根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取包含多个对象组合的对象集合,每个所述对象组合中包含多个对象;
如果存在至少两个对象同时位于多个对象组合中,确定所述至少两个对象相关联;
统计包含相关联的至少两个对象的对象组合的数量;
如果统计得到的对象组合的数量超过预设阈值,将相关联的至少两个对象分别确定为第一对象;
构建包含多个所述第一对象的频繁项集合。
3.根据权利要求1所述的方法,其特征在于,所述提取每个所述第一对象的多个特征,得到多个特征集合,包括:
获取预设的特征提取集合,所述特征提取集合包含多个参考特征;
在所述特征提取集合中选择第一预设数量个参考特征;
按照第一预设数量个参考特征,分别提取每个所述第一对象的特征;
为每个所述第一对象构建包含提取的多个特征的特征集合。
4.根据权利要求1所述的方法,其特征在于,所述提取每个所述第一对象的多个特征,得到多个特征集合,包括:
获取预设的特征提取集合对应的多个特征类别,所述特征类别对应多个参考特征;
在多个特征类别中确定至少一个参考特征类别;
根据参考特征类别的数量,在每个所述参考特征类别中提取第二预设数量个参考特征;
根据至少一个参考特征类别和每个参考特征类别中的第二预设数量个参考特征,提取每个所述第一对象的特征;
为每个所述第一对象构建包含提取的多个特征的特征集合。
5.根据权利要求1所述的方法,其特征在于,所述根据所述参考关联规则确定多个第二对象的目标关联规则,包括:
根据所述参考关联规则对应的多个所述特征集合,在预设对象集合中确定每个所述特征集合对应的多个第二对象,所述第二对象具有对应的所述特征集合中的多个特征;
根据多个第二对象生成目标关联规则。
6.一种关联规则生成装置,其特征在于,包括:
第一获取模块,用于获取包含多个相关联的第一对象的频繁项集合;
提取模块,用于提取每个所述第一对象的多个特征,得到多个特征集合,每个所述特征集合包含对应的第一对象的多个特征;
建立模块,用于如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则;
第一确定模块,用于根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取包含多个对象组合的对象集合,每个所述对象组合中包含多个对象;
第二确定模块,用于如果存在至少两个对象同时位于多个对象组合中,确定所述至少两个对象相关联;
统计模块,用于统计包含相关联的至少两个对象的对象组合的数量;
第三确定模块,用于如果统计得到的对象组合的数量超过预设阈值,将相关联的至少两个对象分别确定为第一对象;
构建模块,用于构建包含多个所述第一对象的频繁项集合。
8.根据权利要求6所述的装置,其特征在于,所述提取模块,包括:
第一获取单元,用于获取预设的特征提取集合,所述特征提取集合包含多个参考特征;
选择单元,用于在所述特征提取集合中选择第一预设数量个参考特征;
第一提取单元,按照第一预设数量个参考特征,分别提取每个所述第一对象的特征;
第二提取单元,用于为每个所述第一对象构建包含提取的多个特征的特征集合。
9.根据权利要求6所述的装置,其特征在于,所述提取模块,包括:
第二获取单元,用于获取预设的特征提取集合对应的多个特征类别,所述特征类别对应多个参考特征;
第一确定单元,用于在多个特征类别中确定至少一个参考特征类别;
第三提取单元,用于根据参考特征类别的数量,在每个所述参考特征类别中提取第二预设数量个参考特征;
第四提取单元,用于根据至少一个参考特征类别和每个参考特征类别中的第二预设数量个参考特征,提取每个所述第一对象的特征;
为每个所述第一对象构建包含提取的多个特征的特征集合。
10.根据权利要求6所述的装置,其特征在于,所述第一确定模块,包括:
第二确定单元,用于根据所述参考关联规则对应的多个所述特征集合,在预设对象集合中确定每个所述特征集合对应的多个第二对象,所述第二对象具有对应的所述特征集合中的多个特征;
生成单元,用于根据多个第二对象生成目标关联规则。
11.一种终端,其特征在于,所述终端包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取包含多个相关联的第一对象的频繁项集合;
提取每个所述第一对象的多个特征,得到多个特征集合,每个所述特征集合包含对应的第一对象的多个特征;
如果多个相关联的第一对象的置信度超过预设阈值,建立多个所述特征集合之间的参考关联规则;
根据所述参考关联规则确定多个第二对象的目标关联规则,所述第二对象具有任一所述特征集合中多个特征。
CN201611097211.7A 2016-12-02 2016-12-02 关联规则生成方法、装置及终端 Pending CN106779926A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611097211.7A CN106779926A (zh) 2016-12-02 2016-12-02 关联规则生成方法、装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611097211.7A CN106779926A (zh) 2016-12-02 2016-12-02 关联规则生成方法、装置及终端

Publications (1)

Publication Number Publication Date
CN106779926A true CN106779926A (zh) 2017-05-31

Family

ID=58883153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611097211.7A Pending CN106779926A (zh) 2016-12-02 2016-12-02 关联规则生成方法、装置及终端

Country Status (1)

Country Link
CN (1) CN106779926A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921587A (zh) * 2018-05-24 2018-11-30 腾讯科技(深圳)有限公司 一种数据处理方法、装置及服务器
CN109426998A (zh) * 2017-08-29 2019-03-05 北京京东尚科信息技术有限公司 信息推送方法和装置
CN109446418A (zh) * 2018-10-17 2019-03-08 重庆扬升信息技术有限公司 一种通过大数据对无纸化信息进行挖掘推送方法
CN109978580A (zh) * 2017-12-28 2019-07-05 北京京东尚科信息技术有限公司 对象推荐方法、装置以及计算机可读存储介质
CN110334133A (zh) * 2019-07-11 2019-10-15 京东城市(北京)数字科技有限公司 规则挖掘方法和装置、电子设备和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592223A (zh) * 2011-01-18 2012-07-18 卓望数码技术(深圳)有限公司 一种商品推荐方法和商品推荐系统
CN103208073A (zh) * 2012-01-17 2013-07-17 阿里巴巴集团控股有限公司 获得推荐商品信息及提供商品信息的方法、装置
CN105335518A (zh) * 2015-11-16 2016-02-17 孙宝文 生成用户偏好信息的方法及装置
CN105404628A (zh) * 2014-09-12 2016-03-16 阿里巴巴集团控股有限公司 数据推送方法和装置
CN105719156A (zh) * 2015-10-15 2016-06-29 深圳市麻省图创科技有限公司 用于识别和推广已添加标签的商品的系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592223A (zh) * 2011-01-18 2012-07-18 卓望数码技术(深圳)有限公司 一种商品推荐方法和商品推荐系统
CN103208073A (zh) * 2012-01-17 2013-07-17 阿里巴巴集团控股有限公司 获得推荐商品信息及提供商品信息的方法、装置
CN105404628A (zh) * 2014-09-12 2016-03-16 阿里巴巴集团控股有限公司 数据推送方法和装置
CN105719156A (zh) * 2015-10-15 2016-06-29 深圳市麻省图创科技有限公司 用于识别和推广已添加标签的商品的系统及方法
CN105335518A (zh) * 2015-11-16 2016-02-17 孙宝文 生成用户偏好信息的方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109426998A (zh) * 2017-08-29 2019-03-05 北京京东尚科信息技术有限公司 信息推送方法和装置
CN109426998B (zh) * 2017-08-29 2022-01-07 北京京东尚科信息技术有限公司 信息推送方法和装置
CN109978580A (zh) * 2017-12-28 2019-07-05 北京京东尚科信息技术有限公司 对象推荐方法、装置以及计算机可读存储介质
CN108921587A (zh) * 2018-05-24 2018-11-30 腾讯科技(深圳)有限公司 一种数据处理方法、装置及服务器
CN109446418A (zh) * 2018-10-17 2019-03-08 重庆扬升信息技术有限公司 一种通过大数据对无纸化信息进行挖掘推送方法
CN110334133A (zh) * 2019-07-11 2019-10-15 京东城市(北京)数字科技有限公司 规则挖掘方法和装置、电子设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN107481114B (zh) 商品推荐方法、装置、电子商务系统及存储介质
US11995112B2 (en) System and method for information recommendation
CN106779926A (zh) 关联规则生成方法、装置及终端
CN106557480B (zh) 查询改写的实现方法及装置
CN108205768A (zh) 数据库建立方法和数据推荐方法及装置、设备和存储介质
CN111143697B (zh) 一种内容推荐的方法以及相关装置
CN108733706A (zh) 热度信息的生成方法和装置
CN110428311B (zh) 招投标信息推荐方法及相关产品
CN107315827A (zh) 一种电子阅读中的关联推荐的方法及其装置
CN111695960A (zh) 一种对象推荐系统、方法、电子设备及存储介质
CN113330475A (zh) 信息推荐方法、装置、电子设备以及存储介质
CN106547365A (zh) 商品推荐的方法和装置
US9342834B2 (en) System and method for setting goals and modifying segment criteria counts
CN111161009B (zh) 信息推送方法、装置、计算机设备和存储介质
CN112115710B (zh) 一种行业信息识别方法及装置
CN105787777A (zh) 信息处理方法以及装置
CN106204163B (zh) 一种用户属性特征的确定方法和装置
US9213979B2 (en) Array attribute configurator
Listianingrum et al. Smartphone hedonic price study based on online retail price in Indonesia
US10282482B2 (en) Data provision device, data provision method, and data provision program
CN112131502A (zh) 数据处理方法、数据处理装置、电子设备和介质
CN110503482B (zh) 一种物品处理方法、装置、终端及存储介质
CN111193598B (zh) 一种群聊会话推荐方法及装置
CN115082844A (zh) 相似人群扩展方法、装置、电子设备和可读存储介质
KR102485807B1 (ko) 사용자를 위한 주방 용품 추천 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170531

WD01 Invention patent application deemed withdrawn after publication