CN111340578B - 一种商品关联关系的生成方法、装置、介质及电子设备 - Google Patents
一种商品关联关系的生成方法、装置、介质及电子设备 Download PDFInfo
- Publication number
- CN111340578B CN111340578B CN201811554126.8A CN201811554126A CN111340578B CN 111340578 B CN111340578 B CN 111340578B CN 201811554126 A CN201811554126 A CN 201811554126A CN 111340578 B CN111340578 B CN 111340578B
- Authority
- CN
- China
- Prior art keywords
- commodity
- weight
- image
- information
- purchased
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004590 computer program Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000005065 mining Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 241001122767 Theaceae Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 235000008452 baby food Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000010413 gardening Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供了一种商品关联关系的生成方法、装置、介质及电子设备,包括:根据所获取的查询条件,获取上述查询条件范围内的订单数据;根据上述订单数据中商品信息的被购买次数,对上述商品信息之间的关联权重进行表达,生成关联商品权重图像;对上述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像;提取并输出上述关联商品权重子图像中的商品信息之间的关联关系。本发明实施例的技术方案实现了从海量电商数据中自动并快速地挖掘出关联商品簇,降低了成本,提升了交叉柜台展示,交叉促销,交叉推荐和库存管理等电商业务的效率。
Description
技术领域
本发明涉及电子商务技术领域,具体而言,涉及一种商品关联关系的生成方法、装置、介质及电子设备。
背景技术
随着电子商务的飞速发展,消费者需要为给定的生活场景购买多个不同功能的关联商品,比如母婴食品的场景可能需要奶粉、菜粉、营养品、各种哺乳器材、婴儿餐桌、婴儿餐具、婴儿服饰、玩具和婴儿安全设备等商品。通常每一个场景都对应了需要一起或者先后购买的一些商品,即关联商品簇。在营销中使用关联商品簇可以使消费者感受到所涉及的生活场景,从而便捷购买生活场景所需商品;也可以使商家有机会把对有价值的商品推送给消费者,从而实现品类拉新和提升长尾商品,应用商品关联簇关系的电商营销业务是交叉销售,具体业务见下表:
现有技术主要依赖专家通过已知的商品的功能关系,手工设立这样的关联关系,例如:功能的不同,例如煤气灶台和抽油烟机,茶叶和茶具;配件功能附属商品,例如手机和手机屏幕保护膜;同系列产品,或者竞争性的产品;已知具体的消费场景:例如母婴、旅行或者家居园艺。而发掘面向场景的商品关联关系可以定义为数学枚举问题,通过人工智能的关联规则挖掘算法,例如先验Apriori和FP Growth Tree算法,从历史订单数据库提取数据,并且发现数据中商品的关联规则。
但是,上述现有技术方案存在以下缺陷:
(1)海量商品消费数据生成了大量的商品关联关系,人工成本高,也无法应对海量数据;
(2)商品关联关系通常超越了行业专家的知识体系;
(3)商品关联关系是面向场景的,多个商品以关联商品簇的形式服务于一个共同的场景,并且动态改变。
而现有的人工智能关联规则挖掘算法是通过减少搜索空间来挖掘部分的关联规则,其主要缺点有:
(1)广度优先搜索的先验Apriori等算法速度慢,消耗很大内存,并且有较大的计算误差;
(2)深度优先搜索的FP-Growth等算法是仅仅是基于高频繁商品集。因为高频繁商品和很多商品都关联,返回的计算结果重复冗余,并且无法在不同频繁程度的商品中找到关联关系,也不能用来计算整体数据的关联关系。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种商品关联关系的生成方法、装置、介质及电子设备,进而至少在一定程度上克服相关技术中需要耗费大量人工定义商品关联关系以及算法效率低下等一个或多个问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供了一种商品关联关系的生成方法,包括:
根据上报数据的数据量配置布隆过滤器的切换时间点;
根据所获取的查询条件,获取上述查询条件范围内的订单数据;
根据上述订单数据中商品信息的被购买次数,对上述商品信息之间的关联权重进行表达,生成关联商品权重图像;
对上述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像;
提取并输出上述关联商品权重子图像中的商品信息之间的关联关系。
在本发明的一个实施例中,上述根据所获取的查询条件,获取上述查询条件范围内的订单数据,还包括:
从订单交易数据库中提取上述查询条件范围内的订单数据,上述订单数据包括:订单号、订单号所对应的用户编号以及订单内的商品编号;
确定出上述订单数据中各用户的订单编号以及所购买的商品编号,并按照预设的表结构将上述订单数据换为表结构的订单数据。
在本发明的一个实施例中,上述根据上述订单数据中商品信息的被购买次数,对上述商品信息之间的关联权重进行表达,生成关联商品权重图像,包括:
根据上述订单数据中单个商品信息被购买的次数,确定出各商品信息对应的关联权重;
根据上述订单数据中商品信息被合并购买的次数,确定出被合并购买的商品信息之间的关联权重;
基于上述各商品信息对应的权重和上述被合并购买的商品信息之间的权重生成关联商品权重图,其中,上述商品信息在上述关联商品权重图中以顶点表示,上述商品信息对应顶点之间的连线表示被合并购买的商品信息。
在本发明的一个实施例中,上述根据上述订单数据中商品信息被合并购买的次数,确定出被合并购买的商品信息之间的关联权重,包括:
通过公式:
确定出被合并购买的商品信息之间的关联权重,其中,si和sj表示被合并购买的商品信息,wedge(si,sj)表示商品信息si与商品信息sj被合并购买的次数,w(si)表示商品信息si被购买的次数,w(sj)表示商品信息sj被购买的次数,compare表示对比和的大小,并输出其中的最大值或平均值。
在本发明的一个实施例中,上述对上述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像,包括:
通过函数:
确定出关联权重最大的关联商品权重子图像,其中,上述函数的约束条件为:si和sj表示被合并购买的商品信息,(si,sj)表示被合并购买的商品信息之间的连线,β(si,sj)表示被合并购买的商品信息之间的权重,w表示设置的权重参数,n表示商品信息的个数。
在本发明的一个实施例中,上述确定出关联权重最大的关联商品权重子图像之后,上述方法还包括:
将上述关联权重最大的关联商品权重子图像从上述关联商品权重图像中删除,获得整理后的关联商品权重图像;
根据预设的循环条件判断是否继续确定出上述整理后的关联商品权重图像中关联权重最大的关联商品权重子图像。
在本发明的一个实施例中,上述将上述关联权重最大的关联商品权重子图像从上述关联商品权重图像中删除,获得整理后的关联商品权重图像,包括:
当上述顶点全部属于上述关联商品权重子图像时,将上述关联权重最大的关联商品权重子图像从上述关联商品权重图像中删除。
在本发明的一个实施例中,上述方法还包括:
当上述顶点不全部属于上述关联商品权重子图像时,确定出不全部属于上述关联商品权重子图的待删除顶点,并统计上述待删除顶点被确定出不属于上述关联商品权重子图像的次数,当上述次数超出预设的阈值后,将上述待删除顶点所对应的关联商品权重子图像从上述关联商品权重图像中删除,和/或
统计上述待删除顶点的所有相邻顶点,确定出上述相邻节点在上述关联商品权重子图中的第一比例和上述关联商品权重图像中的第二比例,当上述第一比例大于等于上述第二比例时,将上述待删除顶点所对应的关联商品权重子图像从上述关联商品权重图像中删除,当上述第一比例小于上述第二比例时,保留上述待删除顶点。
在本发明的一个实施例中,上述提取并输出上述关联商品权重子图像中的商品信息之间的关联关系,包括:
将上述关联商品权重子图像中的商品信息之间的关联关系进行保存,并转换为预设的格式后输出。
根据本发明实施例的第二方面,提供了一种商品关联关系的生成装置,包括:
查询模块,用于根据所获取的查询条件,获取上述查询条件范围内的订单数据;
生成模块,用于根据上述订单数据中商品信息的被购买次数,对上述商品信息之间的关联权重进行表达,生成关联商品权重图像;
确定模块,用于对上述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像;
输出模块,用于提取并输出上述关联商品权重子图像中的商品信息之间的关联关系。
根据本发明实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,上述程序被处理器执行时实现如上述实施例中第一方面的商品关联关系的生成方法。
根据本发明实施例的第四方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现如上述实施例中第一方面的商品关联关系的生成方法。
本发明实施例提供的技术方案可以包括以下有益效果:
本发明实施例提供了一种商品关联关系的生成方法、装置、介质及电子设备,包括:根据所获取的查询条件,获取上述查询条件范围内的订单数据;根据上述订单数据中商品信息的被购买次数,对上述商品信息之间的关联权重进行表达,生成关联商品权重图像;对上述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像;提取并输出上述关联商品权重子图像中的商品信息之间的关联关系。本发明实施例的技术方案实现了从海量电商数据中自动并快速地挖掘出关联商品簇,降低了成本,提升了交叉柜台展示,交叉促销,交叉推荐和库存管理等电商业务的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了根据本发明的一个实施例的商品关联关系的生成方法流程图;
图2示意性示出了根据本发明的一个实施例的关联商品权重图像的示意图;
图3示意性示出了根据本发明的一个实施例的关联商品权重图像进行循环迭代的流程图;
图4示意性示出了根据本发明的一个实施例的商品关联关系的生成装置的框图;
图5示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示意性示出了根据本发明的一个实施例的商品关联关系的生成方法流程图。
参照图1所示,根据本发明的一个实施例的商品关联关系的生成方法,包括如下步骤:
步骤S110,根据所获取的查询条件,获取上述查询条件范围内的订单数据。
在本发明的一个实施例中,上述查询条件可以根据业务的实际需求自由定义,举例而言,可以设定商品的范围,例如:商品的分类信息、商品的品牌信息等,也可以定义针对于特定范围内的用户的购买行为,还可以定义查询一定时间内的商品交易数据等。
在本发明的一个实施例中,根据上述查询条件,从订单交易数据库中提取查询条件定义范围内的定单数据,其中,订单数据至少包括:订单号、订单号所对应的用户编号以及订单内的商品编号;并根据所确定出的上述订单数据中各用户的订单编号以及所购买的商品编号,并按照预设的表结构将上述订单数据换为表结构的订单数据。
在本发明的一个实施例中,订单数据中的消费者编号、消费者所购买的订单编号以及订单内商品品类的编号可以转换为如下表1所示的表结构数据:
消费者编号 | 消费者所购买的订单编号 | 订单内所有商品的品类编号 |
C1 | D1,D4 | S1,S2,S3,S4,S5 |
C2 | D2,D6 | S1,S2,S3,S4 |
C3 | D3 | S6,S7 |
C4 | D5 | S7 |
C5 | D7 | S3,S4,S5 |
表1
步骤S120,根据上述订单数据中商品信息的被购买次数,对上述商品信息之间的关联权重进行表达,生成关联商品权重图像;。
在本发明的一个实施例中,定义了一种关联商品权重图像:G=(V,E,Wv,Wedge,α,β)以表达上述步骤S110中的表结构的订单数据,其中,G表示权重图像,V表示权重图像上的顶点集合,每一个顶点代表可以代表一个商品或者一个商品的集合(比如品类,品牌等等);E表示权重图上的两个顶点之间的连线,每一条连线代表两个顶点存在的关联关系;Wv表示顶点的基础权重,对于顶点si(si∈V),其基础权重Wi表示si被购买的总次数;Wedge表示权重图上的两个顶点之间的连线的权重,对于顶点si,sj(si,sj∈V),Wedge(si,sj)返回si和sj被一起被购买次数;α表示顶点关联权重;β表示顶点之间连线的关联权重。
图2示意性示出了根据本发明的一个实施例的关联商品权重图像的示意图。
参照图2所示,通过上述定义将表(1)的订单数据转换为关联商品权重图像,其中,图中的一个顶点对应一个商品信息,例如商品品类编号,顶点S3的权重数值是3,因为该商品在订单表格中总计由三位消费者购买:C1、C2和C5;边S1-S5(连接顶点S1和S5)的权重是1,因为这两个商品在订单表格中被由一个消费者(C1)购买,完全图是指图中任意的两个顶点都有一条边连接,最大完全子图是指对于一个给定图,由图中一部分顶点和这些顶点间邻边构成的子图是完全图,并且包含最大权重数,例如:顶点集合{S1,S2,S3,S4,S5}是图中的最大的完全子图。
在本发明的一个实施例中,上述根据上述订单数据中商品信息的被购买次数,对上述商品信息之间的关联权重进行表达,生成关联商品权重图像,包括:根据上述订单数据中单个商品信息被购买的次数,确定出各商品信息对应的关联权重;根据上述订单数据中商品信息被合并购买的次数,确定出被合并购买的商品信息之间的关联权重;基于上述各商品信息对应的权重和上述被合并购买的商品信息之间的权重生成关联商品权重图,其中,上述商品信息在上述关联商品权重图中以顶点表示,上述商品信息对应顶点之间的连线表示被合并购买的商品信息。
在本发明的一个实施例中,上述被合并购买的商品信息之间的权重,通过公式(1):
确定出被合并购买的商品信息之间的关联权重,其中,si和sj表示被合并购买的商品信息,wedge(si,sj)表示商品信息si与商品信息sj被合并购买的次数,w(si)表示商品信息si被购买的次数,w(sj)表示商品信息sj被购买的次数,compare表示对比和的大小,并输出其中的最大值或平均值。
在本发明的一个实施例中,上述确定出各商品信息对应的关联权重是商品信息对应顶点的所有相邻边的关联度权重累加之和。
在本发明的一个实施例中,通过上述步骤将从海量数据中挖掘关联商品关联关系的问题转换为从给定的输入图中迭代计算出所有最大完全关联商品权重子图的问题,如果计算得来的完全子图上边的关联权重之和越大,则该关联商品的关联程度越高。
步骤S130,对上述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像。
在本发明的一个实施例中,上述对上述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像,包括:
通过函数(2):
确定出关联权重最大的关联商品权重子图像,其中,上述函数(2)的约束条件为:si和sj表示被合并购买的商品信息,(si,sj)表示被合并购买的商品信息之间的连线,β(si,sj)表示被合并购买的商品信息之间的权重,w表示设置的权重参数,n表示商品信息的个数,si∈(0,1),i=1,2,......,n定义了完全子图的任意两个顶点必须相联的约束条件,/>用于负责计算最优解的目标函数,最优解是产生最大的目标函数值的可行解,以s表示,最优解即关联商品权重图像上含有最大的关联权重完全子图的顶点的集合。
在本发明的一个实施例中,可以以下两个方面优化上述函数(2)确定出关联权重最大的关联商品权重子图像,第一,顶点之间是最大共同关联关系,因此目标函数需要最大化完全子图的顶点数量;第二,顶点之间的关联关系强度(由公式(1)计算),因此目标函数需要最大化完全子图边的关联度。
在本发明的一个实施例中,基于前述方案,在确定出关联权重最大的关联商品权重子图像之后,将上述关联权重最大的关联商品权重子图像从上述关联商品权重图像中删除,获得整理后的关联商品权重图像;根据预设的循环条件判断是否继续确定出上述整理后的关联商品权重图像中关联权重最大的关联商品权重子图像,只要发现的最大完全权重子图包含两个以上的顶点,就继续循环确定出关联权重最大的关联商品权重子图像并移除,否则停止。
图3示意性示出了根据本发明的一个实施例的关联商品权重图像进行循环迭代的流程图。
参照图3所示,根据本发明的一个实施例的关联商品权重图像进行循环迭代,对于一个给定的关联商品权重图像包含了4个商品关联关系(关联商品簇):(1)顶点集合{1、2、3、4、5}是关联商品权重图像中权重最大的关联商品权重子图像;(2)顶点集合{6、7、8、9}是关联商品权重图像中权重第二大的关联商品权重子图像;(3)顶点集合{10、11、12}是关联商品权重图像中权重第三大的关联商品权重子图像;(4)顶点集合{13、14}是关联商品权重图像中权重最小的关联商品权重子图像,具体循环迭代步骤包括:
在迭代第一步中,子图{1、2、3、4、5}被率先搜素到并被移出关联商品权重图像;
在迭代第二步中,子图{6、7、8、9}被搜素到并被移出关联商品权重图像;
迭代第三步中,子图{10、11、12}被搜素到并被移出关联商品权重图像;
迭代第四步中,子图{13、14}被搜素到并被移出关联商品权重图像。
在本发明的一个实施例中,基于前述方案,当上述顶点全部属于上述关联商品权重子图像时,将上述关联权重最大的关联商品权重子图像从上述关联商品权重图像中删除。
在本发明的一个实施例中,基于前述方案,当上述顶点不全部属于上述关联商品权重子图像时,确定出不全部属于上述关联商品权重子图的待删除顶点,并统计上述待删除顶点被确定出不属于上述关联商品权重子图像的次数,当上述次数超出预设的阈值后,将上述待删除顶点所对应的关联商品权重子图像从上述关联商品权重图像中删除,和/或
统计上述待删除顶点的所有相邻顶点,确定出上述相邻节点在上述关联商品权重子图中的第一比例和上述关联商品权重图像中的第二比例,当上述第一比例大于等于上述第二比例时,将上述待删除顶点所对应的关联商品权重子图像从上述关联商品权重图像中删除,当上述第一比例小于上述第二比例时,保留上述待删除顶点。
在本发明的一个实施例中,基于前述方案,在每次迭代中,对于给定的关联商品权重图像G,对于搜索环节搜索到的关联权重最大的关联商品权重子图像S(即最优解S上顶点集合),对于子图S上顶点集合内的每一个顶点,整理环节逐一决策是否将该顶点以及和该顶点所涉及的每一条边从关联商品权重图像G上移去,并且由此更新关联商品权重图像G,其中,对于判断顶点是否从关联商品权重图像需要考虑以下两种情况:(1)该顶点所连接的所有顶点都在子图S上;(2)该顶点所连接的一部分顶点在子图S上,一部分顶点在关联商品权重图像G,但是不属于子图S;对于第(1)中情况的顶点可以直接将该顶点和该顶点所涉及的边可以从G上移去,而对于第(2)中情况的顶点,需要使用以下整理规则判断是否将这样的顶点从关联商品权重图像上移去:
1)使用经验参数值:定义一个顶点最多可以被多少个不同迭代中发现的不同的完全关联度权重子图所包括,在每次迭代中,对于属于第二种情况的顶点,统计该顶点被以往迭代中被发现的不同完全关联度权重子图所包括的次数,如果次数已经达到设定的经验参数值,则该顶点和该顶点所涉及的从关联商品权重图像G上移去,否则该顶点被继续保留在关联商品权重图像G上;
2)使用最大关联规则:统计该顶点的所有相邻顶点(有边相连接),统计有多少邻点在子图S上,计算以上两个统计结果的百分比,由此判断该顶点是否和子图S的关联关系比较大,如果是,则将则该顶点和该顶点所涉及的从关联商品权重图像G上移去,否则该顶点被继续保留在关联商品权重图像G上。
3)融合以上(1)和(2)的两个方法,对使用经验参数值的方法赋予权重,对使用最大关联规则赋予权重,使用权重复合的方法进行计算。
在本发明的一个实施例中,在进行下一次的迭代过程中,上述判断关节会在更新后的关联商品权重图像上搜索下一个关联商品权重子图像。
步骤S140,提取并输出上述关联商品权重子图像中的商品信息之间的关联关系。
在本发明的一个实施例中,在生成商品关联关系的迭代流程中,所有发现的关联权重最大的关联商品权重子图像中的商品信息所对应的顶点集合都被保存,并转换为关联商品品类簇的格式,并被返回给应用服务接口的业务调用方。
在本发明的一个实施例中,输出的关联商品簇(或者关联商品品类簇)服务于不同的电商应用场景,例如:交叉柜台展示、交叉促销、交叉推荐以及库存管理等。
在本发明的一个实施例中,输出的关联商品簇可以是商品的簇,也可以是商品集合(比如商品,分类,品牌等等)簇,也可以应用于细化到不同维度的关联商品簇:
关联商品品类簇:基于不同商品类别,比如商品的二级,三级或四级分类;
关联商品的品牌簇:基于不同商品品牌;
关联商品簇:基于不同商品。
本发明实施例的技术方案实现了从海量电商数据中自动并快速地挖掘出关联商品簇,降低了成本,提升了交叉柜台展示,交叉促销,交叉推荐和库存管理等电商业务的效率。
以下介绍本发明的装置实施例,可以用于执行本发明上述的商品关联关系的生成方法。
图4示意性示出了根据本发明的一个实施例的商品关联关系的生成装置的框图。
参照图4所示,根据本发明的一个实施例的商品关联关系的生成装置400,包括:
查询模块401,用于根据所获取的查询条件,获取上述查询条件范围内的订单数据;
生成模块402,用于根据上述订单数据中商品信息的被购买次数,对上述商品信息之间的关联权重进行表达,生成关联商品权重图像;
确定模块403,用于对上述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像;
输出模块404,用于提取并输出上述关联商品权重子图像中的商品信息之间的关联关系。
由于本发明的示例实施例的商品关联关系的生成装置的各个功能模块与上述第一方面的商品关联关系的生成方法的示例实施例的步骤对应,因此对于本发明装置实施例中未披露的细节,请参照本发明上述的第一方面的商品关联关系的生成方法。
下面参考图5,其示出了适于用来实现本发明实施例的电子设备的计算机系统500的结构示意图。图5示出的电子设备的计算机系统500仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统操作所需的各种程序和数据。CPU501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中的商品关联关系的生成方法。
例如,上述的电子设备可以实现如图1中所示的:步骤S110,根据所获取的查询条件,获取上述查询条件范围内的订单数据;步骤S120,根据上述订单数据中商品信息的被购买次数,对上述商品信息之间的关联权重进行表达,生成关联商品权重图像;步骤S130,对上述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像;步骤S140,提取并输出上述关联商品权重子图像中的商品信息之间的关联关系。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (10)
1.一种商品关联关系的生成方法,其特征在于,包括:
根据所获取的查询条件,获取所述查询条件范围内的订单数据;
根据所述订单数据中商品信息的被购买次数,对所述商品信息之间的关联权重进行表达,生成关联商品权重图像;
对所述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像;
将所述关联权重最大的关联商品权重子图像从所述关联商品权重图像中删除,获得整理后的关联商品权重图像;
根据预设的循环条件判断是否继续确定出所述整理后的关联商品权重图像中关联权重最大的关联商品权重子图像;
提取并输出所述关联商品权重子图像中的商品信息之间的关联关系;
其中,所述对所述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像,包括:
通过函数:
确定出关联权重最大的关联商品权重子图像,其中,所述函数的约束条件为:si和sj表示被合并购买的商品信息,(si,sj)表示被合并购买的商品信息之间的连线,E表示所述关联商品权重图像上的两个顶点之间的连线,每一条连线代表两个顶点存在的关联关系,β(si,sj)表示被合并购买的商品信息之间的权重,w表示设置的权重参数,n表示商品信息的个数。
2.根据权利要求1所述的商品关联关系的生成方法,其特征在于,所述根据所获取的查询条件,获取所述查询条件范围内的订单数据,还包括:
从订单交易数据库中提取所述查询条件范围内的订单数据,所述订单数据包括:订单号、订单号所对应的用户编号以及订单内的商品编号;
确定出所述订单数据中各用户的订单编号以及所购买的商品编号,并按照预设的表结构将所述订单数据换为表结构的订单数据。
3.根据权利要求1所述的商品关联关系的生成方法,其特征在于,所述根据所述订单数据中商品信息的被购买次数,对所述商品信息之间的关联权重进行表达,生成关联商品权重图像,包括:
根据所述订单数据中单个商品信息被购买的次数,确定出各商品信息对应的关联权重;
根据所述订单数据中商品信息被合并购买的次数,确定出被合并购买的商品信息之间的关联权重;
基于所述各商品信息对应的权重和所述被合并购买的商品信息之间的权重生成关联商品权重图,其中,所述商品信息在所述关联商品权重图中以顶点表示,所述商品信息对应顶点之间的连线表示被合并购买的商品信息。
4.根据权利要求3所述的商品关联关系的生成方法,其特征在于,所述根据所述订单数据中商品信息被合并购买的次数,确定出被合并购买的商品信息之间的关联权重,包括:
通过公式:
确定出被合并购买的商品信息之间的关联权重,其中,si和sj表示被合并购买的商品信息,wedge(si,sj)表示商品信息si与商品信息sj被合并购买的次数,w(si)表示商品信息si被购买的次数,w(sj)表示商品信息sj被购买的次数,commpare表示对比和的大小,并输出其中的最大值或平均值。
5.根据权利要求1所述的商品关联关系的生成方法,其特征在于,所述将所述关联权重最大的关联商品权重子图像从所述关联商品权重图像中删除,获得整理后的关联商品权重图像,包括:
当所述关联商品权重图像中的顶点全部属于所述关联商品权重子图像时,将所述关联权重最大的关联商品权重子图像从所述关联商品权重图像中删除。
6.根据权利要求5所述的商品关联关系的生成方法,其特征在于,所述方法还包括:
当所述顶点不全部属于所述关联商品权重子图像时,确定出不全部属于所述关联商品权重子图的待删除顶点,并统计所述待删除顶点被确定出不属于所述关联商品权重子图像的次数,当所述次数超出预设的阈值后,将所述待删除顶点所对应的关联商品权重子图像从所述关联商品权重图像中删除,和/或
统计所述待删除顶点的所有相邻顶点,确定出所述相邻顶点在所述关联商品权重子图中的第一比例和所述关联商品权重图像中的第二比例,当所述第一比例大于等于所述第二比例时,将所述待删除顶点所对应的关联商品权重子图像从所述关联商品权重图像中删除,当所述第一比例小于所述第二比例时,保留所述待删除顶点。
7.根据权利要求1所述的商品关联关系的生成方法,其特征在于,所述提取并输出所述关联商品权重子图像中的商品信息之间的关联关系,包括:
将所述关联商品权重子图像中的商品信息之间的关联关系进行保存,并转换为预设的格式后输出。
8.一种商品关联关系的生成装置,其特征在于,包括:
查询模块,用于根据所获取的查询条件,获取所述查询条件范围内的订单数据;
生成模块,用于根据所述订单数据中商品信息的被购买次数,对所述商品信息之间的关联权重进行表达,生成关联商品权重图像;
确定模块,用于对所述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像;将所述关联权重最大的关联商品权重子图像从所述关联商品权重图像中删除,获得整理后的关联商品权重图像;根据预设的循环条件判断是否继续确定出所述整理后的关联商品权重图像中关联权重最大的关联商品权重子图像;
输出模块,用于提取并输出所述关联商品权重子图像中的商品信息之间的关联关系;
其中,所述确定模块对所述关联商品权重图像进行循环迭代,确定出关联权重最大的关联商品权重子图像,包括:
通过函数:
确定出关联权重最大的关联商品权重子图像,其中,所述函数的约束条件为:si和sj表示被合并购买的商品信息,(si,sj)表示被合并购买的商品信息之间的连线,E表示所述关联商品权重图像上的两个顶点之间的连线,每一条连线代表两个顶点存在的关联关系,β(si,sj)表示被合并购买的商品信息之间的权重,w表示设置的权重参数,n表示商品信息的个数。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的商品关联关系的生成方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的商品关联关系的生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811554126.8A CN111340578B (zh) | 2018-12-18 | 2018-12-18 | 一种商品关联关系的生成方法、装置、介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811554126.8A CN111340578B (zh) | 2018-12-18 | 2018-12-18 | 一种商品关联关系的生成方法、装置、介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111340578A CN111340578A (zh) | 2020-06-26 |
CN111340578B true CN111340578B (zh) | 2024-05-21 |
Family
ID=71181478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811554126.8A Active CN111340578B (zh) | 2018-12-18 | 2018-12-18 | 一种商品关联关系的生成方法、装置、介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111340578B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112258195A (zh) * | 2020-10-23 | 2021-01-22 | 平安科技(深圳)有限公司 | 一种交易数据的处理方法、装置、计算机设备及存储介质 |
CN114037243A (zh) * | 2021-11-02 | 2022-02-11 | 重庆川南环保科技有限公司 | 基于层次聚类的维修派单方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105427125A (zh) * | 2015-10-29 | 2016-03-23 | 电子科技大学 | 基于商品网络连接图的商品簇划分方法 |
CN106779963A (zh) * | 2016-12-29 | 2017-05-31 | 江西博瑞彤芸科技有限公司 | 关联商品的商品信息设置方法 |
CN107527144A (zh) * | 2017-08-21 | 2017-12-29 | 复旦大学 | 一种金融领域关联交易的检测方法 |
CN107563702A (zh) * | 2017-09-14 | 2018-01-09 | 北京京东尚科信息技术有限公司 | 商品仓储调配方法、装置以及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130254055A1 (en) * | 2012-03-21 | 2013-09-26 | Fractal Analytics, Inc. | Commerce System and Method of Learning Consumer Behavior Based on Prior and Current Transactions |
-
2018
- 2018-12-18 CN CN201811554126.8A patent/CN111340578B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105427125A (zh) * | 2015-10-29 | 2016-03-23 | 电子科技大学 | 基于商品网络连接图的商品簇划分方法 |
CN106779963A (zh) * | 2016-12-29 | 2017-05-31 | 江西博瑞彤芸科技有限公司 | 关联商品的商品信息设置方法 |
CN107527144A (zh) * | 2017-08-21 | 2017-12-29 | 复旦大学 | 一种金融领域关联交易的检测方法 |
CN107563702A (zh) * | 2017-09-14 | 2018-01-09 | 北京京东尚科信息技术有限公司 | 商品仓储调配方法、装置以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111340578A (zh) | 2020-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107330445B (zh) | 用户属性的预测方法和装置 | |
CN109697641A (zh) | 计算商品相似度的方法和装置 | |
CN111126442B (zh) | 一种物品关键属性生成方法、物品分类方法和装置 | |
CN103092861B (zh) | 一种商品代表图的选取方法和系统 | |
US7668728B2 (en) | Time polynomial arrow-debreu market equilibrium | |
CN110197390B (zh) | 一种基于关联规则关联度和经济值的推荐方法和系统 | |
CN112085172A (zh) | 图神经网络的训练方法及装置 | |
CN112258301B (zh) | 商品推荐方法、装置、系统、可读存储介质及电子设备 | |
CN111340578B (zh) | 一种商品关联关系的生成方法、装置、介质及电子设备 | |
CN112819404A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN111414533A (zh) | 推荐信息的生成方法、装置、电子设备、存储介质 | |
CN112784212B (zh) | 一种优化库存的方法和装置 | |
CN111612385B (zh) | 一种对待配送物品进行聚类的方法和装置 | |
CN112749323A (zh) | 一种构建用户画像的方法和装置 | |
CN109255563B (zh) | 物品的储位区域的确定方法和装置 | |
CN113378033A (zh) | 一种推荐模型的训练方法和装置 | |
CN111738786A (zh) | 构建商品组合的方法、系统、装置和可读存储介质 | |
CN110807159A (zh) | 数据标记方法、装置、存储介质及电子设备 | |
CN112819555B (zh) | 一种物品推荐方法和装置 | |
CN110826948A (zh) | 仓库选品方法和装置 | |
CN113256192B (zh) | 一种仓储物品规划方法和装置 | |
CN114780847A (zh) | 一种对象信息处理、信息推送方法、装置和系统 | |
CN114677174A (zh) | 一种计算未上架物品销量的方法和装置 | |
CN106294494B (zh) | 项集挖掘方法及装置 | |
Karim et al. | A Data Mining Approach for Prediction Modeling Using Association rule |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |