CN111666481A - 数据挖掘方法、装置、计算机可读介质及电子设备 - Google Patents
数据挖掘方法、装置、计算机可读介质及电子设备 Download PDFInfo
- Publication number
- CN111666481A CN111666481A CN201910165376.0A CN201910165376A CN111666481A CN 111666481 A CN111666481 A CN 111666481A CN 201910165376 A CN201910165376 A CN 201910165376A CN 111666481 A CN111666481 A CN 111666481A
- Authority
- CN
- China
- Prior art keywords
- client
- item
- article
- similarity
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000007418 data mining Methods 0.000 title claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 115
- 230000000694 effects Effects 0.000 claims description 67
- 238000004364 calculation method Methods 0.000 claims description 29
- 238000012216 screening Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 abstract description 7
- 230000006399 behavior Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种数据挖掘方法、装置、计算机可读介质及电子设备,涉及数据处理技术领域。该数据挖掘方法包括:确定与各客户端标识对应的物品关联数据;利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度;确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度;根据所述第二相似度确定与第一物品满足相似阈值的第二物品,确定所述第二物品对应的客户端标识;根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端。本发明实施例的技术方案提高数据挖掘的精确性。
Description
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种数据挖掘方法、数据挖掘装置、计算机可读介质及电子设备。
背景技术
随着网络技术的发展,电子商务成为满足人们交易需求的最常用手段。用户通过电商平台购买物品时,需要向用户推荐用户可能感兴趣的物品,提高用户体验。
目前,基于用户的协同过滤推荐算法可以用来确定用户可能感兴趣的物品。先找到与目标用户相似的用户群体,然后根据相似用户群体的购买行为确定向目标用户推荐的物品。或者,基于物品的协同过滤推荐算法也可以确定物品的目标用户。但是,前一种方法中,需要对每个用户进行精准地画像;后一种方法中,物品的相似度矩阵过于稀疏,物品之间的相关性很低;因此这两种方法都无法进行精确的推荐。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种数据挖掘方法、数据挖掘装置、计算机可读介质及电子设备,进而至少在一定程度上克服对物品的推荐不够精准的问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供了一种数据挖掘方法,包括:
确定与各客户端标识对应的物品关联数据;
利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度;
确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度;
根据所述第二相似度确定与第一物品满足相似阈值的第二物品,确定所述第二物品对应的客户端标识;
根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端。
在本发明的一种示例性实施例中,所述确定与各客户端标识对应的物品关联数据包括:
将预设时段内各客户端标识对应的物品关联数据中物品种类满足预设数量的数据筛选出来,得到所述物品关联数据。
在本发明的一种示例性实施例中,所述利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度包括:
根据所述各客户端标识对应的物品关联数据,计算客户端标识对应的各物品的第一指标;
根据所述物品的所述第一指标确定所述客户端标识对所述物品的评分,以得到各所述客户端对所述物品的平均评分;
根据所述物品的平均评分计算所述物品之间的第一相似度。
在本发明的一种示例性实施例中,所述确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度包括:
确定各所述预定算法的权重;
对多个所述预定算法得到的物品之间的多个第一相似度进行加权求和,得到所述物品之间的第二相似度。
在本发明的一种示例性实施例中,所述根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端包括:
从所述第二物品对应的客户端标识中筛去与所述第一物品对应的客户端标识得到所述第一物品的待推荐客户端标识;
将所述第一物品推荐给所述待推荐客户端标识对应的客户端,以使所述客户端显示所述第一物品的信息。
在本发明的一种示例性实施例中,所述根据所述第二相似度确定与第一物品满足相似阈值的第二物品,确定所述第二物品对应的客户端标识包括:
根据所述物品关联数据计算所述物品之间的支持度;
筛去所述支持度不满足预设阈值的物品。
在本发明的一种示例性实施例中,根据待推荐客户端标识将所述第一物品推荐给对应的客户端之后,还包括:
计算推荐效果步骤,所述计算推荐效果步骤包括根据预设时段内的所述待推荐客户端标识对应的物品关联数据确定推荐的效果指标;
根据所述推荐的效果指标更新各所述预定算法的权重,以更新所述第一物品的待推荐客户端标识;
判断所述推荐的次数是否满足预设数量,若不满足,则将所述第一物品推荐给更新后的待推荐客户端标识对应的客户端,转至计算推荐效果步骤;若满足,则从多个推荐的效果指标中确定最优效果指标;
确定所述最优效果指标对应的各所述预定算法的权重为各所述算法的最终权重。
根据本发明实施例的第二方面,提供了一种数据挖掘装置,包括:
数据获取单元,用于确定与各客户端标识对应的物品关联数据;
第一相似度计算单元,用于利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度;
第二相似度计算单元,用于确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度;
客户端标识确定单元,用于根据所述第二相似度确定与第一物品满足相似阈值的第二物品,确定所述第二物品对应的客户端标识;
物品推荐单元,用于根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端。
在本发明的一种示例性实施例中,数据获取单元可以包括:
数据过滤单元,用于将预设时段内各客户端标识对应的物品关联数据中物品种类满足预设数量的数据筛选出来,得到所述物品关联数据。
在本发明的一种示例性实施例中,第一相似度计算单元可以包括:
指标计算单元,用于根据所述各客户端标识对应的物品关联数据,计算客户端标识对应的各物品的第一指标;
评分单元,用于根据所述物品的所述第一指标确定所述客户端标识对所述物品的评分,以得到各所述客户端对所述物品的平均评分;
第一相似度确定单元,用于根据所述物品的平均评分计算所述物品之间的第一相似度。
在本发明的一种示例性实施例中,第二相似度计算单元可以包括:
权重确定单元,用于确定各所述预定算法的权重;
加权求和单元,用于对多个所述预定算法得到的物品之间的多个第一相似度进行加权求和,得到所述物品之间的第二相似度。
在本发明的一种示例性实施例中,物品推荐单元包括:
客户端筛选单元,用于从所述第二物品对应的客户端标识中筛去与所述第一物品对应的客户端标识得到所述第一物品的待推荐客户端标识;
客户端推荐单元,用于将所述第一物品推荐给所述待推荐客户端标识对应的客户端,以使所述客户端显示所述第一物品的信息。
在本发明的一种示例性实施例中,所述数据挖掘装置还可以包括:
支持度计算单元,用于根据所述物品关联数据计算所述物品之间的支持度;
物品筛选单元,筛去所述支持度不满足预设阈值的物品。
在本发明的一种示例性实施例中,该数据挖掘装置还可以包括:
循环推荐单元,用于计算推荐效果步骤,所述计算推荐效果步骤包括根据预设时段内的所述待推荐客户端标识对应的物品关联数据确定推荐的效果指标;
权重更新单元,用于根据所述推荐的效果指标更新各所述预定算法的权重,以更新所述第一物品的待推荐客户端标识;
判断单元,用于判断所述推荐的次数是否满足预设数量,若不满足,则将所述第一物品推荐给更新后的待推荐客户端标识对应的客户端,转至计算推荐效果步骤;若满足,则从多个推荐的效果指标中确定最优效果指标;
权重输出单元,用于确定所述最优效果指标对应的各所述预定算法的权重为各所述算法的最终权重。
根据本发明实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的数据挖掘方法。
根据本发明实施例的第四方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的数据挖掘方法。
本发明实施例提供的技术方案可以包括以下有益效果:
在本发明的一些实施例所提供的技术方案中,一方面,利用多个预定算法计算物品之间的第一相似度,可以得到物品之间多个第一相似度,能够从多个维度表征物品之间的相似度,更加全面地描述物品之间的相似性;然后,根据每个预定算法的权重以及各预定算法得出的第一相似度得到物品之间的第二相似度,提高了物品相似度的可靠性和准确性。另一方面,根据第二相似度确定与第一物品满足相似阈值的第二物品,进而确定第二物品对应的客户端标识,然后根据第二物品对应的客户端标识确定第一物品的待推荐客户端标识,可以更加准确地预测物品与客户端之间的对应关系,能够提高数据挖掘的准确性;并且,能够使得对物品的推荐更加具有针对性,提高对物品的推荐效率;此外,还可以使得用户能够快速发现自己感兴趣的物品,提高用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了根据本发明的实施例中用于实现数据挖掘方法的系统架构示意图;
图2示意性示出了根据本发明的实施例的数据挖掘方法的第一个流程图;
图3示意性示出了根据本发明的实施例的数据挖掘方法的第二个流程图;
图4示意性示出了根据本发明的实施例的数据挖掘方法的第三个流程图;
图5示意性示出了根据本发明的实施例的数据挖掘方法的第四个流程图;
图6示意性示出了根据本发明的实施例的数据挖掘方法的第五个流程图;
图7示意性示出了根据本发明的实施例的数据挖掘装置的框图;
图8示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本示例实施方式中首先提供了一种用于实现数据挖掘方法的系统架构。参考图1所示,该系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送请求指令等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本申请实施方式所提供的数据挖掘方法一般由服务器105执行,相应地,数据挖掘装置一般设置与终端设备101中。
基于上述系统架构100,本示例中首先提供一种数据挖掘方法,如图2所示,该方法可以包括步骤S210、步骤S220、步骤S230、步骤S240以及步骤S250。其中:
步骤S210,确定与各客户端标识对应的物品关联数据;
步骤S220,利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度;
步骤S230,确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度;
步骤S240,根据所述第二相似度确定与第一物品满足相似阈值的第二物品,确定所述第二物品对应的客户端标识;
步骤S250,根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端。
根据本示例性实施方式中的数据挖掘方法,一方面,利用多个预定算法计算物品之间的第一相似度,可以得到物品之间多个第一相似度,能够从多个维度表征物品之间的相似度,更加全面地描述物品之间的相似性;然后,根据每个预定算法的权重以及各预定算法得出的第一相似度得到物品之间的第二相似度,提高了物品相似度的可靠性和准确性。另一方面,根据第二相似度确定与第一物品满足相似阈值的第二物品,进而确定第二物品对应的客户端标识,然后根据第二物品对应的客户端标识确定第一物品的待推荐客户端标识,可以更加准确地预测物品与客户端之间的对应关系,能够提高数据挖掘的准确性;并且,能够使得对物品的推荐更加具有针对性,提高对物品的推荐效率;此外,还可以使得用户能够快速发现自己感兴趣的物品,提高用户体验。
下面,将结合图2至图6对本示例性实施方式中的数据挖掘方法的各个步骤进行更加详细的说明。
如图2所示,在步骤S210中,可以确定与各客户端标识对应的物品关联数据。
在本示例性实施例中,物品关联数据可以是对与物品相关的数据的记录。因此物品关联数据可以包括物品的属性信息,例如价格、数量、类别等;还可以包括与物品关联的行为信息,例如用户对物品的获取行为、交易行为等,以及该行为发生的时间。此外,物品关联数据还可以包括与物品关联的其他信息,例如物品展示时的图像信息、物品运输时的物流信息等。
客户端标识可以唯一标识一客户端,在某一客户端上产生的物品关联数据也可以通过该客户端的客户端标识来获取。客户端的数据可以上传至服务器进行保存,并且通过服务器,多个客户端之间可以进行交互。因此从服务器上可以获取所有的客户端对应的物品关联数据。
根据预设的筛选范围可以从客户端对应的数据中筛选出物品关联数据。由于物品关联数据可以包含该物品自上线以来在该客户端产生的所有数据,有些时间比较久远不能准确表示近期与物品相关的行为信息,因此可以将预设时间内的物品关联数据筛选出来,可以大大减少数据的计算次数,提高计算效率。并且,还可以将同一客户端对应的物品关联数据中物品种类不符合要求的数据筛去,从而得到客户端对应的物品种类满足要求的物品关联数据。此外,还可以根据物品关联数据中包含的行为信息来筛选数据,将预设时间内物品获取行为次数不符合要求的数据筛去,得到物品关联数据。然而,得到物品关联数据还可以通过其他方式,例如将预设时间内客户端获取的物品总金额不满足要求的客户端标识对应的物品关联数据筛去等。
其中,预设时间段可以包括任意时长,例如一年、一个月、三个月等;也可以包括其他时间段,例如当前时间的前六个月到前三个月的时间段、客户端标识对应的物品关联数据最后一次更新时间的前六个月内等,本示例实施方式对此不做特殊限定。
物品可以根据物品的属性对其分类,例如物品的名称、生产厂家等;此外,物品还可以根据其他标准进行分类,例如物品的用途等,本示例实施方式对此不做特殊限定。根据物品的种类将物品关联数据中物品种类不满足预设数量的数据删去,也就是说,在所有的客户端标识中将一部分客户端标识删除,可以得到满足要求的客户端标识对应的物品关联数据。其中,预设数量可以包括任意数值,例如2、3、4、5等,也可以包括一数值范围,例如2-10、2-200、2-1000等等,本示例实施方式对此不做限定。
在步骤S220中,通过多种预定算法计算目标数据中物品之间的第一相似度。
在本示例性实施方式中,通过多种算法计算物品之间的相似度,可以得到多个维度的相似度计算结果。相比于只计算一种相似度来说,多种算法能够比较全面地描述物品之间的相似性;并且,不采用基于用户的协同过滤算法,避免了受用户画像准确性的影响。
详细而言,从物品关联数据中的第一种物品开始,用第一种算法计算第一种物品与其他各种物品两两之间的第一相似度,可以得到第一种物品对应的第一种算法计算出的第一相似度,然后得到第二种物品对应的第一种算法的第一相似度…,依次类推,可以得到所有物品两两之间的第一种算法计算出的第一相似度。进而,可以得到各个物品两两之间的第二种算法计算得出的第一相似度、第三种算法计算出的第一相似度等等。例如,用5中预定算法计算物品A和B的第一相似度,可以得到A和B之间的5个第一相似度。其中,多种预定算法可以包括两种以及两种以上的计算相似度的算法,例如杰卡德距离、余弦距离等。
可选地,预定算法可以包括:杰卡德距离、余弦距离、皮尔逊相关系数、调整余弦距离、欧式距离、曼哈顿距离、闵可夫斯基距离中的多种。
在一种示例性实施方式中,利用多种预定算法计算物品关联数据中的各物品之间的第一相似度可以包括步骤S301、步骤S302和步骤S303,如图3所示。
在步骤S301中,根据物品关联数据可以统计出每一客户端标识对每一物品的第一指标。在本实施例中,第一指标可以包括同一客户端标识对同一种物品的获取行为发生的次数、例如3次、5次等;也可以包括同一客户端对同一种物品的获取的数量,例如2个单位、5个单位等;此外,还可以包括同一客户端标识对同一种物品的获取所需金额,例如1000元、2000元等,本示例实施方式对此不做限定。
在步骤S302中,将客户端标识对各物品的第一指标计算出来之后,可以根据各物品的第一指标确定该客户端对于该物品的评分,进而得到该物品的平均评分。在本实施方式中,可以先设定一评分规则,利用该评分规则将第一指标转化成对物品的评分。该评分规则可以是自定义的方法,例如score(x)=2/(1+e^(-0.2x))-1,其中x为第一指标,利用该公式可以将评分收敛在[0,1]区间内。此外,也可以利用其他方式得到物品的评分,例如机器学习等。计算各客户端标识对于同一物品的评分后,可以得到所有客户端对于该物品的平均评分。进而,可以得到各个物品的平均评分。
在步骤S303中,得到每一物品的平均评分后,利用各物品的平均评分计算各物品之间的第一相似度。每一客户端标识都能够标识使用该客户端的用户,因此根据各物品的平均评分计算出的物品之间的第一相似度能够更好的表征用户对于物品的兴趣。举例而言,可以利用皮尔逊相关系数、欧式距离分别计算每两个物品之间的两个相似度。例如,使用皮尔逊相关系数的计算公式可以为:
在步骤S230中,确定各预定算法的权重,可以根据各预定算法的权重以及各预定算法得出的第一相似度得到物品之间的第二相似度。
在本示例实施方式中,各预定算法的权重可以利用机器学习算法来确定,例如利用卷积神经网络确定出各个预定算法对应的权重等。此外,也可以采用其他方式计算各预定算法的权重,例如自定义权重等。可选地,可以通过模拟退火算法多次更新各预定算法的权重,以确定出各预定算法的最优权重。
确定各预定算法的权重之后,可以对各预定算法计算出的第一相似度进行加权求和,得出物品之间的第二相似度。例如,对于物品a和b,杰卡德距离法算的权重为Q1、通过该算法计算出的a、b之间的相似度为F1,余弦距离法的权重为Q2、计算出的a、b之间的相似度为F2,欧式距离的权重为Q3、计算得出的结果为F3,曼哈顿距离的权重为Q4、计算得出的结果为F4,闵可夫斯基距离的权重为Q5、计算得出的结果为F5,那么a和b的相似指标可以通过Q1*F1+Q2*F2+Q3*F3+Q4*F4+Q5*F5来计算。此外,还可以利用其他方式对权重和第一相似度进行计算得出第二相似度,例如设第一种算法得出的第一相似度为q1,第二种算法得出的第一相似度为q2,第三种算法得出的第一相似度为q3,第四种算法得出的第一相似度为q4,第五种算法得出的第一相似度为q5,其中第一种算法、第二种算法与第三种算法的权重相同为:m,第四种算法与第五种算法的权重相同为n,那么相似度指标也可以通过m*(q1+q2+q3)+n/(q4+q5)来计算。
在步骤S240中,可以根据第二相似度确定与第一物品满足相似阈值的第二物品,从而确定第二物品对应的客户端标识。
在本示例实施方式中,根据第二相似度可以确定与某一物品最为相似的物品。计算出第一物品与其他各物品之间的第二相似度之后,可以将第二相似度满足相似阈值的物品筛选出来,作为第二物品。其中,相似阈值可以根据实际情况设定,例如0.5、0.6等,也可以设置为其他值,例如0.7、0.8、0.9等,本示例实施例对此不做特殊限定。
例如,物品集合为(a、b、c、d、e),那么可以确定a与b、c、d、e之间的第二相似度,将该第二相似度满足预设阈值的物品挑选出来,作为a的第二物品。
确定与第一物品相似的第二物品后,确定第二物品对应的客户端标识。通过物品关联数据可以得到包含第二物品的物品关联数据,该物品关联数据对应的客户端标识,则为第二物品对应的客户端标识。
在步骤S250中,根据第二物品对应的客户端标识可以确定第一物品的待推荐客户端标识,以便根据待推荐客户端标识将第一物品推荐给对应的客户端。
在本示例实施方式中,确定第二物品对应的客户端标识后,可以根据该客户端标识确定第一物品的待推荐客户端标识。举例而言,第二物品对应的客户端标识可以为第一物品的待推荐客户端标识;或者,从第二物品对应的客户端标识中筛选出待推荐客户端标识,可以将第二物品对应的客户端标识中与第一物品也对应的客户端标识删除,得到第一物品的待推荐客户端标识。
例如,物品A和B的第二相似度最高,那么从与物品A对应的客户端标识集合a中选出不与物品B对应的客户端标识,从而得到物品B的待推荐客户端标识的集合b;同样地,从与物品B对应的客户端标识中选出不与物品A对应的客户端标识,该客户端标识也可以为物品A的待推荐客户端标识。也就是说,由于A和B的相似度较高,如果某一客户端标识与A产生物品关联数据,与B没有产生物品关联数据,那么该客户端将来很有可能与B产生物品关联数据。
确定第一物品的待推荐客户端标识之后,可以将第一物品推荐给待推荐的客户端标识对应的客户端,以使该客户端显示所述第一物品的信息。例如,将第一物品ID号推送到对应的客户端,在该客户端的显示界面中可以显示第一物品的信息。物品的信息可以包括物品的名称、图像、文字说明等等;也可以包括物品的其他信息,例如物品的规格、使用说明、物品的凭证等,本示例实施方式对此不做特殊限定。
在示例性的实施例中,确定物品之间的第一相似度之前,还包括步骤S401至步骤S402,如图4所示。其中:
在步骤S401中,根据物品关联数据能够计算物品之间的支持度。物品之间的支持度可以是在所有客户端对应的物品关联数据中,某几个物品一起出现的次数与客户端标识的总数量的比例,例如Support(a,b)=count(a,b)/count(n),其中count(a,b)表示物品关联数据中同时出现a和b的客户端的数量,count(n)为总的客户端数量,Support(a,b)为a和b的支持度。
具体而言,可以将物品关联数据中的物品进行组合获得多个物品组,从而计算每组物品的支持度。其中物品可以通过各种方式进行组合成物品组,例如两两组合、三个进行组成、四个进行组合、五个进行组合等等。组合成物品组的物品的数量可以根据实际的物品关联数据设定,例如6、7、10等,本示例实施方式对此不做限定。
在步骤S402中,在得到物品之间的支持度后,可以将支持度较高的物品留下,而将支持度较低的物品删去。可以按照支持度从大到小的顺序对支持度进行排序,根据排序的结果选出预设数量的物品,例如选取前500、1000个物品等。或者,也可以将支持度符合预设阈值的物品筛选出来,例如将支持度大于0.5的物品筛选出来。当然,也可以通过其他方式选取,例如选取支持度大于0.6、或0.7的物品等。
利用支持度对物品进行筛选,可以降低物品维度,从而减少计算量,提高后续相似度的计算效率。
在一种示例性实施方式中,可以根据待推荐客户端标识将第一物品推荐给对应的客户端。将第一物品推荐给客户端之后,还可以包括步骤S501至步骤S504,如图5所示。
步骤S501为计算推荐效果步骤。具体地,在步骤S501中,将第一物品推荐给待推荐客户端后,该客户端上将会产生物品关联数据,那么根据预设时间段内的待推荐客户端标识对应的物品关联数据可以确定推荐的效果指标。可以将第一物品的信息推送给待推荐客户端标识对应的客户端,例如物品详情、物品图片、价格等等,以便于用户在登陆到该客户端后可以快速发现第一物品,进行获取、查看等行为。在推荐之后,根据预设时段内的该客户端对应的物品关联数据、以及该第一物品对应的所有客户端的物品关联数据确定推荐的效果指标。其中,预设时段可以包括各种时间间隔的时间段,例如从推荐第一物品时刻起到当前时刻为止的时间间隔、从推荐第一物品的时刻起的三个月内的时间间隔等等,本示例实施方式对此不做限定。
在该预设时段内,收集第一物品的物品关联数据,即包含第一物品的物品关联数据,并确定这些物品关联数据对应的客户端标识的集合,确定该集合中的待推荐客户端标识的数量,并计算该集合中待推荐客户端标识的数量占该集合总数量中的比例,该比例即为推荐的效果指标。此外,效果指标的计算方式也可以通过其他方式计算,例如计算待推荐客户端标识对应的第一物品的数量在所有客户端的第一物品的总数量的比值,得出的结果即为推荐的效果指标。
在步骤S602中,根据推荐的效果更新各预定算法的权重,以更新第一物品的待推荐客户端标识。例如,确定了第一物品的推荐的效果指标之后,可以增大或减小某一预定算法的权重,然后根据更新后的各预定算法的权重再次进行计算各物品之间的第二相似度,根据新计算出的第二相似度更新第一物品的待推荐客户端标识。
在步骤S503中,可以判断推荐的次数是否满足预设数量。例如,预设数量为5,则如果已经把第一物品推荐给用户群5次,那么可以确定推荐的次数满足预设数量。如果推荐的次数不满足预设数量,则再次将第一物品推荐给更新后的待推荐客户端标识对应的客户端,并且确定此次推荐的效果指标;然后根据确定的效果指标再次对各预定算法的权重进行更新,根据更新后的权重重新计算第一物品与各物品之间的第二相似度,进而再次更新与第一物品相似的第二物品,从而再次确定第一物品的待推荐客户端标识,循环地进行推荐并根据推荐的效果指标更新预定算法的权重,直到推荐的次数满足预设数量。在推荐的次数满足预设数量时,从多次推荐确定的多个效果指标中确定最优的效果指标。该最优的效果指标可以为指标值最大的效果指标。
在步骤S504中,确定最优效果指标对应的各预定算法的权重可以为各预定算法的最终权重。
示例性地,将第一物品推荐给待推荐客户端标识对应的客户端后,确定预设时间段内该次推荐的效果指标。然后随机改变各算法的权重确定下一个时间段内的推荐效果指标,如果下一个时间段内的效果指标的变化没有超过第一次推荐的效果指标的预设范围,那么可以再次增大或减小该算法的权重,依次类推直至找到推荐效果最大的最优权重;或者推荐的次数超出预设的次数范围时,从多次推荐的效果中确定出推荐效果最好时各算法的最优权重。
下面以图6为例,详细介绍优化权重的过程。如图6所示,在步骤S601中,将第一物品推荐给对应的客户端。通过第二相似度可以确定与第一物品相似的第二物品,进而根据第二物品对应的客户端标识确定第一物品的待推荐客户标识,然后将第一物品推荐给对应的客户端。
在步骤S602中,可以计算推荐的效果,例如通过公式:
其中,TP表示待推荐客户端标识中在推荐之后的三个月内获取了第一物品的用户数量。FP表示待推荐客户端标识中在推荐之后的三个月内未获取第一物品的用户数量。FN表示在推荐之后的三个月内获取了第一物品但是不在待推荐客户端标识中的用户数量。每一客户端标识可以表示一用户。然后通过公式:
y=1/x
计算推荐的效果指标,其中,y为效果指标。确定出效果指标之后,可以将当前的效果指标作为最优的效果指标y′;或者y′也可以设定一初始值,例如0.2。
对于步骤S605,通过温度系数T更新权重。例如,某一预定算法的的权重为m,则可以将该权重更新为m+r*T。T可用于控制更新的次数,例如每更新一次权重T值减小一次,当T值小于1时,不再更新各预定算法的权重。对于步骤S606,通过Metropolis准则更新权重。Metropolis准则为:
其中,T的初始值为100。详细而言,从(0,1)之间随机选中一个数R,若R<P,则随机更新权重,并将T的值更新为T*0.96。
在步骤S607中,判断推荐的次数是否大于预设数量。预设数量可以更加实际情况设定,例如5次、6次、10次等等。如果推荐的次数大于预设数量,则执行步骤S608。如果推荐的次数不大于预设数量,则执行步骤S610。
对于步骤S608,判断是否满足结束条件,结束条件可以为T<1,则判断当前的T是否小于1,如果T小于1则执行步骤S609,如果T不小1则执行步骤S611。在步骤S609中,不再将第一物品进行推荐,而是从已经推荐的效果指标中确定最优的效果指标,该效果指标对应的各预定算法的权重即为各预定算法的最优权重。在步骤S611中,如果T不小1,则将T更新为T*0.96。
对于步骤S610,如果推荐次数不大于预设数量,则随机扰动权重。例如,将权重减少随机数量,增加随机数量等等。接下来,在步骤S612中,使用更新后的预定算法的权重可以再次计算物品之间的第二相似度。更新了物品之间的第二相似度后,更加更新后的第二相似度确定与第一物品相似的第二物品。然后重新确定该第二物品对应的客户标识,根据该客户端标识更新第一物品的待推荐客户端标识,即步骤S613。在步骤S613中更新了第一物品的待推荐客户端标识后,可以转至步骤S601,将第一物品推荐给该客户端标识对应的客户端,进行循环。不断计算新的待推荐客户端标识,然后确定推荐效果指标,确定出推荐的效果指标后,更新当前最优效果指标y′,直至推荐次数大于预设数量并且T<1时停止,此时的y′对应的权重可以为各预定算法的最优权重。
以下介绍本发明的装置实施例,可以用于执行本发明上述的数据挖掘方法。如图7所示,该数据挖掘装置700可以包括:
数据获取单元710,用于确定与各客户端标识对应的物品关联数据;
第一相似度计算单元720,用于利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度;
第二相似度计算单元730,用于确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度;
客户端标识确定单元740,用于根据所述第二相似度确定与第一物品满足相似阈值的第二物品,确定所述第二物品对应的客户端标识;
物品推荐单元750,用于根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端。
数据获取单元,用于确定与各客户端标识对应的物品关联数据;
第一相似度计算单元,用于利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度;
第二相似度计算单元,用于确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度;
客户端标识确定单元,用于根据所述第二相似度确定与第一物品满足相似阈值的第二物品,确定所述第二物品对应的客户端标识;
物品推荐单元,用于根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端。
在本发明的一种示例性实施例中,数据获取单元可以包括:
数据过滤单元,用于将预设时段内各客户端标识对应的物品关联数据中物品种类满足预设数量的数据筛选出来,得到所述物品关联数据。
在本发明的一种示例性实施例中,第一相似度计算单元可以包括:
指标计算单元,用于根据所述各客户端标识对应的物品关联数据,计算客户端标识对应的各物品的第一指标;
评分单元,用于根据所述物品的所述第一指标确定所述客户端标识对所述物品的评分,以得到各所述客户端对所述物品的平均评分;
第一相似度确定单元,用于根据所述物品的平均评分计算所述物品之间的第一相似度。
在本发明的一种示例性实施例中,第二相似度计算单元可以包括:
权重确定单元,用于确定各所述预定算法的权重;
加权求和单元,用于对多个所述预定算法得到的物品之间的多个第一相似度进行加权求和,得到所述物品之间的第二相似度。
在本发明的一种示例性实施例中,物品推荐单元包括:
客户端筛选单元,用于从所述第二物品对应的客户端标识中筛去与所述第一物品对应的客户端标识得到所述第一物品的待推荐客户端标识;
客户端推荐单元,用于将所述第一物品推荐给所述待推荐客户端标识对应的客户端。
在本发明的一种示例性实施例中,所述数据挖掘装置可以包括:
支持度计算单元,用于根据所述物品关联数据计算所述物品之间的支持度;
物品筛选单元,筛去所述支持度不满足预设阈值的物品。
在本发明的一种示例性实施例中,该数据挖掘装置还可以包括:
循环推荐单元,用于计算推荐效果步骤,所述计算推荐效果步骤包括根据预设时段内的所述待推荐客户端标识对应的物品关联数据确定推荐的效果指标;
权重更新单元,用于根据所述推荐的效果指标更新各所述预定算法的权重,以更新所述第一物品的待推荐客户端标识;
判断单元,用于判断所述推荐的次数是否满足预设数量,若不满足,则将所述第一物品推荐给更新后的待推荐客户端标识对应的客户端,转至计算推荐效果步骤;若满足,则从多个推荐的效果指标中确定最优效果指标;
权重输出单元,用于确定所述最优效果指标对应的各所述预定算法的权重为各所述算法的最终权重。
由于本发明的示例实施例的数据挖掘装置的各个功能模块与上述数据挖掘方法的示例实施例的步骤对应,因此对于本发明装置实施例中未披露的细节,请参照本发明上述的数据挖掘方法的实施例。
下面参考图8,其示出了适于用来实现本发明实施例的电子设备的计算机系统800的结构示意图。图8示出的电子设备的计算机系统800仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统操作所需的各种程序和数据。CPU801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的数据挖掘方法。
例如,所述的电子设备可以实现如图2中所示的:步骤S210,确定与各客户端标识对应的物品关联数据;步骤S220,利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度;步骤S230,确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度;步骤S240,根据所述第二相似度确定与第一物品满足相似阈值的第二物品,确定所述第二物品对应的客户端标识;步骤S250,根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端。
又如,所述的电子设备可以实现如图3所示的各个步骤。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (10)
1.一种数据挖掘方法,其特征在于,包括:
确定与各客户端标识对应的物品关联数据;
利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度;
确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度;
根据所述第二相似度确定与第一物品满足相似阈值的第二物品,确定所述第二物品对应的客户端标识;
根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端。
2.根据权利要求1所述的数据挖掘方法,其特征在于,所述确定与各客户端标识对应的物品关联数据包括:
将预设时段内各客户端标识对应的物品关联数据中物品种类满足预设数量的数据筛选出来,得到所述物品关联数据。
3.根据权利要求1所述的数据挖掘方法,其特征在于,所述利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度包括:
根据所述各客户端标识对应的物品关联数据,计算客户端标识对应的各物品的第一指标;
根据所述物品的所述第一指标确定所述客户端标识对所述物品的评分,以得到各所述客户端对所述物品的平均评分;
根据所述物品的平均评分计算所述物品之间的第一相似度。
4.根据权利要求1所述的数据挖掘方法,其特征在于,所述确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度包括:
确定各所述预定算法的权重;
对多个所述预定算法得到的物品之间的多个第一相似度进行加权求和,得到所述物品之间的第二相似度。
5.根据权利要求1所述的数据挖掘方法,其特征在于,所述根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端包括:
从所述第二物品对应的客户端标识中筛去与所述第一物品对应的客户端标识得到所述第一物品的待推荐客户端标识;
将所述第一物品推荐给所述待推荐客户端标识对应的客户端,以使所述客户端显示所述第一物品的信息。
6.根据权利要求3所述的数据挖掘方法,其特征在于,利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度之前,还包括:
根据所述物品关联数据计算所述物品之间的支持度;
筛去所述支持度不满足预设阈值的物品。
7.根据权利要求1所述的数据挖掘方法,其特征在于,根据待推荐客户端标识将所述第一物品推荐给对应的客户端之后,还包括:
计算推荐效果步骤,所述计算推荐效果步骤包括根据预设时段内的所述待推荐客户端标识对应的物品关联数据确定推荐的效果指标;
根据所述推荐的效果指标更新各所述预定算法的权重,以更新所述第一物品的待推荐客户端标识;
判断所述推荐的次数是否满足预设数量,若不满足,则将所述第一物品推荐给更新后的待推荐客户端标识对应的客户端,转至计算推荐效果步骤;若满足,则从多个推荐的效果指标中确定最优效果指标;
确定所述最优效果指标对应的各所述预定算法的权重为各所述算法的最终权重。
8.一种数据挖掘装置,其特征在于,包括:
数据获取单元,用于确定与各客户端标识对应的物品关联数据;
第一相似度计算单元,用于利用多个预定算法计算所述物品关联数据中的各物品之间的第一相似度;
第二相似度计算单元,用于确定各所述预定算法的权重,根据各所述第一相似度以及各所述算法的权重得到物品之间的第二相似度;
客户端标识确定单元,用于根据所述第二相似度确定与第一物品满足相似阈值的第二物品,确定所述第二物品对应的客户端标识;
物品推荐单元,用于根据所述第二物品对应的客户端标识确定所述第一物品的待推荐客户端标识,以便根据待推荐客户端标识将所述第一物品推荐给对应的客户端。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的数据挖掘方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的数据挖掘方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910165376.0A CN111666481B (zh) | 2019-03-05 | 2019-03-05 | 数据挖掘方法、装置、计算机可读介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910165376.0A CN111666481B (zh) | 2019-03-05 | 2019-03-05 | 数据挖掘方法、装置、计算机可读介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111666481A true CN111666481A (zh) | 2020-09-15 |
CN111666481B CN111666481B (zh) | 2024-04-09 |
Family
ID=72381821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910165376.0A Active CN111666481B (zh) | 2019-03-05 | 2019-03-05 | 数据挖掘方法、装置、计算机可读介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111666481B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112446765A (zh) * | 2020-12-01 | 2021-03-05 | 平安科技(深圳)有限公司 | 产品推荐方法、装置、电子设备及计算机可读存储介质 |
CN115496129A (zh) * | 2022-08-29 | 2022-12-20 | 超聚变数字技术有限公司 | 一种软件匹配方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677715A (zh) * | 2015-12-29 | 2016-06-15 | 海信集团有限公司 | 一种基于多用户的视频推荐方法及装置 |
US20160180315A1 (en) * | 2014-12-22 | 2016-06-23 | Toshiba Tec Kabushiki Kaisha | Information processing apparatus using object recognition, and commodity identification method by the same |
KR20160118644A (ko) * | 2015-04-02 | 2016-10-12 | 주식회사 지케이21글로벌 | 물품 추천 시스템 및 방법, 이를 위한 장치 |
CN106651542A (zh) * | 2016-12-31 | 2017-05-10 | 珠海市魅族科技有限公司 | 一种物品推荐的方法及装置 |
CN107256238A (zh) * | 2017-05-23 | 2017-10-17 | 深思考人工智能机器人科技(北京)有限公司 | 一种多约束条件下的个性化信息推荐方法及信息推荐系统 |
-
2019
- 2019-03-05 CN CN201910165376.0A patent/CN111666481B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160180315A1 (en) * | 2014-12-22 | 2016-06-23 | Toshiba Tec Kabushiki Kaisha | Information processing apparatus using object recognition, and commodity identification method by the same |
KR20160118644A (ko) * | 2015-04-02 | 2016-10-12 | 주식회사 지케이21글로벌 | 물품 추천 시스템 및 방법, 이를 위한 장치 |
CN105677715A (zh) * | 2015-12-29 | 2016-06-15 | 海信集团有限公司 | 一种基于多用户的视频推荐方法及装置 |
CN106651542A (zh) * | 2016-12-31 | 2017-05-10 | 珠海市魅族科技有限公司 | 一种物品推荐的方法及装置 |
CN107256238A (zh) * | 2017-05-23 | 2017-10-17 | 深思考人工智能机器人科技(北京)有限公司 | 一种多约束条件下的个性化信息推荐方法及信息推荐系统 |
Non-Patent Citations (2)
Title |
---|
党博;姜久雷;: "基于评分差异度和用户偏好的协同过滤算法", 计算机应用, no. 04 * |
胡步发等: "基于对称变换与自评估的人眼定位新方法", 电路与系统学报, no. 1 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112446765A (zh) * | 2020-12-01 | 2021-03-05 | 平安科技(深圳)有限公司 | 产品推荐方法、装置、电子设备及计算机可读存储介质 |
CN115496129A (zh) * | 2022-08-29 | 2022-12-20 | 超聚变数字技术有限公司 | 一种软件匹配方法及装置 |
CN115496129B (zh) * | 2022-08-29 | 2024-03-19 | 超聚变数字技术有限公司 | 一种软件匹配方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111666481B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106651542B (zh) | 一种物品推荐的方法及装置 | |
US9589025B2 (en) | Correlated information recommendation | |
US20160191450A1 (en) | Recommendations Engine in a Layered Social Media Webpage | |
CN110363604B (zh) | 页面生成方法和装置 | |
WO2019072128A1 (zh) | 对象识别方法及其系统 | |
CN109993627B (zh) | 推荐方法、推荐模型的训练方法、装置和存储介质 | |
CN109299356B (zh) | 基于大数据的活动推荐方法、装置、电子设备及存储介质 | |
CN107808346B (zh) | 一种潜在目标对象的评估方法及评估装置 | |
CN113393306A (zh) | 产品推荐方法、装置、电子设备及计算机可读介质 | |
CN111666481B (zh) | 数据挖掘方法、装置、计算机可读介质及电子设备 | |
CN111798261A (zh) | 信息更新的方法和装置 | |
CN110827101B (zh) | 一种店铺推荐的方法和装置 | |
CN107357847B (zh) | 数据处理方法及其装置 | |
CN113495991A (zh) | 一种推荐方法和装置 | |
CN111177564A (zh) | 一种产品推荐方法及装置 | |
CN110659919A (zh) | 数据匹配方法、装置、介质及电子设备 | |
CN110766488A (zh) | 一种自动确定主题场景的方法和装置 | |
CN113516524B (zh) | 用于推送信息的方法和装置 | |
CN111460300B (zh) | 网络内容推送方法、装置及存储介质 | |
CN109885504B (zh) | 推荐系统的测试方法、装置、介质及电子设备 | |
CN113763080A (zh) | 推荐物品的确定方法、装置、电子设备和存储介质 | |
CN113792952A (zh) | 用于生成模型的方法和装置 | |
CN113220983A (zh) | 基于深度学习的选品方法和装置 | |
CN113449175A (zh) | 热点数据的推荐方法和装置 | |
CN113360765B (zh) | 事件信息的处理方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |