CN115757958A - 产品推荐方法、装置、计算机设备和存储介质 - Google Patents
产品推荐方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN115757958A CN115757958A CN202211463943.9A CN202211463943A CN115757958A CN 115757958 A CN115757958 A CN 115757958A CN 202211463943 A CN202211463943 A CN 202211463943A CN 115757958 A CN115757958 A CN 115757958A
- Authority
- CN
- China
- Prior art keywords
- target
- product recommendation
- object attribute
- product
- attribute type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种产品推挤方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;确定各对象属性类型相应的重复度;获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。采用本方法能够提高产品推荐的准确性。
Description
技术领域
本申请涉及大数据技术领域,特别是涉及一种产品推荐方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机软件技术的发展,互联网技术的普及,网络上的信息数据越来越多,因而,如何从海量信息数据中提取用户感兴趣的数据并推荐给用户,是很多企业十分关注的问题。而产品的精准推荐,会直接影响到企业产品的成交量。
在现有技术中,产品推荐的方法包括基于内容推荐的算法和协同过滤算法等。然而,传统的推荐方法存在着推荐产品不准确的缺点,因此,目前急需一种产品推荐方法。
发明内容
基于此,有必要针对上述技术问题,提供一种产品推荐方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种产品推荐方法。所述方法包括:
获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
确定各对象属性类型相应的重复度,重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
在其中一个实施例中,确定各对象属性类型相应的重复度,包括:
针对每一对象属性类型,根据各样本画像数据中是否包含对象属性类型相应的子类型有效数据,确定对象属性类型的各子类型在所有样本画像数据中的出现次数;
根据各对象属性类型中各子类型有效数据的出现次数,确定各对象属性类型的重复度。
在其中一个实施例中,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例,包括:
按照各产品推荐算法与各对象属性类型间的适配程度,确定各产品推荐算法作为输入数据类型的指定对象属性类型;
根据目标对象属性类型相应的重复度和各产品推荐算法相应的指定对象属性类型的重复度,确定各产品推荐算法的分配比例。
在其中一个实施例中,根据目标对象属性类型相应的重复度和各产品推荐算法相应的指定对象属性类型的重复度,确定各产品推荐算法的分配比例,包括:
对多个样本画像数据进行聚类,获得多种聚类类型,并确定目标画像数据所属的目标聚类类型;
根据各产品推荐算法相应的指定对象属性类型的重复度以及各目标对象属性类型相应的重复度,确定各产品推荐算法相应的第一分配比例;
确定在目标聚类类型下各产品推荐算法相应的第二分配比例;
将各产品推荐算法相应的第一分配比例和第二分配比例进行整合,获得各产品推荐算法的分配比例。
在其中一个实施例中,确定在目标聚类类型下各产品推荐算法相应的第二分配比例,包括:
获取多个第二分配比例参考组,每一第二分配比例参考组均包括各产品推荐算法相应的参考第二分配比例;
针对每一第二分配比例参考组和从属于目标聚类类型下的各目标样本对象,按照第二分配比例参考组,通过各产品推荐算法,向目标样本对象模拟推荐虚拟产品,以获得各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分;
根据各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分,计算第二分配比例参考组的评价分数,评价分数用于衡量使用第二分配比例参考进行产品推荐时的推荐准确度;
根据每一第二分配比例参考组的评价分数,从所有第二分配比例参考组中选取目标第二分配比例参考组,并将目标第二分配比例参考组作为在目标聚类类型下各产品推荐算法相应的第二分配比例。
在其中一个实施例中,按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品,包括:
获得各产品推荐算法针对所有虚拟产品的产品推荐排序;
按照各产品推荐算法的分配比例,从高至低对各产品推荐算法进行遍历;
针对当前遍历到的当前产品推荐算法和所有虚拟产品中当前未被推荐的当前剩余虚拟产品,按照当前产品推荐算法的分配比例和所有当前剩余虚拟产品的总数量,确定当前推荐数量;
按照当前产品推荐算法相应的产品推荐排序,从所有当前剩余虚拟产品中选取当前推荐数量个虚拟产品并进行推荐,重复上述过程直至各产品推荐算法均已被遍历。
第二方面,本申请还提供了一种产品推荐装置。所述装置包括:
第一获取模块,用于获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
确定模块,用于确定各对象属性类型相应的重复度,重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
第二获取模块,用于获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
推荐模块,用于按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
确定各对象属性类型相应的重复度,重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
确定各对象属性类型相应的重复度,重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
确定各对象属性类型相应的重复度,重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
上述产品推荐方法、装置、计算机设备、存储介质和计算机程序产品,获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;确定各对象属性类型相应的重复度,重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。通过本方法,可以提高产品推荐的准确性。
附图说明
图1为一个实施例中产品推荐方法的流程示意图;
图2为另一个实施例中产品推荐方法的流程示意图;
图3为一个实施例中产品推荐装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种专业名词,但除非特别说明,这些专业名词不受这些术语限制。这些术语仅用于将一个专业名词与另一个专业名词区分。举例来说,在不脱离本申请的范围的情况下,第三预设阈值与第四预设阈值可以相同可以不同。
在一个实施例中,如图1所示,提供了一种产品推荐方法,本实施例以该方法应用于终端进行举例说明,其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备。可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
101、获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
102、确定各对象属性类型相应的重复度,重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
103、获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
104、按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
其中,样本对象指的是接收推荐产品的对象,比如银行中办理业务的客户。样本画像数据的类型可以为多种。
对象属性类型指的是样本对象会目标对象的不同维度的数据,比如,针对银行的产品推荐场景,对象属性类型可以为客户基本信息、客户个人资产负债情况、客户之于金融产品的交互行为等。
每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同指的是各样本画像数据中的对象属性类型相同,比如有A样本画像数据、B样本画像数据和C样本画像数据,其中,A样本画像数据有对象属性类型α的数据和对象属性类型β的数据,则B样本画像数据和C样本画像数据均有对象属性类型α的数据和对象属性类型β的数据。
每一对象属性类型包括各子类型数据,有效数据指的是在该对象属性类型数据中是否包括各子类型的数据。比如,对象属性类型α数据包括α1子类型数据、α2子类型数据和α3子类型数据;对象属性类型β数据包括β1子类型数据、β2子类型数据和β3子类型数据;若B样本画像数据中对象属性类型α数据为α1子类型数据、α3子类型数据,B样本画像数据中对象属性类型β数据为β2子类型数据和β3子类型数据;则B样本画像数据中没有对象属性类型α中的α2子类型的有效数据和对象属性类型β中的β1子类型数据,B样本画像数据中有对象属性类型α的α1子类型和α3子类型的有效数据,有对象属性类型β的β2子类型和β3子类型的有效数据。
目标对象指的是接收推荐产品的对象,比如银行中办理业务的目标客户。目标画像数据指的是与样本画像数据中对象属性类型相同的数据,比如,样本画像数据有α对象属性类型数据和β对象属性类型数据,则获取目标对象的α对象属性类型的数据和β对象属性类型的数据作为目标画像数据。
目标对象属性类型指的是目标画像数据中有效数据的对象属性类型。
虚拟产品是指相应产品推荐场景中的数字产品和服务,可用虚拟资源或现实资源进行交换得到。
目标虚拟产品指的是根据对目标对象的目标画像数据分析,从所有虚拟产品中选出的虚拟产品。
对于产品推荐算法的种类,本发明实施例对其不做具体限定,包括但不限于:按照排行榜(热门)算法、基于内容的推荐算法及协同过滤算法。
分配比例指的是每一种产品推荐算法需要推荐虚拟产品的比例;比如,需要向目标对象推荐10种类型的目标虚拟产品,其中,协同过滤算法的分配比例为1/5,则通过协同过滤算法向目标对象推荐2种类型的目标虚拟产品。
具体地,当确定了每种产品推荐算法的分配比例后,按照分配比例的大小,从所有的虚拟推荐产品中选择目标推荐产品向目标对象进行推荐。比如,有A、B、C三种产品推荐算法,目标虚拟产品的种类为10类,所有的虚拟产品的种类为100类;A产品推荐算法的推荐比例为50%,B产品推荐算法的推荐比例为30%,C产品推荐算法的推荐比例为20%。则先根据A产品推荐算法的推荐比例50%,从100类中选出5类虚拟产品作为A产品推荐算法相应的目标虚拟产品推荐给目标对象,然后从A产品推荐算法未推荐过的95类虚拟产品中选出3类虚拟产品作为B产品推荐算法相应的目标虚拟产品推荐给目标对象,最后从A产品推荐算法和B产品推荐算法均未推荐过的92类虚拟产品中选出2类虚拟产品作为C产品推荐算法相应的目标虚拟产品推荐给目标对象。
本发明实施例提供的方法,通过对目标对象的目标画像数据,以及各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例,从而可以根据按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。通过构建样本画像数据,构建出目标对象的概念模型,并且针对目标对象给出每一种产品推荐算法的分配比例,通过多个产品推荐算法的有效组合,避免单一产品推荐算法的存在推荐准确度不高等,从而提高提升虚拟产品的推荐准确度以及提高产品的推荐质量。此外,各产品推荐算法的分配比例也可随样本对象的各自的样本画像数据的改动,或数据维度的增多,而训练出一个更细化的分配比例策略公式。
结合上述实施例的内容,在一个实施例中,确定各对象属性类型相应的重复度,包括:
针对每一对象属性类型,根据各样本画像数据中是否包含对象属性类型相应的子类型有效数据,确定对象属性类型的各子类型在所有样本画像数据中的种类数量;
根据各对象属性类型中各子类型有效数据的出现次数,确定各对象属性类型的重复度。
其中,对象属性类型的数量是根据样本画像数据确定的。比如,各样本画像数据中共有3种对象属性类型,则对象属性类型的数量为3,对所有对象属性类型进行排序,所有对象属性类型被分为第一种对象属性类型,第二种对象属性类型和第三种对象属性类型。
针对每一对象属性类型,根据各样本画像数据中是否包含对象属性类型相应的子类型有效数据,确定对象属性类型的各子类型在所有样本画像数据中的出现次数指的是:针对任一对象属性类型S,对象属性类型S对应的子类型为S1、S2、S3、S4、S5,若在所有样本画像数据中有对象属性类型S的子类型有效数据,且对象属性类型S有n种子类型有效数据则对象属性类型S的各子类型在所有样本画像数据中的出现次数为n。
比如,有5个样本画像数据,第1个样本画像数据中有对象属性类型S的子类型S1有效数据和子类型S2有效数据;第2个样本画像数据中有对象属性类型S的子类型S2有效数据和子类型S3有效数据;第3个样本画像数据中有对象属性类型S的子类型S1有效数据和子类型S2有效数据;第4个样本画像数据中有对象属性类型S的子类型S3有效数据和子类型S4有效数据;第5个样本画像数据中有对象属性类型S的子类型S1有效数据、子类型S2有效数据、子类型S4有效数据和子类型S5有效数据,则对象属性类型S的S1子类型有效数据出现次数为1+0+1+0+1=3,对象属性类型S的S2子类型有效数据出现次数为1+1+1+0+1=4,对象属性类型S的S3子类型有效数据出现次数为0+1+1+0+1=3,对象属性类型S的S4子类型有效数据出现次数为0+0+0+1+1=2,对象属性类型S的S5子类型有效数据出现次数为0+0+0+0+1=1。
具体地,根据各对象属性类型对应的出现次数,确定各对象属性类型的重复度,包括:根据各对象属性类型中各子类型有效数据的出现次数,确定各对象属性类型中每一子类型的重复度;根据各对象属性类型中每一子类型的重复度,确定各对象属性类型的重复度。
其中,根据各对象属性类型中各子类型有效数据的出现次数,确定各对象属性类型中每一子类型的重复度,包括:
公式(1)中,ai指的是对象属性类型a的第i种子类型,ω(ai)指的是对象属性类型a的第i种子类型有效数据的重复度,N(ai)指的是对象属性类型a的第i种子类型有效数据在所有样本画像数据中的出现次数,N(aj)指的是对象属性类型a的第j种子类型aj在所有样本画像数据中的出现次数,k指的是在所有样本画像数据中对象属性类型a数据共有k种子类型有效数据,k为正整数。
根据各对象属性类型中每一子类型的重复度,确定各对象属性类型的重复度,包括:
公式(2)中,ω(aj)指的是对象属性类型a的第j种子类型有效数据的重复度,ω(a)指的是对象属性类型a的重复度;k指的是在所有样本画像数据中对象属性类型a数据共有k种子类型有效数据,k为正整数。
本发明实施例提供的方法,通过确定每一对象属性类型的各子类型在所有样本画像数据中的出现次数,确定各对象属性类型中每一子类型的重复度,从而确定各对象属性类型的重复度。根据对象属性类型的重复度,可以确定每一对象属性类型在所有样本画像数据中的重要性,进而提高根据各对象属性类型相应的重复度确定各产品推荐算法的分配比例的准确性。
结合上述实施例的内容,在一个实施例中,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例,包括:
按照各产品推荐算法与各对象属性类型间的适配程度,确定各产品推荐算法作为输入数据类型的指定对象属性类型;
根据目标对象属性类型相应的重复度和各产品推荐算法相应的指定对象属性类型的重复度,确定各产品推荐算法的分配比例。
其中,按照各产品推荐算法与各对象属性类型间的适配程度,确定各产品推荐算法作为输入数据类型的指定对象属性类型指的是:将与产品推荐算法A适配程度最高对象属性类型作为该产品推荐算法对应指定对象属性类型。比如,共有3种产品推荐算法,分别为A产品推荐算法、B产品推荐算法和C产品推荐算法;其中,与A产品推荐算法适配程度最高的是种对象属性类型a;与B产品推荐算法适配程度最高的是种对象属性类型b,与C产品推荐算法适配程度最高的是种对象属性类型c,则A产品推荐算法对应的指定对象属性类型为对象属性类型a,B产品推荐算法对应的指定对象属性类型为对象属性类型b;C产品推荐算法对应的指定对象属性类型为对象属性类型c。
具体地,计算目标对象属性类型相应的重复度,包括:将目标对象属性类型数据中有效数据的子类型作为目标子类型,根据各目标子类型有效数据的出现次数,确定各目标子类型的重复度;根据目标对象属性类型的各目标子类型的重复度,确定目标对象属性类型的重复度。
其中,根据各目标子类型有效数据的出现次数,确定各目标子类型的重复度,包括:
公式(3)中,mi指的是目标对象属性类型m的第i种目标子类型,ω(mi)指的是目标对象属性类型m的第i种目标子类型有效数据的重复度,N(mi)指的是目标对象属性类型m的第i种子类型有效数据在目标画像数据中的出现次数,N(mj)指的是目标对象属性类型m的第j种子类型mj在所有样本画像数据中的出现次数,k指的是在所有样本画像数据中目标对象属性类型m数据共有k种子类型有效数据,k为正整数。
其中,根据目标对象属性类型的各目标子类型的重复度,确定目标对象属性类型的重复度,包括:
公式(4)中,ω(mi)指的是目标对象属性类型m的第i种目标子类型有效数据的重复度,ω(m)指的是目标对象属性类型m的重复度,k指的是在所有样本画像数据中目标对象属性类型数据m共有k种子类型有效数据,k为正整数,n指的是在所有目标画像数据中目标对象属性类型m数据有n种子类型有效数据。
本发明实施例提供的方法,通过各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,可以确定各产品推荐算法的分配比例,从而可以根据各产品推荐算法的分配比例对目标对象进行产品推荐。
结合上述实施例的内容,在一个实施例中,根据目标对象属性类型相应的重复度和各产品推荐算法相应的指定对象属性类型的重复度,确定各产品推荐算法的分配比例,包括:
对多个样本画像数据进行聚类,获得多种聚类类型,并确定目标画像数据所属的目标聚类类型;
根据各产品推荐算法相应的指定对象属性类型的重复度以及各目标对象属性类型相应的重复度,确定各产品推荐算法相应的第一分配比例;
确定在目标聚类类型下各产品推荐算法相应的第二分配比例;
将各产品推荐算法相应的第一分配比例和第二分配比例进行整合,获得各产品推荐算法的分配比例。
其中,对于对多个样本画像数据进行聚类,得到多种聚类类型,并确定目标画像数据所属的目标聚类类型中聚类的方法,本发明实施例对其不做具体限定,包括但不限于采用K-Means聚类算法。采用K-Means聚类算法对样本画像数据进行处理,包括:
步骤1、初始化操作是选取k个质点作为初始聚类中心μ=μ1,μ2,...,μk。
步骤2、针对样本画像数据集中每个样本χi,计算它到k个聚类中心的欧式距离,如公式(5),并将其分配到距离最近的质心所对应的类中。
步骤3、重新计算聚类中心,根据公式(6)。
步骤4、重复执行上述第2和第3步的操作,不断构建误差平方和(公式7)和K值的关系图。
公式(5)(6)(7)中,D(χ,μ)为非质点χ和质点μ的欧式距离,μc为质点cc的均值向量,SSE(C)为非质点χ到质点μ的欧式距离平方的总和,即误差平方和。
步骤5、聚类算法中k值的选取对K-means影响较大,常见选取K值的方法有手肘法,当k小于真实聚类数,k值的增大会导致误差平方和(SSE)有大幅度的下降,每个簇的聚合程度增高,而当k等于或大于真实聚类数,每个簇的聚合程度回报将会变小,误差平方和(SSE)的下降趋于平缓。通过对K-Means聚类算法不断地重复,绘制手肘法关系图,从而得出最合适的k值,以及得出最终簇的变化图。
步骤6、步骤5中通过K-Means聚类算法得出的聚类结果,可通过可视化分析工具(BI)或基础的excel图表进行群体特征分析。首先需要将簇类映射回数据集,并查看数据帧,通过比较每个群集上所有变量的平均值,群集的属性可被提取,群集的属性分析提取结合RFM(Recency Frequency Monetary)模型,并直观地根据目标对象基本信息、目标对象虚拟资源拥有情况、目标对象之于推荐产品的交互行为等方面进行分析,最终挑选出围绕目标对象基本信息、目标对象虚拟资源拥有情况以及目标对象之于推荐产品的交互行为等方面的数据,对多个方面的数据进行分析,确定每一方面数据的适配程度最高的产品推荐算法。比如,内容推荐算法适配程度最高的是目标对象与推荐产品有足够的交互行为方面的数据,协同过滤算法适配程度最高的是目标对象基本信息的数据,其中,推荐产品有足够的交互行为方面的数据为一种对象属性类型(比如对象属性类型a)的数据,目标对象基本信息方面的数据为另一种对象属性类型(比如对象属性类型b)的数据。
指定对象属性类型指的是各产品推荐算法相应的且与目标对象属性类型相同的对象属性类型,指定对象属性类型的重复度指的是根据所有样本画像数据计算得到对象属性类型的重复度,即上述公式(2)中计算得到的对象属性类型的重复度。
具体地,根据各产品推荐算法相应的指定对象属性类型的重复度以及各目标对象属性类型相应的重复度,确定各产品推荐算法相应的第一分配比例,包括:
公式(8)中,ω(m)指的是指定对象属性类型m的重复度,ω(m')指的是与指定对象属性类型m具有相同类型的目标对象属性类型m的重复度;k指的是在所有样本画像数据中指定对象属性类型m数据共有k种子类型有效数据,k为正整数;ω(mi)指的是目标对象属性类型m的第i种目标子类型有效数据的重复度,ω(mj)指的是指定对象属性类型m的第j种目标子类型有效数据的重复度,n指的是在所有目标画像数据中目标对象属性类型m数据有n种子类型有效数据;η指的是与指定对象属性类型m适配程度最高的产品推荐算法相应的第一分配比例。
将每一产品推荐算法相应的第一分配比例和第二分配比例进行相乘,得到相乘结果,对每一相乘结果进行归一化处理,得到每一产品推荐算法的推荐比例。
本发明实施例提供的方法,通过目标对象属性类型相应的重复度和各产品推荐算法相应的指定对象属性类型的重复度,可以确定各产品推荐算法的分配比例。
结合上述实施例的内容,在一个实施例中,确定在目标聚类类型下各产品推荐算法相应的第二分配比例,包括:
获取多个第二分配比例参考组,每一第二分配比例参考组均包括各产品推荐算法相应的参考第二分配比例;
针对每一第二分配比例参考组和从属于目标聚类类型下的各目标样本对象,按照第二分配比例参考组,通过各产品推荐算法,向目标样本对象模拟推荐虚拟产品,以获得各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分;
根据各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分,计算第二分配比例参考组的评价分数,评价分数用于衡量使用第二分配比例参考进行产品推荐时的推荐准确度;
根据每一第二分配比例参考组的评价分数,从所有第二分配比例参考组中选取目标第二分配比例参考组,并将目标第二分配比例参考组作为在目标聚类类型下各产品推荐算法相应的第二分配比例。
其中,目标聚类类型下各产品推荐算法相应的第二分配比例是在通过聚类算法对所有样本画像数据进行聚类时确定的。比如,根据聚类算法对所有样本画像数据进行聚类后,得到3类的聚类类型数据,每一类聚类类型数据对应多个第二分配比例参考组,每一个第二分配比例参考组中包括3种类型的第二分配比例。比如产品推荐算法有三种,分别为排行榜(热门)推荐算法、协同过滤算法和基于内容的推荐方法,其中,协同过滤算法对应的第二分配比例的类型为α,基于内容的推荐方法对应的第二分配比例的类型为β,排行榜(热门)推荐算法相应的第二分配比例的类型为1-α-β,其中,α+β<1,0≤α,0≤β,n个第二分配比例参考组可以为:第1个第二分配比例参考组(α1,β1,1-α1-β1),第2个第二分配比例参考组(α2,β2,1-α2-β2),...,第n个第二分配比例参考组(αn,βn,1-αn-βn),其中,n为大于2的整数。
其中,协同过滤算法通过计算目标对象之间的相似度,为该目标对象找出最相似的对象集合,向目标对象推荐对象集合相应的产品,相似度比较主要通过修正余弦相似性,考虑不同对象的评分尺度。基于内容的推荐方法指的是通过计算目标对象曾经评分高的产品的相似产品,从而将该相似产品推荐给目标对象。
具体地,根据各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分,计算每一第二分配比例参考组的评价分数,包括:
公式(9)中,rs,ui为采用第二分配比例参考组s时目标样本对象u对于第i类虚拟产品的真实评分,为采用第二分配比例参考组s时通过各产品推荐算法为目标样本对象u推荐第i类虚拟产品的预测评分,Ep代表测试数值,RMSE(s)为第二分配比例参考组s的评价分数。
从所有第二分配比例参考组中选取目标第二分配比例参考组指的是:根据每一第二分配比例参考组的评价分数,从所有第二分配比例参考组的评价分数中选取评价分数最高的一组第二分配比例参考组作为目标第二分配比例参考组,并将该目标第二分配比例参考组作为在目标聚类类型下各产品推荐算法相应的第二分配比例。
本发明实施例提供的方法,通过确定在目标聚类类型下各产品推荐算法相应的第二分配比例,从而可以根据第二分配比例以及各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
结合上述实施例的内容,在一个实施例中,按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品,包括:
获得各产品推荐算法针对所有虚拟产品的产品推荐排序;
按照各产品推荐算法的分配比例,从高至低对各产品推荐算法进行遍历;
针对当前遍历到的当前产品推荐算法和所有虚拟产品中当前未被推荐的当前剩余虚拟产品,按照当前产品推荐算法的分配比例和所有当前剩余虚拟产品的总数量,确定当前推荐数量;
按照当前产品推荐算法相应的产品推荐排序,从所有当前剩余虚拟产品中选取当前推荐数量个虚拟产品并进行推荐,重复上述过程直至各产品推荐算法均已被遍历。
具体地,获得各产品推荐算法针对所有虚拟产品的产品推荐排序指的是按照每一产品推荐算法针对所有虚拟产品的排序方法对所有虚拟产品进行排序,得到每一产品推荐算法的虚拟产品排序队列。当确定每一产品推荐算法的分配比例后,则根据每一产品推荐算法的分配比例,从每一产品推荐算法的虚拟产品排序队列中选出相应的虚拟产品作为目标虚拟产品,最后将目标虚拟产品推荐给目标对象。
比如,产品推荐算法为A产品推荐算法、B产品推荐算法和C产品推荐算法,虚拟产品的数量为200,目标虚拟产品的数量为20,其中,A产品推荐算法的分配比例为50%、B产品推荐算法的分配比例为30%和C产品推荐算法的分配比例为20%。则A产品推荐算法推荐目标虚拟产品的数量为10,B产品推荐算法推荐目标虚拟产品的数量为6,C产品推荐算法推荐目标虚拟产品的数量为4。首先从A产品推荐算法的虚拟产品排序队列中按照排序高低从高到低顺序选择数量为20的虚拟产品,作为A产品推荐算法相应的第一目标虚拟产品,其次,从B产品推荐算法的虚拟产品排序队列中按照排序高低从高到低顺序选择数量为6、且不包括第一目标虚拟产品的虚拟产品,作为B产品推荐算法相应的第二目标虚拟产品,最后从C产品推荐算法的虚拟产品排序队列中按照排序高低从高到低顺序选择数量为4、且不包括第一目标虚拟产品和第二目标虚拟产品的虚拟产品,作为C产品推荐算法相应的第三目标虚拟产品,将第一目标虚拟产品、第二目标虚拟产品和第三目标虚拟产品作为目标虚拟产品向目标对象进行推荐。
本发明实施例提供的方法,根据各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品,可以提高推荐产品的准确性,以及根据多种推荐算法向目标对象进行产品推荐,可以避免单一产品推荐算法的存在的问题,提升产品推荐的整体质量。
结合上述实施例的内容,在一个实施例中,如图2所示,一种产品推荐方法,包括:
201、获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
202、针对每一对象属性类型,根据各样本画像数据中是否包含对象属性类型相应的子类型有效数据,确定对象属性类型的各子类型在所有样本画像数据中的出现次数;
203、根据各对象属性类型中各子类型有效数据的出现次数,确定各对象属性类型的重复度;重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
204、获取目标对象的目标画像数据,按照各产品推荐算法与各对象属性类型间的适配程度,确定各产品推荐算法作为输入数据类型的指定对象属性类型;
205、对多个样本画像数据进行聚类,获得多种聚类类型,并确定目标画像数据所属的目标聚类类型;
206、根据各产品推荐算法相应的指定对象属性类型的重复度以及各目标对象属性类型相应的重复度,确定各产品推荐算法相应的第一分配比例;
207、确定在目标聚类类型下各产品推荐算法相应的第二分配比例;
208、将各产品推荐算法相应的第一分配比例和第二分配比例进行整合,获得各产品推荐算法的分配比例。
209、按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
本发明实施例提供的方法,通过对多个样本对象各自的样本画像数据进行分析处理,构建出样本对象群相应的概念模型,并且针对样本对象群给出每一产品推荐算法的分配比例策略,通过多个产品推荐算法的有效组合,避免单一算法的存在问题,从而可以提升推荐的整体质量。不同目标对象的产品推荐算法的分配比例也可因应输入参数的改动,或挖掘维度的增多,而训练出一个更细化的分配比例策略公式。此外,本发明实施例提供的方法给出一种混合产品推荐算法的推荐方法,同时也能增加混合产品推荐算法的数量,从而提高产品推荐准确性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的产品推荐方法的产品推荐装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个产品推荐装置实施例中的具体限定可以参见上文中对于产品推荐方法的限定,在此不再赘述。
在一个实施例中,如图3所示,提供了一种产品推荐装置,包括:第一获取模块301、确定模块302、第二获取模块303和推荐模块304,其中:
第一获取模块301,用于获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
确定模块302,用于确定各对象属性类型相应的重复度,重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
第二获取模块303,用于获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
推荐模块304,用于按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
在一个实施例中,确定模块302,包括:
第一确定子模块,用于针对每一对象属性类型,根据各样本画像数据中是否包含对象属性类型相应的子类型有效数据,确定对象属性类型的各子类型在所有样本画像数据中的出现次数;
第二确定子模块,用于根据各对象属性类型中各子类型有效数据的出现次数,确定各对象属性类型的重复度。
在一个实施例中,第二获取模块303,包括:
第三确定子模块,用于按照各产品推荐算法与各对象属性类型间的适配程度,确定各产品推荐算法作为输入数据类型的指定对象属性类型;
第四确定子模块,用于根据目标对象属性类型相应的重复度和各产品推荐算法相应的指定对象属性类型的重复度,确定各产品推荐算法的分配比例。
在一个实施例中,第四确定子模块,包括:
第一确定单元,用于对多个样本画像数据进行聚类,获得多种聚类类型,并确定目标画像数据所属的目标聚类类型;
第二确定单元,用于根据各产品推荐算法相应的指定对象属性类型的重复度以及各目标对象属性类型相应的重复度,确定各产品推荐算法相应的第一分配比例;
第三确定单元,用于确定在目标聚类类型下各产品推荐算法相应的第二分配比例;
整合单元,用于将各产品推荐算法相应的第一分配比例和第二分配比例进行整合,获得各产品推荐算法的分配比例。
在一个实施例中,第三确定单元,包括:
获取子单元,用于获取多个第二分配比例参考组,每一第二分配比例参考组均包括各产品推荐算法相应的参考第二分配比例;
获得子单元,用于针对每一第二分配比例参考组和从属于目标聚类类型下的各目标样本对象,按照第二分配比例参考组,通过各产品推荐算法,向目标样本对象模拟推荐虚拟产品,以获得各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分;
计算子单元,用于根据各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分,计算第二分配比例参考组的评价分数,评价分数用于衡量使用第二分配比例参考进行产品推荐时的推荐准确度;
选取子单元,用于根据每一第二分配比例参考组的评价分数,从所有第二分配比例参考组中选取目标第二分配比例参考组,并将目标第二分配比例参考组作为在目标聚类类型下各产品推荐算法相应的第二分配比例。
在一个实施例中,推荐模块304,包括:
排序子模块,用于获得各产品推荐算法针对所有虚拟产品的产品推荐排序;
遍历子模块,用于按照各产品推荐算法的分配比例,从高至低对各产品推荐算法进行遍历;
第五确定子模块,用于针对当前遍历到的当前产品推荐算法和所有虚拟产品中当前未被推荐的当前剩余虚拟产品,按照当前产品推荐算法的分配比例和所有当前剩余虚拟产品的总数量,确定当前推荐数量;
推荐子模块,用于按照当前产品推荐算法相应的产品推荐排序,从所有当前剩余虚拟产品中选取当前推荐数量个虚拟产品并进行推荐,重复上述过程直至各产品推荐算法均已被遍历。
上述产品推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种产品推荐方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
确定各对象属性类型相应的重复度,重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
针对每一对象属性类型,根据各样本画像数据中是否包含对象属性类型相应的子类型有效数据,确定对象属性类型的各子类型在所有样本画像数据中的出现次数;
根据各对象属性类型中各子类型有效数据的出现次数,确定各对象属性类型的重复度。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
按照各产品推荐算法与各对象属性类型间的适配程度,确定各产品推荐算法作为输入数据类型的指定对象属性类型;
根据目标对象属性类型相应的重复度和各产品推荐算法相应的指定对象属性类型的重复度,确定各产品推荐算法的分配比例。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对多个样本画像数据进行聚类,获得多种聚类类型,并确定目标画像数据所属的目标聚类类型;
根据各产品推荐算法相应的指定对象属性类型的重复度以及各目标对象属性类型相应的重复度,确定各产品推荐算法相应的第一分配比例;
确定在目标聚类类型下各产品推荐算法相应的第二分配比例;
将各产品推荐算法相应的第一分配比例和第二分配比例进行整合,获得各产品推荐算法的分配比例。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取多个第二分配比例参考组,每一第二分配比例参考组均包括各产品推荐算法相应的参考第二分配比例;
针对每一第二分配比例参考组和从属于目标聚类类型下的各目标样本对象,按照第二分配比例参考组,通过各产品推荐算法,向目标样本对象模拟推荐虚拟产品,以获得各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分;
根据各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分,计算第二分配比例参考组的评价分数,评价分数用于衡量使用第二分配比例参考进行产品推荐时的推荐准确度;
根据每一第二分配比例参考组的评价分数,从所有第二分配比例参考组中选取目标第二分配比例参考组,并将目标第二分配比例参考组作为在目标聚类类型下各产品推荐算法相应的第二分配比例。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获得各产品推荐算法针对所有虚拟产品的产品推荐排序;
按照各产品推荐算法的分配比例,从高至低对各产品推荐算法进行遍历;
针对当前遍历到的当前产品推荐算法和所有虚拟产品中当前未被推荐的当前剩余虚拟产品,按照当前产品推荐算法的分配比例和所有当前剩余虚拟产品的总数量,确定当前推荐数量;
按照当前产品推荐算法相应的产品推荐排序,从所有当前剩余虚拟产品中选取当前推荐数量个虚拟产品并进行推荐,重复上述过程直至各产品推荐算法均已被遍历。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
确定各对象属性类型相应的重复度,重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向目标对象进行推荐的目标虚拟产品。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
针对每一对象属性类型,根据各样本画像数据中是否包含对象属性类型相应的子类型有效数据,确定对象属性类型的各子类型在所有样本画像数据中的出现次数;
根据各对象属性类型中各子类型有效数据的出现次数,确定各对象属性类型的重复度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
按照各产品推荐算法与各对象属性类型间的适配程度,确定各产品推荐算法作为输入数据类型的指定对象属性类型;
根据目标对象属性类型相应的重复度和各产品推荐算法相应的指定对象属性类型的重复度,确定各产品推荐算法的分配比例。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对多个样本画像数据进行聚类,获得多种聚类类型,并确定目标画像数据所属的目标聚类类型;
根据各产品推荐算法相应的指定对象属性类型的重复度以及各目标对象属性类型相应的重复度,确定各产品推荐算法相应的第一分配比例;
确定在目标聚类类型下各产品推荐算法相应的第二分配比例;
将各产品推荐算法相应的第一分配比例和第二分配比例进行整合,获得各产品推荐算法的分配比例。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取多个第二分配比例参考组,每一第二分配比例参考组均包括各产品推荐算法相应的参考第二分配比例;
针对每一第二分配比例参考组和从属于目标聚类类型下的各目标样本对象,按照第二分配比例参考组,通过各产品推荐算法,向目标样本对象模拟推荐虚拟产品,以获得各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分;
根据各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分,计算第二分配比例参考组的评价分数,评价分数用于衡量使用第二分配比例参考进行产品推荐时的推荐准确度;
根据每一第二分配比例参考组的评价分数,从所有第二分配比例参考组中选取目标第二分配比例参考组,并将目标第二分配比例参考组作为在目标聚类类型下各产品推荐算法相应的第二分配比例。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获得各产品推荐算法针对所有虚拟产品的产品推荐排序;
按照各产品推荐算法的分配比例,从高至低对各产品推荐算法进行遍历;
针对当前遍历到的当前产品推荐算法和所有虚拟产品中当前未被推荐的当前剩余虚拟产品,按照当前产品推荐算法的分配比例和所有当前剩余虚拟产品的总数量,确定当前推荐数量;
按照当前产品推荐算法相应的产品推荐排序,从所有当前剩余虚拟产品中选取当前推荐数量个虚拟产品并进行推荐,重复上述过程直至各产品推荐算法均已被遍历。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种产品推荐方法,其特征在于,所述方法包括:
获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
确定各对象属性类型相应的重复度,所述重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和所述目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向所述目标对象进行推荐的目标虚拟产品。
2.根据权利要求1所述的方法,其特征在于,所述确定各对象属性类型相应的重复度,包括:
针对每一对象属性类型,根据各样本画像数据中是否包含所述对象属性类型相应的子类型有效数据,确定所述对象属性类型的各子类型在所有样本画像数据中的出现次数;
根据各对象属性类型中各子类型有效数据的出现次数,确定各对象属性类型的重复度。
3.根据权利要求1所述的方法,其特征在于,所述根据各对象属性类型相应的重复度和所述目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例,包括:
按照各产品推荐算法与各对象属性类型间的适配程度,确定各产品推荐算法作为输入数据类型的指定对象属性类型;
根据所述目标对象属性类型相应的重复度和各产品推荐算法相应的指定对象属性类型的重复度,确定各产品推荐算法的分配比例。
4.根据权利要求3所述的方法,其特征在于,所述根据所述目标对象属性类型相应的重复度和各产品推荐算法相应的指定对象属性类型的重复度,确定各产品推荐算法的分配比例,包括:
对多个样本画像数据进行聚类,获得多种聚类类型,并确定所述目标画像数据所属的目标聚类类型;
根据各产品推荐算法相应的指定对象属性类型的重复度以及各目标对象属性类型相应的重复度,确定各产品推荐算法相应的第一分配比例;
确定在所述目标聚类类型下各产品推荐算法相应的第二分配比例;
将各产品推荐算法相应的第一分配比例和第二分配比例进行整合,获得各产品推荐算法的分配比例。
5.根据权利要求4所述的方法,其特征在于,所述确定在所述目标聚类类型下各产品推荐算法相应的第二分配比例,包括:
获取多个第二分配比例参考组,每一第二分配比例参考组均包括各产品推荐算法相应的参考第二分配比例;
针对每一第二分配比例参考组和从属于所述目标聚类类型下的各目标样本对象,按照所述第二分配比例参考组,通过各产品推荐算法,向所述目标样本对象模拟推荐虚拟产品,以获得各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分;
根据各目标样本对象对于各虚拟产品的真实评分、以及通过各产品推荐算法为各目标样本对象推荐各虚拟产品的预测评分,计算所述第二分配比例参考组的评价分数,所述评价分数用于衡量使用所述第二分配比例参考进行产品推荐时的推荐准确度;
根据每一第二分配比例参考组的评价分数,从所有第二分配比例参考组中选取目标第二分配比例参考组,并将所述目标第二分配比例参考组作为在所述目标聚类类型下各产品推荐算法相应的第二分配比例。
6.根据权利要求1所述的方法,其特征在于,所述按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向所述目标对象进行推荐的目标虚拟产品,包括:
获得各产品推荐算法针对所有虚拟产品的产品推荐排序;
按照各产品推荐算法的分配比例,从高至低对各产品推荐算法进行遍历;
针对当前遍历到的当前产品推荐算法和所有虚拟产品中当前未被推荐的当前剩余虚拟产品,按照所述当前产品推荐算法的分配比例和所有当前剩余虚拟产品的总数量,确定当前推荐数量;
按照所述当前产品推荐算法相应的产品推荐排序,从所有当前剩余虚拟产品中选取所述当前推荐数量个虚拟产品并进行推荐,重复上述过程直至各产品推荐算法均已被遍历。
7.一种产品推荐装置,其特征在于,所述装置包括:
第一获取模块,用于获取多个样本对象各自的样本画像数据,每一样本画像数据均覆盖有多种对象属性类型,且不同样本画像数据相应的对象属性类型的覆盖范围相同;
确定模块,用于确定各对象属性类型相应的重复度,所述重复度用于表征相应的对象属性类型在不同样本画像数据中具有各子类型有效数据的出现频率;
第二获取模块,用于获取目标对象的目标画像数据,根据各对象属性类型相应的重复度和所述目标画像数据包含的有效数据相应的目标对象属性类型,确定各产品推荐算法的分配比例;
推荐模块,用于按照各产品推荐算法的分配比例,通过各产品推荐算法,在所有虚拟产品中确定向所述目标对象进行推荐的目标虚拟产品。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211463943.9A CN115757958A (zh) | 2022-11-22 | 2022-11-22 | 产品推荐方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211463943.9A CN115757958A (zh) | 2022-11-22 | 2022-11-22 | 产品推荐方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115757958A true CN115757958A (zh) | 2023-03-07 |
Family
ID=85334674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211463943.9A Pending CN115757958A (zh) | 2022-11-22 | 2022-11-22 | 产品推荐方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115757958A (zh) |
-
2022
- 2022-11-22 CN CN202211463943.9A patent/CN115757958A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021174944A1 (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
US20060101048A1 (en) | KStore data analyzer | |
CN115795000A (zh) | 基于联合相似度算法对比的围标识别方法和装置 | |
CN114372681A (zh) | 基于流水数据的企业分类方法、装置、设备、介质和产品 | |
CN117035980A (zh) | 资源借调评估方法、装置、计算机设备和存储介质 | |
CN117033765A (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN116894721A (zh) | 一种指标预测方法、装置、计算机设备 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN115049429A (zh) | 增益预测方法、装置和计算机设备 | |
CN115757958A (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
CN114626701A (zh) | 社区风险预警方法、装置、计算机设备和存储介质 | |
CN117853217A (zh) | 数据隐私保护的金融违约率预测方法、装置以及设备 | |
CN116385156B (zh) | 资源分配方法、装置、计算机设备和计算机可读存储介质 | |
CN118154300A (zh) | 抵质押参数处理方法、装置、计算机设备和存储介质 | |
CN116151896A (zh) | 虚拟产品推荐方法、装置、计算机设备和存储介质 | |
CN117314036A (zh) | 工单分配方法、装置、设备、存储介质和程序产品 | |
CN116881546A (zh) | 资源推荐方法、装置、设备和存储介质 | |
CN117312405A (zh) | 用户异常等级确定方法、装置、计算机设备、介质和产品 | |
CN118313625A (zh) | 金融服务资源配置方法、装置、设备和存储介质 | |
CN117312660A (zh) | 项目推送方法、装置、计算机设备和存储介质 | |
CN114691991A (zh) | 推荐方法、装置、模拟系统、计算机设备和存储介质 | |
CN117312892A (zh) | 用户聚类方法、装置、计算机设备和存储介质 | |
CN114064464A (zh) | 安全需求分析方法、装置、计算机设备和存储介质 | |
CN115878746A (zh) | 政策文本确定方法和装置 | |
CN118400422A (zh) | 信息推送方法、装置、设备、存储介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |