CN117172887B - 商品推荐模型训练方法及商品推荐方法 - Google Patents
商品推荐模型训练方法及商品推荐方法 Download PDFInfo
- Publication number
- CN117172887B CN117172887B CN202311444961.7A CN202311444961A CN117172887B CN 117172887 B CN117172887 B CN 117172887B CN 202311444961 A CN202311444961 A CN 202311444961A CN 117172887 B CN117172887 B CN 117172887B
- Authority
- CN
- China
- Prior art keywords
- commodity
- user
- pair
- tower
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 114
- 238000000034 method Methods 0.000 title claims abstract description 66
- 239000013598 vector Substances 0.000 claims description 77
- 238000004590 computer program Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 239000003599 detergent Substances 0.000 description 4
- 241000208818 Helianthus Species 0.000 description 3
- 235000003222 Helianthus annuus Nutrition 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005202 decontamination Methods 0.000 description 1
- 230000003588 decontaminative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Control Of Vending Devices And Auxiliary Devices For Vending Devices (AREA)
Abstract
本申请适用于商品推荐技术领域,提供了商品推荐模型训练方法及商品推荐方法,包括:根据用户的点击序列确定所述用户对应的目标商品,所述点击序列包括被所述用户点击的商品的商品标识,所述目标商品与所述点击序列对应的所述商品属于不同售卖平台的商品;构建训练样本,一个所述训练样本包括一个用户对应的所述点击序列和所述目标商品的商品标识;基于各个所述训练样本对预构建的商品推荐模型进行训练,直至所述商品推荐模型满足要求,得到训练后的所述商品推荐模型。本申请可以实现商品的跨售卖平台推荐。
Description
技术领域
本申请属于商品推荐技术领域,尤其涉及商品推荐模型训练方法、商品推荐方法、终端设备及计算机可读存储介质。
背景技术
随着电子技术和网络技术的不断发展,越来越多的用户喜欢网络购物,各种线上售卖平台越来越多。为了给用户提供优质的购物体验以及提高商家的经济收入,通常会根据用户的喜好等对用户进行商品推荐,以提高商品的点击率和转化率。
目前,线上的各个售卖平台在向用户进行商品推荐时,通常仅基于用户在单个售卖平台的历史浏览记录来进行推荐,无法向用户推荐个性化的跨售卖平台的商品。
发明内容
本申请实施例提供了商品推荐模型训练方法,可以实现商品的跨售卖平台推荐。
第一方面,本申请实施例提供了一种商品推荐模型训练方法,包括:
根据用户的点击序列确定所述用户对应的目标商品,所述点击序列包括被所述用户点击的商品的商品标识,所述目标商品与所述点击序列对应的所述商品属于不同售卖平台的商品;
构建训练样本,一个所述训练样本包括一个用户对应的所述点击序列和所述目标商品的商品标识;
基于各个所述训练样本对预构建的商品推荐模型进行训练,直至所述商品推荐模型满足要求,得到训练后的所述商品推荐模型。
第二方面,本申请实施例提供了一种商品推荐方法,包括:
获取待推荐用户的点击序列;
将所述点击序列作为商品推荐模型的输入,得到所述商品推荐模型输出的推荐商品的商品标识,其中,所述商品推荐模型根据如上述第一方面所述的商品推荐模型训练方法训练得到。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的商品推荐模型训练方法或上述第二方面所述的商品推荐方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中所述的商品推荐模型训练方法或上述第二方面的商品推荐方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面所述的商品推荐模型训练方法或上述第二方面所述的商品推荐方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:
本申请实施例中,根据用户的点击序列和目标商品构建训练样本,一个训练样本中包含一个用户对应的点击序列和目标商品的商品标识,而该目标商品是根据用户的点击序列确定的、与该点击序列对应的商品属于不同售卖平台的商品,即,在训练样本中增加与用户点击查看过的商品属于不同售卖平台的目标商品,基于该训练样本对预构建的商品推荐模型进行训练,能够使得训练得到的商品推荐模型具有召回与用户的点击序列对应的商品属于不同售卖平台的商品的能力,实现商品的跨售卖平台推荐。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1是本申请一实施例提供的一种商品推荐模型训练方法的流程示意图;
图2是本申请实施例提供的一种商品推荐方法的流程示意图;
图3是本申请实施例提供的商品推荐模型训练装置的结构示意图;
图4是本申请实施例提供的商品推荐装置的结构示意图;
图5是本申请实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。
实施例一:
图1示出了本发明实施例提供的一种商品推荐模型训练方法的流程示意图,详述如下:
步骤S101,根据用户的点击序列确定上述用户对应的目标商品,上述点击序列包括被上述用户点击的商品的商品标识,上述目标商品与上述点击序列对应的上述商品属于不同售卖平台的商品。
上述售卖平台是指推广销售商品的平台,如各种电商平台、企业官网等线上售卖平台,以及如专卖店、展厅等线下售卖平台。需要指出的是,本申请实施例需基于用户的点击序列确定用户对应的目标商品,即,需要获取线上售卖平台的用户的点击序列,而确定的目标商品可以是线上售卖平台的商品,也可以是线下售卖平台的商品。
上述点击序列即基于被用户点击过的商品确定的序列,该点击序列中包含的是被用户点击的商品的商品标识。上述商品标识可以是商品的名称、产品序列号或者产品编号、型号等标识。
可选地,在获取用户的点击序列时,可以基于点击时间的先后顺序获取在预设时间段内(如过去100天)被用户点击过的商品,从而基于各个被用户点击的商品的商品标识得到有序的点击序列,即点击序列的商品标识的先后顺序根据商品被点击的时间顺序确定。例如,将预设时间段内最后一个被用户点击的商品的商品标识作为点击序列中的第一个数据,将预设时间段内第一个被用户点击的商品的商品标识作为点击序列中的最后一个数据,即,点击序列中的商品标识按照商品被用户点击的时间降序排序。
具体地,为了解决不同售卖平台之间交叉用户少甚至没有交叉用户,导致难以获取交叉用户对应的交叉数据的问题,可以根据用户的点击序列来确定一个与该点击序列对应的商品属于不同售卖平台的商品,得到该用户对应的目标商品。可选地,在确定用户对应的目标商品时,可以获取与用户的点击序列对应的商品存在关联且属于不同的售卖平台的商品作为目标商品,例如,根据用户的点击序列对应的商品的类目、价格等特征获取其它售卖平台的具有相同特征(即类目相同、价格相近等)的商品,再从获取到的这些商品中确定出目标商品。
需要指出的是,上述用户可以是单个售卖平台的用户,即仅在一个售卖平台注册和选购商品的用户,上述用户也可以是跨多个售卖平台的用户(即交叉用户),即同时在多个售卖平台注册和选购商品的用户。可以理解的是,当用户为单个售卖平台的用户时,其点击序列中的商品标识对应的商品均属于同一个售卖平台中的商品,当用户为交叉用户时,其点击序列中的商品标识对应的商品可以包括多个售卖平台中的商品,点击序列中的商品标识的顺序可以是对应的商品被用户点击的时间的先后顺序。
在一些实施例中,由于不同售卖平台的数据通常不互通,为了减小获取点击序列的难度,可以仅获取单个售卖平台的各个用户的点击序列,即,对每一个售卖平台,仅获取在该售卖平台上注册和选购商品的用户的点击序列,得到各个售卖平台对应的各个用户的点击序列,不需要获取到各个售卖平台的用户的数据后再确定交叉用户以及交叉用户的点击序列,使得后续不需要基于交叉用户的点击序列构建跨域样本,减小对交叉用户的依赖同时减少获取点击序列所需时间和计算量。例如,假设存在售卖平台A、售卖平台B和售卖平台C,则可以获取仅在售卖平台A注册的用户的点击序列,以及,获取仅在售卖平台B注册的用户的点击序列、仅在售卖平台C注册的用户的点击序列。
可选地,在用户的点击序列中包含了至少两个售卖平台的商品的商品标识的情况下,在根据该点击序列确定用户对应的目标商品时,可以是根据该点击序列中被用户点击的时间最晚的商品标识对应的商品所属的售卖平台确定对应的目标商品,也可以根据该点击序列中被用户点击的次数最多的商品标识对应的商品所属的售卖平台确定对应的目标商品。
例如,假设点击序列A中包含售卖平台B1中的商品的商品标识以及售卖平台B2中的商品的商品标识,并假设点击序列A中的商品标识按商品被用户点击的时间降序排列,第一个商品标识(即被用户点击的时间最晚的商品的商品标识)对应的商品B为B1平台的商品,则在确定该点击序列A对应的用户的目标商品时,根据商品B所属的售卖平台B1,确定的目标商品为售卖平台B1以外的售卖平台的商品(如售卖平台B2的商品)。
本申请实施例中,根据用户的点击序列确定与用户的点击序列对应的商品属于不同售卖平台的商品,使得后续能够基于用户对应的点击序列和目标商品构建训练样本,并不要求获取交叉用户对应的交叉数据来生成训练样本,能够减小对交叉用户的依赖性。
步骤S102,构建训练样本,一个上述训练样本包括一个用户对应的上述点击序列和上述目标商品的商品标识。
具体地,由于跨售卖平台推荐商品的模型的训练强烈依赖于交叉用户的如点击商品等行为信息,在交叉用户较少或无交叉用户时,训练得到的模型的准确性低,甚至难以进行模型的训练,因此,为了提高训练得到的商品推荐模型的准确性,可以基于各个用户对应的目标商品以及点击序列,构建得到多个训练样本。其中,构建的一个训练样本中包括一个用户对应的点击序列和目标商品的商品标识,由于确定的目标商品与用户的点击序列对应的商品属于不同售卖平台的商品,因此,可以认为,包含用户对应的点击序列和目标商品的训练样本相当于根据交叉用户点击序列构建的训练样本,从而能够在不需要获取交叉用户的情况下,得到所需的训练样本来训练商品推荐模型。
本申请实施例中,基于用户对应的点击序列和目标商品构建训练样本,构建得到的每一个训练样本中,其对应的目标商品与点击序列对应的商品属于不同售卖平台的商品,即,每一个训练样本均包含不同售卖平台的商品,在不需要存在或获取交叉用户的情况下能够得到足够的交叉数据(即包含不同售卖平台的商品且与被用户点击的商品相关的数据)作为训练样本。
步骤S103,基于各个上述训练样本对预构建的商品推荐模型进行训练,直至上述商品推荐模型满足要求,得到训练后的上述商品推荐模型。
具体地,在构建得到各个训练样本之后,可以根据构建的各个训练样本对预构建的商品推荐模型进行训练,直至该商品推荐模型满足要求(如准确性满足预设阈值0.98、迭代次数满足预设次数900等),得到训练后的商品推荐模型。由于一个训练样本中包含一个用户对应的点击序列和目标商品的商品标识,即,在训练样本中加入与用户的点击序列对应的商品属于不同售卖平台的目标商品,因此,基于构建得到的这些训练样本训练得到的商品推荐模型具有召回与用户的点击序列对应的商品属于不同售卖平台的商品的能力,即,得到能够跨售卖平台推荐商品的商品推荐模型。
本申请实施例中,根据用户的点击序列和对应的目标商品构建训练样本,一个训练样本中包含一个用户的点击序列和目标商品的商品标识,而目标商品是与点击序列对应的商品,即被用户点击过的商品属于不同售卖平台的商品,也即,每一个训练样本中均加入与被用户点击过的商品属于不同售卖平台的目标商品,从而使得基于这些训练样本训练得到的商品推荐模型具有召回与用户的点击序列属于不同售卖平台的商品的能力,较好地实现商品的跨售卖平台推荐。
在一些实施例中,上述步骤S101包括:
A1:确定待匹配商品。
A2:在上述待匹配商品与上述点击序列对应的上述商品属于同一上述售卖平台的情况下,从预先构建的各个商品对中确定目标商品对,其中,一个上述商品对包含一个第一商品标识和一个第二商品标识,上述第一商品标识为第一售卖平台对应的第一商品的商品标识,上述第二商品标识为第二售卖平台对应的第二商品的商品标识,上述目标商品对为上述第一商品标识或上述第二商品标识与上述待匹配商品的商品标识相同的上述商品对。
A3:根据上述目标商品对确定上述目标商品,其中,当上述第一商品标识与上述待匹配商品的商品标识相同时,上述目标商品为上述第二商品标识对应的商品,当上述第二商品标识与上述待匹配商品的商品标识相同时,上述目标商品为上述第一商品标识对应的商品。
具体地,在根据用户的点击序列确定对应的目标商品时,可以先从获取一个商品作为待匹配商品,基于该待匹配商品与用户的点击序列对应的商品确定目标商品。可选地,在获取待匹配商品时,可以基于用户的点击序列对应的商品的类目、价格等特征确定待匹配商品,即,基于用户的点击序列对应的商品的商品特征获取关联性较大的商品作为待匹配商品,以提高基于该待匹配商品确定的目标商品与点击序列对应的商品的关联性。在确定出待匹配商品后,判断确定的待匹配商品与用户的点击序列中的商品标识对应的商品是否属于同一个售卖平台的商品。
在判定待匹配商品与点击序列对应的商品属于同一个售卖平台的情况下,可以基于该待匹配商品获取到与该待匹配商品属于不同售卖平台的商品,即获取到与点击序列对应的商品属于不同售卖平台的商品(也即获取目标商品)。
在获取与该待匹配商品属于不同售卖平台的商品时,可以从预先构建的各个商品对中确定第一商品标识与该待匹配商品的商品标识相同的商品对,将其作为目标商品对,或者,从各个商品对中确定出第二商品标识与该待匹配商品的商品标识相同的商品对,将其作为目标商品对。其中,一个商品对中包含一个第一商品标识和第二商品标识,第一商品标识为第一售卖平台对应的第一商品的商品标识,第二商品标识为第二售卖平台对应的第二商品的商品标识,即,将第一售卖平台的商品称为第一商品,将第二售卖平台的商品称为第二商品。
在确定出目标商品对之后,可以根据该目标商品对中的商品标识对应的商品确定该点击序列对应的目标商品。其中,当目标商品对中的第一商品标识与待匹配商品的商品标识相同时,将目标商品对中的第二商品标识对应的商品作为目标商品,当目标商品对中的第二商品标识与待匹配商品的商品标识相同时,将目标商品对中的第一商品标识对应的商品作为目标商品。
可以理解的是,由于预先构建的商品对中包含的两个商品标识对应的商品是不同售卖平台的商品,因此,在判定待匹配商品与点击序列对应的商品属于同一个售卖平台时,可以基于各个商品对直接获取到与该待匹配商品关联的目标商品对,从而基于目标商品对获取到与点击序列对应的商品属于不同售卖平台的商品,得到目标商品。
若判定待匹配商品与点击序列对应的商品属于不同售卖平台的商品,则可以直接将该待匹配商品确定为该点击序列对应的目标商品。
可选地,由于本申请实施例中预先构建的商品对对应的商品为第一售卖平台和第二售卖平台的商品,即商品对基于第一售卖平台和第二售卖平台构建得到,为了能够基于待匹配商品准确获取到对应的目标商品对,待匹配商品为从第一售卖平台和第二售卖平台中的商品中确定的商品。
在一些实施例中,在点击序列对应的商品包含多个售卖平台的商品时,可以从点击序列对应的商品中确定出一个参考商品,根据该参考商品所属的售卖平台判断待匹配商品与点击序列对应的商品是否属于同一售卖平台。可选地,该参考商品可以是点击序列对应的商品中被用户点击的时间最晚的商品,以根据用户最新点击查看的商品进行判断,该参考商品也可以是点击序列对应的商品中被用户点击的次数最多的商品,而商品被用户点击的次数能够反映用户的选购偏好,判断被用户的点击次数最多的商品与待匹配商品是否属于同一售卖平台,能够提高判断结果的准确性,从而提高确定的目标商品的准确性。
可以理解的是,由于本申请实施例中预先构建的各个商品对对应的商品为第一售卖平台和第二售卖平台的商品,为了在判定待匹配商品与点击序列对应的商品属于同一个售卖平台的情况下,能够从各个商品对中准确确定出目标商品对,可以从第一售卖平台和第二售卖平台的商品中随机抽取一个商品作为待匹配商品。
在另一些实施例中,预先构建的各个商品对也可以包含至少三个商品标识,商品对中的各个商品标识对应的商品所属的售卖平台中,至少存在两个不同的售卖平台。
例如,假设商品对中包含第一商品标识、第二商品标识、第三商品标识和第四商品标识,第一商品标识为售卖平台A的商品的商品标识,第二商品标识为售卖平台B的商品的商品标识,第三商品标识为售卖平台C的商品的商品标识,第四商品标识为售卖平台D的商品的商品标识,即,商品对中每一个商品标识对应的商品所属的售卖平台均不相同。
对应地,在确定目标商品对时,若商品对中包含的各个商品标识中,任意一个商品标识与待匹配商品的商品标识相同,则可以将该商品对确定为目标商品对,可以将商品对中任意一个商品标识与待匹配商品的商品标识相同的商品对确定为目标商品对。在目标商品对中包含至少三个商品标识时,可以将目标商品对中除目标商品标识(即目标商品对中与待匹配商品的商品标识相同的商品标识,还包括该商品对中其它的与待匹配商品属于同一售卖平台的商品标识)以外的任意一个商品标识对应的商品作为目标商品。
本申请实施例中,由于预先构建的商品对中包含的两个商品标识所对应的商品是不同售卖平台的商品,因此,在确定用户对应的目标商品时,若确定的待匹配商品与用户的点击序列对应的商品属于同一个售卖平台,可以基于各个商品对直接获取到与该待匹配商品关联的目标商品对,从而基于目标商品对获取到与点击序列对应的商品属于不同售卖平台的商品,得到与点击序列对应的商品属于不同售卖平台的目标商品,以便根据用户的点击序列和目标商品构建训练样本。
在一些实施例中,可以根据以下步骤构建商品对:
B1、根据上述第一售卖平台的各个第一商品以及上述第二售卖平台的各个第二商品确定多个关键词。
B2、对每一个上述关键词,将同一个上述关键词对应的上述第一商品标识和上述第二商品标识进行两两组合,得到多个上述商品对。
B3、对每一个上述商品对,确定上述商品对对应的上述第一商品和上述第二商品之间的相似程度,并将上述商品对和上述相似程度关联存储。
对应地,上述步骤A2在从预先构建的各个商品对中确定目标商品对时,包括:
A21、确定上述第一商品标识或上述第二商品标识与上述待匹配商品的商品标识相同的上述商品对,得到候选商品对。
A22、将各个上述候选商品对中上述相似程度最大的上述候选商品对确定为上述目标商品对。
具体地,为了提高商品推荐的准确性,在构建商品对时,可以先根据第一售卖平台的各个第一商品和第二售卖平台的各个第二商品,确定多个关键词。可选地,在基于各个商品(即各个第一商品和各个第二商品)确定关键词时,可以通过实体识别或关键词提取算法等方式对商品的商品信息(如商品标题)进行处理,得到关键词。
例如,获取第一售卖平台的各个商品的商品标题,以及第二售卖平台的各个商品的商品标题,然后对获取到的各个商品标题进行实体识别,即识别各个商品标题中具有特定意义的实体(如有线耳机、短袖等),得到各个商品对应的关键词。考虑到各个商品对应的关键词中可能存在重合的关键词,因此,在得到第一售卖平台和第二售卖平台的商品对应的多个关键词之后,可以对得到的关键词进行去重处理,去除重复的关键词,减少后续处理过程中的数据量。
在基于售卖平台的商品提取得到关键词之后,可以对每一个关键词,获取该关键词对应的第一商品和第二商品,然后将第一商品和第二商品进行组合,即,将第一商品标识和第二商品标识进行两两组合,得到该关键词对应的多个商品对。可以理解的是,基于商品确定的关键词能够反映商品的某个特征(如类型、品牌等),即,同一个关键词对应的第一商品和第二商品是具有相同的某一个特征的商品,得到的商品对对应的商品包含不同售卖平台的商品,且其商品具有关联性。
例如,假设关键词A对应的第一商品标识(即属于第一售卖平台的第一商品的商品标识)包括:[B1,B2,B3],对应的第二商品标识(即属于第二售卖平台的商品的商品标识)包括:[C1,C2],则将第一商品标识和第二商品标识进行两两组合,得到的商品对包括:[B1,C1]、[B1,C2]、[B2,C1]、[B2,C2]、[B3,C1]、[B3,C2]。
可选地,由于商品标题通常包含商品的名称、品牌、型号和类型等多种特征,反映商品的多种不同的特征,且实际应用中,商品的商品标题通常较为复杂,还包含较多的无关信息,因此,为了减少无关信息的干扰,同时提高商品的覆盖率,可以基于商品的商品标题进行处理,得到能够反映商品的不同特征的多个关键词,从而能够基于商品的每一个特征维度(如类型、品牌等),分别基于在单个特征维度上相关的商品构建商品对。
例如,假设第一售卖平台的商品A的商品标题A1为:“向日葵儿童宝宝洁净洗衣液酵素正品持久留香家庭/婴儿/孕妇适用”,直接基于该商品A的商品标题构建商品对时,需获取商品标题与商品标题A1相近的商品与该商品A进行两两组合,而该商品标题A1同时包含商品A的多个特征,通常较难获取到商品标题与商品标题A1相近的其它售卖平台的商品,不能构建得到足够的商品对,且构建得到的商品对覆盖的商品较少。因此,可以基于商品标题提取得到多个关键词。
例如,基于该商品标题A可以得到以下的关键词:向日葵、儿童、去污、洗衣液、酵素、婴儿和孕妇,在基于关键词构建商品对时,会将商品A与同样包含关键词“向日葵”的第二售卖平台的各个商品进行两两组合,同时,对于其它关键词如“洗衣液”,会将商品A与包含关键词“洗衣液”的第二售卖平台的各个商品进行两两组合,得到多个商品对,构建得到的商品对的商品覆盖率高,从而保障在基于待匹配商品从各个商品对中确定出目标商品对,进而能够基于待匹配商品和目标商品对确定目标商品,即得到用户对应的目标商品。
在得到各个商品对之后,还可以对每一个商品对,确定商品对对应的第一商品(即第一商品标识对应的商品)和第二商品(即第二商品标识对应的商品)之间的相似程度,再将商品对与其相似程度进行关联存储。其中,该相似程度即第一商品和第二商品之间的关联程度,以便需要时可以直接查询到商品对对应的相似程度,不需要重复计算,减少计算量,节省所需时间。可选地,在计算商品对对应的第一商品和第二商品之间的相似程度时,可以基于如距离算法等相似度算法计算得到第一商品和第二商品之间的相似程度,也可以基于预设的计算规则计算得到第一商品和第二商品之间的相似程度。
例如,可以分别对第一商品的商品信息(第一商品信息)和第二商品的商品信息(第二商品信息)进行特征提取,得到第一商品信息对应的特征向量和第二商品信息对应的特征向量,然后计算两个特征向量之间的余弦夹角值,将该余弦夹角值作为商品对的第一分数。
对应地,在基于待匹配商品确定目标商品对,以确定目标商品时,可以先确定出第一商品标识或第二商品标识与待匹配商品的商品标识相同的商品对,得到候选商品对,即将第一商品或第二商品与待匹配商品相同的商品对作为候选商品对,再获取各个候选商品对对应的相似程度,将相似程度最大的候选商品对作为目标商品对,即,将各个候选商品对中第一商品和第二商品的相似程度最大的商品对作为目标商品对,能够基于目标商品对得到与待匹配商品关联程度最高且属于不同售卖平台的商品作为目标商品,提高得到的目标商品的准确性。
本申请实施例中,基于对应同一个关键词的不同售卖平台的商品,构建商品对,使得获取到的商品对对应的商品包含不同售卖平台的商品,且其商品具有关联性。同时,在构建商品对的过程中,先基于各个售卖平台的商品提取关键词,再将同一个关键词对应的第一商品标识和第二商品标识进行两两组合,即,将两个售卖平台中,对应同一个关键词的商品进行两两组合,从而提高构建得到的商品对的商品覆盖率。
在一些实施例中,为了在实现跨售卖平台的商品推荐的同时,实现用户的兴趣拓展,在构建商品对时,商品对中至少包含一个线下售卖平台(如专卖店、专柜等)的商品的商品标识,使得在基于线上售卖平台的用户的点击序列推荐商品时,可以召回线下售卖平台的商品,向用户推荐线下售卖平台的商品,实现用户的兴趣拓展。例如,预先构建的各个商品对中,一个商品对包含一个第一商品标识和第二商品标识,该第二商品标识为线下售卖平台的商品的商品标识,即,第二售卖平台为线下售卖平台。
在一些实施例中,上述步骤B3包括:
B31、对每一个上述商品对,根据上述第一商品的商品信息和上述第二商品的上述商品信息确定第一分数,上述第一分数用于指示上述第一商品和上述第二商品之间的上述相似程度。
B32、将每一个上述商品对和对应的上述第一分数关联存储。
具体地,为了较为准确地反映商品对对应的第一商品和第二商品之间的相似程度,在确定每一个商品对对应的相似程度时,可以获取商品对对应的第一商品的商品信息(第一商品信息)和第二商品的商品信息(第二商品信息),通过预设的计算规则计算得到量化的第一分数,通过量化的第一分数较为清楚地指示第一商品和第二商品之间的相似程度,再将每一个商品对与其对应的第一分数进行关联存储,以便后续能够直接查询得到商品对对应的第一分数,不需要再次进行计算。例如,可以将商品对转换为:[ID1,ID2,similarity]的形式进行存储,ID1为第一商品标识,ID2为第二商品标识,similarity为该商品对的第一分数。
在一些实施例中,可以分别计算第一商品信息中的每一个信息与第二商品信息中对应的信息之间的相似程度,得到对应的第三分数,然后根据各个第三分数的平均值或中位数等确定商品对的第一分数,进一步提高商品对的第一分数的准确性。
在一些实施例中,上述商品信息可以包含商品的类目(即类型,如饮料、酒水等)、品牌、价格和热度等信息中的一个或多个。在计算第一商品信息中的每一个信息与第二商品信息中对应的信息之间的相似程度时,得到对应的第三分数时,由于不同的信息的衡量标准通常存在差异,因此,为了提高计算得到的第三分数的准确性,对于不同的信息,可以采用对应的计算规则计算其第三分数。
例如,对于商品信息中的类目信息,假设将商品的类目分为四个等级,其中,一级类目为商品的总体分类,二级类目为一级类目的子类目,是一级类目的具体分类,以此类推,四级类目为最细的分类,可以基于类目等级确定商品信息中的类目信息对应的第三分数,如,若第一商品的类目和第二商品的类目属于同一个四级类目,则其第三分数计为1,若属于同一个三级类目,则其第三分数为0.75,若属于同一个二级类目,则其第三分数计为0.5,若属于同一个一级类目,则其第三分数计为0.25,若第一商品的一级类目和第二商品的一级类目不同,则其第三分数计为0。
又如,对于商品信息中的品牌信息,若第一商品的品牌和第二商品的品牌相同,则其第三分数为1,否则,其第三分数计为0。
对于商品信息中的价格信息,可以根据预设的价位差公式计算其第三分数。例如,上述价位差公式可以是如下的形式:
其中,score1为价格信息的第三分数,price1为第一商品的价格,price2为第二商品的价格,Abs()为绝对值函数,是指取第一商品的价格和第二商品的价格的差的绝对值,Max()为求最大值函数,/>是指取第一商品的价格和第二商品的价格中的较大值。
对于商品信息中的热度信息,可以根据预设的热度差公式计算其第三分数。例如,上述热度差可以是如下的形式:
其中,score2为热度信息的第三分数,price1为第一商品的热度,price2为第二商品的热度,Abs()为绝对值函数,是指取第一商品的价格和第二商品的价格的差的绝对值,Max()为求最大值函数,/>是指取第一商品的价格和第二商品的价格中的较大值。
本申请实施例中,根据商品对对应的第一商品的商品信息和第二商品的商品信息计算得到量化的第一分数,通过该量化的第一分数更加清楚地反映第一商品和第二商品的相似程度。
在一些实施例中,上述步骤B31包括:
根据上述第一商品的上述商品信息、上述第二商品的上述商品信息以及上述商品信息中的各个信息对应的权重确定上述第一分数。
具体地,由于商品信息中不同的信息所反映的是商品不同的特征,而不同特征的重要性也存在一定的差异,因此,为了进一步提高得到的第一分数的准确性,在根据第一商品的商品信息和第二商品的商品信息计算商品对的第一分数时,对于商品信息中不同的信息,可以分别先计算各个信息对应的相似程度,得到第三分数,然后结合各个信息对应的第三分数和权重确定商品对的第一分数。
例如,假设以商品信息的各个信息对应的第三分数的总和作为商品对的第一分数,并假设获取到商品对M的第一商品A的商品信息A1,和第二商品B的商品信息B1,商品信息A1和商品信息B1中均包含类目信息x1(对应权重z1)、品牌信息x2(对应权重z2)和价格信息x3(对应权重z3),则分别计算类目信息x1、品牌信息x2和价格信息x3的相似程度,得到其对应的第三分数:y1、y2和y3,则根据各个第三分数及对应的权重,得到商品对M的第一分数:。
本申请实施例中,结合商品信息中各个信息对应的权重和各个信息对应的第三分数计算商品对的第一分数,充分考虑反映商品的不同信息所反映的特征的重要性的差异,以提高得到的第一分数的合理性和准确性。
在一些实施例中,上述训练样本还包括用户的用户标识,上述商品推荐模型为包括用户塔、商品塔和互操作层的双塔模型,上述步骤S103包括:
C1、将上述用户标识和上述点击序列作为上述用户塔的输入,得到上述用户塔输出的用户特征向量,以及,将上述目标商品的商品标识作为上述商品塔的输入,得到上述商品塔输出的商品特征向量。
C2、将上述用户特征向量和上述商品特征向量作为上述互操作层的输入,得到上述互操作层输出的第二分数,上述互操作层用于计算上述用户特征向量与上述商品特征向量之间的相似程度,得到上述第二分数。
C3、基于上述第二分数对上述双塔模型的模型参数进行调整,直至上述双塔模型满足上述要求,得到训练后的上述双塔模型。
上述双塔模型是指将模型分成用户侧模型(即用户塔)和物品侧模型(即商品塔)两部分,然后通过互操作层将用户侧和物品侧两部分联合起来,生成最后的预测得分的模型。其中,由于双塔模型中的用户塔和商品塔可以将提取到的用户特征向量和商品特征向量缓存到其对应的内存数据库中,在进行商品的推荐时,可以直接获取相应的用户特征向量和商品特征向量计算其相似程度,因此,本申请实施例中,构建双塔模型作为商品推荐模型,在双塔模型训练完成后,可以预先采用训练后的双塔模型中的商品塔提取商品的商品特征向量并进行缓存,在向用户推荐商品时,仅需要输入用户的用户标识、点击序列提取得到用户特征向量,从而提高商品推荐效率。
本申请实施例中,为了进一步提高训练得到的商品推荐模型推荐商品的准确性,在构建训练样本时,将用户的用户标识也加入训练样本中,得到包含用户的用户标识、点击序列和目标商品的商品标识的训练样本,通过用户标识的增加来增强训练样本所表达的用户特征,使得基于该训练样本训练得到的商品推荐模型在向用户推荐商品时,召回的商品与用户的偏好更加贴近。
具体地,在基于构建的各个训练样本对双塔模型进行训练时,可以将训练样本反映用户的特征的用户标识和点击序列作为用户塔的输入,通过用户塔提取用户相关的特征信息,得到用户特征向量,对应地,将训练样本中反映商品特征的目标商品的商品标识作为商品塔的输入,通过商品塔提取目标商品相关的特征信息,得到商品特征向量。
在得到用户特征向量和商品特征向量之后,将其作为互操作层的输入,互操作层计算该用户特征向量和商品特征向量之间的相似程度,得到商品对对应的第二分数,该第二分数即反映用户与该目标商品的匹配程度。
在得到互操作层输出的第二分数之后,可以根据该第二分数与对应的目标得分进行对比,从而基于对比结果进行反向梯度传播,对双塔模型的模型参数进行调整,再基于调整后的双塔模型继续进行训练,直至更新后的双塔模型满足要求(如准确性达0.99),完成双塔模型的训练,得到训练后的双塔模型。
在一些实施例中,上述训练样本中还可以包括用户的用户信息,该用户信息可以包括用户的性别、年龄、兴趣爱好和购买水平等信息中的一个或多个信息,以进一步增强训练样本中用户的用户特征。上述训练样本还可以包括目标商品的商品信息,该商品信息包括类目、品牌和价格等信息中的一个或多个信息,以增强目标商品的商品特征,从而提高训练得到的商品推荐模型召回的商品的准确性。
本申请实施例中,在训练样本中加入用户标识,以增强用户特征,使得基于该训练样本训练得到的商品推荐模型在向用户推荐商品时,召回的商品与用户的偏好更加贴近。同时,采用双塔模型作为商品推荐模型,使得在模型训练过程中,能够基于用户塔和商品塔分别学习用户的特征和商品的特征,提高提取到的用户特征向量和商品特征向量的准确性,且模型训练完成后,训练后的双塔模型中,用户塔和商品塔能够预先将提取得到用户特征向量和商品特征向量存储到对应的内存数据库中,在进行用户的商品推荐时,能够直接获取对应的用户特征向量与各个商品特征向量直接进行相似程度的计算,以确定推荐商品,从而提高商品推荐模型进行商品推荐的效率,且易于部署,有利于实际应用。
对应于上文实施例上述的商品推荐模型训练方法,图2示出了本申请实施例提供的一种商品推荐方法的流程示意图,详述如下:
步骤S201,获取待推荐用户的点击序列。
步骤S202,将上述点击序列作为商品推荐模型的输入,得到上述商品推荐模型输出的推荐商品的商品标识,其中,上述商品推荐模型根据上述的商品推荐模型训练方法训练得到。
其中,上述待推荐用户为线上售卖平台的用户,进一步地,待推荐用户可以是已登录售卖平台的用户,服务器在检测到用户登录售卖平台后,可以将该用户作为待推荐用户,获取该待推荐用户的点击序列进行商品推荐。
其中,在根据待推荐用户的点击序列进行商品推荐时,服务器将该点击序列作为训练后的商品推荐模型的输入,得到该商品推荐模型输出的推荐商品的商品标识,再根据该商品标识获取到推荐商品的商品信息(如商品标题和商品图像,第二商品信息),然后在该售卖平台上展示该推荐商品的商品信息,实现跨售卖平台的商品推荐。
可选地,在获取待推荐用户的点击序列时,可以根据获取被点击时间在待推荐用户此次登录时间之后的商品确定该待推荐用户的点击序列,也可以根据被点击时间在待推荐用户登录当天的商品确定点击序列,即,根据近期被待推荐用户点击的商品确定点击序列,以保障该点击序列的实时性,从而保障推荐商品的实时性,为待推荐用户实时推荐个性化的跨售卖平台的商品。可选地,若没有获取到待推荐用户的点击序列,则可以预设的兜底商品作为推荐商品,向用户展示该兜底商品。
本申请实施例中,获取待推荐用户的点击序列作为商品推荐模型的输入,而该商品推荐模型根据上述的商品推荐模型训练方法训练得到,具有召回跨售卖平台的商品的能力,因此,能够基于待推荐用户的点击序列为该待推荐用户推荐个性化的跨售卖平台的商品,提高用户体验。
在一些实施例中,上述商品推荐模型为包括用户塔、商品塔和互操作层的双塔模型,上述用户塔用于对用户标识和上述点击序列进行特征提取,得到用户特征向量,上述商品塔用于缓存预先对各个商品的商品标识进行特征提取得到的商品特征向量,上述互操作层用于计算上述用户特征向量和各个上述商品特征向量之间的相似程度,得到商品对应的第二分数,并根据各个上述第二分数确定上述推荐商品的商品标识。
上述步骤S202包括:
将上述待推荐用户的上述用户标识和上述点击序列输入上述用户塔,得到上述用户塔输出的上述用户特征向量。
将上述用户特征向量和上述商品塔缓存的各个上述商品特征向量作为上述互操作层的输入,得到上述互操作层输出的上述推荐商品的商品标识。
具体地,在实际应用中,可以预先将各个售卖平台的商品的商品标识作为商品推荐模型中的商品塔的输入,通过该商品塔对商品标识进行特征提取,得到对应的商品特征向量,并存储到内存数据库中。可选地,也可以将各个售卖平台的商品的商品标识和商品信息作为商品推荐模型中的商品塔的输入,通过该商品塔对商品标识和商品信息进行特征提取,得到反映更多特征的商品特征向量,从而提高商品推荐模型召回的推荐商品的准确性。
在确定待推荐用户的推荐商品时,将用户标识和点击序列输入用户塔中,通过用户塔对其进行特征提取,得到用户特征向量,然后将该用户特征向量作为互操作层的输入,互操作层计算该用户特征向量与内存数据库中缓存的各个商品特征向量之间的相似程度,得到各个商品对应的第二分数,再根据各个第二分数确定推荐商品的商品标识,最后输出该推荐商品的商品标识,实现商品的推荐。
在一些实施例中,还可以获取待推荐用户的用户信息,将用户标识、用户信息和点击序列输入作为用户塔的输入,使得提取到的用户特征向量能够反映更多的用户的特征信息,进而,使得确定的推荐商品与待推荐用户的偏好更加贴近,提高用户体验。
可选地,互操作层在根据各个第二分数确定推荐商品的商品标识时,可以将第二分数最大的商品标识确定为推荐商品的商品标识,即,将第二分数最大的商品确定为推荐商品。在一些实施例中,也可以对各个第二分数进行排序,将第二分数较大的前N个商品标识确定为推荐商品的商品标识,即,确定多个推荐商品。
本申请实施例中,将用户标识和点击序列作为用户塔的输入,以增强用户特征,使得基于提取得到的用户特征向量确定的推荐商品与用户的偏好更加贴近。同时,采用双塔模型作为商品推荐模型,商品塔能够预先将提取到的商品的商品特征向量存储到内存数据库中,在进行待推荐用户的商品推荐时,能够基于提取到的用户特征向量与内存数据库中的各个商品特征向量直接进行相似程度的计算,以确定推荐商品,从而提高商品推荐模型进行商品推荐的效率,且易于部署,有利于实际应用。
需要指出的是,上述第一分数反映的是构建的商品对中第一商品和第二商品之间的相似程度,上述第三分数反映的是构建的商品对中对应的第一商品信息中单个信息与第二商品信息中对应的信息之间的相似程度,第一分数可以根据第一商品信息中各个信息对应的第三分数确定。上述第二分数反映的是用户塔输出的用户特征向量与商品塔存储的商品的特征向量之间的相似程度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
实施例二:
对应于上文实施例所述的方法,图3示出了本申请实施例提供的商品推荐模型训练装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图3,该装置包括:目标商品获取模块31、样本构建模块32和训练模块33。其中,
目标商品获取模块31,用于根据用户的点击序列确定上述用户对应的目标商品,上述点击序列包括被上述用户点击的商品的商品标识,上述目标商品与上述点击序列对应的上述商品属于不同售卖平台的商品。
样本构建模块32,用于构建训练样本,一个上述训练样本包括一个用户对应的上述点击序列和上述目标商品的商品标识。
训练模块33,用于基于各个上述训练样本对预构建的商品推荐模型进行训练,直至上述商品推荐模型满足要求,得到训练后的上述商品推荐模型。
本申请实施例中,根据用户的点击序列和对应的目标商品构建训练样本,一个训练样本中包含一个用户的点击序列和目标商品的商品标识,而目标商品是与点击序列对应的商品,即被用户点击过的商品属于不同售卖平台的商品,也即,每一个训练样本中均加入与被用户点击过的商品属于不同售卖平台的目标商品,从而使得基于这些训练样本训练得到的商品推荐模型具有召回与用户的点击序列属于不同售卖平台的商品的能力,较好地实现商品的跨售卖平台推荐。
在一些实施例中,上述目标商品获取模块31包括:
待匹配商品获取单元,用于确定待匹配商品;
目标商品对获取单元,用于在上述待匹配商品与上述点击序列对应的上述商品属于同一上述售卖平台的情况下,从预先构建的各个商品对中确定目标商品对,其中,一个上述商品对包含一个第一商品标识和一个第二商品标识,上述第一商品标识为第一售卖平台对应的第一商品的商品标识,上述第二商品标识为第二售卖平台对应的第二商品的商品标识,上述目标商品对为上述第一商品标识或上述第二商品标识与上述待匹配商品的商品标识相同的上述商品对。
目标商品获取单元,用于根据上述目标商品对确定上述目标商品,其中,当上述第一商品标识与上述待匹配商品的商品标识相同时,上述目标商品为上述第二商品标识对应的商品,当上述第二商品标识与上述待匹配商品的商品标识相同时,上述目标商品为上述第一商品标识对应的商品。
在一些实施例中,上述商品推荐模型训练装置还包括:
关键词获取模块,用于根据上述第一售卖平台的各个第一商品以及上述第二售卖平台的各个第二商品确定多个关键词。
商品对构建模块,用于对每一个上述关键词,将同一个上述关键词对应的上述第一商品标识和上述第二商品标识进行两两组合,得到多个上述商品对。
相似程度计算模块,用于对每一个上述商品对,确定上述商品对对应的上述第一商品和上述第二商品之间的相似程度,并将上述商品对和上述相似程度关联存储。
对应地,上述目标商品获取模块31还包括:
候选商品对获取单元,用于确定上述第一商品标识或上述第二商品标识与上述待匹配商品的商品标识相同的上述商品对,得到候选商品对。
目标商品对确定单元,用于将各个上述候选商品对中上述相似程度最大的上述候选商品对确定为上述目标商品对。
在一些实施例中,上述商品信息包括商品的类目、品牌、价格以及热度中的一个或多个信息,上述商品推荐模型训练装置还包括:
第一分数计算模块,用于根据上述第一商品的上述商品信息、上述第二商品的上述商品信息以及上述商品信息中的各个信息对应的权重确定上述第一分数。
在一些实施例中,上述训练样本还包括上述用户的用户标识,上述商品推荐模型为包括用户塔、商品塔和互操作层的双塔模型,上述训练模块33包括:
将上述用户标识和上述点击序列作为上述用户塔的输入,得到上述用户塔输出的用户特征向量,以及,将上述目标商品的商品标识作为上述商品塔的输入,得到上述商品塔输出的商品特征向量;
将上述用户特征向量和上述商品特征向量作为上述互操作层的输入,得到上述互操作层输出的第二分数,上述互操作层用于计算上述用户特征向量与上述商品特征向量之间的相似程度,得到上述第二分数;
基于上述第二分数对上述双塔模型的模型参数进行调整,直至上述双塔模型满足上述要求,得到训练后的上述双塔模型。
对应于上文实施例上述的方法,图4示出了本申请实施例提供的商品推荐装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图4,该装置包括:点击序列获取模块41和推荐模块42。其中,
点击序列获取模块41,用于获取待推荐用户的点击序列。
推荐模块42,用于将上述点击序列作为商品推荐模型的输入,得到上述商品推荐模型输出的推荐商品的商品标识,其中,上述商品推荐模型根据上文实施例上述的商品推荐模型训练方法训练得到。
本申请实施例中,获取待推荐用户的点击序列作为商品推荐模型的输入,而该商品推荐模型根据上述的商品推荐模型训练方法训练得到,具有召回跨售卖平台的商品的能力,因此,能够基于待推荐用户的点击序列为该待推荐用户推荐个性化的跨售卖平台的商品,提高用户体验。
在一些实施例中,上述商品推荐模型为包括用户塔、商品塔和互操作层的双塔模型,上述用户塔用于对用户标识和上述点击序列进行特征提取,得到用户特征向量,上述商品塔用于缓存预先对各个商品的商品标识进行特征提取得到的商品特征向量,上述互操作层用于计算上述用户特征向量和各个上述商品特征向量之间的相似程度,得到商品对应的第二分数,并根据各个上述第二分数确定上述推荐商品的商品标识。上述商品推荐装置还包括:
用户特征向量获取模块,用于将上述待推荐用户的上述用户标识和上述点击序列输入上述用户塔,得到上述用户塔输出的上述用户特征向量。
推荐商品获取模块,用于将上述用户特征向量和上述商品塔缓存的各个上述商品特征向量作为上述互操作层的输入,得到上述互操作层输出的上述推荐商品的商品标识。
需要说明的是,所述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
实施例三:
图5为本申请一实施例提供的终端设备的结构示意图。如图5所示,该实施例的终端设备5包括:至少一个处理器50(图5中仅示出一个处理器)、存储器51以及存储在所述存储器51中并可在所述至少一个处理器50上运行的计算机程序52,所述处理器50执行所述计算机程序52时实现所述任意各个方法实施例中的步骤。
所述终端设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端设备5的举例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),该处理器50还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51在一些实施例中可以是所述终端设备5的内部存储单元,例如终端设备5的硬盘或内存。所述存储器51在另一些实施例中也可以是所述终端设备5的外部存储设备,例如所述终端设备5上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以所述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将所述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。所述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种网络设备,该网络设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述任意各个方法实施例中的步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现所述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现所述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现所述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现所述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在所述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (9)
1.一种商品推荐模型训练方法,其特征在于,包括:
根据用户的点击序列确定所述用户对应的目标商品,所述点击序列包括被所述用户点击的商品的商品标识,所述目标商品与所述点击序列对应的所述商品属于不同售卖平台的商品;
构建训练样本,一个所述训练样本包括一个用户对应的所述点击序列和所述目标商品的商品标识;
基于各个所述训练样本对预构建的商品推荐模型进行训练,直至所述商品推荐模型满足要求,得到训练后的所述商品推荐模型;
其中,所述根据用户的点击序列确定所述用户对应的目标商品包括:
确定待匹配商品;
在所述待匹配商品与所述点击序列对应的所述商品属于同一所述售卖平台的情况下,从预先构建的各个商品对中确定目标商品对,其中,一个所述商品对包含一个第一商品标识和一个第二商品标识,所述第一商品标识为第一售卖平台对应的第一商品的商品标识,所述第二商品标识为第二售卖平台对应的第二商品的商品标识,所述目标商品对为所述第一商品标识或所述第二商品标识与所述待匹配商品的商品标识相同的所述商品对;
根据所述目标商品对确定所述目标商品,其中,当所述第一商品标识与所述待匹配商品的商品标识相同时,所述目标商品为所述第二商品标识对应的商品,当所述第二商品标识与所述待匹配商品的商品标识相同时,所述目标商品为所述第一商品标识对应的商品。
2.如权利要求1所述的商品推荐模型训练方法,其特征在于,所述商品对根据如下步骤构建:
根据所述第一售卖平台的各个第一商品以及所述第二售卖平台的各个第二商品确定多个关键词;
对每一个所述关键词,将同一个所述关键词对应的所述第一商品标识和所述第二商品标识进行两两组合,得到多个所述商品对;
对每一个所述商品对,确定所述商品对对应的所述第一商品和所述第二商品之间的相似程度,并将所述商品对和所述相似程度关联存储;
对应地,所述从预先构建的各个商品对中确定目标商品对,包括:
确定所述第一商品标识或所述第二商品标识与所述待匹配商品的商品标识相同的所述商品对,得到候选商品对;
将各个所述候选商品对中所述相似程度最大的所述候选商品对确定为所述目标商品对。
3.如权利要求2所述的商品推荐模型训练方法,其特征在于,所述对每一个所述商品对,确定所述商品对对应的所述第一商品和所述第二商品之间的相似程度,并将所述商品对和所述相似程度关联存储,包括:
对每一个所述商品对,根据所述第一商品的商品信息和所述第二商品的所述商品信息确定第一分数,所述第一分数用于指示所述第一商品和所述第二商品之间的所述相似程度;
将每一个所述商品对和对应的所述第一分数关联存储。
4.如权利要求3所述的商品推荐模型训练方法,其特征在于,所述商品信息包括商品的类目、品牌、价格以及热度中的一个或多个信息,所述根据所述第一商品的商品信息和所述第二商品的所述商品信息确定第一分数,包括:
根据所述第一商品的所述商品信息、所述第二商品的所述商品信息以及所述商品信息中的各个信息对应的权重确定所述第一分数。
5.如权利要求1至4任一项所述的商品推荐模型训练方法,其特征在于,所述训练样本还包括所述用户的用户标识,所述商品推荐模型为包括用户塔、商品塔和互操作层的双塔模型,所述基于所述训练样本对预构建的商品推荐模型进行训练,直至所述商品推荐模型满足要求,得到训练后的所述商品推荐模型,包括:
将所述用户标识和所述点击序列作为所述用户塔的输入,得到所述用户塔输出的用户特征向量,以及,将所述目标商品的商品标识作为所述商品塔的输入,得到所述商品塔输出的商品特征向量;
将所述用户特征向量和所述商品特征向量作为所述互操作层的输入,得到所述互操作层输出的第二分数,所述互操作层用于计算所述用户特征向量与所述商品特征向量之间的相似程度,得到所述第二分数;
基于所述第二分数对所述双塔模型的模型参数进行调整,直至所述双塔模型满足所述要求,得到训练后的所述双塔模型。
6.一种商品推荐方法,其特征在于,包括:
获取待推荐用户的点击序列;
将所述点击序列作为商品推荐模型的输入,得到所述商品推荐模型输出的推荐商品的商品标识,其中,所述商品推荐模型根据如权利要求1至5任一项所述的商品推荐模型训练方法训练得到。
7.如权利要求6所述的商品推荐方法,其特征在于,所述商品推荐模型为包括用户塔、商品塔和互操作层的双塔模型,所述用户塔用于对用户标识和所述点击序列进行特征提取,得到用户特征向量,所述商品塔用于缓存预先对各个商品的商品标识进行特征提取得到的商品特征向量,所述互操作层用于计算所述用户特征向量和各个所述商品特征向量之间的相似程度,得到商品对应的第二分数,并根据各个所述第二分数确定所述推荐商品的商品标识;
所述将所述待推荐用户的所述点击序列作为所述商品推荐模型的输入,得到所述商品推荐模型输出的推荐商品,包括:
将所述待推荐用户的所述用户标识和所述点击序列输入所述用户塔,得到所述用户塔输出的所述用户特征向量;
将所述用户特征向量和所述商品塔缓存的各个所述商品特征向量作为所述互操作层的输入,得到所述互操作层输出的所述推荐商品的商品标识。
8.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5或如权利要求6至7任一项所述的方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5或如权利要求6至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311444961.7A CN117172887B (zh) | 2023-11-02 | 2023-11-02 | 商品推荐模型训练方法及商品推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311444961.7A CN117172887B (zh) | 2023-11-02 | 2023-11-02 | 商品推荐模型训练方法及商品推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117172887A CN117172887A (zh) | 2023-12-05 |
CN117172887B true CN117172887B (zh) | 2024-02-27 |
Family
ID=88947198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311444961.7A Active CN117172887B (zh) | 2023-11-02 | 2023-11-02 | 商品推荐模型训练方法及商品推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117172887B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117974276A (zh) * | 2024-04-02 | 2024-05-03 | 深圳市灵智数字科技有限公司 | 商品推荐模型训练方法、商品推荐方法及电子设备 |
CN117994008A (zh) * | 2024-04-03 | 2024-05-07 | 深圳市灵智数字科技有限公司 | 活动商品推荐方法、装置、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012103909A (ja) * | 2010-11-10 | 2012-05-31 | Yahoo Japan Corp | 推薦情報送信装置 |
CN107464162A (zh) * | 2017-07-28 | 2017-12-12 | 腾讯科技(深圳)有限公司 | 商品关联方法、装置及计算机可读存储介质 |
CN111931062A (zh) * | 2020-08-28 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 一种信息推荐模型的训练方法和相关装置 |
CN112906396A (zh) * | 2021-04-01 | 2021-06-04 | 翻车信息科技(杭州)有限公司 | 一种基于自然语言处理的跨平台商品匹配方法及系统 |
CN113450172A (zh) * | 2020-03-27 | 2021-09-28 | 北京沃东天骏信息技术有限公司 | 一种商品推荐方法和装置 |
CN115018586A (zh) * | 2022-06-20 | 2022-09-06 | 上海禹璨信息技术有限公司 | 跨平台商品推送方法、装置、设备及存储介质 |
CN115311042A (zh) * | 2022-07-18 | 2022-11-08 | 创优数字科技(广东)有限公司 | 商品推荐方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4181026A4 (en) * | 2020-07-24 | 2023-08-02 | Huawei Technologies Co., Ltd. | RECOMMENDATION MODEL FORMING METHOD AND APPARATUS, RECOMMENDATION METHOD AND APPARATUS, AND COMPUTER READABLE MEDIUM |
-
2023
- 2023-11-02 CN CN202311444961.7A patent/CN117172887B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012103909A (ja) * | 2010-11-10 | 2012-05-31 | Yahoo Japan Corp | 推薦情報送信装置 |
CN107464162A (zh) * | 2017-07-28 | 2017-12-12 | 腾讯科技(深圳)有限公司 | 商品关联方法、装置及计算机可读存储介质 |
CN113450172A (zh) * | 2020-03-27 | 2021-09-28 | 北京沃东天骏信息技术有限公司 | 一种商品推荐方法和装置 |
CN111931062A (zh) * | 2020-08-28 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 一种信息推荐模型的训练方法和相关装置 |
CN112906396A (zh) * | 2021-04-01 | 2021-06-04 | 翻车信息科技(杭州)有限公司 | 一种基于自然语言处理的跨平台商品匹配方法及系统 |
CN115018586A (zh) * | 2022-06-20 | 2022-09-06 | 上海禹璨信息技术有限公司 | 跨平台商品推送方法、装置、设备及存储介质 |
CN115311042A (zh) * | 2022-07-18 | 2022-11-08 | 创优数字科技(广东)有限公司 | 商品推荐方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117172887A (zh) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117172887B (zh) | 商品推荐模型训练方法及商品推荐方法 | |
CN108876526B (zh) | 商品推荐方法、装置和计算机可读存储介质 | |
CN101960479A (zh) | 利用拥护者推介的社交网络促销的方法和设备 | |
CN103092877A (zh) | 一种关键词推荐方法和装置 | |
CN111260449B (zh) | 一种模型训练的方法、商品推荐的方法、装置及存储介质 | |
US11200593B2 (en) | Predictive recommendation system using tiered feature data | |
CN113516496B (zh) | 广告转化率预估模型构建方法、装置、设备及其介质 | |
CN111080409A (zh) | 一种推送信息的计算机装置、方法、设备及介质 | |
CN110134783A (zh) | 个性化推荐的方法、装置、设备和介质 | |
CN109299426A (zh) | 一种精确头条信息的推荐方法及装置 | |
CN108876517B (zh) | 基于人工智能的用户喜好分析方法及系统 | |
CN108305181A (zh) | 社交影响力确定、信息投放方法及装置、设备及存储介质 | |
CN115860870A (zh) | 一种商品推荐方法、系统、装置及可读介质 | |
CN111429214A (zh) | 一种基于交易数据的买卖双方匹配方法及装置 | |
KR20210058525A (ko) | 상품 또는 서비스에 대한 비정형의 품목데이터를 자동으로 분류하는 방법 및 디바이스 | |
CN117273865A (zh) | 商品推荐方法、装置、电子设备及存储介质 | |
CN112036987B (zh) | 确定推荐商品的方法和装置 | |
CN111787042B (zh) | 用于推送信息的方法和装置 | |
CN117611272A (zh) | 商品推荐方法、装置及电子设备 | |
KR100821339B1 (ko) | 쇼핑 상품 검색 서비스에서 상품 정보 제공 방법 및 그시스템 | |
CN110851708A (zh) | 负样本的抽取方法、装置、计算机设备和存储介质 | |
CN110020918A (zh) | 一种推荐信息生成方法和系统 | |
CN112948701B (zh) | 信息推荐装置、方法、设备及存储介质 | |
CN111178974B (zh) | 一种提高多平台融合性的方法和装置 | |
JP2017076376A (ja) | 算出装置、算出方法および算出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |