CN113268656A - 一种用户推荐方法、装置、电子设备及计算机存储介质 - Google Patents

一种用户推荐方法、装置、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN113268656A
CN113268656A CN202110407599.0A CN202110407599A CN113268656A CN 113268656 A CN113268656 A CN 113268656A CN 202110407599 A CN202110407599 A CN 202110407599A CN 113268656 A CN113268656 A CN 113268656A
Authority
CN
China
Prior art keywords
user
commodity
attribute value
store
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110407599.0A
Other languages
English (en)
Inventor
刘珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202110407599.0A priority Critical patent/CN113268656A/zh
Publication of CN113268656A publication Critical patent/CN113268656A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本申请实施例提供了一种用户推荐方法、装置、电子设备及计算机存储介质,该方法包括:确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据;利用预设商品特征模型分别对所述用户商品属性值数据和所述店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息;对所述用户特征信息和所述店铺特征信息进行相似度计算,根据计算结果从所述待推荐用户中确定目标用户集合,并将所述目标用户集合推荐给所述目标店铺。这样,通过预设商品特征模型确定用户特征信息和店铺特征信息,能够准确计算用户行为与店铺商品的相关性,进而确定出向目标店铺推荐的目标用户集合,提高了用户推荐的准确率。

Description

一种用户推荐方法、装置、电子设备及计算机存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种用户推荐方法、装置、电子设备及计算机存储介质。
背景技术
在销售场景中,店铺往往需要通过针对不同的用户群体制定不同的营销策略,从而实现整体的业务增长。因此,对于电商平台来说,向店铺推荐潜在新用户(也称为新客)是帮助店铺实现用户增长的重要一环,尤其对于销量少的冷门店铺。
在相关技术中,可以通过协同过滤算法寻找店铺老用户的相似用户(或者寻找相似店铺的老用户),将寻找到的用户作为潜在新用户;也可以对用户-店铺建立预测模型,从而预测潜在新用户。然而,以上相关技术所提供的技术方案存在计算量大且预测精度过低的问题,实际应用效果无法达到预期。
发明内容
本申请提供了一种用户推荐方法、装置、电子设备及计算机存储介质,通过预设商品特征模型生成店铺特征信息和用户特征信息,能够准确计算用户行为与店铺商品的相关性,从而能够提高预测准确率。
本申请的技术方案是这样实现的:
第一方面,本申请实施例提供了一种用户推荐方法,该方法包括:
确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据;
利用预设商品特征模型分别对用户商品属性值数据和店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息;
对用户特征信息和店铺特征信息进行相似度计算,根据计算结果从待推荐用户中确定目标用户集合,并将目标用户集合推荐给目标店铺。
第二方面,本申请实施例提供了一种用户推荐装置,该用户推荐装置包括确定单元、分析单元和推荐单元;其中,
确定单元,配置为确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据;
分析单元,配置为利用预设商品特征模型分别对用户商品属性值数据和店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息;
推荐单元,配置为对用户特征信息和店铺特征信息进行相似度计算,根据计算结果从待推荐用户中确定目标用户集合,并将目标用户集合推荐给目标店铺。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括存储器和处理器;其中,
存储器,用于存储能够在处理器上运行的计算机程序;
处理器,用于在运行计算机程序时,执行如第一方面方法的步骤。
第四方面,本申请实施例提供了一种计算机存储介质,该计算机存储介质存储有计算机程序,该计算机程序被执行时实现如第一方面方法的步骤。
本申请实施例提供了一种用户推荐方法、装置、电子设备及计算机存储介质,确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据;利用预设商品特征模型分别对用户商品属性值数据和店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息;对用户特征信息和店铺特征信息进行相似度计算,根据计算结果从待推荐用户中确定目标用户集合,并将目标用户集合推荐给目标店铺。这样,通过预设商品特征模型确定用户特征信息和店铺特征信息,能够准确计算用户行为与店铺商品的相关性,以便确定出向目标店铺推荐的潜在新用户;同时本申请的技术方案仅通过更新预设商品特征模型就可以实现对用户特征信息和店铺特征信息的更新,进而能够实时更新向目标店铺推荐的潜在新用户,从而不仅提高了用户推荐的准确率,而且还保证了用户推荐的实时性,进而提高店铺的运营效率。
附图说明
图1为本申请实施例提供的一种用户推荐方法的流程示意图;
图2为本申请实施例提供的另一种用户推荐方法的流程示意图;
图3为本申请实施例提供的一种用户推荐方法的工作过程示意图;
图4为本申请实施例提供的又一种用户推荐方法的流程示意图;
图5为本申请实施例提供的另一种用户推荐方法的工作过程示意图;
图6为本申请实施例提供的又一种用户推荐方法的工作过程示意图;
图7为本申请实施例提供的再一种用户推荐方法的工作过程示意图;
图8为本申请实施例提供的再一种用户推荐方法的工作过程示意图;
图9为本申请实施例提供的再一种用户推荐方法的工作过程示意图;
图10为本申请实施例提供的一种用户推荐装置的组成结构示意图;
图11为本申请实施例提供的另一种用户推荐装置的组成结构示意图;
图12为本申请实施例提供的一种电子设备的硬件结构示意图;
图13为本申请实施例提供的另一种电子设备的组成结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅仅用于解释相关申请,而非对该申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关申请相关的部分。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
需要指出,本申请实施例所涉及的术语“第一\第二\第三”仅是用于区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
对本申请实施例进行进一步详细说明之前,首先针对本申请实施例所涉及的相关技术进行阐述:
在互联网电商领域中,店铺往往需要通过针对不同的用户(或称为客户)群体制定不同的营销策略,从而实现整体的业务增长。因此,向店铺推荐潜在新用户(该过程也称为店铺拉新)是帮助店铺实现用户增长的重要一环。
特别地,针对销量少的冷门店铺,由于与冷门店铺有过交互行为的用户很少,潜在新客的数目较大,而电商平台存在大量这种冷门店铺。这些店铺单单依靠运营者人工寻找目标新客进行营销活动(例如发放广告/优惠券)往往效率过低,所以有必要通过算法来帮助冷门店铺寻找其潜在意向新客,提高店铺商家的运营效率。
在相关技术中,目前可以通过以下几个途径进行店铺拉新:(1)基于协同过滤算法,寻找与目标店铺的老用户相似的用户,将其作为店铺的潜在新用户;(2)基于协同过滤算法,寻找与目标店铺的相似店铺,将相似店铺的老用户作为店铺的潜在新用户;(3)基于用户-店铺的行为特征/用户统计特征/店铺统计特征进行建模,通过模型直接预测可能会购买的潜在新用户。
然而,一方面,对于基于协同过滤寻找店铺老用户的相似用户以及基于协同过滤寻找相似店铺的用户来说,均存在召回用户量级过大且预测精度太低的问题;另一方面,对于直接使用用户-店铺行为样本进行建模来说,如果采用对店铺有交互行为的用户(称为交互用户)作为训练样本,此时由于大量冷门店铺并没有足够的交互用户样本,容易导致模型训练不充分,对于冷门店铺来说无法达到预期效果;如果采用对店铺无行为的用户作为训练样本,由于行为部分特征的缺失/稀疏,会导致用户召回量级过大且预测精度太低的问题。
基于此,本申请实施例提供了一种用户推荐方法,该方法的基本思想为:确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据;利用预设商品特征模型分别对用户商品属性值数据和店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息;对用户特征信息和店铺特征信息进行相似度计算,根据计算结果从待推荐用户中确定目标用户集合,并将目标用户集合推荐给目标店铺。这样,通过预设商品特征模型确定用户特征信息和店铺特征信息,能够准确计算用户行为与店铺商品的相关性,以便确定出向目标店铺推荐的潜在新用户,不存在用户召回量级过大的弊端;同时本申请的技术方案仅通过更新预设商品特征模型就可以实现对用户特征信息和店铺特征信息的更新,进而能够实时更新向目标店铺推荐的潜在新用户,从而不仅提高了用户推荐的准确率,而且还保证了用户推荐的实时性,进而提高店铺的运营效率。
下面将结合附图对本申请各实施例进行详细说明。
在本申请的一实施例中,参见图1,其示出了本申请实施例提供的一种用户推荐方法的流程示意图。如图1所示,该方法可以包括:
S101:确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据。
需要说明的是,本申请实施例提供的用户推荐方法可以应用于电商平台,或者与电商平台相关的设备。这里,设备可以是诸如计算机、智能手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、导航装置等等,本申请实施例对此不作具体限定。
具体地,该用户推荐方法可以适用于向目标店铺推荐用户、向目标用户推荐店铺、向目标用户推荐商品等相关场景。在这里,店铺可以是指具体的电商店铺,也可以是移动应用(Application,App)、媒体频道、实体店铺等。换句话说,基于本申请实施例提供的发明构思,本领域技术人员可将用户推荐方法进行适应性修改后在多种业务场景中进行实施,这些均在本申请实施例的保护范围之内。
为了方便说明,以下均以向目标店铺进行潜在新用户推荐的业务场景为例进行具体说明。
此时,需要根据用户商品属性值数据和店铺商品属性值数据向目标店铺进行用户推荐。在这里,用户商品属性值数据中包含了待推荐用户在最近一段时间内所交互商品(例如浏览的商品、点击的商品等)的属性信息,而店铺商品属性值数据是指目标店铺中售卖商品的属性信息。另外,在店铺拉新的业务场景中,待推荐用户一般是指未与目标店铺有过任何交互行为的若干个用户,也可以是指未在目标店铺中下单的若干个用户,可以根据实际需求进行筛选和确定。为了更加清晰的进行说明,以下待推荐用户也会称为若干个用户。
S102:利用预设商品特征模型分别对用户商品属性值数据和店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息。
需要说明的是,本申请实施例涉及一种预设商品特征模型,且预设商品特征模型用于指示不同商品属性值各自的特征向量。在这里,通过预设商品特征模型对用户商品属性值数据和店铺商品属性值数据进行分析,能够得到用户特征信息和店铺特征信息,进一步可根据用户特征信息和店铺特征信息的相似性,对目标店铺进行潜在新用户推荐。
在一些实施例中,所述利用预设商品特征模型分别对用户商品属性值数据和店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息,可以包括:
基于预设行为类别和预设商品属性类别对用户商品属性值数据进行处理,得到待推荐用户的行为-商品类别属性值数据;
利用预设商品特征模型对待推荐用户的行为-商品类别属性值数据进行特征分析,得到用户特征信息;以及
基于预设商品属性类别对店铺商品属性值数据进行处理,得到目标店铺的商品类别属性值数据;
利用预设商品特征模型对目标店铺的商品类别属性值数据进行特征分析,得到店铺特征信息。
在本申请实施例中,通常情况下,店铺商品属性值数据是指店铺中售卖商品的属性相关信息,而用户商品属性值数据是指不同用户与电商平台进行交互操作所产生的商品交互行为序列。应理解,通过电商平台的历史操作数据,能够方便地获取每个用户的商品交互行为序列,也就构成了用户商品属性值数据。
换句话说,对于店铺来说,店铺商品属性值数据中包括了售卖商品的属性值,然而,对于待推荐用户来说,用户商品属性值数据中包括了待推荐用户在不同交互行为下的商品属性值。
因此,对于店铺来说,由于同一商品针对不同的商品属性类别存在不同的属性值,例如商品属性类别可以是商品品牌、商品品类,还可以是(商品品牌×商品品类),所以需要根据预设商品属性类别对店铺商品属性值数据进行处理,以获得商品类别属性值数据,进而利用预设商品特征模型对其进行分析,以确定店铺特征信息。
对于待推荐用户来说,除了要考虑商品属性类别外,待推荐用户对同一商品的不同交互行为也贡献了不同的信息。因此,需要同时根据预设行为类别和预设商品属性类别对用户商品属性值数据进行处理,得到待推荐用户中的行为-商品类别属性值数据,进而利用预设商品特征模型对其进行分析,以确定用户特征信息。
在这里,该预设行为类别包括下述至少之一:浏览行为、点击行为、加入购物车(或称为加购)行为、搜索行为和购买行为;该预设商品属性类别包括下述至少之一:商品品牌和商品品类。
示例性地,以待计算用户(待计算用户可以理解为待推荐用户中的具体一个用户)为例,具体处理方法如下:
第一,根据电商平台的系统日志,可以获取待计算用户的交互行为记录,也就是用户商品属性值数据。在这里,交互行为记录包括了与待计算用户有过交互行为的商品序列,例如待计算用户点击过的商品序列、待计算用户收藏过的商品序列等等。
第二,根据交互行为的不同,用户对于商品感兴趣的程度也并不相同。因此,按照预设行为类别将用户商品属性值数据进行分类处理,得到待计算用户的行为-商品类别属性值数据,具体可以是浏览-商品属性值集合、收藏-商品属性值集合。
第三,以浏览-商品属性值集合为例,根据商品属性的不同再次进行分类,得到浏览-商品品牌子集、浏览-商品品类子集、浏览-(商品品牌×商品品类)子集。
也就是说,用户商品属性值数据可以看作若干个用户各自的多个行为-商品类别属性值集合,且每个行为-商品类别属性值集合可继续分为多个子集。
进一步地,在一些实施例中,所述利用预设商品特征模型对待推荐用户的行为-商品类别属性值数据进行特征分析,得到用户特征信息,可以包括:
将待推荐用户的行为-商品类别属性值数据输入至预设商品特征模型,得到待推荐用户的行为-特征向量数据;
对待推荐用户的行为-特征向量数据进行均值化处理,得到待推荐用户的行为特征数据;
将待推荐用户的行为特征数据进行拼接处理,得到用户特征信息。
需要说明的是,对于待推荐用户来说,首先,将行为-商品类别属性值数据依次输入至预设商品特征模型,能够相应地获取预设商品特征模型输出的行为-特征向量数据;然后,将行为-特征向量数据进行均值化处理,能够得到行为特征数据;最后,将行为特征数据进行拼接就得到了特征信息,从而得到了用户特征信息。
示例性地,假定行为-商品类别属性值数据包括待计算用户的浏览-商品类别属性值集合,且浏览-商品类别属性值集合包括浏览-商品品牌子集、浏览-商品品类子集、浏览-(商品品牌×商品品类)子集,则处理方法如下:
首先,将浏览-商品品牌子集、浏览-商品品类子集、浏览-(商品品牌×商品品类)子集依次输入到预设商品特征模型中,就得到了浏览-品牌特征向量子集、浏览-品类特征向量子集和浏览-品牌品类特征向量子集(相当于行为-特征向量数据);
其次,以子集为单位,对浏览-品牌特征向量子集、浏览-品类特征向量子集和浏览-品牌品类特征向量子集进行一次均值化处理,可以得到浏览-品牌均值向量、浏览-品类均值向量和浏览-品牌品类均值向量;然后,将浏览-品牌均值向量、浏览-品类均值向量和浏览-品牌品类均值向量进行二次均值化处理,可以得到待计算用户相对于浏览行为的浏览特征向量;
最后,根据以上方法进行类似处理,还能够获得待计算用户的收藏特征向量、购买特征向量等(相当于行为特征数据),将这些向量进行拼接就得到了待计算用户的特征信息。
应理解,预设商品特征模型可以包括多个预设商品子模型,以便灵活处理不同预设商品属性类别下、不同预设行为类别下的浏览-商品属性值子集。
这样,用户特征信息融合了多维度的用户行为以及不同的商品属性粒度(品牌/品类/(商品品牌×商品品类)),能够更好的呈现待推荐用户的行为特征,以便提高预测准确率。
进一步地,在一些实施例中,所述利用预设商品特征模型对目标店铺的商品类别属性值数据进行特征分析,得到店铺特征信息,可以包括:
将目标店铺的商品类别属性值数据输入至预设商品特征模型,得到店铺特征向量数据;
对店铺特征向量数据进行均值化处理,得到店铺特征信息。
需要说明的是,对于商品来说,首先将商品类别属性值数据依次输入至预设商品特征模型,能够相应地获取预设商品特征模型输出的店铺特征向量数据;然后对店铺特征向量数据进行均值化处理,即可得到店铺特征信息。
示例性地,商品类别属性值数据可以包括多个店铺商品属性值子集,例如店铺商品品类属性值子集、店铺商品品牌属性值子集、店铺(商品品牌×商品品类)属性值子集等;将这些店铺商品属性值子集依次输入到预设商品特征模型中,就得到了相应的多个店铺特征向量子集(相当于店铺特征向量数据),将每一店铺特征向量子集都进行一次均值化处理,能够获得多个店铺特征向量,进而对多个店铺特征向量进行二次均值化处理,能够获得店铺特征信息。
这样,通过以上处理,将店铺特征与多行为用户特征(即不同行为类别下的用户特征)进行了维度对齐,所生成的扩充后的店铺特征信息同样融合了不同的商品属性粒度,利用用户特征信息和扩充后的店铺特征信息进行相似度计算时结果更为精确,进一步提高了预测效果。
S103:对用户特征信息和店铺特征信息进行相似度计算,根据计算结果从待推荐用户中确定目标用户集合,并将目标用户集合推荐给目标店铺。
需要说明的是,对用户特征信息和店铺特征信息进行相似度计算,从待推荐用户(待推荐用户是指一个用户群体,可以包括多个具体用户)中确定出目标用户集合(相当于前述的潜在新用户),将目标用户集合推荐给目标店铺。
进一步地,在一些实施例中,所述对用户特征信息和店铺特征信息进行相似度计算,根据计算结果从待推荐用户中确定目标用户集合,可以包括:
对店铺特征信息进行维度扩充处理,得到扩充后的店铺特征信息;其中,扩充后的店铺特征信息与用户特征信息的维度相同;
对用户特征信息和扩充后的店铺特征信息进行相似度计算,得到待推荐用户与目标店铺的相关度值;
按照相关度值对待推荐用户进行排序,根据排序结果确定目标用户集合。
需要说明的是,根据前述内容,对于用户来说,由于存在预设行为类别的区分,且不同预设行为类别下用户行为-特征向量数据需要经过均值化处理和拼接来得到用户特征信息;但是对于店铺来说,不存在预设行为类别的区分,所计算到的店铺特征向量数据经过均值化可直接作为店铺特征信息。
换句话说,用户特征信息和店铺特征信息的维度可能不同,所以需要根据用户特征信息对店铺特征信息进行维度扩充处理,得到扩充后的店铺特征信息,以使得扩充后的店铺特征信息与用户特征信息的维度相同。
在维度扩充之后,对用户特征信息和扩充后的店铺特征信息进行向量距离计算,得到若干个用户各自的相关度值。在这里,相关度值能够指示用户对目标店铺所售商品的感兴趣程度。
示例性地,预设商品特征模型可以包括多个预设商品子模型,以便灵活处理不同预设行为类别下的浏览-商品属性值子集,那么维度扩充可以理解为:利用多个预设商品子模型分别对待处理店铺商品属性值数据进行处理,并将处理结果进行拼接。
应理解,用户特征信息实际上包含了若干个用户的特征向量,将每个用户的特征向量与店铺特征信息(店铺特征信息的本质为同样为一个特征向量)进行向量距离计算,计算得到的向量距离值即为该用户的相关度值。在这里,向量距离值可以为余弦距离值、杰卡德距离或者欧式距离等类似指标。
在得到若干个用户的相关度值后,由于相关度值是指向量距离值,相关度值越小,说明该用户与店铺商品的相关性越高,因此按照相关度值从小到大对若干个用户进行排序,从排序结果中取前M个用户确定为目标用户集合。在这里,M为正整数,M的取值需要根据业务场景进行确定。
通过以上步骤,能够从若干个用户中确定出目标店铺的潜在新用户,从而帮助目标店铺完成店铺拉新操作,从而店铺能够针对潜在新用户设计相应的销售策略,提高店铺商品转化率,进而提高了店铺的运营效率。
本申请实施例提供了一种用户推荐方法,通过确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据;利用预设商品特征模型分别对用户商品属性值数据和店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息;对用户特征信息和店铺特征信息进行相似度计算,根据计算结果从待推荐用户中确定目标用户集合,并将目标用户集合推荐给目标店铺。这样,通过预设商品特征模型确定用户特征信息和店铺特征信息,能够准确计算用户行为与店铺商品的相关性,以便确定出向目标店铺推荐的潜在新用户;同时本申请的技术方案仅通过更新预设商品特征模型就可以实现对用户特征信息和店铺特征信息的更新,进而能够实时更新向目标店铺推荐的潜在新用户,从而不仅提高了用户推荐的准确率,而且还保证了用户推荐的实时性,进而提高店铺的运营效率。
在本申请的另一实施例中,对预设商品特征模型的训练方法进行详细阐述。参见图2,其示出了本申请实施例提供的另一种用户推荐方法的流程示意图。
如图2所示,该方法可以包括:
S201:获取样本用户的用户商品属性值样本数据。
需要说明的是,本申请实施例主要提供了预设商品特征模型的训练方法。
具体地,从电商平台获取样本用户在一段时间内(具体时长需要根据实际应用场景确定,例如30分钟、1天等)的商品交互行为序列,从而得到用户商品属性值样本数据。在这里,商品交互行为序列可以包括样本用户浏览的商品、点击的商品、购买的商品等。样本用户实际上可以包括多个具体用户。
S202:对用户商品属性值样本数据进行预处理,得到训练样本数据。
需要说明的是,对于原始的用户商品属性值样本数据进行预处理,得到用于模型训练的训练样本数据。在这里,训练样本数据中包括至少一个商品属性值和至少一个商品属性值各自的训练标签值。然后,利用神经网络模型能够学习每个商品属性值的特征,进而得到预设商品特征模型。换句话说,预设商品特征模型用于指示不同商品属性值各自的特征向量。
进一步地,在一些实施例中,所述对用户商品属性值样本数据进行预处理,得到训练样本数据,可以包括:
按照预设行为类别和预设商品属性类别对用户商品属性值样本数据进行处理,得到多个商品属性值组合对;
对多个商品属性值组合对进行统计分析,根据统计分析结果确定多个商品属性值组合对各自的权重值;
基于多个商品属性值组合对以及多个商品属性值组合对各自的权重值,确定训练样本数据。
需要说明的是,按照预设行为类别和预设商品属性类别对用户商品属性值样本数据进行处理,得到多个商品属性值组合对,具体包括:
(1)根据预设行为类别对商品交互数据进行分类,分别得到行为-商品类别属性值样本数据,例如浏览-商品属性值集合、点击-商品属性值集合、购买-商品属性值集合等;
(2)根据预设商品属性类别对行为-商品类别属性值样本数据中进行拆分组合处理,得到多个商品属性值组合对。在对行为-商品类别属性值样本数据中进行拆分组合处理时,需要针对同一用户在同一预设行为类别下的商品属性值进行组合,且被组合的两个商品属性值来自于不同的商品。
在得到多个商品属性值组合对后,对每一个商品属性值组合对进行统计分析,将具有该商品属性值组合对的样本用户数量确定为该商品属性值组合对的权重值。
示例性地,假定行为-商品类别属性值样本数据包含某个样本用户的浏览商品集合A{(品牌1×品类2),(品牌2×品类3)};其中,商品属性值表现为商品品牌×商品品类。
此时,将浏览商品集合A进行拆分组合处理,能够得到以下几个商品属性值组合对:[品牌1,品牌2]、[品牌1,品类3]、[品类2×品牌2]、[品类2,品类3]、[品牌1×品牌2,品牌2]、[品牌2,品牌2×品类3]。
在对所有样本用户做如上处理后,统计具有[品牌1,品牌2]这一商品属性值组合对的样本用户数量,就得到[品牌1,品牌2]的权重值。
通过以上步骤,能够得到多个商品属性值组合对以及多个商品属性值组合对各自的权重值,进而能够确定训练样本数据。
进一步地,在一些实施例中,所述基于多个商品属性值组合对以及多个商品属性值组合对各自的权重值,确定训练样本数据,可以包括:
根据多个商品属性值组合对以及多个商品属性值组合对各自的权重值,构建商品属性关联图;
根据多个商品属性值组合对以及多个商品属性值组合对各自的权重值,构建商品属性关联图;
利用预设随机游走模型对商品关联图进行计算,得到至少一条近邻序列;
对至少一条近邻序列进行窗口划分处理,得到至少一个训练输入值和至少一个训练标签值;
将至少一个训练输入值和至少一个训练标签值确定为训练样本数据。
需要说明的是,根据多个商品属性值组合对和多个商品属性值组合对各自的权重值,构建商品属性关联图。
具体地,以每个商品属性值作为一个顶点,每个商品属性值组合对指示两个顶点之间存在边(该边为有向边,从第一个商品属性值指向第二个商品属性值),每个商品属性值组合对的权重值为边的权重值。
示例性地,假定训练样本数据包括:[品牌1×品类2,品类3](6)、[品牌1×品类2,品牌2](4)、[品牌1×品类2,品牌2×品类3](2)、[品牌2×品类2,品牌1×品类2](1)、[品牌2×品类2,品牌3×品类3](1);其中,括号中的数字为该商品属性值组合对的权重值,则由以上数据构成的商品属性关联图如图3所示。
在构建商品属性关联图中,需要根据不同的预设行为类别进行区分。也就是说,对于点击行为,对应有一个商品属性关联图,而对于浏览行为,则对应由另一个商品属性关联图。
在得到商品属性关联图之后,利用随机游走子模型对商品关联图进行计算,从而得到至少一条近邻序列,且至少一条近邻序列中包含多个商品属性值。
针对所得到的近邻序列进行窗口划分处理,确定至少一个商品属性值关联对(具体地,每个商品属性值关联对包括一个训练输入值和一个训练标签值),进而得到至少一个训练输入值和至少一个训练标签值,也就得到了训练样本数据。在这里,假定商品属性值关联对包括商品属性值1和商品属性值2,可以这样理解:商品属性值2是用户在与商品属性值1所对应商品进行交互后,下一步可能进行交互的商品对象。
进一步地,在一些实施例中,对至少一条近邻序列进行窗口划分处理,得到至少一个训练输入值和至少一个训练标签值,可以按照以下内容实施:确定预设窗口阈值N;在至少一条近邻序列中每一近邻序列中,将第i个商品属性值确定为训练输入值,将第(i±n)个商品属性值确定为训练标签值,以得到至少一个训练输入值和至少一个训练标签值;其中,i、n和N均为正整数,n小于或等于N。
需要说明的是,为了确定商品属性值关联对,首先,设置预设窗口阈值N(根据实际应用场景进行设置)。示例性地,N为2,此时在每一条近邻序列中,将第i个商品属性值分别与第(i-2)个、第(i-1)个、第(i+1)个或者第(i±2)个商品属性值进行关联,得到前述的商品属性值关联对。换句话说,第i个商品属性值为一个训练输入值,而第(i±n)个商品属性值为第i个商品属性值的训练标签值。
这样,通过以上处理能够得到包含多个商品属性值关联对的训练样本数据,以便后续训练得到预设商品特征模型。
S203:利用训练样本数据对预设神经网络模型进行训练,得到预设商品特征模型。
需要说明的是,利用训练样本数据对预设神经网络模型进行训练,在损失函数达到预设阈值时,得到预设商品特征模型。
具体地,预设神经网络模型可以包括输入层、隐藏层和分类层。利用多个商品属性值关联对中的第一个商品属性值作为输入,第二个商品属性值作为标签,对预设神经网络模型进行训练。当损失函数达到预设阈值时,根据训练后的隐藏层向量能够确定不同商品属性值的特征向量,从而得到预设商品特征模型。
通过以上处理,能够得到用于指示每一商品属性值的特征向量的预设商品特征模型,以便进行店铺拉新处理。
基于前述的用户推荐方法,本申请实施例的应用场景为店铺拉新场景,需要解决的问题为寻找冷门店铺的潜在新用户(或称为新客),冷门店铺的新客可定义为近一年来未对该店铺产生过购买记录的用户。然而,冷门店铺拉新场景的难点在于与该冷门店铺有过交互行为的用户过少,因此无论是协同过滤还是通过用户-店铺/用户/店铺的统计特征建模方法,都难以准确预测某个未知用户未来是否产生购买行为。换句话说,为了提高模型精度,必须要在特征上使得用户与店铺进行联系,由于冷门店铺和新客不存在直接的交互特征,所以可以通过商品属性值的特征向量来间接建立用户与店铺的交互特征。
具体实现方式包括:采用用户一段时间内有过交互行为的(浏览/点击/加购/搜索/购买)的商品属性值序列(品类/(品牌×品类)/品牌)作为输入,通过算法计算得到用来描述商品属性值(品类/(品牌×品类)/品牌)的特征向量,然后通过计算好的商品属性值(品类/(品牌×品类)/品牌)的特征向量来得到用户的特征向量(相当于用户特征信息)与店铺的特征向量(相当于店铺特征信息),最后将用户的特征向量与店铺的特征向量进行余弦相似度计算,排序得到最相似的目标用户集合,即为店铺的潜在新客。
由于本申请实施例中店铺与用户的特征向量均由用户行为计算得到,相比相关技术中的协同过滤方法,通过用户的行为来确定店铺特征向量和用户特征向量,间接得到了店铺与用户可能存在的交互关系,能更准确地从用户行为角度表示店铺的特征。在最终预测结果中,店铺往往是包含了预测用户在行为上强相关的品类/(品牌×品类)/品牌商品的店铺。相比相关技术中使用用户-店铺行为样本进行建模的方法,不存在仅对店铺有行为的用户进行召回以及召回样本量级过少的缺点,从而避免了导致交互特征稀疏、模型精度低的弊端。
简言之,本申请实施例提供的用户推荐方法可以包括以下内容:
(1)通过算法对样本用户的行为序列(相当于用户商品属性值样本数据)进行处理,生成对商品(品牌、品类、(品牌×品类))描述的特征(相当于商品属性值),进而生成对店铺描述的特征(店铺特征信息)与对用户描述的特征(用户特征信息),以上方法生成的店铺特征与店铺商品具有强烈的相关性,且用户特征与用户行为同样具有强烈的关性,适合于寻找店铺的潜在新客,预测准确率高;
(2)通过本方法生成的用户特征融合了多维度的用户行为以及不同的商品粒度(品牌、品类、(品牌×品类)),生成的店铺特征融合了不同的商品粒度。将店铺特征与多行为用户特征进行了维度对齐;
(3)通过店铺特征和用户特征可以实现新客推荐,店铺特征和用户特征之间的相似度即为用户与店铺的行为相关度。
本申请实施例提供了一种用户推荐方法,通过本实施例对前述实施例的具体实施方法进行了详细阐述,从中可以看出,通过预设商品特征模型能够间接建立用户与店铺的交互特征,无需仅关注与店铺有过交互行为的用户数据,进而预设商品特征模型能够得到充分训练,模型精度高;而且,通过预设商品特征模型生成店铺特征信息和用户特征信息,能够表征用户行为与店铺商品的相关性,从而目标用户集合与目标店铺中的商品存在强相关关系,预测准确率高;另外,仅需要对新的用户商品属性值数据进行重新训练,就可以更新预设商品特征模型,进一步更新用户特征信息和店铺特征信息,最终更新目标用户集合,还提高了用户推荐的通用性。
在本申请的又一实施例中,参见图4,其示出了本申请实施例提供的又一种用户推荐方法的流程示意图。如图4所示,该方法可以包括:
S301:获取用户商品属性值样本数据。
需要说明的是,本申请实施例的用户推荐方法可以分为两大部分,第一部分是根据用户商品属性值样本数据建立预设商品特征模型,第二部分是根据预设商品特征模型进行店铺拉新操作。
针对第一部分,需要收集用户的行为数据,用户的行为数据可以理解为用户在一个会话(Session)内浏览/点击/加购/搜索/购买的商品序列,也就得到了用户商品属性值数据。其中,购买Session时长为1天,其余Session时长为30分钟。另外,在商品序列中,每个商品以(品牌×品类)的形式表示。
S302:对用户商品属性值样本数据进行数据处理。
需要说明的是,在获取到用户商品属性值样本数据之后,对Session中的(品牌×品类)进行分类和去重。示例性的,分类及去重后的数据(相当于前述的行为-商品类别属性值数据)形式如下:
用户1浏览:[(品牌1×品类2),(品牌2×品类3),(品牌3×品类4)…]
用户1点击:[(品牌1×品类2)…]
用户1加购:[(品牌2×品类3)…]
用户1搜索:[(品牌1×品类3)…]
用户1购买:[(品牌1×品类3)…]
用户2浏览:[(品牌2×品类2),(品牌3×品类3),(品牌4×品类4)…]
用户2点击:[(品牌2×品类2)…]
用户2加购:[(品牌3×品类3)…]
用户2搜索:[(品牌1×品类3)…]
用户2购买:[(品牌3×品类3)…]
针对以上数据,剔除其中的异常值。在这里,异常值剔除规则可以根据应用场景确定,例如将每个Session中浏览(品牌×品类)数量大于100或者只有1个的数据删除。
在剔除异常值之后,将每个用户的一个行为序列中的(品牌×品类数)按分品牌、分品类两两组合展开(具体的组合规则可以根据业务需求确定),以生成商品属性值组合对(简称为Pair对)并计数,Pair对及其计数的数据形式如下(上述以浏览序列为例,其他行为序列同理):
[品牌1×品类2,品牌2×品类3]2
[品牌1×品类2,品牌2]4
[品牌1×品类2,品类3]6
[品牌2×品类2,品牌3×品类3]1
[品牌2×品类2,品牌1×品类2]1
其中,每个Pair对包括两个商品属性值,即商品属性值可以为某个商品的品牌信息,某个商品的品类信息或者某个商品的品牌品类信息。为了方便说明,商品属性值也可以称为商品标识(Identity Document,ID),以下均以ID指代商品属性值。另外,每个Pair对后面的数字是指拥有该Pair对的样本用户数量,即Pair对的计数。另外,以上仅为Pair对的数据形式示例,与前述示例并不存在联系。
S303:根据数据处理结果,构建商品属性关联图。
需要说明的是,根据前述中得到的Pair对及其权重值构建商品属性关联图(Graph),Pair对中的ID即为商品属性关联图中的顶点(Node),Pair对的计数为两顶点间的边(Edge)的权重值。根据前述的Pair对及其计数的示例数据,所得到的商品属性关联图如图3所示。
S304:利用商品属性关联图训练预设节点嵌入模型。
需要说明的是,利用商品属性关联图训练预设节点嵌入模型,将商品属性关联图输入预设节点嵌入模型,输出为训练好的每一ID的特征向量。在这里,预设节点嵌入模型可以理解为前述的预设随机游走模型和预设神经网络模型的整体。
以预设节点嵌入模型是Node2Vec算法为例进行具体说明。
第一步,针对商品属性关联图,采用有偏的随机游走方式(即预设随机游走模型)获取每一顶点的近邻序列。
给定当前顶点v,近邻序列中下一个顶点x的概率如式(1)所示:
Figure BDA0003022925140000191
其中,Z是归一化常数(需要根据实际应用场景确定),
Figure BDA0003022925140000192
顶点v到顶点x的未归一化时的转移概率,E表示v和x之间存在边。
在这里,假定当前随机游走经过边(t,v)到达当前顶点v,则令
Figure BDA0003022925140000193
Figure BDA0003022925140000194
且ωvx为顶点v与x的边的权重值,αpq(t,x)的取值如式(2)所示:
Figure BDA0003022925140000195
其中,dtx为顶点t到顶点x之间最短路径的距离。p,q为参数(取值需要根据实际应用环境确定),p用于控制重复访问刚刚访问过的顶点的概率。q控制着游走是向外还是向内,若q>1,随机游走倾向于访问和t接近的顶点,偏向广度优先遍历算法(Breath FirstSearch,BFS)。若q<1,倾向于访问远离t的顶点,偏向深度优先遍历算法(Depth FirstSearch,DFS)。参见图5,其示出了本申请实施例提供的另一种用户推荐方法的工作过程示意图。当从t访问到v时,图5描述了决定下一个访问顶点时每个顶点对应的αpq(t,x)。
第二步,根据以上算法的结果,生成预设神经网络模型(例如Word2Vec模型)的训练样本。设定p=100,q=0.5,对于图3中的每个顶点生成100条长度为6的近邻序列。在这里,近邻序列的数量和长度均可根据实际应用场景确定。近邻序列的示例结果如下:
[品牌13333,品类5,品牌22,品类339,品牌121品类23…]
[品牌13品类5,品牌321,品牌22品类339,品牌121品类23…]
[品牌13,品类22,品牌22,品类339,品类23…]
[品牌13品类22,品牌22品类339,品类121…]
……
将上述近邻序列,按照窗口阈值划分构造Word2Vec模型的训练输入。示例性地,近邻序列为[品牌13333,品类5,品牌22,品类339,品牌121品类23],窗口阈值(相当于前述的预设阈值)大小为2,则将第i个店铺与第(i±n)个店铺生成商品属性值关联对,进而得到训练样本数据由于窗口阈值为2,所以n取1或2。此时,针对[品牌13333,品类5,品牌22,品类339,品牌121品类23…],所得到的商品属性值关联对如下:
[品牌13333,品类5],[品牌13333,品牌22],[品类5,品牌13333],[品类5,品牌22],[品类5,品类339],[品牌22,品牌13333],[品牌22,品类5],[品牌22,品类339],[品牌22,品牌121品类23],[品类339,品类5],[品类339,品牌22],[品类339,品牌121品类23],[品牌121品类23,品牌22],[品牌121品类23,品类339]。
此时,生成的是商品属性值关联对为[目标ID,上下文近邻ID]的形式,其中目标店铺为训练输入值,上下文近邻店铺为训练输入值。
第三步,将生成的训练样本用于训练Word2Vec模型(相当于前述的预设神经网络模型)。Word2Vec模型是一种神经网络算法,在本申请实施例中,Word2Vec模型具体为Skip-Gram模型,Skip-Gram模型包含一个输入层、一个隐藏层和一个输出层。
假定输入层向量为a,大小为(n'×1),隐藏层向量h=WT·a+b。其中,W为大小为(n'×m)的矩阵,b为大小m,W和b在开始会被随机生成,然后输入训练样本(X,Y),X为输入向量(即训练输入值),Y为真实标签(即训练输标签值),针对输入向量计算后得到隐藏层,进而得到输出层,利用Softmax函数对输出层结果进行打分操作,Softmax函数如式(3)所示:
Figure BDA0003022925140000211
其中,x'为输出层的输出向量,yj为y的第j个元素。
Softmax层的输出结果为预测概率值
Figure BDA0003022925140000212
根据预测概率值
Figure BDA0003022925140000213
和训练标签值计算损失,损失函数设定为交叉熵,具体计算过程如式(4)所示。
Figure BDA0003022925140000214
在计算得到损失后,通过梯度下降反向对权重求导
Figure BDA0003022925140000215
令导数为0即梯度下降最快的方向,更新权重W和b,更新后的权重再进行前向隐藏层输出层Softmax计算反复迭代更新权重W和b。
假定共100000个ID,每个ID的特征向量(隐藏层)设为128,交叉熵为损失函数,设定窗口大小为2,参见图6,其示出了本申请实施例提供的又一种用户推荐方法的工作过程示意图。如图6所示,预设神经网络模型包括输入层、隐藏层(Hidden Layer)和输出层(Output Layer);输入层的输入向量(Input Vector)为10000维(Positions),隐藏层(Hidden Layer)采用300个线性神经元(Linear Neurons),输出层采用Softmax函数进行打分(或称为Softmax Classifier),且输出层具有10000个神经元。
基于图6的内容,预设神经网络模型(即预设商品特征模型)的训练流程为:将由近邻序列生成的训练样本依次输入到词向量子模型Skip-Gram模型中,随机初始化网络权重,随机初始化的输入层与隐藏层之间的权重矩阵大小为(100000×128),隐藏层与输出层之间的权重矩阵大小为(100000×128),每个输入ID对应一个随机初始化的隐藏层向量,然后由前向网络计算出损失,再由梯度下降反向更新权重,最终迭代多次损失收敛后得到的权重即为训练好的权重。换句话说,训练好的隐藏层向量即为ID的特征向量。
S305:根据训练结果,生成预设商品特征模型。
需要说明的是,根据训练好的隐藏层向量,生成预设商品特征模型。在这里,预设商品特征模型用于指示每一ID的特征向量,即每一商品属性值的特征向量。
综上,取构建好的商品属性关联图作为预设节点嵌入模型的输入,输出为所需要的表征ID的特征向量。
S306:生成用户特征信息。
需要说明的是,在得到预设商品特征模型后,也就完成了第一部分的技术内容,以下为第二部分的技术内容阐述。
根据预设商品特征模型,生成用户特征信息,用户特征信息的本质是一个向量。换句话说,根据每个用户近期的不同行为序列ID(相当于用户商品属性值数据)生成用户行为的特征向量(Embedding)。
具体地,根据已经生成的ID及每个ID的特征向量(即预设商品特征模型),将用户行为序列ID(品牌/品类/品牌×品类)进行向量化。在这里,需要将用户行为序列ID按照分品牌/分品类/(品牌×品类)进行属性分类,在每一属性类别下进行向量化(Embedding),然后将每一类别中所有ID的向量进行均值化操作(Average Pooling),也就分别生成用户行为的品牌向量、品类向量和(品牌×品类)向量,然后将这三个向量再次进行AveragePooling操作生成用户的行为向量。
参见图7,其示出了本申请实施例提供的再一种用户推荐方法的工作过程示意图。如图7所示,在用户的行为序列ID中,包括品牌3、品牌8、品牌1和品牌2,则需要利用预设商品特征模型确定品牌3、品牌8、品牌1和品牌2的特征向量,并将所得到的特征向量进行均值化操作,得到品牌向量(或称为品牌Embedding);同理,继续得到品类向量(或称为品类Embedding)和(品牌×品类)向量(或称为(品牌×品类)Embedding),品牌向量、品类向量和(品牌×品类)向量也可称为ID向量(或称为ID Embedding);最后,将品牌向量、品类向量和(品牌×品类)向量进行均值化操作,得到该用户的行为向量。
进一步地,参见图8,其示出了本申请实施例提供的再一种用户推荐方法的工作过程示意图。如图8所示,根据行为类别(浏览/搜索/点击/加购/购买)的不同,分别可以得到该用户的不同行为向量,即用户浏览向量(或称为用户浏览Embedding)、用户搜索向量(或称为用户搜索Embedding)、用户购买向量(或称为用户购买Embedding)、用户点击向量(或称为用户点击Embedding)和用户加购向量(或称为用户加购Embedding),将这些不同行为的向量(Embedding)连接(Soncatenation)到一起,得到了该用户的用户向量(或称为用户Embedding),不同用户的用户向量也就构成了用户特征信息。
S307:生成店铺特征信息。
在这里,步骤S306和步骤S307可以并行执行,两者的执行顺序不分先后。
需要说明的是,类似于前述处理,根据预设商品特征模型,生成店铺特征信息,店铺特征信息的本质是一个向量。应理解,若店铺特征信息与用户特征信息维度不同,还需要将店铺特征信息进行维度扩充。
参见图9,其示出了本申请实施例提供的再一种用户推荐方法的工作过程示意图。如图9所示,根据店铺主营商品ID(品牌/品类/(品牌×品类)),以及已经生成的ID及不同ID的特征向量(Embedding),分品牌/分品类/(品牌×品类)的向量进行Average Pooling,分别生成店铺的品牌向量(或称为品牌Embedding)、品类向量(或称为品类Embedding)和(品牌×品类)向量(或称为(品牌×品类)Embedding),然后将品牌向量、品类向量和(品牌×品类)向量也可称为ID向量(或称为ID Embedding);然后将这三个向量再次进行AveragePooling操作生成店铺的Embedding;在店铺Embedding与用户Embedding有维度不同的情况下,需要将店铺Embedding进行扩充到同维度后作为店铺最终的特征向量(或称为店铺Unified Embedding),相当于前述的扩充后的店铺特征信息。
S308:根据用户特征信息和店铺特征信息,计算用户与店铺之间的相关度值。
需要说明的是,对于店铺特征信息与其他所有用户(除已经确定为新客外)的用户特征信息计算余弦距离,就得到了用户与店铺之间的相关度值。应理解,如果店铺特征信息经过了维度扩充,则需要针对扩充后的店铺特征信息和用户特征信息进行相关度值的计算。
具体地,向量
Figure BDA0003022925140000241
与向量
Figure BDA0003022925140000242
的余弦距离通过式(5)进行计算:
Figure BDA0003022925140000243
S309:根据多个用户与店铺的相关度值对多个用户进行排序,生成目标用户集合。
需要说明的是,根据多个用户与店铺的相关度值对多个用户进行排序,按降序排序取前100万即为目标用户集合,即最终的潜在新客集合。
还需要说明的是,在上述实施例中,用户的行为序列可以是浏览/点击/曝光/搜索/加购/购买等行为,行为序列时间长度随行为类型的不同而改变;根据用户行为序列生成特征向量的算法可以使用多种已有算法,例如深度游走算法(DeepWalk算法)或者类似算法(如LINE算法、Word2Vec算法),并不局限于Node2Vec算法;店铺向量与用户向量的相似度计算可以采用余弦距离、杰卡德距离或者欧式距离等类似指标。
综上,本申请实施例提供的用户推荐方法的整体流程为:首先,从电商平台的底层数据中获取用户对于商品属性值(品牌×品类)的交互行为(浏览/点击/加购/搜索/购买)数据;其次,对每个用户行为进行Session的划分,将每个Session中的ID两两组合并进行计数,通过得到的ID-ID Pair对与计数构建商品属性关联图;又次,将构建好的商品属性关联图通过Node2Vec算法进行有偏随机游走生成ID相邻序列,通过得到的ID相邻序列按窗口生成(目标ID,上下文相邻ID)即(输入,标签)形式的Skip-Gram模型的训练样本;再次,通过训练样本训练Node2Vec算法中的Skip-Gram模型,将训练好的隐藏层作为ID(品牌/品类/品牌×品类)的特征向量;最后,根据ID的特征向量生产店铺向量与用户向量,对用户与店铺的特征向量进行相似度的计算,每个店铺按余弦距离取相似度最高的前100万(Top100万)作为最终的潜在新客。
本申请实施例提供了一种用户推荐方法,通过本实施例对前述实施例的具体实施方法进行了详细阐述,从中可以看出,通过Node2Vec算法对训练样本数据进行处理得到预设商品特征模型,进而确定多个用户的用户特征信息和店铺特征信息,以便于从多个用户中确定出目标用户集合,因此,通过预设商品特征模型能够间接建立用户与店铺的交互特征,无需仅关注与店铺有过交互行为的用户数据,进而预设商品特征模型能够得到充分训练,模型精度高;另外,通过预设商品特征模型生成店铺特征信息和用户特征信息,能够表征用户行为与店铺商品的相关性,从而目标用户集合与目标店铺中的商品存在强相关关系,预测准确率高;另外,本申请实施例所提供的方法具有通用性和实时性,仅需要定期更新输入的用户行为数据重新训练预设节点嵌入模型,即可更新每个ID的特征向量(预设商品特征模型),根据每个ID的特征向量可每天更新用户向量与店铺向量,从而生成每个店铺的潜在新客,以便于店铺针对潜在新客制定相应的销售策略,从而提高店铺的运营效率。
在本申请的再一实施例中,参见图10,其示出了本申请实施例提供的一种用户推荐装置40的组成结构示意图。如图10所示,该用户推荐装置40包括确定单元401、分析单元402和推荐单元403,其中,
确定单元401,配置为确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据;
分析单元402,配置为利用预设商品特征模型分别对用户商品属性值数据和店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息;
推荐单元403,配置为对用户特征信息和店铺特征信息进行相似度计算,根据计算结果从待推荐用户中确定目标用户集合,并将目标用户集合推荐给目标店铺。
在一些实施例中,分析单元402,具体配置为基于预设行为类别和预设商品属性类别对用户商品属性值数据进行处理,得到待推荐用户的行为-商品类别属性值数据;利用预设商品特征模型对待推荐用户的行为-商品类别属性值数据进行特征分析,得到用户特征信息;以及基于预设商品属性类别对店铺商品属性值数据进行处理,得到目标店铺的商品类别属性值数据;利用预设商品特征模型对目标店铺的商品类别属性值数据进行特征分析,得到店铺特征信息。
在一些实施例中,分析单元402,还配置为将待推荐用户的行为-商品类别属性值数据输入至预设商品特征模型,得到待推荐用户的行为-特征向量数据;对待推荐用户的行为-特征向量数据进行均值化处理,得到待推荐用户的行为特征数据;将待推荐用户的行为特征数据进行拼接处理,得到用户特征信息。
在一些实施例中,分析单元402,还配置为将目标店铺的商品类别属性值数据输入至预设商品特征模型,得到店铺特征向量数据;对店铺特征向量数据进行均值化处理,得到店铺特征信息。
在一些实施例中,分析单元402,还配置为对店铺特征信息进行维度扩充处理,得到扩充后的店铺特征信息;其中,扩充后的店铺特征信息与用户特征信息的维度相同;对用户特征信息和扩充后的店铺特征信息进行相似度计算,得到待推荐用户与目标店铺的相关度值;按照相关度值对待推荐用户进行排序,根据排序结果确定目标用户集合。
在一些实施例中,如图11所示,该用户推荐装置40还包括训练单元404,配置为获取样本用户的用户商品属性值样本数据;对用户商品属性值样本数据进行预处理,得到训练样本数据;利用训练样本数据对预设神经网络模型进行训练,得到预设商品特征模型。
在一些实施例中,训练单元404,还配置为按照预设行为类别和预设商品属性类别对用户商品属性值样本数据进行处理,得到多个商品属性值组合对;对多个商品属性值组合对进行样本用户数量的统计分析,确定多个商品属性值组合对各自的权重值;基于多个商品属性值组合对以及多个商品属性值组合对各自的权重值,确定训练样本数据。
在一些实施例中,训练单元404,还配置为根据多个商品属性值组合对以及多个商品属性值组合对各自的权重值,构建商品属性关联图;利用预设随机游走模型对商品关联图进行计算,得到至少一条近邻序列;对至少一条近邻序列进行窗口划分处理,得到至少一个训练输入值和至少一个训练标签值;将至少一个训练输入值和至少一个训练标签值确定为训练样本数据。
在一些实施例中,预设行为类别包括下述至少之一:浏览行为、点击行为、加入购物车行为、搜索行为和购买行为;预设商品属性类别包括下述至少之一:商品品牌和商品品类。
可以理解地,在本实施例中,“单元”可以是部分电路、部分处理器、部分程序或软件等等,当然也可以是模块,还可以是非模块化的。而且在本实施例中的各组成部分可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或processor(处理器)执行本实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
因此,本实施例提供了一种计算机存储介质,该计算机存储介质存储有计算机程序,计算机程序被多个处理器执行时实现前述实施例中任一项的方法的步骤。
基于上述的一种用户推荐装置40的组成以及计算机存储介质,参见图12,其示出了本申请实施例提供的一种电子设备50的硬件结构示意图。如图12所示,电子设备50可以包括:通信接口501、存储器502和处理器503;各个组件通过总线设备504耦合在一起。可理解,总线设备504用于实现这些组件之间的连接通信。总线设备504除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图12中将各种总线都标为总线设备504。其中,通信接口501,用于在与其他外部网元之间进行收发信息过程中,信号的接收和发送;
存储器502,用于存储能够在处理器503上运行的计算机程序;
处理器503,用于在运行计算机程序时,执行:
确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据;
利用预设商品特征模型分别对用户商品属性值数据和店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息;
对用户特征信息和店铺特征信息进行相似度计算,根据计算结果从待推荐用户中确定目标用户集合,并将目标用户集合推荐给目标店铺。
可以理解,本申请实施例中的存储器502可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步链动态随机存取存储器(Synchronous link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本申请描述的设备和方法的存储器502旨在包括但不限于这些和任意其它适合类型的存储器。
而处理器503可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器503中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器503可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器502,处理器503读取存储器502中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本申请描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits,ASIC)、数字信号处理器(Digital SignalProcessing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(ProgrammableLogic Device,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请功能的其它电子单元或其组合中。
对于软件实现,可通过执行本申请功能的模块(例如过程、函数等)来实现本申请的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
可选地,作为另一个实施例,处理器503还配置为在运行计算机程序时,执行前述实施例中任一项的方法的步骤。
在本申请的再一实施例中,基于上述用户推荐装置40的组成示意图,参见图13,其示出了本申请实施例提供的另一种电子设备50的组成结构示意图。如图13所示,该电子设备50至少包括前述实施例中任一项的用户推荐装置40。
对于电子设备50而言,由于其包括用户推荐装置40,且用户推荐装置40能够根据预设商品特征模型确定用户特征信息和店铺特征信息,从而准确计算用户行为与店铺商品的相关性,以便确定出向目标店铺推荐的潜在新用户;同时本申请的技术方案仅通过更新预设商品特征模型就可以实现对用户特征信息和店铺特征信息的更新,进而能够实时更新向目标店铺推荐的潜在新用户,提高了用户推荐的准确率。
以上,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。
需要说明的是,在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (12)

1.一种用户推荐方法,其特征在于,所述方法包括:
确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据;
利用预设商品特征模型分别对所述用户商品属性值数据和所述店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息;
对所述用户特征信息和所述店铺特征信息进行相似度计算,根据计算结果从所述待推荐用户中确定目标用户集合,并将所述目标用户集合推荐给所述目标店铺。
2.根据权利要求1所述的用户推荐方法,其特征在于,所述利用预设商品特征模型分别对所述用户商品属性值数据和所述店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息,包括:
基于预设行为类别和预设商品属性类别对所述用户商品属性值数据进行处理,得到所述待推荐用户的行为-商品类别属性值数据;
利用所述预设商品特征模型对所述待推荐用户的行为-商品类别属性值数据进行特征分析,得到所述用户特征信息;以及
基于所述预设商品属性类别对所述店铺商品属性值数据进行处理,得到所述目标店铺的商品类别属性值数据;
利用所述预设商品特征模型对所述目标店铺的商品类别属性值数据进行特征分析,得到所述店铺特征信息。
3.根据权利要求2所述的用户推荐方法,其特征在于,所述利用所述预设商品特征模型对所述待推荐用户的行为-商品类别属性值数据进行特征分析,得到所述用户特征信息,包括:
将所述待推荐用户的行为-商品类别属性值数据输入至所述预设商品特征模型,得到所述待推荐用户的行为-特征向量数据;
对所述待推荐用户的行为-特征向量数据进行均值化处理,得到所述待推荐用户的行为特征数据;
将所述待推荐用户的行为特征数据进行拼接处理,得到所述用户特征信息。
4.根据权利要求2所述的用户推荐方法,其特征在于,所述利用所述预设商品特征模型对所述目标店铺的商品类别属性值数据进行特征分析,得到所述店铺特征信息,包括:
将所述目标店铺的商品类别属性值数据输入至所述预设商品特征模型,得到店铺特征向量数据;
对所述店铺特征向量数据进行均值化处理,得到所述店铺特征信息。
5.根据权利要求1所述的用户推荐方法,其特征在于,所述对所述用户特征信息和所述店铺特征信息进行相似度计算,根据计算结果从所述待推荐用户中确定目标用户集合,包括:
对所述店铺特征信息进行维度扩充处理,得到扩充后的店铺特征信息;其中,所述扩充后的店铺特征信息与所述用户特征信息的维度相同;
对所述用户特征信息和所述扩充后的店铺特征信息进行相似度计算,得到所述待推荐用户与所述目标店铺的相关度值;
按照所述相关度值对所述待推荐用户进行排序,根据排序结果确定所述目标用户集合。
6.根据权利要求1至5任一项所述的用户推荐方法,其特征在于,所述方法还包括:
获取样本用户的用户商品属性值样本数据;
对所述用户商品属性值样本数据进行预处理,得到训练样本数据;
利用所述训练样本数据对预设神经网络模型进行训练,得到所述预设商品特征模型。
7.根据权利要求6所述的用户推荐方法,其特征在于,所述对所述用户商品属性值样本数据进行预处理,得到训练样本数据,包括:
按照预设行为类别和预设商品属性类别对所述用户商品属性值样本数据进行处理,得到多个商品属性值组合对;
对所述多个商品属性值组合对进行样本用户数量的统计分析,确定所述多个商品属性值组合对各自的权重值;
基于所述多个商品属性值组合对以及所述多个商品属性值组合对各自的权重值,确定所述训练样本数据。
8.根据权利要求7所述的用户推荐方法,其特征在于,所述基于所述多个商品属性值组合对以及所述多个商品属性值组合对各自的权重值,确定所述训练样本数据,包括:
根据所述多个商品属性值组合对以及所述多个商品属性值组合对各自的权重值,构建商品属性关联图;
利用预设随机游走模型对所述商品关联图进行计算,得到至少一条近邻序列;
对所述至少一条近邻序列进行窗口划分处理,得到至少一个训练输入值和至少一个训练标签值;
将所述至少一个训练输入值和所述至少一个训练标签值确定为所述训练样本数据。
9.根据权利要求2或7所述的用户推荐方法,其特征在于,
所述预设行为类别包括下述至少之一:浏览行为、点击行为、加入购物车行为、搜索行为和购买行为;
所述预设商品属性类别包括下述至少之一:商品品牌和商品品类。
10.一种用户推荐装置,其特征在于,所述用户推荐装置包括确定单元、分析单元和推荐单元;其中,
所述确定单元,配置为确定待推荐用户的用户商品属性值数据和目标店铺的店铺商品属性值数据;
所述分析单元,配置为利用预设商品特征模型分别对所述用户商品属性值数据和所述店铺商品属性值数据进行特征分析,得到用户特征信息和店铺特征信息;
所述推荐单元,配置为对所述用户特征信息和所述店铺特征信息进行相似度计算,根据计算结果从所述待推荐用户中确定目标用户集合,并将所述目标用户集合推荐给所述目标店铺。
11.一种电子设备,其特征在于,所述电子设备包括存储器和处理器;其中,
所述存储器,用于存储能够在所述处理器上运行的计算机程序;
所述处理器,用于在运行所述计算机程序时,执行如权利要求1至9任一项所述方法的步骤。
12.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被执行时实现如权利要求1至9任一项所述方法的步骤。
CN202110407599.0A 2021-04-15 2021-04-15 一种用户推荐方法、装置、电子设备及计算机存储介质 Pending CN113268656A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110407599.0A CN113268656A (zh) 2021-04-15 2021-04-15 一种用户推荐方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110407599.0A CN113268656A (zh) 2021-04-15 2021-04-15 一种用户推荐方法、装置、电子设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN113268656A true CN113268656A (zh) 2021-08-17

Family

ID=77228784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110407599.0A Pending CN113268656A (zh) 2021-04-15 2021-04-15 一种用户推荐方法、装置、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113268656A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641811A (zh) * 2021-08-19 2021-11-12 中山大学 促进购买行为的会话推荐方法、系统、设备及存储介质
CN115131068A (zh) * 2022-07-08 2022-09-30 连连(杭州)信息技术有限公司 一种店铺分类方法、装置和计算机存储介质
CN116205536A (zh) * 2023-03-06 2023-06-02 阿里巴巴(中国)有限公司 对象评估方法、计算设备及可读存储介质
CN116308465A (zh) * 2023-05-15 2023-06-23 深圳易派支付科技有限公司 一种基于移动支付的大数据分析系统
CN117252665A (zh) * 2023-11-14 2023-12-19 苏州元脑智能科技有限公司 业务推荐方法、装置、电子设备及存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641811A (zh) * 2021-08-19 2021-11-12 中山大学 促进购买行为的会话推荐方法、系统、设备及存储介质
CN113641811B (zh) * 2021-08-19 2023-09-01 中山大学 促进购买行为的会话推荐方法、系统、设备及存储介质
CN115131068A (zh) * 2022-07-08 2022-09-30 连连(杭州)信息技术有限公司 一种店铺分类方法、装置和计算机存储介质
CN115131068B (zh) * 2022-07-08 2023-12-26 连连(杭州)信息技术有限公司 一种店铺分类方法、装置和计算机存储介质
CN116205536A (zh) * 2023-03-06 2023-06-02 阿里巴巴(中国)有限公司 对象评估方法、计算设备及可读存储介质
CN116205536B (zh) * 2023-03-06 2023-10-13 阿里巴巴(中国)有限公司 对象评估方法、计算设备及可读存储介质
CN116308465A (zh) * 2023-05-15 2023-06-23 深圳易派支付科技有限公司 一种基于移动支付的大数据分析系统
CN116308465B (zh) * 2023-05-15 2023-09-01 深圳易派支付科技有限公司 一种基于移动支付的大数据分析系统
CN117252665A (zh) * 2023-11-14 2023-12-19 苏州元脑智能科技有限公司 业务推荐方法、装置、电子设备及存储介质
CN117252665B (zh) * 2023-11-14 2024-02-20 苏州元脑智能科技有限公司 业务推荐方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN113268656A (zh) 一种用户推荐方法、装置、电子设备及计算机存储介质
CN111460130B (zh) 信息推荐方法、装置、设备和可读存储介质
US20170017900A1 (en) System and method for feature generation over arbitrary objects
CN107833117B (zh) 一种考虑标签信息的贝叶斯个性化排序推荐方法
CN113256367B (zh) 用户行为历史数据的商品推荐方法、系统、设备及介质
CN106251174A (zh) 信息推荐方法及装置
CN104679771A (zh) 一种个性化数据搜索方法和装置
KR102412158B1 (ko) 오픈마켓에서의 시장점유율 확대를 위한 키워드 추출 및 분석 방법
Malik et al. EPR-ML: E-Commerce Product Recommendation Using NLP and Machine Learning Algorithm
CN113837842A (zh) 一种基于用户行为数据的商品推荐方法及设备
CN111695024A (zh) 对象评估值的预测方法及系统、推荐方法及系统
CN113191838A (zh) 一种基于异质图神经网络的购物推荐方法及系统
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN116401542A (zh) 一种多意图多行为解耦推荐方法及装置
Sharma et al. Intelligent data analysis using optimized support vector machine based data mining approach for tourism industry
CN115641179A (zh) 信息推送方法、装置及电子设备
CN116911949A (zh) 基于边界排名损失和邻域感知图神经网络的物品推荐方法
Latha et al. Product recommendation using enhanced convolutional neural network for e-commerce platform
CN116542738A (zh) 一种基于电子商务大数据的信息推送方法
CN113393250A (zh) 一种信息处理方法及装置、存储介质
CN112488355A (zh) 基于图神经网络预测用户评级的方法和装置
CN113065067A (zh) 一种物品推荐方法、装置、计算机设备及存储介质
Arora et al. Evaluation Of Product Reviews Using Deep Learning Classifier Models
CN116957740B (zh) 一种基于词特征的农产品推荐系统
JP2019160064A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination