CN114971766A - 商品推荐方法及其装置、设备、介质、产品 - Google Patents
商品推荐方法及其装置、设备、介质、产品 Download PDFInfo
- Publication number
- CN114971766A CN114971766A CN202210394151.4A CN202210394151A CN114971766A CN 114971766 A CN114971766 A CN 114971766A CN 202210394151 A CN202210394151 A CN 202210394151A CN 114971766 A CN114971766 A CN 114971766A
- Authority
- CN
- China
- Prior art keywords
- commodity
- data set
- data
- commodity data
- recall
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 230000008569 process Effects 0.000 claims abstract description 30
- 238000012163 sequencing technique Methods 0.000 claims abstract description 16
- 238000013479 data entry Methods 0.000 claims description 61
- 238000013507 mapping Methods 0.000 claims description 41
- 238000003062 neural network model Methods 0.000 claims description 30
- 230000006399 behavior Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012216 screening Methods 0.000 claims description 12
- 239000002131 composite material Substances 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 12
- 238000012937 correction Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000576 supplementary effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/014—Providing recall services for goods or products
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开一种商品推荐方法及其装置、设备、介质、产品,所述方法包括:获取多个召回通道相对应的商品数据集,其中包含多个商品数据条目,每个商品数据条目包含召回过程中确定的排序分值;匹配各个召回通道对应预设的粗排权重,计算出各个商品数据集中商品数据条目的排序分值加权后的综合分值,合并各个商品数据集获得汇总数据集,实现对不同商品数据集中的相同商品数据条目的综合分值的汇总;根据所述综合分值对所述汇总数据集的商品数据条目进行倒排序;从所述汇总数据集中确定排序靠前的部分商品数据条目作为商品推荐的粗排序数据集。本申请能够提升电商平台在商品搜索、商品广告、商品排序等应用场景中的数据匹配精准度,从而提升用户体验。
Description
技术领域
本申请涉及电商信息技术领域,尤其涉及一种商品推荐方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。
背景技术
电商平台中,为用户推荐商品是一种普遍需求,故存在各种各样的商品推荐系统,用于满足商品搜索、广告、排行所需,而推荐相应的商品数据集。商品推荐系统主要包括召回和排序两阶段,其中的召回阶段用于根据一定的需求从海量的数据集中筛选出部分候选数据,然后将候选数据集交由排序阶段进行精排序,实现对商品数据的优先级梳理,使最终获得的商品数据集能够按照某一期望的业务逻辑实现有效的排序推荐效果。
有时,在召回阶段,按照单一的召回规则实施数据筛选,难以有效地达到期望的召回效果。例如,某一业务场景下,例如直播销售场景下,针对用户访问的某一商品,开发人员主观认为应向推荐与该商品具有某种相似性的商品,但结果可能适得其反,用户只是随意访问而已,因而,设定一个召回通道,根据用户对商品的访问本身而为其推荐相似商品本身,难以有效命中用户需求。
另一示例中,用户多次访问自身已经购买过的一个商品,只是需要重复进入其购买过的商品的详情页了解具体情况,如果此时将其理解为用户期望购买的商品并为其推荐相似商品,则也引起误读,因而,通常会结合商品的点击率或转化率等参数进一步结合衡量而设定召回通道,以便为用户有效推荐商品。
可见,现有的商品推荐系统中,由于缺乏对有效需求的分析而未提出有效的解决方案,使得商品推荐系统难以产生有效的商品推荐效果。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种商品推荐方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种商品推荐方法,包括如下步骤:
获取多个召回通道相对应的商品数据集,所述商品数据集中包含多个商品数据条目,每个商品数据条目包含召回过程中确定的排序分值;
匹配各个召回通道对应预设的粗排权重,计算出各个商品数据集中商品数据条目的排序分值加权后的综合分值,合并各个商品数据集获得汇总数据集,实现对不同商品数据集中的相同商品数据条目的综合分值的汇总;
根据所述综合分值对所述汇总数据集的商品数据条目进行倒排序;
从所述汇总数据集中确定排序靠前的部分商品数据条目作为商品推荐的粗排序数据集。
深化的实施例中,获取多个召回通道相对应的商品数据集,包括如下步骤:
通过第一召回通道从候选数据集中选取出商品特征信息与目标商品特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第一商品数据集,所述匹配度作为排序分值;
通过第二召回通道从候选数据集中选取出商品特征信息与用户偏好特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第二商品数据集,所述匹配度作为排序分值。
深化的实施例中,通过第一召回通道从候选数据集中选取出商品特征信息与目标商品特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第一商品数据集,包括如下步骤:
从所述候选数据集中获取用户访问的目标商品的商品特征信息,所述商品特征信息由第一神经网络模型所提取;
计算目标商品特征信息与所述候选数据集中各个商品数据条目所携带的商品特征信息之间语义上的匹配度;
将匹配度高于预设阈值的商品数据条目及其相应的匹配度构造为映射关系数据,存储于第一商品数据集中。
深化的实施例中,通过第二召回通道从候选数据集中选取出商品特征信息与用户偏好特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第二商品数据集,包括如下步骤:
获取用户行为记录数据,采用第二神经网络模型提取出相应的用户偏好特征信息;
分别将所述候选数据集中的每个商品数据条目的商品特征信息结合所述用户偏好特征信息共同输入第三神经网络模型确定出每个商品数据条目与所述用户偏好特征信息之间的匹配度;
将匹配度高于预设阈值的商品数据条目及其相应的匹配度构造为映射关系数据,存储于第二商品数据集中。
深化的实施例中,从所述汇总数据集中确定排序靠前的部分商品数据条目作为商品推荐的粗排序数据集的步骤之后,包括如下步骤:
将所述粗排序数据集推送至精排序接口以对所述粗排序数据集处理为精排序数据集后推送至终端设备;
响应于所述精排序接口返回的失败事件,将所述粗排序数据集推送至终端设备。
深化的实施例中,匹配各个召回通道对应预设的权重,包括如下步骤:
根据精排序接口产出的精排序数据集相对于所述粗排序数据集的排序位置变化,量化统计出各个召回通道的商品数据条目精排序后的综合位置评分;
根据所述综合位置评分校正所述预设的粗排权重。
具体化的实施例中,量化统计出各个召回通道的商品数据条目精排序后的综合位置评分,还包括如下步骤:
统计各个召回通道相对应的商品数据条目在精排序后的序号的总和;
对各个召回通道相对应的总和进行归一化作为各个召回通道的综合位置评分。
适应本申请的目的之一而提供的一种商品推荐装置,包括数据获取模块、分值计算模块、数据倒排模块,以及数据筛选模块,其中:所述数据获取模块,用于获取多个召回通道相对应的商品数据集,所述商品数据集中包含多个商品数据条目,每个商品数据条目包含召回过程中确定的排序分值;所述分值计算模块,用于匹配各个召回通道对应预设的粗排权重,计算出各个商品数据集中商品数据条目的排序分值加权后的综合分值,合并各个商品数据集获得汇总数据集,实现对不同商品数据集中的相同商品数据条目的综合分值的汇总;所述数据倒排模块,用于根据所述综合分值对所述汇总数据集的商品数据条目进行倒排序;所述数据筛选模块,用于从所述汇总数据集中确定排序靠前的部分商品数据条目作为商品推荐的粗排序数据集。
深化的实施例中,所述数据获取模块,包括:第一获取模块,用于通过第一召回通道从候选数据集中选取出商品特征信息与目标商品特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第一商品数据集,所述匹配度作为排序分值;第二获取模块,用于通过第二召回通道从候选数据集中选取出商品特征信息与用户偏好特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第二商品数据集,所述匹配度作为排序分值。
深化的实施例中,所述第一获取模块,包括:目标确定单元,用于从所述候选数据集中获取用户访问的目标商品的商品特征信息,所述商品特征信息由第一神经网络模型所提取;语义匹配单元,用于计算目标商品特征信息与所述候选数据集中各个商品数据条目所携带的商品特征信息之间语义上的匹配度;数据筛选单元,用于将匹配度高于预设阈值的商品数据条目及其相应的匹配度构造为映射关系数据,存储于第一商品数据集中。
深化的实施例中,所述第二获取模块,包括:行为获取单元,用于获取用户行为记录数据,采用第二神经网络模型提取出相应的用户偏好特征信息;匹配运算单元,用于分别将所述候选数据集中的每个商品数据条目的商品特征信息结合所述用户偏好特征信息共同输入第三神经网络模型确定出每个商品数据条目与所述用户偏好特征信息之间的匹配度;数据筛选单元,用于将匹配度高于预设阈值的商品数据条目及其相应的匹配度构造为映射关系数据,存储于第二商品数据集中。
深化的实施例中,所述数据筛选模块,包括:精排推送单元,用于将所述粗排序数据集推送至精排序接口以对所述粗排序数据集处理为精排序数据集后推送至终端设备;粗排推送单元,用于响应于所述精排序接口返回的失败事件,将所述粗排序数据集推送至终端设备。
深化的实施例中,所述分值计算模块,包括:量化统计单元,用于根据精排序接口产出的精排序数据集相对于所述粗排序数据集的排序位置变化,量化统计出各个召回通道的商品数据条目精排序后的综合位置评分;权重校正单元,用于根据所述综合位置评分校正所述预设的粗排权重。
具体化的实施例中,所述量化统计单元,包括:统计单元,用于统计各个召回通道相对应的商品数据条目在精排序后的序号的总和;量化单元,用于对各个召回通道相对应的总和进行归一化作为各个召回通道的综合位置评分。
适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的商品推荐方法的步骤。
适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的商品推荐方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
适应本申请的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述方法的步骤。
相对于现有技术,本申请的技术方案包含多方面的技术优势,包括但不限于如下各方面:
一方面,本申请利用多个召回通道从候选数据集中获取用做粗排序数据集的商品数据条目,服务于商品推荐系统,在此过程中,通过多个不同召回通道的配合,可以实现对复杂场景和需求的数据筛选,从而确定出符合预期的商品数据条目。
另一方面,本申请在利用多个召回通道获得的数据集时,允许预设各个召回通道相对应的粗排权重,利用粗排权重对各个召回通道的重要性进行区分,使所召回的数据集中,不同召回通道的商品数据条目得以根据所述粗排权重的约束而进行粗排序,据此进行截尾确定出的部分排序靠前的商品数据条目,更具数据代表价值,能提升召回准确率,对于电商平台而言,能够获得更为高效地实现商品搜索、商品广告、商品排序等服务功能。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的商品推荐方法的典型实施例的流程示意图;
图2为本申请示例性的第一召回通道获取第一商品数据集的过程的流程示意图;
图3为本申请示例性的第二召回通道获取第二商品数据集的过程的流程示意图;
图4为本申请的商品推荐方法的扩展实施例的流程示意图;
图5为本申请实施例中根据精排序数据集校正召回阶段的粗排权重的过程的流程示意图;
图6为本申请实施例中为召回通道确定修正粗排权重所需的综合位置评分的过程的流程示意图;
图7为本申请的商品推荐装置的原理框图;
图8为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种商品推荐方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如在本申请的电商平台应用场景中,一般部署在服务器中实施,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
请参阅图1,本申请的商品推荐方法,可被实现于电商平台的商品推荐系统中,服务于商品搜索、商品广告投放、商品排序等需求,在其典型实施例中,包括如下步骤:
步骤S1100、获取多个召回通道相对应的商品数据集,所述商品数据集中包含多个商品数据条目,每个商品数据条目包含召回过程中确定的排序分值:
当用户出于某种需求而调用电商平台的商品推荐系统,执行相应的商品搜索请求时,或者当系统需要向终端消费用户投放商品广告时,可触发商品推荐系统中负责数据召回的业务逻辑,从而启动本申请的方法的执行。适应本申请的执行所需,商品推荐系统预先配置有多个召回通道,每个召回通道适应一个相应的业务场景而预设相应的数据获取逻辑,当其被调用时,根据其自身的数据获取逻辑从候选数据集中筛选出相应的商品数据集。所述的候选数据集可以是电商平台的独立站点中的商品数据库的全量商品数据条目,也可以是一个广告商品数据库中的全量商品数据条目,具体视业务需求而定。所述的商品数据条目,是指用于描述一个商品的商品信息相对应的数据记录,包含多个商品信息相对应的字段,例如商品ID、商品标题、商品图片、商品标签等。
根据每个召回通道所获取的商品数据集中的各个商品数据条目,在其召回过程中,根据相应的召回通道固有的业务逻辑,将获得一个相应的排序分值,所述的排序分值可以作为对所获得的商品数据集进行排序的依据。
一个具体的实施例中,商品推荐系统提供两个召回通道,故可将本步骤分解为两个步骤处理,具体包括:
步骤S1110、通过第一召回通道从候选数据集中选取出商品特征信息与目标商品特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第一商品数据集,所述匹配度作为排序分值:
首先,调用第一召回通道获取第一商品数据集,所述的第一召回通道所实现的业务逻辑,在于从所述的候选数据集中,匹配出与终端用户所访问的商品在特征上相匹配的商品,而将这些相匹配的商品相对应的商品数据条目构造为第一商品数据集,并且在召回过程中确定各个相匹配的商品数据条目相对应的匹配度。因而,第一商品数据集可包含各个相匹配的商品数据条目及其相应的匹配度之间的映射关系数据。用户所访问的商品,可以通过用户访问某个商品时触发的用户行为数据来获取。
确定用户所访问的商品与其相匹配的商品数据条目彼此的特征之间的匹配度,可以采用诸如余弦相似度、欧氏距离、皮尔逊系数等任意一种数据距离算法来实现。
步骤S1120、通过第二召回通道从候选数据集中选取出商品特征信息与用户偏好特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第二商品数据集,所述匹配度作为排序分值:
同理,调用第二召回通道获取第二商品数据集,所述的第二召回通道所实现的业务逻辑,在于从所述的候选数据集中,筛选出商品特征信息与终端用户偏好特征信息相匹配的商品数据条目,同时确定各个筛选出的商品数据条目与所述用户偏好特征信息之间构成相匹配的置信度,将该置信度作用商品数据条目相对应的匹配度,同理也可作为排序分值。然后将每个筛选出的商品数据条目与其相应的匹配度构造为映射关系数据,存储于第二商品数据集中。
经此处的示例可以看出,通过两个在业务逻辑上相关联的召回通道,即关联于相同终端用户所访问的商品及其个人偏好特征,不仅参考了用户所访问的商品的特征信息确定出其相似的商品数据条目,而且也参考该用户的个人偏好相对应的特征信息确定匹配该偏好的商品数据条目,从而实现从更多维度获取商品数据,其所获得的第一商品数据集与第二商品数据集,构成是次召回的完整数据集,由此可见,通过多个召回通道从候选数据集中筛选数据,可以起到数据查全的作用。
步骤S1200、匹配各个召回通道对应预设的粗排权重,计算出各个商品数据集中商品数据条目的排序分值加权后的综合分值,合并各个商品数据集获得汇总数据集,实现对不同商品数据集中的相同商品数据条目的综合分值的汇总:
不难理解,两个商品数据集中可能存在部分重复的商品数据条目,但也更可能存在互不相同的商品数据条目,两个商品数据集所获得的相同或不同商品数据条目的价值孰轻孰重,可以通过预设权重加以衡量,此一预设权重可称为粗排权重。所述粗排权重可由本领域技术人员事先预设,在本申请的部分实施例中,也可通过本申请的技术方案实现循环修正。
具体而言,为了实现对经多召回通道召回的各个商品数据集的综合,可以为各个召回通道预设其相对应召回的商品数据集相对应的粗排权重,据此,对于通过各个召回通道获得的各个商品数据集,例如所述的第一商品数据集和第二商品数据集,可将两者中各个商品数据条目所对应的排序分值乘以其所属的商品数据集的粗排权重,实现对所述排序分值的加权,从而确定出各个商品数据条目相对应的综合分值。由此,各个召回通道所确定的商品数据集所构成的全量商品数据条目,均获得其相应的综合分值。
对于多源的各个商品数据集,需要将其合并同同一汇总数据集,以便进行集中排序。如前所述,各个商品数据集中可能存在部分相同的商品数据条目,因而需要去重。据此,在将各个商品数据集进行合并时,可采用多种策略来处理彼此相同的商品数据条目的合并,例如,一种方式中,可将相同商品数据条目的综合分值进行简单加和获得新的综合分值,作为该商品数据条目在所述汇总数据集中相对应的综合分值。另一方式中,可以针对各个商品数据集中的相同商品数据条目取其中的最大综合分值作为该商品数据条目在所述汇总数据集中相对应的综合分值。至此,便实现了对多个召回通道相对应获取的各路商品数据集的综合,获得一个汇总数据集,该汇总数据集中所包含的各个商品数据条目,均关联对应一个综合分值。
步骤S1300、根据所述综合分值对所述汇总数据集的商品数据条目进行倒排序:
由于经由各个召回通道召回的商品数据条目通常数量较多,通常达到几千甚至几万的级别,其中包含大量的冗余和无用数据,因而,后续需要对其进行初步的优选。为此,在本步骤中,可先根据所述的综合分值对汇总数据集中的各个商品数据条目进行倒排序,使各个商品数据条目按照所述的综合分值占据不同的排序位置。
步骤S1400、从所述汇总数据集中确定排序靠前的部分商品数据条目作为商品推荐的粗排序数据集:
最后,考虑到最终推送到终端设备所需的数据规模以及商品推荐系统处理数据的效率,可对已经完成排序的所述汇总数据集进行截尾,根据预设的数量,选取排序靠前的部分商品数据条目,作为商品推荐所需的粗排序数据集,对于排序在后的其他商品数据条目则予以丢弃。
所确定的粗排序数据集,可将其交由商品推荐系统中的精排序接口进行精细化的排序处理,以适应各种具体业务所需,优化各个商品数据条目的排序位置后输出至终端设备中使用。当所述的精排序接口失效时,也可将所述的粗排序数据集直接推送至终端设备处使用。
通过本申请的典型实施例及其变通实施例可以看出,相对于现有技术,本申请的技术方案包含多方面的技术优势,包括但不限于如下各方面:
一方面,本申请利用多个召回通道从候选数据集中获取用做粗排序数据集的商品数据条目,服务于商品推荐系统,在此过程中,通过多个不同召回通道的配合,可以实现对复杂场景和需求的数据筛选,从而确定出符合预期的商品数据条目。
另一方面,本申请在利用多个召回通道获得的数据集时,允许预设各个召回通道相对应的粗排权重,利用粗排权重对各个召回通道的重要性进行区分,使所召回的数据集中,不同召回通道的商品数据条目得以根据所述粗排权重的约束而进行粗排序,据此进行截尾确定出的部分排序靠前的商品数据条目,更具数据代表价值,能提升召回准确率,对于电商平台而言,能够获得更为高效地实现商品搜索、商品广告、商品排序等服务功能。
请参阅图2,深化的实施例中,所述步骤S1110、通过第一召回通道从候选数据集中选取出商品特征信息与目标商品特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第一商品数据集,包括如下步骤:
步骤S1111、从所述候选数据集中获取用户访问的目标商品的商品特征信息,所述商品特征信息由第一神经网络模型所提取:
所述的第一召回通道被调用时,对于用户所访问的商品,即目标商品,首先从所述候选数据集中确定其相应的商品特征信息。候选数据集中每个商品数据条目均对应存储由其中的商品信息提取出来的商品特征信息。所述的商品特征信息可以是根据商品数据条目所存储的商品信息中的图片信息和/或文本信息进行表示学习获得的深层语义特征信息。
推荐的一种实施例中,采用预先训练至收敛状态的第一神经网络模型来实施对所述商品特征信息的提取。第一神经网络模型适应其所据以表示学习的商品信息的类型的不同而提供不同的构型,例如,当据以表示学习的商品信息为单独的商品图片时,该第一神经网络模型可以是CNN、Resnet等基于卷积的神经网络基础模型;当据以表示学习的商品信息为文本信息时,该第一神经网络模型可以是Transformer、Bert、LSTM等基于RNN的神经网络基础模型;当据以表示学习的商品信息既包含图片信息也包含文本信息时,则可分别采用对应的神经网络基础模型分别提取特征信息后再行综合即可。所述的第一神经网络模型,可由本领域技术人员采用足量的训练样本结合分类器实施训练,使其习得对所述的商品数据条目中的商品信息进行表示学习,获得相应的商品特征信息即可。
步骤S1112、计算目标商品特征信息与所述候选数据集中各个商品数据条目所携带的商品特征信息之间语义上的匹配度:
对于所述的目标商品的商品特征信息,可将其与所述候选数据集中的各个商品数据条目逐一对应,计算与这些商品数据条目的商品特征信息之间的语义相似数据,具体可采用如前所述的任意一种数据距离算法进行计算确定,例如以余弦相似算法进行计算确定,从而确定出对应的相似度数值作为彼此之间的匹配度,所述的匹配度由于在计算相似度数值时可进行归一化,故也可表征各个商品数据条目与所述目标商品的相对相似程度,因此可作为所述排序分值使用。
步骤S1113、将匹配度高于预设阈值的商品数据条目及其相应的匹配度构造为映射关系数据,存储于第一商品数据集中:
经过前面的步骤,第一召回通道所获得的第一商品数据集中,各个商品数据条目均获得一个相应的可作为排序分值的匹配度,由此,可利用一个预设阈值,对其进行初步选优,确定出匹配度高于所述预设阈值的商品数据条目,保留为第一商品数据集,而将其他的商品数据条目予以删除。
本实施例中,经由第一召回通道获得的是与用户所访问的商品在语义特征上构成相匹配的商品相对应的商品数据条目,从商品相似的维度实现了数据查全的效果,其中,由于粗召回阶段所获取的数据量级可能较大,例如上万或十万级,通过此处的筛选,可以实现对第一商品数据集的商品数据条目总量的初步压缩,可以提升后续处理过程的运算效率。
请参阅图3,深化的实施例中,所述步骤S1120、通过第二召回通道从候选数据集中选取出商品特征信息与用户偏好特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第二商品数据集,包括如下步骤:
步骤S1121、获取用户行为记录数据,采用第二神经网络模型提取出相应的用户偏好特征信息:
所述的第二召回通道被调用时,对于访问第一召回通道的同一用户,可以获取其用户行为记录数据,所述用户行为记录数据包含用户对电商平台的各种商品的访问行为,例如点击行为、下单行为、支付行为等相对应的数据,据此,可将最近一段时间内的用户行为记录数据经预处理后获得用户行为记录数据,将其输入预设的第二神经网络模型中提取出相应的用户偏好特征信息,实现对用户行为特征的表示学习。所述的第二神经网络模型可以由本领域技术人员采用足量的训练数据实施迭代训练获得,使其具有根据用户行为记录数据获取用户相对应的用户偏好特征信息的能力即可。第二神经网络模型同理可采用Bert之类的适于处理文本信息的基础模型加以实施。
步骤S1122、分别将所述候选数据集中的每个商品数据条目的商品特征信息结合所述用户偏好特征信息共同输入第三神经网络模型确定出每个商品数据条目与所述用户偏好特征信息之间的匹配度:
进而,调用第三神经网络模型来为候选数据集中的各个商品数据条目关联于所述用户偏好特征信息而计算匹配度。
第三神经网络模型,可采用双塔模型来构建,由本领域技术人员采用足量的训练样本将其预先训练至收敛状态即可,包括两路特征处理过程,其中第一路用于处理用户偏好特征信息,第二路用于处理商品数据条目相对应的商品特征信息,所述商品特征信息可以采用前一实施例第一神经网络模型进行提取。然后,将所述用户偏好特征信息与所述商品特征信息进行拼接或特征融合后,经全连接层映射至一个分类空间,以判断两者是否构成相似,并且对应输出对应的置信度,该置信度被归一化至[0,1]数值空间,其数值越高,表示商品数据条目与用户行为数据越匹配,由此,其置信度可被视为商品数据条目相对应的匹配度,也可作为排序分值。
对所述的候选数据集中的各个商品数据条目,可将每一个商品数据条目相对应的商品特征信息联合所述用户偏好特征信息作为两路输入,输入至所述第三神经网络模型中计算出相应的匹配度,然后便可将该匹配度与该商品数据条目建立映射关系数据。
步骤S1123、将匹配度高于预设阈值的商品数据条目及其相应的匹配度构造为映射关系数据,存储于第二商品数据集中:
经过前面的步骤,第二召回通道所获得的第二商品数据集中,各个商品数据条目均获得一个相应的可作为排序分值的匹配度,由此,可利用一个预设阈值,对其进行初步选优,确定出匹配度高于所述预设阈值的商品数据条目,保留为第二商品数据集,而将其他的商品数据条目予以删除。
本实施例中,经由第二召回通道获得的是与用户的行为数据特征构成相匹配的商品相对应的商品数据条目,从用户偏好的维度实现了数据查全的效果,其中,由于粗召回阶段所获取的数据量级可能较大,例如上万或十万级,通过此处的筛选,可以实现对第二商品数据集的商品数据条目总量的初步压缩,可以提升后续处理过程的运算效率。
请参阅图4,深化的实施例中,所述步骤S1400、从所述汇总数据集中确定排序靠前的部分商品数据条目作为商品推荐的粗排序数据集的步骤之后,包括如下步骤:
步骤S1500、将所述粗排序数据集推送至精排序接口以对所述粗排序数据集处理为精排序数据集后推送至终端设备:
根据商品推荐系统的两阶段理论,前述各实施例所获得的粗排序数据,需要传递至排序阶段做进一步的精排序处理,据此,可调用商品推荐系统预设的精排序接口,将所述的粗排序数据集推送至该精排序接口,由精排序接口预设的业务逻辑对所述粗排序数据集进行精排序。所述精排序接口的业务逻辑,可由本领域技术人员根据商品推荐系统的需求灵活设定,其旨在为进一步精准命中满足所述商品搜索、商品广告投放等需求所需的商品数据条目,实现数据查准,为终端设备提供有效的目标商品数据条目,从而各种下游任务的有效执行。
当成功调用所述精排序接口实现精排序,而获得相应的精排序数据集后,便可由精排序对应的业务逻辑将所述精排序数据集推送至相应的终端设备,完成整个商品推荐过程。
步骤S1600、响应于所述精排序接口返回的失败事件,将所述粗排序数据集推送至终端设备:
一旦所述的精排序接口由于某种原因导致无法执行排序阶段的业务逻辑,会导致商品推荐系统无法向终端设备推送下游任务所需的商品数据条目,此时,响应于精排序接口返回的调用失败事件,可直接向下游任务所在的终端设备推送所述的粗排序数据,由于所述粗排序数据已经实现了对多个召回通道的商品数据集的综合和优选,因而,也能起到有效推荐的补充作用。
本实施例通过对精排序调用失败时进行响应,实现对商品推荐系统的容灾机制,当商品推荐系统的精排序接口失效时,可以采用粗排序数据集用于辅助实现商品搜索、商品广告投放之类的下游任务,确保下游任务有效运行。
请参阅图5,在本申请前述任意实施例的基础上继续深化的实施例中,所述步骤S1200、匹配各个召回通道对应预设的权重,包括如下步骤:
步骤S1210、根据精排序接口产出的精排序数据集相对于所述粗排序数据集的排序位置变化,量化统计出各个召回通道的商品数据条目精排序后的综合位置评分:
所述精排序接口,根据其固有的业务逻辑对所述的粗排序数据进行精排序并获得精排序数据集后,不难理解,粗排序数据集中各个商品数据条目,其排序位置相对于其在所述粗排序数据集中的排序位置通常会发生变化,据此,可根据每一召回通道相对应的商品数据集,确定出根据该商品数据集处理获得的粗排序数据集中的各个商品数据条目在所述精排序数据集中的排序位置,然后量化这些排序位置,统计出该商品数据集映射到所述精排序数据集中的综合位置评分。不难理解,不同的召回通道将获得不同的综合位置评分,所述综合位置评分反映了精排序系统对各个召回通道获得的商品数据条目的采纳程度。
步骤S1220、根据所述综合位置评分校正所述预设的粗排权重:
所述的综合位置评分可以用于校正各个召回通道相对应的所述粗排权重,一种实施例中,可以直接将所述综合位置评分用于替换原来的粗排权重,以便在后续执行召回时发挥作用,实现对粗排权重的修正。另一实施例中,可以对各个召回通道相对应的综合位置评分进行归一化,确定出各个召回通道相对应的相对比例数值,将这一相对比例数据用做相应的召回通道的粗排权重的修正权重,取粗排权重与修正权重的乘积作为同一召回通道的新的粗排权重,也可实现对粗排权重的修正。
本实施例中,通过利用精排序接口的精排序数据集中各召回通道相对应的商品数据条目的排序位置变化信息量化出粗排权重相对应的修正数据,即所述的综合位置评分,然后根据所述的综合位置评分对相应的如召回通道的粗排权重进行修正,实现对商品推荐系统的精排序结果的信息价值的循环利用,从而构建一个反哺机制,使得各个召回通道的权重可以在商品推荐系统的不断使用过程中持续修正,最终整个商品推荐系统的查全率和查准率,使商品推荐系统运行更为高效精准。
请参阅图6,具体化的实施例中,所述步骤S1210中,量化统计出各个召回通道的商品数据条目精排序后的综合位置评分,还包括如下步骤:
步骤S1211、统计各个召回通道相对应的商品数据条目在精排序后的序号的总和:
本实施例中,以精排序数据集所包含的商品数据条目为据,根据这些商品数据条目由何一召回通道提供而确定各个商品数据条目相对应的排序位置相对应的序号,例如对应第一召回通道的各个商品数据条目为1、2、3、6、7;对应第二召回通道的各个商品数据条目为4、5、8、9、10。然后,分别对应各个召回通道对所述的序号进行数值加和,由此,对应第一召回通道,获得的总和为19,对应第二召回通道获得的总和为36。如果同一商品数据条目同时属于多个召回通道时,各个召回通道均可对该商品数据条目的序号进行加和。不难理解,所获得的序号总和,实际上表征了召回通道所获得的商品数据条目在商品推荐系统最终精排序后的密切程度,其对应的总和越大,则该召回通道的贡献越大,反之亦然。
步骤S1212、对各个召回通道相对应的总和进行归一化作为各个召回通道的综合位置评分:
确定各个召回通道相对应的排序位置的序号总和后,便可对其进行归一化,示例的方式例如,将各个召回通道的总和除以所有召回通道的总和之和,例如,第一召回通道获得的归一化数值为19/(19+36)=0.35,第二召回通道获得的归一化数值为36/(19+36)=0.65,于是这些归一化数值便可以作为精排序后对各个召回通道的综合位置评分,用于修正所述的召回阶段的粗排权重,例如在每个召回通道的原粗排权重的基础上乘以其相应的正向表示的综合位置评分作为新的精排权重即可。所述正向的综合位置评分是指在综合位置评分的基础上,根据该评分所表示的意见,对其数值进行反向调节获得的结果,例如,由于第一召回通道的商品数据条目总体上更为靠前,而其获得的归一化数值更低,为0.35,为了使综合位置评分更能表示数值越大重要性越高,故将1-0.35=0.65确定了正向的综合位置评分,作为第一召回通道用于修正其粗排权重的有效的综合位置评分。对于第二召回通道也同理。本质上,正向的综合位置评分的确定也是归一化过程中可以合并解决的,对此,本领域技术人员可灵活实施。可见此处示例中,所述综合位置评分起到所述粗排权重的微调权重的作用,实现对预设的粗排权重的修正。
本实施例中,通过示例出利用精排序后的序号确定各个召回通道的综合位置评分的过程,揭示了精排序数据集中各个商品数据条目的排序位置所隐含的数据价值,实现对精排序数据集的数据价值挖掘,反哺服务于商品推荐系统的召回阶段,不断提升商品召回阶段各个召回通道所获得的商品数据集与排序阶段的密切配合程度,从而可以更为高效地服务于商品推荐系统,使商品搜索、商品广告投放之类的下游任务更能获得精准有效的目标商品数据条目。
请参阅图7,适应本申请的目的之一而提供的一种商品推荐装置,是对本申请的商品推荐方法的功能化体现,该装置包括数据获取模块1100、分值计算模块1200、数据倒排模块1300,以及数据筛选模块1400,其中:所述数据获取模块1100,用于获取多个召回通道相对应的商品数据集,所述商品数据集中包含多个商品数据条目,每个商品数据条目包含召回过程中确定的排序分值;所述分值计算模块1200,用于匹配各个召回通道对应预设的粗排权重,计算出各个商品数据集中商品数据条目的排序分值加权后的综合分值,合并各个商品数据集获得汇总数据集,实现对不同商品数据集中的相同商品数据条目的综合分值的汇总;所述数据倒排模块1300,用于根据所述综合分值对所述汇总数据集的商品数据条目进行倒排序;所述数据筛选模块1400,用于从所述汇总数据集中确定排序靠前的部分商品数据条目作为商品推荐的粗排序数据集。
深化的实施例中,所述数据获取模块1100,包括:第一获取模块,用于通过第一召回通道从候选数据集中选取出商品特征信息与目标商品特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第一商品数据集,所述匹配度作为排序分值;第二获取模块,用于通过第二召回通道从候选数据集中选取出商品特征信息与用户偏好特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第二商品数据集,所述匹配度作为排序分值。
深化的实施例中,所述第一获取模块,包括:目标确定单元,用于从所述候选数据集中获取用户访问的目标商品的商品特征信息,所述商品特征信息由第一神经网络模型所提取;语义匹配单元,用于计算目标商品特征信息与所述候选数据集中各个商品数据条目所携带的商品特征信息之间语义上的匹配度;数据筛选单元,用于将匹配度高于预设阈值的商品数据条目及其相应的匹配度构造为映射关系数据,存储于第一商品数据集中。
深化的实施例中,所述第二获取模块,包括:行为获取单元,用于获取用户行为记录数据,采用第二神经网络模型提取出相应的用户偏好特征信息;匹配运算单元,用于分别将所述候选数据集中的每个商品数据条目的商品特征信息结合所述用户偏好特征信息共同输入第三神经网络模型确定出每个商品数据条目与所述用户偏好特征信息之间的匹配度;数据筛选单元,用于将匹配度高于预设阈值的商品数据条目及其相应的匹配度构造为映射关系数据,存储于第二商品数据集中。
深化的实施例中,所述数据筛选模块1400,包括:精排推送单元,用于将所述粗排序数据集推送至精排序接口以对所述粗排序数据集处理为精排序数据集后推送至终端设备;粗排推送单元,用于响应于所述精排序接口返回的失败事件,将所述粗排序数据集推送至终端设备。
深化的实施例中,所述分值计算模块1200,包括:量化统计单元,用于根据精排序接口产出的精排序数据集相对于所述粗排序数据集的排序位置变化,量化统计出各个召回通道的商品数据条目精排序后的综合位置评分;权重校正单元,用于根据所述综合位置评分校正所述预设的粗排权重。
具体化的实施例中,所述量化统计单元,包括:统计单元,用于统计各个召回通道相对应的商品数据条目在精排序后的序号的总和;量化单元,用于对各个召回通道相对应的总和进行归一化作为各个召回通道的综合位置评分。
为解决上述技术问题,本申请实施例还提供计算机设备。如图8所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种商品推荐方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的商品推荐方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图7中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的商品推荐装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的商品推荐方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本申请任一实施例所述方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请能够提升电商平台在商品搜索、商品广告、商品排序等应用场景中的数据匹配精准度,从而提升用户体验。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种商品推荐方法,其特征在于,包括如下步骤:
获取多个召回通道相对应的商品数据集,所述商品数据集中包含多个商品数据条目,每个商品数据条目包含召回过程中确定的排序分值;
匹配各个召回通道对应预设的粗排权重,计算出各个商品数据集中商品数据条目的排序分值加权后的综合分值,合并各个商品数据集获得汇总数据集,实现对不同商品数据集中的相同商品数据条目的综合分值的汇总;
根据所述综合分值对所述汇总数据集的商品数据条目进行倒排序;
从所述汇总数据集中确定排序靠前的部分商品数据条目作为商品推荐的粗排序数据集。
2.根据权利要求1所述的商品推荐方法,其特征在于,获取多个召回通道相对应的商品数据集,包括如下步骤:
通过第一召回通道从候选数据集中选取出商品特征信息与目标商品特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第一商品数据集,所述匹配度作为排序分值;
通过第二召回通道从候选数据集中选取出商品特征信息与用户偏好特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第二商品数据集,所述匹配度作为排序分值。
3.根据权利要求2所述的商品推荐方法,其特征在于,通过第一召回通道从候选数据集中选取出商品特征信息与目标商品特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第一商品数据集,包括如下步骤:
从所述候选数据集中获取用户访问的目标商品的商品特征信息,所述商品特征信息由第一神经网络模型所提取;
计算目标商品特征信息与所述候选数据集中各个商品数据条目所携带的商品特征信息之间语义上的匹配度;
将匹配度高于预设阈值的商品数据条目及其相应的匹配度构造为映射关系数据,存储于第一商品数据集中。
4.根据权利要求2所述的商品推荐方法,其特征在于,通过第二召回通道从候选数据集中选取出商品特征信息与用户偏好特征信息相匹配的商品数据条目,将所述商品数据条目及其相应的匹配度构成的映射关系数据存储于第二商品数据集,包括如下步骤:
获取用户行为记录数据,采用第二神经网络模型提取出相应的用户偏好特征信息;
分别将所述候选数据集中的每个商品数据条目的商品特征信息结合所述用户偏好特征信息共同输入第三神经网络模型确定出每个商品数据条目与所述用户偏好特征信息之间的匹配度;
将匹配度高于预设阈值的商品数据条目及其相应的匹配度构造为映射关系数据,存储于第二商品数据集中。
5.根据权利要求1至4中任意一项所述的商品推荐方法,其特征在于,从所述汇总数据集中确定排序靠前的部分商品数据条目作为商品推荐的粗排序数据集的步骤之后,包括如下步骤:
将所述粗排序数据集推送至精排序接口以对所述粗排序数据集处理为精排序数据集后推送至终端设备;
响应于所述精排序接口返回的失败事件,将所述粗排序数据集推送至终端设备。
6.根据权利要求5所述的商品推荐方法,其特征在于,匹配各个召回通道对应预设的权重,包括如下步骤:
根据精排序接口产出的精排序数据集相对于所述粗排序数据集的排序位置变化,量化统计出各个召回通道的商品数据条目精排序后的综合位置评分;
根据所述综合位置评分校正所述预设的粗排权重。
7.根据权利要求6所述的商品推荐方法,其特征在于,量化统计出各个召回通道的商品数据条目精排序后的综合位置评分,还包括如下步骤:
统计各个召回通道相对应的商品数据条目在精排序后的序号的总和;
对各个召回通道相对应的总和进行归一化作为各个召回通道的综合位置评分。
8.一种商品推荐装置,其特征在于,包括:
数据获取模块,用于获取多个召回通道相对应的商品数据集,所述商品数据集中包含多个商品数据条目,每个商品数据条目包含召回过程中确定的排序分值;
分值计算模块,用于匹配各个召回通道对应预设的粗排权重,计算出各个商品数据集中商品数据条目的排序分值加权后的综合分值,合并各个商品数据集获得汇总数据集,实现对不同商品数据集中的相同商品数据条目的综合分值的汇总;
数据倒排模块,用于根据所述综合分值对所述汇总数据集的商品数据条目进行倒排序;
数据筛选模块,用于从所述汇总数据集中确定排序靠前的部分商品数据条目作为商品推荐的粗排序数据集。
9.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210394151.4A CN114971766A (zh) | 2022-04-14 | 2022-04-14 | 商品推荐方法及其装置、设备、介质、产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210394151.4A CN114971766A (zh) | 2022-04-14 | 2022-04-14 | 商品推荐方法及其装置、设备、介质、产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114971766A true CN114971766A (zh) | 2022-08-30 |
Family
ID=82977789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210394151.4A Pending CN114971766A (zh) | 2022-04-14 | 2022-04-14 | 商品推荐方法及其装置、设备、介质、产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114971766A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117455579A (zh) * | 2023-12-25 | 2024-01-26 | 深圳市智岩科技有限公司 | 商品推荐干预方法、装置以及介质和设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339383A (zh) * | 2015-07-07 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 一种搜索排序方法及系统 |
CN110941762A (zh) * | 2019-12-02 | 2020-03-31 | 上海麦克风文化传媒有限公司 | 一种个性化推荐系统排序结果的改进方法 |
CN112232915A (zh) * | 2019-12-23 | 2021-01-15 | 北京来也网络科技有限公司 | 结合rpa与ai的商品推荐方法和装置 |
CN113407849A (zh) * | 2021-07-15 | 2021-09-17 | 百果园技术(新加坡)有限公司 | 一种粗排序的方法及装置 |
CN113627967A (zh) * | 2020-05-09 | 2021-11-09 | 北京奇虎科技有限公司 | 行为数据处理方法、装置、设备及存储介质 |
CN114119131A (zh) * | 2021-10-26 | 2022-03-01 | 上海赛可出行科技服务有限公司 | 一种网约车优惠券商品自动上架推荐方法 |
-
2022
- 2022-04-14 CN CN202210394151.4A patent/CN114971766A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339383A (zh) * | 2015-07-07 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 一种搜索排序方法及系统 |
CN110941762A (zh) * | 2019-12-02 | 2020-03-31 | 上海麦克风文化传媒有限公司 | 一种个性化推荐系统排序结果的改进方法 |
CN112232915A (zh) * | 2019-12-23 | 2021-01-15 | 北京来也网络科技有限公司 | 结合rpa与ai的商品推荐方法和装置 |
CN113627967A (zh) * | 2020-05-09 | 2021-11-09 | 北京奇虎科技有限公司 | 行为数据处理方法、装置、设备及存储介质 |
CN113407849A (zh) * | 2021-07-15 | 2021-09-17 | 百果园技术(新加坡)有限公司 | 一种粗排序的方法及装置 |
CN114119131A (zh) * | 2021-10-26 | 2022-03-01 | 上海赛可出行科技服务有限公司 | 一种网约车优惠券商品自动上架推荐方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117455579A (zh) * | 2023-12-25 | 2024-01-26 | 深圳市智岩科技有限公司 | 商品推荐干预方法、装置以及介质和设备 |
CN117455579B (zh) * | 2023-12-25 | 2024-04-09 | 深圳市智岩科技有限公司 | 商品推荐干预方法、装置以及介质和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230102337A1 (en) | Method and apparatus for training recommendation model, computer device, and storage medium | |
CN108885624B (zh) | 信息推荐系统及方法 | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN112364204B (zh) | 视频搜索方法、装置、计算机设备及存储介质 | |
CN109993627B (zh) | 推荐方法、推荐模型的训练方法、装置和存储介质 | |
CN114065750A (zh) | 商品信息匹配、发布方法及其装置、设备、介质、产品 | |
CN111125528A (zh) | 信息推荐方法及装置 | |
CN113627995A (zh) | 商品推荐列表更新方法及其装置、设备、介质、产品 | |
CN114663197A (zh) | 商品推荐方法及其装置、设备、介质、产品 | |
CN114186013A (zh) | 实体识别模型热更新方法及其装置、设备、介质、产品 | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
CN115130711A (zh) | 一种数据处理方法、装置、计算机及可读存储介质 | |
CN114663164A (zh) | 电商站点推广配置方法及其装置、设备、介质、产品 | |
CN115545832A (zh) | 商品搜索推荐方法及其装置、设备、介质 | |
CN114862480A (zh) | 广告投放定向方法及其装置、设备、介质、产品 | |
CN115099857A (zh) | 广告商品组合发布方法及其装置、设备、介质、产品 | |
CN114971766A (zh) | 商品推荐方法及其装置、设备、介质、产品 | |
CN113987161A (zh) | 一种文本排序方法及装置 | |
CN114218426A (zh) | 音乐视频推荐方法及其装置、设备、介质、产品 | |
CN113971599A (zh) | 广告投放选品方法及其装置、设备、介质、产品 | |
CN113704620A (zh) | 基于人工智能的用户标签更新方法、装置、设备及介质 | |
CN116823404A (zh) | 商品组合推荐方法及其装置、设备、介质 | |
CN116485503A (zh) | 商品组合推荐方法及其装置、设备、介质 | |
CN115907928A (zh) | 商品推荐方法及其装置、设备、介质 | |
CN115292603A (zh) | 商品搜索方法及其装置、设备、介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |