CN114049172A - 物品推荐排序方法、装置、计算机设备及存储介质 - Google Patents
物品推荐排序方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN114049172A CN114049172A CN202111314663.7A CN202111314663A CN114049172A CN 114049172 A CN114049172 A CN 114049172A CN 202111314663 A CN202111314663 A CN 202111314663A CN 114049172 A CN114049172 A CN 114049172A
- Authority
- CN
- China
- Prior art keywords
- recommended
- item
- order
- articles
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请适用于计算机领域,提供了一种物品推荐排序方法、装置、计算机设备及存储介质,包括:获取目标用户的日志信息和待推荐物品,日志信息包括用户信息和用户点击序列;对获取的用户信息和用户点击序列进行预处理产生一阶特征,对部分一阶特征进行处理得到二阶特征;确定待推荐物品的one‑hot编码,并将多个待推荐物品的one‑hot编码映射成可区分的低维向量;根据一阶特征、二阶特征及待推荐物品的低维向量构建训练集并训练LightGBM模型;根据LightGBM模型生成用户点击序列和待推荐物品的相似度结果,根据相似度结果向目标用户推荐待推荐物品中的物品,本申请的物品推荐排序方法能够降低模型的存储空间,提高模型的更新与迭代速度,进一步提高物品推荐排序的效率。
Description
技术领域
本申请属于计算机领域,尤其涉及一种物品推荐排序方法、装置、计算机设备及存储介质。
背景技术
排序模型在推荐系统里占有重要地位,好的排序模型可以使得系统推荐给用户的物品更具有个性化,能够有效提高用户的个人体验。目前主流的推荐系统一般采用DNN的排序模型,如DIN,Deep&wide network,DeepFM等技术的模型。然而DNN的排序模型虽然性能优越,但是基于DNN的排序模型对硬件的要求较高,推荐排序的规模越大,所要消耗的硬件资源就越多,因此无法适用于所有的应用场景。
同时,由于DNN的训练特性,训练基于DNN的排序模型往往需要大量的样本,一般是数百万以上,给样本的搜集和存储带来诸多不便。DNN模型的大样本训练会导致时间延长,模型的迭代速度缓慢,导致物品的推荐排序效率较低,用户体验较差。
发明内容
本申请的目的在于提供一种物品推荐排序方法、装置、计算机设备及存储介质,旨在解决现有技术中排序模型的迭代速度缓慢、物品的推荐排序效率较低的技术问题。
本申请是这样实现的:
第一方面,本申请实施例提供一种物品推荐排序方法,包括:
获取目标用户的日志信息和待推荐物品,所述日志信息包括用户信息和用户点击序列;
对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,对部分所述一阶特征进行处理得到二阶特征;
确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量;
根据所述一阶特征、所述二阶特征及所述待推荐物品的低维向量构建训练集并训练LightGBM模型;
根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果,根据所述相似度结果向所述目标用户推荐所述待推荐物品中的物品。
可选地,所述用户点击序列包括当前时间之前的至少一个历史物品的物品信息,所述历史物品的物品信息包括所述历史物品的分享数量和所述历史物品的点击率。
可选地,所述对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,对部分所述一阶特征进行处理得到二阶特征,包括:
对所述历史物品的分享数量和所述历史物品的点击率进行运算处理产生一阶特征;
将所述历史物品的分享数量的一阶特征和所述历史物品的点击率的一阶特征做乘积运算,得到所述二阶特征。
可选地,所述确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量包括:
采用one-hot对每一个所述待推荐物品进行编码;
对所述待推荐物品进行初始化,形成高维向量表示,更新所述待推荐物品集合后的高维向量表示;
基于权重矩阵,采用全连接网络将所述高维向量表示进行线性变换,映射成可区分的低维向量。
可选地,所述确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量包括:
采用one-hot对一个所述待推荐物品进行编码,具体的one-hot编码为[0 0 0 10];
所述基于权重矩阵,采用全连接网络将所述高维向量表示进行线性变换,映射成可区分的低维向量,包括:
得到[10 12 19]即为one-hot编码为[0 0 0 1 0]的低维向量。
可选地,所述根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果包括:
对所述一阶特征和所述二阶特征进行处理得到特征向量;
采用LightGBM模型计算所述特征向量和所述待推荐物品的相似度;
根据每一个所述待推荐物品的相似度结果向所述目标用户推荐物品。
可选地,所述特征向量和所述待推荐物品的相似度是通过计算所述特征向量和所述待推荐物品余弦相似度得到。
第二方面,本申请实施例提供一种物品推荐排序装置,包括:
获取模块,被配置为获取目标用户的日志信息和待推荐物品,所述日志信息包括用户信息和用户点击序列;
特征生成模块,对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,对部分所述一阶特征进行处理得到二阶特征;
低维处理模块,确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量;
模型训练模块,根据所述一阶特征、所述二阶特征及所述待推荐物品的低维向量构建训练集并训练LightGBM模型;
排序推荐模块,根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果,根据所述相似度结果向所述目标用户推荐所述待推荐物品中的物品。
第三方面,本申请实施例提供种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如上述所述的物品推荐排序方法的步骤。
第四方面,本申请实施例提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述所述的物品推荐排序方法的步骤。
本申请提供的物品推荐排序方法获取目标用户的日志信息和待推荐物品,所述日志信息包括用户信息和用户点击序列;对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,对部分所述一阶特征进行处理得到二阶特征;确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量;根据所述一阶特征、所述二阶特征及所述待推荐物品的低维向量构建训练集并训练LightGBM模型;根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果,根据所述相似度结果向所述目标用户推荐所述待推荐物品中的物品,该物品推荐排序方法通过一阶特征和二阶特征的处理,能够更精准的为用户推荐物品,且采用低维向量处理,模型占用的存储空间较小,消耗的硬件资源相对较少,更新与迭代速度快,有效提高推荐排序效率。
附图说明
图1是本申请实施例提供的物品推荐排序方法的流程示意图;
图2是本申请实施例提供的产生二阶特征的流程示意图;
图3是本申请实施例提供的产生二阶特征的结构示意图;
图4是本申请实施例提供的映射成低维向量的流程示意图;
图5是本申请实施例提供的映射成低维向量的结构示意图;
图6是本申请实施例提供的物品推荐排序方法的模型示意图;
图7是本申请实施例提供的物品推荐排序装置的各模块框图;
图8是本申请实施例提供的电子设备的结构示意图;
图9是本申请实施例提供的服务器的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本技术领域技术人员可以理解,这里所使用的“设备”既包括无线信号接收器的设备,其仅具备无发射能力的发射信号接收器的设备,又包括发射和接收硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。
如图1所示,为本申请实施例提供的一种物品推荐排序方法,包括:
S1000、获取目标用户的日志信息和待推荐物品,所述日志信息包括用户信息和用户点击序列;
S2000、对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,对部分所述一阶特征进行处理得到二阶特征;
S3000、确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量;
S4000、根据所述一阶特征、所述二阶特征及所述待推荐物品的低维向量构建训练集并训练LightGBM模型;
S5000、根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果,根据所述相似度结果向所述目标用户推荐所述待推荐物品中的物品。
在本实施例中,所述日志信息包括用户信息和用户点击序列。具体的,用户信息可以是用户账号等信息。所述用户点击序列包括当前时间之前的至少一个历史物品的物品信息,所述历史物品的物品信息包括所述历史物品的分享数量和所述历史物品的点击率。
基于此,可以查找所述目标用户的历史搜索记录、针对同一物品的搜索频次、具体的交易记录以及收藏记录等。对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,可以通过采集历史搜索记录数据、搜索频次数据、交易记录数据以及收藏记录数据,进行加工汇总得出所述目标用户的特征,对部分所述一阶特征进行处理可以得到二阶特征。
所述待推荐物品存储在物料库中,其数量为多个,可以是百万级甚至更高,在此不做限制。确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量。所述待推荐物品本身具有一定的特征,如被浏览次数、被点击次数等。进一步的,所述目标用户与所述待推荐物品之间存在交叉关系,如目标用户通过搜索在物料库中寻找所述待推荐物品,或进一步点击和收藏所述待推荐物品。可以根据所述目标用户与所述待推荐物品之间的交叉关系,进一步计算并更新相关特征,以更加准确的反馈相关推荐排序结果。
根据所述一阶特征、所述二阶特征及所述待推荐物品的低维向量构建训练集并训练LightGBM模型。本实施例训练并使用LightGBM模型,其通过全量的训练数据得到最优的排列结果。根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果,根据所述相似度结果向所述目标用户推荐所述待推荐物品中的物品。
本申请实施例基于所述一阶特征、所述二阶特征及所述待推荐物品的低维向量构建训练集并训练LightGBM模型,采用LightGBM模型进行物品排序,其占用的内存较低,消耗的硬件资源相对较少,数据分隔的复杂度也更低,更新与迭代速度更快,有效提高推荐排序效率。
如图2和图3所示,为本申请实施例提供的产生二阶特征的流程示意图。对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,对部分所述一阶特征进行处理得到二阶特征,包括:
S2100、对所述历史物品的分享数量和所述历史物品的点击率进行运算处理产生一阶特征;
S2200、将所述历史物品的分享数量的一阶特征和所述历史物品的点击率的一阶特征做乘积运算,得到所述二阶特征。
在本实施例中,所述二阶特征是指将所述一阶特征进行运算操作产生的特征。具体的,若所述一阶特征包含所述历史物品的分享数量和所述历史物品的点击率,首先对所述历史物品的分享数量和所述历史物品的点击率进行运算处理产生一阶特征,进一步的,将所述历史物品的分享数量的一阶特征和所述历史物品的点击率的一阶特征做乘积运算得到一个新的特征,即为所述二阶特征。
本实施例中的,所述历史物品的物品信息不仅包括所述历史物品的分享数量和所述历史物品的点击率,还可以包括所述历史物品的收藏情况、加入购物车情况等,在此不做限制。进一步的,可根据所述历史物品的收藏情况、所述历史物品的加入购物车情况,对其进行运算处理,得到所述二阶特征。
本申请实施例基于所述一阶特征和所述二阶特征,可进一步判断和比较所述目标用户对所述待推荐物品的点击欲望,从而能够更精准的为所述目标用户推荐所述待推荐物品中的物品,更好的提升所述目标用户的主观体验。
如图4所示,为本申请实施例提供的映射成低维向量的流程示意图。
所述确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量包括:
S3100、采用one-hot对每一个所述待推荐物品进行编码;
S3200、对所述待推荐物品进行初始化,形成高维向量表示,更新所述待推荐物品集合后的高维向量表示;
S3300、基于权重矩阵,采用全连接网络将所述高维向量表示进行线性变换,映射成可区分的低维向量。
在本实施例中,首先对物料库中的所述待推荐物品进行one-hot编码,例如当物料库中有A、B、C、D、E五个物品,则物品A可以表示为[1 0 0 0 0],物品B可以表示为[0 1 0 00],物品C可以表示为[0 0 1 0 0],物品D可以表示为[0 0 0 1 0],物品E可以表示为[0 00 0 1]。采用此编码方式简单明了,但是当物料库中的物品达到百万级时,每个物品的编码维度将达到百万维。
如图5所示,此处可以采用embedding方法,基于简单的全连接网络,将百万维的向量映射成可区分的低维向量。
如下为输入向量低维化处理得到三维向量的过程,所述确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量包括:
采用one-hot对一个所述待推荐物品进行编码,具体的one-hot编码为[0 0 0 10];
所述基于权重矩阵,采用全连接网络将所述高维向量表示进行线性变换,映射成可区分的低维向量,包括:
得到[10 12 19]即为one-hot编码为[0 0 0 1 0]的低维向量。
本申请实施例采用embedding方法,基于简单的全连接网络,将百万维的向量映射成可区分的低维向量,采用embedding方法,能够用低维向量对物料库中的所述待推荐物品进行编码,同时能够保留所述待推荐物品的特征。将embedding编码后的低维向量喂入LightGBM模型,能够有效提高物品推荐排序效率。
如图6所示,为本申请实施例提供的物品推荐排序方法的模型示意图。
在本实施例中,所述根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果包括:
对所述一阶特征和所述二阶特征进行处理得到特征向量;
采用LightGBM模型计算所述特征向量和所述待推荐物品的相似度;
根据每一个所述待推荐物品的相似度结果向所述目标用户推荐物品。
其中,所述特征向量和所述待推荐物品的相似度是通过计算所述特征向量和所述待推荐物品余弦相似度得到。
在n维坐标中,其余弦相似度通过如下计算公式得到:
其中A、B分别代表所述特征向量和所述待推荐物品的低纬向量,n代表n维的坐标。
若相似度数值越接近1,说明所述特征向量与所述待推荐物品的相似度越高,余弦夹角的角度约接近0°。因此,可以基于余弦相似度的计算结果向所述目标用户推荐所述待推荐物品中的物品。
本申请实施例通过对物料库中的所述待推荐物品进行编码、低维处理,进一步计算所述待推荐物品的低维向量与所述特征向量的余弦相似度,基于相似度的结果,从而向所述目标用户推荐所述待推荐物品中的物品。本申请实施例提供的物品推荐排序方法,占用存储空间小,物品排序高效,有效提高物品推荐效率。
如图7所示,本申请还提供了一种物品推荐排序装置,包括:
获取模块1000,被配置为获取目标用户的日志信息和待推荐物品,所述日志信息包括用户信息和用户点击序列;
特征生成模块2000,对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,对部分所述一阶特征进行处理得到二阶特征;
低维处理模块3000,确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量;
模型训练模块4000,根据所述一阶特征、所述二阶特征及所述待推荐物品的低维向量构建训练集并训练LightGBM模型;
排序推荐模块5000,根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果,根据所述相似度结果向所述目标用户推荐所述待推荐物品中的物品。
由于上述物品推荐排序装置是物品推荐排序方法一一对应的装置,其实现原理与物品推荐排序方法一样,此处不再赘述。
本一实施例中,请参阅图8,提供了计算机设备基本结构框图。
该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种物品推荐排序方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种物品推荐排序方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
处理器可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-ProgrammableGate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1001也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central Processing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1001还可以包括AI(ArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
本申请还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例所述物品推荐排序方法。
存储器可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器所执行以实现本申请中方法实施例提供的物品推荐排序方法。
如图9示出了本申请一个实施例提供的服务器的结构示意图。该服务器用于实施上述实施例中提供的物品推荐排序方法。具体来讲:
所述服务器包括中央处理单元(CPU)、包括随机存取存储器(RAM)和只读存储器(ROM)的系统存储器,以及连接系统存储器和中央处理单元的系统总线。所述服务器还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统),和用于存储操作系统、应用程序和其他程序模块的大容量存储设备。
所述基本输入/输出系统包括有用于显示信息的显示器和用于用户输入信息的诸如鼠标、键盘之类的输入设备。其中所述显示器和输入设备都通过连接到系统总线的输入输出控制器连接到中央处理单元。所述基本输入/输出系统还可以包括输入输出控制器以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。
所述大容量存储设备通过连接到系统总线的大容量存储控制器(未示出)连接到中央处理单元。所述大容量存储设备及其相关联的计算机可读介质为服务器提供非易失性存储。也就是说,所述大容量存储设备可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器和大容量存储设备可以统称为存储器。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)和计算机程序产品的流程图和/或方框图中的流程和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图中的一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
另外,在本发明各个实施例中的各功能装置可以集成在相同数据处理装置中,也可以是各个装置单独物理存在,也可以两个或两个以上装置集成在相同装置中。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他装置或步骤,单数不排除复数。计算机装置权利要求中陈述的多个装置或计算机装置也可以由同一个计算机装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内所作的任何修改、等同替换或改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种物品推荐排序方法,其特征在于,包括:
获取目标用户的日志信息和待推荐物品,所述日志信息包括用户信息和用户点击序列;
对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,对部分所述一阶特征进行处理得到二阶特征;
确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量;
根据所述一阶特征、所述二阶特征及所述待推荐物品的低维向量构建训练集并训练LightGBM模型;
根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果,根据所述相似度结果向所述目标用户推荐所述待推荐物品中的物品。
2.如权利要求1所述的物品推荐排序方法,其特征在于:所述用户点击序列包括当前时间之前的至少一个历史物品的物品信息,所述历史物品的物品信息包括所述历史物品的分享数量和所述历史物品的点击率。
3.如权利要求2所述的物品推荐排序方法,其特征在于,所述对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,对部分所述一阶特征进行处理得到二阶特征,包括:
对所述历史物品的分享数量和所述历史物品的点击率进行运算处理产生一阶特征;
将所述历史物品的分享数量的一阶特征和所述历史物品的点击率的一阶特征做乘积运算,得到所述二阶特征。
4.如权利要求1所述的物品推荐排序方法,其特征在于:所述确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量包括:
采用one-hot对每一个所述待推荐物品进行编码;
对所述待推荐物品进行初始化,形成高维向量表示,更新所述待推荐物品集合后的高维向量表示;
基于权重矩阵,采用全连接网络将所述高维向量表示进行线性变换,映射成可区分的低维向量。
6.如权利要求1所述的物品推荐排序方法,其特征在于,所述根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果包括:
对所述一阶特征和所述二阶特征进行处理得到特征向量;
采用LightGBM模型计算所述特征向量和所述待推荐物品的相似度;
根据每一个所述待推荐物品的相似度结果向所述目标用户推荐物品。
7.如权利要求6所述的物品推荐排序方法,其特征在于,所述特征向量和所述待推荐物品的相似度是通过计算所述特征向量和所述待推荐物品余弦相似度得到。
8.一种物品推荐排序装置,其特征在于,包括:
获取模块,被配置为获取目标用户的日志信息和待推荐物品,所述日志信息包括用户信息和用户点击序列;
特征生成模块,对获取的所述用户信息和所述用户点击序列进行预处理产生一阶特征,对部分所述一阶特征进行处理得到二阶特征;
低维处理模块,确定所述待推荐物品的one-hot编码,并将多个所述待推荐物品的one-hot编码映射成可区分的低维向量;
模型训练模块,根据所述一阶特征、所述二阶特征及所述待推荐物品的低维向量构建训练集并训练LightGBM模型;
排序推荐模块,根据所述LightGBM模型生成所述用户点击序列和所述待推荐物品的相似度结果,根据所述相似度结果向所述目标用户推荐所述待推荐物品中的物品。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述的物品推荐排序方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述的物品推荐排序方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111314663.7A CN114049172A (zh) | 2021-11-08 | 2021-11-08 | 物品推荐排序方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111314663.7A CN114049172A (zh) | 2021-11-08 | 2021-11-08 | 物品推荐排序方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114049172A true CN114049172A (zh) | 2022-02-15 |
Family
ID=80207499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111314663.7A Pending CN114049172A (zh) | 2021-11-08 | 2021-11-08 | 物品推荐排序方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114049172A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116205694A (zh) * | 2023-05-04 | 2023-06-02 | 品茗科技股份有限公司 | 造价定额自动推荐配合比的方法、装置、设备及介质 |
CN116522003A (zh) * | 2023-07-03 | 2023-08-01 | 之江实验室 | 基于嵌入表压缩的信息推荐方法、装置、设备和介质 |
-
2021
- 2021-11-08 CN CN202111314663.7A patent/CN114049172A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116205694A (zh) * | 2023-05-04 | 2023-06-02 | 品茗科技股份有限公司 | 造价定额自动推荐配合比的方法、装置、设备及介质 |
CN116205694B (zh) * | 2023-05-04 | 2023-10-24 | 品茗科技股份有限公司 | 造价定额自动推荐配合比的方法、装置、设备及介质 |
CN116522003A (zh) * | 2023-07-03 | 2023-08-01 | 之江实验室 | 基于嵌入表压缩的信息推荐方法、装置、设备和介质 |
CN116522003B (zh) * | 2023-07-03 | 2023-09-12 | 之江实验室 | 基于嵌入表压缩的信息推荐方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108090208A (zh) | 融合数据处理方法及装置 | |
CN104246748B (zh) | 用于确定情境的系统和方法 | |
CN106251174A (zh) | 信息推荐方法及装置 | |
CN107704485A (zh) | 一种职位推荐方法及计算设备 | |
CN114049172A (zh) | 物品推荐排序方法、装置、计算机设备及存储介质 | |
Wang et al. | Comparative performance of logistic regression and survival analysis for detecting spatial predictors of land-use change | |
CN111309780B (zh) | 一种轨迹数据处理方法及装置 | |
CN112000736B (zh) | 时空轨迹伴随分析方法、系统及电子设备和存储介质 | |
CN102456058A (zh) | 类目信息提供方法及装置 | |
CN104679818A (zh) | 一种视频关键帧提取方法及系统 | |
CN111695960A (zh) | 一种对象推荐系统、方法、电子设备及存储介质 | |
CN103309869A (zh) | 数据对象的展示关键词推荐方法及系统 | |
CN101192220B (zh) | 适用于资源搜寻的标签建构方法及系统 | |
CN115423555A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
CN114281950B (zh) | 基于多图加权融合的数据检索方法与系统 | |
CN110427574B (zh) | 路线相似度确定方法、装置、设备和介质 | |
CN111445280A (zh) | 模型生成方法、餐馆排序方法、系统、设备和介质 | |
CN113094602B (zh) | 酒店推荐方法、系统、设备及介质 | |
CN117312688B (zh) | 基于时空资产目录的跨源数据检索方法、介质及设备 | |
CN113704620A (zh) | 基于人工智能的用户标签更新方法、装置、设备及介质 | |
CN113947456B (zh) | 线上商铺匹配方法及其装置、设备、介质、产品 | |
CN116578774A (zh) | 一种预估排序方法、装置、计算机设备及存储介质 | |
CN113761365A (zh) | 用于确定目标信息的数据处理系统 | |
CN111382342A (zh) | 一种热搜词的获取方法、装置、设备及存储介质 | |
CN111105274A (zh) | 数据处理方法、装置、介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |