CN113469786A - 物品推荐的方法、装置、计算机设备和存储介质 - Google Patents
物品推荐的方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113469786A CN113469786A CN202110724549.5A CN202110724549A CN113469786A CN 113469786 A CN113469786 A CN 113469786A CN 202110724549 A CN202110724549 A CN 202110724549A CN 113469786 A CN113469786 A CN 113469786A
- Authority
- CN
- China
- Prior art keywords
- target
- commodity
- recommended
- new
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000004364 calculation method Methods 0.000 claims abstract description 34
- 238000012163 sequencing technique Methods 0.000 claims abstract description 8
- 239000000284 extract Substances 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 13
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000012417 linear regression Methods 0.000 description 6
- 238000003066 decision tree Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000011478 gradient descent method Methods 0.000 description 4
- 238000012797 qualification Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 210000000988 bone and bone Anatomy 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例属于互联网领域,涉及一种物品推荐的方法,包括:服务器获取用户的历史记录中连续输入的多个检索词,以及从该用户在预设时间内连续点击的链接中提取对应链接的标题名称;将每次连接记录中的检索词或标题名称作为元素形成多个目标集合;通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品;通过相似度计算模型计算所述目标商品与所述新品库中的待推荐新品包的相似度;将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户。本申请提出的物品推荐的方法,所推荐物品提升了与用户需要购买的物品的吻合程度,提升了推荐结果的准确性。
Description
技术领域
本申请涉及物品推荐技术领域,尤其涉及一种物品推荐的方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术和电子商务技术的发展,网上购物变得越来越普及。为了对互联网用户的网上购物行为加以引导,电子商务运营商通过各种渠道向互联网用户推送各类商品信息,例如,通过各种互联网应用客户端和各大热门网站等。
现有推荐模型大体上分为:基于用户的推荐模型,基于物品的推荐模型,以及混合推荐模型(即基于用户的推荐模型和基于物品的推荐模型的结合)。根据该推荐模型,可以确定该用户是否喜欢待推荐的物品;当用户喜欢该物品时,向用户推荐该物品,否则不向用户推荐该物品。
具体地,基于用户的推荐模型是假设用户之间对物品的喜好具有相似性。该推荐模型的推荐原理是:根据用户对物品的购买记录,计算用户之间对物品喜好的相似度,向一个用户推荐与其相似的另一用户喜好的物品。基于物品的推荐模型是假设用户倾向于选择相似的物品。该推荐模型的推荐原理是,根据物品之间的属性,计算物品之间的相似度,向用户推荐与其喜好的物品相似度高的物品。混合推荐算法则是上述两种算法的结合,各取所长。
由上可知,现有的基于物品的推荐模型是基于用户与物品的喜好关系进行推荐的,但是仅通过购买记录来定义其喜好的物品,并推荐相似度高的物品,其结果准确率一般不高。
发明内容
本申请实施例的目的在于提出一种物品推荐的方法、装置、计算机设备和存储介质,通过机器学习模型进行学习和预测用户的兴趣相似度,进而可以准确地对寻找到兴趣相似的物品进行推荐。
为了解决上述技术问题,本申请实施例提供一种物品推荐的方法,采用了如下所述的技术方案:
服务器获取用户的历史记录中连续输入的多个检索词,以及从该用户在预设时间内连续点击的链接中提取对应链接的标题名称;将每次连接记录中的检索词或标题名称作为元素形成多个目标集合;
通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品;
通过相似度计算模型计算所述目标商品与所述新品库中的待推荐新品包的相似度;
将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户。
进一步地,所述通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品的步骤,具体包括:
S10、分别针对每个所述目标集合中的元素进行文本分词和特征提取;
S20、将每个元素定义为一个类,计算两两元素之间的最小距离;
S30、将距离最小的两个类合并成一个新类;
S40、计算新类与所有类之间的距离;
S50、重复步骤S30、S40,直到所有类最后合并成一类,得到每个目标集合对应的目标商品。
进一步地,所述相似度计算模型生成的步骤,具体包括:
获取所述目标商品的集合;
构造所述目标商品的集合的特征;
根据余弦相似度公式:
计算所述目标商品与所述新品库中的待推荐新品的相似度,其中,u表示用户,v表示新品包,Iu表示目标商品,Iv表示待推荐新品;
将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
进一步地,所述采用树模型混合线性模型算法对所述样本集合的特征进行训练包括:
采用树模型对所述目标商品的集合的特征进行编码,得到编码后的二值特征;
将所述目标商品的集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
为了解决上述技术问题,本申请实施例提供一种物品推荐的装置,采用了如下所述的技术方案:
所述装置包括:
获取模块,用于服务器获取用户的历史记录中连续输入的多个检索词,以及从该用户在预设时间内连续点击的链接中提取对应链接的标题名称;将每次连接记录中的检索词或标题名称作为元素形成多个目标集合;
聚类模块,用于通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品;
计算模块,用于通过相似度计算模型计算所述目标商品与所述新品库中的待推荐新品包的相似度;
推荐模块,用于将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户。
进一步地,所述聚类模块,具体包括:
提取单元,用于分别针对每个所述目标集合中的元素进行文本分词和特征提取;
第一计算单元,用于将每个元素定义为一个类,计算两两元素之间的最小距离;
第一合并单元,用于将距离最小的两个类合并成一个新类;
第二计算单元,用于计算新类与所有类之间的距离;
第二合并单元,用于重复第一合并单元和第二计算单元执行的步骤,直到所有类最后合并成一类,得到每个目标集合对应的目标商品。
进一步地,所述计算模块包括相似度计算生成模块,所述相似度计算生成模块用于生成基于所述目标集合的相似度计算模型。
进一步地,所述相似度计算模型生成的步骤,具体包括:
获取所述目标商品的集合;
构造所述目标商品的集合的特征;
根据余弦相似度公式:
计算所述目标商品与所述新品库中的待推荐新品的相似度,其中,u表示用户,v表示新品包,Iu表示目标商品,Iv表示待推荐新品;
将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
为了解决上述技术问题,本申请实施例提供一种计算机设备,采用了如下所述的技术方案:
所述计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行上述任一项所述物品推荐的方法的步骤。
为了解决上述技术问题,本申请实施例提供一种计算机可读存储介质,采用了如下所述的技术方案:
所述计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述任一项所述物品推荐的方法的步骤。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请方案通过wifi传输音频数据使得无线耳机中可以播放高分辨率无损音频文件,增强了用户的使用体验;同时使用两个高分辨率DAC芯片解码播放,播放延迟在1ms以下;设置麦克风以及AI芯片既能实现降噪,又能实现语音控制,为用户提供更舒适的听音体验。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的物品推荐的方法一个实施例提供的实施环境的示意图;
图2是本申请的物品推荐的方法一个实施例中树模型编码混合线性模型示意图;
图3是本申请的物品推荐的方法一个实施例中流程示意图;
图4是本申请的物品推荐的方法另一个实施例中流程示意图;
图5是本申请的物品推荐的方法另一个实施例中流程示意图;
图6是本申请的物品推荐的装置一个实施例中结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
参照图1,其示出了本申请实施例提供的实施环境的示意图,该实施环境包括:若干终端设备11和服务器10,其中,所述终端设备11包括但不限于为手机、平板电脑、台式计算机等终端设备。所述服务器10可以是一台服务器,也可以是由若干服务器组成的服务器集群,或者是一个云计算服务中心。
所述终端设备11可以与各种网络如互联网、企业内部网、无线网络等进行通讯,上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术。所述终端设备11通过网络向所述服务器10发送请求,所述服务器10接收所述请求并进行处理。
在实际应用场景中,服务器10可获取若干终端设备11的用户信息,根据获取的用户信息进行用户兴趣相似度的计算,并根据所述兴趣相似度为用户提供相关的推荐,最终实现用户的个性化推荐。
最常用的有监督机器学习算法有线性模型和树模型,其中线性模型,如线性回归(Linear Regression)的优点是简单,易用于大规模数据集,缺点是无法拟合非线性关联;而树模型,如决策树(Decision Tree)的优点是可以拟合非线性关系,而且可以应用于离散特征和连续特征上,缺点是不善于捕捉线性或者近似线性关系,且较为复杂。
参照图2,为了同时利用两类模型的优点,本申请实施例提出了一种树模型编码混合线性模型(Hybrid Tree-encoded Linear Model),图2示出了其模型,该算法主要分为两个步骤,具体来说,为了增强模型的最终非线性表达能力,先使用梯度提升决策树(GBDT)对特征进行非线性变换,即将原始特征变换成一系列二进制特征,类似于编码。
再将所有编码后的特征,即二值特征和所有的原始特征一起作为输入特征,放入线性回归模型中训练(使用梯度下降法进行训练),得到最终的混合模型结果,将训练好的模型在测试集上进行预测,即可判断该模型的效果。
参照图3,本申请第一实施例提供了一种物品推荐的方法,针对线上商城的用户,采用了如下所述的技术方案:
S1、服务器获取用户的历史记录中连续输入的多个检索词,以及从该用户在预设时间内连续点击的链接中提取对应链接的标题名称;将每次连接记录中的检索词或标题名称作为元素形成多个目标集合;
S2、通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品;
S3、通过相似度计算模型计算所述目标商品与所述新品库中的待推荐新品包的相似度;
S4、将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户。
在本实施例中,上述历史记录的时间范围,可以是距离当前半年、一年或者两年的时间范围内。上述链接仅包括线上商城链接。在用户在一定时间内,频繁输入不同的检索词时,可以认为其输入是连续的,例如上述服务器获取用户的历史记录中连续输入的多个检索词,可以是在一个半小时或一个小时内,用户每两次输入检索词间隔不超过五分钟,则认为该时间段内,用户输入的检索词是连接的。同样的,用户在一定时间内,频繁点击的不同链接,可以认为其在这一段时间内点击的链接是连续的,例如用户每两次点击间隔不超过五分钟,则认为该时间段内,用户点击是连接的。相对于直接获取全部的历史记录中全部输入的检索词,获取连续输入的检索词则更具针对性。具体来说,历史记录中全部输入的检索词,或点击的链接,仅仅包含了用户浏览的商品,但是无法从这些浏览的商品中体现出哪些是用户会再次购买或者会再次浏览的,因此基于全部输入的检索词所做出的待推荐新品包没有针对性,相对命中率低;而基于用户连续输入的多个检索词,以及在预设时间内连续点击的链接中提取对应链接的标题名称做出的待推荐新品包,其范围都是用户花费了较多时间浏览的商品,非常有可能符合用户的兴趣点,相对命中率高。
在步骤S2中,每一个目标集合均包括连续输入的多个检索词或在预设时间内连续点击的链接中提取对应链接的标题名称,每一个检索词或标题名称为一个元素,分别将这些目标集合中的元素聚类,每个目标集合得到一个对应的目标商品,最终得到多个目标商品。特殊的,当用户的历史记录检索词只有一个时,该检索词为目标商品。
在步骤S3中,上述新品库中并非需要全部是新商品,而可以是上架一个月内、三个月内或半年内的商品(可以根据需要对商品设置一个推广资格),具体时间可以根据商城推广需求自由设置,这些商品通过待推荐商品包的形式呈现。为了减小服务器的算力负担,本实施例不针对以特定单个商品链接进行推荐,而是针对待推荐新品包进行推荐,待推荐新品包中包含(具备推广资格的)多款同类型商品。一个待推荐商品包包括具有特定关联特征的同类商品,例如蓝牙耳机为一个待推荐商品包、入耳式蓝牙耳机为一个待推荐商品包、骨传导耳机为一个待推荐商品包等。目标商品与待推荐新品包的相似度通过预设的相似度计算模型计算。
在步骤S4中,上述步骤“将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户”中,可以根据客户端推荐页面/网页推荐页面(下统称推荐页面)的需求,决定上述待推荐新品包全部推荐给客户,或者部分推荐给用户。例如,当推荐页面对于待推荐商品包设有多个链接时,将数量与链接数对应的排名靠前的几个待推荐新品包显示于推荐页面;当推荐页面对于待推荐商品包设有单独的推荐链接窗口时,将相似度大于某个预设值(如50%)的待推荐新品包排序按照相似度从高到低排序推荐给用户,如用户点击推荐链接后,在新的窗口上显示排序后的符合条件的待推荐新品包。
参照图4,针对上述物品推荐的方法,本申请还提供了第二实施例,其中,所述通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品的步骤,具体包括:
S10、分别针对每个所述目标集合中的元素进行文本分词和特征提取;
S20、将每个元素定义为一个类,计算两两元素之间的最小距离;
S30、将距离最小的两个类合并成一个新类;
S40、计算新类与所有类之间的距离;
S50、重复步骤S30、S40,直到所有类最后合并成一类,得到每个目标集合对应的目标商品。
在本实施例中,针对每个所述目标集合中的元素进行文本分词和特征提取,可以使用现有技术中的处理模型,例如,使用基于隐马尔可模型的分词方法作为分词器对上述目标集合中的元素进行分词,再进行特征提取。针对步骤S20-S50,通过对目标集合进行聚类,最终得到与目标集合对应的目标商品,其实现方式示例如下:
输入:样本集D={x1,x2,…xm};
聚类簇距离度量函数d;
聚类簇数k.
过程:
输出:簇划分C={C1,C2,…,Ck}
针对上述物品推荐的方法,本申请还提供了第三实施例,其中,所述相似度计算模型生成的步骤,具体包括:
获取所述目标商品的集合;
构造所述目标商品的集合的特征;
根据余弦相似度公式:
计算所述目标商品与所述新品库中的待推荐新品的相似度,其中,u表示用户,v表示新品包,Iu表示目标商品,Iv表示待推荐新品;
将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
参照图2,在本实施例中,图2示出了树模型混合线性模型,该算法主要分为两个步骤,具体来说,为了增强模型的最终非线性表达能力,先使用梯度提升决策树(GBDT)对特征进行非线性变换,即将原始特征变换成一系列二进制特征,类似于编码。再将所有编码后的特征,即二值特征和所有的原始特征一起作为输入特征,放入线性回归模型中训练(使用梯度下降法进行训练),得到最终的混合模型结果,将训练好的模型在测试集上进行预测,即可判断该模型的效果。兴趣相似度预测模型基于树模型编码混合线性算法实现。
参照图5,针对上述物品推荐的方法,本申请还提供了第四实施例,其中,所述采用树模型混合线性模型算法对所述样本集合的特征进行训练包括:
S100、采用树模型对所述目标商品的集合的特征进行编码,得到编码后的二值特征;
S200、将所述目标商品的集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
在本实施例中,针对步骤S100-S200,举例而言,例如,使用有2棵子树的GBDT来拟合训练数据,拟合的结果是第一颗子树有3个叶子节点,第二颗子树有2个叶子节点。如果一个样本经过该GBDT后在第一颗子树中落在了第二个叶子节点(即编码为010,每一位对应一个叶子节点),在第二颗子树中落在了第一个叶子节点(即编码为10),这样最终该样本的编码结果为01010,对应了5个二值特征。再将所有编码后的特征,即5个二值特征和所有的原始特征一起作为输入特征,放入线性回归模型中训练(使用梯度下降法进行训练),得到最终的混合模型结果,将训练好的模型在测试集上进行预测,即可判断该模型的效果。
参照图6,本申请第五实施例提供一种物品推荐的装置,包括:
获取模块1,用于服务器获取用户的历史记录中连续输入的多个检索词,以及从该用户在预设时间内连续点击的链接中提取对应链接的标题名称;将每次连接记录中的检索词或标题名称作为元素形成多个目标集合;
聚类模块2,用于通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品;
计算模块3,用于通过相似度计算模型计算所述目标商品与所述新品库中的待推荐新品包的相似度;
推荐模块4,用于将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户。
在本实施例中,上述历史记录的时间范围,可以是距离当前半年、一年或者两年的时间范围内。上述链接仅包括线上商城链接。在用户在一定时间内,频繁输入不同的检索词时,可以认为其输入是连续的,例如上述服务器获取用户的历史记录中连续输入的多个检索词,可以是在一个半小时或一个小时内,用户每两次输入检索词间隔不超过五分钟,则认为该时间段内,用户输入的检索词是连接的。同样的,用户在一定时间内,频繁点击的不同链接,可以认为其在这一段时间内点击的链接是连续的,例如用户每两次点击间隔不超过五分钟,则认为该时间段内,用户点击是连接的。相对于直接获取全部的历史记录中全部输入的检索词,获取连续输入的检索词则更具针对性。具体来说,历史记录中全部输入的检索词,或点击的链接,仅仅包含了用户浏览的商品,但是无法从这些浏览的商品中体现出哪些是用户会再次购买或者会再次浏览的,因此基于全部输入的检索词所做出的待推荐新品包没有针对性,相对命中率低;而基于用户连续输入的多个检索词,以及在预设时间内连续点击的链接中提取对应链接的标题名称做出的待推荐新品包,其范围都是用户花费了较多时间浏览的商品,非常有可能符合用户的兴趣点,相对命中率高。
在聚类模块2中,每一个目标集合均包括连续输入的多个检索词或在预设时间内连续点击的链接中提取对应链接的标题名称,每一个检索词或标题名称为一个元素,分别将这些目标集合中的元素聚类,每个目标集合得到一个对应的目标商品,最终得到多个目标商品。特殊的,当用户的历史记录检索词只有一个时,该检索词为目标商品。
在计算模块3中,上述新品库中并非需要全部是新商品,而可以是上架一个月内、三个月内或半年内的商品(可以根据需要对商品设置一个推广资格),具体时间可以根据商城推广需求自由设置,这些商品通过待推荐商品包的形式呈现。为了减小服务器的算力负担,本实施例不针对以特定单个商品链接进行推荐,而是针对待推荐新品包进行推荐,待推荐新品包中包含(具备推广资格的)多款同类型商品。一个待推荐商品包包括具有特定关联特征的同类商品,例如蓝牙耳机为一个待推荐商品包、入耳式蓝牙耳机为一个待推荐商品包、骨传导耳机为一个待推荐商品包等。目标商品与待推荐新品包的相似度通过预设的相似度计算模型计算。
在推荐模块4中,上述“将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户”中,可以根据客户端推荐页面/网页推荐页面(下统称推荐页面)的需求,决定上述待推荐新品包全部推荐给客户,或者部分推荐给用户。例如,当推荐页面对于待推荐商品包设有多个链接时,将数量与链接数对应的排名靠前的几个待推荐新品包显示于推荐页面;当推荐页面对于待推荐商品包设有单独的推荐链接窗口时,将相似度大于某个预设值(如50%)的待推荐新品包排序按照相似度从高到低排序推荐给用户,如用户点击推荐链接后,在新的窗口上显示排序后的符合条件的待推荐新品包。
针对上述物品推荐的装置,本申请还提供了第六实施例,其中,所述聚类模块,具体包括:
提取单元,用于分别针对每个所述目标集合中的元素进行文本分词和特征提取;
第一计算单元,用于将每个元素定义为一个类,计算两两元素之间的最小距离;
第一合并单元,用于将距离最小的两个类合并成一个新类;
第二计算单元,用于计算新类与所有类之间的距离;
第二合并单元,用于重复第一合并单元和第二计算单元执行的步骤,直到所有类最后合并成一类,得到每个目标集合对应的目标商品。
在本实施例中,针对每个所述目标集合中的元素进行文本分词和特征提取,可以使用现有技术中的处理模型,例如,使用基于隐马尔可模型的分词方法作为分词器对上述目标集合中的元素进行分词,再进行特征提取。针对步骤S20-S50,通过对目标集合进行聚类,最终得到与目标集合对应的目标商品,其实现方式示例如下:
输入:样本集D={x1,x2,…xm};
聚类簇距离度量函数d;
聚类簇数k.
过程:
输出:簇划分C={C1,C2,…,Ck}
针对上述物品推荐的装置,本申请还提供了第七实施例,其中,所述计算模块包括相似度计算生成模块,所述相似度计算生成模块用于生成基于所述目标集合的相似度计算模型。
针对上述物品推荐的装置,本申请还提供了第八实施例,其中,所述相似度计算模型生成的步骤,具体包括:
获取所述目标商品的集合;
构造所述目标商品的集合的特征;
根据余弦相似度公式:
计算所述目标商品与所述新品库中的待推荐新品的相似度,其中,u表示用户,v表示新品包,Iu表示目标商品,Iv表示待推荐新品;
将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
在本实施例中,图2示出了树模型混合线性模型,该算法主要分为两个步骤,具体来说,为了增强模型的最终非线性表达能力,先使用梯度提升决策树(GBDT)对特征进行非线性变换,即将原始特征变换成一系列二进制特征,类似于编码。再将所有编码后的特征,即二值特征和所有的原始特征一起作为输入特征,放入线性回归模型中训练(使用梯度下降法进行训练),得到最终的混合模型结果,将训练好的模型在测试集上进行预测,即可判断该模型的效果。兴趣相似度预测模型基于树模型编码混合线性算法实现。
本申请第九实施例提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述物品推荐的方法,包括步骤:
服务器获取用户的历史记录中连续输入的多个检索词,以及从该用户在预设时间内连续点击的链接中提取对应链接的标题名称;将每次连接记录中的检索词或标题名称作为元素形成多个目标集合;
通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品;
通过相似度计算模型计算所述目标商品与所述新品库中的待推荐新品包的相似度;
将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户。
本申请第十实施例提供一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现所述物品推荐的方法,包括步骤:
服务器获取用户的历史记录中连续输入的多个检索词,以及从该用户在预设时间内连续点击的链接中提取对应链接的标题名称;将每次连接记录中的检索词或标题名称作为元素形成多个目标集合;
通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品;
通过相似度计算模型计算所述目标商品与所述新品库中的待推荐新品包的相似度;
将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种物品推荐的方法,其特征在于,包括:
服务器获取用户的历史记录中连续输入的多个检索词,以及从该用户在预设时间内连续点击的链接中提取对应链接的标题名称;将每次连接记录中的检索词或标题名称作为元素形成多个目标集合;
通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品;
通过相似度计算模型计算所述目标商品与所述新品库中的待推荐新品包的相似度;
将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户。
2.根据权利要求1所述的物品推荐的方法,其特征在于,所述通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品的步骤,具体包括:
S10、分别针对每个所述目标集合中的元素进行文本分词和特征提取;
S20、将每个元素定义为一个类,计算两两元素之间的最小距离;
S30、将距离最小的两个类合并成一个新类;
S40、计算新类与所有类之间的距离;
S50、重复步骤S30、S40,直到所有类最后合并成一类,得到每个目标集合对应的目标商品。
4.根据权利要求3所述的物品推荐的方法,其特征在于,所述采用树模型混合线性模型算法对所述样本集合的特征进行训练包括:
采用树模型对所述目标商品的集合的特征进行编码,得到编码后的二值特征;
将所述目标商品的集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
5.一种物品推荐的装置,其特征在于,包括:
获取模块,用于服务器获取用户的历史记录中连续输入的多个检索词,以及从该用户在预设时间内连续点击的链接中提取对应链接的标题名称;将每次连接记录中的检索词或标题名称作为元素形成多个目标集合;
聚类模块,用于通过聚类模型分别对所述目标集合中的元素进行聚类,得到多个目标商品;
计算模块,用于通过相似度计算模型计算所述目标商品与所述新品库中的待推荐新品包的相似度;
推荐模块,用于将所述待推荐新品包与所述目标商品之间的相似度按从高到低进行排序,并将排名靠前的至少一个待推荐新品包推荐给用户。
6.根据权利要求1所述的物品推荐的装置,其特征在于,所述聚类模块,具体包括:
提取单元,用于分别针对每个所述目标集合中的元素进行文本分词和特征提取;
第一计算单元,用于将每个元素定义为一个类,计算两两元素之间的最小距离;
第一合并单元,用于将距离最小的两个类合并成一个新类;
第二计算单元,用于计算新类与所有类之间的距离;
第二合并单元,用于重复第一合并单元和第二计算单元执行的步骤,直到所有类最后合并成一类,得到每个目标集合对应的目标商品。
7.根据权利要求6所述的物品推荐的装置,其特征在于,所述计算模块包括相似度计算生成模块,所述相似度计算生成模块用于生成基于所述目标集合的相似度计算模型。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,其特征在于,所述处理器执行权利要求1至4中任一项所述物品推荐的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现权利要求1至4中任一项所述物品推荐的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110724549.5A CN113469786A (zh) | 2021-06-29 | 2021-06-29 | 物品推荐的方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110724549.5A CN113469786A (zh) | 2021-06-29 | 2021-06-29 | 物品推荐的方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113469786A true CN113469786A (zh) | 2021-10-01 |
Family
ID=77873608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110724549.5A Pending CN113469786A (zh) | 2021-06-29 | 2021-06-29 | 物品推荐的方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469786A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114840762A (zh) * | 2022-05-19 | 2022-08-02 | 马上消费金融股份有限公司 | 推荐内容确定方法、装置和电子设备 |
CN116719946A (zh) * | 2023-08-10 | 2023-09-08 | 中国电信股份有限公司 | 工单推荐方法、工单推荐装置、存储介质及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677828A (zh) * | 2016-01-04 | 2016-06-15 | 成都陌云科技有限公司 | 基于大数据的用户信息处理方法 |
CN108665329A (zh) * | 2017-03-29 | 2018-10-16 | 北京京东尚科信息技术有限公司 | 一种基于用户浏览行为的商品推荐方法 |
CN108763314A (zh) * | 2018-04-26 | 2018-11-06 | 深圳市腾讯计算机系统有限公司 | 一种兴趣推荐方法、装置、服务器及存储介质 |
CN109934721A (zh) * | 2019-01-18 | 2019-06-25 | 深圳壹账通智能科技有限公司 | 理财产品推荐方法、装置、设备及存储介质 |
CN112287244A (zh) * | 2020-10-29 | 2021-01-29 | 平安科技(深圳)有限公司 | 基于联邦学习的产品推荐方法、装置、计算机设备及介质 |
CN112434151A (zh) * | 2020-11-26 | 2021-03-02 | 重庆知识产权大数据研究院有限公司 | 一种专利推荐方法、装置、计算机设备及存储介质 |
CN112529663A (zh) * | 2020-12-15 | 2021-03-19 | 中国平安人寿保险股份有限公司 | 商品推荐方法、装置、终端设备及存储介质 |
CN112632385A (zh) * | 2020-12-29 | 2021-04-09 | 中国平安人寿保险股份有限公司 | 课程推荐方法、装置、计算机设备及介质 |
-
2021
- 2021-06-29 CN CN202110724549.5A patent/CN113469786A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677828A (zh) * | 2016-01-04 | 2016-06-15 | 成都陌云科技有限公司 | 基于大数据的用户信息处理方法 |
CN108665329A (zh) * | 2017-03-29 | 2018-10-16 | 北京京东尚科信息技术有限公司 | 一种基于用户浏览行为的商品推荐方法 |
CN108763314A (zh) * | 2018-04-26 | 2018-11-06 | 深圳市腾讯计算机系统有限公司 | 一种兴趣推荐方法、装置、服务器及存储介质 |
CN109934721A (zh) * | 2019-01-18 | 2019-06-25 | 深圳壹账通智能科技有限公司 | 理财产品推荐方法、装置、设备及存储介质 |
CN112287244A (zh) * | 2020-10-29 | 2021-01-29 | 平安科技(深圳)有限公司 | 基于联邦学习的产品推荐方法、装置、计算机设备及介质 |
CN112434151A (zh) * | 2020-11-26 | 2021-03-02 | 重庆知识产权大数据研究院有限公司 | 一种专利推荐方法、装置、计算机设备及存储介质 |
CN112529663A (zh) * | 2020-12-15 | 2021-03-19 | 中国平安人寿保险股份有限公司 | 商品推荐方法、装置、终端设备及存储介质 |
CN112632385A (zh) * | 2020-12-29 | 2021-04-09 | 中国平安人寿保险股份有限公司 | 课程推荐方法、装置、计算机设备及介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114840762A (zh) * | 2022-05-19 | 2022-08-02 | 马上消费金融股份有限公司 | 推荐内容确定方法、装置和电子设备 |
CN116719946A (zh) * | 2023-08-10 | 2023-09-08 | 中国电信股份有限公司 | 工单推荐方法、工单推荐装置、存储介质及电子设备 |
CN116719946B (zh) * | 2023-08-10 | 2023-11-28 | 中国电信股份有限公司 | 工单推荐方法、工单推荐装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111259263B (zh) | 一种物品推荐方法、装置、计算机设备及存储介质 | |
JP2020509449A (ja) | 警告するための方法と装置 | |
US20160170982A1 (en) | Method and System for Joint Representations of Related Concepts | |
CN107644036B (zh) | 一种数据对象推送的方法、装置及系统 | |
CN111859160B (zh) | 一种基于图神经网络会话序列推荐方法及系统 | |
US20130185294A1 (en) | Recommender system, recommendation method, and program | |
Xu et al. | Integrated collaborative filtering recommendation in social cyber-physical systems | |
CN110827112B (zh) | 深度学习的商品推荐方法、装置、计算机设备及存储介质 | |
CN105718184A (zh) | 一种数据处理方法和装置 | |
CN106294500B (zh) | 内容项目的推送方法、装置及系统 | |
CN110020162B (zh) | 用户识别方法和装置 | |
US10970296B2 (en) | System and method for data mining and similarity estimation | |
CN104751354A (zh) | 一种广告人群筛选方法 | |
US20210303792A1 (en) | Content analysis utilizing general knowledge base | |
CN113469786A (zh) | 物品推荐的方法、装置、计算机设备和存储介质 | |
CN111967914A (zh) | 基于用户画像的推荐方法、装置、计算机设备和存储介质 | |
CN113268667B (zh) | 一种基于中文评论情感引导的序列推荐方法及系统 | |
CN107977678A (zh) | 用于输出信息的方法和装置 | |
CN111967924A (zh) | 商品推荐方法、商品推荐装置、计算机设备和介质 | |
CN112825182A (zh) | 一种确定推荐商品的方法和装置 | |
CN111340522B (zh) | 资源推荐方法、装置、服务器及存储介质 | |
US20190370297A1 (en) | Method and apparatus for enriching metadata via a network | |
CN112907334A (zh) | 一种对象推荐方法及装置 | |
CN111787042B (zh) | 用于推送信息的方法和装置 | |
CN114429384B (zh) | 基于电商平台的产品智能推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20211001 |
|
WD01 | Invention patent application deemed withdrawn after publication |