CN116861323A - 一种在推荐中解决长尾效应的方法和装置 - Google Patents
一种在推荐中解决长尾效应的方法和装置 Download PDFInfo
- Publication number
- CN116861323A CN116861323A CN202310915482.2A CN202310915482A CN116861323A CN 116861323 A CN116861323 A CN 116861323A CN 202310915482 A CN202310915482 A CN 202310915482A CN 116861323 A CN116861323 A CN 116861323A
- Authority
- CN
- China
- Prior art keywords
- commodity
- list
- hot
- cold
- word vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000000694 effects Effects 0.000 title claims abstract description 37
- 239000013598 vector Substances 0.000 claims abstract description 175
- 238000009825 accumulation Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 230000006872 improvement Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005587 bubbling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种在推荐中解决长尾效应的方法和装置,根据预设的热门商品的销量阈值将商品列表划分为热门商品列表和冷门商品列表,基于预先训练好的词向量模型生成热门商品词向量列表和冷门商品词向量列表,将每一个词向量映射到向量空间中,将每一个热门词向量确定为聚类中心对冷门商品词向量进行聚类,当用户请求访问包含推荐列表栏目的电商网站页面数据时,确定所述用户的至少一个关联热门商品,从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品,生成所述推荐冷门商品的商品推荐列表,向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据,能够有效促进电子商务平台的交易量的提升。
Description
技术领域
本发明涉及电子商务技术领域,特别涉及一种在推荐中解决长尾效应的方法和装置。
背景技术
电子商务平台作为主要的商品销售渠道之一,具有低销售成本和齐全的商品种类,因此在消费者中广受欢迎。然而,由于电子商务平台上的商品数量庞大,用户想要快速找到所需商品非常困难,为了解决这个问题,人们研究出了各种商品推荐算法,可以根据用户的偏好、历史浏览记录和社交关系等信息为用户提供个性化的商品推荐。然而目前的商品推荐算法主要关注热门商品和新品的推荐,这就导致了冷门商品被用户关注到的概率更低。但提高冷门商品的曝光率是非常有必要的,冷门商品数量庞大,单个冷门商品虽然销量较低,但冷门商品的总体销量却是远超热门商品的,即通常所称的长尾效应。目前的商品推荐算法对冷门商品的关注度不高,即使有些电子商务平台考虑到了冷门商品的推荐,一般也是采用乱序或随机算法向用户进行随机推荐,这种推荐方式对成交率的提高效果不佳,使得电子商务平台的交易量的提升面临着较大的瓶颈问题。
发明内容
本发明正是基于上述问题,提出了一种在推荐中解决长尾效应的方法和装置,能够有效促进电子商务平台的交易量的提升。
有鉴于此,本发明的第一方面提出了一种在推荐中解决长尾效应的方法,包括:
获取预设的统计周期的综合商品列表以及所述综合商品列表中每种商品的销量;
根据预设的热门商品的销量阈值将所述综合商品列表划分为热门商品列表和冷门商品列表;
基于预先训练好的词向量模型将所述热门商品列表和所述冷门商品列表中的商品名称转化为词向量以生成热门商品词向量列表和冷门商品词向量列表;
构建对应所述词向量的维度的向量空间;
将所述热门商品词向量列表和所述冷门商品词向量列表中的每一个词向量映射到所述向量空间中;
将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类;
当用户请求访问包含推荐列表栏目的电商网站页面数据时,确定所述用户的至少一个关联热门商品;
从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品;
生成所述推荐冷门商品的商品推荐列表;
向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据。
进一步的,在上述的在推荐中解决长尾效应的方法中,将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类的步骤具体包括:
遍历所述冷门商品词向量列表以对每个冷门词向量执行以下步骤:
将遍历到的冷门词向量即第i个冷门词向量确定为当前词向量其中i∈[1,nclist],nclist为所述冷门商品词向量列表中的词向量的数量;
计算当前词向量与第j个热门词向量的距离dij,其中j∈[1,nhlist],nglist为所述热门商品词向量列表中的词向量的数量;
确定与当前词向量距离最小的热门词向量使得dik满足:
其中k∈[1,nhlist];
将当前词向量与第k个热门词向量/>归到同一个簇。
进一步的,在上述的在推荐中解决长尾效应的方法中,在确定与当前词向量距离最小的热门词向量的步骤之后,还包括:
对于同一个冷门词向量存在多个kx使得/>均满足/>时,将当前词向量/>同时与第kx个热门词向量/>归到同一个簇,其中x∈(1,nmin],nmin为满足上述条件的热门词向量的数量。
进一步的,在上述的在推荐中解决长尾效应的方法中,确定所述用户的至少一个关联热门商品的步骤具体包括:
获取所述用户的交易商品列表、购物车商品列表以及收藏商品列表;
将所述用户的交易商品列表、购物车商品列表以及收藏商品列表合并为所述用户的关联商品列表;
构建所述用户的关联热门商品列表,所述热门商品列表为所述用户的关联商品列表与所述热门商品列表的交集;
从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品。
进一步的,在上述的在推荐中解决长尾效应的方法中,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:
记录所述统计周期内所述热门商品作为所述关联热门商品的推荐次数其中i∈[1,nrehlist],nrehlist为所述关联热门商品列表中的热门商品的数量;
从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:
判断所述关联热门商品列表中的热门商品的推荐次数是否全部相同;
判断为否时,从所述关联热门商品列表中剔除推荐次数最多的热门商品后生成关联次热门商品列表;
将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品。
进一步的,在上述的在推荐中解决长尾效应的方法中,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:
检测用户点击所述商品推荐列表中的冷门商品的操作;
记录所述统计周期内所述冷门商品所在簇的聚类中心对应的热门商品的推荐点击次数
基于所述推荐点击次数计算所述热门商品的推荐权重:
其中uplim为所述推荐权重的求和上限。
进一步的,在上述的在推荐中解决长尾效应的方法中,将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:
使用乱序算法对所述关联次热门商品列表中的热门商品进行乱序排列;
计算所述关联次热门商品列表中的热门商品的推荐权重总和:
在[0,total_weight]的区间范围内生成一个随机数random_num;
遍历所述关联次热门商品列表中的热门商品以计算临时累加权重:
其中k为当前遍历到的热门商品在乱序排列后的所述关联次热门商品列表中的位置;
当遍历到第一个满足cumulative_weight≥random_num的热门商品时,停止遍历;
将当前的k值对应的热门商品确定为所述关联热门商品。
进一步的,在上述的在推荐中解决长尾效应的方法中,从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品的步骤具体包括:
获取所述电商网站页面上的商品推荐列表的长度nrelist以及所述关联热门商品的数量nreh;
计算所述推荐冷门商品的数量:
从所述关联热门商品所在的簇中确定数量为nrec的推荐冷门商品。
进一步的,在上述的在推荐中解决长尾效应的方法中,在确定所述用户的至少一个关联热门商品的步骤中确定多个关联热门商品,生成所述推荐冷门商品的商品推荐列表的步骤具体包括:
将每个关联热门商品对应的推荐冷门商品合并到一个推荐冷门商品列表;
使用乱序算法对所述推荐冷门商品列表中的冷门商品进行乱序排列得到所述推荐冷门商品的商品推荐列表。
本发明的第二方面提出了一种在推荐中解决长尾效应的装置,包括存储器和处理器,所述处理器执行所述存储器中存储的计算机程序实现如本发明第一方面任一项所述的在推荐中解决长尾效应的方法。
本发明提出了一种在推荐中解决长尾效应的方法和装置,根据预设的热门商品的销量阈值将商品列表划分为热门商品列表和冷门商品列表,基于预先训练好的词向量模型生成热门商品词向量列表和冷门商品词向量列表,将每一个词向量映射到向量空间中,将每一个热门词向量确定为聚类中心对冷门商品词向量进行聚类,当用户请求访问包含推荐列表栏目的电商网站页面数据时,确定所述用户的至少一个关联热门商品,从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品,生成所述推荐冷门商品的商品推荐列表,向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据,能够有效促进电子商务平台的交易量的提升。
附图说明
图1是本发明一个实施例提供的一种在推荐中解决长尾效应的方法的流程图;
图2是本发明一个实施例提供的商品销量曲线图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
在本发明的描述中,术语“多个”则指两个或两个以上,除非另有明确的限定,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。术语“连接”、“安装”、“固定”等均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本说明书的描述中,术语“一个实施例”、“一些实施方式”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
下面参照附图来描述根据本发明一些实施方式提供的一种在推荐中解决长尾效应的方法和装置。
如图1所示,本发明的第一方面提出了一种在推荐中解决长尾效应的方法,包括:
获取预设的统计周期的综合商品列表以及所述综合商品列表中每种商品的销量;
根据预设的热门商品的销量阈值将所述综合商品列表划分为热门商品列表和冷门商品列表;
基于预先训练好的词向量模型将所述热门商品列表和所述冷门商品列表中的商品名称转化为词向量以生成热门商品词向量列表和冷门商品词向量列表;
构建对应所述词向量的维度的向量空间;
将所述热门商品词向量列表和所述冷门商品词向量列表中的每一个词向量映射到所述向量空间中;
将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类;
当用户请求访问包含推荐列表栏目的电商网站页面数据时,确定所述用户的至少一个关联热门商品;
从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品;
生成所述推荐冷门商品的商品推荐列表;
向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据。
具体的,所述预设的统计周期可以为三天、一周或者一个月等。所述综合商品列表中不包含上线时间小于所述统计周期的商品,避免新品的低销量数据影响销量统计的准确性。
图2是所述综合商品列表的商品销量曲线,Y轴表示销量,X轴表示商品,Y轴自下而上表示销量从低到高,商品根据销量从高到低在X轴自左向右排列。从图2可以看到,以所述销量阈值为界限,销量大于所述销量阈值的商品为热门商品,销量小于所述销量阈值的商品为冷门商品,所述热门商品列表由所述综合商品列表中的热门商品组成,所述冷门商品列表由所述综合商品列表中的冷门商品组成。
所述词向量模型是使用预先准备的与商品名称相关的语料库训练得到,所述的与商品名称相关的语料库包括电商网站数据、新闻数据、社交媒体数据、维基百科数据等,所述电商网站数据包括各大电商平台的商品列表、商品描述、用户评价等数据,所述新闻数据包括涵盖了各行各业的商品信息的大量的新闻报道数据,所述社交媒体数据包括社交媒体上用户对商品的评价和意见数据,所述维基百科数据包括大量用于描述不同领域和商品的文本数据。
进一步的,在上述的在推荐中解决长尾效应的方法中,将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类的步骤具体包括:
遍历所述冷门商品词向量列表以对每个冷门词向量执行以下步骤:
将遍历到的冷门词向量即第i个冷门词向量确定为当前词向量其中i∈[1,nclist],nclist为所述冷门商品词向量列表中的词向量的数量;
计算当前词向量与第j个热门词向量的距离dij,其中j∈[1,nhlist],nhlist为所述热门商品词向量列表中的词向量的数量;
确定与当前词向量距离最小的热门词向量使得dik满足:
其中k∈[1,nhlist];
将当前词向量与第k个热门词向量/>归到同一个簇。
具体的,在聚类迭代的过程中始终以热门词向量列表中的词向量作为聚类中心,使得聚类结果保持与热门词向量的强关联性。在本发明的技术方案中,所述热门词向量列表中的词向量为热门词向量,所述冷门词向量列表中的词向量为冷门词向量。通过所述词向量模型所生成的词向量包括所述热门词向量和所述冷门词向量,均具有相同的维数,例如所生成的词向量具有n个维度,则构建对应所述词向量的维度的向量空间的步骤具体为构建一个n维向量空间。在所述向量空间中,可以采用余弦距离、欧氏距离、曼哈顿距离或者切比雪夫距离之中的任一种来衡量词向量之间的距离。
进一步的,在上述的在推荐中解决长尾效应的方法中,在确定与当前词向量距离最小的热门词向量的步骤之后,还包括:
对于同一个冷门词向量存在多个kx使得/>均满足/>时,将当前词向量/>同时与第kx个热门词向量/>归到同一个簇,其中x∈(1,nmin],nmin为满足上述条件的热门词向量的数量。
具体的,对于同一个冷门词向量存在多个kx表示同时存在多个热门词向量/>与该冷门词向量/>的距离相同,且这个距离dik为该冷门词向量/>与所有热门词向量/>的距离值dij中的最小值。
在上述实施方式的技术方案中,同一个冷门词向量可以与多个热门词向量/>存在于同一个簇中,即对于以这些热门词向量/>为聚类中心的簇,该冷门词向量/>为其交集数据。
进一步的,在上述的在推荐中解决长尾效应的方法中,确定所述用户的至少一个关联热门商品的步骤具体包括:
获取所述用户的交易商品列表、购物车商品列表以及收藏商品列表;
将所述用户的交易商品列表、购物车商品列表以及收藏商品列表合并为所述用户的关联商品列表;
构建所述用户的关联热门商品列表,所述热门商品列表为所述用户的关联商品列表与所述热门商品列表的交集;
从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品。
具体的,所述用户的交易商品列表为所述用户在电子商务平台上的历史交易订单中的商品的合集。在本发明的一些实施方式中,所述用户的关联商品列表还可以包括用户曾经评论过或者浏览过的商品的列表。
进一步的,在上述的在推荐中解决长尾效应的方法中,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:
记录所述统计周期内所述热门商品作为所述关联热门商品的推荐次数其中i∈[1,nrehlist],nrehlist为所述关联热门商品列表中的热门商品的数量;
从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:
判断所述关联热门商品列表中的热门商品的推荐次数是否全部相同;
判断为否时,从所述关联热门商品列表中剔除推荐次数最多的热门商品后生成关联次热门商品列表;
将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品。
在上述实施方式的技术方案中,记录所述统计周期内所述热门商品作为所述关联热门商品的推荐次数具体为针对每一个用户,其关联热门商品列表中的每一个热门商品作为关联热门商品执行一次对应的冷门商品推荐后,在所述统计周期内累加记录其推荐次数。
在从所述关联热门商品列表中剔除推荐次数最多的热门商品后生成关联次热门商品列表的步骤中,当推荐次数最多的热门商品为多个时,将推荐次数最多的多个热门商品从所述关联热门商品列表中剔除。当所述关联热门商品列表中的热门商品的推荐次数全部相同时,不执行从所述关联热门商品列表中剔除推荐次数最多的热门商品后生成关联次热门商品列表的步骤。
进一步的,在上述的在推荐中解决长尾效应的方法中,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:
检测用户点击所述商品推荐列表中的冷门商品的操作;
记录所述统计周期内所述冷门商品所在簇的聚类中心对应的热门商品的推荐点击次数
基于所述推荐点击次数计算所述热门商品的推荐权重:
其中uplim为所述推荐权重的求和上限。
具体的,对于作为聚类中心对应的热门商品,其推荐点击次数为其所在簇的所有冷门商品在所述统计周期内被点击的次数之和。
进一步的,在上述的在推荐中解决长尾效应的方法中,将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:
使用乱序算法对所述关联次热门商品列表中的热门商品进行乱序排列;
计算所述关联次热门商品列表中的热门商品的推荐权重总和:
在[0,total_weight]的区间范围内生成一个随机数random_num;
遍历所述关联次热门商品列表中的热门商品以计算临时累加权重:
其中k为当前遍历到的热门商品在乱序排列后的所述关联次热门商品列表中的位置;
当遍历到第一个满足cumulative_weight≥random_num的热门商品时,停止遍历;
将当前的k值对应的热门商品确定为所述关联热门商品。
在上述实施方式的技术方案中,可以使用费雪耶茨算法和萨托洛算法等随机排序算法、克努特德斯特内夫算法等洗牌算法或者使用冒泡排序算法、希尔排序算法等实现对所述关联次热门商品列表中的商品进行乱序排列。
进一步的,在上述的在推荐中解决长尾效应的方法中,从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品的步骤具体包括:
获取所述电商网站页面上的商品推荐列表的长度nrelist以及所述关联热门商品的数量nreh;
计算所述推荐冷门商品的数量:
从所述关联热门商品所在的簇中确定数量为nrec的推荐冷门商品。
在本发明的一些实施方式中,根据所述电商网站页面上的商品推荐列表的长度确定所述推荐冷门商品的数量,所述电商网站页面上的商品推荐列表的长度指的是所述商品推荐列表能够容纳的推荐商品的数量。当所述关联热门商品的数量为1时,则从所述关联热门商品所在的簇中确定与所述商品推荐列表的长度相等数量的冷门商品作为所推荐冷门商品。
在本发明的一些实施方式中,从所述关联热门商品所在的簇中确定数量为nrec的推荐冷门商品的步骤之后,还包括:
记录所述统计周期内每个簇中每个冷门商品被确定推荐冷门商品的次数;
在从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品的步骤中还包括:
判断所述关联热门商品的词向量为聚类中心的簇中的冷门商品被确定推荐冷门商品的次数是否全部相同;
判断为否时,从所述关联热门商品的词向量为聚类中心的簇中剔除被确定推荐冷门商品次数最多的冷门商品后生成拟推荐冷门商品列表;
将所述拟推荐冷门商品列表中的商品进行乱序排列后利用随机算法从所述拟推荐冷门商品列表中确定nrec个冷门商品作为所述推荐冷门商品。
进一步的,在上述的在推荐中解决长尾效应的方法中,在确定所述用户的至少一个关联热门商品的步骤中确定多个关联热门商品,生成所述推荐冷门商品的商品推荐列表的步骤具体包括:
将每个关联热门商品对应的推荐冷门商品合并到一个推荐冷门商品列表;
使用乱序算法对所述推荐冷门商品列表中的冷门商品进行乱序排列得到所述推荐冷门商品的商品推荐列表。
具体的,一个关联热门商品对应的推荐冷门商品是指从该关联热门商品所在簇中确定的推荐冷门商品。
本发明的第二方面提出了一种在推荐中解决长尾效应的装置,包括存储器和处理器,所述处理器执行所述存储器中存储的计算机程序实现如本发明第一方面任一项所述的在推荐中解决长尾效应的方法。
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
依照本发明的实施例如上文所述,这些实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施例。显然,根据以上描述,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地利用本发明以及在本发明基础上的修改使用。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (10)
1.一种在推荐中解决长尾效应的方法,其特征在于,包括:
获取预设的统计周期的综合商品列表以及所述综合商品列表中每种商品的销量;
根据预设的热门商品的销量阈值将所述综合商品列表划分为热门商品列表和冷门商品列表;
基于预先训练好的词向量模型将所述热门商品列表和所述冷门商品列表中的商品名称转化为词向量以生成热门商品词向量列表和冷门商品词向量列表;
构建对应所述词向量的维度的向量空间;
将所述热门商品词向量列表和所述冷门商品词向量列表中的每一个词向量映射到所述向量空间中;
将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类;
当用户请求访问包含推荐列表栏目的电商网站页面数据时,确定所述用户的至少一个关联热门商品;
从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品;
生成所述推荐冷门商品的商品推荐列表;
向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据。
2.根据权利要求1所述的在推荐中解决长尾效应的方法,其特征在于,将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类的步骤具体包括:
遍历所述冷门商品词向量列表以对每个冷门词向量执行以下步骤:
将遍历到的冷门词向量即第i个冷门词向量确定为当前词向量其中i∈[1,nclist],nclist为所述冷门商品词向量列表中的词向量的数量;
计算当前词向量与第j个热门词向量的距离dij,其中j∈[1,nhlist],nhlist为所述热门商品词向量列表中的词向量的数量;
确定与当前词向量距离最小的热门词向量使得dik满足:
其中k∈[1,nhlist];
将当前词向量与第k个热门词向量/>归到同一个簇。
3.根据权利要求1所述的在推荐中解决长尾效应的方法,其特征在于,在确定与当前词向量距离最小的热门词向量的步骤之后,还包括:
对于同一个冷门词向量存在多个kx使得/>均满足/>时,将当前词向量/>同时与第kx个热门词向量/>归到同一个簇,其中x∈(1,nmin],nmin为满足上述条件的热门词向量的数量。
4.根据权利要求1所述的在推荐中解决长尾效应的方法,其特征在于,确定所述用户的至少一个关联热门商品的步骤具体包括:
获取所述用户的交易商品列表、购物车商品列表以及收藏商品列表;
将所述用户的交易商品列表、购物车商品列表以及收藏商品列表合并为所述用户的关联商品列表;
构建所述用户的关联热门商品列表,所述热门商品列表为所述用户的关联商品列表与所述热门商品列表的交集;
从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品。
5.根据权利要求4所述的在推荐中解决长尾效应的方法,其特征在于,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:
记录所述统计周期内所述热门商品作为所述关联热门商品的推荐次数其中i∈[1,nrehlisy],nrehlist为所述关联热门商品列表中的热门商品的数量;
从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:
判断所述关联热门商品列表中的热门商品的推荐次数是否全部相同;
判断为否时,从所述关联热门商品列表中剔除推荐次数最多的热门商品后生成关联次热门商品列表;
将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品。
6.根据权利要求4所述的在推荐中解决长尾效应的方法,其特征在于,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:
检测用户点击所述商品推荐列表中的冷门商品的操作;
记录所述统计周期内所述冷门商品所在簇的聚类中心对应的热门商品的推荐点击次数
基于所述推荐点击次数计算所述热门商品的推荐权重:
其中uplim为所述推荐权重的求和上限。
7.根据权利要求6所述的在推荐中解决长尾效应的方法,其特征在于,将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:
使用乱序算法对所述关联次热门商品列表中的热门商品进行乱序排列;
计算所述关联次热门商品列表中的热门商品的推荐权重总和:
在[0,total_weight]的区间范围内生成一个随机数random_num;
遍历所述关联次热门商品列表中的热门商品以计算临时累加权重:
其中k为当前遍历到的热门商品在乱序排列后的所述关联次热门商品列表中的位置;
当遍历到第一个满足cumulative_weight≥random_num的热门商品时,停止遍历;
将当前的k值对应的热门商品确定为所述关联热门商品。
8.根据权利要求1所述的在推荐中解决长尾效应的方法,其特征在于,从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品的步骤具体包括:
获取所述电商网站页面上的商品推荐列表的长度nrelist以及所述关联热门商品的数量nreh;
计算所述推荐冷门商品的数量:
从所述关联热门商品所在的簇中确定数量为nrec的推荐冷门商品。
9.根据权利要求8所述的在推荐中解决长尾效应的方法,其特征在于,在确定所述用户的至少一个关联热门商品的步骤中确定多个关联热门商品,生成所述推荐冷门商品的商品推荐列表的步骤具体包括:
将每个关联热门商品对应的推荐冷门商品合并到一个推荐冷门商品列表;
使用乱序算法对所述推荐冷门商品列表中的冷门商品进行乱序排列得到所述推荐冷门商品的商品推荐列表。
10.一种在推荐中解决长尾效应的装置,其特征在于,包括存储器和处理器,所述处理器执行所述存储器中存储的计算机程序实现如权利要求1-9任一项所述的在推荐中解决长尾效应的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310915482.2A CN116861323B (zh) | 2023-07-24 | 2023-07-24 | 一种在推荐中解决长尾效应的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310915482.2A CN116861323B (zh) | 2023-07-24 | 2023-07-24 | 一种在推荐中解决长尾效应的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116861323A true CN116861323A (zh) | 2023-10-10 |
CN116861323B CN116861323B (zh) | 2024-02-23 |
Family
ID=88221457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310915482.2A Active CN116861323B (zh) | 2023-07-24 | 2023-07-24 | 一种在推荐中解决长尾效应的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116861323B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654307A (zh) * | 2014-11-13 | 2016-06-08 | 苏宁云商集团股份有限公司 | 基于用户反馈的商品推荐方法和系统 |
CN105809474A (zh) * | 2016-02-29 | 2016-07-27 | 深圳市未来媒体技术研究院 | 一种层次化商品信息过滤推荐方法 |
CN108898459A (zh) * | 2018-06-25 | 2018-11-27 | 中国联合网络通信集团有限公司 | 一种商品推荐方法及装置 |
CN109299372A (zh) * | 2018-10-18 | 2019-02-01 | 浙江正元智慧科技股份有限公司 | 一种基于协同过滤的智慧选课推荐方法 |
CN112102029A (zh) * | 2020-08-20 | 2020-12-18 | 浙江大学 | 一种基于知识图谱的长尾推荐计算方法 |
CN113793164A (zh) * | 2020-11-27 | 2021-12-14 | 北京沃东天骏信息技术有限公司 | 广告投放方法、装置、设备及存储介质 |
CN113869971A (zh) * | 2021-09-08 | 2021-12-31 | 卓尔智联(武汉)研究院有限公司 | 商品推荐方法、装置、设备及存储介质 |
CN114240575A (zh) * | 2021-12-24 | 2022-03-25 | 中国人民解放军海军工程大学 | 基于商品流行度及用户动态兴趣的商品推荐方法及系统 |
CN115115435A (zh) * | 2022-08-02 | 2022-09-27 | 北京工业大学 | 基于多样性的电商推荐算法 |
CN115544242A (zh) * | 2022-12-01 | 2022-12-30 | 深圳市智加云栖科技有限公司 | 基于大数据的同类商品选型推荐方法 |
KR20230018010A (ko) * | 2021-07-29 | 2023-02-07 | 주식회사 디파인 | 소비자 동향을 반영한 롱테일 아이템 추천 시스템 및 방법 |
-
2023
- 2023-07-24 CN CN202310915482.2A patent/CN116861323B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654307A (zh) * | 2014-11-13 | 2016-06-08 | 苏宁云商集团股份有限公司 | 基于用户反馈的商品推荐方法和系统 |
CN105809474A (zh) * | 2016-02-29 | 2016-07-27 | 深圳市未来媒体技术研究院 | 一种层次化商品信息过滤推荐方法 |
CN108898459A (zh) * | 2018-06-25 | 2018-11-27 | 中国联合网络通信集团有限公司 | 一种商品推荐方法及装置 |
CN109299372A (zh) * | 2018-10-18 | 2019-02-01 | 浙江正元智慧科技股份有限公司 | 一种基于协同过滤的智慧选课推荐方法 |
CN112102029A (zh) * | 2020-08-20 | 2020-12-18 | 浙江大学 | 一种基于知识图谱的长尾推荐计算方法 |
CN113793164A (zh) * | 2020-11-27 | 2021-12-14 | 北京沃东天骏信息技术有限公司 | 广告投放方法、装置、设备及存储介质 |
KR20230018010A (ko) * | 2021-07-29 | 2023-02-07 | 주식회사 디파인 | 소비자 동향을 반영한 롱테일 아이템 추천 시스템 및 방법 |
CN113869971A (zh) * | 2021-09-08 | 2021-12-31 | 卓尔智联(武汉)研究院有限公司 | 商品推荐方法、装置、设备及存储介质 |
CN114240575A (zh) * | 2021-12-24 | 2022-03-25 | 中国人民解放军海军工程大学 | 基于商品流行度及用户动态兴趣的商品推荐方法及系统 |
CN115115435A (zh) * | 2022-08-02 | 2022-09-27 | 北京工业大学 | 基于多样性的电商推荐算法 |
CN115544242A (zh) * | 2022-12-01 | 2022-12-30 | 深圳市智加云栖科技有限公司 | 基于大数据的同类商品选型推荐方法 |
Non-Patent Citations (2)
Title |
---|
张献忠;: "基于商品流行度和用户活跃度的推荐算法研究", 电脑知识与技术, no. 32 * |
朱睿 等: "基于高速乱序流的Top-K连续查询算法", 《计算机学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN116861323B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020215751A1 (zh) | 一种推荐方法、电子设备及可读存储介质 | |
TWI567673B (zh) | Sorting methods and devices for search results | |
CN111709812A (zh) | 基于用户动态分类的电商平台商品推荐方法及系统 | |
Zhang et al. | Enabling kernel-based attribute-aware matrix factorization for rating prediction | |
Wang et al. | A strategy-oriented operation module for recommender systems in E-commerce | |
CA3070612A1 (en) | Click rate estimation | |
CN102567900A (zh) | 一种向客户推荐商品的方法 | |
CN112200601B (zh) | 物品推荐方法、装置及可读存储介质 | |
Badriyah et al. | Recommendation system for property search using content based filtering method | |
CN111695023A (zh) | 信息推荐方法、装置、存储介质及设备 | |
WO2020221022A1 (zh) | 业务对象推荐方法 | |
Chung et al. | Categorization for grouping associative items using data mining in item-based collaborative filtering | |
Gaikwad et al. | E-commerce recommendation system using improved probabilistic model | |
CN110321490B (zh) | 推荐方法、装置、设备及计算机可读存储介质 | |
CN116861323B (zh) | 一种在推荐中解决长尾效应的方法和装置 | |
Ge | A user-based collaborative filtering recommendation algorithm based on folksonomy smoothing | |
Jain et al. | E-commerce product recommendation based on product specification and similarity | |
JP2019160142A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN114298787A (zh) | 一种商品自动推荐方法及装置 | |
Chew et al. | Recommender System for Retail Domain: An Insight on Techniques and Evaluations | |
Strömqvist | Matrix factorization in recommender systems: How sensitive are matrix factorization models to sparsity? | |
Mohan et al. | Recommendation system in business intelligence solutions for grocery shops: Challenges and perspective | |
CN117350770B (zh) | 一种基于用户画像的精准营销方法及系统 | |
Meel et al. | Movie Recommendation Using Content-Based and Collaborative Filtering | |
Chen et al. | Online Product Recommendations based on Diversity and Latent Association Analysis on News and Products. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |