CN110335091A - 一种基于长尾效应的卷烟惊喜度推荐方法及系统 - Google Patents

一种基于长尾效应的卷烟惊喜度推荐方法及系统 Download PDF

Info

Publication number
CN110335091A
CN110335091A CN201910635958.0A CN201910635958A CN110335091A CN 110335091 A CN110335091 A CN 110335091A CN 201910635958 A CN201910635958 A CN 201910635958A CN 110335091 A CN110335091 A CN 110335091A
Authority
CN
China
Prior art keywords
user
cigarette
long tail
recommended
pleasantly surprised
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910635958.0A
Other languages
English (en)
Inventor
禚晓光
田世康
程金龙
孙涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Software Co Ltd
Original Assignee
Inspur Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Co Ltd filed Critical Inspur Software Co Ltd
Priority to CN201910635958.0A priority Critical patent/CN110335091A/zh
Publication of CN110335091A publication Critical patent/CN110335091A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于长尾效应的卷烟惊喜度推荐方法及系统,属于计算机技术领域。本发明的基于长尾效应的卷烟惊喜度推荐方法包括以下步骤:S1、数据集选取:根据销售指标对用户进行分档,从分档用户中选取训练集;S2、建立模型:根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证;S3、计算各用户主题分布的余弦相似度,使用用户主题分布间的余弦相似度来刻画用户相似度;S4、寻找紧邻用户生成推荐卷烟集合。该发明的基于长尾效应的卷烟惊喜度推荐方法能够将客户信息、卷烟销售数据和指标进行建模,挖掘卷烟长尾中的销售机会,增加卷烟销量,具有很好的推广应用价值。

Description

一种基于长尾效应的卷烟惊喜度推荐方法及系统
技术领域
本发明涉及计算机技术领域,具体提供一种基于长尾效应的卷烟惊喜度推荐方法及系统。
背景技术
目前卷烟行业的市场行情普遍存在畅销烟、紧俏烟占据了整个卷烟市场80%的销量,特别是一些畅销、紧俏卷烟的限量供应在一定程度上影响到零售客户的运营。如何针对“需求不旺、销量不佳”的品牌,进行营销已迫在眉睫。
“长尾理论”阐述了:只要存储和流通的渠道足够大,需求不旺或销量不佳的产品所共同占据的市场份额可以和那些少数热销产品所占据的市场份额相匹敌甚至更大。也就是说,众多小市场汇聚成的市场能量可与主流大市场相抗衡。本文从“长尾理论”角度出发,将客户信息、卷烟销售数据和指标进行建模,挖掘卷烟长尾中的销售机会,增加卷烟销量。可以采用LDA主题文档模型进行长尾推荐。LDA主题文档模型是一种文档主题生成模型,也称为三层贝叶斯概率模型,传统的LDA主题文档模型为文档-主题-词。所谓生成模型为文档-主题-词三层结构,就是说,我们认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布。但是传统的LDA主题文档模型并不能满足分析卷烟行业行情的需求。
发明内容
本发明的技术任务是针对上述存在的问题,提供一种能够将客户信息、卷烟销售数据和指标进行建模,挖掘卷烟长尾中的销售机会,增加卷烟销量的基于长尾效应的卷烟惊喜度推荐方法。
本发明进一步的技术任务是提供一种基于长尾效应的卷烟惊喜度推荐系统。
为实现上述目的,本发明提供了如下技术方案:
一种基于长尾效应的卷烟惊喜度推荐方法,具体包括以下步骤:
S1、数据集选取:根据销售指标对用户进行分档,从分档用户中选取训练集;
S2、建立模型:根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证;
S3、计算各用户主题分布的余弦相似度,使用用户主题分布间的余弦相似度来刻画用户相似度;
S4、寻找紧邻用户生成推荐卷烟集合。
作为优选,步骤S1中,选取训练集后,统计用户的卷烟品规订购数量,卷烟品规和订购的数量生成商品层Wi,用户对卷烟品规订购总量为用户订购行为层Uj
根据各类销售指标对用户进行分档,一般分为30档用户,从30档用户中采用随机抽样的方法,每档用户取200个用户共6000户作为训练集,统计抽样用户各种品规卷烟的订购数量,将各品规卷烟和订购的数量生成商品层Wi。每个用户的对于各品规卷烟订购总量看成客户订购行为层Uj。相同主题下的用户是爱好相近的用户,可以作为长尾推荐的用户。
作为优选,步骤S2中,将Uij作为用户订购卷烟出现的概率,如公式(1)所示
p(θ)=uj/wi (1)
通过用户概率模型分解得到卷烟-主题阵W和主题-用户阵K。
在20个主题下,进行500次的分解迭代,卷烟-主题阵W和主题-用户阵K趋于收敛。主题用来刻画用户的订购行为的偏好。
作为优选,步骤S3中,各用户主题分布的余弦相似度计算如公式(2)所示
其中Sij表示用户ui和uj的相似度;Ui和Uj表示两用户的概率主题分布。其中相似度Sij值越大,用户爱好越相近,寻找相似度最大的前N个用户作为推荐用户。
作为优选,步骤S4中,通过用户标签取出推荐用户的地理位置,使用K紧邻算法计算地理位置与目标用户最接近的推荐用户,将最接近的推荐用户订购卷烟集合推送给目标用户,K紧邻计算公式如公式(3)所示
其中,目标用户地理位置坐标为P(x1,y1),推荐用户地理位置坐标为Q(x2,y2)。
一种基于长尾效应的卷烟惊喜度推荐系统,包括以下模块:
数据集选取模块:用于根据销售指标对用户进行分档,从分档用户中选取训练集;
模型模块:用于根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证;
各用户主题分布的余弦相似度计算模块:使用用户主题分布间的余弦相似度来刻画用户相似度;
卷烟集合生成模块:用于寻找紧邻用户生成推荐卷烟集合。
作为优选,所述数据集选取模块选取训练集后,统计用户的卷烟品规订购数量,卷烟品规和订购的数量生成商品层Wi,用户对卷烟品规订购总量为用户订购行为层Uj
作为优选,卷烟集合生成模通过用户标签取出推荐用户的地理位置,使用K紧邻算法计算地理位置与目标用户最接近的推荐用户,将最接近的推荐用户订购卷烟集合推送给目标用户。
与现有技术相比,本发明的基于长尾效应的卷烟惊喜度推荐方法具有以下突出的有益效果:所述基于长尾效应的卷烟惊喜度推荐方法基于目前卷烟行业的市场情普遍存在畅销烟、紧俏烟占据了整个卷烟市场60%的销量,特别是一些畅销、紧俏卷烟的限量供应在一定程度上影响到零售客户的运营的问题,针对“需求不旺、销量不佳”的品牌,进行营销,将客户信息、卷烟销售数据和指标进行建模,挖掘卷烟长尾中的销售机会,增加卷烟销量,具有良好的推广应用价值。
附图说明
图1是本发明基于长尾效应的卷烟惊喜度推荐方法中客户订购行为层-商品-主题层示意图。
具体实施方式
下面将结合实施例,对本发明的基于长尾效应的卷烟惊喜度推荐方法及系统作进一步详细说明。
实施例
本发明的基于长尾效应的卷烟惊喜度推荐方法,具体包括以下步骤:
S1、数据集选取:根据销售指标对用户进行分档,从分档用户中选取训练集。
选取训练集后,统计用户的卷烟品规订购数量,卷烟品规和订购的数量生成商品层Wi,用户对卷烟品规订购总量为用户订购行为层Uj
根据各类销售指标对用户进行分档,一般分为30档用户,从30档用户中采用随机抽样的方法,每档用户取200个用户共6000户作为训练集,统计抽样用户各种品规卷烟的订购数量,将各品规卷烟和订购的数量生成商品层Wi。每个用户的对于各品规卷烟订购总量看成客户订购行为层Uj。相同主题下的用户是爱好相近的用户,可以作为长尾推荐的用户。
S2、建立模型:根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证。
将Uij作为用户订购卷烟出现的概率,如公式(1)所示
p(θ)=uj/wi (1)
通过用户概率模型分解得到卷烟-主题阵W和主题-用户阵K。
在20个主题下,进行500次的分解迭代,卷烟-主题阵W和主题-用户阵K趋于收敛。主题用来刻画用户的订购行为的偏好。
S3、计算各用户主题分布的余弦相似度,使用用户主题分布间的余弦相似度来刻画用户相似度。
各用户主题分布的余弦相似度计算如公式(2)所示
其中Sij表示用户ui和uj的相似度;Ui和Uj表示两用户的概率主题分布。其中相似度Sij值越大,用户爱好越相近,寻找相似度最大的前N个用户作为推荐用户。
S4、寻找紧邻用户生成推荐卷烟集合。
通过用户标签取出推荐用户的地理位置,使用K紧邻算法计算地理位置与目标用户最接近的推荐用户,将最接近的推荐用户订购卷烟集合推送给目标用户,K紧邻计算公式如公式(3)所示
其中,目标用户地理位置坐标为P(x1,y1),推荐用户地理位置坐标为Q(x2,y2)。
该基于长尾效应的卷烟惊喜度推荐方法利用LDA文档主题模型对用户的兴趣建模,LDA文档主题模型为客户订购行为-主题-商品这三层。将主题模型下生成的多项式的概率分布表示为用户对商品的兴趣。并将一个用户对所有商品的所有行为并成一个文档进行主题生成,得到概率分布情况。有了概率分布情况就可以建立相应的主题兴趣模型。
其中客户订购行为层-商品-主题三层释义如下,如附图1所示:
商品层:商品集W={w1,w2...wv}是从卷烟库中抽取出来的去除停用卷烟后的所有卷烟的集合。
主题层:主题集中的每一个主题zk都是基于卷烟集W的概率多项式分布,可以表示为向量其中pk,j表示卷烟wj在主题zk中的生成概率。
客户订购行为层:即每一个用的订购行为表示成一个卷烟频向量di={tfi,1,tfi,2...tfi,v},其中tfi,j表示卷烟j在客户i订购行为中出现的次数;对于主题层来说,客户集可以表示为U={u1,u2...um},其中每个向量ud={qd,1,qd,2...qd,m}表示一个客户订购的主题分布,qd,m是该主题z在客户订购行为中的生成概率。
本发明的基于长尾效应的卷烟惊喜度推荐系统,包括以下模块:
数据集选取模块:用于根据销售指标对用户进行分档,从分档用户中选取训练集;
模型模块:用于根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证;
各用户主题分布的余弦相似度计算模块:使用用户主题分布间的余弦相似度来刻画用户相似度;
卷烟集合生成模块:用于寻找紧邻用户生成推荐卷烟集合。
数据集选取模块选取训练集后,统计用户的卷烟品规订购数量,卷烟品规和订购的数量生成商品层Wi,用户对卷烟品规订购总量为用户订购行为层Uj
卷烟集合生成模通过用户标签取出推荐用户的地理位置,使用K紧邻算法计算地理位置与目标用户最接近的推荐用户,将最接近的推荐用户订购卷烟集合推送给目标用户。

Claims (8)

1.一种基于长尾效应的卷烟惊喜度推荐方法,其特征在于:具体包括以下步骤:
S1、数据集选取:根据销售指标对用户进行分档,从分档用户中选取训练集;
S2、建立模型:根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证;
S3、计算各用户主题分布的余弦相似度,使用用户主题分布间的余弦相似度来刻画用户相似度;
S4、寻找紧邻用户生成推荐卷烟集合。
2.根据权利要求1所述的基于长尾效应的卷烟惊喜度推荐方法,其特征在于:步骤S1中,选取训练集后,统计用户的卷烟品规订购数量,卷烟品规和订购的数量生成商品层Wi,用户对卷烟品规订购总量为用户订购行为层Uj
3.根据权利要求2所述的基于长尾效应的卷烟惊喜度推荐方法,其特征在于:步骤S2中,将Uij作为用户订购卷烟出现的概率,如公式(1)所示
p(θ)=uj/wi (1)
通过用户概率模型分解得到卷烟-主题阵W和主题-用户阵K。
4.根据权利要求3所述的基于长尾效应的卷烟惊喜度推荐方法,其特征在于:步骤S3中,各用户主题分布的余弦相似度计算如公式(2)所示
其中Sij表示用户ui和uj的相似度;Ui和Uj表示两用户的概率主题分布。
5.根据权利要求4所述的基于长尾效应的卷烟惊喜度推荐方法,其特征在于:步骤S4中,通过用户标签取出推荐用户的地理位置,使用K紧邻算法计算地理位置与目标用户最接近的推荐用户,将最接近的推荐用户订购卷烟集合推送给目标用户,K紧邻计算公式如公式(3)所示
其中,目标用户地理位置坐标为P(x1,y1),推荐用户地理位置坐标为Q(x2,y2)。
6.一种基于长尾效应的卷烟惊喜度推荐系统,其特征在于:包括以下模块:
数据集选取模块:用于根据销售指标对用户进行分档,从分档用户中选取训练集;
模型模块:用于根据商品和用户的订购行为建立用户概率模型,根据用户概率模型对训练集验证;
各用户主题分布的余弦相似度计算模块:使用用户主题分布间的余弦相似度来刻画用户相似度;
卷烟集合生成模块:用于寻找紧邻用户生成推荐卷烟集合。
7.根据权利要求6所述的基于长尾效应的卷烟惊喜度推荐系统,其特征在于:所述数据集选取模块选取训练集后,统计用户的卷烟品规订购数量,卷烟品规和订购的数量生成商品层Wi,用户对卷烟品规订购总量为用户订购行为层Uj
8.据权利要求7所述的基于长尾效应的卷烟惊喜度推荐系统,其特征在于:卷烟集合生成模通过用户标签取出推荐用户的地理位置,使用K紧邻算法计算地理位置与目标用户最接近的推荐用户,将最接近的推荐用户订购卷烟集合推送给目标用户。
CN201910635958.0A 2019-07-15 2019-07-15 一种基于长尾效应的卷烟惊喜度推荐方法及系统 Pending CN110335091A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910635958.0A CN110335091A (zh) 2019-07-15 2019-07-15 一种基于长尾效应的卷烟惊喜度推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910635958.0A CN110335091A (zh) 2019-07-15 2019-07-15 一种基于长尾效应的卷烟惊喜度推荐方法及系统

Publications (1)

Publication Number Publication Date
CN110335091A true CN110335091A (zh) 2019-10-15

Family

ID=68144891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910635958.0A Pending CN110335091A (zh) 2019-07-15 2019-07-15 一种基于长尾效应的卷烟惊喜度推荐方法及系统

Country Status (1)

Country Link
CN (1) CN110335091A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330406A (zh) * 2020-11-10 2021-02-05 深圳大学 一种长尾物品推荐方法、智能终端及存储介质
CN116881559A (zh) * 2023-07-14 2023-10-13 广东烟草惠州市有限责任公司 一种基于改进k最近邻的卷烟品规推荐方法
CN116882685A (zh) * 2023-07-14 2023-10-13 广东烟草惠州市有限责任公司 一种基于lda模型的卷烟陈列方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886067A (zh) * 2014-03-20 2014-06-25 浙江大学 使用标签隐含主题进行图书推荐的方法
CN106296290A (zh) * 2016-08-11 2017-01-04 浪潮软件股份有限公司 一种基于大数据和数据挖掘的个性化订单推荐方法
CN107481114A (zh) * 2017-08-16 2017-12-15 北京京东尚科信息技术有限公司 商品推荐方法、装置、电子商务系统及存储介质
CN107908669A (zh) * 2017-10-17 2018-04-13 广东广业开元科技有限公司 一种基于并行lda的大数据新闻推荐方法、系统及装置
US20190050484A1 (en) * 2015-12-23 2019-02-14 Baidu Online Network Technology (Beijing) Co. Ltd. Big data based cross-domain recommendation method and apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886067A (zh) * 2014-03-20 2014-06-25 浙江大学 使用标签隐含主题进行图书推荐的方法
US20190050484A1 (en) * 2015-12-23 2019-02-14 Baidu Online Network Technology (Beijing) Co. Ltd. Big data based cross-domain recommendation method and apparatus
CN106296290A (zh) * 2016-08-11 2017-01-04 浪潮软件股份有限公司 一种基于大数据和数据挖掘的个性化订单推荐方法
CN107481114A (zh) * 2017-08-16 2017-12-15 北京京东尚科信息技术有限公司 商品推荐方法、装置、电子商务系统及存储介质
CN107908669A (zh) * 2017-10-17 2018-04-13 广东广业开元科技有限公司 一种基于并行lda的大数据新闻推荐方法、系统及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330406A (zh) * 2020-11-10 2021-02-05 深圳大学 一种长尾物品推荐方法、智能终端及存储介质
CN112330406B (zh) * 2020-11-10 2024-05-24 深圳大学 一种长尾物品推荐方法、智能终端及存储介质
CN116881559A (zh) * 2023-07-14 2023-10-13 广东烟草惠州市有限责任公司 一种基于改进k最近邻的卷烟品规推荐方法
CN116882685A (zh) * 2023-07-14 2023-10-13 广东烟草惠州市有限责任公司 一种基于lda模型的卷烟陈列方法

Similar Documents

Publication Publication Date Title
Esser et al. Scaling rectified flow transformers for high-resolution image synthesis
CN109299370B (zh) 多对级个性化推荐方法
CN111461841B (zh) 物品推荐方法、装置、服务器及存储介质
CN110335091A (zh) 一种基于长尾效应的卷烟惊喜度推荐方法及系统
CN105095267B (zh) 一种用于用户参与项目的推荐方法及装置
CN108898459A (zh) 一种商品推荐方法及装置
CN109087177A (zh) 向目标用户推荐商品的方法、装置及计算机可读存储介质
US20180365718A1 (en) Machine learning for marketing of branded consumer products
CN104036405A (zh) 一种虚拟资源交易订单的处理方法及装置
CN113724042A (zh) 一种商品推荐方法、装置、介质和设备
Tseng et al. Statistical properties of agent-based models in markets with continuous double auction mechanism
CN110570233A (zh) 用于电商平台的用户回购时间预测方法及装置
CN111080206A (zh) 补货清单的生成方法、装置、设备及存储介质
CN111340522A (zh) 资源推荐方法、装置、服务器及存储介质
KR20150113644A (ko) 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법
CN111310029B (zh) 一种基于用户商品画像和潜在因子特征提取的混合推荐方法
CN108475387A (zh) 使用社交媒体数据利用个性化激励增加选择共享
Shravani et al. VR supermarket: A virtual reality online shopping platform with a dynamic recommendation system
Wölbitsch et al. Beggars can't be choosers: augmenting sparse data for embedding-based product recommendations in retail stores
CN118429020A (zh) 商家推荐方法、装置、计算机设备、存储介质和程序产品
US10579752B2 (en) Generating a model based on input
CN104035934A (zh) 一种多媒体信息推荐的方法及装置
CN104899232B (zh) 协同聚类的方法和设备
CN110020918B (zh) 一种推荐信息生成方法和系统
TW201737128A (zh) 資料管控的方法及系統

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191015