CN104899660A - 基于奇异值分解的商铺受欢迎度预测方法 - Google Patents
基于奇异值分解的商铺受欢迎度预测方法 Download PDFInfo
- Publication number
- CN104899660A CN104899660A CN201510329542.8A CN201510329542A CN104899660A CN 104899660 A CN104899660 A CN 104899660A CN 201510329542 A CN201510329542 A CN 201510329542A CN 104899660 A CN104899660 A CN 104899660A
- Authority
- CN
- China
- Prior art keywords
- store
- shop
- shops
- popularity
- newly opened
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 24
- 239000013598 vector Substances 0.000 claims abstract description 22
- 239000011159 matrix material Substances 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 18
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 abstract description 3
- 230000007613 environmental effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于奇异值分解的商铺受欢迎度预测方法,用于解决现有门店选址系统及方法效率低的技术问题。技术方案是以用户偏好为中介,在奇异值分解的基础上,加入商铺特征融合和商铺偏好学习,利用社交媒体和基于位置的服务,获取有效信息,包括商铺周围商圈的信息,商铺周围的交通信息,商铺周围人流量的信息等。由于采用奇异值分解的方法进行欢迎度预测,不仅考虑了隐性特征,同时包含了提取出的显性特征。在矩阵分解的过程中,迭代计算左奇异向量、右奇异向量和商铺特征向量。同时利用商铺计算新开商铺的邻居商铺,拟合得到新开商铺的向量参数值,解决了由于矩阵稀疏带来的新开商铺参数不准确的问题,提高了商铺受欢迎度预测方法的效率。
Description
技术领域
本发明涉及一种商铺受欢迎度预测方法,特别是涉及一种基于奇异值分解的商铺受欢迎度预测方法。
背景技术
文献“门店选址系统及方法”公开了一种门店选址系统及方法。该方法通过新开店的业态确定商圈范围,进而确定已有门店和居住小区,并找出这些门店的吸引力影响因素信息,利用回归分析,分析销售额和各影响因素的关系,确定各影响因素对吸引力的影响程度,进一步通过获得的影响因素和其相应的调节指数利用多因素吸引力模型计算出新开店的吸引力。文献所述方法虽然从商业智能的角度出发,解决之前需要通过调查问卷和专家系统的传统性问题,但是影响门店吸引力的因素错综复杂,从吸引力的角度出发,涉及到的很多因素都难以获取。如,销售额、营业面积、销售品类、停车场台数等。文献所述方法中很多因素需要实地取值,适应性不强;当周围环境变化时,不能动态获取和调整相关因素的值,而是需要人工获取,重新进行评估,工程量巨大且效率不高。
发明内容
为了克服现有门店选址系统及方法效率低的不足,本发明提供一种基于奇异值分解的商铺受欢迎度预测方法。该方法以用户偏好为中介,在奇异值分解的基础上,加入商铺特征融合和商铺偏好学习,利用社交媒体和基于位置的服务,获取有效的信息,包括商铺周围商圈的信息,商铺周围的交通信息,商铺周围人流量的信息等。采用这种方式,当商铺周围的环境信息等发生变化时,不需要通过人工实地调研更新信息,采用发明方法能够较快地预测商铺受欢迎度。由于采用奇异值分解的方法进行欢迎度预测,不仅考虑了隐性特征,同时包含了提取出的显性特征。在矩阵分解的过程中,迭代计算左奇异向量、右奇异向量和商铺特征向量。同时利用商铺计算新开商铺的邻居商铺,拟合得到新开商铺的向量参数值,解决了由于矩阵稀疏带来的新开商铺参数不准确的问题,提高了商铺受欢迎度预测方法的效率。
本发明解决其技术问题所采用的技术方案是:一种基于奇异值分解的商铺受欢迎度预测方法,其特点是采用以下步骤:
S1、利用网络爬虫抓取商铺数据,结合基于位置的服务上提供的地点经纬度和交通信息,补全商铺信息。将商铺数据整理成<s,t,p>的三元组格式,并将全部数据按8:2的比例划分为训练数据和测试数据。
其中,s代表商铺,t代表类型,p代表欢迎度。
S2、从商铺信息中提取的特征如下:
距所在商业区中心的距离,定义Fs=logDs,其中Ds为商铺s到所在商业区中心的距离,Fs表示商铺距商业区的远近程度。
交通便利性,定义Tc表示商铺交通便利程度。考虑公交车和地铁两种常用的交通工具,并从两个角度分别对商铺s所在地的交通便利性进行刻画:距离和多样性。
其中,Nbus(s,r)和Nsub(s,r)分别表示商铺s所在区域中公交车、地铁的种类,Dbus和Dsub分别表示商铺s到公交站和地铁站的最近距离。
竞争性,表示同类型商铺之间的关系。其中,Cs为商铺竞争力大小,t表示商铺s所属类型,Nts(s,r)为商铺s所在区域内同类型商铺个数。N(s,r)为商铺s所在区域内所有商铺个数。
多样性,描述了新开商铺所在区域的商业格局。其中,Ndiver表示多样性值,T表示所有商铺类型,Nt(s,r)表示商铺s周围类型为t的商铺数,N(s,r)表示商铺s周围的所有商铺数。
互补性,表示不同类型商铺之间的关系。引入商铺吸引因子ρt->t'来刻画商铺类型t和t'间的耦合度。其中Nset(t,t')为集合(t,t')出现的次数;NT表示商铺类型数,NT×(NT-1)/2为NT种商铺的所有组合数,因此ρt→t'反映了集合(t,t')出现的概率。
对特征进行量化后,量化后的特征取值构成向量F。
S3、以<s,t,p>和F为输入,构建奇异值分解矩阵p=STT+ΛF,通过迭代学习过程,得到参数S、T、Λ。
其中,原始矩阵中行代表商铺,列代表类型,矩阵内的值代表商铺和类型对应的受欢迎度。获得的分解向量S,T,Λ,分别代表奇异值分解的左奇异向量、右奇异向量和商铺特征向量。
S4、根据商铺特征计算新开商铺和训练数据中的同类型商铺集合中所有商铺之间的相似度,从训练数据中找出与目标商铺相似的邻居商铺集合neighbor。
采用欧式距离计算商铺之间的相似度。
其中,disij表示新开商铺i与商铺j之间的距离,disij值越大,代表商铺i与商铺j之间的相似度越低。<fs1…fsk>和<fj1…fjk>分别为商铺i和商铺j的显性特征向量F中的对应值。
S5、根据商铺特征F计算新开商铺和训练数据中的同类型商铺集合中所有商铺之间的相似度,从训练数据中找出与目标商铺相似的邻居商铺集合neighbor,拟合邻居商铺的训练参数得到新开商铺的参数Λ。
S6、按照公式p=STT+ΛF,计算新开商铺的受欢迎度,完成受欢迎度预测。
本发明的有益效果是:该方法以用户偏好为中介,在奇异值分解的基础上,加入商铺特征融合和商铺偏好学习,利用社交媒体和基于位置的服务,获取有效的信息,包括商铺周围商圈的信息,商铺周围的交通信息,商铺周围人流量的信息等。采用这种方式,当商铺周围的环境信息等发生变化时,不需要通过人工实地调研更新信息,采用发明方法能够较快地预测商铺受欢迎度。由于采用奇异值分解的方法进行欢迎度预测,不仅考虑了隐性特征,同时包含了提取出的显性特征。在矩阵分解的过程中,迭代计算左奇异向量、右奇异向量和商铺特征向量。同时利用商铺计算新开商铺的邻居商铺,拟合得到新开商铺的向量参数值,解决了由于矩阵稀疏带来的新开商铺参数不准确的问题,提高了商铺受欢迎度预测方法的效率。
下面结合附图和具体实施方式对本发明作详细说明。
附图说明
图1是本发明基于奇异值分解的商铺受欢迎度预测方法的流程图。
具体实施方式
参照图1。本发明基于奇异值分解的商铺受欢迎度预测方法具体步骤如下:
1、商铺数据抓取。
利用网络爬虫抓取上海市的所有商铺数据,结合基于位置的服务上提供的信息(地点的经纬度、交通信息),补全商铺信息。将商铺数据整理成<商铺,类型,欢迎度>的三元组格式,并将全部数据按8:2的比例划分为训练数据和测试数据。
2、商铺特征提取及量化。
从商铺信息中提取的特征如下:
距所在商业区中心的距离,定义Fs=logDs,其中Ds为商铺s到所在商业区中心的距离,Fs表示商铺距商业区的远近程度。
交通便利性,定义Tc表示商铺交通便利程度。考虑公交车和地铁两种常用的交通工具,并从2个角度分别对商铺s所在地的交通便利性进行刻画:距离和多样性。
其中,Nbus(s,r)和Nsub(s,r)分别表示商铺s所在区域中公交车、地铁的种类,Dbus和Dsub分别表示商铺s到公交站和地铁站的最近距离。
竞争性,表示同类型商铺之间的关系。其中,Cs为商铺竞争力大小,t表示商铺s所属类型,Nts(s,r)为商铺s所在区域内同类型商铺个数。N(s,r)为商铺s所在区域内所有商铺个数。
多样性,描述了新开商铺所在区域的商业格局。其中,Ndiver表示多样性值,T表示所有商铺类型,Nt(s,r)表示商铺s周围类型为t的商铺数,N(s,r)表示商铺s周围的所有商铺数。
互补性,表示不同类型商铺之间的关系。引入商铺吸引因子ρt->t'来刻画商铺类型t和t'间的耦合度。其中Nset(t,t')为集合(t,t')出现的次数;NT表示商铺类型数,NT×(NT-1)/2为NT种商铺的所有组合数,因此ρt→t'反映了集合(t,t')出现的概率。
对特征进行量化后,量化后的特征取值构成向量F。
3、奇异值分解。
以<s,t,p>和F为输入,构建奇异值分解矩阵p=STT+ΛF,通过迭代学习过程,得到参数S、T、Λ。
4、邻居商铺集合。
根据商铺特征计算新开商铺和训练数据中的同类型商铺集合中所有商铺之间的相似度,从训练数据中找出与目标商铺相似的邻居商铺集合neighbor。
本发明中采用欧式距离计算商铺之间的相似度。
其中,disij表示新开商铺i与商铺j之间的距离,disij值越大,代表商铺i与商铺j之间的相似度越低。<fs1…fsk>和<fj1…fjk>分别为商铺i和商铺j的显性特征向量F中的对应值。
5、参数学习。
根据商铺特征F计算新开商铺和训练数据中的同类型商铺集合中所有商铺之间的相似度,从训练数据中找出与目标商铺相似的邻居商铺集合neighbor。拟合邻居商铺的训练参数得到新开商铺的参数Λ。
6、受欢迎度预测。
按照公式p=STT+ΛF,计算新开商铺的受欢迎度,完成受欢迎度预测。
Claims (1)
1.一种基于奇异值分解的商铺受欢迎度预测方法,其特征在于包括以下步骤:
S1、利用网络爬虫抓取商铺数据,结合基于位置的服务上提供的地点经纬度和交通信息,补全商铺信息;将商铺数据整理成<s,t,p>的三元组格式,并将全部数据按8:2的比例划分为训练数据和测试数据;
其中,s代表商铺,t代表类型,p代表欢迎度;
S2、从商铺信息中提取的特征如下:
距所在商业区中心的距离,定义Fs=logDs,其中Ds为商铺s到所在商业区中心的距离,Fs表示商铺距商业区的远近程度;
交通便利性,定义Tc表示商铺交通便利程度;考虑公交车和地铁两种常用的交通工具,并从两个角度分别对商铺s所在地的交通便利性进行刻画:距离和多样性;
其中,Nbus(s,r)和Nsub(s,r)分别表示商铺s所在区域中公交车、地铁的种类,Dbus和Dsub分别表示商铺s到公交站和地铁站的最近距离;
竞争性,表示同类型商铺之间的关系;其中,Cs为商铺竞争力大小,t表示商铺s所属类型,Nts(s,r)为商铺s所在区域内同类型商铺个数;N(s,r)为商铺s所在区域内所有商铺个数;
多样性,描述了新开商铺所在区域的商业格局;其中,Ndiver表示多样性值,T表示所有商铺类型,Nt(s,r)表示商铺s周围类型为t的商铺数,N(s,r)表示商铺s周围的所有商铺数;
互补性,表示不同类型商铺之间的关系;引入商铺吸引因子ρt->t'来刻画商铺类型t和t'间的耦合度;其中Nset(t,t')为集合(t,t')出现的次数;NT表示商铺类型数,NT×(NT-1)/2为NT种商铺的所有组合数,因此ρt→t'反映了集合(t,t')出现的概率;
对特征进行量化后,量化后的特征取值构成向量F;
S3、以<s,t,p>和F为输入,构建奇异值分解矩阵p=STT+ΛF,通过迭代学习过程,得到参数S、T、Λ;
其中,原始矩阵中行代表商铺,列代表类型,矩阵内的值代表商铺和类型对应的受欢迎度;获得的分解向量S,T,Λ,分别代表奇异值分解的左奇异向量、右奇异向量和商铺特征向量;
S4、根据商铺特征计算新开商铺和训练数据中的同类型商铺集合中所有商铺之间的相似度,从训练数据中找出与目标商铺相似的邻居商铺集合neighbor;
采用欧式距离计算商铺之间的相似度;
其中,disij表示新开商铺i与商铺j之间的距离,disij值越大,代表商铺i与商铺j之间的相似度越低;<fs1…fsk>和<fj1…fjk>分别为商铺i和商铺j的显性特征向量F中的对应值;
S5、根据商铺特征F计算新开商铺和训练数据中的同类型商铺集合中所有商铺之间的相似度,从训练数据中找出与目标商铺相似的邻居商铺集合neighbor,拟合邻居商铺的训练参数得到新开商铺的参数Λ;
S6、按照公式p=STT+ΛF,计算新开商铺的受欢迎度,完成受欢迎度预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510329542.8A CN104899660B (zh) | 2015-06-15 | 2015-06-15 | 基于奇异值分解的商铺受欢迎度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510329542.8A CN104899660B (zh) | 2015-06-15 | 2015-06-15 | 基于奇异值分解的商铺受欢迎度预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104899660A true CN104899660A (zh) | 2015-09-09 |
CN104899660B CN104899660B (zh) | 2018-04-27 |
Family
ID=54032313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510329542.8A Active CN104899660B (zh) | 2015-06-15 | 2015-06-15 | 基于奇异值分解的商铺受欢迎度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104899660B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107886241A (zh) * | 2017-11-10 | 2018-04-06 | 北京三快在线科技有限公司 | 资源分析方法、装置、介质和电子设备 |
CN108629618A (zh) * | 2017-03-22 | 2018-10-09 | 董泽平 | 一种无模型推测基础的产品销售预测方法及系统 |
CN115131068A (zh) * | 2022-07-08 | 2022-09-30 | 连连(杭州)信息技术有限公司 | 一种店铺分类方法、装置和计算机存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440589A (zh) * | 2013-09-17 | 2013-12-11 | 上海商学院 | 门店选址系统及方法 |
CN104156831A (zh) * | 2014-08-25 | 2014-11-19 | 孙军 | 一种购物中心业态发展监控方法 |
CN104392357A (zh) * | 2014-10-29 | 2015-03-04 | 广州康之家医药电子商务有限公司 | 一种基于o2o模式的购物方法及系统 |
-
2015
- 2015-06-15 CN CN201510329542.8A patent/CN104899660B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440589A (zh) * | 2013-09-17 | 2013-12-11 | 上海商学院 | 门店选址系统及方法 |
CN104156831A (zh) * | 2014-08-25 | 2014-11-19 | 孙军 | 一种购物中心业态发展监控方法 |
CN104392357A (zh) * | 2014-10-29 | 2015-03-04 | 广州康之家医药电子商务有限公司 | 一种基于o2o模式的购物方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108629618A (zh) * | 2017-03-22 | 2018-10-09 | 董泽平 | 一种无模型推测基础的产品销售预测方法及系统 |
CN107886241A (zh) * | 2017-11-10 | 2018-04-06 | 北京三快在线科技有限公司 | 资源分析方法、装置、介质和电子设备 |
CN115131068A (zh) * | 2022-07-08 | 2022-09-30 | 连连(杭州)信息技术有限公司 | 一种店铺分类方法、装置和计算机存储介质 |
CN115131068B (zh) * | 2022-07-08 | 2023-12-26 | 连连(杭州)信息技术有限公司 | 一种店铺分类方法、装置和计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104899660B (zh) | 2018-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11748379B1 (en) | Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis | |
Gao et al. | A personalized point-of-interest recommendation model via fusion of geo-social information | |
CN107133262B (zh) | 一种基于多影响嵌入的个性化poi推荐方法 | |
CN102789499B (zh) | 基于物品间情景化隐式关系的协同过滤方法 | |
CN106095973B (zh) | 一种结合短时流量预测的旅游路线推荐方法 | |
CN110119475B (zh) | 一种poi推荐方法及推荐系统 | |
CN109241454A (zh) | 一种将社交网络和图像内容融合的兴趣点推荐方法 | |
CN105242239A (zh) | 一种基于众包指纹分簇和匹配的室内子区域定位方法 | |
CN106997389A (zh) | 一种基于多数据集和协同张量分解的旅游景点推荐方法 | |
CN106126615A (zh) | 一种兴趣点推荐的方法及系统 | |
CN106021456B (zh) | 将文本和地理信息融合在局部协同排列的兴趣点推荐方法 | |
CN113298314B (zh) | 一种考虑动态时空相关性的轨道交通客流预测方法 | |
CN105808680A (zh) | 基于张量分解进行上下文相关的位置推荐方法 | |
CN104850645B (zh) | 一种基于矩阵分解的主动学习评分引导方法及系统 | |
CN108804646A (zh) | 一种融合深度学习和因子分解机的兴趣点签到预测方法 | |
CN105976070A (zh) | 基于重点元素的矩阵分解及微调方法 | |
CN115907001A (zh) | 基于知识蒸馏的联邦图学习方法及自动驾驶方法 | |
CN105160539A (zh) | 一种概率矩阵分解推荐方法 | |
CN104899660B (zh) | 基于奇异值分解的商铺受欢迎度预测方法 | |
CN110874437A (zh) | 一种基于多重兴趣点对排序的个性化兴趣点推荐方法 | |
CN103150383A (zh) | 一种短文本数据的事件演化分析方法 | |
CN103955524A (zh) | 一种基于超图模型的与事件相关的社会化图像查找算法 | |
CN103399900A (zh) | 基于位置服务的图片推荐方法 | |
CN116911949A (zh) | 基于边界排名损失和邻域感知图神经网络的物品推荐方法 | |
CN104463207A (zh) | 知识自编码网络及其极化sar影像地物分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |