CN106095973B - 一种结合短时流量预测的旅游路线推荐方法 - Google Patents
一种结合短时流量预测的旅游路线推荐方法 Download PDFInfo
- Publication number
- CN106095973B CN106095973B CN201610442583.2A CN201610442583A CN106095973B CN 106095973 B CN106095973 B CN 106095973B CN 201610442583 A CN201610442583 A CN 201610442583A CN 106095973 B CN106095973 B CN 106095973B
- Authority
- CN
- China
- Prior art keywords
- interest
- point
- time
- historical
- time series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000012546 transfer Methods 0.000 claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims abstract description 27
- 230000007704 transition Effects 0.000 claims abstract description 13
- 239000000284 extract Substances 0.000 claims abstract description 4
- 238000005311 autocorrelation function Methods 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000003760 hair shine Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 15
- 206010019133 Hangover Diseases 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241001123248 Arma Species 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种结合短时流量预测的旅游路线推荐方法,该方法为:从照片共享网站下载历史照片描述信息,采用DBScan聚类算法对照片进行聚类,得到照片密度大的兴趣点,提取历史照片描述信息的历史旅游路线,根据历史照片描述信息,建立各兴趣点不同时间间隔的时间序列模型,根据该地区历史旅游路线集合中的历史旅游路线生成Markov模型的概率转移矩阵,并通过用户实时上传的照片及照片描述信息,对Markov模型的概率转移矩阵进行更新,根据更新后的Markov模型的概率转移矩阵,为用户推荐转移概率最大的兴趣点。该方法结合各兴趣点的短时游客流量做路线推荐,在景点内部起到分散客流的作用。
Description
技术领域
本发明属于数据挖掘技术领域,具体涉及一种结合短时流量预测的旅游路线推荐方法。
背景技术
随着智能手机等移动智能设备的普及,人们生活水平的日益提高。人们在旅途中拍摄照片记录下旅程的风景已经成为了一种风尚。每年都有成千上万的人拍摄了大量的照片,照片除了记录了人们旅途的风景,还附带GPS信息、拍摄时间等有意义的数据。这为从照片中挖掘旅游路线并推荐提供了很好的数据源。
由于互联网的发展,大量的社交网站、照片共享平台涌进人们的生活之中。这为旅途照片的分享提供了良好的互联网平台,使得信息的共享和传递得到了极大地提高。大量社交网站、照片分享平台的涌现还为我们获取数据源提供了优秀的平台支持。
由于照片信息中包含着GPS信息、拍摄时间信息,这使得我们依据照片的拍摄时间、照片间GPS信息的变化,提取出旅游路线成为了可能。目前,旅游大数据挖掘主要是使用聚类、关联分析等方法,从大量用户的移动轨迹中找到出现概率比较高的频繁轨迹模式,进而为旅游行业提供有价值的信息,为决策者提供决策支持,同时也可以为用户提供个性化的路线推荐服务。上述方法中提出的推荐路线都是基于历史数据提出的一个经典路线,没有考虑到旅行实时过程中游客流量对路线选择的影响,当某些景点人流过大时应采取相应的分流策略,对旅游路线进行重新规划。
发明内容
针对现有技术的不足,本发明提出一种结合短时流量预测的旅游路线推荐方法。
本发明的技术方案是:
一种结合短时流量预测的旅游路线推荐方法,包括以下步骤:
步骤1:从照片共享网站下载一个地区H年的历史照片描述信息,并将各历史照片描述信息存储于数据库中,所述历史照片描述信息包括:照片ID、照片GPS信息、上传用户ID、照片拍摄时间、照片主题和照片描述信息;
步骤2:针对数据库中历史照片描述信息,采用DBScan聚类算法对照片GPS信息进行聚类,得到该地区照片密度大的兴趣点;
步骤3:提取历史照片描述信息中各个兴趣点在同一天内各上传用户ID的历史旅游路线,得到该地区的历史旅游路线集合;
步骤3.1:提取出各个兴趣点中同一天内一个上传用户ID的照片ID,并按照片拍摄时间进行排序,得到该用户的一条历史旅游路线;
步骤3.2:重复步骤3.1提取各个兴趣点在同一天内各上传用户ID的历史旅游路线,将该地区内所有人的历史旅游路线作为历史旅游路线集合,得到该地区的历史旅游路线集合;
步骤4:根据历史照片描述信息,建立各兴趣点不同时间间隔的时间序列模型;
步骤4.1:根据该地区H年内的照片拍摄时间,将各兴趣点按照季节划分为4个部分;
步骤4.2:针对所述划分的各部分,以t小时为时间间隔,统计出一天内各兴趣点各时间间隔的照片数量,将各个时间间隔中该地区一个兴趣点的照片数量的和作为该兴趣点的时间序列;得到各个部分各兴趣点的时间序列集合;
步骤4.3:判断当前兴趣点时间序列是否平稳,若是,执行步骤4.5,否则,执行步骤4.4;
步骤4.4:对当前兴趣点的时间序列进行差分处理,得到该兴趣点的新的时间序列,返回步骤4.3;
步骤4.5:根据当前兴趣点时间序列中k时间间隔的照片数量的方差和协方差确定该兴趣点的时间序列的自相关系数和偏自相关系数,从而确定该兴趣点的时间序列模型;
步骤4.6:重复步骤4.3至步骤4.5,得到各兴趣点的时间序列模型;
步骤5:根据该地区历史旅游路线集合中的历史旅游路线生成Markov模型的概率转移矩阵,并通过用户实时上传的照片及照片描述信息,对Markov模型的概率转移矩阵进行更新;
步骤5.1:根据历史旅游路线集合中的历史旅游路线计算各个兴趣点间的转移次数,得到该地区各兴趣点状态转移有向图,生成Markov模型的概率转移矩阵;
步骤5.2:将用户上传的当前时刻的各兴趣点照片数量和各兴趣点对应的时间序列模型对Markov模型的概率转移矩阵进行调整;
步骤6:根据用户上传的当前时刻的照片GPS信息和更新后的Markov模型的概率转移矩阵,为用户推荐转移概率最大的兴趣点。
优选地,所述判断当前兴趣点时间序列是否平稳的具体方法为:判断一个兴趣点时间序列中照片数量的均值、方差和协方差是否与时间有关,若一个兴趣点时间序列中照片数量的均值、方差和协方差均与时间无关,则该兴趣点的时间序列平稳。
优选地,所述步骤4.5包括以下步骤:
步骤4.5.1:根据当前兴趣点时间序列中k时间间隔的照片数量的方差和协方差得到该兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数;
步骤4.5.2:根据当前兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数之间的关系,确定该兴趣点的时间序列模型的形式;
步骤4.5.3:根据当前兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数是否在置信区间内,确定该兴趣点的时间序列模型的阶数;
步骤4.5.4:采用带遗忘因子的递推最小二乘算法确定当前兴趣点的时间序列模型的参数矩阵。
优选地,所述步骤5.2包括以下步骤:
步骤5.2.1:将用户上传的当前时刻的各兴趣点照片数量输入对应兴趣点的时间序列模型,得到各兴趣点下一时刻游客流量的预测值,并计算该地区各兴趣点下一时刻游客流量预测值的平均值;
步骤5.2.2:确定各兴趣点下一时刻游客流量预测值nj与下一时刻游客流量预测值的平均值的差值subj,j为兴趣点;
步骤5.2.3:根据各兴趣点下一时刻游客流量预测值nj与下一时刻游客流量预测值的平均值的差值subj对Markov模型的转移概率进行更新,得到更新后的Markov模型的概率转移矩阵;
所述更新公式为:当subj大于0时,令其中,pij′为更新的转移概率,pij为原Markov模型的转移概率,N1<N为subj大于0的兴趣点个数,p0为概率变化的基本单位;
当subj小于0时,令其中,N2<N为subj小于0的兴趣点个数。
本发明的有益效果:
本发明提出一种结合短时流量预测的旅游路线推荐方法,该方法结合各兴趣点的短时游客流量做路线推荐,对于游客量过大或过小的兴趣点,适当减小下一时间段到该兴趣点的转移概率,从而在景点内部起到分散客流的作用。现在旅游业发展迅速,一些较大的景点每天都要接待大量的游客,景区拥堵成了普遍现象,而且人流密集也存在一定的安全隐患,因此,分散客流就更加有意义。
附图说明
图1为本发明实施方式中结合短时流量预测的旅游路线推荐方法流程图;
图2为本发明实施方式中个景区内的游客a和游客b的历史旅游路线示意图;
图3为本发明实施方式中建立各兴趣点不同时间间隔的时间序列模型的流程图;
图4为本发明实施方式中1-3月、4-6月、7-9月、10-12月四个部分差分前的时间序列和差分处理后的时间序列对比示意图;
其中,(a)为1-3月差分前的时间序列和差分处理后的时间序列对比示意图;
(b)4-6月差分前的时间序列和差分处理后的时间序列对比示意图;
(c)7-9月差分前的时间序列和差分处理后的时间序列对比示意图;
(d)10-12月差分前的时间序列和差分处理后的时间序列对比示意图;
图5为本发明实施方式中得到的各兴趣点状态转移有向图;
图6为本发明实施方式中得到的1-3月、4-6月各兴趣点下一时刻游客流量的预测值与实际流量的对比图;
其中,(a)为传统方法得到的1-3月游客流量的预测值与实际流量的对比图;
(b)为本发明方法得到的1-3月游客流量的预测值与实际流量的对比图;
(c)为传统方法得到的4-6月游客流量的预测值与实际流量的对比图;
(d)为本发明方法得到的4-6月游客流量的预测值与实际流量的对比图。
具体实施方式
下面结合附图对本发明具体实施方式加以详细的说明。
一种结合短时流量预测的旅游路线推荐方法,如图1所示,包括以下步骤:
步骤1:从Flickr网站下载一个地区5年的历史照片描述信息,并将各历史照片描述信息存储于数据库中,所述历史照片描述信息包括:照片ID、照片GPS信息、上传用户ID、照片拍摄时间、照片主题和照片描述信息.
步骤1.1:从Flickr网站下载一个地区5年具有历史照片描述信息的XML格式的照片文本信息。
步骤1.2:解析具有历史照片描述信息的XML格式的照片文本信息,解析出该历史照片描述信息:照片ID、照片GPS信息、上传用户ID、照片拍摄时间、照片主题和照片描述信息,并将各历史照片描述信息存储于数据库中。
本实施方式中,将一张照片phv的历史照片描述信息以五元组表示:
phv=(photoidv,ownerv,latv,lonv,datetakenv);其中,photoidv为照片phv的照片ID,ownerv为照片phv上传用户ID,latv为照片phv的拍摄地点对应的纬度,lonv为照片phv的拍摄地点对应的精度,datetakenv为照片phv的拍摄时间,包含日期和时间。
步骤2:针对数据库中历史照片描述信息,采用DBScan聚类算法对照片GPS信息进行聚类,得到该地区照片密度大的兴趣点。
步骤2.1:对数据库中照片的历史照片描述信息进行预处理,删除信息缺失的历史照片描述信息:删除照片ID、照片GPS信息、上传用户ID或照片拍摄时间缺失的照片信息。
步骤2.2:采用DBScan聚类算法对照片GPS信息进行聚类,得到各个景区照片密度大的兴趣点。
本实施方式中,采用聚类半径ε取值为1km、聚类密度阈值MinPts取值为200的DBScan聚类算法对照片GPS信息进行聚类,聚类的每一个簇视为一个兴趣点(POI)。
步骤2.3:将各个兴趣点存储至数据库中。
本实施方式中,将兴趣点信息做每一条数据库记录属性class_id,更新至数据库的每一条记录。
步骤3:提取历史照片描述信息中各个兴趣点在同一天内各上传用户ID的历史旅游路线,得到该地区的历史旅游路线集合。
步骤3.1:提取出各个兴趣点中同一天内一个上传用户ID的照片ID,并按照片拍摄时间进行排序,得到该用户的一条历史旅游路线。
本实施方式中,一个用户a的一条历史旅游路线Patha表示为:
Patha=(ownera,date,{Cluster0→Cluster1→…→Clusterz}),其中,ownera为用户a的用户ID,date为Patha的发生的日期,{Cluster0→Cluster1→…→Clusterz}为按照片拍摄时间先后顺序排列的兴趣点的集合,在兴趣点中一般含有多张照片。
步骤3.2:重复步骤3.1提取各个兴趣点在同一天内各上传用户ID的历史旅游路线,将该地区内所有人的历史旅游路线作为历史旅游路线集合,得到该地区的历史旅游路线集合。
本实施方式中,得到的该地区的历史旅游路线集合表示为:
PathSet={Patha,Pathb,Pathc,...}。本实施方式中,一个景区内的游客a和游客b的历史旅游路线如图2所示。
步骤4:根据历史照片描述信息,建立各兴趣点不同时间间隔的时间序列模型,如图3所示。
步骤4.1:根据该地区5年内的照片拍摄时间,将各兴趣点按照季节划分为4个部分。
本实施方式中,将该地区5年内的照片拍摄时间,各兴趣点按照季节划分为4个部分为1-3月、4-6月、7-9月、10-12月四个部分。
步骤4.2:针对划分的1-3月、4-6月、7-9月、10-12月四个部分,以1小时为时间间隔,统计出一天内各兴趣点各时间间隔的照片数量,将各个时间间隔中该地区一个兴趣点的照片数量的和作为该兴趣点的时间序列;得到4个部分各兴趣点的时间序列集合。
步骤4.3:判断当前兴趣点时间序列是否平稳,若是,执行步骤4.5,否则,执行步骤4.4;
本实施方式中,判断当前兴趣点时间序列是否平稳的具体方法为:判断一个兴趣点时间序列中照片数量的均值、方差和协方差是否与时间有关,若一个兴趣点时间序列中照片数量的均值E(Xt)=u是与时间t无关的常数,照片数量的方差Var(Xt)=σ2是与时间t无关的常数,同时照片数量的协方差Cov(Xt,Xt+k)=γk是与时间间隔k有关,与时间t无关的常数,则该兴趣点的时间序列平稳。
步骤4.4:对当前兴趣点的时间序列进行差分处理,得到该兴趣点的新的时间序列,返回步骤4.3。
本实施方式中,对当前兴趣点的施加序列进行差分处理的公式如式(1)所示:
Xt′=Xt-Xt-1 (1)
其中,Xt′为更新后的该兴趣点的时间序列,得到的1-3月、4-6月、7-9月、10-12月四个部分差分前的时间序列和差分处理后的时间序列对比示意图如图4所示。
步骤4.5:根据当前兴趣点时间序列中k时间间隔的照片数量的方差和协方差确定该兴趣点的时间序列的自相关系数和偏自相关系数,从而确定该兴趣点的时间序列模型。
步骤4.5.1:根据当前兴趣点时间序列中k时间间隔的照片数量的方差和协方差得到该兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数。
本实施方式中,一个兴趣点的k阶滞后的自相关函数ACF=ρk如式(2)所示:
一个兴趣点的k阶滞后的偏自相关函数如式(3)所示:
步骤4.5.2:根据当前兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数之间的关系,确定该兴趣点的时间序列模型的形式。
本实施方式中,根据当前兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数之间的关系,确定该兴趣点的时间序列模型的形式具体为:
若当前兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数均为拖尾的,拖尾即函数形状成指数级递减,则选取该兴趣点的时间序列模型的形式为:ARMA(p,q)模型(自回归滑动平均模型);
若当前兴趣点的k阶滞后的自相关函数为拖尾的,并且当前兴趣点的k阶滞后的偏自相关函数为截尾的,截尾即函数在一定延迟k后趋近于0,则选取该兴趣点的时间序列模型的形式为:AR(p)模型(自回归模型);
若当前兴趣点的k阶滞后的偏自相关函数为拖尾的,并且当前兴趣点的k阶滞后的自相关函数为截尾的,则选取该兴趣点的时间序列模型的形式为:MA(q)模型(滑动平均模型)。
步骤4.5.3:根据当前兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数是否在置信区间内,确定该兴趣点的时间序列模型的阶数。
步骤4.5.3.1:设定时间偏差k′=0,时间序列模型的阶数p=0和q=0。
步骤4.5.3.2:计算当前兴趣点各时间序列的k′阶滞后的自相关函数ACF=ρk′和k′阶滞后的偏自相关函数
步骤4.5.3.3:判断ρk′和是否都在置信区间内,若是执行步骤4.5.3.5,否则,执行步骤4.5.3.4。
本实施方式中,置信区间为判断ρk′和是否都在置信区间内即判断是否且
步骤4.5.3.4:若则令p=p+1,若则令q=q+1,同时,令k′=k′+1,返回步骤4.5.3.2。
步骤4.5.3.5:当前时间序列模型的阶数p和q作为当前兴趣点的时间序列模型的阶数。
步骤4.5.4:采用带遗忘因子的递推最小二乘算法确定当前兴趣点的时间序列模型的参数矩阵。
本实施方式中,令遗忘因子ρ=0.97,均方根误差阈值为η=18.2863。
步骤4.6:重复步骤4.3至步骤4.5,得到各兴趣点的时间序列模型。
步骤5:根据该地区历史旅游路线集合中的历史旅游路线生成Markov模型的概率转移矩阵,并通过用户实时上传的照片及照片描述信息,对Markov模型的概率转移矩阵进行更新。
步骤5.1:根据历史旅游路线集合中的历史旅游路线计算各个兴趣点间的转移次数,得到该地区各兴趣点状态转移有向图,生成Markov模型的概率转移矩阵。
本实施方式中,得到的各兴趣点状态转移有向图如图5所示。
本实施方式中,生成Markov模型的概率转移矩阵如式(4)所示:
步骤5.2:将用户上传的当前时刻的各兴趣点照片数量和各兴趣点对应的时间序列模型对Markov模型的概率转移矩阵进行调整。
步骤5.2.1:将用户上传的当前时刻的各兴趣点照片数量输入对应兴趣点的时间序列模型,得到各兴趣点下一时刻游客流量的预测值nj,并计算该地区各兴趣点下一时刻游客流量预测值的平均值j为兴趣点,N为该地区兴趣点个数。
本实施方式中,得到的1-3月、4-6月各兴趣点下一时刻游客流量的预测值与实际流量的对比图如图6所示,其中(a)和(c)为传统方法得到的游客流量的预测值与实际流量的对比图,(b)和(d)为本发明方法得到的游客流量的预测值与实际流量的对比图。
步骤5.2.2:确定各兴趣点下一时刻游客流量预测值nj与下一时刻游客流量预测值的平均值的差值subj。
本实施方式中,各兴趣点下一时刻游客流量预测值n0、n1、n2、n3、n4分别为:Flow[164 150 94 221 371]。
各兴趣点下一时刻游客流量预测值nj与下一时刻游客流量预测值的平均值的差值subj分别为:subj={-36,-50,-106,21,171}。
步骤5.2.3:根据各兴趣点下一时刻游客流量预测值nj与下一时刻游客流量预测值的平均值的差值subj对Markov模型的转移概率进行更新,得到更新后的Markov模型的概率转移矩阵。
本实施方式中,当subj大于0时,更新公式如式(5)所示:
其中,pij′为更新的转移概率,i,j∈N,pij为原Markov模型的转移概率,N1<N为subj大于0的兴趣点个数,p0为概率变化的基本单位。
当subj小于0时,更新公式如式(6)所示:
其中,N2<N为subj小于0的兴趣点个数。
本实施方式中,sum1=|-36-50-106|=192,sum2=|21+171|=192。
以Markov模型的概率转移矩阵式(4)中兴趣点在C1处为例,更新后的Markov模型的概率转移矩阵如式(7)所示:
步骤6:根据用户上传的当前时刻的照片GPS信息和更新后的Markov模型的概率转移矩阵,为用户推荐转移概率最大的兴趣点。
本实施方式中,根据用户上传的当前时刻的照片GPS所在的兴趣点,在更新后的Markov模型的概率转移矩阵中找到所在兴趣点的一行中找到概率最大的兴趣点发送给用户。
Claims (3)
1.一种结合短时流量预测的旅游路线推荐方法,其特征在于,包括以下步骤:
步骤1:从照片共享网站下载一个地区H年的历史照片描述信息,并将各历史照片描述信息存储于数据库中,所述历史照片描述信息包括:照片ID、照片GPS信息、上传用户ID、照片拍摄时间、照片主题和照片描述信息;
步骤2:针对数据库中历史照片描述信息,采用DBScan聚类算法对照片GPS信息进行聚类,得到该地区照片密度大的兴趣点;
步骤3:提取历史照片描述信息中各个兴趣点在同一天内各上传用户ID的历史旅游路线,得到该地区的历史旅游路线集合;
步骤3.1:提取出各个兴趣点中同一天内一个上传用户ID的照片ID,并按照片拍摄时间进行排序,得到该用户的一条历史旅游路线;
步骤3.2:重复步骤3.1提取各个兴趣点在同一天内各上传用户ID的历史旅游路线,将该地区内所有人的历史旅游路线作为历史旅游路线集合,得到该地区的历史旅游路线集合;
步骤4:根据历史照片描述信息,建立各兴趣点不同时间间隔的时间序列模型;
步骤4.1:根据该地区H年内的照片拍摄时间,将各兴趣点按照季节划分为4个部分;
步骤4.2:针对所述划分的各部分,以t小时为时间间隔,统计出一天内各兴趣点各时间间隔的照片数量,将各个时间间隔中该地区一个兴趣点的照片数量的和作为该兴趣点的时间序列;得到各个部分各兴趣点的时间序列集合;
步骤4.3:判断当前兴趣点时间序列是否平稳,若是,执行步骤4.5,否则,执行步骤4.4;
步骤4.4:对当前兴趣点的时间序列进行差分处理,得到该兴趣点的新的时间序列,返回步骤4.3;
步骤4.5:根据当前兴趣点时间序列中k时间间隔的照片数量的方差和协方差确定该兴趣点的时间序列的自相关系数和偏自相关系数,从而确定该兴趣点的时间序列模型;
步骤4.6:重复步骤4.3至步骤4.5,得到各兴趣点的时间序列模型;
步骤5:根据该地区历史旅游路线集合中的历史旅游路线生成Markov模型的概率转移矩阵,并通过用户实时上传的照片及照片描述信息,对Markov模型的概率转移矩阵进行更新;
步骤5.1:根据历史旅游路线集合中的历史旅游路线计算各个兴趣点间的转移次数,得到该地区各兴趣点状态转移有向图,生成Markov模型的概率转移矩阵;
步骤5.2:将用户上传的当前时刻的各兴趣点照片数量和各兴趣点对应的时间序列模型对Markov模型的概率转移矩阵进行调整,具体步骤如下:
步骤5.2.1:将用户上传的当前时刻的各兴趣点照片数量输入对应兴趣点的时间序列模型,得到各兴趣点下一时刻游客流量的预测值,并计算该地区各兴趣点下一时刻游客流量预测值的平均值;
步骤5.2.2:确定各兴趣点下一时刻游客流量预测值nj与下一时刻游客流量预测值的平均值的差值subj,j为兴趣点;
步骤5.2.3:根据各兴趣点下一时刻游客流量预测值nj与下一时刻游客流量预测值的平均值的差值subj对Markov模型的转移概率进行更新,得到更新后的Markov模型的概率转移矩阵;
所述更新公式为:当subj大于0时,令其中,pij′为更新的转移概率,pij为原Markov模型的转移概率,N1<N为subj大于0的兴趣点个数,p0为概率变化的基本单位;
当subj小于0时,令其中,N2<N为subj小于0的兴趣点个数;
步骤6:根据用户上传的当前时刻的照片GPS信息和更新后的Markov模型的概率转移矩阵,为用户推荐转移概率最大的兴趣点。
2.根据权利要求1所述的结合短时流量预测的旅游路线推荐方法,其特征在于,所述判断当前兴趣点时间序列是否平稳的具体方法为:判断一个兴趣点时间序列中照片数量的均值、方差和协方差是否与时间有关,若一个兴趣点时间序列中照片数量的均值、方差和协方差均与时间无关,则该兴趣点的时间序列平稳。
3.根据权利要求1所述的结合短时流量预测的旅游路线推荐方法,其特征在于,所述步骤4.5包括以下步骤:
步骤4.5.1:根据当前兴趣点时间序列中k时间间隔的照片数量的方差和协方差得到该兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数;
步骤4.5.2:根据当前兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数之间的关系,确定该兴趣点的时间序列模型的形式;
步骤4.5.3:根据当前兴趣点的k阶滞后的自相关函数和k阶滞后的偏自相关函数是否在置信区间内,确定该兴趣点的时间序列模型的阶数;
步骤4.5.4:采用带遗忘因子的递推最小二乘算法确定当前兴趣点的时间序列模型的参数矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610442583.2A CN106095973B (zh) | 2016-06-20 | 2016-06-20 | 一种结合短时流量预测的旅游路线推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610442583.2A CN106095973B (zh) | 2016-06-20 | 2016-06-20 | 一种结合短时流量预测的旅游路线推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106095973A CN106095973A (zh) | 2016-11-09 |
CN106095973B true CN106095973B (zh) | 2019-05-21 |
Family
ID=57237450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610442583.2A Expired - Fee Related CN106095973B (zh) | 2016-06-20 | 2016-06-20 | 一种结合短时流量预测的旅游路线推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106095973B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107050864A (zh) * | 2017-03-24 | 2017-08-18 | 中国农业大学 | 一种游戏互动方法、互动系统的搭建方法及搭建装置 |
CN107203760A (zh) * | 2017-06-09 | 2017-09-26 | 中国联合网络通信集团有限公司 | 人群密度监控方法及装置 |
CN107436950B (zh) * | 2017-08-07 | 2020-12-29 | 苏州大学 | 一种旅行路线推荐方法及系统 |
CN107563122B (zh) * | 2017-09-20 | 2020-05-19 | 长沙学院 | 基于交织时间序列局部连接循环神经网络的犯罪预测方法 |
CN109978215B (zh) * | 2017-12-28 | 2021-09-14 | 杭州橙鹰数据技术有限公司 | 巡防管理方法和装置 |
CN108345697A (zh) * | 2018-03-22 | 2018-07-31 | 山东财经大学 | 面向大学生群体的智慧课程推荐方法、系统及存储介质 |
CN108846500A (zh) * | 2018-04-17 | 2018-11-20 | 安徽师范大学 | 基于Flickr地理标签元的旅游历史数据获取方法 |
CN108984783A (zh) * | 2018-07-26 | 2018-12-11 | 佛山市甜慕链客科技有限公司 | 一种使用大数据进行递减处理的方法 |
CN109816127B (zh) * | 2019-01-11 | 2022-12-30 | 广州市骑鹅游信息技术咨询服务有限公司 | 一种智能票务推荐方法及系统 |
CN113780613A (zh) * | 2020-12-15 | 2021-12-10 | 京东城市(北京)数字科技有限公司 | 一种路径推荐方法和装置 |
CN113834498B (zh) * | 2021-11-29 | 2022-04-19 | 四川北控聚慧物联网科技有限公司 | 一种收运定位导航系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899650A (zh) * | 2015-05-26 | 2015-09-09 | 成都中科大旗软件有限公司 | 基于多源数据分析对旅游景区客流量进行预测的方法 |
CN104899948A (zh) * | 2015-06-05 | 2015-09-09 | 北京京东尚科信息技术有限公司 | 一种封闭空间拥堵监测方法和系统 |
CN105553823A (zh) * | 2015-12-15 | 2016-05-04 | 广西金中软件有限公司 | 综合旅游信息服务多媒体平台 |
-
2016
- 2016-06-20 CN CN201610442583.2A patent/CN106095973B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899650A (zh) * | 2015-05-26 | 2015-09-09 | 成都中科大旗软件有限公司 | 基于多源数据分析对旅游景区客流量进行预测的方法 |
CN104899948A (zh) * | 2015-06-05 | 2015-09-09 | 北京京东尚科信息技术有限公司 | 一种封闭空间拥堵监测方法和系统 |
CN105553823A (zh) * | 2015-12-15 | 2016-05-04 | 广西金中软件有限公司 | 综合旅游信息服务多媒体平台 |
Non-Patent Citations (1)
Title |
---|
《A Plane Moving Average Algorithm for Short-Term Traffic Flow Prediction》;Lv Lei等;《 Advances in Knowledge Discovery and Data Mining》;20150519;第357-369页 |
Also Published As
Publication number | Publication date |
---|---|
CN106095973A (zh) | 2016-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106095973B (zh) | 一种结合短时流量预测的旅游路线推荐方法 | |
CN109241454B (zh) | 一种将社交网络和图像内容融合的兴趣点推荐方法 | |
CN108829852B (zh) | 一种个性化旅游路线推荐方法 | |
EP3475848B1 (en) | Generating theme-based videos | |
CN106997389B (zh) | 一种基于多数据集和协同张量分解的旅游景点推荐方法 | |
Jiang et al. | Author topic model-based collaborative filtering for personalized POI recommendations | |
CN104794171B (zh) | 标记图片地理位置信息的方法及装置 | |
CN107423837A (zh) | 旅游路线的智能规划方法及系统 | |
US20100211308A1 (en) | Identifying interesting locations | |
CN112182398B (zh) | 考虑用户的长期偏好与短期偏好的景点推荐方法和系统 | |
CN105975496A (zh) | 一种基于上下文感知的音乐推荐方法及装置 | |
CN116823534B (zh) | 一种基于多模态大模型的文旅行业智能服务虚拟人系统 | |
CN110263982A (zh) | 广告点击率预估模型的优化方法和装置 | |
CN111914157A (zh) | 一种基于用户偏好的旅游方案生成方法和系统 | |
KR102042919B1 (ko) | 가상 캐릭터의 커스터마이징 학습을 통한 ar기반 테마여행 ai 큐레이션 제공시스템 | |
CN112084401A (zh) | 一种旅游路线定制装置及方法 | |
CN107016566A (zh) | 基于本体的用户模型构建方法 | |
CN108920451A (zh) | 基于动态阈值和多分类器的文本情感分析方法 | |
CN113609379B (zh) | 标签体系构建方法、装置、电子设备及存储介质 | |
CN112199611A (zh) | 基于AIoT和计算机视觉的智慧景区景点推荐方法 | |
CN107391637A (zh) | 针对具备地理社交信息的群组推荐方法 | |
CN113656560B (zh) | 情感类别的预测方法和装置、存储介质及电子设备 | |
CN109299389A (zh) | 一种旅游景点推荐方法及装置 | |
CN108959387A (zh) | 信息获取方法及装置 | |
CN112579793B (zh) | 模型的训练方法、poi标签检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190521 |