CN114519454A - 一种基于游客时空行为模式挖掘的景区客流实时预测方法 - Google Patents

一种基于游客时空行为模式挖掘的景区客流实时预测方法 Download PDF

Info

Publication number
CN114519454A
CN114519454A CN202210018208.0A CN202210018208A CN114519454A CN 114519454 A CN114519454 A CN 114519454A CN 202210018208 A CN202210018208 A CN 202210018208A CN 114519454 A CN114519454 A CN 114519454A
Authority
CN
China
Prior art keywords
time
scenic spot
tourist
scenic
tourists
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210018208.0A
Other languages
English (en)
Inventor
于海涛
吴忠军
王建英
谭立国
贺剑武
姚建盛
周茂杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Technology
Original Assignee
Guilin University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Technology filed Critical Guilin University of Technology
Priority to CN202210018208.0A priority Critical patent/CN114519454A/zh
Publication of CN114519454A publication Critical patent/CN114519454A/zh
Priority to GB2300208.2A priority patent/GB2615888A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/12Hotels or restaurants
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)

Abstract

本发明提供一种基于游客时空行为模式挖掘的景区客流实时预测方法,包括以下步骤:S1.大数据的实时采集:包括对游客的基本信息、时空行为数据、交通状况数据、气象数据和目的地节庆数据进行实时采集;S2.挖掘游客的时空行为模式和构建景区之间空间可达性模型;S3.根据目的地当前时刻游客在各景区时空分布、游客移动方向性信息和交通状况数据,利用步骤S2中构建的模型,对于各个景区下一预测周期的客流数量进行预测;S4.根据在各个景区实时产生的游客时空数据,对步骤S2中构建的模型进行迭代更新。本发明通过游客时空行为特征的挖掘以及游客与环境之间的交互作用,能够提高一个旅游目的地范围内的各景区客流的实时预测精度。

Description

一种基于游客时空行为模式挖掘的景区客流实时预测方法
技术领域
本发明涉及一种基于游客时空行为模式挖掘的景区客流实时预测方法,属于旅游需求预测技术领域。
背景技术
近年来随着人们物质生活水平的提高,越来越多的人选择在节假日出门旅游,旅游业蓬勃发展。预测旅游需求是旅游业的一个关键问题,通过准确的预测趋势和模式,政府和私营部门可以制定组织良好的旅游战略,并提供更好的基础设施和资源调度,为游客提供优质服务,并制定适当的营销策略,从不断增长的旅游业中获益。通过科学方法对旅游流量预测,为旅游目的地行政管理部门提供决策支持、减少隐患事故的发生,提高旅游目的地的形象,提升目的地的可持续发展;在景区管理方面,根据需求预测结果进行提前的安全预警和资源调度分配,提高应急响应速度和旅游服务质量;对于游客,通过客流量的分布情况的预估提供定制出行计划的依据,减少时间成本、经济成本和心理成本,规避由于景区或目的地超载引起的旅游风险,提高旅游体验质量;对于旅游目的地居民,根据需求预测结果,合理安排本地出行的行程计划,减少旅游目的地的主客冲突,实现目的地居民和游客的双赢。
目前游客预测的研究对象,主要针对单个景区或宏观的旅游目的地之间的旅游流开展研究,缺少针对一个旅游目的地各景区之间关联关系考虑。针对单个景区的客流预测,根据数据的时间序列分布规律,利用机器学习或计量经济学的方法试图提高景区客流量的预测精度。这种预测方面,只考虑单个景区的游客的输入因素,没有考虑一个旅游目的地各个景区之间游客在时空之间的关联性,忽略了目的地各个景区之间的游客时空行为模式的挖掘。没有把一个旅游目的地作为一个由游客、居民、旅游设施和旅游环境构建一个有序的系统进行统一考虑,忽略了游客作为主体与目的地环境的交互作用对于景区客流的影响。旅游流的研究,主要基于抽样的宏观统计数据、基于社交媒体的地理标签数据或旅游攻略数据里面的行程分享数据。这种研究方法主要存在2个问题:一方面;统计数据作为宏观数据的时间粒度较大,而且是通过抽样进行测算生成,因此数据存在一定的统计偏差,而社交网络的数据是少数游客会发布信息,因此样本对游客的实际熟虑覆盖率较低,尤其是老年人在社交网络很少会发布和分享自己的旅游体验和行程;另一方面,在时间上和空间上具有一定的滞后性,尤其是旅游攻略分享,无法实现实时的客流预测。游客通常是在游后,根据自己的实际体验分享旅游攻略或发布具有地理标签的照片。最为重要的是,游客在社交媒体上分享的数据,出于用户隐私和企业的商业秘密,通常只能获取部分数据。在实际旅游场景中,游客在一个旅游目的地区域内的时空行为具有一定模式,基于大数据样本深度挖掘行为特征能够对游客的时空转移规律建模,有助于提高景区的实时客流的预测精度。
综上所述,目前的游客客流的预测方法,仅仅考虑旅游目的地系统的输入,也就是游客的抵达信息,没有考虑系统中各景区游客转移的关联性以及游客与旅游环境之间的交互作用,无法实现高精度的旅游目的地各个景区的旅游流量实时预测效果。
发明内容
为解决上述问题,本发明公开了一种基于游客时空行为模式挖掘的景区客流实时预测方法,该方法根据不同类型游客的时空分布特征、当前热门景区之间的交通状况、目的地天气状况、节庆事件、游客的人口统计特征等信息,细粒度预测在下一时刻目的地各个景区的游客流量。从系统论的角度出发,通过游客时空行为特征的挖掘以及游客与环境之间的交互作用,能够提高一个旅游目的地范围内的各景区客流的实时预测精度。
上述的目的通过以下技术方案实现:
一种基于游客时空行为模式挖掘的景区客流实时预测方法,包括以下步骤:
S1.大数据的实时采集:包括对游客的基本信息、时空行为数据、交通状况数据、气象数据和目的地节庆数据进行实时采集;
S2.挖掘游客的时空行为模式和构建景区之间空间可达性模型;
S3.根据目的地当前时刻游客在各景区时空分布、游客移动方向性信息和交通状况数据,利用步骤S2中构建的模型,对于各个景区下一预测周期的客流数量进行预测;
S4.根据在各个景区实时产生的游客时空数据,对步骤S2中构建的模型进行迭代更新。
进一步地,步骤S1中所述大数据的实时采集具体包括如下信息采集:
S101散客信息采集,在景区出入口安装物联网设备采集游客手机信令信息,所述物联网设备包括电子围栏或探针设备,记录游客出入景区的时间;
S102团队游客的信息采集,在景区入口和出口处导游对电子行程单的二维码进行扫描,读取团队游客电子行程单信息,包括团队游客的行程路线、到达该景点的时间点以及游客成员信息,及其实际离开景区的时间,在后台数据库进行同步更新,从而记录的团队游客时间、空间信息和游客信息;
S103本地居民的信息采集,设置专门的本地居民通道,通过刷身份证的方式进行验票和信息采集;
S104游客在景区内各景点的时空信息采集,采用近距离通信技术实现景点区域内游客的时空信息采集;
S105目的地交通路况信息的采集,通过高德地图或百度地图的开放API接口,对道路交通情况进行实时采集;
S106目的地的气象信息和节庆活动信息采集,利用网络爬虫软件爬取旅游目的地的天气、节庆活动信息。
进一步地,步骤S2中所述挖掘游客的时空行为模式和构建景区之间空间可达性模型包括:
S201计算游客在景区内景点的停留时间
根据游客在景区内各个景点最早出现的时间点和最晚出现的时间点,针对散客和本地市居民计算每一个游客的停留时间
Figure BDA0003460964590000031
Figure BDA0003460964590000032
表示游客i在景区j中的景点k最晚出现的时间点,表示游客离开景点区域的时间;
Figure BDA0003460964590000033
示游客i在景区j中的景点k最早出现的时间点,表示游客进入景点区域的时间;
S202计算游客在景区内总共停留时间
Figure BDA0003460964590000034
Figure BDA0003460964590000035
表示游客i在景区j中总共停留的时间,计算公式为
Figure BDA0003460964590000036
Figure BDA0003460964590000037
表示游客i离开景区j的时刻,
Figure BDA0003460964590000038
表示游客i进入景区j的时刻;
去除游客在各个景点停留的时间,在景区j的非景点区域所花费的时间为
Figure BDA0003460964590000039
Figure BDA00034609645900000310
N表示景区中的景点数量,依据设备采集到的游客进入景区时间和离开时间,计算数据库中每个游客的
Figure BDA00034609645900000311
Figure BDA00034609645900000312
S203构建各个景区之间游客移动的时间代价期望矩阵TM×M,表示如公式(1)
Figure BDA00034609645900000313
M表示旅游目的地的热门景区的数量,type表示游客的类型,type取值为0,1,2分别表示本地游客、散客和团队游客;Tj1->j2表示根据当前的交通路况信息,从景区j1到景区j2需要时间的数学期望;Tj1->j1=0,表示没有景区之间转移行为发生;
S204基于客源地和游客类型的概率转移矩阵计算
针对游客景区之间的转移概率矩阵如公式(2)所示。
Figure BDA00034609645900000314
Figure BDA0003460964590000041
表示离开景区j1转移到其他景区和非景区区域的概率之和恒等于1;pj1->j2(j1≠j2,j1,j2<M+1)表示游客从景区j1转移到景区j2的概率,pj1->j1(j1<M+1)表示游客在下一时刻继续停留在景区j1的概率,pj1->M+1(j1≠M+1)表示游客离开景区j1后转移到非热门景区或其他区域的概率,这里有3种情况:离开旅游目的地、去往目的地其他非热门景区或者去往目的地的其他区域;根据具体的旅游目的地内部景区分布、临近旅游目的地之间的空间分布以及所处的时间点,转移概率具有差异性,PM×M+1测量景区之间转移的概率,其中pj1->j2(j1≠j2)的计算公式(3):
Figure BDA0003460964590000042
其中,pj1,(t-1)表示游客在(t-1)时刻位于景区j1的概率,在实际计算pj1->j2时,利用数据库中游客的时空信息,统计在(t-1)时刻位于景区j1并且在下一时刻t出现在景区j2的游客数量Num(j1->j2,t),除以在(t-1)时刻出现在景区j1的游客数量Num(j1,t-1);
计算转移概率矩阵
Figure BDA0003460964590000043
source=0表示本地居民,外地的散客对应的source取值为非零的整数,对于团队游客,因为行程是确定的不需要单独进行计算;
S205基于时间维度的游客景区之间的概率转移矩阵构建
针对当天、所处月份及其对应历史同期3个维度分别计算游客的转移概率矩阵,分别表示为
Figure BDA0003460964590000044
Figure BDA0003460964590000045
在相应的时间维度内进行样本的筛选,概率的计算公式与公式(3)相同,计算时间维度上的转移概率时,把数据的样本限定在规定的时间范围内;
S206构建任意2个景区之间游客在时间序列上的到达的概率矩阵
基于游客在时间序列上的特征,构建景区到达游客的概率矩阵,如公式(4)所示
Figure BDA0003460964590000046
p'j1->j2,q(1≤q<t)表示在q时刻开景区j1,在第t时刻到达景区j2的概率,也就是需要t-q周期时间从景区j1转移到景区j2的概率;p'j1->j2,t则表示游客在(t-1)时刻离开景区j1,在t时刻到达景区j2的概率,也就是游客在一个时间周期之内能够转移到目标景区的概率;P'j表示转移需要多长时间能够转移到目标景区的概率;
S207游客在景区内停留时间的预测
利用深度神经网络训练离开景区时间的预测模型,深度神经网络输出变量为游客在景区内的停留时间,深度神经网络的输入变量包括:游客类型、当前时间、所在的月份、天气状况、在各个景点的停留时间、本地居民和外地游客的客源地)进入景区的时刻、在非景区区域内停留时间、游览的顺序等数据,采用深度学习的LSTM深度神经网络对当地居民和散客分别构建景区停留时间的预测模型;
S208游客的综合转移概率矩阵的计算
针对本地居民和散客分别计算景区j1转移到景区j2的综合概率
Figure BDA0003460964590000051
下标source表示客源地的类型,取值为0表示本地居民,外地的散客取值为非零的整数,计算公式需要综合考虑客源地、月份、历史同期和当天的转移概率,称为综合转移概率,计算公式如公式(5)所示:
Figure BDA0003460964590000052
其中,基于大数据样本,利用多元线性回归模型确定回归方程中的参数α,β,γ,
Figure BDA0003460964590000053
表示根据当天的最新游客时空数据计算出来的转移概率,
Figure BDA0003460964590000054
表示季节性对游客转移概率的影响,具体的取值方式根据旅游目的地的旅游景观资源季节性特征进行确定;
S209游客抵达目的地首个景区的随机过程模型构建
根据当日的旅游是否具有旅游经历,到达景区的游客分为2种类型:一类从其他景区转移过来的游客;另一类是在旅游目的地当天还没有景区旅游经历的游客,该游客没有当日的历史时空轨迹数据可用,因此不能采用空间概率转移的方式进行计算;对于这类游客,根据数据库中记录第一站游览景点k的到达时间的历史信息,计算游客在各个时间间隔内的抵达人数分布,用于预测从非景区区域到达景点k的游客数量
Figure BDA0003460964590000055
在现实场景中,抵达景区的时间分布符合泊松分布过程,采用泊松分布模型构建游客到达首个景区的随机过程模型。
进一步地,步骤S3中,景区下一时刻的游客流量的预测结果取决于三个变量:离开本景区游客数量的预测值、目前在其他景区内并且下一时刻转移到本景区的游客预测值以及在转移途中游客的预测值,景区j在t时刻的游客流量预测步骤具体如下:
S301预测离开该景区游客的数量
计算[t-1,t]时间区间内离开景区j的游客数量,计算公式如公式(6)所示:
Figure BDA0003460964590000056
其中,
Figure BDA0003460964590000057
表示在[t-1,t]时间区间预计离开景区的本地居民人数,
Figure BDA0003460964590000058
表示在[t-1,t]时间区间预计离开本景区的散客类型的游客数量,
Figure BDA0003460964590000059
表示在[t-1,t]时间区间离开本景区的团队游客数量;
Figure BDA0003460964590000061
Figure BDA0003460964590000062
的计算利用步骤S207中的停留时间预测模型进行计算;
S302预测其他景区转移到该景区j的游客数量
计算公式如公式(7)所示:
Figure BDA0003460964590000063
其中,j1表示除了景区j其他景区的编号,q表示在[1,t]之间的时刻,当前的时刻为t,source表示游客的类型。
Figure BDA0003460964590000064
表示在第q时刻离开第景区j1的游客中,游客类型为source的游客预计到达景区j的数量。下标source取值为0时,表示本地居民,取其他整数时表示外地的散客,source的取值标识客源地的编号。计算公式如公式(8)所示:
Figure BDA0003460964590000065
p'j1->j,q表示在[q-1,q]时间区间内离开景区j1,在[t-1,t]时间区间内到达景区j的概率,表示到达的可能性,计算方法见公式(4),
Figure BDA0003460964590000066
利用步骤S208构建的模型进行计算,
Figure BDA0003460964590000067
表示团队游客中从景区j1到达景区j的数量,根据电子行程单信息进行确定,S303景区j在t时刻的游客流量预测,计算公式如(9)所示:
Figure BDA0003460964590000068
最终的预测结果需要相应的奖惩机制进行自适应调整,参数λ为奖惩系数。
本发明的有益效果为:
1、针对不同旅游类型的游客表现出差异化的时空行为,分别对本地居民、团队游客和散客的时空行为进行细粒度的模型构建。
2、基于系统论的整体性和有机联系性,根据游客在目的地景区之间转移规律挖掘游客在旅游目的地的时空行为特征,提高游客实时预测的精度。
3、利用深度学习,利用大数据样本训练游客在景区内停留时间的预测,提高了景区内游客的动态分布的预测效果。
4、从多个维度,基于目的地实时大数据样本利用多元回归模型构建了游客景区之间的综合概率转移矩阵,有效提高转移概率计算的准确度。
附图说明
图1为本发明的体系结构图;
图2为本发明的实施例中游客在两个景区之间转移概率的标准差的分布;
图3为本发明的实施例中游客在两个景区之间转移概率的最大值与最小值之差的分布。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
本发明实施的系统架构如图1所示,主要包含基础设施层、数据存储层、模型构建层和应用层。基础设施层:包括游客的基本信息、时空行为信息、气象、交通和节庆活动等信息进行采集的各种物联网设备以及各种计算服务器,主要包括本地居民身份证刷卡设备、手机信令采集设备和电子行程单读取设备、网络数据爬取服务器和模型训练服务器。数据存储层:采用分布式存储技术对本发明的海量数据进行存储,包括旅游目的地景区具有游览行为的本地居民的基本信息、团队游的电子行程单数据、通过物联网设备采集到的散客出入景区的信息、游客在景区内部游览的时空数据以及爬虫软件爬取的旅游目的地的实时交通数据、气象数据和目的地的节庆数据。模型训练层:训练本发明在游客实时预测中涉及到的各个模型,包括游客行为轨迹生成算法、各个维度的游客转移概率计算、游客景区内停留时间的预测模型、游客的综合转移概率的回归模型、游客到达第一个景区的随机过程模型等。用户应用层:面向游客、企业管理人员和旅游目的地行政管理人员的具体应用模块,包括游客对各景区进行实时查询和下一时刻景区的游客分布等信息、景区的管理人员针对实时客流和未来预测结果进行管理决策,旅游目的地的行政管理人员针对客流的分布和预测结果进行资源调度和安全预警发布。
本发明的具体步骤如下:
S1.大数据的实时采集:包括对游客的基本信息、时空行为数据、交通状况数据、气象数据和目的地节庆数据进行实时采集;
S2.挖掘游客的时空行为模式和构建景区之间空间可达性模型;
S3.根据目的地当前时刻游客在各景区时空分布、游客移动方向性信息和交通状况数据,利用步骤S2中构建的模型,对于各个景区下一预测周期的客流数量进行预测;
S4.根据在各个景区实时产生的游客时空数据,对步骤S2中构建的模型进行迭代更新。
其中,所述步骤S1中,主要采集游客、交通路况、天气和节庆等相关信息:
S101散客信息采集。在景区出入口安装电子围栏或探针设备等物联网设备,采集手机信令信息,记录游客出入景区的时间。手机卡ISMI的信息唯一标识游客的ID,而且能够识别手机的运营商归属地,从而推断出客源地。
S102团队游客的信息采集。在景区入口和出口处导游对电子行程单的二维码进行扫描,读取团队游客电子行程单信息,包括团队游客的行程路线、到达该景点的时间点以及游客成员等相关信息,及其实际离开景区的时间,在后台数据库进行同步更新,从而记录的团队游客时间、空间信息和游客信息。
S103本地居民的信息采集。设置专门的本地居民通道,通过刷身份证的方式进行验票和信息采集。
S104游客在景区内各景点的时空信息采集。采用近距离通信技术实现景点区域内游客的时空信息采集,例如智能手环或近距离通信卡等。智能手环可以实时记录游客的空间轨迹。智能卡采用近距离通信技术,佩戴智能卡的游客经过景点时,该景点配备的感知设备就可以记录游客进入景点区域和离开景点区域的时间,从而计算出游客在各个景点的逗留时间。智能卡可以作为门票发放给游客,游客离开景区时进行回收。出于个人隐私的考虑,相比较智能手环,智能卡易于普及,而且成本相对较低。
S105目的地交通路况信息的采集。通过高德地图或百度地图的开放API接口,对道路交通情况进行实时采集。
S106目的地的气象信息和节庆活动等信息采集。利用网络爬虫软件爬取旅游目的地的天气、节庆等可能影响游客行为的信息。
在所述步骤S2中,包括以下步骤进行模型构建:
S201计算游客在景区内景点的停留时间
根据游客在景区内各个景点最早出现的时间点和最晚出现的时间点,针对散客和本地市居民计算每一个游客的停留时间
Figure BDA0003460964590000081
Figure BDA0003460964590000082
表示游客i在景区j中的景点k最晚出现的时间点,表示游客离开景点区域的时间;
Figure BDA0003460964590000083
示游客i在景区j中的景点k最早出现的时间点,表示游客进入景点区域的时间;
S202计算游客在景区内总共停留时间
Figure BDA0003460964590000084
Figure BDA0003460964590000085
表示游客i在景区j中总共停留的时间,计算公式为
Figure BDA0003460964590000086
Figure BDA0003460964590000087
表示游客i离开景区j的时刻,
Figure BDA0003460964590000088
表示游客i进入景区j的时刻;
去除游客在各个景点停留的时间,在景区j的非景点区域所花费的时间为
Figure BDA0003460964590000089
Figure BDA00034609645900000810
N表示景区中的景点数量,依据设备采集到的游客进入景区时间和离开时间,计算数据库中每个游客的
Figure BDA00034609645900000811
Figure BDA00034609645900000812
S203构建各个景区之间游客移动的时间代价期望矩阵TM×M,表示如公式(1)
Figure BDA0003460964590000091
M表示旅游目的地的热门景区的数量,type表示游客的类型,type取值为0,1,2分别表示本地游客、散客和团队游客;Tj1->j2表示根据当前的交通路况信息,从景区j1到景区j2需要时间的数学期望;Tj1->j1=0,表示没有景区之间转移行为发生;
S204基于客源地和游客类型的概率转移矩阵计算
针对游客景区之间的转移概率矩阵如公式(2)所示。
Figure BDA0003460964590000092
Figure BDA0003460964590000093
表示离开景区j1转移到其他景区和非景区区域的概率之和恒等于1;pj1->j2(j1≠j2,j1,j2<M+1)表示游客从景区j1转移到景区j2的概率,pj1->j1(j1<M+1)表示游客在下一时刻继续停留在景区j1的概率,pj1->M+1(j1≠M+1)表示游客离开景区j1后转移到非热门景区或其他区域的概率,这里有3种情况:离开旅游目的地、去往目的地其他非热门景区或者去往目的地的其他区域;根据具体的旅游目的地内部景区分布、临近旅游目的地之间的空间分布以及所处的时间点,转移概率具有差异性,PM×M+1测量景区之间转移的概率,其中pj1->j2(j1≠j2)的计算公式(3):
Figure BDA0003460964590000094
其中,pj1,(t-1)表示游客在(t-1)时刻位于景区j1的概率,在实际计算pj1->j2时,利用数据库中游客的时空信息,统计在(t-1)时刻位于景区j1并且在下一时刻t出现在景区j2的游客数量Num(j1->j2,t),除以在(t-1)时刻出现在景区j1的游客数量Num(j1,t-1),注意这里的t时刻是一个时间点的泛指,不代表一个具体的某一时刻;
计算转移概率矩阵
Figure BDA0003460964590000095
source=0表示本地居民,外地的散客对应的source取值为非零的整数,外地散客的划分可以按照省份或其他行政区域划分方式。对于团队游客,因为行程是确定的不需要单独进行计算;
S205基于时间维度的游客景区之间的概率转移矩阵构建
针对当天、所处月份及其对应历史同期3个维度分别计算游客的转移概率矩阵,分别表示为
Figure BDA0003460964590000101
Figure BDA0003460964590000102
在相应的时间维度内进行样本的筛选,概率的计算公式与公式(3)相同,计算时间维度上的转移概率时,把数据的样本限定在规定的时间范围内。
旅游目的地的旅游资源的吸引力具有很强季节性特征,尤其是自然类型的旅游资源,这个概率可以根据目的地的旅游资源实际特点进行粒度划分。可以按照月份划分,也可以按照季节进行划分等。因此,在计算
Figure BDA0003460964590000103
时,需要根据旅游目的地景观资源特点,按照月份进行取值,或按照春夏秋冬进行取值,或者按照目的地景观资源的实际季节性特征确定取值。
Figure BDA0003460964590000104
表示计算当天到目前为止的样本范围内,景区之间的转移概率,当天的转移概率与旅游目的地的节庆信息和天气有很强的相关性。
Figure BDA0003460964590000105
为历史同期数据,为了提高转移概率计算的精度,采用历史上各个同期的平均值。
S206构建任意2个景区之间游客在时间序列上的到达的概率矩阵
游客从一个景区到达另一个景区所需要时间,除了与两个景区的距离和交通状况有关,还与游客的行为有一定的关系,在做预测时需要捕捉游客在时间序列上的特征,基于此构建景区到达游客的概率矩阵,如公式(4)所示。
Figure BDA0003460964590000106
p'j1->j2,q(1≤q<t)表示在q时刻开景区j1,在第t时刻到达景区j2的概率,也就是需要t-q周期时间从景区j1转移到景区j2的概率。p'j1->j2,t则表示游客在(t-1)时刻离开景区j1,在t时刻到达景区j2的概率,也就是游客在一个时间周期之内能够转移到目标景区的概率。公式(3)中的PM×(M+1)表示游客在景区之间的转移意向的概率,P'j表示转移需要多长时间能够转移到目标景区的概率,他们表达意义完全不同。
S207游客在景区内停留时间的预测。
为了预测景区j下一个周期的客流,需要同时考虑输入而且需要考虑输出。不仅需要预测在下一时刻到达景区j的游客数量,而且需要对下一时刻离开该景区j的游客数量进行预测。本发明利用深度神经网络训练离开景区时间的预测模型。深度神经网络输出变量为游客在景区内的停留时间,深度神经网络的输入变量包括:游客类型、当前时间、所在的月份、天气状况、在各个景点的停留时间、客源地(本地居民和外地游客的客源地)、进入景区的时刻、在非景区区域内停留时间、游览的顺序等数据。输出结果为游客在该景区停留的时长,输出结果可以根据预测周期的长度进行相应粒度设置。根据预测的停留时间和进入景区时间,判断游客是否会在预测周期内离开景区。在数据库中具有海量的关于游客的景区时空行为历史信息可供模型训练。因为游客离开景区表现为时间序列特征,因此采用深度学习的LSTM深度神经网络对当地居民和散客分别构建景区停留时间的预测模型。
S208游客的综合转移概率矩阵的计算。
游客在景区之间转移的概率与客源地、季节性和历史行为模式,以及当天的旅游目的地的环境等因素有关,因此需要针对本地居民和散客分别计算景区j1转移到景区j2的综合概率
Figure BDA0003460964590000111
下标source表示客源地的类型,取值为0表示本地居民,外地的散客取值为非零的整数。计算公式需要综合考虑客源地、月份、历史同期和当天的转移概率,本发明中称为综合转移概率。计算公式如公式(5)所示:
Figure BDA0003460964590000112
其中,基于大数据样本,利用多元线性回归模型确定回归方程中的参数α,β,γ。
Figure BDA0003460964590000113
表示根据当天的最新游客时空数据计算出来的转移概率。当天的转移概率受到当日交通状况、天气和节庆事件等影响,具有的信息价值密度较高。
Figure BDA0003460964590000114
表示季节性对游客转移概率的影响,具体的取值方式根据旅游目的地的旅游景观资源季节性特征进行确定。
S209游客抵达目的地首个景区的随机过程模型构建。
根据当日的旅游是否具有旅游经历,到达景区的游客可以分为2种类型:一类从其他景区转移过来的游客;另一类是在旅游目的地当天还没有景区旅游经历的游客,该游客没有当日的历史时空轨迹数据可用,因此不能采用空间概率转移的方式进行计算。对于这类游客,根据数据库中记录第一站游览景点k的到达时间的历史信息(不是当日信息),计算游客在各个时间间隔内的抵达人数分布,用于预测从非景区区域到达景点k的游客数量
Figure BDA0003460964590000115
在现实场景中,抵达景区的时间分布符合泊松分布过程,本研究采用泊松分布模型构建游客到达首个景区的随机过程模型。
所述的步骤S3中,景区下一时刻的游客流量的预测结果取决于三个变量:离开本景区游客数量的预测值、目前在其他景区内并且下一时刻转移到本景区的游客预测值以及在转移途中游客的预测值。以景区j为例,景区j在t时刻的游客流量预测步骤具体如下:
S301预测离开该景区游客的数量。
计算[t-1,t]时间区间内离开景区j的游客数量,计算公式如公式(6)所示:
Figure BDA0003460964590000116
其中,
Figure BDA0003460964590000121
表示在[t-1,t]时间区间预计离开景区的本地居民人数,
Figure BDA0003460964590000122
表示在[t-1,t]时间区间预计离开本景区的散客类型的游客数量,
Figure BDA0003460964590000123
表示在[t-1,t]时间区间离开本景区的团队游客数量。
Figure BDA0003460964590000124
根据旅游电子行程的信息,根据电子行程单规定的游览时间以及入园时间,可以相对确定团队游客是否会在[t-1,t]时间区间离开景区。团队游客是否能够在电子行程单上规定的时间离开景区,与景区游客拥挤程度和天气有一定的相关性,因此应进行自适应调整。通常,景区的游客拥挤,会延误团队游客的行程,可以根据历史信息构建延长团队游客停留时间的模型,天气状况恶化或者时间较晚时会提前离开景区。
Figure BDA0003460964590000125
Figure BDA0003460964590000126
的计算利用步骤S207中的停留时间预测模型进行计算。相比较外地散客,本地居民通过刷身份证,除了时空行为信息还可以获取年龄、出生月份、性别的人口属性信息,更加有利于提高深度神经网络模型的预测精度。
S302预测其他景区转移到该景区j的游客数量。
计算公式如公式(7)所示:
Figure BDA0003460964590000127
其中,j1表示除了景区j其他景区的编号,q表示在[1,t]之间的时刻,当前的时刻为t,source表示游客的类型。
Figure BDA0003460964590000128
表示在第q时刻离开第景区j1的游客中,游客类型为source的游客预计到达景区j的数量。下标source取值为0时,表示本地居民,取其他整数时表示外地的散客,source的取值标识客源地的编号。计算公式如公式(8)所示:
Figure BDA0003460964590000129
p'j1->j,q表示在[q-1,q]时间区间内离开景区j1,在[t-1,t]时间区间内到达景区j的概率,表示到达的可能性,计算方法见公式(4)。
Figure BDA00034609645900001210
利用步骤S208构建的模型进行计算。
Figure BDA00034609645900001211
表示团队游客中从景区j1到达景区j的数量,根据电子行程单信息进行确定。S303景区j在t时刻的游客流量预测,计算公式如(9)所示:
Figure BDA00034609645900001212
天气状况、节庆信息、体育赛事、及旅游政策出台以及应急事件等因素对于景区的预测人数具有调节作用,因此最终的预测结果需要相应的奖惩机制进行自适应调整,参数λ为奖惩系数。例如,天气恶劣或者目的地有应急事件发生时,λ取值为小于1的小数;当节假日或者有节庆信息时,λ取大于1的数,其他情况下λ取值为1。
所述步骤IV中,系统定期对本方法的综合概率转移矩阵、游客在景区内停留时长的预测模型、游客在景区之间综合概率转移、奖惩机制的自适应调整系数进行迭代更新以及。
各个景区中每天都在实时产生游客的时空数据,因此系统每天利用数据库中新增数据,增量更新游客景区之间概率转移矩阵、景区之间在时间序列上可达的概率转移矩阵、针对各个景区的游客到达旅游目的地第景区的随机过程模型、基于深度神经网络的游客停留时间的预测模型和游客景区之间转移的综合概率矩阵的多元回归模型。
这里采用模型增量更新的方式,在每次构建模型时,需要保存计算的中间结果。在下一次模型更新时,不需要对数据库中所有的样本作为输入进行模型训练,只需要在上一次结算的中间结果基础之上进行增量更新,从而可以减少模型定期更新的时间代价。保存上次计算总结结果,虽然增加存储空间开销,但是能够极大降低模型更新的时间复杂度。
为了验证游客时空转移具有一定的规律性,在某旅游目的地的8个热门景区部署了探针设备,分别安装在热门景区的出入口,采集游客2020年5-12月期间在某旅游目的地各热门景区的游客实时抵达时间和离开的时间,探针设备根据游客的手机信令信息唯一标识游客的身份ID。8个热门景区分别是景区1、景区4、景区2、景区3、景区5、景区6、景区7、景区8等。表1为2020年5月-12月的各个景区之间转移概率计算结果。
Figure BDA0003460964590000131
Figure BDA0003460964590000141
注:转移概率取值为0,表示数值小于0.001,导致无法显示,并不是取值为0。
为了验证游客在景区之间的转移行为表现出较强的规律性特征,计算了各个景区之间转移概率的标准差及其变化范围的区间大小,分别如图2和图3所示。从图2中可以看出,转移概的标准差的最大值为0.00385,对应的转移路径序号是21,是景区7→景区1之间的转移路径,其余的标准差均低于0.0013,说明游客在景区之间转移的概率波动较小。从图3可以看出,各个景区之间转移概率的变化区间(最大值与最小值之差)排在前3的取值分别是0.011、0.006和0.005,分别是序号21、15、4以及34,其余的转移概率变化区间均低于0.004,这说明景区之间转移概率在较小的范围内变化。根据图2和图3的结果,说明游客在景区之间的转移规律是可以量化建模。
需要说明的是,以上内容仅仅说明了本发明的技术思想,不能以此限定本发明的保护范围,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰均落入本发明权利要求书的保护范围之内。

Claims (4)

1.一种基于游客时空行为模式挖掘的景区客流实时预测方法,其特征在于,该方法包括以下步骤:
S1.大数据的实时采集:包括对游客的基本信息、时空行为数据、交通状况数据、气象数据和目的地节庆数据进行实时采集;
S2.挖掘游客的时空行为模式和构建景区之间空间可达性模型;
S3.根据目的地当前时刻游客在各景区时空分布、游客移动方向性信息和交通状况数据,利用步骤S2中构建的模型,对于各个景区下一预测周期的客流数量进行预测;
S4.根据在各个景区实时产生的游客时空数据,对步骤S2中构建的模型进行迭代更新。
2.根据权利要求1所述的基于游客时空行为模式挖掘的景区客流实时预测方法,其特征在于,步骤S1中所述大数据的实时采集具体包括如下信息采集:
S101散客信息采集,在景区出入口安装物联网设备采集游客手机信令信息,所述物联网设备包括电子围栏或探针设备,记录游客出入景区的时间;
S102团队游客的信息采集,在景区入口和出口处导游对电子行程单的二维码进行扫描,读取团队游客电子行程单信息,包括团队游客的行程路线、到达该景点的时间点以及游客成员信息,及其实际离开景区的时间,在后台数据库进行同步更新,从而记录的团队游客时间、空间信息和游客信息;
S103本地居民的信息采集,设置专门的本地居民通道,通过刷身份证的方式进行验票和信息采集;
S104游客在景区内各景点的时空信息采集,采用近距离通信技术实现景点区域内游客的时空信息采集;
S105目的地交通路况信息的采集,通过高德地图或百度地图的开放API接口,对道路交通情况进行实时采集;
S106目的地的气象信息和节庆活动信息采集,利用网络爬虫软件爬取旅游目的地的天气、节庆活动信息。
3.根据权利要求1所述的基于游客时空行为模式挖掘的景区客流实时预测方法,其特征在于,步骤S2中所述挖掘游客的时空行为模式和构建景区之间空间可达性模型包括:
S201计算游客在景区内景点的停留时间
根据游客在景区内各个景点最早出现的时间点和最晚出现的时间点,针对散客和本地市居民计算每一个游客的停留时间
Figure FDA0003460964580000011
Figure FDA0003460964580000012
表示游客i在景区j中的景点k最晚出现的时间点,表示游客离开景点区域的时间;
Figure FDA0003460964580000013
示游客i在景区j中的景点k最早出现的时间点,表示游客进入景点区域的时间;
S202计算游客在景区内总共停留时间
Figure FDA0003460964580000021
Figure FDA0003460964580000022
表示游客i在景区j中总共停留的时间,计算公式为
Figure FDA0003460964580000023
Figure FDA0003460964580000024
表示游客i离开景区j的时刻,
Figure FDA0003460964580000025
表示游客i进入景区j的时刻;
去除游客在各个景点停留的时间,在景区j的非景点区域所花费的时间为
Figure FDA0003460964580000026
Figure FDA0003460964580000027
N表示景区中的景点数量,依据设备采集到的游客进入景区时间和离开时间,计算数据库中每个游客的
Figure FDA0003460964580000028
Figure FDA0003460964580000029
S203构建各个景区之间游客移动的时间代价期望矩阵TM×M,表示如公式(1)
Figure FDA00034609645800000210
M表示旅游目的地的热门景区的数量,type表示游客的类型,type取值为0,1,2分别表示本地游客、散客和团队游客;Tj1->j2表示根据当前的交通路况信息,从景区j1到景区j2需要时间的数学期望;Tj1->j1=0,表示没有景区之间转移行为发生;
S204基于客源地和游客类型的概率转移矩阵计算
针对游客景区之间的转移概率矩阵如公式(2)所示。
Figure FDA00034609645800000211
Figure FDA00034609645800000212
表示离开景区j1转移到其他景区和非景区区域的概率之和恒等于1;pj1->j2(j1≠j2,j1,j2<M+1)表示游客从景区j1转移到景区j2的概率,pj1->j1(j1<M+1)表示游客在下一时刻继续停留在景区j1的概率,pj1->M+1(j1≠M+1)表示游客离开景区j1后转移到非热门景区或其他区域的概率,这里有3种情况:离开旅游目的地、去往目的地其他非热门景区或者去往目的地的其他区域;根据具体的旅游目的地内部景区分布、临近旅游目的地之间的空间分布以及所处的时间点,转移概率具有差异性,PM×M+1测量景区之间转移的概率,其中pj1->j2(j1≠j2)的计算公式(3):
Figure FDA0003460964580000031
其中,pj1,(t-1)表示游客在(t-1)时刻位于景区j1的概率,在实际计算pj1->j2时,利用数据库中游客的时空信息,统计在(t-1)时刻位于景区j1并且在下一时刻t出现在景区j2的游客数量Num(j1->j2,t),除以在(t-1)时刻出现在景区j1的游客数量Num(j1,t-1);
计算转移概率矩阵
Figure FDA0003460964580000032
表示本地居民,外地的散客对应的source取值为非零的整数,对于团队游客,因为行程是确定的不需要单独进行计算;
S205基于时间维度的游客景区之间的概率转移矩阵构建
针对当天、所处月份及其对应历史同期3个维度分别计算游客的转移概率矩阵,分别表示为
Figure FDA0003460964580000033
Figure FDA0003460964580000034
在相应的时间维度内进行样本的筛选,概率的计算公式与公式(3)相同,计算时间维度上的转移概率时,把数据的样本限定在规定的时间范围内;
S206构建任意2个景区之间游客在时间序列上的到达的概率矩阵
基于游客在时间序列上的特征,构建景区到达游客的概率矩阵,如公式(4)所示
Figure FDA0003460964580000035
p′j1->j2,q(1≤q<t)表示在q时刻开景区j1,在第t时刻到达景区j2的概率,也就是需要t-q周期时间从景区j1转移到景区j2的概率;p′j1->j2,t则表示游客在(t-1)时刻离开景区j1,在t时刻到达景区j2的概率,也就是游客在一个时间周期之内能够转移到目标景区的概率;P′j表示转移需要多长时间能够转移到目标景区的概率;
S207游客在景区内停留时间的预测
利用深度神经网络训练离开景区时间的预测模型,深度神经网络输出变量为游客在景区内的停留时间,深度神经网络的输入变量包括:游客类型、当前时间、所在的月份、天气状况、在各个景点的停留时间、本地居民和外地游客的客源地)进入景区的时刻、在非景区区域内停留时间、游览的顺序等数据,采用深度学习的LSTM深度神经网络对当地居民和散客分别构建景区停留时间的预测模型;
S208游客的综合转移概率矩阵的计算
针对本地居民和散客分别计算景区j1转移到景区j2的综合概率
Figure FDA0003460964580000041
下标source表示客源地的类型,取值为0表示本地居民,外地的散客取值为非零的整数,计算公式需要综合考虑客源地、月份、历史同期和当天的转移概率,称为综合转移概率,计算公式如公式(5)所示:
Figure FDA0003460964580000042
其中,基于大数据样本,利用多元线性回归模型确定回归方程中的参数α,β,γ,
Figure FDA0003460964580000043
表示根据当天的最新游客时空数据计算出来的转移概率,
Figure FDA0003460964580000044
表示季节性对游客转移概率的影响,具体的取值方式根据旅游目的地的旅游景观资源季节性特征进行确定;
S209游客抵达目的地首个景区的随机过程模型构建
根据当日的旅游是否具有旅游经历,到达景区的游客分为2种类型:一类从其他景区转移过来的游客;另一类是在旅游目的地当天还没有景区旅游经历的游客,该游客没有当日的历史时空轨迹数据可用,因此不能采用空间概率转移的方式进行计算;对于这类游客,根据数据库中记录第一站游览景点k的到达时间的历史信息,计算游客在各个时间间隔内的抵达人数分布,用于预测从非景区区域到达景点k的游客数量
Figure FDA0003460964580000045
在现实场景中,抵达景区的时间分布符合泊松分布过程,采用泊松分布模型构建游客到达首个景区的随机过程模型。
4.根据权利要求1所述的基于游客时空行为模式挖掘的景区客流实时预测方法,其特征在于,步骤S3中,景区下一时刻的游客流量的预测结果取决于三个变量:离开本景区游客数量的预测值、目前在其他景区内并且下一时刻转移到本景区的游客预测值以及在转移途中游客的预测值,景区j在t时刻的游客流量预测步骤具体如下:
S301预测离开该景区游客的数量
计算[t-1,t]时间区间内离开景区j的游客数量,计算公式如公式(6)所示:
Figure FDA0003460964580000046
其中,
Figure FDA0003460964580000047
表示在[t-1,t]时间区间预计离开景区的本地居民人数,
Figure FDA0003460964580000048
表示在[t-1,t]时间区间预计离开本景区的散客类型的游客数量,
Figure FDA0003460964580000049
表示在[t-1,t]时间区间离开本景区的团队游客数量;
Figure FDA00034609645800000410
Figure FDA00034609645800000411
的计算利用步骤S207中的停留时间预测模型进行计算;
S302预测其他景区转移到该景区j的游客数量
计算公式如公式(7)所示:
Figure FDA0003460964580000051
其中,j1表示除了景区j其他景区的编号,q表示在[1,t]之间的时刻,当前的时刻为t,source表示游客的类型。
Figure FDA0003460964580000052
表示在第q时刻离开第景区j1的游客中,游客类型为source的游客预计到达景区j的数量。下标source取值为0时,表示本地居民,取其他整数时表示外地的散客,source的取值标识客源地的编号。计算公式如公式(8)所示:
Figure FDA0003460964580000053
p′j1->j,q表示在[q-1,q]时间区间内离开景区j1,在[t-1,t]时间区间内到达景区j的概率,表示到达的可能性,计算方法见公式(4),
Figure FDA0003460964580000054
利用步骤S208构建的模型进行计算,
Figure FDA0003460964580000055
表示团队游客中从景区j1到达景区j的数量,根据电子行程单信息进行确定,S303景区j在t时刻的游客流量预测,计算公式如(9)所示:
Figure FDA0003460964580000056
最终的预测结果需要相应的奖惩机制进行自适应调整,参数λ为奖惩系数。
CN202210018208.0A 2022-01-07 2022-01-07 一种基于游客时空行为模式挖掘的景区客流实时预测方法 Pending CN114519454A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210018208.0A CN114519454A (zh) 2022-01-07 2022-01-07 一种基于游客时空行为模式挖掘的景区客流实时预测方法
GB2300208.2A GB2615888A (en) 2022-01-07 2023-01-06 Method for predicting tourist flow in scenic area in real time based on tourists' spatio-temporal behavior pattern mining

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210018208.0A CN114519454A (zh) 2022-01-07 2022-01-07 一种基于游客时空行为模式挖掘的景区客流实时预测方法

Publications (1)

Publication Number Publication Date
CN114519454A true CN114519454A (zh) 2022-05-20

Family

ID=81597563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210018208.0A Pending CN114519454A (zh) 2022-01-07 2022-01-07 一种基于游客时空行为模式挖掘的景区客流实时预测方法

Country Status (2)

Country Link
CN (1) CN114519454A (zh)
GB (1) GB2615888A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115456429A (zh) * 2022-09-20 2022-12-09 重庆大学 一种基于景区客流动态调整景区游客容纳量的方法及装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117454319A (zh) * 2023-09-13 2024-01-26 中国科学院地理科学与资源研究所 一种基于gps大数据的旅游流数据分析方法
CN117592638A (zh) * 2023-10-20 2024-02-23 南京新中安物联技术股份有限公司 一种景区客流分析与管控的方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115456429A (zh) * 2022-09-20 2022-12-09 重庆大学 一种基于景区客流动态调整景区游客容纳量的方法及装置
CN115456429B (zh) * 2022-09-20 2023-07-21 重庆大学 一种基于景区客流动态调整景区游客容纳量的方法及装置

Also Published As

Publication number Publication date
GB2615888A (en) 2023-08-23

Similar Documents

Publication Publication Date Title
Pan et al. Predicting bike sharing demand using recurrent neural networks
Zannat et al. Emerging big data sources for public transport planning: A systematic review on current state of art and future research directions
Gurumurthy et al. Analyzing the dynamic ride-sharing potential for shared autonomous vehicle fleets using cellphone data from Orlando, Florida
Vlahogianni et al. A real-time parking prediction system for smart cities
CN114519454A (zh) 一种基于游客时空行为模式挖掘的景区客流实时预测方法
Huang et al. A mobility network approach to identify and anticipate large crowd gatherings
Kaltenbrunner et al. Urban cycles and mobility patterns: Exploring and predicting trends in a bicycle-based public transport system
Ehmke et al. Floating car based travel times for city logistics
Chen et al. Uncertainty in urban mobility: Predicting waiting times for shared bicycles and parking lots
Wang et al. Trajectory analysis for on-demand services: A survey focusing on spatial-temporal demand and supply patterns
Zheng et al. The benefits of introducing meeting points into flex-route transit services
Zheng et al. Multi-attraction, hourly tourism demand forecasting
He et al. Evaluation of city-scale built environment policies in New York City with an emerging-mobility-accessible synthetic population
CN111242395B (zh) 用于od数据的预测模型构建方法及装置
CN110545558A (zh) 基于Wi-Fi数据的高速服务区人群密度估计系统
Duan et al. Bi-level programming model for resource-shared parking lots allocation
Liu et al. Smart card data-centric replication of the multi-modal public transport system in Singapore
Li et al. Using smart card data trimmed by train schedule to analyze metro passenger route choice with synchronous clustering
Xiong et al. An integrated and personalized traveler information and incentive scheme for energy efficient mobility systems
Chiariotti et al. Bike sharing as a key smart city service: State of the art and future developments
Xie et al. Revealing spatiotemporal travel demand and community structure characteristics with taxi trip data: A case study of New York City
Peftitsi et al. Evaluating crowding in individual train cars using a dynamic transit assignment model
Guo et al. Understanding individual and collective human mobility patterns in twelve crowding events occurred in Shenzhen
Gao et al. Exploring spatio-temporal pattern heterogeneity of dockless bike-sharing system: Links with cycling environment
Jiang et al. A unified probabilistic framework for spatiotemporal passenger crowdedness inference within urban rail transit network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination