CN115130786A - 一种景区游客饱和量的判断方法和装置 - Google Patents

一种景区游客饱和量的判断方法和装置 Download PDF

Info

Publication number
CN115130786A
CN115130786A CN202210971107.5A CN202210971107A CN115130786A CN 115130786 A CN115130786 A CN 115130786A CN 202210971107 A CN202210971107 A CN 202210971107A CN 115130786 A CN115130786 A CN 115130786A
Authority
CN
China
Prior art keywords
task
sample
prediction
prediction model
scenic spot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210971107.5A
Other languages
English (en)
Other versions
CN115130786B (zh
Inventor
谢朝武
李哲君
卫华飞
曾怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nowledge Data Co ltd
Huaqiao University
Original Assignee
Nowledge Data Co ltd
Huaqiao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nowledge Data Co ltd, Huaqiao University filed Critical Nowledge Data Co ltd
Priority to CN202210971107.5A priority Critical patent/CN115130786B/zh
Publication of CN115130786A publication Critical patent/CN115130786A/zh
Application granted granted Critical
Publication of CN115130786B publication Critical patent/CN115130786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种景区游客饱和量的判断方法和装置,通过分挖掘WiFi探针监测到的手机mac的相关性,然后设定预测步长h,构造多个学习任务,对每一个学习任务通过数据集样本构造对应的训练集和测试集,通过训练集优化多任务模型,然后通过测试集输入优化的多任务预测模型,得到设定预测步长时刻的游客预测数据,从而实现准确预测下一时刻景区游客的数量,并对景区的饱和量达到预警的目的。

Description

一种景区游客饱和量的判断方法和装置
技术领域
本发明涉及智慧旅游技术领域,特别涉及一种景区游客饱和量的判断方法和装置。
背景技术
随着经济的全球化,人们对物质及精神方面的需求都在不断增高,旅游成了人们满足精神需求的重要活动之一。同时,旅游也的兴盛为国家的经济增长和收入带来了强力的推动作用,已经成为重要的经济增长来源。旅游,作为人类与大自然及人类文明相互作用的活动方式,对风景区的社会、经济、环境都有巨大的影响。但是许多热点旅游景点都存在着超负荷、超容量的情况。旅游景区的超载不仅使游客的旅游质量下降,而且也使景区的旅游资源遭受到破坏,导致生态环境失衡。因此,高效合理的判断景区游客饱和量对保护景区资源而言至关重要。
景区游客饱和量的判断依据是:对进入景区的人数进行统计,同时从出口出去的人数进行计数,实时地计算出此时景区的人数,并与设定的饱和量进行判断。而最早的判断方法是基于统计部门或市场调研机构的发布,该方法影响因素较多,且需具有先验知识才能进行判断,不能事先预测;还有基于关注度拟合客流量的方法,该方法只进行关注度一个单因素进行学习会造成欠拟合;还有一些基于人脸识别、指纹识别以及手机设备特征的wifi探针等多种技术的判断方法,但上述的判断方法是基于单一因素进行的单任务学习,即采用的训练集所有样本都是针对单个学习任务的数据,如果在样本不充分的情况下,无法对样本进行有效的训练,从而产生欠拟合现象,进而导致预测不准确等情况。
发明内容
本发明要解决的技术问题,在于提供一种景区游客饱和量的判断方法和装置,构造多任务学习,更为准确地预测下一时刻景区游客的数量,实现对景区的饱和量预警。
第一方面,本发明实施例提供了一种景区游客饱和量的判断方法,包括:
步骤10、获取WiFi探针采集到的手机mac总量时间序列,得到历史样本,对所述历史样本按设定预测步长h进行预处理,得到数据集样本;
步骤20、构造n个学习任务t+1,t+2,……,t+n,其中t为当前时刻,n≦h;
步骤30、针对每一个学习任务,对所述数据集样本进行处理得到对应的训练集和测试集;
步骤40、将训练集输入多任务预测模型,得到优化的多任务预测模型;
步骤50、将测试集输入优化的多任务预测模型,得到设定预测步长h时刻的游客预测数据。
进一步地,所述步骤10具体包括:
获取wifi探针采集到的手机mac总量时间序列,得到历史样本{y1,y2,...,yn,yn+1,...,yt},其中,t为当前时刻,n为学习任务数;然后根据历史样本通过如下公式得到t+h时刻的估计值
Figure BDA0003793858610000021
得到数据集样本,
Figure BDA0003793858610000022
其中,h为预测步长,f为计算采集样本函数。
进一步地,所述步骤20具体包括:
构造n个学习任务,每个学习任务对应的m个训练样本,其公式表示为:
Figure BDA0003793858610000023
其中,xi,j为输入数据,yi,j为输出数据,j为样本,m为训练样本个数。
进一步地,所述步骤30具体包括:针对每一个学习任务,对所述数据集样本通过流出法、交叉验证法或自助法处理得到训练集和测试集。
进一步地,所述步骤40具体包括:
采用MTLS-SVM多任务预测模型,其需要优化的目标函数为:
Figure BDA0003793858610000031
其中,
Figure BDA0003793858610000032
为原始空间向高维特征空间的映射,ξ=(ξ12,...,ξn)Τ为松弛变量,minJ为最小化损失函数,w0 T表示转置公共信息,w0表示公共信息,λ为正则项系数,m为训练样本个数,vi T表示转置特定信息,vi表示特定信息,γ为正则项,s.t.表示约束条件,bi表示偏差向量,1n表示n阶单位矩阵;
MTLS-SVM多任务预测模型通过最小化所述目标函数,同时找到
Figure BDA0003793858610000033
Figure BDA0003793858610000034
通过拉格朗日法求解所述目标函数,最终得到MTLS-SVM多任务预测模型的决策函数,作为优化的多任务预测模型:
Figure BDA0003793858610000035
其中,αi,j表示第i个任务中第j个样本的拉格朗日乘子,k(xi,j,x)为核函数,n为任务个数,λ为正则项系数,m为训练样本个数,k(xi,x)为内积函数,bi为偏差向量。
第二方面,本发明实施例提供了一种景区游客饱和量的判断装置,包括:预处理模块、多任务构造模块、样本构建模块、模型优化模块以及预测模块;
所述预处理模块,用于获取WiFi探针采集到的手机mac总量时间序列,得到历史样本,对所述历史样本按设定预测步长h进行预处理,得到数据集样本;
所述多任务构造模块,用于构造n个学习任务t+1,t+2,……,t+n,其中t为当前时刻,n≦h;
所述样本构建模块,用于针对每一个学习任务,对所述数据集样本进行处理得到对应的训练集和测试集;
所述模型优化模块,用于将训练集输入多任务预测模型,得到优化的多任务预测模型;
所述预测模块,用于将测试集输入优化的多任务预测模型,得到设定预测步长h时刻的游客预测数据。
进一步地,所述预处理模块具体包括:
获取WiFi探针采集到的手机mac总量时间序列,得到历史样本{y1,y2,...,yn,yn+1,...,yt},其中,t为当前时刻,n为学习任务数;然后根据历史样本通过如下公式得到t+h时刻的估计值
Figure BDA0003793858610000041
得到数据集样本,
Figure BDA0003793858610000042
其中,h为预测步长,f为计算采集样本函数。
进一步地,所述模型优化模块具体包括:
构造n个学习任务,每个学习任务对应的m个训练样本,其公式表示为:
Figure BDA0003793858610000043
其中,xi,j为输入数据,yi,j为输出数据,j为样本,m为训练样本个数。
进一步地,所述样本构建模块具体包括:针对每一个学习任务,对所述数据集样本通过流出法、交叉验证法或自助法处理得到训练集和测试集。
进一步地,所述预测模块具体包括:
采用MTLS-SVM多任务预测模型,其需要优化的目标函数为:
Figure BDA0003793858610000044
其中,
Figure BDA0003793858610000045
为原始空间向高维特征空间的映射,ξ=(ξ12,...,ξn)Τ为松弛变量,minJ为最小化损失函数,w0 T表示转置公共信息,w0表示公共信息,λ为正则项系数,m为训练样本个数,vi T表示转置特定信息,vi表示特定信息,γ为正则项,s.t.表示约束条件,bi表示偏差向量,1n表示n阶单位矩阵;
MTLS-SVM多任务预测模型通过最小化所述目标函数,同时找到
Figure BDA0003793858610000051
Figure BDA0003793858610000052
通过拉格朗日法求解所述目标函数,最终得到MTLS-SVM多任务预测模型的决策函数,作为优化的多任务预测模型:
Figure BDA0003793858610000053
其中,αi,j表示第i个任务中第j个样本的拉格朗日乘子,k(xi,j,x)为核函数,n为任务个数,λ为正则项系数,m为训练样本个数,k(xi,x)为内积函数,bi为偏差向量。
本发明具有如下优点:
通过构建多任务预测模型,在时间序列多步预测中能够取得较高的预测精度,基于MTLS-SVM的建模,同时将多个学习任务并行的训练模型,借助任务间的归纳偏置,达到了相辅相成的效果,有效提高了模型的泛化能力,并对当前景点的游客量起到更加精准的预警作用,规避一些潜在的风险。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明基于MTLS-SVM的时间序列预测模型示意图;
图2为本发明实施例一方法执行流程图;
图3为本发明实施例一多任务学习与单任务学习比较图;
图4为本发明实施例二装置的结构示意图。
具体实施方式
本申请实施例中的技术方案,总体思路如下:
本发明的采用一种多任务预测模型(MTLS-SVM),充分挖掘WiFi探针监测到的手机mac的相关性,构造多任务学习,预测下一时刻景区游客的数量,并对景区的饱和量达到预警的目的。基于大数据平台,将探针接收的数据实时的保存在Mongo数据表中,并进行数据挖掘和分析,获取实时的游客量。
WiFi探针采集到数据主要为MAC层的信息,比如设备MAC地址,WiFi信号强度,WiFi信号帧类型,数据格式为:探针MAC|抓取设备的MAC|信号强度|时间戳。具体的数据释意为:
1)探针MAC:就是探针本身的mac地址。
2)抓取的设备MAC:指探针抓取到的WiFi信号的发射设备的MAC地址,一般为手机。
3)信号强度:指探针抓取到WiFi信号的强度,最小值为“-100”,一般来说此值越大表示发射设备离探针越近。
4)时间戳:指探针抓取到WiFi信号的时间,如果探针在局域网内使用而没有接入广域网的话,时间戳可能不准确。
而探针监测到的手机mac以及时间戳,可以视为一种时间序列,时间序列是一种重要的数据对象。对其进行分析处理,挖掘其中有用的信息,对于揭示事物发展规律,发现事物之间的相互关系具有很重要的实际意义。基于此,采用时间序列预测,其根据采集到的历史数据建立模型捕捉数据的内在变化规律,从而预测未来某个时间点或者时间段内可能发生的结果。因此提出基于MTLS-SVM的时间序列预测模型包括数据预处理、任务构造和模型训练三个部分,如图1所示。
实施例一
本发明实施例提供了一种景区游客饱和量的判断方法,如图2所示,包括:
步骤10、获取WiFi探针采集到的手机mac总量时间序列,得到历史样本,对所述历史样本按设定预测步长h进行预处理,得到数据集样本;
获取WiFi探针采集到的手机mac总量时间序列,得到历史样本{y1,y2,...,yn,yn+1,...,yt},其中,t为当前时刻,n为学习任务数;然后根据历史样本通过如下公式得到t+h时刻的估计值
Figure BDA0003793858610000061
得到数据集样本,
Figure BDA0003793858610000062
其中,h为预测步长,f为计算采集样本函数。
将整理后的游客总量数据构造为数据集样本。如表1所示:
表1
输出 输入
y<sub>n+h</sub> y<sub>n</sub>,y<sub>n-1</sub>,...,y<sub>2</sub>,y<sub>1</sub>
y<sub>n+h+1</sub> y<sub>n+1</sub>,y<sub>n</sub>,...,y<sub>3</sub>,y<sub>2</sub>
y<sub>t-1</sub> y<sub>t-h-1</sub>,y<sub>t-h-2</sub>,...,y<sub>t-h-n+1</sub>,y<sub>t-h-n</sub>
y<sub>t</sub> y<sub>t-h</sub>,y<sub>t-h-1</sub>,…,y<sub>t-h-n+2</sub>,y<sub>t-h-n+1</sub>
步骤20、构造n个学习任务t+1,t+2,……,t+n,其中t为当前时刻,n≦h;
构造n个学习任务,每个学习任务对应的m个训练样本,其公式表示为:
Figure BDA0003793858610000071
其中,xi,j为输入数据,yi,j为输出数据,j为样本,m为训练样本个数。
传统的单任务学习方法使用前个时刻的观测值预测时刻的值,模型输出为单值。而使用多任务学习方法可以将一起作为预测输出,其模型的对比图如图3所示。
单任务预测,针对n个任务,需要构造出n个不同的预测模型,分别输出相应的估计值。而采用多任务学习方法只需构造一个多输出预测模型,得到n个任务的输出值。因此在利用多任务模型进行下一时刻游客量预测时,只需要根据时间序列预测目标,选取适当的n个任务,并构造每个任务相应的训练集就可以。
步骤30、针对每一个学习任务,对所述数据集样本进行处理得到对应的训练集和测试集;针对每一个学习任务,对所述数据集样本通过流出法、交叉验证法或自助法处理得到训练集和测试集。
步骤40、将训练集输入多任务预测模型,得到优化的多任务预测模型;
传统的时间序列预测多数采用的是单任务机器学习方法,即采用的训练集所有样本都是针对单个学习任务的数据,如果在样本不充分的情况下,无法对样本进行有效的训练,从而产生欠拟合现象。因此采用一种多任务预测模型(MTLS-SVM),充分挖掘WiFi探针监测到的手机mac的相关性,构造多任务学习,预测下一时刻景区游客的数量,并对景区的饱和量达到预警的目的。
采用MTLS-SVM多任务预测模型,其需要优化的目标函数为:
Figure BDA0003793858610000081
其中,
Figure BDA0003793858610000082
为原始空间向高维特征空间的映射,ξ=(ξ12,...,ξn)Τ为松弛变量,minJ为最小化损失函数,w0 T表示转置公共信息,w0表示公共信息,λ为正则项系数,m为训练样本个数,vi T表示转置特定信息,vi表示特定信息,γ为正则项,s.t.表示约束条件,bi表示偏差向量,1n表示n阶单位矩阵;
MTLS-SVM多任务预测模型通过最小化所述目标函数,同时找到
Figure BDA0003793858610000083
Figure BDA0003793858610000084
通过拉格朗日法求解所述目标函数,最终得到MTLS-SVM多任务预测模型的决策函数,作为优化的多任务预测模型:
Figure BDA0003793858610000085
其中,αi,j表示第i个任务中第j个样本的拉格朗日乘子,k(xi,j,x)为核函数,n为任务个数,λ为正则项系数,m为训练样本个数,k(xi,x)为内积函数,bi为偏差向量。
步骤50、将测试集输入优化的多任务预测模型,得到设定预测步长h时刻的游客预测数据。
根据计算得到的预测步长h时刻的游客预测数据,并与设定的饱和量进行判断,实现及时的、较高预测精度的游客人数饱和预警。
整体的算法实现步骤如下:
输入:WiFi探针采集到的手机mac总量时间序列:;
输出:预测未来某时刻的手机mac总量;
Step 1、数据预处理,将原始数据归一化并按上述数据预处理的方式构造数据集样本,将数据集划分为训练集和测试集;
Step 2、根据目标估计值构造n个学习任务;
Step 3、利用步骤1构造好的训练集训练MTLS-SVM模型;
Step 4、将步骤2构建好的测试集输入训练好的MTLS-SVM模型,得到需要的估计值;
时间序列的多部预测是一项有挑战性的任务,这是由于随着步长的增大,时间间隔增大,序列之间的关联性降低,对未来时刻取值的决策能力把握不足,使得预测精度降低。多步预测可以对未来一段时间内的值进行估计,有助人们对未来一段时间的游客饱和量以及自然天气进行估计,有助于人们了解事物发展趋势,帮人们指定相应的决策。
为了验证多步预测中的有效性,实验分别取3和5两个不同的步长做对比,预测结果如表二所示:
表二
Figure BDA0003793858610000091
Figure BDA0003793858610000101
由预测结果数据所述,多任务预测模型在时间序列多步预测中均取得了较高的预测精度,验证了提出方法的有效性与可行性。基于MTLS-SVM的建模,同时将多个学习任务并行的训练模型,借助任务间的归纳偏置,达到了相辅相成的效果,有效提高了模型的泛化能力。
基于同一发明构思,本申请还提供了与实施例一中的方法对应的装置,详见实施例二。
实施例二
在本实施例中提供了一种景区游客饱和量的判断装置,如图4所示,包括:预处理模块、多任务构造模块、样本构建模块、模型优化模块以及预测模块;
所述预处理模块,用于获取WiFi探针采集到的手机mac总量时间序列,得到历史样本,对所述历史样本按设定预测步长h进行预处理,得到数据集样本;
所述多任务构造模块,用于构造n个学习任务t+1,t+2,……,t+n,其中t为当前时刻,n≦h;
所述样本构建模块,用于针对每一个学习任务,对所述数据集样本进行处理得到对应的训练集和测试集;
所述模型优化模块,用于将训练集输入多任务预测模型,得到优化的多任务预测模型;
所述预测模块,用于将测试集输入优化的多任务预测模型,得到设定预测步长h时刻的游客预测数据。
在一种可能的实现方式中,所述预处理模块具体包括:
获取WiFi探针采集到的手机mac总量时间序列,得到历史样本{y1,y2,...,yn,yn+1,...,yt},其中,t为当前时刻,n为学习任务数;然后根据历史样本通过如下公式得到t+h时刻的估计值
Figure BDA0003793858610000111
得到数据集样本,
Figure BDA0003793858610000112
其中,h为预测步长,f为计算采集样本函数。
在一种可能的实现方式中,所述模型优化模块具体包括:
构造n个学习任务,每个学习任务对应的m个训练样本,其公式表示为:
Figure BDA0003793858610000113
其中,xi,j为输入数据,yi,j为输出数据,j为样本,m为训练样本个数。
在一种可能的实现方式中,所述样本构建模块具体包括:针对每一个学习任务,对所述数据集样本通过流出法、交叉验证法或自助法处理得到训练集和测试集。
在一种可能的实现方式中,所述预测模块具体包括:
采用MTLS-SVM多任务预测模型,其需要优化的目标函数为:
Figure BDA0003793858610000114
其中,
Figure BDA0003793858610000115
为原始空间向高维特征空间的映射,ξ=(ξ12,...,ξn)Τ为松弛变量,minJ为最小化损失函数,w0 T表示转置公共信息,w0表示公共信息,λ为正则项系数,m为训练样本个数,vi T表示转置特定信息,vi表示特定信息,γ为正则项,s.t.表示约束条件,bi表示偏差向量,1n表示n阶单位矩阵;
MTLS-SVM多任务预测模型通过最小化所述目标函数,同时找到
Figure BDA0003793858610000116
Figure BDA0003793858610000117
通过拉格朗日法求解所述目标函数,最终得到MTLS-SVM多任务预测模型的决策函数,作为优化的多任务预测模型:
Figure BDA0003793858610000121
其中,αi,j表示第i个任务中第j个样本的拉格朗日乘子,k(xi,j,x)为核函数,n为任务个数,λ为正则项系数,m为训练样本个数,k(xi,x)为内积函数,bi为偏差向量。
由于本发明实施例二所介绍的装置,为实施本发明实施例一的方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。
本发明实施例通过构建多任务预测模型,在时间序列多步预测中能够取得较高的预测精度,基于MTLS-SVM的建模,同时将多个学习任务并行的训练模型,借助任务间的归纳偏置,达到了相辅相成的效果,有效提高了模型的泛化能力,并对当前景点的游客量起到更加精准的预警作用,规避一些潜在的风险。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。

Claims (10)

1.一种景区游客饱和量的判断方法,其特征在于,包括:
步骤10、获取WiFi探针采集到的手机mac总量时间序列,得到历史样本,对所述历史样本按设定预测步长h进行预处理,得到数据集样本;
步骤20、构造n个学习任务t+1,t+2,……,t+n,其中t为当前时刻,n≦h;
步骤30、针对每一个学习任务,对所述数据集样本进行处理得到对应的训练集和测试集;
步骤40、将训练集输入多任务预测模型,得到优化的多任务预测模型;
步骤50、将测试集输入优化的多任务预测模型,得到设定预测步长h时刻的游客预测数据。
2.根据权利要求1所述的一种景区游客饱和量的判断方法,其特征在于:所述步骤10具体包括:
获取wifi探针采集到的手机mac总量时间序列,得到历史样本{y1,y2,...,yn,yn+1,...,yt},其中,t为当前时刻,n为学习任务数;然后根据历史样本通过如下公式得到t+h时刻的估计值
Figure FDA0003793858600000013
得到数据集样本,
Figure FDA0003793858600000011
其中,h为预测步长,f为计算采集样本函数。
3.根据权利要求2所述的一种景区游客饱和量的判断方法,其特征在于:所述步骤20具体包括:
构造n个学习任务,每个学习任务对应的m个训练样本,其公式表示为:
Figure FDA0003793858600000012
其中,xi,j为输入数据,yi,j为输出数据,j为样本,m为训练样本个数。
4.根据权利要求1所述的一种景区游客饱和量的判断方法,其特征在于:所述步骤30具体包括:针对每一个学习任务,对所述数据集样本通过流出法、交叉验证法或自助法处理得到训练集和测试集。
5.根据权利要求3或4所述的一种景区游客饱和量的判断方法,其特征在于:所述步骤40具体包括:
采用MTLS-SVM多任务预测模型,其需要优化的目标函数为:
Figure FDA0003793858600000021
Figure FDA0003793858600000022
其中,
Figure FDA0003793858600000023
为原始空间向高维特征空间的映射,ξ=(ξ12,...,ξn)Τ为松弛变量,minJ为最小化损失函数,w0 T表示转置公共信息,w0表示公共信息,λ为正则项系数,m为训练样本个数,vi T表示转置特定信息,vi表示特定信息,γ为正则项,s.t.表示约束条件,bi表示偏差向量,1n表示n阶单位矩阵;
MTLS-SVM多任务预测模型通过最小化所述目标函数,同时找到
Figure FDA0003793858600000024
和b=(b1,b2,...,bm)T
通过拉格朗日法求解所述目标函数,最终得到MTLS-SVM多任务预测模型的决策函数,作为优化的多任务预测模型:
Figure FDA0003793858600000025
其中,αi,j表示第i个任务中第j个样本的拉格朗日乘子,k(xi,j,x)为核函数,n为任务个数,λ为正则项系数,m为训练样本个数,k(xi,x)为内积函数,bi为偏差向量。
6.一种景区游客饱和量的判断装置,其特征在于,包括:预处理模块、多任务构造模块、样本构建模块、模型优化模块以及预测模块;
所述预处理模块,用于获取wifi探针采集到的手机mac总量时间序列,得到历史样本,对所述历史样本按设定预测步长h进行预处理,得到数据集样本;
所述多任务构造模块,用于构造n个学习任务t+1,t+2,……,t+n,其中t为当前时刻,n≦h;
所述样本构建模块,用于针对每一个学习任务,对所述数据集样本进行处理得到对应的训练集和测试集;
所述模型优化模块,用于将训练集输入多任务预测模型,得到优化的多任务预测模型;
所述预测模块,用于将测试集输入优化的多任务预测模型,得到设定预测步长h时刻的游客预测数据。
7.根据权利要求6所述的一种景区游客饱和量的判断装置,其特征在于:所述预处理模块具体包括:
获取WiFi探针采集到的手机mac总量时间序列,得到历史样本{y1,y2,...,yn,yn+1,...,yt},其中,t为当前时刻,n为学习任务数;然后根据历史样本通过如下公式得到t+h时刻的估计值
Figure FDA0003793858600000033
得到数据集样本,
Figure FDA0003793858600000031
其中,h为预测步长,f为计算采集样本函数。
8.根据权利要求7所述的一种景区游客饱和量的判断装置,其特征在于:所述模型优化模块具体包括:
构造n个学习任务,每个学习任务对应的m个训练样本,其公式表示为:
Figure FDA0003793858600000032
其中,xi,j为输入数据,yi,j为输出数据,j为样本,m为训练样本个数。
9.根据权利要求6所述的一种景区游客饱和量的判断装置,其特征在于:所述样本构建模块具体包括:针对每一个学习任务,对所述数据集样本通过流出法、交叉验证法或自助法处理得到训练集和测试集。
10.根据权利要求8或9所述的一种景区游客饱和量的判断装置,其特征在于:所述预测模块具体包括:
采用MTLS-SVM多任务预测模型,其需要优化的目标函数为:
Figure FDA0003793858600000041
Figure FDA0003793858600000042
其中,
Figure FDA0003793858600000043
为原始空间向高维特征空间的映射,ξ=(ξ12,...,ξn)Τ为松弛变量,minJ为最小化损失函数,w0 T表示转置公共信息,w0表示公共信息,λ为正则项系数,m为训练样本个数,vi T表示转置特定信息,vi表示特定信息,γ为正则项,s.t.表示约束条件,bi表示偏差向量,1n表示n阶单位矩阵;
MTLS-SVM多任务预测模型通过最小化所述目标函数,同时找到
Figure FDA0003793858600000044
和b=(b1,b2,...,bm)T
通过拉格朗日法求解所述目标函数,最终得到MTLS-SVM多任务预测模型的决策函数,作为优化的多任务预测模型:
Figure FDA0003793858600000045
其中,αi,j表示第i个任务中第j个样本的拉格朗日乘子,k(xi,j,x)为核函数,n为任务个数,λ为正则项系数,m为训练样本个数,k(xi,x)为内积函数,bi为偏差向量。
CN202210971107.5A 2022-08-11 2022-08-11 一种景区游客饱和量的判断方法和装置 Active CN115130786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210971107.5A CN115130786B (zh) 2022-08-11 2022-08-11 一种景区游客饱和量的判断方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210971107.5A CN115130786B (zh) 2022-08-11 2022-08-11 一种景区游客饱和量的判断方法和装置

Publications (2)

Publication Number Publication Date
CN115130786A true CN115130786A (zh) 2022-09-30
CN115130786B CN115130786B (zh) 2024-08-06

Family

ID=83386095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210971107.5A Active CN115130786B (zh) 2022-08-11 2022-08-11 一种景区游客饱和量的判断方法和装置

Country Status (1)

Country Link
CN (1) CN115130786B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446759A (zh) * 2018-02-11 2018-08-24 陕西师范大学 基于季节性长短期记忆网络模型的旅游客流量预测方法
CN111160651A (zh) * 2019-12-31 2020-05-15 福州大学 一种基于stl-lstm的地铁客流预测方法
CN111652444A (zh) * 2020-06-05 2020-09-11 南京机电职业技术学院 一种基于K-means和LSTM的日游客量预测方法
CN111985706A (zh) * 2020-08-15 2020-11-24 西北工业大学 一种基于特征选择和lstm的景区日客流量预测方法
CN114202103A (zh) * 2021-11-17 2022-03-18 浙江桢数科技有限公司 一种基于机器学习的节假日景区客流预测方法
US20220198372A1 (en) * 2019-09-11 2022-06-23 Hewlett-Packard Development Company, L.P. Time-series machine learning model-based resource demand prediction

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446759A (zh) * 2018-02-11 2018-08-24 陕西师范大学 基于季节性长短期记忆网络模型的旅游客流量预测方法
US20220198372A1 (en) * 2019-09-11 2022-06-23 Hewlett-Packard Development Company, L.P. Time-series machine learning model-based resource demand prediction
CN111160651A (zh) * 2019-12-31 2020-05-15 福州大学 一种基于stl-lstm的地铁客流预测方法
CN111652444A (zh) * 2020-06-05 2020-09-11 南京机电职业技术学院 一种基于K-means和LSTM的日游客量预测方法
CN111985706A (zh) * 2020-08-15 2020-11-24 西北工业大学 一种基于特征选择和lstm的景区日客流量预测方法
CN114202103A (zh) * 2021-11-17 2022-03-18 浙江桢数科技有限公司 一种基于机器学习的节假日景区客流预测方法

Also Published As

Publication number Publication date
CN115130786B (zh) 2024-08-06

Similar Documents

Publication Publication Date Title
Ma et al. Spatiotemporal prediction of PM2. 5 concentrations at different time granularities using IDW-BLSTM
US11335179B1 (en) Water environment risk prediction and early warning method
Zhang et al. Curb-gan: Conditional urban traffic estimation through spatio-temporal generative adversarial networks
Zhuang et al. Crime hot spot forecasting: A recurrent model with spatial and temporal information
Corcoran et al. Predicting the geo-temporal variations of crime and disorder
Akhavian et al. Evaluation of queuing systems for knowledge-based simulation of construction processes
CN111091196B (zh) 客流数据确定方法、装置、计算机设备和存储介质
CN111507762B (zh) 基于多任务共预测神经网络的城市出租车需求预测方法
CN109376906B (zh) 基于多维度轨迹的出行时间预测方法、系统及电子设备
CN114418175A (zh) 一种人员管理方法、装置、电子设备及存储介质
CN113298318A (zh) 一种新型的配电变压器重过载预测方法
CN112101673A (zh) 一种基于隐马尔可夫模型的电网发展趋势预测方法及系统
CN115310355A (zh) 考虑多能耦合的综合能源系统多元负荷预测方法及系统
Rodríguez-Rueda et al. Origin–Destination matrix estimation and prediction from socioeconomic variables using automatic feature selection procedure-based machine learning model
Tarasov et al. Review and possible development direction of the methods for modeling of soil pollutants spatial distribution
CN111984514A (zh) 基于Prophet-bLSTM-DTW的日志异常检测方法
Gai et al. Research on water quality spatiotemporal forecasting model based on ST-BIGRU-SVR neural network
CN115130786A (zh) 一种景区游客饱和量的判断方法和装置
Germanova et al. Situational modelling of oil pollution risks monitored by distributed monitoring
Aftabi et al. A Variational Autoencoder Framework for Robust, Physics-Informed Cyberattack Recognition in Industrial Cyber-Physical Systems
CN114880954A (zh) 一种基于机器学习的滑坡敏感性的评估方法
CN111143774B (zh) 一种基于影响因素多状态模型的电力负荷预测方法和装置
Kocijan et al. Regressor selection for ozone prediction
CN114915563A (zh) 一种网络流量预测方法和系统
Gao et al. Deep data stream analysis model and algorithm with memory mechanism

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant