CN117455079A - 一种宏观客流量预测方法与系统 - Google Patents
一种宏观客流量预测方法与系统 Download PDFInfo
- Publication number
- CN117455079A CN117455079A CN202311775542.1A CN202311775542A CN117455079A CN 117455079 A CN117455079 A CN 117455079A CN 202311775542 A CN202311775542 A CN 202311775542A CN 117455079 A CN117455079 A CN 117455079A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- passenger flow
- macroscopic
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 43
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 238000012417 linear regression Methods 0.000 claims abstract description 12
- 238000011156 evaluation Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000001932 seasonal effect Effects 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 239000003344 environmental pollutant Substances 0.000 claims description 5
- 231100000719 pollutant Toxicity 0.000 claims description 5
- 230000007613 environmental effect Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 230000004308 accommodation Effects 0.000 claims description 3
- 239000002245 particle Substances 0.000 claims description 2
- 238000011161 development Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 6
- 238000013524 data verification Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 description 2
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000001681 protective effect Effects 0.000 description 2
- MGWGWNFMUOTEHG-UHFFFAOYSA-N 4-(3,5-dimethylphenyl)-1,3-thiazol-2-amine Chemical compound CC1=CC(C)=CC(C=2N=C(N)SC=2)=C1 MGWGWNFMUOTEHG-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- JCXJVPUVTGWSNB-UHFFFAOYSA-N nitrogen dioxide Inorganic materials O=[N]=O JCXJVPUVTGWSNB-UHFFFAOYSA-N 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Medical Informatics (AREA)
- Educational Administration (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种宏观客流量预测方法与系统,涉及文旅产业治理技术领域,包括以下步骤:采集旅游相关数据;对旅游相关数据进行预处理,获得模型训练数据;利用模型训练数据对线性回归模型依次进行训练和验证,生成宏观客流量预测模型;采集城市旅游相关数据通过预处理获得待预测输入数据,将待预测输入数据输入宏观客流量预测模型,获得客流量预测结果。本发明通过对多种数据进行学习,建立一个预测模型,准确预测城市未来客流量,为城市规划和旅游资源开发提供辅助决策。
Description
技术领域
本发明涉及文旅产业治理技术领域,更具体的说是涉及一种宏观客流量预测方法与系统。
背景技术
随着社会的不断进步和人们生活水平的不断提高,越来越多的人踏入旅游这个休闲娱乐行业,游客人数呈井喷式增长,尤其是在旅游旺季,这对旅游景区及其附近酒店宾馆,周围交通等带来了前所未有的挑战。在文旅产业治理方面,精准掌握、预测城市宏观客流对于预防、预判节假日可能出来的客流高峰以及拥堵带来的城市负面影响尤其重要。
目前国内很多旅游景区已经开始逐步重视客流量的预测工作,但是由于信息化进步较晚,有记录的数据样本量少,对客流量的预测都是建立在主观的管理经验上面,没有一个清晰的数学模型,致使预测结果和实际值出现很大的偏差。
因此,如何实现客流量的宏观准确预测是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种宏观客流量预测方法与系统,综合考虑环境、天气、城市常住居民数量、旅游资源情况、区域消费指数CPI、季节时间等因素,通过建立一个深度学习网络,对历史客流等数据进行学习,构建出一个可预测城市客流量的方法和系统,帮助城市管理者和旅游从业者准确预测未来客流量,为城市规划和旅游资源开发提供辅助决策。
为了实现上述目的,本发明采用如下技术方案:
一种宏观客流量预测方法,包括以下步骤:
步骤1:采集旅游相关数据;
步骤2:对旅游相关数据进行预处理,获得模型训练数据;
步骤3:利用模型训练数据对线性回归模型依次进行训练和验证,生成宏观客流量预测模型;
步骤4:采集城市旅游相关数据,通过预处理获得待预测输入数据,将待预测输入数据输入宏观客流量预测模型,获得客流量预测结果。
优选的,旅游相关数据包括但不限于城市环境数据、天气数据、城市人口数据、旅游资源评价数据、季节时间数据、消费指数、人均收入和历史客流数据等;其中,城市环境数据包括各类污染物数据信息;天气数据包括温度、降雨量、风力等信息;旅游资源评价数据包括景点、酒店、餐饮服务等信息;季节时间数据包括春夏秋冬四季时间信息;历史客流数据包括历史客流量、客流趋势等信息;城市人口数据包括城市常住人口数量信息。
优选的,预处理包括数据清洗、数据归一化、特征选择、特征提取等,特征提取的具体方法如下:
根据空气中各类污染物数据信息并利用AQI模型计算AQI值,采用AQI值表示城市环境数据;
根据温度、降雨量和风力信息利用旅游指数计算公式计算TI值,采用TI值表示天气数据;
根据春夏秋冬四季时间信息将时间按天为颗粒度进行划分构建一维数组表示季节时间数据{D,F,DoF};
根据景点、酒店和餐饮服务信息中的景区资源指数和住宿资源指数计算旅游资源影响力评价指数IMI,采用IMI表示旅游资源评价数据;
将季节时间数据{D,F,DoF}、城市环境数据AQI、天气数据TI、城市人口数据Q、消费指数CPI、人均收入IC、旅游资源评价数据IMI和历史客流数据QoC以天为单位构建数据集,获得模型训练数据,表示为({D,F,DoF},AQI,TI,{Q,CPI,IC},IMI,QoC)。
优选的,线性回归模型表示为F(x)=Wx+b,其中,W为权重,x为输入数据,b为偏置,F(x)为客流量预测结果。
优选的,待预测输入数据表示为({D,F,DoF},AQI,TI,{Q,CPI,IC},IMI)。
优选的,对模型进行训练和验证的过程包括:
将模型训练数据划分为训练数据集和验证数据集;
采用启发式方法初始化线性回归模型的模型参数;
根据模型参数和训练数据集采用predict函数和loss函数计算损失值;
根据损失值采用gradients函数计算损失梯度;
根据损失梯度更新模型参数,获得预测模型;
采用验证数据集对预测模型进行验证,获得宏观客流量预测模型。
优选的,基于以上训练得到的(W,b)模型数据,使用另外一年的数据进行验收,并使用与训练过程中损失计算一致的算法评价模型效果,如果总体偏差度大于10%,则再次返回采用训练数据集执行训练的过程。
一种宏观客流量预测系统,包括数据集成模块、数据处理模块、数据训练与模型验证模块、模型预测服务模块;其中,
数据集成模块,采集旅游相关数据;
数据处理模块,对旅游相关数据进行预处理,获得模型训练数据;
数据训练与模型验证模块,利用模型训练数据对线性回归模型依次进行训练和验证,生成宏观客流量预测模型;
模型预测服务模块,采集城市旅游相关数据,通过预处理获得待预测输入数据,将待预测输入数据输入宏观客流量预测模型,获得客流量预测结果。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种宏观客流量预测方法与系统,综合考虑城市环境、天气、城市人口数据、旅游资源评价、季节时间、历史客流等因素,建立一个深度学习网络,对历史客流等数据进行学习构建出一个可预测城市客流量的模型,在文旅产业治理方面,通过预测模型精准掌握、预测城市宏观客流,这对于预防、预判节假日可能出来的客流高峰以及拥堵带来的城市负面影响尤其重要,该方法和系统应用广泛,可以帮助城市管理者和旅游从业者准确预测未来客流量,有助于城市规划和旅游资源开发。另外,本发明提出了对影响客流数据的各类因素进行降维、量化的方法,使模型的训练更加高效快速;提出了旅游资源影响力评价方法,对一个城市的旅游资源整体进行指数模型化计算获得旅游资源影响力评价指数IMI,使旅游资源评价数据以一个量化的数据体现其吸引力和影响力;将城市人口数据、消费指数、人均收入作为出游意愿的评估数据,充分考虑到了本地人口出行、收入和消费水平对近距离出游带来的影响;通过线性回归算法,历史数据交叉训练验证,得到一个更加客观、准确的模型,可拟合一些非常规类事件带来的客流异动造成的模型偏差,同样可以以较少量的数据,得到一个较好的预测模型。
本发明通过实时监测和分析,对模型进行不断修正和优化,以提高预测准确性和实用性,还可以根据不同的城市和旅游地点进行定制,以适应各种不同的场景和需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的宏观客流量预测方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本发明实施例公开了一种宏观客流量预测方法,如图1所示,包括以下步骤:
S1:数据采集;
收集城市环境数据、天气数据、城市人口数据、旅游资源评价数据、季节时间数据以及历史客流数据等,采集的数据需要具有代表性和可靠性,以保证后续的预测分析准确性;
S2:数据处理和预处理;
对采集到的数据进行处理和预处理,包括数据清洗、数据归一化、特征选择、特征提取等;其中,通过特征选择选取中具有代表性的数据,通过数据清洗将采集的离散数据中的异常点删除,通过特征提取和数据归一化处理将采集的数据进行计算映射为一个表示数值;特征选择和特征提取是建立客流预测模型的关键步骤,需要挖掘出数据中的重要特征,并将其转化为可用的预测指标;
S3:模型建立;
采用机器学习、数据挖掘等技术,选择线性回归算法建立宏观客流量预测模型,模型需要综合考虑多种因素,包括历史客流趋势、环境、天气、季节、城市人口数量、旅游资源评价、消费指数和人均收入等因素,同时,还需要对模型进行调参和优化,以提高预测准确性和实用性;
S4:预测分析;
基于建立的宏观客流量预测模型,对未来客流进行预测分析;预测分析需要结合环境、天气、季节、城市人口数量、旅游资源评价、消费指数和人均收入等因素,以得出更加准确的客流预测结果,以便城市管理者和旅游从业者进行参考和决策。
S5:监测和优化;
通过实时监测和分析,将实时产生的数据作为新的历史数据,周期性对模型使用新历史数据进行再训练,生成新模型,以实现预测效果的修正和优化。
进一步的,城市环境数据,使用AQI(空气质量指数)表示,为各地环境保护局监测到的空气中各类污染物的含量通过AQI模型计算后得到的一个数值,以天为单位,使用AQI可以将多种环境数据通过AQI模型进行降维,降低模型复杂度;AQI的分数范围从0到500,其中0表示空气质量优秀,500表示空气质量非常差,AQI分数越高,空气质量越差,对健康的影响也越大,当AQI超过100时,敏感人群可能会感到不适,而当AQI超过300时,所有人都可能受到不利影响;AQI的计算过程是将监测到的每种污染物的浓度与代入相应的AQI模型计算得到的数值相比较,选择最高的得分作为整个AQI的得分,每个污染物的浓度和AQI模型如下:
AQI臭氧:MAX(臭氧1小时平均值,AQI=100*(1小时平均值/0.125ppm)^1.3);
AQI二氧化硫:MAX(24小时平均值,AQI=100*(24小时平均值/0.03ppm)^0.5)
AQI二氧化氮:MAX(1小时平均值,AQI=100 *(1小时平均值/0.053ppm)^1.5)
AQI一氧化碳:MAX(8小时平均值,AQI=100*(8小时平均值/9ppm)^0.5)
AQIPM2.5、AQIPM10:MAX(24小时平均值,AQI=100*(24小时平均值/35ug/m3)^0.5)。
进一步的,天气数据包括温度、湿度、风向、风力、太阳照射强度等相关数据,统一通过旅游指数计算公式转换为1-5的值TI,越低越适宜出行,越高越不适宜出行;旅游指数TI的计算公式为:
其中,N为总云量(10分制),T为日平均气温(℃),TM为日最高气温(℃),V为日平均风速(m/s),UVIG为紫外线指数等级,R为日降水量(mm),并且令R≥25.0mm时,TI=0。
进一步的,根据旅游指数计算公式对天气数据进行计算获得TI值,旅游指数是气象部门根据天气的变化情况,结合气温、风速和具体的天气现象,从天气的角度出发给市民提供的出游建议;一般天气晴好,温度适宜的情况下最适宜出游;而酷热或严寒的天气条件下,则不适宜外出旅游;旅游指数还综合了体感指数、穿衣指数、感冒指数、紫外线指数等生活气象指数,给市民提供更加详细实用的出游提示;旅游指数分为5级,级数越高,越不适应旅游,如下表1所示。
表1旅游指数说明
等级 | 级别内涵 | 指数范围 | 服务提示 |
1级 | 适宜 | >7.0 | 天气极好,您可以尽情地享受大自然的无限风光 |
2级 | 较适宜 | 5.0~7.0 | 在…时段,建议您(针对(闷热)|(雷雨)|(风大)|(干燥)等不利条件编辑出变化的防护措施) |
3级 | 不太适宜 | 30~5.0 | 尽量减少外出,一定要外出旅游者,在…时段,建议您(针对(闷热)|(雷雨)|(风大)|(干燥)等不利条件编辑出变化的防护措施) |
4级 | 不适宜 | ≤3.0 | 建议减少出游 |
进一步的,季节时间数据{D,F,DoF},将时间按天为颗粒度进行划分,取值为1-365,分别表示一年中的365天,用D表示每年的第D天,D为一个一维数组;F表示周末或节假日,0表示工作日,如果为周末,则表示全年第F周的周末;DoF通过1、2表示周末的周六或周日。
进一步的,表示旅游资源评价数据的旅游资源影响力评价指数IMI,体现城市文化旅游资源及其配套设施情况,景区0-5A分别增加景区资源指数0-5分(S),酒店0-5星分别增加住宿指数0-5分(H),公式S*0.6+H*0.4所得即为旅游资源影响力评价指数IMI。
进一步的,城市人口数据包括城市常住人口数量,根据城市常住人口数量Q、当地物价指数CPI、人均收入水平IC综合评价得到出游意愿{Q,CPI,IC},三组数据在模型中对应三个权重。
进一步的,采用F(x)=Wx+b线性回归算法,其中,W为权重,x为输入数据,b为偏置,F(x)为客流数据;
使用至少3年的数据对模型进行训练,具体为使用任意两年数据训练,剩余1年数据验证的策略,分别为第1、2年训练和第3年数据验证,第2、3年数据用于训练和第1年数据进行验证,第3,1年数据进行训练和第2年数据进行验证,当历史数据比较多时,可采用同样策略,最后将三次训练的输出模型(W,b)进行均值处理形成最终模型M(W,b);
初始化模型参数weights= random_values,bias=random_values,或者使用启发式方法初始化;定义学习率和迭代次数learning_rate=0.01,iterations=1000;迭代训练过程predict函数根据输入的模型参数(weights和bias)和训练数据计算预测值;calculate_loss函数根据预测值和实际值计算损失;calculate_gradients函数根据损失计算梯度;这些函数的具体实现方式取决于所使用的模型和库;predictions=weights*input_data+bias,其中,weights是模型的权重参数,bias是模型的偏置参数,input_data是输入的自变量数据,函数将输入数据与模型参数进行线性运算,得到预测值并返回;calculate_loss函数遍历每个样本,计算预测值与实际值之间的平方误差,然后将所有样本的误差平均得到损失函数的值;gradients函数首先将梯度初始化为0,然后遍历每个权重参数,计算其对损失函数的偏导数,最后计算偏置参数对损失函数的偏导数。返回的梯度列表中,第一个元素是第一个权重参数的梯度,第二个元素是第二个权重参数的梯度,以此类推,最后一个元素是偏置参数的梯度。
实施例2
基于上述实施例,在一个具体实施方式中,一种宏观客流量预测系统包括:数据集成模块、数据处理模块、数据训练与模型验证模块、模型预测服务模块;
数据集成模块,收集城市环境数据、天气数据、城市人口数据、旅游资源评价数据、季节时间数据、消费指数、人均收入以及历史客流数据等。
数据处理模块,对上述采集数据进行处理和分析,包括数据清洗、数据预处理、数据可视化等,以便后续的模型建立和预测分析;
数据训练与模型验证模块,采用机器学习、数据挖掘等技术,建立客流预测模型,模型需要综合考虑多种因素,包括历史客流趋势、环境、天气、季节、城市人口数量、旅游资源评价、消费指数和人均收入等因素,同时,还需要对模型进行调参和优化,以提高预测准确性和实用性;基于建立的客流预测模型,对未来客流进行预测分析,以得出更加准确的客流预测结果。通过实时监测和分析,将实时产生的数据作为新的历史数据,周期性对模型使用新历史数据进行再训练,生成新模型,以实现预测效果的修正和优化。
模型预测服务模块,通过输入未来几天的({D,F,DoF},AQI,TI,{Q,CPI,IC},IMI),通过Wx+b输出预客流测值F。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种宏观客流量预测方法,其特征在于,包括以下步骤:
步骤1:采集旅游相关数据;
步骤2:对旅游相关数据进行预处理,获得模型训练数据;
步骤3:利用模型训练数据对线性回归模型依次进行训练和验证,生成宏观客流量预测模型;
步骤4:采集城市旅游相关数据,通过预处理获得待预测输入数据,将待预测输入数据输入宏观客流量预测模型,获得客流量预测结果。
2.根据权利要求1所述的一种宏观客流量预测方法,其特征在于,旅游相关数据包括城市环境数据、天气数据、城市人口数据、旅游资源评价数据、季节时间数据、消费指数、人均收入和历史客流数据;其中,城市环境数据包括各类污染物数据信息;天气数据包括温度、降雨量和风力信息;旅游资源评价数据包括景点、酒店和餐饮服务信息;季节时间数据包括春夏秋冬四季时间信息;历史客流数据包括历史客流量和客流趋势信息。
3.根据权利要求2所述的一种宏观客流量预测方法,其特征在于,预处理包括数据清洗、数据归一化、特征选择和特征提取,特征提取的具体方法如下:
根据空气中各类污染物数据信息利用AQI模型计算AQI值,采用AQI值表示城市环境数据;
根据温度、降雨量和风力信息利用旅游指数计算公式计算TI值,采用TI值表示天气数据;
根据春夏秋冬四季时间信息将时间按天为颗粒度进行划分构建一维数组表示季节时间数据{D,F,DoF};
根据景点、酒店和餐饮服务信息中的景区资源指数和住宿资源指数计算旅游资源影响力评价指数IMI,采用IMI表示旅游资源评价数据;
将季节时间数据{D,F,DoF}、城市环境数据AQI、天气数据TI、城市人口数据Q、消费指数CPI、人均收入IC、旅游资源评价数据IMI和历史客流数据QoC以天为单位构建数据集,获得模型训练数据,表示为({D,F,DoF},AQI,TI,{Q,CPI,IC},IMI,QoC)。
4.根据权利要求1所述的一种宏观客流量预测方法,其特征在于,线性回归模型表示为F(x)=Wx+b,其中,W为权重,x为输入数据,b为偏置,F(x)为客流量预测结果。
5.根据权利要求3所述的一种宏观客流量预测方法,其特征在于,待预测输入数据表示为({D,F,DoF},AQI,TI,{Q,CPI,IC},IMI)。
6.根据权利要求2所述的一种宏观客流量预测方法,其特征在于,对模型进行训练和验证的过程包括:
将模型训练数据划分为训练数据集和验证数据集;
采用启发式方法初始化线性回归模型的模型参数;
根据模型参数和训练数据集采用predict函数和loss函数计算损失值;
根据损失值采用gradients函数计算损失梯度;
根据损失梯度更新模型参数,获得预测模型;
采用验证数据集对预测模型进行验证,获得宏观客流量预测模型。
7.一种宏观客流量预测系统,其特征在于,采用权利要求1-6任一项所述的一种宏观客流量预测方法,包括数据集成模块、数据处理模块、数据训练与模型验证模块、模型预测服务模块;其中,
数据集成模块,采集旅游相关数据;
数据处理模块,对旅游相关数据进行预处理,获得模型训练数据;
数据训练与模型验证模块,利用模型训练数据对线性回归模型依次进行训练和验证,生成宏观客流量预测模型;
模型预测服务模块,采集城市旅游相关数据,通过预处理获得待预测输入数据,将待预测输入数据输入宏观客流量预测模型,获得客流量预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311775542.1A CN117455079A (zh) | 2023-12-22 | 2023-12-22 | 一种宏观客流量预测方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311775542.1A CN117455079A (zh) | 2023-12-22 | 2023-12-22 | 一种宏观客流量预测方法与系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117455079A true CN117455079A (zh) | 2024-01-26 |
Family
ID=89580213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311775542.1A Pending CN117455079A (zh) | 2023-12-22 | 2023-12-22 | 一种宏观客流量预测方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117455079A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443314A (zh) * | 2019-08-08 | 2019-11-12 | 中国工商银行股份有限公司 | 基于机器学习的景区客流量预测方法及装置 |
CN112330359A (zh) * | 2020-11-04 | 2021-02-05 | 上饶市中科院云计算中心大数据研究院 | 一种智慧旅游景区饱和度评价方法和装置 |
CN113222049A (zh) * | 2021-05-26 | 2021-08-06 | 中国石油天然气股份有限公司 | 一种特殊螺纹上扣扭矩的分类识别方法及识别设备 |
CN114202103A (zh) * | 2021-11-17 | 2022-03-18 | 浙江桢数科技有限公司 | 一种基于机器学习的节假日景区客流预测方法 |
-
2023
- 2023-12-22 CN CN202311775542.1A patent/CN117455079A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443314A (zh) * | 2019-08-08 | 2019-11-12 | 中国工商银行股份有限公司 | 基于机器学习的景区客流量预测方法及装置 |
CN112330359A (zh) * | 2020-11-04 | 2021-02-05 | 上饶市中科院云计算中心大数据研究院 | 一种智慧旅游景区饱和度评价方法和装置 |
CN113222049A (zh) * | 2021-05-26 | 2021-08-06 | 中国石油天然气股份有限公司 | 一种特殊螺纹上扣扭矩的分类识别方法及识别设备 |
CN114202103A (zh) * | 2021-11-17 | 2022-03-18 | 浙江桢数科技有限公司 | 一种基于机器学习的节假日景区客流预测方法 |
Non-Patent Citations (1)
Title |
---|
钟栎娜,邹统钎,王成慧: "《旅游目的地城市大数据发展报告 2019》", 31 August 2020, 北京:旅游教育出版社, pages: 6 - 14 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108701274B (zh) | 一种城市小尺度空气质量指数预测方法与系统 | |
CN111815037B (zh) | 一种基于注意力机制的可解释性短临极端降雨预测方法 | |
CN108446470B (zh) | 基于车辆轨迹数据和人口分布的医疗设施可达性分析方法 | |
CN110782093B (zh) | 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统 | |
CN108280789B (zh) | 一种精细时空尺度二氧化碳排放要素间影响的空间分析方法 | |
Gao et al. | Assessing neighborhood air pollution exposure and its relationship with the urban form | |
Jalalkamali | Using of hybrid fuzzy models to predict spatiotemporal groundwater quality parameters | |
CN111613054B (zh) | 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 | |
CN110378520A (zh) | 一种pm2.5浓度预测和预警方法 | |
CN107884511A (zh) | 用于预测室内空气质量的设备和方法 | |
CN113496314B (zh) | 一种神经网络模型预测道路交通流量的方法 | |
CN109685249A (zh) | 基于AutoEncoder和BiLSTM融合神经网络的空气PM2.5浓度预测方法 | |
CN111489015A (zh) | 基于多种模型对比和优化的大气o3浓度预测方法 | |
Kazemi-Beydokhti et al. | Determination of the physical domain for air quality monitoring stations using the ANP-OWA method in GIS | |
CN110889092A (zh) | 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法 | |
CN108596664B (zh) | 一种电子车票的单边交易费用确定方法、系统及装置 | |
CN112579922A (zh) | 一种基于用户轨迹的兴趣点推荐方法 | |
CN113836808A (zh) | 一种基于重污染特征约束的pm2.5深度学习预测方法 | |
CN113011455A (zh) | 一种空气质量预测svm模型构建方法 | |
Ordieres-Meré et al. | Predicting ground level ozone in Marrakesh by machine-learning techniques | |
CN114139719A (zh) | 一种基于机器学习的多源人为热时空量化方法 | |
CN111897810B (zh) | 建立定量化不同尺度区域间大气污染联防联控方案的方法 | |
CN117455079A (zh) | 一种宏观客流量预测方法与系统 | |
KR102526361B1 (ko) | 지역단위의 폭염 및 한파에 대한 지표면효과 분석 시스템 및 방법 | |
CN116776263A (zh) | 基于数据驱动的街区尺度建筑高能耗异常检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |