CN113807556A - 一种旅游指标预测方法、装置、设备及介质 - Google Patents

一种旅游指标预测方法、装置、设备及介质 Download PDF

Info

Publication number
CN113807556A
CN113807556A CN202010541246.5A CN202010541246A CN113807556A CN 113807556 A CN113807556 A CN 113807556A CN 202010541246 A CN202010541246 A CN 202010541246A CN 113807556 A CN113807556 A CN 113807556A
Authority
CN
China
Prior art keywords
travel
index
target
sample
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010541246.5A
Other languages
English (en)
Other versions
CN113807556B (zh
Inventor
王小正
陈维强
孙永良
于涛
王玮
李建伟
葛通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense TransTech Co Ltd
Original Assignee
Hisense TransTech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense TransTech Co Ltd filed Critical Hisense TransTech Co Ltd
Priority to CN202010541246.5A priority Critical patent/CN113807556B/zh
Publication of CN113807556A publication Critical patent/CN113807556A/zh
Application granted granted Critical
Publication of CN113807556B publication Critical patent/CN113807556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种旅游指标预测方法、装置、设备及介质,用以解决现有预测旅游指标的方法预测的旅游指标的精确度和稳定性不高的问题。由于本发明实施例通过预先训练完成的残差预测模型,基于获取的关联数据序列,获取预测的目标旅游地的残差,其中,该关联数据序列中包含的每维元素为目标旅游地设定第一时间长度的旅游指标的关联数据,后续根据该残差以及预测的目标旅游地的旅游指标,从而确定目标旅游地的目标旅游指标,使确定的目标旅游指标可以充分考虑关联数据对旅游指标的影响,从而提高确定的预测的目标旅游指标的准确性。

Description

一种旅游指标预测方法、装置、设备及介质
技术领域
本发明涉及计算机数据处理与分析领域,尤其涉及一种旅游指标预测方法、装置、设备及介质。
背景技术
近几年,伴随着经济的增长,消费者的旅游需求得到释放且呈现巨大的增长趋势,特别是法定节假日的实施使得旅游市场潜力巨大。然而,受突发事件、随机因素以及季节性等因素的影响使得旅游相关部门在做决策时,可能会面临双重的困境。首先,在旅游旺季,短时间内客流急增,这将导致客运匮乏,景区人流和交通过度拥堵,景区承载力也会因此面临严重考验,其直接后果是游客体验大打折扣,同时也给景区的生态环境造成巨大的压力。其次,旅游淡季的来临使得客流骤减,这将导致大量航班座位空缺,酒店客房闲置,景区客数据严重不足,造成不必要的资源浪费。因此,准确预测未来的旅游指标,可以辅助城市相关产业规划和配套设施建设,对旅游景区的安全风险进行预警,对旅游各个部门的科学决策至关重要。
现有技术中,进行旅游指标预测的方法包括如下几种方式:
方式一:将旅游景区的历史游客指标数据及其对应的关联数据融合,其中关联数据包括最高气温、最低气温、天气、风向、风力、工作日情况中至少一种;将关联数据、历史游客数据输入学习器中进行训练实现游客数据预测。
方式二:通过采集商场客流、周围天气以及营销活动信息,并将上述信息作为旅游指标的关联数据进行统计和分析,然后通过运用深度神经网络准确预测出下一时段或者下一天的客流,从而针对客流过多的情况进行预防。
方式三:根据百度指数的数据构建网络搜索指数,将网络搜索指数和时间序列数据作为旅游指标的关联数据输入极限学习机(KELM)来预测旅游指标。
对于上述的方法可知,现有预测旅游指标的方法一般都是采用模型进行预测的,但这些用于旅游指标预测的模型预测的旅游指标精确度和稳定性不高。
发明内容
本发明实施例提供了一种旅游指标预测方法、装置、设备及介质,用以解决现有预测旅游指标的方法预测的旅游指标的精确度和稳定性不高的问题。
本发明实施例提供了一种旅游指标预测方法,所述方法包括:
获取目标旅游地的历史旅游指标序列,以及历史旅游指标的关联数据序列,所述历史旅游指标序列中包含的每维元素为所述目标旅游地设定第一时间长度的历史旅游指标,所述关联数据序列中包含的每维元素为所述目标旅游地所述设定第一时间长度的历史旅游指标的关联数据;
通过预先训练完成的旅游指标预测模型,基于所述历史旅游指标序列,获取预测的所述目标旅游地的旅游指标;并
通过预先训练完成的残差预测模型,基于所述关联数据序列,获取预测的所述目标旅游地的残差;
根据所述旅游指标以及所述残差,确定所述目标旅游地的目标旅游指标。
进一步地,所述旅游指标预测模型通过如下方式训练:
获取所述目标旅游地的样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标;
通过原始旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
根据所述样本旅游指标以及所述识别旅游指标,对所述原始旅游指标预测模型进行训练。
进一步地,当获取到训练完成的旅游指标预测模型之后,所述残差预测模型通过如下方式训练:
获取所述样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标及样本关联数据序列;
通过预先训练完成的旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
确定所述样本旅游指标与所述识别旅游指标之间的样本残差;
通过原始残差预测模型,基于所述样本关联数据序列,获取预测的所述目标旅游地的识别残差;
根据所述识别残差以及所述样本残差,对所述原始残差预测模型进行训练。
进一步地,所述关联数据包括所述目标旅游地的居民消费价格指数、所述目标旅游地的国内生产总值、所述目标旅游地的关键词对应的搜索量、全国居民消费价格指数、全国的国内生产总值、月份中的至少一种。
进一步地,所述目标旅游地的关键词通过如下方式确定:
获取所述目标旅游地的任一旅游核心关键词在所述设定第一时间长度对应的搜索量,以及对应的历史旅游指标;
针对设定阶数滞后期中的每一阶滞后期,获取所述旅游核心关键词在该阶滞后期的所述设定第一时间长度的搜索量;
分别确定每个所述搜索量与所述对应的历史旅游指标的相关系数;
若每个所述相关系数均大于设定相关阈值,则将所述旅游核心关键词作为所述目标旅游地的关键词。
进一步地,确定所述目标旅游地的关键词对应的搜索量,包括:
针对所述目标旅游地的任一关键词,根据该关键词对应的目标滞后期阶数,及滞后期阶数与滞后时间段的对应关系,确定该关键词对应的目标滞后时间段,根据待预测的旅游指标所对应的时间段,以及所述目标滞后时间段,确定搜索量提取时间段,获取所述提取时间段该关键词的搜索量。
本发明实施例还提供了一种旅游指标预测装置,所述装置包括:
获取单元,用于获取目标旅游地的历史旅游指标序列,以及历史旅游指标的关联数据序列,所述历史旅游指标序列中包含的每维元素为所述目标旅游地设定第一时间长度的历史旅游指标,所述关联数据序列中包含的每维元素为所述目标旅游地所述设定第一时间长度的历史旅游指标的关联数据;
第一处理单元,用于通过预先训练完成的旅游指标预测模型,基于所述历史旅游指标序列,获取预测的所述目标旅游地的旅游指标;并
第二处理单元,用于通过预先训练完成的残差预测模型,基于所述关联数据序列,获取预测的所述目标旅游地的残差;
确定单元,用于根据所述旅游指标以及所述残差,确定所述目标旅游地的目标旅游指标。
进一步地,所述旅游指标预测模型通过如下方式训练:
获取所述目标旅游地的样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标;
通过原始旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
根据所述样本旅游指标以及所述识别旅游指标,对所述原始旅游指标预测模型进行训练。
进一步地,当获取到训练完成的旅游指标预测模型之后,所述残差预测模型通过如下方式训练:
获取所述样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标及样本关联数据序列;
通过预先训练完成的旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
确定所述样本旅游指标与所述识别旅游指标之间的样本残差;
通过原始残差预测模型,基于所述样本关联数据序列,获取预测的所述目标旅游地的识别残差;
根据所述识别残差以及所述样本残差,对所述原始残差预测模型进行训练。
进一步地,若所述关联数据包括所述目标旅游地的关键词对应的搜索量,所述获取单元,还用于获取所述目标旅游地的任一旅游核心关键词在所述设定第一时间长度对应的搜索量,以及对应的历史旅游指标;针对设定阶数滞后期中的每一阶滞后期,获取所述旅游核心关键词在该阶滞后期的所述设定第一时间长度的搜索量;分别确定每个所述搜索量与所述对应的历史旅游指标的相关系数;若每个所述相关系数均大于设定相关阈值,则将所述旅游核心关键词作为所述目标旅游地的关键词。
进一步地,所述获取单元,还用于针对所述目标旅游地的任一关键词,根据该关键词对应的目标滞后期阶数,及滞后期阶数与滞后时间段的对应关系,确定该关键词对应的目标滞后时间段,根据待预测的旅游指标所对应的时间段,以及所述目标滞后时间段,确定搜索量提取时间段,获取所述提取时间段该关键词的搜索量。
本发明实施例还提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现根据上述任一所述旅游指标预测方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现根据上述任一所述旅游指标预测方法的步骤。
由于本发明实施例通过预先训练完成的残差预测模型,基于获取的关联数据序列,获取预测的目标旅游地的残差,其中,该关联数据序列中包含的每维元素为目标旅游地设定第一时间长度的旅游指标的关联数据,后续根据该残差以及预测的目标旅游地的旅游指标,从而确定目标旅游地的目标旅游指标,使确定的目标旅游指标可以充分考虑关联数据对旅游指标的影响,从而提高确定的预测的目标旅游指标的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种旅游指标预测过程图;
图2为本发明实施例提供的一种对ARIMA模型进行训练的过程示意图;
图3为本发明实施例提供的对该XGBOOST模型进行训练的过程示意图;
图4为本发明实施例提供的具体的训练旅游指标预测模型和残差预测模型流程示意图;
图5为本发明实施例提供的具体应用上述ARIMA模型和XGBOOST模型预测旅游指标时的误差率分布;
图6为本发明实施例提供的各种关联数据对旅游指标的重要性示意图;
图7为本发明实施例提供的一种旅游指标预测装置结构示意图;
图8为本发明实施例提供的一种电子设备结构示意图。
具体实施方式
为了提高预测的旅游指标的精确度和稳定性,本发明实施例提供了一种旅游指标预测方法、装置、设备及介质。
下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例1:
图1为本发明实施例提供的一种旅游指标预测过程图,如图1所示,所述流程包括:
S101:获取目标旅游地的历史旅游指标序列,以及历史旅游指标的关联数据序列,所述历史旅游指标序列中包含的每维元素为所述目标旅游地设定第一时间长度的历史旅游指标,所述关联数据序列中包含的每维元素为所述目标旅游地所述设定第一时间长度的历史旅游指标的关联数据。
本发明实施例提供的旅游指标预测方法应用于电子设备,该电子设备可以是智能设备,比如,智能电脑等,也可以是服务器。
本发明实施例中目标旅游地可以是具体的某一个景点,比如崂山、故宫等,也可以是省、市、区等,比如,山东省、青岛市等。该目标旅游地的旅游指标为该目标旅游地的旅游人数,或,为目标旅游地的旅游收入等。
在实际应用场景中,一般旅游地在未来的时间段内的旅游指标,不仅受该旅游地之前的旅游指标的影响,有时还会受社会经济等因素的影响,比如,人们一般会希望去比较繁华的旅游地旅游,或者,去最近在急速发展的旅游地旅游。因此,在本发明实施例中,为了提高预测的旅游指标的精确度和稳定性,在对目标旅游地未来的时间段内的旅游指标进行预测之前,工作人员预先收集目标旅游地在过去连续预设数量的设定第一时间长度的历史旅游指标,以及目标旅游地在过去连续预设数量的设定第一时间长度的历史旅游指标的关联数据。
比如,预测青岛市的7月的旅游人数,预设数量为6,设定第一时间长度为1个月,则工作人员可以从统计局、经济数据库等网站,预先收集青岛市在过去连续6个月中每月的历史旅游人数,并从统计年鉴、百度指数等网站收集青岛市过去连续6个月中每月的历史旅游人数的关联数据。
电子设备从预先收集的目标旅游地在过去连续预设数量的设定第一时间长度的历史旅游指标,获取预测旅游指标所需的连续数量的每个设定第一时间长度的历史旅游指标,将每个历史旅游指标按照时间顺序,组合生成历史旅游指标序列;并从预先收集的目标旅游地在过去连续预设数量的设定第一时间长度的历史旅游指标的关联数据中,获取预测旅游指标所需的每个设定第一时间长度的关联数据,将每个关联数据按照预设的组合顺序,组合生成关联数据序列。比如,获取预测8月的旅游人数所需的过去连续7个每月的历史旅游人数,则按照时间顺序从早到晚的顺序,组合生成历史旅游指标序列。
电子设备基于本发明实施例提供的旅游指标预测方法,对该历史旅游指标序列以及历史旅游指标的关联数据序列进行相应的处理。
S102:通过预先训练完成的旅游指标预测模型,基于所述历史旅游指标序列,获取预测的所述目标旅游地的旅游指标。
为了获取预测的旅游指标,在本发明实施例中,预先训练有旅游指标预测模型,比如,ARIMA模型。当基于上述实施例获取到目标旅游地的历史旅游指标序列之后,基于预先训练完成的旅游指标预测模型,对该历史旅游指标序列进行相应的处理,从而获取预测的目标旅游地的旅游指标。
其中,该旅游指标为预测的目标旅游地设定第一时间长度的旅游指标。比如,设定第一时间长度为1个月,通过预先训练完成的旅游指标预测模型,获取的旅游指标为30000,即说明在目标旅游地未来的一个月的旅游指标可能为30000;设定第一时间长度为1周,通过预先训练完成的旅游指标预测模型,获取的旅游指标为4300,即说明在目标旅游地未来的一周的旅游指标为4300。
需要说明的是,该历史旅游指标序列的维数,与对旅游指标预测模型训练时输入的序列的维数相同。
S103:通过预先训练完成的残差预测模型,基于所述关联数据序列,获取预测的所述目标旅游地的残差。
由于在实际应用场景中,社会经济等因素会影响目标旅游地的旅游指标。因此,为了提高预测的旅游指标的精确度和稳定性,在本发明实施例中,预先训练有残差预测模型,比如,XGBOOST模型等。当进行上述的S102中的步骤的同时,即通过预先训练完成的旅游指标预测模型,基于目标旅游地的历史旅游指标序列,获取预测的目标旅游地的旅游指标的同时,还基于预先训练完成的残差预测模型,对目标旅游地的关联数据序列进行相应的处理,从而获取预测的目标旅游地的残差。
其中,该残差为预测的目标旅游地设定第一时间长度的残差。比如,设定第一时间长度为1个月,通过预先训练完成的残差预测模型,获取的残差为300,即说明目标旅游地在预测的未来的第一个月的旅游指标与其对应的真实的旅游指标的残差为300;设定第一时间长度为1周,通过预先训练完成的残差预测模型,获取的残差为300,即说明目标旅游地在预测的未来的一周的旅游指标与其对应的真实的旅游指标的残差为300。
需要说明的是,该关联数据序列的维数,与对残差预测模型训练时输入的序列的维数相同。
S104:根据所述旅游指标以及所述残差,确定所述目标旅游地的目标旅游指标。
为了提高预测的旅游指标的精确度和稳定性,在本发明实施例中,当获取到旅游指标以及残差之后,进行相应的处理,比如,相加,从而确定目标旅游地的目标旅游指标。
其中,该目标旅游指标为预测的目标旅游地设定第一时间长度的目标旅游指标。例如,旅游指标为旅游收入,目标旅游地为崂山,设定第一时间长度为1个月,基于上述S102的步骤获取到崂山的旅游指标38000,并基于上述S103的步骤获取到崂山的残差-8000之后,将该旅游指标38000与残差-8000相加,确定崂山的目标旅游指标为30000,即说明崂山在未来的一个月的目标旅游收入为30000。
由于本发明实施例通过预先训练完成的残差预测模型,基于获取的关联数据序列,获取预测的目标旅游地的残差,其中,该关联数据序列中包含的每维元素为目标旅游地设定第一时间长度的旅游指标的关联数据,后续根据该残差以及预测的目标旅游地的旅游指标,从而确定目标旅游地的目标旅游指标,使确定的目标旅游指标可以充分考虑关联数据对旅游指标的影响,从而提高确定的预测的目标旅游指标的准确性。
实施例2:
为了获取预测的目标旅游地的旅游指标,在上述实施例的基础上,在本发明实施例中,所述旅游指标预测模型通过如下方式训练:
获取所述目标旅游地的样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标;
通过原始旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
根据所述样本旅游指标以及所述识别旅游指标,对所述原始旅游指标预测模型进行训练。
为了获取预测的目标旅游地的旅游指标,需要根据预先收集的目标旅游地的样本集中的历史样本旅游指标序列,对旅游指标预测模型进行训练。其中,目标旅游地的样本集中的历史样本旅游指标序列对应有目标旅游地的样本旅游指标。
需要说明的是,该历史样本旅游指标序列的维数与上述实施例中的历史旅游指标序列的维数相同。该样本旅游指标为目标旅游地设定第一时间长度的真实旅游指标。
需要说明的是,一般情况下,进行模型训练的设备可以是在线的,也可以离线的,因此,该训练旅游指标预测模型的设备可以与后续旅游指标预测的电子设备可以相同,也可以不同。
通过原始旅游指标预测模型,基于上述的历史样本旅游指标序列,可以获得预测的目标旅游地的识别旅游指标。其中,该识别旅游指标为该原始旅游指标预测模型预测的目标旅游地在设定第一时间长度的旅游指标。
根据识别旅游指标以及样本旅游指标,对原始旅游指标预测模型进行训练,以调整原始旅游指标预测模型的各参数的参数值。
例如,设定第一长度为1个月,获取目标旅游地的样本集中的6-8月的历史样本旅游指标序列,该6-8月的历史样本旅游指标序列对应有目标旅游地的9月的样本旅游指标,通过原始旅游指标预测模型,基于6-8月的历史样本旅游指标序列,获取预测的目标旅游地的9月的识别旅游指标,根据9月的样本旅游指标以及9月的识别旅游指标,对原始旅游指标预测模型进行训练。
在具体实施过程中,用于旅游指标预测模型训练的目标旅游地的样本集中包含大量的历史样本旅游指标序列,对每个历史样本旅游指标序列都进行上述操作,当满足预设的收敛条件时,该旅游指标预测模型训练完成。
其中,满足预设的收敛条件可以为目标旅游地的样本集中的历史样本旅游指标序列通过该原始旅游指标预测模型训练后,得到的识别旅游指标与样本旅游指标的残差小于预设阈值的个数大于设定数量,或对原始旅游指标预测模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以灵活进行设置,在此不做具体限定。
作为一种可能的实施方式,在进行模型训练时,可以把目标旅游地的样本集中的历史样本旅游指标序列分为训练历史样本旅游指标序列和测试历史样本旅游指标序列,先基于训练历史样本旅游指标序列对原始旅游指标预测模型进行训练,再基于测试历史样本旅游指标序列对上述已训练的旅游指标预测模型的可靠程度进行验证。
下面以旅游指标预测模型为ARIMA模型为例,对该旅游指标预测模型的训练过程进行说明:
由于ARIMA(p,d,q)模型叫差分自回归移动平均模型,AR是自回归,p是自回归项,MA是移动平均,q为移动平均项,d为时间序列成为平稳时所需做的差分次数。ARIMA模型就是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。
具体的,图2为本发明实施例提供的一种对ARIMA模型进行训练的过程示意图,该过程包括:
首先,获取目标旅游地的样本集中的任一训练历史样本旅游指标序列,该训练历史样本旅游指标序列对应有该目标旅游地的样本旅游指标。
然后,将该训练历史样本旅游指标序列输入到ARIMA模型中,检验该训练历史样本旅游指标序列的平稳性,若该训练历史样本旅游指标序列为非平稳序列,则先对该训练历史样本旅游指标序列进行对数运算后,再进行差分运算,然后重新检验该训练历史样本旅游指标序列的平稳性;若该训练历史样本旅游指标序列为平稳序列,则进行白噪声检验。
其次,若该训练历史样本旅游指标序列为白噪声序列,则无法进行预测,分析结束。若该训练历史样本旅游指标序列为非白噪声序列,则对该训练历史样本旅游指标序列进行旅游指标的预测,获取预测的该目标旅游地的识别旅游指标。
最后,根据样本旅游指标以及该识别旅游指标,对所述原始ARIMA模型进行训练。
具体的,对样本集中的每个训练历史样本旅游指标序列执行上述的步骤。根据每个样本旅游指标以及对应的识别旅游指标的残差,对原始ARIMA模型的参数进行调整。当确定训练的ARIMA模型满足收敛条件时,再基于测试历史样本旅游指标序列对上述已训练的ARIMA模型的可靠程度进行检验,根据检验结果判断训练的ARIMA模型是否合格。若合格,则确定ARIMA模型训练完成,若不合格,则重新执行上述的训练步骤。
实施例3:
为了提高预测的旅游指标的精确度和稳定性,在上述各实施例的基础上,在本发明实施例中,当获取到训练完成的旅游指标预测模型之后,所述残差预测模型通过如下方式训练:
获取所述样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标及样本关联数据序列;
通过预先训练完成的旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
确定所述样本旅游指标与所述识别旅游指标之间的样本残差;
通过原始残差预测模型,基于所述样本关联数据序列,获取预测的所述目标旅游地的识别残差;
根据所述识别残差以及所述样本残差,对所述原始残差预测模型进行训练。
在实际应用过程中,预先训练完成的残差预测模型输出的残差,是对预先训练完成的旅游指标预测模型输出的旅游指标进行修正的。因此,为了提高预测的旅游指标的精确度和稳定性,在本发明实施例中,基于预先训练完成的旅游指标预测模型输出的结果、预先收集的目标旅游地的样本集中的历史样本旅游指标序列对应的样本关联数据序列,对残差预测模型进行训练。
需要说明的是,一般情况下,进行模型训练的设备可以是在线的,也可以离线的,因此,该训练残差预测模型的设备可以与后续旅游指标预测的电子设备相同,也可以不同。
具体实施过程中,当获取到预先训练完成的旅游指标预测模型之后,通过预先训练完成的旅游指标预测模型,基于目标旅游地的样本集中的任一历史样本旅游指标序列,获取预测的该目标旅游地的识别旅游指标。
其中,该历史样本旅游指标序列对应有目标旅游地的样本旅游指标以及样本关联数据序列。
由于在对残差预测模型进行训练的过程中,根据该残差预测模型输出的预测结果以及该预测结果对应的真实值,才能对该残差预测模型的各个参数值进行调整。因此,当基于上述实施例获取到识别旅游指标之后,确定该识别旅游指标与对应的样本旅游指标之间的样本残差。后续通过原始残差预测模型,基于上述历史样本旅游指标序列对应的样本关联数据序列,获取预测的目标旅游地的识别残差之后,根据该识别残差以及该样本残差,对原始残差预测模型进行训练,以调整原始残差预测模型的各参数的参数值。
用于残差预测模型训练的目标旅游地的样本集中包含大量的历史样本旅游指标序列,对每个历史样本旅游指标序列都进行上述操作,当满足预设的收敛条件时,该残差预测模型训练完成。
其中,满足预设的收敛条件可以为目标旅游地的样本集中的每个历史样本旅游指标序列对应的样本残差均通过该原始残差预测模型训练后,根据预设的损失函数、样本残差以及对应的得到的识别残差,确定的损失函数的值最小;或对原始残差预测模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以灵活进行设置,在此不做具体限定。
作为一种可能的实施方式,在进行模型训练时,可以把目标旅游地的样本集中的历史样本旅游指标序列分为训练历史样本旅游指标序列和测试历史样本旅游指标序列,先基于训练历史样本旅游指标序列对应的样本残差,对原始残差预测模型进行训练,再基于测试历史样本旅游指标序列对应的样本残差,对上述已训练的残差预测模型的可靠程度进行验证。
下面以残差预测模型为XGBOOST模型为例,对该残差预测模型的训练过程进行说明:
其中,XGBOOST模型由多棵决策树组成,在进行预测的过程中,是将每棵决策树预测的结果相加,即为XGBOOST模型预测的最终结果。
具体的,图3为本发明实施例提供的对该XGBOOST模型进行训练的过程示意图,该过程如下:
首先,获取该样本集中的任一历史样本旅游指标序列,该历史样本旅游指标序列对应有该目标旅游地的样本旅游指标及样本关联数据序列。
其次,通过预先训练完成的ARIMA模型,基于该历史样本旅游指标序列,获取预测的该目标旅游地的识别旅游指标。
复次,确定该样本旅游指标与该识别旅游指标之间的样本残差。
再次,通过原始XGBOOST模型,基于该样本关联数据序列,获取预测的该目标旅游地的识别残差;
最后,根据该识别残差以及该样本残差,对该原始XGBOOST模型进行训练。
其中,在根据识别残差以及样本残差,对该原始XGBOOST模型的参数进行调整时,可以采用梯度提升算法以及正则化项确定损失函数,从而对参数进行调整。具体的,采用梯度提升算法以及正则化项确定的损失函数可用如下公式表示:
Figure BDA0002538929910000151
其中,
Figure BDA0002538929910000152
为第
Figure BDA0002538929910000153
次训练获取的损失函数,n为获取的识别残差的数量,l(y′i,yi)是为第i个历史样本旅游指标序列对应的识别残差y′i与对应的样本残差yi之间的损失值,∑kΩ(fk)为正则化项,其定义了该XGBOOST模型的复杂程度,
Figure BDA0002538929910000155
γ和λ为人工根据实际训练结果设置的参数值,ω为该第k个决策树中包含的所有叶子节点的值形成的向量,T为该第k个决策树中包含的叶子节点数。
其中,采用XGBOOST模型作为残差预测模型,在进行训练时具有以下优点:
1、根据识别残差以及样本残差,对该原始XGBOOST模型的参数进行调整时,采用正则化项∑kΩ(fk),可以防止过拟合。
2、在确定损失函数的最小值时,使用了牛顿法,将损失函数泰勒展开到二阶,使确定的损失函数的最小值更精确,还可以自定义损失函数的最小值。另外损失函数中加入了正则化项。
3、XGBOOST模型在训练之前,预先对数据进行了排序,然后保存为block(块)结构,后面的迭代中重复地使用这个结构,显著减小计算量,从而可以并行优化在特征粒度上的特征值。
4、XGBOOST模型考虑了训练数据为稀疏值的情况,可以为缺失值或者指定的值指定分支的默认方向,从而极大提升算法的效率。
5、XGBOOST模型支持列抽样,不仅能降低过拟合,还能减少计算。
下表为本发明实施例提供的各种模型预测旅游指标的标准误差以及准确率。
模型 RMSE Accuracy
ARIMA 19 96.36%
GLM 137 73.34%
Random Forest 48 90.66%
SVM 92 82.10%
LSTM 28 94.55%
XGBOOST 18.35 96.43%
ARIMA+XGBOOST 5.33 98.96%
由上表可知,当基于ARIMA模型和XGBOOST模型一起预测旅游指标时,标准误差最小,且准确率最高,从而显著提高预测的旅游指标的准确度和稳定性。
图4为本发明实施例提供的具体的训练旅游指标预测模型和残差预测模型流程示意图,该流程包括:
S401:获取该目标旅游地的样本集中的任一历史样本旅游指标序列。
其中,该历史样本旅游指标序列对应有该目标旅游地的样本旅游指标。
S402:通过原始旅游指标预测模型,基于该历史样本旅游指标序列,获取预测的该目标旅游地的识别旅游指标。
S403:根据该样本旅游指标以及该识别旅游指标,对该原始旅游指标预测模型进行训练。
当获取到训练完成的旅游指标预测模型之后,基于该旅游指标预测模型对原始残差预测模型进行训练,具体步骤如下:
S404:获取该样本集中的任一历史样本旅游指标序列。
其中,该历史样本旅游指标序列还对应有样本关联数据序列。
S405:通过预先训练完成的旅游指标预测模型,基于该历史样本旅游指标序列,获取预测的该目标旅游地的识别旅游指标。
S406:确定该样本旅游指标与该识别旅游指标之间的样本残差。
S407:通过原始残差预测模型,基于该样本关联数据序列,获取预测的该目标旅游地的识别残差。
S408:根据该识别残差以及该样本残差,对该原始残差预测模型进行训练。
图5为本发明实施例提供的具体应用上述ARIMA模型和XGBOOST模型预测旅游指标时的误差率分布。参见图5可知,ARIMA模型和XGBOOST模型预测旅游指标时误差率非常的低,预测的旅游指标的准确度和稳定性都非常的高。
实施例4:
为了进一步提高预测的旅游指标的精确度和稳定性,在上述各实施例的基础上,在本发明实施例中,所述关联数据包括所述目标旅游地的居民消费价格指数、所述目标旅游地的国内生产总值、所述目标旅游地的关键词对应的搜索量、全国居民消费价格指数、全国的国内生产总值、月份中的至少一种。
在实际应用过程中,一般目标旅游地的社会经济情况会对该目标旅游地的旅游指标有较大的影响,比如,一般人们会去经济较为发达的地方旅游,对于经济较为贫瘠的地方则很少去旅游,因此,可以将目标旅游地的居民消费价格指数,和/或,目标旅游地的国内生产总值,作为关联数据。
在一种可能的实施方式中,国家的社会经济状况也会对目标旅游地的旅游指标有较大的影响。比如,国家的社会经济越好,说明人们的生活也越来越好,越来越多的人会考虑通过旅游放松自己,从而使目标旅游地的旅游指标变高。因此,还可以将全国居民消费价格指数,和/或,全国的国内生产总值,作为关联数据。
在另一种可能的实施方式中,当人们在希望去某个地方旅游的时候,一般会提前做好关于该旅游地的旅游攻略,上网了解该旅游地的相关信息,比如,景点、美食等,从而使该旅游地的一些旅游景点、美食、特产等关键词在网上的搜索量特别高。因此,可以将目标旅游地的关键词对应的搜索量,也作为关联数据。
此外,月份对目标旅游地的旅游指标也会有较大的影响,比如,对于有节假日的月份,人们一般会有外出旅游的计划,而对于没有节假日的月份,人们则不会外出旅游。因此,也可以将月份作为关联数据。
基于上述的情况,可以将上述的目标旅游地的居民消费价格指数、目标旅游地的国内生产总值、目标旅游地的关键词对应的搜索量、全国居民消费价格指数、全国的国内生产总值、月份中的至少一个作为关联数据,以便后续根据该关联数据预测目标旅游地的旅游指标。
图6为本发明实施例提供的各种关联数据对旅游指标的重要性示意图。其中,目标旅游地的关键词对应的搜索量对旅游指标的重要性最高,目标旅游地的居民消费价格指数以及目标旅游地的国内生产总值对旅游指标的重要性较高,全国居民消费价格指数以及全国的国内生产总值对旅游指标的重要性较低,但也有一定的影响。
当获取到上述的关联数据之后,为了保证后续预测的旅游指标的准确度和稳定性,工作人员可以对关联数据进行检查,将设定第一时间长度内缺失数据、或者出现异常的数据进行过滤,将保留下来的关联数据进行汇总,融合,比如将周度数据转化为月度数据等。
为了进一步提高预测的旅游指标的精确度和稳定性,所述目标旅游地的关键词通过如下方式确定:
获取所述目标旅游地的任一旅游核心关键词在所述设定第一时间长度对应的搜索量,以及对应的历史旅游指标;
针对设定阶数滞后期中的每一阶滞后期,获取所述旅游核心关键词在该阶滞后期的所述设定第一时间长度的搜索量;
分别确定每个所述搜索量与所述对应的历史旅游指标的相关系数;
若每个所述相关系数均大于设定相关阈值,则将所述旅游核心关键词作为所述目标旅游地的关键词。
由于关于目标旅游地的搜索词有很多,在这些搜索词中,并不是所有的搜索词都对目标旅游地的旅游指标有影响,如果将所有关于目标旅游地的搜索词均作为关联数据的话,则可能会影响预测的目标旅游地的旅游指标的精确度和稳定性,并增加预测旅游指标所需的计算量。因此,为了提高预测的旅游指标的精确度和稳定性,在本发明实施例中,可以将关于目标旅游地的搜索词中,与旅游的六要素相关的搜索词作为目标旅游地的旅游核心关键词,即将关于目标旅游地的搜索词中,与“吃”、“游”、“娱”、“购”、“住”、“行”这六要素相关的搜索词作为目标旅游地的旅游核心关键词,后续可以直接将该旅游核心关键词作为目标旅游地的关键词。
例如,对于“吃”要素,考虑关于目标旅游地的搜索词中与美食、特色小吃等相关的搜索词,比如“青岛美食”;对于“住”要素,考虑关于目标旅游地的搜索词中与宾馆、酒店以及住宿等相关的搜索词,比如“青岛住宿”、“青岛酒店”;对于“行”要素,考虑关于目标旅游地的搜索词中与地图、天气以及机场等相关的搜索词,比如“流亭机场”、“青岛地图”;对于“游”要素,考虑关于目标旅游地的搜索词中具有代表性的景区以及景点名称等相关的搜索词,比如“崂山”、“青岛栈桥”;对于“购”要素,考虑关于目标旅游地的搜索词中与特产、购物等相关的搜索词,比如“青岛特产”;对于“娱”要素,考虑关于目标旅游地的搜索词中与娱乐和休闲信息等相关的搜索词,比如“青岛休闲”、“青岛娱乐”。
为了进一步提高预测的旅游指标的精确度和稳定性,减少预测旅游指标所需的计算量,在本发明实施例中,可以对目标旅游地的旅游核心关键词进行进一步地筛选,将与目标旅游地的旅游指标相关性较高的旅游核心关键词,作为目标旅游地的关键词。具体的,工作人员与预先收集的目标旅游地的任一旅游核心关键词在设定第一时间长度对应的搜索量,以及对应的历史旅游指标。比如,设定第一时间长度为1个月,青岛的“崂山”在7月这1个月对应的搜素量为1200034。
由于人们一般在网上搜索目标旅游地的旅游核心关键词,是在去目标旅游地之前,因此,目标旅游地的旅游核心关键词对应的搜索量对目标旅游地的旅游指标的影响具有滞后性,比如,5月青岛的旅游核心关键词“崂山”的搜索量增长,则该青岛在6月份的旅游指标很可能也增长。
因此,在本发明实施例中,预先对滞后期设置有设定阶数,并预先保存有每相邻两阶对应的时间长度差,比如,若每相邻两阶的时间长度差为1个月,则1阶对应1个月,12阶对应12个月,6阶对应六个月;若每相邻两阶对应的时间长度差为1周,则1阶对应1周,12阶对应12周,6阶对应六周等。
当获取到目标旅游地的任一旅游核心关键词在设定第一时间长度对应的搜索量,以及对应的历史旅游指标之后,针对设定阶数滞后期中的每一阶滞后期,获取该旅游核心词在该阶滞后期的设定第一时间长度的搜索量。比如,每相邻两阶的时间长度差为1个月,获取的是旅游核心关键词在5月份对应的搜索量,若获取该旅游核心关键词在1阶滞后期的设定第一时间长度的搜索量,则为获取该旅游核心关键词在4月对应的搜索量,若获取该旅游核心关键词在3阶滞后期的设定第一时间长度的搜索量,则为获取该旅游核心关键词在2月对应的搜索量。
基于上述获取的每个搜索量,分别确定每个搜索量与上述获取的对应的历史旅游指标的相关系数,比如,皮尔逊相关系数。具体的,以皮尔逊相关系数为例,确定搜索量与上述获取的对应的历史旅游指标的相关系数,可以通过如下公式确定:
Figure BDA0002538929910000201
其中,X为搜索量,Y为对应的历史旅游指标,r为皮尔逊相关系数。
由于相关系数越大,说明该搜索量与上述获取的对应的历史旅游指标的相关性越大,相关系数越小,说明该搜索量与上述获取的对应的历史旅游指标的相关性越小。因此,为了进一步提高预测的旅游指标的精确度和稳定性,在本发明实施例中,预先设置有设定相关阈值,比如,0.7等。当获取到每个相关系数之后,判断每个相关系数是否均大于设定相关阈值。具体的,若每个相关系数均大于设定相关阈值,说明该旅游核心关键词对该目标旅游地的旅游指标影响很大,则将该旅游核心关键词作为目标旅游地的关键词;若每个相关系数不均大于设定相关阈值,说明该旅游核心关键词对该目标旅游地的旅游指标影响不大,则过滤该旅游核心关键词。
为了减少预测目标旅游地的目标旅游指标的计算量,并提高预测目标旅游地的目标旅游指标的时效性,确定所述目标旅游地的关键词对应的搜索量,包括:
针对所述目标旅游地的任一关键词,根据该关键词对应的目标滞后期阶数,及滞后期阶数与滞后时间段的对应关系,确定该关键词对应的目标滞后时间段,根据待预测的旅游指标所对应的时间段,以及所述目标滞后时间段,确定搜索量提取时间段,获取所述提取时间段该关键词的搜索量。
由于现有技术中,经常会通过该目标旅游地的旅游指标的关联数据在过去的一年、半年等很长一段时间内的搜索量,来预测目标旅游地的旅游指标,从而使计算量非常的大,且预测的旅游指标实时性较差。而在实际应用过程中,一般关联数据则只对目标旅游地在未来的一个月或者两个月的旅游指标影响较大。因此,为了减少预测目标旅游地的目标旅游指标的计算量,并提高预测目标旅游地的目标旅游指标的时效性,目标旅游地的任一关键词均对应有目标滞后期阶数。其中,该目标滞后期阶数可以是该关键词对应的相关系数最大值所对应的滞后期阶数。
下表为示例性的当旅游指标为旅游人数或旅游收入时,目标旅游地“青岛”的关键词、每个关键词对应的相关系数最大值以及对应的目标滞后期阶数。
Figure BDA0002538929910000211
Figure BDA0002538929910000221
在本发明实施例中,还预先保存的滞后阶数与滞后时间段的对应关系。当获取到关键词对应的目标滞后期阶数之后,根据预先保存的滞后阶数与滞后时间段的对应关系,确定该关键词对应的目标滞后时间段。
为了准确确定获取该关键词的搜索量,在本发明实施例中,还要获取待预测的旅游指标所对应的时间段,比如,8月、9月、2月等,根据该待预测的旅游指标所对应的时间段,以及上述实施例确定的目标滞后时间段,确定搜索量提取时间段。比如,目标滞后时间段为3个月,该待预测的旅游指标所对应的时间段为8月,则确定搜索提取时间段为5月。
当基于上述实施例确定了搜索提取时间段之后,获取在该搜索时间段内该关键词的搜索量。比如,滞后期阶数与滞后时间段的对应关系为1个月,关键词“流亭”对应的目标滞后期阶数是-1,确定该关键词对应的目标滞后时间段为1个月,获取的待预测的旅游指标序列所对应的时间段为8月,根据该待预测的旅游指标序列所对应的时间段8月以及目标滞后时间段1个月,确定搜索量提取时间段为7月,则获取在7月该关键词“流亭”的搜索量。
实施例5:
图7为本发明实施例提供的一种旅游指标预测装置结构示意图,该装置包括:
获取单元71,用于获取目标旅游地的历史旅游指标序列,以及历史旅游指标的关联数据序列,所述历史旅游指标序列中包含的每维元素为所述目标旅游地设定第一时间长度的历史旅游指标,所述关联数据序列中包含的每维元素为所述目标旅游地所述设定第一时间长度的历史旅游指标的关联数据;
第一处理单元72,用于通过预先训练完成的旅游指标预测模型,基于所述历史旅游指标序列,获取预测的所述目标旅游地的旅游指标;并
第二处理单元73,用于通过预先训练完成的残差预测模型,基于所述关联数据序列,获取预测的所述目标旅游地的残差;
确定单元74,用于根据所述旅游指标以及所述残差,确定所述目标旅游地的目标旅游指标。
进一步地,所述旅游指标预测模型通过如下方式训练:
获取所述目标旅游地的样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标;
通过原始旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
根据所述样本旅游指标以及所述识别旅游指标,对所述原始旅游指标预测模型进行训练。
进一步地,当获取到训练完成的旅游指标预测模型之后,所述残差预测模型通过如下方式训练:
获取所述样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标及样本关联数据序列;
通过预先训练完成的旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
确定所述样本旅游指标与所述识别旅游指标之间的样本残差;
通过原始残差预测模型,基于所述样本关联数据序列,获取预测的所述目标旅游地的识别残差;
根据所述识别残差以及所述样本残差,对所述原始残差预测模型进行训练。
进一步地,若所述关联数据包括所述目标旅游地的关键词对应的搜索量,所述获取单元71,还用于获取所述目标旅游地的任一旅游核心关键词在所述设定第一时间长度对应的搜索量,以及对应的历史旅游指标;针对设定阶数滞后期中的每一阶滞后期,获取所述旅游核心关键词在该阶滞后期的所述设定第一时间长度的搜索量;分别确定每个所述搜索量与所述对应的历史旅游指标的相关系数;若每个所述相关系数均大于设定相关阈值,则将所述旅游核心关键词作为所述目标旅游地的关键词。
进一步地,所述获取单元71,还用于针对所述目标旅游地的任一关键词,根据该关键词对应的目标滞后期阶数,及滞后期阶数与滞后时间段的对应关系,确定该关键词对应的目标滞后时间段,根据待预测的旅游指标所对应的时间段,以及所述目标滞后时间段,确定搜索量提取时间段,获取所述提取时间段该关键词的搜索量。
由于上述提供的旅游指标预测装置所解决问题的原理与旅游指标预测方法相似,因此处理器执行上述计算机可读取介质中的计算机程序后,实现的步骤可以参见方法的实施,重复之处不再赘述。
由于本发明实施例通过预先训练完成的残差预测模型,基于获取的关联数据序列,获取预测的目标旅游地的残差,其中,该关联数据序列中包含的每维元素为目标旅游地设定第一时间长度的旅游指标的关联数据,后续根据该残差以及预测的目标旅游地的旅游指标,从而确定目标旅游地的目标旅游指标,使确定的目标旅游指标可以充分考虑关联数据对旅游指标的影响,从而提高确定的预测的目标旅游指标的准确性。
实施例6:
图8为本发明实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本发明实施例还提供了一种电子设备,如图8所示,包括:处理器81、通信接口82、存储器83和通信总线84,其中,处理器81,通信接口82,存储器83通过通信总线84完成相互间的通信。
所述存储器83中存储有计算机程序,当所述程序被所述处理器81执行时,使得所述处理器81执行如下步骤:
获取目标旅游地的历史旅游指标序列,以及历史旅游指标的关联数据序列,所述历史旅游指标序列中包含的每维元素为所述目标旅游地设定第一时间长度的历史旅游指标,所述关联数据序列中包含的每维元素为所述目标旅游地所述设定第一时间长度的历史旅游指标的关联数据;
通过预先训练完成的旅游指标预测模型,基于所述历史旅游指标序列,获取预测的所述目标旅游地的旅游指标;并
通过预先训练完成的残差预测模型,基于所述关联数据序列,获取预测的所述目标旅游地的残差;
根据所述旅游指标以及所述残差,确定所述目标旅游地的目标旅游指标。
进一步地,所述旅游指标预测模型通过如下方式训练:
获取所述目标旅游地的样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标;
通过原始旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
根据所述样本旅游指标以及所述识别旅游指标,对所述原始旅游指标预测模型进行训练。
进一步地,当获取到训练完成的旅游指标预测模型之后,所述残差预测模型通过如下方式训练:
获取所述样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标及样本关联数据序列;
通过预先训练完成的旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
确定所述样本旅游指标与所述识别旅游指标之间的样本残差;
通过原始残差预测模型,基于所述样本关联数据序列,获取预测的所述目标旅游地的识别残差;
根据所述识别残差以及所述样本残差,对所述原始残差预测模型进行训练。
进一步地,若所述关联数据包括所述目标旅游地的关键词对应的搜索量,所述处理器81,还用于获取所述目标旅游地的任一旅游核心关键词在所述设定第一时间长度对应的搜索量,以及对应的历史旅游指标;针对设定阶数滞后期中的每一阶滞后期,获取所述旅游核心关键词在该阶滞后期的所述设定第一时间长度的搜索量;分别确定每个所述搜索量与所述对应的历史旅游指标的相关系数;若每个所述相关系数均大于设定相关阈值,则将所述旅游核心关键词作为所述目标旅游地的关键词。
进一步地,所述处理器81,还用于针对所述目标旅游地的任一关键词,根据该关键词对应的目标滞后期阶数,及滞后期阶数与滞后时间段的对应关系,确定该关键词对应的目标滞后时间段,根据待预测的旅游指标所对应的时间段,以及所述目标滞后时间段,确定搜索量提取时间段,获取所述提取时间段该关键词的搜索量。
由于上述电子设备解决问题的原理与旅游指标预测方法相似,因此上述电子设备的实施可以参见方法的实施,重复之处不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口82用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
由于本发明实施例通过预先训练完成的残差预测模型,基于获取的关联数据序列,获取预测的目标旅游地的残差,其中,该关联数据序列中包含的每维元素为目标旅游地设定第一时间长度的旅游指标的关联数据,后续根据该残差以及预测的目标旅游地的旅游指标,从而确定目标旅游地的目标旅游指标,使确定的目标旅游指标可以充分考虑关联数据对旅游指标的影响,从而提高确定的预测的目标旅游指标的准确性。
实施例7:
在上述各实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由处理器执行的计算机程序,当所述程序在所述处理器上运行时,使得所述处理器执行时实现如下步骤:
获取目标旅游地的历史旅游指标序列,以及历史旅游指标的关联数据序列,所述历史旅游指标序列中包含的每维元素为所述目标旅游地设定第一时间长度的历史旅游指标,所述关联数据序列中包含的每维元素为所述目标旅游地所述设定第一时间长度的历史旅游指标的关联数据;
通过预先训练完成的旅游指标预测模型,基于所述历史旅游指标序列,获取预测的所述目标旅游地的旅游指标;并
通过预先训练完成的残差预测模型,基于所述关联数据序列,获取预测的所述目标旅游地的残差;
根据所述旅游指标以及所述残差,确定所述目标旅游地的目标旅游指标。进一步地,所述旅游指标预测模型通过如下方式训练:
获取所述目标旅游地的样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标;
通过原始旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
根据所述样本旅游指标以及所述识别旅游指标,对所述原始旅游指标预测模型进行训练。
进一步地,当获取到训练完成的旅游指标预测模型之后,所述残差预测模型通过如下方式训练:
获取所述样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标及样本关联数据序列;
通过预先训练完成的旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
确定所述样本旅游指标与所述识别旅游指标之间的样本残差;
通过原始残差预测模型,基于所述样本关联数据序列,获取预测的所述目标旅游地的识别残差;
根据所述识别残差以及所述样本残差,对所述原始残差预测模型进行训练。
进一步地,所述关联数据包括所述目标旅游地的居民消费价格指数、所述目标旅游地的国内生产总值、所述目标旅游地的关键词对应的搜索量、全国居民消费价格指数、全国的国内生产总值、月份中的至少一种。
进一步地,所述目标旅游地的关键词通过如下方式确定:
获取所述目标旅游地的任一旅游核心关键词在所述设定第一时间长度对应的搜索量,以及对应的历史旅游指标;
针对设定阶数滞后期中的每一阶滞后期,获取所述旅游核心关键词在该阶滞后期的所述设定第一时间长度的搜索量;
分别确定每个所述搜索量与所述对应的历史旅游指标的相关系数;
若每个所述相关系数均大于设定相关阈值,则将所述旅游核心关键词作为所述目标旅游地的关键词。
进一步地,确定所述目标旅游地的关键词对应的搜索量,包括:
针对所述目标旅游地的任一关键词,根据该关键词对应的目标滞后期阶数,及滞后期阶数与滞后时间段的对应关系,确定该关键词对应的目标滞后时间段,根据待预测的旅游指标所对应的时间段,以及所述目标滞后时间段,确定搜索量提取时间段,获取所述提取时间段该关键词的搜索量。
由于上述提供的计算机可读取介质解决问题的原理与旅游指标预测方法相似,因此处理器执行上述计算机可读取介质中的计算机程序后,实现的步骤可以参见方法的实施,重复之处不再赘述。
上述实施例中的计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD)等。
由于本发明实施例通过预先训练完成的残差预测模型,基于获取的关联数据序列,获取预测的目标旅游地的残差,其中,该关联数据序列中包含的每维元素为目标旅游地设定第一时间长度的旅游指标的关联数据,后续根据该残差以及预测的目标旅游地的旅游指标,从而确定目标旅游地的目标旅游指标,使确定的目标旅游指标可以充分考虑关联数据对旅游指标的影响,从而提高确定的预测的目标旅游指标的准确性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (13)

1.一种旅游指标预测方法,其特征在于,所述方法包括:
获取目标旅游地的历史旅游指标序列,以及历史旅游指标的关联数据序列,所述历史旅游指标序列中包含的每维元素为所述目标旅游地设定第一时间长度的历史旅游指标,所述关联数据序列中包含的每维元素为所述目标旅游地所述设定第一时间长度的历史旅游指标的关联数据;
通过预先训练完成的旅游指标预测模型,基于所述历史旅游指标序列,获取预测的所述目标旅游地的旅游指标;并
通过预先训练完成的残差预测模型,基于所述关联数据序列,获取预测的所述目标旅游地的残差;
根据所述旅游指标以及所述残差,确定所述目标旅游地的目标旅游指标。
2.根据权利要求1所述的方法,其特征在于,所述旅游指标预测模型通过如下方式训练:
获取所述目标旅游地的样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标;
通过原始旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
根据所述样本旅游指标以及所述识别旅游指标,对所述原始旅游指标预测模型进行训练。
3.根据权利要求2所述的方法,其特征在于,当获取到训练完成的旅游指标预测模型之后,所述残差预测模型通过如下方式训练:
获取所述样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标及样本关联数据序列;
通过预先训练完成的旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
确定所述样本旅游指标与所述识别旅游指标之间的样本残差;
通过原始残差预测模型,基于所述样本关联数据序列,获取预测的所述目标旅游地的识别残差;
根据所述识别残差以及所述样本残差,对所述原始残差预测模型进行训练。
4.根据权利要求1-3任一所述的方法,其特征在于,所述关联数据包括所述目标旅游地的居民消费价格指数、所述目标旅游地的国内生产总值、所述目标旅游地的关键词对应的搜索量、全国居民消费价格指数、全国的国内生产总值、月份中的至少一种。
5.根据权利要求4所述的方法,其特征在于,所述目标旅游地的关键词通过如下方式确定:
获取所述目标旅游地的任一旅游核心关键词在所述设定第一时间长度对应的搜索量,以及对应的历史旅游指标;
针对设定阶数滞后期中的每一阶滞后期,获取所述旅游核心关键词在该阶滞后期的所述设定第一时间长度的搜索量;
分别确定每个所述搜索量与所述对应的历史旅游指标的相关系数;
若每个所述相关系数均大于设定相关阈值,则将所述旅游核心关键词作为所述目标旅游地的关键词。
6.根据权利要求5所述的方法,其特征在于,确定所述目标旅游地的关键词对应的搜索量,包括:
针对所述目标旅游地的任一关键词,根据该关键词对应的目标滞后期阶数,及滞后期阶数与滞后时间段的对应关系,确定该关键词对应的目标滞后时间段,根据待预测的旅游指标所对应的时间段,以及所述目标滞后时间段,确定搜索量提取时间段,获取所述提取时间段该关键词的搜索量。
7.一种旅游指标预测装置,其特征在于,所述装置包括:
获取单元,用于获取目标旅游地的历史旅游指标序列,以及历史旅游指标的关联数据序列,所述历史旅游指标序列中包含的每维元素为所述目标旅游地设定第一时间长度的历史旅游指标,所述关联数据序列中包含的每维元素为所述目标旅游地所述设定第一时间长度的历史旅游指标的关联数据;
第一处理单元,用于通过预先训练完成的旅游指标预测模型,基于所述历史旅游指标序列,获取预测的所述目标旅游地的旅游指标;并
第二处理单元,用于通过预先训练完成的残差预测模型,基于所述关联数据序列,获取预测的所述目标旅游地的残差;
确定单元,用于根据所述旅游指标以及所述残差,确定所述目标旅游地的目标旅游指标。
8.根据权利要求7所述的装置,其特征在于,所述旅游指标预测模型通过如下方式训练:
获取所述目标旅游地的样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标;
通过原始旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
根据所述样本旅游指标以及所述识别旅游指标,对所述原始旅游指标预测模型进行训练。
9.根据权利要求8所述的装置,其特征在于,当获取到训练完成的旅游指标预测模型之后,所述残差预测模型通过如下方式训练:
获取所述样本集中的任一历史样本旅游指标序列,所述历史样本旅游指标序列对应有所述目标旅游地的样本旅游指标及样本关联数据序列;
通过预先训练完成的旅游指标预测模型,基于所述历史样本旅游指标序列,获取预测的所述目标旅游地的识别旅游指标;
确定所述样本旅游指标与所述识别旅游指标之间的样本残差;
通过原始残差预测模型,基于所述样本关联数据序列,获取预测的所述目标旅游地的识别残差;
根据所述识别残差以及所述样本残差,对所述原始残差预测模型进行训练。
10.根据权利要求7-9任一所述的装置,其特征在于,若所述关联数据包括所述目标旅游地的关键词对应的搜索量,所述获取单元,还用于获取所述目标旅游地的任一旅游核心关键词在所述设定第一时间长度对应的搜索量,以及对应的历史旅游指标;针对设定阶数滞后期中的每一阶滞后期,获取所述旅游核心关键词在该阶滞后期的所述设定第一时间长度的搜索量;分别确定每个所述搜索量与所述对应的历史旅游指标的相关系数;若每个所述相关系数均大于设定相关阈值,则将所述旅游核心关键词作为所述目标旅游地的关键词。
11.根据权利要求10所述的装置,其特征在于,所述获取单元,还用于针对所述目标旅游地的任一关键词,根据该关键词对应的目标滞后期阶数,及滞后期阶数与滞后时间段的对应关系,确定该关键词对应的目标滞后时间段,根据待预测的旅游指标所对应的时间段,以及所述目标滞后时间段,确定搜索量提取时间段,获取所述提取时间段该关键词的搜索量。
12.一种电子设备,其特征在于,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现根据权利要求1-6中任一所述旅游指标预测方法的步骤。
13.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1-6中任一所述旅游指标预测方法的步骤。
CN202010541246.5A 2020-06-15 2020-06-15 一种旅游指标预测方法、装置、设备及介质 Active CN113807556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010541246.5A CN113807556B (zh) 2020-06-15 2020-06-15 一种旅游指标预测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010541246.5A CN113807556B (zh) 2020-06-15 2020-06-15 一种旅游指标预测方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113807556A true CN113807556A (zh) 2021-12-17
CN113807556B CN113807556B (zh) 2024-06-14

Family

ID=78892343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010541246.5A Active CN113807556B (zh) 2020-06-15 2020-06-15 一种旅游指标预测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113807556B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115238531A (zh) * 2022-09-23 2022-10-25 南京航空航天大学 一种基于多情景的机场环境承载力预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951845A (zh) * 2015-05-29 2015-09-30 华南理工大学 基于网络关注度拟合客流量的旅游景区饱和度预警方法
KR20150117899A (ko) * 2014-04-11 2015-10-21 양재혁 무선 네트워크를 이용한 관광경로 제공 방법 및 이를 이용한 단말
CN105404942A (zh) * 2015-12-07 2016-03-16 山东科技大学 一种旅游数据最优权组合预测模型
CN110929922A (zh) * 2019-11-08 2020-03-27 北京宝兰德软件股份有限公司 一种基于时间序列数据的指标趋势预测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150117899A (ko) * 2014-04-11 2015-10-21 양재혁 무선 네트워크를 이용한 관광경로 제공 방법 및 이를 이용한 단말
CN104951845A (zh) * 2015-05-29 2015-09-30 华南理工大学 基于网络关注度拟合客流量的旅游景区饱和度预警方法
CN105404942A (zh) * 2015-12-07 2016-03-16 山东科技大学 一种旅游数据最优权组合预测模型
CN110929922A (zh) * 2019-11-08 2020-03-27 北京宝兰德软件股份有限公司 一种基于时间序列数据的指标趋势预测方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115238531A (zh) * 2022-09-23 2022-10-25 南京航空航天大学 一种基于多情景的机场环境承载力预测方法

Also Published As

Publication number Publication date
CN113807556B (zh) 2024-06-14

Similar Documents

Publication Publication Date Title
CN110782093B (zh) 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN111210093B (zh) 基于大数据的日用水量预测方法
CN111091196B (zh) 客流数据确定方法、装置、计算机设备和存储介质
CN105678398A (zh) 基于大数据技术的电力负荷预测方法及基于该方法的研究应用系统
CN110956807B (zh) 基于多源数据与滑动窗口组合的高速公路流量预测方法
CN110555561A (zh) 一种中长期径流集合预报方法
CN112149898B (zh) 故障率预测模型的训练、故障率预测方法及相关装置
CN113077090A (zh) 客流预测方法、系统及计算机可读存储介质
CN109376906B (zh) 基于多维度轨迹的出行时间预测方法、系统及电子设备
CN112489426A (zh) 一种基于图卷积神经网络的城市交通流量时空预测方案
CN113516304B (zh) 基于时空图网络的区域污染物时空联合预测方法及装置
CN112419711B (zh) 基于改进gmdh算法的封闭式停车场停车需求预测方法
CN115204477A (zh) 一种上下文感知图递归网络的自行车流量预测方法
CN115049152A (zh) 一种机场换乘区到港旅客流量预测方法、装置及电子设备
CN112733307A (zh) 一种供暖季城市天然气负荷预测方法及装置
CN110490365B (zh) 一种基于多源数据融合预测网约车订单量的方法
CN113821547B (zh) 快速高效的停车场占有率短时预测方法、系统及存储介质
CN115240871A (zh) 一种基于深度嵌入聚类元学习的流行病预测方法
Wang et al. A two-step model for predicting travel demand in expanding subways
CN115034429A (zh) 基于深度图神经网络的城市出租车接客点推荐方法
CN113807556A (zh) 一种旅游指标预测方法、装置、设备及介质
CN108154259B (zh) 热泵的负荷预测方法及装置、存储介质、处理器
CN113837383A (zh) 模型训练方法、装置、电子设备及存储介质
CN111145535B (zh) 一种复杂场景下的行程时间可靠性分布预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant