CN108053242A - 景点门票票量预测方法、系统、设备及存储介质 - Google Patents

景点门票票量预测方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN108053242A
CN108053242A CN201711320700.9A CN201711320700A CN108053242A CN 108053242 A CN108053242 A CN 108053242A CN 201711320700 A CN201711320700 A CN 201711320700A CN 108053242 A CN108053242 A CN 108053242A
Authority
CN
China
Prior art keywords
ticket
day
amount
ticket amount
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711320700.9A
Other languages
English (en)
Other versions
CN108053242B (zh
Inventor
曹玫
胡琳
孟月
吴辰
吴一辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Information Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Information Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Information Technology Shanghai Co Ltd filed Critical Ctrip Travel Information Technology Shanghai Co Ltd
Priority to CN201711320700.9A priority Critical patent/CN108053242B/zh
Publication of CN108053242A publication Critical patent/CN108053242A/zh
Application granted granted Critical
Publication of CN108053242B publication Critical patent/CN108053242B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种景点门票票量预测方法、系统、设备及存储介质,包括将每日门票票量历史信息分为法定节日假期对应的第一票量历史信息以及非法定节日对应的第二票量历史信息;根据第二票量历史信息建立时间序列模型;根据第一票量历史信息建立法定节日假期票量预测模型;获得每一基准日期之前预设定天对基准日期的门票的预订量作为一特征变量,根据特征变量与基准日期的票量建立票量回归模型;根据时间序列模型、法定节日假期票量预测模型以及票量回归模型择一进行每日票量预测。本发明有效地利用景点门票的历史趋势信息和已预订信息能够快速而准确地预测出在线旅行社景点门票的每日票量,为合理安排人力确保用户体验提供了保障。

Description

景点门票票量预测方法、系统、设备及存储介质
技术领域
本发明涉及门票票量,具体地说,涉及一种景点门票票量预测方法、系统、设备及存储介质。
背景技术
随着互联网技术的快速发展,在线旅行社也得以迅猛发展,越来越多的景点可以在互联网上方便快捷地进行预订,同时在旅游出行中选择在网上预订景点门票的游客数量也在快速增长。
为了确保用户体验,同时控制人力成本,在线旅行社需要提前预测每日的景点门票票量,从而合理安排人力,为用户提供更好的服务。然而通过人工预测在线旅行社每日的景点门票票量,不仅耗时耗力,同时不同的人有不同的预期,预测结果易受人工主观意志影响,从而影响预测结果的准确性。
因此,利用计算机技术自动对景点门票的相关信息进行分析和判断,理性预测出每日的票量成为了迫切的需求。现阶段,关于OTA的景点门票票量预测的相关研究尚未深入展开,鲜有利用计算机自动预测OTA每日的景点门票票量的方法,实现景点门票票量的快速而准确的预测成为了一项具有挑战性的任务。
发明内容
针对现有技术中的问题,本发明的目的在于提供一种景点门票票量预测方法、系统、设备及存储介质以克服现有技术中无法对在线旅行社的每日景点门票票量进行快速而准确预测的缺陷。
根据本发明的一个方面,提供一种景点门票票量预测方法,包括:如下步骤:
S1:获取一景点的每日门票票量历史信息,将所述每日门票票量历史信息分为预设的所有法定节日假期对应的第一票量历史信息以及所有非法定节日对应的第二票量历史信息;
S2:根据第二票量历史信息建立非法定节日中每一天与当天票量相联系的时间序列模型;
S3:在第一票量历史信息中获得在每一年中每个法定节日假期的总票量以及每个法定节日假期的每日票量,获得各法定节日假期总票量之间的第一比值和各法定节日假期每日票量之间的第二比值,根据第一比值和第二比值建立法定节日假期票量预测模型;
S4:获得每一基准日期之前预设定天对基准日期的门票的预订量作为一特征变量,根据所述特征变量与所述基准日期的票量建立预设定天对应的票量回归模型;
S5:根据所述时间序列模型、法定节日假期票量预测模型以及票量回归模型择一进行每日票量预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为常规日期时,选择时间序列模型进行预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为节假日日期时,选择节假日票量预测模型进行预测,当待查询日期距当前查询日期的值小于预设定天数时,选择所述票量回归模型进行预测。
优选地,所述步骤S1还包括如下步骤:
S101:将不同年份的每个法定节日假期对齐,将不同年份的非法定节日以每年第一周为基准对齐;
S102:当法定节日假期和非法定节日中的一日门票票量低于第一预设定门票阈值和高于第二预设定门票阈值时,对该日门票票量进行修正,所述修正为对该日门票票量修正为相邻两年份中与该日对齐日的门票票量平均值。
优选地,在步骤S2中包括如下步骤:
S201:第二票量历史信息中的每日票量构成一时间序列样本,通过差分变化法对时间序列样本中的每一时间序列进行平稳化处理,具体公式为Yt=Xt-Xt-s,其中Yt为差分后时间序列的值,Xt为序号为t的时间序列的值,s为差分阶数,t为时间序列的序列号,Xt-s为序号为t-s的时间序列的值;
S202:对差分后的时间序列{Yt}建立多个时间序列模型,并计算每个时间序列模型的AIC值,选择其中AIC值最小的时间序列模型作为最优时间序列模型;
S203:计算时间序列样本的似然函数,求出使得所述似然函数达到极大值时最优时间序列模型各参数的极大似然估计值;
S204:计算Q统计量,其中检验的临界值由卡方分布获得,当Q统计量的值大于检验的临界值时,则最优时间序列模型拟合不显著,检验不通过;当Q统计量的值小于检验的临界值时,则最优时间序列模型拟合显著有效,检验通过,其中,T为时间序列样本个数,为时间序列样本残差的自相关系数,m为自由度,k为自由度序号。
优选地,所述步骤S4包括如下步骤:
S401:选取多个特征变量形成样本集,多个所述特征变量包括基准日期前第一天、第二天、第三天、第四天、第五天的预定量,基准日期前第五天之前的所有预定量以及基准日期的日期类型、是否有景点活动以及天气类型,所述日期类型包括法定节日假期和非法定节日假期,所述是否有景点活动包括有景点活动和没有景点活动,所述天气类型包括晴天、阴天、小雨、中雨以及大雨;
S402:将样本集中80%的样本作为训练集,20%的样本作为测试集依次训练支持向量回归机模型、随机森林模型、XGBOOST模型;
S403:将支持向量回归机模型、随机森林模型、XGBOOST模型进行加权建立票量回归模型,其中支持向量回归机模型的权重值设为α,随机森林模型的权重值设为β,XGBOOST模型的权重设为(1-α-β),α、β和(1-α-β)的取值在0到1之间;
S404:以步长i进行搜索权重值α、β的最优值以使票量回归模型均方误差最小化,步长i的取值为0.01。
优选地,步骤S401还包括如下步骤:
S4011:对特征变量进行z-score标准处理,计算公式为:zi=(xi-μ)/σ;zi为标准化处理后的特征变量值,xi为特征变量原始值,μ为对应特征变量的均值,σ为对应特征变量的标准差,i为特征变量的序号;
其中,所述法定节日假期作为特征变量时赋值为1,所述非法定节日假期作为特征变量时赋值为0,所述有景点活动的日期作为特征变量时赋值为1、所述没有景点活动的日期作为特征变量时赋值为0,所述晴天的日期作为特征变量时赋值为1、所述阴天的日期作为特征变量时赋值为2、所述小雨的日期作为特征变量时赋值为3、所述中雨的日期作为特征变量时赋值为4以及所述大雨的日期作为特征变量时赋值为5。
优选地,所述法定节日假期包括元旦、春节、清明节、劳动节、端午节、中秋节以及国庆。
优选地,重复执行步骤S401至S404,建立基准日期前第一天、第二天、第三天、第四天、第五天对应的票量回归模型。
本发明还提供一种景点门票票量预测系统,用于实现所述的景点门票票量预测方法,其特征在于,包括:
门票票量历史信息获取模块,用于获取一景点的每日门票票量历史信息,将所述每日门票票量历史信息分为预设的所有法定节日假期对应的第一票量历史信息以及所有非法定节日对应的第二票量历史信息;
时间序列模型建立模块,根据第二票量历史信息建立非法定节日中每一天与当天票量相联系的时间序列模型;
法定节日假期票量预测模型建立模块,用于在第一票量历史信息中获得在每一年中每个法定节日假期的总票量以及每个法定节日假期的每日票量,获得各法定节日假期总票量之间的第一比值和各法定节日假期每日票量之间的第二比值,根据第一比值和第二比值建立法定节日假期票量预测模型;
票量回归模型建立模块,获得每一基准日期之前预设定天对基准日期的门票的预订量作为一特征变量,根据所述特征变量与所述基准日期的票量建立预设定天对应的票量回归模型;
每日票量预测模块,用于根据所述时间序列模型、法定节日假期票量预测模型以及票量回归模型择一进行每日票量预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为常规日期时,选择时间序列模型进行预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为节假日日期时,选择节假日票量预测模型进行预测,当待查询日期距当前查询日期的值小于预设定天数时,选择所述票量回归模型进行预测。
本发明还提供一种景点门票票量预测设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行所述景点门票票量预测方法的步骤。
本发明还提供一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现所述景点门票票量预测方法的步骤。
相比现有技术,本发明具有如下优势:
本发明建立的基于景点门票票量历史信息建立票量的时间序列模型和法定节日假期票量预测模型,充分利用景点门票票量周期性、趋势性及节假日特性等多方面的信息,对景点门票票量进行长期预测,有助于早做准备,尤其是针对节假日高峰期,提前储备人力;本发明建立的基于景点门票票量已预订信息的票量回归模型,充分利用景点门票近期的用户预订信息,对景点门票票量进行短期预测,提高预测的准确性,有助于更精确地对人力进行安排及调整;本发明有效地利用景点门票的历史趋势信息和已预订信息进行综合分析和判断,快速而准确地预测出在线旅行社景点门票的每日票量,为合理安排人力确保用户体验以及控制人力成本提供了保障。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是本发明提供的景点门票票量预测方法步骤流程图;
图2是本发明中门票票量进行修正的步骤流程图;
图3是本发明中建立时间序列模型的步骤流程图;
图4是本发明中建立票量回归模型的步骤流程图;
图5是本发明提供的景点门票票量预测系统的模块示意图;
图6是本发明中景点门票票量预测设备的结构示意图;以及
图7是本本发明中计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
在本实施例中,图1是本发明提供的景点门票票量预测方法步骤流程图,如图1所示,本发明提供的景点门票票量预测方法,包括:如下步骤:
S1:获取一景点的每日门票票量历史信息,将每日门票票量历史信息分为预设的所有法定节日假期对应的第一票量历史信息以及所有非法定节日对应的第二票量历史信息;
在本实施例中,法定节日假期包括元旦、春节、清明节、劳动节、端午节、中秋节以及国庆。当因国家正策增加或减少法定节日假期的数量时,可以将法定节日假期的设定进行修改。当在不同的国家进行适用时,也可以根据该国的法定节日假期进行设定。在变形例中,也可以增加暑假、寒假、妇女节、情人节、圣诞节等假期。
当某日受到极端天气影响时,如暴雨、台风等影响,门票票量受天气影响很大,而出现异常低的历史数据时,需要根据正常趋势进行修正;当某日在该景点举行大型活动时,如大型促销、特惠、景点内举行灯会或展览等活动,出现当日门票异常高的历史数据时,也需要根据正常趋势进行修正。
图2是本发明中门票票量进行修正的步骤流程图,步骤S1还包括如下步骤:
S101:将不同年份的每个法定节日假期对齐,将不同年份的非法定节日以每年第一周为基准对齐;
S102:当法定节日假期和非法定节日中的一日门票票量低于第一预设定门票阈值和高于第二预设定门票阈值时,对该日门票票量进行修正,修正为相邻两年份中与该日对齐日的门票票量的平均值。在变形例中,也可以将该日门票票量修正为该日相邻两天门票票量的平均值,或该日所在周或月中每日门票量的平均值。第一预设定门票阈值和第二预设定门票阈值可以根据历史票量的每日平均值乘以一系数进行设定,也可以根据该日所在周或月中每日门票量的平均值乘以一系数进行设定,如第一预设定门票阈值为该日所在周或月中每日门票量的平均值乘以0.5,第二预设定门票阈值为该日所在周或月中每日门票量的平均值乘以2。
在本实施例中,不同年份的法定节日假期数据,根据放假时间进行对齐,在本实施例中,认定节假日开始前三天,门票票量开始受到假期影响逐渐上升,即节假日前三天对齐节假日前三天,节假日前两天对齐节假日前两天,以此类推。
S2:根据第二票量历史信息建立非法定节日中每一天与当天票量相联系的时间序列模型;
图3是本发明中建立时间序列模型的步骤流程图,在本实施例中,在步骤S2中包括如下步骤:
S201:第二票量历史信息中的每日票量构成一时间序列样本,通过差分变化法对时间序列样本中的每一时间序列进行平稳化处理,具体公式为Yt=Xt-Xt-s,其中Yt为差分后时间序列的值,Xt为序号为t的时间序列的值,s为差分阶数,t为时间序列的序列号,Xt-s为序号为t-s的时间序列的值;
S202:对差分后的时间序列{Yt}建立多个时间序列模型,并计算每个时间序列模型的AIC值,选择其中AIC值最小的时间序列模型作为最优时间序列模型;其中,AIC(Akaikeinformation criterion)信息准则是衡量统计模型拟合优良性的一种标准,由于它为日本统计学家赤池弘次创立和发展的,因此又称赤池信息量准则,它建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。数字信号处理中对多种模型作选择的判别方法。在一般的情况下,AIC可以表示为:AIC=2k-2ln(L),其中:k是参数的数量,L是似然函数。假设条件是模型的误差服从独立正态分布。让n为观察数,SSR(SUM SQAURE OFRESIDUE)为残差平方和,那么AIC变为:AIC=2k+nln(SSR/n)增加自由参数的数目提高了拟合的优良性,AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合的情况。所以优先考虑的模型应是AIC值最小的那一个。赤池信息准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。
S203:计算时间序列样本的似然函数,求出使得似然函数达到极大值时最优时间序列模型各参数的极大似然估计值;在数理统计学中,似然函数是一种关于统计模型中的参数的函数,表示模型参数中的似然性。给定输出x时,关于参数θ的似然函数L(θ|x)(在数值上)等于给定参数θ后变量X的概率:L(θ|x)=P(X=x|θ)。似然函数在推断统计学中扮演重要角色,如在最大似然估计和费雪信息之中的应用等等。“似然性”与“或然性”或“概率”意思相近,都是指某种事件发生的可能性,但是在统计学中,“似然性”和“或然性”或“概率”又有明确的区分。概率用于在已知一些参数的情况下,预测接下来的观测所得到的结果,而似然性则是用于在已知某些观测所得到的结果时,对有关事物的性质的参数进行估计。
S204:计算Q统计量,其中检验的临界值由卡方分布获得,当Q统计量的值大于检验的临界值时,则最优时间序列模型拟合不显著,检验不通过;当Q统计量的值小于检验的临界值时,则最优时间序列模型拟合显著有效,检验通过,其中,T为时间序列样本个数,为时间序列样本残差的自相关系数,m为自由度,k为自由度序号。
S3:在第一票量历史信息中获得在每一年中每个法定节日假期的总票量以及每个法定节日假期的每日票量,获得各法定节日假期总票量之间的第一比值和各法定节日假期每日票量之间的第二比值,根据第一比值和第二比值建立法定节日假期票量预测模型。在本实施例中,利用历史年份中的各不同节假日门票票量之间的系数的截尾均值作为指标以确定比值;当待预测节假日为元旦,则利用其与上一年各节假日之间的门票票量关系进行预测;若待预测节假日为非元旦,则利用其与当年已发生的各节假日之间的门票票量关系进行预测。当使用本发明提供的景点门票票量预测方法时,根据各法定节日假期总票量之间的第一比值确定待预测法定节日假期的总票量,根据该待预测法定节日假期每日票量之间的第二比值,确定该待预测法定节日假期的每日票量。如元旦、春节、清明节、劳动节、端午节、中秋节以及国庆之间的总票量之间的比值为1∶1.1∶1.2∶1.5∶1.2∶1∶2,其中,劳动节三日每日票量比值为:2∶1.5∶1。本年度的元旦的总票量为10000张,则可以预测出本年度劳动节的总票量为15000张,进而根据劳动节三天每日票量比值预测出本年度劳动节的三日的票量分别为6667、5000、3333。
S4:获得每一基准日期之前每一天对基准日期的门票的预订量作为一特征变量,根据特征变量与基准日期的票量建立票量回归模型。
图4是本发明中建立票量回归模型的步骤流程图,在本实施例中步骤S4包括如下步骤:
S401:选取多个特征变量形成样本集,多个特征变量包括基准日期前第一天、第二天、第三天、第四天、第五天的预订量,基准日期前第五天之前的所有预订量以及基准日期的日期类型、是否有景点活动以及天气类型,日期类型包括法定节日假期和非法定节日假期,是否有景点活动包括有景点活动和没有景点活动,天气类型包括晴天、阴天、小雨、中雨以及大雨。法定节日假期作为特征变量时赋值为1,非法定节日假期作为特征变量时赋值为0,有景点活动的日期作为特征变量时赋值为1、没有景点活动的日期作为特征变量时赋值为0,晴天的日期作为特征变量时赋值为1、阴天的日期作为特征变量时赋值为2、小雨的日期作为特征变量时赋值为3、中雨的日期作为特征变量时赋值为4以及大雨的日期作为特征变量时赋值为5。
S402:将样本集中80%的样本作为训练集,20%的样本作为测试集依次训练支持向量回归机模型、随机森林模型、XGBOOST模型;XGBOOST源起于Boosting集成学习方法,在演化过程中又融入了Bagging集成学习方法的优势,通过Gradient Boosting框架自定义损失函数提高了算法解决通用问题的能力,同时引入更多可控参数即可针对问题场景进行优化,最后通过工程实现方面细节优化,在保证算法结果稳定的同时还可高效处理大规模数据,可扩展支持不同编程语言。这些因素共同使它成为了工业界的主流机器学习算法之一。
本实施例中,采用测试集计算支持向量回归机模型的测试误差,根据测试误差的大小调整支持向量回归机模型的参数;所训练的支持向量回归机模型的核函数为线性核,惩罚系数为0.1。采用测试集计算随机森林模型的测试误差,根据测试误差的大小调整随机森林模型的参数;所训练的随机森林模型的决策树个数为800个。采用测试集计算XGBOOST模型的测试误差,根据测试误差的大小调整XGBOOST模型参数;所训练的XGBOOST模型的学习率为0.1,决策树个数为1000。
S403:将支持向量回归机模型、随机森林模型、XGBOOST模型进行加权建立票量回归模型,其中支持向量回归机模型的权重值设为α,随机森林模型的权重值设为β,XGBOOST模型的权重设为(1-α-β),α、β和(1-α-β)的取值在0到1之间;
S404:以步长i进行搜索权重值α、β的最优值以使票量回归模型均方误差的最小化,步长i的取值为0.01。在变形例,步长i可以设置为0.02、0.03或0.04等数值。在本实施例中,权重值α的取值为0.21,权重值β取值为0.38。
在本实施例中,重复步骤S401至步骤S404,建立基准日期前第一天、第二天、第三天、第四天、第五天对应的票量回归模型。本实施例中共建立5个票量回归模型
步骤S401还包括如下步骤:
S4011:对特征变量进行z-score标准处理,计算公式为:zi=(xi-μ)/σ;zi为标准化处理后的特征变量值,xi为特征变量原始值,μ为对应特征变量的均值,σ为对应特征变量的标准差,i为特征变量的序号。
在本发明中能够根据时间序列模型、法定节日假期票量预测模型以及票量回归模型择一进行每日票量预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为常规日期时,选择时间序列模型进行预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为节假日日期时,选择节假日票量预测模型进行预测,当待查询日期距当前查询日期的值小于预设定天数时,选择票量回归模型进行预测。
在本实施例中,若待预测门票票量的日期距当前大于等于5天,且为非节假日,则利用时间序列模型进行预测;若待预测门票票量的日期距当前大于等于5天,且为节假日,则采用节假日票量预测模型进行预测;若待预测门票票量的日期距当前小于5天,根据待预测门票票量的日期距当前日期的天数,选择对应提前天数的票量回归模型,将待预测门票票量日期的各变量信息依次输入票量回归模型,则输出各日期的门票票量预测值。
图5示出了本发明提供的景点门票票量预测系统的模块示意图,本发明提供一种景点门票票量预测系统100,用于实现上述的景点门票票量预测方法,景点门票票量预测系统100包括:
门票票量历史信息获取模块101,用于获取一景点的每日门票票量历史信息,将每日门票票量历史信息分为预设的所有法定节日假期对应的第一票量历史信息以及所有非法定节日对应的第二票量历史信息;
时间序列模型建立模块102,根据第二票量历史信息建立非法定节日中每一天与当天票量相联系的时间序列模型;
法定节日假期票量预测模型建立模块103,用于在第一票量历史信息中获得在每一年中每个法定节日假期的总票量以及每个法定节日假期的每日票量,获得各法定节日假期总票量之间的第一比值和各法定节日假期每日票量之间的第二比值,根据第一比值和第二比值建立法定节日假期票量预测模型;
票量回归模型建立模块104,获得每一基准日期之前预设定天对基准日期的门票的预订量作为一特征变量,根据特征变量与基准日期的票量建立预设定天对应的票量回归模型;
每日票量预测模块105,用于根据时间序列模型、法定节日假期票量预测模型以及票量回归模型择一进行每日票量预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为常规日期时,选择时间序列模型进行预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为节假日日期时,选择节假日票量预测模型进行预测,当待查询日期距当前查询日期的值小于预设定天数时,选择票量回归模型进行预测。
本发明实施例还提供一种景点门票票量预测设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行上述的景点门票票量预测方法的步骤。
如上,该实施例通过景点门票票量预测方法从景点门票的历史趋势信息和已预订信息两个方面出发,提高了景点门票票量预测的实用性和效果。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图6是本发明中景点门票票量预测设备的结构示意图。下面参照图6来描述根据本发明的这种实施方式的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的景点门票票量预测方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。
如上所示,该实施例的计算机可读存储介质的程序在执行时,通过景点门票票量预测方法从景点门票的历史趋势信息和已预订信息两个方面出发,提高了景点门票票量预测的实用性和效果。
图7是本本发明中计算机可读存储介质的结构示意图。参考图7所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言-诸如Java、C++等,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本实施例中,本发明建立的基于景点门票票量历史信息建立票量的时间序列模型和法定节日假期票量预测模型,充分利用景点门票票量周期性、趋势性及节假日特性等多方面的信息,对景点门票票量进行长期预测,有助于早做准备,尤其是针对节假日高峰期,提前储备人力;本发明建立的基于景点门票票量已预订信息的票量回归模型,充分利用景点门票近期的用户预订信息,对景点门票票量进行短期预测,提高预测的准确性,有助于更精确地对人力进行安排及调整;本发明有效地利用景点门票的历史趋势信息和已预订信息进行综合分析和判断,快速而准确地预测出在线旅行社景点门票的每日票量,为合理安排人力确保用户体验以及控制人力成本提供了保障。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种景点门票票量预测方法,其特征在于,包括:如下步骤:
S1:获取一景点的每日门票票量历史信息,将所述每日门票票量历史信息分为预设的所有法定节日假期对应的第一票量历史信息以及所有非法定节日对应的第二票量历史信息;
S2:根据第二票量历史信息建立非法定节日中每一天与当天票量相联系的时间序列模型;
S3:在第一票量历史信息中获得在每一年中每个法定节日假期的总票量以及每个法定节日假期的每日票量,获得各法定节日假期总票量之间的第一比值和各法定节日假期每日票量之间的第二比值,根据第一比值和第二比值建立法定节日假期票量预测模型;
S4:获得每一基准日期之前预设定天对基准日期的门票的预定量作为一特征变量,根据所述特征变量与所述基准日期的票量建立预设定天对应的票量回归模型;
S5:根据所述时间序列模型、法定节日假期票量预测模型以及票量回归模型择一进行每日票量预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为常规日期时,选择时间序列模型进行预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为节假日日期时,选择节假日票量预测模型进行预测,当待查询日期距当前查询日期的值小于预设定天数时,选择所述票量回归模型进行预测。
2.根据权利要求1所述的景点门票票量预测方法,其特征在于:所述步骤S1还包括如下步骤:
S101:将不同年份的每个法定节日假期对齐,将不同年份的非法定节日以每年第一周为基准对齐;
S102:当法定节日假期和非法定节日中的一日门票票量低于第一预设定门票阈值和高于第二预设定门票阈值时,对该日门票票量进行修正,所述修正为对该日门票票量修正为相邻两年份中与该日对齐日的门票票量平均值。
3.根据权利要求1所述的景点门票票量预测方法,其特征在于:在步骤S2中包括如下步骤:
S201:第二票量历史信息中的每日票量构成一时间序列样本,通过差分变化法对时间序列样本中的每一时间序列进行平稳化处理,具体公式为Yt=Xt-Xt-s,其中Yt为差分后时间序列的值,Xt为序号为t的时间序列的值,s为差分阶数,t为时间序列的序列号,Xt-s为序号为t-s的时间序列的值;
S202:对差分后的时间序列{Yt}建立多个时间序列模型,并计算每个时间序列模型的AIC值,选择其中AIC值最小的时间序列模型作为最优时间序列模型;
S203:计算时间序列样本的似然函数,求出使得所述似然函数达到极大值时最优时间序列模型各参数的极大似然估计值;
S204:计算Q统计量,其中检验的临界值由卡方分布获得,当Q统计量的值大于检验的临界值时,则最优时间序列模型拟合不显著,检验不通过;当Q统计量的值小于检验的临界值时,则最优时间序列模型拟合显著有效,检验通过,其中,T为时间序列样本个数,为时间序列样本残差的自相关系数,m为自由度,k为自由度序号。
4.根据权利要求1所述的景点门票票量预测方法,其特征在于:所述步骤S4包括如下步骤:
S401:选取多个特征变量形成样本集,多个所述特征变量包括基准日期前第一天、第二天、第三天、第四天、第五天的预订量,基准日期前第五天之前的所有预订量以及基准日期的日期类型、是否有景点活动以及天气类型,所述日期类型包括法定节日假期和非法定节日假期,所述是否有活动包括有景点活动和没有景点活动,所述天气类型包括晴天、阴天、小雨、中雨以及大雨;
S402:将样本集中80%的样本作为训练集,20%的样本作为测试集依次训练支持向量回归机模型、随机森林模型、XGBOOST模型;
S403:将支持向量回归机模型、随机森林模型、XGBOOST模型进行加权建立票量回归模型,其中支持向量回归机模型的权重值设为α,随机森林模型的权重值设为β,XGBOOST模型的权重设为(1-α-β),α、β和(1-α-β)的取值在0到1之间;
S404:以步长i进行搜索权重值α、β的最优值以使票量回归模型均方误差最小化,步长i的取值为0.01。
5.根据权利要求4所述的景点门票票量预测方法,其特征在于:步骤S401还包括如下步骤:
S4011:对特征变量进行z-score标准处理,计算公式为:zi=(xi-μ)/σ;zi为标准化处理后的特征变量值,xi为特征变量原始值,μ为对应特征变量的均值,σ为对应特征变量的标准差,i为特征变量的序号;
其中,所述法定节日假期作为特征变量时赋值为1,所述非法定节日假期作为特征变量时赋值为0,所述有景点活动的日期作为特征变量时赋值为1、所述没有景点活动的日期作为特征变量时赋值为0,所述晴天的日期作为特征变量时赋值为1、所述阴天的日期作为特征变量时赋值为2、所述小雨的日期作为特征变量时赋值为3、所述中雨的日期作为特征变量时赋值为4以及所述大雨的日期作为特征变量时赋值为5。
6.根据权利要求1所述的景点门票票量预测方法,其特征在于:所述法定节日假期包括元旦、春节、清明节、劳动节、端午节、中秋节以及国庆。
7.根据权利要求4所述的景点门票票量预测方法,其特征在于:重复执行步骤S401至S404,建立基准日期前第一天、第二天、第三天、第四天、第五天对应的票量回归模型。
8.一种景点门票票量预测系统,用于实现权利要求1至7中任意一项所述的景点门票票量预测方法,其特征在于,包括:
门票票量历史信息获取模块,用于获取一景点的每日门票票量历史信息,将所述每日门票票量历史信息分为预设的所有法定节日假期对应的第一票量历史信息以及所有非法定节日对应的第二票量历史信息;
时间序列模型建立模块,根据第二票量历史信息建立非法定节日中每一天与当天票量相联系的时间序列模型;
法定节日假期票量预测模型建立模块,用于在第一票量历史信息中获得在每一年中每个法定节日假期的总票量以及每个法定节日假期的每日票量,获得各法定节日假期总票量之间的第一比值和各法定节日假期每日票量之间的第二比值,根据第一比值和第二比值建立法定节日假期票量预测模型;
票量回归模型建立模块,获得每一基准日期之前预设定天对基准日期的门票的预订量作为一特征变量,根据所述特征变量与所述基准日期的票量建立预设定天对应的票量回归模型;
每日票量预测模块,用于根据所述时间序列模型、法定节日假期票量预测模型以及票量回归模型择一进行每日票量预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为常规日期时,选择时间序列模型进行预测,当待查询日期距当前查询日期的值大于等于预设定天数时且待查询日期为节假日日期时,选择节假日票量预测模型进行预测,当待查询日期距当前查询日期的值小于预设定天数时,选择所述票量回归模型进行预测。
9.一种景点门票票量预测设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任意一项所述景点门票票量预测方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至7中任意一项所述景点门票票量预测方法的步骤。
CN201711320700.9A 2017-12-12 2017-12-12 景点门票票量预测方法、系统、设备及存储介质 Active CN108053242B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711320700.9A CN108053242B (zh) 2017-12-12 2017-12-12 景点门票票量预测方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711320700.9A CN108053242B (zh) 2017-12-12 2017-12-12 景点门票票量预测方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN108053242A true CN108053242A (zh) 2018-05-18
CN108053242B CN108053242B (zh) 2021-02-09

Family

ID=62124420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711320700.9A Active CN108053242B (zh) 2017-12-12 2017-12-12 景点门票票量预测方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108053242B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110148025A (zh) * 2019-05-22 2019-08-20 郑州智通互联电子有限公司 一种基于大数据的景区智能售票系统
CN110555537A (zh) * 2018-05-30 2019-12-10 微软技术许可有限责任公司 多因素多时间点相关的预测
CN110866625A (zh) * 2018-08-28 2020-03-06 北京京东尚科信息技术有限公司 促销指标信息生成方法和装置
CN110866790A (zh) * 2019-11-26 2020-03-06 上海景域文化传播股份有限公司 一种景点门票销量预测系统及方法
CN111401940A (zh) * 2020-03-05 2020-07-10 杭州网易再顾科技有限公司 特征预测方法、装置、电子设备及存储介质
CN111435486A (zh) * 2019-01-15 2020-07-21 阿里巴巴集团控股有限公司 验票资源的调配方法及装置
CN111861000A (zh) * 2020-07-21 2020-10-30 携程计算机技术(上海)有限公司 基于历史数据的日收入预测方法、系统、设备及存储介质
CN111898786A (zh) * 2019-05-05 2020-11-06 顺丰科技有限公司 一种电子锁需求预测方法、系统、设备及存储介质
CN112488377A (zh) * 2020-11-25 2021-03-12 上海中通吉网络技术有限公司 快递日订单量的预测方法、装置、存储介质及电子设备
CN112734340A (zh) * 2021-01-21 2021-04-30 上海东普信息科技有限公司 快递件量的预测指标筛选方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850653A (zh) * 2015-06-03 2015-08-19 江苏马上游科技股份有限公司 一种基于流式数据挖掘的游客流量短时及趋势预测系统
CN104899663A (zh) * 2015-06-17 2015-09-09 北京奇虎科技有限公司 一种数据预测方法和装置
CN104899650A (zh) * 2015-05-26 2015-09-09 成都中科大旗软件有限公司 基于多源数据分析对旅游景区客流量进行预测的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899650A (zh) * 2015-05-26 2015-09-09 成都中科大旗软件有限公司 基于多源数据分析对旅游景区客流量进行预测的方法
CN104850653A (zh) * 2015-06-03 2015-08-19 江苏马上游科技股份有限公司 一种基于流式数据挖掘的游客流量短时及趋势预测系统
CN104899663A (zh) * 2015-06-17 2015-09-09 北京奇虎科技有限公司 一种数据预测方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈荣: "基于支持向量回归的旅游短期客流量预测模型研究", 《中国博士学位论文全文数据库经济与管理科学辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555537A (zh) * 2018-05-30 2019-12-10 微软技术许可有限责任公司 多因素多时间点相关的预测
CN110866625A (zh) * 2018-08-28 2020-03-06 北京京东尚科信息技术有限公司 促销指标信息生成方法和装置
CN111435486A (zh) * 2019-01-15 2020-07-21 阿里巴巴集团控股有限公司 验票资源的调配方法及装置
CN111435486B (zh) * 2019-01-15 2024-04-02 阿里巴巴集团控股有限公司 验票资源的调配方法及装置
CN111898786A (zh) * 2019-05-05 2020-11-06 顺丰科技有限公司 一种电子锁需求预测方法、系统、设备及存储介质
CN110148025A (zh) * 2019-05-22 2019-08-20 郑州智通互联电子有限公司 一种基于大数据的景区智能售票系统
CN110866790A (zh) * 2019-11-26 2020-03-06 上海景域文化传播股份有限公司 一种景点门票销量预测系统及方法
CN111401940A (zh) * 2020-03-05 2020-07-10 杭州网易再顾科技有限公司 特征预测方法、装置、电子设备及存储介质
CN111861000A (zh) * 2020-07-21 2020-10-30 携程计算机技术(上海)有限公司 基于历史数据的日收入预测方法、系统、设备及存储介质
CN112488377A (zh) * 2020-11-25 2021-03-12 上海中通吉网络技术有限公司 快递日订单量的预测方法、装置、存储介质及电子设备
CN112734340A (zh) * 2021-01-21 2021-04-30 上海东普信息科技有限公司 快递件量的预测指标筛选方法、装置、设备及存储介质
CN112734340B (zh) * 2021-01-21 2023-09-01 上海东普信息科技有限公司 快递件量的预测指标筛选方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN108053242B (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
CN108053242A (zh) 景点门票票量预测方法、系统、设备及存储介质
Chen et al. Plant diversity enhances productivity and soil carbon storage
Matthews et al. A global model of island species–area relationships
Ramachandran et al. Support from the relationship of genetic and geographic distance in human populations for a serial founder effect originating in Africa
CN109587713A (zh) 一种基于arima模型的网络指标预测方法、装置及存储介质
CN107689008A (zh) 一种用户投保行为预测的方法及装置
CN111932402A (zh) 一种基于相似日和lstm的短期电力负荷双向组合预测方法
CN108960520A (zh) 一种电力负荷预测方法、系统、计算机设备、介质
CN109697522A (zh) 一种数据预测的方法和装置
CN111680841B (zh) 基于主成分分析的短期负荷预测方法、系统及终端设备
CN113837488B (zh) 能源消耗数据预测方法、系统、设备
CN112308281A (zh) 一种温度信息预测方法及装置
CN116205355B (zh) 电力负荷的预测方法、装置以及存储介质
CN108830417B (zh) 一种基于arma和回归分析的生活能源消费预测方法及系统
CN107730097B (zh) 一种母线负荷预测方法、装置及计算设备
CN113743673B (zh) 一种台风期间的电力负荷预测方法
CN110598775B (zh) 基于模糊聚类和bp神经网络的预测方法、系统及存储介质
CN108805174A (zh) 聚类方法及装置
CN109598052A (zh) 基于相关系数分析的智能电表寿命周期预测方法及装置
CN109615414A (zh) 房产预估方法、装置及存储介质
Zechar et al. A parimutuel gambling perspective to compare probabilistic seismicity forecasts
CN111080037A (zh) 一种基于深度神经网络的短期电力负荷预测方法及装置
CN115187134A (zh) 基于网格的配电网规划方法、装置及终端设备
CN103942403B (zh) 一种对海量变量进行筛选的方法及设备
JPH08308108A (ja) 電力需要量予測方法およびその装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant