CN111476409A - 一种新航线开通的预测方法、系统及设备 - Google Patents
一种新航线开通的预测方法、系统及设备 Download PDFInfo
- Publication number
- CN111476409A CN111476409A CN202010239436.1A CN202010239436A CN111476409A CN 111476409 A CN111476409 A CN 111476409A CN 202010239436 A CN202010239436 A CN 202010239436A CN 111476409 A CN111476409 A CN 111476409A
- Authority
- CN
- China
- Prior art keywords
- airport
- coordinates
- target
- preset
- passenger
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000003064 k means clustering Methods 0.000 claims description 16
- 238000007621 cluster analysis Methods 0.000 claims description 13
- 230000004308 accommodation Effects 0.000 description 10
- 230000009286 beneficial effect Effects 0.000 description 10
- 238000006073 displacement reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0835—Relationships between shipper or supplier and carriers
- G06Q10/08355—Routing methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及一种新航线开通的预测方法、系统和电子设备,涉及航空信息技术领域,所述预测方法具体通过对乘客的常住地坐标进行聚类分析后得到两个最终聚类中心,根据距离所述两个最终聚类中心最近的第一预设机场和第二预设机场,确定拟开航线,以便于每个乘客出行乘坐,使新开航线基于乘客流量为导向进行决策,提高准确度,这样可以保证新开通航线的客座率达到新开航线的要求,从而保障新开航线的运营收益,且有利于提高航空公司的航线布局的合理性。
Description
技术领域
本发明涉及航空信息技术领域,尤其涉及一种新航线开通的预测方法、系统及电子设备。
背景技术
随着机场业私有化和区域一体化进程的推进,机场间的竞争日趋激烈,同时,全国运输机场及连接机场的航线数量呈现快速增加,因此,航空公司对新航线开通的决策具有重要的现实意义,目前,航空公司往往采用时间序列预测法和计量经济预测方法来进行航线预测,具体地:
1)时间序列方法,主要是以过去一年或多年以上的营业数据作为基础预知未来新开航线的营业情况,其基本假设是过去影响市场的各种因素今后仍将继续存在,唯一变化的是时间,但预测的结果往往比较粗糙,可靠性较差,进而影响新开航线的运营收益;
2)计量经济预测方法,主要是用票价水平、居民收入水平和时间趋势等其他因素来回归分析未来的乘客需求量。由于要求的自变量涉及的自变量,例如居民收入水平等来自其他预测,因此自变量的预测误差会很大程度上影响航空旅客需求量的预测,不能保证新开航线的客座率,进而影响新开航线的运营收益;
因此,如何提供一种精确地新航线开通的预测方法以提高新开航线的运营收益是业内亟待解决的技术问题。
发明内容
针对现有技术中因时间序列预测的结果粗糙导致的可靠性差,以及计量经济预测方法中自变量预测误差大,无法保证新开航线的客座率,而导致降低新开航线的运营收益,本发明提供了一种新航线开通的预测方法、系统及电子设备,目的在于通过对乘客的常住地坐标进行聚类分析后确定拟开航线,从而使新开航线基于乘客流量为导向进行决策,提高准确度,既可以保证新开航线的客座率又有利于提高新开航线的运营收益。
本发明的一种新航线开通的预测方法的技术方案如下:
获取在预选的第一机场的第一预设距离范围内的所有目标机场,得到第一目标机场集合,获取在预选的第二机场的第二预设距离范围内的所有目标机场,得到第二目标机场集合,将所述第一机场、所述第一目标机场集合中的所有目标机场、所述第二机场和所述第二目标机场集合中的所有目标机场标记为总机场集合;
获取所述总机场集合中的各机场之间已在飞航线在预设时间段内的每个乘客的常住地坐标,根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,其中,N为正整数;
对N个目标常住地坐标进行聚类分析后得到第一最终聚类中心和第二最终聚类中心,将所述第一最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第一预设机场,将所述第二最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第二预设机场,并将所述第一预设机场和所述第二预设机场之间的航线确定为拟开航线。
本发明的一种新航线开通的预测方法的有益效果如下:
在预选第一机场和第二机场的同时,并获取第一机场的第一预设距离范围内的所有目标机场和第二机场的第二预设距离范围内的所有目标机场,且根据各机场之间已在飞航线在预设时间段内的每个乘客的常住地坐标得到N个目标常住地坐标,然后对N个目标常住地坐标进行聚类分析后得到两个最终聚类中心,此时根据两个最终聚类中心确定出最便于每个乘客出行乘坐的第一预设机场和第二预设机场,因此将第一预设机场和第二预设机场之间的航线确定为拟开航线,使新开航线基于乘客流量为导向进行决策,提高准确度,这样可以保证拟开航线的客座率达到新开航线的要求,从而保障新开航线的运营收益,且有利于提高航空公司的航线布局的合理性。
在上述方案的基础上,本发明的一种新航线开通的预测方法还可以做如下改进。
进一步,所述对N个目标常住地坐标进行聚类分析后得到第一最终聚类中心和第二最终聚类中心,包括:
将从所述N个目标常住地坐标中选取的K1个目标常住地坐标作为第一初始聚类中心,并基于K-means聚类算法得到K1个第一聚类中心;
将从所述K1个第一聚类中心中选取的K2个第一聚类中心作为第二初始聚类中心,并基于K-means聚类算法得到K2个第二聚类中心,直至得到所述第一最终聚类中心和所述第二最终聚类中心,其中,K1、K2均为正整数且K2<N,K2<K1。
采用上述进一步方案的有益效果是:采用逐渐减少聚类中心数量的方式来获取两个最终聚类中心,简化了聚类分析复杂度,有利于提高乘客常住地坐标的聚类分析效率,从而更快速的确定拟开航线。
进一步,所述根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,包括:
判断任一乘客的常住地坐标到剩余的每个常住地坐标的距离是否均大于第一预设距离阈值,若是,则删除该乘客的常住地坐标,若否,则保留该乘客的常住地坐标,直至对每个乘客的常住地坐标进行判断后得到N个目标常住地坐标。
采用上述进一步方案的有益效果是:通过删除部分因分布太分散、距离其它乘客太远的常住地坐标,有效的解决了部分乘客的常住地坐标分布太分散而导致聚类结果不准确的问题,从而提高了乘客常住地坐标聚类分析的效率和准确性。
进一步,所述根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,包括:
获取所述总机场集合中的各机场之间已在飞航线的在预设时间段内的每个乘客的乘机次数;
判断所述N1个常住地坐标中任一常住地坐标到剩余的每个常住地坐标的距离是否均大于第二预设距离阈值,若是,则删除该常住地坐标,若否,则保留该常住地坐标,直至对每个常住地坐标进行判断后得到所述N个目标常住地坐标。
采用上述进一步方案的有益效果是:一方面避免了某些乘客在预设时间段内出行多次,而导致其对应的常住地坐标在进行聚类分析中只使用一次而带来的误差,以便进一步提高聚类分析的准确度,从而提高拟开航线预测的准确性,另一方面,通过第二预设距离阈值删除部分常住地坐标,减少计算量,提高效率。
本发明的一种新航线开通的预测系统的技术方案如下:
包括:预选模块、处理模块和预测模块,
所述预选模块用于:获取在预选的第一机场的第一预设距离范围内的所有目标机场,得到第一目标机场集合,获取在预选的第二机场的第二预设距离范围内的所有目标机场,得到第二目标机场集合,将所述第一机场、所述第一目标机场集合中的所有目标机场、所述第二机场和所述第二目标机场集合中的所有目标机场标记为总机场集合;
所述处理模块用于获取所述总机场集合中的各机场之间已在飞航线在预设时间段内的每个乘客的常住地坐标,根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,其中,N为正整数;
所述预测模块用于对N个目标常住地坐标进行聚类分析后得到第一最终聚类中心和第二最终聚类中心,将所述第一最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第一预设机场,将所述第二最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第二预设机场,并将所述第一预设机场和所述第二预设机场之间的航线确定为拟开航线。
本发明的一种新航线开通的预测系统的有益效果如下:
在预选第一机场和第二机场的同时,并获取第一机场的第一预设距离范围内的所有目标机场和第二机场的第二预设距离范围内的所有目标机场,且根据各机场之间已在飞航线在预设时间段内的每个乘客的常住地坐标得到N个目标常住地坐标,然后对N个目标常住地坐标进行聚类分析后得到两个最终聚类中心,此时根据两个最终聚类中心确定出最便于每个乘客出行乘坐的第一预设机场和第二预设机场,因此将第一预设机场和第二预设机场之间的航线确定为拟开航线,使新开航线基于乘客流量为导向进行决策,提高准确度,这样可以保证拟开航线的客座率达到新开航线的要求,从而保障新开航线的运营收益,且有利于提高航空公司的航线布局的合理性。
在上述方案的基础上,本发明的一种新航线开通的预测系统还可以做如下改进。
所述预测模块具体用于:
将从所述N个目标常住地坐标中选取的K1个目标常住地坐标作为第一初始聚类中心,并基于K-means聚类算法得到K1个第一聚类中心,将从所述K1个第一聚类中心中选取的K2个第一聚类中心作为第二初始聚类中心,并基于K-means聚类算法计算出K2个第二聚类中心,直至得到两个所述最终聚类中心,其中,K1、K2均为正整数且K2<N,K2<K1。
采用上述进一步方案的有益效果是:采用逐渐减少聚类中心数量的方式来获取两个最终聚类中心,简化了聚类分析复杂度,有利于提高乘客常住地坐标的聚类分析效率,从而更快速的确定拟开航线。
进一步,所述处理模块具体用于:判断任一乘客的常住地坐标到剩余的每个常住地坐标的距离是否均大于第一预设距离阈值,若是,则删除该乘客的常住地坐标,若否,则保留该乘客的常住地坐标,直至对每个乘客的常住地坐标进行判断后得到所述N个目标常住地坐标。
采用上述进一步方案的有益效果是:通过删除部分因分布太分散、距离其它乘客太远的常住地坐标,有效的解决了部分乘客的常住地坐标分布太分散而导致聚类结果不准确的问题,从而提高了乘客常住地坐标聚类分析的效率和准确性。
进一步,所述处理模块还具体用于获取所述总机场集合中的各机场之间已经在飞航线的在预设时间段内的每个乘客的乘机次数;
判断所述N1个常住地坐标中任一常住地坐标到剩余的每个常住地坐标的距离是否均大于第二预设距离阈值,若是,则删除该常住地坐标,若否,则保留该常住地坐标,直至对每个常住地坐标进行判断后得到所述N个目标常住地坐标。
采用上述进一步方案的有益效果是:一方面避免了某些乘客在预设时间段内出行多次,而导致其对应的常住地坐标在进行聚类分析中只使用一次而带来的误差,可进一步提高聚类分析的准确度,从而提高拟开航线预测的准确性,另一方面,通过第二预设距离阈值删除部分常住地坐标,减少计算量,提高效率。
本发明的一种电子设备的技术方案如下:包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,所述处理器执行所述程序时实现上述任一项所述的一种新航线开通的预测方法的部分或全部步骤。
附图说明
图1为本发明实施例的一种新航线开通的预测方法的流程示意图;
图2为本发明实施例的一种新航线开通的预测系统的结构示意图;
图3为本发明实施例的一种电子设备的结构示意图。
具体实施方式
如图1所示,本发明实施例的一种新航线开通的预测方法,包括如下步骤:
S1、获取在预选的第一机场的第一预设距离范围内的所有目标机场,得到第一目标机场集合,获取在预选的第二机场的第二预设距离范围内的所有目标机场,得到第二目标机场集合,将所述第一机场、所述第一目标机场集合中的所有目标机场、所述第二机场和所述第二目标机场集合中的所有目标机场标记为总机场集合;
假设预选的第一机场为A机场,预选的第二机场为B机场,将第一预设距离和第二预设距离均设置为200km,在A机场的200km范围内的所有目标机场为C机场,即第一目标机场集合中包括C机场,在B机场的200km范围内的所有目标机场为D机场,即第二目标机场集合中包括D机场,总机场集合中包括A机场、B机场、C机场和D机场。
S2、获取所述总机场集合中的各机场之间已在飞航线在预设时间段内的每个乘客的常住地坐标,根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,其中,N为正整数;
以上述为例说明,获取A机场、B机场、C机场和D机场相互之间已在飞航线在预设时间段内的每个乘客的常住地坐标,为便于表述,用横杠“—”来进行表示,例如“A机场—B机场”表示A机场直飞至B机场,“A机场—B机场—C机场”表示A机场经B机场中转至C机场,那么A机场、B机场、C机场和D机场相互之间能形成的航线包括:A机场—B机场、A机场—C机场、A机场—D机场、B机场—C机场、B机场—D机场、C机场—D机场、A机场—B机场—C机场、A机场—B机场—D机场、A机场—C机场—D机场等,获取A机场、B机场、C机场和D机场相互形成的航线中的已在飞航线,例如A机场—B机场、A机场—D机场均为已在飞航线,则获取A机场—B机场和A机场—D机场在预设时间段如一年或一个月内的每个乘客的常住地坐标。
其中,每名乘客的常住地坐标可通过如下方式进行确定:
通过每名乘客的位移数据信息来确定其常住地坐标,其中,位移数据信息包括时间数据和各时间点对应的坐标,具体地:
乘客所携带的移动终端如手机和平板电脑等均会随时保存日志文件,以预设频率采集各乘客所携带的移动终端如手机、平板电脑的日志文件,并从各日志文件识别并提取出时间数据和各时间点对应的坐标,其中坐标数据为经纬度,由此可精确地确定乘客的位移数据信息,然后,选取乘客停留时间最长所对应的坐标即为该乘客的常住地坐标,其中,预设频率可设置为1分钟/次、2分钟/次等,然后根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标。
上述根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,其实施方式可为:
判断任一乘客的常住地坐标到剩余的每个常住地坐标的距离是否均大于第一预设距离阈值,若是,则删除该乘客的常住地坐标,若否,则保留该乘客的常住地坐标,直至对每个乘客的常住地坐标进行判断后得到N个目标常住地坐标。
举例说明,从A机场—B机场和A机场—D机场在预设时间段如一年或一个月内的乘客的数量为10000个,得到每个乘客的常住地坐标,故常住地坐标为10000个,设置第一预设距离阈值为30km,假如第一个乘客的常住地坐标距离剩余的9999个乘客的常住地坐标均大于30km,也就是说,该乘客30km内不存在其他乘客,第一个乘客周围的乘客密度较低,因此将第一个乘客的常住地坐标删除,直至对每个乘客的常住地坐标进行判断后得到8000个目标常住地坐标,即从10000个常住地坐标降至8000个目标常住地坐标,通过删除部分因分布太分散、距离其它乘客太远的常住地坐标,有效的解决了部分乘客的常住地坐标分布太分散而导致聚类结果不准确的问题,从而提高了乘客常住地坐标聚类分析的效率和准确性。
或者,根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,其实施方式还可为:
获取所述总机场集合中的各机场之间已经在飞航线的在预设时间段内的每个乘客的乘机次数;
判断所述N1个常住地坐标中任一常住地坐标到剩余的每个常住地坐标的距离是否均大于第二预设距离阈值,若是,则删除该常住地坐标,若否,则保留该常住地坐标,直至对每个常住地坐标进行判断后得到所述N个目标常住地坐标。
举例说明,从A机场—B机场和A机场—D机场在预设时间段内的乘客的数量为10000个,预设时间段可为一年或一个月,分别获取每个乘客在预设时间段内的常住地坐标,一个乘客在预设时间段内对应一个常住地坐标,则此时所获得的常住地坐标的数量为10000个,但由于有些乘客在预设时间段内出行了多次,因此为避免该类乘客的常住地坐标在进行聚类分析时只使用一次而带来的误差,以便进一步提高聚类分析的准确度,从而提高拟开航线预测的准确性。本发明实施例中,通过获取所述总机场集合中的各机场之间已在飞航线的在预设时间段内的每个乘客的乘机次数,然后根据每个乘客的常住地坐标和乘机次数,得到N1个常住地坐标,其中其中x为乘客数量,ni为第i个乘客的常住地坐标对应的乘机次数,1≤i≤x,N1、x和i为正整数。
以上述例子说明,某乘客在预设时间段内出行了10次,则提取该乘客常住地坐标10次,则此时,获得的常住地坐标的数量为10009个,依此类推,遍历每一个乘客的常住地坐标对应的乘机次数n,则利用上述公式计算得到所有乘客在预设时间段内总的常住地坐标的数量,即N1。
判断所述N1个常住地坐标中任一常住地坐标到剩余的每个常住地坐标的距离是否均大于第二预设距离阈值,若是,则删除该常住地坐标,若否,则保留该常住地坐标,直至对每个常住地坐标进行判断后得到N个目标常住地坐标,具体地:
设置第二预设距离阈值为30km,假如第一个常住地坐标距离剩余的14999个常住地坐标均大于30km,也就是说,该第一个常住地坐标的30km内不存在其它常住地坐标,第一个常住地坐标周围的常住地坐标密度较低,因此将第第一个常住地坐标删除,直至对每个常住地坐标进行判断后得到8000个目标常住地坐标,即从15000个常住地坐标降至8000个目标常住地坐标。
通过获取每个乘客的乘机次数,根据每个乘客的常住地坐标和乘机次数,得到N1个常住地坐标,再根据常住地坐标的分布情况,确定N个目标常住地坐标,一方面避免了某些乘客在预设时间段内出行多次,而导致其对应的常住地坐标在进行聚类分析中只使用一次而带来的误差,以便进一步提高聚类分析的准确度,从而提高拟开航线预测的准确性,另一方面,通过第二预设距离阈值删除部分常住地坐标,减少计算量,提高效率。
下面通过另外一个实例对引入每个乘客的乘机次数后能提高拟开航线预测的准确性进行说明,具体地:
假如上述10000个乘客中,有1000个第一乘客的乘机次数分别为10次,另外有1000个第二乘客的的乘机次数分别为1次,且假设1000个第一乘客分布在直径为20km的范围内,而1000个第二乘客分布在直径为17km的范围内,若假如对1000个第一乘客的常住地坐标使用一次时,则共有2000个常住地坐标,此时,进行聚类分析时,由于1000个第一乘客的常住地坐标分布在直径为20km的范围内的密度要小于1000个第二乘客的常住地坐标分布在直径为17km的范围内的密度,则第一最终聚类中心和第二最终聚类中心分布在1000个第二乘客的概率要明显高于第一最终聚类中心和第二最终聚类中心分布在1000个第一乘客的概率,但实际上,由于1000个第一乘客的乘机次数分别为10次,根据每个第一乘客的常住地坐标和乘机次数,得到10000个常住地坐标,这10000个常住地坐标分布在直径为20km的范围内的密度要远超过1000个第二乘客的常住地坐标分布在直径为17km范围内的密度,则第一最终聚类中心和第二最终聚类中心分布在第一乘客的常住地坐标的概率要明显高于第一最终聚类中心和第二最终聚类中心分布在1000个第二乘客的概率,因此,通过引入每个乘客的乘机次数,能进一步提高聚类分析的准确度,从而提高拟开航线预测的准确性。
S3、对N个目标常住地坐标进行聚类分析后得到第一最终聚类中心和第二最终聚类中心,将所述第一最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第一预设机场,将所述第二最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第二预设机场,并将所述第一预设机场和所述第二预设机场之间的航线确定为拟开航线。
对N个目标常住地坐标进行聚类分析后得到第一最终聚类中心和第二最终聚类中心,具体的实施方式可为:
将从所述N个目标常住地坐标中选取的K1个目标常住地坐标作为第一初始聚类中心,并基于K-means聚类算法得到K1个第一聚类中心,其中,K1为正整数且K1<N;
将从所述K1个第一聚类中心中选取的K2个第一聚类中心作为第二初始聚类中心,并基于K-means聚类算法得到K2个第二聚类中心,直至得到所述第一最终聚类中心和所述第二最终聚类中心,其中,K2均为正整数K2<K1。
具体的,假设得到8000个目标常住地坐标,对8000个目标常住地坐标进行聚类分析后得到两个最终聚类中心,其中,可采用K-means聚类算法进行聚类分析。在此可将每个目标常住地坐标看做是一个数据点,并预先将8000个目标常住地坐标分为2组,则随机将2个目标常住地坐标作为2个初始聚类中心,然后计算每个目标常住地坐标分别与上述2个初始聚类中心的距离,把每个目标常住地坐标分配给距离最小的初始聚类中心,两个初始聚类中心以及各自分配给它们的目标常住地坐标就代表一个聚类,每分配一个目标常住地坐标,聚类的聚类中心会根据聚类中现有的目标常住地坐标被重新计算。这个过程将不断重复直到满足某个终止条件,其中终止条件没有聚类中心再发生变化,此时得到两个最终聚类中心,可以理解的是,两个最终聚类中心是8000个目标常住地坐标中的两个目标常住地坐标。
例如,从上述8000个目标常住地坐标中选取500个目标常住地坐标作为第一初始聚类中心,即K1=500,然后参照上述方法并通过K-means聚类算法计算出500个第一聚类中心;再从500个第一聚类中心中选取100个第一聚类中心作为第二初始聚类中心,即K2=100,然后参照上述方法并通过K-means聚类算法计算出100个第二聚类中心,再从100个第二聚类中心中选取K3个第二聚类中心作为第三初始聚类中心,可设置K3=20,然后参照上述方法并通过K-means聚类算法计算出20个第三最终聚类中心,依次类推,直至得到两个最终聚类中心。采用逐渐减少聚类中心数量的方式来获取两个最终聚类中心,简化了聚类分析复杂度,有利于提高乘客常住地坐标的聚类分析效率,从而更快速的确定拟开航线。其中,K1、K2、K3、……等可根据实际情况进行设置,在此不做赘述。
将所述第一最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第一预设机场,将所述第二最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第二预设机场,并将所述第一预设机场和所述第二预设机场之间的航线确定为拟开航线,其实施方式可为:
例如,得到第一最终聚类中心分别到A机场、B机场、C机场和D机场的距离,进行比较后若A机场到第一最终聚类中心之间的距离为最小值,则将A机场作为第一预设机场;
得到第二最终聚类中心分别到A机场、B机场、C机场和D机场的距离,进行比较后若D机场到第二最终聚类中心之间的距离为最小值,则将D机场作为第二预设机场;
此时根据两个最终聚类中心确定出最便于每个乘客出行乘坐的A机场和D机场,因此将A机场和D机场之间的航线即A机场—D机场确定为拟开航线。
本发明实施例中,在预选第一机场和第二机场的同时,并获取第一机场的第一预设距离范围内的所有目标机场和第二机场的第二预设距离范围内的所有目标机场,且根据各机场之间已在飞航线在预设时间段内的每个乘客的常住地坐标得到N个目标常住地坐标,然后对N个目标常住地坐标进行聚类分析后得到两个最终聚类中心,此时根据两个最终聚类中心确定出最便于每个乘客出行乘坐的第一预设机场和第二预设机场,因此将第一预设机场和第二预设机场之间的航线确定为拟开航线,使新开航线基于乘客流量为导向进行决策,提高准确度,这样可以保证拟开航线的客座率达到新开航线的要求,从而保障新开航线的运营收益,且有利于提高航空公司的航线布局的合理性。
在上述各实施例中,虽然对步骤进行进行了编号S1、S2等,但只是本申请给出的具体实施例,本领域的技术人员可根据实际情况对S1、S2等的执行顺序进行调整,此也在本发明的保护范围内。
如图2所示,本发明实施例的一种新航线开通的预测系统200,包括:预选模块210、处理模块220和预测模块230,
所述预选模块210用于:获取在预选的第一机场的第一预设距离范围内的所有目标机场,得到第一目标机场集合,获取在预选的第二机场的第二预设距离范围内的所有目标机场,得到第二目标机场集合,将所述第一机场、所述第一目标机场集合中的所有目标机场、所述第二机场和所述第二目标机场集合中的所有目标机场标记为总机场集合;
所述处理模块220用于获取所述总机场集合中的各机场之间已在飞航线在预设时间段内的每个乘客的常住地坐标,根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,其中,N为正整数;
所述预测模块230用于对N个目标常住地坐标进行聚类分析后得到第一最终聚类中心和第二最终聚类中心,将所述第一最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第一预设机场,将所述第二最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第二预设机场,并将所述第一预设机场和所述第二预设机场之间的航线确定为拟开航线。
本发明实施例中,在预选第一机场和第二机场的同时,并获取第一机场的第一预设距离范围内的所有目标机场和第二机场的第二预设距离范围内的所有目标机场,且根据各机场之间已在飞航线在预设时间段内的每个乘客的常住地坐标得到N个目标常住地坐标,然后对N个目标常住地坐标进行聚类分析后得到两个最终聚类中心,此时根据两个最终聚类中心确定出最便于每个乘客出行乘坐的第一预设机场和第二预设机场,因此将第一预设机场和第二预设机场之间的航线确定为拟开航线,使新开航线基于乘客流量为导向进行决策,提高准确度,这样可以保证拟开航线的客座率达到新开航线的要求,从而保障新开航线的运营收益,且有利于提高航空公司的航线布局的合理性。
较优地,在上述技术方案中,所述预测模块230具体用于:
将从所述N个目标常住地坐标中选取的K1个目标常住地坐标作为第一初始聚类中心,并基于K-means聚类算法得到K1个第一聚类中心,将从所述K1个第一聚类中心中选取的K2个第一聚类中心作为第二初始聚类中心,并基于K-means聚类算法计算出K2个第二聚类中心,直至得到两个所述最终聚类中心,其中,K1、K2均为正整数且K2<N,K2<K1。
采用逐渐减少聚类中心数量的方式来获取两个最终聚类中心,简化了聚类分析复杂度,有利于提高乘客常住地坐标的聚类分析效率,从而更快速的确定拟开航线。
较优地,在上述技术方案中,所述处理模块220具体用于:判断任一乘客的常住地坐标到剩余的每个常住地坐标的距离是否均大于第一预设距离阈值,若是,则删除该乘客的常住地坐标,若否,则保留该乘客的常住地坐标,直至对每个乘客的常住地坐标进行判断后得到所述N个目标常住地坐标。
通过删除部分因分布太分散、距离其它乘客太远的常住地坐标,有效的解决了部分乘客的常住地坐标分布太分散而导致聚类结果不准确的问题,从而提高了乘客常住地坐标聚类分析的效率和准确性。
较优地,在上述技术方案中,所述处理模块220还用于获取所述总机场集合中的各机场之间已经在飞航线的在预设时间段内的每个乘客的乘机次数;
判断所述N1个常住地坐标中任一常住地坐标到剩余的每个常住地坐标的距离是否均大于第二预设距离阈值,若是,则删除该常住地坐标,若否,则保留该常住地坐标,直至对每个常住地坐标进行判断后得到所述N个目标常住地坐标。
一方面避免了某些乘客在预设时间段内出行多次,而导致其对应的常住地坐标在进行聚类分析中只使用一次而带来的误差,以便进一步提高聚类分析的准确度,从而提高拟开航线预测的准确性,另一方面,通过第二预设距离阈值删除部分常住地坐标,减少计算量,提高效率。
需要说明的是,上述关于本发明的一种新航线开通的预测系统200中的各参数和各个单元模块实现相应功能的步骤,可参考上文中关于一种新航线开通的预测方法的实施例中的各参数和步骤,在此不做赘述。
如图3所示,本发明实施例的一种电子设备300,包括存储器310、处理器320及存储在所述存储器上并在所述处理器上运行的程序330,所述处理器320执行所述程序330时实现上述任意一种新航线开通的预测方法实施例中的部分或全部步骤。
其中,电子设备可以选用电脑、手机等,相对应地,其程序为电脑软件或手机APP等,且上述关于本发明的一种电子设备中的各参数和步骤,可参考上文中一种新航线开通的预测方法的实施例中的各参数和步骤,在此不做赘述。
在本发明中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (9)
1.一种新航线开通的预测方法,其特征在于,包括:
获取在预选的第一机场的第一预设距离范围内的所有目标机场,得到第一目标机场集合,获取在预选的第二机场的第二预设距离范围内的所有目标机场,得到第二目标机场集合,将所述第一机场、所述第一目标机场集合中的所有目标机场、所述第二机场和所述第二目标机场集合中的所有目标机场标记为总机场集合;
获取所述总机场集合中的各机场之间已在飞航线在预设时间段内的每个乘客的常住地坐标,根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,其中,N为正整数;
对N个目标常住地坐标进行聚类分析后得到第一最终聚类中心和第二最终聚类中心,将所述第一最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第一预设机场,将所述第二最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第二预设机场,并将所述第一预设机场和所述第二预设机场之间的航线确定为拟开航线。
2.根据权利要求1所述的新航线开通的预测方法,其特征在于,所述对N个目标常住地坐标进行聚类分析后得到第一最终聚类中心和第二最终聚类中心,包括:
将从所述N个目标常住地坐标中选取的K1个目标常住地坐标作为第一初始聚类中心,并基于K-means聚类算法得到K1个第一聚类中心;
将从所述K1个第一聚类中心中选取的K2个第一聚类中心作为第二初始聚类中心,并基于K-means聚类算法得到K2个第二聚类中心,直至得到所述第一最终聚类中心和所述第二最终聚类中心,其中,K1、K2均为正整数且K2<N,K2<K1。
3.根据权利要求1或2所述的新航线开通的预测方法,其特征在于,所述根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,包括:
判断任一乘客的常住地坐标到剩余的每个常住地坐标的距离是否均大于第一预设距离阈值,若是,则删除该乘客的常住地坐标,若否,则保留该乘客的常住地坐标,直至对每个乘客的常住地坐标进行判断后得到所述N个目标常住地坐标。
5.一种新航线开通的预测系统,其特征在于,包括:预选模块、处理模块和预测模块,
所述预选模块用于:获取在预选的第一机场的第一预设距离范围内的所有目标机场,得到第一目标机场集合,获取在预选的第二机场的第二预设距离范围内的所有目标机场,得到第二目标机场集合,将所述第一机场、所述第一目标机场集合中的所有目标机场、所述第二机场和所述第二目标机场集合中的所有目标机场标记为总机场集合;
所述处理模块用于获取所述总机场集合中的各机场之间已在飞航线在预设时间段内的每个乘客的常住地坐标,根据预设条件将每个乘客的常住地坐标进行处理后得到N个目标常住地坐标,其中,N为正整数;
所述预测模块用于对N个目标常住地坐标进行聚类分析后得到第一最终聚类中心和第二最终聚类中心,将所述第一最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第一预设机场,将所述第二最终聚类中心与所述总机场集合中各机场之间的距离值中最小距离值对应的机场作为第二预设机场,并将所述第一预设机场和所述第二预设机场之间的航线确定为拟开航线。
6.根据权利要求5所述的新航线开通的预测系统,其特征在于,所述预测模块具体用于:
将从所述N个目标常住地坐标中选取的K1个目标常住地坐标作为第一初始聚类中心,并基于K-means聚类算法得到K1个第一聚类中心,将从所述K1个第一聚类中心中选取的K2个第一聚类中心作为第二初始聚类中心,并基于K-means聚类算法得到K2个第二聚类中心,直至得到所述第一最终聚类中心和所述第二最终聚类中心,其中,K1、K2均为正整数且K2<N,K2<K1。
7.根据权利要求5或6所述的新航线开通的预测系统,其特征在于,
所述处理模块具体用于:判断任一乘客的常住地坐标到剩余的每个常住地坐标的距离是否均大于第一预设距离阈值,若是,则删除该乘客的常住地坐标,若否,则保留该乘客的常住地坐标,直至对每个乘客的常住地坐标进行判断后得到所述N个目标常住地坐标。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述的一种新航线开通的预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010239436.1A CN111476409B (zh) | 2020-03-30 | 2020-03-30 | 一种新航线开通的预测方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010239436.1A CN111476409B (zh) | 2020-03-30 | 2020-03-30 | 一种新航线开通的预测方法、系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111476409A true CN111476409A (zh) | 2020-07-31 |
CN111476409B CN111476409B (zh) | 2023-07-18 |
Family
ID=71749289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010239436.1A Active CN111476409B (zh) | 2020-03-30 | 2020-03-30 | 一种新航线开通的预测方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111476409B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112000716A (zh) * | 2020-08-26 | 2020-11-27 | 携程旅游网络技术(上海)有限公司 | 航线推送方法、系统、电子设备和存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140089036A1 (en) * | 2012-09-26 | 2014-03-27 | Xerox Corporation | Dynamic city zoning for understanding passenger travel demand |
CN108391235A (zh) * | 2018-02-13 | 2018-08-10 | 中国联合网络通信集团有限公司 | 一种数据分析方法及装置 |
CN109145989A (zh) * | 2018-08-22 | 2019-01-04 | 深圳市东部公共交通有限公司 | 公交站点布设方法、装置及计算机终端 |
CN109376207A (zh) * | 2018-09-18 | 2019-02-22 | 同济大学 | 从手机信令数据中提取高速列车乘客常住地的方法 |
WO2019056355A1 (en) * | 2017-09-25 | 2019-03-28 | Beijing Didi Infinity Technology And Development Co., Ltd. | SYSTEM AND METHOD FOR PROVIDING A TRANSPORT SERVICE |
CN110020980A (zh) * | 2019-04-08 | 2019-07-16 | 江苏号百信息服务有限公司 | 基于手机信令数据的机场到发旅客识别与客情分析方法 |
CN110113718A (zh) * | 2019-05-31 | 2019-08-09 | 南京瑞栖智能交通技术产业研究院有限公司 | 一种基于手机信令数据的铁路交通枢纽人口类型识别方法 |
CN110363433A (zh) * | 2019-07-17 | 2019-10-22 | 携程旅游网络技术(上海)有限公司 | 新开航线的评估方法、系统、电子设备和介质 |
CN110852792A (zh) * | 2019-10-28 | 2020-02-28 | 海南太美航空股份有限公司 | 一种基于大数据分析的航线价值评估方法及相关产品 |
CN110929945A (zh) * | 2019-11-28 | 2020-03-27 | 海南太美航空股份有限公司 | 一种航线开通的预测方法、系统及电子设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104751536A (zh) * | 2013-12-25 | 2015-07-01 | 中兴通讯股份有限公司 | 一种公交站点优化评估方法和系统 |
CN105427003A (zh) * | 2015-12-30 | 2016-03-23 | 北京航空航天大学 | 一种基于出行需求分析的公交站点部署方法 |
CN106875066B (zh) * | 2017-02-28 | 2021-06-11 | 百度在线网络技术(北京)有限公司 | 用车出行行为的预测方法、装置、服务器以及存储介质 |
CN108171452B (zh) * | 2017-12-08 | 2022-04-05 | 苏宁易购集团股份有限公司 | 一种快递点选址方法及装置 |
-
2020
- 2020-03-30 CN CN202010239436.1A patent/CN111476409B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140089036A1 (en) * | 2012-09-26 | 2014-03-27 | Xerox Corporation | Dynamic city zoning for understanding passenger travel demand |
WO2019056355A1 (en) * | 2017-09-25 | 2019-03-28 | Beijing Didi Infinity Technology And Development Co., Ltd. | SYSTEM AND METHOD FOR PROVIDING A TRANSPORT SERVICE |
CN108391235A (zh) * | 2018-02-13 | 2018-08-10 | 中国联合网络通信集团有限公司 | 一种数据分析方法及装置 |
CN109145989A (zh) * | 2018-08-22 | 2019-01-04 | 深圳市东部公共交通有限公司 | 公交站点布设方法、装置及计算机终端 |
CN109376207A (zh) * | 2018-09-18 | 2019-02-22 | 同济大学 | 从手机信令数据中提取高速列车乘客常住地的方法 |
CN110020980A (zh) * | 2019-04-08 | 2019-07-16 | 江苏号百信息服务有限公司 | 基于手机信令数据的机场到发旅客识别与客情分析方法 |
CN110113718A (zh) * | 2019-05-31 | 2019-08-09 | 南京瑞栖智能交通技术产业研究院有限公司 | 一种基于手机信令数据的铁路交通枢纽人口类型识别方法 |
CN110363433A (zh) * | 2019-07-17 | 2019-10-22 | 携程旅游网络技术(上海)有限公司 | 新开航线的评估方法、系统、电子设备和介质 |
CN110852792A (zh) * | 2019-10-28 | 2020-02-28 | 海南太美航空股份有限公司 | 一种基于大数据分析的航线价值评估方法及相关产品 |
CN110929945A (zh) * | 2019-11-28 | 2020-03-27 | 海南太美航空股份有限公司 | 一种航线开通的预测方法、系统及电子设备 |
Non-Patent Citations (2)
Title |
---|
冉斌;: "手机数据在交通调查和交通规划中的应用" * |
缪前明;: "手机大数据在城市规划领域的应用方向研究" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112000716A (zh) * | 2020-08-26 | 2020-11-27 | 携程旅游网络技术(上海)有限公司 | 航线推送方法、系统、电子设备和存储介质 |
CN112000716B (zh) * | 2020-08-26 | 2024-02-13 | 携程旅游网络技术(上海)有限公司 | 航线推送方法、系统、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111476409B (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110503245B (zh) | 一种机场航班大面积延误风险的预测方法 | |
CN103093649B (zh) | 用于推断飞行器参数的方法和系统 | |
CN110176141B (zh) | 一种基于poi及流量特征的交通小区划分方法和系统 | |
CN110334959A (zh) | 一种航班舱位资源分配方法及装置 | |
CN111192090A (zh) | 航班的座位分配方法、装置、存储介质和电子设备 | |
CN106919957B (zh) | 处理数据的方法及装置 | |
CN109615937A (zh) | 航段运行时间优化计算装置 | |
CN110929945A (zh) | 一种航线开通的预测方法、系统及电子设备 | |
CN109948844B (zh) | 一种停机位分配鲁棒性的优化方法、装置、设备及介质 | |
CN107403325B (zh) | 机票订单可信度评价方法和装置 | |
CN112308616B (zh) | 一种航司旅客的群体划分方法及装置 | |
CN109657736A (zh) | 基于聚类特征的航段运行时间计算方法 | |
US11754404B2 (en) | Transport navigation system and transport navigation method | |
CN115293562A (zh) | 航班的飞行计划生成方法、装置、计算机设备和存储介质 | |
CN111476409A (zh) | 一种新航线开通的预测方法、系统及设备 | |
CN112926809B (zh) | 一种基于聚类和改进的xgboost的航班流量预测方法及系统 | |
CN106471528A (zh) | 用于分析航班旅客机票海量数据库存的方法和计算机程序产品 | |
CN108665723A (zh) | 一种信息获取方法及装置 | |
Zhu et al. | Validating rail transit assignment models with cluster analysis and automatic fare collection data | |
Ma et al. | QA-Share: Toward an efficient QoS-aware dispatching approach for urban taxi-sharing | |
CN114694422A (zh) | 一种飞行航线的冲突检测方法、装置及电子设备 | |
CN107391728A (zh) | 数据挖掘方法以及数据挖掘装置 | |
CN111199301B (zh) | 一种集散中心的选取方法、装置、设备及存储介质 | |
US11006281B2 (en) | Systems and methods for planning high altitude platform-based communication networks | |
CN112419128A (zh) | 一种线路规划方法以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |