CN110852792B

CN110852792B - 一种基于大数据分析的航线价值评估方法及相关产品

Info

Publication number: CN110852792B
Application number: CN201911033276.9A
Authority: CN
Inventors: 许宏江
Original assignee: Hainan Taimei Airlines Co ltd
Current assignee: Hainan Taimei Airlines Co ltd
Priority date: 2019-10-28
Filing date: 2019-10-28
Publication date: 2023-10-03
Anticipated expiration: 2039-10-28
Also published as: CN110852792A

Abstract

本发明提供一种基于大数据分析的航线价值评估方法及相关产品，属于民用航空信息技术领域。方法包括：获取航线中每个客户的历史位移数据，构建时间分段模型并判断客源地；获取其余地址信息，进行加权处理得到目标地域；建立航线数据库，构建训练集和验证集，并构建航线客源地和目标地域的出行欲望p_i模型。进行卷积神经网络训练，并根据出行欲望模型计算得到客源地和每个目标地域在航线中产生的预期价值；对航线所有客源地和目标地域的预期价值进行评估。本公开实现了对航线类的无形资产的自动化评估，比人工数据分析更便捷，更高效，更全面，可以据此准确的得到航空公司所拥有的航线价值，同时可以为新航线的开通提供必要的参考。

Description

一种基于大数据分析的航线价值评估方法及相关产品

技术领域

本发明涉及民用航空信息技术领域，特别是指一种基于大数据分析的航线价值评估方法及相关产品。

背景技术

随着经济水平的发展，带来了日益激烈的航空公司市场竞争，为增强其市场竞争力，航空公司通常选择开辟新航线或加大旧有热门航线的运力，但以往进行数据分析时，往往只利用历史收益记录进行人工分析预测，并使用得到的预期收益对航线价值进行评估，这种方式以往受限于人工数据处理能力，不但考虑内容过少，评估结果不准确，还对分析人员的素质要求高。同时，航线的价值是由多种因素所共同决定的，仅通过对民航航线的历史收益记录，按照现有技术建立神经网络模型进行数据分析，也同样会面临分析结果不够全面准确的问题。

现有技术已有对于从大量民航旅客订票数据中识别潜在高价值旅客的研究，从个体旅客和其人际关系圈的视角出发挖掘航线的潜在价值。但由于本行业的特殊性，航线实际价值不仅受个体旅客影响，也和地方经济以及政策等息息相关，从旅客层面进行分析完全无法体现这些行业外因素对航线价值产生的影响。并且，其他行业对无形资产的评估方式也不能简单套用到这个技术领域内，而评价航线或潜在价值，来开辟新航线、增减旧有航线运力或进行航线转让等需求客观存在，因此迫切需要一种全面准确的，带有发展眼光的航线价值评估方法。

发明内容

为进一步解决上述问题，本发明提供一种基于大数据分析的航线价值评估方法及相关产品，以客源地和目标地域为核心进行大数据分析，使得分析结果更加准确全面，可信度更高，并且可以更准确的预测航线价值的未来走向，为开辟新航线、增减旧有航线运力或进行航线转让等需求提供有价值的参考。

本发明提供了一种基于大数据分析的航线价值评估方法，具体包括以下步骤：

S1、获取航线中每个客户的历史位移数据，构建时间分段模型，通过所述时间分段模型判断所述航线中每个客户的客源地；

S2、获取所述航线中每个客户的其余地址信息，根据所述历史位移数据对所述其余地址信息进行加权处理，得到有权重的目标地域，所述其余地址信息是指与所述航线中每个客户有关联的非客源地的地址信息；

S3、建立航线数据库，通过所述航线数据库构建训练集和验证集，并构建航线客源地和目标地域在所述航线的出行欲望p_i模型，对所述出行欲望模型进行卷积神经网络训练，得到训练后的出行欲望模型，并根据所述出行欲望模型计算得到客源地和每个目标地域在所述航线中产生的预期价值；

S4、通过加权求和公式对所述航线所有客源地和目标地域的预期价值进行自动化计算，并根据所述计算结果评估拟开航线。

优选的，所述历史位移数据为所述航线的每个客户通过航班出行的历史记录，包括起点，终点，航班号，位移距离，起飞时间，降落时间等。

可选的，所述历史位移数据还包括所述航线的每个客户通过其他交通方式出行的历史记录，包括起点，终点，航班号，位移距离，出发时间，到达时间等。

优选的，由于历史位移数据中的时间数据均为分段函数，且每段时间长度与起始位置不固定，因此根据历史位移数据中的时间段构建时间分段模型，通过每段时间的间隔长短判断客户的第一出发地与其他出发地。通常的，按照客户历史出行记录中的所有终点进行统计，将在此终点的降落时间到下一次起飞时间的间隔最长的所述地点判断为第一出发地。

可选的，将每个客户在历史位移数据中作为起点起飞最多的地理位置判断为第一出发地。

优选的，通过预设条件判断客户的第一出发地之后，将客户第一出发地判断为客源地，并将其他出发地归入其余地址信息。

优选的，所述其余地址信息，包括但不限于：

手机属地地址、身份证地址和非客源地的历史出行地点。

优选的，根据历史位移数据对其余地址信息进行加权处理，得到有权重的目标地域。通常的，由于探亲等原因，手机属地地址与身份证地址均会出现在非客源地的历史出行地点之中，按照在所述地点的降落时间到下一次起飞时间的间隔长短，对其余地址信息的重要程度进行加权。

可选的，通过所述其余地址信息不同的出行时间点进行加权，如根据全年公休放假安排，赋予在假期前后出行的始末地点更高的权重。

可选的，通过所述其余地址信息不同的出行次数进行加权，赋予出行次数更多的地点更高的权重。

优选的，所述构建航线客源地和目标地域在所述航线的出行欲望p_i模型，对所述出行欲望模型进行卷积神经网络训练，得到训练后的出行欲望模型，并根据所述出行欲望模型计算得到客源地和每个目标地域在所述航线中产生的预期价值，具体包括：

S31、对客户年龄数据进行聚类，分为不同的年龄组进行计算，预设迭代次数，并分别赋予各权重随机值，构建出行欲望模型；

S32、随机从训练集中抽出样本，对所述出行欲望模型进行神经网络训练，得到训练后的出行欲望模型；

S33、使用验证集对训练后的出行欲望模型进行验证，得到验证后的出行欲望模型；

S34、根据所述出行欲望模型，并根据不同客户所属年龄组在预设时间间隔内的变化，计算每个客源地和目标地域在航线中产生的预期价值。

可选的，在对客户年龄进行聚类时，将年龄按照0-12、12-22、22-40、40-60、>60进行分组。

优选的，由于预测航线的预期价值是长期的，客户的年龄可能会在不同的组别之间变化，通过航线数据库中客户群体的年龄变化趋势，对不同的组别赋予相应变化的权重来计算客源地和目标地域在航线中产生的预期价值。

可选的，年龄变化趋势也可以使用客源地和目标地域当地统计的人口年龄变化趋势。

优选的，所述航线数据库，包括：

客源地，有权重的目标地域，年龄，年平均出行频率，年出行距离，年平均出行价格，出行达成率。

可选的，根据数据分析人员对航线价值的人工分析，赋予各权重预设的初始值。

优选的，所述通过加权求和公式对所述航线所有客源地和目标地域的预期价值进行自动化计算，并根据所述计算结果评估拟开航线，具体包括：

获取多条航线客源地的经济发展趋势和政策走向趋势信息，其中至少包含一条确定价值的航线，利用自然语义处理算法对所述经济发展趋势和政策走向趋势信息进行分析，建立趋势走向模型，然后确定待评估航线与已评估航线之间所述趋势走向的相似度，构成相似的航线集合，并得到所述趋势走向对预期价值的影响数值t，将客源地和每个目标地域的出行欲望模型与影响数值t结合，并对预期价值S进行评估S＝Σp_i*(1+t)，其中p_i为出行欲望。

优选的，通过加权求和公式对客源地和每个目标地域的加权并评估时，计算使用的权重为步骤S2中获取的目标地域权重。在加权计算中会将该目标地域权重与每个目标地域的出行欲望p_i整合，作为构成每个目标地域出行欲望模型的一部分参与计算，并结合自然语义处理得到的影响数值t，求和计算得到航线整体预期价值，与现有已估值航线进行对比。在对新航线开辟的参考过程中，通常会根据该潜在航线的客源地和目标地域地理位置重合范围最大的已估值航线作为参照，对该潜在航线的价值进行打分，并根据该潜在航线的相应得分评价该航线是否有值得新开辟的预期价值。

优选的，调用趋势走向模型与训练后的出行欲望模型，将所述航线的预期价值、出行欲望和趋势走向整理在以时间为横轴的图表中并进行显示。

可选的，调用航线数据库，将所述航线数据库中的内容与所述航线的预期价值、出行欲望和趋势走向进行筛选并显示，为用户进行相关的决策提供合理的数据。

本发明提供了一种基于大数据分析的航线价值评估装置，所述装置包括：

客源判断模块，用于获取航线中每个客户的历史位移数据，构建时间分段模型，通过所述时间分段模型判断所述航线中每个客户的客源地；

目标判断模块，用于获取所述航线中每个客户的其余地址信息，根据所述历史位移数据对所述其余地址信息进行加权处理，得到有权重的目标地域，所述其余地址信息是指与所述航线中每个客户有关联的非客源地的地址信息；

价值计算模块，用于建立航线数据库，通过所述航线数据库构建训练集和验证集，并构建航线客源地和目标地域在所述航线的出行欲望p_i模型，对所述出行欲望模型进行卷积神经网络训练，得到训练后的出行欲望模型，并根据所述出行欲望模型计算得到客源地和每个目标地域在所述航线中产生的预期价值；

评估模块，通过加权求和公式用于对所述航线所有客源地和目标地域的预期价值进行自动化计算并评估，并通过评估得分对未开辟航线进行开辟。

优选的，所述价值计算模块具体包括：

初始化单元，用于对客户年龄数据进行聚类，分为不同的年龄组进行计算，预设迭代次数，并分别赋予各权重随机值，构建出行欲望模型；

训练单元，用于随机从训练集中抽出样本，对所述出行欲望模型进行神经网络训练，得到训练后的出行欲望模型；

验证单元，用于使用验证集对训练后的出行欲望模型进行验证，得到验证后的出行欲望模型；

预期价值计算单元，用于根据所述出行欲望模型，并根据不同的年龄组群体年龄的变化，计算每个客源地和目标地域在航线中产生的预期价值。

本发明还提供一种电子设备，所述设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述方法实施例中记载的任何一种基于大数据分析的航线价值评估方法的部分或全部步骤。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述方法实施例中记载的任何一种基于大数据分析的航线价值评估方法的部分或全部步骤。

本发明通过用户的历史出行信息，以客源地和目标地域为核心构建出行欲望模型，并通过获取经济发展趋势和政策走向趋势信息确定其对客户群体出行欲望的影响，全面准确的对航线的价值进行了评估。并且，对机场数据进行整理，用户可根据自身需求选择性展示机场相关数据及数据范围，使用多种显示方式，能更直观的对航线价值及其相关信息进行了解和管理。本申请扩大了航线数据分析来源的覆盖范围，并且通过以客源地和目标地域为核心构建，能降低后续其余航线数据分析的复杂度，提高分析效率。本公开实现了对航线类的无形资产的自动化评估和管理，比人工数据分析更便捷，更高效，更全面，可以据此准确的得到航空公司所拥有的航线价值，得到的结论也可以为新航线的开通提供必要的参考。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于大数据分析的航线价值评估方法的流程示意图；

图2为本发明实施例提供的应用大数据分析进行具体价值计算方法的流程示意图；

图3为本发明实施例提供的一种基于大数据分析的航线价值评估装置的结构示意图；

图4为本发明实施例提供的一种基于大数据分析的航线价值评估设备的结构示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

实施例一

本发明提供一种基于大数据分析的航线价值评估方法，图1给出了该基于大数据分析的航线价值评估方法流程图，参照图1，包括：

可选的，所述历史位移数据还包括所述航线的每个客户通过其他交通方式出行的历史记录，包括起点，终点，航班号，位移距离，出发时间，到达时间等。如所述航线的每个客户通过火车或高铁出行的订票记录数据。

在一个具体的实施例中，所述历史位移数据为中国民航旅客订座系统中的旅客订票数据和高德提供的数据包。

由于经济发展趋势，政策走向趋势是以实际地理位置为单位进行影响，以及每个客户对航线价值的影响也可以用客源地整合后的出行欲望进行体现。因此，相比较单独就航线的历史数据进行建模分析，以客源地作为分析基本单位的分析方式考虑的内容更加全面，所述分析也可以为该客源地影响的不同航线同时提供数据分析参考，在考虑趋势影响之后比其他的数据分析方式效率更高，并且可以减少神经网络模型的训练次数。再者，对于目前不存在航线的潜在开航路线，也可以根据该潜在航线附近客源地对其他航线的影响，来判断该潜在航线的航线价值，在这种状态下，由于不存在现有航线，现有技术较难准确的评估出航线价值。

优选的，所述其余地址信息，包括但不限于：

手机属地地址、身份证地址和非客源地的历史出行地点。

优选的，如图2所示，所述构建航线客源地和目标地域在所述航线的出行欲望p_i模型，对所述出行欲望模型进行卷积神经网络训练，得到训练后的出行欲望模型，并根据所述出行欲望模型计算得到客源地和每个目标地域在所述航线中产生的预期价值，具体包括：

在一个具体的实施例中，通过预设一万次的迭代次数对所述神经网络模型进行训练，得到训练后的出行欲望模型。

优选的，在实施例中，所述航线数据库，包括：

客源地，有权重的目标地域，年龄，年平均出行频率，年出行距离，年平均出行价格，出行达成率等。

优选的，由于预测航线的预期价值是长期的，客户的年龄可能会在不同的组别之间变化，通过航线数据库中客户群体的年龄变化趋势，对不同的组别赋予相应变化的权重来计算客源地和目标地域在航线中产生的预期价值。现有技术通常在预测时会默认群体年龄结构固定，以方便对不同年龄段的潜在收益进行统计和预测，但由于群体年龄结构并不会时刻保持稳定，不同年龄组别的人数比例其实是在不断变化的，因此本申请创新性的通过客户群体的历史年龄结构变化来赋予相应的权重变化，模拟真实年龄情况对航线价值的影响，做出更准确的预测。

在一个具体的实施例中，年平均出行价格和出行达成率为影响出行欲望模型的主要决策变量，在模型中的其余数值如年龄，年平均出行时间，年平均出行距离等均为非线性影响因素。

优选的，在实施例的基础上，所述通过加权求和公式对所述航线所有客源地和目标地域的预期价值进行自动化计算，并根据所述计算结果评估拟开航线，具体包括：

获取多条航线客源地的经济发展趋势和政策走向趋势信息，其中至少包含一条确定价值的航线，利用自然语义处理算法对所述经济发展趋势和政策走向趋势信息进行分析，建立趋势走向模型，然后确定待评估航线与已评估航线之间所述趋势走向的相似度，构成相似的航线集合，并得到所述趋势走向对预期价值的影响数值t，将客源地和每个目标地域的出行欲望模型与影响数值t结合，并对预期价值进行评估S＝Σp_i*(1+t)，其中p_i为出行欲望。

优选的，通过加权求和公式对所述航线所有客源地和目标地域的预期价值进行自动化计算，计算使用的权重为步骤S2中获取的目标地域权重。在加权计算中会将该目标地域权重与每个目标地域的出行欲望p_i整合，作为构成每个目标地域出行欲望模型的一部分参与计算，并结合自然语义处理得到的影响数值t，求和计算得到航线整体预期价值，与现有已估值航线进行对比。在对拟开航线的参考过程中，通常会根据该拟开航线的客源地和目标地域地理位置重合范围最大的已估值航线作为参照，对该拟开航线的价值进行打分，并根据该拟开航线的相应得分来评价该拟开航线是否具有开航的预期价值，从而为用户提供准确的开航技术指导，保证用户的利益最大化。

在一个具体的实施例中，经济发展趋势和政策走向趋势信息由网络爬虫在网络中对相关文章进行针对性的爬取，通过自然语言处理对较大数量的文章按照发布时间进行针对性的倾向分析。虽然经济发展趋势和政策走向趋势信息本身属性较混杂，但往往此类文章给出的倾向性信号较容易通过自然语言处理算法来进行判断。在本实施例中这种倾向性信号，即会对经济发展趋势和政策走向趋势信息产生影响的信号，较容易从网络文章中自动、准确地得出，通过对此类倾向性信号进行聚类、加权，并与已评估价值航线的趋势走向共同建立趋势走向模型，就能得出此类倾向性信号在一个较长的时间间隔内对航线价值趋势的影响。

在一个具体的实施例中，方法通过Python脚本实现，出行欲望模型p_i由中国民航旅客订座系统提供的旅客订票数据进行训练和验证。通过自然语言处理算法NLR对在网络中爬取的相关文章进行分词和向量转换，其中每一个客源地和目标地域均通过网络爬虫爬取500篇有效文章，转换得到的趋势向量的正负极性和大小代表具体的趋势走向变化。在本实施例中，相似航线集合由相关性较高的、置信度大于90的航线的趋势向量集组成，然后通过对所有趋势向量集进一步的数据处理，建立并验证趋势走向模型。

优选的，在一个具体的实施例中，还包括：

调用趋势走向模型与训练后的出行欲望模型，将所述航线的预期价值、出行欲望和趋势走向整理在以时间为横轴的图表中并进行显示。

在一个具体的实施例中，当用户需要获得关于不同航线的航线价值，或需要获得对新开航线价值的参考时，可以通过筛选不同的数据内容显示在系统前端。如仅显示航线用户群体的年龄曲线或经济发展趋势和政策走向趋势信息曲线与航线预期价值曲线进行对比。也可以用表格的形式来获得航线数据库内的其他内容，并对这些内容进行相关性分析或其他形式的对比分析。

在一个具体的实施例中，用户还可以将航线的预期收益与其他航线的预期收益进行对比，或将航线的详细数据信息与相似航线集合内的其他航线的详细数据信息进行对比，为用户决策快速高效地提供可视化的数据信息。

实施例二

本实施例还提供一种基于大数据分析的航线价值评估装置3，如图3所示，包括：

客源判断模块31，用于获取航线中所述航线中每个客户的历史位移数据，构建时间分段模型，通过所述时间分段模型判断每个客户的客源地；

目标判断模块32，用于获取所述航线中每个客户的其余地址信息，根据所述历史位移数据对所述其余地址信息进行加权处理，得到有权重的目标地域，所述其余地址信息是指与所述航线中每个客户有关联的非客源地的地址信息；

价值计算模块33，用于建立航线数据库，通过所述航线数据库构建训练集和验证集，并构建航线客源地和目标地域在所述航线的出行欲望p_i模型，对所述出行欲望模型进行卷积神经网络训练，得到训练后的出行欲望模型，并根据所述出行欲望模型计算得到客源地和每个目标地域在所述航线中产生的预期价值；

评估模块34，用于通过加权求和公式对所述航线所有客源地和目标地域的预期价值进行自动化计算，并根据所述计算结果评估拟开航线。

优选的，所述价值计算模块具体包括：

实施例三

本发明实施例还提供一种电子设备4，如图4所示，所述设备包括存储器42、处理器41以及存储在所述存储器中并可在所述处理器上运行的计算机程序43，其特征在于，所述处理器执行所述计算机程序时实现上述方法实施例中记载的任何一种基于大数据分析的航线价值评估方法的部分或全部步骤。

本发明实施例还提供一种计算机可读存储介质42，所述计算机可读存储介质42存储有计算机程序43，其特征在于，所述计算机程序43被处理器41执行时实现上述方法实施例中记载的任何一种基于大数据分析的航线价值评估方法的部分或全部步骤。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于大数据分析的航线价值评估方法，其特征在于，包括以下步骤：

S4、通过加权求和公式对所述航线所有客源地和目标地域的预期价值进行自动化计算，并根据所述计算结果评估拟开航线；

所述构建航线客源地和目标地域在所述航线的出行欲望p_i模型，对所述出行欲望模型进行卷积神经网络训练，得到训练后的出行欲望模型，并根据所述出行欲望模型计算得到客源地和每个目标地域在所述航线中产生的预期价值，具体包括：

S34、根据所述出行欲望模型，并根据不同客户所属年龄组在预设时间间隔内的变化，计算每个客源地和目标地域在航线中产生的预期价值；

所述通过加权求和公式对所述航线所有客源地和目标地域的预期价值进行自动化计算，并根据所述计算结果评估拟开航线，具体包括：

获取多条航线客源地的经济发展趋势和政策走向趋势信息，其中至少包含一条确定价值的航线，利用自然语义处理算法对所述经济发展趋势和政策走向趋势信息进行分析，建立趋势走向模型，然后确定待评估航线与已评估航线之间所述趋势走向的相似度，构成相似的航线集合，并得到所述趋势走向对预期价值的影响t，将客源地和每个目标地域的出行欲望模型与影响结合，并对预期价值S进行评估S＝Σp_i*(1+t)，其中p_i为出行欲望。

2.根据权利要求1所述的一种基于大数据分析的航线价值评估方法，其特征在于，还包括：

调用趋势走向模型与训练后的出行欲望模型，将所述航线的预期价值、出行欲望和趋势走向在以时间为横轴的图表中进行显示。

3.根据权利要求1所述的一种基于大数据分析的航线价值评估方法，其特征在于，所述其余地址信息，包括：

手机属地地址、身份证地址和非客源地的历史出行地点。

4.根据权利要求1所述的一种基于大数据分析的航线价值评估方法，其特征在于，所述航线数据库，包括：

客源地、有权重的目标地域、年龄、年平均出行频率、年出行距离、年平均出行价格和出行达成率。

5.一种基于大数据分析的航线价值评估装置，其特征在于，包括：

评估模块，用于通过加权求和公式对所述航线所有客源地和目标地域的预期价值进行自动化计算，并根据所述计算结果评估拟开航线；

对客户年龄数据进行聚类，分为不同的年龄组进行计算，预设迭代次数，并分别赋予各权重随机值，构建出行欲望模型；

随机从训练集中抽出样本，对所述出行欲望模型进行神经网络训练，得到训练后的出行欲望模型；

使用验证集对训练后的出行欲望模型进行验证，得到验证后的出行欲望模型；

根据所述出行欲望模型，并根据不同客户所属年龄组在预设时间间隔内的变化，计算每个客源地和目标地域在航线中产生的预期价值；

6.根据权利要求5所述的一种基于大数据分析的航线价值评估装置，其特征在于，所述价值计算模块具体包括：

7.一种电子设备，其特征在于，所述设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的一种基于大数据分析的航线价值评估方法的步骤。

8.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的一种基于大数据分析的航线价值评估方法的步骤。