CN112200625A - 一种航班资源推荐方法及装置 - Google Patents

一种航班资源推荐方法及装置 Download PDF

Info

Publication number
CN112200625A
CN112200625A CN202011056782.2A CN202011056782A CN112200625A CN 112200625 A CN112200625 A CN 112200625A CN 202011056782 A CN202011056782 A CN 202011056782A CN 112200625 A CN112200625 A CN 112200625A
Authority
CN
China
Prior art keywords
passenger
journey
alternative
similarity
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011056782.2A
Other languages
English (en)
Inventor
吴格
傅之凤
冯迪
毕铮
赵耀帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Technology Co Ltd
China Travelsky Holding Co
Original Assignee
China Travelsky Holding Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Holding Co filed Critical China Travelsky Holding Co
Priority to CN202011056782.2A priority Critical patent/CN112200625A/zh
Publication of CN112200625A publication Critical patent/CN112200625A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供的航班资源推荐方法及装置,应用于计算机技术领域,该方法设置多个预设旅客聚类簇,同时基于待推荐旅客的PNR,确定待推荐旅客的同行旅客。在获取待推荐旅客的包括航班取消航段的原始行程之后,构建多个备选行程,针对所得备选行程,各备选行程的第一接受度、第二接受度,以及,备选行程相似度,最终基于所得第一接受度、第二接受度,以及备选行程相似度,向待推荐旅客推送各备选行程。本方法综合考虑多方面因素,向旅客推荐的航班资源是综合多方面因素得出的,因而具备更高的接受度,有助于减少航空公司服务器进行无效计算的情况,进而提高航空公司服务器的有效使用率。

Description

一种航班资源推荐方法及装置
技术领域
本发明属于计算机技术领域,尤其涉及一种航班资源推荐方法及装置。
背景技术
在航班运营中,由于恶劣天气、空中交通管制、飞行设备故障、地面服务保障等原因,航班取消的现象时有发生,严重影响旅客的出行安排,降低旅客的出行体验。因此,为了提升航空公司的服务质量以及旅客的出行体验,航班取消发生后如何为旅客提供备选行程,即为旅客推荐其他可以完成既定出行安排的航班资源,一直是各航空公司极为关注的问题。
目前,在航班取消发生后,航空公司在向中转旅客提供备选行程时,推荐航班资源的规则较为单一,如只按旅客价值向旅客推荐航班资源,导致旅客对推荐的航班资源不满意,不接受航空公司所推荐的备选行程。
在实际应用中,每一种保护方案都需要服务器按照现有的航班资源推荐方法,调用可用航班进行相应的计算之后得出,航空公司推荐的备选行程接受度不高,意味着服务器进行了很多无效工作,浪费大量的计算资源,服务器计算资源的有效使用率较低,同时,还会影响航班资源的使用率和机场旅客的疏散效率。
发明内容
有鉴于此,本发明的目的在于提供一种航班资源推荐方法及装置,综合多方面因素评价备选行程,提高所推荐航班资源的接受度,进而提高航空公司服务器的有效使用率,提高航班资源的使用率和机场旅客的疏散效率,具体方案如下:
第一方面,本发明提供一种航班资源推荐方法,包括:
获取待推荐旅客的原始行程,所述原始行程包括航班取消航段;
构建由所述航班取消航段的起飞机场,至所述待推荐旅客目的地的可用航班组合,得到多个备选行程;
在多个预设旅客聚类簇中,确定所述待推荐旅客所属的目标预设旅客聚类簇,并根据所述待推荐旅客与所述目标预设旅客聚类簇中各样本旅客的行程相似度,分别计算各所述备选行程的第一接受度,其中,任一所述预设旅客聚类簇内的样本旅客对应相似的旅客情境特征;
根据所述待推荐旅客的旅客订座记录PNR,确定所述待推荐旅客的同行旅客,并根据所述待推荐旅客与所述同行旅客的行程相似度,分别计算各所述备选行程的第二接受度;
分别计算各所述备选行程与所述待推荐旅客的原始行程的相似度,得到各所述备选行程对应的备选行程相似度;
基于所述第一接受度、所述第二接受度,以及所述备选行程相似度,向所述待推荐旅客推送各所述备选行程。
第二方面,本发明提供一种航班资源推荐装置,包括:
获取单元,用于获取待推荐旅客的原始行程,所述原始行程包括航班取消航段;
构建单元,用于构建由所述航班取消航段的起飞机场,至所述待推荐旅客目的地的可用航班组合,得到多个备选行程;
第一计算单元,用于在多个预设旅客聚类簇中,确定所述待推荐旅客所属的目标预设旅客聚类簇,并根据所述待推荐旅客与所述目标预设旅客聚类簇中各样本旅客的行程相似度,分别计算各所述备选行程的第一接受度,其中,任一所述预设旅客聚类簇内的样本旅客对应相似的旅客情境特征;
第二计算单元,用于根据所述待推荐旅客的旅客订座记录PNR,确定所述待推荐旅客的同行旅客,并根据所述待推荐旅客与所述同行旅客的行程相似度,分别计算各所述备选行程的第二接受度;
第三计算单元,用于分别计算各所述备选行程与所述待推荐旅客的原始行程的相似度,得到各所述备选行程对应的备选行程相似度;
推荐单元,用于基于所述第一接受度、所述第二接受度,以及所述备选行程相似度,向所述待推荐旅客推送各所述备选行程。
基于上述技术方案,本发明提供的航班资源推荐方法,设置多个预设旅客聚类簇,且各预设旅客聚类簇内的样本旅客对应着相似的旅客情境特征,同时,还会基于待推荐旅客的PNR,确定待推荐旅客的同行旅客。在获取待推荐旅客的包括航班取消航段的原始行程之后,构建由该航班取消航段的起飞机场,至待推荐旅客目的地的可用航班组合,得到多个备选行程,进一步,针对所得备选行程,基于待推荐旅客与所属的目标预设旅客聚类簇中样本旅客的行程相似度,计算待推荐旅客对各备选行程的第一接受度;基于待推荐旅客与同行旅客的行程相似度,计算待推荐旅客对各备选行程的第二接受度,以及,各备选行程对应的备选行程相似度,最终基于所得第一接受度、第二接受度,以及备选行程相似度,向待推荐旅客推送各备选行程。
本发明提供的航班资源推荐方法,综合考虑目标预设旅客聚类簇所表征的群体特征、同行旅客之间的相互影响,以及各备选行程与待推荐旅客原始行程之间的相似度三方面因素,与现有技术相比,本方法向旅客推荐的航班资源是综合多方面因素得出的,因而具备更高的接受度,有助于减少航空公司服务器做无用功的情况,进而提高航空公司服务器的有效使用率,提高航班资源的使用率和机场旅客的疏散效率。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1是本发明实施例提供的一种航班资源推荐方法的流程图;
图2是本发明实施例提供的一种航班资源推荐装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
可选的,参见图1,图1是本发明实施例提供的一种航班资源推荐方法的流程图,该方法的流程可以包括:
S100、获取待推荐旅客的原始行程,原始行程包括航班取消航段。
根据不同的航班取消情况,待推荐旅客的原始行程的具体构成会有所差异,本发明实施例所提供的航班资源推荐方法中,待推荐旅客指的是中转旅客,因此,待推荐旅客的原始行程不仅包括航班取消航段,同时,还包括航班取消航段之后的后续航段,以及航班取消航段之前的前期航段。
可选的,待推荐旅客的原始行程可以通过待推荐旅客的PNR信息中获取得到,当然,也可以从航空公司的旅客服务系统中获得,本发明实施例对于待推荐旅客的原始行程的具体来源不做限定。
S110、构建由航班取消航段的起飞机场,至待推荐旅客目的地的可用航班组合,得到多个备选行程。
可选的,在得到待推荐旅客的原始行程之后,即可明确获知原始行程中的航班取消航段,该航班取消航段包括起飞机场、降落机场、起飞时间等基本信息,本发明实施例具体基于航班取消航段的起飞机场值待推荐旅客的目的地的所有可用航班进行组合,从而得到多个备选行程。
具体的,可以获取航班取消航段的起飞时间之后预设时长内的所有可用航班,比如获取起飞时间之后12小时内的所有可用航班,然后按照本发明实施例提供的行程构造规则对各可用航班进行组合,从而得到多个备选行程。可以想到的是,对各可用航班进行组合的基本原则还在于,可以使得待推荐旅客经过有限次数的转机后,到达其最终的目的地。
可选的,本发明实施例提供的行程构造规则可以包括:以原始行程包括段航段为例,原始行程包括I2-I1-CUR-O1-O2,其中CUR段为本发明实施例中述及的航班取消航段,I2和I1为前期航段,O1和O2为后续航段。在此基础上,备选行程的构造规则为:
1、如果后续航段中O1、O2均存在,且均为国际段,则在构建备选行程时,可以修改原始行程中的CUR-O1-O2三段;否则,最多只修改原始行程中的I1-CUR-O1三段,最少则只修改CUR段。
2、各备选行程的中转点的前后航段时间差需满足中转机场的MCT要求。
3、备选行程中的航班安排不止限于待推荐旅客PNR中的原航空公司,国内/国外的其他航空公司均为可选项。
可选的,不论对于上述原始行程,还是构建的备选行程,都可以包括如下信息:
单航段特征包括:pnr创建日期,销售/承运航司、航班号,出发-到达机场对、地区对、国家对,出发-到达日期对、时间对,舱位,特殊服务(如特殊餐食)等。
航班信息:起飞时间、到达时间、是否经停、总旅行时间,原航班,舱位等。
S120、在多个预设旅客聚类簇中,确定待推荐旅客所属的目标预设旅客聚类簇,并根据待推荐旅客与所述目标预设旅客聚类簇中各样本旅客的行程相似度,分别计算各备选行程的第一接受度。
为通过群体特征对各备选行程的接受度进行考核,本发明实施例提供的推荐方法还设置有多个预设旅客聚类簇,任一预设旅客聚类簇内的样本旅客对应相似的旅客情境特征。
可选的,本发明实施例所述及的旅客情境特征可以包括旅客画像和取消情境特征,其中,旅客画像包括:预设旅客基本信息和旅客偏好信息,具体的,预设旅客基本信息包括:旅客性别,年龄,国籍,籍贯(常驻地),VIP等级,常客信息等。
旅客偏好信息包括:出发月份偏好,出发日期偏好(工作日/非工作日,节假日/节假日前后三天/非节假日),出发时间偏好,到达日期偏好,到达时间偏好,航司偏好,机型偏好,提前订票天数偏好,飞行时长偏好,飞行频次偏好,中转停留时间偏好,票价偏好,折扣率偏好,行李偏好,值机偏好等。
其中,在旅客画像中,部分特征为连续变量,如旅客年龄等,部分特征为离散变量,如旅客性别。
取消情境特征包括:航班取消特征和与航班取消特征对应的预设市场特征,具体的,
航班取消特征包括:航班提前取消天数、取消类型(ASM、SSM、SSIM),取消时间(小时级/2小时为刻度)等。
与航班取消特征对应的预设时长特征则包括:当天取消航班数、航班取消比例、当日航班投放量(分时段)、日均本航司航班频率、日均市场航班频率等。
基于上述信息,下面对本发明实施例提供的各预设旅客聚类簇的得到过程进行介绍。如前所述,每一预设旅客聚类簇内包括旅客情境特征相似的样本旅客,因此,为了得到预设旅客聚类簇,首先需要准备一定数量的样本旅客,当然,每一样本旅客均对应着上述内容所述的旅客情境特征。
在得到各个样本旅客的旅客情境特征后,对各样本旅客的旅客情境特征进行数据标准化和旅客聚类,将高维系数用户矩阵转化为低维用户矩阵。其中,
数据标准化过程采用z-score方法对上述各特征进行归一化处理,即
Figure BDA0002711071160000071
其中,x表示任一情境特征的特征值;
μ=mean(x),表示x对应的情境特征的平均值;
σ=std(x),表示x对应的情境特征的标准差;
x’表示x对应的情境特征的归一化值。
需要说明的是,对于各旅客情境特征的归一化过程,具体可以参照现有技术中的z-score方法实现,此处不再详述。
进一步的,采用改进原始簇心的K-means聚类算法对样本旅客进行聚类分析,主要算法步骤如下:
输入:含有m个n维样本的待聚类数据集D,其中,D={xi|i=1,2,3,...m},xi=(xi1,xi2,xi3,...,xin)T;设聚类簇个数K;初始簇最大簇内个数Cmax,最小支持度minSup
输出:使平方误差最小的K个簇。
描述:采用在选取聚类初始簇心时,首先通过贪心策略寻找数据对象的邻域半径和密度较大的簇;然后不断选取密度较大且距离最远的簇作为临时初始簇,并将初始簇中支持度最高的核心数据对象作为初始簇的中心。
步骤1、选取聚类初始簇心:
计算D中样本对象两两间的欧式距离d,计算公式为
Figure BDA0002711071160000072
遍历找出支持度>最小支持度minSup的核心样本对象,并按密度排序,选取密度最大的一个样本对象c1和与之相距最远的一个样本对象c2作为初始簇心,并在剩余的核心数据对象中,迭代选取密度次大并且距离已选定为初始簇心最远的样本对象作为初始簇心,直至选取K个初始簇心,构成初始簇心集合C,其中,C={ci|i=1,2,3,...K}。
步骤2、遍历数据集D,计算并比较每个xi到初始簇心cj的欧式距离d(xi,cj),将xi归入距离最近的簇中;
步骤3、重新计算各个簇的平均值,作为新的聚类簇心;
步骤4、重复执行步骤2和3,直至聚类簇心C不再发生变化,得到多个预设旅客聚类簇。
需要说明的是,在具体实现时,可以参照现有技术中聚类算法对预设的样本旅客进行聚类划分,本发明实施例此处不再详述。
基于上述多个预设旅客聚类簇,在确定待推荐旅客所属的目标预设旅客聚类簇时,首先需要获取待推荐旅客的旅客情境特征,然后,分别计算待推荐旅客的旅客情境特征与各预设的预设旅客聚类簇簇心的距离;最后,将各预设旅客聚类簇中距离最小的预设旅客聚类簇,作为待推荐旅客所属的目标预设旅客聚类簇。
通过上述内容可以看出,本发明实施例所提用的航班资源推荐方法,引入预设旅客聚类簇,通过群体特征的角度评价备选行程的接受度,同时,综合考虑旅客的个人偏好信息,这在现有技术中是没有的。
基于上述内容,下面对各备选行程的第一接受度的计算过程进行说明:
在本发明实施例中,各旅客样本簇中的样本旅客均对应一原始行程和一实际行程,在根据待推荐旅客与目标预设旅客聚类簇中各样本旅客的行程相似度,分别计算各所述备选行程的第一接受度时,首先分别计算待推荐旅客的原始行程与目标预设旅客聚类簇中各样本旅客的原始行程的相似度,得到相应的第一原始行程相似度。具体的,待推荐旅客的原始行程与目标预设旅客聚类簇中的任一样本旅客的原始行程相似度,即第一原始行程相似度可以采用下述公式计算,可以看出,下述相似度计算公式基于pearson相关系数法计算得到的。
Figure BDA0002711071160000081
其中,X表示待推荐旅客的原始行程特征向量;
X’表示样本旅客的原始行程特征向量;
Xi表示待推荐旅客原始行程特征向量中的第i个特征;
Xi’表示样本旅客的原始行程特征向量中的第i个特征;
μX表示待推荐旅客的原始行程特征向量的均值,
μX'表示样本旅客的原始行程特征向量的均值,
n表示待推荐旅客以及样本旅客的原始行程的特征向量的数量。
进一步的,针对每一备选行程,分别计算备选行程与目标预设旅客聚类簇中各样本旅客的实际行程的相似度,得到相应的第一备选行程相似度。
具体的,任一备选行程与目标预设旅客聚类簇中的任一样本旅客的实际行程相似度,即各备选行程对应的第一备选行程相似度可以采用下述公式计算:
Figure BDA0002711071160000091
其中,Y表示任一备选行程的备选行程特征向量;
Y’表示样本旅客的实际行程特征向量;
Yi表示备选行程的备选行程特征向量中的第i个特征;
Yi’表示样本旅客的实际行程特征向量中的第i个特征;
μY表示任一备选行程的备选行程特征向量的均值,
μY'表示样本旅客的实际行程特征向量的均值,
m表示备选行程以及样本旅客的实际行程中特征向量的数量。
最终,根据各第一原始行程相似度,以及各第一备选行程相似度,分别计算各备选行程的第一接受度。
具体的,首先按照第一原始行程相似度由高到低的顺序排列目标预设旅客聚类簇中的各样本旅客,得到样本旅客排序;
然后,基于上述样本旅客排序,将样本旅客排序中的前N个样本旅客作为第一最近邻集合,其中,N为大于或等于1的整数,表示为U(μ12,...μN)。
基于与第一最近邻集合中各样本旅客相应的第一原始行程相似度和第一备选行程相似度,即可分别计算各所述备选行程的第一接受度。
具体的,对于任一备选行程,其第一接收度可以表示为:
Figure BDA0002711071160000092
其中,μ表示待推荐旅客。
需要说明的是,在本步骤,以及在后续步骤中,各中行程的行程特征向量均由下列特征构成:
日期特征:出发-到达日期(月/日/星期),出发-到达时刻
地域特征:出发-到达机场,城市,省份,区域,国家
行程特征:中转时间,主舱位,折扣率,飞行距离,票价。
S130、根据待推荐旅客的PNR,确定待推荐旅客的同行旅客,并根据待推荐旅客与同行旅客的行程相似度,分别计算各备选行程的第二接受度。
本发明实施例所提供的航班资源推荐方法,还考虑同行人或同社交群体的行程之间可能产生相互影响,因此,在本步骤中对各备选行程的第二接受度进行计算。
可选的,本实施例中的同行旅客包括本次同od(出发地、目的地)订票旅客和历史熟悉度高于预设阈值的旅客(即同社交群体)。其中,待推荐旅客μ和同行旅客γk的历史熟悉度可以表示为:
Figure BDA0002711071160000101
其中,F(μ,γk)表示历史熟悉度;
Seg_cnt(μ,γk)表示待推荐旅客与同行旅客的同行航段数;
Seg_cnt(μ)表示待推荐旅客μ的总航段数指的是待推荐旅客的原始行程的总航段数。
需要说明的是,对于本次同od订票人和同社交群体的订票信息等,都可以基于待推荐旅客的PNR确定,具体的获取过程可以参照现有技术实现,本发明对于上述同行旅客的筛选过程不做具体限定。
与样本旅客类似,同行旅客同样对应一原始行程和一实际行程,分别计算各备选行程的第二接受度的过程可以如下进行:
分别计算待推荐旅客的原始行程与各同行旅客的原始行程的相似度,得到相应的第二原始行程相似度,具体的,可以按照如下公式进行:
Figure BDA0002711071160000111
其中,X表示待推荐旅客的原始行程特征向量;
P’表示同行旅客的原始行程特征向量;
Xi表示待推荐旅客原始行程特征向量中的第i个特征;
Pi’表示同行旅客的原始行程特征向量中的第i个特征;
μX表示待推荐旅客的原始行程特征向量的均值,
μP'表示同行旅客的原始行程特征向量的均值,
n表示待推荐旅客以及同行旅客的原始行程的特征向量的数量。
进一步的,针对每一备选行程,分别计算备选行程与各同行旅客的实际行程的相似度,得到相应的第二备选行程相似度。具体的,第二备选行程相似度可以采用如下公式计算:
Figure BDA0002711071160000112
其中,Y表示任一备选行程的备选行程特征向量;
T’表示同行旅客的实际行程特征向量;
Yi表示备选行程的备选行程特征向量中的第i个特征;
Ti’表示同行旅客的实际行程特征向量中的第i个特征;
μY表示任一备选行程的备选行程特征向量的均值,
μT'表示同行旅客的实际行程特征向量的均值,
m表示备选行程以及样本旅客的实际行程中特征向量的数量。
最后,根据各第二原始行程相似度,以及各第二备选行程相似度,分别计算各备选行程的第二接受度。
具体的,首先按照第二原始行程相似度由高到低的顺序排列各同行旅客,得到同行旅客排序;
然后,将同行旅客排序中的前M个同行旅客作为第二最近邻集合,表示为R(γ12,...,γM),其中,M为大于或等于1的整数。
基于与第二最近邻集合中各同行旅客相应的第二原始行程相似度和第二备选行程相似度,分别计算各备选行程的第二接受度。针对任一备选行程,其第二接受度可以按下述公式计算:
Figure BDA0002711071160000121
其中,
Figure BDA0002711071160000122
k表示第二最近邻集合中的第k个同行旅客。
S140、分别计算各备选行程与待推荐旅客的原始行程的相似度,得到各备选行程对应的备选行程相似度。
可选的,针对任一备选行程,可以按照如下公式计算备选行程与待推荐旅客的原始行程之间的相似度:
Figure BDA0002711071160000123
其中,l为变量维度,
Figure BDA0002711071160000124
为指示函数,Ci表示原始行程,Cj表示备选行程。若Ci、Cj中第v个变量度量值不存在,则
Figure BDA0002711071160000125
为0,否则为1;若Ci、Cj中第v个变量度量值相同,则
Figure BDA0002711071160000126
为1;若Ci、Cj中第v个变量均为数值变量,且不相同,则
Figure BDA0002711071160000127
否则
Figure BDA0002711071160000128
为0。
S150、基于第一接受度、第二接受度,以及备选行程相似度,向待推荐旅客推送各备选行程。
可选的,经过前述步骤,得到每一备选行程的第一接受度、第二接受度和备选行程相似度,在此基础上,针对每一备选行程,计算该备选行程的第一接受度、第二接受度,以及备选行程相似度的平均值,即可得到备选行程的最终接受度,具体的,可以表示为:
Figure BDA0002711071160000129
然后,按照最终接受度由高到低的顺序,向待推荐旅客推送各备选行程。
综上所述,本发明提供的航班资源推荐方法,综合考虑目标预设旅客聚类簇所表征的群体特征、同行旅客之间的相互影响,以及各备选行程与待推荐旅客原始行程之间的相似度三方面因素,与现有技术相比,本方法向旅客推荐的航班资源是综合多方面因素得出的,因而具备更高的接受度,有助于减少航空公司服务器做无用功的情况,进而提高航空公司服务器的有效使用率,提高航班资源的使用率和机场旅客的疏散效率。
需要说明的是,附图中的流程图,示出按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
需要说明的是,上述内容虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
下面对本发明实施例提供的航班资源推荐装置进行介绍,下文描述的航班资源推荐装置可以认为是为实现本发明实施例提供的航班资源推荐方法,在中央设备中需设置的功能模块架构;下文描述内容可与上文相互参照。
可选的,参见图2,图2是本发明实施例提供的一种航班资源推荐装置,该装置包括:
获取单元10,用于获取待推荐旅客的原始行程,所述原始行程包括航班取消航段;
构建单元20,用于构建由所述航班取消航段的起飞机场,至所述待推荐旅客目的地的可用航班组合,得到多个备选行程;
第一计算单元30,用于在多个预设旅客聚类簇中,确定所述待推荐旅客所属的目标预设旅客聚类簇,并根据所述待推荐旅客与所述目标预设旅客聚类簇中各样本旅客的行程相似度,分别计算各所述备选行程的第一接受度,其中,任一所述预设旅客聚类簇内的样本旅客对应相似的旅客情境特征;
第二计算单元40,用于根据所述待推荐旅客的旅客订座记录PNR,确定所述待推荐旅客的同行旅客,并根据所述待推荐旅客与所述同行旅客的行程相似度,分别计算各所述备选行程的第二接受度;
第三计算单元50,用于分别计算各所述备选行程与所述待推荐旅客的原始行程的相似度,得到各所述备选行程对应的备选行程相似度;
推荐单元60,用于基于所述第一接受度、所述第二接受度,以及所述备选行程相似度,向所述待推荐旅客推送各所述备选行程。
可选的,所述推荐单元60,用于基于所述第一接受度、所述第二接受度,以及所述备选行程相似度,向所述待推荐旅客推送各所述备选行程时,具体包括:
针对每一所述备选行程,计算所述备选行程的所述第一接受度、所述第二接受度,以及所述备选行程相似度的平均值,得到所述备选行程的最终接受度;
按照所述最终接受度由高到低的顺序,向所述待推荐旅客推送各所述备选行程。
可选的,所述第一计算单元30,用于在多个预设旅客聚类簇中,确定所述待推荐旅客所属的目标预设旅客聚类簇时,具体包括:
获取所述待推荐旅客的旅客情境特征;
分别计算所述待推荐旅客的旅客情境特征与各预设旅客聚类簇簇心的距离;
将各所述预设旅客聚类簇中所述距离最小的预设旅客聚类簇,作为所述待推荐旅客所属的目标预设旅客聚类簇。
可选的,所述旅客情境特征包括旅客画像和取消情境特征,其中,
所述旅客画像包括:预设旅客基本信息和旅客偏好信息;
所述取消情境特征包括:航班取消特征和与所述航班取消特征对应的预设市场特征。
可选的,各所述旅客样本簇中的样本旅客均对应一原始行程和一实际行程,所述第一计算单元30,用于根据所述待推荐旅客与所述目标预设旅客聚类簇中各样本旅客的行程相似度,分别计算各所述备选行程的第一接受度时,具体包括:
分别计算所述待推荐旅客的原始行程与所述目标预设旅客聚类簇中各所述样本旅客的原始行程的相似度,得到相应的第一原始行程相似度;
针对每一所述备选行程,分别计算所述备选行程与所述目标预设旅客聚类簇中各所述样本旅客的实际行程的相似度,得到相应的第一备选行程相似度;
根据各所述第一原始行程相似度,以及各所述第一备选行程相似度,分别计算各所述备选行程的第一接受度。
可选的,所述第一计算单元30,用于根据各所述第一原始行程相似度,以及各所述第一备选行程相似度,分别计算各所述备选行程的第一接受度时,具体包括:
按照所述第一原始行程相似度由高到低的顺序排列所述目标预设旅客聚类簇中的各所述样本旅客,得到样本旅客排序;
将所述样本旅客排序中的前N个样本旅客作为第一最近邻集合,其中,N为大于或等于1的整数;
基于与所述第一最近邻集合中各所述样本旅客相应的第一原始行程相似度和第一备选行程相似度,分别计算各所述备选行程的第一接受度。
可选的,所述同行旅客包括多个,且各所述同行旅客均对应一原始行程和一实际行程,所述第二计算单元40,用于根据所述待推荐旅客与所述同行旅客的行程相似度,分别计算各所述备选行程的第二接受度时,具体包括:
分别计算所述待推荐旅客的原始行程与各所述同行旅客的原始行程的相似度,得到相应的第二原始行程相似度;
针对每一所述备选行程,分别计算所述备选行程与各所述同行旅客的实际行程的相似度,得到相应的第二备选行程相似度;
根据各所述第二原始行程相似度,以及各所述第二备选行程相似度,分别计算各所述备选行程的第二接受度。
可选的,所述第二计算单元40,用于根据各所述第二原始行程相似度,以及各所述第二备选行程相似度,分别计算各所述备选行程的第二接受度时,具体包括:
按照所述第二原始行程相似度由高到低的顺序排列各所述同行旅客,得到同行旅客排序;
将所述同行旅客排序中的前M个同行旅客作为第二最近邻集合,其中,M为大于或等于1的整数;
基于与所述第二最近邻集合中各所述同行旅客相应的第二原始行程相似度和第二备选行程相似度,分别计算各所述备选行程的第二接受度。
可选的,各所述预设旅客聚类簇基于多个样本旅客的旅客情境特征,应用聚类算法进行聚类划分后得到。
需要说明的是,描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一计算单元还可以被描述为“计算第一接受度的单元”。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种航班资源推荐方法,其特征在于,包括:
获取待推荐旅客的原始行程,所述原始行程包括航班取消航段;
构建由所述航班取消航段的起飞机场,至所述待推荐旅客目的地的可用航班组合,得到多个备选行程;
在多个预设旅客聚类簇中,确定所述待推荐旅客所属的目标预设旅客聚类簇,并根据所述待推荐旅客与所述目标预设旅客聚类簇中各样本旅客的行程相似度,分别计算各所述备选行程的第一接受度,其中,任一所述预设旅客聚类簇内的样本旅客对应相似的旅客情境特征;
根据所述待推荐旅客的旅客订座记录PNR,确定所述待推荐旅客的同行旅客,并根据所述待推荐旅客与所述同行旅客的行程相似度,分别计算各所述备选行程的第二接受度;
分别计算各所述备选行程与所述待推荐旅客的原始行程的相似度,得到各所述备选行程对应的备选行程相似度;
基于所述第一接受度、所述第二接受度,以及所述备选行程相似度,向所述待推荐旅客推送各所述备选行程。
2.根据权利要求1所述的航班资源推荐方法,其特征在于,所述基于所述第一接受度、所述第二接受度,以及所述备选行程相似度,向所述待推荐旅客推送各所述备选行程,包括:
针对每一所述备选行程,计算所述备选行程的所述第一接受度、所述第二接受度,以及所述备选行程相似度的平均值,得到所述备选行程的最终接受度;
按照所述最终接受度由高到低的顺序,向所述待推荐旅客推送各所述备选行程。
3.根据权利要求1所述的航班资源推荐方法,其特征在于,所述在多个预设旅客聚类簇中,确定所述待推荐旅客所属的目标预设旅客聚类簇,包括:
获取所述待推荐旅客的旅客情境特征;
分别计算所述待推荐旅客的旅客情境特征与各预设旅客聚类簇簇心的距离;
将各所述预设旅客聚类簇中所述距离最小的预设旅客聚类簇,作为所述待推荐旅客所属的目标预设旅客聚类簇。
4.根据权利要求1-3任一项所述的航班资源推荐方法,其特征在于,所述旅客情境特征包括旅客画像和取消情境特征,其中,
所述旅客画像包括:预设旅客基本信息和旅客偏好信息;
所述取消情境特征包括:航班取消特征和与所述航班取消特征对应的预设市场特征。
5.根据权利要求1所述的航班资源推荐方法,其特征在于,各所述旅客样本簇中的样本旅客均对应一原始行程和一实际行程,所述根据所述待推荐旅客与所述目标预设旅客聚类簇中各样本旅客的行程相似度,分别计算各所述备选行程的第一接受度,包括:
分别计算所述待推荐旅客的原始行程与所述目标预设旅客聚类簇中各所述样本旅客的原始行程的相似度,得到相应的第一原始行程相似度;
针对每一所述备选行程,分别计算所述备选行程与所述目标预设旅客聚类簇中各所述样本旅客的实际行程的相似度,得到相应的第一备选行程相似度;
根据各所述第一原始行程相似度,以及各所述第一备选行程相似度,分别计算各所述备选行程的第一接受度。
6.根据权利要求5所述的航班资源推荐方法,其特征在于,所述根据各所述第一原始行程相似度,以及各所述第一备选行程相似度,分别计算各所述备选行程的第一接受度,包括:
按照所述第一原始行程相似度由高到低的顺序排列所述目标预设旅客聚类簇中的各所述样本旅客,得到样本旅客排序;
将所述样本旅客排序中的前N个样本旅客作为第一最近邻集合,其中,N为大于或等于1的整数;
基于与所述第一最近邻集合中各所述样本旅客相应的第一原始行程相似度和第一备选行程相似度,分别计算各所述备选行程的第一接受度。
7.根据权利要求1所述的航班资源推荐方法,其特征在于,所述同行旅客包括多个,且各所述同行旅客均对应一原始行程和一实际行程,所述根据所述待推荐旅客与所述同行旅客的行程相似度,分别计算各所述备选行程的第二接受度,包括:
分别计算所述待推荐旅客的原始行程与各所述同行旅客的原始行程的相似度,得到相应的第二原始行程相似度;
针对每一所述备选行程,分别计算所述备选行程与各所述同行旅客的实际行程的相似度,得到相应的第二备选行程相似度;
根据各所述第二原始行程相似度,以及各所述第二备选行程相似度,分别计算各所述备选行程的第二接受度。
8.根据权利要求7所述的航班资源推荐方法,其特征在于,所述根据各所述第二原始行程相似度,以及各所述第二备选行程相似度,分别计算各所述备选行程的第二接受度,包括:
按照所述第二原始行程相似度由高到低的顺序排列各所述同行旅客,得到同行旅客排序;
将所述同行旅客排序中的前M个同行旅客作为第二最近邻集合,其中,M为大于或等于1的整数;
基于与所述第二最近邻集合中各所述同行旅客相应的第二原始行程相似度和第二备选行程相似度,分别计算各所述备选行程的第二接受度。
9.根据权利要求1所述的航班资源推荐方法,其特征在于,各所述预设旅客聚类簇基于多个样本旅客的旅客情境特征,应用聚类算法进行聚类划分后得到。
10.一种航班资源推荐装置,其特征在于,包括:
获取单元,用于获取待推荐旅客的原始行程,所述原始行程包括航班取消航段;
构建单元,用于构建由所述航班取消航段的起飞机场,至所述待推荐旅客目的地的可用航班组合,得到多个备选行程;
第一计算单元,用于在多个预设旅客聚类簇中,确定所述待推荐旅客所属的目标预设旅客聚类簇,并根据所述待推荐旅客与所述目标预设旅客聚类簇中各样本旅客的行程相似度,分别计算各所述备选行程的第一接受度,其中,任一所述预设旅客聚类簇内的样本旅客对应相似的旅客情境特征;
第二计算单元,用于根据所述待推荐旅客的旅客订座记录PNR,确定所述待推荐旅客的同行旅客,并根据所述待推荐旅客与所述同行旅客的行程相似度,分别计算各所述备选行程的第二接受度;
第三计算单元,用于分别计算各所述备选行程与所述待推荐旅客的原始行程的相似度,得到各所述备选行程对应的备选行程相似度;
推荐单元,用于基于所述第一接受度、所述第二接受度,以及所述备选行程相似度,向所述待推荐旅客推送各所述备选行程。
CN202011056782.2A 2020-09-30 2020-09-30 一种航班资源推荐方法及装置 Pending CN112200625A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011056782.2A CN112200625A (zh) 2020-09-30 2020-09-30 一种航班资源推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011056782.2A CN112200625A (zh) 2020-09-30 2020-09-30 一种航班资源推荐方法及装置

Publications (1)

Publication Number Publication Date
CN112200625A true CN112200625A (zh) 2021-01-08

Family

ID=74008292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011056782.2A Pending CN112200625A (zh) 2020-09-30 2020-09-30 一种航班资源推荐方法及装置

Country Status (1)

Country Link
CN (1) CN112200625A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077304A (zh) * 2021-03-22 2021-07-06 海南太美航空股份有限公司 一种航班信息的推荐方法、系统和电子设备
CN114372750A (zh) * 2022-01-10 2022-04-19 中国民航信息网络股份有限公司 中转错失旅客的行李保护方法、相关装置及存储介质
CN115168456A (zh) * 2022-09-07 2022-10-11 中国民航信息网络股份有限公司 航班销售过程特征获取方法及装置、存储介质及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140052481A1 (en) * 2012-08-14 2014-02-20 Amadeus S.A.S. Itinerary analysis for passenger re-accommodation
US20160117618A1 (en) * 2014-10-22 2016-04-28 Google Inc. Determining alternative travel itineraries using current location
CN107944586A (zh) * 2017-12-18 2018-04-20 携程旅游网络技术(上海)有限公司 点到点交通出行方案推送方法、系统、设备及存储介质
CN110334959A (zh) * 2019-07-10 2019-10-15 中国民航信息网络股份有限公司 一种航班舱位资源分配方法及装置
CN110751395A (zh) * 2019-10-21 2020-02-04 中国民航信息网络股份有限公司 一种旅客行程状态确定方法、装置及服务器
CN110889610A (zh) * 2019-11-18 2020-03-17 中国民航信息网络股份有限公司 一种旅客保护方法及系统
CN111581506A (zh) * 2020-04-28 2020-08-25 海南太美航空股份有限公司 基于协同过滤的航班推荐方法及系统
CN111581505A (zh) * 2020-04-28 2020-08-25 海南太美航空股份有限公司 基于组合推荐的航班推荐方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140052481A1 (en) * 2012-08-14 2014-02-20 Amadeus S.A.S. Itinerary analysis for passenger re-accommodation
US20160117618A1 (en) * 2014-10-22 2016-04-28 Google Inc. Determining alternative travel itineraries using current location
CN107944586A (zh) * 2017-12-18 2018-04-20 携程旅游网络技术(上海)有限公司 点到点交通出行方案推送方法、系统、设备及存储介质
CN110334959A (zh) * 2019-07-10 2019-10-15 中国民航信息网络股份有限公司 一种航班舱位资源分配方法及装置
CN110751395A (zh) * 2019-10-21 2020-02-04 中国民航信息网络股份有限公司 一种旅客行程状态确定方法、装置及服务器
CN110889610A (zh) * 2019-11-18 2020-03-17 中国民航信息网络股份有限公司 一种旅客保护方法及系统
CN111581506A (zh) * 2020-04-28 2020-08-25 海南太美航空股份有限公司 基于协同过滤的航班推荐方法及系统
CN111581505A (zh) * 2020-04-28 2020-08-25 海南太美航空股份有限公司 基于组合推荐的航班推荐方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
上官栋栋 等: "应用遗传算法求解航班恢复问题", 数学的实践与认识, vol. 48, no. 15, 31 August 2018 (2018-08-31), pages 178 - 185 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077304A (zh) * 2021-03-22 2021-07-06 海南太美航空股份有限公司 一种航班信息的推荐方法、系统和电子设备
CN113077304B (zh) * 2021-03-22 2023-01-13 海南太美航空股份有限公司 一种航班信息的推荐方法、系统和电子设备
CN114372750A (zh) * 2022-01-10 2022-04-19 中国民航信息网络股份有限公司 中转错失旅客的行李保护方法、相关装置及存储介质
CN115168456A (zh) * 2022-09-07 2022-10-11 中国民航信息网络股份有限公司 航班销售过程特征获取方法及装置、存储介质及电子设备
CN115168456B (zh) * 2022-09-07 2022-11-25 中国民航信息网络股份有限公司 航班销售过程特征获取方法及装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN112200625A (zh) 一种航班资源推荐方法及装置
Cheng et al. Utility-aware ridesharing on road networks
CN107086935B (zh) 基于wifi ap的人流量分布预测方法
WO2016124118A1 (zh) 一种订单处理方法与系统
EP3252705A1 (en) Order allocation system and method
CN105488597B (zh) 旅客目的地预测方法及系统
Fathollahi-Fard et al. A Lagrangian relaxation-based algorithm to solve a home health care routing problem
CN111784049B (zh) 一种旅客流失时间预测方法及装置
CN110020745B (zh) 基于航班时刻表的实时大型航空枢纽停车场规模预测方法
CN109657736A (zh) 基于聚类特征的航段运行时间计算方法
WO2024125485A1 (zh) 旅客托运行李信息预测方法及相关设备
EP4384974A1 (en) Systems and methods for predicting airport passenger flow
Alisoltani et al. Space-time clustering-based method to optimize shareability in real-time ride-sharing
CN112101779A (zh) 基于主客观结合的结构熵权法机场场面运行综合评价系统
CN114782114A (zh) 一种基于CNN-GRU和SSA-GWO-LightGBM的机票价格预测方法
Kieu et al. A class-specific soft voting framework for customer booking prediction in on-demand transport
CN111445091B (zh) 一种客运中心出租车司机的智能决策方法
CN110347937B (zh) 一种出租车智能寻客方法
CN116562574A (zh) 城际定制客运的协同优化方法、装置、设备和存储介质
Alisoltani et al. Data-oriented approach for the dial-a-ride problem
EP2927847A1 (en) Journey planning method and system
Ma et al. QA-Share: Toward an efficient QoS-aware dispatching approach for urban taxi-sharing
Nguyen et al. Understanding Determinants of Making Airline Entry and Exit Decisions: Application of Logit Models
CN113297336A (zh) 航班的季节性归类方法、装置及机器可读介质
Cheng et al. Prediction of Tourist Consumption Based on Bayesian Network and Big Data.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination