CN110751395B - 一种旅客行程状态确定方法、装置及服务器 - Google Patents
一种旅客行程状态确定方法、装置及服务器 Download PDFInfo
- Publication number
- CN110751395B CN110751395B CN201911002630.1A CN201911002630A CN110751395B CN 110751395 B CN110751395 B CN 110751395B CN 201911002630 A CN201911002630 A CN 201911002630A CN 110751395 B CN110751395 B CN 110751395B
- Authority
- CN
- China
- Prior art keywords
- airport
- sequence
- passenger
- journey
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 32
- 230000007246 mechanism Effects 0.000 claims abstract description 31
- 238000013528 artificial neural network Methods 0.000 claims abstract description 18
- 239000013598 vector Substances 0.000 claims description 79
- 238000012216 screening Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 230000010006 flight Effects 0.000 claims 1
- 230000010365 information processing Effects 0.000 abstract description 8
- 230000015572 biosynthetic process Effects 0.000 abstract description 2
- 101100100125 Mus musculus Traip gene Proteins 0.000 description 16
- 230000008569 process Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供的旅客行程状态确定方法、装置及服务器,应用于信息处理技术领域,该方法首先获取目标旅客第一预设时间段内包括多个航段数据的行程序列和预设偏好信息;根据行程序列中的各航段数据,确定目标旅客对应的机场序列;然后,调用预训练的行程状态确定模型,将目标旅客的机场序列和目标旅客的预设偏好信息输入行程状态确定模型,确定目标旅客的行程状态。本方法采用基于注意力机制的神经网络训练得到形成状态确定模型对目标旅客的行程状态进行判定,可以准确的判断目标旅客的行程是否结束,如果判定目标旅客的行程已经结束,则不再发送推送信息,从而减少服务器的信息处理量。
Description
技术领域
本发明属于信息处理技术领域,尤其涉及一种旅客行程状态确定方法、装置及服务器。
背景技术
在民航领域中,可以将旅客出行全流程的时间段划分为出行前、在途、出行后三个阶段。而在出行前与在途这两个阶段中,存在一类行程未预定完成旅客,具体指未预定好当前完整航程的全部机票的旅客。
不论是处于出行前阶段,还是处于在途阶段,大部分行程未预定完成旅客都有一个共同的特征,即他们当前购票的目的地并不是最终目的地,仍然存在继续购票的可能性,因此,航空公司会向这类旅客推送相关的服务信息,比如机票信息、酒店信息等。
然而,现有技术中的推送服务是没有针对性的,只要是处于行程未预定完成状态的旅客,服务器都会向其推送服务信息,显然,这种推送方式会迫使服务器处理大量的信息,负载过重。
因此,如何确定行程未预定完成旅客在到达目的地后行程是否结束,为针对性的提供推送服务提供参考依据,减少服务器的信息处理量,成为本领域技术人员需要解决的技术问题之一。
发明内容
有鉴于此,本发明的目的在于提供一种旅客行程状态确定方法、装置及服务器,能够确定行程未预定完成旅客在到达目的地后行程是否结束,为针对性的提供推送服务提供参考依据,减少服务器的信息处理量,具体方案如下:
第一方面,本发明提供一种旅客行程状态确定方法,包括:
获取目标旅客第一预设时间段内的行程序列和预设偏好信息,其中,所述行程序列中包括多个航段数据;
根据所述行程序列中的各所述航段数据,确定所述目标旅客对应的机场序列,其中,所述机场序列中包括多个机场标识,且各所述机场标识按照航班时间的先后顺序排列;
调用预训练的行程状态确定模型,所述行程状态确定模型以机场序列和预设偏好信息为训练样本,以行程状态为标签,训练基于注意力机制的神经网络得到,其中,所述行程状态包括结束状态和非结束状态;
将所述目标旅客的机场序列和所述目标旅客的预设偏好信息输入所述行程状态确定模型,确定所述目标旅客的行程状态。
可选的,训练所述行程状态确定模型的过程包括:
获取多个旅客在第二预设时间段内的机场序列样本和各所述旅客对应的预设偏好信息,其中,所述机场序列样本中包括多个机场标识,且各所述机场标识按照航班时间的先后顺序排列,所述预设偏好信息中包括多个预设偏好参量;
针对每一所述机场序列样本,基于注意力机制,生成各所述机场标识对应的权重向量;
针对每一所述旅客的预设偏好信息,基于注意力机制,生成各所述预设偏好参量对应的权重向量;
针对每一所述机场序列样本,按照预设拼接规则,对各所述机场标识对应的权重向量以及各所述预设偏好参量对应的权重向量进行拼接,得到与每一所述机场序列样本对应的输入向量;
分别确定神经网络对各所述输入向量的输出结果,到所述行程状态之间的误差,得到各所述机场序列样本相对应的误差;
以各所述机场序列样本相对应的误差处于预设范围内为训练目标,调整所述神经网络的参数,得到行程状态确定模型。
可选的,本发明第一方面提供的旅客行程状态确定方法,还包括:
针对每一所述机场序列样本,基于注意力机制,生成该机场序列样本中首个机场标识对应的局部权重向量,得到第一局部权重向量;
针对每一所述机场序列样本,基于注意力机制,生成该机场序列样本中最后一个机场标识对应的局部权重向量,得到第二局部权重向量。
可选的,所述针对每一所述机场序列样本,按照预设拼接规则,对各所述机场标识对应的权重向量以及各所述预设偏好参量对应的权重向量进行拼接,得到与每一所述机场序列样本对应的输入向量,包括:
针对每一所述机场序列样本,按照预设拼接规则,对各所述机场标识对应的权重向量、各所述预设偏好参量对应的权重向量、所述第一局部权重向量,以及所述第二局部权重向量进行拼接,得到与每一所述机场序列样本对应的输入向量。
可选的,所述获取目标旅客第一预设时间段内的行程序列,包括:
获取目标旅客在第一预设时间段内的旅客订座记录PNR信息;
按照预设数据筛选规则筛选所述PNR信息,得到筛选后的PNR信息;
以航段为单位划分所述筛选后的PNR信息,得到所述目标旅客在所述第一预设时间段内的行程序列。
可选的,所述根据所述行程序列中的各所述航段数据,确定所述目标旅客对应的机场序列,包括:
获取所述行程序列中,各所述航段数据中的航班时间;
提取各所述航段数据中的机场标识,并按照所述航班时间的先后顺序排列所述机场标识,得到所述目标旅客对应的机场序列。
可选的,本发明第一方面任一项提供的旅客行程状态确定方法,还包括:
若所述目标旅客的行程状态为所述非结束状态,推送预设推送信息。
第二方面,本发明提供一种旅客行程状态确定装置,包括:
获取单元,用于获取目标旅客第一预设时间段内的行程序列和预设偏好信息,其中,所述行程序列中包括多个航段数据;
第一确定单元,用于根据所述行程序列中的各所述航段数据,确定所述目标旅客对应的机场序列,其中,所述机场序列中包括多个机场标识,且各所述机场标识按照航班时间的先后顺序排列;
调用单元,用于调用预训练的行程状态确定模型,所述行程状态确定模型以机场序列和预设偏好信息为训练样本,以行程状态为标签,训练基于注意力机制的神经网络得到,其中,所述行程状态包括结束状态和非结束状态;
第二确定单元,用于将所述目标旅客的机场序列和所述目标旅客的预设偏好信息输入所述行程状态确定模型,确定所述目标旅客的行程状态。
可选的,所述获取单元,用于获取目标旅客第一预设时间段内的行程序列时,具体包括:
获取目标旅客在第一预设时间段内的旅客订座记录PNR信息;
按照预设数据筛选规则筛选所述PNR信息,得到筛选后的PNR信息;
以航段为单位划分所述筛选后的PNR信息,得到所述目标旅客在所述第一预设时间段内的行程序列。
第三方面,本发明提供一种服务器,包括:存储器和处理器;所述存储器存储有适于所述处理器执行的程序,以实现本发明第一方面任一项所述的旅客行程状态确定方法。
基于上述本发明提供的旅客行程状态确定方法,首先获取目标旅客第一预设时间段内包括多个航段数据的行程序列和预设偏好信息;根据行程序列中的各航段数据,确定目标旅客对应的机场序列,其中,机场序列中包括多个机场标识,且各机场标识按照航班时间的先后顺序排列;然后,调用预训练的行程状态确定模型,将目标旅客的机场序列和目标旅客的预设偏好信息输入行程状态确定模型,确定目标旅客的行程状态。本发明提供的旅客行程状态确定方法,采用基于注意力机制的神经网络训练得到形成状态确定模型对目标旅客的行程状态进行判定,可以准确的判断目标旅客的行程是否结束,为针对性的提供推送服务提供参考依据,如果判定目标旅客的行程已经结束,则不再发送推送信息,从而减少服务器的信息处理量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明申请实施例提供的一种旅客行程状态确定方法的流程图;
图2是本发明申请实施例提供的基于注意力机制的神经网络模型的结构示意图;
图3是本发明申请实施例提供的一种旅客行程状态确定装置的结构框图;
图4是本发明申请实施例提供的一种服务器的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的一种旅客行程状态确定方法的流程图,该方法可应用于电子设备,该电子设备可选如笔记本电脑、智能手机、PC(个人计算机)等具有数据处理能力的电子设备,显然,该电子设备在某些情况下也可选用网络侧的服务器实现;参照图1,本发明实施例提供的旅客行程状态确定方法可以包括:
步骤S100、获取目标旅客第一预设时间段内的行程序列和预设偏好信息。
为了确定目标旅客的行程是否结束,首先需要获取第一预设时间段内的行程序列。具体的,对于第一预设时间段的选取,可以结合计算机或服务器的数据处理能力,以及后续述及的行程状态确定模型的设计要求确定,当然,也可以单纯根据人为经验选取,本发明实施例对于第一预设时间段的选取不做限定。
可选的,为获取目标旅客在第一预设时间段内的行程序列,可以首先获取目标旅客在该第一预设时间段内的所有PNR(Passenger Name Record,旅客订座记录)信息,然后按照预设数据筛选规则筛选所有的PNR信息,得到筛选后的PNR信息。具体的信息筛选过程主要包括剔除PNR信息中包含有特定的、服务器无法识别或无法处理的特殊字符,比如“/”、“?”、“*”等。
以航段为单位划分筛选后的PNR信息,得到目标旅客在第一预设时间段内的行程序列,其中,一条航段数据对应一条历史航程记录,一条记录代表目标旅客的一次完整航程,而行程序列是由多个航段构成的,具体的,可将每个行程序列记为l=<x1-x2,x2-x3,...,xn-1-xn>,其中xi向量机场标识,xi-1-xi向量一段航段。
可选的,在构建行程序列过程中,还需要剔除非闭环非迁徙行程序列。对于非闭环非迁徙行程序列的判断规则如下:判断行程序列是否是闭环行程序列,即最初起始地及最终目的地相同的行程序列,如果行程序列为闭环行程序列,则保留;如果行程序列非闭环,且旅客在行程结束后短期内,比如30天,未再次出行,则为非迁徙非闭环行程序列,舍弃不用。
可选的,基于PNR信息中包含的旅客基础信息,比如旅客的性别分布、年龄分布、出行次数分布等,从多个维度对旅客的完整行程模式偏好、旅客一次性订票偏好和旅客提前订票间隔偏好进行统计分析,可以总结得出旅客在多个不同维度下的出行习惯和订票习惯(订票偏好和提前订票间隔)。进一步的,还可以统计分析旅客的完整行程模式偏好、旅客一次性订票偏好和旅客提前订票间隔偏好的各种影响因素,比如年龄、性别、旅客出行次数、旅客等级、票价折扣等,本发明实施例所述及的预设偏好信息,主要包括:旅客年龄段、旅客性别、旅客户籍地、出行模式偏好、订票习惯偏好、个人中转机场、旅客常到达地、旅客群中转地、行程串航段数、节假日信息等。因此,还需要获取目标旅客的上述预设偏好信息。
步骤S110、根据行程序列中的各航段数据,确定目标旅客对应的机场序列。
在得到目标旅客的行程序列之后,提取行程序列中各航段数据中的航班时间,以及各航段数据中的机场标识,并按照航班时间的先后顺序排列机场标识,得到目标旅客对应的机场序列。根据机场序列的生成过程可以看出,目标旅客的机场序列中包括多个机场标识,且各机场标识按照航班时间的先后顺序排列的。
可选的,机场标识可以是机场名称、缩写、编号等任何可以唯一的向量机场的信息,本发明实施例对机场标识的具体形式不做限定。
步骤S120、调用预训练的行程状态确定模型。
在得到上述所需信息之后,即可调用预训练的行程状态确定模型。本发明实施例述及的行程状态确定模型以机场序列和预设偏好信息为训练样本,以行程状态为标签,训练基于注意力机制的神经网络得到,其中,行程状态包括结束状态和非结束状态。下面会对行程状态确定模型的训练过程进行介绍,此处暂不详述。
步骤S130、将目标旅客的机场序列和目标旅客的预设偏好信息输入行程状态确定模型,确定目标旅客的行程状态。
调用预训练的行程状态确定模型之后,将目标旅客的机场序列和目标旅客的预设偏好信息输入行程状态确定模型,即可确定目标旅客在到达目的地后行程是否结束。
可选的,如果判定目标旅客的行程状态为非结束状态,则推送预设推送信息。
综上所述,本发明提供的旅客行程状态确定方法,采用基于注意力机制的神经网络训练得到形成状态确定模型对目标旅客的行程状态进行判定,可以准确的判断目标旅客的行程是否结束,为针对性的提供推送服务提供参考依据,如果判定目标旅客的行程已经结束,则不再发送推送信息,从而减少服务器的信息处理量。
进一步的,还可以为航公公司提供参考依据,对于行程已经结束的旅客,在短期内不再推送预设推送信息,可有效减少旅客对推广信息的抵触情绪;对于行程未结束的旅客,则可以继续推送预设推送信息,提高旅客的服务感受。
可选的,下面对训练本发明实施例提供的行程状态确定模型的过程介绍:
首先,获取多个旅客在第二预设时间段内的机场序列样本和各旅客对应的预设偏好信息。与前述目标旅客的机场序列样本一样,在训练过程中所采用的机场序列样本中同样包括多个机场标识,且各机场标识按照航班时间的先后顺序排列,相应的,每一旅客的预设偏好信息中包括多个预设偏好参量。而且,预设偏好信息中的具体参量与图1所示实施例中述及的参量一致,此处不再赘述。
需要说明的是,本实施例所述及的第二预设时间段,可以和前述第一预设时间段选取为同一时间段,当然,也可以选取为不同的时间段,本发明申请对于第一预设时间段以及第二预设时间段的选取不做具体限定。
可选的,对于用于训练的机场序列样本和旅客的预设偏好信息,可以是第三方软件或设备处理之后的满足上述要求的样本数据,本发明实施例在训练基于注意力机制的神经网络以得到行程状态确定模型时,直接使用即可。
当然,也可以将样本数据的处理过程集成到本发明实施例提供的训练方法中。具体的,与前述获取目标旅客的行程序列类似,首先采集第二预设时间段内多个旅客的PNR信息,然后以航段为单位划分所得所有的PNR信息,得到所有旅客在第二预设时间段内的所有航段数据。进一步的,解析所得各个航段数据,确定第二预设时间段内的各旅客的机场序列,相应的,还可同步获取各旅客的预设偏好信息。
针对每一机场序列样本,基于注意力机制,生成各机场标识对应的权重向量,同时,针对每一旅客的预设偏好信息,基于注意力机制,生成各预设偏好参量对应的权重向量。按照预设拼接规则,对各机场标识对应的权重向量以及各预设偏好参量对应的权重向量进行拼接,得到与每一机场序列样本对应的输入向量。
分别确定神经网络对各输入向量的输出结果,到行程状态之间的误差,得到各机场序列样本相对应的误差,并以各机场序列样本相对应的误差处于预设范围内为训练目标,调整神经网络的参数,最终得到行程状态确定模型。
可选的,本发明实施例所提供的模型训练方法,不仅关注机场序列中的每一机场的权重值,同时,还特别关注机场序列首个机场,以及最后一个机场对最终识别结果的影响,因此,针对每一机场序列样本,基于注意力机制,生成该机场序列样本中首个机场标识对应的局部权重向量,得到第一局部权重向量,针对每一机场序列样本,基于注意力机制,生成该机场序列样本中最后一个机场标识对应的局部权重向量,得到第二局部权重向量。
在得到第一局部权重向量、第二局部权重向量的基础上,针对每一机场序列样本,按照预设拼接规则,对各机场标识对应的权重向量、各预设偏好参量对应的权重向量、第一局部权重向量,以及第二局部权重向量进行拼接,从而得到与每一机场序列样本对应的输入向量。
通过本发明实施例,不仅考虑了机场序列中各机场以及旅客偏好信息的权重值,同时,还综合了各个机场序列中首个机场以及最后一个机场的权重值,训练得到的行程状态确定模型能够更为准确的判定目标旅客的行程状态。
可选的,参见图2,图2是本发明申请实施例提供的基于注意力机制的神经网络模型的结构示意图,下面结合图2所示的结构图对训练行程状态确定模型的过程进行具体介绍。
在获取各旅客的机场序列之后,首先对旅客的机场序列建立注意力机制,并且在建立注意力机制过程中特别关注机场序列中的最初起始机场及最终目的机场。通过建立的注意力机制获得一个当前机场序列的向量,记为ma。另外,为了进一步强调最初起始机场及最终目的机场的重要性,提取每一机场序列中的首个机场标识和最后一个机场标识,分别生成对应的向量,记为m1和mt。然后将m1、ma、mt分别输入到一个MLP(Multi-LayerPerception,多层感知器)单元中,得到h1、ha、ht,将三者进行拼接,得到行程串的嵌入向量h。此外,基于注意力机制构建每一旅客的预设编号信息的向量,记为hf,同样经过一个MLP单元再和h进行拼接作为最后一层全连接层的输入,最终输出一个[0,1]之间的概率值,向量是正类的概率。最后,通过计算交叉熵损失函数来利用神经网络算法经过多轮迭代并更新模型中参数以更好的拟合真实样本分布,最终得到旅客行程状态确定模型。
具体的,训练过程中,输入的是训练样本中的机场序列s=<x1,x2,x3,...,xn>。首先将机场序列中的机场标识按照(式1)嵌入求和得到ms。
然后再经过注意力机制(图2中示出的Attention Net)自动学到每个机场的权重向量,然后对各机场的权重向量进行加权求和计算得到当前输入的机场序列的全局向量ma。具体公式如(式2)所示。
其中,αi是注意力机制中学到的各个机场的权重向量。
再经过一个MLP单元P(图2中示出的MLP CellB),进行向量转换,得到hs,此即为最终的全局向量。具体的公式如(式3)所示。
hs=f(Wsms+bs) (式3)
其中,Ws是权重矩阵,bs是偏差项,f是一个非线性的激活函数。
模型中,为了强调机场序列中的首个机场和最后一个机场对机场序列判断的重要性,把机场序列中的首个机场和最后一个机场对应的向量也提取出来,即前述的第一局部权重向量和第二局部权重向量,分别是从首个机场x1和最后一个机场xt得到的两个向量m1和mt。具体计算公式如(式4)和(式5)。
m1=x1 (式4)
mt=xt (式5)
二者分别经过一个MLP单元P(图2中示出的MLP Cell A和MLP Cell C)进行向量转化得到h1和ht,具体的公式如(式6)和(式7)。
h1=f(W1x1+b1) (式6)
ht=f(Wtxt+bt) (式7)
到目前为止,输入一个机场序列,模型对其提取了三个权重向量h1,hs,ht,分别是机场序列中首个机场对应的第一局部权重向量和最后一个机场对应的第二局部权重向量,以及机场序列的全局向量。将三者进行拼接,得到机场序列的向量,记为h。
进一步的,考虑到深度学习模型的输入是旅客的机场序列,这其中包含的信息十分有限,例如,人工特征中的旅客订票行为反应的信息通过机场序列无法学到,因此,本法发明实施例还提供各旅客的预设偏好信息作为补充信息,使得模型达到更好的效果。预设偏好信息至少包括前述内容中列举的10项,当然,还可以包括其他可以用于表征旅客偏好信息,或者,其他有助于模型训练的信息,这些补充信息同样经过一个MLP(图2中示出的MLPCell D)单元再和h进行拼接作为全连接层的输入,最终输出[0,1]的概率值,得到分类结果。
通过计算交叉熵损失函数,对所计算的损失利用后向传播算法经过多轮迭代并更新模型中参数以更好的拟合真实样本分布,最终得到旅客行程状态确定模型。
可选的,在得到行程状态确定模型之后,为验证模型的处理能力,还可采用其他的机场序列对模型进行测试。
在对模型进行测试时,可以采用单独准备的测试样本进行,同样也可以在准备训练模型所使用的训练样本时,单独保存其中的一部分样本数据作为后续使用的测试样本,这都是可选的。
在测试过程中,输入测试样本集中任意一条机场序列,输出该机场序列的预测类别(0/1,即结束状态和非结束状态)。然后我们通过比对测试样本的机场序列的预测类别和真实类别标签,计算出准确率accuracy、精确率precision和F1值三个值来判定模型识别结果的好坏。
首先介绍下文述及的各种符号所代表的意义,如表1所示:
表1
准确率是指分类正确的样本数占总样本的比例。计算公式如(式8)所示。
精确率是指被分为正样本的样本中实际为正样本的比例。计算公式如式9所示。
F1值是准确率和召回率的调和平均和。计算公式如(式10)所示。
这三个指标都是值越高说明模型训练的效果越好。
本发明提供的旅客行程状态确定模型,采用基于注意力机制的神经网络训练得到,可以准确的判断目标旅客的行程是否结束,为针对性的提供推送服务提供参考依据,如果判定目标旅客的行程已经结束,则不再发送推送信息,从而减少服务器的信息处理量。
下面对本发明实施例提供的旅客行程状态确定装置进行介绍,下文描述的旅客行程状态确定装置可以认为是为实现本发明实施例提供的旅客行程状态确定方法,在中央设备中需设置的功能模块架构;下文描述内容可与上文相互参照。
图3是本发明申请实施例提供的一种旅客行程状态确定装置的结构框图,参照图3,该装置可以包括:
获取单元10,用于获取目标旅客第一预设时间段内的行程序列和预设偏好信息,其中,所述行程序列中包括多个航段数据;
第一确定单元20,用于根据所述行程序列中的各所述航段数据,确定所述目标旅客对应的机场序列,其中,所述机场序列中包括多个机场标识,且各所述机场标识按照航班时间的先后顺序排列;
调用单元30,用于调用预训练的行程状态确定模型,所述行程状态确定模型以机场序列和预设偏好信息为训练样本,以行程状态为标签,训练基于注意力机制的神经网络得到,其中,所述行程状态包括结束状态和非结束状态;
第二确定单元40,用于将所述目标旅客的机场序列和所述目标旅客的预设偏好信息输入所述行程状态确定模型,确定所述目标旅客的行程状态。
可选的,所述获取单元10,用于获取目标旅客第一预设时间段内的行程序列时,具体包括:
获取目标旅客在第一预设时间段内的旅客订座记录PNR信息;
按照预设数据筛选规则筛选所述PNR信息,得到筛选后的PNR信息;
以航段为单位划分所述筛选后的PNR信息,得到所述目标旅客在所述第一预设时间段内的行程序列。
图4为本发明实施例提供的服务器的结构框图,参见图4所示,可以包括:至少一个处理器100,至少一个通信接口200,至少一个存储器300和至少一个通信总线400;
在本发明实施例中,处理器100、通信接口200、存储器300、通信总线400的数量为至少一个,且处理器100、通信接口200、存储器300通过通信总线400完成相互间的通信;显然,图4所示的处理器100、通信接口200、存储器300和通信总线400所示的通信连接示意仅是可选的;
可选的,通信接口200可以为通信模块的接口,如GSM模块的接口;
处理器100可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器300,存储有应用程序,可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
其中,处理器100具体用于执行存储器内的应用程序,以实现上述所述的旅客行程状态确定方法的任一实施例。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的核心思想或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种旅客行程状态确定方法,其特征在于,包括:
获取目标旅客第一预设时间段内的行程序列和预设偏好信息,其中,所述行程序列中包括多个航段数据,所述目标旅客为行程未预定完成的旅客;
根据所述行程序列中的各所述航段数据,确定所述目标旅客对应的机场序列,其中,所述机场序列中包括多个机场标识,且各所述机场标识按照航班时间的先后顺序排列;
调用预训练的行程状态确定模型,所述行程状态确定模型以机场序列和预设偏好信息为训练样本,以行程状态为标签,训练基于注意力机制的神经网络得到,其中,所述行程状态包括结束状态和非结束状态;
将所述目标旅客的机场序列和所述目标旅客的预设偏好信息输入所述行程状态确定模型,确定所述目标旅客的行程状态。
2.根据权利要求1所述的旅客行程状态确定方法,其特征在于,训练所述行程状态确定模型的过程包括:
获取多个旅客在第二预设时间段内的机场序列样本和各所述旅客对应的预设偏好信息,其中,所述机场序列样本中包括多个机场标识,且各所述机场标识按照航班时间的先后顺序排列,所述预设偏好信息中包括多个预设偏好参量;
针对每一所述机场序列样本,基于注意力机制,生成各所述机场标识对应的权重向量;
针对每一所述旅客的预设偏好信息,基于注意力机制,生成各所述预设偏好参量对应的权重向量;
针对每一所述机场序列样本,按照预设拼接规则,对各所述机场标识对应的权重向量以及各所述预设偏好参量对应的权重向量进行拼接,得到与每一所述机场序列样本对应的输入向量;
分别确定神经网络对各所述输入向量的输出结果,到所述行程状态之间的误差,得到各所述机场序列样本相对应的误差;
以各所述机场序列样本相对应的误差处于预设范围内为训练目标,调整所述神经网络的参数,得到行程状态确定模型。
3.根据权利要求2所述的旅客行程状态确定方法,其特征在于,还包括:
针对每一所述机场序列样本,基于注意力机制,生成该机场序列样本中首个机场标识对应的局部权重向量,得到第一局部权重向量;
针对每一所述机场序列样本,基于注意力机制,生成该机场序列样本中最后一个机场标识对应的局部权重向量,得到第二局部权重向量。
4.根据权利要求3所述的旅客行程状态确定方法,其特征在于,所述针对每一所述机场序列样本,按照预设拼接规则,对各所述机场标识对应的权重向量以及各所述预设偏好参量对应的权重向量进行拼接,得到与每一所述机场序列样本对应的输入向量,包括:
针对每一所述机场序列样本,按照预设拼接规则,对各所述机场标识对应的权重向量、各所述预设偏好参量对应的权重向量、所述第一局部权重向量,以及所述第二局部权重向量进行拼接,得到与每一所述机场序列样本对应的输入向量。
5.根据权利要求1所述的旅客行程状态确定方法,其特征在于,所述获取目标旅客第一预设时间段内的行程序列,包括:
获取目标旅客在第一预设时间段内的旅客订座记录PNR信息;
按照预设数据筛选规则筛选所述PNR信息,得到筛选后的PNR信息;
以航段为单位划分所述筛选后的PNR信息,得到所述目标旅客在所述第一预设时间段内的行程序列。
6.根据权利要求1所述的旅客行程状态确定方法,其特征在于,所述根据所述行程序列中的各所述航段数据,确定所述目标旅客对应的机场序列,包括:
获取所述行程序列中,各所述航段数据中的航班时间;
提取各所述航段数据中的机场标识,并按照所述航班时间的先后顺序排列所述机场标识,得到所述目标旅客对应的机场序列。
7.根据权利要求1-6任一项所述的旅客行程状态确定方法,其特征在于,还包括:
若所述目标旅客的行程状态为所述非结束状态,推送预设推送信息。
8.一种旅客行程状态确定装置,其特征在于,包括:
获取单元,用于获取目标旅客第一预设时间段内的行程序列和预设偏好信息,其中,所述行程序列中包括多个航段数据,所述目标旅客为行程未预定完成的旅客;
第一确定单元,用于根据所述行程序列中的各所述航段数据,确定所述目标旅客对应的机场序列,其中,所述机场序列中包括多个机场标识,且各所述机场标识按照航班时间的先后顺序排列;
调用单元,用于调用预训练的行程状态确定模型,所述行程状态确定模型以机场序列和预设偏好信息为训练样本,以行程状态为标签,训练基于注意力机制的神经网络得到,其中,所述行程状态包括结束状态和非结束状态;
第二确定单元,用于将所述目标旅客的机场序列和所述目标旅客的预设偏好信息输入所述行程状态确定模型,确定所述目标旅客的行程状态。
9.根据权利要求8所述的旅客行程状态确定装置,其特征在于,所述获取单元,用于获取目标旅客第一预设时间段内的行程序列时,具体包括:
获取目标旅客在第一预设时间段内的旅客订座记录PNR信息;
按照预设数据筛选规则筛选所述PNR信息,得到筛选后的PNR信息;
以航段为单位划分所述筛选后的PNR信息,得到所述目标旅客在所述第一预设时间段内的行程序列。
10.一种服务器,其特征在于,包括:存储器和处理器;所述存储器存储有适于所述处理器执行的程序,以实现权利要求1至7任一项所述的旅客行程状态确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911002630.1A CN110751395B (zh) | 2019-10-21 | 2019-10-21 | 一种旅客行程状态确定方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911002630.1A CN110751395B (zh) | 2019-10-21 | 2019-10-21 | 一种旅客行程状态确定方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110751395A CN110751395A (zh) | 2020-02-04 |
CN110751395B true CN110751395B (zh) | 2023-07-04 |
Family
ID=69279229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911002630.1A Active CN110751395B (zh) | 2019-10-21 | 2019-10-21 | 一种旅客行程状态确定方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110751395B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112200625A (zh) * | 2020-09-30 | 2021-01-08 | 中国民航信息网络股份有限公司 | 一种航班资源推荐方法及装置 |
CN112307341A (zh) * | 2020-11-02 | 2021-02-02 | 沈阳民航东北凯亚有限公司 | 航班推送方法及装置 |
CN112882621B (zh) * | 2021-02-07 | 2022-11-18 | 微民保险代理有限公司 | 模块显示方法、装置、计算机设备和存储介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063675A (zh) * | 2009-06-03 | 2011-05-18 | 埃森哲环球服务有限公司 | 旅行相关报价的生成 |
CN103310299A (zh) * | 2013-05-17 | 2013-09-18 | 北京博研智通科技有限公司 | 一种机场导乘系统及方法 |
CN105654340A (zh) * | 2015-12-28 | 2016-06-08 | 中国民航信息网络股份有限公司 | 旅客真实航程的确定方法及系统 |
CN105654416A (zh) * | 2015-12-25 | 2016-06-08 | 中国民航信息网络股份有限公司 | 自助服务推送方法及客户端 |
CN106780274A (zh) * | 2016-12-30 | 2017-05-31 | 中国民航信息网络股份有限公司 | 中转旅客的识别方法及装置 |
CN107305742A (zh) * | 2016-04-18 | 2017-10-31 | 滴滴(中国)科技有限公司 | 用于确定预计到达时间的方法和设备 |
CN108009656A (zh) * | 2017-08-16 | 2018-05-08 | 北京嘀嘀无限科技发展有限公司 | 网约车订单处理方法、系统、终端及服务器 |
CN108460674A (zh) * | 2018-02-01 | 2018-08-28 | 平安科技(深圳)有限公司 | 信息处理方法、装置、计算机设备和存储介质 |
CN108596678A (zh) * | 2018-05-02 | 2018-09-28 | 陈思恩 | 一种航空公司旅客价值计算方法 |
CN109451038A (zh) * | 2018-12-06 | 2019-03-08 | 北京达佳互联信息技术有限公司 | 一种信息推送方法、装置、服务器及计算机可读存储介质 |
CN109522372A (zh) * | 2018-11-21 | 2019-03-26 | 北京交通大学 | 民航领域旅客价值的预测方法 |
CN109670277A (zh) * | 2019-02-19 | 2019-04-23 | 南京邮电大学 | 一种基于多模态数据融合与多模型集成的旅行时间预测方法 |
CN109768879A (zh) * | 2018-12-14 | 2019-05-17 | 北京爱奇艺科技有限公司 | 目标业务服务器的确定方法、装置及服务器 |
CN109816438A (zh) * | 2019-01-11 | 2019-05-28 | 珠海天燕科技有限公司 | 信息推送方法及装置 |
CN109903191A (zh) * | 2019-01-04 | 2019-06-18 | 平安科技(深圳)有限公司 | 基于机器学习的旅行推荐方法、装置、存储介质及终端 |
CN110288121A (zh) * | 2019-05-16 | 2019-09-27 | 北京交通大学 | 基于多粒度时间注意力机制的航班客座率预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080243561A1 (en) * | 2007-04-02 | 2008-10-02 | Amadeus S.A.S. | Electronic mail based travel document check-in system |
-
2019
- 2019-10-21 CN CN201911002630.1A patent/CN110751395B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063675A (zh) * | 2009-06-03 | 2011-05-18 | 埃森哲环球服务有限公司 | 旅行相关报价的生成 |
CN103310299A (zh) * | 2013-05-17 | 2013-09-18 | 北京博研智通科技有限公司 | 一种机场导乘系统及方法 |
CN105654416A (zh) * | 2015-12-25 | 2016-06-08 | 中国民航信息网络股份有限公司 | 自助服务推送方法及客户端 |
CN105654340A (zh) * | 2015-12-28 | 2016-06-08 | 中国民航信息网络股份有限公司 | 旅客真实航程的确定方法及系统 |
CN107305742A (zh) * | 2016-04-18 | 2017-10-31 | 滴滴(中国)科技有限公司 | 用于确定预计到达时间的方法和设备 |
CN106780274A (zh) * | 2016-12-30 | 2017-05-31 | 中国民航信息网络股份有限公司 | 中转旅客的识别方法及装置 |
CN108009656A (zh) * | 2017-08-16 | 2018-05-08 | 北京嘀嘀无限科技发展有限公司 | 网约车订单处理方法、系统、终端及服务器 |
CN108460674A (zh) * | 2018-02-01 | 2018-08-28 | 平安科技(深圳)有限公司 | 信息处理方法、装置、计算机设备和存储介质 |
CN108596678A (zh) * | 2018-05-02 | 2018-09-28 | 陈思恩 | 一种航空公司旅客价值计算方法 |
CN109522372A (zh) * | 2018-11-21 | 2019-03-26 | 北京交通大学 | 民航领域旅客价值的预测方法 |
CN109451038A (zh) * | 2018-12-06 | 2019-03-08 | 北京达佳互联信息技术有限公司 | 一种信息推送方法、装置、服务器及计算机可读存储介质 |
CN109768879A (zh) * | 2018-12-14 | 2019-05-17 | 北京爱奇艺科技有限公司 | 目标业务服务器的确定方法、装置及服务器 |
CN109903191A (zh) * | 2019-01-04 | 2019-06-18 | 平安科技(深圳)有限公司 | 基于机器学习的旅行推荐方法、装置、存储介质及终端 |
CN109816438A (zh) * | 2019-01-11 | 2019-05-28 | 珠海天燕科技有限公司 | 信息推送方法及装置 |
CN109670277A (zh) * | 2019-02-19 | 2019-04-23 | 南京邮电大学 | 一种基于多模态数据融合与多模型集成的旅行时间预测方法 |
CN110288121A (zh) * | 2019-05-16 | 2019-09-27 | 北京交通大学 | 基于多粒度时间注意力机制的航班客座率预测方法 |
Non-Patent Citations (2)
Title |
---|
一种基于航空旅客行为的旅客细分模型;许青林等;《计算机工程与应用》(第24期);全文 * |
民航旅客后续行程推断方法应用;邹威;《电子技术与软件工程》(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110751395A (zh) | 2020-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109214584B (zh) | 用于预测客流量的方法和装置 | |
CN110751395B (zh) | 一种旅客行程状态确定方法、装置及服务器 | |
CN106651213B (zh) | 服务订单的处理方法及装置 | |
CN104537502A (zh) | 处理订单的方法和设备 | |
Nuzzolo et al. | Individual utility‐based path suggestions in transit trip planners | |
CN105589939A (zh) | 识别群体运动轨迹方法和装置 | |
CN113287124A (zh) | 用于搭乘订单派遣的系统和方法 | |
CN109739965B (zh) | 跨领域对话策略的迁移方法及装置、设备、可读存储介质 | |
CN113723288B (zh) | 基于多模态混合模型的业务数据处理方法及装置 | |
CN112884235B (zh) | 出行推荐方法、出行推荐模型的训练方法、装置 | |
CN111104585B (zh) | 一种问题推荐方法及装置 | |
Cheon et al. | Data-driven stochastic transit assignment modeling using an automatic fare collection system | |
CN107392392A (zh) | 基于深度学习的微博转发预测方法 | |
Xu et al. | A taxi dispatch system based on prediction of demand and destination | |
CN116629338A (zh) | 一种模型数据的处理方法、相关装置、设备以及存储介质 | |
CN110222892A (zh) | 乘客的下车站点预测方法及装置 | |
CN111369029A (zh) | 服务选择预测方法、装置、电子设备及存储介质 | |
CN111858923A (zh) | 一种文本分类方法、系统、装置及存储介质 | |
CN115936801A (zh) | 基于神经网络的产品推荐方法、装置、设备和存储介质 | |
CN110766435B (zh) | 向量训练方法、装置、电子设备以及计算机可读存储介质 | |
CN107784548A (zh) | 订单处理方法和装置 | |
CN113128597A (zh) | 一种用户行为特征的提取和分类预测的方法及装置 | |
CN110689158B (zh) | 一种对目的地进行预测的方法、装置及存储介质 | |
CN110751576B (zh) | 一种旅客行程确定方法、装置及服务器 | |
CN114510638B (zh) | 信息处理方法、装置、设备、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |