CN112836996A - 一种识别乘客潜在购票需求的方法 - Google Patents
一种识别乘客潜在购票需求的方法 Download PDFInfo
- Publication number
- CN112836996A CN112836996A CN202110259342.5A CN202110259342A CN112836996A CN 112836996 A CN112836996 A CN 112836996A CN 202110259342 A CN202110259342 A CN 202110259342A CN 112836996 A CN112836996 A CN 112836996A
- Authority
- CN
- China
- Prior art keywords
- passenger
- ticket
- train
- deterministic
- tickets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000006399 behavior Effects 0.000 claims abstract description 39
- 238000012706 support-vector machine Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 33
- 238000012360 testing method Methods 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 7
- 239000004576 sand Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 claims description 3
- 239000002184 metal Substances 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种识别乘客潜在购票需求的方法。该方法包括:获取目标列车的相关数据,并进行处理;建立余票更新机制;根据乘客购票行为及各等级列车席位的余票情况,将乘客的购票意愿分为确定性意愿和非确定性意愿,将乘客购票数据分为确定性意愿的乘客购票数据和非确定性意愿的乘客购票数据;对经过处理后的目标列车的相关数据进行特征提取,得到与列车席位等级相关性高的特征;基于确定性意愿的乘客购票数据构建用于识别乘客的潜在购票需求的支持向量机模型;用所构建的该支持向量机模型识别每位非确定性意愿的乘客的潜在购票需求。通过该方法能够挖掘出隐藏在不确定需求背后的潜在购票需求,为区间票额分配提供更可靠的依据。
Description
技术领域
本发明涉及铁路运输领域,特别是针对乘客的不确定购票需求进行需求重新识别提出了一种识别乘客潜在购票需求的方法。
背景技术
高速铁路在我国交通运输系统中扮演着重要的角色,2019年运输的乘客比例占所有运输方式的64.1%,但是即便如此,很少线路能够既满足乘客的需求又达到铁路期望的收入水平。要解决该问题,一般有两种方法:一种是调整价格策略,另一种则是合理规划利用列车的运输能力。前者要在我国实施并不容易,因为铁路票价由政府调控,受外界的影响太小,所以合理利用列车的运输能力就成了一个重要的研究方向,在合理分配列车能力的时候不仅要有优化方法同时要充分考虑旅客的需求才能实现双赢。
乘客的潜在购票需求在某种程度上可以根据购票行为来确定,但是有些乘客的购票行为并不能反映其潜在购票需求,因为部分乘客发生购票行为时受到了一些限制条件(如某种类型的票已经售罄)。因此,对这类不能反映乘客潜在购票需求的购票行为,我们设计了一种识别其潜在购票需求的方法,从而为票额分配提供强有力的支撑,进而提高列车的上座率。
发明内容
本发明的发明目的:针对乘客不确定的购票需求进行需求重新识别提出一种识别乘客潜在购票需求的方法,从而为票额分配提供强有力的支撑,进而提高列车的上座率、收入等。
本发明为实现其发明目的所采取的技术方案:一种识别乘客潜在购票需求的方法,所述方法包括以下步骤:
S1、获取目标列车的相关数据,并对目标列车的相关数据进行处理;
S2、建立余票更新机制;
S3、根据乘客购票行为及各等级列车席位的余票情况,将乘客的购票意愿分为确定性意愿和非确定性意愿,因此将乘客购票数据分为确定性意愿的乘客购票数据(即通过乘客的购票行为能够确定乘客的潜在购票需求的乘客购票数据)和非确定性意愿的乘客购票数据(即通过乘客的购票行为无法确定乘客的潜在购票需求的乘客数据);
所述确定性意愿:在各等级列车席位的余票数量都能够满足乘客需求的情况下,若乘客选择购买其中一种等级列车席位的车票,则认定乘客的购票行为与其潜在购票需求是一致的,此时通过乘客的购票行为能够确定乘客的潜在购票需求,将这种情况下的乘客购票意愿称为确定性意愿;
所述非确定性意愿:在不同等级列车席位中有一种以上等级列车席位的余票数量不能够满足乘客需求的情况下,若乘客选择购买其中一种等级列车席位余票数量能够满足乘客需求的车票,则认定乘客的购票行为与其潜在购票需求之间的关系是不确定的,此时通过乘客的购票行为无法确定乘客的潜在购票需求,将这种情况下的乘客购票意愿称为非确定性意愿;
S4、对经过步骤S1处理后的所述目标列车的相关数据进行特征提取,得到与列车席位等级相关性高的特征;
S5、基于所述确定性意愿的乘客购票数据构建用于识别乘客潜在购票需求的支持向量机模型;
S6、用所构建的用于识别乘客潜在购票需求的支持向量机模型对输入的每位乘客的购票数据进行分析并划分列车席位需求等级,进而识别出每位非确定性意愿的乘客的潜在购票需求。
进一步,所述目标列车的相关数据包括:目标列车的发车日期,目标列车的席位等级分布,目标列车各等级席位的定员,目标列车运行的OD区间,目标列车运行的OD区间的距离,乘客购票提前天数,乘客的购票渠道,乘客所购车票的起点站,乘客所购车票的终点站,乘客所购车票的起点站和终点站所在城市的行政等级,乘客购票数量,乘客所购车票的席位等级。
进一步,所述步骤S2,建立余票更新机制,具体包括:
用c表示目标列车席位等级编号,i表示不同OD区间的起点站编号,j表示不同OD区间的终点站编号;用矩阵描述目标列车运行在OD区间(i,j)的c等级列车席位的余票数量;用表示乘客购买起点站为i、终点站为j,且列车席位等级为c的车票数量;设置各等级列车席位的余票数量的初始值为目标列车对应等级席位的定员;当发生乘客购票行为并且购票行为成立时,所涉及的列车运行的OD区间对应等级的列车席位的余票数量立即更新,具体步骤包括:
进一步,所述步骤S4,对经过步骤S1处理后的所述目标列车的相关数据进行特征提取,得到与列车席位等级相关性高的特征,具体包括:
判断列车席位等级与其余特征之间的关系,并分别计算出列车席位等级与任一其余特征之间的相关系数,依据计算出的相关系数提取与列车席位等级相关性高的特征;所述其余特征是指不包括列车席位等级在内的经过步骤S1处理后的所述目标列车的相关数据;
计算相关系数的公式为:
公式中,rm表示列车席位等级与任一其余特征之间的相关系数;n表示样本容量,k≤n;y表示列车席位等级;xm表示任一其余特征。
进一步,所述步骤S5和所述步骤S6,具体包括:
定义已购票乘客样本数据集、训练集、测试集,如下:
所述训练集是由所述确定性意愿的乘客购票数据组成,记为S,用于进行数据分析并构建用于识别乘客潜在购票需求的支持向量机模型;
所述测试集是由所述非确定性意愿的乘客购票数据组成,记为T,用于测试所构建的用于识别乘客潜在购票需求的支持向量机模型在实际应用中的预测表现情况,同时识别出每位所述非确定性意愿的乘客的潜在购票需求;
令其中,为任一子训练集,表示第h次购票信息对应的数据;表示第h次购票的属性特征,且yh表示对应属性条件下实际购票的列车席位等级的标签,且yh∈{0,1},其中数值0和1代表两种不同的列车席位等级;h=1,2,…,l;l代表子训练集的总量;
采用所述训练集构造特征空间中的超平面:基于所述训练集获得的信息,根据列车席位等级种类将特征空间分为两种,用于描述所述超平面的函数表达式为f(x)=ωx+b,ω为所述超平面的法向量,b为所述超平面的一个变量;
基于所述训练集,求解得到ω和b的最优解可以用于解决如下优化问题:
0≤αs≤C,s=1,2,…,l,
式中,α=(α1,α2,…,αl)T是拉格朗日乘子向量;K是内核函数;C是手动设置的惩罚因子;Xs和Xt是任一两个子训练集的输入,ys和yt分别是对应的两个子训练集的标签,ys∈{0,1},yt∈{0,1};
进一步,所述与列车席位等级相关性高的特征包括:目标列车运行的OD区间,目标列车运行的OD区间的距离,乘客购票提前天数,乘客所购车票的起点站,乘客所购车票的终点站,乘客所购车票的起点站和终点站所在城市的行政等级。
与现有技术相比,本发明具有的有益效果:
(1)本发明是针对非确定性意愿的乘客购票需求进行需求重新识别提出的一种识别乘客潜在购票需求的方法,首先通过数据处理将其按照确定需求和不确定需求进行分类(分为确定性意愿的乘客购票数据和非确定性意愿的乘客购票数据),然后经过一系列特征处理和提取,最后构建用于识别乘客潜在购票需求的支持向量机模型,并利用该支持向量机模型识别隐藏在不确定需求(即非确定性意愿)背后的潜在购票需求。
(2)由本发明方法得到的乘客的潜在购票需求数据(即隐藏在不确定需求背后的潜在购票需求数据)能够为区间票额分配提供更可靠的依据,进而提高列车的上座率、收入等。
(3)本发明对所获得数据进行特征提取,分析各特征与列车席位等级的相关性,并且确定了与列车席位等级高度相关的特征,这为之后针对各区间进行不同等级列车席位的票额分配提供了强有力的依据。
(4)本发明建立的余票更新机制,有助于相关管理人员了解票额出售的实时状态,同时方便乘客实时查阅不同预售天数下不同列车席位等级的票额剩余情况,通过对大量数据的分析,可以得出乘客的购票规律。
下面通过具体实施方式及附图对本发明作进一步详细说明,但并不意味着对本发明保护范围的限制。
附图说明
图1为本发明实施例的余票更新流程图。
图2为本发明实施例列车席位等级与其余特征之间的相关性分析图。
图3为本发明实施例六个相关性较高的特征的贡献情况图。
图4为本发明实施例通过交叉验证得到的拟合轮廓图。
图5为本发明实施例对一等座中的非确定性意愿的预测结果图。
图6为本发明实施例对二等座中的非确定性意愿的预测结果图。
具体实施方式
实施例
本例给出的一种识别乘客潜在购票需求的方法,首先通过数据处理将其按照确定需求和不确定需求进行分类(分为确定性意愿的乘客购票数据和非确定性意愿的乘客购票数据),然后经过一系列特征处理和提取,最后构建用于识别乘客潜在购票需求的支持向量机模型,并利用该支持向量机模型识别隐藏在不确定需求(即非确定性意愿)背后的潜在购票需求。
本例所涉及的数据来自编号为D2818的列车(即目标列车),该列车服务18个站点,但本例所采用的数据仅涉及其中12个站点;另外,本例只考虑该列车席位等级为一等座和二等座的情况。因此,用c表示目标列车席位等级编号,且c∈{1,2};用i表示不同OD区间的起点站编号,j表示不同OD区间的终点站编号;用矩阵描述目标列车运行在OD区间(i,j)的c等级列车席位的余票数量;用表示乘客购买起点站为i、终点站为j,且列车席位等级为c的车票数量;设置各等级列车席位的余票数量的初始值为目标列车对应等级席位的定员;当发生乘客购票行为并且购票行为成立时,所涉及的列车运行的OD区间对应等级的列车席位的余票数量立即更新。现按步骤对本例进行具体描述如下:
S1、获取目标列车的相关数据,并对目标列车的相关数据进行处理。
本例目标列车的相关数据包括:目标列车的发车日期,目标列车的席位等级分布,目标列车各等级席位的定员,目标列车运行的OD区间,目标列车运行的OD区间的距离,乘客购票提前天数,乘客的购票渠道,乘客所购车票的起点站,乘客所购车票的终点站,乘客所购车票的起点站和终点站所在城市的行政等级,乘客购票数量,乘客所购车票的席位等级级。
对已获得的数据进行梳理,明确始发站、终点站及经停站,然后确定各个站所在城市的行政等级,用以下公式计算所涉及的不同行政等级组合的OD区间:
S2、建立余票更新机制,具体包括:
图1为本例的余票更新流程图。首先,对一等座和二等座的余票矩阵初始化,列车一等座和二等座的余票数量的初始值均为该列车对应等级席位总数(在流程最初的时候因为还没有车票被售出,初始化时即所有运行区间的余票数量均为列车相对席位的定员);然后,当有票售出时,比较对应的余票数量与乘客所购票数的大小,如果对应的余票数量大于乘客所购票数,则乘客的购票行为成立,同时更新对应的矩阵;最后,判断更新后的余票数量是否大于0,若大于0则继续执行售票流程,否则终止售票。
S3、根据乘客购票行为及各等级列车席位的余票情况,将乘客的购票意愿分为确定性意愿和非确定性意愿,因此将乘客购票数据分为确定性意愿的乘客购票数据和非确定性意愿的乘客购票数据。
确定性意愿:在各等级列车席位的余票数量都能够满足乘客需求的情况下,若乘客选择购买其中一种等级列车席位的车票,则认定乘客的购票行为与其潜在购票需求是一致的,此时通过乘客的购票行为能够确定乘客的潜在购票需求,将这种情况下的乘客购票意愿称为确定性意愿。
非确定性意愿:在不同等级列车席位中有一种以上等级列车席位的余票数量不能够满足乘客需求的情况下,若乘客选择购买其中一种等级列车席位余票数量能够满足乘客需求的车票,则认定乘客的购票行为与其潜在购票需求之间的关系是不确定的,此时通过乘客的购票行为无法确定乘客的潜在购票需求,将这种情况下的乘客购票意愿称为非确定性意愿。
表1为根据乘客购票行为及各等级列车席位的余票情况来判断乘客的购票意愿是确定性意愿还是非确定性意愿。如表中编号为1和2所示,在一等座和二等座的余票数量都能够满足乘客需求的情况下,乘客选择购买其中一种等级列车席位的车票,此时乘客的购票行为均能反映其潜购票需求,此时将乘客的购票意愿为确定性意愿;但是,如表中编号为3和4所示,在一等座和二等座中有一种等级列车席位的余票数量不能够满足乘客需求的情况下,乘客选择购买其中一种等级列车席位的车票,此时我们就无法判断该乘客的购票行为是否反映了其潜在购票需求,此时将乘客的购票意愿为非确定性意愿。
表1根据乘客购票行为及各等级列车席位的余票情况来判断乘客的购票意愿情况
S4、对经过步骤S1处理后的目标列车的相关数据进行特征提取,得到与列车席位等级相关性高的特征,具体包括:
判断列车席位等级与其余特征之间的关系,并分别计算出列车席位等级与任一其余特征之间的相关系数,依据计算出的相关系数提取与列车席位等级相关性高的特征;其余特征是指不包括列车席位等级在内的经过步骤S1处理后的目标列车的相关数据;
计算相关系数的公式为:
公式中,rm表示列车席位等级与任一其余特征之间的相关系数;n表示样本容量,k≤n;y表示列车席位等级;xm表示任一其余特征。
本例与列车席位等级相关性高的特征包括:目标列车运行的OD区间,目标列车运行的OD区间的距离,乘客购票提前天数,乘客所购车票的起点站,乘客所购车票的终点站,乘客所购车票的起点站和终点站所在城市的行政等级。
图2是本例的列车席位等级与其余特征之间的相关性分析图。通过图2可以发现:起点站(即乘客所购车票的起点站)、终点站(即乘客所购车票的终点站)、OD区间(即目标列车运行所经过的各个OD区间)、OD区间距离(即目标列车运行所经过的各个OD区间的距离)、行政等级(即乘客所购车票的起点站和终点站所在城市的行政等级)以及购票提前天数(即乘客购票提前天数),这六个特征都与列车席位等级之间存在较高的相关性。
表2是对图2中展示的与列车席位等级相关度较高的六个特征以及列车席位等级的解释,包括各个特征值的取值范围,以及各个特征所属类型。
表2与列车席位等级相关度较高的特征以及列车席位等级的解释
图3是本例的六个相关性较高的特征的贡献情况图,即给出了起点站(即乘客所购车票的起点站)、终点站(即乘客所购车票的终点站)、OD区间(即目标列车运行所经过的各个的OD区间)、OD区间距离(即目标列车运行所经过的各个OD区间的距离)、行政等级(即乘客所购车票的起点站和终点站所在城市的行政等级)以及购票提前天数(即乘客购票提前天数),这六个相关性较高的特征的贡献值。为了避免反常样本的干扰,在整个过程中,我们都对数据进行了清洗。从图3中可以看出,购票提前天数及OD区间的贡献值相较其他特征来说都很小,所以我们进一步将这两种特征从所提取的六个特征中剔除。
S5、基于确定性意愿的乘客购票数据构建用于识别乘客潜在购票需求的支持向量机模型。
S6、用所构建的用于识别乘客潜在购票需求的支持向量机模型对输入的每位乘客的购票数据进行分析并划分列车席位需求等级,进而识别出每位非确定性意愿的乘客的潜在购票需求。
本例步骤S5和步骤S6,具体包括:
定义已购票乘客样本数据集、训练集、测试集,如下:
训练集是由确定性意愿的乘客购票数据组成,记为S,用于进行数据分析并构建用于识别乘客潜在购票需求的支持向量机模型;
测试集是由非确定性意愿的乘客购票数据组成,记为T,用于测试所构建的用于识别乘客潜在购票需求的支持向量机模型在实际应用中的预测表现情况,同时识别出每位非确定性意愿的乘客的潜在购票需求;
令其中,为任一子训练集,表示第h次购票信息对应的数据;表示第h次购票的属性特征,且yh表示对应属性条件下实际购票的列车席位等级的标签,且yh∈{0,1},其中数值0和1代表两种不同的列车席位等级;h=1,2,…,l;l代表子训练集的总量;
采用训练集构造特征空间中的超平面:基于训练集获得的信息,根据列车席位等级种类将特征空间分为两种,用于描述超平面的函数表达式为f(x)=ωx+b,ω为该超平面的法向量,b为该超平面的一个变量;
基于训练集,求解得到ω和b的最优解可以用于解决如下优化问题:
0≤αs≤C,s=1,2,…,l,
式中,α=(α1,α2,…,αl)T是拉格朗日乘子向量;K是内核函数;C是手动设置的惩罚因子;Xs和Xt是任一两个子训练集的输入,ys和yt分别是对应的两个子训练集的标签,ys∈{0,1},yt∈{0,1};
由前文的分析可知,我们可以将乘客的购票意愿分类为确定性意愿和非确定性意愿。现为了进一步验证所构建的用于识别乘客潜在购票需求的支持向量机模型的有效性,拟用已知的确定性意愿数据进行测试。(补充说明:后文中的训练集和测试集有别于前文所述的,将后文中训练集和测试集记为训练集E和测试集F进行区分。因为前文所述的训练集和测试集是按照确定性意愿和非确定性意愿对数据进行划分,而后文是为了验证模型的有效性,而采用确定性意愿数据来测试,所以是将确定性意愿数据分为训练集E和测试集F。)具体如下:
采集数据为2017年11月21日至11月27日列车运行过程的购票信息,因此数据集以天为单位进行分类。训练集E是由这7天数据中任意6天中的确定性意愿数据组成的,而剩余的1天中的确定性意愿数据则组成测试集F。预测集是由这7天数据中的非确定性意愿数据组成的。为了能够得到更加准确的预测结果,我们通过调整所构建的用于识别乘客潜在购票需求的支持向量机模型的相关参数的取值来获得不同参数下的拟合准确度,从而选择拟合准确度最高的参数组用于预测,得到同等条件下最准确的预测结果。由此,我们对这7天的数据通过调整所构建的用于识别乘客潜在购票需求的支持向量机模型中内核函数K的关键参数值σ和γ进行交叉验证,得到不同参数下的拟合轮廓图,如图4所示。从图4中可以看出,拟合度最高的可达94%,这也为机器学习模型的参数选取提供了有力的依据。图5是对一等座中的非确定性意愿的预测结果图,表示乘客的潜在购票需求是二等座,但实际购票结果是一等座的分布情况,结果表明这部分乘客通常是长距离或短距离旅程的乘客。图6是对二等座中的非确定性意愿的预测结果图,表示乘客的潜在购票需求是一等座,但实际购票结果是二等座的分布情况,结果表明这部分乘客主要为中长距离或短距离的乘客。从图5和图6的结果可以看出,购买了一等座的乘客有较多人实际想购买二等座;有少部分购买二等座的乘客希望购买一等座,显然该部分乘客即为未被满足的具有更高消费能力的乘客。
同理,乘客购买其他列车席位等级的车票(如无座或商务座)的情况也可以根据本例方式进行,此处不再重复。
上述结合附图对本发明进行了示例性描述,显然本发明的具体实现并不受本文所示的实施例的限制。
Claims (6)
1.一种识别乘客潜在购票需求的方法,其特征在于,所述方法包括以下步骤:
S1、获取目标列车的相关数据,并对目标列车的相关数据进行处理;
S2、建立余票更新机制;
S3、根据乘客购票行为及各等级列车席位的余票情况,将乘客的购票意愿分为确定性意愿和非确定性意愿,因此将乘客购票数据分为确定性意愿的乘客购票数据和非确定性意愿的乘客购票数据;
所述确定性意愿:在各等级列车席位的余票数量都能够满足乘客需求的情况下,若乘客选择购买其中一种等级列车席位的车票,则认定乘客的购票行为与其潜在购票需求是一致的,此时通过乘客的购票行为能够确定乘客的潜在购票需求,将这种情况下的乘客购票意愿称为确定性意愿;
所述非确定性意愿:在不同等级列车席位中有一种以上等级列车席位的余票数量不能够满足乘客需求的情况下,若乘客选择购买其中一种等级列车席位余票数量能够满足乘客需求的车票,则认定乘客的购票行为与其潜在购票需求之间的关系是不确定的,此时通过乘客的购票行为无法确定乘客的潜在购票需求,将这种情况下的乘客购票意愿称为非确定性意愿;
S4、对经过步骤S1处理后的所述目标列车的相关数据进行特征题取,得到与列车席位等级相关性高的特征;
S5、基于所述确定性意愿的乘客购票数据构建用于识别乘客潜在购票需求的支持向量机模型;
S6、用所构建的用于识别乘客潜在购票需求的支持向量机模型对输入输入的每位乘客的购票数据进行分析并划分列车席位需求等级,进而识别出每位非确定性意愿的乘客的潜在购票需求。
2.根据权利要求1所述的一种识别乘客潜在购票需求的方法,其特征在于,所述目标列车的相关数据包括:目标列车的发车日期,目标列车的席位等级分布,目标列车各等级席位的定员,目标列车运行的OD区间,目标列车运行的OD区间的距离,乘客购票提前天数,乘客的购票渠道,乘客所购车票的起点站,乘客所购车票的终点站,乘客所购车票的起点站和终点站所在城市的行政等级,乘客购票数量,乘客所购车票的席位等级。
3.根据权利要求1所述的一种识别乘客潜在购票需求的方法,其特征在于,所述步骤S2,建立余票更新机制,具体包括:
用c表示目标列车席位等级编号,i表示不同OD区间的起点站编号,j表示不同OD区间的终点站编号;用矩阵描述目标列车运行在OD区间(i,j)的c等级列车席位的余票数量;用表示乘客购买起点站为i、终点站为j,且列车席位等级为c的车票数量;设置各等级列车席位的余票数量的初始值为目标列车对应等级席位的定员;当发生乘客购票行为并且购票行为成立时,所涉及的列车运行的OD区间对应等级的列车席位的余票数量立即更新,具体步骤包括:
5.根据权利要求1所述的一种识别乘客潜在购票需求的方法,其特征在于,所述步骤S5和所述步骤S6,具体包括:
定义已购票乘客样本数据集、训练集、测试集,如下:
所述训练集是由所述确定性意愿的乘客购票数据组成,记为S,用于进行数据分析并构建用于识别乘客潜在购票需求的支持向量机模型;
所述测试集是由所述非确定性意愿的乘客购票数据组成,记为T,用于测试所构建的用于识别乘客潜在购票需求的支持向量机模型在实际应用中的预测表现情况,同时识别出每位所述非确定性意愿的乘客的潜在购票需求;
令其中,为任一子训练集,表示第h次购票信息对应的数据;表示第h次购票的属性特征,目yh表示对应属性条件下实际购票的列车席位等级的标签,且yh∈{0,1},其中数值0和1代表两种不同的列车席位等级;h=1,2,...,l;l代表子训练集的总量;
采用所述训练集构造特征空间中的超平面:基于所述训练集获得的信息,根据列车席位等级种类将特征空间分为两种,用于描述所述超平面的函数表达式为f(x)=ωx+b,ω为所述超平面的法向量,b为所述超平面的一个变量;
基于所述训练集,求解得到ω和b的最优解可以用于解决如下优化问题:
0≤αs≤C,s=1,2,...,l,
式中,α=(α1,α2,...,αl)T是拉格朗日乘子向量;K是内核函数;C是手动设置的惩罚因子;Xs和Xt是任一两个子训练集的输入,ys和yt分别是对应的两个子训练集的标签,ys∈{0,1},yt∈{0,1};
6.根据权利要求1或4所述的一种识别乘客潜在购票需求的方法,其特征在于,所述与列车席位等级相关性高的特征包括:目标列车运行的OD区间,目标列车运行的OD区间的距离,乘客购票提前天数,乘客所购车票的起点站,乘客所购车票的终点站,乘客所购车票的起点站和终点站所在城市的行政等级。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110259342.5A CN112836996B (zh) | 2021-03-10 | 2021-03-10 | 一种识别乘客潜在购票需求的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110259342.5A CN112836996B (zh) | 2021-03-10 | 2021-03-10 | 一种识别乘客潜在购票需求的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112836996A true CN112836996A (zh) | 2021-05-25 |
CN112836996B CN112836996B (zh) | 2022-03-04 |
Family
ID=75929947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110259342.5A Active CN112836996B (zh) | 2021-03-10 | 2021-03-10 | 一种识别乘客潜在购票需求的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112836996B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11645688B2 (en) * | 2018-08-02 | 2023-05-09 | T-Mobile Usa, Inc. | User-behavior-based predictive product and service provisioning |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006008571A1 (en) * | 2004-07-08 | 2006-01-26 | Flaminio Cianci | Negotiable lottery ticket game and method |
CN103838855A (zh) * | 2014-03-17 | 2014-06-04 | 广东创能科技有限公司 | 余票更新的方法 |
US20150066546A1 (en) * | 2013-08-30 | 2015-03-05 | Live Nation Entertainment, Inc. | Biased ticket offers for actors identified using dynamic assessments of actors' attributes |
CN107527223A (zh) * | 2016-12-22 | 2017-12-29 | 北京锐安科技有限公司 | 一种购票信息分析的方法及装置 |
CN108133302A (zh) * | 2016-12-01 | 2018-06-08 | 上海浦东建筑设计研究院有限公司 | 一种基于大数据的公共自行车潜在需求预测方法 |
CN108491979A (zh) * | 2018-04-03 | 2018-09-04 | 中南大学 | 基于等强度分配的高速铁路旅客出行时变需求预测方法 |
CN108805344A (zh) * | 2018-05-29 | 2018-11-13 | 五邑大学 | 一种考虑时变需求的高速铁路网络列车开行方案优化方法 |
CN109993577A (zh) * | 2019-03-25 | 2019-07-09 | 上海工程技术大学 | 一种基于需求转移的可召回舱位控制方法 |
CN110245976A (zh) * | 2019-05-20 | 2019-09-17 | 北京交通大学 | 一种基于大数据的高速铁路动态票价定制系统及方法 |
CN110335099A (zh) * | 2019-05-06 | 2019-10-15 | 北京盛威时代科技有限公司 | 一种基于用户历史数据的车票购买线路推荐方法 |
CN110648407A (zh) * | 2019-10-18 | 2020-01-03 | 合肥工业大学 | 一种列车分段式的座位关联售票方法 |
CN111598317A (zh) * | 2020-05-08 | 2020-08-28 | 内蒙古大学 | 一种铁路定制化列车开行方案生成优化方法 |
-
2021
- 2021-03-10 CN CN202110259342.5A patent/CN112836996B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006008571A1 (en) * | 2004-07-08 | 2006-01-26 | Flaminio Cianci | Negotiable lottery ticket game and method |
US20150066546A1 (en) * | 2013-08-30 | 2015-03-05 | Live Nation Entertainment, Inc. | Biased ticket offers for actors identified using dynamic assessments of actors' attributes |
CN103838855A (zh) * | 2014-03-17 | 2014-06-04 | 广东创能科技有限公司 | 余票更新的方法 |
CN108133302A (zh) * | 2016-12-01 | 2018-06-08 | 上海浦东建筑设计研究院有限公司 | 一种基于大数据的公共自行车潜在需求预测方法 |
CN107527223A (zh) * | 2016-12-22 | 2017-12-29 | 北京锐安科技有限公司 | 一种购票信息分析的方法及装置 |
CN108491979A (zh) * | 2018-04-03 | 2018-09-04 | 中南大学 | 基于等强度分配的高速铁路旅客出行时变需求预测方法 |
CN108805344A (zh) * | 2018-05-29 | 2018-11-13 | 五邑大学 | 一种考虑时变需求的高速铁路网络列车开行方案优化方法 |
CN109993577A (zh) * | 2019-03-25 | 2019-07-09 | 上海工程技术大学 | 一种基于需求转移的可召回舱位控制方法 |
CN110335099A (zh) * | 2019-05-06 | 2019-10-15 | 北京盛威时代科技有限公司 | 一种基于用户历史数据的车票购买线路推荐方法 |
CN110245976A (zh) * | 2019-05-20 | 2019-09-17 | 北京交通大学 | 一种基于大数据的高速铁路动态票价定制系统及方法 |
CN110648407A (zh) * | 2019-10-18 | 2020-01-03 | 合肥工业大学 | 一种列车分段式的座位关联售票方法 |
CN111598317A (zh) * | 2020-05-08 | 2020-08-28 | 内蒙古大学 | 一种铁路定制化列车开行方案生成优化方法 |
Non-Patent Citations (4)
Title |
---|
POPP NELS等: "An Analysis of Attributes Impacting Consumer Online Sport Ticket Purchases in a Dual Market Environment", 《SPORT MARKETING QUARTERLY》 * |
刘帆洨: "铁路客运票额动态分配研究", 《中国优秀博士学位论文全文数据库工程科技Ⅱ辑》 * |
刘帆洨等: "铁路旅客购票需求预测模型研究", 《交通运输工程与信息学报》 * |
杨洁等: "基于最大上座率春运火车票票额分配模型", 《合作经济与科技》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11645688B2 (en) * | 2018-08-02 | 2023-05-09 | T-Mobile Usa, Inc. | User-behavior-based predictive product and service provisioning |
Also Published As
Publication number | Publication date |
---|---|
CN112836996B (zh) | 2022-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Piermartini et al. | Demystifying modelling methods for trade policy | |
CN105931068A (zh) | 一种持卡人消费画像的生成方法及装置 | |
CN109063931A (zh) | 一种预测货运物流司机违约概率的模型方法 | |
Yang | Transport infrastructure, city productivity growth and sectoral reallocation: Evidence from China | |
CN108985347A (zh) | 分类模型的训练方法、店铺分类的方法及装置 | |
CN112949926B (zh) | 一种基于乘客需求重识别的收入最大化票额分配方法 | |
Moufad et al. | A study framework for assessing the performance of the urban freight transport based on PLS approach | |
CN111899059A (zh) | 一种基于区块链的航司收益管理动态定价方法 | |
Tavassoli et al. | Modelling passenger waiting time using large-scale automatic fare collection data: An Australian case study | |
CN105206040B (zh) | 一种基于ic卡数据的公交串车预测方法 | |
CN114187120A (zh) | 一种车险理赔欺诈风险识别方法及装置 | |
CN112836996B (zh) | 一种识别乘客潜在购票需求的方法 | |
CN114638688A (zh) | 一种用于信贷反欺诈的拦截策略衍生方法、系统 | |
CN110852792A (zh) | 一种基于大数据分析的航线价值评估方法及相关产品 | |
Shi et al. | Boosting conditional logit model | |
CN110020666B (zh) | 一种基于乘客行为模式的公共交通广告投放方法及系统 | |
Singer | Endogenous markups, input misallocation and geographical supplier access.” | |
CN109145207B (zh) | 一种基于分类指标预测的信息个性化推荐方法及装置 | |
CN112819388B (zh) | 一种基于乘客需求重识别的长距离优先票额分配方法 | |
Chen et al. | Macro-level accident fatality prediction using a combined model based on ARIMA and multivariable linear regression | |
Grifoll et al. | Forecasting performance of cruise passengers: the Spanish ports case | |
CN113420789A (zh) | 一种预测风险账号的方法、装置、存储介质和计算机设备 | |
Shen et al. | Unveiling the influential factors for customized bus service reopening from naturalistic observations in Shanghai | |
CN110555659A (zh) | 第四方物流平台对于货主的价值分析方法 | |
Daly et al. | The effect of price competition on weapon system acquisition costs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |