CN112052898B - 一种城际高铁乘客的潜在分类模型构建方法和系统 - Google Patents

一种城际高铁乘客的潜在分类模型构建方法和系统 Download PDF

Info

Publication number
CN112052898B
CN112052898B CN202010916704.9A CN202010916704A CN112052898B CN 112052898 B CN112052898 B CN 112052898B CN 202010916704 A CN202010916704 A CN 202010916704A CN 112052898 B CN112052898 B CN 112052898B
Authority
CN
China
Prior art keywords
potential
category
probability
variable
classification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010916704.9A
Other languages
English (en)
Other versions
CN112052898A (zh
Inventor
苏焕银
陶文聪
彭舒婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuyi University
Original Assignee
Wuyi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuyi University filed Critical Wuyi University
Priority to CN202010916704.9A priority Critical patent/CN112052898B/zh
Publication of CN112052898A publication Critical patent/CN112052898A/zh
Application granted granted Critical
Publication of CN112052898B publication Critical patent/CN112052898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/02Reservations, e.g. for tickets, services or events
    • G06Q10/025Coordination of plural reservations, e.g. plural trip segments, transportation combined with accommodation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种城际高铁乘客的潜在分类模型构建方法和系统,所述方法包括:采集城际高铁乘客的旅行属性信息,根据所述旅行属性信息选取外显变量和潜在变量;根据所述潜在变量获取潜在类别概率,并根据所述外显变量获取潜在条件概率;获取所述潜在条件概率和所述潜在类别概率对应的潜在类别参数,根据所述潜在类别参数构建潜在分类模型。通过该方法,利用采集的少数旅客信息,进行城际高铁乘客的潜在分类模型构建,通过该潜在分类模型可以直接进行城际高铁中乘客属于哪个类别进行概率估计,通过估计的概率可以针对性的对不同的乘客类别进行不同的市场划分,显著提高了城际高铁中市场的运营效率和目的性。

Description

一种城际高铁乘客的潜在分类模型构建方法和系统
技术领域
本申请涉及大数据领域,特别是涉及一种城际高铁乘客的潜在分类模型构建方法和系统。
背景技术
铁路运输企业为了精准把握旅客需求特征,通常依据相关影响因素把客运市场划分为若干个旅客群体,每个旅客群体具有相似特征,在此基础上设计相关的运输产品以及市场营销策略,可提高运输企业的经济收入以及旅客满意度。研究铁路客运市场细分的数据主要来源于调查数据或者历史售票数据,多是类别数据。例如,此前在对长途旅客的分类统计中,针对成都到武汉铁路沿线的旅客进行问卷调查,收集了旅客的个人属性和出行属性数据,采用聚类分析方法划分旅客类别。此外,针对武广高速铁路进行问卷调查,获取旅客对运输产品属性的评价以及旅客的经济社会特征和出行需求特征,设计了混合回归模型对旅客市场进行细分。还比如在宝鸡到兰州的铁路通道上进行了旅客选择行为调查和满意度调查,采用粗糙集聚类算法进行客运市场细分研究。
上述针对不同的旅途长度采用不同的统计方法,进行旅客的类别推测,但是,针对城际高铁乘客的类别推测暂无涉及,且上述的分类中采用的统计手段对于城际高铁并不适用,如何构建针对城际高铁乘客的潜在分类模型,并根据模型进行进一步的市场划分,需要进一步的技术创新。
发明内容
基于此,有必要针对上述技术问题,提供一种城际高铁乘客的潜在分类模型构建方法和系统。
第一方面,本发明实施例提供了一种城际高铁乘客的潜在分类模型构建方法,包括以下步骤:
采集城际高铁乘客的旅行属性信息,根据所述旅行属性信息选取外显变量和潜在变量;
根据所述潜在变量获取潜在类别概率,并根据所述外显变量获取潜在条件概率;
获取所述潜在条件概率和所述潜在类别概率对应的潜在类别参数,根据所述潜在类别参数构建潜在分类模型。
进一步的,所述采集城际高铁乘客的旅行属性信息,根据所述旅行属性信息选取外显变量和潜在变量,包括:
根据调查问卷获取城际高铁乘客的旅行属性信息,所述旅行属性信息包括个人属性数据和出行属性数据;
根据所述个人属性数据和出行属性数据的目的属性类别抽取外显变量;
将所述旅行属性信息进行潜在模型适配性检验,选取所述潜在变量。
进一步的,所述根据所述潜在变量获取潜在类别概率,并根据所述外显变量获取潜在条件概率,包括:
获取任意一个所述潜在变量中旅客占全体旅客的类别比例,将所述类别比例作为潜在类别概率;
获取旅客属于任意一个所述潜在变量的条件下,所述外显变量取值对应的外显概率,将所述外显概率作为潜在条件概率。
进一步的,所述获取所述潜在条件概率和所述潜在类别概率对应的潜在类别参数,根据所述潜在类别参数构建潜在分类模型,包括:
累积所述潜在条件概率得到第一潜在类别参数:
累加所述潜在类别概率得到第二潜在类别参数:
根据所述第一潜在类别参数和第二潜在类别参数构建潜在分类模型为P(W1,W2,W3,W4,W5,W6,W7,W8);则
其中,X表示潜在变量;T表示潜在变量的个数;Wi表示任一外显变量,i的取值范围为1~8;P(X)表示潜在类别概率;P(Wi/X)表示潜在条件概率。
进一步的,通过所述潜在分类模型,根据贝叶斯分类算法,得到任一城际旅客归属的潜在类别。
另一方面,本发明实施例还提供了一种城际高铁乘客的潜在分类模型构建系统,包括
变量获取模块,用于采集城际高铁乘客的旅行属性信息,根据所述旅行属性信息选取外显变量和潜在变量;
概率统计模块,用于根据所述潜在变量获取潜在类别概率,并根据所述外显变量获取潜在条件概率;
模型构建模块,用于获取所述潜在条件概率和所述潜在类别概率对应的潜在类别参数,根据所述潜在类别参数构建潜在分类模型。
进一步的,所述变量获取模块包括数据处理单元,所述数据处理单元用于对所述旅行属性信息进行数据处理,包括:
根据调查问卷获取城际高铁乘客的旅行属性信息,所述旅行属性信息包括个人属性数据和出行属性数据;
根据所述个人属性数据和出行属性数据的目的属性类别抽取外显变量;
将所述旅行属性信息进行潜在模型适配性检验,选取所述潜在变量。
进一步的,所述概率统计模块包括概率分类单元,所述概率分类单元用于对所述潜在变量和所述外显变量进行概率统计,包括:
获取任意一个所述潜在变量中旅客占全体旅客的类别比例,将所述类别比例作为潜在类别概率;
获取旅客属于任意一个所述潜在变量的条件下,所述外显变量取值对应的外显概率,将所述外显概率作为潜在条件概率。
进一步的,所述模型构建模块包括模型计算单元,所述模型计算单元用于所述潜在分类模型的计算,包括:
累积所述潜在条件概率得到第一潜在类别参数:
累加所述潜在类别概率得到第二潜在类别参数:
根据所述第一潜在类别参数和第二潜在类别参数构建潜在分类模型为P(W1,W2,W3,W4,W5,W6,W7,W8);则
其中,X表示潜在变量;T表示潜在变量的个数;Wi表示任一外显变量,i的取值范围为1~8;P(X)表示潜在类别概率;P(Wi/X)表示潜在条件概率。
进一步的,所述模型构建模块包括类别获取单元,所述类别获取单元用于通过所述潜在分类模型,根据贝叶斯分类算法,得到任一城际旅客归属的潜在类别。
上述城际高铁乘客的潜在分类模型构建方法和系统中,所述方法包括采集城际高铁乘客的旅行属性信息,根据所述旅行属性信息选取外显变量和潜在变量;根据所述潜在变量获取潜在类别概率,并根据所述外显变量获取潜在条件概率;获取所述潜在条件概率和所述潜在类别概率对应的潜在类别参数,根据所述潜在类别参数构建潜在分类模型。通过该方法,利用采集的少数旅客信息,进行城际高铁乘客的潜在分类模型构建,通过该潜在分类模型可以直接进行城际高铁中乘客属于哪个类别进行概率估计,通过估计的概率可以针对性的对不同的乘客类别进行不同的市场划分,显著提高了城际高铁中市场的运营效率和目的性。
附图说明
图1是本发明实施例提供的潜在分类模型构建方法的流程示意图;
图2是本发明实施例提供的选取类别变量的流程示意图;
图3是本发明实施例提供的获取统计概率的流程示意图;
图4为本发明实施例提供的计算潜在分类模型的流程示意图;
图5为本发明实施例提供的潜在分类模型构建系统的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
铁路运输企业为了精准把握旅客需求特征,通常依据相关影响因素把客运市场划分为若干个旅客群体,每个旅客群体具有相似特征,在此基础上设计相关的运输产品以及市场营销策略,可提高运输企业的经济收入以及旅客满意度。目前铁路客运市场细分研究主要集中在中长距离的普通铁路或者高速铁路,缺少针对城际高速铁路客运市场细分的研究。城际高速铁路是指位于人口稠密的都市圈或城市群的高速铁路客运专线,例如,京津城际高铁,沪宁城际铁路和广珠城际等,主要特点是线路距离较短、列车班次公交化运行以及设计速度不低于250km/h。这导致了城际高速铁路服务的旅客群体和中长距离的铁路旅客群体相比具有明显的特征差异性。
在一个实施例中,如图1所示,提供了一种城际高铁乘客的潜在分类模型构建方法,包括以下步骤:
步骤102,采集城际高铁乘客的旅行属性信息,根据所述旅行属性信息选取外显变量和潜在变量;
步骤104,根据所述潜在变量获取潜在类别概率,并根据所述外显变量获取潜在条件概率;
步骤106,获取所述潜在条件概率和所述潜在类别概率对应的潜在类别参数,根据所述潜在类别参数构建潜在分类模型。
具体地,基于潜在分类模型研究城际高速铁路的客运市场细分问题。例如以广珠城际高速铁路为例,进行旅客问卷调查,获取城际高速铁路旅客的个人属性和出行属性相关数据。在此基础上,确定潜在分类模型的外显变量及模型结构,采用模型软件对模型进行适配性检验,估计模型参数。根据模型估计结果,对城际高速铁路客运市场进行细分,分析各类旅客群体的特征。通过该方法,利用采集的少数旅客信息,进行城际高铁乘客的潜在分类模型构建,通过该潜在分类模型可以直接进行城际高铁中乘客属于哪个类别进行概率估计,通过估计的概率可以针对性的对不同的乘客类别进行不同的市场划分,显著提高了城际高铁中市场的运营效率和目的性。
在一个实施例中,如图2所示,选取类别变量的过程包括:
步骤202,根据调查问卷获取城际高铁乘客的旅行属性信息,所述旅行属性信息包括个人属性数据和出行属性数据;
步骤204,根据所述个人属性数据和出行属性数据的目的属性类别抽取外显变量;
步骤206,将所述旅行属性信息进行潜在模型适配性检验,选取所述潜在变量。
具体地,广珠城际铁路位于中国粤港澳大湾区,全长143km,20个车站,设计速度250km/h,本实施例中对城际高铁乘客的数据获取,以广珠城际高速铁路旅客为调研对象,采取网络调查方法,获取旅行属性信息,有针对性地在广州、珠海、中山等城市发放问卷,包含了工作日和休息日,有效问卷数为1715份,问卷涉及的主要问题包含旅客的个人属性数据(性别、年龄段、学历、税前月收入、职业)、出行属性数据(出行平均次数、出行目的、出行费用、购票方式、提前购票时期)。构建潜在分类模型的首先进行外显变量的选取,外显变量即为影响类别划分的相关影响因素。本实施例通过问卷调查获取外显变量的相关数据,经过多次分类对比试验,剔除职业、提前购票时期等使得分类效果较差的外显变量,最终选定性别、年龄段、学历、税前月收入、出行平均次数、出行目的、出行费用、购票方式这8个因素作为城际铁路客运中的外显变量,上述8个外显变量分别记为W1,W2,W3,W4,W5,W6,W7,W8。本实施例借助通过对所述旅行属性信息进行模型适配性检验。模型适配性检验采用5个评价指标,分别是AIC值、BIC值、Pearson、G2和P值(检验卡方统计量是否显著)。检验原理:如果AIC值、BIC值、PearsonP 2、G2的越小,P值小于或等于0.05,说明观测数据与模型的适配程度越高,由于本实施例中样本数超过1000,因此以BIC值作为重点参考评价指标,经过模型适配性检验,选择潜在类别个数为4的模型进行参数估计,选取出潜在变量。
在一个实施例中,如图3所示,对所述潜在变量和所述外显变量进行概率统计,包括:
步骤302,获取任意一个所述潜在变量中旅客占全体旅客的类别比例,将所述类别比例作为潜在类别概率;
步骤304,获取旅客属于任意一个所述潜在变量的条件下,所述外显变量取值对应的外显概率,将所述外显概率作为潜在条件概率。
其中,潜在类别概率表示旅客属于第X个潜在类别的概率,也可以理解为第X个潜在类别中的旅客占全体旅客的比例,记为P(X),其中X=1,2,…,T,T为潜在类别总数。显然,各个潜在类别概率的总和为1,
条件概率表示旅客属于某个潜在类别的条件下,外显变量取值对应的概率。那么,外显变量Wi的条件概率表示为P(Wi/X),i=1,2,…,8。由于外显变量的不同取值相互独立,因此外显变量对应的条件概率总和均为1,即
其中Fi表示外显变量Wi的最大水平取值,在本实施例中,Fi为8。进一步地,如图4所示,对所述潜在分类模型的计算,包括:
累积所述潜在条件概率得到第一潜在类别参数:
累加所述潜在类别概率得到第二潜在类别参数:
根据所述第一潜在类别参数和第二潜在类别参数构建潜在分类模型为P(W1,W2,W3,W4,W5,W6,W7,W8);则
其中,X表示潜在变量;T表示潜在变量的个数;Wi表示任一外显变量,i的取值范围为1~8;P(X)表示潜在类别概率;P(Wi/X)表示潜在条件概率。
其中,不同外显变量之间满足相互独立的条件,因此满足如下表达式
在完成上述的概率参数化估计后,可以采用潜在变量解释外显变量Wi,i=1,2,…,8之间的关系。那么,潜在分类模型表示如下
其中,P(W1,W2,W3,W4,W5,W6,W7,W8)表示外显变量的联合概率。
在一个实施例中,通过所述潜在分类模型,根据贝叶斯分类算法,得到任一城际旅客归属的潜在类别。具体地,应用上述潜在分类模型对旅客进行分类,将所有旅客分配到适当的潜在类别当中去。对于给定的旅客外显变量取值,利用贝叶斯公式,可以计算该旅客归属潜在类别的概率,表示如下:
那么,判定该旅客属于概率最大的潜在类别,记为X*,表示如下
通过上述算法模型,可以很好的统计出不同旅客的属于概率最大的潜在类别,例如,每个潜在类别的旅客群体多以互联网购票方式为主,但是在其它方面具有明显的差异,具体如下:
1)第1类旅客,男性比例较高,年龄主要分布在26~40岁之间,学历较高,税前月收入较高,出行频率最高,公费出行,以商务出行为主要出行目的。
2)第2类旅客,女性比例偏高,年龄主要在18~25之间、26~30之间和31~40之间,学历较高,税前月收入稍高,出行频率仅次于第1类旅客,自费出行,以旅游休闲和探亲访友为主要出行目的。
3)第3类旅客,女性比例偏高,年龄主要在18~25岁之间,学历较高,税前月收入最低,出行频率较低,自费出行,以旅游休闲和求学为主要出行目的。
4)第4类旅客,女性比例偏高,年龄主要在31~60之间,学历较低,税前月收入较低,出行频率最低,自费出行,以旅游休闲和探亲访友为主要出行目的。
根据上述分析可知,第1类和第2类旅客属于追求出行品质的高端型旅客,第1类旅客一般对出行时间的可靠性和出行过程的便捷性具有较高要求,第2类旅客通常对出行过程的服务质量和配套设置具有较高要求。第3类和第4类旅客属于追求经济效益的低端型旅客,相比于服务质量,更关注票价的合理性。对样本中的所有旅客进行分类计算,得到实际分配后各类别的比例,根据统计发现,上述潜在分类模型对于旅客潜在类别的各类相对误差的绝对值均小于3%,说明潜在分类模型可以较好的对城际高速铁路旅客进行分类。例如,潜在分类模型将广珠城际高速铁路的旅客分为4类,概率分别为45.93%、22.28%、22.14%和9.65%。第1类和第2类旅客属于追求出行品质的高端型旅客,第3类和第4类旅客属于追求经济效益的低端型旅客。每类旅客群体特征都有明显的差异性,铁路运输企业可设计针对性的营销策略,例如,对于第1类的旅客,提供一些直达或者少停站的快速列车,提供VIP上车通道等;对于第2类旅客,提供行李搬运、优先选座、车上饮食等服务;对于第3类旅客和第4类旅客,在旅客出行淡季提供折扣票,吸引这类旅客的出行。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种城际高铁乘客的潜在分类模型构建系统,包括:变量获取模块502、概率统计模块504、模型构建模块506,其中:
变量获取模块502,用于采集城际高铁乘客的旅行属性信息,根据所述旅行属性信息选取外显变量和潜在变量;
概率统计模块504,用于根据所述潜在变量获取潜在类别概率,并根据所述外显变量获取潜在条件概率;
模型构建模块506,用于获取所述潜在条件概率和所述潜在类别概率对应的潜在类别参数,根据所述潜在类别参数构建潜在分类模型。
在一个实施例中,如图5所示,所述变量获取模块502包括数据处理单元5022,所述数据处理单元5022用于对所述旅行属性信息进行数据处理,包括:
根据调查问卷获取城际高铁乘客的旅行属性信息,所述旅行属性信息包括个人属性数据和出行属性数据;
根据所述个人属性数据和出行属性数据的目的属性类别抽取外显变量;
将所述旅行属性信息进行潜在模型适配性检验,选取所述潜在变量。
在一个实施例中,如图5所示,所述概率统计模块504包括概率分类单元5042,所述概率分类单元5042用于对所述潜在变量和所述外显变量进行概率统计,包括:
获取任意一个所述潜在变量中旅客占全体旅客的类别比例,将所述类别比例作为潜在类别概率;
获取旅客属于任意一个所述潜在变量的条件下,所述外显变量取值对应的外显概率,将所述外显概率作为潜在条件概率。
在一个实施例中,如图5所示,所述模型构建模块506包括模型计算单元5062,所述模型计算单元5062用于所述潜在分类模型的计算,包括:
累积所述潜在条件概率得到第一潜在类别参数:
累加所述潜在类别概率得到第二潜在类别参数:
根据所述第一潜在类别参数和第二潜在类别参数构建潜在分类模型为P(W1,W2,W3,W4,W5,W6,W7,W8);则
其中,X表示潜在变量;T表示潜在变量的个数;Wi表示任一外显变量,i的取值范围为1~8;P(X)表示潜在类别概率;P(Wi/X)表示潜在条件概率。
在一个实施例中,如图5所示,所述模型构建模块506包括类别获取单元5064,所述类别获取单元5064用于通过所述潜在分类模型,根据贝叶斯分类算法,得到任一城际旅客归属的潜在类别。
关于城际高铁乘客的潜在分类模型构建系统的具体限定可以参见上文中对于城际高铁乘客的潜在分类模型构建方法的限定,在此不再赘述。上述潜在分类模型构建系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种城际高铁乘客的潜在分类模型构建方法,其特征在于,包括以下步骤:
采集城际高铁乘客的旅行属性信息,根据所述旅行属性信息选取外显变量和潜在变量;
根据所述潜在变量获取潜在类别概率,并根据所述外显变量获取潜在条件概率;
获取所述潜在条件概率和所述潜在类别概率对应的潜在类别参数,根据所述潜在类别参数构建潜在分类模型;
所述获取所述潜在条件概率和所述潜在类别概率对应的潜在类别参数,根据所述潜在类别参数构建潜在分类模型,包括:
累积所述潜在条件概率得到第一潜在类别参数:
累加所述潜在类别概率得到第二潜在类别参数:
根据所述第一潜在类别参数和第二潜在类别参数构建潜在分类模型为P(W1,W2,W3,W4,W5,W6,W7,W8);则
其中,X表示潜在变量;T表示潜在变量的个数;Wi表示任一外显变量,i的取值范围为1~8;P(X)表示潜在类别概率;P(Wi/X)表示潜在条件概率。
2.根据权利要求1所述的城际高铁乘客的潜在分类模型构建方法,其特征在于,所述采集城际高铁乘客的旅行属性信息,根据所述旅行属性信息选取外显变量和潜在变量,包括:
根据调查问卷获取城际高铁乘客的旅行属性信息,所述旅行属性信息包括个人属性数据和出行属性数据;
根据所述个人属性数据和出行属性数据的目的属性类别抽取外显变量;
将所述旅行属性信息进行潜在模型适配性检验,选取所述潜在变量。
3.根据权利要求1所述的城际高铁乘客的潜在分类模型构建方法,其特征在于,所述根据所述潜在变量获取潜在类别概率,并根据所述外显变量获取潜在条件概率,包括:
获取任意一个所述潜在变量中旅客占全体旅客的类别比例,将所述类别比例作为潜在类别概率;
获取旅客属于任意一个所述潜在变量的条件下,所述外显变量取值对应的外显概率,将所述外显概率作为潜在条件概率。
4.根据权利要求1所述的城际高铁乘客的潜在分类模型构建方法,其特征在于,通过所述潜在分类模型,根据贝叶斯分类算法,得到任一城际旅客归属的潜在类别。
5.一种城际高铁乘客的潜在分类模型构建系统,其特征在于,包括变量获取模块,用于采集城际高铁乘客的旅行属性信息,根据所述旅行属性信息选取外显变量和潜在变量;
概率统计模块,用于根据所述潜在变量获取潜在类别概率,并根据所述外显变量获取潜在条件概率;
模型构建模块,用于获取所述潜在条件概率和所述潜在类别概率对应的潜在类别参数,根据所述潜在类别参数构建潜在分类模型;
所述模型构建模块包括模型计算单元,所述模型计算单元用于所述潜在分类模型的计算,包括:
累积所述潜在条件概率得到第一潜在类别参数:
累加所述潜在类别概率得到第二潜在类别参数:
根据所述第一潜在类别参数和第二潜在类别参数构建潜在分类模型为P(W1,W2,W3,W4,W5,W6,W7,W8);则
其中,X表示潜在变量;T表示潜在变量的个数;Wi表示任一外显变量,i的取值范围为1~8;P(X)表示潜在类别概率;P(Wi/X)表示潜在条件概率。
6.根据权利要求5所述的城际高铁乘客的潜在分类模型构建系统,其特征在于,所述变量获取模块包括数据处理单元,所述数据处理单元用于对所述旅行属性信息进行数据处理,包括:
根据调查问卷获取城际高铁乘客的旅行属性信息,所述旅行属性信息包括个人属性数据和出行属性数据;
根据所述个人属性数据和出行属性数据的目的属性类别抽取外显变量;
将所述旅行属性信息进行潜在模型适配性检验,选取所述潜在变量。
7.根据权利要求5所述的城际高铁乘客的潜在分类模型构建系统,其特征在于,所述概率统计模块包括概率分类单元,所述概率分类单元用于对所述潜在变量和所述外显变量进行概率统计,包括:
获取任意一个所述潜在变量中旅客占全体旅客的类别比例,将所述类别比例作为潜在类别概率;
获取旅客属于任意一个所述潜在变量的条件下,所述外显变量取值对应的外显概率,将所述外显概率作为潜在条件概率。
8.根据权利要求5所述的城际高铁乘客的潜在分类模型构建系统,其特征在于,所述模型构建模块包括类别获取单元,所述类别获取单元用于通过所述潜在分类模型,根据贝叶斯分类算法,得到任一城际旅客归属的潜在类别。
CN202010916704.9A 2020-09-03 2020-09-03 一种城际高铁乘客的潜在分类模型构建方法和系统 Active CN112052898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010916704.9A CN112052898B (zh) 2020-09-03 2020-09-03 一种城际高铁乘客的潜在分类模型构建方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010916704.9A CN112052898B (zh) 2020-09-03 2020-09-03 一种城际高铁乘客的潜在分类模型构建方法和系统

Publications (2)

Publication Number Publication Date
CN112052898A CN112052898A (zh) 2020-12-08
CN112052898B true CN112052898B (zh) 2024-01-05

Family

ID=73607782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010916704.9A Active CN112052898B (zh) 2020-09-03 2020-09-03 一种城际高铁乘客的潜在分类模型构建方法和系统

Country Status (1)

Country Link
CN (1) CN112052898B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112785020B (zh) * 2021-01-07 2024-03-29 五邑大学 基于城际高速铁路的旅客购票时间预测方法和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846214A (zh) * 2016-11-24 2017-06-13 西安建筑科技大学 分析交通枢纽可达性对区域公共运输方式竞争影响的方法
CN107368915A (zh) * 2017-06-16 2017-11-21 北京交通大学 一种地铁乘客出行时间选择行为分析方法
CN108647861A (zh) * 2018-04-20 2018-10-12 国网电力科学研究院(武汉)能效测评有限公司 一种基于潜类选择模型的用电客户区分方法
CN110751523A (zh) * 2019-10-21 2020-02-04 中国民航信息网络股份有限公司 一种潜在高价值旅客的发现方法及装置
CN111160731A (zh) * 2019-12-13 2020-05-15 东南大学 一种基于旅客感知的空铁联程服务综合评价方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846214A (zh) * 2016-11-24 2017-06-13 西安建筑科技大学 分析交通枢纽可达性对区域公共运输方式竞争影响的方法
CN107368915A (zh) * 2017-06-16 2017-11-21 北京交通大学 一种地铁乘客出行时间选择行为分析方法
CN108647861A (zh) * 2018-04-20 2018-10-12 国网电力科学研究院(武汉)能效测评有限公司 一种基于潜类选择模型的用电客户区分方法
CN110751523A (zh) * 2019-10-21 2020-02-04 中国民航信息网络股份有限公司 一种潜在高价值旅客的发现方法及装置
CN111160731A (zh) * 2019-12-13 2020-05-15 东南大学 一种基于旅客感知的空铁联程服务综合评价方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于OBE教学模式的轨道交通车站机电设备实践教学环节设计;成利刚 等;《高教学刊》;第111-113页 *
广珠城轨站室内接驳交通方式的调查分析-以江门东站为例;陶文聪 等;《五邑大学学报(自然科学版)》;第34卷(第2期);第32-38页 *

Also Published As

Publication number Publication date
CN112052898A (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
Malokin et al. How do activities conducted while commuting influence mode choice? Using revealed preference models to inform public transportation advantage and autonomous vehicle scenarios
Wen et al. Latent class nested logit model for analyzing high-speed rail access mode choice
Tirachini et al. Multimodal transport pricing: first best, second best and extensions to non-motorized transport
Wang et al. Modeling traveler mode choice behavior of a new high-speed rail corridor in China
Zahabi et al. Spatio-temporal analysis of car distance, greenhouse gases and the effect of built environment: A latent class regression analysis
Eldeeb et al. Quantifying preference heterogeneity in transit service desired quality using a latent class choice model
Echaniz et al. Spatial and temporal variation of user satisfaction in public transport systems
Martin et al. Understanding travel behavior: Research scan
Farazi et al. Application of machine learning to investigate heterogeneity in users’ perception of intercity train service quality in developing countries
Lee et al. Substitution or complementarity? A latent-class cluster analysis of ridehailing impacts on the use of other travel modes in three southern US cities
CN112052898B (zh) 一种城际高铁乘客的潜在分类模型构建方法和系统
Guo et al. Exploring potential travel demand of customized bus using smartcard data
Chen et al. RFM Model and K‐Means Clustering Analysis of Transit Traveller Profiles: A Case Study
Sala et al. Generating demand responsive bus routes from social network data analysis
Graves et al. Customer journey time metrics for New York city bus service using big data
Cordera et al. Future scenarios for the European railway sector: A methodology based on past trends and a stated preference survey
CN110020666B (zh) 一种基于乘客行为模式的公共交通广告投放方法及系统
CN112200455A (zh) 综合客运枢纽换乘引导系统便捷性测评方法及系统
Baqueri et al. Estimation of Value of Time for a Congested Network–A case study of the National Highway, Karachi
Pulugurtha et al. Monetizing reliability to evaluate the impact of transportation alternatives
CN116090785A (zh) 针对大型活动散场场景两阶段的定制公交规划方法
Huang et al. Analysing taxi customer-search behaviour using Copula-based joint model
CN109242185B (zh) 一种小汽车向小汽车换乘地铁出行转换的阈值确定方法
Li et al. Exploring interactive and nonlinear effects of key factors on intercity travel mode choice using XGBoost
CN112766950A (zh) 一种动态路径费用确定方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant