CN113033685A - 一种航空旅客付费选座意愿画像及分析的方法 - Google Patents
一种航空旅客付费选座意愿画像及分析的方法 Download PDFInfo
- Publication number
- CN113033685A CN113033685A CN202110356803.0A CN202110356803A CN113033685A CN 113033685 A CN113033685 A CN 113033685A CN 202110356803 A CN202110356803 A CN 202110356803A CN 113033685 A CN113033685 A CN 113033685A
- Authority
- CN
- China
- Prior art keywords
- label
- data
- weight
- passenger
- ith
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- 238000012935 Averaging Methods 0.000 claims description 4
- 230000036962 time dependent Effects 0.000 claims description 2
- 230000003203 everyday effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Cash Registers Or Receiving Machines (AREA)
Abstract
本发明涉及一种用户画像方法,具体说是一种航空旅客付费意愿画像及分析的方法。通过对旅客在航空业产生的数据为航空旅客进行画像,深入挖掘特征信息,针对不同的客户群体,帮助刻画出具有付费意愿的航空旅客画像,对航空公司而言,细分客户群,预测付费选座的行为特征,为旅客个性化服务提供技术支持。
Description
技术领域
本发明涉及旅客付费选座画像领域,具体是一种航空旅客付费选座意愿画像及分析的方法。
技术背景
在航空领域,每天都还产生大量的旅客信息、航班信息、座位信息,这些数据都整合在航空公司的数据库以及其他订票软件的系统中,数量庞大,信息分散,甚至还有部分错误数据,看似毫无价值。但是如果采用科学有效的方法进行系统性的整合数据,在航空领域而言,我们可以得到有效的用户画像。
中国的航空付费选座业务起步较晚,有着庞大的发展空间,如何识别具有付费选座意愿的航空旅客是至关重要的一件事,这也是本发明要解决的问题。
发明内容
针对上述问题,本发明通过对旅客在航空业产生的数据为航空旅客进行画像,深入挖掘特征信息,针对不同的客户群体,帮助刻画出具有付费意愿的航空旅客画像,对航空公司而言,细分客户群,预测付费选座的行为特征,为旅客个性化服务提供技术支持。
本发明所述一种航空旅客付费选座意愿画像及分析的方法,其特征在于包含以下步骤:
A)数据获取及存储:从众多数据源中获取航空旅客身份信息、航班信息以及其他行为信息,并进行存储;
B)确定标签模型:对所获取的航空旅客身份信息特征、航班信息以及其他行为信息特征进行观察,从而确定对应标签模型;
C)建立标签模型:根据获取到的航空旅客身份信息特征、航班信息以及其他行为信息特征,分别进行对应标签建立,同时赋予每一标签对应的值域和标签价值(所占权重值);所述标签权重值的取值总和为1,每一对应标签的具体权重值表示该标签对航空旅客付费选座意愿的影响占比程度;标签权重为该标签的影响因子以及具体数据类别的权重的乘积;所述标签影响因子与时间有关,具体可描述为标签形成时间以及数据的来源时间,太古老的时间价值系数较低;所述数据类别的权重针对航空行程中行为信息的权重比,具体与旅客选座相关;
D)计算标签权重:利用如下算法计算标签权重Tij,得到一组综合的标签,形成用户画像:
Tij=Rij*Wij
其中,Rij表示第i个标签中第j个值得影响因子,i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息;
其计算公式如下:
其中,Kij为数据集合中与第i个标签的第j个值所对应的数据项数;
数据类别权重Wij表示为:
i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息,计算方法如下:
我们采用PCA降维的方法确定数据类别的主要类别,在进行权重的具体计算,PCA降维步骤如下:
输入:数据集X=[x1,x2,x3,…xk],需要降到k维。
1)去平均值,即每一位特征减去各自的平均值。
2)计算协方差矩阵。
3)通过SVD计算协方差矩阵的特征值与特征向量。
4)对特征值从大到小排序,选择其中最大的k个。然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵。
5)将数据转换到k个特征向量构建的新空间中。
对于得到的K个特征向量就是权重较大的对应数据类别,则,数据类别权重Wij计算公式如下:
Kij为降维后的数据集中第i个标签第j个值对应的数据条目数。
E)预测分析:利用上述步骤获得的数据建立分析模型,使用该分析模型刻画出航空旅客中具有付费意愿的用户画像
由于采用上述技术方案,本发明通过对旅客在航空业产生的数据为航空旅客进行画像,深入挖掘特征信息,针对不同的客户群体,帮助刻画出具有付费意愿的航空旅客画像,对航空公司而言,细分客户群,预测付费选座的行为特征,为旅客个性化服务提供技术支持。
具体实施方式
本发明所述一种航空旅客付费选座意愿画像及分析的方法,包含以下步骤:
A)数据获取及存储:从众多数据源中获取航空旅客身份信息、航班信息以及其他行为信息,并进行存储;该步骤从各类数据库中抓取原始数据,包括但不限于,旅客统一编码出发城市、到达城市、航班号、舱位、航班日期、机票费、机票税费、最近Y年豪华头等舱次数、最近Y年头等舱次数、最近Y年超级经济舱次数、最近Y年经济舱次数、最近Y年公务舱次数、偏好机型、座位靠窗的次数、座位走道的次数、座位中间的次数、座位安全出口的次数、最近Y年升舱次数、最近Y年优选座位次数等数据信息,将数据进行数据清洗,进行存储。
用于存储标签并生成标签模型的标签库;每一标签具有相应的值域和权重;所述标签权重值的取值总和为1,每一对应标签的具体权重值表示该标签对航空旅客付费选座意愿的影响占比程度;标签权重为该标签的影响因子以及具体数据类别的权重的乘积;所述标签影响因子与时间有关;所述数据类别的权重针对航空行程中行为信息的权重比,具体与旅客选座相关;
该步骤进行标签信息输出、生成部分标签对应的权重。建模时选取的特征除了用户的基本特征,包括但不限于姓名,性别,出生年月,旅客统一编码、出发城市、到达城市、航班号、舱位、航班日期、机票费、机票税费、最近Y年豪华头等舱次数、最近Y年头等舱次数、最近Y年超级经济舱次数、最近Y年经济舱次数、最近Y年公务舱次数、偏好机型、座位靠窗的次数、座位走道的次数、座位中间的次数、座位安全出口的次数、最近Y年升舱次数、最近Y年优选座位次数等数据信息。优先考虑座位信息的权重比值。
具体处理步骤是:
对数据进行降维处理,抽取特征,将特征转换为标签信息;
D)计算标签权重:利用如下算法计算标签权重Tij,得到一组综合的标签,形成用户画像:
Tij=Rij*Wij
其中,Rij表示第i个标签中第j个值得影响因子,i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息;
其计算公式如下:
其中,Kij为数据集合中与第i个标签的第j个值所对应的数据项数;
数据类别权重Wij表示为:
i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息,计算方法如下:
我们采用PCA降维的方法确定数据类别的主要类别,在进行权重的具体计算,PCA降维步骤如下:
输入:数据集X=[x1,x2,x3,…xk],需要降到k维。
1)去平均值,即每一位特征减去各自的平均值。
2)计算协方差矩阵。
3)通过SVD计算协方差矩阵的特征值与特征向量。
4)对特征值从大到小排序,选择其中最大的k个。然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵。
5)将数据转换到k个特征向量构建的新空间中。
对于得到的K个特征向量就是权重较大的对应数据类别,则,数据类别权重Wij计算公式如下:
Kij为降维后的数据集中第i个标签第j个值对应的数据条目数。
E)预测分析:利用上述步骤获得的数据建立分析模型,使用该分析模型刻画出航空旅客中具有付费意愿的用户画像
在步骤B),所述旅客身份信息的特征和行为数据的特征包括结构化数据和非结构化数据。
Claims (3)
1.一种航空旅客付费选座意愿画像及分析的方法,其特征在于包含以下步骤:
A)数据获取及存储:从众多数据源中获取航空旅客身份信息、航班信息以及其他行为信息,并进行存储;
B)确定标签模型:对所获取的航空旅客身份信息特征、航班信息以及其他行为信息特征进行观察,从而确定对应标签模型;
C)建立标签模型:根据获取到的航空旅客身份信息特征、航班信息以及其他行为信息特征,分别进行对应标签建立,同时赋予每一标签对应的值域和标签价值(所占权重值);所述标签权重值的取值总和为1,每一对应标签的具体权重值表示该标签对航空旅客付费选座意愿的影响占比程度;标签权重为该标签的影响因子以及具体数据类别的权重的乘积;所述标签影响因子与时间有关,具体可描述为标签形成时间以及数据的来源时间,太古老的时间价值系数较低;所述数据类别的权重针对航空行程中行为信息的权重比,具体与旅客选座相关;
D)计算标签权重:利用如下算法计算标签权重Tij,得到一组综合的标签,形成用户画像:
Tij=Rij*Wij
其中,Rij表示第i个标签中第j个值得影响因子,i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息;
其计算公式如下:
其中,Kij为数据集合中与第i个标签的第j个值所对应的数据项数;
数据类别权重Wij表示为:
i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息,计算方法如下:
我们采用PCA降维的方法确定数据类别的主要类别,在进行权重的具体计算,PCA降维步骤如下:
输入:数据集X=[x1,x2,x3,…xk],需要降到k维。
1)去平均值,即每一位特征减去各自的平均值。
2)计算协方差矩阵。
3)通过SVD计算协方差矩阵的特征值与特征向量。
4)对特征值从大到小排序,选择其中最大的k个。然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵。
5)将数据转换到k个特征向量构建的新空间中。
对于得到的K个特征向量就是权重较大的对应数据类别,则数据类别权重Wij计算公式如下:
Kij为降维后的数据集中第i个标签第j个值对应的数据条目数。
E)预测分析:利用上述步骤获得的数据建立分析模型,使用该分析模型刻画出航空旅客中具有付费意愿的用户画像。
2.根据权利要求1所述的一种航空旅客付费选座意愿画像及分析的方法,其特征在于:在步骤B),所述旅客身份信息的特征和行为数据的特征包括结构化数据和非结构化数据。
3.一种航空旅客付费选座意愿画像及分析的方法,其特征在于包括:
用于存储标签并生成标签模型的标签库;每一标签具有相应的值域和权重;所述标签权重值的取值总和为1,每一对应标签的具体权重值表示该标签对航空旅客付费选座意愿的影响占比程度;标签权重为该标签的影响因子以及具体数据类别的权重的乘积;所述标签影响因子与时间有关;所述数据类别的权重针对航空行程中行为信息的权重比,具体与旅客选座相关;用于计算标签权重的计算设备;该计算器利用如下算法计算标签权重Tij,得到一组综合的标签,形成用户画像;
Tij=Rij*Wij
其中,Rij表示第i个标签中第j个值得影响因子,i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息;
其计算公式如下:
其中,Kij为数据集合中与第i个标签的第j个值所对应的数据项数;
数据类别权重Wij表示为:
i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息,计算方法如下:
我们采用PCA降维的方法确定数据类别的主要类别,在进行权重的具体计算,PCA降维步骤如下:
输入:数据集X=[x1,x2,x3,…xk],需要降到k维。
1)去平均值,即每一位特征减去各自的平均值。
2)计算协方差矩阵。
3)通过SVD计算协方差矩阵的特征值与特征向量。
4)对特征值从大到小排序,选择其中最大的k个。然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵。
5)将数据转换到k个特征向量构建的新空间中。
对于得到的K个特征向量就是权重较大的对应数据类别,则数据类别权重Wij计算公式如下:
Kij为降维后的数据集中第i个标签第j个值对应的数据条目数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110356803.0A CN113033685A (zh) | 2021-04-01 | 2021-04-01 | 一种航空旅客付费选座意愿画像及分析的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110356803.0A CN113033685A (zh) | 2021-04-01 | 2021-04-01 | 一种航空旅客付费选座意愿画像及分析的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113033685A true CN113033685A (zh) | 2021-06-25 |
Family
ID=76454335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110356803.0A Pending CN113033685A (zh) | 2021-04-01 | 2021-04-01 | 一种航空旅客付费选座意愿画像及分析的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113033685A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779384A (zh) * | 2021-08-23 | 2021-12-10 | 广州百奕信息科技有限公司 | 一种基于客户画像的航班推荐系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160042083A1 (en) * | 2007-01-19 | 2016-02-11 | Linkedln Corporation | Computer-based evaluation tool for selecting personalized content for users |
CN105608171A (zh) * | 2015-12-22 | 2016-05-25 | 青岛海贝易通信息技术有限公司 | 用户画像构建方法 |
CN106127515A (zh) * | 2016-06-22 | 2016-11-16 | 北京网智天元科技股份有限公司 | 一种旅客画像及数据分析的方法及装置 |
US20190102652A1 (en) * | 2016-08-31 | 2019-04-04 | Tencent Technology (Shenzhen) Company Limited | Information pushing method, storage medium and server |
CN109582876A (zh) * | 2018-12-19 | 2019-04-05 | 广州易起行信息技术有限公司 | 旅游行业用户画像构造方法、装置和计算机设备 |
CN110097394A (zh) * | 2019-03-27 | 2019-08-06 | 青岛高校信息产业股份有限公司 | 产品潜客推荐方法和装置 |
CN110378731A (zh) * | 2016-04-29 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 获取用户画像的方法、装置、服务器及存储介质 |
CN111899059A (zh) * | 2020-08-12 | 2020-11-06 | 科技谷(厦门)信息技术有限公司 | 一种基于区块链的航司收益管理动态定价方法 |
CN112184525A (zh) * | 2020-09-28 | 2021-01-05 | 上海市浦东新区行政服务中心(上海市浦东新区市民中心) | 通过自然语义分析实现智能匹配推荐的系统及方法 |
-
2021
- 2021-04-01 CN CN202110356803.0A patent/CN113033685A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160042083A1 (en) * | 2007-01-19 | 2016-02-11 | Linkedln Corporation | Computer-based evaluation tool for selecting personalized content for users |
CN105608171A (zh) * | 2015-12-22 | 2016-05-25 | 青岛海贝易通信息技术有限公司 | 用户画像构建方法 |
CN110378731A (zh) * | 2016-04-29 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 获取用户画像的方法、装置、服务器及存储介质 |
CN106127515A (zh) * | 2016-06-22 | 2016-11-16 | 北京网智天元科技股份有限公司 | 一种旅客画像及数据分析的方法及装置 |
US20190102652A1 (en) * | 2016-08-31 | 2019-04-04 | Tencent Technology (Shenzhen) Company Limited | Information pushing method, storage medium and server |
CN109582876A (zh) * | 2018-12-19 | 2019-04-05 | 广州易起行信息技术有限公司 | 旅游行业用户画像构造方法、装置和计算机设备 |
CN110097394A (zh) * | 2019-03-27 | 2019-08-06 | 青岛高校信息产业股份有限公司 | 产品潜客推荐方法和装置 |
CN111899059A (zh) * | 2020-08-12 | 2020-11-06 | 科技谷(厦门)信息技术有限公司 | 一种基于区块链的航司收益管理动态定价方法 |
CN112184525A (zh) * | 2020-09-28 | 2021-01-05 | 上海市浦东新区行政服务中心(上海市浦东新区市民中心) | 通过自然语义分析实现智能匹配推荐的系统及方法 |
Non-Patent Citations (3)
Title |
---|
RUIXIA FENG ET AL: "Travel Mode Selecting Prediction Method Based on Passenger Portrait and Random Forest", 《2020 CHINESE AUTOMATION CONGRESS (CAC)》 * |
TIANTIAN WU ET AL: "Research on Recommendation system based on user portrait", 《2020 IEEE INTERNATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE AND INFORMATION SYSTEMS (ICAIIS)》 * |
魏玲 等: "融合用户画像与协同过滤的知识付费平台个性化推荐模型", 《情报理论与实践》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779384A (zh) * | 2021-08-23 | 2021-12-10 | 广州百奕信息科技有限公司 | 一种基于客户画像的航班推荐系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rodriguez et al. | Bayesian dynamic density estimation | |
CN107086935B (zh) | 基于wifi ap的人流量分布预测方法 | |
Garrow et al. | How much airline customers are willing to pay: An analysis of price sensitivity in online distribution channels | |
CN107403325B (zh) | 机票订单可信度评价方法和装置 | |
Wei et al. | Modeling crew itineraries and delays in the national air transportation system | |
CN111899059A (zh) | 一种基于区块链的航司收益管理动态定价方法 | |
Mumbower et al. | Investigating airline customers’ premium coach seat purchases and implications for optimal pricing strategies | |
Escobari | Airport, airline and departure time choice and substitution patterns: An empirical analysis | |
EP4328846A1 (en) | Operation proposal system and operation proposal producing method | |
CN113033685A (zh) | 一种航空旅客付费选座意愿画像及分析的方法 | |
CN110516873B (zh) | 一种航空公司舱位分配优化方法 | |
JP2002109208A (ja) | 信用リスク管理方法、分析モデル決定方法、分析サーバ及び分析モデル決定装置 | |
CN106127515A (zh) | 一种旅客画像及数据分析的方法及装置 | |
CN112926809B (zh) | 一种基于聚类和改进的xgboost的航班流量预测方法及系统 | |
Sitzimis | An optimal forecasting method of passenger traffic in Greek coastal shipping | |
CN110751395A (zh) | 一种旅客行程状态确定方法、装置及服务器 | |
Vadlamani et al. | Using machine learning to analyze and predict entry patterns of low-cost airlines: a study of Southwest Airlines | |
CN109711896A (zh) | 一种基于旅客细分的官网访客流失分析方法 | |
CN117669837A (zh) | 一种机场陆侧换乘交通方式选择预测方法及系统 | |
Zhou et al. | Market segmentation approach to investigate existing and potential aviation markets | |
Badoe | Modelling work-trip mode choice decisions in two-worker households | |
CN112926701B (zh) | 一种基于gcn半监督的航空乘客的分类方法和系统及其设备 | |
CN113297336B (zh) | 航班的季节性归类方法、装置及机器可读介质 | |
CN113128739B (zh) | 用户触达时间的预测方法、预测模型训练方法及相关装置 | |
Liu et al. | A Bayesian predictor of airline class seats based on multinomial event model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210625 |
|
WD01 | Invention patent application deemed withdrawn after publication |