CN116629544A - 旅客偏好集中度确定方法、系统、电子设备及存储介质 - Google Patents

旅客偏好集中度确定方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN116629544A
CN116629544A CN202310595723.XA CN202310595723A CN116629544A CN 116629544 A CN116629544 A CN 116629544A CN 202310595723 A CN202310595723 A CN 202310595723A CN 116629544 A CN116629544 A CN 116629544A
Authority
CN
China
Prior art keywords
passenger
target
passengers
data
travel times
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310595723.XA
Other languages
English (en)
Inventor
冯迪
吴丽娜
常伯彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Technology Co Ltd
Original Assignee
China Travelsky Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Technology Co Ltd filed Critical China Travelsky Technology Co Ltd
Priority to CN202310595723.XA priority Critical patent/CN116629544A/zh
Publication of CN116629544A publication Critical patent/CN116629544A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种旅客偏好集中度确定方法、系统、电子设备及存储介质,获取目标时间段内的旅客数据;对旅客数据进行异常数据处理,得到目标旅客数据;根据目标旅客数据,统计每个旅客的出行信息;针对每个旅客,根据旅客的出行总次数和乘坐每个航司的出行次数,确定旅客的信息熵;从各个旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客;根据各个目标旅客的信息熵,确定每个目标旅客的标准信息熵;根据各个目标旅客的标准信息熵和目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用旅客偏好集中度,分析目标旅客的对相应的航司的偏好程度,以便对目标旅客以及与目标旅客的旅客类型相同的旅客制定相应的促销策略。

Description

旅客偏好集中度确定方法、系统、电子设备及存储介质
技术领域
本发明涉及互联网技术领域,更具体地说,涉及一种旅客偏好集中度确定方法、系统、电子设备及存储介质。
背景技术
作为“运输生产企业”的航空公司,虽然拥有大量的旅客数据,但是由于航空市场消费终端客流量受到控制,以及OTA等在线平台的强聚客流能力,导致航空公司对于其客户的偏好度理解存在黑盒:而旅客确实会因为某些原因偏爱一家特定的公司,因此,对于其偏爱程度及变化趋势的分析,以把握民航市场是当前亟需解决的问题。
传统的旅客偏好集中度分析方法,主要是通过对航空公司的旅客进行忠诚度分析,来确定航空公司的常旅客,并将所确定的常旅客加入航空公司的常旅客计划,将其确定为该航空公司的会员,其中,常旅客是指经常乘坐该航空公司的飞机的旅客。以便航空公司向常旅客推出的相应的促销手段,用以激励常旅客持续乘坐该航空公司的航班。
但是,这种方式仅对乘坐该航空公司航班较多的旅客进行促销,可能错过潜在“忠诚”旅客,即虽然乘坐航班的次数比较少,但是其对于该航空公司的黏性很高,选择该航空公司的占比较高的旅客。并且这种方式对于旅客偏好的变化认知比较局限,无法确认旅客对于其他航司的偏好是否发生变化,比如某旅客一年共乘坐12次航班,其中6段为A航空公司航班,6段为B航空公司航班,该旅客可以为两家航空公司的常旅客会员,但是该旅客对于两家航空公司的忠诚度可能会随时发生变化。因此,如何掌握这种变化,即如何将旅客的忠诚转化为旅客对航空公司的偏好集中度,以提前预知旅客对航空公司的忠诚度是否会发生变化,对于航空公司提高收益尤为重要。
故,如何提供一种旅客偏好集中度确定方法,以提前预知旅客对航空公司的忠诚度是否会发生变化,以便采取相应的手段来留存旅客,是本申请当前亟需解决的问题。
发明内容
有鉴于此,本发明提供一种旅客偏好集中度确定方法、系统、电子设备及存储介质,以实现通过确定旅客偏好集中度,来提前预知旅客对航空公司的忠诚度是否会发生变化,以便采取相应的手段来留存旅客为目的。
本发明第一方面公开一种旅客偏好集中度确定方法,所述方法包括:
获取目标时间段内的旅客数据;
对旅客数据进行异常数据处理,得到目标旅客数据;
根据所述目标旅客数据,统计每个旅客的出行信息;其中,所述出行信息包括所述旅客的出行总次数和乘坐每个航司的出行次数;
针对每个所述旅客,根据所述旅客的出行总次数和乘坐每个航司的出行次数,确定所述旅客的信息熵;
从各个所述旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客;
根据各个所述目标旅客的信息熵,确定每个所述目标旅客的标准信息熵;
根据各个所述目标旅客的标准信息熵和所述目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用所述旅客偏好集中度,分析所述目标旅客的对相应的航司的偏好程度,以便对所述目标旅客以及与所述目标旅客的旅客类型相同的旅客制定相应的促销策略。
本发明第二方面公开一种旅客偏好集中度确定系统,所述系统包括:
数据获取模块,用于获取目标时间段内的旅客数据;
异常数据处理模块,用于对旅客数据进行异常数据处理,得到目标旅客数据;
统计模块,用于根据所述目标旅客数据,统计每个旅客的出行信息;其中,所述出行信息包括所述旅客的出行总次数和乘坐每个航司的出行次数;
信息熵确定模块,用于针对每个所述旅客,根据所述旅客的出行总次数和乘坐每个航司的出行次数,确定所述旅客的信息熵;
筛选模块,用于从各个所述旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客;
标准信息熵确定模块,用于根据各个所述目标旅客的信息熵,确定每个所述目标旅客的标准信息熵;
旅客偏好集中度确定模块,用于根据各个所述目标旅客的标准信息熵和所述目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用所述旅客偏好集中度,分析所述目标旅客的对相应的航司的偏好程度,以便对所述目标旅客以及与所述目标旅客的旅客类型相同的旅客制定相应的促销策略。
本发明第二方面公开一种电子设备,包括:处理器以及存储器,所述处理器以及存储器通过通信总线相连;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现如上述本发明第一方面公开的旅客偏好集中度确定方法。
本发明第一方面公开一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行如上述本发明第一方面公开的旅客偏好集中度确定方法。
本发明提供一种旅客偏好集中度确定方法、系统、电子设备及存储介质,通过获取目标时间段内的旅客数据,并对旅客数据进行异常数据处理,得到目标旅客数据;根据目标旅客数据,统计每个旅客的出行信息;其中,出行信息包括旅客的出行总次数和乘坐每个航司的出行次数;针对每个旅客,根据旅客的出行总次数和乘坐每个航司的出行次数,确定旅客的信息熵;从各个旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客;根据各个目标旅客的信息熵,确定每个目标旅客的标准信息熵;根据各个目标旅客的标准信息熵和目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用所确定的旅客偏好集中度,来分析目标旅客的对相应的航司的偏好程度,进而根据分析结果对目标旅客以及与目标旅客的旅客类型相同的旅客制定相应的促销策略,从而达到留存目标旅客以及与旅客类型相同的旅客的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种旅客偏好集中度确定方法的流程示意图;
图2为本发明实施例提供的一种旅客偏好集中度确定系统的结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明公开的实施例。虽然附图中显示了本发明公开的某些实施例,然而应当理解的是,本发明公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本发明公开的附图及实施例仅用于示例性作用,并非用于限制本发明公开的保护范围。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本发明公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本发明公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
参见图1,示出了本发明实施例提供的一种旅客偏好集中度确定方法的流程示意图,该旅客偏好集中度确定方法具体包括以下步骤:
S101:获取目标时间段内的旅客数据,并对旅客数据进行异常数据处理,得到目标旅客数据。
在本申请实施例中,在接收到相应的分析目标时,可以从数据库中抽取目标时间段内的旅客数据,由于抽取出的旅客数据可能存在异常数据,不能直接用于旅客偏好集中度的计算,因此可以对抽取到的旅客数据进行异常数据处理,以便利用得到的目标旅客数据进行旅客偏好集中度的计算。
其中,旅客数据可以包括每个旅客的旅客ID和每个旅客的旅客信息;旅客信息至少包括旅客出行时间、出发机场信息、达到机场信息、承运航空公司信息、销售航空公司信息、航班号信息、实际支付进入,以及Noshow标识等等。
具体而言,分析目标可以为分析旅客对航司的忠诚度、变化趋势等等。可以根据实际应用进行设置,本申请实施例不加以限定。
需要说明的是,异常数据可以为未成行航段、字段值为空的承运航司。其中,未成行航段为noshow标识为1的航段,以及出发时间为目标时间的航段。
还需要说明的是,如果承运航司的字段值为空,则可以将该承运航司对应的销售航空公司作为该承运航司的字段值填入相应的位置。
可选的,在获取到相应的旅客数据后,可以删除旅客数据中的未成行航段;
将删除未成行航段后的旅客数据中的目标承运航空公司修改为对应的目标销售航空公司,以完成对旅客数据的异常数据处理,得到相应的目标旅客数据;其中,目标承运航空公司为相应的字段值为空的承运航空公司。
S102:根据目标旅客数据,统计每个旅客的出行信息;其中,出行信息包括旅客的出行总次数和乘坐每个航司的出行次数。
在具体执行步骤S102的过程中,在对旅客信息进行异常数据处理得到相应的目标旅客数据后,可以以旅客ID为识别维度,统计每个旅客在目标时间段内的多个旅客行程,进而可以根据统计的旅客行程确定该旅客的出行总次数,以及乘坐每个航司的出行次数。
可选的,针对目标旅客数据中的每个旅客而言,可以根据该旅客的旅客ID,从目标旅客信息中筛选出该旅客的旅客信息,以便根据该旅客的旅客信息,统计出该旅客在目标时间段内乘坐的每个航司的出行次数,最后,根据每个航司的出行次数,确定该旅客的出行总次数。
在一些实施例中,针对每个旅客而言,可以将该旅客在目标时间段内乘坐每个航司的出行次数进行加和运算,得到该旅客在目标时间段的出行总次数。
需要说明的是,目标时间段可以为3个月、6个月、一年。可以根据实际应用进行设置,本申请实施例不加以限定。
S103:针对每个旅客,根据旅客的出行总次数和乘坐每个航司的出行次数,确定旅客的信息熵。
在本申请实施例中,某一旅客偏爱一家航空公司可以宽泛地定义为:“该旅客乘坐该航空公司的次数大于(至少不小于)乘坐其它航空公司的次数。”而严格定义“偏好”,可以对某一旅客乘坐“偏好”航空公司的次数做出约定,例如,对某一旅客乘坐“偏好”航空公司的次数至少应该大于旅客总行程的50%,之所以称“至少”,是因为最低限度可以保证乘坐“偏爱”航空公司次数的相比于其他航空公司绝对最多,不会出现乘坐两家航空公司次数相等的情况。为了更好的分析旅客对于航司的“偏爱”程度,引入了信息熵作为量度旅客对航空公司”偏爱度”的量化指标。
在具体执行步骤S103的过程中,在确定出每个旅客的出行总次数和乘坐每个航司的出行次数后,可以根据预先设置的信息熵计算逻辑、每个旅客乘坐每个航司的出行次数和相应的出行总次数,计算旅客在每个航司下的信息熵,并根据旅客在每个航司下的信息熵,计算旅客的信息熵。其中,预先设置的信息熵计算逻辑如公式(1)所示。
其中,H为旅客的信息熵,U为各个旅客的集合,x为U集合中的任意一个旅客,P(x)为旅客x乘坐某个航司的出行次数占出行总次数的比例。
例如,旅客1的出行总次数为4,乘坐航司CA的出行次数为1、乘坐航司MU的出行次数为1、乘坐航司CZ的出行次数为1,以及乘坐航司3U的出行次数为1,进而根据预先设置的信息熵计算逻辑、每个旅客乘坐每个航司的出行次数和相应的出行总次数,计算旅客在每个航司下的信息熵,并根据旅客在每个航司下的信息熵,计算旅客的信息熵为-(1/4)*log(1/4)-(1/4)*log(1/4)-(1/4)*log(1/4)-(1/4)*log(1/4)=2。
又例如,旅客2的出行总次数为4,乘坐航司CA的出行次数为3、乘坐航司MU的出行次数为1,进而根据预先设置的信息熵计算逻辑、每个旅客乘坐每个航司的出行次数和相应的出行总次数,计算旅客在每个航司下的信息熵,并根据旅客在每个航司下的信息熵,计算旅客的信息熵为-(3/4)*log(3/4)-(1/4)*log(1/4)=0.811。
由此可见,旅客乘坐的航空公司越多,相应的信息熵越高,如果旅客只乘坐一家航空公司,则该旅客相应的信息熵为0。
S104:从各个旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客。
在本申请实施例中,可以计算不同航段的旅客偏好集中度,进而可以设置相应的目标出行总次数。例如,可以将目标出行总次数K设置为2,3,......,n。可以根据实际应用进行设置。
在具体执行步骤S104的过程中,在设置好目标出行总次数后,可以从各个旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客。
S105:根据各个目标旅客的信息熵,确定每个目标旅客的标准信息熵。
在本申请实施例中,在筛选出多个目标旅客后,可以从多个目标旅客中确定信息熵最大的第一目标信息熵和信息熵最小的第二目标信息熵。针对每个目标旅客而言,根据第一目标信息熵、第二目标信息熵和该目标旅客的信息熵,确定该目标旅客的标准信息熵。其中,根据第一目标信息熵、第二目标信息熵和该目标旅客的信息熵,确定该目标旅客的标准信息熵的方式如公式(2)所示。
pcki=1-(Hki-mink)/(maxk-mink) (2)
其中,pcki为出行总次数为k的旅客i的标准信息熵,Hki为旅客i的信息熵,mink为第二目标信息熵,maxk为第一目标信息熵。
S106:根据各个目标旅客的标准信息熵和目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用旅客偏好集中度,分析目标旅客的对相应的航司的偏好程度,以便对目标旅客以及与目标旅客的旅客类型相同的旅客制定相应的促销策略。
在具体执行步骤S106的过程中,在确定出每个目标旅客的标准信息熵后,可以根据各个目标旅客的标准信息熵和目标旅客的数量,计算相应的平均值,进而将计算得到的均值作为目标出行总次数对应的K个航段相应的旅客偏好集中度,以便后续可以利用得到的旅客偏好集中度帮助对应的航司分析K个航段对应的目标旅客对该航司的偏好程度,进而可以分析的偏好程度,确定该目标旅客对该航司的忠诚度,以便航司对忠诚度低的目标旅客以及该目标旅客的旅客类型一致的旅客制定相应的促销策略,以根据制定的促销策略进行精准营销,从而提高旅客的忠诚度,最终达到提升收益的目的。
进一步的,在本申请实施例中,由于单航段的旅客只乘坐一家航空公司,因此可以为单航段的旅客设置相应的预设偏好集中度,进而在获取到每个旅客的旅客信息后,可以根据每个旅客的旅客信息,从各个旅客中筛选出单航段的旅客;将单航段的旅客的偏好集中度确定预设偏好集中度。
本发明提供一种旅客偏好集中度确定方法,通过获取目标时间段内的旅客数据,并对旅客数据进行异常数据处理,得到目标旅客数据;根据目标旅客数据,统计每个旅客的出行信息;其中,出行信息包括旅客的出行总次数和乘坐每个航司的出行次数;针对每个旅客,根据旅客的出行总次数和乘坐每个航司的出行次数,确定旅客的信息熵;从各个旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客;根据各个目标旅客的信息熵,确定每个目标旅客的标准信息熵;根据各个目标旅客的标准信息熵和目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用所确定的旅客偏好集中度,来分析目标旅客的对相应的航司的偏好程度,进而根据分析结果对目标旅客以及与目标旅客的旅客类型相同的旅客制定相应的促销策略,从而达到留存目标旅客以及与旅客类型相同的旅客的目的。
附图中的流程图和框图,图示了按照本发明公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,adhoc端对端网络),以及任何当前已知或未来研发的网络。
本发明公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。
应当理解,本发明公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本发明公开的范围在此方面不受限制。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
描述于本发明公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本申请以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
基于上述本发明实旅客偏好集中度确定方法,相应的,本发明实施例还公开一种旅客偏好集中度确定系统,如图2所示,该旅客偏好集中度确定系统包括:
数据获取模块21,用于获取目标时间段内的旅客数据;
异常数据处理模块22,用于对旅客数据进行异常数据处理,得到目标旅客数据;
统计模块23,用于根据目标旅客数据,统计每个旅客的出行信息;其中,出行信息包括旅客的出行总次数和乘坐每个航司的出行次数;
信息熵确定模块24,用于针对每个旅客,根据旅客的出行总次数和乘坐每个航司的出行次数,确定旅客的信息熵;
筛选模块25,用于从各个旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客;
标准信息熵确定模块26,用于根据各个目标旅客的信息熵,确定每个目标旅客的标准信息熵;
旅客偏好集中度确定模块27,用于根据各个目标旅客的标准信息熵和目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用旅客偏好集中度,分析目标旅客的对相应的航司的偏好程度,以便对目标旅客以及与目标旅客的旅客类型相同的旅客制定相应的促销策略。
上述本发明实施例公开的旅客偏好集中度确定系统中各个单元具体的原理和执行过程,与上述本发明实施例图1公开的旅客偏好集中度确定方法相同,可参见上述本发明实施例图1公开的旅客偏好集中度确定方法中相应的部分,这里不再进行赘述。
本发明提供一种旅客偏好集中度确定系统,通过获取目标时间段内的旅客数据,并对旅客数据进行异常数据处理,得到目标旅客数据;根据目标旅客数据,统计每个旅客的出行信息;其中,出行信息包括旅客的出行总次数和乘坐每个航司的出行次数;针对每个旅客,根据旅客的出行总次数和乘坐每个航司的出行次数,确定旅客的信息熵;从各个旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客;根据各个目标旅客的信息熵,确定每个目标旅客的标准信息熵;根据各个目标旅客的标准信息熵和目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用所确定的旅客偏好集中度,来分析目标旅客的对相应的航司的偏好程度,进而根据分析结果对目标旅客以及与目标旅客的旅客类型相同的旅客制定相应的促销策略,从而达到留存目标旅客以及与旅客类型相同的旅客的目的。
可选的,异常数据处理模块,包括:
删除单元,用于删除旅客数据中的未成行航段;
修改单元,用于将删除未成行航段后的旅客数据中的目标承运航空公司修改为对应的目标销售航空公司,得到目标旅客数据;其中,目标承运航空公司为相应的字段值为空的承运航空公司。
可选的,统计模块,包括:
出行次数统计单元,用于针对每个旅客,从旅客的目标旅客数据中,获取旅客的旅客ID匹配的旅客信息,并根据旅客信息,统计旅客在目标时间段内乘坐的每个航司的出行次数;
出行总次数确定单元,用于针对每个旅客,根据对应的各个航司的出行次数,确定旅客的出行总次数。
可选的,信息熵确定模块,包括:
第一信息熵计算单元,用于针对每个旅客乘坐的每个航司,根据旅客乘坐航司的出行次数和旅客的出行总次数,计算旅客在航司下的信息熵;
第二信息熵计算单元,用于根据旅客在每个航司下的信息熵,计算旅客的信息熵。
可选的,本发明实施例提供的旅客偏好集中度确定系统还包括:
单航段旅客筛选单元,用于根据每个旅客的旅客信息,从各个旅客中筛选出单航段的旅客;
单航段旅客的偏好集中度确定单元,用于将单航段的旅客的偏好集中度确定为预设偏好集中度。
本申请实施例还提供一种电子设备,该电子设备包括:处理器以及存储器,所述处理器以及存储器通过通信总线相连;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,该程序用于实现旅客偏好集中度确定方法。
下面参考图3,其示出了适于用来实现本发明公开实施例的电子设备的结构示意图。本发明公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3示出的电子设备仅仅是一个示例,不应对本发明公开实施例的功能和使用范围带来任何限制。
如图3所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的旅客偏好集中度确定方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM302被安装。在该计算机程序被处理装置301执行时,执行本发明公开实施例的旅客偏好集中度确定方法中限定的上述功能。
更进一步的,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行旅客偏好集中度确定方法。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备获取目标时间段内的旅客数据;对旅客数据进行异常数据处理,得到目标旅客数据;根据所述目标旅客数据,统计每个旅客的出行信息;其中,所述出行信息包括所述旅客的出行总次数和乘坐每个航司的出行次数;针对每个所述旅客,根据所述旅客的出行总次数和乘坐每个航司的出行次数,确定所述旅客的信息熵;从各个所述旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客;根据各个所述目标旅客的信息熵,确定每个所述目标旅客的标准信息熵;根据各个所述目标旅客的标准信息熵和所述目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用所述旅客偏好集中度,分析所述目标旅客的对相应的航司的偏好程度,以便对所述目标旅客以及与所述目标旅客的旅客类型相同的旅客制定相应的促销策略。
在本发明公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
需要说明的是,本发明公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。

Claims (10)

1.一种旅客偏好集中度确定方法,其特征在于,所述方法包括:
获取目标时间段内的旅客数据;
对旅客数据进行异常数据处理,得到目标旅客数据;
根据所述目标旅客数据,统计每个旅客的出行信息;其中,所述出行信息包括所述旅客的出行总次数和乘坐每个航司的出行次数;
针对每个所述旅客,根据所述旅客的出行总次数和乘坐每个航司的出行次数,确定所述旅客的信息熵;
从各个所述旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客;
根据各个所述目标旅客的信息熵,确定每个所述目标旅客的标准信息熵;
根据各个所述目标旅客的标准信息熵和所述目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用所述旅客偏好集中度,分析所述目标旅客的对相应的航司的偏好程度,以便对所述目标旅客以及与所述目标旅客的旅客类型相同的旅客制定相应的促销策略。
2.根据权利要求1所述的方法,其特征在于,所述对所述旅客数据进行异常数据处理,得到目标旅客数据,包括:
删除所述旅客数据中的未成行航段;
将删除未成行航段后的所述旅客数据中的目标承运航空公司修改为对应的目标销售航空公司,得到目标旅客数据;其中,所述目标承运航空公司为相应的字段值为空的承运航空公司。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标旅客数据,统计每个旅客的出行信息,包括:
针对每个旅客,从所述旅客的目标旅客数据中,获取所述旅客的旅客ID匹配的旅客信息,并根据所述旅客信息,统计所述旅客在所述目标时间段内乘坐的每个航司的出行次数;
针对每个所述旅客,根据对应的各个所述航司的出行次数,确定所述旅客的出行总次数。
4.根据权利要求1所述的方法,其特征在于,所述针对每个所述旅客,根据所述旅客的出行总次数和乘坐每个航司的出行次数,确定所述旅客的信息熵,包括:
针对每个所述旅客乘坐的每个航司,根据所述旅客乘坐所述航司的出行次数和所述旅客的出行总次数,计算所述旅客在所述航司下的信息熵;
根据所述旅客在每个所述航司下的信息熵,计算所述旅客的信息熵。
5.根据权利要求1所述的方法,其特征在于,所述方法包括:
根据每个所述旅客的旅客信息,从各个所述旅客中筛选出单航段的旅客;
将所述单航段的旅客的偏好集中度确定为预设偏好集中度。
6.一种旅客偏好集中度确定系统,其特征在于,所述系统包括:
数据获取模块,用于获取目标时间段内的旅客数据;
异常数据处理模块,用于对旅客数据进行异常数据处理,得到目标旅客数据;
统计模块,用于根据所述目标旅客数据,统计每个旅客的出行信息;其中,所述出行信息包括所述旅客的出行总次数和乘坐每个航司的出行次数;
信息熵确定模块,用于针对每个所述旅客,根据所述旅客的出行总次数和乘坐每个航司的出行次数,确定所述旅客的信息熵;
筛选模块,用于从各个所述旅客中,筛选出出行总次数为目标出行总次数的多个目标旅客;
标准信息熵确定模块,用于根据各个所述目标旅客的信息熵,确定每个所述目标旅客的标准信息熵;
旅客偏好集中度确定模块,用于根据各个所述目标旅客的标准信息熵和所述目标旅客的数量,确定目标出行总次数对应的旅客偏好集中度,以实现利用所述旅客偏好集中度,分析所述目标旅客的对相应的航司的偏好程度,以便对所述目标旅客以及与所述目标旅客的旅客类型相同的旅客制定相应的促销策略。
7.根据权利要求6所述的系统,其特征在于,所述异常数据处理模块,包括:
删除单元,用于删除所述旅客数据中的未成行航段;
修改单元,用于将删除未成行航段后的所述旅客数据中的目标承运航空公司修改为对应的目标销售航空公司,得到目标旅客数据;其中,所述目标承运航空公司为相应的字段值为空的承运航空公司。
8.根据权利要求6所述的系统,其特征在于,所述统计模块,包括:
出行次数统计单元,用于针对每个旅客,从所述旅客的目标旅客数据中,获取所述旅客的旅客ID匹配的旅客信息,并根据所述旅客信息,统计所述旅客在所述目标时间段内乘坐的每个航司的出行次数;
出行总次数确定单元,用于针对每个所述旅客,根据对应的各个所述航司的出行次数,确定所述旅客的出行总次数。
9.一种电子设备,其特征在于,包括:处理器以及存储器,所述处理器以及存储器通过通信总线相连;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现如权利要求1-5任一项所述的旅客偏好集中度确定方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1-5任一项所述的旅客偏好集中度确定方法。
CN202310595723.XA 2023-05-24 2023-05-24 旅客偏好集中度确定方法、系统、电子设备及存储介质 Pending CN116629544A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310595723.XA CN116629544A (zh) 2023-05-24 2023-05-24 旅客偏好集中度确定方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310595723.XA CN116629544A (zh) 2023-05-24 2023-05-24 旅客偏好集中度确定方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116629544A true CN116629544A (zh) 2023-08-22

Family

ID=87636164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310595723.XA Pending CN116629544A (zh) 2023-05-24 2023-05-24 旅客偏好集中度确定方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116629544A (zh)

Similar Documents

Publication Publication Date Title
CN110704751B (zh) 数据处理方法、装置、电子设备及存储介质
CN112836128A (zh) 信息推荐方法、装置、设备和存储介质
CN110378660A (zh) 库存处理方法、装置、电子设备和计算机可读存储介质
CN111628938A (zh) 分支合并的方法、装置、电子设备及计算机存储介质
CN113297277B (zh) 检验统计量确定方法、装置、可读介质及电子设备
CN113159453B (zh) 资源数据预测方法、装置、设备及存储介质
CN116757731B (zh) 航班季节因子的预测方法、装置、电子设备和存储介质
CN112215141B (zh) 一种生物特征识别方法、装置、电子设备及存储介质
CN116720202A (zh) 业务信息检测方法、装置、电子设备和计算机可读介质
CN110727558A (zh) 信息提示方法、装置、存储介质及电子设备
CN116319932A (zh) 内容推送模型的训练方法、装置、设备及存储介质
CN113837814B (zh) 投放资源数量预测的方法、装置、可读介质及电子设备
CN116109374A (zh) 资源位展示方法、装置、电子设备和计算机可读介质
CN116629544A (zh) 旅客偏好集中度确定方法、系统、电子设备及存储介质
CN113485890B (zh) 航班查询系统业务监控方法、装置、设备及存储介质
CN112860999B (zh) 信息推荐方法、装置、设备和存储介质
CN114090655A (zh) 一种称重数据汇总分析及显示方法和装置
CN116703263B (zh) 电力设备配送方法、装置、电子设备和计算机可读介质
CN113077352B (zh) 基于用户信息和保险相关信息的保险服务物品推荐方法
CN117591048B (zh) 任务信息处理方法、装置、电子设备和计算机可读介质
CN115860573B (zh) 基于检测项的公路工程检测方法、电子设备和可读介质
CN113177174B (zh) 特征构建方法、内容显示方法及相关装置
CN115062022B (zh) 航空器手册拆分方法、装置、电子设备和计算机可读介质
CN116245579A (zh) 一种票价计算方法、系统、电子设备及存储介质
CN116385091A (zh) 一种机票变更方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination