CN112307342B - 航班推荐方法及装置 - Google Patents
航班推荐方法及装置 Download PDFInfo
- Publication number
- CN112307342B CN112307342B CN202011203059.2A CN202011203059A CN112307342B CN 112307342 B CN112307342 B CN 112307342B CN 202011203059 A CN202011203059 A CN 202011203059A CN 112307342 B CN112307342 B CN 112307342B
- Authority
- CN
- China
- Prior art keywords
- flight
- data
- personalized data
- recommended
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 113
- 230000010006 flight Effects 0.000 claims abstract description 111
- 238000012163 sequencing technique Methods 0.000 claims abstract description 13
- 230000008569 process Effects 0.000 claims description 52
- 238000001514 detection method Methods 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G06Q50/40—
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种航班推荐方法及装置,该方法包括:确定数据集合,数据集合包括多个个性化数据和航班特征数据;确定待推荐的各个航班并获取每个航班的各个维度值;通过孤立森林算法模型设定主推荐航班和次推荐航班;对各个主推荐航班进行聚类获得每个个性化数据对应的聚类簇;计算各个聚类簇的聚类簇权重及每个主推荐航班的航班权重;按照各个聚类簇权重及航班权重,对各个聚类簇及各个主推荐航班进行排序;并将各个次推荐航班排在各个主推荐航班之后,推送各个已排序的航班。应用该方法,通过多个数据、孤立森林算法及聚类的方式,对各个待推荐的航班进行排序后再进行推送,满足了多个维度的数据的考虑因素,更加全面和合理地向用户推荐航班。
Description
技术领域
本发明涉及航班信息技术领域,特别是涉及一种航班推荐方法及装置。
背景技术
随着客运航空的飞速发展,飞机逐渐成了很多人出行时的选择,目前用户在订购航班时,通常是在第三方网站上进行订购。这些网站是对多个航空公司的航班资源进行了整合,然后通过设置几个简单的选项,将全部符合条件的航班展示给用户。
目前用户在需要查询航班时,需要预先输入日期、地点等信息后,再根据用户所输入的信息查询与各个信息相符的航班,并将查询到的航班向用户进行推荐。但是,目前航班推荐的过程中,用户的选择只局限于时间和地点的选择,当用户无法确定出行时间和地点时,还需要随机挑选几点航班地点进行筛选,并在筛选出多个航班后,还要逐次判断每个航班是否满足自己的其他需求,如是否提供餐食、起飞时刻、降落时刻和是否直飞等,导致目标用户浪费较长的时间,却很难从众多的航班中挑选出最符合自己要求的航班。
发明内容
有鉴于此,本发明提供一种航班推荐方法,通过该方法,可以根据孤立森林算法及聚类的方式对多个维度的个性化数据和航班特征数据进行计算,以此挑选出更符合用户要求的航班向用户进行推荐。
本发明还提供了一种航班推荐装置,用以保证上述方法在实际中的实现及应用。
一种航班推荐方法,包括:
确定预先设置的数据集合,所述数据集合中包括多个供用户选择的个性化数据和多个航班特征数据;
确定待推荐的各个航班,每个航班均与所述数据集合中的各个个性化数据及航班特征数据对应;
获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的维度值;
将每个所述航班对应的各个所述个性化数据及航班特征数据的维度值,输入预先设置的孤立森林算法模型,通过所述孤立森林算法模型检测每个所述航班的推荐价值,以获得所述孤立森林算法模型输出的每个所述航班的检测值;
在各个所述航班中,设定检测值高于预设阈值的航班为主推荐航班,检测值低于所述预设阈值的航班为次推荐航班;
基于每个所述主推荐航班对应的各个所述个性化数据的维度值,对各个所述主推荐航班进行聚类,获得每个所述个性化数据对应的聚类簇;
确定每个所述个性化数据的维度权重,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算各个所述聚类簇的聚类簇权重;
基于各个所述聚类簇权重,对各个所述聚类簇进行排序,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算每个所述主推荐航班的航班权重;
基于各个所述航班权重,对各个所述主推荐航班进行簇内排序;
基于每个所述次推荐航班的检测值,将各个所述次推荐航班依次排在各个所述主推荐航班之后,并将已排序的各个航班推送至预先设置的显示页面。
上述的方法,可选的,所述获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的维度值,包括:
获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的数据参数;
对每个所述航班对应的各个数据参数进行归一化处理,获得每个所述航班对应的各个所述个性化数据及航班特征数据的维度值。
上述的方法,可选的,所述基于每个所述主推荐航班对应的各个所述个性化数据的维度值,对各个所述主推荐航班进行聚类,包括:
确定所述数据集合中各个个性化数据的数据个数;
基于所述数据个数,在各个所述主推荐航班中,选取每个所述个性化数据对应的主推荐航班为聚类中心,并执行预先设置的聚类过程;
其中,所述聚类过程包括:应用预先设置的聚类算法及每个所述主推荐航班对应的各个个性化数据的维度值,计算每个所述主推荐航班到各个所述聚类中心的距离,并将每个所述主推荐航班归类至与其距离最近的聚类中心,获得每个所述个性化数据对应的聚类簇;
应用预先设置的中心算法在各个所述主推荐航班中,重新确定每个所述个性化数据对应的主推荐航班为新的聚类中心,并执行所述聚类过程,直至当前执行的聚类过程对应的各个聚类中心,与上一次执行的聚类过程对应的各个聚类中心一致时,结束对各个所述主推荐航班的聚类。
上述的方法,可选的,所述确定每个所述个性化数据的维度权重,包括:
确定每个所述个性化数据预先设置的优先级,并检测所述数据集合中是否存在用户已选择的个性化数据;
若所述数据集合中存在用户已选择的个性化数据,则增加每个所述已选择的个性化数据的优先级,以获得所述数据集合中每个所述个性化数据的最终的优先级;
基于预先设置的权重公式及每个所述个性化数据的最终的优先级,设置每个所述个性化数据的维度权重。
上述的方法,可选的,所述基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算各个所述聚类簇的聚类簇权重,包括:
确定每个所述聚类簇中主推荐航班的个数,并获取每个所述主推荐航班所属的聚类簇对应的个性化数据的维度值;
基于每个所述聚类簇中主推荐航班的个数,及已获取的各个维度值,计算每个个性化数据的维度平均值;
基于每个所述个性化数据的维度权重及维度平均值,计算每个所述聚类簇的聚类簇权重。
一种航班推荐装置,包括:
第一确定单元,用于确定预先设置的数据集合,所述数据集合中包括多个供用户选择的个性化数据和多个航班特征数据;
第二确定单元,用于确定待推荐的各个航班,每个航班均与所述数据集合中的各个个性化数据及航班特征数据对应;
获取单元,用于获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的维度值;
检测单元,用于将每个所述航班对应的各个所述个性化数据及航班特征数据的维度值,输入预先设置的孤立森林算法模型,通过所述孤立森林算法模型检测每个所述航班的推荐价值,以获得所述孤立森林算法模型输出的每个所述航班的检测值;
设定单元,用于在各个所述航班中,设定检测值高于预设阈值的航班为主推荐航班,检测值低于所述预设阈值的航班为次推荐航班;
聚类单元,用于基于每个所述主推荐航班对应的各个所述个性化数据的维度值,对各个所述主推荐航班进行聚类,获得每个所述个性化数据对应的聚类簇;
第一计算单元,用于确定每个所述个性化数据的维度权重,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算各个所述聚类簇的聚类簇权重;
第二计算单元,用于基于各个所述聚类簇权重,对各个所述聚类簇进行排序,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算每个所述主推荐航班的航班权重;
排序单元,用于基于各个所述航班权重,对各个所述主推荐航班进行簇内排序;
推送单元,用于基于每个所述次推荐航班的检测值,将各个所述次推荐航班依次排在各个所述主推荐航班之后,并将已排序的各个航班推送至预先设置的显示页面。
上述的装置,可选的,所述获取单元,包括:
第一获取子单元,用于获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的数据参数;
处理子单元,用于对每个所述航班对应的各个数据参数进行归一化处理,获得每个所述航班对应的各个所述个性化数据及航班特征数据的维度值。
上述的装置,可选的,所述聚类单元,包括:
确定子单元,用于确定所述数据集合中各个个性化数据的数据个数;
执行子单元,用于基于所述数据个数,在各个所述主推荐航班中,选取每个所述个性化数据对应的主推荐航班为聚类中心,并执行预先设置的聚类过程;
其中,所述聚类过程包括:应用预先设置的聚类算法及每个所述主推荐航班对应的各个个性化数据的维度值,计算每个所述主推荐航班到各个所述聚类中心的距离,并将每个所述主推荐航班归类至与其距离最近的聚类中心,获得每个所述个性化数据对应的聚类簇;
选取子单元,用于应用预先设置的中心算法在各个所述主推荐航班中,重新确定每个所述个性化数据对应的主推荐航班为新的聚类中心,并执行所述聚类过程,直至当前执行的聚类过程对应的各个聚类中心,与上一次执行的聚类过程对应的各个聚类中心一致时,结束对各个所述主推荐航班的聚类。
上述的装置,可选的,所述第一计算单元,包括:
检测子单元,用于确定每个所述个性化数据预先设置的优先级,并检测所述数据集合中是否存在用户已选择的个性化数据;
调整子单元,用于若所述数据集合中存在用户已选择的个性化数据,则增加每个所述已选择的个性化数据的优先级,以获得所述数据集合中每个所述个性化数据的最终的优先级;
设置子单元,用于基于预先设置的权重公式及每个所述个性化数据的最终的优先级,设置每个所述个性化数据的维度权重。
上述的装置,可选的,所述第一计算单元,包括:
第二获取子单元,用于确定每个所述聚类簇中主推荐航班的个数,并获取每个所述主推荐航班所属的聚类簇对应的个性化数据的维度值;
第一计算子单元,用于基于每个所述聚类簇中主推荐航班的个数,及已获取的各个维度值,计算每个个性化数据的维度平均值;
第二计算子单元,用于基于每个所述个性化数据的维度权重及维度平均值,计算每个所述聚类簇的聚类簇权重。
一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述的航班推荐方法。
一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行上述的航班推荐方法。
与现有技术相比,本发明包括以下优点:
本发明提供了一种航班推荐方法,包括:确定数据集合,数据集合中包括多个个性化数据和航班特征数据;确定待推荐的各个航班;获取每个航班的各个维度值;通过孤立森林算法模型设定主推荐航班和次推荐航班;对各个主推荐航班进行聚类,获得每个个性化数据对应的聚类簇;确定每个个性化数据的维度权重,并基于每个航班对应的各个个性化数据的维度权重和维度值,计算各个聚类簇的聚类簇权重;基于各个聚类簇权重,对各个聚类簇进行排序,并基于每个航班对应的各个个性化数据的维度权重和维度值,计算每个主推荐航班的航班权重;基于各个航班权重,对各个主推荐航班进行簇内排序;基于每个次推荐航班的检测值,将各个次推荐航班依次排在各个主推荐航班之后,并将已排序的各个航班推送至预先设置的显示页面。应用本发明提供的方法,通过多个维度数据、孤立森林算法模型及聚类的方式,对各个待推荐的航班排序后再进行推送,满足了多个维度的考虑因素,更加全面和合理地向用户推荐航班。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种航班推荐方法的方法流程图;
图2为本发明实施例提供的一种航班推荐方法的又一方法流程图;
图3为本发明实施例提供的一种航班推荐方法的再一方法流程图;
图4为本发明实施例提供的一种航班推荐方法的又再一方法流程图;
图5为本发明实施例提供的一种航班推荐装置的装置结构图;
图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本发明实施例提供了一种航班推荐方法,该方法可以应用在多种系统平台,其执行主体可以为计算机终端或各种移动设备的处理器,所述方法的方法流程图如图1所示,具体包括:
S101:确定预先设置的数据集合,所述数据集合中包括多个供用户选择的个性化数据和多个航班特征数据;
在本发明实施例中,数据集合预先设置的多个维度的数据的组合,其中包括了多个个性化数据和多个航班特征数据。其中,个性化数据是可以提供给用户选择的维度数据,例如:飞机机龄、航班延误率、座椅舒适度、环境配置、娱乐设置、机型、航司类别和平均折扣率等相关的可以提供给用户选择的个性化数据;航班特征数据是并非提供给用户选择的,与航班的各个条件和特征相关的维度数据,例如:航班客座率、航班经济舱占比和航班平均延误时间等与航班特征相关的航班特征数据。
可以理解的是,个性化数据是当用户在访问指定购票平台、选择购买某个时间段或选择购买某个航行区间的机票等情况时,通过显示界面向用户显示的用户可以根据自身喜好和要求选择的数据。
需要说明的是,在该数据集合中,个性化数据用于表征用户主观意愿上对航班进行选择的需求;航班特征数据用于表征航班的客观条件下航班航行的特征条件。
S102:确定待推荐的各个航班,每个航班均与所述数据集合中的各个个性化数据及航班特征数据对应;
在本发明实施例中,可以将存在剩余未出售舱位的航班确定为待推荐的航班,或者将打折力度较大的航班确定为待推荐的航班,或者根据用户选择的时间和航行区间等需求,确定符合用户需求的航班为待推荐的航班。
需要说明的是,每个航班均与该数据集合即,每个航班对应该数据集合中的各个个性化数据和各个航班特征数据。
S103:获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的维度值;
在本发明实施例中,对每个航班对应的各个个性化数据和航班特征数据进行预处理,获得每个航班对应的数据集合中各个数据的维度值。
S104:将每个所述航班对应的各个所述个性化数据及航班特征数据的维度值,输入预先设置的孤立森林算法模型,通过所述孤立森林算法模型检测每个所述航班的推荐价值,以获得所述孤立森林算法模型输出的每个所述航班的检测值;
在本发明实施例中,该孤立森林算法模型采用孤立森林算法,该孤立森林算法通过对样本点的孤立来检测异常值。具体来说,该算法利用一种名为孤立树的二叉搜索树结构来孤立样本。其中,每一个航班为该孤立森林算法模型所需要计算的样本,将每个航班对应的各个维度值输入该孤立森林算法模型中,通过孤立森林算法中的二叉树结构的方式对每个个性化数据和航班特征数据进行多次迭代的切割,当切割至指定条件时,该孤立森林算法模型将输出每个航班的检测值。其中,航班的检测值越高,其向用户推荐的价值就越高。
S105:在各个所述航班中,设定检测值高于预设阈值的航班为主推荐航班,检测值低于所述预设阈值的航班为次推荐航班;
在本发明实施例中,在经过上述的孤立森林算法模型确定各个航班的检测值时,通过预设阈值区分各个航班。其中,检测值高于预设阈值的航班为主推荐航班,剩余的其他航班为次推荐航班,检测值高的航班其预估的推荐价值就高,反之则推荐价值低。
S106:基于每个所述主推荐航班对应的各个所述个性化数据的维度值,对各个所述主推荐航班进行聚类,获得每个所述个性化数据对应的聚类簇;
在本发明实施例中,按照各个个性化数据的维度值对各个航班进行聚类。聚类簇的个数与个性化数据的数量一致,每个聚类簇与每个个性化数据一一对应。
S107:确定每个所述个性化数据的维度权重,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算各个所述聚类簇的聚类簇权重;
在本发明实施例中,每个个性化数据预先设置了其对应的维度权重。其中,对于数据集合中的各个个性化数据,若存在任意的个性化数据被用户选择,则其对应的维度权重就相对较大。基于每个航班对应的每个个性化数据的维度权重及维度值,计算每个聚类簇的权重,获得每个聚类簇对应的聚类簇权重。
需要说明的是,由于每个聚类簇与各个个性化数据一一对应,因此,若存在任意的个性化数据被用户选择,则该个性化数据对应的聚类簇的聚类簇权重将大于其他聚类簇的聚类簇权重。
S108:基于各个所述聚类簇权重,对各个所述聚类簇进行排序,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算每个所述主推荐航班的航班权重;
在本发明实施例中,在确定各个聚类簇的聚类簇权重,按照权重大小由大至小对各个聚类簇进行排序。在完成对各个聚类簇的排序后,由于每个聚类簇中包含多个航班,因此需要通过各个维度权重及维度值,计算每个聚类簇中各个主推荐航班的航班权重。
具体的,计算各个主推荐航班的航班权重的计算公式为:
A航班=(1-q)a1+(1-q)qa2+(1-q)q2a3+…+(1-q)qn-1an+qn;其中,A航班为航班权重;(1-q)到(1-q)qn-1为数据集合中每个维度数据对应的维度权重;a1到an为当前计算航班权重的航班对应的各个维度数据的维度值;n为个性化数据的个数。
S109:基于各个所述航班权重,对各个所述主推荐航班进行簇内排序;
在本发明实施例中,在确定每个聚类簇中各个主推荐航班的航班权重的大小后,由小至大对每个聚类簇中的各个主推荐航班进行排序,以此完成对待推荐的各个航班中所有主推荐航班的排序。
S110:基于每个所述次推荐航班的检测值,将各个所述次推荐航班依次排在各个所述主推荐航班之后,并将已排序的各个航班推送至预先设置的显示页面。
在本发明实施例中,在各个已排序的主推荐航班之后,按照每个次推荐航班的检测值的大小,再对各个次推荐航班进行排序,获得各个已排序的航班。将各个已排序的航班发送到显示页面后,用户可以根据当前各个已排序的航班,查看每个航班的信息,实现对各个航班的推荐。
本发明实施例提供的航班推荐方法中,在需要向用户推荐航班时,需要确定预先设置的数据集合,该数据集合中包含多个个性化数据和多个航班特征数据。确定各个待推荐航班,以及每个航班对应的各个个性化数据和航班特征数据的维度值。先通过孤立森林算法模型确定各个航班中的主推荐航班和次推荐航班,再对各个主推荐航班进行聚类,获得多个聚类簇。通过每个个性化数据的数据权重及维度值,计算每个聚类簇的聚类簇权重以及每个聚类簇中各个主推荐航班的航班权重。基于各个聚类簇权重及各个航班权重,对各个主推荐航班进行排序,并将各个次推荐航班排在各个主推荐航班之后,获得各个已排序的航班,将各个已排序的航班进行推送。
需要说明的是,在数据集合中,用户可以预先选择任意的个性化数据,在计算每个聚类簇的聚类簇权重中,可以对被用户选中的个性化数据的维度权重进行加权,使得该个性化数据的维度权重大于其他个性化数据的维度权重。
应用本发明实施例提供的方法,通过数据集合中的多个维度数据、孤立森林算法模型及聚类的方式,对各个待推荐的航班进行排序后再进行推送,满足了多个维度的考虑因素,更加全面和合理地向用户推荐航班。
本发明实施例提供的方法中,基于所述S103的内容,在确定各个待推荐的航班后,根据预先设置的数据集合,需要获取每个航班对应的数据集合中各个数据的维度值。参考图2,所述获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的维度值,具体可以包括:
S201:获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的数据参数;
在本发明实施例中,每个航班均对应多个个性化数据和航班特征数据,每个航班对应的数据集合中的各个数据的数据参数均不同。例如,当前待推荐的航班为A和B,则航班A对应的飞机机龄、航班延误率、客座率与经济舱占比等数据的数据参数与航班B对应的各个数据的数据参数不同。
S202:对每个所述航班对应的各个数据参数进行归一化处理,获得每个所述航班对应的各个所述个性化数据及航班特征数据的维度值。
在本发明实施例中,在获得每个航班对应的各个数据参数后,由于每个航班对应的各个数据参数过于庞大,且每个数据参数之间的表现形式不同,在后续进行孤立森林算法、聚类以及权重的计算过程中,会导致参数过于复杂,影响计算的进度,通过归一化处理,将各个数据参数进行归一化,使得处理后获得的每个数据参数对应的维度值处于0~1之间。
本发明实施例提供的航班推荐方法中,在需要将各个待推荐航班向用户进行推荐之前,需要通过孤立森林算法模型、聚类以及权重的计算,各个过程均需要每个航班对应的各个个性化数据和航班特征数据的数据参数参与具体的计算过程。由于每个数据参数过于庞大,且每个数据参数之间的表现形式不同,例如:飞机机龄对应的数据参数为具体的整数值、而飞机延误率的数据参数为百分比,因此需要通过归一化的方式,将各个数据参数转换成同一表现形式的数值作为后续的计算的代入值。在将各个数据参数进行归一化处理后,获得每个航班对应的各个个性化数据和航班特征数据的维度值。
需要说明的是,归一化处理对应的公式为:
其中,Xnew为归一化后的维度值;X为当前计算的个性化数据或航班特征数据的数据参数;Xmax为同一个性化数据或航班特征数据中最大的数据参数;Xmin为同一个性化数据或航班特征数据中最小的数据参数。
应用本发明实施例提供的方法,将各个维度数据的数据参数进行归一化处理,方便后续对各个维度数据的计算。
本发明实施例提供的方法中,基于上述S106的内容,在通过孤立森林算法模型区分出各个主推荐航班以及次推荐航班后,需要对各个主推荐航班进行聚类。其中,所述基于每个所述主推荐航班对应的各个所述个性化数据的维度值,对各个所述主推荐航班进行聚类的过程,具体可以包括:
确定所述数据集合中各个个性化数据的数据个数;
基于所述数据个数,在各个所述主推荐航班中,选取每个所述个性化数据对应的主推荐航班为聚类中心,并执行预先设置的聚类过程;
其中,所述聚类过程包括:应用预先设置的聚类算法及每个所述主推荐航班对应的各个个性化数据的维度值,计算每个所述主推荐航班到各个所述聚类中心的距离,并将每个所述主推荐航班归类至与其距离最近的聚类中心,获得每个所述个性化数据对应的聚类簇;
应用预先设置的中心算法在各个所述主推荐航班中,重新确定每个所述个性化数据对应的主推荐航班为新的聚类中心,并执行所述聚类过程,直至当前执行的聚类过程对应的各个聚类中心,与上一次执行的聚类过程对应的各个聚类中心一致时,结束对各个所述主推荐航班的聚类。
本发明实施例提供的航班推荐方法中,在需要对各个主推荐航班进行聚类时,需要按照个性化数据的数据个数进行聚类。在进行聚类时,先随机选取该数据个数对应的主推荐航班为聚类中心,每个聚类中心与每个个性化数据一一对应,并执行聚类过程。在该聚类过程中,以聚类中心为计算的质心,对每个主推荐航班对应的各个个性化数据的维度值进行计算,确定每个主推荐航班到各个聚类中心的距离,并将主推荐航班归类到距离其最近的聚类中心,生成当前各个聚类中心对应的聚类簇。在当前的聚类过程结束后,应用预先设置的中心算法,重新在各个主推荐航班中计算出每个个性化数据对应的主推荐航班为新的聚类中心,再重新执行该聚类过程。经过应用上述中心算法进行多次选取聚类中心,并执行对应的聚类过程后,若当前选取的聚类中心与上一次选取的聚类中心一致,则将当前选取的聚类中心对应的聚类过程中获得的聚类簇确定为最终的每个个性化数据对应的聚类簇。
需要说明的是,该聚类算法可以是欧氏距离算法,通过欧式距离算法计算每个主推荐航班到各个聚类中心的距离。在计算每个主推荐航班到各个聚类中心的距离的过程中,由于每个聚类中心与每个个性化数据一一对应,因此,在计算主推荐航班到任意聚类中心的距离时,只需应用该主推荐航班对应的各个维度值中,与该聚类中心对应的个性化数据的维度值进行计算。例如,数据集合中包含两个个性化数据A和B,则在各个主推荐航班中选取个性化数据A对应的主推荐航班a为聚类中心a,及个性化数据B对应的主推荐航班b为聚类中心b。应用欧式算法及主推荐航班c对应的个性化数据A的维度值,计算该主推荐航班c到聚类中心a的距离;同时,应用欧式算法及主推荐航班c对应的个性化数据B的维度值,计算该主推荐航班c到聚类中心b的距离,若该主推荐航班到c该聚类中心a的距离最短,则将该主推荐航班c归类至该聚类中心a对应的聚类簇中。
应用本发明实施例提供的方法,经过多次选取每个个性化数据对应的聚类中心,以实现将具有相似特征的主推荐航班归类至同一聚类簇中。
本发明实施例提供的方法中,基于上述S107的内容,在对各个主推荐航班进行聚类后,需要计算每个聚类簇的聚类簇权重。聚类簇权重的计算过程与每个主推荐航班的各个个性化数据的维度权重相关,因此,参考图3,所述确定每个所述个性化数据的维度权重,具体可以包括:
S301:确定每个所述个性化数据预先设置的优先级,并检测所述数据集合中是否存在用户已选择的个性化数据;
在本发明实施例中,对于数据集合中的各个个性化数据,其对应的优先级越高,则该个性化数据的权重就越高。在进行设置每个个性化数据的维度权重前,需要先确定用户是否在数据集合的各个个性化数据中选择了至少一个个性化数据。
需要说明的是,数据集合中的各个个性化数据受用户的影响,若某个个性化数据被用户选择,则表征该用户更加倾向于选择符合该个性化数据的要求的航班。例如用户选择的个性化数据为飞机机龄5年,则证明用户比较倾向乘坐飞机机龄5年左右的航班。
S302:若所述数据集合中存在用户已选择的个性化数据,则增加每个所述已选择的个性化数据的优先级,以获得所述数据集合中每个所述个性化数据的最终的优先级;
在本发明实施例中,若用户已经选择数据集合中的任意的个性化数据,则加大该个性化数据的优先级。在增加用户已选择的个性化数据的优先级后,确定目前数据集合中每个个性化数据的最终的优先级。
需要说明的是,增加每个已选择的个性化的优先级是将各个已选择的个性化数据的优先级改变成大于其他未被用户选择的个性化数据的优先级。其中,若被用户选择的个性化数据为多个时,则每个已选择的个性化数据的优先级按相同的增加比例进行增加;若只有一个已选择的个性化数据,则只要将该个性化数据的优先级增加至大于其他个性化数据的优先级即可。
S303:基于预先设置的权重公式及每个所述个性化数据的最终的优先级,设置每个所述个性化数据的维度权重。
在本发明实施例中,该权重公式用于设置各个个性化数据的维度权重,该权重公式中的每项代表一个个性化数据的维度权重,基于各个个性化数据的最终的优先级,依次将权重公式中的每一项设置为各个个性化数据的维度权重。
具体的,权重公式为:(1-q)+(1-q)q+(1-q)q2+…+(1-q)qn-1+qn=1,(0<q<0.5);
其中,(1-q)到(1-q)qn-1为该权重公式的各个项,其采用等比数列的方式进行权重的递减。(1-q)到(1-q)qn-1为各个各个个性化数据的维度权重,优先级最高的个性化数据的维度权重为(1-q),优先级最低的个性化数据的维度权重为(1-q)qn-1;n为各个个性化数据的个数。
本发明实施例提供的航班推荐方法中,在需要确定各个个性化数据的维度权重的过程中,需要调整各个个性化数据的优先级。具体的,先确定数据集合中是否存在用户已选择的个性化数据,若存在已选择的个性化数据,则需要增加用户已选择的个性化数据的优先级,以保证用户已选择的个性化数据的优先级大于其他个性化数据的优先级。通过预先设置的权重公式:(1-q)+(1-q)q+(1-q)q2+…+(1-q)qn-1+qn=1,设置每个个性化数据的维度权重。
应用本发明实施例提供的方法,对各个个性化数据设置维度权重,以基于各个维度权重计算聚类簇以及各个主推荐航班的权重。
本发明实施例提供的方法中,基于上述S107的内容,在确定各个个性化数据的维度权重后,计算各个聚类簇的聚类簇权重。具体的,参考图4,所述基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算各个所述聚类簇的聚类簇权重的过程,可以包括:
S401:确定每个所述聚类簇中主推荐航班的个数,并获取每个所述主推荐航班所属的聚类簇对应的个性化数据的维度值;
在本发明实施例中,对于同一个聚类簇来说,该聚类簇对应的个性化数据为该聚类簇内各个主推荐航班主要进行计算的数据。在聚类簇的簇内主推荐航班的个数之后,需要获取簇内各个主推荐航班所属的聚类簇对应的个性化数据的维度值。例如,聚类簇A对应的个性化数据为飞机机龄,则获取该聚类簇内所有主推荐航班关于飞机机龄的维度值。
S402:基于每个所述聚类簇中主推荐航班的个数,及已获取的各个维度值,计算每个个性化数据的维度平均值;
在本发明实施例中,计算每个个性化数据的维度平均值的公式为:
其中,为个性化数据的维度平均值;p为聚类簇对应的个性化数据的簇内的各个维度值的和;N为簇内主推荐航班的个数。/>
S403:基于每个所述个性化数据的维度权重及维度平均值,计算每个所述聚类簇的聚类簇权重。
在本发明实施例中,每个聚类簇的聚类簇权重对应的计算公式与上述S108中各个主推荐航班的航班权重对应的计算公式一致。聚类簇权重对应的计算公式为:A聚类簇=(1-q)p1+(1-q)qp2+(1-q)q2p3+…+(1-q)qn-1pn+qn;其中,A聚类簇为聚类簇权重;(1-q)到(1-q)qn-1为数据集合中每个个性化数据的维度权重;p1到pn为个性化数据的维度平均值;n为个性化数据的个数。
本发明实施例提供的航班推荐方法中,在对各个聚类簇进行权重的计算时,先确定每个聚类簇中各个主推荐航班的个数,并获取每个主推荐航班所在的聚类簇对应的个性化数据的维度值,以通过各个维度值及主推荐航班的个数计算每个个性化数据的维度平均值。将已确定的各个维度权重及维度平均值代入聚类簇权重对应的计算公式中,计算每个聚类簇的聚类簇权重。
需要说明的是,在应用聚类簇权重对应的计算公式计算各个聚类簇的聚类簇权重的过程中,由于(1-q)到(1-q)qn-1为固定的值,因此,每次计算时代入的各个维度平均值p1到pn的顺序不同。每次计算时的p1为当前需要计算聚类簇权重的聚类簇对应的个性化数据的维度平均值,p2到pn对应的维度平均值则按照剩余的各个个性化数据的最终的优先级依次进行代入。
例如,当前有三个个性化数据分别为A、B、C,各个个性化数据的优先级为A>B>C;维度平均值依次分别为p1、p2、p3;个性化数据A对应的聚类簇A的聚类簇权重为:A聚类簇A=(1-q)p1+(1-q)qp2+(1-q)q2p3+q3;个性化数据B对应的聚类簇B的聚类簇权重为:A聚类簇B=(1-q)p2+(1-q)qp1+(1-q)q2p3+q3;个性化数据C对应的聚类簇C的聚类簇权重对应的计算公式为:A聚类簇C=(1-q)p3+(1-q)qp1+(1-q)q2p2+q3。
应用本发明实施例提供的方法,通过计算各个聚类簇的聚类簇权重,以确定用户比较偏好的个性班数据,通过对各个聚类簇的排序,将用户比较偏好的个性化数据对应的各个主推荐航班排在前列,缩短用户筛选航班的时间,提高用户的体验感。
上述各个实施例的具体实施过程及其衍生方式,均在本发明的保护范围之内。
与图1所述的方法相对应,本发明实施例还提供了一种航班推荐装置,用于对图1中方法的具体实现,本发明实施例提供的航班推荐装置可以应用计算机终端或各种移动设备中,其结构示意图如图5所示,具体包括:
第一确定单元501,用于确定预先设置的数据集合,所述数据集合中包括多个供用户选择的个性化数据和多个航班特征数据;
第二确定单元502,用于确定待推荐的各个航班,每个航班均与所述数据集合中的各个个性化数据及航班特征数据对应;
获取单元503,用于获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的维度值;
检测单元504,用于将每个所述航班对应的各个所述个性化数据及航班特征数据的维度值,输入预先设置的孤立森林算法模型,通过所述孤立森林算法模型检测每个所述航班的推荐价值,以获得所述孤立森林算法模型输出的每个所述航班的检测值;
设定单元505,用于在各个所述航班中,设定检测值高于预设阈值的航班为主推荐航班,检测值低于所述预设阈值的航班为次推荐航班;
聚类单元506,用于基于每个所述主推荐航班对应的各个所述个性化数据的维度值,对各个所述主推荐航班进行聚类,获得每个所述个性化数据对应的聚类簇;
第一计算单元507,用于确定每个所述个性化数据的维度权重,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算各个所述聚类簇的聚类簇权重;
第二计算单元508,用于基于各个所述聚类簇权重,对各个所述聚类簇进行排序,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算每个所述主推荐航班的航班权重;
排序单元509,用于基于各个所述航班权重,对各个所述主推荐航班进行簇内排序;
推送单元510,用于基于每个所述次推荐航班的检测值,将各个所述次推荐航班依次排在各个所述主推荐航班之后,并将已排序的各个航班推送至预先设置的显示页面。
本发明实施例提供的航班推荐装置,在需要向用户推荐航班时,需要确定预先设置的数据集合,该数据集合中包含多个个性化数据和多个航班特征数据。确定各个待推荐航班,以及每个航班对应的各个个性化数据和航班特征数据的维度值。先通过孤立森林算法模型确定各个航班中的主推荐航班和次推荐航班,再对各个主推荐航班进行聚类,获得多个聚类簇。通过每个个性化数据的数据权重及维度值,计算每个聚类簇的聚类簇权重以及每个聚类簇中各个主推荐航班的航班权重。基于各个聚类簇权重及各个航班权重,对各个主推荐航班进行排序,并将各个次推荐航班排在各个主推荐航班之后,获得各个已排序的航班,将各个已排序的航班进行推送。
应用本发明实施例提供的装置,通过数据集合中的多个维度数据、孤立森林算法模型及聚类的方式,对各个待推荐的航班进行排序后再进行推送,满足了多个维度的考虑因素,更加全面和合理地向用户推荐航班。
本发明实施例提供的装置,所述获取单元503,包括:
第一获取子单元,用于获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的数据参数;
处理子单元,用于对每个所述航班对应的各个数据参数进行归一化处理,获得每个所述航班对应的各个所述个性化数据及航班特征数据的维度值。
本发明实施例提供的装置,所述聚类单元506,包括:
确定子单元,用于确定所述数据集合中各个个性化数据的数据个数;
执行子单元,用于基于所述数据个数,在各个所述主推荐航班中,选取每个所述个性化数据对应的主推荐航班为聚类中心,并执行预先设置的聚类过程;
其中,所述聚类过程包括:应用预先设置的聚类算法及每个所述主推荐航班对应的各个个性化数据的维度值,计算每个所述主推荐航班到各个所述聚类中心的距离,并将每个所述主推荐航班归类至与其距离最近的聚类中心,获得每个所述个性化数据对应的聚类簇;
选取子单元,用于应用预先设置的中心算法在各个所述主推荐航班中,重新确定每个所述个性化数据对应的主推荐航班为新的聚类中心,并执行所述聚类过程,直至当前执行的聚类过程对应的各个聚类中心,与上一次执行的聚类过程对应的各个聚类中心一致时,结束对各个所述主推荐航班的聚类。
本发明实施例提供的装置,所述第一计算单元507,包括:
检测子单元,用于确定每个所述个性化数据预先设置的优先级,并检测所述数据集合中是否存在用户已选择的个性化数据;
调整子单元,用于若所述数据集合中存在用户已选择的个性化数据,则增加每个所述已选择的个性化数据的优先级,以获得所述数据集合中每个所述个性化数据的最终的优先级;
设置子单元,用于基于预先设置的权重公式及每个所述个性化数据的最终的优先级,设置每个所述个性化数据的维度权重。
本发明实施例提供的装置,所述第一计算单元507,包括:
第二获取子单元,用于确定每个所述聚类簇中主推荐航班的个数,并获取每个所述主推荐航班所属的聚类簇对应的个性化数据的维度值;
第一计算子单元,用于基于每个所述聚类簇中主推荐航班的个数,及已获取的各个维度值,计算每个个性化数据的维度平均值;
第二计算子单元,用于基于每个所述个性化数据的维度权重及维度平均值,计算每个所述聚类簇的聚类簇权重。
以上本发明实施例公开的航班推荐装置中各个单元及子单元的具体工作过程,可参见本发明上述实施例公开的航班推荐方法中的对应内容,这里不再进行赘述。
本发明实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述航班推荐方法。
本发明实施例还提供了一种电子设备,其结构示意图如图6所示,具体包括存储器601,以及一个或者一个以上的指令602,其中一个或者一个以上指令602存储于存储器601中,且经配置以由一个或者一个以上处理器603执行所述一个或者一个以上指令602进行以下操作:
确定预先设置的数据集合,所述数据集合中包括多个供用户选择的个性化数据和多个航班特征数据;
确定待推荐的各个航班,每个航班均与所述数据集合中的各个个性化数据及航班特征数据对应;
获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的维度值;
将每个所述航班对应的各个所述个性化数据及航班特征数据的维度值,输入预先设置的孤立森林算法模型,通过所述孤立森林算法模型检测每个所述航班的推荐价值,以获得所述孤立森林算法模型输出的每个所述航班的检测值;
在各个所述航班中,设定检测值高于预设阈值的航班为主推荐航班,检测值低于所述预设阈值的航班为次推荐航班;
基于每个所述主推荐航班对应的各个所述个性化数据的维度值,对各个所述主推荐航班进行聚类,获得每个所述个性化数据对应的聚类簇;
确定每个所述个性化数据的维度权重,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算各个所述聚类簇的聚类簇权重;
基于各个所述聚类簇权重,对各个所述聚类簇进行排序,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算每个所述主推荐航班的航班权重;
基于各个所述航班权重,对各个所述主推荐航班进行簇内排序;
基于每个所述次推荐航班的检测值,将各个所述次推荐航班依次排在各个所述主推荐航班之后,并将已排序的各个航班推送至预先设置的显示页面。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现。
为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种航班推荐方法,其特征在于,包括:
确定预先设置的数据集合,所述数据集合中包括多个供用户选择的个性化数据和多个航班特征数据;
确定待推荐的各个航班,每个航班均与所述数据集合中的各个个性化数据及航班特征数据对应;
获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的维度值;
将每个所述航班对应的各个所述个性化数据及航班特征数据的维度值,输入预先设置的孤立森林算法模型,通过所述孤立森林算法模型检测每个所述航班的推荐价值,以获得所述孤立森林算法模型输出的每个所述航班的检测值;
在各个所述航班中,设定检测值高于预设阈值的航班为主推荐航班,检测值低于所述预设阈值的航班为次推荐航班;
基于每个所述主推荐航班对应的各个所述个性化数据的维度值,对各个所述主推荐航班进行聚类,获得每个所述个性化数据对应的聚类簇;
确定每个所述个性化数据的维度权重,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算各个所述聚类簇的聚类簇权重;
基于各个所述聚类簇权重,对各个所述聚类簇进行排序,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算每个所述主推荐航班的航班权重;
基于各个所述航班权重,对各个所述主推荐航班进行簇内排序;
基于每个所述次推荐航班的检测值,将各个所述次推荐航班依次排在各个所述主推荐航班之后,并将已排序的各个航班推送至预先设置的显示页面。
2.根据权利要求1所述的方法,其特征在于,所述获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的维度值,包括:
获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的数据参数;
对每个所述航班对应的各个数据参数进行归一化处理,获得每个所述航班对应的各个所述个性化数据及航班特征数据的维度值。
3.根据权利要求1所述的方法,其特征在于,所述基于每个所述主推荐航班对应的各个所述个性化数据的维度值,对各个所述主推荐航班进行聚类,包括:
确定所述数据集合中各个个性化数据的数据个数;
基于所述数据个数,在各个所述主推荐航班中,选取每个所述个性化数据对应的主推荐航班为聚类中心,并执行预先设置的聚类过程;
其中,所述聚类过程包括:应用预先设置的聚类算法及每个所述主推荐航班对应的各个个性化数据的维度值,计算每个所述主推荐航班到各个所述聚类中心的距离,并将每个所述主推荐航班归类至与其距离最近的聚类中心,获得每个所述个性化数据对应的聚类簇;
应用预先设置的中心算法在各个所述主推荐航班中,重新确定每个所述个性化数据对应的主推荐航班为新的聚类中心,并执行所述聚类过程,直至当前执行的聚类过程对应的各个聚类中心,与上一次执行的聚类过程对应的各个聚类中心一致时,结束对各个所述主推荐航班的聚类。
4.根据权利要求1所述的方法,其特征在于,所述确定每个所述个性化数据的维度权重,包括:
确定每个所述个性化数据预先设置的优先级,并检测所述数据集合中是否存在用户已选择的个性化数据;
若所述数据集合中存在用户已选择的个性化数据,则增加每个所述已选择的个性化数据的优先级,以获得所述数据集合中每个所述个性化数据的最终的优先级;
基于预先设置的权重公式及每个所述个性化数据的最终的优先级,设置每个所述个性化数据的维度权重。
5.根据权利要求4所述的方法,其特征在于,所述基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算各个所述聚类簇的聚类簇权重,包括:
确定每个所述聚类簇中主推荐航班的个数,并获取每个所述主推荐航班所属的聚类簇对应的个性化数据的维度值;
基于每个所述聚类簇中主推荐航班的个数,及已获取的各个维度值,计算每个个性化数据的维度平均值;
基于每个所述个性化数据的维度权重及维度平均值,计算每个所述聚类簇的聚类簇权重。
6.一种航班推荐装置,其特征在于,包括:
第一确定单元,用于确定预先设置的数据集合,所述数据集合中包括多个供用户选择的个性化数据和多个航班特征数据;
第二确定单元,用于确定待推荐的各个航班,每个航班均与所述数据集合中的各个个性化数据及航班特征数据对应;
获取单元,用于获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的维度值;
检测单元,用于将每个所述航班对应的各个所述个性化数据及航班特征数据的维度值,输入预先设置的孤立森林算法模型,通过所述孤立森林算法模型检测每个所述航班的推荐价值,以获得所述孤立森林算法模型输出的每个所述航班的检测值;
设定单元,用于在各个所述航班中,设定检测值高于预设阈值的航班为主推荐航班,检测值低于所述预设阈值的航班为次推荐航班;
聚类单元,用于基于每个所述主推荐航班对应的各个所述个性化数据的维度值,对各个所述主推荐航班进行聚类,获得每个所述个性化数据对应的聚类簇;
第一计算单元,用于确定每个所述个性化数据的维度权重,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算各个所述聚类簇的聚类簇权重;
第二计算单元,用于基于各个所述聚类簇权重,对各个所述聚类簇进行排序,并基于每个所述航班对应的各个个性化数据的维度权重和维度值,计算每个所述主推荐航班的航班权重;
排序单元,用于基于各个所述航班权重,对各个所述主推荐航班进行簇内排序;
推送单元,用于基于每个所述次推荐航班的检测值,将各个所述次推荐航班依次排在各个所述主推荐航班之后,并将已排序的各个航班推送至预先设置的显示页面。
7.根据权利要求6所述的装置,其特征在于,所述获取单元,包括:
第一获取子单元,用于获取每个所述航班对应的数据集合中,各个所述个性化数据及航班特征数据的数据参数;
处理子单元,用于对每个所述航班对应的各个数据参数进行归一化处理,获得每个所述航班对应的各个所述个性化数据及航班特征数据的维度值。
8.根据权利要求6所述的装置,其特征在于,所述聚类单元,包括:
确定子单元,用于确定所述数据集合中各个个性化数据的数据个数;
执行子单元,用于基于所述数据个数,在各个所述主推荐航班中,选取每个所述个性化数据对应的主推荐航班为聚类中心,并执行预先设置的聚类过程;
其中,所述聚类过程包括:应用预先设置的聚类算法及每个所述主推荐航班对应的各个个性化数据的维度值,计算每个所述主推荐航班到各个所述聚类中心的距离,并将每个所述主推荐航班归类至与其距离最近的聚类中心,获得每个所述个性化数据对应的聚类簇;
选取子单元,用于应用预先设置的中心算法在各个所述主推荐航班中,重新确定每个所述个性化数据对应的主推荐航班为新的聚类中心,并执行所述聚类过程,直至当前执行的聚类过程对应的各个聚类中心,与上一次执行的聚类过程对应的各个聚类中心一致时,结束对各个所述主推荐航班的聚类。
9.根据权利要求6所述的装置,其特征在于,所述第一计算单元,包括:
检测子单元,用于确定每个所述个性化数据预先设置的优先级,并检测所述数据集合中是否存在用户已选择的个性化数据;
调整子单元,用于若所述数据集合中存在用户已选择的个性化数据,则增加每个所述已选择的个性化数据的优先级,以获得所述数据集合中每个所述个性化数据的最终的优先级;
设置子单元,用于基于预先设置的权重公式及每个所述个性化数据的最终的优先级,设置每个所述个性化数据的维度权重。
10.根据权利要求6所述的装置,其特征在于,所述第一计算单元,包括:
第二获取子单元,用于确定每个所述聚类簇中主推荐航班的个数,并获取每个所述主推荐航班所属的聚类簇对应的个性化数据的维度值;
第一计算子单元,用于基于每个所述聚类簇中主推荐航班的个数,及已获取的各个维度值,计算每个个性化数据的维度平均值;
第二计算子单元,用于基于每个所述个性化数据的维度权重及维度平均值,计算每个所述聚类簇的聚类簇权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011203059.2A CN112307342B (zh) | 2020-11-02 | 2020-11-02 | 航班推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011203059.2A CN112307342B (zh) | 2020-11-02 | 2020-11-02 | 航班推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112307342A CN112307342A (zh) | 2021-02-02 |
CN112307342B true CN112307342B (zh) | 2023-10-10 |
Family
ID=74333612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011203059.2A Active CN112307342B (zh) | 2020-11-02 | 2020-11-02 | 航班推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112307342B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113077304B (zh) * | 2021-03-22 | 2023-01-13 | 海南太美航空股份有限公司 | 一种航班信息的推荐方法、系统和电子设备 |
CN113159888A (zh) * | 2021-04-19 | 2021-07-23 | 海南太美航空股份有限公司 | 一种航班信息的推荐方法、系统及电子设备 |
CN113297336B (zh) * | 2021-05-31 | 2023-12-19 | 中国民航信息网络股份有限公司 | 航班的季节性归类方法、装置及机器可读介质 |
CN113850695B (zh) * | 2021-09-07 | 2022-12-13 | 海南太美航空股份有限公司 | 一种基于大数据的航空信息管理平台以及方法 |
CN113901351B (zh) * | 2021-12-10 | 2022-02-22 | 深圳市活力天汇科技股份有限公司 | 一种机票推荐方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109816127A (zh) * | 2019-01-11 | 2019-05-28 | 广州市骑鹅游信息技术咨询服务有限公司 | 一种智能票务推荐方法及系统 |
CN109934678A (zh) * | 2019-03-11 | 2019-06-25 | 深圳市活力天汇科技股份有限公司 | 一种基于用户偏好的航班打分方法 |
CN110147820A (zh) * | 2019-04-11 | 2019-08-20 | 北京远航通信息技术有限公司 | 航班额外油量的推荐方法、装置、设备及存储介质 |
CN110659947A (zh) * | 2019-10-11 | 2020-01-07 | 沈阳民航东北凯亚有限公司 | 商品推荐方法及装置 |
CN111507810A (zh) * | 2020-05-27 | 2020-08-07 | 海南太美航空股份有限公司 | 基于聚类分析的航班服务方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014176748A1 (en) * | 2013-04-28 | 2014-11-06 | Tencent Technology (Shenzhen) Company Limited | Method, device, and system for accessing third party platforms via a messaging application |
-
2020
- 2020-11-02 CN CN202011203059.2A patent/CN112307342B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109816127A (zh) * | 2019-01-11 | 2019-05-28 | 广州市骑鹅游信息技术咨询服务有限公司 | 一种智能票务推荐方法及系统 |
CN109934678A (zh) * | 2019-03-11 | 2019-06-25 | 深圳市活力天汇科技股份有限公司 | 一种基于用户偏好的航班打分方法 |
CN110147820A (zh) * | 2019-04-11 | 2019-08-20 | 北京远航通信息技术有限公司 | 航班额外油量的推荐方法、装置、设备及存储介质 |
CN110659947A (zh) * | 2019-10-11 | 2020-01-07 | 沈阳民航东北凯亚有限公司 | 商品推荐方法及装置 |
CN111507810A (zh) * | 2020-05-27 | 2020-08-07 | 海南太美航空股份有限公司 | 基于聚类分析的航班服务方法及系统 |
Non-Patent Citations (1)
Title |
---|
宋云鹏等.基于因子分析的洼地航班目标旅客推荐模型.《科技走廊》.2019,第44页. * |
Also Published As
Publication number | Publication date |
---|---|
CN112307342A (zh) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112307342B (zh) | 航班推荐方法及装置 | |
US9870540B2 (en) | Travel services search | |
CN109118336B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
US20200342039A1 (en) | Analyzing web pages to facilitate automatic navigation | |
CN110741331B (zh) | 用于图像响应自动助理的系统、方法和装置 | |
US20220237486A1 (en) | Suggesting activities | |
US20200294111A1 (en) | Determining target user group | |
CN109189934A (zh) | 舆情推荐方法、装置、计算机设备及存储介质 | |
US20050210025A1 (en) | System and method for predicting the ranking of items | |
CN108648058B (zh) | 产品排序方法及装置,电子设备、存储介质 | |
CN108665148B (zh) | 一种电子资源质量评价方法、装置和存储介质 | |
US20170154353A1 (en) | Systems and methods for generating a tripscore | |
CA3166347A1 (en) | Video generation method and apparatus, and computer system | |
CN110992124B (zh) | 房源的推荐方法及房源的推荐系统 | |
CN107122386B (zh) | 数据的筛选方法及装置 | |
CN109740036B (zh) | Ota平台酒店排序方法及装置 | |
CN109558384A (zh) | 日志分类方法、装置、电子设备和存储介质 | |
CN106951527A (zh) | 一种歌曲推荐方法及装置 | |
CN106447425A (zh) | 一种生活服务信息推荐方法和装置 | |
CN111353851A (zh) | 酒店排序推荐方法、装置、电子设备、存储介质 | |
KR20220050099A (ko) | 식당에서 필요한 추천 정보를 생성하여 고객에게 제공하는 시스템 | |
Mohanty et al. | A novel multi-attribute decision making approach for selection of appropriate product conforming ergonomic considerations | |
CN105681089B (zh) | 网络用户行为聚类方法、装置及终端 | |
JP2017513131A (ja) | 1つまたは複数のウェブサイトからの商品またはサービスを比較する方法 | |
WO2020042776A1 (zh) | 推荐方法、装置、存储介质和终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |