CN117952717A - 一种基于大数据的机票订单处理方法及系统 - Google Patents
一种基于大数据的机票订单处理方法及系统 Download PDFInfo
- Publication number
- CN117952717A CN117952717A CN202410148387.9A CN202410148387A CN117952717A CN 117952717 A CN117952717 A CN 117952717A CN 202410148387 A CN202410148387 A CN 202410148387A CN 117952717 A CN117952717 A CN 117952717A
- Authority
- CN
- China
- Prior art keywords
- data
- order
- space
- order data
- air ticket
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 230000002159 abnormal effect Effects 0.000 claims abstract description 121
- 238000012545 processing Methods 0.000 claims abstract description 45
- 239000011159 matrix material Substances 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 24
- 230000005856 abnormality Effects 0.000 claims abstract description 14
- 238000001514 detection method Methods 0.000 claims abstract description 10
- 230000015654 memory Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 abstract description 9
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Landscapes
- Testing And Monitoring For Control Systems (AREA)
Abstract
本申请提供一种基于大数据的机票订单处理方法及系统,对获取的历史机票订单数据进行数据延拓,得到订单数据延拓空间;获取二次中心距矩阵,由二次中心距矩阵确定订单数据延拓空间中每个机票订单数据对应的奇异熵;获取订单数据延拓空间的延拓核,通过延拓核确定订单数据延拓空间中每个机票订单数据对应的数据漂移量;根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量,基于异常订单特征量对订单数据延拓空间进行空间聚类,得到异常订单特征集合;根据异常订单特征集合对待检测机票订单进行异常检测,可以在机票订单的数据处理过程中,获取准确的异常订单特征量用于机票订单异常识别,提高了机票异常识别的准确性。
Description
技术领域
本申请涉及订单数据处理技术领域,更具体的说,本申请涉及一种基于大数据的机票订单处理方法及系统。
背景技术
机票订单数据处理涉及收集、整合和分析大量订单信息,包括乘客、航班和支付数据,以预测需求、优化价格和提供个性化服务,机票订单异常处理问题可能涉及订单重复、支付失败、航班取消和机票订单数据异常等,需要建立有效的监测系统和异常处理机制,确保及时识别和解决机票订单异常情况。
现有技术中,常常通过机票订单处理系统从多个数据源收集异常订单信息的订单数据、航班信息、乘客偏好等信息,将其聚类得到异常订单特征,并整合在机票订单处理系统的中心化数据仓库中,机票订单处理系统运用机器学习模型和数据挖掘技术,基于异常订单特征进行准确的异常识别以便于进行更好的数据驱动决策,但在收集异常订单特征的过程中,异常订单特征量的多少直接决定了异常识别的准确率,异常订单特征量过大时,相似的订单异常特征会被划分为多个子特征,难以用于对机票订单的异常识别,异常订单特征量过小时,由于特征过拟合,又会失去异常订单特征的内在结构与分布特征,因此,如何在机票订单的数据处理过程中,获取准确的异常订单特征量用于机票订单异常识别成为了亟待解决的问题。
发明内容
本申请提供一种基于大数据的机票订单处理方法及系统,可以在机票订单的数据处理过程中,获取准确的异常订单特征量用于机票订单异常识别,提高了机票异常识别的准确性。
第一方面,本申请提供一种基于大数据的机票订单处理方法,包括如下步骤:
对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间;
获取所述订单数据延拓空间的二次中心距矩阵,由所述二次中心距矩阵确定所述订单数据延拓空间中每个机票订单数据对应的奇异熵;
获取所述订单数据延拓空间的延拓核,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量;
根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量,基于所述异常订单特征量对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合;
根据所述异常订单特征集合对待检测机票订单进行异常检测。
在一些实施例中,对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间具体包括:
将获取的不同大数据源的历史机票订单数据进行整合,得到机票订单数据域;
将飞行航距作为所述机票订单数据域的数据维度,得到机票订单数据空间;
确定所述机票订单数据空间的延拓极点和延拓极差;
根据所述延拓极点和延拓极差生成飞行航距扩展域;
根据所述航距扩展域对所述机票订单数据空间进行延拓,得到订单数据延拓空间。
在一些实施例中,确定所述机票订单数据空间的延拓极点和延拓极差具体包括:
获取所述机票订单数据空间中所有数据点,进而将所有数据点平均值作为所述机票订单数据空间的延拓极点;
获取所述机票订单数据空间的数据总数和数据维度;
通过所述机票订单数据空间的数据总数和数据维度确定所述机票订单数据空间的延拓极差。
在一些实施例中,根据所述飞行航距扩展域对所述机票订单数据空间进行延拓,得到订单数据延拓空间是指将飞行航距扩展域和所述机票订单数据空间进行合并得到的数据空间作为订单数据延拓空间。
在一些实施例中,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量具体包括:
对于所述订单数据延拓空间中每个机票订单数据,获取该个机票订单数据对应的奇异熵;
通过所述奇异熵和所述延拓核确定该个机票订单数据对应的数据漂移量,进而得到所述订单数据延拓空间中每个机票订单数据对应的数据漂移量。
在一些实施例中,根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量具体包括:
确定所有数据漂移量中的最大数据漂移量,进而获取所述最大数据漂移量在所有数据漂移量中对应的序列位置;
确定所有奇异熵中的最大奇异熵;进而获取所述最大奇异熵在所有奇异熵中对应的序列位置;
由所述最大数据漂移量、最大数据漂移量对应的序列位置、所述最大奇异熵和所述最大奇异熵对应的序列位置确定异常订单特征量。
在一些实施例中,基于所述异常订单特征量对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合具体包括:
通过所述异常订单特征量确定空间聚类中心个数;
基于空间聚类中心个数对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合。
第二方面,本申请提供一种基于大数据的机票订单处理系统,包括有机票订单处理单元,所述机票订单处理单元包括:
延拓模块,用于对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间;
处理模块,用于获取所述订单数据延拓空间的二次中心距矩阵,由所述二次中心距矩阵确定所述订单数据延拓空间中每个机票订单数据对应的奇异熵;
所述处理模块,还用于获取所述订单数据延拓空间的延拓核,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量;
所述处理模块,还用于根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量,基于所述异常订单特征量对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合;
异常检测模块,用于根据所述异常订单特征集合对待检测机票订单进行异常检测。
第三方面,本申请提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于从所述存储器中调用并运行所述计算机程序,使得所述计算机设备执行上述的基于大数据的机票订单处理方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令或代码,当指令或代码在计算机上运行时,使得计算机执行时实现上述的基于大数据的机票订单处理方法。
本申请公开的实施例提供的技术方案具有以下有益效果:
本申请中,首先,对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间,可以将由不同大数据源的历史机票订单数据组成的数据空间变得更具有完整性和鲁棒性,订单数据延拓空间中的数据冗余更少,并且可以将关注点集中在最近的、更有参考价值的机票订单数据上,更精准地识别当前可能存在的机票订单异常情况,然后,获取订单数据延拓空间的二次中心距矩阵,由二次中心距矩阵确定订单数据延拓空间中每个机票订单数据对应的奇异熵,根据奇异熵可以表示机票订单数据的内在特征并找出订单数据延拓空间中具有异常特征的历史机票订单数据,使得机票订单处理系统可以更精准地识别和处理异常情况,其次,获取所述订单数据延拓空间的延拓核,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量,可以衡量出订单数据延拓空间中每个机票订单数据的距离数据中心的偏移程度和分布特性,进而,根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量,以获取准确的异常订单特征量,用于增加订单异常特征集合的完整性,最后,基于异常订单特征量对订单数据延拓空间进行空间聚类,得到异常订单特征集合,根据异常订单特征集合对待检测机票订单进行异常检测,可以在机票订单的数据处理过程中,获取准确的异常订单特征量用于机票订单异常识别,提高了机票异常识别的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请一些实施例所示的基于大数据的机票订单处理方法的示例性流程图;
图2是根据本申请一些实施例所示的确定机票订单数据空间的延拓极点和延拓极差的示例性流程图;
图3是根据本申请一些实施例所示的确定异常订单特征量的示例性流程图;
图4是根据本申请一些实施例所示的机票订单处理单元的示例性硬件和/或软件的示意图;
图5是根据本申请一些实施例所示的实现基于大数据的机票订单处理方法的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种基于大数据的机票订单处理方法及系统,其核心是对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间;获取所述订单数据延拓空间的二次中心距矩阵,由所述二次中心距矩阵确定所述订单数据延拓空间中每个机票订单数据对应的奇异熵;获取所述订单数据延拓空间的延拓核,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量;根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量,基于所述异常订单特征量对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合;根据所述异常订单特征集合对待检测机票订单进行异常检测,可以在机票订单的数据处理过程中,获取准确的异常订单特征量用于机票订单异常识别,提高了机票异常识别的准确性。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。参考图1,该图是根据本申请一些实施例所示的一种基于大数据的机票订单处理方法的示例性流程图,该基于大数据的机票订单处理方法100主要包括如下步骤:
在步骤101,对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间。
在一些实施例中,对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间具体可采用下述方式,即:
将获取的不同大数据源的历史机票订单数据进行整合,得到机票订单数据域;
将飞行航距作为所述机票订单数据域的数据维度,得到机票订单数据空间;
确定所述机票订单数据空间的延拓极点和延拓极差;
根据所述延拓极点和延拓极差生成飞行航距扩展域;
根据所述航距扩展域对所述机票订单数据空间进行延拓,得到订单数据延拓空间。
具体实现时,首先,可以通过机票订单处理系统中的数据采集单元从多个大数据源收集历史机票订单数据,例如航空公司、旅行网站、预订平台等,需要说明的是,本申请中,机票订单数据是一个多维度的包含机票订单基本信息的数据,然后,将每个大数据源的所有机票订单数据的进行字段映射,确保不同大数据源的机票订单数据的订单信息字段具有相同的含义,然后,将不同大数据源的历史机票订单数据转换为统一的数据格式,例如使用标准的数据格式、命名规范等,最后,对所有机票订单数据进行验证和校验,确保机票订单数据的一致性、完整性和准确性,利用数据整合工具或技术,将通过验证和校验的历史机票订单数据合并成一个整合的数据集,即机票订单数据域,需要说明的是,通过整合数据源可以消除重复、矛盾或不一致的机票订单信息,确保数据的一致性和准确性,以减少错误或异常机票订单数据对整体数据的影响,并且机票订单可信域可以提供更全面的视角,更好地了解机票订单的整体情况,使得异常模式更容易被发现。
在上述实施例中,将飞行航距作为所述机票订单数据域的数据维度,得到机票订单数据空间,需要说明的是,通过将飞行航距作为机票订单数据域的数据维度,使得机票订单数据域的数据维度进行了升高,将数据维度升高之后的机票订单数据域作为机票订单数据空间。
需要说明的是,本申请中,机票订单数据空间的延拓极点表示机票订单数据空间的平均位置,机票订单数据空间的延拓极差表示机票订单数据空间的数据分散程度。
优选的,在一些实施例中,参考图2所示,该图是本申请一些实施例中确定机票订单数据空间的延拓极点和延拓极差的示例性流程图,本实施例中确定机票订单数据空间的延拓极点和延拓极差可采用下述步骤实现:
首先,在步骤1011中,获取所述机票订单数据空间中所有数据点,进而将所有数据点平均值作为所述机票订单数据空间的延拓极点;
然后,在步骤1012中,获取所述机票订单数据空间的数据总数和数据维度;
最后,在步骤1013中,通过所述机票订单数据空间的数据总数和数据维度确定所述机票订单数据空间的延拓极差。
在上述实施例中,具体实现时,机票订单数据空间的延拓极差可采用下述公式确定:
其中,λ表示机票订单数据空间的延拓极差,NG表示机票订单数据空间G的数据总数,MG表示机票订单数据空间G的数据维度,表示向下取整,需要说明的是,机票订单数据空间的数据维度可以用机票订单的属性数量来表示,例如,机票订单的属性具有4个属性,则机票订单数据空间的数据维度就为4。
在一些实施例中,根据所述延拓极点和延拓极差生成飞行航距扩展域,具体实现时,可以通过多变量正态分布进行模拟生成多维空间中的正态分布随机数据点,将正态分布随机数据点与该延拓极点相加,进而将所有数据点组成的集合作为飞行航距扩展域,该飞行航距扩展域是增加了飞行航距信息的机票订单数据集合,用来对机票订单数据空间进行延拓扩展,以便于学习机票异常情况与订单航距之间的非线性关系,例如,航距较长的国际航班往往顾客购票时间较长,导致订单存在时间较长,更容易出现订单丢失现象,航距较短的机票订单顾客多次改签,容易出现重复订单情况等。
在一些实施例中,根据所述飞行航距扩展域对所述机票订单数据空间进行延拓,得到订单数据延拓空间是指将飞行航距扩展域和所述机票订单数据空间进行合并得到的数据空间作为订单数据延拓空间,需要说明的是,本申请中,通过将飞行航距扩展域和机票订单数据空间进行合并,可以将飞行航距信息合并到机票订单数据空间中,使得机票订单数据空间的数据信息和数据维度进行了延拓,即得到订单数据延拓空间。
在步骤102,获取所述订单数据延拓空间的二次中心距矩阵,由所述二次中心距矩阵确定所述订单数据延拓空间中每个机票订单数据对应的奇异熵。
需要说明是,本申请中,二次中心距矩阵是用于描述订单数据延拓空间中机票订单数据在不同维度上扩散程度的矩阵,具体实现时,可以计算订单数据延拓空间中每对数据属性的二次交叉项,即二次中心距,可以将所有的二次交叉项组成一个矩阵,即订单数据延拓空间的二次中心距矩阵。
优选的,在一些实施例中,由所述二次中心距矩阵确定所述订单数据延拓空间中每个机票订单数据对应的奇异熵具体可采用下述方式,即:
确定订单数据延拓空间的数据位置中枢核;
由数据位置中枢核和二次中心距矩阵确定订单数据延拓空间中每个机票订单数据对应的奇异熵。
需要说明的是,本申请中,数据位置中枢核是用于描述订单数据延拓空间中心位置的向量,该数据位置中枢核展示了机票订单数据在给个维度上的平均水平,具体实现时,计算订单数据延拓空间的数据均值向量,可以将该数据均值向量作为订单数据延拓空间的数据位置中枢核,奇异熵是订单数据延拓空间中机票订单数据波动程度的量化值,该奇异熵越大,表示机票订单数据波动程度越高。
在上述实施例中,由数据位置中枢核和二次中心距矩阵确定订单数据延拓空间中每个机票订单数据对应的奇异熵,具体实现时,该奇异熵可根据下述公式确定:
其中,γi表示机票订单数据xi对应的奇异熵,xi表示订单数据延拓空间中第i个机票订单数据,μg表示订单数据延拓空间g的数据位置中枢核,SeMg表示订单数据延拓空间g的二次中心距矩阵,T表示转置操作。
需要说明的是,通过奇异熵的计算,可以找出订单数据延拓空间中具有异常特征或不寻常模式的机票订单数据,使得机票订单处理系统更精准地识别和处理异常情况,降低误报率。
在步骤103,获取所述订单数据延拓空间的延拓核,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量。
需要说明的是,本申请中,延拓核表示订单数据延拓空间的整体平均水平,具体实现时,获取订单数据延拓空间的延拓核,该延拓核可以根据订单数据延拓空间的位置中心确定,例如,假设订单数据延拓空间中所有机票订单数据的平均值,即位置中心为H,则延拓核取值可为H。
在一些实施例中,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量具体可采用下述方式,即:
对于所述订单数据延拓空间中每个机票订单数据,获取该个机票订单数据对应的奇异熵;
通过所述奇异熵和所述延拓核确定该个机票订单数据对应的数据漂移量,进而得到所述订单数据延拓空间中每个机票订单数据对应的数据漂移量。
需要说明的是,本申请中,数据漂移量是机票订单数据相对于订单数据延拓空间整体的偏移程度的量化值,数据漂移量越大,表示偏移程度越高,具体实现时,首先,将所有奇异熵按照奇异熵取值大小进行升序排序,然后,对于订单数据延拓空间中每个机票订单数据,获取该个机票订单数据对应的奇异熵,将该个机票订单数据对应的奇异熵与延拓核之间差值的绝对值作为该个机票订单数据对应的数据漂移量,进而可以得到每个机票订单数据对应的数据漂移量。
在步骤104中,根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量,基于所述异常订单特征量对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合。
优选的,在一些实施例中,参考图3所示,该图是本申请一些实施例中确定异常订单特征量的示例性流程图,本实施例中确定异常订单特征量可采用下述步骤实现:
首先,在步骤1041,确定所有数据漂移量中的最大数据漂移量,进而获取所述最大数据漂移量在所有数据漂移量中对应的序列位置;
其次,在步骤1042,确定所有奇异熵中的最大奇异熵;进而获取所述最大奇异熵在所有奇异熵中对应的序列位置;
最后,在步骤1043,由所述最大数据漂移量、最大数据漂移量对应的序列位置、所述最大奇异熵和所述最大奇异熵对应的序列位置确定异常订单特征量。
在上述实施例中,具体实现时,异常订单特征量可根据下述公式确定:
其中,σ表示异常订单特征量,n表示机票订单数据总数,γmax表示最大奇异熵,a表示最大奇异熵γmax对应的序列位置,κmax表示最大奇异熵,b表示最大奇异熵κmax对应的序列位置,需要说明的是,本申请中,异常订单特征量是用于异常识别的异常订单特征的数量,对于机票订单数据,其奇异熵和数据漂移量的越大,说明机票订单数据越异常,需要学习的异常特征的内在结构和空间分布越复杂,异常订单特征量就越大。
需要说明的是,基于数据漂移量和奇异熵,可以更精准地筛选出具有显著偏移和畸变的机票订单数据,得到异常订单特征量后,机票订单处理系统可以更加精准地选取需要重点关注的机票订单数据,减少对于普通机票订单数据的处理,提高了机票订单处理系统的处理效率。
在一些实施例中,基于所述异常订单特征量对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合具体可采用下述方式,即:
通过所述异常订单特征量确定空间聚类中心个数;
基于空间聚类中心个数对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合。
具体实现时,首先,异常订单特征量确定空间聚类中心个数,例如,如果异常订单特征量的取值为10,则可以确定空间聚类中心个数为10,然后,基于空间聚类中心个数对订单数据延拓空间进行空间聚类,得到异常订单特征集合,可以采用均值聚类算法进行空间聚类,得到多个异常订单数据簇,将所有异常订单数据簇的簇心的集合作为异常订单特征集合。
在步骤105,根据所述异常订单特征集合对待检测机票订单进行异常检测。
具体实现时,首先,获取所有待检测机票订单,确定每个待检测机票订单与异常订单特征集合的均值之间的距离,将该距离作为待检测机票订单的奇异值,该奇异值用于衡量待检测机票订单的异常程度,然后,通过异常订单特征量确定奇异阈值,需要说明的是,奇异值服从自由度为异常订单特征量σ值的卡方分布,即χ2(σ),通常将置信度假设为97.5%,则可以得到奇异阈值为当待检测机票订单yi对应的奇异值高于奇异阈值,即/>则判定待检测机票订单yi为异常机票订单数据,需要说明的是,根据奇异值大于奇异阈值的判定条件,能够快速定位并识别出异常机票订单数据,提高了异常识别的速度和效率。
本申请中,首先,对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间,可以将由不同大数据源的历史机票订单数据组成的数据空间变得更具有完整性和鲁棒性,订单数据延拓空间中的数据冗余更少,并且可以将关注点集中在最近的、更有参考价值的机票订单数据上,更精准地识别当前可能存在的机票订单异常情况,然后,获取订单数据延拓空间的二次中心距矩阵,由二次中心距矩阵确定订单数据延拓空间中每个机票订单数据对应的奇异熵,根据奇异熵可以表示机票订单数据的内在特征并找出订单数据延拓空间中具有异常特征的历史机票订单数据,使得机票订单处理系统可以更精准地识别和处理异常情况,其次,获取所述订单数据延拓空间的延拓核,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量,可以衡量出订单数据延拓空间中每个机票订单数据的距离数据中心的偏移程度和分布特性,进而,根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量,以获取准确的异常订单特征量,用于增加订单异常特征集合的完整性,最后,基于异常订单特征量对订单数据延拓空间进行空间聚类,得到异常订单特征集合,根据异常订单特征集合对待检测机票订单进行异常检测,可以在机票订单的数据处理过程中,获取准确的异常订单特征量用于机票订单异常识别,提高了机票异常识别的准确性。
另外,本申请的另一方面,在一些实施例中,本申请提供一种基于大数据的机票订单处理系统,该系统包括有机票订单处理单元,参考图4,该图是根据本申请一些实施例所示的机票订单处理单元的示例性硬件和/或软件的示意图,该机票订单处理单元400包括:延拓模块401、处理模块402和异常检测模块403,分别说明如下:
延拓模块401,本申请中延拓模块401主要用于对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间;
处理模块402,本申请中处理模块402主要用于获取所述订单数据延拓空间的二次中心距矩阵,由所述二次中心距矩阵确定所述订单数据延拓空间中每个机票订单数据对应的奇异熵;
所述处理模块402,还用于获取所述订单数据延拓空间的延拓核,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量;
所述处理模块402,还用于根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量,基于所述异常订单特征量对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合;
异常检测模块403,本申请中异常检测模块403主要用于根据所述异常订单特征集合对待检测机票订单进行异常检测。
上文详细介绍了本申请实施例提供的基于大数据的机票订单处理方法及系统的示例,可以理解的是,相应的装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在一些实施例中,本申请还提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于从所述存储器中调用并运行所述计算机程序,使得所述计算机设备执行上述的基于大数据的机票订单处理方法。
在一些实施例中,参考图5,该图中的虚线表示该单元或该模块为可选的,该图是根据本申请实施例提供的一种基于大数据的机票订单处理方法的计算机设备的结构示意图。上述实施例中的上述的基于大数据的机票订单处理方法可以通过图5所示的计算机设备来实现,该计算机设备500包括至少一个处理器501、存储器502以及至少一个通信单元505,该计算机设备500可以是终端设备或服务器或芯片。
处理器501可以是通用处理器或者专用处理器。例如,处理器501可以是中央处理器(central processing unit,CPU),CPU可以用于对计算机设备500进行控制,执行软件程序,处理软件程序的数据,计算机设备500还可以包括通信单元505,用以实现信号的输入(接收)和输出(发送)。
例如,计算机设备500可以是芯片,通信单元505可以是该芯片的输入和/或输出电路,或者,通信单元505可以是该芯片的通信接口,该芯片可以作为终端设备或网络设备或其它设备的组成部分。
又例如,计算机设备500可以是终端设备或服务器,通信单元505可以是该终端设备或该服务器的收发器,或者,通信单元505可以是该终端设备或该服务器的收发电路。
计算机设备500中可以包括一个或多个存储器502,其上存有程序504,程序504可被处理器501运行,生成指令503,使得处理器501根据指令503执行上述方法实施例中描述的方法。可选地,存储器502中还可以存储有数据(如目标审核模型)。可选地,处理器501还可以读取存储器502中存储的数据,该数据可以与程序504存储在相同的存储地址,该数据也可以与程序504存储在不同的存储地址。
处理器501和存储器502可以单独设置,也可以集成在一起,例如,集成在终端设备的系统级芯片(system on chip,SOC)上。
应理解,上述方法实施例的各步骤可以通过处理器501中的硬件形式的逻辑电路或者软件形式的指令完成,处理器501可以是中央处理器、数字信号处理器(digitalsignalprocessor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(fieldprogrammable gate array,FPGA)或者其它可编程逻辑器件,例如,分立门、晶体管逻辑器件或分立硬件组件。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
例如,在一些实施例中,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令或代码,当指令或代码在计算机上运行时,使得计算机执行时实现上述的基于大数据的机票订单处理方法。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种基于大数据的机票订单处理方法,其特征在于,包括如下步骤:
对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间;
获取所述订单数据延拓空间的二次中心距矩阵,由所述二次中心距矩阵确定所述订单数据延拓空间中每个机票订单数据对应的奇异熵;
获取所述订单数据延拓空间的延拓核,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量;
根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量,基于所述异常订单特征量对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合;
根据所述异常订单特征集合对待检测机票订单进行异常检测。
2.如权利要求1所述的方法,其特征在于,对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间具体包括:
将获取的不同大数据源的历史机票订单数据进行整合,得到机票订单数据域;
将飞行航距作为所述机票订单数据域的数据维度,得到机票订单数据空间;
确定所述机票订单数据空间的延拓极点和延拓极差;
根据所述延拓极点和延拓极差生成飞行航距扩展域;
根据所述航距扩展域对所述机票订单数据空间进行延拓,得到订单数据延拓空间。
3.如权利要求2所述的方法,其特征在于,确定所述机票订单数据空间的延拓极点和延拓极差具体包括:
获取所述机票订单数据空间中所有数据点,进而将所有数据点平均值作为所述机票订单数据空间的延拓极点;
获取所述机票订单数据空间的数据总数和数据维度;
通过所述机票订单数据空间的数据总数和数据维度确定所述机票订单数据空间的延拓极差。
4.如权利要求2所述的方法,其特征在于,根据所述飞行航距扩展域对所述机票订单数据空间进行延拓,得到订单数据延拓空间是指将飞行航距扩展域和所述机票订单数据空间进行合并得到的数据空间作为订单数据延拓空间。
5.如权利要求1所述的方法,其特征在于,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量具体包括:
对于所述订单数据延拓空间中每个机票订单数据,获取该个机票订单数据对应的奇异熵;
通过所述奇异熵和所述延拓核确定该个机票订单数据对应的数据漂移量,进而得到所述订单数据延拓空间中每个机票订单数据对应的数据漂移量。
6.如权利要求1所述的方法,其特征在于,根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量具体包括:
确定所有数据漂移量中的最大数据漂移量,进而获取所述最大数据漂移量在所有数据漂移量中对应的序列位置;
确定所有奇异熵中的最大奇异熵;进而获取所述最大奇异熵在所有奇异熵中对应的序列位置;
由所述最大数据漂移量、最大数据漂移量对应的序列位置、所述最大奇异熵和所述最大奇异熵对应的序列位置确定异常订单特征量。
7.如权利要求1所述的方法,其特征在于,基于所述异常订单特征量对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合具体包括:
通过所述异常订单特征量确定空间聚类中心个数;
基于空间聚类中心个数对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合。
8.一种基于大数据的机票订单处理系统,其特征在于,该基于大数据的机票订单处理系统包括有机票订单处理单元,所述机票订单处理单元包括:
延拓模块,用于对获取的不同大数据源的历史机票订单数据进行数据延拓,得到订单数据延拓空间;
处理模块,用于获取所述订单数据延拓空间的二次中心距矩阵,由所述二次中心距矩阵确定所述订单数据延拓空间中每个机票订单数据对应的奇异熵;
所述处理模块,还用于获取所述订单数据延拓空间的延拓核,通过所述延拓核确定所述订单数据延拓空间中每个机票订单数据对应的数据漂移量;
所述处理模块,还用于根据各个机票订单数据分别对应的数据漂移量和奇异熵,确定异常订单特征量,基于所述异常订单特征量对所述订单数据延拓空间进行空间聚类,得到异常订单特征集合;
异常检测模块,用于根据所述异常订单特征集合对待检测机票订单进行异常检测。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于从所述存储器中调用并运行所述计算机程序,使得所述计算机设备执行权利要求1至7中任一项所述的基于大数据的机票订单处理方法。
10.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令或代码,当指令或代码在计算机上运行时,使得计算机执行时实现如权利要求1至7中任一项所述的基于大数据的机票订单处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410148387.9A CN117952717A (zh) | 2024-02-02 | 2024-02-02 | 一种基于大数据的机票订单处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410148387.9A CN117952717A (zh) | 2024-02-02 | 2024-02-02 | 一种基于大数据的机票订单处理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117952717A true CN117952717A (zh) | 2024-04-30 |
Family
ID=90798167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410148387.9A Pending CN117952717A (zh) | 2024-02-02 | 2024-02-02 | 一种基于大数据的机票订单处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117952717A (zh) |
-
2024
- 2024-02-02 CN CN202410148387.9A patent/CN117952717A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200387785A1 (en) | Power equipment fault detecting and positioning method of artificial intelligence inference fusion | |
CN111796957B (zh) | 基于应用日志的交易异常根因分析方法及系统 | |
CN113837596B (zh) | 一种故障确定方法、装置、电子设备及存储介质 | |
CN113537337A (zh) | 训练方法、异常检测方法、装置、设备和存储介质 | |
CN113988458A (zh) | 反洗钱风险监控方法和模型训练方法、装置、设备及介质 | |
CN110909804B (zh) | 基站异常数据的检测方法、装置、服务器和存储介质 | |
CN113781767A (zh) | 一种基于多源感知的交通数据融合方法及系统 | |
CN113163353A (zh) | 一种电源车的智能健康服务系统及其数据传输方法 | |
CN116414815A (zh) | 数据质量检测方法、装置、计算机设备和存储介质 | |
CN113487223B (zh) | 一种基于信息融合的风险评估方法和评估系统 | |
CN114722947A (zh) | 一种基于近邻搜索分簇的电力调度监控数据异常检测方法 | |
CN114418189A (zh) | 水质等级预测方法、系统、终端设备及存储介质 | |
CN112163019B (zh) | 基于区块链的可信电子批记录处理方法及区块链服务平台 | |
CN116365519B (zh) | 一种电力负荷预测方法、系统、存储介质及设备 | |
CN113472860A (zh) | 大数据和数字化环境下的业务资源分配方法及服务器 | |
CN117036732A (zh) | 一种基于融合模型的机电设备检测系统、方法及设备 | |
CN109636194B (zh) | 一种输变电项目重大变动多源协同检测方法与系统 | |
CN116383645A (zh) | 一种基于异常检测的系统健康度智能监测评估方法 | |
CN111252019A (zh) | 电动车安全行驶检测方法、车载检测器及车载检测系统 | |
CN117952717A (zh) | 一种基于大数据的机票订单处理方法及系统 | |
CN111882135B (zh) | 一种物联网设备入侵检测方法及相关装置 | |
CN115278757A (zh) | 一种检测异常数据的方法、装置及电子设备 | |
CN115348190A (zh) | 一种物联网设备检测方法、系统和设备 | |
CN111798237B (zh) | 基于应用日志的异常交易诊断方法及系统 | |
CN111654853B (zh) | 一种基于用户信息的数据分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |