CN117349769A - 面向服装物流管理的时空数据异常检测方法及系统 - Google Patents
面向服装物流管理的时空数据异常检测方法及系统 Download PDFInfo
- Publication number
- CN117349769A CN117349769A CN202311202702.3A CN202311202702A CN117349769A CN 117349769 A CN117349769 A CN 117349769A CN 202311202702 A CN202311202702 A CN 202311202702A CN 117349769 A CN117349769 A CN 117349769A
- Authority
- CN
- China
- Prior art keywords
- data
- space
- prediction model
- time
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 80
- 238000000034 method Methods 0.000 claims abstract description 71
- 238000007781 pre-processing Methods 0.000 claims abstract description 29
- 230000005856 abnormality Effects 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 32
- 230000002159 abnormal effect Effects 0.000 claims description 31
- 238000013528 artificial neural network Methods 0.000 claims description 23
- 238000007726 management method Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 125000004122 cyclic group Chemical group 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 238000012384 transportation and delivery Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 description 22
- 239000011159 matrix material Substances 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000013507 mapping Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000002547 anomalous effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013450 outlier detection Methods 0.000 description 3
- 238000010967 transthoracic echocardiography Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0833—Tracking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Remote Sensing (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种面向服装物流管理的时空数据异常检测方法及系统,获取一定数量服装物流的时空数据;对时空数据进行数据预处理得到预处理数据,基于预处理数据构建训练集;构建轨迹预测模型;将训练集输入轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型;将待预测的物流数据输入训练好的预测模型,得到预测值;计算预测值与真实值的差值绝对值,基于多个差值绝对值构建差值数据集;构建改进VAE模型;将差值数据集输入改进VAE模型,进行异常检测得到时空数据的异常检测结果。该面向服装物流管理的时空数据异常检测方法解决现有技术中无法兼顾在获取用户短期轨迹动向和轨迹驻点预测的同时还能获取当前轨迹异常性的问题。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种面向服装物流管理的时空数据异常检测方法、系统、电子设备及存储介质。
背景技术
伴随着互联网的迅速发展,传统服装行业的经营模式和市场格局受到了巨大的冲击,为了满足消费者的消费需求,服装企业迅速转型;伴随着服装对运输时效性的严苛要求,物流运输公司在成本控制和货运监控方面需要整合承运车辆运力配载,引导承运人路线规划,及时检测货运异常情况,降低运输成本,以便实现更好的运输服务。
通过采取适当的出行决策,运输供应商可以为运输用户提高运输系统的可靠性。但是,现有的轨迹检测技术一般局限于预测的短期轨迹动向或轨迹驻点二者之一,无法兼顾对二者同时进行预测分析。现有的异常轨迹检测方法主要依据的是局部轨迹相比正常轨迹的偏移程度对异常进行度量,并没有考虑局部轨迹与驻点或时空风险点间的联系。
因此,亟需一种能够兼顾用户短期轨迹动向及轨迹驻点的预测,同时还能当前轨迹异常性的技术方案。
发明内容
本发明实施例的目的在于提供一种面向服装物流管理的时空数据异常检测方法、系统、电子设备及存储介质,用以解决现有技术中无法兼顾在获取用户短期轨迹动向和轨迹驻点预测的同时还能获取当前轨迹异常性的问题。
为实现上述目的,本发明实施例提供一种面向服装物流管理的时空数据异常检测方法,所述方法具体包括:
获取一定数量服装物流的时空数据;
对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集;
构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;
将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型;
将待预测的物流数据输入训练好的预测模型,得到预测值;
计算所述预测值与真实值的差值绝对值,基于多个所述差值绝对值构建差值数据集;
构建改进VAE模型,其中,所述改进VAE模型包括VAE模型、重编码器和约束网络;
将所述差值数据集输入所述改进VAE模型,进行异常检测得到所述时空数据的异常检测结果。
在上述技术方案的基础上,本发明还可以做如下改进:
进一步地,所述对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集,包括:
对所述时空数据进行筛选获得无用数据,对所述无用数据进行清洗;其中,所述无用数据包括未送达货物的数据、小概率影响运送的数据、极短程的数据;
将所述时空数据划分为空间数据和时间数据,对所述空间数据和时间数据进行预处理;
获取所述时空数据的缺失值,并对所述缺失值进行填补。
进一步地,所述构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件,包括:
在所述轨迹预测模型设置观测值的阈值,当观测值超过所述阈值时,所述观测值为异常值;
获取异常值出现的时间信息和空间位置信息,基于所述时间信息和空间位置信息获得所述异常值的出现原因。
进一步地,所述构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件,还包括:
通过嵌入方法将每个分类属性转换为低维实向量,通过嵌入方法在不同的轨迹中发现和共享相似的模式;
将所述嵌入向量与旅行距离进行连接得到连接结果,将所述连接结果作为所述属性组件的输出。
进一步地,所述构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件,还包括:
所述时空学习组件包括地理卷积神经网络和循环神经网络;
通过所述地理卷积神经网络将原始GPS序列转换为一系列特征地图;
通过所述循环神经网络学习所述特征地图的时间相关性。
进一步地,所述构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件,还包括:
通过多任务损失函数同时估计每个局部路径和整个路径的旅行时间,平衡个体估计和集体估计之间的权衡;
在所述轨迹预测模型中设置多因素注意机制,通过所述多因素注意机制基于不同局部路径的隐藏表示和外部因素来学习不同局部路径的权重。
进一步地,所述将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型,包括:
将所述时空数据划分为训练集、验证集和测试集;
基于所述训练集训练所述轨迹预测模型,在所述训练集输入所述轨迹预测模型之前,对所述训练集中的预处理数据进行特征缩放,采用归一化过程将输入的预处理数据归一化到[0,1]范围内;
基于所述验证集对训练后的所述轨迹预测模型进行性能评估,得到满足性能条件的轨迹预测模型;
基于所述测试集评估满足性能条件的所述轨迹预测模型的预测结果,得到所述轨迹预测模型所对应的评价指数。
一种面向服装物流管理的时空数据异常检测系统,包括:
获取模块,用于获取一定数量服装物流的时空数据;
预处理模块,用于对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集;
轨迹预测模型,将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型,将待预测的物流数据输入训练好的预测模型,得到预测值;其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;
计算模块,用于计算所述预测值与真实值的差值绝对值,基于多个所述差值绝对值构建差值数据集;
改进VAE模型,将所述差值数据集输入所述改进VAE模型,进行异常检测得到所述时空数据的异常检测结果;其中,所述改进VAE模型包括VAE模型、重编码器和约束网络。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述方法的步骤。
一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述方法的步骤。
本发明实施例具有如下优点:
本发明中面向服装物流管理的时空数据异常检测方法,获取一定数量服装物流的时空数据;对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集;构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型;将待预测的物流数据输入训练好的预测模型,得到预测值;计算所述预测值与真实值的差值绝对值,基于多个所述差值绝对值构建差值数据集;构建改进VAE模型,其中,所述改进VAE模型包括VAE模型、重编码器和约束网络;将所述差值数据集输入所述改进VAE模型,进行异常检测得到所述时空数据的异常检测结果,解决了现有技术中无法兼顾在获取用户短期轨迹动向和轨迹驻点预测的同时还能获取当前轨迹异常性的问题。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引申获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。
图1为本发明面向服装物流管理的时空数据异常检测方法的流程图;
图2为本发明面向服装物流管理的时空数据异常检测系统的第一架构图;
图3为本发明提供的电子设备实体结构示意图。
其中附图标记为:
获取模块10,预处理模块20,轨迹预测模型30,计算模块40,改进VAE模型50,电子设备60,处理器601,存储器602,总线603。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
图1为本发明面向服装物流管理的时空数据异常检测方法实施例流程图,如图1所示,本发明实施例提供的一种面向服装物流管理的时空数据异常检测方法包括以下步骤:
S101,获取一定数量服装物流的时空数据;
具体的,从服装生产厂家获取货物数量等数据,从与服装厂合作的物流公司获取之前货物的配送时间和路径以做物流数据预测,并且在运送完成后得到运送的真实用时以和预测做对比。
S102,对时空数据进行数据预处理得到预处理数据,基于预处理数据构建训练集;
具体的,对所述时空数据进行筛选获得无用数据,对所述无用数据进行清洗;其中,所述无用数据包括未送达货物的数据、小概率影响运送的数据、极短程的数据;
对于特殊情况下产生的数据可以理解为无用数据,这种数据应该被清洗掉以保证总体预测的准确性。以下情况下的数据是应该去除的:
第一种,未送达货物的数据。在货物运输的过程中会出现诸如订单取消,运输中断等情况,在这种情况下货物可能不会被送到目的地。像这种未送达货物的数据其并不具有参考价值,应该被去除以保证模型预测的准确性。
第二种,小概率影响运送的数据。这里的小概率出现的影响运送的数据是指飓风、大型冰雹、沙尘暴等极端天气事件。这种极端天气一般是短时间内出现且难以预测,在出现后会造成交通情况变化影响物流信息预测。
第三种,极短程的数据。像是同城运输甚至是同区运输的时候,司机状态、城市活动等影响较小的因素就可能被放大,成为决定此次物流的关键因素,这对于物流预测来说是不利的,不应该被保留。
将所述时空数据划分为空间数据和时间数据,对所述空间数据和时间数据进行预处理;获取所述时空数据的缺失值,并对所述缺失值进行填补。
S103,构建轨迹预测模型,其中,轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;
具体的,在所述轨迹预测模型设置观测值的阈值,当观测值超过所述阈值时,所述观测值为异常值;
获取异常值出现的时间信息和空间位置信息,基于所述时间信息和空间位置信息获得所述异常值的出现原因。
通过嵌入方法将每个分类属性转换为低维实向量,通过嵌入方法在不同的轨迹中发现和共享相似的模式;
将所述嵌入向量与旅行距离进行连接得到连接结果,将所述连接结果作为所述属性组件的输出。
所述时空学习组件包括地理卷积神经网络和循环神经网络;
通过所述地理卷积神经网络将原始GPS序列转换为一系列特征地图;
通过所述循环神经网络学习所述特征地图的时间相关性。
通过多任务损失函数同时估计每个局部路径和整个路径的旅行时间,平衡个体估计和集体估计之间的权衡;
在所述轨迹预测模型中设置多因素注意机制,通过所述多因素注意机制基于不同局部路径的隐藏表示和外部因素来学习不同局部路径的权重。
轨迹预测模型是物流的时空数据异常检测,因此分别对空间数据和时间数据两种数据进行预处理;
空间数据从GPS数据中获得,将之前的物流轨迹定义为T,它是连续的GPS点的序列,T={p1,…,p|T|}1。每个GPS点pi包含:纬度(pi·lat)、经度(pi.lng)和时间戳(pi.ts);
时间数据由物流公司给出,每次物流的出发时间,到达时间。
此外,对于每个轨迹,记录轨迹的外部因素,如开始时间(timeID)、星期几(weekID)、天气状况(weatherID)和相应的驾驶员(driverID)。
此外,针对丢失数据的恢复提出了一种插值数据处理过程,对GPS系统中的缺失数据进行了校正。通过替换附近数据点的加权平均值来恢复丢失的数据。
假设第i-1条和第i+1条记录之间存在数据通信缺失区域,假设错过了第i条数据记录。如果i-1和i+1数据之间的传输速度为常数,第i个位置可以通过插值两个观测数据(i-1和i+1数据记录)之间的距离来确定。为了估计到第i个位置的货物到达时间,用下式:
i-1数据与i+1数据之间的距离用di-1,i+1表示。tGPS i表示第i个数据的GPS记录时间。根据这个表示法,建立如下关系式:
di-1,i+1=di-1,i+di,i+1
整体模型的架构,主要由三个组件组成:属性组件、时空学习组件和多任务学习组件。属性组件用于处理外部因素(天气、星期等)和给定路径的基本信息(开始时间、结束时间等)。它的输出作为输入的一部分提供给其他组件。时空学习组件是主要的预测组件,它从原始GPS位置序列中学习空间相关性和时间依赖性。最后,多任务学习组件基于前两个组件估计给定路径的旅行时间,能够平衡个体估计和集体估计之间的权衡。
首先,构造模型中的过程节点和状态节点。然后,构建基本关系:流程和状态之间的包含关系,以及状态和网格单元之间的关系。
还要建立用于构建事件、网格和拥塞路由之间的关系。根据空间连接操作结果过滤后的拥堵中心网格与出租车状态之间的“包含对象”关系,得到物流网格单元中的车辆集合,基于拓扑包含,可以很容易地构建POI与网格之间的关系。
道路的行驶时间受到许多复杂因素的影响,设计了一个简单而有效的组件来将这些因素合并轨迹预测模型中,属性组件包含了出发时间、星期几、天气状况以及驾驶习惯。使用weatherID、driverID、weekID和timeID分别表示这些属性。但是这些因子是分类值,不能直接馈送给神经网络。在轨迹预测模型中,使用嵌入方法将每个分类属性转换为低维实向量。具体来说,嵌入方法通过将参数矩阵W∈RV×E,将每个类别值v∈[V]映射到一个实空间RE×1(称这样的空间为嵌入空间)。其中V表示原始范畴值的词汇量大小,E表示嵌入空间的维数。通常,有E<<V。
除了嵌入属性外,还进一步纳入了另一个重要属性,即旅行距离。形式上,用表示从GPS点pa到pb沿路径的总距离,即/> 其中Dis是两个GPS点之间的地理距离。然后,将得到的嵌入向量与旅行距离Δdp1→p|T|连接在一起。连接被用作属性组件的输出。将这样的输出向量表示为attr。
时空成分由两部分组成。第一部分是一个地理卷积神经网络,它将原始GPS序列转换为一系列特征地图。该分量捕获连续GPS点之间的局部空间相关性。第二部分是循环神经网络,它学习所获得的特征图的时间相关性。
首先将数据输入Geo-Conv层。历史轨迹T是GPS定位点{p1,…,p|T|},其中每个包含相应的经度/纬度。捕获GPS序列中的空间依赖关系对于旅行时间估计至关重要。典型的卷积层由几个卷积滤波器组成,对于多通道输入图像,滤波器通过对每个二维局部补丁应用卷积操作来学习输入中的空间依赖关系。提到Geo-Conv层,该层能够捕获地理位置序列中的空间依赖关系,同时保留精细粒度的信息,如下式。
将第i个GPS坐标映射为向量位点loci∈R16,其中表示拼接操作,Wloc为可学习的权重矩阵。因此,输出序列loc∈R16×|T|表示非线性映射的位置。这样的序列可以看作是一个16通道的输入,每个信道描述了原始GPS序列的地理特征。引入一个卷积滤波器,其参数矩阵Wconv∈Rk×16(将k作为滤波器的核大小)。它在序列loc上应用卷积运算,以及一维滑动窗口。用*表示卷积运算,其输出的第i维表示为:
其中b为偏置项,loci:i+k-1为loc中从指标i到指标i+k-1的子序列,σcnn为对应的激活函数。
因此,基本上捕获了第i个局部路径的空间特征。通过连接c个滤波器的输出,得到了形状为Rc×(|T|-k+1)的局部路径的特征图。最后,引入了一个多任务学习组件,该组件结合了前面的组件,并估计输入路径的旅行时间。之前在估计旅行时间方面的工作可以分为两个类型,个人估计和集体估计。如果采用个体估计,由于该方法没有考虑局部路径之间的时空依赖性,可能会导致局部误差的累积。同时,如果使用集合估计,通常会面临数据稀疏性问题,因为只有少数轨迹穿过整个路径或较长的子路径。
在轨迹预测模型中,将这两种方法与的多任务学习组件结合起来。在训练阶段,强制多任务学习组件,以同时准确估计整个路径和每个局部路径的旅行时间。在测试阶段,消除了局部路径估计部分,并报告整个路径的估计行程时间。
使用时空分量来获得序列{h1,h2,…,h|T|-k+1}。这里每个hi对应于局部路径pi→pi+1→…→pi+k-1的时空特征。
简单地使用两个大小为64和1的堆叠全连接层来将每个hi映射到一个标量ri。其中ri表示第i条局部路径的行进时间。
时空特征序列{hi}的长度也是可变的。为了直接估计整个路径的旅行时间,首先需要将特征序列转换为固定长度的向量。实现这一点的一个简单方法是使用均值池,即:
平均池化方法对所有时空特征一视同仁。但是,准确估计行程时间的不确定性通常是由几个关键的局部路径引起的。如果路径包含多个十字路口、红绿灯或可能非常拥挤的路段,它们比较难以估计。基于此,在轨迹预测模型中,采用了注意力机制来代替均值池。注意力机制本质上是序列{hi}的加权和,其中权重是模型学习到的参数。
其中αi是第i个局部路径的权值,所有αi的和等于1。为了学习权重参数α,考虑局部路径的空间信息,以及开始时间、星期几和天气状况等外部因素。
在轨迹预测模型中,属性分量中的向量attr捕捉外部因素的影响,特征序列{hi}捕捉局部路径的时空特征。因此,设计基于attr和{hi}的注意机制:
zi=<σatt(attr).hi>
其中<>是内积算子,σatt是一个非线性映射,它将attr映射到与hi。
最后,将hatt传递给几个大小相等的完全连接的层。全连接层通过残差连接连接。剩余连接在不同层之间添加了“快捷方式”。因此,之前的信息流可以通过快捷方式跳过一个或多个非线性层,而被跳过的层只需要学习非线性映射的“残差”。
用表示第i个剩余全连通层。对于第一层,该层的输出为/>对于剩余的全连通层,假设第i层的输出为x,则第(i+1)层的输出可表示为x⊕σfi+1(x),其中⊕是逐个元素的加法操作,这种方法训练带有剩余连接的神经网络更容易,也更健壮。最后,使用单个神经元来获得整个路径的估计,将其记为ren。
在轨迹预测模型中还有异常值检测部分,异常值检测用于识别和去除明显不一致的观测值。替换异常值有助于提高模型的性能,并最大限度地减少输出中噪声的影响。任何参数的离群值检测的第一步是为该参数设置阈值。超过这个阈值的观测值被认为是异常值。基于密度的聚类被认为是一种改进的异常值识别方法,因为它考虑了数据集中点的接近性。DBSCAN(Density-Based Spatial Clustering of Application with Noise)是将数据集划分为核心数据点或边界数据点的过程。DBSCAN将异常值分为eps(epsilon-邻域点的距离测量)和MinPts(最小值点的阈值)。使用DBSCAN方法检测到物流数据集中观测值中的一些极端值为异常值,这可能是由于设备测量错误造成的。但是,由于这些异常值会影响预测结果,使用DBSCAN方法来检测货物运送中的异常值,并用其主要公式如下。
Nε(p)={q∈D|dist(p,q)≤ε}
其中,Nε(p)表示样本点p的ε-邻域,D表示数据集,dist(p,q)表示样本点p和样本点q之间的距离,ε表示半径。用于定义样本点的邻域,即距离某个样本点在半径ε内的样本点集合。
p→q,if q∈Nε(p)and|Nε(p)|≥MinPts
其中,p和q分别表示两个样本点,Nε(p)表示样本点p的ε-邻域,|Nε(p)|表示样本点p的ε-邻域中的样本点数量。通过这个方式可以很好的进行区分。
一般在进行物流数据预测时主要是分为两种方式,个体预测与整体预测。个体TTE,首先将路径划分为几个路段,然后估计每个局部路径的旅行时间,最后将它们相加得到总旅行时间。集体TTE,直接估计整个路径的行程时间。尽管个体TTE方法可以估计每个路段的准确行驶时间,但它不能模拟整个路径内的复杂交通状况,包括道路十字路口、红绿灯和方向转弯。此外,如果给定路径上有许多路段,局部误差可能会累积。因此,本模型提出了一个多任务组件,它学会通过多任务损失函数同时估计每个局部路径和整个路径的旅行时间,能够平衡个体和集体估计之间的权衡。为了准确估计整个路径,设计了一种多因素注意机制,根据不同局部路径的隐藏表示和外部因素来学习不同局部路径的权重。
将出发时间,星期几等属性使用嵌入方法进行转换。与onehot编码相比,嵌入方法主要有两个优点。首先,由于类别值的词汇量可能非常大,嵌入方法有效地降低了输入维数,从而提高了计算效率。此外,有研究表明,具有相似语义的类别值通常嵌入到接近的位置。因此,嵌入方法有助于在不同的轨迹中发现和共享相似的模式。
在之前对于数据中的缺失值,一般都是将其作为无用数据删除,但是这样会降低数据的利用率,因此提出了一种填补缺失值的数据预处理过程,将丢失数据填补,这样可以增强数据的完整性,同时增加了数据量。这种数据填补也能够一定程度上增加数据的质量,节省了再度采集数据的成本,有助于数据集的建立。
在输入数据进入模型之前要进行特征缩放。特征缩放是神经网络中的一种重要方法,它可以使数据集的输入更有效地进行预测。在LSTM模型中,使用了一个归一化过程来进行特征缩放。当输入值很大时,多层前馈神经网络的隐层中会出现sigmoid函数,导致梯度变小,减慢训练过程。因此,采用归一化过程将输入归一化到[0,1]范围内。由于输入值变化很大,使用以下算法将范围保持在[0,1]:
其中Nnormalized为特征缩放后对应观测值的归一化值,n为观测值,nmax和nmin为观测值的最大值和最小值。
在轨迹预测模型设计中考虑到了异常值检测的问题,进行异常值检测不仅可以使轨迹预测模型处理性能提升,增加其数据预测的质量,更重要的是反馈到物流企业来帮助他们发现问题,让他们可以根据反馈回来的异常值出现的时间,空间位置来有针对性的检查为什么会出现异常值,这样就可以对问题进行更正,以保证物流更加安全,准时,节省运货成本。
在许多异常检测方法中,服装物流管理异常检测技术试图找到原始数据的低维嵌入,其中异常和正常数据预期彼此分离。在找到那些较低维度的嵌入之后,它们被带回原始数据空间,这被称为原始数据的重建。通过使用低维表示重建数据,获得数据的真实性质,而没有不感兴趣的特征和噪声。数据点的重建误差(原始数据点与其低维重建之间的误差)被用作检测异常的异常分数。自动编码器还用于通过堆叠层来形成深度自动编码器来执行降维。通过减少隐藏层中的单元数量,预计隐藏单元将提取很好地表示数据的特征。此外,通过堆叠自动编码器,可以以分层方式应用降维,在更高的隐藏层中获得更抽象的特征,从而更好地重建数据。
S104,将训练集输入轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型。
具体的,将所述时空数据划分为训练集、验证集和测试集;
基于所述训练集训练所述轨迹预测模型,在所述训练集输入所述轨迹预测模型之前,对所述训练集中的预处理数据进行特征缩放,采用归一化过程将输入的预处理数据归一化到[0,1]范围内;
基于所述验证集对训练后的所述轨迹预测模型进行性能评估,得到满足性能条件的轨迹预测模型;
基于所述测试集评估满足性能条件的所述轨迹预测模型的预测结果,得到所述轨迹预测模型所对应的评价指数。
在训练阶段,使用平均绝对百分比误差(MAPE)作为目标函数。由于MAPE是一个相对误差,可以强制模型为短路径和长路径提供准确的结果。然而,使用多个标准来评估轨迹预测模型,包括均方根误差(RMSE)和平均绝对误差(MAE)。在训练阶段,同时估计所有局部路径和整个路径的旅行时间。
对于局部路径估计,将相应的损耗定义为所有局部路径的平均损耗,即:
其中∈是一个小常数,以防止分母接近0时损失值爆炸(设置∈为10秒)。对于整个路径,定义相应的损耗为:
Len=|ren-(p|T|.ts-p1.ts)|/(p|T|.ts-p1.ts)
轨迹预测模型被训练为最小化两个损失项的加权组合
β·Llocal+(1-β)·Len
其中β是线性平衡Llocal和Len之间权衡的组合系数。默认情况下,在测试阶段,使用整个路径的旅行时间估计ren作为最终估计。
使用平均绝对百分比误差(MAPE)、均方根误差(RMSE)和平均绝对误差(MAE)来评价轨迹预测模型。MAPE是以百分比的形式表示预测误差的指标,其公式为:
MAPE=(1/n)*Σ(|(Ytrue-Ypred)/Ytrue|)*100%
RMSE是衡量预测值与真实值之间误差的平均值的指标,其公式如下:
RMSE=sqrt((1/n)*Σ((Ytrue-Ypred)^2))
MAE是以绝对值的形式表示预测误差的指标,公式如下:
MAE=(1/n)*Σ(|Ytrue-Ypred|)
以上三式中的,Ytrue是真实值,Ypred是预测值,n是样本数量。这些指标都是用于衡量预测模型的预测误差大小的指标,能够非常直观地看出模型预测结果是否达到要求,同时也方便了与其他模型的实验结果对比。
S105,将待预测的物流数据输入训练好的预测模型,得到预测值;
S106,计算预测值与真实值的差值绝对值,基于多个差值绝对值构建差值数据集;
S107,构建改进VAE模型,其中,改进VAE模型包括VAE模型、重编码器和约束网络;
具体的,目前已经提出了许多基于深度学习的异常值检测算法,通常可以获得比传统方法更好的检测结果。考虑到模型的重构能力和异常评分的计算,使用一种基于变分自编码器模型(VAE)与重编码器和潜在约束网络的时间序列异常检测方法(VELC)。为了修改模型的重构能力,使其无法很好地重构异常样本,在VAE的潜在空间中增加了一个约束网络,迫使其生成与训练样本相似的新潜变量。为了能够在两个特征空间中计算异常分数,训练了一个重新编码器来将生成的数据转换到一个新的潜在空间。使用LSTM作为VAE框架的编码器和解码器部分更好地处理时间序列。
基于VAE的带有重编码器和潜在约束网络的时间序列异常检测方法,称为VELC,VELC为改进VAE模型。改进VAE模型在VAE的架构中增加了一个重新编码器来获得新的潜在向量,这种更复杂的架构可以优化原始空间和潜在空间的重建误差,从而准确地对正常样本进行建模。
此外,该算法可以同时在原始空间和潜在空间两个特征空间中计算异常分值,比仅在原始空间中计算异常分值具有更高的精度。此外,为了防止模型很好地重构一些未经训练的异常样本,在原始VAE的潜在空间中增加了一个约束网络,迫使其生成与训练样本相似的新的潜变量,这可以平衡模型区分正常和异常数据的能力。在训练阶段,约束网络与原始VAE网络同时训练,试图提取训练(正常)数据的潜在向量特征。在测试阶段,该网络将由VAE的潜伏分布得到的潜伏向量映射为新的潜伏向量,使新的潜伏向量与训练数据对应的潜伏向量相似。由于时间序列通常是高维的且具有复杂的时间相关性,原有的VAE模型无法很好地对时间序列进行建模,因此使用LSTM作为VAE框架的编码器和解码器部分对正常时间序列进行建模。
变分自动编码器(VAE)是一种无监督的深度学习生成模型,它可以对训练数据的分布进行建模。它来自贝叶斯推理,由一个编码器、潜在分布和一个解码器组成。其原理是一个简单的分布(如高斯分布),具有已知的参数和重叠的特征,通过结合神经网络,理论上可以拟合任何分布。模型的正向传播过程如下:输入样本X经过编码器得到潜在空间分布的参数。在电流分布中采样得到潜变量z,然后用z通过解码器生成重构样本。经过一系列的推导、化简和变分推理,VAE的损失函数可以写成:
在VAE的前向传播中,有一个从分布中采样的步骤。显然,“采样”过程是不可微分的,因此在VAE中使用了一种称为“重参数”的方法。由于高斯分布的叠加,计算后的样本相当于从特定分布参数对应的分布中采样。对于整个模型,从标准正态分布得到的样本可视为一个常数,且该常数的计算过程是可微的,使整个模型可以进行正态反向传播。VAE和自动编码器之间的主要区别在于,VAE是一个随机生成模型,可以给出校准的概率,而自动编码器是一个不具有概率基础的确定性判别模型。
长短期记忆网络(Long Short Term Memory networks,简称LSTMs)是一种特殊的循环神经网络(recurrent neural network,RNN),能够学习序列数据的长期依赖关系。LSTM被明确设计为避免长期依赖问题。长时间记住信息实际上是它们的默认行为,而不是它们努力学习的东西。LSTM的结构与RNN相同,是重复某个神经网络模块(单元)的链式结构。不同之处在于LSTM的每个单元内部由四个部分组成:遗忘门、输入门、状态更新门和输出门。每个门都有自己的权重、偏置和激活函数。在实际的序列数据中,当前数据点的值可能不仅与之前的一些数据点的值有关,还可能与之后的一些数据点的值有关。因此提出了双向LSTM网络,即两个LSTM网络相互叠加。对于要训练的某一序列,其中一个序列正向输入,另一个序列反向输入,然后将两个结果组合成下式,其中Ot为最终输出,和/>代表两个简单LSTM的隐藏层。
通过生成模型的重构误差来检测时间序列的异常,并且该模型是用正常数据训练的,这意味着对于正常数据模型的重构误差相对较小,而对于异常数据模型的重构误差较大。改进VAE模型是基于具有重编码器和潜在约束网络的VAE,由原始VAE的编码器和解码器,重新编码器和约束网络这四部分组合,对正常数据具有较好的建模能力。为了提取时间序列的特征,编码器、解码器和重编码器都使用双向LSTM网络。
重构样本X'通过重编码器网络生成新的潜在空间参数μ'和σ',从新的潜在空间参数对应的分布中采样新的潜在变量re_z,其维数与潜在变量z相同。重编码器网络的主要目的如下:增加重编码器网络的VAE具有更多的参数和复杂的模型结构,这意味着整个模型可以提取更多的数据特征,包括原始潜在空间和新潜在空间的特征。与度量学习类似,通过优化原始空间和潜在空间的重构误差,以一定形式直接对正态样本进行精确建模任务。以往一些基于模型的异常检测方法使用网络中间层的输出作为数据的特征向量,得到了比使用全网输出更好的结果,因此增加重编码器的VAE可以提高基于模型的异常检测性能。此外,带有额外重新编码器网络的VAE可以计算异常分数在两个特征空间(原始空间和潜在空间)中,都有比仅在原始空间中具有更高的精度。
对于包括VAE在内的生成模型基于重构误差的异常检测方法,可能导致异常检测失败的原因有两个:1)模型没有很好地重构正常样本,这意味着正常样本的重构误差较大;2)模型对异常样本的重构效果很好,这意味着该异常样本的重构误差相对较小。由于VAE是由正态样本训练来模拟训练数据的分布,而不是训练数据本身,其目标是在整个训练阶段减少对正态样本数据的重构误差,因此具有较强的数据重构能力。但如果使用VAE进行异常检测,这种强大的能力可能会使模型很好地重构未经训练的异常样本,这意味着输入样本中的一些异常很可能由于其重构误差较小而无法被检测到。考虑到原有VAE网络的结构,为了限制模型重构异常数据的能力,在潜分布采样后增加了一个约束网络,约束网络可以看作是一个类似编码器和解码器网络的额外的特殊网络。虽然约束网络是一个简单的神经网络,但它相当于使解码网络更加复杂。
受稀疏自编码器的启发,有一些约束网络的附加规则。将约束网络设为一个矩阵C∈(zdim,N),矩阵zdim的行数等于潜在向量z的维数,矩阵N的列数作为模型的一个参数,矩阵的每个元素被整个模型视为一个训练过的参数。在训练阶段,模型由正常样本训练,因此模型的每一行都可以看作是正常样本潜在向量的“特征向量”或“代表向量”。在训练或检测阶段,对于采样后得到的每个样本的潜变量z,计算矩阵C的每一行向量之间的余弦相似度,将得到每个z的几个表示系数,记为向量w。
C=(c1,c2,…,cN),
W=(ω1,ω2,…,ω3)
在得到向量W后,将其中的每个元素归一化为了防止异常样本的潜在向量被多个矩阵的复杂组合C重构,在归一化的ω上加入一个稀疏约束。如果ω中的一个元素小于给定的阈值,则设为0,如果大于阈值,则保留。最后,使用矩阵C和w中的每一行的线性组合作为组合系数来计算一个新的约束潜在向量/>
在训练过程中,用正态样本训练模型,并定义损失函数由三部分组成。第一部分是原始VAE的损失函数,它用于减少原始数据与重构数据在原始空间中的L2距离,使模型的分布尽可能接近训练数据的分布。称这两种损耗为重构损耗和KL损耗1。
Lrec_x=∥X-X'∥2
第二部分是重编码器的损失函数。根据原始VAE的损失理论,为重编码器网络设计了一个loss函数,该函数与原始VAE的第二项损失函数相同。
第三部分是隐向量的误差。利用重编码器将生成的数据重新映射到新的潜在空间,并计算两个潜在向量之间的L2距离。
Llat=∥Z-Z'∥2
对于整个模型,损失函数可以描述为:
LVELC=Lrec_x+LKL_1+Llat+LKL_2
在检测阶段,给定输入样本X=[x1,x1,…,x1]∈RN时,改进VAE模型可以生成与训练数据分布相似的新的序列数据。当改进VAE模型遇到异常样本时,会生成一个重构样本X',重构样本X'与原始数据分布有明显差异,并且异常样本在编码器得到的潜在向量z'与重新编码器得到的新潜在向量re_z'之间存在较大差异。因此,可以设计一种新的方法来计算时间序列的异常得分。其判据是,如果一个输入样本的重构误差和两个潜在空间之间的误差较大,则该样本更有可能是异常样本。异常评分A(xi)定义如下:
A(xi)=α∥x-x'∥1+β∥z'-re_z'∥1
其中α和β是约束罚项的参数,α+β=1,α>0,β>0。样本的异常得分越大,表示生成的样本偏离输入数据,即样本越异常。为了保证算法的鲁棒性和发现不同时间序列中的异常,需要将异常评分正则化到[0,1]的范围内,并设置阈值φ。
其中A(xi)'为正则化异常得分。数据越异常,异常分值越大,越接近1。
变分自动编码器是一种将变分推理与深度学习相结合的概率图形模型。因为VAE以概率上合理的方式减小尺寸,所以理论基础是坚定的。VAE相对于自动编码器和PCA的优势在于它提供概率测量而不是重建误差作为异常分数,称之为重建概率。概率比重建误差更具原则性和客观性,并且不需要模型特定阈值来判断异常。
VELC模型在VAE的体系结构中增加了一个重编码器来获取新的潜在向量,这种更复杂的体系结构可以优化原始空间和潜在空间的重建误差,从而准确地对正态样本进行建模。此外,它可以同时计算两个特征空间(原始空间和潜在空间)的异常分数,比只计算原始空间的异常分数具有更高的精度。与预测模型相比,生成模型可以对训练数据的分布进行建模,而不是对训练数据本身进行建模,因此生成模型较强的泛化和建模能力通常会生成一些与训练数据相似但又不同的数据。
此外,它可以压缩高维输入样本,得到数据的低维表示,在这种低维表示中,可以更容易地区分正常数据和异常数据。虽然在数据增强或生成的情况下,具有很强的建模和泛化能力不会对模型的输出产生负面影响,在基于生成模型重构误差进行异常检测的情况下,改进VAE模型较强的泛化能力使得该模型不仅可以更好地重构正常数据,甚至可以很好地重构异常数据。
重建概率与自动编码器的重建误差有两种不同。首先,潜在变量是随机变量。在自动编码器中,潜在变量由确定性映射定义。然而,由于VAE使用概率编码器来模拟潜在变量的分布而不是潜在变量本身,因此可以从采样过程考虑潜在空间的可变性。与自动编码器相比,这扩展了VAE的表现力,即使正常数据和异常数据可能共享相同的平均值,变化也可能不同。据推测,异常数据将具有更大的方差并且显示出更低的重建概率。其次,重建是随机变量。重建概率不仅考虑重建与原始输入之间的差异,而且还考虑通过考虑分布函数的方差参数来重建的可变性。该属性使得能够根据变量方差对重建具有选择性灵敏度。具有大方差的变量将容忍重建中的大差异和原始数据作为正常行为,而具有小方差的变量将显著降低重建概率。这也是自动编码器由于其确定性而缺乏的特征。
重建是概率测量。基于自动编码器的异常检测使用重建误差作为异常分数,如果输入变量是异构的,则难以计算。为了总结异构数据的差异,需要加权合。问题是,没有一种通用的客观方法来确定适当的权重,因为权重将根据拥有的数据而有所不同。此外,即使在确定权重之后,确定重建误差的阈值也是麻烦的。没有明确的目标切割阈值。相反,重建概率的计算不需要加权异构数据的重建误差,因为每个变量的概率分布允许它们通过其自身的可变性单独地计算。
S108,将差值数据集输入改进VAE模型,进行异常检测得到时空数据的异常检测结果;
该面向服装物流管理的时空数据异常检测方法,获取一定数量服装物流的时空数据;对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集;构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型;将待预测的物流数据输入训练好的预测模型,得到预测值;计算所述预测值与真实值的差值绝对值,基于多个所述差值绝对值构建差值数据集;构建改进VAE模型,其中,所述改进VAE模型包括VAE模型、重编码器和约束网络;将所述差值数据集输入所述改进VAE模型,进行异常检测得到所述时空数据的异常检测结果。解决了现有技术中无法兼顾在获取用户短期轨迹动向和轨迹驻点预测的同时还能获取当前轨迹异常性的问题。
该面向服装物流管理的时空数据异常检测方法,首先,基于时空的轨迹预测能够有效地捕捉轨迹数据的时空特征。传统机器学习算法通常只能从数据中提取出单一的特征,而难以同时考虑时空信息。相比之下,基于时空的轨迹预测模型能够同时考虑轨迹的时空特征,如轨迹的起点、终点、行驶路径、速度等,从而提高了轨迹预测的准确性和稳定性。其次,基于时空的轨迹预测可以适应不同的轨迹数据类型和应用场景。传统机器学习算法通常需要大量的训练数据,才能有效地预测轨迹数据。而基于时空的轨迹预测方法可以在不同类型的轨迹数据上进行训练和预测,并且可以适应不同的应用场景,如车辆轨迹预测、人员行动轨迹预测等。
最后,基于时空的轨迹预测方法具有良好的可解释性和可视化效果。相比传统机器学习算法,基于时空的轨迹预测模型通常采用可视化技术,将预测结果呈现在地图上,从而方便用户直观地理解和分析预测结果。相比于RNN,RNN通常需要处理序列数据,而轨迹数据不仅仅是序列数据,还包含时空信息。基于时空的轨迹预测方法可以更好地处理轨迹数据的时空特征,并且能够更好地捕捉轨迹的空间和时间相关性。其次,RNN需要处理的序列长度较长时,容易出现梯度消失或梯度爆炸的问题,导致模型难以训练和优化。相比之下,面向服装物流管理的时空数据异常检测方法通常采用更浅层的神经网络结构,能够更好地避免这些问题。
图2为本发明面向服装物流管理的时空数据异常检测系统实施例流程图;如图2所示,本发明实施例提供的一种面向服装物流管理的时空数据异常检测系统,包括以下步骤:
获取模块10,用于获取一定数量服装物流的时空数据;
预处理模块20,用于对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集;
轨迹预测模型30,将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型,将待预测的物流数据输入训练好的预测模型,得到预测值;其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;
计算模块40,用于计算所述预测值与真实值的差值绝对值,基于多个所述差值绝对值构建差值数据集;
改进VAE模型50,将所述差值数据集输入所述改进VAE模型50,进行异常检测得到所述时空数据的异常检测结果;其中,所述改进VAE模型50包括VAE模型、重编码器和约束网络。
本发明的一种面向服装物流管理的时空数据异常检测系统,通过获取模块10获取一定数量服装物流的时空数据;通过预处理模块20对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集;通过轨迹预测模型将所述训练集输入所述轨迹预测模型30进行迭代训练,得到训练好的轨迹预测模型,将待预测的物流数据输入训练好的预测模型,得到预测值;其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;通过计算模块40计算所述预测值与真实值的差值绝对值,基于多个所述差值绝对值构建差值数据集;通过改进VAE模型50将所述差值数据集输入所述改进VAE模型50,进行异常检测得到所述时空数据的异常检测结果;其中,所述改进VAE模型50包括VAE模型、重编码器和约束网络。该面向服装物流管理的时空数据异常检测方法解决现有技术中无法兼顾在获取用户短期轨迹动向和轨迹驻点预测的同时还能获取当前轨迹异常性的问题。
图3为本发明实施例提供的电子设备实体结构示意图,如图3所示,电子设备60包括:处理器601(processor)、存储器602(memory)和总线603;
其中,处理器601、存储器602通过总线603完成相互间的通信;
处理器601用于调用存储器602中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取一定数量服装物流的时空数据;对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集;构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型;将待预测的物流数据输入训练好的预测模型,得到预测值;计算所述预测值与真实值的差值绝对值,基于多个所述差值绝对值构建差值数据集;构建改进VAE模型,其中,所述改进VAE模型包括VAE模型、重编码器和约束网络;将所述差值数据集输入所述改进VAE模型,进行异常检测得到所述时空数据的异常检测结果。
本实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:获取一定数量服装物流的时空数据;对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集;构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型;将待预测的物流数据输入训练好的预测模型,得到预测值;计算所述预测值与真实值的差值绝对值,基于多个所述差值绝对值构建差值数据集;构建改进VAE模型,其中,所述改进VAE模型包括VAE模型、重编码器和约束网络;将所述差值数据集输入所述改进VAE模型,进行异常检测得到所述时空数据的异常检测结果。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的存储介质。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各实施例或者实施例的某些部分的方法。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (10)
1.一种面向服装物流管理的时空数据异常检测方法,其特征在于,所述方法具体包括:
获取一定数量服装物流的时空数据;
对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集;
构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;
将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型;
将待预测的物流数据输入训练好的预测模型,得到预测值;
计算所述预测值与真实值的差值绝对值,基于多个所述差值绝对值构建差值数据集;
构建改进VAE模型,其中,所述改进VAE模型包括VAE模型、重编码器和约束网络;
将所述差值数据集输入所述改进VAE模型,进行异常检测得到所述时空数据的异常检测结果。
2.根据权利要求1所述面向服装物流管理的时空数据异常检测方法,其特征在于,所述对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集,包括:
对所述时空数据进行筛选获得无用数据,对所述无用数据进行清洗;其中,所述无用数据包括未送达货物的数据、小概率影响运送的数据、极短程的数据;
将所述时空数据划分为空间数据和时间数据,对所述空间数据和时间数据进行预处理;
获取所述时空数据的缺失值,并对所述缺失值进行填补。
3.根据权利要求1所述面向服装物流管理的时空数据异常检测方法,其特征在于,所述构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件,包括:
在所述轨迹预测模型设置观测值的阈值,当观测值超过所述阈值时,所述观测值为异常值;
获取异常值出现的时间信息和空间位置信息,基于所述时间信息和空间位置信息获得所述异常值的出现原因。
4.根据权利要求3所述面向服装物流管理的时空数据异常检测方法,其特征在于,所述构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件,还包括:
通过嵌入方法将每个分类属性转换为低维实向量,通过嵌入方法在不同的轨迹中发现和共享相似的模式;
将所述嵌入向量与旅行距离进行连接得到连接结果,将所述连接结果作为所述属性组件的输出。
5.根据权利要求4所述面向服装物流管理的时空数据异常检测方法,其特征在于,所述构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件,还包括:
所述时空学习组件包括地理卷积神经网络和循环神经网络;
通过所述地理卷积神经网络将原始GPS序列转换为一系列特征地图;
通过所述循环神经网络学习所述特征地图的时间相关性。
6.根据权利要求5所述面向服装物流管理的时空数据异常检测方法,其特征在于,所述构建轨迹预测模型,其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件,还包括:
通过多任务损失函数同时估计每个局部路径和整个路径的旅行时间,平衡个体估计和集体估计之间的权衡;
在所述轨迹预测模型中设置多因素注意机制,通过所述多因素注意机制基于不同局部路径的隐藏表示和外部因素来学习不同局部路径的权重。
7.根据权利要求1所述面向服装物流管理的时空数据异常检测方法,其特征在于,所述将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型,包括:
将所述时空数据划分为训练集、验证集和测试集;
基于所述训练集训练所述轨迹预测模型,在所述训练集输入所述轨迹预测模型之前,对所述训练集中的预处理数据进行特征缩放,采用归一化过程将输入的预处理数据归一化到[0,1]范围内;
基于所述验证集对训练后的所述轨迹预测模型进行性能评估,得到满足性能条件的轨迹预测模型;
基于所述测试集评估满足性能条件的所述轨迹预测模型的预测结果,得到所述轨迹预测模型所对应的评价指数。
8.一种面向服装物流管理的时空数据异常检测系统,其特征在于,包括:
获取模块,用于获取一定数量服装物流的时空数据;
预处理模块,用于对所述时空数据进行数据预处理得到预处理数据,基于所述预处理数据构建训练集;
轨迹预测模型,将所述训练集输入所述轨迹预测模型进行迭代训练,得到训练好的轨迹预测模型,将待预测的物流数据输入训练好的预测模型,得到预测值;其中,所述轨迹预测模型包括属性组件、时空学习组件和多任务学习组件;
计算模块,用于计算所述预测值与真实值的差值绝对值,基于多个所述差值绝对值构建差值数据集;
改进VAE模型,将所述差值数据集输入所述改进VAE模型,进行异常检测得到所述时空数据的异常检测结果;其中,所述改进VAE模型包括VAE模型、重编码器和约束网络。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中的任一项所述的方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中的任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311202702.3A CN117349769A (zh) | 2023-09-18 | 2023-09-18 | 面向服装物流管理的时空数据异常检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311202702.3A CN117349769A (zh) | 2023-09-18 | 2023-09-18 | 面向服装物流管理的时空数据异常检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117349769A true CN117349769A (zh) | 2024-01-05 |
Family
ID=89362229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311202702.3A Pending CN117349769A (zh) | 2023-09-18 | 2023-09-18 | 面向服装物流管理的时空数据异常检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117349769A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117648215A (zh) * | 2024-01-26 | 2024-03-05 | 国网山东省电力公司营销服务中心(计量中心) | 一种用电信息采集系统异常溯源方法及系统 |
-
2023
- 2023-09-18 CN CN202311202702.3A patent/CN117349769A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117648215A (zh) * | 2024-01-26 | 2024-03-05 | 国网山东省电力公司营销服务中心(计量中心) | 一种用电信息采集系统异常溯源方法及系统 |
CN117648215B (zh) * | 2024-01-26 | 2024-05-24 | 国网山东省电力公司营销服务中心(计量中心) | 一种用电信息采集系统异常溯源方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Teh et al. | Sensor data quality: A systematic review | |
Li et al. | Estimation of missing values in heterogeneous traffic data: Application of multimodal deep learning model | |
Guo et al. | GPS-based citywide traffic congestion forecasting using CNN-RNN and C3D hybrid model | |
Kamarianakis et al. | Real‐time road traffic forecasting using regime‐switching space‐time models and adaptive LASSO | |
Davis et al. | A framework for end-to-end deep learning-based anomaly detection in transportation networks | |
He et al. | STNN: A spatio-temporal neural network for traffic predictions | |
Song et al. | A match‐then‐predict method for daily traffic flow forecasting based on group method of data handling | |
CN117349769A (zh) | 面向服装物流管理的时空数据异常检测方法及系统 | |
CN115440032A (zh) | 一种长短期公共交通流量预测方法 | |
Zhou et al. | Improving human mobility identification with trajectory augmentation | |
CN114287023A (zh) | 用于交通预测的多传感器学习系统 | |
Zhu et al. | A Higher‐Order Motif‐Based Spatiotemporal Graph Imputation Approach for Transportation Networks | |
Tambuwal et al. | Deep quantile regression for unsupervised anomaly detection in time-series | |
Chitra et al. | Time-series analysis and flood prediction using a deep learning approach | |
US20240012875A1 (en) | Method, system and computer readable medium for probabilistic spatiotemporal forecasting | |
Wang et al. | Multi-scale deep learning and optimal combination ensemble approach for AQI forecasting using big data with meteorological conditions | |
JP6534971B2 (ja) | 分布クエリに対してビジネスデータを融合するための方法及びシステム | |
Yalçın | Weather parameters forecasting with time series using deep hybrid neural networks | |
CN116663613A (zh) | 一种面向智能物联系统的多元时序异常检测方法 | |
CN115577295A (zh) | 数据检测方法、装置、计算机设备和存储介质 | |
Berkani et al. | Spatio-temporal forecasting: A survey of data-driven models using exogenous data | |
CN115700599A (zh) | 一种面向交通流量预测任务的连续编码器-解码器方法 | |
Petelin et al. | Models for forecasting the traffic flow within the city of Ljubljana | |
Zhou et al. | Dynamic manifold learning for land deformation forecasting | |
CN117456738B (zh) | 一种基于etc门架数据的高速公路交通量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |