CN113033893B - 自动化集装箱码头自动导引车行车时间预测方法 - Google Patents
自动化集装箱码头自动导引车行车时间预测方法 Download PDFInfo
- Publication number
- CN113033893B CN113033893B CN202110307763.0A CN202110307763A CN113033893B CN 113033893 B CN113033893 B CN 113033893B CN 202110307763 A CN202110307763 A CN 202110307763A CN 113033893 B CN113033893 B CN 113033893B
- Authority
- CN
- China
- Prior art keywords
- path
- main
- model
- main path
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000013528 artificial neural network Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 24
- 238000012216 screening Methods 0.000 claims abstract description 21
- 238000003062 neural network model Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 49
- 230000007613 environmental effect Effects 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 17
- 230000007246 mechanism Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000009471 action Effects 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 claims description 2
- 238000011176 pooling Methods 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 239000013256 coordination polymer Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Computational Biology (AREA)
- Development Economics (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Operations Research (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明一种自动化集装箱码头自动导引车行车时间预测方法,涉及一种神经网络和深度学习算法,可以有效地对自动化集装箱码头中自动导引车的行车时间进行准确预测,属于人工智能及控制技术领域,其特征在于:步骤1:主路径编码;步骤2:路径级特征编码;步骤3:环境路径筛选;步骤4:环境路径编码;步骤5:冲突判定;步骤6:计算预测时间与真实时间误差;步骤7:更新训练样本和神经网络;步骤8:行车时间预测。利用神经网络模型对行驶路径进行编码,有效解决自动化集装箱码头自动导引车的行车时间预测问题,具有更高的行车时间预测准确度。
Description
技术领域
本发明属于人工智能及控制技术领域。
背景技术
自动导引车是装备了自动导引设备,沿规划好的路径行驶的无人驾驶自动化车辆,在自动化集装箱码头工业场景中承担水平运输的任务,负责岸桥与堆场之间的集装箱运输。自动导引车在交互点处与码头上的其他设备进行交互,将集装箱运送到指定的位置,是衔接岸桥和堆场的重要设备。水平运输作业过程中,自动导引车的行车时间预测问题十分重要,关系到设备调度和作业安排。如果行车时间预测不准确,会增加装卸设备的等待时间,影响整个自动化码头的作业效率。因此,对自动导引车行车时间进行准确的预测,对于提高自动化集装箱码头的生产效率具有重要的意义。
自动化集装箱码头工业场景中,自动导引车行车时间预测问题具有特殊性。首先,在集装箱码头上,自动导引车在水平运输区的交互点十分密集,路径规划算法根据环境及任务的差异规划不同的路径,使得自动导引车的行驶路径灵活且多变,增大了行车时间预测的难度。其次,自动导引车的行车时间预测精度相较于一般的行车时间预测问题的精度要求更高。最后,由于港口作业繁忙,多辆自动导引车执行任务中存在路径交叉,不可避免地会造成拥堵和冲突,影响最终的到达时间,并且由于路径之间是否发生冲突,以及解决冲突所消耗的时间具有较大的不确定性,因此,行驶中的冲突等待是影响自动导引车行驶时间预测的一项关键难点。
在目前的领域研究所提出的方法中,面向自动化集装箱码头工业场景中的自动导引车行车时间预测方法较少。与自动导引车相关的研究,主要集中在路径规划和调度问题上,这些问题虽然经常需要使用到自动导引车的行驶时间,但大多采用固定车速,并使用路径长度除以车速的简单方式进行计算,该方法忽略了实际工作中自动导引车会遇到冲突等待等情况,预测时间不够准确。而与行车时间预测相关的研究,集中于交通领域,尤其是城市道路上。但城市道路由于车道及路口的限制,行驶车辆的路径相对固定,与自动化集装箱码头内灵活多变的路径不同,因此城市道路的行车时间预测方法难以直接应用于自动导引车行车时间预测问题中。自动化集装箱码头自动导引车行车时间预测问题亟待解决。
发明内容
为了解决上述问题,本发明一种基于神经网络的自动化集装箱码头自动导引车行车时间预测方法。本发明不仅能够针对码头内灵活的路径生成可计算的数据表示,还可预测不同自动导引车在行驶过程中是否会发生冲突,并结合冲突预测提高行车时间预测的准确性,最终达到自动化集装箱码头对于自动导引车行车时间预测的高精度要求。
技术方案
一种基于神经网络的自动化集装箱码头自动导引车行车时间预测方法,其特征是:
首先,针对路径表示的问题,根据自动导引车的行动模式切换(直行、转弯等),将其历史轨迹数据切分为若干主路径子段(8),输入神经网络进行编码;其次,为了引入路径间冲突造成的影响,使用XGBoost模型对同时执行其他自动导引车路径进行筛选,选择有可能发生冲突的若干路径,为当前自动导引车行驶时间估计提供指导;之后,将这些可能冲突的路径信息编码为环境向量,引入注意力机制,以预测其是否与主路径(7)发生冲突作为辅助任务,使模型学习到路径冲突的影响;最后,综合主路径(7)的编码和环境信息的注意力权重,对行车时间进行回归预测。
一种基于神经网络的自动化集装箱码头自动导引车行车时间预测方法,主要包括以下步骤:
步骤1:主路径编码
从训练集数据中获取主路径Ra={TPstart,TPend,tstart,T,RF}(7),使用基于神经网络模型的主路径编码器(1)进行编码,得到主路径向量表示er(11),用于提供给步骤5、步骤6。
步骤2:路径级特征编码
从训练集数据中计算得到每次行车路径级特征,包括起点位置、终点位置、运载箱重等多种特征,使用基于多层神经网络的路径级特征编码器(2)对路径级特征进行编码,得到路径级特征向量表示ef(12),用于提供给步骤6。
步骤3:环境路径筛选
从主路径(7)出发时间的时间窗口内筛选出可能与主路径(7)发生冲突的环境路径。每条路径表示为Ri={TPstart,TPend,tstart,T,RF},使用基于XGBoost的环境路径筛选模型(3)训练预测时间窗口内与主路径Ra发生冲突的环境路径Rb,生成冲突路径对(Ra,Rb),用于提供给步骤4。
步骤4:环境路径编码
将步骤3筛选出的可能与主路径(7)发生冲突的环境路径序列进行编码,基于注意力机制与多层神经网络的环境路径编码器(4)进行编码,生成环境路径向量表示eenv(13),用于提供给步骤5。
步骤5:冲突判定
采用多任务学习思想,使用基于注意力机制的冲突判定网络(5)计算主路径(7)与环境路径发生冲突的概率,生成表示冲突概率的环境路径注意力权重向量A,并采用监督学习方式,利用真实的冲突情况对冲突判定进行监督,计算冲突判定结果与真实的冲突情况的辅助损失函数(15),作为时间预测模型的辅助任务;用于提供给步骤6。
步骤6:计算预测时间与真实时间误差
将步骤1得到的主路径向量表示er(11),步骤2得到的主路径的路径级特征向量表示ef(12),步骤5得到的环境路径注意力权重向量A进行连接操作,使用基于多层神经网络的行车时间预测网络(6)进行计算,得到整体模型最终输出的预测时间计算预测时间与真实时间t的主损失函数(20);用于提供给步骤7。
步骤7:更新训练样本和神经网络
将整体模型在训练集上进行训练,根据主损失函数(20)和辅助损失函数(15)和反向传播公式,调节整体模型中的参数,使整体模型收敛,得到模型M;用于提供给步骤8。
步骤8:行车时间预测
对于新样本Rj={TPstart,TPend,tstart,T,RF},首先使用环境路径筛选模型(3)得到新样本Rj的环境路径集合,之后输入新样本Rj与对应的环境路径集合,使用步骤7训练得到的模型M计算,得到新样本的预测时间。
上述基于神经网络的自动化集装箱码头自动导引车行车时间预测方法,利用了神经网络模型对行驶路径进行编码,将该路径出发前后一段时间内的其他路径进行编码作为环境信息,将预测其是否与主路径发生冲突作为辅助任务;通过采用一种复杂的深度学习架构,设计出一种新的有效的自动化集装箱码头自动导引车的行车时间预测算法。可以有效地对自动化集装箱码头中自动导引车的行车时间进行准确预测。
附图说明
图1为本发明一种基于神经网络的自动化集装箱码头自动导引车行车时间预测方法的模型整体结构示意图。
图2为图1系统中的主路径编码器结构示意图。
图3为图1系统中的环境路径筛选模型结构示意图。
图4为图1系统中的环境路径编码器与冲突判定网络结构示意图。
图5为本发明1系统的方法步骤流程。
具体实施方式
本发明一种基于神经网络的自动化集装箱码头自动导引车行车时间预测方法的基本流程为:首先,针对路径表示的问题,根据自动导引车的行动模式切换(直行、转弯等),将其历史轨迹数据切分为若干主路径子段(8),输入神经网络进行编码;其次,为了引入路径间冲突造成的影响,使用XGBoost模型对同时执行其他自动导引车路径进行筛选,选择有可能发生冲突的若干路径,为当前自动导引车行驶时间估计提供指导;之后,将这些可能冲突的路径信息编码为环境向量,引入注意力机制,以预测其是否与主路径(7)发生冲突作为辅助任务,使模型学习到路径冲突的影响;最后,综合主路径(7)的编码和环境信息的注意力权重,对行车时间进行回归预测。
基于上述方法,构建的系统如图1。该系统设计时:
自动化集装箱码头上,自动导轨车作业过程中与其他设备进行交互是在若干位置基本固定的交互点(TP)进行的,对于自动导轨车行驶时间的预测,是预测两个TP之间的行驶时间。
一条路径R={TPstart,TPend,tstart,T,RF},其中TPstart和TPend分别为路径的起点TP和终点TP,TPstart为路径出发时间,TP={x,y}由其坐标表示,T={p1,p2,...,pn}为路径对应的子段序列,由一系列子段pi={xstart,ystart,xend,yend,xdist,ydist,cosine,markstart,markend}组成,子段中各项分别表示子段起点坐标,子段终点坐标,起点终点间的坐标差,子段的向量余弦以及该子段是否为路径的起始段或终止段;RF为路径级特征,包括当前自动导轨车所承载的集装箱重量w以及任务类型等其他特征。
环境路径(10)ER={ER1,ER2,...,ERn}是在主路径(7)前后一段时间内出发的若干条其他路径,ERi={TPstart,TPend,tstart,w}包含起点TP,终点TP,出发时间以及所转载集装箱的重量。
因此,最终的目标是给出一条路径R,根据在其对应的环境路径(10)ER影响下,预测出自动导轨车完成路径R所需要的行驶时间。
R为需要对其进行行驶时间预测的主路径(7),其中轨迹数据T被输入到一个路径编码器中进行编码,得到一个固定长度的主路径向量表示(11);路径级特征RF通过一个全连接层,得到固定长度的路径级特征向量表示(12),其中任务类型等离散特征被转换为一个|O|维的独热编码表示,其中特定一位为1其余为0,例如假设共有3种任务类型,则它们分别用[1,0,0],[0,1,0],[0,0,1]进行表示,数值较大的箱重特征则进行了归一化处理,缩放为了0到1之间的浮点数;其余的起点TP,终点TP,出发时间以及箱重,与环境路径(10)保持一致,共同输入到环境路径编码器中,通过一个类似于注意力机制的模型,作为多任务训练的一个辅助任务,以主路径(7)是否与各条环境路径(10)发生冲突作为标签,训练得到主路径(7)与各环境路径(10)发生冲突的概率向量,并将它们之间的损失值作为辅助损失函数(15)。将主路径向量表示(11),路径级特征向量表示(12)以及环境路径冲突概率拼接,并通过全连接层,回归预测行驶时间并与真实时间计算主损失函数。
以下给出实施例和技术细节,以及实施后的性能对比。
如图5所示,本发明一种基于神经网络的自动化集装箱码头自动导引车行车时间预测方法的实施过程为:
步骤1:主路径编码
虽然自动化集装箱码头上缺少如公共交通道路一样的,以路口为结点的自然划分,但通过直行、转弯等不同的行动模式,将自动导引车的行驶路径切分为了不同的主路径子段(8)。模型的输入是路径轨迹中每个子段的特征序列。首先,将每一个路径中的n个子段特征都输入到全连接层中,得到它们各自的固定长度向量表示,之后通过卷积神经网络对它们进行编码。主路径编码器全连接层(21)将子路径特征pi转换为特征向量ei,之后分别通过主路径编码器第一个卷积层(22)、主路径编码器池化层(23)和主路径编码器第二个卷积层(24),最终将向量展平,得到主路径向量表示er(11)。计算过程为:
ei=ReLU(pi·Wt+bt)
其中,Wt和bt是主路径编码器全连接层的模型参数。
步骤2:路径级特征编码
主路径(7)和环境路径(10)的基本属性Ri={TPstart,TPend,tstart,T,RF},在输入到特征处理模块之后,进行路径级特征计算,得到一系列特征,包括主路径(7)起止TP坐标,环境路径(10)起止TP坐标,两者间的出发时间差,两路径装载的集装箱重,两路径自身的起止点间X、Y轴坐标差,两路径之间、起止点的X、Y坐标差,以及两路径各自的方向余弦与两路径之间的夹角余弦等。在得到路径级特征之后,将其输入全连接层,进行编码,得到路径级特征向量表示ef(12),维度与主路径向量表示(11)相同。计算过程为:
步骤3:环境路径筛选
从主路径(7)出发时间的时间窗口内筛选出可能与主路径(7)发生冲突的环境路径(10)。每条路径表示为Ri={TPstart,TPend,tstart,T,RF},使用基于XGBoost的环境路径筛选模型(3)训练预测时间窗口内与主路径Ra发生冲突的环境路径Rb,生成冲突路径对rpenv=(Ra,Rb)。
由于自动化集装箱码头任务繁忙,如果直接选取主路径(7)出发时间附近一定区间内的路径作为环境路径(10)的话,数量将会非常多,但其中可能会与主路径(7)发生冲突的却相对比较少,所以需要对主路径(7)出发时间的一定时间窗口内的其他路径进行筛选,提高模型的效率。时间窗口大小取10分钟。
自动导引车行驶过程中记录下的日志中保存了其行驶过程中是否发生冲突,以及与谁发生了冲突,该冲突是单向记录的,即当A车等待B车让出道路时,只有A车会记录自己与B车发生过冲突。通过对日志数据进行处理,从中找出了所有发生过的冲突路径对(Ra,Rb),表示路径Ra与路径Rb发生过冲突,标记为1,每个路径R都表示为(TPstart,TPend,tstart,tend,w)。获取到正样本之后,再从路径数据中随机挑选与正样本数量相当的路径作为负样本的Ra,再随机挑选与Ra在时间上存在重叠但未发生冲突的路径作为Rb,构建出负样本,标记为0。
在完成数据的构建后,使用机器学习模型XGBoost来训练筛选模型。将路径对中的TP名称映射为其对应坐标,并加入两路径出发时间差、坐标差、夹角余弦等各类路径级特征,输入到模型当中,训练出一个能够判断路径对是否会发生冲突的二分类模型。
在获取到主路径(7)出发时间的一定时间窗口内若干候选环境路径之后,将主路径(7)与其环境路径进行同样的特征处理并输入到训练好的二分类模型中,输出其预测为1的概率,得到冲突概率向量CP(28),选择CP中概率最高的K个候选环境路径,作为最终输入到神经网络中的环境路径。
步骤4:环境路径编码
自动导引车作为自动化设备,其在两点间的行驶时间理论上应该是基本保持不变的,而对行驶时间的预测造成影响的一大因素,就是车辆行驶过程中发生冲突而产生的避让等待。对环境路径编码的目的,就是要得到主路径(7)究竟与哪些环境路径发生了冲突,有了这样的一些信息,将能够更加准确的估计出车辆间的冲突对行驶时间造成的影响。图2反映了环境路径编码器(4)结构。
根据步骤3得到的路径对rpenv,主路径(7)和环境路径的基本属性{TPstart,TPend,tstart,w}在输入到环境编码器特征处理机制(26)之后,进行了一些特征处理操作,得到了一系列路径对特征,包括主路径(7)起止TP坐标,环境路径起止TP坐标,两者间的出发时间差,两路径装载的集装箱重,两路径自身的起止点间X、Y轴坐标差,两路径之间、起止点的X、Y坐标差,以及两路径各自的方向余弦与两路径之间的夹角余弦,这些特征与步骤3中进行路径筛选时使用的特征是一致的,得到环境路径对特征向量rpeenv(25)。在得到路径对特征之后,将其输入至环境编码器全连接层(27),得到了与主路径编码相同维度的环境路径特征向量eenv。计算过程为:
步骤5:冲突判定
冲突判定网络(5)采用了注意力机制的思想。注意力机制在深度学习各领域中被广泛使用,可以被简单的解释为是一个元素与其他若干元素之间的重要性权重向量,在冲突判定网络(5)中,对注意力机制进行修改,用来计算主路径(7)与各环境路径之间是否会发生冲突的概率向量。
对上述步骤得到的主路径向量表示er(11),和环境路径向量表示eenv(13)主路径编码相同维度的环境路径特征向量,接着计算主路径编码与各环境路径特征向量的点积,得到注意力得分。在这之后,若是按照一般注意力机制的做法,会使用一个softmax激活函数,将得分转化为和为1的概率分布,但在本方法中,一条主路径(7)会与多条环境路径发生冲突,所以使用sigmoid激活函数让每一条环境路径都可能被判断为与主路径(7)发生冲突,如此一来便可将其输出与真实的冲突情况计算损失值从而作为时间预测模型的辅助任务。计算过程如下:
S=Erp·Rmain
A=sigmoid(S)
其中,和是最终输出的模型判断的主路径(7)与环境路径是否冲突的冲突得分向量(14)及其注意力得分,denv是经过筛选后剩下的环境路径数量;是经过全连接层之后的特征对向量,其与主路径编码在维度上保持一致; 部是可训练的全连接层参数。
步骤6:计算预测时间与真实时间误差
将主路径向量表示er(11),主路径(7)的路径级特征向量表示ef(12),环境路径注意力权重向量A进行连接操作,得到拼接向量表示[er;ef;A](17),使用基于多层神经网络的行车时间预测网络(6)进行计算,得到整体模型最终输出的预测行车时间计算预测时间与真实行车时间t(19)的主损失函数Lmain(20),计算过程如下:
计算辅助任务的误差,即计算基于注意力得分的主路径(7)与环境路径冲突判断结果S,与主路径(7)与环境路径冲突的路径冲突向量Y(15)的交叉熵,计算过程如下:
其中m为训练集中样本数量,Yi是主路径与环境路径冲突的路径冲突向量,Si是模型输出的主路径与环境路径冲突的判断结果。通过辅助损失函数Laux(15)与主损失函数Lmain(20)一起优化模型参数,使得模型能够从历史数据中学到一条主路径(7)与多少条环境路径发生了冲突,使得模型的行车时间预测考虑到冲突次数与冲突路径,令行车时间预测更为准确。
步骤7:更新训练样本和神经网络
将整体模型在训练集上进行训练,根据主损失函数(20)和辅助损失函数(15)和反向传播公式w(t+1)=w(t)+Δw(t),调节整体模型中的参数,使整体模型收敛,得到模型M。
步骤8:行车时间预测
对于新样本Rj={TPstart,TPend,tstart,T,RF},首先使用环境路径筛选模型(3)得到新样本Rj的环境路径,之后输入新样本Rj与对应的环境路径,使用步骤7训练得到的模型M计算,得到新样本的预测时间。
实施例在包含4万条自动导引车路径的测试集上进行时间预测实验以验证有效性,假定t1,t2,...,tn是实际的行驶时间,是预测出的时间,n是路径数量。基于此类问题,一般采用三个指标来评价:绝对百分比误差(Mean Absolute Percentage Error,MAPE),平均相对误差(Mean Relative Error,MRE),平均绝对误差(Mean Absolute Error,MAE),它们的计算方法如下:
三个指标值越低,说明误差越小,行车时间预测越准确。由于与该问题直接相关的研究较少,除了路径规划问题中常见的速度固定的估算方法之外,选择了一个比较基础的神经网络回归模型,和一个常见的机器学习模型XGBoost进行比较,以证明本发明的有效性。从表1可以看出本发明的方法在各误差指标上均低于其他算法,这从客观角度说明了本发明方法优于其他算法。
表1时间预测方法的性能比较
Claims (1)
1.一种基于神经网络的自动化集装箱码头自动导引车行车时间预测方法,其特征是:
首先,针对路径表示的问题,根据自动导引车的行动模式切换,将其历史轨迹数据切分为若干主路径子段(8),输入神经网络进行编码;其次,为了引入路径间冲突造成的影响,使用XGBoost模型对同时执行其他自动导引车路径进行筛选,选择有可能发生冲突的若干路径,为当前自动导引车行驶时间估计提供指导;之后,将这些可能冲突的路径信息编码为环境向量,引入注意力机制,以预测其是否与主路径(7)发生冲突作为辅助任务,使模型学习到路径冲突的影响;最后,综合主路径(7)的编码和环境信息的注意力权重,对行车时间进行回归预测;包括以下步骤:
步骤1:主路径编码
从训练集数据中获取主路径Ra={TPstart,TPend,tstart,T,RF} (7),使用基于神经网络模型的主路径编码器(1)进行编码,得到主路径向量表示er(11),用于提供给步骤5、步骤6;
首先,将每一个路径中的n个子段特征都输入到全连接层中,得到它们各自的固定长度向量表示,之后通过卷积神经网络对它们进行编码;主路径编码器全连接层(21)将子路径特征pi转换为特征向量ei,之后分别通过主路径编码器第一个卷积层(22)、主路径编码器池化层(23)和主路径编码器第二个卷积层(24),最终将向量展平,得到主路径向量表示er(11);计算过程为:
ei=ReLU(pi·Wt+bt)
其中,Wt和bt是主路径编码器全连接层的模型参数;
步骤2:路径级特征编码
从训练集数据中计算得到每次行车路径级特征,包括起点位置、终点位置、运载箱重多种特征,使用基于多层神经网络的路径级特征编码器(2)对路径级特征进行编码,得到路径级特征向量表示ef(12),用于提供给步骤6;
步骤3:环境路径筛选
从主路径(7)出发时间的时间窗口内筛选出可能与主路径(7)发生冲突的环境路径,每条路径表示为Ri={TPstart,TPend,tstart,T,RF},使用基于XGBoost的环境路径筛选模型(3)训练预测时间窗口内与主路径Ra发生冲突的环境路径Rb,生成冲突路径对(Ra,Rb),用于提供给步骤4;
步骤4:环境路径编码
将步骤3筛选出的可能与主路径(7)发生冲突的环境路径序列进行编码,基于注意力机制与多层神经网络的环境路径编码器(4)进行编码,生成环境路径向量表示eenv(13),用于提供给步骤5;
步骤5:冲突判定
采用多任务学习思想,使用基于注意力机制的冲突判定网络(5)计算主路径(7)与环境路径发生冲突的概率,生成表示冲突概率的环境路径注意力权重向量A,并采用监督学习方式,利用真实的冲突情况对冲突判定进行监督,计算冲突判定结果与真实的冲突情况的辅助损失函数(15),作为时间预测模型的辅助任务,用于提供给步骤6;
计算过程如下:
S=Erp·Rmain
A=sigmoid(S)
其中,和是最终输出的模型判断的主路径(7)与环境路径是否冲突的冲突得分向量(14)及其注意力得分,denv是经过筛选后剩下的环境路径数量;是经过全连接层之后的特征对向量,其与主路径编码在维度上保持一致;都是可训练的全连接层参数;
步骤6:计算预测时间与真实时间误差
将步骤1得到的主路径向量表示er(11),步骤2得到的主路径的路径级特征向量表示ef(12),步骤5得到的环境路径注意力权重向量A进行连接操作,使用基于多层神经网络的行车时间预测网络(6)进行计算,得到整体模型最终输出的预测时间计算预测时间与真实时间ti的主损失函数Lmain(20);用于提供给步骤7;
计算过程如下:
步骤7:更新训练样本和神经网络
将整体模型在训练集上进行训练,根据主损失函数Lmain(20)和辅助损失函数Laux(15)和反向传播公式,调节整体模型中的参数,使整体模型收敛,得到模型M;用于提供给步骤8;
计算过程如下:
Yi是主路径与环境路径冲突的路径冲突向量,Si是模型输出的主路径与环境路径冲突的判断结果;
步骤8:行车时间预测
对于新样本Rj={TPstart,TPend,tstart,T,RF},首先使用环境路径筛选模型(3)得到新样本Rj的环境路径集合,之后输入新样本Rj与对应的环境路径集合,使用步骤7训练得到的模型M计算,得到新样本的预测时间;
其中TPstart和TPend分别为路径的起点TP和终点TP,TPstart为路径出发时间,TP={x,y}由其坐标表示,T={p1,p2,…,pn}为路径对应的子段序列,由一系列子段pi={xstart,ystart,xend,yend,xdist,ydist,cosine,markstart,markend}组成,子段中各项分别表示子段起点坐标,子段终点坐标,起点终点间的坐标差,子段的向量余弦以及该子段是否为路径的起始段或终止段;RF为路径级特征;
从训练集数据中获取主路径Ra即新样本Rj。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110307763.0A CN113033893B (zh) | 2021-03-23 | 2021-03-23 | 自动化集装箱码头自动导引车行车时间预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110307763.0A CN113033893B (zh) | 2021-03-23 | 2021-03-23 | 自动化集装箱码头自动导引车行车时间预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113033893A CN113033893A (zh) | 2021-06-25 |
CN113033893B true CN113033893B (zh) | 2023-04-18 |
Family
ID=76472772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110307763.0A Active CN113033893B (zh) | 2021-03-23 | 2021-03-23 | 自动化集装箱码头自动导引车行车时间预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113033893B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112270306A (zh) * | 2020-11-17 | 2021-01-26 | 中国人民解放军军事科学院国防科技创新研究院 | 一种基于拓扑路网的无人车轨迹预测与导航方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106774305B (zh) * | 2016-11-30 | 2019-11-08 | 上海振华重工电气有限公司 | 自动化集装箱码头多自动引导车辆路径冲突消解方法 |
CN111401617A (zh) * | 2020-03-09 | 2020-07-10 | 兰剑智能科技股份有限公司 | 一种基于时间预测的agv调度方法及系统 |
CN111462488B (zh) * | 2020-04-01 | 2021-09-10 | 北京工业大学 | 一种基于深度卷积神经网络和交叉口行为特征模型的交叉口安全风险评估方法 |
-
2021
- 2021-03-23 CN CN202110307763.0A patent/CN113033893B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112270306A (zh) * | 2020-11-17 | 2021-01-26 | 中国人民解放军军事科学院国防科技创新研究院 | 一种基于拓扑路网的无人车轨迹预测与导航方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113033893A (zh) | 2021-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chiang et al. | Learning navigation behaviors end-to-end with autorl | |
Chiang et al. | RL-RRT: Kinodynamic motion planning via learning reachability estimators from RL policies | |
Yang et al. | Bus arrival time prediction using support vector machine with genetic algorithm | |
Grigorescu et al. | Neurotrajectory: A neuroevolutionary approach to local state trajectory learning for autonomous vehicles | |
Wang et al. | A prediction model of vessel trajectory based on generative adversarial network | |
Cho et al. | Deep predictive autonomous driving using multi-agent joint trajectory prediction and traffic rules | |
CN113156947A (zh) | 一种船舶在动态环境下的路径规划的方法 | |
CN114202120A (zh) | 一种针对多源异构数据的城市交通行程时间预测方法 | |
CN111488946A (zh) | 基于信息融合的雷达伺服系统故障诊断方法 | |
CN111695299A (zh) | 一种中尺度涡轨迹预测方法 | |
CN116360454A (zh) | 行人环境下基于深度强化学习的机器人路径避碰规划方法 | |
Butyrev et al. | Deep reinforcement learning for motion planning of mobile robots | |
Kim et al. | Scalable learning with a structural recurrent neural network for short-term traffic prediction | |
CN113537580A (zh) | 一种基于自适应图学习的公共交通客流预测方法及系统 | |
CN116541708A (zh) | 融合数据质量控制和Transformer网络的船舶航迹预测方法及系统 | |
CN115560771A (zh) | 基于采样的路径规划方法及装置、自动行驶设备 | |
Huang et al. | Diversity-aware vehicle motion prediction via latent semantic sampling | |
CN113033893B (zh) | 自动化集装箱码头自动导引车行车时间预测方法 | |
Siddarth et al. | Path planning for mobile robots using deep learning architectures | |
Yu et al. | Learning and Sampling-Based Informative Path Planning for AUVs in Ocean Current Fields | |
CN117506893A (zh) | 基于双重规划和自主学习的机械臂路径规划和控制方法 | |
CN116448134B (zh) | 基于风险场与不确定分析的车辆路径规划方法及装置 | |
CN117408406A (zh) | 一种规划耦合的多目标车辆轨迹预测方法及系统 | |
Zhou et al. | Sa-sgan: A vehicle trajectory prediction model based on generative adversarial networks | |
Du et al. | Real time neural network path planning algorithm for robot |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |