发明内容
本发明实施例提供一种智能机器人驱动传感智能控制系统及其方法,其获取智能机器人的摄像头采集的货物状态图像;采用基于深度学习的人工智能技术,进行所述货物状态图像中关于货物的摆放状态全局隐含特征的充分表达,以此来准确地判断货物摆放状态,从而避免因摆放状态异常而导致的物流延误或损失,提高仓库物流管理的效率和准确性。
本发明实施例还提供了一种智能机器人驱动传感智能控制系统,其包括:图像采集模块,用于获取智能机器人的摄像头采集的货物状态图像;图像增强模块,用于对所述货物状态图像进行图像增强以得到增强货物状态图像;空间特征增强模块,用于将所述增强货物状态图像通过使用空间注意力机制的卷积神经网络模型以得到货物状态特征矩阵;矩阵切分模块,用于对所述货物状态特征矩阵进行特征矩阵切分以得到多个货物状态子特征矩阵;特征优化模块,用于对所述多个货物状态子特征矩阵进行特征分布优化以得到多个优化后货物状态子特征矩阵;全局特征感知模块,用于将所述多个优化后货物状态子特征矩阵通过包含嵌入层的全局特征感知器以得到货物状态全局特征向量;以及
货物摆放状态检测模块,用于将所述货物状态全局特征向量通过分类器以得到分类结果,所述分类结果用于表示货物的摆放状态是否正常。
本发明实施例中,所述图像增强模块,用于:对所述货物状态图像进行双边滤波处理以得到所述增强货物状态图像。
本发明实施例中,所述空间特征增强模块,用于:使用空间注意力机制的卷积神经网络模型的各层在层的正向传递过程中对输入数据分别进行:对输入数据进行卷积处理以生成卷积特征图;对所述卷积特征图进行池化处理以生成池化特征图;对所述池化特征图进行非线性激活以生成激活特征图;计算所述激活特征图的各个位置沿通道维度的均值以生成空间特征矩阵;计算所述空间特征矩阵中各个位置的类Softmax函数值以获得空间得分矩阵;以及,计算所述空间特征矩阵和所述空间得分矩阵的按位置点乘以获得特征矩阵;其中,所述使用空间注意力机制的卷积神经网络模型的最后一层输出的所述特征矩阵为所述货物状态特征矩阵阵。
本发明实施例中,所述特征优化模块,包括:优化因数计算单元,用于计算所述各个货物状态子特征矩阵的基于凸分解的特征几何度量的逐片近似因数以得到多个基于凸分解的特征几何度量的逐片近似因数;以及,加权优化单元,用于以所述多个基于凸分解的特征几何度量的逐片近似因数作为加权系数对所述多个货物状态子特征矩阵进行加权优化以得到多个优化后货物状态子特征矩阵。
本发明实施例中,所述优化因数计算单元,用于:以如下优化公式计算所述各个货物状态子特征矩阵的基于凸分解的特征几何度量的逐片近似因数以得到所述多个基于凸分解的特征几何度量的逐片近似因数;其中,所述优化公式为:,其中,/>是第/>个所述货物状态子特征矩阵的第/>个行向量或者列向量,/>表示/>函数,/>表示/>函数,表示将各个向量级联,且/>表示向量的二范数的平方,/>表示所述多个基于凸分解的特征几何度量的逐片近似因数中第/>个基于凸分解的特征几何度量的逐片近似因数。
本发明实施例中,所述全局特征感知模块,包括:嵌入化单元,用于使用所述包含嵌入层的全局特征感知器的嵌入层对所述多个优化后货物状态子特征矩阵中的各个优化后货物状态子特征矩阵进行向量嵌入化以得到货物状态嵌入向量的序列;以及,转换编码单元,用于将所述货物状态嵌入向量的序列输入所述包含嵌入层的全局特征感知器的转换器以得到所述货物状态全局特征向量。
本发明实施例中,所述转换编码单元,包括:向量构造子单元,用于将所述货物状态嵌入向量的序列进行一维排列以得到货物状态全局特征向量;自注意子单元,用于计算所述货物状态全局特征向量与所述货物状态嵌入向量的序列中各个货物状态嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;标准化子单元,用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;关注度计算子单元,用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及,注意力施加子单元,用于分别以所述多个概率值中各个概率值作为权重对所述货物状态嵌入向量的序列中各个货物状态嵌入向量进行加权以得到所述货物状态全局特征向量。
本发明实施例中,所述货物摆放状态检测模块,包括:全连接编码单元,用于使用所述分类器的多个全连接层对所述货物状态全局特征向量进行全连接编码以得到编码分类特征向量;以及,分类单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
本发明实施例还提供了一种智能机器人驱动传感智能控制方法,其包括:获取智能机器人的摄像头采集的货物状态图像;对所述货物状态图像进行图像增强以得到增强货物状态图像;将所述增强货物状态图像通过使用空间注意力机制的卷积神经网络模型以得到货物状态特征矩阵;对所述货物状态特征矩阵进行特征矩阵切分以得到多个货物状态子特征矩阵;对所述多个货物状态子特征矩阵进行特征分布优化以得到多个优化后货物状态子特征矩阵;将所述多个优化后货物状态子特征矩阵通过包含嵌入层的全局特征感知器以得到货物状态全局特征向量;以及
将所述货物状态全局特征向量通过分类器以得到分类结果,所述分类结果用于表示货物的摆放状态是否正常。
本发明实施例中,对所述货物状态图像进行图像增强以得到增强货物状态图像,包括:对所述货物状态图像进行双边滤波处理以得到所述增强货物状态图像。
本发明实施例中,智能机器人驱动传感智能控制系统及其方法,其获取智能机器人的摄像头采集的货物状态图像;采用基于深度学习的人工智能技术,进行所述货物状态图像中关于货物的摆放状态全局隐含特征的充分表达,以此来准确地判断货物摆放状态,从而避免因摆放状态异常而导致的物流延误或损失,提高仓库物流管理的效率和准确性。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
如上所述,现有的仓库物流系统中,通常需要通过人工对货物进行处理和分类,并且货物的摆放位置也需要人工进行检查。这种方式不仅需要耗费大量的时间和人力资源,效率较低,而且容易受到人为因素的影响,导致误判或者漏判,造成物流的延误或损失。因此,期望一种优化的智能机器人驱动传感智能控制系统。
相应地,考虑到在实际仓库物流管理过程中,为了准确地判断货物摆放状态,从而避免因摆放状态异常而导致的物流延误或损失,在本发明的技术方案中,期望通过智能机器人的摄像头采集货物的状态图像,并基于机器视觉来分析货物的摆放状态是否正常。但是,由于所述货物状态图像中存在有大量的无用干扰信息,导致图像中关于货物的摆放状态的细节特征难以准确地进行捕捉。并且,传统的图像分析方法往往只考虑局部特征,而没有全局认知能力,容易受到光线、噪音等环境因素影响。因此,在此过程中,难点在于如何进行所述货物状态图像中关于货物的摆放状态全局隐含特征的充分表达,以此来准确地判断货物摆放状态,从而避免因摆放状态异常而导致的物流延误或损失,提高仓库物流管理的效率和准确性。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。深度学习以及神经网络的发展为挖掘所述货物状态图像中关于货物的摆放状态全局隐含特征信息提供了新的解决思路和方案。
具体地,在本发明的技术方案中,首先,获取智能机器人的摄像头采集的货物状态图像。接着,考虑到由于所述货物状态图像在采集的过程中,可能会存在大量的噪声干扰,导致图像中关于货物的摆放细节特征变得模糊,影响对于货物摆放状态的检测精准度,因此,在特征提取前需要对所述货物状态图像进行图像增强处理。特别地,可以对于所述货物状态图像进行双边滤波处理以得到增强货物状态图像。应可以理解,双边滤波是一种有效的非线性滤波方法,它能够同时考虑空间域信息和灰度相似性,对于边缘保存有很好的效果。因此,在对所述货物状态图像进行图像增强时,期望使用双边滤波来去除图像噪声和增强图像的细节。值得一提的是,双边滤波不仅可以去除噪声,还在高斯滤波的基础上,多了一个基于空间域分布的高斯滤波函数,进而有效地解决了距离较远的像素影响边缘像素的问题,达到保护边缘去除噪声的目的。
然后,使用在图像的隐含特征提取方面具有优异表现的卷积神经网络模型来进行所述增强货物状态图像的特征提取,特别地,考虑到在进行所述货物的摆放状态检测时,应更加关注于空间位置上关于货物的摆放状态特征信息而忽略与货物的摆放状态检测无关的干扰特征。鉴于注意力机制能够选择聚焦位置,产生更具分辨性的特征表示,且加入注意力模块后的特征会随着网络的加深产生适应性的改变。因此,在本发明的技术方案中,将所述增强货物状态图像通过使用空间注意力机制的卷积神经网络模型中进行处理,以提取出所述增强货物状态图像中聚焦于空间上的关于所述货物的摆放状态隐含特征分布信息,从而得到货物状态特征矩阵。值得一提的是,这里,所述空间注意力所提取到的图像特征则反映了空间维度特征差异的权重,用来抑制或强化不同空间位置的特征,以此来提取出空间上聚焦于货物的摆放状态特征信息。
进一步地,还考虑到由于所述使用空间注意力机制的卷积神经网络模型虽然能够提取出聚焦于空间位置上的关于货物的摆放状态特征信息,但是由于卷积运算的固有局限性,纯CNN的方法仅能够捕捉到局部隐含关联特征,其感受野有限,很难学习明确的全局和远程语义信息交互。因此,为了能够捕捉到所述增强货物状态图像中基于全局的关于货物的摆放状态隐含特征分布信息,在本发明的技术方案中,进一步对所述货物状态特征矩阵进行特征矩阵切分以得到多个货物状态子特征矩阵后,将所述多个货物状态子特征矩阵通过包含嵌入层的全局特征感知器中进行编码以得到货物状态全局特征向量。特别地,这里,所述包含嵌入层的全局特征感知器使用上下文编码器来进行编码,以此来提取出所述增强货物状态图像中的各个局部区域特征的基于全局的关于货物摆放状态的隐含关联特征信息,从而得到具有全局感受野的所述货物状态全局特征向量。
接着,进一步再将所述货物状态全局特征向量作为分类特征向量通过分类器中进行分类处理,以得到用于表示货物的摆放状态是否正常的分类结果。也就是,在本发明的技术方案中,所述分类器的标签包括货物的摆放状态正常(第一标签),以及,货物的摆放状态异常(第二标签),其中,所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。值得注意的是,这里的所述第一标签p1和所述第二标签p2并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“货物的摆放状态是否正常”这种概念,其只是有两种分类标签且输出特征在这两个分类标签下的概率,即p1和p2 之和为一。因此,货物的摆放状态是否正常的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“货物的摆放状态是否正常”的语言文本意义。应可以理解,在本发明的技术方案中,所述分类器的分类标签为货物的摆放状态是否正常的检测评估标签,因此,在得到所述分类结果后,可基于所述分类结果来进行货物的摆放状态是否正常的判断,从而避免因摆放状态异常而导致的物流延误或损失。
特别地,在本发明的技术方案中,在将所述多个货物状态子特征矩阵通过包含嵌入层的全局特征感知器得到所述货物状态全局特征向量时,包含嵌入层的全局特征感知器是对所述多个货物状态子特征矩阵表达的所述增强货物状态图像的各个空间注意力强化局部特征分布进行上下文关联编码。但是,考虑到空间注意力机制会加大所述货物状态特征矩阵的各个局部的特征分布的差异,导致从所述多个货物状态子特征矩阵通过包含嵌入层的全局特征感知器得到的多个上下文货物状态子特征向量之间的高维特征流形的流形几何一致性差,这会提升所述多个上下文货物状态子特征向量级联得到的所述货物状态全局特征向量通过分类器进行分类回归时的收敛难度,也就是,会降低训练速度和收敛到的分类结果的准确性。
因此,本发明的申请人分别计算所述多个货物状态子特征矩阵的每个货物状态子特征矩阵的基于凸分解的特征几何度量的逐片近似因数,表示为:,其中,/>是每个货物状态子特征矩阵/>的第/>个行向量或者列向量,/>表示将各个向量级联,且/>表示向量的二范数的平方。
具体地,所述基于凸分解的特征几何度量的逐片近似因数可以通过的平滑最大函数来定义每个特征矩阵的高维特征流形的局部几何形状间的符号化距离度量,以基于高维特征流形的凸多面体(convex polytope)分解来获得每个凸多面体对象的可微的凸指示符(convex indicator),并进而以/>函数确定用于表达高维特征流形的可学习的逐片凸分解的超平面距离参数,以近似地度量特征几何。这样,通过以所述基于凸分解的特征几何度量的逐片近似因数对各个上下文货物状态子特征向量进行加权,就可以提升各个上下文货物状态子特征向量的高维特征流形的流形几何一致性,从而提升所述货物状态全局特征向量通过分类器进行分类回归时的收敛难度,以改进训练速度和收敛到的分类结果的准确性。这样,能够准确地判断货物摆放状态,从而避免因摆放状态异常而导致的物流延误或损失,以提高仓库物流管理的效率和准确性。
图1为本发明实施例中提供的一种智能机器人驱动传感智能控制系统的应用场景图。如图1所示,在该应用场景中,首先,获取智能机器人的摄像头采集的货物状态图像(例如,如图1中所示意的C);然后,将获取的货物状态图像输入至部署有智能机器人驱动传感智能控制算法的服务器(例如,如图1中所示意的S)中,其中所述服务器能够基于智能机器人驱动传感智能控制算法对所述货物状态图像进行处理,以生成用于表示货物的摆放状态是否正常的分类结果。
在介绍了本发明的基本原理之后,下面将参考附图来具体介绍本发明的各种非限制性实施例。
在本发明的一个实施例中,图2为本发明实施例中提供的一种智能机器人驱动传感智能控制系统的框图。如图2所示,根据本发明实施例的智能机器人驱动传感智能控制系统100,包括:图像采集模块110,用于获取智能机器人的摄像头采集的货物状态图像;图像增强模块120,用于对所述货物状态图像进行图像增强以得到增强货物状态图像;空间特征增强模块130,用于将所述增强货物状态图像通过使用空间注意力机制的卷积神经网络模型以得到货物状态特征矩阵;矩阵切分模块140,用于对所述货物状态特征矩阵进行特征矩阵切分以得到多个货物状态子特征矩阵;特征优化模块150,用于对所述多个货物状态子特征矩阵进行特征分布优化以得到多个优化后货物状态子特征矩阵;全局特征感知模块160,用于将所述多个优化后货物状态子特征矩阵通过包含嵌入层的全局特征感知器以得到货物状态全局特征向量;以及,货物摆放状态检测模块170,用于将所述货物状态全局特征向量通过分类器以得到分类结果,所述分类结果用于表示货物的摆放状态是否正常。
具体地,在本发明实施例中,所述图像采集模块110,用于获取智能机器人的摄像头采集的货物状态图像。如上所述,现有的仓库物流系统中,通常需要通过人工对货物进行处理和分类,并且货物的摆放位置也需要人工进行检查。这种方式不仅需要耗费大量的时间和人力资源,效率较低,而且容易受到人为因素的影响,导致误判或者漏判,造成物流的延误或损失。因此,期望一种优化的智能机器人驱动传感智能控制系统。
相应地,考虑到在实际仓库物流管理过程中,为了准确地判断货物摆放状态,从而避免因摆放状态异常而导致的物流延误或损失,在本发明的技术方案中,期望通过智能机器人的摄像头采集货物的状态图像,并基于机器视觉来分析货物的摆放状态是否正常。但是,由于所述货物状态图像中存在有大量的无用干扰信息,导致图像中关于货物的摆放状态的细节特征难以准确地进行捕捉。并且,传统的图像分析方法往往只考虑局部特征,而没有全局认知能力,容易受到光线、噪音等环境因素影响。因此,在此过程中,难点在于如何进行所述货物状态图像中关于货物的摆放状态全局隐含特征的充分表达,以此来准确地判断货物摆放状态,从而避免因摆放状态异常而导致的物流延误或损失,提高仓库物流管理的效率和准确性。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。深度学习以及神经网络的发展为挖掘所述货物状态图像中关于货物的摆放状态全局隐含特征信息提供了新的解决思路和方案。
具体地,在本发明的技术方案中,首先,获取智能机器人的摄像头采集的货物状态图像。
具体地,在本发明实施例中,所述图像增强模块120,用于对所述货物状态图像进行图像增强以得到增强货物状态图像。接着,考虑到由于所述货物状态图像在采集的过程中,可能会存在大量的噪声干扰,导致图像中关于货物的摆放细节特征变得模糊,影响对于货物摆放状态的检测精准度,因此,在特征提取前需要对所述货物状态图像进行图像增强处理。特别地,可以对于所述货物状态图像进行双边滤波处理以得到增强货物状态图像。
应可以理解,双边滤波是一种有效的非线性滤波方法,它能够同时考虑空间域信息和灰度相似性,对于边缘保存有很好的效果。因此,在对所述货物状态图像进行图像增强时,期望使用双边滤波来去除图像噪声和增强图像的细节。值得一提的是,双边滤波不仅可以去除噪声,还在高斯滤波的基础上,多了一个基于空间域分布的高斯滤波函数,进而有效地解决了距离较远的像素影响边缘像素的问题,达到保护边缘去除噪声的目的。
其中,所述图像增强模块120,用于:对所述货物状态图像进行双边滤波处理以得到所述增强货物状态图像。
具体地,在本发明实施例中,所述空间特征增强模块130,用于将所述增强货物状态图像通过使用空间注意力机制的卷积神经网络模型以得到货物状态特征矩阵。然后,使用在图像的隐含特征提取方面具有优异表现的卷积神经网络模型来进行所述增强货物状态图像的特征提取,特别地,考虑到在进行所述货物的摆放状态检测时,应更加关注于空间位置上关于货物的摆放状态特征信息而忽略与货物的摆放状态检测无关的干扰特征。鉴于注意力机制能够选择聚焦位置,产生更具分辨性的特征表示,且加入注意力模块后的特征会随着网络的加深产生适应性的改变。
因此,在本发明的技术方案中,将所述增强货物状态图像通过使用空间注意力机制的卷积神经网络模型中进行处理,以提取出所述增强货物状态图像中聚焦于空间上的关于所述货物的摆放状态隐含特征分布信息,从而得到货物状态特征矩阵。值得一提的是,这里,所述空间注意力所提取到的图像特征则反映了空间维度特征差异的权重,用来抑制或强化不同空间位置的特征,以此来提取出空间上聚焦于货物的摆放状态特征信息。
其中,所述空间特征增强模块130,用于:使用空间注意力机制的卷积神经网络模型的各层在层的正向传递过程中对输入数据分别进行:对输入数据进行卷积处理以生成卷积特征图;对所述卷积特征图进行池化处理以生成池化特征图;对所述池化特征图进行非线性激活以生成激活特征图;计算所述激活特征图的各个位置沿通道维度的均值以生成空间特征矩阵;计算所述空间特征矩阵中各个位置的类Softmax函数值以获得空间得分矩阵;以及,计算所述空间特征矩阵和所述空间得分矩阵的按位置点乘以获得特征矩阵;其中,所述使用空间注意力机制的卷积神经网络模型的最后一层输出的所述特征矩阵为所述货物状态特征矩阵阵。
注意力机制是机器学习中的一种数据处理方法,广泛应用在自然语言处理、图像识别及语音识别等各种不同类型的机器学习任务中。一方面,注意力机制就是希望网络能够自动学出来图片或者文字序列中的需要注意的地方;另一方面,注意力机制通过神经网络的操作生成一个掩码mask, mask上的值的权重。 一般来说,空间注意力机制对于同一像素点不同通道求均值,再经过一些卷积和上采样的运算得到空间特征,空间特征每层的像素点就被赋予不同的权重。
具体地,在本发明实施例中,所述矩阵切分模块140,用于对所述货物状态特征矩阵进行特征矩阵切分以得到多个货物状态子特征矩阵。进一步地,还考虑到由于所述使用空间注意力机制的卷积神经网络模型虽然能够提取出聚焦于空间位置上的关于货物的摆放状态特征信息,但是由于卷积运算的固有局限性,纯CNN的方法仅能够捕捉到局部隐含关联特征,其感受野有限,很难学习明确的全局和远程语义信息交互。因此,为了能够捕捉到所述增强货物状态图像中基于全局的关于货物的摆放状态隐含特征分布信息,在本发明的技术方案中,进一步对所述货物状态特征矩阵进行特征矩阵切分以得到多个货物状态子特征矩阵
具体地,在本发明实施例中,所述特征优化模块150,用于对所述多个货物状态子特征矩阵进行特征分布优化以得到多个优化后货物状态子特征矩阵。图3为本发明实施例中提供的一种智能机器人驱动传感智能控制系统中所述特征优化模块的框图,如图3所示,所述特征优化模块150,包括:优化因数计算单元151,用于计算所述各个货物状态子特征矩阵的基于凸分解的特征几何度量的逐片近似因数以得到多个基于凸分解的特征几何度量的逐片近似因数;以及,加权优化单元152,用于以所述多个基于凸分解的特征几何度量的逐片近似因数作为加权系数对所述多个货物状态子特征矩阵进行加权优化以得到多个优化后货物状态子特征矩阵。
特别地,在本发明的技术方案中,在将所述多个货物状态子特征矩阵通过包含嵌入层的全局特征感知器得到所述货物状态全局特征向量时,包含嵌入层的全局特征感知器是对所述多个货物状态子特征矩阵表达的所述增强货物状态图像的各个空间注意力强化局部特征分布进行上下文关联编码。但是,考虑到空间注意力机制会加大所述货物状态特征矩阵的各个局部的特征分布的差异,导致从所述多个货物状态子特征矩阵通过包含嵌入层的全局特征感知器得到的多个上下文货物状态子特征向量之间的高维特征流形的流形几何一致性差,这会提升所述多个上下文货物状态子特征向量级联得到的所述货物状态全局特征向量通过分类器进行分类回归时的收敛难度,也就是,会降低训练速度和收敛到的分类结果的准确性。
因此,本发明的申请人分别计算所述多个货物状态子特征矩阵的每个货物状态子特征矩阵的基于凸分解的特征几何度量的逐片近似因数,表示为:以如下优化公式计算所述各个货物状态子特征矩阵的基于凸分解的特征几何度量的逐片近似因数以得到所述多个基于凸分解的特征几何度量的逐片近似因数;其中,所述优化公式为:,其中,/>是第/>个所述货物状态子特征矩阵的第/>个行向量或者列向量,/>表示/>函数,/>表示/>函数,表示将各个向量级联,且/>表示向量的二范数的平方,/>表示所述多个基于凸分解的特征几何度量的逐片近似因数中第/>个基于凸分解的特征几何度量的逐片近似因数。
具体地,所述基于凸分解的特征几何度量的逐片近似因数可以通过的平滑最大函数来定义每个特征矩阵的高维特征流形的局部几何形状间的符号化距离度量,以基于高维特征流形的凸多面体(convex polytope)分解来获得每个凸多面体对象的可微的凸指示符(convex indicator),并进而以/>函数确定用于表达高维特征流形的可学习的逐片凸分解的超平面距离参数,以近似地度量特征几何。这样,通过以所述基于凸分解的特征几何度量的逐片近似因数对各个上下文货物状态子特征向量进行加权,就可以提升各个上下文货物状态子特征向量的高维特征流形的流形几何一致性,从而提升所述货物状态全局特征向量通过分类器进行分类回归时的收敛难度,以改进训练速度和收敛到的分类结果的准确性。这样,能够准确地判断货物摆放状态,从而避免因摆放状态异常而导致的物流延误或损失,以提高仓库物流管理的效率和准确性。
具体地,在本发明实施例中,所述全局特征感知模块160,用于将所述多个优化后货物状态子特征矩阵通过包含嵌入层的全局特征感知器以得到货物状态全局特征向量。然后,将所述多个优化后货物状态子特征矩阵通过包含嵌入层的全局特征感知器中进行编码以得到货物状态全局特征向量。特别地,这里,所述包含嵌入层的全局特征感知器使用上下文编码器来进行编码,以此来提取出所述增强货物状态图像中的各个局部区域特征的基于全局的关于货物摆放状态的隐含关联特征信息,从而得到具有全局感受野的所述货物状态全局特征向量。
图4为本发明实施例中提供的一种智能机器人驱动传感智能控制系统中所述全局特征感知模块的框图,如图4所示,所述全局特征感知模块160,包括:嵌入化单元161,用于使用所述包含嵌入层的全局特征感知器的嵌入层对所述多个优化后货物状态子特征矩阵中的各个优化后货物状态子特征矩阵进行向量嵌入化以得到货物状态嵌入向量的序列;以及,转换编码单元162,用于将所述货物状态嵌入向量的序列输入所述包含嵌入层的全局特征感知器的转换器以得到所述货物状态全局特征向量。
图5为本发明实施例中提供的一种智能机器人驱动传感智能控制系统中所述转换编码单元的框图,如图5所示,所述转换编码单元162,包括:向量构造子单元1621,用于将所述货物状态嵌入向量的序列进行一维排列以得到货物状态全局特征向量;自注意子单元1622,用于计算所述货物状态全局特征向量与所述货物状态嵌入向量的序列中各个货物状态嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;标准化子单元1623,用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;关注度计算子单元1624,用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及,注意力施加子单元1625,用于分别以所述多个概率值中各个概率值作为权重对所述货物状态嵌入向量的序列中各个货物状态嵌入向量进行加权以得到所述货物状态全局特征向量。
在本发明的一个实施例中,所述全局特征感知器被实施为上下文编码器,其中,上下文编码器旨在挖掘得到词序列中上下文之间的隐藏模式,可选地,编码器包括:CNN(Convolutional Neural Network,卷积神经网络)、Recursive NN(RecursiveNeuralNetwork,递归神经网络)、语言模型(Language Model)等。基于CNN的方法对于局部特征有比较好的提取效果,但其对于句子中的长程依赖(Long-term Dependency)问题效果欠佳,因此基于Bi-LSTM(Long Short- Term Memory,长短期记忆网络)的编码器被广泛使用。Recursive NN把句子当作树状结构而非序列进行处理,从理论上而言具有更强的表示能力,但其存在样本标注难度大、深层易梯度消失、难以并行计算等弱点,因此在实际应用中使用 较少。Transformer是应用广泛的网络结构了,同时具有CNN和RNN的特性,对于全局特征有较好的提取效果,同时相较于RNN(RecurrentNeural Network,循环神经网络)在并行计算上具有一定优势。
具体地,在本发明实施例中,所述货物摆放状态检测模块170,用于将所述货物状态全局特征向量通过分类器以得到分类结果,所述分类结果用于表示货物的摆放状态是否正常。接着,进一步再将所述货物状态全局特征向量作为分类特征向量通过分类器中进行分类处理,以得到用于表示货物的摆放状态是否正常的分类结果。也就是,在本发明的技术方案中,所述分类器的标签包括货物的摆放状态正常(第一标签),以及,货物的摆放状态异常(第二标签),其中,所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。
值得注意的是,这里的所述第一标签p1和所述第二标签p2并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“货物的摆放状态是否正常”这种概念,其只是有两种分类标签且输出特征在这两个分类标签下的概率,即p1和p2 之和为一。因此,货物的摆放状态是否正常的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“货物的摆放状态是否正常”的语言文本意义。
应可以理解,在本发明的技术方案中,所述分类器的分类标签为货物的摆放状态是否正常的检测评估标签,因此,在得到所述分类结果后,可基于所述分类结果来进行货物的摆放状态是否正常的判断,从而避免因摆放状态异常而导致的物流延误或损失。
图6为本发明实施例中提供的一种智能机器人驱动传感智能控制系统中所述货物摆放状态检测模块的框图,如图6所示,所述货物摆放状态检测模块170,包括:全连接编码单元171,用于使用所述分类器的多个全连接层对所述货物状态全局特征向量进行全连接编码以得到编码分类特征向量;以及,分类单元172,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
综上,基于本发明实施例的智能机器人驱动传感智能控制系统100被阐明,其获取智能机器人的摄像头采集的货物状态图像;采用基于深度学习的人工智能技术,进行所述货物状态图像中关于货物的摆放状态全局隐含特征的充分表达,以此来准确地判断货物摆放状态,从而避免因摆放状态异常而导致的物流延误或损失,提高仓库物流管理的效率和准确性。
如上所述,根据本发明实施例的智能机器人驱动传感智能控制系统100可以实现在各种终端设备中,例如用于智能机器人驱动传感智能控制的服务器等。在一个示例中,根据本发明实施例的智能机器人驱动传感智能控制系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该智能机器人驱动传感智能控制系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该智能机器人驱动传感智能控制系统100同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该智能机器人驱动传感智能控制系统100与该终端设备也可以是分立的设备,并且该智能机器人驱动传感智能控制系统100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
在本发明的一个实施例中,图7为本发明实施例中提供的一种智能机器人驱动传感智能控制方法的流程图。如图7所示,根据本发明实施例的一种智能机器人驱动传感智能控制方法,其包括:210,获取智能机器人的摄像头采集的货物状态图像;220,对所述货物状态图像进行图像增强以得到增强货物状态图像;230,将所述增强货物状态图像通过使用空间注意力机制的卷积神经网络模型以得到货物状态特征矩阵;240,对所述货物状态特征矩阵进行特征矩阵切分以得到多个货物状态子特征矩阵;250,对所述多个货物状态子特征矩阵进行特征分布优化以得到多个优化后货物状态子特征矩阵;260,将所述多个优化后货物状态子特征矩阵通过包含嵌入层的全局特征感知器以得到货物状态全局特征向量;以及,270,将所述货物状态全局特征向量通过分类器以得到分类结果,所述分类结果用于表示货物的摆放状态是否正常。
图8为本发明实施例中提供的一种智能机器人驱动传感智能控制方法的系统架构的示意图。如图8所示,在所述一种智能机器人驱动传感智能控制方法的系统架构中,首先,获取智能机器人的摄像头采集的货物状态图像;然后,对所述货物状态图像进行图像增强以得到增强货物状态图像;接着,将所述增强货物状态图像通过使用空间注意力机制的卷积神经网络模型以得到货物状态特征矩阵;然后,对所述货物状态特征矩阵进行特征矩阵切分以得到多个货物状态子特征矩阵;接着,对所述多个货物状态子特征矩阵进行特征分布优化以得到多个优化后货物状态子特征矩阵;然后,将所述多个优化后货物状态子特征矩阵通过包含嵌入层的全局特征感知器以得到货物状态全局特征向量;以及,最后,将所述货物状态全局特征向量通过分类器以得到分类结果,所述分类结果用于表示货物的摆放状态是否正常。
在本发明的一个具体示例中,在上述一种智能机器人驱动传感智能控制方法中,对所述货物状态图像进行图像增强以得到增强货物状态图像,包括:对所述货物状态图像进行双边滤波处理以得到所述增强货物状态图像。
在本发明的一个具体示例中,在上述一种智能机器人驱动传感智能控制方法中,将所述增强货物状态图像通过使用空间注意力机制的卷积神经网络模型以得到货物状态特征矩阵,包括:使用空间注意力机制的卷积神经网络模型的各层在层的正向传递过程中对输入数据分别进行:对输入数据进行卷积处理以生成卷积特征图;对所述卷积特征图进行池化处理以生成池化特征图;对所述池化特征图进行非线性激活以生成激活特征图;计算所述激活特征图的各个位置沿通道维度的均值以生成空间特征矩阵;计算所述空间特征矩阵中各个位置的类Softmax函数值以获得空间得分矩阵;以及,计算所述空间特征矩阵和所述空间得分矩阵的按位置点乘以获得特征矩阵;其中,所述使用空间注意力机制的卷积神经网络模型的最后一层输出的所述特征矩阵为所述货物状态特征矩阵阵。
在本发明的一个具体示例中,在上述一种智能机器人驱动传感智能控制方法中,对所述多个货物状态子特征矩阵进行特征分布优化以得到多个优化后货物状态子特征矩阵,包括:计算所述各个货物状态子特征矩阵的基于凸分解的特征几何度量的逐片近似因数以得到多个基于凸分解的特征几何度量的逐片近似因数;以及,以所述多个基于凸分解的特征几何度量的逐片近似因数作为加权系数对所述多个货物状态子特征矩阵进行加权优化以得到多个优化后货物状态子特征矩阵。
在本发明的一个具体示例中,在上述一种智能机器人驱动传感智能控制方法中,计算所述各个货物状态子特征矩阵的基于凸分解的特征几何度量的逐片近似因数以得到多个基于凸分解的特征几何度量的逐片近似因数,包括:以如下优化公式计算所述各个货物状态子特征矩阵的基于凸分解的特征几何度量的逐片近似因数以得到所述多个基于凸分解的特征几何度量的逐片近似因数;其中,所述优化公式为:,其中,/>是第/>个所述货物状态子特征矩阵的第/>个行向量或者列向量,/>表示/>函数,/>表示/>函数,表示将各个向量级联,且/>表示向量的二范数的平方,/>表示所述多个基于凸分解的特征几何度量的逐片近似因数中第/>个基于凸分解的特征几何度量的逐片近似因数。
在本发明的一个具体示例中,在上述一种智能机器人驱动传感智能控制方法中,将所述多个优化后货物状态子特征矩阵通过包含嵌入层的全局特征感知器以得到货物状态全局特征向量,包括:使用所述包含嵌入层的全局特征感知器的嵌入层对所述多个优化后货物状态子特征矩阵中的各个优化后货物状态子特征矩阵进行向量嵌入化以得到货物状态嵌入向量的序列;以及,将所述货物状态嵌入向量的序列输入所述包含嵌入层的全局特征感知器的转换器以得到所述货物状态全局特征向量。
在本发明的一个具体示例中,在上述一种智能机器人驱动传感智能控制方法中,将所述货物状态嵌入向量的序列输入所述包含嵌入层的全局特征感知器的转换器以得到所述货物状态全局特征向量,包括:将所述货物状态嵌入向量的序列进行一维排列以得到货物状态全局特征向量;计算所述货物状态全局特征向量与所述货物状态嵌入向量的序列中各个货物状态嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及,分别以所述多个概率值中各个概率值作为权重对所述货物状态嵌入向量的序列中各个货物状态嵌入向量进行加权以得到所述货物状态全局特征向量。
在本发明的一个具体示例中,在上述一种智能机器人驱动传感智能控制方法中,将所述货物状态全局特征向量通过分类器以得到分类结果,所述分类结果用于表示货物的摆放状态是否正常,包括:使用所述分类器的多个全连接层对所述货物状态全局特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
本领域技术人员可以理解,上述一种智能机器人驱动传感智能控制方法中的各个步骤的具体操作已经在上面参考图1到图6的一种智能机器人驱动传感智能控制系统的描述中得到了详细介绍,并因此,将省略其重复描述。
本发明实施例还提供一种计算机设备,用以解决现有卷积神经网络中池化层直接对卷积层输出的卷积运算结果进行池化运算,导致数据缓存空间较大的技术问题,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述方法实施例中任意一种可选或优选的基于卷积神经网络的图像处理方法。
本发明实施例还提供一种计算机可读存储介质,用以解决现有卷积神经网络中池化层直接对卷积层输出的卷积运算结果进行池化运算,导致数据缓存空间较大的技术问题,该计算机可读存储介质存储有执行上述方法实施例中任意一种可选或优选的基于卷积神经网络的图像处理方法的计算机程序。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。