CN113505629A - 一种基于轻量网络的智能仓储物件识别装置 - Google Patents

一种基于轻量网络的智能仓储物件识别装置 Download PDF

Info

Publication number
CN113505629A
CN113505629A CN202110359606.4A CN202110359606A CN113505629A CN 113505629 A CN113505629 A CN 113505629A CN 202110359606 A CN202110359606 A CN 202110359606A CN 113505629 A CN113505629 A CN 113505629A
Authority
CN
China
Prior art keywords
image acquisition
turntable
convolution layer
acquisition equipment
back bone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110359606.4A
Other languages
English (en)
Inventor
安康
陆叶斌
苗田恬
上官倩芡
方祖华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Normal University
University of Shanghai for Science and Technology
Original Assignee
Shanghai Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Normal University filed Critical Shanghai Normal University
Priority to CN202110359606.4A priority Critical patent/CN113505629A/zh
Publication of CN113505629A publication Critical patent/CN113505629A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于轻量网络的智能仓储物件识别装置,包括一用于放置待识别件的转盘,转盘与转盘驱动装置连接,在转盘驱动装置的驱动下可水平旋转;围绕转盘布置有两个以上视野中心对准转盘中心的图像采集设备,图像采集设备布置在所述转盘的不同方位上且其与转盘间的高度差不同;图像采集设备、转盘驱动装置分别与中央处理单元连接,中央处理器通过图像采集设备获取待识别件的图片,而后将其输入训练好的Densenet改进模型中,训练好的Densenet改进模型输出目标类别。本发明的装置,识别效率高、数据处理量小且识别精度高,极具应用前景。

Description

一种基于轻量网络的智能仓储物件识别装置
技术领域
本发明属于设备识别技术领域,涉及一种基于轻量网络的智能仓储物件 识别装置。
背景技术
从20世纪开始,机器视觉经历了近60年的发展已经出现的众多应用, 也是当下各界学者的热点研究方向之一。将机器视觉应用到检测、交通、医 疗图像、监控系统当中的案例数不胜数,将机器视觉应用到工业仓储当中能 够有助于更快实现工业智能化。由于机器视觉系统可以快速获取大量信息, 而且易于自动处理,也易于同设计信息以及加工控制信息集成,因此,在现 代自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验 和质量控制等领域。但是机器视觉技术比较复杂,最大的困难在于人的视觉 机制尚不清楚。因此建立机器视觉系统仍存在一定复杂性。在研究机器视觉 的过程中,获取一张高质量的可用图像至关重要,因此为保证图像质量,整 个结构对于光源系统的要求很高,对比度、亮度、鲁棒性(位置敏感度)等 都是设计过程中需要慎重考虑的问题。可以预见的是,随着机器视觉技术自 身的成熟和发展,它将在现代和未来制造业中得到越来越广泛的应用。
随着物联网的快速发展,各行各业都在开发智能仓储系统,尤其体现在 物流行业。在工业环境中建立智能仓储系统将极大提升查找效率,现代工业 仓储系统内部不仅物品复杂,而且形态各异、性能各异,实现动态存取、智 能查询可以为工业智能化提供良好的保证。
传统工业生产或仓储场景中,对生产物料(器件)或货物的识别跟踪通 常以打标签(条形码、二维码)的方式实现,通过人力来对打过标签(如二 维码)的货物存放到仓库的固定位置,取货时通过扫描标签获取货物在仓库 的位置,实现货物取放,或者设置于传送带上的扫码系统扫描通过的物料, 实现对物料的跟踪。而对于非标准货物(数量少)或异形货物(无法打标签), 打标签方式效率低或者根本无法实现。对于此类货物,当前的仓储系统主要 是在特定角度采集特定状态的零件,而后完成零件识别,为完成零件识别往 往还需要使用理料机与图像采集设备配合,其不仅采集非常繁琐且不易于管 理,而且理料机往往需要定制,其价格昂贵,同时其难以适用于不规则且复 杂的物料整理。
此外,目标检测是计算机视觉领域的重要研究方向之一,传统的目标检 测方法是通过构建特征描述子提取特征后利用分类器对特征进行分类实现目 标检测,如梯度方向直方图HOG(Histogram of Oriented Gradient)和支持向量机 SVM(Support VectorMachine)。随着深度学习在图像分类领域的优异表现,卷 积神经网络在计算机视觉的各领域开始得到了广泛使用。在目标检测领域中 使用深度学习实现目标检测成为一个新的方向。传统神经网络使用使用全连 接层进行层与层之间的连接,而卷积神经网络的权值共享网络使得计算量大 幅度减少,降低了网络模型的复杂度。卷积神经网络的平移不变性可以使其 更好处理图片的特征,基于图像识别方法出现了大量的卷积神经网络,从最 初的LeNet、AlexNet、ZFNext、VGGNet、Inception系列、ResNet系列到轻 量型神经网络,这些算法在基于Backbone上进行修改,能够得到很高的精度, 这些技术被逐步使用到了人脸识别,智能仓储等其他应用中。尽管如此,该 技术目前还存在以下缺陷:由于残差连接的出现,使其在保证精度的前提下 能够堆叠更深的网络,但这同时也增大了网络模型的复杂度、计算量,一些 商用计算机能够凭借优越的GPU和内存能够运行这些网络,但对于一些性能 有限的嵌入式设备而言,其处理数据量过大,难以满足时效与精度的要求。
因此,开发一种精度高、数据处理量小且适用性好的仓储物件识别装置 极具现实意义。
发明内容
本发明的目的在于克服现有仓储识别系统识别效率及识别精度低、处理 数据量过大且适用性较差的缺陷,提供一种精度高、数据处理量小且适用性 好的仓储物件识别装置。
为实现上述目的,本发明提供如下技术方案:
一种基于轻量网络的智能仓储物件识别装置,包括一用于放置待识别件 的转盘,所述转盘与转盘驱动装置连接,在转盘驱动装置的驱动下可水平旋 转;
围绕所述转盘布置有两个以上视野中心对准转盘中心的图像采集设备, 所述图像采集设备布置在所述转盘的不同方位上且其与转盘间的高度差不同;
所述图像采集设备、转盘驱动装置分别与中央处理单元连接,所述中央 处理器通过图像采集设备获取待识别件的图片,而后将其输入训练好的 Densenet改进模型中,训练好的Densenet改进模型输出目标类别;
所述Densenet改进模型相比于Densenet模型的改进之处在于,网块(Net Block)中的Back Bone包括Channel Split、第一卷积层(第一Conv)、第二 卷积层(第二Conv)、第三卷积层(第三Conv)、第一深度分离卷积层(第一 DWConv)、第二深度分离卷积层(第二DWConv)、Concat、Channel Shuffle, 其中Channel Split、第一卷积层(第一Conv)、第一深度分离卷积层(第一 DWConv)、第二卷积层(第二Conv)、Concat、Channel Shuffle依次连接,第 二深度分离卷积层(第二DWConv)、第三卷积层(第三Conv)与第一卷积 层(第一Conv)、第一深度分离卷积层(第一DWConv)、第二卷积层(第二 Conv)并联,第二深度分离卷积层(第二DWConv)与Channel Split连接, 第三卷积层(第三Conv)与Concat连接。即BackBone的输出通道经过Channel Split分配后一部分经过第一卷积层(第一Conv)、第一深度分离卷积层(第 一DWConv)、第二卷积层(第二Conv),另一部分经第二深度分离卷积层(第二DWConv)、第三卷积层(第三Conv),而后通过Concat合并再通过Channel Shuffle将这些通道进行通道打乱输出到下一层,作为下一层的输入。
本发明的基于轻量网络的智能仓储物件识别装置中的转盘可调整零件的 方位,增加数据丰富性与可靠性,相比于传统机器视觉中只采用俯视图像进 行识别,多视角的图像(其设有的多个不同方位及不同高度的图像采集设备 能够在图像采集过程中获取待识别件的外部全貌)能提供更多的零件信息, 有利于深度学习模型学习到更为完整的零件信息,并且可以防止过拟合,提 升模型泛化能力,不仅能够提高识别效率,而且适用于不规则零件的识别, 大大提高了系统的适用性;此外本发明还首次提出在卷积神经网络结合ShuffleNet通道打算顺序的特性、ResNet中的残差网络、Inception中通道分割、 DenseNet中多重残网络以及MobileNet中的DWConv得到Densenet改进模型, 其相比于传统网络以及轻量化网络进一步提升精度和缩小模型的结构,而应 用Densenet改进模型完成目标类别识别,不仅数据处理量小,而且其识别精 度高,极具应用前景。
作为优选的技术方案:
如上所述的一种基于轻量网络的智能仓储物件识别装置,所述中央处理 器运行如下程序进行数据增强:
(1)待识别件安放在转盘的中心后,中央处理单元开启转盘驱动装置及 所有的图像采集设备,转盘驱动装置驱动转盘水平旋转,图像采集设备定时 对待识别件进行图像采集,在图像采集设备进行图像采集的同时中央处理单 元将记录图像采集设备的观察视角信息,并将采集的图像与观察视角信息数 据信息进行映射构成所述数据集,第n个图像采集设备第t时刻观察视角信息 Gt n的表达式具体如下:
Figure BDA0003004982600000041
Figure BDA0003004982600000051
其中,rn为第n个图像采集设备与转盘中心连线的距离,θn为第n个图像 采集设备与转盘所在水平面的夹角,
Figure BDA0003004982600000052
为第t时刻第n个图像采集设备的水 平面投影与x轴的夹角,
Figure BDA0003004982600000053
为初始时刻第n个图像采集设备的水平面投影与 x轴的夹角,x轴为以转盘中心为原点、以转盘所在水平面为x轴、y轴所在 面所建立的坐标系中的x轴,V表示转盘的旋转速度;
(2)对数据集中的图像采集设备观察视角信息数据进行增强处理,增强 后的第n个图像采集设备第t时刻的观察视角信息Ht n的表达式具体如下:
Figure BDA0003004982600000054
Figure BDA0003004982600000055
其中,
Figure BDA0003004982600000056
为增强后的数据相比于第n个图像采集设备第t时刻的观察视角 信息的旋转角度,[dx,dy]分别表示增强后的数据相比于第n个图像采集设备第 t时刻的观察视角信息x、y轴方向上的平移分量。
本发明的装置在数据采集过程中,在内部以转盘中心为原点建立笛卡尔 坐标系,当物体放置转盘中心位置开始采集图像后,计算相机相对物体的视 角的实时空间极坐标描述(用以描述不同角度摄像单元的空间位姿),从而在 获取的物体图像数据中标注基于空间极坐标表示的观察视角信息(包括识别 角度与距离参数),增加后续识别过程的效率和准确性。
如上所述的一种基于轻量网络的智能仓储物件识别装置,所述增强后的 数据对应的状态相比于增强对象对应的状态左右或上下平移小于等于20%或 者顺或逆时针的随机旋转角度小于等于30°,此处仅给出一种可行的技术方 案,本领域技术人员可根据实际需求通过平移和旋转操作生成增强数据。
如上所述的一种基于轻量网络的智能仓储物件识别装置,所述转盘布置 在一框架内,所述图像采集设备固定在框架上,框架上还固定有光源;
所述转盘下布置黑色背板;黑色背板、光源与柔光罩共同构成本装置的 光源系统,提供漫反射所需条件,其照明条件是基于漫反射照明的,其用于 为装置提供稳定、适宜的光照环境,避免图像采集受到外界噪声干扰与影响, 提高识别正确率。
所述转盘驱动装置为驱动电机。
如上所述的一种基于轻量网络的智能仓储物件识别装置,所述光源布置 在转盘的上方,所述框架外套有柔光罩;
所述框架为方形框架;
所述图像采集设备共有五个,分别布置在框架的四周及顶部,且五个图 像采集设备与转盘的高度差均不相同;五个图像采集设备可以实现并行采集, 采集1次可得到5张同一零件不同视角的图像数据,大幅提升采集速度与效 率;
所述框架的转角处圆角过渡,防止局部压强过大损坏设备;所述框架由 多根铝合金方管固定拼接而成,框架为智能视觉图像采集系统的图像采集设 备提供稳定的结构支持,整个装置中除了待识别件,其余部分(框架、图像 采集设备、转盘、转盘驱动装置、光源、柔光罩及黑色背板)均固定为一体, 防止在移动过程中产生安装误差或碰撞损坏。
如上所述的一种基于轻量网络的智能仓储物件识别装置,所述Densenet 改进模型包括依次连接的主卷积层(主Conv)、特征提取层(Pooling)、第一 网块、过渡层(Transition Layer)、第二网块、归类层(Classification Layer); 所述第一网块和第二网块结构相同;
所述Densenet改进模型的训练集与测试集的数量比为4:1。模型训练终点 为达到预设训练次数。本发明的保护范围并不仅限于此,训练集和测试集的 数量本领域技术人员可根据实际情况进行设置。
如上所述的一种基于轻量网络的智能仓储物件识别装置,所述网块包含 依次连接的第一Back Bone、第二Back Bone、第三Back Bone和第四Back Bone, 第一Back Bone的输出同时为第二Back Bone、第三Back Bone和第四Back Bone的输入,第二Back Bone的输出同时为第三Back Bone和第四Back Bone 的输入;
所述过渡层(Transition Layer)包括特征提取层(Pooling);
所述归类层(Classification Layer)包括平均池化层(global average pool)和Softmax分类器。
如上所述的一种基于轻量网络的智能仓储物件识别装置,所述Densenet 改进模型共有五个,每个Densenet改进模型均与图像采集设备一一对应(即 Densenet改进模型的训练及使用均与图像采集设备对应),其训练过程即以对 应图像采集设备采集到的已知类别的物品图像为输入,以物品的对应类别概 率为理论输出,不断调整模型参数的过程,训练的终止条件为达到训练次数 上限。训练Densenet改进模型所用的一组数据组包括对应图像采集设备采集 得到的已知类别的物品的图像和其对应的类别。
上述的Softmax分类器是用于计算各样本的分类概率的,具体如下:
Figure BDA0003004982600000071
式中,si表示Softmax分类器第i个神经元的输出值,si=F·η,F为某个 训练样本的图像特征向量,η为相应的权值,n为需要分类的类别数量;
而后根据概率yi计算得到训练误差:
Figure BDA0003004982600000081
当i=k时,θik=1,i表示第i个类别,当原始输入属于类别i时,yk *=1;
利用训练误差从卷积神经网络的最后一层依次往前反向传播,使用交叉 熵作为损失函数,Adam自适应梯度优化器进行优化,初始学习率设置为0.01, 训练轮次为100次,采用TensorFlow2.0框架进行实验,将训练好的模型进行 保存。
如上所述的一种基于轻量网络的智能仓储物件识别装置,获得各Densenet 改进模型输出的结果后根据选举规则确认最终结果(即目标类别)或者根据 各Densenet改进模型的权重系数确认最终结果,随权重调整算法,以5个 Densenet改进模型为例,其权重系数均为0.2,如果其中一个Densenet改进模 型多次预测出错n次,则会在[0,2n]中选取一个数字x,则新的权重z=0.2-x*0.01, 当z为0时,系统会发出警报同时移除该Densenet改进模型,设5个Densenet 改进模型分别预测的结果以及权重为y1、y2、y3、y4、y5、z1、z2、z3、z4、z5,如果y1、y2、y3相同,y4、y5相同,z1+z2+z3>z4+z5,则最后的结果为y1。根据 Densenet改进模型的性能不同,在初始化时可以设置不同的权重值比。
如上所述的一种基于轻量网络的智能仓储物件识别装置,所述图像采集 设备采集到的图像在应用前需要进行如下预处理:
(1)灰度化;
(2)去除图像噪音;
(3)使用canny算子进行边缘检测;
(4)根据边缘找出最小外接正方形,将整个外接正方形截取;
(5)将正方形的图像采用双线性插值的方法缩放至合适大小。
通过以上图像预处理方法进行图像标准化处理,以解决原始图像数据分 辨率过大、无效信息过多、图像方位混杂(不同零件的尺寸、形状差异)等 问题。
即首先采用高斯模糊对图像中的污点和划痕进行平滑;然后采用canny 边缘检测算法检测零件轮廓;接着对上述方法采用参数循环检测的自适应解 决参数问题,实现零件的定位,最后对图像进行裁剪。其步骤如下:
i)选择初始化高斯模糊半径r,若此时可以检测到零件边缘信息,直接进 入步骤iii),否则进入ii);
ii)对高斯模糊半径r减2,缩小模糊半径然后回到步骤(1),反复进行此 步骤检测到边缘信息;
iii)经过以上两个步骤,得到可以准确检测到零件边缘信息的高斯模糊半 径参数r′,同时计算出合适的双阈值对图像进行裁剪和缩放;
选取的高斯滤波公式如下所示:
Figure BDA0003004982600000091
其中是模糊半径,是正态分布的标准偏差。
Canny边缘检测,根据零件的定位信息,便可对零件图像进行裁剪,保留 零件主体区域,裁去污点和划痕的边缘信息。Canny边缘检测结果主要取决于 三个参数的选取,分别为高斯模糊半径和梯度幅度的两个阈值。
基于上述问题提出基于参数循环检测的自适应参数调整方法来完成参数 的自适应选取,从而实现零件边缘的准确检测。参数的自适应选取基于两个 基本假设:
a)污点划痕等噪声信息其体积远小于零件本身的体积,在高斯模糊半径 增大的过程中,污点和划痕的信息必然先于零件本身的信息被消除;
b)只要高斯模糊的半径足够大,可以平滑掉整张图片的所有梯度信息, 使得canny算子无法提取到有效信息。
有益效果:
(1)本发明的基于轻量网络的智能仓储物件识别装置,提供稳定的光照 环境,提高对不同外部光照的适应能力以及识别准确率,其上布置的多台不 同视角的相机可以同步并行采集图像,大大提高采集效率与准确率,通过空 间坐标系建立准确的相机与识别物件之间的距离、角度关系,并分别与相应 相机识别到的图片信息融合存储,首次提出将多观察视角信息与图像信息结 合,提高图像采集与后续识别准确率,其应用数据增强操作增加数据量;
(2)本发明的基于轻量网络的智能仓储物件识别装置,首次提出在卷积 神经网络结合ShuffleNet通道打算顺序的特性、ResNet中的残差网络、 Inception中通道分割、DenseNet中多重残网络以及MobileNet中的DWConv 得到Densenet改进模型,其相比于传统网络以及轻量化网络进一步提升精度 和缩小模型的结构,而应用Densenet改进模型完成目标类别识别,不仅数据 处理量小,而且其识别精度高,极具应用前景。
附图说明
图1为本发明的基于轻量网络的智能仓储物件识别装置的整体结构示意 图;
图2为本发明的基于轻量网络的智能仓储物件识别装置的空间立体坐标 表示示意图;
图3为几何特征自适应物件图像修正方法图;
图4为本发明的深度可分离卷积的基本结构图(其中a为现有技术的结 构图,b为本发明改进后的结构图);
图5为本发明的递减特征重用结构图;
图6为本发明的基于轻量网络的智能仓储物件识别装置进行识别操作的 流程图;
其中,1-框架,2-黑色背板,3-图像采集设备,4-光源,5-驱动电机。
具体实施方式
下面结合附图,对本发明的具体实施方式做进一步阐述,显然,所描述 的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、 “右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示 的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗 示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此 不能理解为对本发明的限制。
一种基于轻量网络的智能仓储物件识别装置,如图1所示,包括一用于 放置待识别件的转盘,转盘与转盘驱动装置(驱动电机5)连接,在转盘驱 动装置的驱动下可水平旋转,转盘布置在一框架1(方形框架,由多根铝合 金方管固定拼接而成,框架的转角处圆角过渡)内,转盘下布置黑色背板2, 框架1外套有柔光罩;
围绕转盘布置有五个视野中心对准转盘中心的图像采集设备3,图像采 集设备3位于转盘的上方固定在框架1上,五个图像采集设备分别布置在框 架的四周及顶部,且五个图像采集设备与转盘的高度差均不相同,框架1上 还固定有光源4,光源4布置在转盘的上方;
图像采集设备、转盘驱动装置分别与中央处理单元连接;
使用以上装置的操作流程具体如下:
(a)需要应用上述装置采集训练测试样本,将各类样品件放置在转盘上, 开启转盘及图像采集设备开启采集各类样品件的图像,同时,中央处理器运 行如下程序进行数据增强:
(a1)样品件安放在转盘的中心后,中央处理单元开启转盘驱动装置及 所有的图像采集设备,转盘驱动装置驱动转盘水平旋转,图像采集设备定时 对待识别件进行图像采集,在图像采集设备进行图像采集的同时中央处理单 元将记录图像采集设备的观察视角信息,并将采集的图像与观察视角信息数 据信息进行映射构成所述数据集,第n个图像采集设备第t时刻观察视角信息 Gt n的表达式具体如下:
Figure BDA0003004982600000121
Figure BDA0003004982600000122
其中,rn为第n个图像采集设备与转盘中心连线的距离,θn为第n个图像 采集设备与转盘所在水平面的夹角,
Figure BDA0003004982600000123
为第t时刻第n个图像采集设备的水 平面投影与x轴的夹角,
Figure BDA0003004982600000124
为初始时刻第n个图像采集设备的水平面投影与 x轴的夹角,x轴为以转盘中心为原点、以转盘所在水平面为x轴、y轴所在 面所建立的坐标系(其空间立体坐标表示示意图如图2所示)中的x轴,V表 示转盘的旋转速度;
(a2)对数据集中的图像采集设备观察视角信息数据进行增强处理,增 强后的第n个图像采集设备第t时刻的观察视角信息Ht n的表达式具体如下:
Figure BDA0003004982600000125
Figure BDA0003004982600000126
其中,
Figure BDA0003004982600000131
为增强后的数据(增强后的数据对应的状态相比于增强对象对 应的状态左右或上下平移小于等于20%或者顺或逆时针的随机旋转角度小于 等于30°)相比于第n个图像采集设备第t时刻的观察视角信息的旋转角度, [dx,dy]分别表示增强后的数据相比于第n个图像采集设备第t时刻的观察视角 信息x、y轴方向上的平移分量;
此外,图像在应用前需要进行如下预处理:
灰度化;去除图像噪音;使用canny算子进行边缘检测;根据边缘找出最 小外接正方形,将整个外接正方形截取;将正方形的图像采用双线性插值的 方法缩放至合适大小。
以上图像采集与预处理具体如下:
S1-1在UI界面中使用多线程开启多个角度的摄像头,将工业物件置于基 于漫反射照明的多视角零件数据采集系统中,对图像进行多视角采集;
S1-2对多视角采集到的图像采用几何特征自适应物件图像修正方法,具 体算法如下所示(如图3所示):
(1)选择初始化高斯模糊半径r,在该半径下,大部分的污点和划痕的边 缘信息均被抹去,不会被检测。若此时可以检测到零件边缘信息,则说明在 该半径下,canny算子可以检测到零件边缘,而不会检测到噪声,直接进入步 骤(3)。此时r较大,对于部分零件,其本身的边缘信息也被平滑掉,导致canny 算子不能检测到零件主体的边缘,此时进入步骤(2)。
(2)对高斯模糊半径r减2,缩小模糊半径然后回到步骤(1)。当canny 算子无法检测到边缘信息时,便一直重复步骤(1)和步骤(2),因此称为参数循 环检测算法。在采集所得零件图像中,零件的边缘信息幅值最大,连续性最 高,因此在循环检测过程中,可以保证最先被检测到的边缘信息一定位于零 件边缘处,而不是污点和划痕。
(3)经过以上两个步骤,得到可以准确检测到零件边缘信息的高斯模糊半 径参数r′。在此半径下利用canny算子实现边缘检测,得到仅包含零件边缘 信息的黑白图像,每一个像素点的取值为0或255,0为黑色表示背景,255 为白色表示物体边缘。对该图像进行遍历,可得到其边缘信息在x轴和y轴 上的上下限坐标,从而得到零件主体区域。设为最左侧白色像素点的轴坐标, 为最右侧白色像素点的轴坐标,为最上侧白色像素点的轴坐标,为最下侧白 色像素点的轴坐标,则可得到轮廓信息的边缘坐标区域为轴的到之间,轴的 到之间。本文采用正方形的图片作为数据的标准形式,为了得到完整的图片 信息并且便于数据增强中的平移旋转等操作,将截取区域向四周外扩30个像 素点,即以左上角坐标,以为边长来确定最终的截取区域。以这种方式截取 的图片将使得被检测零件位于图片中心,并且占据图片的主体部分。至此, 完成对零件的定位和裁剪工作。
经过多次实验,最终选取高斯模糊半径的初始化参数r=9,双阈值固定 为时,该算法能取得最好的效果,实现所有零件数据集的无差错定位。根据 零件的定位信息,便可对零件图像进行裁剪,保留零件主体区域,裁去空白 信息区。但此时得到的图像的像素尺寸与零件体积有关,不同体积的零件图 片具有不同的尺寸。为了得到更为标准的数据格式,还需对裁剪后的图片进 行缩放。为了减少缩放带来的信息损失,采用双线性插值法完成图片的缩放, 将所有图片缩放至80*80像素的统一尺寸,以完成数据集的初步构建。经过实际观察,此像素下的图片可以兼顾各种不同体积的零件,控制图像尺寸的 同时保留尽可能多的细节信息。对于小体积零件来说,裁剪和缩放可以使得 零件主体部分细节更加突出,整张图片的噪点和划痕数量也少了很多。
S1-3对S1-2步骤中得到的图像进行平移、翻转、旋转、对比度变化等操 作,使得图片发生轻微的变化而不影响物体特征,采用20%内的左右平移 和上下平移变换,顺时针和逆时针30°内的随机旋转,以及水平/垂直翻转和 对比度变化对数据集进行增强;
S1-4使用UI界面(由PyQt5编写)软件将采集和预处理的图像进行标注, 并且放在指定路径的文件夹下,同时软件将一部分数据以8:2分别放入训练 集和测试集,具体路径如下所示:
New_data/train/camera0/0/...jpg
New_data/train/camera1/0/...jpg New_data为数据集名称,camera为拍摄 角度,单独编号为零件的标签
New_data/test/camera0/0/...jpg从train中抽取一部分作为测试集
New_data可以自己设置其他路径名称。
S1-5判定采集到的同一种类的训练集中图像是否超过200张,如果超过 继续下面步骤,如果没超过,则再次进入到S1-3步骤中。
(b)通过以上处理即可获取足够量的训练测试样本后,使用与图像采集 设备对应的训练测试样本训练Densenet改进模型(即分别采用图像采集设备 I、II、III、IV及V采集的训练测试样本训练Densenet改进模型I、II、III、IV 及V,即训练得到五个Densenet改进模型),其训练过程即以对应图像采集设 备采集到的已知类别的物品图像为输入,以物品的对应类别概率为理论输出, 不断调整模型参数的过程,训练的终止条件为达到训练次数上限(具体训练 是利用训练误差从卷积神经网络的最后一层依次往前反向传播,使用交叉熵 作为损失函数,Adam自适应梯度优化器进行优化,初始学习率设置为0.01, 训练轮次为100次,采用TensorFlow2.0框架进行实验,将训练好的模型进行 保存,其训练集与测试集的数量比为4:1);
Densenet改进模型(其具体为深度可分离卷积-递减特征重用结构,其中 深度可分离卷积的基本结构如图4所示,递减特征重用结构(Back Bone的结 构)如图5所示),包括依次连接的主卷积层(主Conv)、特征提取层、第一 网块、过渡层、第二网块及归类层;
第一网块和第二网块结构相同,网块包含依次连接的第一Back Bone、第 二BackBone、第三Back Bone和第四Back Bone,第一Back Bone的输出同 时为第二Back Bone、第三Back Bone和第四Back Bone的输入,第二Back Bone的输出同时为第三Back Bone和第四Back Bone的输入;
网块中的Back Bone包括Channel Split、第一卷积层、第二卷积层、第三 卷积层、第一深度分离卷积层、第二深度分离卷积层、Concat、Channel Shuffle, 其中ChannelSplit、第一卷积层、第一深度分离卷积层、第二卷积层、Concat、 Channel Shuffle依次连接,第二深度分离卷积层、第三卷积层与第一卷积层、 第一深度分离卷积层、第二卷积层并联,第二深度分离卷积层与Channel Split 连接,第三卷积层与Concat连接;
过渡层包括特征提取层;
归类层包括顺序连接的平均池化层和Softmax分类器;
本发明的网络结构与Densenet模型具体差别如下表1所示:
表1
Figure BDA0003004982600000171
(c)完成待识别件的识别(如图6所示):
将待识别件放置在转盘上,开启转盘及五个图像采集设备,五个图像采 集设备分别采集待识别件的图片,中央处理器获取图片并对预处理后,依次 将各图像采集设备对应的待识别件的图片输入到训练好的与图像采集设备对 应的Densenet改进模型中,各Densenet改进模型输出目标类别,根据选举规 则确认最终结果。
为了验证本发明的方法的准确性,本实施例在私有的数据集上进行了实 验,其实验结果如表2所示(其中Densenet、SqueezeNet及MobileNet分别代 指将本实施例中的Densenet改进模型替换成Densenet模型、SqueezeNet模型 及MobileNet模型):
表2
Figure BDA0003004982600000172
Figure BDA0003004982600000181
通过以上结果可以发现,本发明能够在大幅度减少网络参数的情况下提 升识别精度,极具应用前景。
经验证,本发明的基于轻量网络的智能仓储物件识别装置,提供稳定的 光照环境,提高对不同外部光照的适应能力以及识别准确率,其上布置的多 台不同视角的相机可以同步并行采集图像,大大提高采集效率与准确率,通 过空间坐标系建立准确的相机与识别物件之间的距离、角度关系,并分别与 相应相机识别到的图片信息融合存储,首次提出将多观察视角信息与图像信 息结合,提高图像采集与后续识别准确率,其应用数据增强操作增加数据量; 首次提出在卷积神经网络结合ShuffleNet通道打算顺序的特性、ResNet中的 残差网络、Inception中通道分割、DenseNet中多重残网络以及MobileNet中 的DWConv得到Densenet改进模型,其相比于传统网络以及轻量化网络进一 步提升精度和缩小模型的结构,而应用Densenet改进模型完成目标类别识别, 不仅数据处理量小,而且其识别精度高,极具应用前景。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应该理 解,这些仅是举例说明,在不违背本发明的原理和实质的前提下,可以对这 些实施方式做出多种变更或修改。

Claims (8)

1.一种基于轻量网络的智能仓储物件识别装置,其特征在于,包括一用于放置待识别件的转盘,所述转盘与转盘驱动装置连接,在转盘驱动装置的驱动下可水平旋转;
围绕所述转盘布置有两个以上视野中心对准转盘中心的图像采集设备,所述图像采集设备布置在所述转盘的不同方位上且其与转盘间的高度差不同;
所述图像采集设备、转盘驱动装置分别与中央处理单元连接,所述中央处理器通过图像采集设备获取待识别件的图片,而后将其输入训练好的Densenet改进模型中,训练好的Densenet改进模型输出目标类别;
所述Densenet改进模型相比于Densenet模型的改进之处在于,网块中的Back Bone包括Channel Split、第一卷积层、第二卷积层、第三卷积层、第一深度分离卷积层、第二深度分离卷积层、Concat、Channel Shuffle,其中Channel Split、第一卷积层、第一深度分离卷积层、第二卷积层、Concat、Channel Shuffle依次连接,第二深度分离卷积层、第三卷积层与第一卷积层、第一深度分离卷积层、第二卷积层并联,第二深度分离卷积层与ChannelSplit连接,第三卷积层与Concat连接。
2.根据权利要求1所述的一种基于轻量网络的智能仓储物件识别装置,其特征在于,所述中央处理器运行如下程序进行数据增强:
(1)待识别件安放在转盘的中心后,中央处理单元开启转盘驱动装置及所有的图像采集设备,转盘驱动装置驱动转盘水平旋转,图像采集设备定时对待识别件进行图像采集,在图像采集设备进行图像采集的同时中央处理单元将记录图像采集设备的观察视角信息,并将采集的图像与观察视角信息数据信息进行映射构成所述数据集,第n个图像采集设备第t时刻观察视角信息Gt n的表达式具体如下:
Figure FDA0003004982590000011
Figure FDA0003004982590000021
其中,rn为第n个图像采集设备与转盘中心连线的距离,θn为第n个图像采集设备与转盘所在水平面的夹角,
Figure FDA0003004982590000022
为第t时刻第n个图像采集设备的水平面投影与x轴的夹角,
Figure FDA0003004982590000023
为初始时刻第n个图像采集设备的水平面投影与x轴的夹角,x轴为以转盘中心为原点、以转盘所在水平面为x轴、y轴所在面所建立的坐标系中的x轴,V表示转盘的旋转速度;
(2)对数据集中的图像采集设备观察视角信息数据进行增强处理,增强后的第n个图像采集设备第t时刻的观察视角信息Ht n的表达式具体如下:
Figure FDA0003004982590000026
Figure FDA0003004982590000024
其中,
Figure FDA0003004982590000025
为增强后的数据相比于第n个图像采集设备第t时刻的观察视角信息的旋转角度,[dx,dy]分别表示增强后的数据相比于第n个图像采集设备第t时刻的观察视角信息x、y轴方向上的平移分量。
3.根据权利要求1所述的一种基于轻量网络的智能仓储物件识别装置,其特征在于,所述转盘布置在一框架内,所述图像采集设备固定在框架上,框架上还固定有光源;
所述转盘下布置黑色背板;
所述转盘驱动装置为驱动电机。
4.根据权利要求3所述的一种基于轻量网络的智能仓储物件识别装置,其特征在于,所述光源布置在转盘的上方,所述框架外套有柔光罩;
所述框架为方形框架;
所述图像采集设备共有五个,分别布置在框架的四周及顶部,且五个图像采集设备与转盘的高度差均不相同;
所述框架的转角处圆角过渡;所述框架由多根铝合金方管固定拼接而成。
5.根据权利要求1所述的一种基于轻量网络的智能仓储物件识别装置,其特征在于,所述Densenet改进模型包括依次连接的主卷积层、特征提取层、第一网块、过渡层、第二网块、归类层;所述第一网块和第二网块结构相同;
所述Densenet改进模型的训练集与测试集的数量比为4:1。
6.根据权利要求5所述的一种基于轻量网络的智能仓储物件识别装置,其特征在于,所述网块包含依次连接的第一Back Bone、第二Back Bone、第三Back Bone和第四Back Bone,第一Back Bone的输出同时为第二Back Bone、第三Back Bone和第四Back Bone的输入,第二Back Bone的输出同时为第三Back Bone和第四Back Bone的输入;
所述过渡层包括特征提取层;
所述归类层包括平均池化层和Softmax分类器。
7.根据权利要求4所述的一种基于轻量网络的智能仓储物件识别装置,其特征在于,所述Densenet改进模型共有五个,每个Densenet改进模型均与图像采集设备一一对应,其训练过程即以对应图像采集设备采集到的已知类别的物品图像为输入,以物品的对应类别概率为理论输出,不断调整模型参数的过程,训练的终止条件为达到训练次数上限。
8.根据权利要求7所述的一种基于轻量网络的智能仓储物件识别装置,其特征在于,获得各Densenet改进模型输出的结果后根据选举规则确认最终结果。
CN202110359606.4A 2021-04-02 2021-04-02 一种基于轻量网络的智能仓储物件识别装置 Pending CN113505629A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110359606.4A CN113505629A (zh) 2021-04-02 2021-04-02 一种基于轻量网络的智能仓储物件识别装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110359606.4A CN113505629A (zh) 2021-04-02 2021-04-02 一种基于轻量网络的智能仓储物件识别装置

Publications (1)

Publication Number Publication Date
CN113505629A true CN113505629A (zh) 2021-10-15

Family

ID=78009204

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110359606.4A Pending CN113505629A (zh) 2021-04-02 2021-04-02 一种基于轻量网络的智能仓储物件识别装置

Country Status (1)

Country Link
CN (1) CN113505629A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113920454A (zh) * 2021-10-21 2022-01-11 广西科技大学 一种低对比度工况下工地物料的快速识别和分类方法
CN114782761A (zh) * 2022-06-23 2022-07-22 山东能源数智云科技有限公司 基于深度学习的智能仓储物料识别方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103522305A (zh) * 2013-10-29 2014-01-22 中国科学院自动化研究所 一种使移动机械臂趋近并抓取目标物体的方法
CN109615574A (zh) * 2018-12-13 2019-04-12 济南大学 基于gpu和双尺度图像特征比对的中药识别方法及系统
CN110658202A (zh) * 2019-09-30 2020-01-07 贵州航天云网科技有限公司 一种基于深度学习的工业元器件外观缺陷检测方法
CN211178345U (zh) * 2019-12-12 2020-08-04 天目爱视(北京)科技有限公司 一种三维采集设备
CN112129281A (zh) * 2019-06-25 2020-12-25 南京航空航天大学 一种基于局部邻域地图的高精度图像导航定位方法
WO2021022543A1 (en) * 2019-08-08 2021-02-11 Boe Technology Group Co., Ltd. Computer-implemented method, computer-implemented diagnosis method, apparatus for classifying image, and computer-program product

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103522305A (zh) * 2013-10-29 2014-01-22 中国科学院自动化研究所 一种使移动机械臂趋近并抓取目标物体的方法
CN109615574A (zh) * 2018-12-13 2019-04-12 济南大学 基于gpu和双尺度图像特征比对的中药识别方法及系统
CN112129281A (zh) * 2019-06-25 2020-12-25 南京航空航天大学 一种基于局部邻域地图的高精度图像导航定位方法
WO2021022543A1 (en) * 2019-08-08 2021-02-11 Boe Technology Group Co., Ltd. Computer-implemented method, computer-implemented diagnosis method, apparatus for classifying image, and computer-program product
CN110658202A (zh) * 2019-09-30 2020-01-07 贵州航天云网科技有限公司 一种基于深度学习的工业元器件外观缺陷检测方法
CN211178345U (zh) * 2019-12-12 2020-08-04 天目爱视(北京)科技有限公司 一种三维采集设备

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
HUANG G等: "Densely Connected Convolutional Networks", 《DOI:10.48550/ARXIV.1707.06990》, 28 January 2018 (2018-01-28), pages 1 - 9 *
MA, N等,: "hufflenet v2: Practical guidelines for efficient cnn architecture design", 《PROCEEDINGS OF THE EUROPEAN CONFERENCE ON COMPUTER VISION (ECCV)》, 31 December 2018 (2018-12-31), pages 1116 - 131 *
PLEISS G 等: "Memory-Efficient Implementation of DenseNets", 《DOI:10.48550/ARXIV.1707.06990》, 28 January 2018 (2018-01-28), pages 1 - 9 *
TRACELESSL: "仿射变换(AffineTransform)与仿射矩阵", pages 1 - 9, Retrieved from the Internet <URL:"CSDN,https://blog.csdn.net/TracelessLe/article/details/113759990#%E5%89%8D%E8%A8%8"> *
曾帅: "基于深度学习的零件识别系统设计与研究", 《中国优秀硕士 学位论文全文数据库工程科技Ⅱ辑》, no. 07, 15 July 2020 (2020-07-15), pages 029 - 135 *
程序员阿德: "图像的仿射变换", pages 1 - 10, Retrieved from the Internet <URL:《知乎, https://zhuanlan.zhihu.com/p/80852438》> *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113920454A (zh) * 2021-10-21 2022-01-11 广西科技大学 一种低对比度工况下工地物料的快速识别和分类方法
CN113920454B (zh) * 2021-10-21 2024-03-19 广西科技大学 一种低对比度工况下工地物料的快速识别和分类方法
CN114782761A (zh) * 2022-06-23 2022-07-22 山东能源数智云科技有限公司 基于深度学习的智能仓储物料识别方法和系统
CN114782761B (zh) * 2022-06-23 2022-09-02 山东能源数智云科技有限公司 基于深度学习的智能仓储物料识别方法和系统

Similar Documents

Publication Publication Date Title
US11436437B2 (en) Three-dimension (3D) assisted personalized home object detection
CN105608671B (zh) 一种基于surf算法的图像拼接方法
US10558844B2 (en) Lightweight 3D vision camera with intelligent segmentation engine for machine vision and auto identification
CN111652085B (zh) 基于2d与3d特征结合的物体识别方法
CN113592845A (zh) 一种电池涂布的缺陷检测方法及装置、存储介质
CN110084243B (zh) 一种基于二维码和单目相机的档案识别与定位方法
CN108573231B (zh) 基于运动历史点云生成的深度运动图的人体行为识别方法
CN110163211B (zh) 一种图像识别方法、装置和存储介质
CN113592911B (zh) 表观增强深度目标跟踪方法
CN111310826B (zh) 样本集的标注异常检测方法、装置及电子设备
CN114693661A (zh) 一种基于深度学习的快速分拣方法
CN111445459A (zh) 一种基于深度孪生网络的图像缺陷检测方法及系统
CN113505629A (zh) 一种基于轻量网络的智能仓储物件识别装置
CN111161295B (zh) 一种菜品图像背景剥离方法
CN110929795A (zh) 高速焊线机焊点快速识别与定位方法
CN116052222A (zh) 自然采集牛脸图像的牛脸识别方法
CN106067031A (zh) 基于人工纠错机制与深度学习网络协作机器视觉识别系统
Chen et al. Autosweep: Recovering 3d editable objects from a single photograph
CN113947770A (zh) 一种识别物体放置于智能箱柜不同区域的方法
WO2022121021A1 (zh) 一种身份证号码检测方法、装置、可读存储介质和终端
CN116523916B (zh) 产品表面缺陷检测方法、装置、电子设备及存储介质
Abbas Recovering homography from camera captured documents using convolutional neural networks
CN117133041A (zh) 一种基于深度学习的三维重建网络人脸识别方法、系统、设备及介质
Madessa et al. Leveraging an instance segmentation method for detection of transparent materials
CN110070626B (zh) 一种基于多视角分类的三维物体检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination