CN111882543A

CN111882543A - 一种基于AA R2Unet和HMM的香烟滤棒计数方法

Info

Publication number: CN111882543A
Application number: CN202010741400.3A
Authority: CN
Inventors: 张堃; 韩宇; 姜朋朋; 朱翊晗; 冯文宇; 殷佳炜; 华亮; 李文俊; 鲍毅
Original assignee: Hangzhou Borazhe Technology Co ltd; Nantong University
Current assignee: Hangzhou Borazhe Technology Co ltd; Nantong University
Priority date: 2020-07-29
Filing date: 2020-07-29
Publication date: 2020-11-03
Anticipated expiration: 2040-07-29
Also published as: CN111882543B

Abstract

本发明公开了一种基于AA R2Unet和HMM的香烟滤棒计数方法，本发明利用U‑net网络模型进行训练，准确识别滤棒目标和背景。因此，根据识别出的二值化图像，提出了滤棒分布特征的结构单元填充和圆切线搜索策略，实验结果表明，该算法在检测精度和检测范围上都取得了很大的进步。

Description

一种基于AA R2Unet和HMM的香烟滤棒计数方法

技术领域

本发明涉及香烟滤棒计数技术领域，具体为一种基于AA R2Unet和HMM的香烟滤棒计数方法。

背景技术

工业现场常常需要对复杂环境下密集小目标进行精确识别。实际生产中对于批量识别还是采用精度较低的随机抽样人工识别保证质量规格一致。批量密集目标识别，常常会遇到目标间粘连、目标与背景对比度低、目标遭到阴影遮挡、相机视场畸变等问题。这些问题严重影响图像识别精度，且现在主流识别方法都不能很好的解决。

发明内容

本发明的目的在于提供一种基于AA R2Unet和HMM的香烟滤棒计数方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种基于AA R2Unet和HMM的香烟滤棒计数方法，包括以下步骤：

A、建立AA R2Unet网络对采集的滤棒图片进行目标分割，获取仅包含滤棒目标的图像；

B、基于HMM的优化搜索算法；

C、采用结构元填充的方法对滤棒目标进行计数。

优选的，所述步骤A中，在Unet中加入了R2模块与Attention Augment模块；其中，Unet结构总体呈对称的U型结构，在设计时共包含12个单元(F1-F12),其中左侧F1-F6为收缩路径，主要用于特征的提取；右侧F6-F12为扩张路径，用于细节的恢复实现精准预测；R2模块主要包括了残差学习单元(Residual learning unit)和递归卷积(Recurrentconvolution)。图3中的递归卷积表示在t＝0,t＝1,t＝2时刻以前一层的输出作为输入进行卷积并将结果相加。

优选的，所述Attention Augment本质为通过查询得到一系列键-值对的映射；首先，通过对输入大小为(w,h,c_in)的特征图进行1×1卷积输出QKV矩阵，其大小为(w,h,2*d_k+d_v)，其中w、h、2*d_k+d_V分别表示了矩阵的宽、长与深度；再从深度通道上对QKV矩阵进行分割，得到Q(Query)、K(Key)、V(Value)三个矩阵其深度通道大小分别为d_k、d_k、d_v。接着，采用了多头注意力机制(Multi-Head Attention)的结构，将Q、K、V三个矩阵分别从深度通道上分割为N个相等的矩阵进行后续的计算，这种多头注意力机制将原本单一的attention计算，扩展为较小且并行独立的多个计算，使得模型可以在不同的子空间内学习特征信息。

优选的，对于分割好的Q、K、V矩阵在进行扁平化处理生成Flat_Q、Flat_K、Flat_V三个矩阵，即对Q、K、V保持深度通道不变，从长宽方向对其进行压缩到1维，其中前两个矩阵的大小为(w*h,d_k)，后一个矩阵大小为(w*h,d_v)；接着，Attention Augment保存了原先Self-Attention的做法使用Flat_Q、Flat_K两矩阵进行矩阵乘法运算，计算出权重矩阵，且在此基础上添加了相对位置嵌入的计算，通过对Q矩阵进行长宽两方向的权重计算得到特征图上每个点的相对位置信息，防止特征位置的变换而降低模型的最终效果；长宽两方向的相关位置信息分别通过Q矩阵与权重矩阵H和W内积得到，记为S_h和S_w，其中权重矩阵H和W通过模型的训练得出，大小为(wh,wh,1)。然后，将得到的三个矩阵相加并乘以尺度系数

以防止计算结果过大；随后用softmax函数进行处理，即得到了最终的特征权重矩阵；最后，将该权重矩阵与V矩阵相乘并将结果reshape到原始长宽大小，再进行1×1的卷积操作，即可得到最终的注意力特征矩阵O；将注意力特征矩阵O和正常的卷积过程按深度方向进行拼接(concat)即可得到Attention Augment的结果；注意力特征矩阵O的计算公式如下：

优选的，所述步骤B中，对已找到的圆心作为基准圆心，以d为半径拟合一个圆；再以半径2/3d拟合一个同心圆，记为圆B，对圆A与圆B组成的圆环区域所有像素进行分析；根据滤棒之间位置几何关系，对基准圆心0°±15°、60°±15°、120°±15°、180°±15°、240°±15°、300°±15°方向上的圆环区域像素点进行结构元检测；将检测到的6个方向上符合结构元准则的第一个像素点作为下一个滤棒目标的初始结构元位置。

优选的，在面对不同区域内所设置的半径d不同，使用高斯函数来评价滤棒之间距离差异，即有：

其中为常数2.3，▽gⁿ表示当前滤棒目标的半径值即：

其中(x,y)为当前滤棒目标的中心位置坐标，(x₀,y₀)为当前滤棒匹配初始点坐标；通过循环计算d的值，在6个方向上优先从d距离开始搜索匹配。

优选的，为了优化匹配效率，采用隐式马尔科夫链对6个方向进行提前预测；由于方向作为待预测值，故将其设为HMM的隐藏链，而x值的数据可以通过不断计算进行收集，记为HMM的观测链，其预测结构滤棒匹配方向状态表示为:

S＝{S₁,S₂,...,S_m},m＝6

历史滤棒匹配方向序列X与之对应的方向距离序列Y，利用极大然司法计算模型参数；滤棒各个方向状态初始概率的数学表达式记为:

π＝{π₁,π₂,...,π_m},m＝6

其中表示滤棒匹配方向在状态的初始概率。

经过统计分析可以得出任意的状态出现的次数为，经过一步转移的匹配的方向状态到另一方向状态，则状态转移概率为:

将所有滤棒匹配方向状态的一步转移概率以矩阵的形式列出，则会得到一个的一步转移概率矩阵:

由于计算x属于随机变量，选用CHMM进行滤棒匹配方向预测；通过大量实验发现，滤棒匹配方向状态对应的距离x服从高斯分布；状态所对应的距离x数据点个数记为

因为历史匹配方向状态序列X与对应的Y存在一一对应的关系，所以给定距离x，则滤棒匹配方向状态对应的距离x的高斯密度函数的均值和方差为:

由于不同方向状态x_k对应的距离x计算得到的均值μ_i和方差σ_i ²不同，所以在同一距离对应不同方向状态发生概率也不同，给定距离xk,其发生概率为:

根据Viterbi算法，只需要使

概率最大，实现对下一步滤棒匹配方向的概率预测；同时，选择概率最大的方向优先进行匹配操作。

优选的，所述步骤C中，通过大量实验对比15-45像素大小的结构元，对二值化结果计数精度影响；发现采用5x5的矩形结构元计数有最加效果；通过每个结构元中心构建出一个几何图形，此几何图形的中心即为滤棒目标中心；通过精确定位滤棒中心，能够准确对滤棒数量进行计算；通过观察大量采集到的图像发现，一个滤棒目标周围最多存在6个相邻滤棒。

与现有技术相比，本发明的有益效果是：本发明利用U-net网络模型进行训练，准确识别滤棒目标和背景。因此，根据识别出的二值化图像，提出了滤棒分布特征的结构单元填充和圆切线搜索策略，实验结果表明，该算法在检测精度和检测范围上都取得了很大的进步。

附图说明

图1是本发明实施例提供的一种AA R2Unet和HMM的烟滤棒分割方法的示意性流程图；

图2是本发明实施例提供的一种AA R2Unet结构示意图；

图3是本发明实施例提供的一种R2模块结构示意图；

图4是本发明实施例提供的一种Attention Augment结构示意图；

图5是本发明实施例提供的一种HMM优化搜索算法示意图；

图6是本发明实施例提供的一种结构元匹配策略示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-6，本发明提供一种技术方案：本发明提供如下技术方案：一种基于AAR2Unet和HMM的香烟滤棒计数方法，包括以下步骤：

B、基于HMM的优化搜索算法；

C、采用结构元填充的方法对滤棒目标进行计数。

本发明中，步骤A中，在Unet中加入了R2模块与Attention Augment模块；其中，Unet结构总体呈对称的U型结构，在设计时共包含12个单元(F1-F12),其中左侧F1-F6为收缩路径，主要用于特征的提取；右侧F6-F12为扩张路径，用于细节的恢复实现精准预测；R2模块主要包括了残差学习单元(Residual learning unit)和递归卷积(Recurrentconvolution)。图3中的递归卷积表示在t＝0,t＝1,t＝2时刻以前一层的输出作为输入进行卷积并将结果相加；所述Attention Augment本质为通过查询得到一系列键-值对的映射；首先，通过对输入大小为(w,h,c_in)的特征图进行1×1卷积输出QKV矩阵，其大小为(w,h,2*d_k+d_v)，其中w、h、2*d_k+d_V分别表示了矩阵的宽、长与深度；再从深度通道上对QKV矩阵进行分割，得到Q(Query)、K(Key)、V(Value)三个矩阵其深度通道大小分别为d_k、d_k、d_v。接着，采用了多头注意力机制(Multi-Head Attention)的结构，将Q、K、V三个矩阵分别从深度通道上分割为N个相等的矩阵进行后续的计算，这种多头注意力机制将原本单一的attention计算，扩展为较小且并行独立的多个计算，使得模型可以在不同的子空间内学习特征信息；对于分割好的Q、K、V矩阵在进行扁平化处理生成Flat_Q、Flat_K、Flat_V三个矩阵，即对Q、K、V保持深度通道不变，从长宽方向对其进行压缩到1维，其中前两个矩阵的大小为(w*h,d_k)，后一个矩阵大小为(w*h,d_v)；接着，Attention Augment保存了原先Self-Attention的做法使用Flat_Q、Flat_K两矩阵进行矩阵乘法运算，计算出权重矩阵，且在此基础上添加了相对位置嵌入的计算，通过对Q矩阵进行长宽两方向的权重计算得到特征图上每个点的相对位置信息，防止特征位置的变换而降低模型的最终效果；长宽两方向的相关位置信息分别通过Q矩阵与权重矩阵H和W内积得到，记为S_h和S_w，其中权重矩阵H和W通过模型的训练得出，大小为(wh,wh,1)。然后，将得到的三个矩阵相加并乘以尺度系数

本发明中，在面对不同区域内所设置的半径d不同，使用高斯函数来评价滤棒之间距离差异，即有：

其中为常数2.3，▽gⁿ表示当前滤棒目标的半径值即：

其中(x,y)为当前滤棒目标的中心位置坐标，(x₀,y₀)为当前滤棒匹配初始点坐标；通过循环计算d的值，在6个方向上优先从d距离开始搜索匹配；为了优化匹配效率，采用隐式马尔科夫链对6个方向进行提前预测；由于方向作为待预测值，故将其设为HMM的隐藏链，而x值的数据可以通过不断计算进行收集，记为HMM的观测链，其预测结构滤棒匹配方向状态表示为:

S＝{S₁,S₂,...,S_m},m＝6

π＝{π₁,π₂,...,π_m},m＝6

其中表示滤棒匹配方向在状态的初始概率。

根据Viterbi算法，只需要使

本发明中，步骤C中，通过大量实验对比15-45像素大小的结构元，对二值化结果计数精度影响；发现采用5x5的矩形结构元计数有最加效果；通过每个结构元中心构建出一个几何图形，此几何图形的中心即为滤棒目标中心；通过精确定位滤棒中心，能够准确对滤棒数量进行计算；通过观察大量采集到的图像发现，一个滤棒目标周围最多存在6个相邻滤棒。

本发明对感兴趣区域按照遍历像素点的方式初始匹配寻找第一个结构元位置；对已检测到的结构元本文按照竖直方向与水平方向，小范围搜索以确定单个滤棒目标的边缘位置。本文在确定单个滤棒目标时，以纵向移动为首要定位移动方向。即在已找到的结构元基础上首先进行上下移动，当移动位置超限时开始次要移动方向即水平方向；当在纵方向上有最大取值的同时水平方向取最大值时，此时结构元一定位于滤棒目标最下端。同理可知，单个滤棒目标最上端、最左端、最右端分别对应竖直方向最小值、水平方向最小、水平方向最大。

综上所述，本发明利用U-net网络模型进行训练，准确识别滤棒目标和背景。因此，根据识别出的二值化图像，提出了滤棒分布特征的结构单元填充和圆切线搜索策略，实验结果表明，该算法在检测精度和检测范围上都取得了很大的进步。

本发明未详述之处，均为本领域技术人员的公知技术。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims

1.一种基于AA R2Unet和HMM的香烟滤棒计数方法，其特征在于：包括以下步骤：

B、基于HMM的优化搜索算法；

C、采用结构元填充的方法对滤棒目标进行计数。

2.根据权利要求1所述的一种基于AA R2Unet和HMM的香烟滤棒计数方法，其特征在于：所述步骤A中，在Unet中加入了R2模块与Attention Augment模块；其中，Unet结构总体呈对称的U型结构，在设计时共包含12个单元(F1-F12),其中左侧F1-F6为收缩路径，主要用于特征的提取；右侧F6-F12为扩张路径，用于细节的恢复实现精准预测；R2模块主要包括了残差学习单元(Residual learning unit)和递归卷积(Recurrent convolution)。图3中的递归卷积表示在t＝0,t＝1,t＝2时刻以前一层的输出作为输入进行卷积并将结果相加。

3.根据权利要求2所述的一种基于AA R2Unet和HMM的香烟滤棒计数方法，其特征在于：所述Attention Augment本质为通过查询得到一系列键-值对的映射；首先，通过对输入大小为(w,h,c_in)的特征图进行1×1卷积输出QKV矩阵，其大小为(w,h,2*d_k+d_v)，其中w、h、2*d_k+d_V分别表示了矩阵的宽、长与深度；再从深度通道上对QKV矩阵进行分割，得到Q(Query)、K(Key)、V(Value)三个矩阵其深度通道大小分别为d_k、d_k、d_v。接着，采用了多头注意力机制(Multi-Head Attention)的结构，将Q、K、V三个矩阵分别从深度通道上分割为N个相等的矩阵进行后续的计算，这种多头注意力机制将原本单一的attention计算，扩展为较小且并行独立的多个计算，使得模型可以在不同的子空间内学习特征信息。

4.根据权利要求3所述的一种基于AA R2Unet和HMM的香烟滤棒计数方法，其特征在于：对于分割好的Q、K、V矩阵在进行扁平化处理生成Flat_Q、Flat_K、Flat_V三个矩阵，即对Q、K、V保持深度通道不变，从长宽方向对其进行压缩到1维，其中前两个矩阵的大小为(w*h,d_k)，后一个矩阵大小为(w*h,d_v)；接着，Attention Augment保存了原先Self-Attention的做法使用Flat_Q、Flat_K两矩阵进行矩阵乘法运算，计算出权重矩阵，且在此基础上添加了相对位置嵌入的计算，通过对Q矩阵进行长宽两方向的权重计算得到特征图上每个点的相对位置信息，防止特征位置的变换而降低模型的最终效果；长宽两方向的相关位置信息分别通过Q矩阵与权重矩阵H和W内积得到，记为S_h和S_w，其中权重矩阵H和W通过模型的训练得出，大小为(wh,wh,1)。然后，将得到的三个矩阵相加并乘以尺度系数

5.根据权利要求1所述的一种基于AA R2Unet和HMM的香烟滤棒计数方法，其特征在于：所述步骤B中，对已找到的圆心作为基准圆心，以d为半径拟合一个圆；再以半径2/3d拟合一个同心圆，记为圆B，对圆A与圆B组成的圆环区域所有像素进行分析；根据滤棒之间位置几何关系，对基准圆心0°±15°、60°±15°、120°±15°、180°±15°、240°±15°、300°±15°方向上的圆环区域像素点进行结构元检测；将检测到的6个方向上符合结构元准则的第一个像素点作为下一个滤棒目标的初始结构元位置。

6.根据权利要求5所述的一种基于AA R2Unet和HMM的香烟滤棒计数方法，其特征在于：在面对不同区域内所设置的半径d不同，使用高斯函数来评价滤棒之间距离差异，即有：

其中为常数2.3，

表示当前滤棒目标的半径值即：

7.根据权利要求6所述的一种基于AA R2Unet和HMM的香烟滤棒计数方法，其特征在于：为了优化匹配效率，采用隐式马尔科夫链对6个方向进行提前预测；由于方向作为待预测值，故将其设为HMM的隐藏链，而x值的数据可以通过不断计算进行收集，记为HMM的观测链，其预测结构滤棒匹配方向状态表示为:

S＝{S₁,S₂,...,S_m},m＝6

π＝{π₁,π₂,...,π_m},m＝6

其中表示滤棒匹配方向在状态的初始概率。

由于不同方向状态x_k对应的距离x计算得到的均值μ_i和方差

不同，所以在同一距离对应不同方向状态发生概率也不同，给定距离xk,其发生概率为:

根据Viterbi算法，只需要使

8.根据权利要求1所述的一种基于AA R2Unet和HMM的香烟滤棒计数方法，其特征在于：所述步骤C中，通过大量实验对比15-45像素大小的结构元，对二值化结果计数精度影响；发现采用5x5的矩形结构元计数有最加效果；通过每个结构元中心构建出一个几何图形，此几何图形的中心即为滤棒目标中心；通过精确定位滤棒中心，能够准确对滤棒数量进行计算；通过观察大量采集到的图像发现，一个滤棒目标周围最多存在6个相邻滤棒。