CN108229501B

CN108229501B - 融合纹理特征与形状特征的时序性的草图识别方法

Info

Publication number: CN108229501B
Application number: CN201711379401.2A
Authority: CN
Inventors: 贾棋; 樊鑫; 秦启炜; 唐国磊; 刘日升; 徐秀娟; 赵晓薇; 许真珍
Original assignee: Dalian University of Technology
Current assignee: Dalian University of Technology
Priority date: 2017-12-20
Filing date: 2017-12-20
Publication date: 2021-09-28
Anticipated expiration: 2037-12-20
Also published as: CN108229501A

Abstract

本发明属于计算机视觉领域，公开了一种融合纹理特征与形状特征的时序性的草图识别方法。首先，按照草图的笔画顺序获取一个图像序列；其次，提取每个图像的纹理特征和形状特征，形成对应于图像序列的特征序列；然后，将特征输入到包含两个阶段的网络中进行学习，第一阶段的两个循环神经网络分别接受图像的纹理特征和形状特征，第二阶段首先融合上一阶段的输出，然后输入到第三个循环神经网络，最后通过分类器得到结果，如此，按照序列中的顺序进行迭代学习。优点：将几何描述子用于草图识别，同时采用循环神经网络对草图的时序特征进行有效学习，从而显著改善原有识别模型忽视草图形状特征与时序性特征的缺陷，较好地提升草图识别率。

Description

融合纹理特征与形状特征的时序性的草图识别方法

技术领域

本发明属于计算机视觉领域，涉及图像分类任务，特别涉及一种融合纹理和形状特征的时序性的草图识别方法。

背景技术

反映物体主要特征的草图，是人们交流想法的一种有效途径。然而，自动识别笔画顺序多变和风格各异的手绘草图是一个巨大的挑战，以至于近些年来的自动识别率触到了天花板。大多数现行的方法，尤其是基于深度网络的方法，不是忽略了草图的几何特征，把在自然图像识别中取得巨大成功的纹理特征用于草图识别，而忽视了纹理特征在草图中并不太丰富的缺陷；就是把草图当作结构顺序固定的手写字母来处理，忽视了草图区别于其他形状的时序性，或者未能很好地解决手绘顺序有区别的同类草图对结果的扰动。

本发明结合这两个角度，设计了一种序列性双循环神经网络。通过几何描述子揭示草图的形状特征，并采用循环神经网络学习草图的时序性特征，从而弥补了单一纹理特征的缺陷，提高了草图识别率。

发明内容

为了弥补单一纹理特征的不足以更好地识别草图，本发明提供了一种结合纹理特征与形状特征的时序性的草图识别方法。

本发明的技术方案包括如下步骤：

步骤1.获取图像序列

对于每一个草图S，假设它有N个顺序笔画，则S可以表示为(s₁,s₂,...,s_N)。其中，s_i为该草图S的第i个顺序笔画，i为[1,N]之间的整数。建立一个包含P个图像的序列(I₁,I₂,...,I_P)。其中，第t个图像I_t包含了笔画s₁到s_t×N/P，t为[1,P]之间的整数。

步骤2.提取图像特征

对上述图像序列中的每一幅图像I_t，提取图像纹理特征

提取图像形状特征

步骤3.利用循环神经网络对草图笔画进行迭代学习

搭建一个包含两个阶段和3个GRU(gated recurrent unit)的网络，如图1所示的每一行。然后，按照图像序列(I₁,I₂,...,I_P)的顺序进行迭代学习。图1中的第t行即为利用图像I_t的纹理特征

和形状特征

进行第t次迭代学习。

其中，每一步的迭代学习又包含两个阶段：

步骤3‐1第一阶段的2个GRU分别学习了一个从输入序列

和

到输出

和

的映射。以形状特征为例，给出如下解释：

其中，

和

表示GRU的输入和输出，h_t是GRU的隐藏状态，并由其他三个门单元r，m和

决定。操作符⊙表示向量的对应元素相乘。W_*和U是权重矩阵，b_*是GRU的权重向量。类似地，另一个GRU将纹理特征

映射到

步骤3‐2在第t次迭代学习中，第二阶段的输入是(y_texture ^Ty_shape ^T)^T，输出则为

其中，首先将线性函数W(y_texture ^Ty_shape ^T)^T+b应用于第二阶段的开始位置，W的维度为256*128，用以融合被记忆的纹理特征和形状特征；然后将融合后的特征输入第3个GRU网络。而第二阶段GRU的输出则与最终作为分类器的softmax层进行稠密连接，得到分类结果。

优选的，所述步骤1中，P＝5，以更好地减轻过拟合的影响，更有效地描述草图特征。

优选的，所述步骤2‐3中，M＝500，以更好地提取草图笔画的几何特征。

优选的，所述步骤2中，使用Sketch‐A‐Net模型提取图像纹理特征

优选的，所述步骤2中，使用Shape Context提取图像形状特征

优选的，对于形状特征的提取有如下步骤：

步骤2‐1对每一个笔画应用形状上下文作为几何描述子，且每个笔画上采集5个特征点；

步骤2‐2对形状特征进行k‐means聚类，聚类中心作为codebook；

步骤2‐3使用其中M个聚类中心作为描述整个笔画空间的原型。并使用局部约束线性编码LLC生成最终编码了的笔画表示；

步骤2‐4将maxpooling应用于全部笔画特征，获取更具有区分性的500维的特征向量。

有益效果：本发明构造了基于GRU的序列性双循环神经网络(sequential dualrecurrent neural networks)——SD‐RNN，通过融合纹理与形状特征，极大地丰富了对草图的描述能力，同时提出累积顺序笔画以减小过拟合的观点，达到了用较少的训练数据得到更精确的分类结果的目的。这种网络模型使得草图区别于自然图像的形状特征得到关注，从而在草图识别任务中表现出良好的准确率。

附图说明

图1SD‐RNN网络结构。

图2累积顺序笔画。

图3图像集扩充。

图4原有方法错误示例。

图5形状特征的提升效果。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及具体实例，对本发明做进一步详细说明。这些实例仅仅是说明性的，而并非对本发明的限制。

实施例：

对于步骤1，获取图像序列。取P＝5，能有效利用草图笔画的时序特征，如图2所示。

通过剪裁和水平翻转，将图像序列(I₁,I₂,...,I_P)中的每一个图像扩展为10个图像。图3中，左端的10个图像即展示了这种效果：从右到左，奇数位上的图像是在原图像上做了剪裁，偶数位上的图像是在原图像的水平翻转图像上做了剪裁，剪裁的顺序依次为保留原图的左上，左下，右上，右下和居中部分；以I₂为例，将这10个图像从右到左命名为

此时，原来的每个草图S变成了P*10个图像，其中的图像

来源于图像I_t，k为[1,10]之间的整数。

图3中，按从右到左的顺序，将10个图像先后输入第一阶段的GRU中进行学习。

将SD‐CNN中用于生成纹理特征的Coded Shape Context和用于形状特征学习的GRU去掉，进行实验，结果中的错误示例如图4所示。

将SD‐CNN中用于生成纹理特征的Coded Shape Context和用于形状特征学习的GRU去掉，与SD‐RNN的结果对比如图5所示。