CN105787465A

CN105787465A - 基于位置结构的图像识别方法

Info

Publication number: CN105787465A
Application number: CN201610159439.8A
Authority: CN
Inventors: 兰红云
Original assignee: Suzhou Dongwu Weizhen Information Technology Co Ltd
Current assignee: Suzhou Dongwu Weizhen Information Technology Co Ltd
Priority date: 2016-03-21
Filing date: 2016-03-21
Publication date: 2016-07-20

Abstract

本发明公开了一种基于位置结构的图像识别方法，包括以下步骤：获取输入图像串，并计算输入图像的图像长度；根据输入图像串的倒排索引，获得图像库中的同一个分支下的所有图像串，组成候选图像串集；遍历候选图像串集，计算其中每个图像的图像长度，采用后向匹配计算其中每个图像与输入图像的相似度；按照相似度对相似的图像串从高到低排序，选出相似度最高的n个图像串作为结果输出。本发明只是将两个图像中较短的特征向量进行循环比较，处理时间更快，而且准确率高。

Description

基于位置结构的图像识别方法

技术领域

本发明涉及一种图像识别方法，具体地涉及一种基于位置结构的图像识别方法。

背景技术

图像识别是计算机视觉领域中最活跃的领域之一，主要研究目标在于利用计算机的强大运算能力，帮助人类自动处理海量物理信息，识别各种不同模式的目标代替人的部分脑力劳动。图像识别广泛应用于地质勘探、图像遥感、机器人视觉、生物医学等多个领域，例如ATM取款机。

中国专利文献CN104252473公开了一种图像识别方法，从图像中提取特征向量，形成标志区域信息和标志区域内多个特征向量的特征信息，获得图像识别参照图像，然后通过比较待识别的图像与参照图像，当两个图像的相似度在设定误差值范围内时，则认为该两个图像为同一图像。该种方法存在以下缺陷：

1、需要将被比较的两个图像都向量化，所以要对两个图像都做一次循环比较，处理时间较长。

2、通常都是通过计算两个向量的余弦相似度来比较的，这样对于：“122,11,12（眼睛）125,15,12(鼻子)”、“122,11,12,125,15,12(眼睛鼻子)”，这两个特征向量，该方法就不能识别为百分之百相似。

发明内容

为了解决现有技术存在的问题，本发明目的是：提供一种基于位置结构的图像识别方法，本发明只是将两个图像中较短的特征向量进行循环比较，处理时间更快，而且准确率高。

本发明的技术方案是：

一种基于位置结构的图像识别方法，其特征在于，包括以下步骤：

S01：获取输入图像串，并计算输入图像的图像长度；

S02：根据输入图像串的倒排索引，获得图像库中的同一个分支下的所有图像串，组成候选图像串集；

S03：遍历候选图像串集，计算其中每个图像的图像长度；

S04：比较输入图像与候选图像的图像长度，将图像长度短的图像定义为图像B，图像长度长的图像定义为图像A；

S05：从图像B的最后一个字符开始遍历，判断该字符是否包含在图像A中，若包含则记录这个字符在图像B中的位置pos_B以及该字符在图像A中的位置pos_A，同时将end_point设置为该字符在图像B中的位置，然后继续判断图像B中下一个字符；如果不包含，则直接判断图像B中下一个字符；

S06：若下一个字符也包含在A中，则将end_point设置为该字符在图像B中的位置，根据相似度算法计算图像B中已经确定包含在图像A中的字符与图像A的相似度s1；如果下一个字符不包含在图像A中，则执行步骤S07；相似度算法的计算公式为：，其中，L_A、L_B为A和B的图像长度；

S07：对图像B中的剩余字符串重复步骤S06，得到相似度集合{s1，s2，…}；

S08：图像B中的字符都遍历完成后，将相似度集合{s1，s2，…}中的最大值作为图像A和图像B的相似度S，如果相似度S大于设定阈值，则认为图像A和B为相似。

优选的，所述步骤S08中阈值为0.8。

优选的，在步骤S01之前还包括将图像向量化，提取较短的特征向量为图像特征。

与现有技术相比，本发明的优点是：

本发明只是将两个图像中较短的特征向量进行循环比较，处理时间更快；本发明采用后向匹配图像的相似度，后向匹配更能保留图像中的重要信息，使得相似度计算更加准确。

附图说明

下面结合附图及实施例对本发明作进一步描述：

图1为本发明基于位置结构的图像识别方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面结合具体实施方式并参照附图，对本发明进一步详细说明。应该理解，这些描述只是示例性的，而并非要限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

实施例：

如图1所示，一种基于位置结构的图像识别方法，包括以下步骤：

（1）将图像向量化。例如，将图像A向量化为<101,102,205,255>，图B向量化为<11,102,205,255>。

（2）提取较短的特征向量为图像特征，比如对于上面的向量，假设得到的特征为<0,102,205,0>，<11,102,205,0>，可以将图像特征存储为样本库。

（3）获取输入图像串，并计算输入图像的图像长度；

（4）根据输入图像串的倒排索引，获得图像库中的同一个分支下的所有图像串，组成候选图像串集；

（5）遍历候选图像串集，计算其中每个图像的图像长度，计算其中每个图像与输入图像的相似度；

相似度计算方法：

比较输入图像与候选图像的图像长度，将图像长度短的图像定义为图像B，图像长度长的图像定义为图像A；

a）从图像B的最后一个字符开始遍历，判断该字符是否包含在图像A中，若包含则记录这个字符在图像B中的位置pos_B以及该字符在图像A中的位置pos_A，同时将end_point设置为该字符在图像B中的位置，然后继续判断图像B中下一个字符；如果不包含，则直接判断图像B中下一个字符；

b）若下一个字符也包含在A中，则将end_point设置为该字符在图像B中的位置，根据相似度算法计算图像B中已经确定包含在图像A中的字符与图像A的相似度s1；如果下一个字符不包含在图像A中，则执行步骤S07；相似度算法的计算公式为：，其中，L_A、L_B为A和B的图像长度；

c）对图像B中的剩余字符串重复步骤S06，得到相似度集合{s1，s2，…}；

d）图像B中的字符都遍历完成后，将相似度集合{s1，s2，…}中的最大值作为图像A和图像B的相似度S，如果相似度S大于设定阈值，则认为图像A和B为相似，阈值一般设定为0.8。

（6）按照相似度对相似的图像串从高到低排序，选出相似度最高的n个图像串作为结果输出。

在获得相似图像的时候，之所以要从最后一个字符开始遍历，因为相较于前向匹配，这种后向匹配更能保留图像中的重要信息，使得相似度计算更加准确。因为在使用的场景中，比如图像信息，两个不同人正面脸的相似度要高于同一个人的正脸和侧脸的相似度。

应当理解的是，本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理，而不构成对本发明的限制。因此，在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。此外，本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims

1.一种基于位置结构的图像识别方法，其特征在于，包括以下步骤：

S01：获取输入图像串，并计算输入图像的图像长度；

S03：遍历候选图像串集，计算其中每个图像的图像长度；

S06：若下一个字符也包含在A中，则将end_point设置为该字符在图像B中的位置，根据相似度算法计算图像B中已经确定包含在图像A中的字符与图像A的相似度s1；如果下一个字符不包含在图像A中，则执行步骤S07；相似度算法的计算公式为：，其中，L_A、L_B分别为A和B的图像长度；

2.根据权利要求1所述的基于位置结构的图像识别方法，其特征在于，所述步骤S08中阈值为0.8。

3.根据权利要求1所述的基于位置结构的图像识别方法，其特征在于，在步骤S01之前还包括将图像向量化，提取较短的特征向量为图像特征。