CN112256910A

CN112256910A - 基于内容的商铺标识图像检索方法

Info

Publication number: CN112256910A
Application number: CN202011144063.6A
Authority: CN
Inventors: 吴海波; 李腾; 张志勇; 陈莉
Original assignee: Lanpu Jinjing Beijing Technology Co ltd
Current assignee: Lanpu Jinjing Beijing Technology Co ltd
Priority date: 2020-10-23
Filing date: 2020-10-23
Publication date: 2021-01-22

Abstract

一种基于内容的商铺标识图像检索方法，具体步骤为：步骤一：图像采集；步骤二：图像检测，从采集的图像中识别出商铺标识图像；步骤三：对商铺标识图像和数据库图像数据进行预先处理；步骤四：对商铺标识图像和数据库图像提取特征；步骤五：商铺标识图像与数据库图像进行相似度比对，高于设定阈值，则为被检索到的图像。

Description

基于内容的商铺标识图像检索方法

技术领域

本发明涉及计算检索计算领域，具体涉及一种基于内容的商铺标识图像检索方法。

背景技术

在信息技术如此发展的当今社会，各种不同的信息数据充斥着大家的眼球，如视频图像等多媒体信息；信息量越来越大，从大规模的数据中检索出有效数据的难度便越来越大，因而出现了各种检索方法；传统的基于文本描述的图像检索技术，由于需要人工主观对图像内容进行标注图像指定的关键字，根据关键字进行检索；然而每个人对图像内容的理解是不同的，这会造成关键字匹配错误，降低图像检索的准确性；基于内容的图像检索，是通过输入待查询图像作为输入数据，在数据库中找出相似性最高的检索图像；由于数据库中注册的商铺标识图像是高清整图，而待查询图像是用手机或者VR眼镜拍摄的图像，标识只占图像中的一部分，这中间存在着图像质量问题、拍摄角度、光线和背景的变化，因此想要准确检索出待检索标识是否已在数据库中注册难度较大。

标识

发明内容

本发明针对现有技术的不足，提出一种能快速精准的检索商铺图像标识的，具体技术方案如下：

一种基于内容的商铺标识图像检索方法，具体步骤为：

步骤一：图像采集；

步骤二：图像检测，从采集的图像中识别出商铺标识图像；

步骤三：对商铺标识图像和数据库图像数据进行预先处理；

步骤四：对商铺标识图像和数据库图像提取特征；

步骤五：商铺标识图像与数据库图像进行相似度比对，高于设定阈值，则为被检索到的图像。

为更好的实现本发明，进一步为：

所述步骤一具体为，采用手机或者VR眼镜拍摄需要检索的标识图像。

所述步骤二具体为：

2.1：将采集的图像在终端中通过目标框的方式进行标注；

2.2：将标注出的网络训练yolo网络，其中通过squeezenet网络作为检测网络的主干网络；

2.3：利用yolo网络检测出商铺标识图像的坐标位置；

2.4：对商铺标识图像的位置信息进行剪切，保存商铺标识图像。

所述步骤三具体为：

3.1：对商铺标识图像和数据库图像进行直方图均衡化处理；

3.2：将商铺标识图像和数据库图像缩放到统一规格大小，具体为128*64像素；

3.3：将商铺标识图像和数据库图像进行4*2分块。

所述步骤四具体为，先通过颜色矩和灰度共生矩阵提取图像的中低层特征，然后通过CNN卷积神经网络提取图像的高层特征。

本发明的有益效果为：1、商铺标识检测和其他的图像检索略有区别的是，商铺标识只占图像中的一小部分，需要从拍摄的图像中准确的找出标识位置；本发明通过改进的检测算法，用移动端的网络结构squeezenet改进原始的算法，在保证精度的同时速度得到了三倍提升；在正面拍摄的图像中标识检测的召回率高达99.5％以上；

2、采用分块思想，提取图像分块的局部特征，同时提取整图特征信息，达到局部与全局特征相结合；由于大部分商铺标识图像宽大于高，因此采用4*2分块，将图像宽分为四部分、高分为两部分；保证标识图像的各位置特征信息重要性一致；通过多种特征提取方法提取图像的不同特征，分别求得各自的特征相似度，根据相似度加权求得最终相似度；不同方法提取的特征保证不同层次的特征，由于特征的维度不一致，特征融合不利于各自特征能发挥出其该有的作用，因此单独计算相似度再求平均；保证检索精度；

3、本发明中商铺标识注册的数据库中，每类商铺标识有且仅有一张图像特征，因此需要成功检索出数据库中唯一的标识图像，需要保证各层次特征的提取；本发明在特征提取环节花费较大资源，检索精度达99％以上，而且图像的特征提取、相似度计算等都在服务器端处理，所以同样能够达到实时；

附图说明

图1为本发明的流程示意图。

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。

如图1所示：一种基于内容的商铺标识图像检索方法，具体步骤为：

S1：用手机或者VR眼镜拍摄需要检索标识图像；

S2：用yolo网络对图像进行标识检测；若为检测到标识图像则不返回数据；若检测到一个或者多个标识图像则返回置信度最高的标识图像；并将裁剪后的数据发送到云端；

具体的检测定位步骤为：

S2.1：数据采集；标识检测训练集收集，通过手机拍摄含有标识的图像；

S2.2：数据标注；将图像中的标识通过目标框的方式标注出来；

S2.3：标识检测网络的训练；通过S1标注好的网络训练yolo网络，用于yolov3网络主干网络darknet53结构较深，消耗资源较大，本实施例通过squeezenet网络作为检测网络的主干网络，网络模型由原生yolov3的234M降到约30M，推理时间约提升了3倍,能在移动设备端达到实时；在检测标识图像上与原始yolo精度没有明显的降低，同时效果好于tiny-yolo版本；

S2.4：yolo网络对标识检测；通过S3训练好的模型对拍摄的图像进行推理测试；得到标识所在图像的坐标位置；

S2.5：根据S4得到的标识位置信息对其进行裁剪，保存标识图像，用于后续检索需要。

S3：数据预处理；数据库中的图像是高清的纯标识图像，不需要定位裁剪等，只要将图像进行均衡化、缩放和切块；查询数据根据S2得到的数据进行同样的预处理；具体为图像预处理为了更好的提取图像中的特征信息；首先对图像进行直方图均衡化，直方图均衡化是一种简单的图像增强技术，能够增大图像的对比度，使图像更清晰；然后将图像缩放到统一大小128*64；最后将缩放后的图像进行4*2的分块，得到最后的分块图像为32*32；

S4：特征提取；分别对1张整图和8张小图提取三种特征；数据库图像采用同样的方法提取特征保存在数据库中；具体为先通过颜色矩和灰度共生矩阵提取图像的中低层特征，通过CNN(卷积神经网络)提取图像的高层特征；颜色矩是一种简单有效的颜色特征表示方法，有一阶矩(均值)、二阶矩(方差)和三阶矩(斜度)等，由于颜色信息主要分布于低阶矩中，所以颜色矩能够有效正面图像中的颜色分布信息；灰度共生矩阵，指的是一种通过研究灰度的空间相关特性来描述纹理的常用方法。由于纹理是由灰度分布在空间位置上反复出现而形成的，因而在图像空间中相隔某距离的两像素之间会存在一定的灰度关系，即图像中灰度的空间相关特性。卷积神经网络提取的是图像高层语义信息，相比Googlenet和resnet，vgg提取的特征偏局部一些，所以选用了vgg16网络，模型是在imagenet数据集预训练的权重模型，取网络的前10层加上一层全局最大池化层，得到最后的256个特征数据；

S5：相似度计算；通过余弦距离计算每一种特征的相似度；最后通过加权平均方法求得最终相似度；取相似度最高且大于设定阈值时，则为检索到的图像；

特征提取之后由于维度差异，并为进行特征融合，而是各自比较相似度，最后加权平均三个相似度得到最终的相似度；因此一个标识图像分成8块，加上整图总共9块，每块需要提取上述三个图像特征；另外，整图的信息特征重要程度要大于每一个小分块的图像，经过实验表明，小块相似度权重为1，整块权重相似度为3时的效果最好；其中S1-2在移动端处理，S3-5在云端处理。

Claims

1.一种基于内容的商铺标识图像检索方法，其特征在于，具体步骤为：

步骤一：图像采集；

步骤二：图像检测，从采集的图像中识别出商铺标识图像；

步骤三：对商铺标识图像和数据库图像数据进行预先处理；

步骤四：对商铺标识图像和数据库图像提取特征；

2.根据权利要求1所述基于内容的商铺标识图像检索方法，其特征在于：

3.根据权利要求1所述基于内容的商铺标识图像检索方法，其特征在于，

所述步骤二具体为：

2.1：将采集的图像在终端中通过目标框的方式进行标注；

2.3：利用yolo网络检测出商铺标识图像的坐标位置；

4.根据权利要求1所述基于内容的商铺标识图像检索方法，其特征在于，

所述步骤三具体为：

3.1：对商铺标识图像和数据库图像进行直方图均衡化处理；

3.3：将商铺标识图像和数据库图像进行4*2分块。

5.根据权利要求1所述基于内容的商铺标识图像检索方法，其特征在于，所述步骤四具体为，先通过颜色矩和灰度共生矩阵提取图像的中低层特征，

然后通过CNN卷积神经网络提取图像的高层特征。