CN112347284B - 一种组合商标图像检索方法 - Google Patents
一种组合商标图像检索方法 Download PDFInfo
- Publication number
- CN112347284B CN112347284B CN202010975070.4A CN202010975070A CN112347284B CN 112347284 B CN112347284 B CN 112347284B CN 202010975070 A CN202010975070 A CN 202010975070A CN 112347284 B CN112347284 B CN 112347284B
- Authority
- CN
- China
- Prior art keywords
- trademark
- sequence
- character
- search result
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 32
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 30
- 238000012163 sequencing technique Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 125000004122 cyclic group Chemical group 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 102100032202 Cornulin Human genes 0.000 claims description 5
- 101000920981 Homo sapiens Cornulin Proteins 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000013518 transcription Methods 0.000 claims description 4
- 230000035897 transcription Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种组合商标图像检索方法,包括:收集各类商标图像,建立商标库;使用卷积神经网络模型提取待检测组合商标图像的特征,并计算提取得到的特征与商标库中各个商标提取到的特征的欧式距离,根据欧式距离的大小对商标检索结果进行排序,得到基于图像特征的检索结果序列Q;使用端对端的文字识别算法检索并识别待检测组合商标中的文字;对识别得到的文字与商标库中的各个商标对应文字进行相似度排序,得到基于文字识别的检索结果序列T;融合检索结果序列Q和检索结果序列T,得到最终检索结果序列S。本方法分别对图像与文字进行提取和识别,并融合两者得到最终的检索结果。可以较准确地检索到组合商标图像相似性结果。
Description
技术领域
本发明属于数字图像处理领域,涉及一种组合商标图像检索方法。
背景技术
商标图像根据图像内容可以大致分为文字商标、图形商标、组合商标三类,如图2所示。尺度不变特征变换算法(SIFT)能够提取比较稳定的图像特征,具有尺度不变性,对于旋转和光照变化的图像具有鲁棒性,但是传统的基于SIFT特征的图像检索方法,如Jia S等在《Trademark image retrieval algorithm based on SIFT feature》(GreenCommunications and Networks,2017,113:201-207.)中提到的图像检索方法,对于当前大规模的商标图像而言,效率效果都相对较低,方法的适用性不广。Noh H等在《Large-scaleimage retrieval with attentive deep local features》(Proceedings of the IEEEInternational Conference on Computer Vision,2017:3456-3465.)中提出了一种大规模商标图像检索技术,利用全卷积神经网络模型Resnet50提取局部密集特征,提取的特征具有语义局部特征,使特征匹配更加精确。WenMei等在《Trademark image retrievalbased on faster R-CNN》(Journal of Physics Conference Series,2019,1237(3):32-42.)中,首次将Faster R-CNN应用于商标图像检索,图像的全局特征描述符由Faster R-CNN提取,图像的局部特征由RPN网络提取。
但上述方法均没有考虑到组合商标图像中含有大量文字。这些文字不仅需要从字形出发判断是否有近似商标,其读音是否与已有注册商标相近也是商标注册审查时需要考虑的因素。
发明内容
为克服现有技术缺陷,本发明提出一种组合商标图像检索方法。
本发明目的通过至少通过以下技术方案之一实现。
一种组合商标图像检索方法,包括以下步骤:
收集各类商标图像,若商标中含有文字,标注其文字信息,建立商标库;
使用卷积神经网络模型提取待检测组合商标图像的特征,并计算提取得到的特征与商标库中各个商标提取到的特征的欧式距离,根据欧式距离的大小对商标检索结果进行排序,得到基于图像特征的检索结果序列Q;
使用端对端的文字识别算法检索并识别待检测组合商标中的文字;
对识别得到的文字与商标库中的各个商标对应文字进行相似度排序,得到基于文字识别的检索结果序列T;
融合检索结果序列Q和检索结果序列T,得到最终检索结果序列S,即为最终的商标检索结果。
进一步的,述卷积神经网络模型为VGG16预训练模型,所述欧式距离的计算公式为:
其中,A,B为两个n维特征向量,Ai为向量A在第i维度上的值,Bi为向量B在第i维度上的值。
进一步的,所述端对端的文字识别算法为CRNN算法,由卷积神经网络CNN、循环神经网络RNN和转录层CTC Loss组成,CNN负责提取输入文字图像的特征,得到特征图;将CNN输出的特征图输入到循环神经网络RNN中对特征序列进行预测,对序列中的每个特征向量进行学习,并输出预测标签分布,得到预测结果后,使用CTC Loss,把从循环层得到的标签分布转换成最后的标签序列,从而得到文字识别结果。
进一步的,采用文字排序算法为融合文字拼音编码与五笔编码的文字排序算进行所述相似度排序,具体步骤为:
计算两个文字字符串的拼音编码差异DPY:
其中,aPY,bPY分别表示待排序的文字字符的拼音编码,ED(·)表示编辑距离算法,MAX(·)表示为求两个数的最大值,|·|表示为求该文字字符串的长度,
所述编辑距离算法指两个字符串之间,由一个转成另一个所需要的最小编辑操作次数,计算过程如下:两个字符串a,b的距离以动态规划的算法进行计算,首先构造一个以|a|+1为行,|b|+1为列的过程矩阵D,先给矩阵D的第一行和第一列赋值从0开始递增,D[i][0]=i,0≤i≤|a|,D[0][j]=j,0≤j≤|b|,之后矩阵中的其他元素由下式计算得到:
D[i][j]=min(D[i-1][j]+1,D[i][j-1]+1,D[i-1][j-1]+cost)
其中,D[i-1][j]+1代表删除一个字符的操作,D[i][j-1]+1代表增加一个字符的操作,D[i-1][j-1]+cost代表替换字符操作,cost的值由a[i]、b[j]两数的关系确定,如果a[i]=b[j],则cost=1,否则cost=0,以此迭代计算出最后D[|a|][|b|]的值为编辑距离ED(a,b)的值,
计算两个文字字符串的五笔编码差异DWB:
其中,aWB,bWB分别表示待排序的文字字符的五笔编码;
计算两个文字字符串的编辑距离,求解过程中,过程矩阵Ds第一行第一列的元素计算如下:
D[i][0]=i,0≤i≤|a|
D[0][j]=j,0≤j≤|b|
过程矩阵Ds除第一行第一列以外的其他元素计算如下:
根据计算得到的编辑距离,对识别得到的文字与商标库中的各个商标对应文字进行相似度排序,得到基于文字识别的检索结果序列T。
进一步的,所述融合检索结果序列Q和检索结果序列T,得到最终检索结果序列S,具体为:
检索序列Q和T都有的商标,如果商标库中某一商标同时存在于序列Q与T中,则将该商标列入最终检索结果序列S中,如果有多个商标都存在序列Q和T中,则以各个商标在序列Q和T的顺序平均值依次列入序列S中;
如果商标库中某一商标只存在于序列Q或T中,则根据其在各个序列中的顺序依次列入序列S中,如果两个商标分别在序列Q的顺序与序列T的顺序相同,则优先将序列Q对应的商标列入序列S中。
本发明还提供一种组合商标图像检索装置,包括:
商标库建立模块,用于收集各类商标图像,若商标中含有文字,标注其文字信息;
特征提取模块,用于使用卷积神经网络模型提取待检测组合商标图像的特征;
计算排序模块,用于计算提取得到的特征与商标库中各个商标提取到的特征的欧式距离,并根据欧式距离的大小对商标检索结果进行排序,得到基于图像特征的检索结果序列Q;
识别模块,用于使用端对端的文字识别算法检索并识别待检测组合商标中的文字;
排序模块,用于对识别得到的文字与商标库中的各个商标对应文字进行相似度排序,得到基于文字识别的检索结果序列T;
融合模块,用于融合检索结果序列Q和检索结果序列T,得到最终检索结果序列S,即为最终的检索结果。
本发明还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
本发明还提供一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
与现有技术相比,本发明实现的有益效果至少如下:
本发明结合了组合商标的图像特点与实际商标注册的需求,是一种高效高质的组合商标图像检索方法。本发明所提供的方法,首先提取商标图像特征并且进行文字识别,再分别对图像特征与识别文字与商标库中的各个商标进行相似度检索排序,最后融合图像与文字的检索结果,得到最终检索结果。同时考虑商标图像中的图像和文字,可以更为准确地检索到组合商标图像相似性结果。
附图说明
图1:本发明实施例的流程图。
图2:商标库部分商标图像示例。
图3:商标库分类情况示例。
图4:VGG16模型示意图。图4中仍存在有灰度填充,请进行修改
图5:本发明实施例于自建商标库的部分检索结果。
图6:本发明实施例中的一种组合商标图像检索装置的结构框图。
具体实施方式
以下结合附图和具体实施方式对本发明的方案做进一步的阐述。
实施例1
请见图1,在一个具体的实施例中,提供了一种组合商标图像方法,包括以下步骤:
步骤1:收集各类商标图像,整理为商标库,商标库部分商标图像如图2所示,商标库中含有文字商标、图形商标和组合商标。一共1000张商标图像,同时通过人工分类,将相同相近或相似的商标归为一类,每个类图片有1-15张商标图像,其中某一分类商标如图3所示。如果商标中含有文字,则标注其文字信息。
步骤2:使用卷积神经网络模型提取待检测组合商标图像的特征,并计算提取得到的特征与商标库中各个商标提取到的特征的欧式距离,根据欧式距离的大小对商标检索结果进行排序,得到基于图像特征的检索结果序列Q。
具体的,使用VGG16模型提取组合商标图像的特征。所使用的VGG16模型包含13个卷积层和3个全连接层,其中包括5个卷积层,每个卷积层后面有一个最大池化层,所有隐层的激活单元都采用ReLU函数。卷积层后面有两个4096维度和一个1000维度的全连接层,全连接层后面是一个softmax分类器。卷积层的后面都采用3x3的小卷积核来进行池化操作,卷积层步长被设置为1,VGG16模型如图4所示。由于当前商标图像没有一个标准的数据集,重新建立数据集训练网络并不可行,因此将直接采用以普通图像进行预训练得到的VGG16网络模型,将商标图像输入经过预训练的VGG16模型,进行模型微调。
使用同一VGG16模型对商标库的各个商标进行特征提取,计算待检索商标的特征与商标库中各个商标的特征的欧式距离,欧式距离计算公式为:
其中,A,B为两个n维特征向量,Ai为向量A在第i维度上的值,Bi为向量B在第i维度上的值。根据欧式距离的大小对商标检索结果进行排序,得到基于图像特征的检索结果序列Q。
步骤3:使用端对端的文字识别算法检索并识别待检测组合商标中的文字。
具体的,使用CRNN算法检索并识别组合商标中的文字。CRNN算法,由卷积神经网络CNN、循环神经网络RNN和转录层CTC Loss组成,CNN主要负责提取输入文字图像的特征,得到特征图。再把CNN输出的特征图输入到RNN循环神经网络中对特征序列进行预测,对序列中的每个特征向量进行学习,并输出预测标签分布,得到预测结果后,使用CTC Loss,把从循环层得到的标签分布转换成最后的标签序列,从而得到文字识别结果。
步骤4:对识别得到的文字与商标库中的各个商标对应文字进行相似度排序,得到基于文字识别的检索结果序列T。
具体的,采用融合文字拼音编码与五笔编码的文字排序算法,具体步骤为:
步骤4.1:计算两个文字字符串的拼音编码差异DPY:
其中,aPY,bPY分别表示待排序的文字字符的拼音编码,ED(·)表示编辑距离算法,MAX(·)表示为求两个数的最大值,|·|表示为求该文字字符串的长度,
编辑距离算法指两个字符串之间,由一个转成另一个所需要的最小编辑操作次数,计算过程如下:两个字符串a,b的距离以动态规划的算法进行计算,首先构造一个以|a|+1为行,|b|+1为列的过程矩阵D,先给矩阵D的第一行和第一列赋值从0开始递增,D[i][0]=i,0≤i≤|a|,D[0][j]=j,0≤j≤|b|,之后矩阵中的其他元素由下式计算得到:
D[i][j]=min(D[i-1][j]+1,D[i][j-1]+1,D[i-1][j-1]+cost)
其中,i,j为字符下标,D[i][j]代表字符串a[0],a[1],...,a[i]和字符串b[0],b[1],...,b[j]的编辑距离,D[i-1][j]+1代表删除一个字符的操作,D[i][j-1]+1代表增加一个字符的操作,D[i-1][j-1]+cost代表替换字符操作,cost代表字符a[i]、字符b[j]是否相等,其值由a[i]、b[j]两数的关系确定,如果a[i]=b[j],则cost=1,否则cost=0,以此迭代计算出最后D[|a|][|b|]的值为编辑距离ED(a,b)的值;
步骤4.2:计算两个文字字符串的五笔编码差异DWB:
其中,aWB,bWB分别表示待排序的文字字符的五笔编码;
步骤4.3:计算两个文字字符串的编辑距离,求解过程中,过程矩阵Ds第一行第一列的元素计算如下:
D[i][0]=i,0≤i≤|a|
D[0][j]=j,0≤j≤|b|
过程矩阵Ds除第一行第一列以外的其他元素计算如下:
步骤4.4:根据计算得到的编辑距离,对识别得到的文字与商标库中的各个商标对应文字进行相似度排序,得到基于文字识别的检索结果序列T。
步骤5:融合检索结果序列Q和T,得到最终检索结果序列S,即为最终的商标检索结果。具体包括以下步骤:
步骤5.1:检索序列Q和T都有的商标,如果商标库中某一商标同时存在于序列Q与T中,则将该商标列入最终检索结果序列S中,如果有多个商标都存在序列Q和T中,则以各个商标在序列Q和T的顺序平均值依次列入序列S中;
步骤5.2:如果商标库中某一商标只存在于序列Q或T中,则根据其在序列中的顺序列入序列S中,如果两个商标分别在序列Q的顺序与序列T的顺序相同,则优先将序列Q对应的商标列入序列S中。通过以上步骤最终得到检索结果序列S。
本发明具体实施例步骤1所建立的商标库,其部分检索结果如图5所示。采用查全率(Recall)、和平均精度均值(Mean Average Precision,MAP)作为商标图像检索结果评价指标,与SIFT、HU矩特征、SURF三种图像检索算法,深度学习方法Resnet50模型、VGGnet模型作对比,根据步骤1所建立的商标库每一类都有15个相似的商标图像,因此当检索数量设置为15时,计算查全率和MAP,其对比结果如下。
表1五种方法商标检索对比结果1
查全率 | MAP | |
SIFT | 0.682 | 0.786 |
HU | 0.601 | 0.702 |
SURF | 0.716 | 0.790 |
Resnet50 | 0.805 | 0.818 |
VGGnet | 0.812 | 0.825 |
本申请的方法 | 0.862 | 0.884 |
当检索数量不设置为15时,一般以查找到相似商标图像为优先选择,因此仅考虑查全率,其对比结果如下。
表2五种方法商标检索对比结果1
从表1和表2可以明显看到,相比于其他现有的检索方法,采用本实施例提供的检索方法的得到商标检索结果明显更优,体现了本实施例提供的组合商标检索方法的优越性,可以更为准确地检索到组合商标图像的相似性结果。
实施例2
在一个具体的实施例中,如图6所示,提供了一种组合商标图像检索装置,包括:
商标库建立模块,用于收集各类商标图像,若商标中含有文字,标注其文字信息;
特征提取模块,用于使用卷积神经网络模型提取待检测组合商标图像的特征;
计算排序模块,用于计算提取得到的特征与商标库中各个商标提取到的特征的欧式距离,并根据欧式距离的大小对商标检索结果进行排序,得到基于图像特征的检索结果序列Q;
识别模块,用于使用端对端的文字识别算法检索并识别待检测组合商标中的文字;
排序模块,用于对识别得到的文字与商标库中的各个商标对应文字进行相似度排序,得到基于文字识别的检索结果序列T;
融合模块,用于融合检索结果序列Q和检索结果序列T,得到最终检索结果序列S,即为最终的检索结果。
其中,特征提取模块中的卷积神经网络模型为VGG16预训练模型。
其中,计算排序模块中欧式距离的计算公式为:
其中,A,B为两个n维特征向量,Ai为向量A在第i维度上的值,Bi为向量B在第i维度上的值。
其中,识别模块中的识别算法为CRNN算法,由卷积神经网络CNN、循环神经网络RNN和转录层CTC Loss组成,CNN负责提取输入文字图像的特征,得到特征图;将CNN输出的特征图输入到循环神经网络RNN中对特征序列进行预测,对序列中的每个特征向量进行学习,并输出预测标签分布,得到预测结果后,使用CTC Loss,把从循环层得到的标签分布转换成最后的标签序列,从而得到文字识别结果。
其中,融合模块中采用融合文字拼音编码与五笔编码的文字排序算进行所述相似度排序。
上述的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
实施例3
在一个具体的实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述组合商标图像检索方法的步骤。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、数据库、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储商标样本图像以及数据库等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述组合商标图像检索方法。
实施例4
在一个具体的实施例中,提供了一种计算机可读介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述组合商标图像检索方法的步骤。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (4)
1.一种组合商标图像检索方法,其特征在于,包括以下步骤:
收集各类商标图像,若商标中含有文字,标注其文字信息,建立商标库;
使用卷积神经网络模型提取待检测组合商标图像的特征,并计算提取得到的特征与商标库中各个商标提取到的特征的欧式距离,根据欧式距离的大小对商标检索结果进行排序,得到基于图像特征的检索结果序列Q;
使用端对端的文字识别算法检索并识别待检测组合商标中的文字;
对识别得到的文字与商标库中的各个商标对应文字进行相似度排序,得到基于文字识别的检索结果序列T;
融合检索结果序列Q和检索结果序列T,得到最终检索结果序列S,即为最终的商标检索结果;所述卷积神经网络模型为VGG16预训练模型,所述欧式距离的计算公式为:
其中,A,B为两个n维特征向量,Am为向量A在第m维度上的值,Bm为向量B在第m维度上的值;
根据欧式距离的大小对商标检索结果进行排序,得到基于图像特征的检索结果序列Q;所述端对端的文字识别算法为CRNN算法,由卷积神经网络CNN、循环神经网络RNN和转录层CTC Loss组成,CNN负责提取输入文字图像的特征,得到特征图;将CNN输出的特征图输入到循环神经网络RNN中对特征序列进行预测,对序列中的每个特征向量进行学习,并输出预测标签分布,得到预测结果后,使用CTC Loss,把从循环层得到的标签分布转换成最后的标签序列,从而得到文字识别结果;采用融合文字拼音编码与五笔编码的文字排序算法进行所述相似度排序,并得到基于文字识别的检索结果序列T,具体步骤为:
计算两个文字字符串的拼音编码差异DPY:
其中,aPY,bPY分别表示待排序的文字字符的拼音编码,ED(·)表示编辑距离算法,MAX(·)表示为求两个数的最大值,|·|表示为求该文字字符串的长度,
所述编辑距离算法指两个字符串之间,由一个转成另一个所需要的最小编辑操作次数,计算过程如下:两个字符串a,b的距离以动态规划的算法进行计算,首先构造一个以|a|+1为行,|b|+1为列的过程矩阵D,先给矩阵D的第一行和第一列赋值从0开始递增,D[i][0]=i,0≤i≤|a|,D[0][j]=j,0≤j≤|b|,之后矩阵中的其他元素由下式计算得到:
D[i][j]=min(D[i-1][j]+1,D[i][j-1]+1,D[i-1][j-1]+cost)
其中,i,j为字符下标,D[i][j]代表字符串a[0],a[1],...,a[i]和字符串b[0],b[1],...,b[j]的编辑距离,D[i-1][j]+1代表删除一个字符的操作,D[i][j-1]+1代表增加一个字符的操作,D[i-1][j-1]+cost代表替换字符操作,cost代表字符a[i]、字符b[j]是否相等,其值由a[i]、b[j]两数的关系确定,如果a[i]=b[j],则cost=1,否则cost=0,以此迭代计算出最后D[|a|][|b|]的值为编辑距离ED(a,b)的值;
计算两个文字字符串的五笔编码差异DWB:
其中,aWB,bWB分别表示待排序的文字字符的五笔编码;
计算两个文字字符串的编辑距离,求解过程中,过程矩阵Ds第一行第一列的元素计算如下:
D[i][0]=i,0≤i≤|a|
D[0][j]=j,0≤j≤|b|
过程矩阵Ds除第一行第一列以外的其他元素计算如下:
其中,D[i-1][j]+1代表删除一个字符的操作,D[i][j-1]+1代表增加一个字符的操作,D[i-1][j-1]+cost代表替换字符操作;
根据计算得到的编辑距离,对识别得到的文字与商标库中的各个商标对应文字进行相似度排序,得到基于文字识别的检索结果序列T;所述融合检索结果序列Q和检索结果序列T,得到最终检索结果序列S,具体为:
检索序列Q和序列T都有的商标,如果商标库中某一商标同时存在于序列Q与T中,则将该商标列入最终检索结果序列S中,如果有多个商标都存在序列Q和序列T中,则以各个商标在序列Q和序列T的顺序平均值依次列入序列S中;
如果商标库中某一商标只存在于序列Q或T中,则根据其在序列中的顺序列入序列S中,如果两个商标分别在序列Q的顺序与序列T的顺序相同,则优先将序列Q对应的商标列入序列S中。
2.一种实现权利要求1所述检索方法的组合商标图像检索装置,其特征在于,包括:
商标库建立模块,用于收集各类商标图像,若商标中含有文字,标注其文字信息;
特征提取模块,用于使用卷积神经网络模型提取待检测组合商标图像的特征;
计算排序模块,用于计算提取得到的特征与商标库中各个商标提取到的特征的欧式距离,并根据欧式距离的大小对商标检索结果进行排序,得到基于图像特征的检索结果序列Q;
识别模块,用于使用端对端的文字识别算法检索并识别待检测组合商标中的文字;
排序模块,用于对识别得到的文字与商标库中的各个商标对应文字进行相似度排序,得到基于文字识别的检索结果序列T;
融合模块,用于融合检索结果序列Q和检索结果序列T,得到最终检索结果序列S,即为最终的检索结果。
3.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1所述方法的步骤。
4.一种计算机可读介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010975070.4A CN112347284B (zh) | 2020-09-16 | 2020-09-16 | 一种组合商标图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010975070.4A CN112347284B (zh) | 2020-09-16 | 2020-09-16 | 一种组合商标图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112347284A CN112347284A (zh) | 2021-02-09 |
CN112347284B true CN112347284B (zh) | 2024-05-14 |
Family
ID=74358146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010975070.4A Active CN112347284B (zh) | 2020-09-16 | 2020-09-16 | 一种组合商标图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112347284B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926592B (zh) * | 2021-04-13 | 2022-07-26 | 南京邮电大学 | 一种基于改进Fast算法的商标检索方法及装置 |
CN113505257A (zh) * | 2021-05-26 | 2021-10-15 | 中国科学院深圳先进技术研究院 | 图像检索方法、商标检索方法、电子设备以及存储介质 |
WO2024019634A1 (ru) * | 2022-07-22 | 2024-01-25 | Публичное Акционерное Общество "Сбербанк России" | Способ и система поиска графических изображений |
CN115311477B (zh) * | 2022-08-09 | 2024-01-16 | 北京惠朗时代科技有限公司 | 一种基于超分辨率重建的模仿式商标精准检测方法及系统 |
CN115048543B (zh) * | 2022-08-15 | 2022-10-25 | 北京华顺信安科技有限公司 | 图像相似判断方法、图像搜索方法及设备 |
CN115344738B (zh) * | 2022-10-18 | 2023-02-28 | 南通知果科技有限公司 | 基于人工智能的检索方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258037A (zh) * | 2013-05-16 | 2013-08-21 | 西安工业大学 | 一种针对多组合内容的商标识别检索方法 |
CN104462380A (zh) * | 2014-12-11 | 2015-03-25 | 北京中细软移动互联科技有限公司 | 商标检索方法 |
CN108664556A (zh) * | 2018-04-03 | 2018-10-16 | 南昌奇眸科技有限公司 | 适用于组合商标的并行检索系统及方法 |
KR20190009061A (ko) * | 2017-07-18 | 2019-01-28 | 주식회사 싱크텍처 | 문자 상표 검색 시스템 및 검색 서비스 제공 방법 |
-
2020
- 2020-09-16 CN CN202010975070.4A patent/CN112347284B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258037A (zh) * | 2013-05-16 | 2013-08-21 | 西安工业大学 | 一种针对多组合内容的商标识别检索方法 |
CN104462380A (zh) * | 2014-12-11 | 2015-03-25 | 北京中细软移动互联科技有限公司 | 商标检索方法 |
KR20190009061A (ko) * | 2017-07-18 | 2019-01-28 | 주식회사 싱크텍처 | 문자 상표 검색 시스템 및 검색 서비스 제공 방법 |
CN108664556A (zh) * | 2018-04-03 | 2018-10-16 | 南昌奇眸科技有限公司 | 适用于组合商标的并行检索系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112347284A (zh) | 2021-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112347284B (zh) | 一种组合商标图像检索方法 | |
CN109165306B (zh) | 基于多任务哈希学习的图像检索方法 | |
CN112199375B (zh) | 跨模态的数据处理方法、装置、存储介质以及电子装置 | |
CN110866140B (zh) | 图像特征提取模型训练方法、图像搜索方法及计算机设备 | |
WO2020147857A1 (zh) | 海量视频特征提取以及存储和检索方法及系统 | |
CN108427738B (zh) | 一种基于深度学习的快速图像检索方法 | |
CN108763380B (zh) | 商标识别检索方法、装置、计算机设备和存储介质 | |
CN110222218B (zh) | 基于多尺度NetVLAD和深度哈希的图像检索方法 | |
Wilkinson et al. | Neural Ctrl-F: segmentation-free query-by-string word spotting in handwritten manuscript collections | |
CN112819023B (zh) | 样本集的获取方法、装置、计算机设备和存储介质 | |
CN111738169B (zh) | 一种基于端对端网络模型的手写公式识别方法 | |
CN111476315A (zh) | 一种基于统计相关性与图卷积技术的图像多标签识别方法 | |
CN113836992B (zh) | 识别标签的方法、训练标签识别模型的方法、装置及设备 | |
CN110347857B (zh) | 基于强化学习的遥感影像的语义标注方法 | |
CN111159485A (zh) | 尾实体链接方法、装置、服务器及存储介质 | |
CN113051914A (zh) | 一种基于多特征动态画像的企业隐藏标签抽取方法及装置 | |
Van Phan et al. | A nom historical document recognition system for digital archiving | |
CN110705490A (zh) | 视觉情感识别方法 | |
CN112948601A (zh) | 一种基于受控语义嵌入的跨模态哈希检索方法 | |
CN114579794A (zh) | 特征一致性建议的多尺度融合地标图像检索方法及系统 | |
CN110110120B (zh) | 一种基于深度学习的图像检索方法和装置 | |
CN111144469B (zh) | 基于多维关联时序分类神经网络的端到端多序列文本识别方法 | |
CN108845999B (zh) | 一种基于多尺度区域特征比对的商标图像检索方法 | |
CN115713970A (zh) | 基于Transformer-Encoder和多尺度卷积神经网络的转录因子识别方法 | |
CN115496948A (zh) | 一种基于深度学习的网络监督细粒度图像识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |