CN114428878A - 一种商标图像检索方法及系统 - Google Patents
一种商标图像检索方法及系统 Download PDFInfo
- Publication number
- CN114428878A CN114428878A CN202210356178.4A CN202210356178A CN114428878A CN 114428878 A CN114428878 A CN 114428878A CN 202210356178 A CN202210356178 A CN 202210356178A CN 114428878 A CN114428878 A CN 114428878A
- Authority
- CN
- China
- Prior art keywords
- trademark
- candidate frame
- candidate
- trademark image
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
Abstract
本发明涉及数据检索技术领域,具体公开了一种商标图像检索方法及系统,所述方法包括接收用户输入的含有商标分类信息的商标图像,基于所述商标分类信息确定检索库;提取所述商标图像中的文本信息,将提取到的文本信息与所述检索库中的文字项进行比对,根据比对结果更新所述检索库;对所述商标图像进行内容识别,确定所述商标图像的特征向量;基于所述特征向量在更新后的检索库中查询并显示目标商标。本发明通过提取所述商标图像中的文本信息,然后对所述商标图像进行内容识别,确定所述商标图像的特征向量,根据文本信息和特征向量缩小检索范围,极大地提高了检索效率。
Description
技术领域
本发明涉及数据检索技术领域,具体是一种商标图像检索方法及系统。
背景技术
商标是用以识别和区分商品或者服务来源的标志。任何能够将自然人、法人或者其他组织的商品与他人的商品区别开的标志,包括文字、图形、字母、数字、三维标志、颜色组合和声音等,以及上述要素的组合,均可以作为商标申请注册。
申请人在商标申请之前,都会进行一些简单的检索,由于商标的种类多种多样,现有的检索技术大都是基于数据库的遍历检索过程;随着数据库规模的扩大,基于数据库的遍历检索过程的效率也会随之降低,如何提高商标检索的效率是本发明技术方案想要解决的技术问题。
发明内容
本发明的目的在于提供一种商标图像检索方法及系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种商标图像检索方法,所述方法包括:
接收用户输入的含有商标分类信息的商标图像,基于所述商标分类信息确定检索库;所述检索库包括文字项和图像特征项;
提取所述商标图像中的文本信息,将提取到的文本信息与所述检索库中的文字项进行比对,根据比对结果更新所述检索库;
对所述商标图像进行内容识别,确定所述商标图像的特征向量;
基于所述特征向量在更新后的检索库中查询并显示目标商标。
作为本发明进一步的方案:所述提取所述商标图像中的文本信息的步骤包括:
对所述商标图像进行文本检测,根据文本检测结果在所述商标图像上标记候选框及各候选框对应的原始置信度;其中,所述候选框的位置由文本行位置确定;
对候选框进行轮廓分析,根据轮廓分析结果合并所述候选框;
识别合并后的候选框中的文本信息。
作为本发明进一步的方案:所述对候选框进行轮廓分析,根据轮廓分析结果合并所述候选框的步骤包括:
依次将候选框两两比对,确定存在交集区域的候选框;
获取存在交集区域的候选框的原始置信度,将原始置信度更大的候选框作为第一候选框,另一候选框作为第二候选框;
根据所述第一候选框与所述第二候选框的交集区域的尺寸以及闭包区域的尺寸,计算所述第二候选框的损失参数;
计算所述第一候选框与所述第二候选框的原始交并比,根据所述第二候选框的损失参数修正所述原始交并比,获得修正交并比;
根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度;
将所述第二候选框的修正置信度与预设的置信度阈值进行比对,根据比对结果合并两个候选框。
作为本发明进一步的方案:所述根据所述第一候选框与所述第二候选框的交集区域的尺寸以及闭包区域的尺寸,计算所述第二候选框的损失参数的步骤包括:
获取所述交集区域的宽度和高度,以及所述闭包区域的宽度和高度;
根据所述交集区域与所述闭包区域的高度比,以及所述交集区域与所述闭包区域的宽度比,计算所述第二候选框的损失参数。
作为本发明进一步的方案:所述根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度的步骤包括:
根据所述修正交并比计算所述第二候选框的衰减权值;
基于所述第二候选框的衰减权值修正所述第二候选框的原始置信度,获得所述第二候选框的修正置信度。
作为本发明进一步的方案:所述对所述商标图像进行内容识别,确定所述商标图像的特征向量的步骤包括:
对所述商标图像进行轮廓识别,获取商标轮廓;
根据所述商标轮廓确定商标区域,计算商标区域内的闭合区域参数;其中,所述闭合区域参数包括闭合区域中心点位置信息和闭合区域大小信息;
根据预设的遍历方向对所述商标轮廓进行拆分,得到各商标图像的轮廓特征;
将所述闭合区域参数和所述轮廓特征输入训练好的向量生成模型,得到该商标图像的特征向量。
作为本发明进一步的方案:所述基于所述特征向量在更新后的检索库中查询并显示目标商标的步骤包括:
基于所述特征向量遍历更新后的检索库中的图像特征项,并计算重合度;
将所述重合度与预设的重合度进行比对,当所述重合度达到预设的重合度阈值时,标记检索库中对应的数据项;
统计标记的数据项,得到并显示目标商标。
本发明技术方案还提供了一种商标图像检索系统,所述系统包括:
检索库确定模块,用于接收用户输入的含有商标分类信息的商标图像,基于所述商标分类信息确定检索库;所述检索库包括文字项和图像特征项;
检索库更新模块,用于提取所述商标图像中的文本信息,将提取到的文本信息与所述检索库中的文字项进行比对,根据比对结果更新所述检索库;
特征向量确定模块,用于对所述商标图像进行内容识别,确定所述商标图像的特征向量;
商标查询模块,用于基于所述特征向量在更新后的检索库中查询并显示目标商标。
作为本发明进一步的方案:所述检索库更新模块包括:
文本检测单元,用于对所述商标图像进行文本检测,根据文本检测结果在所述商标图像上标记候选框及各候选框对应的原始置信度;其中,所述候选框的位置由文本行位置确定;
轮廓分析单元,用于对候选框进行轮廓分析,根据轮廓分析结果合并所述候选框;
文本识别单元,用于识别合并后的候选框中的文本信息。
作为本发明进一步的方案:所述轮廓分析单元包括:
比对子单元,用于依次将候选框两两比对,确定存在交集区域的候选框;
分类子单元,用于获取存在交集区域的候选框的原始置信度,将原始置信度更大的候选框作为第一候选框,另一候选框作为第二候选框;
第一计算子单元,用于根据所述第一候选框与所述第二候选框的交集区域的尺寸以及闭包区域的尺寸,计算所述第二候选框的损失参数;
第二计算子单元,用于计算所述第一候选框与所述第二候选框的原始交并比,根据所述第二候选框的损失参数修正所述原始交并比,获得修正交并比;
修正子单元,用于根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度;
合并子单元,用于将所述第二候选框的修正置信度与预设的置信度阈值进行比对,根据比对结果合并两个候选框。
与现有技术相比,本发明的有益效果是:本发明通过提取所述商标图像中的文本信息,然后对所述商标图像进行内容识别,确定所述商标图像的特征向量,根据文本信息和特征向量缩小检索范围,极大地提高了检索效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为商标图像检索方法的流程框图。
图2为商标图像检索方法的第一子流程框图。
图3为商标图像检索方法的第二子流程框图。
图4为商标图像检索方法的第三子流程框图。
图5为商标图像检索方法的第四子流程框图。
图6为商标图像检索系统的组成结构框图。
图7为商标图像检索系统中检索库更新模块的组成结构框图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1
图1为商标图像检索方法的流程框图,本发明实施例中,一种商标图像检索方法,所述方法包括步骤S100至步骤S400:
步骤S100:接收用户输入的含有商标分类信息的商标图像,基于所述商标分类信息确定检索库;所述检索库包括文字项和图像特征项;
商标图像的存储过程一定含有与商标图像为映射关系的索引,同类型的商品图像往往存储在相同位置处,上述商标分类信息就是索引的前段信息,基于商类分类信息确定前缀,再根据商标图像的自身数据确定后缀,所述前缀加后缀即可生成商标图像的索引。在检索过程中,获取商标分类信息,可以确定一个大致的检索范围,也就是上述检索库。
步骤S200:提取所述商标图像中的文本信息,将提取到的文本信息与所述检索库中的文字项进行比对,根据比对结果更新所述检索库;
有些商标图像中存在文本信息,根据所述文本信息可以进一步的缩小检索范围,当然,有些商标图像中没有文本信息,对于没有文本信息的商标图像,步骤S200的作用不是很大;步骤S200的重点在于提取所述商标图像中的文本信息。
步骤S300:对所述商标图像进行内容识别,确定所述商标图像的特征向量;
步骤S400:基于所述特征向量在更新后的检索库中查询并显示目标商标;
从图像角度对商标图像进行内容识别,可以确定商标图像的特征参数,基于这些特征参数可以确定一个特征矩阵(特征向量);通过该特征矩阵在所述更新后的检索库中查询目标商标并显示。
图2为商标图像检索方法的第一子流程框图,所述提取所述商标图像中的文本信息的步骤包括步骤S201至步骤S203:
步骤S201:对所述商标图像进行文本检测,根据文本检测结果在所述商标图像上标记候选框及各候选框对应的原始置信度;其中,所述候选框的位置由文本行位置确定;
步骤S202:对候选框进行轮廓分析,根据轮廓分析结果合并所述候选框;
步骤S203:识别合并后的候选框中的文本信息。
步骤S201至步骤S203对商标图像的文本信息提取过程进行了具体的描述,首先,对商标图像中的文字位置进行大致的识别,确定若干个候选框,对这些候选框进行优化后,基于优化后的候选框识别商标图像中的文本信息。
对于步骤S201,需要进行进一步的说明,文本检测的目的是找出图片中的文本行的所在位置,本发明可以采用CTPN模型算法。
在本发明技术方案的一个实施例中,采用CTPN模型算法主要包括以下过程:
1、准备模型训练样本集;
为了适用于商品图片的文本检测,在选取训练样本时可以采用多家电商服务上中的商品图片,例如采用阿里天池ICP2018淘宝商品网络图像数据集中的图片,以及苏宁易购图像数据集中的图片。由于不同来源的图片数据格式不同,有的数据格式为左上角为原点出发的四个坐标点,有的为左上和右下两个坐标点,因此需要将不同数据格式的图片处理成数据格式统一的Bbox标签。然后对图像和标签缩放成同一规格。
由于CTPN的锚点机制,因此需要将Bbox标签转化为anchor标签,前景和背景的分类标签、anchor中心点纵向坐标和高度、水平偏移量作为训练样本集的标签。
2、构造文本检测模型,利用训练样本集训练文本检测模型;
文本检测模型采用神经网络模型,其中CNN层采用VGG16提取空间特征;后接中间层将VGG16的conv5提取滑动局部块转化为LSTM的输入;RNN层采用BilSTM提取序列特征;最后接一个全连接层,包括:前景和背景的分类、anchor中心点纵向坐标和高度的定位、边界优化的多任务损失函数。
利用上述训练样本集训练上述神经网络模型,得到可以获得候选框和其对应的置信度的文本检测模型。
图3为商标图像检索方法的第二子流程框图,所述对候选框进行轮廓分析,根据轮廓分析结果合并所述候选框的步骤包括步骤S2021至步骤S2026:
步骤S2021:依次将候选框两两比对,确定存在交集区域的候选框;
步骤S2022:获取存在交集区域的候选框的原始置信度,将原始置信度更大的候选框作为第一候选框,另一候选框作为第二候选框;
步骤S2023:根据所述第一候选框与所述第二候选框的交集区域的尺寸以及闭包区域的尺寸,计算所述第二候选框的损失参数;
步骤S2024:计算所述第一候选框与所述第二候选框的原始交并比,根据所述第二候选框的损失参数修正所述原始交并比,获得修正交并比;
步骤S2025:根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度;
步骤S2026:将所述第二候选框的修正置信度与预设的置信度阈值进行比对,根据比对结果合并两个候选框。
作为本发明技术方案进一步的限定,所述根据所述第一候选框与所述第二候选框的交集区域的尺寸以及闭包区域的尺寸,计算所述第二候选框的损失参数的步骤包括:
获取所述交集区域的宽度和高度,以及所述闭包区域的宽度和高度;
根据所述交集区域与所述闭包区域的高度比,以及所述交集区域与所述闭包区域的宽度比,计算所述第二候选框的损失参数。
作为本发明技术方案进一步的限定,所述根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度的步骤包括:
根据所述修正交并比计算所述第二候选框的衰减权值;
基于所述第二候选框的衰减权值修正所述第二候选框的原始置信度,获得所述第二候选框的修正置信度。
上述内容对候选框的优化过程进行了具体的限定,主要目的是合并一些候选框,使得存在交集的候选框成为一个整体,在这个整体上进行文本识别,识别的完整度较高。
具体地,损失参数C的计算公式如下:
C=(k1×hc/hu+k1×Wc/Wu)2;
其中,hc和hu分别为交集区域的高度和宽度,Wc和Wu分别为闭包区域的高度和宽度,k1和k2分别为权重系数,优选地,k1=0.7,k2=0.3。
在上述内容中,当两个候选框分别为标识两个文本行位置的候选框时,其存在闭包区域的高度与交集区域的高度比,要小于标识一个文本行位置的两个候选框的闭包区域高度与交集区域高度比,因此本损失参数主要从高度上对原始置信度进行修正,因此高度的比的权值系数要大于宽度比的权值系数。
进一步的,原始交并比IOU的计算公式为:
IOU=(area(M)∩area(Si))/(area(M)∪area(Si));
其中,M表示第一候选框,Si表示第二候选框,area(M)∩area(Si)为两个候选框的交集区域面积,area(M)∪area(Si)为两个候选框的并集区域面积。
在上述内容中,原始交并比IOU体现了两个候选框的重叠情况。
图4为商标图像检索方法的第三子流程框图,所述对所述商标图像进行内容识别,确定所述商标图像的特征向量的步骤包括步骤S301至步骤S304:
步骤S301:对所述商标图像进行轮廓识别,获取商标轮廓;
步骤S302:根据所述商标轮廓确定商标区域,计算商标区域内的闭合区域参数;其中,所述闭合区域参数包括闭合区域中心点位置信息和闭合区域大小信息;
步骤S303:根据预设的遍历方向对所述商标轮廓进行拆分,得到各商标图像的轮廓特征;
步骤S304:将所述闭合区域参数和所述轮廓特征输入训练好的向量生成模型,得到该商标图像的特征向量。
上述内容提供了一种具体的特征向量生成方案,特征向量由训练好的向量生成模型生成,所述向量生成模型的输入是闭合区域参数和所述轮廓特征,通俗地说,所述闭合区域参数就是商标图像中孔洞的位置及大小,所述轮廓特征就是商标轮廓的走势。
图5为商标图像检索方法的第四子流程框图,所述基于所述特征向量在更新后的检索库中查询并显示目标商标的步骤包括步骤S401至步骤S403:
步骤S401:基于所述特征向量遍历更新后的检索库中的图像特征项,并计算重合度;
步骤S402:将所述重合度与预设的重合度进行比对,当所述重合度达到预设的重合度阈值时,标记检索库中对应的数据项;
步骤S403:统计标记的数据项,得到并显示目标商标。
步骤S401至步骤S403对目标商标的显示过程进行了具体的限定,最终提取到的目标商标,是与该商标图像较为相似的商标,只要相似度达到一定限度,就可以认为检索库中的该商标是目标商标。
实施例2
图6为商标图像检索系统的组成结构框图,本发明实施例中,一种商标图像检索系统,所述系统10包括:
检索库确定模块11,用于接收用户输入的含有商标分类信息的商标图像,基于所述商标分类信息确定检索库;所述检索库包括文字项和图像特征项;
检索库更新模块12,用于提取所述商标图像中的文本信息,将提取到的文本信息与所述检索库中的文字项进行比对,根据比对结果更新所述检索库;
特征向量确定模块13,用于对所述商标图像进行内容识别,确定所述商标图像的特征向量;
商标查询模块14,用于基于所述特征向量在更新后的检索库中查询并显示目标商标。
图7为商标图像检索系统中检索库更新模块的组成结构框图,所述检索库更新模块12包括:
文本检测单元121,用于对所述商标图像进行文本检测,根据文本检测结果在所述商标图像上标记候选框及各候选框对应的原始置信度;其中,所述候选框的位置由文本行位置确定;
轮廓分析单元122,用于对候选框进行轮廓分析,根据轮廓分析结果合并所述候选框;
文本识别单元123,用于识别合并后的候选框中的文本信息。
作为本发明技术方案进一步的限定,所述轮廓分析单元包括:
比对子单元,用于依次将候选框两两比对,确定存在交集区域的候选框;
分类子单元,用于获取存在交集区域的候选框的原始置信度,将原始置信度更大的候选框作为第一候选框,另一候选框作为第二候选框;
第一计算子单元,用于根据所述第一候选框与所述第二候选框的交集区域的尺寸以及闭包区域的尺寸,计算所述第二候选框的损失参数;
第二计算子单元,用于计算所述第一候选框与所述第二候选框的原始交并比,根据所述第二候选框的损失参数修正所述原始交并比,获得修正交并比;
修正子单元,用于根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度;
合并子单元,用于将所述第二候选框的修正置信度与预设的置信度阈值进行比对,根据比对结果合并两个候选框。
所述商标图像检索方法所能实现的功能均由计算机设备完成,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述程序代码由所述一个或多个处理器加载并执行以实现所述商标图像检索方法的功能。
处理器从存储器中逐条取出指令、分析指令,然后根据指令要求完成相应操作,产生一系列控制命令,使计算机各部分自动、连续并协调动作,成为一个有机的整体,实现程序的输入、数据的输入以及运算并输出结果,这一过程中产生的算术运算或逻辑运算均由运算器完成;所述存储器包括只读存储器(Read-Only Memory,ROM),所述只读存储器用于存储计算机程序,所述存储器外部设有保护装置。
示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在终端设备中的执行过程。
本领域技术人员可以理解,上述服务设备的描述仅仅是示例,并不构成对终端设备的限定,可以包括比上述描述更多或更少的部件,或者组合某些部件,或者不同的部件,例如可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,上述处理器是上述终端设备的控制中心,利用各种接口和线路连接整个用户终端的各个部分。
上述存储器可用于存储计算机程序和/或模块,上述处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现上述终端设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如信息采集模板展示功能、产品信息发布功能等)等;存储数据区可存储根据泊位状态显示系统的使用所创建的数据(比如不同产品种类对应的产品信息采集模板、不同产品提供方需要发布的产品信息等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例系统中的全部或部分模块/单元,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个系统实施例的功能。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种商标图像检索方法,其特征在于,所述方法包括:
接收用户输入的含有商标分类信息的商标图像,基于所述商标分类信息确定检索库;所述检索库包括文字项和图像特征项;
提取所述商标图像中的文本信息,将提取到的文本信息与所述检索库中的文字项进行比对,根据比对结果更新所述检索库;
对所述商标图像进行内容识别,确定所述商标图像的特征向量;
基于所述特征向量在更新后的检索库中查询并显示目标商标。
2.根据权利要求1所述的商标图像检索方法,其特征在于,所述提取所述商标图像中的文本信息的步骤包括:
对所述商标图像进行文本检测,根据文本检测结果在所述商标图像上标记候选框及各候选框对应的原始置信度;其中,所述候选框的位置由文本行位置确定;
对候选框进行轮廓分析,根据轮廓分析结果合并所述候选框;
识别合并后的候选框中的文本信息。
3.根据权利要求2所述的商标图像检索方法,其特征在于,所述对候选框进行轮廓分析,根据轮廓分析结果合并所述候选框的步骤包括:
依次将候选框两两比对,确定存在交集区域的候选框;
获取存在交集区域的候选框的原始置信度,将原始置信度更大的候选框作为第一候选框,另一候选框作为第二候选框;
根据所述第一候选框与所述第二候选框的交集区域的尺寸以及闭包区域的尺寸,计算所述第二候选框的损失参数;
计算所述第一候选框与所述第二候选框的原始交并比,根据所述第二候选框的损失参数修正所述原始交并比,获得修正交并比;
根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度;
将所述第二候选框的修正置信度与预设的置信度阈值进行比对,根据比对结果合并两个候选框。
4.根据权利要求3所述的商标图像检索方法,其特征在于,所述根据所述第一候选框与所述第二候选框的交集区域的尺寸以及闭包区域的尺寸,计算所述第二候选框的损失参数的步骤包括:
获取所述交集区域的宽度和高度,以及所述闭包区域的宽度和高度;
根据所述交集区域与所述闭包区域的高度比,以及所述交集区域与所述闭包区域的宽度比,计算所述第二候选框的损失参数。
5.根据权利要求3所述的商标图像检索方法,其特征在于,所述根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度的步骤包括:
根据所述修正交并比计算所述第二候选框的衰减权值;
基于所述第二候选框的衰减权值修正所述第二候选框的原始置信度,获得所述第二候选框的修正置信度。
6.根据权利要求1所述的商标图像检索方法,其特征在于,所述对所述商标图像进行内容识别,确定所述商标图像的特征向量的步骤包括:
对所述商标图像进行轮廓识别,获取商标轮廓;
根据所述商标轮廓确定商标区域,计算商标区域内的闭合区域参数;其中,所述闭合区域参数包括闭合区域中心点位置信息和闭合区域大小信息;
根据预设的遍历方向对所述商标轮廓进行拆分,得到各商标图像的轮廓特征;
将所述闭合区域参数和所述轮廓特征输入训练好的向量生成模型,得到该商标图像的特征向量。
7.根据权利要求1所述的商标图像检索方法,其特征在于,所述基于所述特征向量在更新后的检索库中查询并显示目标商标的步骤包括:
基于所述特征向量遍历更新后的检索库中的图像特征项,并计算重合度;
将所述重合度与预设的重合度进行比对,当所述重合度达到预设的重合度阈值时,标记检索库中对应的数据项;
统计标记的数据项,得到并显示目标商标。
8.一种商标图像检索系统,其特征在于,所述系统包括:
检索库确定模块,用于接收用户输入的含有商标分类信息的商标图像,基于所述商标分类信息确定检索库;所述检索库包括文字项和图像特征项;
检索库更新模块,用于提取所述商标图像中的文本信息,将提取到的文本信息与所述检索库中的文字项进行比对,根据比对结果更新所述检索库;
特征向量确定模块,用于对所述商标图像进行内容识别,确定所述商标图像的特征向量;
商标查询模块,用于基于所述特征向量在更新后的检索库中查询并显示目标商标。
9.根据权利要求8所述的商标图像检索系统,其特征在于,所述检索库更新模块包括:
文本检测单元,用于对所述商标图像进行文本检测,根据文本检测结果在所述商标图像上标记候选框及各候选框对应的原始置信度;其中,所述候选框的位置由文本行位置确定;
轮廓分析单元,用于对候选框进行轮廓分析,根据轮廓分析结果合并所述候选框;
文本识别单元,用于识别合并后的候选框中的文本信息。
10.根据权利要求9所述的商标图像检索系统,其特征在于,所述轮廓分析单元包括:
比对子单元,用于依次将候选框两两比对,确定存在交集区域的候选框;
分类子单元,用于获取存在交集区域的候选框的原始置信度,将原始置信度更大的候选框作为第一候选框,另一候选框作为第二候选框;
第一计算子单元,用于根据所述第一候选框与所述第二候选框的交集区域的尺寸以及闭包区域的尺寸,计算所述第二候选框的损失参数;
第二计算子单元,用于计算所述第一候选框与所述第二候选框的原始交并比,根据所述第二候选框的损失参数修正所述原始交并比,获得修正交并比;
修正子单元,用于根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度;
合并子单元,用于将所述第二候选框的修正置信度与预设的置信度阈值进行比对,根据比对结果合并两个候选框。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210356178.4A CN114428878A (zh) | 2022-04-06 | 2022-04-06 | 一种商标图像检索方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210356178.4A CN114428878A (zh) | 2022-04-06 | 2022-04-06 | 一种商标图像检索方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114428878A true CN114428878A (zh) | 2022-05-03 |
Family
ID=81314364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210356178.4A Pending CN114428878A (zh) | 2022-04-06 | 2022-04-06 | 一种商标图像检索方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114428878A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114971932A (zh) * | 2022-07-29 | 2022-08-30 | 深圳慢云智能科技有限公司 | 一种基于公寓住宅智慧空间的人工智能社交方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368614A (zh) * | 2017-09-12 | 2017-11-21 | 重庆猪八戒网络有限公司 | 基于深度学习的图像检索方法及装置 |
CN108038122A (zh) * | 2017-11-03 | 2018-05-15 | 福建师范大学 | 一种商标图像检索的方法 |
CN108470073A (zh) * | 2018-04-03 | 2018-08-31 | 南昌奇眸科技有限公司 | 适用于组合商标的检索系统及方法 |
WO2020052183A1 (zh) * | 2018-09-10 | 2020-03-19 | 平安科技(深圳)有限公司 | 商标侵权的识别方法、装置、计算机设备和存储介质 |
CN112580637A (zh) * | 2020-12-31 | 2021-03-30 | 苏宁金融科技(南京)有限公司 | 文本信息识别方法、提取方法、装置及系统 |
KR102234385B1 (ko) * | 2020-12-22 | 2021-03-31 | 주식회사 드림비트 | 상표 검색 방법 및 장치 |
-
2022
- 2022-04-06 CN CN202210356178.4A patent/CN114428878A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368614A (zh) * | 2017-09-12 | 2017-11-21 | 重庆猪八戒网络有限公司 | 基于深度学习的图像检索方法及装置 |
CN108038122A (zh) * | 2017-11-03 | 2018-05-15 | 福建师范大学 | 一种商标图像检索的方法 |
CN108470073A (zh) * | 2018-04-03 | 2018-08-31 | 南昌奇眸科技有限公司 | 适用于组合商标的检索系统及方法 |
WO2020052183A1 (zh) * | 2018-09-10 | 2020-03-19 | 平安科技(深圳)有限公司 | 商标侵权的识别方法、装置、计算机设备和存储介质 |
KR102234385B1 (ko) * | 2020-12-22 | 2021-03-31 | 주식회사 드림비트 | 상표 검색 방법 및 장치 |
CN112580637A (zh) * | 2020-12-31 | 2021-03-30 | 苏宁金融科技(南京)有限公司 | 文本信息识别方法、提取方法、装置及系统 |
Non-Patent Citations (1)
Title |
---|
张金玉 等: "《红外热波检测及其图像序列处理技术》", 30 June 2015, 国防工业出版社, pages: 118 - 122 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114971932A (zh) * | 2022-07-29 | 2022-08-30 | 深圳慢云智能科技有限公司 | 一种基于公寓住宅智慧空间的人工智能社交方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111476227B (zh) | 基于ocr的目标字段识别方法、装置及存储介质 | |
KR20220002066A (ko) | 이미지 문답 방법, 장치, 컴퓨터 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램 | |
Triki et al. | Deep leaf: Mask R-CNN based leaf detection and segmentation from digitized herbarium specimen images | |
CN112434691A (zh) | 基于智能解析识别的hs编码匹配、展示方法、系统及存储介质 | |
CN113378710A (zh) | 图像文件的版面分析方法、装置、计算机设备和存储介质 | |
CN111860669B (zh) | Ocr识别模型的训练方法、装置和计算机设备 | |
US20080222113A1 (en) | Image search method, apparatus, and program | |
CN112183307A (zh) | 文本识别方法、计算机设备和存储介质 | |
WO2022100376A1 (zh) | 文本段落结构还原方法、装置、设备及计算机存储介质 | |
CN112381153A (zh) | 票据分类的方法、装置和计算机设备 | |
CN114428878A (zh) | 一种商标图像检索方法及系统 | |
CN113239227B (zh) | 图像数据结构化方法、装置、电子设备及计算机可读介质 | |
WO2023038722A1 (en) | Entry detection and recognition for custom forms | |
CN114648776A (zh) | 一种财务报销数据处理方法和处理系统 | |
CN114022891A (zh) | 扫描文本的关键信息提取方法、装置、设备及存储介质 | |
CN112651392A (zh) | 证件信息的获取方法及装置、存储介质、计算机设备 | |
CN111428486B (zh) | 物品信息数据处理方法、装置、介质及电子设备 | |
CN117115823A (zh) | 一种篡改识别方法、装置、计算机设备和存储介质 | |
CN115734072A (zh) | 一种工业自动化设备的物联网集中监控方法及装置 | |
CN115620317A (zh) | 一种电子工程文档真实性验证方法和系统 | |
CN114040012A (zh) | 一种信息查询推送方法、装置及计算机设备 | |
CN115063784A (zh) | 票据图像的信息提取方法和装置、存储介质及电子设备 | |
CN114387600A (zh) | 文本特征识别方法、装置、计算机设备和存储介质 | |
Wen et al. | Using weighted part model for pedestrian detection in crowded scenes based on image segmentation | |
CN114490993A (zh) | 小样本意图识别方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220503 |