CN112036362A - 图像处理方法、装置、计算机设备和可读存储介质 - Google Patents
图像处理方法、装置、计算机设备和可读存储介质 Download PDFInfo
- Publication number
- CN112036362A CN112036362A CN202010956547.4A CN202010956547A CN112036362A CN 112036362 A CN112036362 A CN 112036362A CN 202010956547 A CN202010956547 A CN 202010956547A CN 112036362 A CN112036362 A CN 112036362A
- Authority
- CN
- China
- Prior art keywords
- image
- determined
- candidate
- trademark
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请的实施例提供了一种图像处理方法、装置、计算机设备和可读存储介质,涉及图像处理技术领域,图像处理方法应用于计算机设备,所述计算机设备存储有参考商标图像;图像处理方法包括:将待识别图像输入区域选取模型得到候选区域;基于所述参考商标图像,在所述候选区域中搜索待确定商标图像;通过第一邻近算法计算所述参考商标图像和所述待确定商标图像的相似程度;当所述相似程度超过预设相似程度阈值时,将所述待确定商标图像作为所述待识别图像中的商标,通过上述步骤,能够高效地进行商标图案的处理。
Description
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种图像处理方法、装置、计算机设备和可读存储介质。
背景技术
商标的识别处理相关问题一直是具有一定挑战性的问题,其原因在于商标所在的图像中存在非常多的干扰因素(例如视角的变化,弯曲,形状和颜色的变化,遮挡,背景的变化等)。而在现有技术中,有采用传统的基于图像匹配的标志检测识别实现识别图像中商标图案的方案,然而当需要处理的图像中包括多个商标时,现有的基于图像匹配的标志检测识别仅能对每个商标依次进行识别,处理效率低下。
有鉴于此,如何提供一种能够高效处理商标图案的方案,是本领域技术人员需要解决的。
发明内容
本申请提供了一种图像处理方法、装置、计算机设备和可读存储介质。
本申请的实施例可以这样实现:
第一方面,本申请实施例提供一种图像处理方法,应用于计算机设备,计算机设备存储有参考商标图像;
方法包括:
将待识别图像输入区域选取模型得到候选区域;
基于参考商标图像,在候选区域中搜索待确定商标图像;
通过第一邻近算法计算参考商标图像和待确定商标图像的相似程度;
当相似程度超过预设相似程度阈值时,将待确定商标图像作为待识别图像中的商标。
在可选的实施方式中,区域选取模型包括第一区域选取网络和第二区域选取网络;
将待识别图像输入区域选取模型得到候选区域的步骤,包括:
将待识别图像输入第一区域选取网络,得到第一候选区域,其中,第一候选区域中包括第一尺寸区间的待确定商标图像;
将待识别图像输入第二区域选取网络,得到第二候选区域,其中,第二候选区域中包括第二尺寸区间的待确定商标图像,第一尺寸区间大于标准尺寸区间,第二尺寸区间小于标准尺寸区间;
确定候选区域,候选区域包括第一候选区域和第二候选区域。
在可选的实施方式中,第一区域选取网络是通过以下方式得到的:
获取纯色样本图像,其中,纯色样本图像包括纯色背景和样本商标;
将纯色样本图像输入预先建立的第一区域选取网络进行训练,得到训练后的第一区域选取网络。
在可选的实施方式中,第二区域选取网络是通过以下方式得到的:
获取样本图像;
获取样本图像中的样本特征点;
对样本特征点进行聚类,得到多个聚类区域;
从多个聚类区域中确定目标聚类区域,其中,目标聚类区域的大小在第二尺寸区间内;
对目标聚类区域中的样本特征点进行标注,得到目标聚类区域图像,目标聚类区域图像是根据标注后的目标聚类区域中的样本特征点确定的;
将目标聚类区域图像输入预先建立的第二区域选取网络进行训练,得到训练后的第二区域选取网络。
在可选的实施方式中,参考商标图像包括参考特征点和参考特征点的参考描述子,候选区域包括候选特征点和候选特征点的候选描述子;
基于参考商标图像,在候选区域中搜索待确定商标图像的步骤,包括:
获取预设特征图,其中,预设特征图是根据参考特征点和参考描述子构建的;
获取候选特征点和候选描述子;
根据候选特征点和候选描述子对预设特征图进行特征点匹配,得到单应性矩阵,其中,单应性矩阵用于表征待确定特征点和候选特征之间的映射关系,参考特征点包括待确定特征点;
根据单应性矩阵,确定待确定特征点在候选区域中的坐标;
将待确定特征点的坐标确定的区域作为待确定商标图像。
在可选的实施方式中,根据候选特征点和候选描述子对预设特征图进行特征点匹配,得到单应性矩阵的步骤,包括:
基于候选描述子,利用第二邻近算法从预设特征图中确定第一数量的待确定参考描述子,其中,参考描述子包括待确定参考描述子;
根据第一数量的待确定参考描述子确定第一数量的待确定特征点,其中,第一数量的待确定参考描述子和第一数量的待确定特征点一一对应;
根据候选特征点和定第一数量的待确定特征点利用共面点成像原理构建单应性矩阵。
在可选的实施方式中,通过第一邻近算法计算参考商标图像和待确定商标图像的相似程度的步骤,包括:
通过第一邻近算法计算参考商标图像和待确定商标图像的欧式空间距离;
根据欧式空间距离确定参考商标图像和待确定商标图像的相似程度。
第二方面,本申请实施例提供一种图像处理装置,应用于计算机设备,计算机设备存储有参考商标图像;
装置包括:
输入模块,用于将待识别图像输入区域选取模型得到候选区域;
搜索模块,用于基于参考商标图像,在候选区域中搜索待确定商标图像;
校验模块,用于通过第一邻近算法计算参考商标图像和待确定商标图像的相似程度;当相似程度超过预设相似程度阈值时,将待确定商标图像作为待识别图像中的商标。
第三方面,本申请实施例提供一种计算机设备,计算机设备包括处理器及存储有计算机指令的非易失性存储器,计算机指令被处理器执行时,计算机设备执行前述实施方式中任意一项的图像处理方法。
第四方面,本申请实施例提供一种可读存储介质,可读存储介质包括计算机程序,计算机程序运行时控制可读存储介质所在计算机设备执行前述实施方式中任意一项的图像处理方法。
本申请实施例的有益效果包括,例如:采用本申请实施例提供的一种图像处理方法、装置、计算机设备和可读存储介质,通过将待识别图像输入区域选取模型得到候选区域;再基于参考商标图像,在候选区域中搜索待确定商标图像;进而通过第一邻近算法计算参考商标图像和待确定商标图像的相似程度;最终当相似程度超过预设相似程度阈值时,将待确定商标图像作为待识别图像中的商标,通过上述步骤,巧妙地利用了区域选取模型,能够高效地实现商标图像的处理。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的图像处理方法的一种步骤流程示意图;
图2为本申请实施例提供的图像处理方法的另一种步骤流程示意图;
图3为本申请实施例提供的图像处理方法的另一种步骤流程示意图;
图4为本申请实施例提供的标注前的样本图像;
图5为本申请实施例提供的标注后的样本图像;
图6为本申请实施例提供的参考商标图像和待确定商标图像的一种欧式空间距离示意图;
图7为本申请实施例提供的参考商标图像和待确定商标图像的另一种欧式空间距离示意图;
图8为本申请实施例提供的参考商标图像和待确定商标图像的另一种欧式空间距离示意图;
图9为本申请实施例提供的图像处理装置的一种结构示意框图;
图10为本申请实施例提供的计算机设备的一种结构示意框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
在图像识别领域中,商标识别一直是一个技术难点,其原因在于商标所在的图像一般包含了大量的干扰因素,例如视角的变化,弯曲,形状和颜色的变化,遮挡,背景的变化等,这些都使得从图像中进行商标的识别变得尤其困难。而在现有技术中,可以利用基于图像匹配的标志检测识别对商标进行识别,然而基于图像匹配的标志检测识别的方案,在一个图像存在多个商标时,也仅能依次对多个商标进行识别,识别效率低。
为了解决上述提出的技术问题,请参考图1,图1为本申请实施例提供的图像处理方法的步骤流程示意图,该方法应用于计算机设备100,计算机设备100存储有参考商标图像。下面对图像处理方法进行详细的描述。
步骤201,将待识别图像输入区域选取模型得到候选区域。
步骤202,基于参考商标图像,在候选区域中搜索待确定商标图像。
步骤203,通过第一邻近算法计算参考商标图像和待确定商标图像的相似程度。
步骤204,当相似程度超过预设相似程度阈值时,将待确定商标图像作为待识别图像中的商标。
在本申请实施例中,待识别图像中可以包括至少一个商标,计算机设备100中存储的参考商标图像包括了用户想要进行识别的商标,可以是预先存储在计算机设备100中后,后续也可以进行添加或者删除,在此不做限制。可以将待识别图像输入预先训练的区域选取模型(Region Proposal Network,简称RPN)中得到候选区域,候选区域是在待识别图像中的确定的,如前所描述的,候选区域也可以是多个。
在确定了多个候选区域后,可以基于参考商标图像在所有候选区域中进行搜索,查看是否有符合条件的待确认商标图像。待确认商标图像还不能完全作为用户需求的图像进行展示,为了进一步提高准确值,可以通过第一邻近算法计算参考商标图像和待确定商标图像的相似程度,在两者的相似程度达到预设相似程度阈值时,可以认为待确定商标图像是待识别图像中用户需求的商标。否则,则将待确定商标图像删除。通过上述步骤,能够利用RPN网络训练得到的区域选取模型确定多个候选区域,进而能够从多个候选区域中确定待确定商标图像,便可以再验证后获取用户需求的商标,实现了能够在待识别图像中存在多个商标时能够准确地进行识别的目的。
在前述基础上,区域选取模型包括第一区域选取网络和第二区域选取网络。作为一种可替换的具体实施方式,前述步骤201可以有以下的具体实施方式。
子步骤201-1,将待识别图像输入第一区域选取网络,得到第一候选区域。
其中,第一候选区域中包括第一尺寸区间的待确定商标图像。
子步骤201-2,将待识别图像输入第二区域选取网络,得到第二候选区域。
其中,第二候选区域中包括第二尺寸区间的待确定商标图像,第一尺寸区间大于标准尺寸区间,第二尺寸区间小于标准尺寸区间。
子步骤201-3,确定候选区域,候选区域包括第一候选区域和第二候选区域。
应当理解的是,除了前述提出的技术问题,在现有技术中采用传统的卷积神经网络训练得到识别模型,在对小目标进行识别时也存在识别准确率低的问题,同时在实际场景中,也会存在较大的目标导致识别模型无法准确识别。
为了解决商标过大或者过小而导致的无法识别的问题,在本申请实施例中,分别提出了两种基于RPN训练得到的区域选取网络,其中,第一区域选取网络用于识别第一尺寸区间对应的第一候选区域中的待确定商标图像,第一尺寸区间大于标准尺寸区间,可以理解为对较大的商标进行识别。对应的,第二尺寸区间小于标准尺寸区间,第二选取网络用于识别第二尺寸区间对应的第二候选区域中的待确定商标图像,即可以理解为对较小的商标进行识别。
在本申请实施例的另一实施方式中,前述区域选取模型可以仅包括第一区域选取网络,即前述区域选取模型可以主要针对较大的商标。具体的过程可以是将待识别图像输入第一区域选取网络,得到第一候选区域。而第一候选区域中包括第一尺寸区间的待确定商标图像,第一尺寸区间大于标准尺寸区间,候选区域即为第一候选区域。通过上述步骤,也能解决现有技术中,无法对较大的商标进行识别的问题。
在本申请实施例中的又一实施方式中,前述区域选取模型可以仅包括第二区域选取网络,即前述区域选取模型可以主要针对较小的商标。具体的过程可以是将待识别图像输入第二区域选取网络,得到第二候选区域。而第二候选区域中包括第二尺寸区间的待确定商标图像,第二尺寸区间小于标准尺寸区间,候选区域即为第二候选区域。通过上述步骤,也能解决现有技术中,无法对较小的商标进行识别的问题。
通过上述步骤,除了满足常规的商标大小(即位于标准尺寸区间内)的识别,还能够对过小或者过大的商标进行识别。
为了能够更加清楚地对本申请提出的方案进行描述,请结合参考图2,第一区域选取网络是通过以下方式得到的。
步骤301,获取纯色样本图像。
其中,纯色样本图像包括纯色背景和样本商标。
步骤302,将纯色样本图像输入预先建立的第一区域选取网络进行训练,得到训练后的第一区域选取网络。
值得说明的是,为了能够使第一区域选取网络能够对较大的候选区域进行确定,可以采用纯色样本图像作为训练样本,纯色样本图像可以是预先合成的,可以由纯色背景和样本商标构成,其中,纯色背景的大小可以是随机的。
具体的训练过程可以是,将纯色样本图像输入预先建立的第一区域选取网络,得到损失函数的值,并基于损失函数的值对预先建立的第一区域选取网络的相关参数进行调整,直至满足第一训练条件,得到训练后的第一区域选取网络,在本申请实施例中,基于前述纯色样本图像训练得到的第一区域选取网络,偏向于将待识别图像中较大面具的区域检测为第一候选区域,进而能够识别位于第一候选区域汇总的较大的待确定商标图像。
在前述基础上,请结合参考图3,第二区域选取网络是通过以下方式得到的。
步骤401,获取样本图像。
步骤402,获取样本图像中的样本特征点。
步骤403,对样本特征点进行聚类,得到多个聚类区域。
步骤404,从多个聚类区域中确定目标聚类区域。
其中,目标聚类区域的大小在第二尺寸区间内。
步骤405,对目标聚类区域中的样本特征点进行标注,得到目标聚类区域图像。
其中,目标聚类区域图像是根据标注后的目标聚类区域中的样本特征点确定的。
步骤406,将目标聚类区域图像输入预先建立的第二区域选取网络进行训练,得到训练后的第二区域选取网络。
相应的,为了解决前述传统卷积神经网络训练的识别模型无法精准识别较小目标的问题,在本申请实施例中,可以基于图像中的特征点作为训练样本进行训练得到第二区域选取网络来解决上述问题。
具体的,可以获取样本图像,并进一步获取样本图像中的样本特征点,具体的,可以是SIFT(Scale-invariant feature transform,简称尺度不变特征转换)特征点,可以对样本特征点进行聚类操作,具体可以通过DBSCAN(Density-Based Spatial Clustering ofApplications with Noise,简称基于密度的聚类)算法进行聚类。
可以从聚类操作得到的多个聚类区域中确定出目标聚类区域,目标聚类区域的判定标准可以是前述第二尺寸区间,即较小的聚类区域。在本申请实施例中,可以对确定的目标聚类区域中的特征点进行标注,标注的规则可以是在目标聚类区域中最大x坐标、最大y坐标、最小x坐标和最小y坐标确定的四个点确定的区域,将该区域作为目标聚类区域图像,并将目标聚类区域图像作为训练集输入预先建立的第二区域选取网络进行训练,得到对应的损失函数的值,在根据损失函数的值对的第二区域选取网络的相关参数进行调整,直至符合第二训练条件,得到训练后的第二区域选取网络,可以参考图4和图5,图4为进行标注前的样本图像,图5为进行标注后的样本图像,标注后的样本图像中包括前述目标聚类区域图像(即标注框确定的区域)。
值得说明的是,在现有技术中卷积神经网络在进行训练时需要人工标注,即在进行训练样本时需要进行人工标注才能够使得训练继续,不仅如此,训练好的模型不能够应对需要识别的商标的大规模改变(例如生产环境中涉及到频繁的标志增减),需要重新进行人工标注数据进行训练。而采用上述步骤,在基于SIFT特征点作为训练样本的基础上,能够巧妙地实现自动标注,以此解决上述问题,应当理解的是,前述采用纯色样本图像作为训练样本的第一区域选取网络,也无需进行人工标注。
在此基础上,参考商标图像包括参考特征点和参考特征点的参考描述子,候选区域包括候选特征点和候选特征点的候选描述子。作为一种可替换的具体实施方式,前述步骤202可以由以下的详细步骤实现。
子步骤202-1,获取预设特征图。
其中,预设特征图是根据参考特征点和参考描述子构建的。
子步骤202-2,获取候选特征点和候选描述子。
子步骤202-3,根据候选特征点和候选描述子对预设特征图进行特征点匹配,得到单应性矩阵。
其中,单应性矩阵用于表征待确定特征点和候选特征之间的映射关系,参考特征点包括待确定特征点。
子步骤202-4,根据单应性矩阵,确定待确定特征点在候选区域中的坐标。
子步骤202-5,将待确定特征点的坐标确定的区域作为待确定商标图像。
在确定了候选区域后,为了能够准确地从候选区域中确定待确定商标图像,可以先获取预设特征图,预设特征图可以是预先根据参考特征点和参考描述子构建的,具体的,预设特征图可以是hnsw(Hierarchical Navigable Small World,简称搜索领域基于图的算法)图。在获取了hnsw图后,可以基于hnsw图对候选特征点和候选描述子进行特征点匹配,得到单应性矩阵,可以根据单应性矩阵确定待确定特征点在候选区域中的坐标,即所在区域。在确定了待确定商标图像的所在区域后自然可以确定商标图像。
为了能够更加清楚的描述前述方案,在本申请实施例中,前述子步骤202-3还可以由以下的具体实施方式实现。
(1)基于候选描述子,利用第二邻近算法从预设特征图中确定第一数量的待确定参考描述子。
其中,参考描述子包括待确定参考描述子。
(2)根据第一数量的待确定参考描述子确定第一数量的待确定特征点。
其中,第一数量的待确定参考描述子和第一数量的待确定特征点一一对应。
(3)根据候选特征点和定第一数量的待确定特征点利用共面点成像原理构建单应性矩阵。
在本申请实施例中,可以对候选描述子利用第二邻近算法在预设特征图中进行搜索,可选的,可以是对候选描述子基于hnsw图利用KNN(K-NearestNeighbor,简称最近邻算法)进行搜索,可以得到前k个(即第一数量)与候选描述子在KNN算法下距离最近的待确定参考描述子,进而得到对应的第一数量的待确定参考特征点,可以利用共面点成像原理,对第一数量的待确定参考特征点做关键点匹配,得到前述单应性矩阵。
值得说明的是,通过上述步骤,能够解决现有技术中使用传统的卷积神经网络训练得到识别模型进行识别时,需要对参考商标与待确定商标图像进行遍历的问题,可以仅通过依次搜索就确定k个符合要求的参考对象,提高了检索效率。
在此基础上,作为一种可替换的具体实施方式,前述步骤203可以包括以下的具体实施方式。
子步骤203-1,通过第一邻近算法计算参考商标图像和待确定商标图像的欧式空间距离。
子步骤203-2,根据欧式空间距离确定参考商标图像和待确定商标图像的相似程度。
应当理解的是,再根据前述方案确定出待确定商标图像后,为了能提高识别结果的准确性,还可以进一步地对其进行验证,第一邻近算法可以是facenet(人脸网络),可以通过facenet计算参考商标图像和待确定商标图像的欧式空间距离,可以设置欧式空间距离阈值,例如1,当参考商标图像和待确定商标图像之间的欧式空间距离小于1时,可以认为待确定商标图像与参考商标图像表征同一商标,即待确定商标图像为待识别图像中的商标,而当参考商标图像和待确定商标图像之间的欧式空间距离大于1时,便可以认为当前的待确认商标图像与参考商标图像不匹配,可以将其舍弃。
上述第二邻近算法可以理解为度量学习的一种,在本申请实施例中,采取上述方案能够准确地对搜索结果进行校验,使用户能够准确地获取需求的商标。应当理解的是,在本申请实施例中采取了与第一邻近算法不同的第二邻近算法对待确定商标图像进行校验以提高待确定商标图像的准确性,在本申请实施例实施方式中,还可以有更多的邻近算法对待确定商标图像进行校验,在此不做限定。
可选的,前述facenet相关计算可以由以下代码实现:
可选的,在上述facenet的基础上计算得到的参考商标图像和待确定商标图像之间的欧式空间距离可以参考图6、图7和图8,其中,图6为参考商标图像和待确定商标图像之间的欧式空间距离为1.2的情况,不符合要求。图7为参考商标图像和待确定商标图像之间的欧式空间距离为0.4的情况,符合要求。图8为参考商标图像和待确定商标图像之间的欧式空间距离为1.5的情况,不符合要求,应当理解的是,正如前所描述的,采取了与第一邻近算法不同的第二邻近算法对待确定商标图像进行校验是能够提高待确定商标图像的准确性,而第一邻近算法作为用于进一步校验的工具,种类和数量也可以不止一种,即可以通过多种不同的邻近算法对最后确定待确定商标图像是否为用户需求的商标进行确定,而通过设置多种邻近算法,既能够防止不是用户需求的商标被误判为用户需求的情况,也能够防止原本是用户需求的商标因误判而被删除的情况,在此不做限定。通过上述步骤,便能对待确定商标图像是否为用户需求的商标的准确性进一步地提升。
本申请实施例提供一种图像处理装置110,应用于计算机设备100,计算机设备100存储有参考商标图像,如图9所示,图像处理装置110包括:
输入模块1101,用于将待识别图像输入区域选取模型得到候选区域。
搜索模块1102,用于基于参考商标图像,在候选区域中搜索待确定商标图像。
校验模块1103,用于通过第一邻近算法计算参考商标图像和待确定商标图像的相似程度;当相似程度超过预设相似程度阈值时,将待确定商标图像作为待识别图像中的商标。
进一步地,区域选取模型包括第一区域选取网络和第二区域选取网络;输入模块1101具体用于:
将待识别图像输入第一区域选取网络,得到第一候选区域,其中,第一候选区域中包括第一尺寸区间的待确定商标图像;将待识别图像输入第二区域选取网络,得到第二候选区域,其中,第二候选区域中包括第二尺寸区间的待确定商标图像,第一尺寸区间大于标准尺寸区间,第二尺寸区间小于标准尺寸区间;确定候选区域,候选区域包括第一候选区域和第二候选区域。
进一步地,装置还包括建立模块,训练模块1104用于:
获取纯色样本图像,其中,纯色样本图像包括纯色背景和样本商标;将纯色样本图像输入预先建立的第一区域选取网络进行训练,得到训练后的第一区域选取网络。
进一步地,训练模块1104还用于:
获取样本图像;获取样本图像中的样本特征点;对样本特征点进行聚类,得到多个聚类区域;从多个聚类区域中确定目标聚类区域,其中,目标聚类区域的大小在第二尺寸区间内;对目标聚类区域中的样本特征点进行标注,得到目标聚类区域图像,目标聚类区域图像是根据标注后的目标聚类区域中的样本特征点确定的;将目标聚类区域图像输入预先建立的第二区域选取网络进行训练,得到训练后的第二区域选取网络。
进一步地,参考商标图像包括参考特征点和参考特征点的参考描述子,候选区域包括候选特征点和候选特征点的候选描述子;
搜索模块1102具体用于:
获取预设特征图,其中,预设特征图是根据参考特征点和参考描述子构建的;获取候选特征点和候选描述子;根据候选特征点和候选描述子对预设特征图进行特征点匹配,得到单应性矩阵,其中,单应性矩阵用于表征待确定特征点和候选特征之间的映射关系,参考特征点包括待确定特征点;根据单应性矩阵,确定待确定特征点在候选区域中的坐标;将待确定特征点的坐标确定的区域作为待确定商标图像。
进一步地,搜索模块1102更进一步具体用于:
基于候选描述子,利用第二邻近算法从预设特征图中确定第一数量的待确定参考描述子,其中,参考描述子包括待确定参考描述子;根据第一数量的待确定参考描述子确定第一数量的待确定特征点,其中,第一数量的待确定参考描述子和第一数量的待确定特征点一一对应;根据候选特征点和定第一数量的待确定特征点利用共面点成像原理构建单应性矩阵。
进一步地,校验模块1103具体用于:
通过第一邻近算法计算参考商标图像和待确定商标图像的欧式空间距离;根据欧式空间距离确定参考商标图像和待确定商标图像的相似程度。
本申请实施例提供一种计算机设备100,计算机设备100包括处理器及存储有计算机指令的非易失性存储器,计算机指令被处理器执行时,计算机设备100执行前述的图像处理方法。如图10所示,图10为本申请实施例提供的计算机设备100的结构框图。计算机设备100包括图像处理装置110、存储器111、处理器112及通信单元113。
存储器111、处理器112以及通信单元113各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。图像处理装置110包括至少一个可以软件或固件(firmware)的形式存储于存储器111中或固化在计算机设备100的操作系统(operating system,OS)中的软件功能模块。处理器112用于执行存储器111中存储的可执行模块,例如图像处理装置110所包括的软件功能模块及计算机程序等。
其中,存储器111可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
本申请实施例提供一种可读存储介质,可读存储介质包括计算机程序,计算机程序运行时控制可读存储介质所在计算机设备100执行前述的图像处理方法。
综上所述,本申请实施例提供了一种图像处理方法、装置、计算机设备和可读存储介质,通过将待识别图像输入区域选取模型得到候选区域;再基于所述参考商标图像,在所述候选区域中搜索待确定商标图像;进而通过第一邻近算法计算所述参考商标图像和所述待确定商标图像的相似程度;最终当所述相似程度超过预设相似程度阈值时,将所述待确定商标图像作为所述待识别图像中的商标,通过上述步骤,巧妙地利用了区域选取模型,能够高效地实现商标图像的处理。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种图像处理方法,其特征在于,应用于计算机设备,所述计算机设备存储有参考商标图像;
所述方法包括:
将待识别图像输入区域选取模型得到候选区域;
基于所述参考商标图像,在所述候选区域中搜索待确定商标图像;
通过第一邻近算法计算所述参考商标图像和所述待确定商标图像的相似程度;
当所述相似程度超过预设相似程度阈值时,将所述待确定商标图像作为所述待识别图像中的商标。
2.根据权利要求1所述的方法,其特征在于,所述区域选取模型包括第一区域选取网络和第二区域选取网络;
所述将待识别图像输入区域选取模型得到候选区域的步骤,包括:
将待识别图像输入所述第一区域选取网络,得到第一候选区域,其中,所述第一候选区域中包括第一尺寸区间的待确定商标图像;
将待识别图像输入所述第二区域选取网络,得到第二候选区域,其中,所述第二候选区域中包括第二尺寸区间的待确定商标图像,所述第一尺寸区间大于标准尺寸区间,所述第二尺寸区间小于所述标准尺寸区间;
确定所述候选区域,所述候选区域包括所述第一候选区域和所述第二候选区域。
3.根据权利要求2所述的方法,其特征在于,所述第一区域选取网络是通过以下方式得到的:
获取纯色样本图像,其中,所述纯色样本图像包括纯色背景和样本商标;
将所述纯色样本图像输入预先建立的所述第一区域选取网络进行训练,得到训练后的所述第一区域选取网络。
4.根据权利要求2所述的方法,其特征在于,所述第二区域选取网络是通过以下方式得到的:
获取样本图像;
获取所述样本图像中的样本特征点;
对所述样本特征点进行聚类,得到多个聚类区域;
从所述多个聚类区域中确定目标聚类区域,其中,所述目标聚类区域的大小在所述第二尺寸区间内;
对所述目标聚类区域中的样本特征点进行标注,得到目标聚类区域图像,所述目标聚类区域图像是根据标注后的所述目标聚类区域中的样本特征点确定的;
将所述目标聚类区域图像输入预先建立的所述第二区域选取网络进行训练,得到训练后的所述第二区域选取网络。
5.根据权利要求1所述的方法,其特征在于,所述参考商标图像包括参考特征点和所述参考特征点的参考描述子,所述候选区域包括候选特征点和所述候选特征点的候选描述子;
所述基于所述参考商标图像,在所述候选区域中搜索待确定商标图像的步骤,包括:
获取预设特征图,其中,所述预设特征图是根据所述参考特征点和所述参考描述子构建的;
获取所述候选特征点和所述候选描述子;
根据所述候选特征点和所述候选描述子对所述预设特征图进行特征点匹配,得到单应性矩阵,其中,所述单应性矩阵用于表征待确定特征点和所述候选特征之间的映射关系,所述参考特征点包括所述待确定特征点;
根据所述单应性矩阵,确定所述待确定特征点在所述候选区域中的坐标;
将所述待确定特征点的坐标确定的区域作为所述待确定商标图像。
6.根据权利要求5所述的方法,其特征在于,所述根据所述候选特征点和所述候选描述子对所述预设特征图进行特征点匹配,得到单应性矩阵的步骤,包括:
基于所述候选描述子,利用第二邻近算法从所述预设特征图中确定第一数量的待确定参考描述子,其中,所述参考描述子包括所述待确定参考描述子;
根据所述第一数量的待确定参考描述子确定第一数量的所述待确定特征点,其中,所述第一数量的待确定参考描述子和所述第一数量的所述待确定特征点一一对应;
根据所述候选特征点和所述定第一数量的待确定特征点利用共面点成像原理构建所述单应性矩阵。
7.根据权利要求1所述的方法,其特征在于,所述通过第一邻近算法计算所述参考商标图像和所述待确定商标图像的相似程度的步骤,包括:
通过第一邻近算法计算所述参考商标图像和所述待确定商标图像的欧式空间距离;
根据所述欧式空间距离确定所述参考商标图像和所述待确定商标图像的相似程度。
8.一种图像处理装置,其特征在于,应用于计算机设备,所述计算机设备存储有参考商标图像;
所述装置包括:
输入模块,用于将待识别图像输入区域选取模型得到候选区域;
搜索模块,用于基于所述参考商标图像,在所述候选区域中搜索待确定商标图像;
校验模块,用于通过第一邻近算法计算所述参考商标图像和所述待确定商标图像的相似程度;当所述相似程度超过预设相似程度阈值时,将所述待确定商标图像作为所述待识别图像中的商标。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述计算机设备执行权利要求1-7中任意一项所述的图像处理方法。
10.一种可读存储介质,其特征在于,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在计算机设备执行权利要求1-7中任意一项所述的图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010956547.4A CN112036362A (zh) | 2020-09-11 | 2020-09-11 | 图像处理方法、装置、计算机设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010956547.4A CN112036362A (zh) | 2020-09-11 | 2020-09-11 | 图像处理方法、装置、计算机设备和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112036362A true CN112036362A (zh) | 2020-12-04 |
Family
ID=73588957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010956547.4A Withdrawn CN112036362A (zh) | 2020-09-11 | 2020-09-11 | 图像处理方法、装置、计算机设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112036362A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749668A (zh) * | 2021-01-18 | 2021-05-04 | 上海明略人工智能(集团)有限公司 | 目标图像的聚类方法、装置、电子设备和计算机可读介质 |
CN112766264A (zh) * | 2021-01-25 | 2021-05-07 | 广州互联网法院 | 图片比对方法及电子设备、计算机可读存储介质 |
CN112862813A (zh) * | 2021-03-04 | 2021-05-28 | 北京柏惠维康科技有限公司 | 标记点提取方法、装置、电子设备及计算机存储介质 |
CN113673321A (zh) * | 2021-07-12 | 2021-11-19 | 浙江大华技术股份有限公司 | 目标重识别方法、目标重识别装置及计算机可读存储介质 |
CN115100665A (zh) * | 2022-07-22 | 2022-09-23 | 贵州中烟工业有限责任公司 | 近似商标筛选方法、模型构建方法及计算机可读存储介质 |
-
2020
- 2020-09-11 CN CN202010956547.4A patent/CN112036362A/zh not_active Withdrawn
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749668A (zh) * | 2021-01-18 | 2021-05-04 | 上海明略人工智能(集团)有限公司 | 目标图像的聚类方法、装置、电子设备和计算机可读介质 |
CN112766264A (zh) * | 2021-01-25 | 2021-05-07 | 广州互联网法院 | 图片比对方法及电子设备、计算机可读存储介质 |
CN112766264B (zh) * | 2021-01-25 | 2024-06-07 | 广州互联网法院 | 图片比对方法及电子设备、计算机可读存储介质 |
CN112862813A (zh) * | 2021-03-04 | 2021-05-28 | 北京柏惠维康科技有限公司 | 标记点提取方法、装置、电子设备及计算机存储介质 |
CN113673321A (zh) * | 2021-07-12 | 2021-11-19 | 浙江大华技术股份有限公司 | 目标重识别方法、目标重识别装置及计算机可读存储介质 |
CN115100665A (zh) * | 2022-07-22 | 2022-09-23 | 贵州中烟工业有限责任公司 | 近似商标筛选方法、模型构建方法及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635657B (zh) | 目标跟踪方法、装置、设备及存储介质 | |
CN110232311B (zh) | 手部图像的分割方法、装置及计算机设备 | |
US10762376B2 (en) | Method and apparatus for detecting text | |
CN112036362A (zh) | 图像处理方法、装置、计算机设备和可读存储介质 | |
CN109145766B (zh) | 模型训练方法、装置、识别方法、电子设备及存储介质 | |
CN108256479B (zh) | 人脸跟踪方法和装置 | |
US20240092344A1 (en) | Method and apparatus for detecting parking space and direction and angle thereof, device and medium | |
CN109409398B (zh) | 图像处理装置、图像处理方法以及存储介质 | |
US10445602B2 (en) | Apparatus and method for recognizing traffic signs | |
CN111027563A (zh) | 一种文本检测方法、装置及识别系统 | |
TW201926140A (zh) | 影像標註方法、電子裝置及非暫態電腦可讀取儲存媒體 | |
CN111783770B (zh) | 图像的矫正方法、装置和计算机可读存储介质 | |
WO2018121287A1 (zh) | 目标再识别方法和装置 | |
US10528844B2 (en) | Method and apparatus for distance measurement | |
CN112016531A (zh) | 模型训练方法、对象识别方法、装置、设备及存储介质 | |
CN109947273B (zh) | 一种点读定位方法及装置 | |
CN111340213B (zh) | 神经网络的训练方法、电子设备、存储介质 | |
US20200005078A1 (en) | Content aware forensic detection of image manipulations | |
CN111488798B (zh) | 指纹识别方法、装置、电子设备及存储介质 | |
CN109919164B (zh) | 用户界面对象的识别方法及装置 | |
US10740590B2 (en) | Skin information processing method, skin information processing device, and non-transitory computer-readable medium | |
CN111008210B (zh) | 商品识别方法、装置、编解码器及存储装置 | |
JP5414631B2 (ja) | 文字列探索方法、文字列探索装置、記録媒体 | |
WO2021237973A1 (zh) | 图像定位模型获取方法及装置、终端和存储介质 | |
CN111275693B (zh) | 一种图像中物体的计数方法、计数装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201204 |
|
WW01 | Invention patent application withdrawn after publication |