CN109426831A - 图片相似匹配及模型训练的方法、装置及计算机设备 - Google Patents
图片相似匹配及模型训练的方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN109426831A CN109426831A CN201710761108.6A CN201710761108A CN109426831A CN 109426831 A CN109426831 A CN 109426831A CN 201710761108 A CN201710761108 A CN 201710761108A CN 109426831 A CN109426831 A CN 109426831A
- Authority
- CN
- China
- Prior art keywords
- picture
- training
- factor
- feature
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种图片相似匹配模型训练的方法、装置及计算机设备,获取训练集,训练集包括训练对,训练对包括第一训练图片、第二训练图片及分类标签;获取训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据全局特征因素、局部特征因素及字符特征因素建立训练对的特征向量;将训练对的特征向量及分类标签作为模型输入对模型进行训练,得到图片相似匹配模型。本发明还提供一种应用该图片相似匹配模型训练的方法或装置的图片相似匹配的方法、装置及计算机设备。通过该图片相似匹配模型进行图片相似匹配所得到的结果将更为准确,即可以提高图片相似匹配的准确率。
Description
技术领域
本发明涉及图像处理技术领域,特别是涉及一种图片相似匹配模型训练的方法、装置及计算机设备以及一种图片相似匹配的方法、装置及计算机设备。
背景技术
在图像处理技术领域,存在大量有微小差距的图片,如图片截取位置不同、大小缩放不一致、添加水印等,在实际业务中,可以将这些存在微小差距的图片进行相似匹配判断,以方便后续操作,如去重或聚集,实现去重或者不同源图片之间聚集的目的。
传统的查找相似图片的方法是通过提取图像的全局或局部特征,并根据提取的特征计算距离,进而基于计算出的距离判断是否两张图片相似,这种传统的方式由于仅涉及单一的全局特征或局部特征,准确率较低。
发明内容
基于此,有必要针对图片相似性判断准确率低的问题,提供一种能够提高准确率的图片相似匹配及模型训练的方法、装置及计算机设备。
一种图片相似匹配模型训练的方法,包括:
获取训练集,所述训练集包括训练对,所述训练对包括第一训练图片、第二训练图片及分类标签,所述分类标签表示所述第一训练图片与所述第二训练图片相似匹配的预期结果;
获取所述训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据所述全局特征因素、所述局部特征因素及所述字符特征因素建立所述训练对的特征向量;
将所述训练对的特征向量及分类标签作为模型输入对所述模型进行训练,得到图片相似匹配模型。
一种图片相似匹配的方法,包括:
获取第一待配图片及第二待配图片;
获取通过上述的图片相似匹配模型训练的方法得到的图片相似匹配模型;
获取所述第一待配图片及所述第二待配图片的全局特征因素、局部特征因素及字符特征因素,形成待配特征向量,并将所述待配特征向量输入所述图片相似匹配模型得到匹配结果。
一种图片相似匹配模型训练的装置,包括:
训练集获取模块,用于获取训练集,所述训练集包括训练对,所述训练对包括第一训练图片、第二训练图片及分类标签,所述分类标签表示所述第一训练图片与所述第二训练图片相似匹配的预期结果;
特征向量建立模块,用于获取所述训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据所述全局特征因素、所述局部特征因素及所述字符特征因素建立所述训练对的特征向量;
模型训练模块,用于将所述训练对的特征向量及分类标签作为模型输入对所述模型进行训练,得到图片相似匹配模型。
一种图片相似匹配的装置,包括:
待配图片获取模块,用于获取第一待配图片及第二待配图片;
模型获取模块,用于获取通过权利要求8-11任意一项所述的图片相似匹配模型训练的装置得到的图片相似匹配模型;
相似匹配模块,用于获取所述第一待配图片及所述第二待配图片的全局特征因素、局部特征因素及字符特征因素,形成待配特征向量,并将所述待配特征向量输入所述图片相似匹配模型得到匹配结果。
一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述的方法的步骤。
一种计算机存储介质,所述计算机存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现上述的方法的步骤。
上述图片相似匹配及模型训练的方法及装置、计算机设备及存储介质,由于该图片相似匹配模型需要根据获取到的训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据所述全局特征因素、所述局部特征因素及所述字符特征因素建立所述训练对的特征向量;再将该特征向量与分类标签作为模型的输入,对模型进行训练,得到图片相似匹配模型。因此,该特征向量涉及的因素不仅包括全局特征因素及局部特征因素,还包括字符特征因素,相较于单一考虑全局特征或局部特征的特征向量更为全面,能够得到更为准确的图片相似匹配模型。从而,通过该图片相似匹配模型进行图片相似匹配所得到的结果将更为准确,即可以提高图片相似匹配的准确率。
附图说明
图1为一实施方式的图片相似匹配模型训练的方法及装置的执行设备的内部结构示意图;
图2为一实施方式的图片相似匹配模型训练的方法的流程图;
图3为图2的图片相似匹配模型训练的方法的一个步骤的具体流程图;
图4为一实施方式的图片相似匹配的方法的流程图;
图5为图4的图片相似匹配的方法的一个步骤的具体流程图;
图6为一实施方式的图片相似匹配模型训练的装置的结构图;
图7为另一实施方式的图片相似匹配模型训练的装置的结构图;
图8为一实施方式的图片相似匹配的装置的结构图;
图9为另一实施方式的图片相似匹配的装置的结构图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
图1为一实施方式中的执行设备的内部结构示意图。执行设备可以为服务器或客户终端。执行设备包括通过系统总线连接的处理器、存储介质、内存储器、输出装置和输入装置。其中,执行设备的存储介质存储有操作系统以及一种图片相似匹配模型训练的装置或/及一种图片相似匹配的装置的计算机应用程序,该图片相似匹配模型训练的装置的计算机应用程序被处理器执行时,实现一种图片相似匹配模型训练的方法或/及一种图片相似匹配的方法。该处理器用于提供计算和控制能力,支撑整个执行设备的运行。执行设备的内存储器为存储介质中的图片相似匹配模型训练的装置运行提供环境,该内存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种图片相似匹配模型训练的方法或/及一种图片相似匹配的方法。执行设备的输出装置可以为显示屏,显示屏可以是液晶显示屏或者电子墨水显示屏等。执行设备的输入装置可以是显示屏上覆盖的触摸层,也可以是设置在执行设备的外壳上的按键、轨迹球或触控板,也可以是外接的键盘、触控板或鼠标等。本领域技术人员可以理解,图1中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的执行设备的限定,具体的执行设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
请参照图2,在一实施方式中,提供一种图片相似匹配模型训练的方法,该方法运行在如图1所示的执行设备中,该方法包括以下步骤:
S210:获取训练集。训练集包括训练对,训练对包括第一训练图片、第二训练图片及分类标签,分类标签表示第一训练图片与第二训练图片相似匹配的预期结果。
训练集中的训练对的格式可以为<第一训练图片,第二训练图片,分类标签>。分类标签可以通过人工标注的方式确定,即通过人工方式确定第一训练图片与第二训练图片相似匹配的预期结果。
S220:获取训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据全局特征因素、局部特征因素及字符特征因素建立训练对的特征向量。
可以通过特征提取的方式,获取第一训练图片及第二训练图片全局特征因素、局部特征因素及字符特征因素。其中,全局特征因素为与图片的全局特征相关的量;局部特征因素为与图片的局部特征相关的量;字符特征因素为与图片中的字符相关的量。如,字符特征因素可以包括字符数量、字符的匹配率及字符数量的差值中的至少一项,当两张图片中的均没有字符时,字符数量均为0,字符的匹配率为100%,字数数量的差值也为0。当两张图片中一张有字符,另一张没有字符时,字符数量为实际数量,字符的匹配率为0%,字符数量的差值为两张图片的实际差值。
根据全局特征因素、局部特征因素及字符特征因素建立训练对的特征向量。因此,特征向量涉及全局特征因素、局部特征因素及字符特征因素,其涉及的因素相较于单一考虑全局特征因素或局部特征因素的情况更为全面。
S230:将训练对的特征向量及分类标签作为模型输入对模型进行训练,得到图片相似匹配模型。
分类标签可以包括相似和不相似两种;此时,模型为二分类模型。分类标签还可以包括不少于三个的相似等级,如,十分相似、相似及不相似;此时,模型为相应的多分类模型。可以通过随机森林算法或者其它算法进行模型训练,得到图片相似匹配模型。
上述图片相似匹配模型训练的方法,由于该图片相似匹配模型需要根据获取到的训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据全局特征因素、局部特征因素及字符特征因素建立训练对的特征向量;再将该特征向量与分类标签作为模型的输入,对模型进行训练,得到图片相似匹配模型。因此,该特征向量涉及的因素不仅包括全局特征因素及局部特征因素,还包括字符特征因素,相较于单一考虑全局特征或局部特征的特征向量更为全面,能够得到更为准确的图片相似匹配模型。从而,通过该图片相似匹配模型进行图片相似匹配所得到的结果将更为准确,即可以提高图片相似匹配的准确率。
在其中一实施方式中,全局特征因素包括全局特征的距离值;或/及,局部特征因素包括局部特征的匹配率及局部特征的差值;或/及,字符特征因素包括字符数量、字符的匹配率及字符数量的差值。
其中,全局特征可以包括颜色和边缘的方向性描述、模糊颜色和纹理直方图、颜色相关直方图、图像颜色布局描述符特征、模糊颜色直方图、模糊对立直方图、联合复合描述符、联合直方图、基于Gabor小波的纹理特征、边缘直方图、可伸缩颜色、Tamura纹理特征这12种特征中的至少一项。在一个具体实施例中,全局特征包括上述12种特征。
需要说明的是,通过将图像与Gabor滤波器卷积可以得到一系列的滤波图像,每幅图像都描述了一定尺度和一定方向度上面的图像信息。可以通过以基小波为Gabor函数的小波变换来提取每幅滤波图像的纹理特征(基于Gabor小波的纹理特征)来对图像进行相似性判断。Tamura纹理特征,是基于人类对纹理的视觉感知心理学研究,包括6种属性,即:粗糙度、对比度、方向度、线像度、规整度和粗略度。
局部特征可以为尺度不变特征转换特征(Scale-Invariant Feature Transform,SIFT)。尺度不变特征转换特征是用于图像处理领域的一种描述,这种描述具有尺度不变性,可在图像中检测出关键点。字符可以为任意的字符标记,也可以为文字,如字符特征因素可以文字识别结果相关的量。
请参阅图3,在其中一实施方式中,获取训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据全局特征因素、局部特征因素及字符特征因建立训练对的特征向量的步骤,包括:
S321:分别获取训练对的第一训练图片及第二训练图片的全局特征、局部特征及字符识别结果。
S323:根据第一训练图片及第二训练图片的全局特征、局部特征及字符识别结果,确定训练对的第一训练图片及第二训练图片的全局特征的距离值、局部特征的匹配率、局部特征的差值、字符数量、字符的匹配率以及字符数量的差值。
在全局特征包括上述的12种全局特征的实施例中,全局特征的距离值可以分别记为global_1、global_2、…、global_12。局部特征的匹配率包括第一训练图片的局部特征相对于第二训练图片的匹配率,以及第二训练图片的局部特征相对于第一训练图片的匹配率,可以分别记为sift_match_1及sift_match2;局部特征的差值可以为第一训练图片的局部特征与第二训练图片的局部特征的差值,可以记为sift_no_diff。字符数量包括第一训练图片中的字符的数量和第二训练图片中的字符的数量,即第一字符数量和第二字符数量,可以分别记为ocr_no_1、ocr_no_2。字符的匹配率可以包括第一训练图片中的字符相对于第二训练图片中的字符的匹配率,以及第二训练图片中的字符相对第一训练图片中的字符的匹配率,即第一字符匹配率和第二字符匹配率,可以分别记为ocr_match_1、ocr_match2。字符数量的差值可以为第一字符数量和第二字符数量的差,可以记为ocr_no_diff。
在其中一具体实施例中,局部特征为SIFT特征的特征点;局部特征的匹配率为彼此特征点的匹配率,即第一训练图片的特征点相对第二训练图片的特征点的匹配率以及第二训练图片的特征点相对第一训练图片的特征点的匹配率;局部特征的差值为第一训练图片与第二训练图片的特征点个数的差。
S325:根据全局特征的距离值、局部特征的匹配率、局部特征的差值、字符的匹配率以及字符数量的差值,建立训练对的特征向量。
将特征向量记为L_feature,在一个具体示例中,特征向量可以表示为一个22维的向量:L_feature(global_1、global_2、…、global_12、sift_no_1、sift_no_2、sift_match_1、sift_match2、sift_no_diff、ocr_no_1、ocr_no_2、ocr_match_1、ocr_match2、ocr_no_diff)。
在其中一实施方式中,局部特征包括尺度不变特征转换特征;或/及,全局特征包括颜色和边缘的方向性描述、模糊颜色和纹理直方图、颜色相关直方图、图像颜色布局描述符特征、模糊颜色直方图、模糊对立直方图、联合复合描述符、联合直方图、基于Gabor小波的纹理特征、边缘直方图、可伸缩颜色、Tamura纹理特征中的至少一项。可以理解地,特征越多,涉及的因素越全面,则最终得到的图片相似匹配模型越准确。
请参阅图4,本发明还提供一种应用上述图片相似匹配模型训练的方法得到的图片相似匹配模型的图片相似匹配的方法。该方法,包括:
S410:获取第一待配图片及第二待配图片。
S420:获取通过上述的图片相似匹配模型训练的方法得到的图片相似匹配模型。
S430:获取第一待配图片及第二待配图片的全局特征因素、局部特征因素及字符特征因素,形成待配特征向量,并将待配特征向量输入图片相似匹配模型得到匹配结果。
第一待配图片及第二待配图片为需要进行相似匹配的两张图片,匹配结果表示的是该第一待配图片与第二待配图片相似匹配的结果。匹配结果与分类标签的内容对应,可以包括相似和不相似两种结果;还可以包括不少于三个的相似等级的结果,如,十分相似、相似及不相似。
上述图片相似匹配的方法,通过上述图片相似匹配模型训练的方法得到的图片相似匹配模型,进行图片相似匹配。由于该图片相似匹配模型更为准确,因此,通过该图片相似匹配模型进行图片相似匹配所得到的结果将更为准确,即可以提高图片相似匹配的准确率。
请参阅图5,在其中一实施方式中,获取第一待配图片及第二待配图片的步骤,包括:
S511:获取第一待配图集及第二待配图集。第一待配图集包括不少于一张第一待配图片,第二待配图集包括不少于一张第二待配图片。
S513:根据第一待配图集及第二待配图集生成由一张第一待配图片及一张第二待配图片组成的图片对。
S515:获取图片对的第一待配图片及第二待配图片。
在本实方式中获取的第一待配图片和第二待配图片为同一图片对中相对应的两张待配图片,从而对该图片对中的两张待配图片进行图片相似匹配。将根据第一待配图片集和第二待配图片集所生成的图片对都进行图片相似匹配可以得到各组图片对的匹配结果,从而实现对第一待配图片集和第二待配图片集进行图片相似匹配。
进一步地,如图5所示,在得到匹配结果之后,还包括S540。
S540:根据匹配结果,对匹配结果为相似的图片对进行过滤和聚合。如此,达到可根据后续业务需求将相似的图片聚集在一起或去重的目的。
假设匹配结果包括:A1-B1相似,A2-B1相似,A3-B1不相似,A4-B1不相似,A1-B2不相似,A2-B2不相似,A3-B1不相似,A4-B2不相似。过滤就是把匹配结果为相似的图片对找出来,即(A1-B1和A2-B1)是相似的。聚合可以是把匹配结果为相似的图片对整理到一起,即(A1、B1、A2)放一起,这三张图片就是相似的,然后便可以根据后续业务需求将这些相似的图片进行输出或仅保留一张,从而达到根据后续业务需求将相似的图片聚集在一起或去重的目的。
在其中一具体实施例中,根据全局特征因素、局部特征因素及字符特征因素建立特征向量,从而对模型进行训练,得到图片相似匹配模型。对于需要进行相似匹配的待配图片,首先提取待配图片的全局特征因素、局部特征因素及字符特征因素建立待配特征向量,然后将该待配特征向量输入至图片相似匹配模型得到匹配结果。该相似匹配模型能够按照训练过程中确定的各阈值与待配特征向量中的各元素进行比较,从而确定匹配结果。
在其中一个具体实施中,获取第一待配图集及第二待配图集,第一待配图集包括不少于一张第一待配图片,第二待配图集包括不少于一张第二待配图片;假设第一匹配集包括A1、A2、A3、A4四张第一待匹配图片,第二匹配集包括B1、B2两张第二待匹配图片,第一待配图片及第二待配图片为均为表情图片。根据第一待配图集及第二待配图集可以生成由一张第一待配图片及一张第二待配图片组成的图片对:A1-B1,A2-B1,A3-B1,A4-B1,A1-B2,A2-B2,A3-B2及A4-B2。获取图片对的第一待配图片及第二待配图片之后,获取通过图片相似匹配模型训练的方法得到的图片相似匹配模型;获取第一待配图片及第二待配图片的全局特征因素、局部特征因素及字符特征因素,形成待配特征向量,并将待配特征向量输入图片相似匹配模型可以得到匹配结果;假设匹配结果为:A1-B1相似,A2-B1相似,A3-B1不相似,A4-B1不相似,A1-B2不相似,A2-B2不相似,A3-B1不相似,A4-B2不相似。根据匹配结果,对匹配结果为相似的图片对进行过滤和聚合。过滤就是把匹配结果为相似的图片对找出来,即(A1-B1和A2-B1)是相似的。聚合就是把匹配结果为相似的图片对整理到一起,即(A1、B1、A2)放一起,这三张表情图片就是相似的。因此,最终展现的结果可以为A1、B1、A2这三张相似的表情图片。
本发明还提供一种与上述图片相似匹配模型训练的方法相对应的图片相似匹配模型训练的装置。如图6所示,该装置包括:
训练集获取模块610,用于获取训练集,训练集包括训练对,训练对包括第一训练图片、第二训练图片及分类标签,分类标签表示第一训练图片与第二训练图片相似匹配的预期结果。
特征向量建立模块640,用于获取训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据全局特征因素、局部特征因素及字符特征因素建立训练对的特征向量。
模型训练模块650,用于将训练对的特征向量及分类标签作为模型输入对模型进行训练,得到图片相似匹配模型。
上述图片相似匹配模型训练的装置,由于该图片相似匹配模型需要根据获取到的训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据全局特征因素、局部特征因素及字符特征因素建立训练对的特征向量;再将该特征向量与分类标签作为模型的输入,对模型进行训练,得到图片相似匹配模型。因此,该特征向量涉及的因素不仅包括全局特征因素及局部特征因素,还包括字符特征因素,相较于单一考虑全局特征或局部特征的特征向量更为全面,能够得到更为准确的图片相似匹配模型。从而,通过该图片相似匹配模型进行图片相似匹配所得到的结果将更为准确,即可以提高图片相似匹配的准确率。
在其中一实施方式中,全局特征因素包括全局特征的距离值;或/及,局部特征因素包括局部特征的匹配率及局部特征的差值;或/及,字符特征因素包括字符数量、字符的匹配率及字符数量的差值。
请参阅图图7,在其中一实施方式中,该装置还包括特征获取模块720及因素确定模块730。
特征获取模块720,用于分别获取训练对的第一训练图片及第二训练图片的全局特征、局部特征及字符识别结果。
因素确定模块730,用于根据第一训练图片及第二训练图片的全局特征、局部特征及字符识别结果,确定训练对的第一训练图片及第二训练图片的全局特征的距离值、局部特征的匹配率、局部特征的差值、字符的匹配率以及字符数量的差值。
特征向量建立模块740,用于根据全局特征的距离值、局部特征的匹配率、局部特征的差值、字符的匹配率以及字符数量的差值,建立训练对的特征向量。
在该实施方式中,训练集获取模块710,用于获取训练集,训练集包括训练对,训练对包括第一训练图片、第二训练图片及分类标签,分类标签表示第一训练图片与第二训练图片相似匹配的预期结果。模型训练模块750,用于将训练对的特征向量及分类标签作为模型输入对模型进行训练,得到图片相似匹配模型。
在其中一实施方式中,局部特征包括尺度不变特征转换特征;或/及,全局特征包括颜色和边缘的方向性描述、模糊颜色和纹理直方图、颜色相关直方图、图像颜色布局描述符特征、模糊颜色直方图、模糊对立直方图、联合复合描述符、联合直方图、基于Gabor小波的纹理特征、边缘直方图、可伸缩颜色、Tamura纹理特征中的至少一项。
本发明还提供一种与上述图片相似匹配的方法相对应的图片相似匹配的装置。如图8所示,该装置包括:
待配图片获取模块830,用于获取第一待配图片及第二待配图片。
模型获取模块840,用于获取通过上述的图片相似匹配模型训练的装置得到的图片相似匹配模型。
相似匹配模块850,用于获取第一待配图片及第二待配图片的全局特征因素、局部特征因素及字符特征因素,形成待配特征向量,并将待配特征向量输入图片相似匹配模型得到匹配结果。
上述图片相似匹配的装置,通过上述图片相似匹配模型训练的装置得到的图片相似匹配模型,进行图片相似匹配。由于该图片相似匹配模型更为准确,因此,通过该图片相似匹配模型进行图片相似匹配所得到的结果将更为准确,即可以提高图片相似匹配的准确率。
在其中一实施方式中,如图9所示,该装置还包括图集获取模块910及图片对生成模块920。
图集获取模块910,用于获取第一待配图集及第二待配图集。第一待配图集包括不少于一张第一待配图片,第二待配图集包括不少于一张第二待配图片。
图片对生成模块920,用于根据第一待配图集及第二待配图集生成由一张第一待配图片及一张第二待配图片组成的图片对。
待配图片获取模块930,用于获取图片对的第一待配图片及第二待配图片。
在该实施方式中,模型获取模块940,用于获取通过上述的图片相似匹配模型训练的装置得到的图片相似匹配模型。相似匹配模块950,用于获取第一待配图片及第二待配图片的全局特征因素、局部特征因素及字符特征因素,形成待配特征向量,并将待配特征向量输入图片相似匹配模型得到匹配结果。
请继续参阅图9,该装置还包括:
图片过滤聚合模块960,用于根据匹配结果,对匹配结果为相似的图片对进行过滤和聚合。
本发明还提供与上述方法相对应的计算机设备及计算机存储介质。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的方法的步骤。
本发明还提供一种计算机存储介质,计算机存储介质上存储有计算机程序,计算机程序被处理器执行时,实现上述的方法的步骤。
由于上述的装置与上述的方法相互对应,对于装置中与上述方法对应的具体技术特征,在此不作赘述。上述计算机设备及计算机存储介质均与上述方法相互对应,对于计算机设备及存储介质中与上述方法对应的技术特征,在此也不作赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一非易失性的计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种图片相似匹配模型训练的方法,包括:
获取训练集,所述训练集包括训练对,所述训练对包括第一训练图片、第二训练图片及分类标签,所述分类标签表示所述第一训练图片与所述第二训练图片相似匹配的预期结果;
获取所述训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据所述全局特征因素、所述局部特征因素及所述字符特征因素建立所述训练对的特征向量;
将所述训练对的特征向量及分类标签作为模型输入对所述模型进行训练,得到图片相似匹配模型。
2.根据权利要求1所述的图片相似匹配模型训练的方法,其特征在于,所述全局特征因素包括全局特征的距离值;或/及,所述局部特征因素包括局部特征的匹配率及局部特征的差值;或/及,所述字符特征因素包括字符数量、字符的匹配率及所述字符数量的差值。
3.根据权利要求2所述的图片相似匹配模型训练的方法,其特征在于,获取所述训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据所述全局特征因素、所述局部特征因素及所述字符特征因建立所述训练对的特征向量的步骤,包括:
分别获取所述训练对的第一训练图片及第二训练图片的全局特征、局部特征及字符识别结果;
根据所述第一训练图片及所述第二训练图片的所述全局特征、所述局部特征及所述字符识别结果,确定所述训练对的第一训练图片及第二训练图片的全局特征的距离值、局部特征的匹配率、局部特征的差值、字符的匹配率以及字符数量的差值;
根据所述全局特征的距离值、所述局部特征的匹配率、所述局部特征的差值、所述字符的匹配率以及所述字符数量的差值,建立所述训练对的特征向量。
4.根据权利要求1所述的图片相似匹配模型训练的方法,其特征在于,所述局部特征包括尺度不变特征转换特征;或/及,所述全局特征包括颜色和边缘的方向性描述、模糊颜色和纹理直方图、颜色相关直方图、图像颜色布局描述符特征、模糊颜色直方图、模糊对立直方图、联合复合描述符、联合直方图、基于Gabor小波的纹理特征、边缘直方图、可伸缩颜色、Tamura纹理特征中的至少一项。
5.一种图片相似匹配的方法,包括:
获取第一待配图片及第二待配图片;
获取通过权利要求1-4任意一项所述的图片相似匹配模型训练的方法得到的图片相似匹配模型;
获取所述第一待配图片及所述第二待配图片的全局特征因素、局部特征因素及字符特征因素,形成待配特征向量,并将所述待配特征向量输入所述图片相似匹配模型得到匹配结果。
6.根据权利要求5所述的图片相似匹配的方法,其特征在于,获取第一待配图片及第二待配图片的步骤,包括:
获取第一待配图集及第二待配图集;所述第一待配图集包括不少于一张第一待配图片,所述第二待配图集包括不少于一张第二待配图片;
根据所述第一待配图集及所述第二待配图集生成由一张所述第一待配图片及一张所述第二待配图片组成的图片对;
获取所述图片对的所述第一待配图片及所述第二待配图片。
7.根据权利要求6所述的图片相似匹配的方法,其特征在于,得到匹配结果之后,还包括:
根据所述匹配结果,对所述匹配结果为相似的图片对进行过滤和聚合。
8.一种图片相似匹配模型训练的装置,包括:
训练集获取模块,用于获取训练集,所述训练集包括训练对,所述训练对包括第一训练图片、第二训练图片及分类标签,所述分类标签表示所述第一训练图片与所述第二训练图片相似匹配的预期结果;
特征向量建立模块,用于获取所述训练对的第一训练图片及第二训练图片的全局特征因素、局部特征因素及字符特征因素,并根据所述全局特征因素、所述局部特征因素及所述字符特征因素建立所述训练对的特征向量;
模型训练模块,用于将所述训练对的特征向量及分类标签作为模型输入对所述模型进行训练,得到图片相似匹配模型。
9.根据权利要求8所述的图片相似匹配模型训练的装置,其特征在于,所述全局特征因素包括全局特征的距离值;或/及,所述局部特征因素包括局部特征的匹配率及局部特征的差值;或/及,所述字符特征因素包括字符数量、字符的匹配率及所述字符数量的差值。
10.根据权利要求9所述的图片相似匹配模型训练的装置,其特征在于,还包括特征获取模块及因素确定模块;
所述特征获取模块,用于分别获取所述训练对的第一训练图片及第二训练图片的全局特征、局部特征及字符识别结果;
所述因素确定模块,用于根据所述第一训练图片及所述第二训练图片的所述全局特征、所述局部特征及所述字符识别结果,确定所述训练对的第一训练图片及第二训练图片的全局特征的距离值、局部特征的匹配率、局部特征的差值、字符的匹配率以及字符数量的差值;
所述特征向量建立模块,用于根据所述全局特征的距离值、所述局部特征的匹配率、所述局部特征的差值、所述字符的匹配率以及所述字符数量的差值,建立所述训练对的特征向量。
11.根据权利要求8所述的图片相似匹配模型训练的装置,其特征在于,所述局部特征包括尺度不变特征转换特征;或/及,所述全局特征包括颜色和边缘的方向性描述、模糊颜色和纹理直方图、颜色相关直方图、图像颜色布局描述符特征、模糊颜色直方图、模糊对立直方图、联合复合描述符、联合直方图、基于Gabor小波的纹理特征、边缘直方图、可伸缩颜色、Tamura纹理特征中的至少一项。
12.一种图片相似匹配的装置,包括:
待配图片获取模块,用于获取第一待配图片及第二待配图片;
模型获取模块,用于获取通过权利要求8-11任意一项所述的图片相似匹配模型训练的装置得到的图片相似匹配模型;
相似匹配模块,用于获取所述第一待配图片及所述第二待配图片的全局特征因素、局部特征因素及字符特征因素,形成待配特征向量,并将所述待配特征向量输入所述图片相似匹配模型得到匹配结果。
13.根据权利要求12所述的图片相似匹配的装置,其特征在于,还包括图集获取模块及图片对生成模块;
所述图集获取模块,用于获取第一待配图集及第二待配图集;所述第一待配图集包括不少于一张第一待配图片,所述第二待配图集包括不少于一张第二待配图片;
所述图片对生成模块,用于根据所述第一待配图集及所述第二待配图集生成由一张所述第一待配图片及一张所述第二待配图片组成的图片对;
所述待配图片获取模块,用于获取所述图片对的所述第一待配图片及所述第二待配图片。
14.根据权利要求13所述的图片相似匹配的装置,其特征在于,还包括:
图片过滤聚合模块,用于根据所述匹配结果,对所述匹配结果为相似的图片对进行过滤和聚合。
15.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1-7所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710761108.6A CN109426831B (zh) | 2017-08-30 | 2017-08-30 | 图片相似匹配及模型训练的方法、装置及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710761108.6A CN109426831B (zh) | 2017-08-30 | 2017-08-30 | 图片相似匹配及模型训练的方法、装置及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109426831A true CN109426831A (zh) | 2019-03-05 |
CN109426831B CN109426831B (zh) | 2022-12-13 |
Family
ID=65502115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710761108.6A Active CN109426831B (zh) | 2017-08-30 | 2017-08-30 | 图片相似匹配及模型训练的方法、装置及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109426831B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197213A (zh) * | 2019-05-21 | 2019-09-03 | 北京航空航天大学 | 基于神经网络的图像匹配方法、装置和设备 |
CN110516094A (zh) * | 2019-08-29 | 2019-11-29 | 百度在线网络技术(北京)有限公司 | 门类兴趣点数据的去重方法、装置、电子设备及存储介质 |
CN111160357A (zh) * | 2020-04-02 | 2020-05-15 | 支付宝(杭州)信息技术有限公司 | 一种基于对抗学习的模型训练、图片输出方法及装置 |
CN111506750A (zh) * | 2020-06-15 | 2020-08-07 | 北京金山云网络技术有限公司 | 图片检索方法、装置及电子设备 |
CN112423016A (zh) * | 2020-11-20 | 2021-02-26 | 广州欢网科技有限责任公司 | 一种提高电视台直播收视率的优化方法和系统 |
CN113449754A (zh) * | 2020-03-26 | 2021-09-28 | 百度在线网络技术(北京)有限公司 | 标签的匹配模型训练和展示方法、装置、设备及介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887523A (zh) * | 2010-06-21 | 2010-11-17 | 南京邮电大学 | 利用图片文字与局部不变特征检测图像垃圾邮件的方法 |
CN102831244A (zh) * | 2012-09-13 | 2012-12-19 | 重庆立鼎科技有限公司 | 一种房产文档图像的分类检索方法 |
CN103473545A (zh) * | 2013-08-01 | 2013-12-25 | 西安交通大学 | 一种基于多特征的文本图像相似度度量方法 |
WO2014032244A1 (en) * | 2012-08-30 | 2014-03-06 | Microsoft Corporation | Feature-based candidate selection |
CN104966109A (zh) * | 2015-07-17 | 2015-10-07 | 北京旷视科技有限公司 | 医疗化验单图像分类方法及装置 |
CN105354273A (zh) * | 2015-10-29 | 2016-02-24 | 浙江高速信息工程技术有限公司 | 一种快速检索高速公路逃费车辆高相似度图像的方法 |
CN105787488A (zh) * | 2016-03-02 | 2016-07-20 | 浙江宇视科技有限公司 | 由全局向局部传递的图像特征提取方法及装置 |
US20160210532A1 (en) * | 2015-01-21 | 2016-07-21 | Xerox Corporation | Method and system to perform text-to-image queries with wildcards |
CN106228166A (zh) * | 2016-07-27 | 2016-12-14 | 北京交通大学 | 字符图像的识别方法 |
-
2017
- 2017-08-30 CN CN201710761108.6A patent/CN109426831B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887523A (zh) * | 2010-06-21 | 2010-11-17 | 南京邮电大学 | 利用图片文字与局部不变特征检测图像垃圾邮件的方法 |
WO2014032244A1 (en) * | 2012-08-30 | 2014-03-06 | Microsoft Corporation | Feature-based candidate selection |
CN102831244A (zh) * | 2012-09-13 | 2012-12-19 | 重庆立鼎科技有限公司 | 一种房产文档图像的分类检索方法 |
CN103473545A (zh) * | 2013-08-01 | 2013-12-25 | 西安交通大学 | 一种基于多特征的文本图像相似度度量方法 |
US20160210532A1 (en) * | 2015-01-21 | 2016-07-21 | Xerox Corporation | Method and system to perform text-to-image queries with wildcards |
CN104966109A (zh) * | 2015-07-17 | 2015-10-07 | 北京旷视科技有限公司 | 医疗化验单图像分类方法及装置 |
CN105354273A (zh) * | 2015-10-29 | 2016-02-24 | 浙江高速信息工程技术有限公司 | 一种快速检索高速公路逃费车辆高相似度图像的方法 |
CN105787488A (zh) * | 2016-03-02 | 2016-07-20 | 浙江宇视科技有限公司 | 由全局向局部传递的图像特征提取方法及装置 |
CN106228166A (zh) * | 2016-07-27 | 2016-12-14 | 北京交通大学 | 字符图像的识别方法 |
Non-Patent Citations (2)
Title |
---|
ROBERTO H.W.PINHEIRO 等: "Data-driven global-ranking local feature selection methods for text categorization", 《EXPERT SYSTEMS WITH APPLICATIONS》 * |
郭加旋: "面向非纯文本文档图像的检索技术研究与实现", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197213A (zh) * | 2019-05-21 | 2019-09-03 | 北京航空航天大学 | 基于神经网络的图像匹配方法、装置和设备 |
CN110516094A (zh) * | 2019-08-29 | 2019-11-29 | 百度在线网络技术(北京)有限公司 | 门类兴趣点数据的去重方法、装置、电子设备及存储介质 |
CN113449754A (zh) * | 2020-03-26 | 2021-09-28 | 百度在线网络技术(北京)有限公司 | 标签的匹配模型训练和展示方法、装置、设备及介质 |
CN113449754B (zh) * | 2020-03-26 | 2023-09-22 | 百度在线网络技术(北京)有限公司 | 标签的匹配模型训练和展示方法、装置、设备及介质 |
CN111160357A (zh) * | 2020-04-02 | 2020-05-15 | 支付宝(杭州)信息技术有限公司 | 一种基于对抗学习的模型训练、图片输出方法及装置 |
CN111160357B (zh) * | 2020-04-02 | 2020-06-30 | 支付宝(杭州)信息技术有限公司 | 一种基于对抗学习的模型训练、图片输出方法及装置 |
CN111506750A (zh) * | 2020-06-15 | 2020-08-07 | 北京金山云网络技术有限公司 | 图片检索方法、装置及电子设备 |
CN112423016A (zh) * | 2020-11-20 | 2021-02-26 | 广州欢网科技有限责任公司 | 一种提高电视台直播收视率的优化方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109426831B (zh) | 2022-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ye et al. | Joint feature learning and relation modeling for tracking: A one-stream framework | |
CN109426831A (zh) | 图片相似匹配及模型训练的方法、装置及计算机设备 | |
US20220083801A1 (en) | Methods and apparatuses for vehicle appearance feature recognition, methods and apparatuses for vehicle retrieval, storage medium, and electronic devices | |
Liu et al. | Open-world semantic segmentation via contrasting and clustering vision-language embedding | |
CN107944442B (zh) | 基于改进卷积神经网络的对象检测装置及方法 | |
Mishra et al. | Region duplication forgery detection technique based on SURF and HAC | |
CN108229531B (zh) | 对象特征提取方法、装置、存储介质和电子设备 | |
CN108334644B (zh) | 图像识别方法和装置 | |
CN106651877B (zh) | 实例分割方法及装置 | |
CN108549870A (zh) | 一种对物品陈列进行鉴别的方法及装置 | |
Chen et al. | Relation matters: Foreground-aware graph-based relational reasoning for domain adaptive object detection | |
CN104915673B (zh) | 一种基于视觉词袋模型的目标分类方法和系统 | |
Zhang et al. | Deep object co-segmentation via spatial-semantic network modulation | |
CN104715023A (zh) | 基于视频内容的商品推荐方法和系统 | |
CN109145766A (zh) | 模型训练方法、装置、识别方法、电子设备及存储介质 | |
WO2022156525A1 (zh) | 对象匹配方法、装置及设备 | |
Gao et al. | Insulator segmentation for power line inspection based on modified conditional generative adversarial network | |
Liu et al. | An indoor scene classification method for service robot Based on CNN feature | |
CN107358490A (zh) | 一种图像匹配方法、装置及电子设备 | |
Wang et al. | Detecting tampered scene text in the wild | |
Kim et al. | Robust facial landmark extraction scheme using multiple convolutional neural networks | |
CN113657273A (zh) | 确定商品信息的方法、装置、电子设备及介质 | |
WO2024027347A9 (zh) | 内容识别方法、装置、设备、存储介质及计算机程序产品 | |
Maigrot et al. | Tampering detection and localization in images from social networks: A CBIR approach | |
Lad et al. | Feature based object mining and tagging algorithm for digital images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |