CN101576932A - 近重复图片的计算机查找方法和装置 - Google Patents

近重复图片的计算机查找方法和装置 Download PDF

Info

Publication number
CN101576932A
CN101576932A CNA2009101467265A CN200910146726A CN101576932A CN 101576932 A CN101576932 A CN 101576932A CN A2009101467265 A CNA2009101467265 A CN A2009101467265A CN 200910146726 A CN200910146726 A CN 200910146726A CN 101576932 A CN101576932 A CN 101576932A
Authority
CN
China
Prior art keywords
picture
grouping
feature vector
node
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009101467265A
Other languages
English (en)
Other versions
CN101576932B (zh
Inventor
贾梦雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN2009101467265A priority Critical patent/CN101576932B/zh
Publication of CN101576932A publication Critical patent/CN101576932A/zh
Priority to HK10104500.3A priority patent/HK1136892A1/xx
Priority to US12/802,815 priority patent/US8611649B2/en
Priority to EP10789858.7A priority patent/EP2443589B1/en
Priority to PCT/US2010/001719 priority patent/WO2010147644A1/en
Priority to JP2012516057A priority patent/JP5463415B2/ja
Application granted granted Critical
Publication of CN101576932B publication Critical patent/CN101576932B/zh
Priority to US14/080,537 priority patent/US9405993B2/en
Priority to JP2014007980A priority patent/JP5797789B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请实施例公开了一种近重复图片查找方法,该方法为:将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;对于所述多个分组中的各分组,确定该分组中图片的颜色特征向量,利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片划分为多组;从多组中查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组;将查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。本申请实施例还公开了一种近重复图片查找装置。本申请实施例还公开了近重复图片的计算机查找方法和装置。采用本申请,能够有效提高查找给定图片的近重复图片的效率。

Description

近重复图片的计算机查找方法和装置
技术领域
本申请涉及数字图像处理领域,尤其涉及一种近重复图片的计算机查找方法和装置。
背景技术
目前,对于给定的两张图片,判断这两张图片是否相同具体采用如下图像特征提取法:
首先,提取两张图片的图像特征,图像特征可以视为图片的签名;
然后,比较两张图片的签名是否完全匹配,若是,则判断两张图片相同,否则,判断两张图片不相同。
上述方法中,提取的图片的图像特征为该图片的颜色直方图向量。颜色直方图向量的具体提取方法如下:
首先,选择一种颜色空间,如RGB空间,并将颜色空间进行量化,量化后的结果是若干种颜色;
然后,统计图片的全部区域或部分区域中每一种颜色对应的像素个数,形成颜色直方图;
最后,将形成的所有颜色直方图拼成一个向量,作为图片的签名。
在需要从多张图片中查找与给定图片相同的图片时,具体做法是,按照上述图像特征提取法判断给定图片与多张图片中的各张图片是否相同,并将判断相同的图片作为查找结果。
在实现本申请的过程中,发明人发现现有技术中存在如下技术问题:
其一,在从多张图片中查找与给定图片相同的图片时,需要将给定图片与多张图片中的每一张图片进行比较,比较过程涉及图像特征提取等复杂过程,实现效率较低。
其二,利用上述图像特征提取法并不能判断两张图片是否为近重复图片,因为在图片的局部颜色发生不大的变化时,例如在图片中嵌入了水印,图片的图像特征也会发生变化。因此也就无法从多张图片中查找与给定图片为近重复图片的图片。近重复图片是指,两张图片的主体内容基本相同,只是由于人工加入小面积的标志或水印,或是由于图片缩放等原因而引起了少量差异,将这两张图片称为近重复图片。
发明内容
本申请实施例提供一种近重复图片查找方法和装置,以及一种近重复图片的计算机查找方法和装置,用于提高从多张图片中查找给定图片的近重复图片的效率。
本申请实施例提供一种近重复图片的计算机查找方法,该方法包括:
将数据库中存储的多张待分组图片读入内存;
将读入内存的多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;将每一个分组存储在硬盘上不同的分组数据库中;
将给定图片读入内存;从硬盘上查找所存储图片的主颜色与给定图片的主颜色相同的分组数据库,并将查找到的分组数据库中的图片读入内存;
将从分组数据库中读入内存的图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
本申请实施例提供一种近重复图片的计算机查找方法,该方法包括:
将数据库中存储的多张待分组图片读入内存;
将读入内存的多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;对于所述多个分组中的各分组,确定该分组中图片的颜色特征向量,利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片划分为多个分组,并将该多个分组保存在硬盘上;
将给定图片读入内存;从硬盘上查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组,并将该分组中的图片读入内存;
将从硬盘上读入内存的图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
本申请实施例提供一种近重复图片的计算机查找方法,该方法包括:
将多张待分组图片读入内存;
确定读入内存的各待分组图片的颜色特征向量;利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组,并将该多个分组保存在硬盘上;
将给定图片读入内存;从硬盘上查找与所述给定图片的颜色特征向量的距离最近的分组,并将查找到的分组中的图片读入内存;
将从硬盘读入内存的图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
本申请实施例提供一种近重复图片查找方法,该方法包括:
将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
从所述多个分组中查找所包含图片的主颜色与给定图片的主颜色相同的分组;
将查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
本申请实施例提供一种近重复图片查找方法,该方法包括:
将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
对于所述多个分组中的各分组,确定该分组中图片的颜色特征向量,利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片划分为多个分组;
从当前各分组中查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组;
将查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
本申请实施例提供一种近重复图片查找方法,该方法包括:
确定多张待分组图片中各待分组图片的颜色特征向量;利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组;
从所述多个分组中查找与给定图片的颜色特征向量的距离最近的分组;
将查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
本申请实施例提供一种近重复图片查找装置,该装置包括:
分组单元,用于将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
查找单元,用于从所述多个分组中查找所包含图片的主颜色与给定图片的主颜色相同的分组;
匹配单元,用于将所述查找单元查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
本申请实施例提供一种近重复图片查找装置,该装置包括:
第一分组单元,用于将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
向量确定单元,用于对于所述多个分组中的各分组,确定该分组中图片的颜色特征向量;
第二分组单元,用于对于所述多个分组中的各分组,利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片划分为多个分组;
查找单元,用于从所述第二分组单元分组后的各分组中查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组;
匹配单元,用于将所述查找单元查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
本申请实施例提供一种近重复图片查找装置,该装置包括:
向量确定单元,用于确定多张待分组图片中各待分组图片的颜色特征向量;
分组单元,用于利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组;
查找单元,用于从所述多个分组中查找与给定图片的颜色特征向量的距离最近的分组;
匹配单元,用于将所述查找单元查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
本申请中,根据图片的主颜色和/或颜色特征向量将多张待分组图片进行分组,在各分组中查找所包含图片的主颜色与给定图片的主颜色相同和/或与给定图片的颜色特征向量的距离最近的分组,将查找到的分组中所包含的各图片与给定图片进行图像特征的匹配,将匹配结果满足设定的近重复图片判定条件的图片确定为给定图片的近重复图片。由于首先将多张待分组图片分组,在各分组中查找到满足一定条件的分组后,只将满足条件的分组中的图片与给定图片进行匹配,而不是将所有待分组图片均与给定图片进行匹配来确定给定图片的近重复图片,能够有效地提高查找给定图片的近重复图片的效率。
附图说明
图1为本申请实施例一的方法流程示意图;
图2为本申请实施例二的方法流程示意图;
图3为本申请实施例二中建立的图片签名树的结构示例图;
图4为本申请实施例三的方法流程示意图;
图5为本申请实施例提供的一种装置的结构示意图;
图6为本申请实施例提供的另一种装置的结构示意图;
图7为本申请实施例提供的又一种装置的结构示意图。
具体实施方式
为了以较高的效率实现从多张图片中查找到与给定图片为近重复图片的图片,本申请实施例提供图片查找方法,该方法中,根据图片的主颜色和/或颜色特征向量将多张待分组图片进行分组,然后查找所包含图片的主颜色与给定图片的主颜色相同和/或与给定图片的颜色特征向量的距离最近的分组,最后将该分组中所包含的各图片与给定图片进行图像特征的匹配,将匹配成功的图片确定为给定图片的近重复图片。
图片的主颜色,是指该图片上对应像素点个数最多的颜色,具体确定方法可以为:首先,选择一种RGB空间作为颜色空间,将该颜色空间量化到M种颜色;然后,统计量化后的每种颜色在图片上对应的像素点个数;最后,选择像素点个数最多的颜色作为该图片的主颜色。这里,M的取值为大于1的整数,例如512、256、1024等。颜色空间是指,为了使各种颜色能按照一定的排列次序并容纳在一个空间内,将三维坐标轴与颜色的三个独立参数对应起来,使每一个颜色都有一个对应的空间位置,反过来,在空间中的任何一点都代表一个特定的颜色,将这个空间称为颜色空间。
图片的颜色特征向量,是指一种或多种颜色在该图片上对应像素点个数构成的向量。图片的颜色特征向量的确定方法可以为:
首先,将图片划分为N块;然后,对于划分后N块中的每一块,统计该块上设定种颜色对应的像素点个数;最后,将统计得到的各像素点个数构成的向量确定为该图片的颜色特征向量。这里,N的取值为大于1的整数,例如9、4、16等。设定种颜色可以是一种或多种颜色,例如红、黄、蓝三基色,也可以是量化后的M种颜色中的一种或多种颜色。
图片的颜色特征向量的确定方法还可以为:直接统计图片上设定种颜色对应的像素点个数,将统计得到的各像素点个数构成的向量确定为该图片的颜色特征向量。
图片的图像特征,是指对该图片内容的描述信息。图片的图像特征可以有多种,例如,图片的颜色特征向量和/或图片的主颜色率等。图片的主颜色率的确定方法如下:首先,将选定的颜色空间量化到M种颜色,M为大于1的整数;然后,统计该图片上M种颜色中各颜色对应的像素点个数,计算统计得到的最大像素点个数占该图片上像素点个数总和的比例,将计算结果作为该图片的主颜色率。
本申请实施例提供的图片查找方法具体包括以下三种实施例:
实施例一:
本实施例中,根据图片的主颜色将多张待分组图片进行分组,参见图1,具体包括以下步骤:
步骤10:将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
步骤11:从多个分组中查找所包含图片的主颜色与给定图片的主颜色相同的分组;
步骤12:将查找到的分组中所包含图片的图像特征与给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为给定图片的近重复图片。
步骤12中,在将查找到的分组中所包含图片的图像特征与给定图片的图像特征进行匹配之前,需要提取查找到的分组中所包含图片和给定图片中各图片的主颜色率和/或颜色特征向量等作为该图片的图像特征。
近重复图片判定条件可以有以下两种:
第一种,给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离为0,并且给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的主颜色率门限值;主颜色率门限值在0到1之间取值。
第二种,给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离小于设定的距离门限值、以及给定图片和查找到的分组中图片的主颜色率均小于设定的第一主颜色率门限值、并且给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的第二主颜色率门限值。距离门限值的取值为大于0的自然数,第一主颜色率门限值和第二主颜色率门限值在0到1之间取值,并且第一主颜色率门限值大于第二主颜色率门限值。
下面结合具体计算机应用对本实施例进行说明:
步骤a1:将数据库中存储的多张待分组图片读取到内存中;
步骤a2:对读取到内存中的每一张待分组图片,确定该图片的主颜色;
根据图片的主颜色将将读入内存的多张待分组图片划分为多个分组,同一分组中图片的主颜色相同,将每一个分组存储在硬盘上不同的分组数据库中,并建立主颜色标识与分组数据库地址的对应关系表A;
计算每一张待分组图片的图像特征,建立图片标识与图像特征的对应关系表B,将对应关系表A和B存放在硬盘上;
步骤a3:将给定图片和对应关系表A、B读入内存;
确定给定图片的主颜色,从对应关系表A中查找给定图片的主颜色的标识对应的分组数据库地址,从硬盘上读取该分组数据库地址对应的分组数据库中保存的所有图片到内存;
步骤a4:从对应关系表B中查找从分组数据库中读取到的各个图片的标识对应的图像特征,将给定图片的图像特征分别与查找到各个图像特征分别进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图像特征对应的图片,确定为给定图片的近重复图片。
实施例二:
本实施例中,根据图片的主颜色和颜色特征向量将多张待分组图片进行分组,参见图2,具体包括以下步骤:
步骤20:将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
步骤21:对于多个分组中的各分组,确定该分组中图片的颜色特征向量,利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片分为多组;
步骤22:从多组中查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组;
步骤23:将查找到的分组中所包含图片的图像特征与给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为给定图片的近重复图片。
步骤21中,利用聚类算法按照一分组中各图片的颜色特征向量间的距离,将该分组中的图片分为多组,假设该分组为分组A,其具体实现方法如下:
步骤S01:将分组A作为当前图片分组,将当前图片分组中图片的主颜色设置为图片签名树的子树的根节点,将该根节点作为当前父节点;
步骤S02:利用聚类算法按照当前图片分组中各图片的颜色特征向量间的距离,将当前图片分组中各图片的颜色特征向量分为K组,K为大于1的整数;
步骤S03:对于K组中的每一组,若该组不满足设定的分组停止条件,则到步骤S04,否则,到步骤S05;
步骤S04:将该组中各颜色特征向量的聚类中心设置为当前父节点的子节点,并将该分组作为当前图片分组,将所述子节点作为当前父节点,返回步骤S02;
步骤S05:将该组中各颜色特征向量对应的图片设置为当前父节点的子节点,并将该子节点所包含各图片构成的分组,确定为利用聚类算法按照分组A中各图片的颜色特征向量间的距离,将分组A中的图片分为多组后的一个分组。
步骤S02中,聚类算法是一种将多个同类元素进行分组的算法,具体的,将给定的一个有N个元素的数据集分成K组,分组后每一个分组至少包含一个元素,且每一个元素属于且仅属于一个分组。对于给定的K,算法首先给出一个初始的分组方法,以后通过反复迭代的方法将上一次的分组继续进行分组,使得本次的分组结果较之前一次的分组结果好,好的标准是:同一分组中元素的距离越来越近,而不同分组中元素的距离越来越远。聚类算法有K-MEANS算法、GCS算法等。本申请中是利用聚类算法将图片的颜色特征向量进行分组,两个颜色特征向量的距离是指该两个颜色特征向量的分量差的平方和,例如,向量A为(a1,b1,c1),向量B为(a2,b2,c2),则向量A和向量B的距离为(a1-a2)2+(b1-b2)2+(c1-c2)2
步骤S03中,分组停止条件可以有多种,举例说明,可以包括以下三种中的一种或任意组合:
第一种,分组中包含的颜色特征向量的个数小于设定的向量数门限值,该向量数门限值为大于1的整数;
第二种,分组中各颜色特征向量到该分组中各颜色特征向量的聚类中心的距离均小于设定的距离门限值,该距离门限值为不小于0的自然数;
第三种,分组的分裂次数超过设定的分裂数门限值,分组的分裂次数是指从待分组图片到得到该分组的时间段内执行分组操作的次数。分裂数门限值的取值为不小于1的整数。
步骤S04中,分组的聚类中心是根据该分组中所包含的所有颜色特征向量确定的另一颜色特征向量,该颜色特征向量到该分组中所包含的所有颜色特征向量的距离小于其它分组中任意一个颜色特征向量到该分组中所包含的所有颜色特征向量的距离。
步骤22中,从当前各分组中查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组,其实现方法如下:
步骤S11:在上述建立的图片签名树中查找根节点为给定图片的主颜色的子树,将该子树的根节点作为当前父节点;
步骤S12:在所述子树中查找当前父节点的子节点,对于查找到的各子节点,若该子节点为中间节点,则到步骤S13;若该子节点为叶子节点,则到步骤S14;
步骤S13:判断该中间节点的颜色特征向量与给定图片的颜色特征向量的距离是否满足设定条件,若是,则将该中间节点作为当前父节点,返回步骤S12,否则,停止查找操作;
步骤S14:将该叶子节点所包含各图片构成的分组,确定为所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组。
步骤S13中,设定条件可以为以下两种:
第一种,该中间节点的颜色特征向量与给定图片的颜色特征向量的距离小于预先设定的距离阈值,该距离阈值的取值为大于0的自然数;
第二种,该中间节点的颜色特征向量与给定图片的颜色特征向量的距离为查找到的各中间节点的颜色特征向量与给定图片的颜色特征向量的距离中的最小值。例如查找到当前父节点的4个中间节点,该4个中间节点的颜色特征向量与给定图片的颜色特征向量的距离分别为1、2、3和4,则确定距离为1的中间节点为符合设定条件的节点。
步骤23中,在将查找到的分组中所包含图片的图像特征与给定图片的图像特征进行匹配之前,需要提取查找到的分组中所包含图片和给定图片中各图片的主颜色率和/或颜色特征向量等作为该图片的图像特征。近重复图片判定条件与步骤12中的近重复图片判定条件相同,这里不再赘述。
下面以具体实例对上述方法进行说明:
假设待分组图片包含10张图片,建立这10张图片的图片签名树即将这10张图片进行分组的流程如下:
步骤S21:将待分组图片分为2组,每组中包含5张图片,第1组所包含图片的主颜色均为红色,第2组所包含图片的主颜色均为蓝色;确定每组中各图片的颜色特征向量;
步骤S22:将步骤S21中分组后的第1组中图片的主颜色设置为图片签名树的一个子树的根节点,将该根节点作为当前父节点;利用聚类算法按照第1组中各图片的颜色特征向量间的距离,将第1组中各图片的颜色特征向量分为2组,分组后第1组中包含2个图片的颜色特征向量,第2组中包含3个图片的颜色特征向量;
步骤S23:对于步骤S22中分组后的第1组,由于该组满足设置的分组停止条件:向量的数目小于3,将第1组包含的2个图片的主颜色率和颜色特征向量设置为当前父节点的子节点;对于步骤S22中分组后的第2组,该组不满足设置的分组停止条件,将第2组中3个颜色特征向量的聚类中心设置为当前父节点的子节点,将该子节点作为当前父节点;
步骤S24:对于步骤S22中分组后的第2组,利用聚类算法按照该组中各图片的颜色特征向量间的距离,将该组中各图片的颜色特征向量分为2组,分组后第1组中包含1个图片的颜色特征向量,第2组中包含2个图片的颜色特征向量;
步骤S25:对于步骤S24中分组后的2组,由于这2组均满足设置的分组停止条件:向量的数目小于3,将第1组包含的1个图片的主颜色率和颜色特征向量设置为当前父节点的一个子节点,将第2组包含的2个图片的主颜色率和颜色特征向量设置为当前父节点的另一个子节点;
步骤S26:将步骤S21中分组后的第2组中图片的主颜色设置为图片签名树的一个子树的根节点,将该根节点作为当前父节点;利用聚类算法按照第2组中各图片的颜色特征向量间的距离,将第2组中各图片的颜色特征向量分为2组,分组后第1组中包含1个图片的颜色特征向量,第2组中包含4个图片的颜色特征向量;
步骤S27:对于步骤S26中分组后的第1组,由于该组满足设置的分组停止条件:向量的数目小于3,将第1组包含的1个图片的主颜色率和颜色特征向量设置为当前父节点的子节点;对于步骤S26中分组后的第2组,该组不满足设置的分组停止条件,将第2组中4个颜色特征向量的聚类中心设置为当前父节点的子节点,将该子节点作为当前父节点;
步骤S28:对于步骤S26中分组后的第2组,利用聚类算法按照该组中各图片的颜色特征向量间的距离,将该组中4个图片的颜色特征向量分为2组,分组后第1组中包含2个图片的颜色特征向量,第2组中也包含2个图片的颜色特征向量;
步骤S29:对于步骤S28中分组后的2组,由于这2组均满足设置的分组停止条件:向量的数目小于3,将第1组包含的2个图片的主颜色率和颜色特征向量设置为当前父节点的一个子节点,将第2组包含的2个图片的主颜色率和颜色特征向量设置为当前父节点的另一个子节点。
至此,10个待分组图片的图片签名树建立完毕,如图3所示,由于该图片签名树具有6个叶子节点,因此,10个待分组图片被分为6组。
现需要从如图3所示的图片签名树中查找到一主颜色为红色的给定图片的近重复图片,具体实现流程如下:
步骤S31:在图片签名树中查找根节点为红色的子树,将查找到的子树的根节点作为当前父节点;
步骤S32:查找当前父节点的子节点,查找到2个子节点,其中一个字节点为中间节点,另一个子节点为叶子节点;
步骤S33:对于步骤S32中查找到的叶子节点,将该叶子节点中各图片的图像特征与给定图片的图像特征进行匹配,匹配发现给定图片的颜色特征向量与该叶子节点中一个图片的颜色特征向量的距离为0,并且给定图片的主颜色率与叶子节点中该图片的主颜色率之差小于设定的主颜色率门限值,将叶子节点中的该图片确定为查找到给定图片的近重复图片;
步骤S34:对于步骤S32中查找到的中间节点,判断该中间节点的颜色特征向量与给定图片的颜色特征向量的距离不满足设定条件:该距离小于设定的距离门限值,不在继续查找。
下面结合具体计算机应用对本实施例进行说明:
步骤b1:将数据库中存储的多张待分组图片读取到内存中;
步骤b2:对读取到内存中的每一张待分组图片,计算每一张待分组图片的图像特征,建立图片标识与图像特征的对应关系表A,将对应关系表A存放在硬盘上;
步骤b3:根据图片的主颜色将读入内存的多张待分组图片划分为多个分组,同一分组中图片的主颜色相同;
对于各个分组,根据步骤S01~步骤S05的算法,建立图片签名树;将建立的图片签名树保存在硬盘上;
步骤b4:将给定图片、对应关系表A和图片签名树读入内存;
从对应关系表A中查找给定图片的标识对应的图像特征;根据步骤S11~步骤S14的算法,在硬盘上保存的图片签名树中查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的叶子节点,将该叶子节点中的图片读入内存;
步骤b5:从对应关系表A中查找上一步骤从叶子节点读入内存的各个图片的标识对应的图像特征,将给定图片的图像特征分别与查找到的各个图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图像特征对应的图片,确定为给定图片的近重复图片。
实施例三:
本实施例中,根据图片的颜色特征向量将多张待分组图片进行分组,参见图4,具体包括以下步骤:
步骤40:确定多张待分组图片中各待分组图片的颜色特征向量;
步骤41:利用聚类算法按照多张待分组图片的颜色特征向量间的距离,将多张待分组图片划分为多个分组;
步骤42:从多个分组中查找与给定图片的颜色特征向量的距离最近的分组;
步骤43:将查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
步骤41中,利用聚类算法按照多张待分组图片的颜色特征向量间的距离,将多张待分组图片划分为多个分组,其实现方法可以如下:
步骤S41:设置图片签名树的根节点,并将该根节点作为当前父节点;将多张待分组图片构成的分组作为当前图片分组;
步骤S42:利用聚类算法按照当前图片分组中各图片的颜色特征向量间的距离,将当前图片分组中各图片的颜色特征向量分为K组,K为大于1的整数;
步骤S43:对于K组中的每一组,若该组不满足设定的分组停止条件,则到步骤S44,否则,到步骤S45;
步骤S44:将该组中各颜色特征向量的聚类中心设置为当前父节点的子节点,并将该分组作为当前图片分组,将所述子节点作为当前父节点,返回步骤S42;
步骤S45:将该组中各颜色特征向量对应的图片设置为当前父节点的子节点,并将该子节点所包含各图片构成的分组,确定为利用聚类算法按照多张待分组图片的颜色特征向量间的距离,将多张待分组图片划分为多个分组后的一个分组。
步骤S43中,分组停止条件与步骤S03中的分组停止条件相同,这里不再赘述。
步骤42中,从多个分组中查找与给定图片的颜色特征向量的距离最近的分组,其实现方法如下:
步骤S51:将建立的图片签名树的根节点作为当前父节点;
步骤S52:在图片签名树中查找当前父节点的子节点,对于查找到的各子节点,若该子节点为中间节点,则到步骤S53;若该子节点为叶子节点,则到步骤S54;
步骤S53:判断该中间节点的颜色特征向量与给定图片的颜色特征向量的距离是否满足设定条件,若是,则将该中间节点作为当前父节点,返回步骤S52,否则,停止查找操作;
步骤S54:将该叶子节点所包含各图片构成的分组,确定为与给定图片的颜色特征向量的距离最近的分组。
步骤S53中,设定条件与步骤S13中的设定条件相同,这里不再赘述。
步骤43中,在将查找到的分组中所包含图片的图像特征与给定图片的图像特征进行匹配之前,需要提取查找到的分组中所包含图片和给定图片中各图片的主颜色率和/或颜色特征向量等作为该图片的图像特征。近重复图片判定条件与步骤12中的近重复图片判定条件相同,这里不再赘述。
下面结合具体计算机应用对本实施例进行说明:
步骤c1:将数据库中存储的多张待分组图片读取到内存中;
步骤b2:对读取到内存中的每一张待分组图片,计算每一张待分组图片的图像特征,建立图片标识与图像特征的对应关系表A,将对应关系表A存放在硬盘上;
步骤b3:根据步骤S41~步骤S45的算法,建立图片签名树;将建立的图片签名树保存在硬盘上;
步骤b4:将给定图片、对应关系表A和图片签名树读入内存;
从对应关系表A中查找给定图片的标识对应的图像特征;根据步骤S51~步骤S54的算法,在硬盘上保存的图片签名树中查找与给定图片的颜色特征向量的距离最近的叶子节点,将该叶子节点中的图片读入内存;
步骤b5:从对应关系表A中查找上一步骤读入内存的各个图片的标识对应的图像特征,将给定图片的图像特征分别与查找到的各个图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图像特征对应的图片,确定为给定图片的近重复图片。
下面举例说明本申请的具体应用场景:
步骤c1:用户将输入的给定图片或通过互联网搜索到的给定图片提交给客户端的近重复图片查找系统;
步骤c2:近重复图片查找系统按照实施例一~实施例三中的方法连入互联网的服务器上搜索给定图片的近重复图片,连入互联网的服务器中保存有按照实施例一~实施例三中的方法建立的图片签名树;
步骤c3:近重复图片查找系统将搜索到的近重复图片返回并展现在用户所在的客户端上。
参见图5,本申请实施例提供一种图片查找装置,该装置包括:
分组单元50,用于将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
查找单元51,用于从所述多个分组中查找所包含图片的主颜色与给定图片的主颜色相同的分组;
匹配单元52,用于将所述查找单元查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
所述近重复图片判定条件包括:
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离为0,并且所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的主颜色率门限值;或者,
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离小于设定的距离门限值、以及所述给定图片和查找到的分组中图片的主颜色率均小于设定的第一主颜色率门限值、并且所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的第二主颜色率门限值。
参见图6,本申请实施例还提供一种图片查找装置,该装置包括:
第一分组单元60,用于将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
向量确定单元61,用于对于所述多个分组中的各分组,确定该分组中图片的颜色特征向量;
第二分组单元62,用于对于所述多个分组中的各分组,利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片划分为多个分组;
查找单元63,用于从所述第二分组单元分组后的各分组中查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组;
匹配单元64,用于将所述查找单元查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
所述第二分组单元62包括:
子树建立单元,用于对于所述多个分组中的各分组,将该分组作为当前图片分组及第一分组,将当前图片分组中图片的主颜色设置为图片签名树的子树的根节点,将该根节点作为当前父节点,触发聚类分组单元;
聚类分组单元,用于利用聚类算法按照当前图片分组中各图片的颜色特征向量间的距离,将当前图片分组中各图片的颜色特征向量分为K组,K为大于1的整数,触发递归建立单元;
递归建立单元,用于对于K组中的每一组,判断该组是否满足设定的分组停止条件,若是,则触发叶子节点建立单元;否则,触发中间节点建立单元;
中间节点建立单元,用于将该组中各颜色特征向量的聚类中心设置为当前父节点的子节点,并将该分组作为当前图片分组,将所述子节点作为当前父节点,触发聚类分组单元;
叶子节点建立单元,用于将该组中各颜色特征向量对应的图片设置为当前父节点的子节点,并将该子节点所包含各图片构成的分组,确定为利用聚类算法按照第一分组中各图片的颜色特征向量间的距离,将第一分组中的图片划分为多个分组后的一个分组。
所述分组停止条件包括以下三种中的一种或任意组合:
分组中包含的颜色特征向量的个数小于设定的向量数门限值;
分组中各颜色特征向量到该分组中各颜色特征向量的聚类中心的距离均小于设定的距离门限值;
分组的分裂次数超过设定的分裂数门限值,所述分组的分裂次数是从所述待分组图片到得到该分组的时间段内执行分组操作的次数。
所述查找单元63包括:
第一查找单元,用于在所述图片签名树中查找根节点为给定图片的主颜色的子树,将所述子树的根节点作为当前父节点;
第二查找单元,用于在所述子树中查找当前父节点的子节点,对于查找到的各子节点,若该子节点为中间节点,则触发中间节点处理单元;若该子节点为叶子节点,则触发叶子节点处理单元;
中间节点处理单元,用于判断该中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离是否满足设定条件,若是,则将该中间节点作为当前父节点,触发第二查找单元,否则,停止查找操作;
叶子节点处理单元,用于将该叶子节点所包含各图片构成的分组,确定为所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组。
所述设定条件为:所述距离小于预先设定的距离阈值;或者,所述距离为查找到的各中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离中的最小值。
所述近重复图片判定条件包括:
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离为0,以及所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的主颜色率门限值;或者,
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离小于设定的距离门限值,以及所述给定图片和查找到的分组中图片的主颜色率均小于设定的第一主颜色率门限值、并且所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的第二主颜色率门限值。
参见图7,本申请实施例还提供一种图片查找装置,该装置包括:
向量确定单元70,用于确定多张待分组图片中各待分组图片的颜色特征向量;
分组单元71,用于利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组;
查找单元72,用于从所述多个分组中查找与给定图片的颜色特征向量的距离最近的分组;
匹配单元73,用于将所述查找单元查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
所述分组单元71包括:
初始化单元,用于设置图片签名树的根节点,并将该根节点作为当前父节点;将所述多张待分组图片构成的分组作为当前图片分组;
聚类分组单元,用于利用聚类算法按照当前图片分组中各图片的颜色特征向量间的距离,将当前图片分组中各图片的颜色特征向量分为K组,K为大于1的整数;
递归建立单元,用于对于K组中的每一组,判断该组是否满足设定的分组停止条件,若是,则触发叶子节点建立单元;否则,触发中间节点建立单元;
中间节点建立单元,用于将该组中各颜色特征向量的聚类中心设置为当前父节点的子节点,并将该分组作为当前图片分组,将所述子节点作为当前父节点,触发聚类分组单元;
叶子节点建立单元,用于将该组中各颜色特征向量对应的图片设置为当前父节点的子节点,并将该子节点所包含各图片构成的分组,确定为利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组后的一个分组。
分组停止条件包括以下三种中的一种或任意组合:
分组中包含的颜色特征向量的个数小于设定的向量数门限值;
分组中各颜色特征向量到该分组中各颜色特征向量的聚类中心的距离均小于设定的距离门限值;
分组的分裂次数超过设定的分裂数门限值,所述分组的分裂次数是从所述待分组图片到得到该分组的时间段内执行分组操作的次数。
所述查找单元72包括:
第一查找单元,用于将所述图片签名树的根节点作为当前父节点,在所述图片签名树中查找当前父节点的子节点,对于查找到的各子节点,若该子节点为中间节点,则触发中间节点处理单元;若该子节点为叶子节点,则触发叶子节点处理单元;
中间节点处理单元,用于判断该中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离是否满足设定条件,若是,则将该中间节点作为当前父节点,触发第一查找单元,否则,停止查找操作;
叶子节点处理单元,用于将该叶子节点所包含各图片构成的分组,确定为与给定图片的颜色特征向量的距离最近的分组。
所述设定条件为:所述距离小于预先设定的距离阈值;或者,所述距离为查找到的各中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离中的最小值。
所述近重复图片判定条件包括:
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离为0,以及所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的主颜色率门限值;或者,
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离小于设定的距离门限值,以及所述给定图片和查找到的分组中图片的主颜色率均小于设定的第一主颜色率门限值、并且所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的第二主颜色率门限值。
综上,本申请的有益效果包括:
本申请实施例提供的方案中,首先根据图片的主颜色和/或颜色特征向量将多张待分组图片进行分组,然后,在各分组中查找所包含图片的主颜色与给定图片的主颜色相同和/或与给定图片的颜色特征向量的距离最近的分组,最后,只将查找到的分组中所包含的各图片与给定图片进行图像特征的匹配,将匹配结果满足设定的近重复图片判定条件的图片确定为给定图片的近重复图片。由于首先将多张待分组图片分组,在各分组中查找到满足一定条件的分组后,只将满足条件的分组中的图片与给定图片进行匹配,从而确定给定图片的近重复图片,而不是将所有待分组图片均与给定图片进行匹配来确定给定图片的近重复图片,能够有效地提高查找给定图片的近重复图片的效率。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (38)

1、一种近重复图片的计算机查找方法,其特征在于,该方法包括:
读取数据库中存储的多张待分组图片;
将读取的所述多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;将每一个分组图片存储在不同的分组数据库中;
读取给定图片;查找所存储图片的主颜色与给定图片的主颜色相同的分组数据库,并读取查找到的分组数据库中的图片;
将从分组数据库中读取的图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
2、如权利要求1所述的方法,其特征在于,所述给定图片为用户输入的图片或用户通过互联网搜索得到的图片。
3、如权利要求1所述的方法,其特征在于,在将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片之后,该方法进一步包括:
将所述近重复图片展现给用户。
4、一种近重复图片的计算机查找方法,其特征在于,该方法包括:
读取数据库中存储的多张待分组图片;
将读取的多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;对于所述多个分组中的各分组,确定该分组中图片的颜色特征向量,利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片划分为多个分组,并将该多个分组进行储存;
读取给定图片;查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组,并读取该分组中的图片;
将所述读取的图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
5、如权利要求4所述的方法,其特征在于,所述利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片划分为多个分组并将该多个分组进行储存包括:
A1、将该分组作为当前图片分组及第一分组,将当前图片分组中图片的主颜色设置为图片签名树的子树的根节点,将该根节点作为当前父节点;
B1、利用聚类算法按照当前图片分组中各图片的颜色特征向量间的距离,将当前图片分组中各图片的颜色特征向量分为K组,K为大于1的整数;
C1、对于K组中的每一组,若该组不满足设定的分组停止条件,则到步骤D1,否则,到步骤E1;
D1、将该组中各颜色特征向量的聚类中心设置为当前父节点的子节点,并将该分组作为当前图片分组,将所述子节点作为当前父节点,返回步骤B1;
E1、将该组中各颜色特征向量对应的图片设置为当前父节点的子节点,并将该子节点所包含各图片构成的分组,确定为利用聚类算法按照第一分组中各图片的颜色特征向量间的距离,将第一分组中的图片划分为多个分组后的一个分组;
F1、将建立的图片签名树进行储存。
6、如权利要求5所述的方法,其特征在于,所述查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组包括:
A2、在所述存储的图片签名树中查找根节点为给定图片的主颜色的子树,将所述子树的根节点作为当前父节点;
B2、在所述子树中查找当前父节点的子节点,对于查找到的各子节点,若该子节点为中间节点,则到步骤C2;若该子节点为叶子节点,则到步骤D2;
C2、判断该中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离是否满足设定条件,若是,则将该中间节点作为当前父节点,返回步骤B2,否则,停止查找操作;
D2、将该叶子节点所包含各图片构成的分组,确定为所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组。
7、如权利要求4所述的方法,其特征在于,所述给定图片为用户输入的图片或用户通过互联网搜索得到的图片。
8、如权利要求4所述的方法,其特征在于,在将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片之后,该方法进一步包括:
将所述近重复图片展现给用户。
9、一种近重复图片的计算机查找方法,其特征在于,该方法包括:
读取多张待分组图片;
确定读取的各待分组图片的颜色特征向量;利用聚类算法按照读入内存的多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组,并将该多个分组进行储存;
读取给定图片;查找与所述给定图片的颜色特征向量的距离最近的分组,并读取所述查找到的分组中的图片;
将所述读取的图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
10、如权利要求9所述的方法,其特征在于,所述利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片分为多个分组并将该多个分组进行储存包括:
A1、设置图片签名树的根节点,并将该根节点作为当前父节点;将所述多张待分组图片构成的分组作为当前图片分组;
B1、利用聚类算法按照当前图片分组中各图片的颜色特征向量间的距离,将当前图片分组中各图片的颜色特征向量分为K组,K为大于1的整数;
C1、对于K组中的每一组,若该组不满足设定的分组停止条件,则到步骤D1,否则,到步骤E1;
D1、将该组中各颜色特征向量的聚类中心设置为当前父节点的子节点,并将该分组作为当前图片分组,将所述子节点作为当前父节点,返回步骤B1;
E1、将该组中各颜色特征向量对应的图片设置为当前父节点的子节点,并将该子节点所包含各图片构成的分组,确定为利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组后的一个分组;
F1、将建立的图片签名树进行存储。
11、如权利要求10所述的方法,其特征在于,所述查找与给定图片的颜色特征向量的距离最近的分组包括:
A2、将所述存储的图片签名树的根节点作为当前父节点;
B2、在所述图片签名树中查找当前父节点的子节点,对于查找到的各子节点,若该子节点为中间节点,则到步骤C2;若该子节点为叶子节点,则到步骤D2;
C2、判断该中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离是否满足设定条件,若是,则将该中间节点作为当前父节点,返回步骤B2,否则,停止查找操作;
D2、将该叶子节点所包含各图片构成的分组,确定为与给定图片的颜色特征向量的距离最近的分组。
12、如权利要求9所述的方法,其特征在于,所述给定图片为用户输入的图片或用户通过互联网搜索得到的图片。
13、如权利要求9所述的方法,其特征在于,在将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片之后,该方法进一步包括:
将所述近重复图片展现给用户。
14、一种近重复图片查找方法,其特征在于,该方法包括:
将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
从所述多个分组中查找所包含图片的主颜色与给定图片的主颜色相同的分组;
将查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
15、如权利要求14所述的方法,其特征在于,所述近重复图片判定条件包括:
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离为0,并且所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的主颜色率门限值;或者,
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离小于设定的距离门限值、以及所述给定图片和查找到的分组中图片的主颜色率均小于设定的第一主颜色率门限值、并且所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的第二主颜色率门限值。
16、一种近重复图片查找方法,其特征在于,该方法包括:
将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
对于所述多个分组中的各分组,确定该分组中图片的颜色特征向量,利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片划分为多个分组;
从当前各分组中查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组;
将查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
17、如权利要求16所述的方法,其特征在于,所述确定该分组中图片的颜色特征向量包括:
将所述图片划分为N块,N为大于1的整数;
对于所述N块中的每一块,统计该块上设定种颜色对应的像素点个数;
将统计得到的各像素点个数构成的向量确定为所述图片的颜色特征向量。
18、如权利要求16所述的方法,其特征在于,所述利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片划分为多个分组包括:
A1、将该分组作为当前图片分组及第一分组,将当前图片分组中图片的主颜色设置为图片签名树的子树的根节点,将该根节点作为当前父节点;
B1、利用聚类算法按照当前图片分组中各图片的颜色特征向量间的距离,将当前图片分组中各图片的颜色特征向量分为K组,K为大于1的整数;
C1、对于K组中的每一组,若该组不满足设定的分组停止条件,则到步骤D1,否则,到步骤E1;
D1、将该组中各颜色特征向量的聚类中心设置为当前父节点的子节点,并将该分组作为当前图片分组,将所述子节点作为当前父节点,返回步骤B1;
E1、将该组中各颜色特征向量对应的图片设置为当前父节点的子节点,并将该子节点所包含各图片构成的分组,确定为利用聚类算法按照第一分组中各图片的颜色特征向量间的距离,将第一分组中的图片划分为多个分组后的一个分组。
19、如权利要求18所述的方法,其特征在于,所述步骤C1中分组停止条件包括以下三种中的一种或任意组合:
分组中包含的颜色特征向量的个数小于设定的向量数门限值;
分组中各颜色特征向量到该分组中各颜色特征向量的聚类中心的距离均小于设定的距离门限值;
分组的分裂次数超过设定的分裂数门限值,所述分组的分裂次数是从所述待分组图片到得到该分组的时间段内执行分组操作的次数。
20、如权利要求18所述的方法,其特征在于,所述从当前各分组中查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组包括:
A2、在所述图片签名树中查找根节点为给定图片的主颜色的子树,将所述子树的根节点作为当前父节点;
B2、在所述子树中查找当前父节点的子节点,对于查找到的各子节点,若该子节点为中间节点,则到步骤C2;若该子节点为叶子节点,则到步骤D2;
C2、判断该中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离是否满足设定条件,若是,则将该中间节点作为当前父节点,返回步骤B2,否则,停止查找操作;
D2、将该叶子节点所包含各图片构成的分组,确定为所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组。
21、如权利要求20所述的方法,其特征在于,所述步骤C2中设定条件为:
所述距离小于预先设定的距离阈值;或者,
所述距离为查找到的各中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离中的最小值。
22、如权利要求16所述的方法,其特征在于,在将查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配之前,该方法进一步包括:
将选定的颜色空间量化到M种颜色,M为大于1的整数;
对于查找到的分组中所包含图片和所述给定图片中的各图片,统计该图片上M种颜色中各颜色对应的像素点个数,计算统计得到的最大像素点个数占该图片上像素点个数总和的比例,将计算结果作为该图片的主颜色率;将该主颜色率和/或该图片的颜色特征向量确定为该图片的图像特征。
23、如权利要求22所述的方法,其特征在于,所述近重复图片判定条件包括:
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离为0,以及所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的主颜色率门限值;或者,
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离小于设定的距离门限值,以及所述给定图片和查找到的分组中图片的主颜色率均小于设定的第一主颜色率门限值、并且所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的第二主颜色率门限值。
24、一种近重复图片查找方法,其特征在于,该方法包括:
确定多张待分组图片中各待分组图片的颜色特征向量;利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组;
从所述多个分组中查找与给定图片的颜色特征向量的距离最近的分组;
将查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
25、如权利要求24所述的方法,其特征在于,所述确定待分组图片的颜色特征向量包括:
将所述待分组图片划分为N块,N为大于1的整数;
对于所述N块中的每一块,统计该块上设定种颜色对应的像素点个数;
将统计得到的各像素点个数构成的向量确定为所述待分组图片的颜色特征向量。
26、如权利要求24所述的方法,其特征在于,所述利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片分为多个分组包括:
A1、设置图片签名树的根节点,并将该根节点作为当前父节点;将所述多张待分组图片构成的分组作为当前图片分组;
B1、利用聚类算法按照当前图片分组中各图片的颜色特征向量间的距离,将当前图片分组中各图片的颜色特征向量分为K组,K为大于1的整数;
C1、对于K组中的每一组,若该组不满足设定的分组停止条件,则到步骤D1,否则,到步骤E1;
D1、将该组中各颜色特征向量的聚类中心设置为当前父节点的子节点,并将该分组作为当前图片分组,将所述子节点作为当前父节点,返回步骤B1;
E1、将该组中各颜色特征向量对应的图片设置为当前父节点的子节点,并将该子节点所包含各图片构成的分组,确定为利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组后的一个分组。
27、如权利要求26所述的方法,其特征在于,所述步骤C1中分组停止条件包括以下三种中的一种或任意组合:
分组中包含的颜色特征向量的个数小于设定的向量数门限值;
分组中各颜色特征向量到该分组中各颜色特征向量的聚类中心的距离均小于设定的距离门限值;
分组的分裂次数超过设定的分裂数门限值,所述分组的分裂次数是从所述待分组图片到得到该分组的时间段内执行分组操作的次数。
28、如权利要求26所述的方法,其特征在于,所述从所述多个分组中查找与给定图片的颜色特征向量的距离最近的分组包括:
A2、将所述图片签名树的根节点作为当前父节点;
B2、在所述图片签名树中查找当前父节点的子节点,对于查找到的各子节点,若该子节点为中间节点,则到步骤C2;若该子节点为叶子节点,则到步骤D2;
C2、判断该中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离是否满足设定条件,若是,则将该中间节点作为当前父节点,返回步骤B2,否则,停止查找操作;
D2、将该叶子节点所包含各图片构成的分组,确定为与给定图片的颜色特征向量的距离最近的分组。
29、如权利要求28所述的方法,其特征在于,所述步骤C2中设定条件为:
所述距离小于预先设定的距离阈值;或者,
所述距离为查找到的各中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离中的最小值。
30、如权利要求24所述的方法,其特征在于,在将查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配之前,该方法进一步包括:
将选定的颜色空间量化到M种颜色,M为大于1的整数;
对于查找到的分组中所包含图片和所述给定图片中的各图片,统计该图片上M种颜色中各颜色对应的像素点个数,计算统计得到的最大像素点个数占该图片上像素点个数总和的比例,将计算结果作为该图片的主颜色率;将该主颜色率和/或该图片的颜色特征向量确定为该图片的图像特征。
31、如权利要求30所述的方法,其特征在于,所述近重复图片判定条件包括:
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离为0,以及所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的主颜色率门限值;或者,
所述给定图片的颜色特征向量与查找到的分组中图片的颜色特征向量的距离小于设定的距离门限值,以及所述给定图片和查找到的分组中图片的主颜色率均小于设定的第一主颜色率门限值、并且所述给定图片的主颜色率与查找到的分组中图片的主颜色率之差小于设定的第二主颜色率门限值。
32、一种近重复图片查找装置,其特征在于,该装置包括:
分组单元,用于将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
查找单元,用于从所述多个分组中查找所包含图片的主颜色与给定图片的主颜色相同的分组;
匹配单元,用于将所述查找单元查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
33、一种近重复图片查找装置,其特征在于,该装置包括:
第一分组单元,用于将多张待分组图片划分为多个分组,划分为多个分组后同一分组中图片的主颜色相同;
向量确定单元,用于对于所述多个分组中的各分组,确定该分组中图片的颜色特征向量;
第二分组单元,用于对于所述多个分组中的各分组,利用聚类算法按照该分组中各图片的颜色特征向量间的距离,将该分组中的图片划分为多个分组;
查找单元,用于从所述第二分组单元分组后的各分组中查找所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组;
匹配单元,用于将所述查找单元查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
34、如权利要求33所述的装置,其特征在于,所述第二分组单元包括:
子树建立单元,用于对于所述多个分组中的各分组,将该分组作为当前图片分组及第一分组,将当前图片分组中图片的主颜色设置为图片签名树的子树的根节点,将该根节点作为当前父节点,触发聚类分组单元;
聚类分组单元,用于利用聚类算法按照当前图片分组中各图片的颜色特征向量间的距离,将当前图片分组中各图片的颜色特征向量分为K组,K为大于1的整数,触发递归建立单元;
递归建立单元,用于对于K组中的每一组,判断该组是否满足设定的分组停止条件,若是,则触发叶子节点建立单元;否则,触发中间节点建立单元;
中间节点建立单元,用于将该组中各颜色特征向量的聚类中心设置为当前父节点的子节点,并将该分组作为当前图片分组,将所述子节点作为当前父节点,触发聚类分组单元;
叶子节点建立单元,用于将该组中各颜色特征向量对应的图片设置为当前父节点的子节点,并将该子节点所包含各图片构成的分组,确定为利用聚类算法按照第一分组中各图片的颜色特征向量间的距离,将第一分组中的图片划分为多个分组后的一个分组。
35、如权利要求34所述的装置,其特征在于,所述查找单元包括:
第一查找单元,用于在所述图片签名树中查找根节点为给定图片的主颜色的子树,将所述子树的根节点作为当前父节点;
第二查找单元,用于在所述子树中查找当前父节点的子节点,对于查找到的各子节点,若该子节点为中间节点,则触发中间节点处理单元;若该子节点为叶子节点,则触发叶子节点处理单元;
中间节点处理单元,用于判断该中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离是否满足设定条件,若是,则将该中间节点作为当前父节点,触发第二查找单元,否则,停止查找操作;
叶子节点处理单元,用于将该叶子节点所包含各图片构成的分组,确定为所包含图片的主颜色与给定图片的主颜色相同、并且与给定图片的颜色特征向量的距离最近的分组。
36、一种近重复图片查找装置,其特征在于,该装置包括:
向量确定单元,用于确定多张待分组图片中各待分组图片的颜色特征向量;
分组单元,用于利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组;
查找单元,用于从所述多个分组中查找与给定图片的颜色特征向量的距离最近的分组;
匹配单元,用于将所述查找单元查找到的分组中所包含图片的图像特征与所述给定图片的图像特征进行匹配,将匹配结果满足预先设定的近重复图片判定条件的图片确定为所述给定图片的近重复图片。
37、如权利要求36所述的装置,其特征在于,所述分组单元包括:
初始化单元,用于设置图片签名树的根节点,并将该根节点作为当前父节点;将所述多张待分组图片构成的分组作为当前图片分组;
聚类分组单元,用于利用聚类算法按照当前图片分组中各图片的颜色特征向量间的距离,将当前图片分组中各图片的颜色特征向量分为K组,K为大于1的整数;
递归建立单元,用于对于K组中的每一组,判断该组是否满足设定的分组停止条件,若是,则触发叶子节点建立单元;否则,触发中间节点建立单元;
中间节点建立单元,用于将该组中各颜色特征向量的聚类中心设置为当前父节点的子节点,并将该分组作为当前图片分组,将所述子节点作为当前父节点,触发聚类分组单元;
叶子节点建立单元,用于将该组中各颜色特征向量对应的图片设置为当前父节点的子节点,并将该子节点所包含各图片构成的分组,确定为利用聚类算法按照所述多张待分组图片的颜色特征向量间的距离,将所述多张待分组图片划分为多个分组后的一个分组。
38、如权利要求36所述的装置,其特征在于,所述查找单元包括:
第一查找单元,用于将所述图片签名树的根节点作为当前父节点,在所述图片签名树中查找当前父节点的子节点,对于查找到的各子节点,若该子节点为中间节点,则触发中间节点处理单元;若该子节点为叶子节点,则触发叶子节点处理单元;
中间节点处理单元,用于判断该中间节点的颜色特征向量与所述给定图片的颜色特征向量的距离是否满足设定条件,若是,则将该中间节点作为当前父节点,触发第一查找单元,否则,停止查找操作;
叶子节点处理单元,用于将该叶子节点所包含各图片构成的分组,确定为与给定图片的颜色特征向量的距离最近的分组。
CN2009101467265A 2009-06-16 2009-06-16 近重复图片的计算机查找方法和装置 Active CN101576932B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN2009101467265A CN101576932B (zh) 2009-06-16 2009-06-16 近重复图片的计算机查找方法和装置
HK10104500.3A HK1136892A1 (en) 2009-06-16 2010-05-10 Close-repetitive picture computer searching method and device
US12/802,815 US8611649B2 (en) 2009-06-16 2010-06-14 Method and system for near-duplicate image searching
PCT/US2010/001719 WO2010147644A1 (en) 2009-06-16 2010-06-15 Method and system for near-duplicate image searching
EP10789858.7A EP2443589B1 (en) 2009-06-16 2010-06-15 Method and system for near-duplicate image searching
JP2012516057A JP5463415B2 (ja) 2009-06-16 2010-06-15 準複製画像検索のための方法およびシステム
US14/080,537 US9405993B2 (en) 2009-06-16 2013-11-14 Method and system for near-duplicate image searching
JP2014007980A JP5797789B2 (ja) 2009-06-16 2014-01-20 準複製画像検索のための方法およびシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101467265A CN101576932B (zh) 2009-06-16 2009-06-16 近重复图片的计算机查找方法和装置

Publications (2)

Publication Number Publication Date
CN101576932A true CN101576932A (zh) 2009-11-11
CN101576932B CN101576932B (zh) 2012-07-04

Family

ID=41271866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101467265A Active CN101576932B (zh) 2009-06-16 2009-06-16 近重复图片的计算机查找方法和装置

Country Status (6)

Country Link
US (2) US8611649B2 (zh)
EP (1) EP2443589B1 (zh)
JP (2) JP5463415B2 (zh)
CN (1) CN101576932B (zh)
HK (1) HK1136892A1 (zh)
WO (1) WO2010147644A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207778A (zh) * 2012-01-13 2013-07-17 青岛海信移动通信技术股份有限公司 一种修饰图标的方法、装置和移动终端
CN103390165A (zh) * 2012-05-10 2013-11-13 北京百度网讯科技有限公司 一种图片聚类的方法及装置
CN104112284A (zh) * 2013-04-22 2014-10-22 阿里巴巴集团控股有限公司 一种图片的相似度检测方法和设备
CN104142946A (zh) * 2013-05-08 2014-11-12 阿里巴巴集团控股有限公司 一种同款业务对象聚合、搜索的方法和系统
CN105808645A (zh) * 2016-02-26 2016-07-27 北京金山安全软件有限公司 一种图片处理方法、装置及电子设备
CN103996217B (zh) * 2014-04-30 2017-01-04 王进 一种基于色彩聚类中心变换的场景主题优化与调色方法
CN108228844A (zh) * 2018-01-09 2018-06-29 美的集团股份有限公司 一种图片筛选方法及装置、存储介质、计算机设备
CN110019550A (zh) * 2017-12-15 2019-07-16 百度在线网络技术(北京)有限公司 数据仓库管理方法、装置及计算机设备
CN110019007A (zh) * 2017-10-30 2019-07-16 北京金风科创风电设备有限公司 数据处理方法及装置
US10459965B2 (en) 2013-12-02 2019-10-29 Samsung Electronics Co., Ltd. Method and apparatus for displaying images
CN110442738A (zh) * 2019-07-31 2019-11-12 北京明略软件系统有限公司 图片去重方法和装置,存储介质及电子装置
CN111143581A (zh) * 2019-12-31 2020-05-12 汇医达(杭州)科技有限公司 一种用于期刊投稿、稿件筛选的数据箱系统

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8582872B1 (en) * 2011-06-30 2013-11-12 Google Inc. Place holder image detection via image clustering
US8750613B2 (en) 2011-12-13 2014-06-10 The Nielsen Company (Us), Llc Detecting objects in images using color histograms
US8897554B2 (en) 2011-12-13 2014-11-25 The Nielsen Company (Us), Llc Video comparison using color histograms
US8897553B2 (en) 2011-12-13 2014-11-25 The Nielsen Company (Us), Llc Image comparison using color histograms
US8995771B2 (en) * 2012-04-30 2015-03-31 Microsoft Technology Licensing, Llc Identification of duplicates within an image space
US9063954B2 (en) 2012-10-15 2015-06-23 Google Inc. Near duplicate images
EP2770446A4 (en) * 2012-12-28 2015-01-14 Huawei Tech Co Ltd DATA PROCESSING AND DEVICE
US9530072B2 (en) 2013-03-15 2016-12-27 Dropbox, Inc. Duplicate/near duplicate detection and image registration
US20150095305A1 (en) * 2013-09-30 2015-04-02 International Business Machines Corporation Detecting multistep operations when interacting with web applications
US9524447B2 (en) 2014-03-05 2016-12-20 Sizhe Tan Searching 2D image based on transformed 1D data matching
US20150254280A1 (en) * 2014-03-06 2015-09-10 Nec Laboratories America, Inc. Hybrid Indexing with Grouplets
US9558680B2 (en) * 2014-04-04 2017-01-31 Sizhe Tan Payload in picture encoding
CN104123736B (zh) * 2014-07-04 2017-02-15 北京思特奇信息技术股份有限公司 一种图片主色系获取方法及装置
JP6624062B2 (ja) * 2014-10-14 2019-12-25 日本電気株式会社 情報処理装置、情報処理方法、及び、プログラム
US9311342B1 (en) 2015-02-09 2016-04-12 Sony Corporation Tree based image storage system
US9430718B1 (en) 2015-02-09 2016-08-30 Sony Corporation Efficient local feature descriptor filtering
CN104866323B (zh) * 2015-06-11 2018-03-30 北京金山安全软件有限公司 一种解锁界面的生成方法、装置及电子设备
CN104866755B (zh) * 2015-06-11 2018-03-30 北京金山安全软件有限公司 应用程序解锁界面背景图片的设置方法、装置及电子设备
US11030453B2 (en) 2015-12-16 2021-06-08 Assa Abloy Ab Optical authentication of objects based on latent structural characteristics
CN106960211B (zh) * 2016-01-11 2020-04-14 北京陌上花科技有限公司 关键帧获取方法及装置
CN105488820B (zh) * 2016-02-25 2018-04-06 曹溯 颜色比对方法及装置
CN107818341A (zh) * 2017-10-25 2018-03-20 天津大学 一种基于改进K‑means算法的颜色提取方法
KR102424519B1 (ko) 2018-01-04 2022-07-26 삼성전자 주식회사 디스플레이장치 및 그 제어방법
CN109657083B (zh) * 2018-12-27 2020-07-14 广州华迅网络科技有限公司 纺织品图片特征库的建立方法和装置
US11216505B2 (en) * 2019-09-05 2022-01-04 Adobe Inc. Multi-resolution color-based image search
US11887217B2 (en) 2020-10-26 2024-01-30 Adobe Inc. Text editing of digital images

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0461817A3 (en) 1990-06-15 1993-11-18 American Telephone & Telegraph Image segmenting apparatus and methods
US5668897A (en) 1994-03-15 1997-09-16 Stolfo; Salvatore J. Method and apparatus for imaging, image processing and data compression merge/purge techniques for document image databases
EP1619875A1 (en) 1997-06-17 2006-01-25 Seiko Epson Corporation Image processing apparatus, image processing method, color adjustment method, and color adjusment system
US5983224A (en) 1997-10-31 1999-11-09 Hitachi America, Ltd. Method and apparatus for reducing the computational requirements of K-means data clustering
US6628824B1 (en) 1998-03-20 2003-09-30 Ken Belanger Method and apparatus for image identification and comparison
CN1178461C (zh) 1998-06-09 2004-12-01 松下电器产业株式会社 图像编码装置、图像译码装置、传真装置
US6285995B1 (en) * 1998-06-22 2001-09-04 U.S. Philips Corporation Image retrieval system using a query image
JP2000090239A (ja) 1998-09-10 2000-03-31 Matsushita Electric Ind Co Ltd 画像検索装置
EP1153366B1 (en) * 1999-02-05 2007-04-25 Samsung Electronics Co., Ltd. Color image processing method and apparatus thereof
JP4173246B2 (ja) 1999-04-28 2008-10-29 株式会社リコー 類似画像表示方法及び類似画像表示処理プログラムを格納した記録媒体
US7212667B1 (en) * 1999-05-17 2007-05-01 Samsung Electronics Co., Ltd. Color image processing method for indexing an image using a lattice structure
KR100436500B1 (ko) * 1999-05-17 2004-06-22 삼성전자주식회사 컬러 영상 처리 방법
EP1089198A3 (en) 1999-09-30 2003-03-12 Hewlett-Packard Company, A Delaware Corporation Content-based image searching
US6961463B1 (en) 2000-03-29 2005-11-01 Eastman Kodak Company Method of detecting duplicate pictures in an automatic albuming system
JP2002117037A (ja) * 2000-10-06 2002-04-19 Nec Corp 画像検索装置、並びに画像検索方法及びこれが書き込まれた記録媒体
US7046851B2 (en) 2000-11-08 2006-05-16 California Institute Of Technology Image and video indexing scheme for content analysis
KR100494080B1 (ko) * 2001-01-18 2005-06-13 엘지전자 주식회사 공간 밀착 성분을 이용한 대표 칼라 설정방법
JP4889159B2 (ja) 2001-05-14 2012-03-07 富士通株式会社 データ検索システムおよびデータ検索方法
JP4374902B2 (ja) 2003-05-16 2009-12-02 富士通株式会社 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
US7634472B2 (en) 2003-12-01 2009-12-15 Yahoo! Inc. Click-through re-ranking of images and other data
US7853582B2 (en) 2004-08-31 2010-12-14 Gopalakrishnan Kumar C Method and system for providing information services related to multimodal inputs
US8732025B2 (en) 2005-05-09 2014-05-20 Google Inc. System and method for enabling image recognition and searching of remote content on display
US7809722B2 (en) * 2005-05-09 2010-10-05 Like.Com System and method for enabling search and retrieval from image files based on recognized information
US7860319B2 (en) 2005-05-11 2010-12-28 Hewlett-Packard Development Company, L.P. Image management
WO2007004477A1 (ja) 2005-06-30 2007-01-11 Nec Corporation 画像識別システム及び方法
US7457825B2 (en) 2005-09-21 2008-11-25 Microsoft Corporation Generating search requests from multimodal queries
US7860308B2 (en) 2005-12-01 2010-12-28 Yahoo! Inc. Approach for near duplicate image detection
US7647331B2 (en) 2006-03-28 2010-01-12 Microsoft Corporation Detecting duplicate images using hash code grouping
US7813561B2 (en) * 2006-08-14 2010-10-12 Microsoft Corporation Automatic classification of objects within images
EP2375629B1 (en) 2006-08-16 2014-12-24 Huawei Technologies Co., Ltd. Method and apparatus for transmitting/receiving in emergency services
JP5015235B2 (ja) * 2007-03-27 2012-08-29 パナソニック株式会社 画像閲覧装置及び方法
US7941442B2 (en) * 2007-04-18 2011-05-10 Microsoft Corporation Object similarity search in high-dimensional vector spaces
JP5176483B2 (ja) 2007-10-30 2013-04-03 株式会社ニコン 画像認識装置、画像追尾装置および撮像装置
US8150098B2 (en) * 2007-12-20 2012-04-03 Eastman Kodak Company Grouping images by location
US8150170B2 (en) * 2008-05-30 2012-04-03 Microsoft Corporation Statistical approach to large-scale image annotation
CN101290634B (zh) * 2008-06-03 2010-07-28 北京搜狗科技发展有限公司 一种识别重复缩略图的方法、装置及在搜索引擎中的应用
CN101359366B (zh) * 2008-07-28 2011-11-16 同济大学 一种图形匹配识别系统及其实现方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207778A (zh) * 2012-01-13 2013-07-17 青岛海信移动通信技术股份有限公司 一种修饰图标的方法、装置和移动终端
CN103390165A (zh) * 2012-05-10 2013-11-13 北京百度网讯科技有限公司 一种图片聚类的方法及装置
CN103390165B (zh) * 2012-05-10 2017-08-22 北京百度网讯科技有限公司 一种图片聚类的方法及装置
CN104112284A (zh) * 2013-04-22 2014-10-22 阿里巴巴集团控股有限公司 一种图片的相似度检测方法和设备
CN104112284B (zh) * 2013-04-22 2017-10-13 阿里巴巴集团控股有限公司 一种图片的相似度检测方法和设备
CN104142946A (zh) * 2013-05-08 2014-11-12 阿里巴巴集团控股有限公司 一种同款业务对象聚合、搜索的方法和系统
US10459965B2 (en) 2013-12-02 2019-10-29 Samsung Electronics Co., Ltd. Method and apparatus for displaying images
CN103996217B (zh) * 2014-04-30 2017-01-04 王进 一种基于色彩聚类中心变换的场景主题优化与调色方法
CN105808645A (zh) * 2016-02-26 2016-07-27 北京金山安全软件有限公司 一种图片处理方法、装置及电子设备
CN105808645B (zh) * 2016-02-26 2019-05-10 北京金山安全软件有限公司 一种图片处理方法、装置及电子设备
CN110019007A (zh) * 2017-10-30 2019-07-16 北京金风科创风电设备有限公司 数据处理方法及装置
CN110019550A (zh) * 2017-12-15 2019-07-16 百度在线网络技术(北京)有限公司 数据仓库管理方法、装置及计算机设备
CN110019550B (zh) * 2017-12-15 2021-07-09 百度在线网络技术(北京)有限公司 数据仓库管理方法、装置及计算机设备
CN108228844A (zh) * 2018-01-09 2018-06-29 美的集团股份有限公司 一种图片筛选方法及装置、存储介质、计算机设备
CN108228844B (zh) * 2018-01-09 2020-10-27 美的集团股份有限公司 一种图片筛选方法及装置、存储介质、计算机设备
CN110442738A (zh) * 2019-07-31 2019-11-12 北京明略软件系统有限公司 图片去重方法和装置,存储介质及电子装置
CN111143581A (zh) * 2019-12-31 2020-05-12 汇医达(杭州)科技有限公司 一种用于期刊投稿、稿件筛选的数据箱系统

Also Published As

Publication number Publication date
EP2443589A4 (en) 2013-01-23
US20100316290A1 (en) 2010-12-16
EP2443589A1 (en) 2012-04-25
HK1136892A1 (en) 2010-07-09
EP2443589B1 (en) 2018-08-01
CN101576932B (zh) 2012-07-04
US20140126813A1 (en) 2014-05-08
JP5797789B2 (ja) 2015-10-21
WO2010147644A1 (en) 2010-12-23
JP2012530319A (ja) 2012-11-29
US9405993B2 (en) 2016-08-02
US8611649B2 (en) 2013-12-17
JP5463415B2 (ja) 2014-04-09
JP2014096175A (ja) 2014-05-22

Similar Documents

Publication Publication Date Title
CN101576932B (zh) 近重复图片的计算机查找方法和装置
US10831819B2 (en) Hue-based color naming for an image
CN104991959B (zh) 一种基于内容检索相同或相似图像的方法与系统
US10949467B2 (en) Random draw forest index structure for searching large scale unstructured data
US11106708B2 (en) Layered locality sensitive hashing (LSH) partition indexing for big data applications
Shim et al. Image indexing by modified color cooccurrence matrix
JP2012090264A (ja) 二次元ビジュアルフィンガープリントを用いるプレゼンテーション及びリッチドキュメントコンテンツの混合コレクションにおける類似コンテンツの発見方法
CN105335469A (zh) 一种图像匹配、检索方法和装置
JP3701888B2 (ja) 漸進的ヒストグラムを利用したマルチメディアの検索方法
US7130845B2 (en) Image retrieval method and apparatus independent of illumination change
CN107223242A (zh) 高效的局部特征描述符过滤
CN112561976A (zh) 一种图像主颜色特征提取方法、图像检索方法、存储介质及设备
US20060182347A1 (en) Image retrieval method and apparatus independent of illumination change
EP2707836A1 (en) System and method for compact descriptor for visual search
CN114330584A (zh) 数据聚类方法、装置、存储介质以及电子设备
Feng et al. Real-time SLAM relocalization with online learning of binary feature indexing
EP1195062A1 (en) Color image processing method
US20130287302A1 (en) Identification of duplicates within an image space
KR100574556B1 (ko) 칼라 영상 기술자 추출 장치 및 방법과 그를 이용한 멀티미디어 데이터 검색 장치 및 방법
CN107870923B (zh) 图像检索方法和装置
Bouker et al. Retrieval of images using mean-shift and gaussian mixtures based on weighted color histograms
Nirmala et al. Content based image retrieval system using auto color correlogram
CN111868710B (zh) 搜索大规模非结构化数据的随机提取森林索引结构
Piras et al. Dissimilarity representation in multi-feature spaces for image retrieval
Zhang et al. Research on a Distributed Approach for Large-scale Image Retrieval based on Location-sensitive Hashing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1136892

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1136892

Country of ref document: HK