CN110019915B - 检测图片的方法、装置和计算机可读存储介质 - Google Patents

检测图片的方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN110019915B
CN110019915B CN201810822464.9A CN201810822464A CN110019915B CN 110019915 B CN110019915 B CN 110019915B CN 201810822464 A CN201810822464 A CN 201810822464A CN 110019915 B CN110019915 B CN 110019915B
Authority
CN
China
Prior art keywords
picture
grained
coarse
subset
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810822464.9A
Other languages
English (en)
Other versions
CN110019915A (zh
Inventor
程晓旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201810822464.9A priority Critical patent/CN110019915B/zh
Publication of CN110019915A publication Critical patent/CN110019915A/zh
Application granted granted Critical
Publication of CN110019915B publication Critical patent/CN110019915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提出一种检测图片的方法、装置和计算机可读存储介质,涉及图像处理领域。本公开基于不同的粒度提取图片特征和划分图片子集,按照粒度由粗到细的顺序,利用待检测图片的相应粒度的特征,从各个相应粒度图片子集中确定待检测图片所属的相应粒度图片子集,并在待检测图片所属的最细粒度图片子集中查找相似或相同的图片,需要比较的图片数量大大减少,从而提高图片检测效率。

Description

检测图片的方法、装置和计算机可读存储介质
技术领域
本公开涉及图像处理领域,特别涉及一种检测图片的方法、装置和计算机可读存储介质。
背景技术
在涉及图片搜索的业务场景中,经常需要查找相似或相同的图片。一些相关技术,提取待检测图片的特征,然后将待检测图片的特征与其他图片的特征进行距离的比较,如果距离小于设定的阈值,则判定为待检测图片的相同或相似的图片。
发明内容
发明人发现,在图片规模比较大的情况下,相关技术的图片检测效率比较低。
鉴于此,本公开所要解决的一个技术问题是,提高图片检测效率。
本公开的一些实施例提出一种检测图片的方法,包括:
利用粒度不同的多个特征提取模型分别提取待检测图片的相应粒度的特征;
针对相邻粒度的每两个特征提取模型执行以下操作:
利用待检测图片的粗粒度的特征,从各个粗粒度图片子集中确定待检测图片所属的粗粒度图片子集,其中,待检测图片的粗粒度的特征是利用相邻粒度中较粗粒度的特征提取模型提取得到的;
利用待检测图片的细粒度的特征,从待检测图片所属的粗粒度图片子集下属的各个细粒度图片子集中确定待检测图片所属的细粒度图片子集,其中,待检测图片的细粒度的特征是利用相邻
粒度中较细粒度的特征提取模型提取得到的;
在针对所有特征提取模型均执行完上述操作后,将待检测图片与待检测图片所属的最细粒度图片子集中的各个图片进行比较,以查找相似或相同的图片。
可选地,各个粗粒度图片子集的形成方法包括:
利用相邻粒度中较粗粒度的特征提取模型提取图片集合中的各个图片的粗粒度的特征;
利用图片集合中的各个图片的粗粒度的特征对图片集合中的各个图片进行聚类,从而形成各个粗粒度图片子集;
其中,所述图片集合是各个粗粒度图片子集形成前所属的图片集合。
可选地,各个细粒度图片子集的形成方法包括:
利用相邻粒度中较细粒度的特征提取模型提取任意一个粗粒度图片子集中的各个图片的细粒度的特征;
利用该粗粒度图片子集中的各个图片的细粒度的特征对该粗粒度图片子集中的各个图片进行聚类,从而形成该粗粒度图片子集下属的各个细粒度图片子集。
可选地,确定待检测图片所属的粗粒度图片子集包括:
根据待检测图片的粗粒度的特征与每个粗粒度图片子集中的中心点的粗粒度的特征,计算待检测图片与各个粗粒度图片子集之间的距离,将具有最小距离的粗粒度图片子集确定为待检测图片所属的粗粒度图片子集。
可选地,确定待检测图片所属的细粒度图片子集包括:
根据待检测图片的细粒度的特征与每个细粒度图片子集中的中心点的细粒度的特征,计算待检测图片与各个细粒度图片子集之间的距离,将具有最小距离的细粒度图片子集确定为待检测图片所属的细粒度图片子集。
可选地,特征提取模型是二值化特征模型,以便基于二值化特征计算的汉明距离来进行图片的比较。
本公开的一些实施例提出一种检测图片的装置,包括:
特征提取模块,用于利用粒度不同的多个特征提取模型分别提取待检测图片的相应粒度的特征;
逐级确定模块,用于针对相邻粒度的每两个特征提取模型执行以下操作:
利用待检测图片的粗粒度的特征,从各个粗粒度图片子集中确定待检测图片所属的粗粒度图片子集,其中,待检测图片的粗粒度的特征是利用相邻粒度中较粗粒度的特征提取模型提取得到的;
利用待检测图片的细粒度的特征,从待检测图片所属的粗粒度图片子集下属的各个细粒度图片子集中确定待检测图片所属的细粒度图片子集,其中,待检测图片的细粒度的特征是利用相邻粒度中较细粒度的特征提取模型提取得到的;
图片比较模块,用于在针对所有特征提取模型均执行完上述操作后,将待检测图片与待检测图片所属的最细粒度图片子集中的各个图片进行比较,以查找相似或相同的图片。
可选地,各个粗粒度图片子集的形成方法包括:
利用相邻粒度中较粗粒度的特征提取模型提取图片集合中的各个图片的粗粒度的特征;
利用图片集合中的各个图片的粗粒度的特征对图片集合中的各个图片进行聚类,从而形成各个粗粒度图片子集;
其中,所述图片集合是各个粗粒度图片子集形成前所属的图片集合;
可选地,各个细粒度图片子集的形成方法包括:
利用相邻粒度中较细粒度的特征提取模型提取任意一个粗粒度图片子集中的各个图片的细粒度的特征;
利用该粗粒度图片子集中的各个图片的细粒度的特征对该粗粒度图片子集中的各个图片进行聚类,从而形成该粗粒度图片子集下属的各个细粒度图片子集。
可选地,所述逐级确定模块包括:
用于确定待检测图片所属的粗粒度图片子集的第一确定单元,
以及
用于确定待检测图片所属的细粒度图片子集的第二确定单元;
其中,
所述第一确定单元,用于:根据待检测图片的粗粒度的特征与每个粗粒度图片子集中的中心点的粗粒度的特征,计算待检测图片与各个粗粒度图片子集之间的距离,将具有最小距离的粗粒度图片子集确定为待检测图片所属的粗粒度图片子集;
所述第二确定单元,用于:根据待检测图片的细粒度的特征与每个细粒度图片子集中的中心点的细粒度的特征,计算待检测图片与各个细粒度图片子集之间的距离,将具有最小距离的细粒度图片子集确定为待检测图片所属的细粒度图片子集。
可选地,特征提取模型是二值化特征模型,以便基于二值化特征计算的汉明距离来进行图片的比较。
本公开的一些实施例提出一种检测图片的装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行任一项前述的检测图片的方法。
本公开的一些实施例提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一项前述的检测图片的方法的步骤。
本公开基于不同的粒度提取图片特征和划分图片子集,按照粒度由粗到细的顺序,利用待检测图片的相应粒度的特征,从各个相应粒度图片子集中确定待检测图片所属的相应粒度图片子集,并在待检测图片所属的最细粒度图片子集中查找相似或相同的图片,需要比较的图片数量大大减少,从而提高图片检测效率。
附图说明
下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍。根据下面参照附图的详细描述,可以更加清楚地理解本公开,
显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本公开的基于多个特征提取模型实现的检测图片的方法一些实施例的流程示意图。
图2是本公开的基于两个特征提取模型实现的检测图片的方法一些实施例的流程示意图。
图3是本公开的检测图片的装置一些实施例的结构示意图。
图4是本公开的检测图片的装置另一些实施例的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。
本公开基于不同的粒度提取图片特征和划分图片子集,按照粒度由粗到细的顺序,利用待检测图片的相应粒度的特征,从各个相应粒度图片子集中确定待检测图片所属的相应粒度图片子集,并在待检测图片所属的最细粒度图片子集中查找相似或相同的图片,从而提高图片检测效率。
本公开涉及粒度不同的多个(即至少两个)特征提取模型,不同粒度的特征提取模型所提取的特征的粒度不同,较粗粒度的特征提取模型所提取的特征的粒度较粗,较细粒度的特征提取模型所提取的特征的粒度较细。特征提取模型例如可以是神经网络模型,所提取的特征例如可以是深度特征。
可选地,特征提取模型例如可以是二值化特征模型,二值化特征例如可以是0和1编码结构的特征。对被比较图片的二值化特征使用异或操作就可以计算这些图片的汉明距离,计算效率非常高,进而基于汉明距离就可以判定被比较图片的相似程度。
本公开基于粒度不同的多个特征提取模型,将图片集合划分为不同粒度的图片子集。
具体来说,按照粒度由粗到细的顺序,针对相邻粒度的每两个特征提取模型执行以下操作A~B:
操作A:利用相邻粒度中较粗粒度的特征提取模型提取图片集合(即各个粗粒度图片子集形成前所属的图片集合)中的各个图片的粗粒度的特征,利用图片集合中的各个图片的粗粒度的特征对图片集合中的各个图片进行聚类,从而形成各个粗粒度图片子集。
操作B:利用相邻粒度中较细粒度的特征提取模型提取任意一个粗粒度图片子集中的各个图片的细粒度的特征,利用该粗粒度图片子集中的各个图片的细粒度的特征对该粗粒度图片子集中的各个图片进行聚类,从而形成该粗粒度图片子集下属的各个细粒度图片子集。
基于粒度不同的多个特征提取模型重复执行操作A~B,则可以将图片集合划分为不同粒度的图片子集。
举例来说,假设有不同粒度的两个特征提取模型,其中较粗粒度的特征提取模型设为M1,较细粒度的特征提取模型设为M2,原始的图片集合设为S。则,图片集合S利用较粗粒度的特征提取模型M1经过操作A的处理被划分为p个粗粒度图片子集,设为S1,S2,…,Sp。然后,任意一个粗粒度图片子集Si(i=1,2,…,p)利用较细粒度的特征提取模型M2经过操作B的处理被进一步细分为q个细粒度图片子集,设为Sij(i=1,2,…,p;j=1,2,…,q)。如果还有更细粒度的特征提取模型,则可以将Sij进一步细分为更细粒度的图片子集,这里不再赘述。
基于上述不同粒度的图片子集,可以进行层次化的图片检测。下面结合图1描述检测图片的方法。
图1是本公开的基于多个特征提取模型实现的检测图片的方法一些实施例的流程示意图。
如图1所示,检测图片的方法包括:步骤110~130。
在步骤110,利用粒度不同的多个特征提取模型分别提取待检测图片的相应粒度的特征。
在步骤120,针对相邻粒度的每两个特征提取模型执行以下操作121~122:
操作121:利用待检测图片的粗粒度的特征,从各个粗粒度图片子集中确定待检测图片所属的粗粒度图片子集,其中,待检测图片的粗粒度的特征是利用相邻粒度中较粗粒度的特征提取模型提取得到的。
其中,确定待检测图片所属的粗粒度图片子集包括:根据待检测图片的粗粒度的特征与每个粗粒度图片子集中的中心点的粗粒度的特征,计算待检测图片与各个粗粒度图片子集之间的距离,将具有最小距离的粗粒度图片子集确定为待检测图片所属的粗粒度图片子集。
操作122:利用待检测图片的细粒度的特征,从待检测图片所属的粗粒度图片子集下属的各个细粒度图片子集中确定待检测图片所属的细粒度图片子集,其中,待检测图片的细粒度的特征是利用相邻粒度中较细粒度的特征提取模型提取得到的。
其中,确定待检测图片所属的细粒度图片子集包括:根据待检测图片的细粒度的特征与每个细粒度图片子集中的中心点的细粒度的特征,计算待检测图片与各个细粒度图片子集之间的距离,将具有最小距离的细粒度图片子集确定为待检测图片所属的细粒度图片子集。
在步骤130,在针对所有特征提取模型均执行完上述操作后,将待检测图片与待检测图片所属的最细粒度图片子集中的各个图片进行比较,以查找相似或相同的图片。
比较过程例如为:根据待检测图片的最细粒度的特征与待检测图片所属的最细粒度图片子集中的各个图片的最细粒度的特征,计算待检测图片与其所属的最细粒度图片子集中的各个图片的距离,根据设定的距离阈值,从待检测图片所属的最细粒度图片子集中,查找到与待检测图片相似或相同的图片。
举例来说,假设原始的图片集合S被划分为两个粗粒度图片子集S1和S2(参考前述操作A实现),粗粒度图片子集S1被划分为两个细粒度图片子集S11和S12(参考前述操作B实现),粗粒度图片子集S2被划分为两个细粒度图片子集S21和S22(参考前述操作B实现),并假设待检测图片P实际属于子集S12。
则检测过程为:经过操作121的处理,确定待检测图片P属于粗粒度图片子集S1,后续待检测图片P无需与粗粒度图片子集S2中的图片进行比较;然后,经过操作122的处理,确定待检测图片P属于细粒度图片子集S12,后续待检测图片P无需与细粒度图片子集S11中的图片进行比较;最后,经过步骤130的处理,待检测图片P与细粒度图片子集S12中的各个图片进行比较,可以从细粒度图片子集S12中查找到与待检测图片P相似或相同的图片。
由此可见,需要比较的图片数量大大减少,可以极大地提高图片检测效率。在大规模图片检测时,可以有效提高图片检测效率。
上述实施例基于不同的粒度提取图片特征和划分图片子集,按照粒度由粗到细的顺序,利用待检测图片的相应粒度的特征,从各个相应粒度图片子集中确定待检测图片所属的相应粒度图片子集,并在待检测图片所属的最细粒度图片子集中查找相似或相同的图片,从而提高图片检测效率。
下面以不同粒度的两个特征提取模型为例,描述检测图片的方法。
图2是本公开的基于两个特征提取模型实现的检测图片的方法一些实施例的流程示意图。
如图2所示,检测图片的方法包括:步骤210~230。
在步骤210,利用粗粒度的特征提取模型提取待检测图片的粗粒度的特征,并利用细粒度的特征提取模型提取待检测图片的细粒度的特征。
在步骤220,利用待检测图片的粗粒度的特征,从各个粗粒度图片子集中确定待检测图片所属的粗粒度图片子集。
在步骤230,利用待检测图片的细粒度的特征,从待检测图片所属的粗粒度图片子集下属的各个细粒度图片子集中确定待检测图片所属的细粒度图片子集。
在步骤240,将待检测图片与待检测图片所属的细粒度图片子集中的各个图片进行比较,以查找相似或相同的图片。
上述实施例可以减少需要比较的图片的数量,提高图片检测效率。
图3是本公开的检测图片的装置一些实施例的结构示意图。
如图3所示,该实施例的检测图片的装置300包括:模块310~330。
特征提取模块310,用于利用粒度不同的多个特征提取模型分别提取待检测图片的相应粒度的特征。
逐级确定模块320,用于针对相邻粒度的每两个特征提取模型执行以下操作:
利用待检测图片的粗粒度的特征,从各个粗粒度图片子集中确定待检测图片所属的粗粒度图片子集,其中,待检测图片的粗粒度的特征是利用相邻粒度中较粗粒度的特征提取模型提取得到的;
利用待检测图片的细粒度的特征,从待检测图片所属的粗粒度图片子集下属的各个细粒度图片子集中确定待检测图片所属的细粒度图片子集,其中,待检测图片的细粒度的特征是利用相邻粒度中较细粒度的特征提取模型提取得到的。
图片比较模块330,用于在针对所有特征提取模型均执行完上述操作后,将待检测图片与待检测图片所属的最细粒度图片子集中的各个图片进行比较,以查找相似或相同的图片。
在一些实施例中,其中的各个粗粒度图片子集的形成方法包括:
利用相邻粒度中较粗粒度的特征提取模型提取图片集合(即各个粗粒度图片子集形成前所属的图片集合)中的各个图片的粗粒度的特征;利用图片集合中的各个图片的粗粒度的特征对图片集合中的各个图片进行聚类,从而形成各个粗粒度图片子集。
在一些实施例中,其中的各个细粒度图片子集的形成方法包括:
利用相邻粒度中较细粒度的特征提取模型提取任意一个粗粒度图片子集中的各个图片的细粒度的特征;利用该粗粒度图片子集中的各个图片的细粒度的特征对该粗粒度图片子集中的各个图片进行聚类,从而形成该粗粒度图片子集下属的各个细粒度图片子集。
在一些实施例中,逐级确定模块320包括:
用于确定待检测图片所属的粗粒度图片子集的第一确定单元321,
以及
用于确定待检测图片所属的细粒度图片子集的第二确定单元322。
第一确定单元321用于:根据待检测图片的粗粒度的特征与每个粗粒度图片子集中的中心点的粗粒度的特征,计算待检测图片与各个粗粒度图片子集之间的距离,将具有最小距离的粗粒度图片子集确定为待检测图片所属的粗粒度图片子集;
第二确定单元322用于:根据待检测图片的细粒度的特征与每个细粒度图片子集中的中心点的细粒度的特征,计算待检测图片与各个细粒度图片子集之间的距离,将具有最小距离的细粒度图片子集确定为待检测图片所属的细粒度图片子集。
在一些实施例中,特征提取模型是二值化特征模型,以便基于二值化特征计算的汉明距离来进行图片的比较。
图4是本公开的检测图片的装置另一些实施例的结构示意图。
如图4所示,该实施例的检测图片的装置400包括:存储器410以及耦接至该存储器410的处理器420,处理器420被配置为基于存储在存储器410中的指令,执行前述任意一些实施例中的检测图片的方法。
其中,存储器410例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。
装置400还可以包括输入输出接口430、网络接口440、存储接口450等。这些接口430,440,450以及存储器410和处理器420之间例如可以通过总线460连接。其中,输入输出接口430为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口440为各种联网设备提供连接接口。存储接口450为SD卡、U盘等外置存储设备提供连接接口。
上述实施例的装置,使得需要比较的图片数量大大减少,从而提高图片检测效率。
本公开还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任意一些实施例中的检测图片的方法的步骤。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (12)

1.一种检测图片的方法,包括:
利用粒度不同的多个特征提取模型分别提取待检测图片的相应粒度的特征;
针对相邻粒度的每两个特征提取模型执行以下操作:
首先,将图片集合划分为不同粒度的图片子集,包括:基于图片集合中的各个图片的粗粒度的特征进行聚类形成各个粗粒度图片子集,基于粗粒度图片子集中的各个图片的细粒度的特征进行聚类形成粗粒度图片子集下属的各个细粒度图片子集;
其次,利用待检测图片的粗粒度的特征,根据待检测图片与各个粗粒度图片子集的中心点之间的距离,从各个粗粒度图片子集中确定待检测图片所属的粗粒度图片子集,其中,待检测图片的粗粒度的特征是利用相邻粒度中较粗粒度的特征提取模型提取得到的;利用待检测图片的细粒度的特征,根据待检测图片与待检测图片所属的粗粒度图片子集下属的各个细粒度图片子集的中心点之间的距离,从待检测图片所属的粗粒度图片子集下属的各个细粒度图片子集中确定待检测图片所属的细粒度图片子集,其中,待检测图片的细粒度的特征是利用相邻粒度中较细粒度的特征提取模型提取得到的;
在针对所有特征提取模型均执行完上述操作后,利用最细粒度的图片特征,将待检测图片与待检测图片所属的最细粒度图片子集中的各个图片进行比较,以查找相似或相同的图片。
2.如权利要求1所述的方法,其中,各个粗粒度图片子集的形成方法包括:
利用相邻粒度中较粗粒度的特征提取模型提取图片集合中的各个图片的粗粒度的特征;
利用图片集合中的各个图片的粗粒度的特征对图片集合中的各个图片进行聚类,从而形成各个粗粒度图片子集;
其中,所述图片集合是各个粗粒度图片子集形成前所属的图片集合。
3.如权利要求1所述的方法,其中,各个细粒度图片子集的形成方法包括:
利用相邻粒度中较细粒度的特征提取模型提取任意一个粗粒度图片子集中的各个图片的细粒度的特征;
利用该粗粒度图片子集中的各个图片的细粒度的特征对该粗粒度图片子集中的各个图片进行聚类,从而形成该粗粒度图片子集下属的各个细粒度图片子集。
4.如权利要求1所述的方法,其中,确定待检测图片所属的粗粒度图片子集包括:
根据待检测图片的粗粒度的特征与每个粗粒度图片子集中的中心点的粗粒度的特征,计算待检测图片与各个粗粒度图片子集之间的距离,将具有最小距离的粗粒度图片子集确定为待检测图片所属的粗粒度图片子集。
5.如权利要求1所述的方法,其中,确定待检测图片所属的细粒度图片子集包括:
根据待检测图片的细粒度的特征与每个细粒度图片子集中的中心点的细粒度的特征,计算待检测图片与各个细粒度图片子集之间的距离,将具有最小距离的细粒度图片子集确定为待检测图片所属的细粒度图片子集。
6.如权利要求1所述的方法,其中,特征提取模型是二值化特征模型,以便基于二值化特征计算的汉明距离来进行图片的比较。
7.一种检测图片的装置,包括:
特征提取模块,用于利用粒度不同的多个特征提取模型分别提取待检测图片的相应粒度的特征;
逐级确定模块,用于针对相邻粒度的每两个特征提取模型执行以下操作:
首先,将图片集合划分为不同粒度的图片子集,包括:基于图片集合中的各个图片的粗粒度的特征进行聚类形成各个粗粒度图片子集,基于粗粒度图片子集中的各个图片的细粒度的特征进行聚类形成粗粒度图片子集下属的各个细粒度图片子集;
其次,利用待检测图片的粗粒度的特征,根据待检测图片与各个粗粒度图片子集的中心点之间的距离,从各个粗粒度图片子集中确定待检测图片所属的粗粒度图片子集,其中,待检测图片的粗粒度的特征是利用相邻粒度中较粗粒度的特征提取模型提取得到的;利用待检测图片的细粒度的特征,根据待检测图片与待检测图片所属的粗粒度图片子集下属的各个细粒度图片子集的中心点之间的距离,从待检测图片所属的粗粒度图片子集下属的各个细粒度图片子集中确定待检测图片所属的细粒度图片子集,其中,待检测图片的细粒度的特征是利用相邻粒度中较细粒度的特征提取模型提取得到的;
图片比较模块,用于在针对所有特征提取模型均执行完上述操作后,利用最细粒度的图片特征,将待检测图片与待检测图片所属的最细粒度图片子集中的各个图片进行比较,以查找相似或相同的图片。
8.如权利要求7所述的装置,其中,
各个粗粒度图片子集的形成方法包括:
利用相邻粒度中较粗粒度的特征提取模型提取图片集合中的各个图片的粗粒度的特征;
利用图片集合中的各个图片的粗粒度的特征对图片集合中的各个图片进行聚类,从而形成各个粗粒度图片子集;
其中,所述图片集合是各个粗粒度图片子集形成前所属的图片集合;
各个细粒度图片子集的形成方法包括:
利用相邻粒度中较细粒度的特征提取模型提取任意一个粗粒度图片子集中的各个图片的细粒度的特征;
利用该粗粒度图片子集中的各个图片的细粒度的特征对该粗粒度图片子集中的各个图片进行聚类,从而形成该粗粒度图片子集下属的各个细粒度图片子集。
9.如权利要求7所述的装置,其中,所述逐级确定模块包括:
用于确定待检测图片所属的粗粒度图片子集的第一确定单元,以及
用于确定待检测图片所属的细粒度图片子集的第二确定单元;
其中,
所述第一确定单元,用于:根据待检测图片的粗粒度的特征与每个粗粒度图片子集中的中心点的粗粒度的特征,计算待检测图片与各个粗粒度图片子集之间的距离,将具有最小距离的粗粒度图片子集确定为待检测图片所属的粗粒度图片子集;
所述第二确定单元,用于:根据待检测图片的细粒度的特征与每个细粒度图片子集中的中心点的细粒度的特征,计算待检测图片与各个细粒度图片子集之间的距离,将具有最小距离的细粒度图片子集确定为待检测图片所属的细粒度图片子集。
10.如权利要求7所述的装置,其中,特征提取模型是二值化特征模型,以便基于二值化特征计算的汉明距离来进行图片的比较。
11.一种检测图片的装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1-6中任一项所述的检测图片的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-6中任一项所述的检测图片的方法的步骤。
CN201810822464.9A 2018-07-25 2018-07-25 检测图片的方法、装置和计算机可读存储介质 Active CN110019915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810822464.9A CN110019915B (zh) 2018-07-25 2018-07-25 检测图片的方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810822464.9A CN110019915B (zh) 2018-07-25 2018-07-25 检测图片的方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110019915A CN110019915A (zh) 2019-07-16
CN110019915B true CN110019915B (zh) 2022-04-12

Family

ID=67188335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810822464.9A Active CN110019915B (zh) 2018-07-25 2018-07-25 检测图片的方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110019915B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814147A (zh) * 2010-04-12 2010-08-25 中国科学院自动化研究所 一种实现场景图像的分类方法
CN105608230A (zh) * 2016-02-03 2016-05-25 南京云创大数据科技股份有限公司 一种基于图像检索的商家信息推荐系统及方法
CN106886599A (zh) * 2017-02-28 2017-06-23 北京京东尚科信息技术有限公司 图像检索方法以及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9141885B2 (en) * 2013-07-29 2015-09-22 Adobe Systems Incorporated Visual pattern recognition in an image
CN104766096B (zh) * 2015-04-17 2017-11-10 南京大学 一种基于多尺度全局特征和局部特征的图像分类方法
CN105005794B (zh) * 2015-07-21 2018-06-05 太原理工大学 融合多粒度上下文信息的图像像素语义标注方法
TW201719572A (zh) * 2015-11-19 2017-06-01 國立交通大學 三維模型分析及搜尋方法
CN106933816A (zh) * 2015-12-29 2017-07-07 北京大唐高鸿数据网络技术有限公司 基于全局特征和局部特征的跨镜头目标检索系统及方法
CN105550381B (zh) * 2016-03-17 2019-04-05 北京工业大学 一种基于改进sift特征的高效图像检索方法
CN106886553B (zh) * 2016-12-27 2020-07-28 浙江宇视科技有限公司 一种图像检索方法及服务器
CN106844524B (zh) * 2016-12-29 2019-08-09 北京工业大学 一种基于深度学习和Radon变换的医学图像检索方法
CN107480708A (zh) * 2017-07-31 2017-12-15 微梦创科网络科技(中国)有限公司 一种复杂模型的聚类方法及系统
CN107766890B (zh) * 2017-10-31 2021-09-14 天津大学 一种细粒度识别中判别性图块学习的改进方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814147A (zh) * 2010-04-12 2010-08-25 中国科学院自动化研究所 一种实现场景图像的分类方法
CN105608230A (zh) * 2016-02-03 2016-05-25 南京云创大数据科技股份有限公司 一种基于图像检索的商家信息推荐系统及方法
CN106886599A (zh) * 2017-02-28 2017-06-23 北京京东尚科信息技术有限公司 图像检索方法以及装置

Also Published As

Publication number Publication date
CN110019915A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
US9697423B1 (en) Identifying the lines of a table
CN106940799B (zh) 文本图像处理方法和装置
CN105205397A (zh) 恶意程序样本分类方法及装置
US8838657B1 (en) Document fingerprints using block encoding of text
CN107330027B (zh) 一种弱监督的深度台标检测方法
US10783163B2 (en) Instance-based distributed data recovery method and apparatus
CN108073815B (zh) 基于代码切片的家族判定方法、系统及存储介质
CN111144282B (zh) 表格识别方法和装置、计算机可读存储介质
CN110866491A (zh) 目标检索方法、装置、计算机可读存储介质和计算机设备
US20210264189A1 (en) Text Recognition Method and Apparatus, Electronic Device, and Storage Medium
CN102306287A (zh) 一种用于识别敏感图像的方法与设备
CN110633594A (zh) 一种目标检测方法和装置
JP2019512127A (ja) 文字列距離計算方法及び装置
CN104517113A (zh) 一种图像的特征提取方法、图像的分类方法及相关装置
KR101836811B1 (ko) 이미지 상호간의 매칭을 판단하는 방법, 장치 및 컴퓨터 프로그램
CN105404683A (zh) 一种版式文档处理方法及装置
CN111399848A (zh) 一种硬编码数据检测方法、装置、电子设备和介质
CN104778252B (zh) 索引的存储方法和装置
CN107292002B (zh) 一种数字岩心重构的方法及装置
CN111368867B (zh) 档案归类方法及系统、计算机可读存储介质
CN111783812A (zh) 违禁图像识别方法、装置和计算机可读存储介质
CN111353062A (zh) 一种图像检索方法、装置以及设备
CN114637870A (zh) 一种图像数据处理方法、装置、设备及存储介质
CN107688744B (zh) 基于图像特征匹配的恶意文件分类方法及装置
CN105354224A (zh) 知识数据的处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant