CN103793466A - 一种图像检索方法及装置 - Google Patents

一种图像检索方法及装置 Download PDF

Info

Publication number
CN103793466A
CN103793466A CN201310713508.1A CN201310713508A CN103793466A CN 103793466 A CN103793466 A CN 103793466A CN 201310713508 A CN201310713508 A CN 201310713508A CN 103793466 A CN103793466 A CN 103793466A
Authority
CN
China
Prior art keywords
image
unique point
retrieved
classification
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310713508.1A
Other languages
English (en)
Other versions
CN103793466B (zh
Inventor
刘宇
冯良炳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hongzhituoxin Venture Capital Enterprise LP
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201310713508.1A priority Critical patent/CN103793466B/zh
Publication of CN103793466A publication Critical patent/CN103793466A/zh
Application granted granted Critical
Publication of CN103793466B publication Critical patent/CN103793466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Abstract

本发明适用于计算机视觉领域,提供了一种图像检索方法及装置,所述方法包括:提取图像集中每幅图像的特征点,构成一个特征点库;对所述特征点库中的特征点进行聚类操作,获得N类,所述N为预先定义的大于0的整数;提取待检索图像的特征点,基于待检索图像的特征点预测待检索图像所属类别,该类别为所述N类中的一类;统计所述待检索图像中N类特征点出现的次数,获取出现次数最高的前M类特征点,所述M为大于0且小于N的整数;获得所属类别对应的图像集,统计该图像集中每幅图像出现所述M类特征点的次数,并对出现的次数进行加和运算得到分值;输出分值最高的前L幅图像,所述L为大于0的整数。通过本发明可快速、准确的获得图像检索结果。

Description

一种图像检索方法及装置
技术领域
本发明属于计算机视觉技术领域,尤其涉及一种图像检索方法及装置。
背景技术
图像检索是指在图像集合中查找具有指定特征或包含指定内容的图像处理技术。随着多媒体技术、网络技术和数据库技术的不断发展,互联网的不断普及,人们对于图形、图像等多媒体数据的需求越来越强烈,因此图像信息的应用也越来越广泛。数字图像的容量随着人们的需要飞速增长着,每天都会产生数以百万计的图像。因此提供一种快速、准确的图像检索技术将显得十分必要。
现有的图像检索技术主要是基于文本的图像检索,这种技术的实质还是传统意义上的文本检索技术,其过程是将与网络图像相关的文本信息如图像标题、链接文本、内容描述等建立索引来标注图像,最后采用关键字匹配技术来进行检索。然而,由于语义的多义性以及描述的模糊性等问题,使基于文本的图像检索技术的准确度受到比较大的限制,所返回的结果通常不符合用户的预期。
发明内容
本发明实施例在于提供一种图像检索方法及装置,以解决现有基于文本的图像检索技术检索结果不够准确的问题。
本发明实施例的第一方面,提供一种图像检索方法,所述方法包括:
提取图像集中每幅图像的特征点,构成一个特征点库;
对所述特征点库中的特征点进行聚类操作,获得N类,所述N为预先定义的大于0的整数;
提取待检索图像的特征点,基于所述待检索图像的特征点预测所述待检索图像所属类别,该类别为所述N类中的一类;
统计所述待检索图像中N类特征点出现的次数,获取出现次数最高的前M类,所述M为大于0且小于N的整数;
获得所述所属类别对应的图像集,统计该图像集中每幅图像出现所述M类特征点的次数,并对出现的次数进行加和运算得到分值;
输出分值最高的前L幅图像,所述L为大于0的整数。
本发明实施例的第二方面,提供一种图像检索装置,所述装置包括:
特征点提取单元,用于提取图像集中每幅图像的特征点,构成一个特征点库;
聚类单元,用于对所述特征点库中的特征点进行聚类操作,获得N类,所述N为预先定义的大于0的整数;
类别预测单元,用于提取待检索图像的特征点,基于所述待检索图像的特征点预测所述待检索图像所属类别,该类别为所述N类中的一类;
次数统计单元,用于统计所述待检索图像中N类特征点出现的次数,获取出现次数最高的前M类,所述M为大于0且小于N的整数;
分值计算单元,用于获得所述所属类别对应的图像集,统计该图像集中每幅图像出现所述M类特征点的次数,并对出现的次数进行加和运算得到分值;
结果输出单元,用于输出分值最高的前L幅图像,所述L为大于0的整数。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例通过统计待检索图像中N类特征点出现的次数,获取出现次数最高的前M类特征点,并统计图像集中每幅图像出现所述M类特征点的次数,对出现的次数进行加和运算得到分值,将分值最高的前L幅图像作为检索结果输出。本发明实施例将图像特征点出现的次数作为最重要的信息进行索引检索,可快速、准确的获得图像检索结果。而且本发明实施例实现简单,对硬件要求较低,从而有利于降低产品成本。另外本发明实施例应用灵活,可应用于图像检索、显著性检测以及图像排序等,适用于面广,具有较强的易用性和实用性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例提供的图像检索方法的实现流程图;
图2是本发明第一实施例提供的待检索图片各SIFT特征点出现次数的示例图;
图3是本发明第一实施例提供的待检索图片各SIFT特征点出现次数的另一示例图;
图4是本发明第一实施例提供的M类SIFT特征点出现次数经加和运算得到分值的示意图;
图5是本发明第一实施例提供的图像检索结果的示例图;
图6是本发明第二实施例提供的图像检索装置的组成结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一:
图1示出了第一实施例提供的图像检索方法的实现流程,该方法过程详述如下:
在步骤S101中,提取图像集中每幅图像的特征点,构成一个特征点库。
在本实施例中,为了获得较多的特征点数,提高图像检索的准确度,所述特征点优选为尺度不变特征转换(Scale-invariant feature transform,SIFT)特征点。
其中,所述提取图像集中每幅图像的特征点具体包括:
对于图像集中的每幅图像,将其所有SIFT特征点根据最小距离原则各自映射到N类得到N维特征向量V1,将V1中的每个值除以该幅图像的特征点总数得到频率特征向量V2,V2即为该幅图像的SIFT特征点。
在步骤S102中,对所述特征点库中的特征点进行聚类操作,获得N类,所述N为预先定义的大于0的整数。
具体的可以是,对所述特征点库中的特征点采用K均值聚类算法(不局限于此算法)进行聚类操作。
在步骤S103中,提取待检索图像的特征点,基于所述待检索图像的特征点预测所述待检索图像所属类别,该类别为所述N类中的一类。
具体的可以是,基于所述待检索图像的特征点通过预测算法预测所述待检索图像所属类别。其中,所述预测算法包括但不限于支持向量机(Support VectorMachine,SVM)算法。
在步骤S104中,统计所述待检索图像中N类特征点出现的次数,获取出现次数最高的前M类特征点,所述M为大于0且小于N的整数。
在本实施例中,对所述待检索图像的所有特征进行统计,N类中,有一些类在所述待检索图像中从未出现,一些类出现了1次,一些类出现了2次或多次。根据SIFT类出现次数排序,获取出现次数最高的前M类(例如N类的30%)特征点作为索引。如图2、图3所示,图2为聚类20K(从数据集中选取20个点作为初始聚类中心)时所述待检索图像各SIFT出现的次数,图3为聚类50K(从数据集中选取50个点作为初始聚类中心)时所述待检索图像各SIFT出现的次数。其中,纵坐标表示出现的次数,横坐标表示不同的SIFT类。
在步骤S105中,获得所述所属类别对应的图像集,统计该图像集中每幅图像出现所述M类特征点的次数,并对出现的次数进行加和运算得到分值(如图4所示)。
在本实施例中,将所述M类特征点作为索引,对所属类别对应的图像集中每幅图像出现所述M类特征点的次数进行加和运算。按分块的方式,把高分数段(即大于或等于某一预设阈值的分值)放入一个表中,中低分数段(即小于某一预设阈值的分值)放入另一个表中。高分数段的图像即为要搜索的图像。
本实施例还包括为所述M类特征点的每类特征点设置一个权值,对所属类别对应的图像集中每幅图像出现所述M类特征点的次数进行加权运算;
其中,加权运算的公式为:
Q = Σ n = 1 p ( q n + ( k n × f n ) )
Q为每幅图像出现所述M类特征点的次数进行加权运算后获得的分值,qn为第n类特征点对应的权值的基本值(每类特征点的基本值可以相同也可以不同),n大于0的整数,kn为每类特征点设置的权值、fn为第n类特征点出现的次数,p表示该幅图像包含P类特征点。
在步骤S106中,输出分值最高的前L幅(例如前40%)图像,所述L为大于0的整数,输出结果如图5所示。
通过本发明实施例可快速、准确的获得图像检索结果。而且本发明实施例实现简单,对硬件要求较低,具有较高的灵活性。
实施例二:
图6示出了本发明第二实施例提供的图像检索装置的组成结构,为了便于说明,仅示出了与本发明实施例相关的部分。
该图像检索装置可应用于各种终端设备,例如口袋计算机(Pocket PersonalComputer,PPC)、掌上电脑、计算机、笔记本电脑、个人数字助理(PersonalDigital Assistant,PDA)等,可以是运行于这些终端内的软件单元、硬件单元或者软硬件相结合的单元,也可以作为独立的挂件集成到这些终端中或者运行于这些终端的应用系统中。
该图像检索装置包括特征点提取单元61、聚类单元62、类别预测单元63、次数统计单元64、分值计算单元65以及结果输出单元66。其中,各单元具体功能如下:
特征点提取单元61,用于提取图像集中每幅图像的特征点,构成一个特征点库;
聚类单元62,用于对所述特征点库中的特征点进行聚类操作,获得N类,所述N为预先定义的大于0的整数;
类别预测单元63,用于提取待检索图像的特征点,基于所述待检索图像的特征点预测所述待检索图像所属类别,该类别为所述N类中的一类;
次数统计单元64,用于统计所述待检索图像中N类特征点出现的次数,获取出现次数最高的前M类,所述M为大于0且小于N的整数;
分值计算单元65,用于获得所述所属类别对应的图像集,统计该图像集中每幅图像出现所述M类特征点的次数,并对出现的次数进行加和运算得到分值;
结果输出单元66,用于输出分值最高的前L幅图像,所述L为大于0的整数。
其中,所述特征点为SIFT特征点。
进一步的,
所述特征点提取单元61,用于对图像集中的每幅图像,将其所有SIFT特征点根据最小距离原则各自映射到N类得到N维特征向量V1,将V1中的每个值除以该幅图像的特征点总数得到频率特征向量V2,V2即为该幅图像的SIFT特征点。
进一步的,
所述聚类单元62,用于对所述特征点库中的特征点采用K均值聚类算法进行聚类操作。
进一步的,
所述类别预测单元63,用于基于所述待检索图像的特征点通过预测算法预测所述待检索图像所属类别,所述预测算法包括SVM算法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元或模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元或模块既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例的对应过程,在此不再赘述。
综上所述,本发明实施例通过统计待检索图像中N类特征点出现的次数,获取出现次数最高的前M类特征点,并统计图像集中每幅图像出现所述M类特征点的次数,对出现的次数进行加和运算得到分值,将分值最高的前L幅图像作为检索结果输出。本发明实施例将图像特征点出现的次数作为最重要的信息进行索引检索,可快速、准确的获得图像检索结果。而且本发明实施例实现简单,对硬件要求较低,从而有利于降低产品成本。另外本发明实施例应用灵活,可应用于图像检索、显著性检测以及图像排序等,适用于面广,具有较强的易用性和实用性。
本领域普通技术人员还可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,包括ROM/RAM、磁盘、光盘等。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明由所提交的权利要求书确定的专利保护范围。

Claims (10)

1.一种图像检索方法,其特征在于,所述方法包括:
提取图像集中每幅图像的特征点,构成一个特征点库;
对所述特征点库中的特征点进行聚类操作,获得N类,所述N为预先定义的大于0的整数;
提取待检索图像的特征点,基于所述待检索图像的特征点预测所述待检索图像所属类别,该类别为所述N类中的一类;
统计所述待检索图像中N类特征点出现的次数,获取出现次数最高的前M类特征点,所述M为大于0且小于N的整数;
获得所述所属类别对应的图像集,统计该图像集中每幅图像出现所述M类特征点的次数,并对出现的次数进行加和运算得到分值;
输出分值最高的前L幅图像,所述L为大于0的整数。
2.如权利要求1所述的方法,其特征在于,所述特征点为SIFT特征点。
3.如权利要求2所述的方法,其特征在于,所述提取图像集中每幅图像的特征点包括:
对于图像集中的每幅图像,将其所有SIFT特征点根据最小距离原则各自映射到N类得到N维特征向量V1,将V1中的每个值除以该幅图像的特征点总数得到频率特征向量V2,V2即为该幅图像的SIFT特征点。
4.如权利要求1所述的方法,其特征在于,所述对所述特征点库中的特征点进行聚类操作包括:
对所述特征点库中的特征点采用K均值聚类算法进行聚类操作。
5.如权利要求1所述的方法,其特征在于,所述基于所述待检索图像的特征点预测所述待检索图像所属类别包括:
基于所述待检索图像的特征点通过预测算法预测所述待检索图像所属类别,所述预测算法包括SVM算法。
6.一种图像检索装置,其特征在于,所述装置包括:
特征点提取单元,用于提取图像集中每幅图像的特征点,构成一个特征点库;
聚类单元,用于对所述特征点库中的特征点进行聚类操作,获得N类,所述N为预先定义的大于0的整数;
类别预测单元,用于提取待检索图像的特征点,基于所述待检索图像的特征点预测所述待检索图像所属类别,该类别为所述N类中的一类;
次数统计单元,用于统计所述待检索图像中N类特征点出现的次数,获取出现次数最高的前M类,所述M为大于0且小于N的整数;
分值计算单元,用于获得所述所属类别对应的图像集,统计该图像集中每幅图像出现所述M类特征点的次数,并对出现的次数进行加和运算得到分值;
结果输出单元,用于输出分值最高的前L幅图像,所述L为大于0的整数。
7.如权利要求6所述的装置,其特征在于,所述特征点为SIFT特征点。
8.如权利要求7所述的装置,其特征在于,
所述特征点提取单元,用于对图像集中的每幅图像,将其所有SIFT特征点根据最小距离原则各自映射到N类得到N维特征向量V1,将V1中的每个值除以该幅图像的特征点总数得到频率特征向量V2,V2即为该幅图像的SIFT特征点。
9.如权利要求6所述的装置,其特征在于,
所述聚类单元,用于对所述特征点库中的特征点采用K均值聚类算法进行聚类操作。
10.如权利要求6所述的装置,其特征在于,
所述类别预测单元,用于基于所述待检索图像的特征点通过预测算法预测所述待检索图像所属类别,所述预测算法包括SVM算法。
CN201310713508.1A 2013-12-20 2013-12-20 一种图像检索方法及装置 Active CN103793466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310713508.1A CN103793466B (zh) 2013-12-20 2013-12-20 一种图像检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310713508.1A CN103793466B (zh) 2013-12-20 2013-12-20 一种图像检索方法及装置

Publications (2)

Publication Number Publication Date
CN103793466A true CN103793466A (zh) 2014-05-14
CN103793466B CN103793466B (zh) 2018-06-05

Family

ID=50669132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310713508.1A Active CN103793466B (zh) 2013-12-20 2013-12-20 一种图像检索方法及装置

Country Status (1)

Country Link
CN (1) CN103793466B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480581A (zh) * 2017-03-31 2017-12-15 触景无限科技(北京)有限公司 物体识别方法和装置
CN107766822A (zh) * 2017-10-23 2018-03-06 平安科技(深圳)有限公司 电子装置、人脸图像聚类搜索方法和计算机可读存储介质
CN109902198A (zh) * 2019-03-11 2019-06-18 京东方科技集团股份有限公司 一种以图搜图的方法、装置及应用系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100074530A1 (en) * 2008-09-25 2010-03-25 Canon Kabushiki Kaisha Image processing apparatus, image processing method and program
CN101859326A (zh) * 2010-06-09 2010-10-13 南京大学 一种图像检索方法
CN102402621A (zh) * 2011-12-27 2012-04-04 浙江大学 一种基于图像分类的图像检索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100074530A1 (en) * 2008-09-25 2010-03-25 Canon Kabushiki Kaisha Image processing apparatus, image processing method and program
CN101859326A (zh) * 2010-06-09 2010-10-13 南京大学 一种图像检索方法
CN102402621A (zh) * 2011-12-27 2012-04-04 浙江大学 一种基于图像分类的图像检索方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480581A (zh) * 2017-03-31 2017-12-15 触景无限科技(北京)有限公司 物体识别方法和装置
CN107480581B (zh) * 2017-03-31 2021-06-15 触景无限科技(北京)有限公司 物体识别方法和装置
CN107766822A (zh) * 2017-10-23 2018-03-06 平安科技(深圳)有限公司 电子装置、人脸图像聚类搜索方法和计算机可读存储介质
WO2019080411A1 (zh) * 2017-10-23 2019-05-02 平安科技(深圳)有限公司 电子装置、人脸图像聚类搜索方法和计算机可读存储介质
CN109902198A (zh) * 2019-03-11 2019-06-18 京东方科技集团股份有限公司 一种以图搜图的方法、装置及应用系统
US11481432B2 (en) 2019-03-11 2022-10-25 Beijing Boe Technology Development Co., Ltd. Reverse image search method, apparatus and application system

Also Published As

Publication number Publication date
CN103793466B (zh) 2018-06-05

Similar Documents

Publication Publication Date Title
CN107133213B (zh) 一种基于算法的文本摘要自动提取方法与系统
CN109885773B (zh) 一种文章个性化推荐方法、系统、介质及设备
Roy et al. Towards cross-domain learning for social video popularity prediction
CN104239373B (zh) 为文档添加标签的方法及装置
Li et al. Key word extraction for short text via word2vec, doc2vec, and textrank
CN103258000B (zh) 对网页中高频关键词进行聚类的方法及装置
CN103049568B (zh) 对海量文档库的文档分类的方法
CN104881458B (zh) 一种网页主题的标注方法和装置
CN103678564A (zh) 一种基于数据挖掘的互联网产品调研系统
CN107679082A (zh) 问答搜索方法、装置以及电子设备
Wu et al. News filtering and summarization on the web
CN105843796A (zh) 一种微博情感倾向分析方法及装置
CN104077415A (zh) 搜索方法及装置
CN110807326B (zh) 结合gpu-dmm与文本特征的短文本关键词提取方法
CN110457481A (zh) 一种分类模型训练的方法、装置、设备以及存储介质
CN104408033A (zh) 一种文本信息提取的方法及系统
CN104102635A (zh) 一种挖掘知识图谱的方法及装置
CN110232126A (zh) 热点挖掘方法及服务器和计算机可读存储介质
CN103761286B (zh) 一种基于用户兴趣的服务资源检索方法
CN103942328A (zh) 一种视频检索方法及视频装置
CN112487161A (zh) 一种面向企业需求的专家推荐方法、装置、介质及设备
Qiu et al. Incorporate the syntactic knowledge in opinion mining in user-generated content
CN103793466A (zh) 一种图像检索方法及装置
CN104462061A (zh) 词语提取方法及提取装置
CN110389932B (zh) 电力文件自动分类方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230323

Address after: 518000 A-301, office building, Shenzhen Institute of advanced technology, No. 1068, Xue Yuan Avenue, Shenzhen University Town, Shenzhen, Guangdong, Nanshan District, China

Patentee after: Shenzhen shen-tech advanced Cci Capital Ltd.

Address before: 518000 No. 1068, Xue Yuan Avenue, Xili University Town, Nanshan District, Shenzhen, Guangdong

Patentee before: SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230424

Address after: 518000 b402, blocks a and B, Nanshan medical device Industrial Park, No. 1019, Nanhai Avenue, Yanshan community, merchants street, Nanshan District, Shenzhen, Guangdong

Patentee after: Shenzhen hongzhituoxin venture capital enterprise (L.P.)

Address before: 518000 A-301, office building, Shenzhen Institute of advanced technology, No. 1068, Xue Yuan Avenue, Shenzhen University Town, Shenzhen, Guangdong, Nanshan District, China

Patentee before: Shenzhen shen-tech advanced Cci Capital Ltd.

TR01 Transfer of patent right