CN105718531A - 图像数据库的建立方法及图像识别方法 - Google Patents

图像数据库的建立方法及图像识别方法 Download PDF

Info

Publication number
CN105718531A
CN105718531A CN201610029172.0A CN201610029172A CN105718531A CN 105718531 A CN105718531 A CN 105718531A CN 201610029172 A CN201610029172 A CN 201610029172A CN 105718531 A CN105718531 A CN 105718531A
Authority
CN
China
Prior art keywords
matrix
picture
image
pictures
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610029172.0A
Other languages
English (en)
Other versions
CN105718531B (zh
Inventor
谭俊东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jinzhile Network Technology Co.,Ltd.
Original Assignee
Guangzhou Smart Space Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Smart Space Information Technology Co Ltd filed Critical Guangzhou Smart Space Information Technology Co Ltd
Priority to CN201610029172.0A priority Critical patent/CN105718531B/zh
Publication of CN105718531A publication Critical patent/CN105718531A/zh
Application granted granted Critical
Publication of CN105718531B publication Critical patent/CN105718531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供的图像数据库的建立方法及图像识别方法,通过将图像的特征值矩阵描述进行低纬度向量化转化,可以有效降低需要保存的数据量,单台服务器可以保存更多的图像数据,能够支持大规模的图像搜索的实现,且可加快图像匹配搜索的速度。

Description

图像数据库的建立方法及图像识别方法
技术领域
本发明涉及图像识别技术领域,特别是涉及一种图像数据库的建立方法及图像识别方法。
背景技术
目前的图像识别系统结构,每张图片的特征值用一个特征值矩阵表述,数据量巨大,耗费大量的内存,单台服务器能够存储的数据量有限,因此限制了大规模的图像搜索的实现,且图像搜索的速度也受到了限制。
因此,需要提供一种图像数据库的建立方法及图像识别方法以解决上述技术问题。
发明内容
本发明主要解决的技术问题是提供一种图像数据库的建立方法及图像识别方法,以解决现有技术的图像存储数据量巨大造成搜索大量图像难以实现、搜索速度慢的问题。
为解决上述技术问题,本发明采用的第一技术方案是提供一种图像数据库的建立方法,包括步骤:
⑴采集目标图片,并为每张图片打上名称标签,并把打上标签的目标图片存放进图片集队列;
⑵推出图片集队列的首位图片;
⑶提取所述首位图片的局部特征点;
⑷计算局部特征点的特征值,并将每张图片的特征值以一个n×m矩阵的形式表述;
⑸把上述n×m矩阵所表述的数据放进一个向量化引擎中,使得图片的特征点表达为一个低纬度的向量[V1V2...VK];
⑹把低纬度的向量[V1V2...VK]存入特征向量数据库;
⑺判断图片集队列是否为空,若是,则结束,若否,则回到步骤⑵;
其中,m、n和k都是正整数,且k<<n×m。
本发明的图像数据库的建立方法的优选实施例中,所述步骤(4)具体包括:
A、加载所有图片的特征矩阵,并合并这些特征矩阵形成一个矩阵M;
B、在特征值空间随机生成10000个中心特征值C=[c1c2c3...c10000];
C、取出M的每一行Fi=M[i],找到Fi最邻近的中心特征值cj
D、更新C=[c1c2c3...c10000]里的每一个cj,使得cj是最邻近Fi的几何中心点;
E、重复步骤C和D,直到每一个cj的位置变化都小于一个预定的阈值,保存中心特征点向量C=[c1c2c3...c10000];
F、对于一个新图片的特征矩阵M′的每一行Fi′=M′[i],找到C=[c1c2c3...c10000]里面与之最邻近的中心点;
G、计算C=[c1c2c3...c10000]在M′的直方图,得到向量矩阵表达v=[V1V2...VK],并输出向量矩阵v=[V1V2...VK],结束;
其中,i是矩阵M的行数,j是cj在C=[c1c2c3...c10000]中序数。
为解决上述技术问题,本发明采用的第二技术方案是提供一种图像识别方法,该图像识别方法基于上述任意一项所述的图像数据库的建立方法,包括步骤:
(8)输入图片;
(9)提取图片的局部特征点;
(10)计算特征点特征值,所述特征值采用一个n×m矩阵的形式表述;
(11)向量化输入图片的特征点矩阵表述;
(12)搜索特征向量矩阵数据库以匹配输入的图片的向量化特征点矩阵;
(13)输出匹配结果,完成搜索;
其中,m和n都是正整数。
本发明的有益效果是:区别于现有技术的情况,本发明提供的图像数据库的建立方法及图像识别方法,通过将图像的特征值矩阵描述进行低纬度向量化转化,可以有效降低需要保存的数据量,单台服务器可以保存更多的图像数据,能够支持大规模的图像搜索的实现,且可加快图像匹配搜索的速度。
附图说明
图1是本发明的图像数据库的建立方法的实施例的流程示意图;
图2是图1中步骤(4)的详细流程示意图;
图3是本发明的图像识别方法的流程示意图。
具体实施方式
下面结合图示对本发明的技术方案进行详述。
请参见图1所示,本发明的图像数据库的建立方法,包括步骤:
⑴开始建立图像数据库:采集目标图片,并为每张图片打上名称标签,并把打上标签的目标图片存放进图片集队列;
⑵推出图片集队列的首位图片,如图1所示,推出的该张图片可以用行列式 RGB 11 RGB 12 RGB 13 ... RGB 1 c RGB 21 RGB 22 RGB 23 ... RGB 2 c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . RGB r 1 RGB r 2 RGB r 3 ... RGB r c 的形式表述,其中,RGBrC代表采集到像素点信息,这里r表示行列式的行数,c表示行列式的列数;
⑶提取该首位图片的局部特征点,局部特征点集合可以用坐标集 X 1 Y 1 X 2 Y 2 . . . . . . X n Y n 的形式表述,其中,Xn和Yn为特征点的横坐标和纵坐标;
⑷计算局部特征点的特征值,并将该图片的特征值以一个n×m矩阵 f 11 f 12 f 13 ... f 1 m f 21 f 22 f 23 ... f 2 m . . . . . . . . . . . . . . . f n 1 f n 2 f n 3 ... f n m 的形式表述,fnm代表矩阵的一个元素;
⑸向量化特征值矩阵,具体为:把上述n×m矩阵所表述的数据放进一个向量化引擎中,使得图片的特征点表达为一个低纬度的向量[V1V2...VK];
⑹把低纬度的向量[V1V2...VK]存入特征向量数据库;
⑺如图1所示,判断图片集队列是否为空,若是,则结束,若否,则回到步骤⑵;
其中,m、n和k都是正整数,且k<<n×m。
由于k<<n×m,使得图片的特征值表述的数据量大大减少,节约了内存空间。
在本发明的图像数据库的建立方法的一个优选实施例中,如图2所示,图1中步骤(4)具体包括:
A、加载所有图片的特征矩阵,并合这些特征矩阵形成一个矩阵M,因此每个图片的小矩阵特征值表述变为所有图片的大矩阵特征值表述,该步骤A包括依次按时间顺序排列的步骤A1、A2和A3,A1为:开始,A2为:加载所有图片的特征矩阵,A3为:合并这些特征矩阵形成一个矩阵M;
B、在特征值空间随机生成10000个中心特征值C=[c1c2c3...c10000];
C、取出M的每一行Fi=M[i],找到Fi最邻近的中心特征值cj,包括依次按时间顺序进行的步骤λ1、λ2、λ3和λ4,其中,λ1为i=0,λ2为Fi=M[i],λ3为找到与Fi最邻近的点Cj,λ4为判断i的行数是否小于M的总行数,若是则回到步骤λ2,否则执行步骤D;
D、更新C=[c1c2c3...c10000]里的每一个cj,使得cj是最邻近Fi的几何中心点,具体如依次按时间顺序排列的D1、D2、D3,D1为:i=0,D2为更新cj,使得cj是最邻近Fi的几何中心点,D3为判断i是否小于10000,若是,在回到步骤D1,若否,则执行步骤E;
E、重复步骤C和D,直到每一个cj的位置变化都小于一个预定的阈值,保存中心特征点向量C=[c1c2c3...c10000],其中步骤E步骤按时间顺序排列的E1和E2,步骤E1具体为判断每一个cj的位置变化都小于一个预定的阈值?若是,则执行步骤E2保存中心特征点向量C=[c1c2c3...c10000],否则回到步骤C;
F、包括F1和F2,F1:引入新图片的特征值矩阵M′,F2:对于一个新图片的特征矩阵M′的每一行Fi′=M′[i],找到C=[c1c2c3...c10000]里面与之最邻近的中心点cj
G、计算C=[c1c2c3...c10000]在M′的直方图,得到向量矩阵表达v=[V1V2...VK],并输出向量矩阵v=[V1V2...VK],结束,步骤G具体包括按时间顺序排列的步骤G1、G2、G3,其中,步骤G1为统计每一个cj的数量,并把该数量的数目设成C=[c1c2c3...c10000]在该维度上的值,步骤G2为输出向量,G3为结束;
其中,i是矩阵M的行数,j是cj在C=[c1c2c3...c10000]中序数。
如图3所示,本发明提供的图像识别方法,该图像识别方法基于上述任意一项所述的图像数据库的建立方法,包括步骤:
(8)输入图片,该张图片可以用行列式 RGB 11 RGB 12 RGB 13 ... RGB 1 C RGB 21 RGB 22 RGB 23 ... RGB 2 C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . RGB r 1 RGB r 2 RGB r 3 ... RGB r C 的形式表述;
(9)提取该图片的局部特征点 X 1 Y 1 X 2 Y 2 . . . . . . X n Y n ;
(10)计算特征点特征值,所述特征值采用一个n×m矩阵的形式表述;
(11)向量化输入图片的特征点矩阵表述;
(12)搜索特征向量矩阵数据库以匹配输入的图片的向量化特征点矩阵;
(13)输出匹配结果,完成搜索,其中,输出匹配的结果包括:1、在特征向量数据库中找到了相匹配的图片,则调取相匹配的图片的目录信息,否则,输出未找到匹配的信息,然后结束搜索;
其中,m和n都是正整数。
其中,在图3中步骤(1)-(7)是本发明的第一技术方案的图像数据的建立方法的步骤,对此不做赘述。
本发明提供的图像识别方法,单次搜索的时间得到有效缩短,且由于图像数据库的建立方法特征向量数据库占用内存得到减少,使得图像识别方法可以实现大规模的图像的搜索的实现。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (3)

1.一种图像数据库的建立方法,其特征在于,包括步骤:
⑴采集目标图片,并为每张图片打上名称标签,并把打上标签的目标图片存放进图片集队列;
⑵推出图片集队列的首位图片;
⑶提取所述首位图片的局部特征点;
⑷计算局部特征点的特征值,并将每张图片的特征值以一个n×m矩阵的形式表述;
⑸把上述n×m矩阵所表述的数据放进一个向量化引擎中,使得图片的特征点表达为一个低纬度的向量[V1V2...VK];
⑹把低纬度的向量[V1V2...VK]存入特征向量数据库;
⑺判断图片集队列是否为空,若是,则结束,若否,则回到步骤⑵;
其中,m、n和k都是正整数,且k<<n×m。
2.根据权利要求1所述的图像数据库的建立方法,其特征在于,所述步骤(4)具体包括:
A、加载所有图片的特征矩阵,并合并这些特征矩阵形成一个矩阵M;
B、在特征值空间随机生成10000个中心特征值C=[c1c2c3...c10000];
C、取出M的每一行Fi=M[i],找到Fi最邻近的中心特征值cj
D、更新C=[c1c2c3...c10000]里的每一个cj,使得cj是最邻近Fi的几何中心点;
E、重复步骤C和D,直到每一个cj的位置变化都小于一个预定的阈值,保存中心特征点向量C=[c1c2c3...c10000];
F、对于一个新图片的特征矩阵M′的每一行的Fi′=M′[i],找到C=[c1c2c3...c10000]里面与之最邻近的中心点;
G、计算C=[c1c2c3...c10000]在M′的直方图,得到向量矩阵表达v=[V1V2...VK],并输出向量矩阵v=[V1V2...VK],结束;
其中,i是矩阵M的行数,j是cj在C=[c1c2c3...c10000]中序数。
3.一种图像识别方法,其特征在于,所述图像识别方法基于权利要求1或2所述的图像数据库的建立方法,包括步骤:
(8)输入图片;
(9)提取图片的局部特征点;
(10)计算特征点特征值,所述特征值采用一个n×m矩阵的形式表述;
(11)向量化输入图片的特征点矩阵表述;
(12)搜索特征向量矩阵数据库以匹配输入的图片的向量化特征点矩阵;
(13)输出匹配结果,完成搜索;
其中,m和n都是正整数。
CN201610029172.0A 2016-01-14 2016-01-14 图像数据库的建立方法及图像识别方法 Active CN105718531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610029172.0A CN105718531B (zh) 2016-01-14 2016-01-14 图像数据库的建立方法及图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610029172.0A CN105718531B (zh) 2016-01-14 2016-01-14 图像数据库的建立方法及图像识别方法

Publications (2)

Publication Number Publication Date
CN105718531A true CN105718531A (zh) 2016-06-29
CN105718531B CN105718531B (zh) 2019-12-17

Family

ID=56147616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610029172.0A Active CN105718531B (zh) 2016-01-14 2016-01-14 图像数据库的建立方法及图像识别方法

Country Status (1)

Country Link
CN (1) CN105718531B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844715A (zh) * 2017-02-08 2017-06-13 摩登大道时尚电子商务有限公司 一种图片检索匹配方法和装置
CN109302477A (zh) * 2018-09-30 2019-02-01 武汉斗鱼网络科技有限公司 一种任务的调度方法及相关装置
CN109567600A (zh) * 2018-12-05 2019-04-05 江西书源科技有限公司 家用净水机的配件自动识别方法
WO2021012691A1 (zh) * 2019-07-23 2021-01-28 北京京东振世信息技术有限公司 用于检索图像的方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110317923A1 (en) * 2009-03-04 2011-12-29 Olympus Corporation Method of compiling image database, image database compilation program, image retrieval method
CN103440625A (zh) * 2013-08-16 2013-12-11 浙江大学 基于纹理特征加强的高光谱图像处理方法
CN103902979A (zh) * 2014-04-01 2014-07-02 浙江大学 一种人脸特征提取及分类方法
CN104573681A (zh) * 2015-02-11 2015-04-29 成都果豆数字娱乐有限公司 一种人脸识别方法
CN105243154A (zh) * 2015-10-27 2016-01-13 武汉大学 基于显著点特征和稀疏自编码的遥感图像检索方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110317923A1 (en) * 2009-03-04 2011-12-29 Olympus Corporation Method of compiling image database, image database compilation program, image retrieval method
CN103440625A (zh) * 2013-08-16 2013-12-11 浙江大学 基于纹理特征加强的高光谱图像处理方法
CN103902979A (zh) * 2014-04-01 2014-07-02 浙江大学 一种人脸特征提取及分类方法
CN104573681A (zh) * 2015-02-11 2015-04-29 成都果豆数字娱乐有限公司 一种人脸识别方法
CN105243154A (zh) * 2015-10-27 2016-01-13 武汉大学 基于显著点特征和稀疏自编码的遥感图像检索方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李同宇 等: ""基于特征融合的人脸图像性别识别"", 《智能系统学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844715A (zh) * 2017-02-08 2017-06-13 摩登大道时尚电子商务有限公司 一种图片检索匹配方法和装置
CN109302477A (zh) * 2018-09-30 2019-02-01 武汉斗鱼网络科技有限公司 一种任务的调度方法及相关装置
CN109567600A (zh) * 2018-12-05 2019-04-05 江西书源科技有限公司 家用净水机的配件自动识别方法
WO2021012691A1 (zh) * 2019-07-23 2021-01-28 北京京东振世信息技术有限公司 用于检索图像的方法和装置

Also Published As

Publication number Publication date
CN105718531B (zh) 2019-12-17

Similar Documents

Publication Publication Date Title
CN105718531A (zh) 图像数据库的建立方法及图像识别方法
CN107067020B (zh) 图片识别方法及装置
CN104765876B (zh) 海量gnss小文件云存储方法
CN109145730B (zh) 一种遥感影像中矿区自动语义分割方法
CN106845452B (zh) 基于北斗的高分遥感数据处理方法
CN103049446A (zh) 一种图像检索方法及装置
CN106021575A (zh) 一种视频中同款商品检索方法及装置
CN103473307B (zh) 跨媒体稀疏哈希索引方法
CN103258217A (zh) 一种基于增量学习的行人检测方法
CN110188217A (zh) 图像查重方法、装置、设备和计算机可读储存介质
CN106127748A (zh) 一种图像特征样本数据库及其建立方法
CN103678682B (zh) 基于抽象模板的海量栅格数据处理及管理方法
CN104408479A (zh) 一种基于深度局部特征描述符的海量图像分类方法
CN105808757A (zh) 基于多特征融合的bow模型的中草药植物图片检索方法
CN106875278A (zh) 基于随机森林的社交网络用户画像方法
CN109408767A (zh) 一种面向电网缺失数据的填补方法
CN106919719A (zh) 一种面向大数据的信息补全方法
WO2008098499A1 (en) Searching method based on layout information
CN103473275A (zh) 一种采用多特征融合的图像自动标注方法和系统
CN106203448A (zh) 一种基于非线性尺度空间的场景分类方法
CN108241663A (zh) 一种基于图像检索的图像归类方法
CN101021867A (zh) 一种基于图像金字塔中间层分块的图像检索方法
CN102831187A (zh) 基于内容的图像检索系统
CN105975940A (zh) 一种基于稀疏双向二维局部判别投影的掌纹图像识别方法
CN103886333B (zh) 遥感图像的主动谱聚类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240510

Address after: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Patentee after: Shenzhen Jinzhile Network Technology Co.,Ltd.

Country or region after: China

Address before: No. 22 Qinglan Street, Daxue City, Panyu District, Guangzhou City, Guangdong Province, 511400, National Digital Home Zone B

Patentee before: GUANGZHOU WANLIAN INFORMATION TECHNOLOGY CO.,LTD.

Country or region before: China