CN106844725A - 一种云端图像数据库生成及识别方法 - Google Patents

一种云端图像数据库生成及识别方法 Download PDF

Info

Publication number
CN106844725A
CN106844725A CN201710073065.2A CN201710073065A CN106844725A CN 106844725 A CN106844725 A CN 106844725A CN 201710073065 A CN201710073065 A CN 201710073065A CN 106844725 A CN106844725 A CN 106844725A
Authority
CN
China
Prior art keywords
image
description
data base
tree
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710073065.2A
Other languages
English (en)
Inventor
施茂燊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Mizhi Technology Co ltd
Original Assignee
Qianhai Shenzhen Da Cheng Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qianhai Shenzhen Da Cheng Technology Co Ltd filed Critical Qianhai Shenzhen Da Cheng Technology Co Ltd
Priority to CN201710073065.2A priority Critical patent/CN106844725A/zh
Publication of CN106844725A publication Critical patent/CN106844725A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Abstract

本发明公开了一种云端图像数据库生成及识别方法,其生成方法包括描述子生成步骤:收集图像,提取每张图像的ORB特征点,并对每个ORB特征点生成相应的描述子以得到描述子样本;树状模型生成步骤:根据描述子样本生成图像数据库的树状模型;数据库生成步骤:向树状模型中添加图像,建立树状结构的图像数据库;采用该方法可有效解决网络较差对识别的速度影响;且在图像数据库容量增长时,检索时间的增长从线性减少至对数级别,极大的减少了对超大规模图像数据库的平均单次检索时间,支持超大规模的图像数据库。

Description

一种云端图像数据库生成及识别方法
技术领域
本发明涉及图像识别技术领域,具体涉及一种云端图像数据库生成及识别方法。
背景技术
实时图像搜索是一种可以支持用户自定义的,超大规模的图像数据库的实时图像识别技术。它可以实现对移动端设备的图像输入内容进行实时的识别。整个识别过程是在云端进行的,这样可以使用户无需将庞大的图像数据库下载到本地,并且也可以充分地利用云端计算资源对数据库进行高速的检索。
然而,目前基于云端的实时图像识别技术其通过上传本地图片到服务器,服务器将带识别的图片与存储的图片逐一进行比较,其存在以下缺陷:
其一,在无线网络较差的情况下,用户实时上传图像的速度会受到很大影响;
其二,在对云端数据库进行检索时,在保证一定准确度的前提下,其检索速度和广度存在矛盾,这两点都与云端图像数据库的大小密切相关;
其三,当数据库中的图像增多时,搜索广度会增加,而随之线性增加则是每次搜索所需要的时间,这样就使得实时图像搜索系统无法很好的支持超大规模的图像数据库。
发明内容
本发明为了解决上述技术问题提供一种云端图像数据库生成及识别方法。
本发明通过下述技术方案实现:
一种云端图像数据库生成方法,包括以下步骤,
描述子生成步骤:收集图像,提取每张图像的ORB特征点,并对每个ORB特征点生成相应的描述子以得到描述子样本;
树状模型生成步骤:根据描述子样本生成图像数据库的树状模型;
数据库生成步骤:向树状模型中添加图像,建立树状结构的图像数据库。
所述描述子生成步骤具体为:收集图像,分别对每张图像进行缩放以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子。
所述树状模型生成步骤为:利用描述子之间的欧式距离作为判据,对描述子样本用K-means算法做聚合分类,生成图像数据库的树状模型。
所述树状模型生成步骤具体为:
A1、定义一个树状结构,其最大层数为L,每层最大子节点数为K;
A2、对描述子样本用K-means算法做聚合分类,得到子节点分类结果,将每个子节点内所有描述子的平均描述子作为该子节点的描述子;
A3、若该子节点内描述子样本的数量大于K的两倍,则对该子节点内的描述子样本作进一步的K-means分类,重复该步骤,直至树状结构的最大层数小于等于L或者没有子节点的描述子样本数量大于K的两倍;
A4、对所有的子节点依次排序标号,生成图像数据库的树状模型。
所述数据库生成步骤为:
B1、给图像一个唯一的编号;
B2、对该图像进行缩放以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子;
B3、将该图像的所有描述子利用树状模型进行分类,并将每个描述子的分类结果关联在其分配到的子节点上;
B4、对每一张图像做B1至B3的步骤,得到具有树状结构的图像数据库。
一种云端图像数据库识别方法,包括以下步骤,
图像获取步骤:获取目标图像,并对该目标图像使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,生成目标图像的ORB描述子序列;
图像上传步骤:将该ORB描述子序列上传到上述方法生成的云端图像数据库中;
图像识别步骤:云端图像数据库利用检索词汇树的检索算法对图像进行匹配并返回ID结果。
传统的图像匹配是图像和图像之间的匹配,检索的时间的增加随着图像的增加线性增长。一个特征描述子到数据库里匹配所有特征描述子,传统图像的暴力匹配,数据库里的描述子越多,匹配的时间就越长,因为暴力匹配是一一匹配,最后寻找距离最短的匹配组。采用本方法,由于数据库中的描述子已经进行树状分类,在进行匹配的时候,待匹配的描述子会寻找与其最相似的分支,而不需要遍历真个数据库。因此能极大的解决检索速度的问题。对于新加入图像描述子会加入相应的分支,而不是单纯的增加,因此在广度上也能很好的解决大数据库的检索情况。
所述图像识别步骤具体为:利用检索词汇树的检索算法在图像数据库中寻找该图像的最佳匹配,并返回最佳匹配的编号。
本发明与现有技术相比,具有如下的优点和有益效果:
1、本发明通过提取图像的特征点来生成描述子,从而构建树状的图像数据库,在识别目标图像时,通过对目标图像描述子的提取实现检索匹配,相比于图像,描述子的数据量小,网络较差对识别的速度影响小;在图像数据库容量增长的同时,使得检索时间的增长从线性减少至对数级别,极大的减少了对超大规模图像数据库的平均单次检索时间,支持超大规模的图像数据库。
2、本发明的方法,其树状检索结构可以让待匹配的特征描述子不用一一匹配所有的描述子,检索时间主要跟经过的节点数有关系,数据库中的描述子多不代表检索经过的节点数越多,使得检索时间不是按数据库的大小线性增加,而是对数增长,大大提高检索速度。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
一种云端图像数据库生成方法,包括以下步骤,
描述子生成步骤:收集图像,提取每张图像的ORB特征点,并对每个ORB特征点生成相应的描述子以得到描述子样本;
树状模型生成步骤:根据描述子样本生成图像数据库的树状模型;
数据库生成步骤:向树状模型中添加图像,建立树状结构的图像数据库。
具体的:
在描述子生成步骤中,收集的图像数量要多且来自各种场景,一般需要几万张,其存放在一个文件夹内,常用的图像格式均可,譬如JPG、JPEG、JPE、JFIF、BMP;分别对每张图像进行一定的缩放比例以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子。对收集到的每个图像均做该步骤的处理,ORB特征点的描述子是一个128位的二进制序列。
在树状模型生成步骤中,利用描述子之间的欧式距离作为判据,对描述子样本用K-means算法做聚合分类,生成图像数据库的树状模型。树状模型生成后一般不做改动。较为详细的,可采用下述步骤方法:
A1、定义一个树状结构,其最大层数为L,每层最大子节点数为K;
A2、对描述子样本用K-means算法做聚合分类,得到子节点分类结果,将每个子节点内所有描述子的平均描述子作为该子节点的描述子;
A3、若该子节点内描述子样本的数量大于K的两倍,则对该子节点内的描述子样本作进一步的K-means分类,重复该步骤,直至树状结构的最大层数小于等于L或者没有子节点的描述子样本数量大于K的两倍;
A4、在所有的K-means分类结束后,对所有的子节点从左到右依次排序标号,生成图像数据库的树状模型。
向树状模型中添加所有需要的图像数据以形成图像数据库,将需要添加到树状模型中的图像存放在同一文件夹里,具体的可采用下述步骤:
B1、向树状模型中添加一张图像的时,给该图像一个唯一的编号;
B2、对该图像进行缩放以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,这样就获得了可以代表这张图像特征的一个ORB描述子序列;
B3、将该图像的所有描述子利用树状模型进行分类,并将每个描述子的分类结果关联在其分配到的子节点上;分类完成后,树状模型的每一个子节点上就会记录该编号的图像所具有的描述子在各节点分别出现了几次,而该编号图像也会存储其描述子在那些序号的子节点上分别出现了多少次;
B4、对每一张图像做B1至B3的步骤,得到具有树状结构的图像数据库。使用者可根据自身的需求,随时任意的向数据库中增加或删除图像。
按上述步骤方法生成了云端图像数据库,用户需要对图像进行识别时,可采用下列方法。
实施例2
一种云端图像数据库识别方法,包括以下步骤,
图像获取步骤:获取目标图像,并对该目标图像使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,生成该目标图像的ORB描述子序列;
图像上传步骤:将该ORB描述子序列上传到按实施例1的方法生成的云端图像数据库中;
图像识别步骤:云端图像数据库利用检索词汇树的检索算法对图像进行匹配并返回编号结果。
具体的,用户在使用实时图像识别系统时,用户的移动端设备每采集到一帧目标图像,会先对采集到的目标图像使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,生成该目标图像的ORB描述子序列,并将此序列发送到云端。与采集到的目标图像相比,ORB描述子序列的数据量会小非常多。
云端收到ORB描述子序列后,即开始利用检索词汇树的检索算法,在已生成的树形图像数据库中寻找该图像的最佳匹配,并返回匹配得分和匹配结果图像在数据库中的编号。每一次检索,可以生成一个可自定义长度的按照匹配得分高低排列匹配结果编号序列,然后将匹配得分最高项作为结果发回给用户。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种云端图像数据库生成方法,其特征在于,包括以下步骤,
描述子生成步骤:收集图像,提取每张图像的ORB特征点,并对每个ORB特征点生成相应的描述子以得到描述子样本;
树状模型生成步骤:根据描述子样本生成图像数据库的树状模型;
数据库生成步骤:向树状模型中添加图像,建立树状结构的图像数据库。
2.根据权利要求1所述的一种云端图像数据库生成方法,其特征在于,所述描述子生成步骤具体为:收集图像,分别对每张图像进行缩放以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子。
3.根据权利要求1所述的一种云端图像数据库生成方法,其特征在于,所述树状模型生成步骤为:利用描述子之间的欧式距离作为判据,对描述子样本用K-means算法做聚合分类,生成图像数据库的树状模型。
4.根据权利要求3所述的一种云端图像数据库生成方法,其特征在于,所述树状模型生成步骤具体为:
A1、定义一个树状结构,其最大层数为L,每层最大子节点数为K;
A2、对描述子样本用K-means算法做聚合分类,得到子节点分类结果,将每个子节点内所有描述子的平均描述子作为该子节点的描述子;
A3、若该子节点内描述子样本的数量大于K的两倍,则对该子节点内的描述子样本作进一步的K-means分类,重复该步骤,直至树状结构的最大层数小于等于L或者没有子节点的描述子样本数量大于K的两倍;
A4、对所有的子节点依次排序标号,生成图像数据库的树状模型。
5.根据权利要求1所述的一种云端图像数据库生成方法,其特征在于,所述数据库生成步骤为:
B1、给图像一个唯一的编号;
B2、对该图像进行缩放以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子;
B3、将该图像的所有描述子利用树状模型进行分类,并将每个描述子的分类结果关联在其分配到的子节点上;
B4、对每一张图像做B1至B3的步骤,得到具有树状结构的图像数据库。
6.一种云端图像数据库识别方法,其特征在于,包括以下步骤,
图像获取步骤:获取目标图像,并对该目标图像使用ORB算法提取所有ORB特征点,
并对每一个ORB特征点生成相应的描述子,生成目标图像的ORB描述子序列;
图像上传步骤:将该ORB描述子序列上传到按权利要求1至5任一权利要求的方法生成的云端图像数据库中;
图像识别步骤:云端图像数据库利用检索词汇树的检索算法对图像进行匹配并返回ID结果。
7.根据权利要求1所述的一种云端图像数据库生成方法,其特征在于,所述图像识别步骤具体为:利用检索词汇树的检索算法在图像数据库中寻找该图像的最佳匹配,并返回最佳匹配的编号。
CN201710073065.2A 2017-02-10 2017-02-10 一种云端图像数据库生成及识别方法 Pending CN106844725A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710073065.2A CN106844725A (zh) 2017-02-10 2017-02-10 一种云端图像数据库生成及识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710073065.2A CN106844725A (zh) 2017-02-10 2017-02-10 一种云端图像数据库生成及识别方法

Publications (1)

Publication Number Publication Date
CN106844725A true CN106844725A (zh) 2017-06-13

Family

ID=59121691

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710073065.2A Pending CN106844725A (zh) 2017-02-10 2017-02-10 一种云端图像数据库生成及识别方法

Country Status (1)

Country Link
CN (1) CN106844725A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113555090A (zh) * 2021-07-21 2021-10-26 李真林 影像设备扫描知识库构建方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200913939A (en) * 2007-09-28 2009-04-01 Ensky Technology Co Ltd Image display apparatus and method therefor
US20090297018A1 (en) * 2007-11-07 2009-12-03 The Board Of Trustees Of The Leland Stanford Junior University Image reconstruction with incomplete fourier-space magnitude data combined with real-space information
CN102426019A (zh) * 2011-08-25 2012-04-25 航天恒星科技有限公司 一种无人机景象匹配辅助导航方法及系统
CN102831405A (zh) * 2012-08-16 2012-12-19 北京理工大学 基于分布式和暴力匹配的室外大规模物体识别方法和系统
CN103020628A (zh) * 2012-11-30 2013-04-03 北京理工大学 一种基于rgb对比图像与目标形状的烟雾检测方法
CN103426186A (zh) * 2013-09-05 2013-12-04 山东大学 一种改进的surf快速匹配方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200913939A (en) * 2007-09-28 2009-04-01 Ensky Technology Co Ltd Image display apparatus and method therefor
US20090297018A1 (en) * 2007-11-07 2009-12-03 The Board Of Trustees Of The Leland Stanford Junior University Image reconstruction with incomplete fourier-space magnitude data combined with real-space information
CN102426019A (zh) * 2011-08-25 2012-04-25 航天恒星科技有限公司 一种无人机景象匹配辅助导航方法及系统
CN102831405A (zh) * 2012-08-16 2012-12-19 北京理工大学 基于分布式和暴力匹配的室外大规模物体识别方法和系统
CN103020628A (zh) * 2012-11-30 2013-04-03 北京理工大学 一种基于rgb对比图像与目标形状的烟雾检测方法
CN103426186A (zh) * 2013-09-05 2013-12-04 山东大学 一种改进的surf快速匹配方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113555090A (zh) * 2021-07-21 2021-10-26 李真林 影像设备扫描知识库构建方法及系统

Similar Documents

Publication Publication Date Title
CN106874445A (zh) 基于词汇树检索与相似度验证的云端图像识别方法
CN109241317B (zh) 基于深度学习网络中度量损失的行人哈希检索方法
CN103617217B (zh) 一种基于层次索引的图像检索方法及系统
JP3494368B2 (ja) 動映像の検索、ブラウジングまたは要約を行うための動映像表現方法と、その処理装置および処理方法
US10949467B2 (en) Random draw forest index structure for searching large scale unstructured data
CN106844726A (zh) 一种基于词汇树检索与暴力匹配的图像识别方法
US11106708B2 (en) Layered locality sensitive hashing (LSH) partition indexing for big data applications
CN102364498A (zh) 一种基于多标签的图像识别方法
CN106815362A (zh) 一种基于kpca多表索引图像哈希检索方法
CN109710792B (zh) 一种基于索引的快速人脸检索系统应用
CN107180079B (zh) 基于卷积神经网络以及树与哈希结合索引的图像检索方法
CN107392238A (zh) 基于移动视觉搜索的户外植物知识拓展学习系统
WO2023108995A1 (zh) 向量相似度计算方法、装置、设备及存储介质
CN110502664A (zh) 视频标签索引库创建方法、视频标签生成方法及装置
CN111125469B (zh) 一种社交网络的用户聚类方法、装置以及计算机设备
Wang et al. Duplicate discovery on 2 billion internet images
CN111709303A (zh) 一种人脸图像的识别方法和装置
CN108319518A (zh) 基于循环神经网络的文件碎片分类方法及装置
CN112434553A (zh) 一种基于深度字典学习的视频鉴别方法及系统
KR101675785B1 (ko) 특징점을 이용한 영상 검색 방법 및 상기 방법을 수행하는 장치
CN104156362B (zh) 一种大规模图像特征点匹配方法
CN113010705B (zh) 标签预测方法、装置、设备及存储介质
CN108764258B (zh) 一种用于群体图像插入的最优图像集选取方法
CN106844725A (zh) 一种云端图像数据库生成及识别方法
CN109918529A (zh) 一种基于树形聚类矢量量化的图像检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant after: Shenzhen Qianhai Rui Fu Technology Co.,Ltd.

Address before: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant before: SHENZHEN DARSEEK TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
TA01 Transfer of patent application right

Effective date of registration: 20180801

Address after: 610000 12, A District, 4 building 200, Tianfu five street, hi tech Zone, Chengdu, Sichuan.

Applicant after: Chengdu Mizhi Technology Co.,Ltd.

Address before: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant before: Shenzhen Qianhai Rui Fu Technology Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20170613

RJ01 Rejection of invention patent application after publication