CN106227814A - 用于提供图像存储和检索的系统 - Google Patents

用于提供图像存储和检索的系统 Download PDF

Info

Publication number
CN106227814A
CN106227814A CN201610586151.9A CN201610586151A CN106227814A CN 106227814 A CN106227814 A CN 106227814A CN 201610586151 A CN201610586151 A CN 201610586151A CN 106227814 A CN106227814 A CN 106227814A
Authority
CN
China
Prior art keywords
data
storage medium
image
storage
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201610586151.9A
Other languages
English (en)
Inventor
黎海纤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610586151.9A priority Critical patent/CN106227814A/zh
Publication of CN106227814A publication Critical patent/CN106227814A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了用于提供图像存储和检索的系统,其特征是,包含有存储图像的存储设备,所述数据存储设备包括:可用介质计数确定单元,操作介质识别单元,分用途介质指定单元,重构处理执行单元。

Description

用于提供图像存储和检索的系统
技术领域
本发明涉及图像检索领域,具体涉及用于提供图像存储和检索的系统。
背景技术
随着移动互联网、物联网等技术的兴起,全球范围内数据量迅猛增长,大数据时代己经来临。伴随着大数据的产生,其在现代社会和经济活动中发挥着极其重要的作用。
大数据基本都是基于云计算,在这其中,数据的分析以及检索技术,是整个大数据领域的关键支撑技术。大规模数据给传统的多媒体研究,尤其是基于图像的应用和研究带来了新的挑战和机遇。
发明内容
针对上述问题,本发明提供用于提供图像存储和检索的系统。
本发明的目的采用以下技术方案来实现:
用于提供图像存储和检索的系统,其特征是,包含有存储图像的存储设备,所述数据存储设备包括:
可用介质计数确定单元,用于当检测到重构所存储数据的请求时确定可用于处理数据的输入和输出之一的存储介质的数目是否不小于处理数据的输入和输出之一所必需的存储介质的数目加1;
操作介质识别单元,用于当可用于处理数据的输入和输出之一的存储介质的数目不小于处理数据的输入和输出之一所必需的存储介质的数目加1时识别可用存储介质中将被操作的存储介质;
分用途介质指定单元,用于指定将被操作的存储介质之一作为用于重构的存储介质、其它存储介质作为用于处理数据的输入和输出之一的存储介质,并且在每个命令周期中移动对于用于重构的存储介质的指定;
重构处理执行单元,用于按照所述存储介质的指定而彼此并行地执行处理数据的输入和输出之一和用于重构的处理单位的读取,以及在准备了重构所存储数据所必需的所有处理单位的阶段中重构所存储数据并把所重构的所存储数据记录在作为重构目的地的存储介质上。
优选地,其特征是,所述处理数据是大数据尺寸的数据。
优选地,其特征是,所述处理数据是要求高度实时能力的数据。
本发明的有益效果为:通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是用于提供图像存储和检索的系统的示意图。
图2是用于提供图像存储和检索的系统的另一示意图。
具体实施方式
结合以下实施例对本发明作进一步描述。
实施例1:用于提供图像存储和检索的系统,其特征是,包含有存储图像的存储设备,所述数据存储设备包括:
可用介质计数确定单元,用于当检测到重构所存储数据的请求时确定可用于处理数据的输入和输出之一的存储介质的数目是否不小于处理数据的输入和输出之一所必需的存储介质的数目加1;
操作介质识别单元,用于当可用于处理数据的输入和输出之一的存储介质的数目不小于处理数据的输入和输出之一所必需的存储介质的数目加1时识别可用存储介质中将被操作的存储介质;
分用途介质指定单元,用于指定将被操作的存储介质之一作为用于重构的存储介质、其它存储介质作为用于处理数据的输入和输出之一的存储介质,并且在每个命令周期中移动对于用于重构的存储介质的指定;
重构处理执行单元,用于按照所述存储介质的指定而彼此并行地执行处理数据的输入和输出之一和用于重构的处理单位的读取,以及在准备了重构所存储数据所必需的所有处理单位的阶段中重构所存储数据并把所重构的所存储数据记录在作为重构目的地的存储介质上。
优选地,其特征是,所述处理数据是大数据尺寸的数据。
优选地,其特征是,所述处理数据是要求高度实时能力的数据。
优选地,其特征是,图像检索通过以下步骤实现:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记;
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类;
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类;
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果;每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T1=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
在本实施例的用于提供图像存储和检索的系统中,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;T1=0.95,T2=0.78,检索精度提高了50%,检索速度提高了1%。
实施例2:用于提供图像存储和检索的系统,其特征是,包含有存储图像的存储设备,所述数据存储设备包括:
可用介质计数确定单元,用于当检测到重构所存储数据的请求时确定可用于处理数据的输入和输出之一的存储介质的数目是否不小于处理数据的输入和输出之一所必需的存储介质的数目加1;
操作介质识别单元,用于当可用于处理数据的输入和输出之一的存储介质的数目不小于处理数据的输入和输出之一所必需的存储介质的数目加1时识别可用存储介质中将被操作的存储介质;
分用途介质指定单元,用于指定将被操作的存储介质之一作为用于重构的存储介质、其它存储介质作为用于处理数据的输入和输出之一的存储介质,并且在每个命令周期中移动对于用于重构的存储介质的指定;
重构处理执行单元,用于按照所述存储介质的指定而彼此并行地执行处理数据的输入和输出之一和用于重构的处理单位的读取,以及在准备了重构所存储数据所必需的所有处理单位的阶段中重构所存储数据并把所重构的所存储数据记录在作为重构目的地的存储介质上。
优选地,其特征是,所述处理数据是大数据尺寸的数据。
优选地,其特征是,所述处理数据是要求高度实时能力的数据。
优选地,其特征是,图像检索通过以下步骤实现:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记;
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类;
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类;
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果;每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T1=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
在本实施例的用于提供图像存储和检索的系统中,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;T1=0.95,T2=0.78,检索精度提高了50%,检索速度提高了1%。
实施例3:用于提供图像存储和检索的系统,其特征是,包含有存储图像的存储设备,所述数据存储设备包括:
可用介质计数确定单元,用于当检测到重构所存储数据的请求时确定可用于处理数据的输入和输出之一的存储介质的数目是否不小于处理数据的输入和输出之一所必需的存储介质的数目加1;
操作介质识别单元,用于当可用于处理数据的输入和输出之一的存储介质的数目不小于处理数据的输入和输出之一所必需的存储介质的数目加1时识别可用存储介质中将被操作的存储介质;
分用途介质指定单元,用于指定将被操作的存储介质之一作为用于重构的存储介质、其它存储介质作为用于处理数据的输入和输出之一的存储介质,并且在每个命令周期中移动对于用于重构的存储介质的指定;
重构处理执行单元,用于按照所述存储介质的指定而彼此并行地执行处理数据的输入和输出之一和用于重构的处理单位的读取,以及在准备了重构所存储数据所必需的所有处理单位的阶段中重构所存储数据并把所重构的所存储数据记录在作为重构目的地的存储介质上。
优选地,其特征是,所述处理数据是大数据尺寸的数据。
优选地,其特征是,所述处理数据是要求高度实时能力的数据。
优选地,其特征是,图像检索通过以下步骤实现:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记;
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类;
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类;
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果;每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T1=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
在本实施例的用于提供图像存储和检索的系统中,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;T1=0.95,T2=0.78,检索精度提高了50%,检索速度提高了1%。
实施例4:用于提供图像存储和检索的系统,其特征是,包含有存储图像的存储设备,所述数据存储设备包括:
可用介质计数确定单元,用于当检测到重构所存储数据的请求时确定可用于处理数据的输入和输出之一的存储介质的数目是否不小于处理数据的输入和输出之一所必需的存储介质的数目加1;
操作介质识别单元,用于当可用于处理数据的输入和输出之一的存储介质的数目不小于处理数据的输入和输出之一所必需的存储介质的数目加1时识别可用存储介质中将被操作的存储介质;
分用途介质指定单元,用于指定将被操作的存储介质之一作为用于重构的存储介质、其它存储介质作为用于处理数据的输入和输出之一的存储介质,并且在每个命令周期中移动对于用于重构的存储介质的指定;
重构处理执行单元,用于按照所述存储介质的指定而彼此并行地执行处理数据的输入和输出之一和用于重构的处理单位的读取,以及在准备了重构所存储数据所必需的所有处理单位的阶段中重构所存储数据并把所重构的所存储数据记录在作为重构目的地的存储介质上。
优选地,其特征是,所述处理数据是大数据尺寸的数据。
优选地,其特征是,所述处理数据是要求高度实时能力的数据。
优选地,其特征是,图像检索通过以下步骤实现:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记;
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类;
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类;
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果;每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T1=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
在本实施例的用于提供图像存储和检索的系统中,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;T1=0.95,T2=0.78,检索精度提高了50%,检索速度提高了1%。
实施例5:用于提供图像存储和检索的系统,其特征是,包含有存储图像的存储设备,所述数据存储设备包括:
可用介质计数确定单元,用于当检测到重构所存储数据的请求时确定可用于处理数据的输入和输出之一的存储介质的数目是否不小于处理数据的输入和输出之一所必需的存储介质的数目加1;
操作介质识别单元,用于当可用于处理数据的输入和输出之一的存储介质的数目不小于处理数据的输入和输出之一所必需的存储介质的数目加1时识别可用存储介质中将被操作的存储介质;
分用途介质指定单元,用于指定将被操作的存储介质之一作为用于重构的存储介质、其它存储介质作为用于处理数据的输入和输出之一的存储介质,并且在每个命令周期中移动对于用于重构的存储介质的指定;
重构处理执行单元,用于按照所述存储介质的指定而彼此并行地执行处理数据的输入和输出之一和用于重构的处理单位的读取,以及在准备了重构所存储数据所必需的所有处理单位的阶段中重构所存储数据并把所重构的所存储数据记录在作为重构目的地的存储介质上。
优选地,其特征是,所述处理数据是大数据尺寸的数据。
优选地,其特征是,所述处理数据是要求高度实时能力的数据。
优选地,其特征是,图像检索通过以下步骤实现:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记;
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类;
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类;
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果;每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T1=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
在本实施例的用于提供图像存储和检索的系统中,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;T1=0.95,T2=0.78,检索精度提高了50%,检索速度提高了1%。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (3)

1.用于提供图像存储和检索的系统,其特征是,包含有存储图像的存储设备,所述数据存储设备包括:
可用介质计数确定单元,用于当检测到重构所存储数据的请求时确定可用于处理数据的输入和输出之一的存储介质的数目是否不小于处理数据的输入和输出之一所必需的存储介质的数目加1;
操作介质识别单元,用于当可用于处理数据的输入和输出之一的存储介质的数目不小于处理数据的输入和输出之一所必需的存储介质的数目加1时识别可用存储介质中将被操作的存储介质;
分用途介质指定单元,用于指定将被操作的存储介质之一作为用于重构的存储介质、其它存储介质作为用于处理数据的输入和输出之一的存储介质,并且在每个命令周期中移动对于用于重构的存储介质的指定;
重构处理执行单元,用于按照所述存储介质的指定而彼此并行地执行处理数据的输入和输出之一和用于重构的处理单位的读取,以及在准备了重构所存储数据所必需的所有处理单位的阶段中重构所存储数据并把所重构的所存储数据记录在作为重构目的地的存储介质上。
2.根据权利要求1所述的用于提供图像存储和检索的系统,其特征是,所述处理数据是大数据尺寸的数据。
3.根据权利要求2所述的用于提供图像存储和检索的系统,其特征是,所述处理数据是要求高度实时能力的数据。
CN201610586151.9A 2016-07-22 2016-07-22 用于提供图像存储和检索的系统 Withdrawn CN106227814A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610586151.9A CN106227814A (zh) 2016-07-22 2016-07-22 用于提供图像存储和检索的系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610586151.9A CN106227814A (zh) 2016-07-22 2016-07-22 用于提供图像存储和检索的系统

Publications (1)

Publication Number Publication Date
CN106227814A true CN106227814A (zh) 2016-12-14

Family

ID=57531422

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610586151.9A Withdrawn CN106227814A (zh) 2016-07-22 2016-07-22 用于提供图像存储和检索的系统

Country Status (1)

Country Link
CN (1) CN106227814A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944454A (zh) * 2017-11-08 2018-04-20 国网电力科学研究院武汉南瑞有限责任公司 一种针对变电站的基于机器学习的语义标注方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944454A (zh) * 2017-11-08 2018-04-20 国网电力科学研究院武汉南瑞有限责任公司 一种针对变电站的基于机器学习的语义标注方法
CN107944454B (zh) * 2017-11-08 2021-09-14 国网电力科学研究院武汉南瑞有限责任公司 一种针对变电站的基于机器学习的语义标注方法

Similar Documents

Publication Publication Date Title
Schönberger et al. A vote-and-verify strategy for fast spatial verification in image retrieval
Bampis et al. Fast loop-closure detection using visual-word-vectors from image sequences
CN102693311B (zh) 基于随机化视觉词典组和上下文语义信息的目标检索方法
CN102693299B (zh) 一种并行视频拷贝检测系统和方法
Guan et al. On-device mobile visual location recognition by integrating vision and inertial sensors
CN106407311A (zh) 获取搜索结果的方法和装置
CN103886048B (zh) 一种基于聚类的增量数字图书推荐方法
CN103810299A (zh) 基于多特征融合的图像检索方法
CN105593851A (zh) 用于跟踪与通过关联的文本和图像可识别的实体相关的微博消息的方法和装置
CN103309869B (zh) 数据对象的展示关键词推荐方法及系统
CN104112005B (zh) 分布式海量指纹识别方法
CN104199842A (zh) 一种基于局部特征邻域信息的相似图片检索方法
CN104462199A (zh) 一种网络环境下的近似重复图像搜索方法
CN102693316B (zh) 基于线性泛化回归模型的跨媒体检索方法
CN103218825A (zh) 一种尺度不变的时空兴趣点快速检测方法
CN109359300A (zh) 基于深度学习的医学文献中关键词筛选方法及装置
CN105843925A (zh) 一种基于改进bow算法的相似图片搜索方法
CN106203165B (zh) 基于可信云计算的信息大数据分析支撑方法
An et al. Hypergraph propagation and community selection for objects retrieval
Agrawal et al. A novel algorithm for automatic document clustering
CN108984711A (zh) 一种基于分层嵌入的个性化app推荐方法
CN103345511B (zh) 一种基于稀疏表达的遥感图像检索方法
CN106776910A (zh) 一种搜索结果的显示方法及装置
CN108563794A (zh) 基于高阶奇异值分解的上下文推荐方法及装置
CN106294550A (zh) 一种遥感图像智能检索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C04 Withdrawal of patent application after publication (patent law 2001)
WW01 Invention patent application withdrawn after publication

Application publication date: 20161214