CN103902595A - 一种构建数据库的方法和装置 - Google Patents

一种构建数据库的方法和装置 Download PDF

Info

Publication number
CN103902595A
CN103902595A CN201210581276.4A CN201210581276A CN103902595A CN 103902595 A CN103902595 A CN 103902595A CN 201210581276 A CN201210581276 A CN 201210581276A CN 103902595 A CN103902595 A CN 103902595A
Authority
CN
China
Prior art keywords
picture
database
retrieved
hash
hashed value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210581276.4A
Other languages
English (en)
Other versions
CN103902595B (zh
Inventor
杨志宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Feinno Communication Technology Co Ltd
Original Assignee
Beijing Feinno Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Feinno Communication Technology Co Ltd filed Critical Beijing Feinno Communication Technology Co Ltd
Priority to CN201210581276.4A priority Critical patent/CN103902595B/zh
Publication of CN103902595A publication Critical patent/CN103902595A/zh
Application granted granted Critical
Publication of CN103902595B publication Critical patent/CN103902595B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种构建数据库的方法和装置,属于网络通信领域。方法包括:将分类后的数据库图片的基本信息保存到图片基本信息表中;提取每张数据库图片的数据库图片特征,将数据库图片特征以及数据库图片索引保存到图片特征表中;通过LSH算法对在图片特征表中保存的每张数据库图片的数据库图片特征进行散列,生成数据库图片散列值;将每个数据库图片散列值以及数据库图片索引保存到每个散列表中。本发明解决了目前还没有通用的数据库结构设计可以支持各种LSH算法的问题,进而无法更好的发挥LSH在相似性检索中的优势。

Description

一种构建数据库的方法和装置
技术领域
本发明涉及网络通信领域,特别涉及一种构建数据库的方法和装置。
背景技术
随着网络通信技术的飞速发展,网络中的数据量越来越大,检索相似信息的难度也越来越大。其中,图片的相似搜索由于可以实现网络图片自动排重、相关图片推荐等效果而得到广泛应用,而构建数据库以实现相似检索也就越来越必要。
目前,图片相似搜索的方法有tree类相似算法,如R-tree,Kd-tree,SR-tree,是基于空间划分的算法,检索的结果虽然精确但是在高维数据集上的时间效率不高。
LSH(Location Sensitive Hash,位置敏感哈希函数)算法,由于与一般哈希函数相比具有位置敏感性,对散列前的相似点进行哈希计算,之后产生的散列值在一定程度上也能保持相似,并且具有一定的概率保证。这样LSH算法能够在保证一定准确性的前提下,时间和空间复杂度得到降低,并且能够很好地支持高维数据的检索,因此LSH算法在含有丰富特征信息的图片相似性领域中的应用越来越受到重视。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
目前,存在各种类型的LSH算法,但还没有通用的数据库结构设计可以支持各种LSH算法,进而无法更好的发挥LSH在相似性检索中的优势。
发明内容
为了解决目前没有通用的数据库结构设计支持各种LSH算法的问题,本发明实施例提供了一种构建数据库的方法和装置。所述技术方案如下:
一方面,提供了一种构建数据库的方法,所述方法包括:
将分类后的数据库图片的基本信息保存到图片基本信息表中;所述图片基本信息表中包括所述数据库图片的图片名字、图片类型、图片入库时间、数据库图片索引和图片的信息摘要算法MD5值;其中,所述数据库图片索引是数据库图片的标识;
提取每张所述数据库图片的数据库图片特征,将所述数据库图片特征以及所述数据库图片索引保存到图片特征表中;
通过位置敏感哈希函数LSH算法对在所述图片特征表中保存的每张数据库图片的数据库图片特征进行散列,生成数据库图片散列值;其中,所述数据库图片散列值的个数与预设的散列表个数相等;
将每个所述数据库图片散列值以及所述数据库图片索引保存到每个所述散列表中。
具体地,所述将每个所述数据库图片散列值以及所述数据库图片索引保存到每个所述散列表中之后,包括:
加载每个所述散列表;
提取待检索图片的待检索图片特征,并通过所述LSH算法对所述待检索图片特征进行散列,生成待检索图片散列值;其中,生成的每个所述待检索图片散列值与所述加载的散列表相对应;
在与所述每个待检索图片散列值对应的散列表中查找与所述待检索图片散列值匹配相似的数据库图片散列值;
根据查找到的与所述待检索图片散列值匹配相似的数据库图片散列值查找对应的数据库图片索引,并根据所述数据库图片索引查找与所述待检索图片散列值匹配相似的数据库图片的基本信息。
进一步地,所述在与所述每个待检索图片散列值对应的散列表中查找与所述待检索图片散列值匹配相似的数据库图片散列值,包括:
在所述每个散列表中查找与所述待检索图片散列值相同的散列值;
和/或,
在所述每个散列表中查找与所述待检索图片散列值达到预设相似度的散列值。
进一步地,所述根据所述数据库图片索引查找与所述待检索图片散列值匹配相似的数据库图片的基本信息之后,还包括:
从与所述待检索图片散列值匹配相似的数据库图片的基本信息中选择预设个数的数据库图片基本信息。
其中,所述待检索图片特征与所述数据库图片特征的个数和类型相同,所述待检索图片特征以及所述数据库图片特征包括:图片颜色、纹理共生矩阵、形状特征及纹理直方图特征。
另一方面,提供了一种构建数据库的装置,所述装置包括:
图片基本信息表模块,用于将分类后的数据库图片的基本信息保存到图片基本信息表中;所述图片基本信息表中包括所述数据库图片的图片名字、图片类型、图片入库时间、数据库图片索引和图片的信息摘要算法MD5值;其中,所述数据库图片索引是数据库图片的标识;
图片特征表模块,用于提取每张所述数据库图片的数据库图片特征,将所述数据库图片特征以及所述数据库图片索引保存到图片特征表中;
散列表模块,用于通过位置敏感哈希函数LSH算法对在所述图片特征表中保存的每张数据库图片的数据库图片特征进行散列,生成数据库图片散列值;其中,所述数据库图片散列值的个数与预设的散列表个数相等;将每个所述数据库图片散列值以及所述数据库图片索引保存到每个所述散列表中。
具体地,所述装置还包括:
加载模块,用于将每个所述数据库图片散列值以及所述数据库图片索引保存到每个所述散列表中之后,加载每个所述散列表;
散列模块,用于提取待检索图片的待检索图片特征,并通过所述LSH算法对所述待检索图片特征进行散列,生成待检索图片散列值;其中,生成的每个所述待检索图片散列值与所述加载的散列表相对应;
匹配模块,用于在与所述每个待检索图片散列值对应的散列表中查找与所述待检索图片散列值匹配相似的数据库图片散列值;
检索模块,用于根据查找到的与所述待检索图片散列值匹配相似的数据库图片散列值查找对应的数据库图片索引,并根据所述数据库图片索引查找与所述待检索图片散列值匹配相似的数据库图片的基本信息。
进一步地,所述匹配模块,包括:
第一匹配单元,用于在所述每个散列表中查找与所述待检索图片散列值相同的散列值;
和/或,
第二匹配单元,用于在所述每个散列表中查找与所述待检索图片散列值达到预设相似度的散列值。
进一步地,所述检索模块,还用于根据所述数据库图片索引查找与所述待检索图片散列值匹配相似的数据库图片的基本信息之后,从与所述待检索图片散列值匹配相似的数据库图片的基本信息中选择预设个数的数据库图片基本信息。
其中,所述待检索图片特征与所述数据库图片特征的个数和类型相同,所述待检索图片特征以及所述数据库图片特征包括:图片颜色、纹理共生矩阵、形状特征及纹理直方图特征。
本发明实施例提供的技术方案带来的有益效果是:
通过将数据库图片的基本信息保存到图片基本信息表中;提取每张数据库图片的数据库图片特征,将数据库图片特征以及数据库图片索引保存到图片特征表中;通过LSH算法对在图片特征表中保存的数据库图片特征进行散列,生成数据库图片散列值,将每个数据库图片散列值以及数据库图片索引对应的保存到每个散列表中,解决了目前还没有通用的数据库结构设计可以支持各种LSH算法的问题,进而无法更好的发挥LSH在相似性检索中的优势。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的数据库设计方法流程图;
图2是本发明实施例二提供的数据库设计方法流程图;
图3是本发明实施例二提供的图片基本信息表示意图;
图4是本发明实施例二提供的图片特征表示意图;
图5是本发明实施例二提供的散列表示意图;
图6是本发明实施例三提供的数据库设计装置第一种结构示意图;
图7是本发明实施例三提供的数据库设计装置第二种结构示意图;
图8是本发明实施例三提供的数据库设计装置第三种结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一
参见图1,本发明实施例提供了一种构建数据库的方法,该方法包括:
101、将分类后的数据库图片的基本信息保存到图片基本信息表中;图片基本信息表中包括数据库图片的图片名字、图片类型、图片入库时间、数据库图片索引和图片的信息摘要算法MD5值;其中,数据库图片索引是数据库图片的标识;
102、提取每张数据库图片的数据库图片特征,将数据库图片特征以及数据库图片索引保存到图片特征表中;
103、通过位置敏感哈希函数LSH算法对在图片特征表中保存的每张数据库图片的数据库图片特征进行散列,生成数据库图片散列值;其中,数据库图片散列值的个数与预设的散列表个数相等;
104、将每个数据库图片散列值以及数据库图片索引保存到每个散列表中。
具体地,将每个数据库图片散列值以及数据库图片索引保存到每个散列表中之后,包括:
加载每个散列表;
提取待检索图片的待检索图片特征,并通过LSH算法对待检索图片特征进行散列,生成待检索图片散列值;其中,生成的每个待检索图片散列值与加载的散列表相对应;
在与每个待检索图片散列值对应的散列表中查找与待检索图片散列值匹配相似的数据库图片散列值;
根据查找到的与待检索图片散列值匹配相似的数据库图片散列值查找对应的数据库图片索引,并根据数据库图片索引查找与待检索图片散列值匹配相似的数据库图片的基本信息。
进一步地,在与每个待检索图片散列值对应的散列表中查找与待检索图片散列值匹配相似的数据库图片散列值,包括:
在每个散列表中查找与待检索图片散列值相同的散列值;
和/或,
在每个散列表中查找与待检索图片散列值达到预设相似度的散列值。
进一步地,根据数据库图片索引查找与待检索图片散列值匹配相似的数据库图片的基本信息之后,还包括:
从与待检索图片散列值匹配相似的数据库图片的基本信息中选择预设个数的数据库图片基本信息。
其中,待检索图片特征与数据库图片特征的个数和类型相同,待检索图片特征以及数据库图片特征包括:图片颜色、纹理共生矩阵、形状特征及纹理直方图特征。
本发明实施例提供的方法,通过将数据库图片的基本信息保存到图片基本信息表中;提取每张数据库图片的数据库图片特征,将数据库图片特征以及数据库图片索引保存到图片特征表中;通过LSH算法对在图片特征表中保存的数据库图片特征进行散列,生成数据库图片散列值,将每个数据库图片散列值以及数据库图片索引对应的保存到每个散列表中,解决了目前还没有通用的数据库结构设计可以支持各种LSH算法的问题,进而无法更好的发挥LSH在相似性检索中的优势。
实施例二
参见图2,本发明实施例提供了一种构建数据库的方法,该方法包括:
201、将分类后的数据库图片的基本信息存入图片基本信息表中;
具体地,首先将数据库图片进行分类,如将数据库图片分为风景、人物等类别,这样可以节省检索过程中的数据量;然后使用C#或其他方式将分类后的数据库图片存入图片基本信息表中;
具体地,参见图3,图片基本信息表用来记录图片的基本信息,图片基本信息表中包括但不限于数据库图片的图片名字、图片类型、图片入库时间、数据库图片索引和图片的MD5(Message Digest Algorithm,信息摘要算法)值;其中,数据库图片索引是数据库图片的唯一标识;图片的MD5值用于确保所有的图片不重复。
202、提取每张数据库图片的数据库图片特征,将数据库图片特征以及数据库图片索引保存到图片特征表中;
具体地,首先提取每张数据库图片的数据库图片特征,数据库图片特征包括但不限于:图片颜色、纹理共生矩阵、形状特征及纹理直方图特征,还根据对数据检索要求的高低提取更多的图片特征,当然也可减少数据库图片特征的个数;然后将数据库图片的图片特征以及数据库图片索引存入图片特征表中;参见图4,该图片特征表中存放数据库图片特征,可以扩展,其中还有一个列名“数据库图片索引”用于关联图片基本信息表中的索引字段;
提取数据库图片的图片特征的方式可以使用OpenCV工具,也可以采用其他工具提取数据库图片的图片特征。
203、通过LSH算法对在图片特征表中保存的每张数据库图片的数据库图片特征进行散列,生成数据库图片散列值;其中,数据库图片散列值的个数与预设的散列表个数相等;
具体地,使用通用的LSH算法把在图片特征表中保存的每张数据库图片的图片特征进行散列;根据预设的散列表个数,生成与散列表个数相等的数据库图片散列值;例如:预设的散列表个数为10,则将数据库图片A的图片特征进行散列,生成10个散列值。
204、将每个数据库图片散列值以及数据库图片索引保存到每个散列表中。
具体地,参见图5,将步骤203生成的数据库图片的每个散列值Pic_Key以及该待检索图片索引数据库图片索引一起对应的保存到每个散列表中,如数据库图片A生成的10个散列值,则将每个散列值以及数据库图片A的索引分别对应的保存到10个散列表中。
通过步骤201-204,完成了构建数据库的步骤,此时已建立3个表:图片基本信息表、图片特征表、散列表,这3个表通过数据库图片索引进行关联,可以查找到对应的信息。
205、加载每个散列表,提取待检索图片的待检索图片特征;
具体地,将步骤204生成的散列表中保存的数据库图片的散列值加载到内存中;然后提取需要待检索图片的待检索图片特征;其中,待检索图片特征与数据库图片特征个数和类型相同,待检索图片特征以及数据库图片特征包括但不限于:图片颜色、纹理共生矩阵、形状特征及纹理直方图特征;还根据对数据检索要求的高低提取更多的图片特征,当然也可减少待检索图片特征的个数;
提取待检索图片的图片特征的方式与提取数据库图片的图片特征的方式相同,可以使用OpenCV工具,也可以采用其他工具提取数据库图片的图片特征。
206、通过LSH算法对待检索图片特征进行散列,生成待检索图片散列值;其中,生成的每个待检索图片散列值与加载的散列表相对应;
具体地,使用与数据库图片相同的LSH算法对待检索图片的图片特征进行散列,并根据预设的散列表个数,生成与散列表个数相等的待检索图片散列值;例如:预设的散列表个数为10,则将待检索图片B的图片特征进行散列,生成10个散列值。另外,也可以对应的生成的散列值个数小于散列表的个数,但是所生成的散列值必须唯一对应一个散列表,这样有些散列表就没有散列值和其对应,这样的相似性检索可能会漏掉某些相似图片,精确度降低。
207、在与每个待检索图片散列值对应的散列表中查找与待检索图片散列值匹配相似的数据库图片散列值;
具体地,可以在每个散列表中查找与待检索图片散列值相同的散列值,查找到的散列值即为匹配相似的散列值;
还可以在每个散列表中查找与待检索图片散列值达到预设相似度比如相差10的散列值,查找到的散列值即为匹配相似的散列值。
208、根据查找到的与待检索图片散列值匹配相似的数据库图片散列值查找对应的数据库图片索引,并根据数据库图片索引查找与待检索图片散列值匹配相似的数据库图片的基本信息。
具体地,查找到与待检索图片散列值匹配相似的散列值之后,根据该散列值对应的数据库图片索引,在图片基本信息表中查找与待检索图片散列值匹配相似的数据库图片基本信息,此时已完成待检索图片的相似性检索。
209、从与待检索图片散列值匹配相似的数据库图片的基本信息中选择预设个数的数据库图片基本信息。
具体地,由于查找与待检索图片散列值匹配相似的数据库图片基本信息可能有多个,比如查找到100个,而用户可能仅需要10个,此时可以从与待检索图片散列值匹配相似的数据库图片基本信息中选择预设个数的如10个数据库图片基本信息;对于选择的方式以及选择的依据可以根据情况灵活设置。
本发明实施例提供的方法,通过将数据库图片的基本信息保存到图片基本信息表中;提取每张数据库图片的数据库图片特征,将数据库图片特征以及数据库图片索引保存到图片特征表中;通过LSH算法对在图片特征表中保存的数据库图片特征进行散列,生成数据库图片散列值,将每个数据库图片散列值以及数据库图片索引对应的保存到每个散列表中,解决了目前还没有通用的数据库结构设计可以支持各种LSH算法的问题,进而无法更好的发挥LSH在相似性检索中的优势。
实施例三
参见图6,本发明实施例提供了一种构建数据库的装置,该装置包括:
图片基本信息表模块601,用于将分类后的数据库图片的基本信息保存到图片基本信息表中;图片基本信息表中包括数据库图片的图片名字、图片类型、图片入库时间、数据库图片索引、图片的信息摘要算法MD5值;其中,数据库图片索引是数据库图片的标识;
图片特征表模块602,用于提取每张数据库图片的数据库图片特征,将数据库图片特征以及数据库图片索引保存到图片特征表中;
散列表模块603,用于通过位置敏感哈希函数LSH算法对在图片特征表中保存的每张数据库图片的数据库图片特征进行散列,生成数据库图片散列值;其中,数据库图片散列值的个数与预设的散列表个数相等;将每个数据库图片散列值以及数据库图片索引保存到每个散列表中。
具体地,参见图7,该装置还包括:
加载模块604,用于将数据库图片的每个散列值以及数据库图片索引保存到每个散列表中之后,加载每个散列表;
散列模块605,用于提取待检索图片的待检索图片特征,并通过LSH算法对待检索图片特征进行散列,生成待检索图片散列值;其中,生成的每个待检索图片散列值与加载的散列表相对应;
匹配模块606,用于在与每个待检索图片散列值对应的散列表中查找与待检索图片散列值匹配相似的数据库图片散列值;
检索模块607,用于根据查找到的与待检索图片散列值匹配相似的数据库图片散列值查找对应的数据库图片索引,并根据数据库图片索引查找与待检索图片散列值匹配相似的数据库图片的基本信息。
进一步地,参见图8,该匹配模块606,包括:
第一匹配单元606a,用于在每个散列表中查找与待检索图片散列值相同的散列值;
和/或,
第二匹配单元606b,用于在每个散列表中查找与待检索图片散列值达到预设相似度的散列值。
进一步地,该检索模块607,还用于根据数据库图片索引查找与待检索图片散列值匹配相似的数据库图片的基本信息之后,从与待检索图片散列值匹配相似的数据库图片的基本信息中选择预设个数的数据库图片基本信息。
其中,本发明实施例的待检索图片特征与数据库图片特征的个数和类型相同,待检索图片特征以及数据库图片特征包括:图片颜色、纹理共生矩阵、形状特征及纹理直方图特征。
本发明实施例提供的装置,通过将数据库图片的基本信息保存到图片基本信息表中;提取每张数据库图片的数据库图片特征,将数据库图片特征以及数据库图片索引保存到图片特征表中;通过LSH算法对在图片特征表中保存的数据库图片特征进行散列,生成数据库图片散列值,将每个数据库图片散列值以及数据库图片索引对应的保存到每个散列表中,解决了目前还没有通用的数据库结构设计可以支持各种LSH算法的问题,进而无法更好的发挥LSH在相似性检索中的优势。
需要说明的是:上述实施例提供的构建数据库的装置在对图片构建数据库时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的构建数据库的装置与构建数据库的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种构建数据库的方法,其特征在于,所述方法包括:
将分类后的数据库图片的基本信息保存到图片基本信息表中;所述图片基本信息表中包括所述数据库图片的图片名字、图片类型、图片入库时间、数据库图片索引和图片的信息摘要算法MD5值;其中,所述数据库图片索引是数据库图片的标识;
提取每张所述数据库图片的数据库图片特征,将所述数据库图片特征以及所述数据库图片索引保存到图片特征表中;
通过位置敏感哈希函数LSH算法对在所述图片特征表中保存的每张数据库图片的数据库图片特征进行散列,生成数据库图片散列值;其中,所述数据库图片散列值的个数与预设的散列表个数相等;
将每个所述数据库图片散列值以及所述数据库图片索引保存到每个所述散列表中。
2.根据权利要求1所述的方法,其特征在于,所述将每个所述数据库图片散列值以及所述数据库图片索引保存到每个所述散列表中之后,包括:
加载每个所述散列表;
提取待检索图片的待检索图片特征,并通过所述LSH算法对所述待检索图片特征进行散列,生成待检索图片散列值;其中,生成的每个所述待检索图片散列值与所述加载的散列表相对应;
在与所述每个待检索图片散列值对应的散列表中查找与所述待检索图片散列值匹配相似的数据库图片散列值;
根据查找到的与所述待检索图片散列值匹配相似的数据库图片散列值查找对应的数据库图片索引,并根据所述数据库图片索引查找与所述待检索图片散列值匹配相似的数据库图片的基本信息。
3.根据权利要求2所述的方法,其特征在于,所述在与所述每个待检索图片散列值对应的散列表中查找与所述待检索图片散列值匹配相似的数据库图片散列值,包括:
在所述每个散列表中查找与所述待检索图片散列值相同的散列值;
和/或,
在所述每个散列表中查找与所述待检索图片散列值达到预设相似度的散列值。
4.根据权利要求2所述的方法,其特征在于,所述根据所述数据库图片索引查找与所述待检索图片散列值匹配相似的数据库图片的基本信息之后,还包括:
从与所述待检索图片散列值匹配相似的数据库图片的基本信息中选择预设个数的数据库图片基本信息。
5.根据权利要求1-4任一权利要求所述的方法,其特征在于,所述待检索图片特征与所述数据库图片特征的个数和类型相同。
6.一种构建数据库的装置,其特征在于,所述装置包括:
图片基本信息表模块,用于将分类后的数据库图片的基本信息保存到图片基本信息表中;所述图片基本信息表中包括所述数据库图片的图片名字、图片类型、图片入库时间、数据库图片索引和图片的信息摘要算法MD5值;其中,所述数据库图片索引是数据库图片的标识;
图片特征表模块,用于提取每张所述数据库图片的数据库图片特征,将所述数据库图片特征以及所述数据库图片索引保存到图片特征表中;
散列表模块,用于通过位置敏感哈希函数LSH算法对在所述图片特征表中保存的每张数据库图片的数据库图片特征进行散列,生成数据库图片散列值;其中,所述数据库图片散列值的个数与预设的散列表个数相等;将每个所述数据库图片散列值以及所述数据库图片索引对应的保存到每个所述散列表中。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
加载模块,用于将每个所述数据库图片散列值以及所述数据库图片索引保存到每个所述散列表中之后,加载每个所述散列表;
散列模块,用于提取待检索图片的待检索图片特征,并通过所述LSH算法对所述待检索图片特征进行散列,生成待检索图片散列值;其中,生成的每个所述待检索图片散列值与所述加载的散列表相对应;
匹配模块,用于在与所述每个待检索图片散列值对应的散列表中查找与所述待检索图片散列值匹配相似的数据库图片散列值;
检索模块,用于根据查找到的与所述待检索图片散列值匹配相似的数据库图片散列值查找对应的数据库图片索引,并根据所述数据库图片索引查找与所述待检索图片散列值匹配相似的数据库图片的基本信息。
8.根据权利要求7所述的装置,其特征在于,所述匹配模块,包括:
第一匹配单元,用于在所述每个散列表中查找与所述待检索图片散列值相同的散列值;
和/或,
第二匹配单元,用于在所述每个散列表中查找与所述待检索图片散列值达到预设相似度的散列值。
9.根据权利要求7所述的装置,其特征在于,所述检索模块,还用于根据所述数据库图片索引查找与所述待检索图片散列值匹配相似的数据库图片的基本信息之后,从与所述待检索图片散列值匹配相似的数据库图片的基本信息中选择预设个数的数据库图片基本信息。
10.根据权利要求6-9任一权利要求所述的装置,其特征在于,所述待检索图片特征与所述数据库图片特征的个数和类型相同。
CN201210581276.4A 2012-12-27 2012-12-27 一种构建数据库的方法和装置 Active CN103902595B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210581276.4A CN103902595B (zh) 2012-12-27 2012-12-27 一种构建数据库的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210581276.4A CN103902595B (zh) 2012-12-27 2012-12-27 一种构建数据库的方法和装置

Publications (2)

Publication Number Publication Date
CN103902595A true CN103902595A (zh) 2014-07-02
CN103902595B CN103902595B (zh) 2017-02-08

Family

ID=50993923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210581276.4A Active CN103902595B (zh) 2012-12-27 2012-12-27 一种构建数据库的方法和装置

Country Status (1)

Country Link
CN (1) CN103902595B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199728A (zh) * 2014-08-14 2014-12-10 腾讯科技(深圳)有限公司 图片传送信息展示方法和装置
CN105930456A (zh) * 2016-04-22 2016-09-07 安庆师范学院 模拟濒危松科植物潜在分布的方法
CN107798389A (zh) * 2017-11-06 2018-03-13 国网重庆市电力公司电力科学研究院 一种图像数据集构建方法、系统及计算机可读存储设备
CN109491984A (zh) * 2018-10-09 2019-03-19 湖北省农村信用社联合社网络信息中心 散列分组数据库碎片轮询整理方法
CN110516412A (zh) * 2019-07-22 2019-11-29 平安科技(深圳)有限公司 图片原创信息获取方法、装置、计算机设备及存储介质
CN111104369A (zh) * 2019-12-16 2020-05-05 北京明略软件系统有限公司 一种检索数据库构建方法及装置
CN112347289A (zh) * 2019-08-06 2021-02-09 Tcl集团股份有限公司 一种图像管理方法及终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458695A (zh) * 2008-12-18 2009-06-17 西交利物浦大学 基于关键词和内容特征的混合图片索引构建和查询方法及其应用
US20100119170A1 (en) * 2008-11-07 2010-05-13 Yahoo! Inc. Image compression by comparison to large database
CN101710334A (zh) * 2009-12-04 2010-05-19 大连理工大学 基于图像哈希的大规模图像库检索方法
CN102622366A (zh) * 2011-01-28 2012-08-01 阿里巴巴集团控股有限公司 相似图像的识别方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100119170A1 (en) * 2008-11-07 2010-05-13 Yahoo! Inc. Image compression by comparison to large database
CN101458695A (zh) * 2008-12-18 2009-06-17 西交利物浦大学 基于关键词和内容特征的混合图片索引构建和查询方法及其应用
CN101710334A (zh) * 2009-12-04 2010-05-19 大连理工大学 基于图像哈希的大规模图像库检索方法
CN102622366A (zh) * 2011-01-28 2012-08-01 阿里巴巴集团控股有限公司 相似图像的识别方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199728A (zh) * 2014-08-14 2014-12-10 腾讯科技(深圳)有限公司 图片传送信息展示方法和装置
CN104199728B (zh) * 2014-08-14 2017-11-21 腾讯科技(深圳)有限公司 图片传送信息展示方法和装置
CN105930456A (zh) * 2016-04-22 2016-09-07 安庆师范学院 模拟濒危松科植物潜在分布的方法
CN107798389A (zh) * 2017-11-06 2018-03-13 国网重庆市电力公司电力科学研究院 一种图像数据集构建方法、系统及计算机可读存储设备
CN107798389B (zh) * 2017-11-06 2021-05-14 国网重庆市电力公司电力科学研究院 一种图像数据集构建方法、系统及计算机可读存储设备
CN109491984A (zh) * 2018-10-09 2019-03-19 湖北省农村信用社联合社网络信息中心 散列分组数据库碎片轮询整理方法
CN110516412A (zh) * 2019-07-22 2019-11-29 平安科技(深圳)有限公司 图片原创信息获取方法、装置、计算机设备及存储介质
CN112347289A (zh) * 2019-08-06 2021-02-09 Tcl集团股份有限公司 一种图像管理方法及终端
CN111104369A (zh) * 2019-12-16 2020-05-05 北京明略软件系统有限公司 一种检索数据库构建方法及装置

Also Published As

Publication number Publication date
CN103902595B (zh) 2017-02-08

Similar Documents

Publication Publication Date Title
CN103902595A (zh) 一种构建数据库的方法和装置
CN103914463B (zh) 一种图片信息的相似性检索方法和装置
CN102156751B (zh) 一种提取视频指纹的方法及装置
CN111190904B (zh) 一种图-关系数据库混合存储的方法和装置
CN107368527B (zh) 基于数据流的多属性索引方法
CN111801665B (zh) 用于大数据应用的分层局部敏感哈希(lsh)分区索引
CN109471905B (zh) 一种支持时间范围和属性范围复合查询的区块链索引方法
US20030198380A1 (en) Color image processing method
CN106980656B (zh) 一种基于二值码字典树的搜索方法
CN108255915B (zh) 一种文件管理方法、装置及机器可读存储介质
RU2005105582A (ru) База данных и система управления знаниями
CN103678661A (zh) 图像搜索方法和终端
CN101826107A (zh) 哈希数据处理方法和装置
CN102024019B (zh) 一种分布式文件系统中基于后缀树的目录组织方法
CN103049473A (zh) 一种数据查询方法及装置
CN106599091B (zh) 基于键值存储的rdf图结构存储和索引方法
CN102629269A (zh) 一种嵌入式数据库的检索及存储方法
CN104321766A (zh) 数据的处理方法和装置
CN104021223A (zh) 一种集群数据库测点的访问方法及装置
US20220253405A1 (en) File system
CN109739854A (zh) 一种数据存储方法及装置
CN112347142A (zh) 数据处理方法及装置
CN116756253B (zh) 关系型数据库的数据存储、查询方法、装置、设备和介质
CN110032586B (zh) 储能电芯数据的存储方法、查询方法及采集存储系统
CN111309725A (zh) 一种基于哈希算法的电力设备数据存取方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: Room 810, 8 / F, 34 Haidian Street, Haidian District, Beijing 100080

Patentee after: BEIJING D-MEDIA COMMUNICATION TECHNOLOGY Co.,Ltd.

Address before: 100089 Beijing city Haidian District wanquanzhuang Road No. 28 Wanliu new building block A room 602

Patentee before: BEIJING D-MEDIA COMMUNICATION TECHNOLOGY Co.,Ltd.