CN110019876B - 数据查询方法、电子设备及存储介质 - Google Patents

数据查询方法、电子设备及存储介质 Download PDF

Info

Publication number
CN110019876B
CN110019876B CN201711421701.2A CN201711421701A CN110019876B CN 110019876 B CN110019876 B CN 110019876B CN 201711421701 A CN201711421701 A CN 201711421701A CN 110019876 B CN110019876 B CN 110019876B
Authority
CN
China
Prior art keywords
picture
binary tree
tree index
node
searched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711421701.2A
Other languages
English (en)
Other versions
CN110019876A (zh
Inventor
彭齐荣
魏运运
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Intellifusion Technologies Co Ltd
Original Assignee
Shenzhen Intellifusion Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Intellifusion Technologies Co Ltd filed Critical Shenzhen Intellifusion Technologies Co Ltd
Priority to CN201711421701.2A priority Critical patent/CN110019876B/zh
Priority to PCT/CN2017/119637 priority patent/WO2019127299A1/zh
Publication of CN110019876A publication Critical patent/CN110019876A/zh
Application granted granted Critical
Publication of CN110019876B publication Critical patent/CN110019876B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种数据查询方法,所述方法包括:获取待查询图片及查询条件;根据所述查询条件,确定待查找区;提取所述待查询图片的特征;当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集;当确定所述待查找区有未建立二叉树索引的图片时,将所述待查询图片的特征与所述未建立二叉树索引的图片的特征进行比对,查找与所述待查询图片相似的第二图片集;基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片。本发明能提高搜索速度。本发明还提供一种电子设备及存储介质。本发明能提高搜索速度。

Description

数据查询方法、电子设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种数据查询方法、电子设备及存储介质。
背景技术
目前人工智能能运用很多领域,如监控、智能交通等等,这都会涉及到大量图片数据的存储。目前存储的方式都是将所有的图片存储在服务器相关联的数据库中。随着存储的数据量逐渐变大,从存储的所有数据中查询所需的数据也无法达到实时。
发明内容
鉴于以上内容,有必要提供一种数据查询方法、电子设备及存储介质,能提高搜索速度。
一种数据查询方法,所述方法包括:
获取待查询图片及查询条件;
根据所述查询条件,确定待查找区;
提取所述待查询图片的特征;
当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集;
当确定所述待查找区有未建立二叉树索引的图片时,将所述待查询图片的特征与所述未建立二叉树索引的图片的特征进行比对,查找与所述待查询图片相似的第二图片集;
基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片。
根据本发明优选实施例,所述查询条件包括拍摄时间,所述根据所述查询条件,确定待查找区包括:
根据所述拍摄时间,将时间与所述拍摄时间匹配的区作为所述待查找区。
根据本发明优选实施例,在所述二叉树索引中,二叉树的一个叶子结点表示一个类别的图片数据,除叶子结点外的每个结点表示两个候选类别的差分特征,除叶子结点及根结点外任意一个结点对应的两个候选类别由对所述任意一个结点的父节点对应的两个候选类别中第一候选类别分类得到的,所述任意一个结点的兄弟结点对应的两个候选类别由对所述任意一个结点的父节点对应的两个候选类别中第二候选类别分类得到的。
根据本发明优选实施例,所述当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集包括:
从每个二叉树索引的根结点开始,采用优先队列遍历每个二叉树索引,将遍历的结点插入在所述优先队列中,基于所述待查询图片的特征与遍历的结点表示的差分特征间的距离,对所述优先队列进行排序,直至达到遍历终止条件,基于所述优先队列中叶子结点对应的类别中的图片数据,确定所述待查询图片相似的第一图片集。
根据本发明优选实施例,所述当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集包括:
依次计算所述待查询图片的特征与每个二叉树索引中的根结点表示的差分特征的距离;
将所述每个二叉树索引中的根结点依次插入优先队列中,并基于所述待查询图片的特征与每个二叉树索引中的根结点表示的差分特征的距离,对所述优先队列中的根结点进行排序;
从所述优先队列中最小距离对应的根结点开始,依次遍历所述优先队列中每个根结点对应的孩子结点,计算所述待查询图片的特征与每个根结点对应的孩子结点表示的差分特征的距离;
基于所述待查询图片的特征与每个根结点对应的孩子结点表示的差分特征的距离,对所述优先队列中的孩子结点进行排序;
从所述优先队列中最小距离对应的孩子结点开始,利用优先队列递归遍历每个二叉树索引,直至达到遍历终止条件,基于所述优先队列中叶子结点对应的类别中的图片数据,确定所述待查询图片相似的第一图片集。
根据本发明优选实施例,基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片包括以下一种或者多种的组合:
获取所述第一图片集中每张图片的标识及/或所述第二图片集中每张图片的标识;根据所述第一图片集中每张图片的标识及/或所述第二图片集中每张图片的标识,查找所述第一图片集中每张图片的标识关联的数据及/或所述第二图片集中每张图片的标识关联的数据输出给用户。
根据本发明优选实施例,所述方法还包括:
获取待存储图片的拍摄时间;
根据所述待存储图片的拍摄时间,将待存储图片存储于对应的区中。
根据本发明优选实施例,所述方法还包括:
当一个区中未建立二叉树索引的图片数据的存储量大于或者等于第二阈值时,对所述一个区中未建立二叉树索引的图片数据生成二叉树索引。
一种电子设备,所述电子设备包括存储器及处理器,所述存储器用于存储至少一个指令,所述处理器用于执行所述至少一个指令以实现任意实施例中任一项所述数据查询方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现任意实施例中任一项所述数据查询方法。
由以上技术方案可以看出,本发明获取待查询图片及查询条件;根据所述查询条件,确定待查找区;提取所述待查询图片的特征;当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集;当确定所述待查找区有未建立二叉树索引的图片时,将所述待查询图片的特征与所述未建立二叉树索引的图片的特征进行比对,查找与所述待查询图片相似的第二图片集;基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片。本发明能在建立了二叉树索引的分区中,对二叉树进行搜索,不需要对每一条的数据进行比对,大大提升了搜索速度;在没有建立二叉树索引分区中,该分区的搜索需要与分区中每条的图片数据进行比对得到相似度达到一定阈值的图片。因此,利用本发明对数据进行查询,从整体上提高了搜索速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明数据查询方法的较佳实施例的流程图。
图2是本发明二叉树索引示意图。
图3是本发明查找二叉树示意图。
图4是本发明数据查询装置的较佳实施例的功能模块图。
图5是本发明至少一个实例中电子设备的较佳实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,是本发明数据查询方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
S10,电子设备获取获取待查询图片及查询条件。
在本发明优选实施例中,所述电子设备与多个终端设备相通信,所述终端设备包括,但并不限于:手机、摄像装置等等。在用户界面上,所述终端设备获取输入的待查询图片及查询条件,并将所述待查询图片及查询条件发送至所述电子设备。例如,所述电子设备用于存储一个商场中多个摄像装置抓拍的图片。在用户界面上输入一个人脸图片,并输入查询条件,例如时间段2017年7月,则所述电子设备在数据库中,查找2017年7月时间段中,与所述人脸图片相似的图片。
进一步地,所述查询条件包括,但不限于:拍摄时间。
S11,所述电子设备根据所述查询条件,确定待查找区。
优选地,所述将存储的图片数据分成多个区包括:获取所述存储的图片数据中每张图片的拍摄时间数据;基于每张图片的拍摄时间数据,将存储的图片数据分成多个区。例如,将拍摄时间为2016的图片数据分在第一区,将拍摄时间为2017的图片数据分在第二区等等。
进一步地,当所述存储的图片数据的存储量大于或者等于存储阈值时,将存储的图片数据分成多个区。
进一步地,在当前时间到达预设时间时,将存储的图片数据分成多个区。
优选地,所述根据所述查询条件,确定待查找区包括:
根据所述拍摄时间,将时间与所述拍摄时间匹配的区作为所述待查找区。避免了对所有分区进行查询,提高了效率。
S12,所述电子设备提取所述待查询图片的特征。
在本发明中,利用图像提取技术,从所述待查询图片中提取所述待查询图片的特征。图像提取技术为现有技术,本发明不再详述。
S13,当确定所述待查找区有二叉树索引时,所述电子设备根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集。
在本发明中,在对存储的图片数据分成多个区后,对符合条件的区生成二叉树索引后,后续对图片数据进行查询时,可以基于所述二叉树索引查询数据。
优选地,在对存储的图片数据分成多个区后,从所述多个区中筛选存储量大于或者等于第一存储阈值的区时,对筛选的区中的图片数据生成二叉树索引。对于存储量小于第一存储阈值的区,直到存储量达到第一存储阈值时,才会生成二叉树索引。对区中存储的数据建立二叉树索引,便于后续数据的搜索,无需对每一条的数据进行比对,大大提升了搜索速度。
在本发明中,对于每个区而言,后续都会继续有图片要存入。优选地,所述电子设备获取待存储图片的拍摄时间;根据所述待存储图片的拍摄时间,将待存储图片存储于对应的区中。
在本发明的优选实施例中,在已经生成了二叉树索引的一个区中,当有图片需要存入时,先将图片存储在所述一个区中,但不对所述图片建立二叉树索引。优选地,当所述一个区中未建立二叉树索引的图片数据的存储量大于或者等于第二阈值时,对所述一个区中未建立二叉树索引的图片数据生成二叉树索引。所述第二阈值可以与第一阈值相同或者不同。
在本发明的优选实施例中,在对每个区中的图片数据生成二叉树索引时,在所述二叉树索引中,二叉树的一个叶子结点表示一个类别的图片数据,除叶子结点外的每个结点表示两个候选类别的差分特征,除叶子结点及根结点外任意一个结点对应的两个候选类别由对所述任意一个结点的父节点对应的两个候选类别中第一候选类别分类得到的,所述任意一个结点的兄弟结点对应的两个候选类别由对所述任意一个结点的父节点对应的两个候选类别中第二候选类别分类得到的。这样建立二叉树索引后,后续在对数据进行搜索,无需对每一条的数据进行比对,大大提升了搜索速度。
进一步地,利用近似最近邻算法,对任意一个区中的图片数据生成二叉树索引包括:
从所述任意一个区中随机选取两点作为初始中心点;
利用预设算法,基于所述初始中心点进行迭代聚类,在迭代次数大于1的当前迭代的上一次迭代中能得到至少一组候选类别,所述至少一组候选类别中每组候选类别对应第一候选类别及第二候选类别;所述每组候选类别对应的二叉树结点表示每组候选类别中第一候选类别与第二候选类别间的差分特征值;
在当前迭代中,分别对所述每组候选类别中第一候选类别及第二候选类别分别进行迭代聚类,得到所述每组候选类别中第一候选类别对应的两个候选类别及所述每组候选类别中第二候选类别对应的两个候选类别,将表示所述每组候选类别中第一候选类别对应的两个候选类别的差分特征的二叉树结点作为所述每组候选类别对应的二叉树结点的左结点或右结点,将表示所述每组候选类别中第二候选类别对应的两个候选类别的差分特征的二叉树结点作为所述每组候选类别对应的二叉树结点的右结点或左结点;
执行多次迭代聚类,直至达到收敛条件,得到所述任意一个区对应的多个类别,其中二叉树的一个叶子结点表示一个类别的图片数据。
进一步地,两个候选类别间的差分特征用两个候选类别的聚类中心间的差分特征表示。
进一步地,所述迭代终止条件包括,但不限于:迭代次数等等。
例如,为了便于理解上述生成二叉树索引的过程,以二次迭代为例,如图2所示,用Q表示一个区中存储的图片数据,在第一次迭代聚类中,从Q中随机选取两点作为初始中心点,以所述初始中心点对Q进行聚类,得到两个候选类别A1及A2,结点A表示候选类别A1与候选类别A2间的差分特征,并将结点A作为所述二叉树索引的根结点。第二次迭代聚类中,分别对候选类别A1进行聚类得到候选类别B1和候选类别B2,对候选类别A2进行聚类得到候选类别C1和候选类别C2,候选类别B1与候选类别B2间的差分特征用结点B表示,候选类别C1与候选类别C2件间的差分特征用结点C表示,并按照预设规则,将结点B作为根结点A的左边子结点,将结点C作为根结点A的右边子结点。所述叶子结点D1表示候选类别B1,所述叶子结点D2表示候选类别B2,所述叶子结点D3表示候选类别C1,所述叶子结点D4表示候选类别C2。
在本发明中,当对区存储的图片数据生成二叉树索引后,后续对图片数据进行查询时,可以基于所述二叉树索引查询数据。
优选地,所述当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集包括:
从每个二叉树索引的根结点开始,采用优先队列遍历每个二叉树索引,将遍历的结点插入在所述优先队列中,基于所述待查询图片的特征与遍历的结点表示的差分特征间的距离,对所述优先队列进行排序,直至达到遍历终止条件,基于所述优先队列中叶子结点对应的类别中的图片数据,确定所述待查询图片相似的第一图片集。对区中存储的数据建立二叉树索引,在进行数据搜索时,无需对每一条的数据进行比对,大大提升了搜索速度。而且基于所述待查询图片的特征与遍历的结点表示的差分特征间的距离进行查询,这样可以避免遍历所有的二叉树,提高了查询速度。
进一步地,所述当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集包括:
依次计算所述待查询图片的特征与每个二叉树索引中的根结点表示的差分特征的距离;
将所述每个二叉树索引中的根结点依次插入优先队列中,并基于所述待查询图片的特征与每个二叉树索引中的根结点表示的差分特征的距离,对所述优先队列中的根结点进行排序;
从所述优先队列中最小距离对应的根结点开始,依次遍历所述优先队列中每个根结点对应的孩子结点,计算所述待查询图片的特征与每个根结点对应的孩子结点表示的差分特征的距离;
基于所述待查询图片的特征与每个根结点对应的孩子结点表示的差分特征的距离,对所述优先队列中的孩子结点进行排序;
从所述优先队列中最小距离对应的孩子结点开始,利用优先队列递归遍历每个二叉树索引,直至达到遍历终止条件,基于所述优先队列中叶子结点对应的类别中的图片数据,确定所述待查询图片相似的第一图片集。
进一步地,所述遍历终止条件包括,但不限于:所述优先队列中叶子结点对应的类别中的图片数据大于或者等于数据阈值等等。
例如,如图3所示,在一个待查找区生成了2棵二叉树,所述待查询图片的特征用W表示,计算待查询图片的特征W与第一棵二叉树的根结点H表示的差分特征间的距离T1,计算待查询图片的特征W与第二棵二叉树的根结点M表示的差分特征间的距离T2,根据T1及T2大小,按照小从到大,将所述根结点H及所述根结点M插入在优先队列中,例如,T1小于T2,则先计算待查询图片的特征W与根结点H的左孩子结点G间的距离T3,将结点G对应的两个叶子结点插入在优先队列中,再计算待查询图片的特征W与根结点H的右孩子结点K间的距离T4,根据T3及T4大小,将结点G及结点K放入优先队列中,若T4小于T3,按照从小到大排序,则在优先队列中,叶子结点的排序为:K1、K2、G1、G2。当此时叶子结点表示的类别中图片数据超过阈值时,将所述叶子结点表示的类别中图片数据作为所述待查询图片相似的第一图片集。
S14,当确定所述待查找区有未建立二叉树索引的图片时,所述电子设备将所述待查询图片的特征与所述未建立二叉树索引的图片的特征进行比对,查找与所述待查询图片相似的第二图片集。
S15,所述电子设备基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片。
在本发明中,当没有第一图片集时,基于第二图片集,输出与所述待查询图片相似的图片。当没有第二图片集时,基于第一图片集,输出与所述待查询图片相似的图片。当第一图片集及第二图片集同时存在时,基于第一图片集及第二图片集,输出与所述待查询图片相似的图片。
优选地,基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片包括:
获取所述第一图片集中每张图片的标识及/或所述第二图片集中每张图片的标识;根据所述第一图片集中每张图片的标识及/或所述第二图片集中每张图片的标识,查找所述第一图片集中每张图片的标识关联的数据及/或所述第二图片集中每张图片的标识关联的数据输出给用户。
进一步地,所述第一图片集、第二图片集中每张图片的标识关联的数据包括,但不限于:拍摄地点、抓拍的摄像装置的编号、图片编号、图片中人物的身份等等其他信息。
本发明获取待查询图片及查询条件;根据所述查询条件,确定待查找区;提取所述待查询图片的特征;当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集;当确定所述待查找区有未建立二叉树索引的图片时,将所述待查询图片的特征与所述未建立二叉树索引的图片的特征进行比对,查找与所述待查询图片相似的第二图片集;基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片。本发明能在建立了二叉树索引的分区中,对二叉树进行搜索,不需要对每一条的数据进行比对,大大提升了搜索速度;在没有建立二叉树索引分区中,该分区的搜索需要与分区中每条的图片数据进行比对得到相似度达到一定阈值的图片。因此,利用本发明对数据进行查询,从整体上提高了搜索速度。
如图4所示,本发明数据查询装置的较佳实施例的功能模块图。所述数据查询装置11包括获取模块100、确定模块101、划分模块102、提取模块103、查询模块104、存储模块105、生成模块106及输出模块107。本发明所称的单元是指一种能够被数据查询装置11的处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各单元的功能将在后续的实施例中详述。
所述获取模块100获取获取待查询图片及查询条件。
在本发明优选实施例中,所述电子设备与多个终端设备相通信,所述终端设备包括,但并不限于:手机、摄像装置等等。在用户界面上,所述终端设备获取输入的待查询图片及查询条件,并将所述待查询图片及查询条件发送至所述电子设备。例如,所述电子设备用于存储一个商场中多个摄像装置抓拍的图片。在用户界面上输入一个人脸图片,并输入查询条件,例如时间段2017年7月,则所述电子设备在数据库中,查找2017年7月时间段中,与所述人脸图片相似的图片。
进一步地,所述查询条件包括,但不限于:拍摄时间。
所述确定模块101根据所述查询条件,确定待查找区。
优选地,所述划分模块102将存储的图片数据分成多个区,包括:获取所述存储的图片数据中每张图片的拍摄时间数据;基于每张图片的拍摄时间数据,将存储的图片数据分成多个区。例如,将拍摄时间为2016的图片数据分在第一区,将拍摄时间为2017的图片数据分在第二区等等。
进一步地,当所述存储的图片数据的存储量大于或者等于存储阈值时,所述划分模块102将存储的图片数据分成多个区。
进一步地,在当前时间到达预设时间时,所述划分模块102将存储的图片数据分成多个区。
优选地,所述确定模块101根据所述查询条件,确定待查找区包括:
根据所述拍摄时间,将时间与所述拍摄时间匹配的区作为所述待查找区。避免了对所有分区进行查询,提高了效率。
所述提取模块103提取所述待查询图片的特征。
在本发明中,利用图像提取技术,从所述待查询图片中提取所述待查询图片的特征。图像提取技术为现有技术,本发明不再详述。
当确定所述待查找区有二叉树索引时,所述电子设备根据所述待查询图片的特征,对所述二叉树索引进行遍历,所述查询模块104查找与所述待查询图片相似的第一图片集。
在本发明中,所述查询模块104在对存储的图片数据分成多个区后,对符合条件的区生成二叉树索引后,后续对图片数据进行查询时,可以基于所述二叉树索引查询数据。
优选地,所述查询模块104在对存储的图片数据分成多个区后,从所述多个区中筛选存储量大于或者等于第一存储阈值的区时,对筛选的区中的图片数据生成二叉树索引。对于存储量小于第一存储阈值的区,直到存储量达到第一存储阈值时,才会生成二叉树索引。对区中存储的数据建立二叉树索引,便于后续数据的搜索,无需对每一条的数据进行比对,大大提升了搜索速度。
在本发明中,对于每个区而言,后续都会继续有图片要存入。优选地,所述存储模块105获取待存储图片的拍摄时间;根据所述待存储图片的拍摄时间,将待存储图片存储于对应的区中。
在本发明的优选实施例中,在已经生成了二叉树索引的一个区中,当有图片需要存入时,先将图片存储在所述一个区中,但不对所述图片建立二叉树索引。优选地,当所述一个区中未建立二叉树索引的图片数据的存储量大于或者等于第二阈值时,所述生成模块106对所述一个区中未建立二叉树索引的图片数据生成二叉树索引。所述第二阈值可以与第一阈值相同或者不同。
在本发明的优选实施例中,在对每个区中的图片数据生成二叉树索引时,在所述二叉树索引中,二叉树的一个叶子结点表示一个类别的图片数据,除叶子结点外的每个结点表示两个候选类别的差分特征,除叶子结点及根结点外任意一个结点对应的两个候选类别由对所述任意一个结点的父节点对应的两个候选类别中第一候选类别分类得到的,所述任意一个结点的兄弟结点对应的两个候选类别由对所述任意一个结点的父节点对应的两个候选类别中第二候选类别分类得到的。这样建立二叉树索引后,后续在对数据进行搜索,无需对每一条的数据进行比对,大大提升了搜索速度。
进一步地,所述生成模块106利用近似最近邻算法,对任意一个区中的图片数据生成二叉树索引包括:
从所述任意一个区中随机选取两点作为初始中心点;
利用预设算法,基于所述初始中心点进行迭代聚类,在迭代次数大于1的当前迭代的上一次迭代中能得到至少一组候选类别,所述至少一组候选类别中每组候选类别对应第一候选类别及第二候选类别;所述每组候选类别对应的二叉树结点表示每组候选类别中第一候选类别与第二候选类别间的差分特征值;
在当前迭代中,分别对所述每组候选类别中第一候选类别及第二候选类别分别进行迭代聚类,得到所述每组候选类别中第一候选类别对应的两个候选类别及所述每组候选类别中第二候选类别对应的两个候选类别,将表示所述每组候选类别中第一候选类别对应的两个候选类别的差分特征的二叉树结点作为所述每组候选类别对应的二叉树结点的左结点或右结点,将表示所述每组候选类别中第二候选类别对应的两个候选类别的差分特征的二叉树结点作为所述每组候选类别对应的二叉树结点的右结点或左结点;
执行多次迭代聚类,直至达到收敛条件,得到所述任意一个区对应的多个类别,其中二叉树的一个叶子结点表示一个类别的图片数据。
进一步地,两个候选类别间的差分特征用两个候选类别的聚类中心间的差分特征表示。
进一步地,所述迭代终止条件包括,但不限于:迭代次数等等。
例如,为了便于理解上述生成二叉树索引的过程,以二次迭代为例,如图2所示,用Q表示一个区中存储的图片数据,在第一次迭代聚类中,从Q中随机选取两点作为初始中心点,以所述初始中心点对Q进行聚类,得到两个候选类别A1及A2,结点A表示候选类别A1与候选类别A2间的差分特征,并将结点A作为所述二叉树索引的根结点。第二次迭代聚类中,分别对候选类别A1进行聚类得到候选类别B1和候选类别B2,对候选类别A2进行聚类得到候选类别C1和候选类别C2,候选类别B1与候选类别B2间的差分特征用结点B表示,候选类别C1与候选类别C2件间的差分特征用结点C表示,并按照预设规则,将结点B作为根结点A的左边子结点,将结点C作为根结点A的右边子结点。所述叶子结点D1表示候选类别B1,所述叶子结点D2表示候选类别B2,所述叶子结点D3表示候选类别C1,所述叶子结点D4表示候选类别C2。
在本发明中,当对区存储的图片数据生成二叉树索引后,后续对图片数据进行查询时,可以基于所述二叉树索引查询数据。
优选地,所述当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,所述查询模块104对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集包括:
从每个二叉树索引的根结点开始,采用优先队列遍历每个二叉树索引,将遍历的结点插入在所述优先队列中,基于所述待查询图片的特征与遍历的结点表示的差分特征间的距离,对所述优先队列进行排序,直至达到遍历终止条件,基于所述优先队列中叶子结点对应的类别中的图片数据,确定所述待查询图片相似的第一图片集。对区中存储的数据建立二叉树索引,在进行数据搜索时,无需对每一条的数据进行比对,大大提升了搜索速度。而且基于所述待查询图片的特征与遍历的结点表示的差分特征间的距离进行查询,这样可以避免遍历所有的二叉树,提高了查询速度。
进一步地,当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,所述查询模块104对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集包括:
依次计算所述待查询图片的特征与每个二叉树索引中的根结点表示的差分特征的距离;
将所述每个二叉树索引中的根结点依次插入优先队列中,并基于所述待查询图片的特征与每个二叉树索引中的根结点表示的差分特征的距离,对所述优先队列中的根结点进行排序;
从所述优先队列中最小距离对应的根结点开始,依次遍历所述优先队列中每个根结点对应的孩子结点,计算所述待查询图片的特征与每个根结点对应的孩子结点表示的差分特征的距离;
基于所述待查询图片的特征与每个根结点对应的孩子结点表示的差分特征的距离,对所述优先队列中的孩子结点进行排序;
从所述优先队列中最小距离对应的孩子结点开始,利用优先队列递归遍历每个二叉树索引,直至达到遍历终止条件,基于所述优先队列中叶子结点对应的类别中的图片数据,确定所述待查询图片相似的第一图片集。
进一步地,所述遍历终止条件包括,但不限于:所述优先队列中叶子结点对应的类别中的图片数据大于或者等于数据阈值等等。
例如,如图3所示,在一个待查找区生成了2棵二叉树,所述待查询图片的特征用W表示,计算待查询图片的特征W与第一棵二叉树的根结点H表示的差分特征间的距离T1,计算待查询图片的特征W与第二棵二叉树的根结点M表示的差分特征间的距离T2,根据T1及T2大小,按照小从到大,将所述根结点H及所述根结点M插入在优先队列中,例如,T1小于T2,则先计算待查询图片的特征W与根结点H的左孩子结点G间的距离T3,将结点G对应的两个叶子结点插入在优先队列中,再计算待查询图片的特征W与根结点H的右孩子结点K间的距离T4,根据T3及T4大小,将结点G及结点K放入优先队列中,若T4小于T3,按照从小到大排序,则在优先队列中,叶子结点的排序为:K1、K2、G1、G2。当此时叶子结点表示的类别中图片数据超过阈值时,将所述叶子结点表示的类别中图片数据作为所述待查询图片相似的第一图片集。
当确定所述待查找区有未建立二叉树索引的图片时,所述查询模块104将所述待查询图片的特征与所述未建立二叉树索引的图片的特征进行比对,查找与所述待查询图片相似的第二图片集。
基于所述第一图片集及/或所述第二图片集,所述输出模块107输出与所述待查询图片相似的图片。
在本发明中,当没有第一图片集时,基于第二图片集,所述输出模块107输出与所述待查询图片相似的图片。当没有第二图片集时,基于第一图片集,所述输出模块107输出与所述待查询图片相似的图片。当第一图片集及第二图片集同时存在时,基于第一图片集及第二图片集,所述输出模块107输出与所述待查询图片相似的图片。
优选地,基于所述第一图片集及/或所述第二图片集,所述输出模块107输出与所述待查询图片相似的图片包括:
获取所述第一图片集中每张图片的标识及/或所述第二图片集中每张图片的标识;根据所述第一图片集中每张图片的标识及/或所述第二图片集中每张图片的标识,查找所述第一图片集中每张图片的标识关联的数据及/或所述第二图片集中每张图片的标识关联的数据输出给用户。
进一步地,所述第一图片集、第二图片集中每张图片的标识关联的数据包括,但不限于:拍摄地点、抓拍的摄像装置的编号、图片编号、图片中人物的身份等等其他信息。
本发明获取待查询图片及查询条件;根据所述查询条件,确定待查找区;提取所述待查询图片的特征;当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集;当确定所述待查找区有未建立二叉树索引的图片时,将所述待查询图片的特征与所述未建立二叉树索引的图片的特征进行比对,查找与所述待查询图片相似的第二图片集;基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片。本发明能在建立了二叉树索引的分区中,对二叉树进行搜索,不需要对每一条的数据进行比对,大大提升了搜索速度;在没有建立二叉树索引分区中,该分区的搜索需要与分区中每条的图片数据进行比对得到相似度达到一定阈值的图片。因此,利用本发明对数据进行查询,从整体上提高了搜索速度。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明每个实施例所述方法的部分步骤。
如图5所示,所述电子设备3包括至少一个发送装置31、至少一个存储器32、至少一个处理器33、至少一个接收装置34以及至少一个通信总线。其中,所述通信总线用于实现这些组件之间的连接通信。
所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。所述电子设备3还可包括网络设备和/或用户设备。其中,所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
所述电子设备3可以是,但不限于任何一种可与用户通过键盘、触摸板或声控设备等方式进行人机交互的电子产品,例如,平板电脑、智能手机、个人数字助理(PersonalDigital Assistant,PDA)、智能式穿戴式设备、摄像设备、监控设备等终端。
所述电子设备3所处的网络包括,但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
其中,所述接收装置34和所述发送装置31可以是有线发送端口,也可以为无线设备,例如包括天线装置,用于与其他设备进行数据通信。
所述存储器32用于存储程序代码。所述存储器32可以是集成电路中没有实物形式的具有存储功能的电路,如RAM(Random-Access Memory,随机存取存储器)、FIFO(First InFirst Out,)等。或者,所述存储器32也可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)、智能媒体卡(smart media card)、安全数字卡(secure digitalcard)、快闪存储器卡(flashcard)等储存设备等等。
所述处理器33可以包括一个或者多个微处理器、数字处理器。所述处理器33可调用存储器32中存储的程序代码以执行相关的功能。例如,图2中所述的各个单元是存储在所述存储器32中的程序代码,并由所述处理器33所执行,以实现一种数据查询方法。所述处理器33又称中央处理器(CPU,CentralProcessing Unit),是一块超大规模的集成电路,是运算核心(Core)和控制核心(Control Unit)。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令当被包括一个或多个处理器的电子设备执行时,使电子设备执行如上文方法实施例所述的数据查询方法。
结合图1所示,所述电子设备3中的所述存储器32存储多个指令以实现一种商品推荐方法,所述处理器33可执行所述多个指令从而实现:
获取待查询图片及查询条件;
根据所述查询条件,确定待查找区;
提取所述待查询图片的特征;
当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集;
当确定所述待查找区有未建立二叉树索引的图片时,将所述待查询图片的特征与所述未建立二叉树索引的图片的特征进行比对,查找与所述待查询图片相似的第二图片集;
基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片。
根据本发明优选实施例,所述查询条件包括拍摄时间,所述处理器33可执行的所述多个指令用于根据所述查询条件,确定待查找区包括:
根据所述拍摄时间,将时间与所述拍摄时间匹配的区作为所述待查找区。
根据本发明优选实施例,在所述二叉树索引中,二叉树的一个叶子结点表示一个类别的图片数据,除叶子结点外的每个结点表示两个候选类别的差分特征,除叶子结点及根结点外任意一个结点对应的两个候选类别由对所述任意一个结点的父节点对应的两个候选类别中第一候选类别分类得到的,所述任意一个结点的兄弟结点对应的两个候选类别由对所述任意一个结点的父节点对应的两个候选类别中第二候选类别分类得到的。
根据本发明优选实施例,当确定所述待查找区有二叉树索引时,所述处理器33可执行的所述多个指令用于根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集包括:
从每个二叉树索引的根结点开始,采用优先队列遍历每个二叉树索引,将遍历的结点插入在所述优先队列中,基于所述待查询图片的特征与遍历的结点表示的差分特征间的距离,对所述优先队列进行排序,直至达到遍历终止条件,基于所述优先队列中叶子结点对应的类别中的图片数据,确定所述待查询图片相似的第一图片集。
根据本发明优选实施例,当确定所述待查找区有二叉树索引时,所述处理器33可执行的所述多个指令用于根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集包括:
依次计算所述待查询图片的特征与每个二叉树索引中的根结点表示的差分特征的距离;
将所述每个二叉树索引中的根结点依次插入优先队列中,并基于所述待查询图片的特征与每个二叉树索引中的根结点表示的差分特征的距离,对所述优先队列中的根结点进行排序;
从所述优先队列中最小距离对应的根结点开始,依次遍历所述优先队列中每个根结点对应的孩子结点,计算所述待查询图片的特征与每个根结点对应的孩子结点表示的差分特征的距离;
基于所述待查询图片的特征与每个根结点对应的孩子结点表示的差分特征的距离,对所述优先队列中的孩子结点进行排序;
从所述优先队列中最小距离对应的孩子结点开始,利用优先队列递归遍历每个二叉树索引,直至达到遍历终止条件,基于所述优先队列中叶子结点对应的类别中的图片数据,确定所述待查询图片相似的第一图片集。
根据本发明优选实施例,基于所述第一图片集及/或所述第二图片集,所述处理器33可执行的所述多个指令用于输出与所述待查询图片相似的图片包括以下一种或者多种的组合:
获取所述第一图片集中每张图片的标识及/或所述第二图片集中每张图片的标识;根据所述第一图片集中每张图片的标识及/或所述第二图片集中每张图片的标识,查找所述第一图片集中每张图片的标识关联的数据及/或所述第二图片集中每张图片的标识关联的数据输出给用户。
根据本发明优选实施例,所述处理器33可执行的所述多个指令还包括:
获取待存储图片的拍摄时间;
根据所述待存储图片的拍摄时间,将待存储图片存储于对应的区中。
根据本发明优选实施例,所述方法还包括:
当一个区中未建立二叉树索引的图片数据的存储量大于或者等于第二阈值时,对所述一个区中未建立二叉树索引的图片数据生成二叉树索引。
以上说明的本发明的特征性的手段可以通过集成电路来实现,并控制实现上述任意实施例中所述数据查询方法的功能。即,本发明的集成电路安装于所述电子设备中,使所述电子设备发挥如下功能:
获取待查询图片及查询条件;根据所述查询条件,确定待查找区;提取所述待查询图片的特征;当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集;当确定所述待查找区有未建立二叉树索引的图片时,将所述待查询图片的特征与所述未建立二叉树索引的图片的特征进行比对,查找与所述待查询图片相似的第二图片集;基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片。
在任意实施例中所述数据查询方法所能实现的功能都能通过本发明的集成电路安装于所述电子设备中,使所述电子设备发挥任意实施例中所述数据查询方法所能实现的功能,在此不再详述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明的各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (9)

1.一种数据查询方法,其特征在于,所述方法包括:
将存储的图片数据对应的多个分区中存储量大于或者等于第一存储阈值的分区,确定为目标分区,并根据所述目标分区对应的图像数据,生成所述目标分区对应的二叉树索引;
获取待查询图片及查询条件;
根据所述查询条件,确定待查找区;
提取所述待查询图片的特征;
当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集;
当确定所述待查找区有未建立二叉树索引的图片时,将所述待查询图片的特征与所述未建立二叉树索引的图片的特征进行比对,查找与所述待查询图片相似的第二图片集;
基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片;
其中,在所述二叉树索引中,二叉树的一个叶子结点表示一个类别的图片数据,除叶子结点外的每个结点表示两个候选类别的差分特征,除叶子结点及根结点外任意一个结点对应的两个候选类别由对所述任意一个结点的父节点对应的两个候选类别中第一候选类别分类得到的,所述任意一个结点的兄弟结点对应的两个候选类别由对所述任意一个结点的父节点对应的两个候选类别中第二候选类别分类得到的。
2.如权利要求1所述的数据查询方法,其特征在于,所述查询条件包括拍摄时间,所述根据所述查询条件,确定待查找区包括:
根据所述拍摄时间,将时间与所述拍摄时间匹配的区作为所述待查找区。
3.如权利要求1或2所述的数据查询方法,其特征在于,所述当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集包括:
从每个二叉树索引的根结点开始,采用优先队列遍历每个二叉树索引,将遍历的结点插入在所述优先队列中,基于所述待查询图片的特征与遍历的结点表示的差分特征间的距离,对所述优先队列进行排序,直至达到遍历终止条件,基于所述优先队列中叶子结点对应的类别中的图片数据,确定所述待查询图片相似的第一图片集。
4.如权利要求3所述的数据查询方法,其特征在于,所述当确定所述待查找区有二叉树索引时,根据所述待查询图片的特征,对所述二叉树索引进行遍历,查找与所述待查询图片相似的第一图片集包括:
依次计算所述待查询图片的特征与每个二叉树索引中的根结点表示的差分特征的距离;
将所述每个二叉树索引中的根结点依次插入优先队列中,并基于所述待查询图片的特征与每个二叉树索引中的根结点表示的差分特征的距离,对所述优先队列中的根结点进行排序;
从所述优先队列中最小距离对应的根结点开始,依次遍历所述优先队列中每个根结点对应的孩子结点,计算所述待查询图片的特征与每个根结点对应的孩子结点表示的差分特征的距离;
基于所述待查询图片的特征与每个根结点对应的孩子结点表示的差分特征的距离,对所述优先队列中的孩子结点进行排序;
从所述优先队列中最小距离对应的孩子结点开始,利用优先队列递归遍历每个二叉树索引,直至达到遍历终止条件,基于所述优先队列中叶子结点对应的类别中的图片数据,确定所述待查询图片相似的第一图片集。
5.如权利要求1所述的数据查询方法,其特征在于,基于所述第一图片集及/或所述第二图片集,输出与所述待查询图片相似的图片包括以下一种或者多种的组合:
获取所述第一图片集中每张图片的标识及/或所述第二图片集中每张图片的标识;根据所述第一图片集中每张图片的标识及/或所述第二图片集中每张图片的标识,查找所述第一图片集中每张图片的标识关联的数据及/或所述第二图片集中每张图片的标识关联的数据输出给用户。
6.如权利要求1所述的数据查询方法,其特征在于,所述方法还包括:
获取待存储图片的拍摄时间;
根据所述待存储图片的拍摄时间,将所述待存储图片存储于对应的区中。
7.如权利要求1或6所述的数据查询方法,其特征在于,所述方法还包括:
当一个区中未建立二叉树索引的图片数据的存储量大于或者等于第二阈值时,对所述一个区中未建立二叉树索引的图片数据生成二叉树索引。
8.一种电子设备,其特征在于,所述电子设备包括存储器及处理器,所述存储器用于存储至少一个指令,所述处理器用于执行所述至少一个指令以实现如权利要求1至7中任一项所述数据查询方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至7中任一项所述数据查询方法。
CN201711421701.2A 2017-12-25 2017-12-25 数据查询方法、电子设备及存储介质 Active CN110019876B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201711421701.2A CN110019876B (zh) 2017-12-25 2017-12-25 数据查询方法、电子设备及存储介质
PCT/CN2017/119637 WO2019127299A1 (zh) 2017-12-25 2017-12-29 数据查询方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711421701.2A CN110019876B (zh) 2017-12-25 2017-12-25 数据查询方法、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110019876A CN110019876A (zh) 2019-07-16
CN110019876B true CN110019876B (zh) 2023-07-28

Family

ID=67064331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711421701.2A Active CN110019876B (zh) 2017-12-25 2017-12-25 数据查询方法、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN110019876B (zh)
WO (1) WO2019127299A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112241672B (zh) * 2019-07-19 2024-05-03 杭州海康威视数字技术股份有限公司 一种身份数据的关联方法、装置、电子设备及存储介质
CN111177440B (zh) * 2019-12-20 2023-11-07 北京旷视科技有限公司 目标图像的检索方法、装置、计算机设备和存储介质
CN111159443B (zh) * 2019-12-31 2022-03-25 深圳云天励飞技术股份有限公司 一种图像特征值的搜索方法、装置及电子设备
CN111311094B (zh) * 2020-02-14 2022-05-24 上海东普信息科技有限公司 供应链项目分析方法、装置、设备及存储介质
CN111797256A (zh) * 2020-05-29 2020-10-20 平安普惠企业管理有限公司 基于多色图片的查询结果发送方法、装置和计算机设备
CN112069129B (zh) * 2020-09-18 2024-01-19 浪潮云信息技术股份公司 基于国产cpu的配置文件格式转换方法、装置及介质
CN112364246B (zh) * 2020-11-19 2024-02-06 中国平安人寿保险股份有限公司 数据搜索方法、装置、计算机设备及存储介质
CN113268485B (zh) * 2021-06-02 2024-02-09 电信科学技术第十研究所有限公司 数据表关联分析方法、装置、设备及存储介质
CN113568956B (zh) * 2021-08-05 2024-06-18 武汉美之修行信息科技有限公司 一种近似产品查询方法、装置及计算机可读存储介质
CN116541420B (zh) * 2023-07-07 2023-09-15 上海爱可生信息技术股份有限公司 向量数据的查询方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436491A (zh) * 2011-11-08 2012-05-02 张三明 一种基于BigBase的海量图片搜索系统及方法
CN102902826A (zh) * 2012-11-08 2013-01-30 公安部第三研究所 一种基于基准图像索引的图像快速检索方法
CN103324682A (zh) * 2013-05-31 2013-09-25 百度在线网络技术(北京)有限公司 一种基于图片来搜索视频的方法及装置
CN105354273A (zh) * 2015-10-29 2016-02-24 浙江高速信息工程技术有限公司 一种快速检索高速公路逃费车辆高相似度图像的方法
US20170161271A1 (en) * 2015-12-04 2017-06-08 Intel Corporation Hybrid nearest neighbor search tree with hashing table
CN106874513A (zh) * 2017-03-07 2017-06-20 维沃移动通信有限公司 一种照片查找方法及移动终端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092848B (zh) * 2011-10-28 2016-09-07 浙江大华技术股份有限公司 一种图片存储与检索方法
CN103164402B (zh) * 2011-12-08 2016-08-10 青岛海尔电子有限公司 文件显示的方法
CN105183746B (zh) * 2015-07-08 2018-04-17 西安交通大学 从多相关图片中挖掘显著特征实现图像检索的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436491A (zh) * 2011-11-08 2012-05-02 张三明 一种基于BigBase的海量图片搜索系统及方法
CN102902826A (zh) * 2012-11-08 2013-01-30 公安部第三研究所 一种基于基准图像索引的图像快速检索方法
CN103324682A (zh) * 2013-05-31 2013-09-25 百度在线网络技术(北京)有限公司 一种基于图片来搜索视频的方法及装置
CN105354273A (zh) * 2015-10-29 2016-02-24 浙江高速信息工程技术有限公司 一种快速检索高速公路逃费车辆高相似度图像的方法
US20170161271A1 (en) * 2015-12-04 2017-06-08 Intel Corporation Hybrid nearest neighbor search tree with hashing table
CN106874513A (zh) * 2017-03-07 2017-06-20 维沃移动通信有限公司 一种照片查找方法及移动终端

Also Published As

Publication number Publication date
CN110019876A (zh) 2019-07-16
WO2019127299A1 (zh) 2019-07-04

Similar Documents

Publication Publication Date Title
CN110019876B (zh) 数据查询方法、电子设备及存储介质
US8874597B2 (en) Method and system for text filtering based on semantic matching
JP6905603B2 (ja) 画像検索方法、装置、機器および読み取り可能な記憶媒体
CN112052404B (zh) 多源异构关系网络的群体发现方法、系统、设备及介质
CN112016623B (zh) 一种人脸聚类方法、装置、设备及存储介质
CN109981326B (zh) 家庭宽带感知故障定位的方法及装置
Leng et al. Hashing for distributed data
CN110019400B (zh) 数据存储方法、电子设备及存储介质
CN109885651A (zh) 一种问题推送方法和装置
CN111309946B (zh) 一种已建立档案优化方法及装置
CN110083731B (zh) 图像检索方法、装置、计算机设备及存储介质
WO2017095413A1 (en) Incremental automatic update of ranked neighbor lists based on k-th nearest neighbors
KR101780534B1 (ko) 이미지 기반 검색을 위한 맵리듀스 기반의 이미지 특징 추출 방법 및 시스템
US11361195B2 (en) Incremental update of a neighbor graph via an orthogonal transform based indexing
CN116032741A (zh) 一种设备识别方法、装置、电子设备和计算机存储介质
CN111667018B (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备
CN103995831B (zh) 基于物品间相似度的物品处理方法、系统和装置
CN110209895B (zh) 向量检索方法、装置和设备
US20160292258A1 (en) Method and apparatus for filtering out low-frequency click, computer program, and computer readable medium
CN111222136B (zh) 恶意应用归类方法、装置、设备及计算机可读存储介质
CN111191065A (zh) 一种同源图像确定方法及装置
Ayat et al. Entity resolution for distributed probabilistic data
WO2014117296A1 (en) Generating a hint for a query
CN104463864A (zh) 多级并行关键帧云提取方法及系统
Gomes et al. Mapreduce vocabulary tree: An approach for large scale image indexing and search in the cloud

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant