CN112925942A - 一种数据搜索方法、装置、设备及存储介质 - Google Patents

一种数据搜索方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112925942A
CN112925942A CN202110341219.8A CN202110341219A CN112925942A CN 112925942 A CN112925942 A CN 112925942A CN 202110341219 A CN202110341219 A CN 202110341219A CN 112925942 A CN112925942 A CN 112925942A
Authority
CN
China
Prior art keywords
image
target
commodity image
hash value
commodity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110341219.8A
Other languages
English (en)
Inventor
骆国生
温忠源
邹伟力
何洁珍
马林
王海潮
何菁仪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202110341219.8A priority Critical patent/CN112925942A/zh
Publication of CN112925942A publication Critical patent/CN112925942A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,公开了一种数据搜索方法、装置、设备及存储介质,该方法包括:获取用户输入的目标商品图像;提取所述目标商品图像的目标特征值,并采用感知哈希函数对所述目标特征值进行处理,得到所述目标商品图像的哈希值;根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像。上述技术方案,降低了搜索计算量,提高了商品图像的匹配速度,为电子商务平台中的商品图像搜索提供了一种新思路。

Description

一种数据搜索方法、装置、设备及存储介质
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及机器视觉技术领域,具体涉及一种数据搜索方法、装置、设备及存储介质。
背景技术
在电子商务中,有时使用文字已经难以表述想要的内容,而商品图像搜索是通过图像的内容及视觉特征,为用户提供相关的图像资料检索服务,解决了用户随拍随搜、快速查找相关产品的需求。然而,在海量的种类复杂的商品图像中,如何快速匹配出用户所提供商品图像的相似图像至关重要。
发明内容
本发明实施例提供了一种数据搜索方法、装置、设备及存储介质,以实现商品图像的快速匹配。
第一方面,本发明实施例提供了一种数据搜索方法,该方法包括:
获取用户输入的目标商品图像;
提取所述目标商品图像的目标特征值,并采用感知哈希函数对所述目标特征值进行处理,得到所述目标商品图像的哈希值;
根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像。
第二方面,本发明实施例还提供了一种数据搜索装置,该装置包括:
目标商品图像获取模块,用于获取用户输入的目标商品图像;
哈希值得到模块,用于提取所述目标商品图像的目标特征值,并采用感知哈希函数对所述目标特征值进行处理,得到所述目标商品图像的哈希值;
相似图像确定模块,用于根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的数据搜索方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的数据搜索方法。
本发明实施例的技术方案,在获取用户输入的目标商品图像之后,提取目标商品图像的目标特征值,并采用感知哈希函数对目标特征值进行处理得到目标商品图像的哈希值,进而根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像。上述技术方案,引用哈希值,将目标商品图像的目标特征值转换为哈希值,通过哈希值进行目标商品的匹配,降低了搜索计算量,提高了商品图像的匹配速度,为电子商务平台中的商品图像搜索提供了一种新思路。
附图说明
图1是本发明实施例一提供的一种数据搜索方法的流程图;
图2是本发明实施例二提供的一种数据搜索方法的流程图;
图3是本发明实施例三提供的一种数据搜索方法的流程图;
图4是本发明实施例四提供的一种数据搜索方法的流程图;
图5是本发明实施例五提供的一种数据搜索装置的结构示意图;
图6是本发明实施例六提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的一种数据搜索方法的流程图;本实施例可适用于在电子商务交易场景中进行商品图像搜索的情况。该方法可以由数据搜索装置来执行,该装置可以采用软件和/或硬件的方式实现,并可配置于承载数据搜索功能的计算设备中,如服务器中。可选的,如图1所示,该方法具体包括:
S101,获取用户输入的目标商品图像。
其中,目标商品图像是指需要进行搜索的商品图像。
可选的,本实施例中,用户在具有搜索商品需求的情况下,可以从本地图像库中选择一张想要搜索的商品图像,并通过客户端发送至服务器,服务器获取用户的商品图像,并将所获取的用户的商品图像作为目标商品图像。进一步的,用户还可以在客户端通过点击“扫一扫”或者“拍一拍”等图标,调用客户端所在终端中的采集单元(比如相机)实时采集商品图像,并将所采集的商品图像发送至服务器,进而服务器获取用户的商品图像,并将所获取的用户的商品图像作为目标商品图像。
S102,提取目标商品图像的目标特征值,并采用感知哈希函数对目标特征值进行处理,得到目标商品图像的哈希值。
其中,目标特征值用于表征目标商品图像的本质特点或特性,可选的,目标特征值可以包括商品类别、商品用途和商品质量;为了进一步提高后续匹配精度,目标特征值还可以包括商品图像的颜色、纹理、形状和空间关系等。
可选的,本实施例中,可以基于深度学习技术,从目标商品图像中提取目标特征值。例如,可以预先训练一个特征提取模型,进而可以基于特征提取模型,从目标商品图像中提取目标特征值。其中,采用商品图像库中带有特征值的商品图像,进行机器学习,得到特征值提取模型。
进一步的,为了快速提取目标特征值,提取目标商品图像的目标特征值还可以是,识别目标商品图像的主体区域,并从主体区域中提取目标特征值。其中,主体区域是指目标商品图像的核心区域,也就是目标商品图像中目标商品所在的主要区域。具体可以是,采用图像识别技术,从目标商品图像中提取主体区域;之后采用特征提取模型,从主体区域中提取目标特征值。
当然,也可以采取其他方式提取目标商品图像的目标特征值,并不局限于本实施例中涉及的目标特征值的提取方法。
可以理解的是,存储电子商务大规模的商品图像的特征值需要占用大量的存储空间,因此为节省存储空间,本实施例可以对商品图像的特征值进行降维处理。例如可以利用商品图像库中一定数量的商品图像的特征值对感知哈希函数进行训练,以确定感知哈希函数中的参数,之后采用参数已知的感知哈希函数对商品图像库中所有商品图像的特征值进行降维处理,以得到商品图像库中每一商品图像的哈希值,进而可以存储商品图像的哈希值,以降低对存储空间的需求。
进而,在提取到目标商品图像的目标特征值之后,可以利用参数已知的感知哈希函数对目标特征值进行处理,得到目标商品图像的哈希值。哈希值可以是一串数值,不同的商品图像的哈希值不同。
S103,根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像。
可选的,在存储商品图像的哈希值的情况下,本实施例中,可以基于商品图像与哈希值之间的关联关系,根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像。本实施例中,可以将商品图像库中所有商品图像的哈希值存储在单独的哈希列表中,每个哈希值对应一个商品图像的获取地址,以构建商品图像与哈希值之间的关联关系;可选的,还可以将哈希值和商品图像一起存储在商品图像库中,以构建商品图像与哈希值之间的关联关系。
具体的,可以以目标商品图像的哈希值为索引,在哈希列表中查找对应的哈希值,进而根据哈希值对应的商品图像的获取地址从商品图像库中查找到相应的商品图像,作为目标商品图像的相似图像。可选的,还可以直接以目标商品图像的哈希值为索引,在商品图像库中进行查找,以确定目标商品图像的相似图像。
需要说明的是,本实施例商品图像的特征值中引入商品类别、商品用途和商品质量等,为后续精准地匹配出相似图像奠定了基础;同时本实施例基于商品图像的哈希值,从商品图像库中确定相似图像,降低了搜索计算量,提高了商品图像匹配的速度。
本发明实施例的技术方案,在获取用户输入的目标商品图像之后,提取目标商品图像的目标特征值,并采用感知哈希函数对目标特征值进行处理得到目标商品图像的哈希值,进而根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像。上述技术方案,引用哈希值,将目标商品图像的目标特征值转换为哈希值,通过哈希值进行目标商品的匹配,降低了搜索计算量,提高了商品图像匹配的速度,为电子商务平台中的商品图像搜索提供了一种新思路。
可以理解的是,当目标商品图像的像素过高时,提取目标特征值需要花费较长的时间,进而影响响应用户的速度,因此,为了进一步提高响应速度,作为本发明实施例的一种可选方式,在提取目标商品图像的目标特征值之前,可以对目标商品图像进行压缩。
具体的,可以对目标商品图像进行无损压缩,无损压缩的方法有行程长度编码和熵编码法等。可选的,还可以对目标商品图像进行有损压缩,所谓有损压缩是将色彩空间化减到图像中常用的颜色,所选择的颜色定义在压缩图像头的调色板中,图像中的每个像素都用调色板中颜色索引表示;有损压缩的方法有色度抽样、变换编码和分形压缩等。
为了更进一步的提高用户的体验效果,作为本发明实施例的另一种可选方式,在根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像之后,向用户展示相似图像的商品信息,以便用户进行查看、收藏、下单等操作。具体的,可以以列表的方式向用户展示相似图像的商品信息,或者以滑动窗口的形式向用户展示每个相似图像的商品信息。
实施例二
图2是本发明实施例二提供的一种数据搜索方法的流程图。本实施例在上述实施例的基础上,对“根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像”进一步优化,提供一种可选方案。如图2所示,该数据搜索方法具体可以包括:
S201,获取用户输入的目标商品图像。
S202,提取目标商品图像的目标特征值,并采用感知哈希函数对目标特征值进行处理,得到目标商品图像的哈希值。
S203,基于商品图像与哈希值之间的关联关系,根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像。
本实施例中,首先获取商品图像库中每一商品图像的哈希值,然后计算目标商品图像的哈希值,与商品图像库中每一商品图像的哈希值之间的距离。具体的,可以计算目标商品图像的哈希值,与商品图像库中每一商品图像的哈希值之间的差值并取绝对值,作为目标商品图像的哈希值,与商品图像库中每一商品图像的哈希值之间的距离。可选的,本实施例中两个商品图像的哈希值之间的距离可用于表征两个商品图像之间的相似度。
进而,基于商品图像与哈希值之间的关联关系,根据距离,从商品图像库中确定目标商品图像的相似图像。具体的,对距离进行由大到小的顺序排序,选取设定数量的排序在前的距离,其中,设定数量可以由本领域技术人员根据实际情况设定;进而确定与这些距离对应的商品图像库中商品图像的哈希值,并基于商品图像与哈希值之间的关联关系,从商品图像库中确定目标商品图像的相似图像。例如,可以以哈希值为索引,从商品图像库中商品图像对应的哈希值列表中查找对应的哈希值,再根据哈希值查找到对应的商品图像,作为目标商品图像的相似图像。
本发明实施例的技术方案,通过计算目标商品图像的哈希值,与商品图像库中每一商品图像的哈希值之间的距离,进而基于商品图像与哈希值之间的关联关系,根据距离,可从商品图像库中确定目标商品图像的相似图像,为快速从商品图像中匹配出目标商品图像的相似图像提供了一种可选方式。
实施例三
图3是本发明实施例三提供的一种数据搜索方法的流程图;本实施例在上述实施例的基础上,对“根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像”进一步优化,提供另一种可选方案。如图3所示,该数据搜索方法具体可以包括:
S301,获取用户输入的目标商品图像。
S302,提取目标商品图像的目标特征值,并采用感知哈希函数对目标特征值进行处理,得到目标商品图像的哈希值。
S303,根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的候选商品图像。
其中,候选商品图像是商品图像库的子集,是与目标商品图像相关的商品图像。
本实施例中,可以根据预设数值和目标商品图像的哈希值,确定哈希范围。具体的,可以在目标商品图像的哈希值上加减预设数值,以得到哈希范围。
进而,根据哈希范围和商品图像库中商品图像的哈希值,确定目标商品图像的候选商品图像。具体的,在商品图像库的商品图像的哈希值中,查找出在哈希范围内的哈希值,将这些哈希值对应的商品图像,作为目标商品图像的候选商品图像。
S304,计算目标商品图像的哈希值,与每一候选商品图像的哈希值之间的距离。
本实施例中,可以将目标商品图像的哈希值,与每一候选商品图像中的哈希值作差并取绝对值的结果,作为目标商品图像的哈希值,与每一候选商品图像的哈希值之间的距离。
S305,基于商品图像与哈希值之间的关联关系,根据距离,从候选商品图像中确定目标商品图像的相似图像。
具体的,在计算目标商品图像的哈希值与每一候选商品图像的哈希值之间的距离之后,可以对距离进行由大到小的顺序排序,并选取设定数量的排序在前的距离;进而确定与这些距离对应的候选商品图像中商品图像的哈希值,并基于商品图像与哈希值之间的关联关系,从候选商品图像中确定目标商品图像的相似图像。
本发明实施例的技术方案,根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的候选商品图像,之后计算目标商品图像的哈希值,与每一候选商品图像的哈希值之间的距离,进而基于商品图像与哈希值之间的关联关系,根据距离,从候选商品图像中确定目标商品图像的相似图像。上述技术方案,引人候选商品图像,缩小了搜索范围,进一步提高了目标商品图像的搜索速度,进而提高了响应速度,提升了用户体验。
实施例四
图4是本发明实施例四提供的一种数据搜索方法的流程图;本实施例在上述实施例的基础上,对“根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像”进一步优化,提供再一种可选方案。如图4所示,该数据搜索方法具体可以包括:
S401,获取用户输入的目标商品图像。
S402,提取目标商品图像的目标特征值,并采用感知哈希函数对目标特征值进行处理,得到目标商品图像的哈希值。
S403,确定目标商品图像的哈希值关联的二值型数据。
由于哈希值是浮点型数据,其数据占用的内存要比其他数值型数据占用的内存大,因此,可以将目标商品图像的哈希值转换成二值型数据,以进一步降低存储空间。
S404,基于商品图像与二值型数据之间的关联关系,根据目标商品图像的哈希值关联的二值型数据,从商品图像库中确定目标商品图像的相似图像。
本实施例中,计算商品图像库中每个商品图像的哈希值,并将哈希值转换为二值型数据,然后,预先建立商品图像与二值型数据之间的关联关系,可选的,将这些二值型数据可以存储在单独的二值型数据列表中,每个二值型数据对应一个商品图像的获取地址;可选的,还可以将二值型数据和商品图像一起存储在商品图像库中。
进而,基于商品图像与二值型数据之间的关联关系,以目标商品图像的哈希值关联的二值型数据为索引,从商品图像库中确定目标商品图像的相似图像。
为了更进一步提高目标商品图像的搜索速度,作为本实施例的一种可选方式,还可以确定目标商品图像的哈希值关联的整数型数据,具体的,计算商品图像库中每个商品图像的哈希值,并将哈希值转换为二值型数据,再将二值型数据转换为整数型数据。预先建立商品图像与整数型数据之间的关联关系,可选的,将这些二值型数据可以存储在单独的整数型数据列表中,每个整数型数据对应一个商品图像的获取地址;可选的,还可以将整数型数据和商品图像一起存储在商品图像库中。
进而,基于商品图像与整数值数据之间的关联关系,根据目标商品图像的哈希值关联的整数型数据,从商品图像库中确定目标商品图像的相似图像。
本发明实施例的技术方案,确定目标商品图像的哈希值关联的二值型数据,进而基于商品图像与二值型数据之间的关联关系,根据目标商品图像的哈希值关联的二值型数据,从商品图像库中确定目标商品图像的相似图像。上述技术方案,将哈希值转换为二值型数据,进一步降低了存储空间,同时提高了目标商品图像的搜索速度,提升了用户体验。
实施例五
图5是本发明实施例五提供的一种数据搜索装置的结构示意图;本实施例可适用于在电子商务交易场景中进行商品图像搜索的情况。该装置可以采用软件和/或硬件的方式实现,并可配置于承载数据搜索功能的计算设备中,如服务器中。可选的,如图5所示,该装置包括目标商品图像获取模块510,哈希值得到模块520和相似图像确定模块530,其中,
目标商品图像获取模块510,用于获取用户输入的目标商品图像;
哈希值得到模块520,用于提取目标商品图像的目标特征值,并采用感知哈希函数对目标特征值进行处理,得到目标商品图像的哈希值;
相似图像确定模块530,用于根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像。
本发明实施例的技术方案,在获取用户输入的目标商品图像之后,提取目标商品图像的目标特征值,并采用感知哈希函数对目标特征值进行处理得到目标商品图像的哈希值,进而根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像。上述技术方案,引用哈希值,将目标商品图像的目标特征值转换为哈希值,通过哈希值进行目标商品的匹配,降低了搜索计算量,提高了商品图像的匹配速度,为电子商务平台中的商品图像搜索提供了一种新思路。
进一步地,哈希值得到模块520包括特征值提取单元,其中,
特征值提取单元,用于识别目标商品图像的主体区域,并从主体区域中提取目标特征值。
进一步地,特征值提取单元,还用于基于特征提取模型,从目标商品图像中提取目标特征值。
进一步地,相似图像确定模块530具体用于
基于商品图像与哈希值之间的关联关系,根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的相似图像。
进一步地,相似图像确定模块530包括距离计算单元和相似图像确定单元,其中,
距离计算单元,用于计算目标商品图像的哈希值,与商品图像库中每一商品图像的哈希值之间的距离;
相似图像确定单元,用于基于商品图像与哈希值之间的关联关系,根据距离,从商品图像库中确定目标商品图像的相似图像。
进一步地,相似图像确定模块530还包括候选商品图像确定单元,其中,
候选商品图像确定单元,用于根据目标商品图像的哈希值,从商品图像库中确定目标商品图像的候选商品图像;
距离计算单元,还用于计算目标商品图像的哈希值,与每一候选商品图像的哈希值之间的距离;
相似图像确定单元,还用于基于商品图像与哈希值之间的关联关系,根据距离,从候选商品图像中确定目标商品图像的相似图像。
进一步地,候选商品图像确定单元包括哈希范围确定子单元和候选商品图像确定子单元,其中,
哈希范围确定子单元,用于根据预设数值和目标商品图像的哈希值,确定哈希范围;
候选商品图像确定子单元,用于根据哈希范围和商品图像库中商品图像的哈希值,确定目标商品图像的候选商品图像。
进一步地,相似图像确定模块530还包括二值型数据确定单元,其中,
二值型数据确定单元,用于确定目标商品图像的哈希值关联的二值型数据;
相似图像确定单元,还用于基于商品图像与二值型数据之间的关联关系,根据目标商品图像的哈希值关联的二值型数据,从商品图像库中确定目标商品图像的相似图像。
进一步地,相似图像确定模块530还包括整数型数据确定单元,其中,
整数型数据确定单元,用于确定目标商品图像的哈希值关联的整数型数据;
相似图像确定单元,还用于基于商品图像与整数值数据之间的关联关系,根据目标商品图像的哈希值关联的整数型数据,从商品图像库中确定目标商品图像的相似图像。
进一步地,该装置还包括图像压缩模块,该图像压缩模块用于对目标商品图像进行压缩。
进一步地,该装置还包括商品信息展示模块,该商品信息展示模块用于向用户展示相似图像的商品信息。
进一步地,目标特征值至少包括:商品类别、商品用途和商品质量。
实施例六
图6是本发明实施例六提供的一种电子设备的结构示意图,图6示出了适于用来实现本发明实施例实施方式的示例性电子设备的框图。图6显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。该设电子备典型可以是上述实施例中承载数据搜索功能的计算设备。
如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:一个或者多个处理单元或者处理器616,存储器628,连接不同系统组件(包括存储器628和处理器616)的总线618。
总线618表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备600典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备600访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器628可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)630和/或高速缓存存储器632。电子设备600可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统634可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线618相连。存储器628可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明实施例各实施例的功能。
具有一组(至少一个)程序模块642的程序/实用工具640,可以存储在例如存储器628中,这样的程序模块642包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块642通常执行本发明实施例所描述的实施例中的功能和/或方法。
电子设备600也可以与一个或多个外部设备614(例如键盘、指向设备、显示器624等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口622进行。并且,电子设备600还可以通过网络适配器520与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图6所示,网络适配器620通过总线618与电子设备600的其它模块通信。应当明白,尽管图6中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器616通过运行存储在存储器628中的程序,从而执行各种功能应用以及数据处理,例如实现本发明任一实施例所提供的数据搜索方法。
实施例七
本发明实施例七还提供一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时可以用于执行本发明上述任一实施例所提供的数据搜索方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言(诸如Java、Smalltalk、C++),还包括常规的过程式程序设计语言(诸如“C”语言或类似的程序设计语言)。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明实施例进行了较为详细的说明,但是本发明实施例不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (15)

1.一种数据搜索方法,其特征在于,包括:
获取用户输入的目标商品图像;
提取所述目标商品图像的目标特征值,并采用感知哈希函数对所述目标特征值进行处理,得到所述目标商品图像的哈希值;
根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像。
2.根据权利要求1所述的方法,其特征在于,提取所述目标商品图像的目标特征值,包括:
识别所述目标商品图像的主体区域,并从所述主体区域中提取所述目标特征值。
3.根据权利要求1所述的方法,其特征在于,提取所述目标商品图像的目标特征值,包括:
基于特征提取模型,从所述目标商品图像中提取所述目标特征值。
4.根据权利要求1所述的方法,其特征在于,根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像,包括:
基于商品图像与哈希值之间的关联关系,根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像。
5.根据权利要求4所述的方法,其特征在于,基于商品图像与哈希值之间的关联关系,根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像,包括:
计算所述目标商品图像的哈希值,与所述商品图像库中每一商品图像的哈希值之间的距离;
基于商品图像与哈希值之间的关联关系,根据所述距离,从商品图像库中确定所述目标商品图像的相似图像。
6.根据权利要求4所述的方法,其特征在于,根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像,包括:
根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的候选商品图像;
计算所述目标商品图像的哈希值,与每一候选商品图像的哈希值之间的距离;
基于商品图像与哈希值之间的关联关系,根据所述距离,从所述候选商品图像中确定所述目标商品图像的相似图像。
7.根据权利要求6所述的方法,其特征在于,根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的候选商品图像,包括:
根据预设数值和所述目标商品图像的哈希值,确定哈希范围;
根据所述哈希范围和所述商品图像库中商品图像的哈希值,确定所述目标商品图像的候选商品图像。
8.根据权利要求1所述的方法,其特征在于,根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像,包括:
确定所述目标商品图像的哈希值关联的二值型数据;
基于商品图像与二值型数据之间的关联关系,根据所述目标商品图像的哈希值关联的二值型数据,从商品图像库中确定所述目标商品图像的相似图像。
9.根据权利要求1所述的方法,其特征在于,根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像,包括:
确定所述目标商品图像的哈希值关联的整数型数据;
基于商品图像与整数值数据之间的关联关系,根据所述目标商品图像的哈希值关联的整数型数据,从商品图像库中确定所述目标商品图像的相似图像。
10.根据权利要求1所述的方法,其特征在于,提取所述目标商品图像的目标特征值之前,还包括:
对所述目标商品图像进行压缩。
11.根据权利要求1所述的方法,其特征在于,根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像之后,还包括:
向用户展示所述相似图像的商品信息。
12.根据权利要求1-11中任一所述的方法,其特征在于,所述目标特征值至少包括:商品类别、商品用途和商品质量。
13.一种数据搜索装置,其特征在于,包括:
目标商品图像获取模块,用于获取用户输入的目标商品图像;
哈希值得到模块,用于提取所述目标商品图像的目标特征值,并采用感知哈希函数对所述目标特征值进行处理,得到所述目标商品图像的哈希值;
相似图像确定模块,用于根据所述目标商品图像的哈希值,从商品图像库中确定所述目标商品图像的相似图像。
14.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的数据搜索方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-12中任一所述的数据搜索方法。
CN202110341219.8A 2021-03-30 2021-03-30 一种数据搜索方法、装置、设备及存储介质 Pending CN112925942A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110341219.8A CN112925942A (zh) 2021-03-30 2021-03-30 一种数据搜索方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110341219.8A CN112925942A (zh) 2021-03-30 2021-03-30 一种数据搜索方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112925942A true CN112925942A (zh) 2021-06-08

Family

ID=76176564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110341219.8A Pending CN112925942A (zh) 2021-03-30 2021-03-30 一种数据搜索方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112925942A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657273A (zh) * 2021-08-17 2021-11-16 中国平安财产保险股份有限公司 确定商品信息的方法、装置、电子设备及介质
CN114676278A (zh) * 2022-03-22 2022-06-28 鲸灵云(杭州)智能有限公司 一种基于私域电商平台中用户图片的识别处理方法、系统和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657273A (zh) * 2021-08-17 2021-11-16 中国平安财产保险股份有限公司 确定商品信息的方法、装置、电子设备及介质
CN114676278A (zh) * 2022-03-22 2022-06-28 鲸灵云(杭州)智能有限公司 一种基于私域电商平台中用户图片的识别处理方法、系统和存储介质

Similar Documents

Publication Publication Date Title
CN107832662B (zh) 一种获取图片标注数据的方法和系统
CN112559800B (zh) 用于处理视频的方法、装置、电子设备、介质和产品
US20220351390A1 (en) Method for generating motion capture data, electronic device and storage medium
KR102002024B1 (ko) 객체 라벨링 처리 방법 및 객체 관리 서버
CN112925942A (zh) 一种数据搜索方法、装置、设备及存储介质
JP2022110132A (ja) 陳列シーン認識方法、モデルトレーニング方法、装置、電子機器、記憶媒体およびコンピュータプログラム
US12118770B2 (en) Image recognition method and apparatus, electronic device and readable storage medium
CN113780098A (zh) 文字识别方法、装置、电子设备以及存储介质
CN112287945A (zh) 碎屏确定方法、装置、计算机设备及计算机可读存储介质
CN114549904A (zh) 视觉处理及模型训练方法、设备、存储介质及程序产品
CN113360683A (zh) 训练跨模态检索模型的方法以及跨模态检索方法和装置
CN112258541A (zh) 视频边界检测方法、系统、设备及存储介质
CN110516094A (zh) 门类兴趣点数据的去重方法、装置、电子设备及存储介质
CN115994243A (zh) 跨模态检索模型处理方法、装置、设备、产品及介质
CN108009233B (zh) 一种图像还原方法、装置、计算机设备及存储介质
CN111124862B (zh) 智能设备性能测试方法、装置及智能设备
CN113903071A (zh) 人脸识别方法、装置、电子设备和存储介质
CN113642472A (zh) 判别器模型的训练方法和动作识别方法
CN112801078A (zh) 兴趣点poi的匹配方法、装置、电子设备及存储介质
CN113360712B (zh) 视频表示的生成方法、装置和电子设备
CN113408530B (zh) 一种图像识别方法、装置、设备以及存储介质
CN113627399B (zh) 题目处理方法、装置、设备及存储介质
CN114363627B (zh) 图像处理方法、装置及电子设备
CN113221920B (zh) 图像识别方法、装置、设备、存储介质以及计算机程序产品
CN114549697A (zh) 图像处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination