CN112541091A - 图像搜索方法、装置、服务器和存储介质 - Google Patents

图像搜索方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN112541091A
CN112541091A CN201910898814.4A CN201910898814A CN112541091A CN 112541091 A CN112541091 A CN 112541091A CN 201910898814 A CN201910898814 A CN 201910898814A CN 112541091 A CN112541091 A CN 112541091A
Authority
CN
China
Prior art keywords
image
target
intention
search
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910898814.4A
Other languages
English (en)
Inventor
沈力行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201910898814.4A priority Critical patent/CN112541091A/zh
Priority to PCT/CN2020/116923 priority patent/WO2021057741A1/zh
Publication of CN112541091A publication Critical patent/CN112541091A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种图像搜索方法、装置、服务器和存储介质,涉及深度学习技术领域。包括:接收图像搜索指令,该图像搜索指令中携带输入信息;根据该输入信息,确定该输入信息对应的意图类别的多个属性信息,该意图类别为该输入信息对应的图像搜索意图的类别;根据该意图类别对应的多个属性信息,生成标准查询式;根据该标准查询式,在第一图像库中进行图像搜索,得到符合该标准查询式的至少一个目标图像,输出该至少一个目标图像,该第一图像库中存储多个图像,使得服务器可以根据输入信息的语义进行图像搜索,可以获取到更抽象、更泛化、更自由的标砖查询式,从而扩大了搜索范围,提高了搜索到的图像信息的数量。

Description

图像搜索方法、装置、服务器和存储介质
技术领域
本公开涉及深度学习技术领域,特别涉及一种图像搜索方法、装置、服务器和存储介质。
背景技术
信息检索一般利用结构化语句或者固定的指令集合进行搜索,例如,通过关键词或关键短语集合进行信息搜索。随着跨媒体技术的发展,信息搜索得到的相关信息的类型也越来越广泛,从文本扩展到音频、图像或视频等。其中,对图像搜索是指通过信息搜索返回的相关答案为图像集合的搜索方式。
相关技术中,对搜索入口对应的图像库中的图像进行标注,当对图像进行搜索时,向搜索入口中输入相关的关键词或关键短语集合;根据图像库中图像标注的标签,确定该图像与该关键词或关键短语集合的相似度,进而确定该关键词或关键短语对应的图像,输出该图像。
上述相关技术中,在进行图像搜索时,只能根据输入的关键词或关键短语集合获得需要搜索的信息,被搜索的对象不够抽象,太过具体,导致搜索到的图像信息较少。
发明内容
为了克服相关技术中存在的相关图像中的关与图像标注的数据和文本解析式标注数据等无法充分利用起来,造成搜索范围较小,答案不准确的问题,本公开提供了一种图像搜索方法、装置、服务器和存储介质。
一方面,提供了一种图像搜索方法,所述方法包括:
接收图像搜索指令,所述图像搜索指令中携带输入信息;
根据所述输入信息,确定所述输入信息对应的意图类别的多个属性信息,所述意图类别为所述输入信息对应的图像搜索意图的类别;
根据所述意图类别对应的多个属性信息,生成标准查询式;
根据所述标准查询式,在第一图像库中进行图像搜索,得到符合所述标准查询式的至少一个目标图像,输出所述至少一个目标图像,所述第一图像库中存储多个图像。
在一种可能的实现方式中,所述根据所述输入信息,确定所述输入信息对应的意图类别的多个属性信息,包括:
根据所述输入信息,对所述输入信息进行意图识别,得到所述输入信息对应的图像搜索意图;根据所述图像搜索意图,确定所述图像搜索意图的意图类别;根据所述意图类别,确定所述意图类别对应的多个目标属性;根据所述多个目标属性,从所述输入信息中获取所述多个目标属性对应的多个属性信息;或者,
将所述输入信息输入至意图识别模型中,输出所述输入信息对应的意图类别的多个属性信息。
在另一种可能的实现方式中,所述根据所述多个目标属性,从所述输入信息中获取所述多个目标属性对应的多个属性信息,包括:
对所述输入信息进行语义解析,得到所述输入信息的语义解析结果,所述语义解析结果包括多个属性和每个属性对应的属性信息;
从所述语义解析结果中,确定所述多个目标属性对应的多个属性信息。
在另一种可能的实现方式中,所述根据所述标准查询式,在第一图像库中进行图像搜索,得到符合所述标准查询式的至少一个目标图像,包括:
确定所述标准查询式对应的搜索字段;
根据所述搜索字段,从所述第一图像库中确定与所述搜索字段匹配的至少一个目标描述文本,所述第一图像库中存储多个图像和每个图像对应的描述文本;
根据所述至少一个目标描述文本,从所述第一图像库中确定所述至少一个目标描述文本对应的至少一个目标图像。
在另一种可能的实现方式中,所述根据所述至少一个目标描述文本,从所述第一图像库中确定所述至少一个目标描述文本对应的至少一个目标图像,包括:
根据所述搜索字段,确定与所述搜索字段匹配的目标图像标签;
根据所述目标图像标签,从所述第一图像库中确定所述目标图像标签对应的至少一个图像,所述第一图像库中的每个图像上标注了所述图像对应的图像标签;
根据所述至少一个目标描述文本,从所述目标图像标签对应的至少一个图像中确定所述至少一个目标描述文本对应的至少一个目标图像。
在另一种可能的实现方式中,所述根据所述搜索字段,确定与所述搜索字段匹配的目标图像标签之前,所述方法还包括:
获取多个图像,对于每个图像,对所述图像进行目标检测,得到所述图像对应的意图类别;
对所述图像进行图像识别,得到所述图像对应的属性信息;根据所述图像对应的意图类别和属性信息,生成所述图像对应的描述文本,所述图像对应的描述文本中包括所述意图类别和所述属性信息,将所述图像和所述图像的描述文本存储至所述第一图像库中;和/或,
根据所述图像对应的意图类别,确定所述图像对应的图像标签;标注所述图像对应的图像标签。
在另一种可能的实现方式中,所述根据所述标准查询式,在第一图像库中进行图像搜索之前,所述方法还包括:
确定当前登录账户的目标用户的历史搜索图像;
根据所述历史搜索图像,确定所述历史搜索图像对应的意图类别;
根据所述历史搜索图像对应的意图类别,确定所述历史搜索图像对应的图像标签;
从第二图像库中选择与所述历史搜索图像对应的图像标签匹配的多个图像,所述第二图像库中存储了多个图像,每个图像上标注图像标签;
将所述多个图像组成所述第一图像库。
在另一种可能的实现方式中,所述根据所述多个目标属性,从所述输入信息中获取所述多个目标属性对应的多个属性信息之后,所述方法还包括:
当所述多个目标属性中的关键属性的属性信息未被填写时,生成反馈信息,所述反馈信息用于提示用户所述输入信息不完整;输出所述反馈信息;
当所述多个目标属性中的关键属性的属性信息均被填写时,执行根据所述意图类别对应的多个属性信息,生成标准查询式的步骤。
另一方面,提供了一种图像搜索装置,所述装置包括:
接收模块,用于接收图像搜索指令,所述图像搜索指令中携带输入信息;
第一确定模块,用于根据所述输入信息,确定所述输入信息对应的意图类别的多个属性信息,所述意图类别为所述输入信息对应的图像搜索意图的类别;
第一生成模块,用于根据所述意图类别对应的多个属性信息,生成标准查询式;
搜索模块,用于根据所述标准查询式,在第一图像库中进行图像搜索,得到符合所述标准查询式的至少一个目标图像,输出所述至少一个目标图像,所述第一图像库中存储多个图像。
在一种可能的实现方式中,所述第一确定模块还用于根据所述输入信息,对所述输入信息进行意图识别,得到所述输入信息对应的图像搜索意图;根据所述图像搜索意图,确定所述图像搜索意图的意图类别;根据所述意图类别,确定所述意图类别对应的多个目标属性;根据所述多个目标属性,从所述输入信息中获取所述多个目标属性对应的多个属性信息;或者,将所述输入信息输入至意图识别模型中,输出所述输入信息对应的意图类别的多个属性信息。
在另一种可能的实现方式中,所述第一确定模块,还用于对所述输入信息进行语义解析,得到所述输入信息的语义解析结果,所述语义解析结果包括多个属性和每个属性对应的属性信息;从所述语义解析结果中,确定所述多个目标属性对应的多个属性信息。
在另一种可能的实现方式中,所述搜索模块,还用于确定所述标准查询式对应的搜索字段;根据所述搜索字段,从所述第一图像库中确定与所述搜索字段匹配的至少一个目标描述文本,所述第一图像库中存储多个图像和每个图像对应的描述文本;根据所述至少一个目标描述文本,从所述第一图像库中确定所述至少一个目标描述文本对应的至少一个目标图像。
在另一种可能的实现方式中,所述搜索模块,还用于根据所述搜索字段,确定与所述搜索字段匹配的目标图像标签;根据所述目标图像标签,从所述第一图像库中确定所述目标图像标签对应的至少一个图像,所述第一图像库中的每个图像上标注了所述图像对应的图像标签;根据所述至少一个目标描述文本,从所述目标图像标签对应的至少一个图像中确定所述至少一个目标描述文本对应的至少一个目标图像。
在另一种可能的实现方式中,所述装置还包括:
获取模块,用于获取多个图像,对于每个图像,对所述图像进行目标检测,得到所述图像对应的意图类别;
识别模块,用于对所述图像进行图像识别,得到所述图像对应的属性信息;根据所述图像对应的意图类别和属性信息,生成所述图像对应的描述文本,所述图像对应的描述文本中包括所述意图类别和所述属性信息,将所述图像和所述图像的描述文本存储至所述第一图像库中;和/或,根据所述图像对应的意图类别,确定所述图像对应的图像标签;标注所述图像对应的图像标签。
在另一种可能的实现方式中,所述装置还包括:
第二确定模块,用于确定当前登录账户的目标用户的历史搜索图像;
第三确定模块,用于根据所述历史搜索图像,确定所述历史搜索图像对应的意图类别;
第四确定模块,用于根据所述历史搜索图像对应的意图类别,确定所述历史搜索图像对应的图像标签;
第一选择模块,用于从第二图像库中选择与所述历史搜索图像对应的图像标签匹配的多个图像,所述第二图像库中存储了多个图像,每个图像上标注图像标签;
组成模块,用于将所述多个图像组成所述第一图像库。
在另一种可能的实现方式中,所述装置还包括:
第二生成模块,用于当所述多个目标属性中的关键属性的属性信息未被填写时,生成反馈信息,所述反馈信息用于提示用户所述输入信息不完整;输出所述反馈信息;
所述第一生成模块,还用于当所述多个目标属性中的关键属性的属性信息均被填写时,根据所述意图类别对应的多个属性信息,生成标准查询式。
另一方面,提供了一种服务器,所述服务器包括:
至少一个处理器;和
至少一个存储器;
所述至少一个存储器存储有一个或多个程序,所述一个或多个程序被配置成由所述至少一个处理器执行,所述一个或多个程序包含用于进行如本公开实施中所述的图像搜索方法的指令。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质应用于终端,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如本公开实施例中所述图像搜索方法中的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
在本公开实施例中,通过接收图像搜索指令,该图像搜索指令中携带输入信息;根据该输入信息,确定该输入信息对应的意图类别的多个属性信息,该意图类别为该输入信息对应的图像搜索意图的类别;根据该意图类别对应的多个属性信息,生成标准查询式;根据该标准查询式,在第一图像库中进行图像搜索,得到符合该标准查询式的至少一个目标图像,输出该至少一个目标图像,该第一图像库中存储多个图像,使得服务器可以根据输入信息的语义进行图像搜索,可以获取到更抽象、更泛化、更自由的标砖查询式,从而扩大了搜索范围,提高了搜索到的图像信息的数量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并于说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种图像搜索方法所涉及的实施环境的示意图;
图2是根据一示例性实施例示出的一种图像搜索方法所涉及的实施环境的示意图;
图3是根据一示例性实施例示出的一种图像搜索方法流程图;
图4是根据一示例性实施例示出的一种图像搜索方法流程图;
图5是根据一示例性实施例示出的一种意图解析模块的结构示意图;
图6是根据一示例性实施例示出的一种查询信息管理模块的结构示意图;
图7是根据一示例性实施例示出的一种图像搜索装置框图;
图8是本公开实施例提供的一种服务器的结构示意图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据本公开示例性实施例示出的一种图像搜索方法所涉及的实施环境的示意图。参见图1,该实施环境包括终端101和服务器102。终端101和服务器102之间通过网络连接进行数据交互。终端101中运行服务器102关联的应用程序,基于该应用程序可以登录服务器102,从而与服务器102进行数据交互。其中,该终端101中的应用程序可以为任一具有图像搜索功能的应用程序,相应的,该终端101可以通过该应用程序向服务器102发送图像搜索指令,该图像搜索指令携带输入信息。服务器102接收该图像搜索指令,根据该图像搜索指令中的输入信息进行图像搜索。
其中,该终端101可以为任一具有图像搜索功能的终端101,例如,该终端101可以为手机、电脑或可穿戴设备等。在本公开实施例中,对该终端101不作具体限定。该图像搜索功能可以为通过终端101图像搜索入口实现的图像搜索功能,该图像搜索功能还可以为目标对话界面提供的搜索功能,在本公开实施例中,对此不作具体限定。
当该图像搜索功能为图像搜索入口提供的图像搜索功能时,终端101可以通过该图像搜索入口接收用户输入的图像搜索指令。相应的,用户向该图像搜索入口中输入待搜索的输入信息,当终端101检测到该图像搜索入口中输入了待搜索的输入信息时,终端101确认接收到图像搜索指令。当该图像搜索功能为目标对话界面提供的图像搜索功能时,终端101通过该目标对话界面接收用户输入的输入信息,相应的,当用户在该目标对话界面中输入了输入信息后,可以点击发送按钮,将该输入信息输入至该目标对话界面中,终端101检测到发送按钮被点击时,确定接收到了图像搜索指令。
另外,该目标对话界面可以为终端101中安装的第三方应用程序中的对话界面,也可以为终端101中安装的第三方应用程序中的小程序或公众号中的目标对话界面,在本公开实施例中,对此不作具体限定。
该终端101接收到用户输入的图像搜索指令时,根据该图像搜索指令向服务器102发送搜索指令,该搜索指令中携带输入信息,服务器102接收该收入信息,根据该输入信息进行图像搜索。该服务器102可以对不同的输入信息进行意图分析和语义解析,适用于对话系统中,通过输入信息对应的问题句子获取更抽象更泛化更自由的信息。参见图2,该服务器102包括:意图解析模块、查询信息管理模块和图像检索模块。其中,意图解析模块的输出与查询信息管理模块的输入连接,查询信息管理模块的输出与图像检索模块的输入连接。
该意图解析模块,用于接收图像搜索指令,该图像搜索指令中携带输入信息,该意图解析模块对该输入信息进行意图识别,确定该输入信息的意图类别,根据该意图类别,确定与该意图类别对应的多个属性信息。
在一种可能的实现方式中,该意图解析模块中可以包括意图识别模型,相应的,意图解析模块可以将该输入信息输入至该意图识别模型中,通过该意图识别模型识别该输入信息对应的意图类别的多个属性信息。
在另一种可能的实现方式中,该意图解析模块,还用于对该输入信息进行意图识别,得到该输入信息对应的图像搜索意图;根据该图像搜索意图,确定该图像搜索意图的意图类别,根据该意图类别,确定该意图类别对应的多个目标属性;根据多个目标属性,从输入信息中获取该多个目标属性的多个属性信息。
意图解析模块获取到该意图类别的多个属性信息之后,将该意图类别的多个属性信息输入至查询信息管理模块。该查询信息管理模块,用于接收该意图解析模块输出的该意图类别的多个属性信息,根据该意图类别对应的多个属性信息生成标准查询式,将该标准查询式发送给图像检索模块。
在一种可能的实现方式中,该查询信息管理模块中包括标准查询式生成单元和反馈生成单元。该反馈生成单元的输入与意图解析模块的输出连接,该反馈单元的输出与标准查询式生成单元的输入连接。
其中,该反馈生成单元用于接收该意图解析模块输出的该意图类别对应的多个属性信息,确定当前多个目标属性中的关键属性的属性信息是否被填写,当多个目标属性中的关键属性的属性信息未被填写时,生成反馈信息,输出该反馈信息,该反馈信息用于提示用户该输入信息提供的信息不完整。当该多个目标属性中的关键属性的属性信息均被填写时,将该多个目标属性对应的多个属性信息发送给标准查询式生成单元。
该标准查询式生成单元,用于接收该反馈生成单元输出的多个目标属性对应的多个属性信息,根据该多个属性信息生成标准查询式,将该标准查询式发送给图像检索模块。
该图像检索模块,用于接收该查询信息管理模块输出的标准查询式,确定该标准查询式对应的搜索字段,根据该搜索字段,从第一图像库中确定与该搜索字段匹配的至少一个目标描述文本,第一图像库中存储多个图像和每个图像对应的描述文本;根据该至少一个目标描述文本,从第一图像库中确定该至少一个目标描述文本对应的至少一个目标图像。
并且,该查询信息管理模块在根据至少一个目标描述文本,从第一图像库中确定至少一个目标描述文本对应的至少一个目标图像时,根据该搜索字段,确定与该搜索字段匹配的目标图像标签;根据该目标图像标签,从第一图像库中确定目标图像对应的至少一个图像,第一图像库中的每个图像上标注了图像对应的图像标签;根据至少一个目标描述文本,从目标图像标签对应的至少一个图像中确定至少一个目标描述文本对应的至少一个目标图像。
在一种可能的实现方式中,该图像搜索系统还包括图像推荐模块,该图像推荐模块与该图像检索模块连接。图像推荐模块,用于确定第一图像库,为图像检索模块推荐第一图像库。
第一种实现方式,图像推荐模块根据图像搜索业务,确定第一图像库。相应的,该图像推荐模块用于确定当前图像搜索业务,根据该图像搜索业务,确定该图像搜索业务的业务类型,根据该业务类型从第二图像库中选择与该业务类型匹配的多个图像,将该多个图像组成第一图像库。
该图像搜索业务为根据不同的图像搜索任务确定,例如。公安领域对查询人物信息领域兴趣较高,则图像推荐模块从第二图像库中选择包括人物的多个图像,将该多个图像组成第一图像库。再如,交通领域对于车辆查询兴趣较高,则图像推荐模块从第二图像库中选择包括车辆的多个图像,将该多个图像组成第一图像库。
第二种实现方式,图像推荐模块还可以根据目标用户的历史搜索记录,确定第一图像库。相应的,该图像推荐模块用于确定当前登录账户的目标用户的历史搜索图像;根据该历史搜索图像,确定该历史搜索图像对应的意图类别;根据该历史搜索图像对应的意图类别,确定该历史搜索图像对应的图像标签;从第二图像库中选择与该历史搜索图像对应的图像标签匹配的多个图像,该第二图像库中存储了多个图像,每个图像上标注图像标签;将该多个图像组成该第一图像库。
图3是根据一示例性实施例示出的一种图像搜索方法流程图,如图3所示,该方法包括如下步骤。
步骤301:接收图像搜索指令,该图像搜索指令中携带输入信息。
步骤302:根据该输入信息,确定该输入信息对应的意图类别的多个属性信息,该意图类别为该输入信息对应的图像搜索意图的类别。
步骤303:根据该意图类别对应的多个属性信息,生成标准查询式。
步骤304:根据该标准查询式,在第一图像库中进行图像搜索,得到符合该标准查询式的至少一个目标图像,输出该至少一个目标图像,该第一图像库中存储多个图像。
在一种可能的实现方式中,该根据该输入信息,确定该输入信息对应的意图类别的多个属性信息,包括:
根据该输入信息,对该输入信息进行意图识别,得到该输入信息对应的图像搜索意图;根据该图像搜索意图,确定该图像搜索意图的意图类别;根据该意图类别,确定该意图类别对应的多个目标属性;根据该多个目标属性,从该输入信息中获取该多个目标属性对应的多个属性信息;或者,
将该输入信息输入至意图识别模型中,输出该输入信息对应的意图类别的多个属性信息。
在另一种可能的实现方式中,该根据该多个目标属性,从该输入信息中获取该多个目标属性对应的多个属性信息,包括:
对该输入信息进行语义解析,得到该输入信息的语义解析结果,该语义解析结果包括多个属性和每个属性对应的属性信息;
从该语义解析结果中,确定该多个目标属性对应的多个属性信息。
在另一种可能的实现方式中,该根据该标准查询式,在第一图像库中进行图像搜索,得到符合该标准查询式的至少一个目标图像,包括:
确定该标准查询式对应的搜索字段;
根据该搜索字段,从该第一图像库中确定与该搜索字段匹配的至少一个目标描述文本,该第一图像库中存储多个图像和每个图像对应的描述文本;
根据该至少一个目标描述文本,从该第一图像库中确定该至少一个目标描述文本对应的至少一个目标图像。
在另一种可能的实现方式中,该根据该至少一个目标描述文本,从该第一图像库中确定该至少一个目标描述文本对应的至少一个目标图像,包括:
根据该搜索字段,确定与该搜索字段匹配的目标图像标签;
根据该目标图像标签,从该第一图像库中确定该目标图像标签对应的至少一个图像,该第一图像库中的每个图像上标注了该图像对应的图像标签;
根据该至少一个目标描述文本,从该目标图像标签对应的至少一个图像中确定该至少一个目标描述文本对应的至少一个目标图像。
在另一种可能的实现方式中,该根据该搜索字段,确定与该搜索字段匹配的目标图像标签之前,该方法还包括:
获取多个图像,对于每个图像,对该图像进行目标检测,得到该图像对应的意图类别;
对该图像进行图像识别,得到该图像对应的属性信息;根据该图像对应的意图类别和属性信息,生成该图像对应的描述文本,该图像对应的描述文本中包括该意图类别和该属性信息,将该图像和该图像的描述文本存储至该第一图像库中;和/或,
根据该图像对应的意图类别,确定该图像对应的图像标签;标注该图像对应的图像标签。
在另一种可能的实现方式中,该根据该标准查询式,在第一图像库中进行图像搜索之前,该方法还包括:
确定当前登录账户的目标用户的历史搜索图像;
根据该历史搜索图像,确定该历史搜索图像对应的意图类别;
根据该历史搜索图像对应的意图类别,确定该历史搜索图像对应的图像标签;
从第二图像库中选择与该历史搜索图像对应的图像标签匹配的多个图像,该第二图像库中存储了多个图像,每个图像上标注图像标签;
将该多个图像组成该第一图像库。
在另一种可能的实现方式中,该根据该多个目标属性,从该输入信息中获取该多个目标属性对应的多个属性信息之后,该方法还包括:
当该多个目标属性中的关键属性的属性信息未被填写时,生成反馈信息,该反馈信息用于提示用户该输入信息不完整;输出该反馈信息;
当该多个目标属性中的关键属性的属性信息均被填写时,执行根据该意图类别对应的多个属性信息,生成标准查询式的步骤。
在本公开实施例中,通过接收图像搜索指令,该图像搜索指令中携带输入信息;根据该输入信息,确定该输入信息对应的意图类别的多个属性信息,该意图类别为该输入信息对应的图像搜索意图的类别;根据该意图类别对应的多个属性信息,生成标准查询式;根据该标准查询式,在第一图像库中进行图像搜索,得到符合该标准查询式的至少一个目标图像,输出该至少一个目标图像,该第一图像库中存储多个图像,使得服务器可以根据输入信息的语义进行图像搜索,可以获取到更抽象、更泛化、更自由的标砖查询式,从而扩大了搜索范围,提高了搜索到的图像信息的数量。
图4是根据一示例性实施例提出的一种图像搜索方法的流程图,如图4所示,该方法包括如下步骤。
步骤401:服务器接收图像搜索指令,该图像搜索指令中携带输入信息。
在本步骤中,当用户想要进行图像搜索时,用户在终端中输入该输入信息,触发终端向服务器发送图像搜索指令,该图像搜索指令携带该输入信息。其中,该输入信息可以为待查询的问题,例如,该输入信息可以为“十点左右有哪些穿红衣服的女生通过路口A”。该输入信息还可以为由关键字或关键短语组成的输入信息,例如,该输入信息可以为“十点、女生、红衣服和路口A”。在本公开实施例中,对该输入信息不作具体限定。
步骤402:服务器根据该输入信息,对该输入信息进行意图识别,得到该输入信息对应的图像搜索意图,根据图像搜索意图,确定该图像搜索意图的意图类别。
服务器可以对该输入信息进行解析,得到该输入信息中的关键词,根据该关键词对该输入信息进行意图识别,得到该输入信息对应的意图类别;另外,当该输入信息为问题时,服务器也可以根据该输入信息确定该输入信息对应的答案信息,根据该答案信息对该输入信息进行意图识别。
其中,该意图类别为该输入信息对应的图像搜索意图的类别。该意图类别可以为服务器中事先设置的意图类别。例如,当该图像搜索意图可以为搜索人、搜索车、搜索路况、搜索厨房或搜索动物等,相应的,参见图5,该图像搜索意图的意图类别可以为:人、车、路况、厨房或动物等。
例如,继续参考上述实施例,当输入信息为“十点左右有哪些穿红衣服的女生通过路口A”时,服务器根据该输入信息,确定该输入信息的图像搜素意图为搜索十点左右通过路口A的穿红衣服的女生,根据该图像搜索意图,确定该图像搜索意图对应的意图类别为“人”。
步骤403:服务器根据该意图类别,确定该意图类别对应的多个目标属性。
服务器中可以存储意图类别和目标属性的对应关系,相应的,在本步骤中,服务器根据该意图类别,从意图类别和目标属性的对应关系中,确定该意图类别对应的多个目标属性。
其中,该意图类别对应的目标属性可以为根据该意图类别的特征设置的目标属性。例如,该意图类别为人,则该意图类别对应的多个目标属性可以为“着装”、“性别”和“年纪”等;该意图类别为车,则该意图类别对应的多个目标属性可以为“类型”、“颜色”或“车牌”等;该意图类别为动物,则该意图类别对应的多个目标属性可以为“种类”或“大小”等。
其中,不同的意图类别对应的多个目标属性的数量可以相同也可以不同;并且,每个意图类别对应的目标属性的数量可以根据需要进行设置,在本公开实施例中,对此均不作具体限定。例如,意图类别对应的目标属性的数量可以为3、5或8等。
步骤404:服务器根据该多个目标属性,从该输入信息中获取该多个目标属性对应的多个属性信息。
其中,该属性信息可以为根据不同属性对应的特征设置的属性信息,例如,该属性为性别时,该属性信息可以为男或女;当该属性为颜色时,该属性信息可以为红色、蓝色或紫色等,并且,属性对应的不同的属性信息的表现形式可以为根据需要进行设置,例如,男性对应的属性信息可以为1,女性对应的属性信息可以为0;红色对应的属性信息可以为1、蓝色对应的属性信息可以为2、紫色对应的属性信息可以为3等。在本公开实施例中,对属性信息的表现形式不作具体限定。
本步骤可以通过以下步骤(1)-(2)实现,包括:
(1)服务器对该输入信息进行语义解析,得到该输入信息的语义解析结果,该语义解析结果包括多个属性和每个属性对应的属性信息。
服务器中包括语义解析树模型;在本步骤中,服务器可以将该输入信息输入至语义解析树模型,输出该输入信息的语义解析结果。
例如,该输入信息为“十点左右有哪些穿红衣服的女生通过路口A”,则对该输入信息进行语义解析,则该输入信息中的属性包括“时间”、“着装”、“性别”和“地点”,这些属性对应的属性信息分别为“十点左右”、“红衣服”、“女生”和“路口A”。
(2)服务器从该语义解析结果中,确定该多个目标属性对应的多个属性信息。
在本步骤中,服务器通过马尔科夫链(Markov chain),根据目标属性,从该语义解析结果中确定该多个目标属性对应的多个属性信息。
继续根据上述举例说明,则该输入信息的意图类别为“人”,则可以确定该意图类别对应的目标属性可以包括“着装”、“性别”和“年纪”。而该输入信息中的属性包括:“时间”、“着装”、“性别”和“地点”,这些属性对应的属性信息分别为“十点左右”、“红衣服”、“女生”和“路口A”。则服务器可以确定该输入信息中的目标属性中“着装”和“性别”对应的属性信息分别为“红衣服”和“女生”。
需要说明的一点是,服务器还可以通过意图识别模型直接获取该输入信息对应的多个属性信息。相应的上述步骤402-404可以替换为:服务器将该输入信息输入至意图识别模型中,输出该输入信息对应的意图类别的多个属性信息。
其中,该意图识别模型可以为基于卷积和循环神经网络的意图识别模型。在本步骤之前,服务器需要对一般神经网络进行网络训练,并且,可以利用卷积和循环网络对输入信息的上下文语义进行神经网络训练,得到意图识别模型。
步骤405:服务器根据该意图类别对应的多个属性信息,生成标准查询式。
其中,该标准查询式可以为任一查询语言的查询式,在本公开实施例中,对该标准查询式的类型不作具体限定。例如,该标准查询式可以为SQL(Structured QueryLanguage,结构化查询语句)编程语言的查询式。
该标准查询语句可以通过标准查询式生成模型生成,该标准查询式生成模型可以为自注意机制和语言模型联合网络模型。该通过标准查询式生成模型生成标准查询式的过程可以通过可以为:服务器将该意图类别对应的多个属性信息输入标准查询式生成模型中,输出该标准查询式。
例如,继续根据上述举例说明,当该标准查询式为SQL编程语言的查询式时,当多个属性信息分别为“红衣服”和“女生”,“红衣服”和“女生”在标准查询式中对应的值分别为5和0时,该标准查询式可以为select*from table1 where field1 like’%value0%’&’%value5%’,其中,table1表示第一图像库,该语句表达的含义为在第一图像库中查找“红衣服”的“女生”的图像。
在本实现方式中,结合语义解析生成标准查询式,让查询系统更加轻便,减轻算法引擎压力,将端处理与云处理相结合,充分发挥线下算法的能力。
步骤406:服务器确定该标准查询式对应的搜索字段。
服务器进行搜索时,主要根据搜索字段进行搜索,该搜索字段为与该标准查询式对应的搜索字段,该标准查询式中根据各属性的属性信息确定该标准查询式对应的搜索字段,例如,该标准查询式为SQL变成语句select*from table1 where field1 like’%value0%’&’%value5%’时,可以确定该搜索字段为属性信息为0和5的的字段,当该属性信息为0的字段为“女生”,该属性信息为5的字段为红衣服时,服务器确定该搜索字段为“穿红衣服的女生”。
步骤407:服务器根据该搜索字段,从该第一图像库中确定与该搜索字段匹配的至少一个目标描述文本。
其中,该第一图像库中存储多个图像和每个图像对应的描述文本。该图像的描述文本可以包括根据图像中的内容对应的意图类别和属性信息,例如,当图像中的内容为人时,该描述文本可以为图像中的人的着装或外貌等。该图像的描述文本还可以包括图像的生成时间、生成地点等相关信息,在本公开实施例中,对该图像对应的描述文本不作具体限定。
第一图像库中包括多个图像和每个图像对应的描述文本。服务器根据该搜索字段与每个图像对应的描述文本之间的相似度,从第一图像库中确定至少一个目标描述文本。相应的,该过程可以通过以下过程(A1)-(A2)实现,包括:
(A1)服务器确定该搜索字段与该第一图像库中的每个描述文本之间的相似度。
(A2)服务器根据该搜索字段与该每个描述文本之间的相似度,从该每个描述文本中确定该至少一个目标描述文本。
服务器可以从该多个描述文本中选择相似度在第一指定相似度以上的目标描述文本,该第一指定相似度可以根据需要进行设置,在本公开实施例中,对该第一指定相似度不作具体限定。
需要说明的一点是,当相似度在第一指定相似度以上的目标描述文本有多个时,服务器还可以结合图像的时间信息或浏览量等其他维度的信息,从多个目标描述文本中选择至少一个目标描述文本。例如,服务器可以从该多个目标描述文本中,选择时间信息在指定时间段的至少一个目标描述文本;或者,服务器还可以从该多个目标描述文本中,选择浏览量在指定数量以上的图像对应的至少一个目标描述文本。在本公开实施例中,对此也不作具体限定。
在本公开实施例中,通过不同维度的标签对图像进行搜索,克服了信息来源的单一性,从整体设计思路上向真正的跨媒体技术发展。
在本步骤之前,服务器需要生成第一图像库,该过程可以通过以下步骤(1)-(4)实现,包括:
(1)服务器获取多个图像,对于每个图像,对该图像进行目标检测,得到该图像对应的意图类别。
对该图像进行目标检测,检测该图像中存在的目标对象,根据该图像中存在的目标对象,确定该图像对应的意图类别。其中,该目标对象可以为人、动物或车辆等。相应的,该图像对应的意图类别为人、动物或车辆等。
其中,该服务器可以根据已知的目标对象检测图像中是否包含该已知的目标对象。该目标对象可以为已知的意图类别对应的目标对象。例如,服务器检测的意图类别可以包括人、车、路况、厨房或动物等,相应的,服务器检测图像中的目标对象时,可以将人、车、路况、厨房或动物等作为检测的目标对象,在图像中检测是否存在这些目标对象。
需要说明的一点是,一个图像中可能包括多个目标对象,因此,图像对应的意图类别可以为一个也可以为多个,在本公开实施例中,对此不作具体限定。例如,服务器检测到图像中的目标对象可以包括人和车,则该图像对应的意图类别可以为人和/或车。当该图像对应的意图类别只能为一个意图类别时,服务器可以从图像的多个目标对象中随机选择一个目标对象,将选择的目标对象对应的意图类别作为该图像的意图类别;服务器还可以从该多个目标对象中,选择主要目标对象,将该主要目标对象对应的意图类别作为该图像的意图类别。
(2)服务器对该图像进行图像识别,得到该图像对应的属性信息。
在本步骤中,服务器对该图像进行图像识别,根据识别到的图像中的目标对象的特征,确定该图像对应的属性信息。例如,服务器可以对该图像进行图像识别确定该图像中有穿红衣服的女生,则可以得到该图像对应的属性信息有“女”、“红衣服”。
另外,服务器还可以对该目标对象以外的其他对象进行识别,例如,服务器还可以识别图像中目标对象所处的环境,得到环境信息等。
(3)服务器根据该图像对应的意图类别和属性信息,生成该图像对应的描述文本,该图像对应的描述文本中包括该意图类别和该属性信息,将该图像和该图像的描述文本存储至该第一图像库中。
服务器可以将该图像对应的意图类别和属性信息组成该图像对应的描述文本。例如,服务器获取到该图像对应的意图类别为“人”,属性信息包括:男生、跑步等,则该图像的描述文本可以为“一个男生正在跑步”。
当服务器还从图像中识别出环境信息时,本步骤可以为:服务器根据图像对应的意图类别、属性信息和该环境信息,生成该图像的描述文本。例如,该环境信息可以为“操场”。则该图像的描述文本可以为“一个男孩正在操场跑步”等。
服务器生成该图像对应的描述文本后,将该图像与该图像的描述文本进行关联,生成该图像与该描述文本的对应关系,将该图像和该描述文本的对应关系存储在该第一图像库中。
在本实现方式中,服务器根据图像对应的意图类别和图像对应的属性信息,确定该图像对应的描述文本,将该图像与该图像对应的描述文本进行关联,存储在第一图像库中,以便服务器后续可以直接根据图像的描述文本从第一图像库中获取图像,提高了搜索效率。
需要说明的一点是,服务器根据该图像进行了目标检测后,还可以将该目标检测结果对应的意图类别作为该图像的图像标签,对该图像进行标注。相应的,服务器执行完步骤(1)后,可以直接执行以下步骤(4),对图像进行标注。
(4)服务器根据该图像对应的意图类别,确定该图像对应的图像标签;标注该图像对应的图像标签。
该意图类别可以包括人、车、路况、厨房或动物等,相应的,该图像标签也可以为人、车、路况、厨房或动物等。
另外,该图像标签还可以根据不同的时间生成,例如,该图像标签可以为第一时间段、第二时间段等,其中,该第一时间段和第二时间段可以根据需要进行设置,例如,该第一时间段可以为十点到十一点、第二时间段可以为十四点到十五点等。在本公开实施例中,对该图像标签不作具体限定。
在本公开实施例中,通过对图像进行目标检测和图像识别,对不同的图像进行标注,利用多领域标注数据扩充图片查询数据来源,克服了信息来源的单一性,从整体设计思路上向真正的跨媒体技术发展。并且,通过对图像进行目标检测确定图像对应的意图类别,根据该意图类别对图像进行图像标签标注,提高了图像标注的准确性,提高搜索效率。
步骤408:服务器根据该至少一个目标描述文本,从该第一图像库中确定该至少一个目标描述文本对应的至少一个目标图像。
在一种可能的实现方式中,第一图像库中存储了多个图像和每个图像对应的描述文本。在本步骤中,对于每个目标描述文本,服务器根据该目标描述文本,从第一图像库中的描述文本与图像的对应关系中,确定该目标描述文本对应的图像,从而确定该至少一个目标描述文本对应的至少一个目标图像。
例如,继续根据上述举例说明,至少一个目标描述文本为“穿红衣服的女生”,则从第一图像库中确定至少一个目标图像,目标图像中的内容包括穿红衣服的女生。
在另一种可能的实现方式中,第一图像库中的每个图像上标注了图像标签;在本步骤中,服务器还可以结合图像标签,进行目标图像的选择。相应的,本步骤可以通过以下过程(B1)-(B3)实现,包括:
(B1)服务器根据该搜索字段,确定与该搜索字段匹配的目标图像标签。
该目标图像标签可以为人物、车辆或动物等。例如,该搜索字段用于搜索女生,服务器可以确定该搜索字段匹配的目标图像标签为人。
(B2)服务器根据该目标图像标签,从该第一图像库中确定该图像标签对应的至少一个图像。
该第一图像库中的每个图像上标注了该图像对应的图像标签。在本步骤中,服务器根据目标图像标签,从第一图像库中,确定标注为该目标图像标签的至少一个图像。
(B3)服务器根据该至少一个目标描述文本,从该目标图像标签对应的至少一个图像中确定该至少一个目标描述文本对应的至少一个目标图像。
在本步骤中,服务器根据该目标图像标签对应的至少一个图像,确定至少一个图像中的每个图像的描述文本,确定该至少一个目标描述文本与每个图像的描述文本之间的相似度,根据该至少一个目标描述文本与每个图像的描述文本之间的相似度,从该每个图像的描述文本中选择相似度在第二指定相似度以上的至少一个描述文本,选择该至少一个描述文本对应的至少一个目标图像。
第二指定相似度和第一指定相似度可以相同,也可以不相同,在本公开实施例中,对此不作具体限定。
在本实现方式中,通过根据图像标签存储该第一图像库中的图像,使得服务器查询时,可以根据该第一图像库中的图像标签筛选出至少一个图像,再从该至少一个图像中确定至少一个目标图像,提高了搜索效率。
其中,该第一图像库可以为该服务器中事先存储的图像库,该第一图像库还可以为服务器从第二图像库中选择多个图像,将该多个图像组成第一图像库。
在一种可能的实现方式中,服务器可以根据业务类型,从第二图像库中选择多个图像;相应的,服务器生成第一图像库的过程可以为:服务器确定当前的图像搜索业务;根据该图像搜索业务,确定该图像搜索业务对应的业务类型,根据该业务类型,从第二图像库中选择与该业务类型匹配的多个第一图像,该第二图像库中存储了多个图像,每个图像上标注业务类型。
该图像搜索业务的业务类型可以根据当前图像搜索业务的采用领域等进行确定,该业务类型可以为公安领域业务类型或交通领域业务类型等。在本公开实施例中,对该业务的业务类型不作具体限定。并且,该第二图像中存储了多个图像,每个图像上可以标注该图像对应的业务类型,服务器可以直接根据该业务类型从该第二图像库中选择与当前图像搜索业务对应的业务类型的图像。
在本实现方式中,服务器通过根据不同的业务类型推荐不同的图像,组成第一图像库,使得第一图像库中存储的图像更具有针对性,方便服务器进行查询,提高了服务器的查询效率。
在另一种可能的实现方式中,服务器还可以根据目标用户的历史搜索记录,确定第一图像库。相应的,服务器生成第一图像库的过程可以为:服务器确定当前登录账户的目标用户的历史搜索图像;根据该历史搜索图像,确定该历史搜索图像对应的意图类别;根据该历史搜索图像对应的意图类别,确定该历史搜索图像对应的图像标签;从第二图像库中选择与该历史搜索图像对应的图像标签匹配的多个图像,该第二图像库中存储了多个图像,每个图像上标注图像标签;将该多个图像组成该第一图像库。
在本实现方式中,服务器根据当前用户的用户特征向用户推荐不同的第一图像库,提高了第一图像库中的图像的针对性,方便服务器进行查询,提高了服务器的查询效率。
步骤409:服务器输出该至少一个目标图像。
在本步骤中,服务器输出该查询到的至少一个目标图像。将该至少一个目标图像输出至终端中,由终端进行显示。
例如,继续根据上述举例说明,服务器输出内容为“穿红衣服的女生”的目标图像。
在本公开实施例中,通过接收图像搜索指令,该图像搜索指令中携带输入信息;根据该输入信息,确定该输入信息对应的意图类别的多个属性信息,该意图类别为该输入信息对应的图像搜索意图的类别;根据该意图类别对应的多个属性信息,生成标准查询式;根据该标准查询式,在第一图像库中进行图像搜索,得到符合该标准查询式的至少一个目标图像,输出该至少一个目标图像,该第一图像库中存储多个图像,使得服务器可以根据输入信息的语义进行图像搜索,可以获取到更抽象、更泛化、更自由的标砖查询式,从而扩大了搜索范围,提高了搜索到的图像信息的数量。
图7是根据一示例性实施例示出的一种图像搜索装置的框图。该装置包括:
接收模块701,用于接收图像搜索指令,该图像搜索指令中携带输入信息;
第一确定模块702,用于根据该输入信息,确定该输入信息对应的意图类别的多个属性信息,该意图类别为该输入信息对应的图像搜索意图的类别;
第一生成模块703,用于根据该意图类别对应的多个属性信息,生成标准查询式;
搜索模块704,用于根据该标准查询式,在第一图像库中进行图像搜索,得到符合该标准查询式的至少一个目标图像,输出该至少一个目标图像,该第一图像库中存储多个图像。
在一种可能的实现方式中,该第一确定模块702还用于根据该输入信息,对该输入信息进行意图识别,得到该输入信息对应的图像搜索意图;根据该图像搜索意图,确定该图像搜索意图的意图类别;根据该意图类别,确定该意图类别对应的多个目标属性;根据该多个目标属性,从该输入信息中获取该多个目标属性对应的多个属性信息;或者,将该输入信息输入至意图识别模型中,输出该输入信息对应的意图类别的多个属性信息。
在另一种可能的实现方式中,该第一确定模块702,还用于对该输入信息进行语义解析,得到该输入信息的语义解析结果,该语义解析结果包括多个属性和每个属性对应的属性信息;从该语义解析结果中,确定该多个目标属性对应的多个属性信息。
在另一种可能的实现方式中,该搜索模块704,还用于确定该标准查询式对应的搜索字段;根据该搜索字段,从该第一图像库中确定与该搜索字段匹配的至少一个目标描述文本,该第一图像库中存储多个图像和每个图像对应的描述文本;根据该至少一个目标描述文本,从该第一图像库中确定该至少一个目标描述文本对应的至少一个目标图像。
在另一种可能的实现方式中,该搜索模块704,还用于根据该搜索字段,确定与该搜索字段匹配的目标图像标签;根据该目标图像标签,从该第一图像库中确定该目标图像标签对应的至少一个图像,该第一图像库中的每个图像上标注了该图像对应的图像标签;根据该至少一个目标描述文本,从该目标图像标签对应的至少一个图像中确定该至少一个目标描述文本对应的至少一个目标图像。
在另一种可能的实现方式中,该装置还包括:
湖区模块,还用于获取多个图像,对于每个图像,对该图像进行目标检测,得到该图像对应的意图类别;
识别模块,用于对该图像进行图像识别,得到该图像对应的属性信息;根据该图像对应的意图类别和属性信息,生成该图像对应的描述文本,该图像对应的描述文本中包括该意图类别和该属性信息,将该图像和该图像的描述文本存储至该第一图像库中;和/或,根据该图像对应的意图类别,确定该图像对应的图像标签;标注该图像对应的图像标签。
在另一种可能的实现方式中,该装置还包括:
第二确定模块,用于确定当前登录账户的目标用户的历史搜索图像;
第三确定模块,用于根据该历史搜索图像,确定该历史搜索图像对应的意图类别;
第四确定模块,用于根据该历史搜索图像对应的意图类别,确定该历史搜索图像对应的图像标签;
第一选择模块,用于从第二图像库中选择与该历史搜索图像对应的图像标签匹配的多个图像,该第二图像库中存储了多个图像,每个图像上标注图像标签;
组成模块,用于将该多个图像组成该第一图像库。
在另一种可能的实现方式中,该装置还包括:
第二生成模块,用于当该多个目标属性中的关键属性的属性信息未被填写时,生成反馈信息,该反馈信息用于提示用户该输入信息不完整;输出该反馈信息;
该第一生成模块703,还用于当该多个目标属性中的关键属性的属性信息均被填写时,根据该意图类别对应的多个属性信息,生成标准查询式。
在本公开实施例中,通过接收图像搜索指令,该图像搜索指令中携带输入信息;根据该输入信息,确定该输入信息对应的意图类别的多个属性信息,该意图类别为该输入信息对应的图像搜索意图的类别;根据该意图类别对应的多个属性信息,生成标准查询式;根据该标准查询式,在第一图像库中进行图像搜索,得到符合该标准查询式的至少一个目标图像,输出该至少一个目标图像,该第一图像库中存储多个图像,使得服务器可以根据输入信息的语义进行图像搜索,可以获取到更抽象、更泛化、更自由的标砖查询式,从而扩大了搜索范围,提高了搜索到的图像信息的数量。
需要说明的是:上述实施例提供的图像搜索装置在图像搜索时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像搜索装置与图像搜索方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图8是本公开实施例提供的一种服务器的结构示意图,该服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)801和一个或一个以上的存储器802,其中,该存储器802中存储有至少一条指令,该至少一条指令由该处理器801加载并执行以实现上述各个方法实施例提供的资源转移方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质应用于终端,该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该指令、该程序、该代码集或该指令集由处理器加载并执行以实现上述实施例图像搜索方法中服务器所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中执行了详细描述,此处将不做详细阐述说明。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (18)

1.一种图像搜索方法,其特征在于,所述方法包括:
接收图像搜索指令,所述图像搜索指令中携带输入信息;
根据所述输入信息,确定所述输入信息对应的意图类别的多个属性信息,所述意图类别为所述输入信息对应的图像搜索意图的类别;
根据所述意图类别对应的多个属性信息,生成标准查询式;
根据所述标准查询式,在第一图像库中进行图像搜索,得到符合所述标准查询式的至少一个目标图像,输出所述至少一个目标图像,所述第一图像库中存储多个图像。
2.根据权利要求1所述的方法,其特征在于,所述根据所述输入信息,确定所述输入信息对应的意图类别的多个属性信息,包括:
根据所述输入信息,对所述输入信息进行意图识别,得到所述输入信息对应的图像搜索意图;根据所述图像搜索意图,确定所述图像搜索意图的意图类别;根据所述意图类别,确定所述意图类别对应的多个目标属性;根据所述多个目标属性,从所述输入信息中获取所述多个目标属性对应的多个属性信息;或者,
将所述输入信息输入至意图识别模型中,输出所述输入信息对应的意图类别的多个属性信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个目标属性,从所述输入信息中获取所述多个目标属性对应的多个属性信息,包括:
对所述输入信息进行语义解析,得到所述输入信息的语义解析结果,所述语义解析结果包括多个属性和每个属性对应的属性信息;
从所述语义解析结果中,确定所述多个目标属性对应的多个属性信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述标准查询式,在第一图像库中进行图像搜索,得到符合所述标准查询式的至少一个目标图像,包括:
确定所述标准查询式对应的搜索字段;
根据所述搜索字段,从所述第一图像库中确定与所述搜索字段匹配的至少一个目标描述文本,所述第一图像库中存储多个图像和每个图像对应的描述文本;
根据所述至少一个目标描述文本,从所述第一图像库中确定所述至少一个目标描述文本对应的至少一个目标图像。
5.根据权利要求4所述的方法,其特征在于,所述根据所述至少一个目标描述文本,从所述第一图像库中确定所述至少一个目标描述文本对应的至少一个目标图像,包括:
根据所述搜索字段,确定与所述搜索字段匹配的目标图像标签;
根据所述目标图像标签,从所述第一图像库中确定所述目标图像标签对应的至少一个图像,所述第一图像库中的每个图像上标注了所述图像对应的图像标签;
根据所述至少一个目标描述文本,从所述目标图像标签对应的至少一个图像中确定所述至少一个目标描述文本对应的至少一个目标图像。
6.根据权利要求5所述的方法,其特征在于,所述根据所述搜索字段,确定与所述搜索字段匹配的目标图像标签之前,所述方法还包括:
获取多个图像,对于每个图像,对所述图像进行目标检测,得到所述图像对应的意图类别;
对所述图像进行图像识别,得到所述图像对应的属性信息;根据所述图像对应的意图类别和属性信息,生成所述图像对应的描述文本,所述图像对应的描述文本中包括所述意图类别和所述属性信息,将所述图像和所述图像的描述文本存储至所述第一图像库中;和/或,
根据所述图像对应的意图类别,确定所述图像对应的图像标签;标注所述图像对应的图像标签。
7.根据权利要求1所述的方法,其特征在于,所述根据所述标准查询式,在第一图像库中进行图像搜索之前,所述方法还包括:
确定当前登录账户的目标用户的历史搜索图像;
根据所述历史搜索图像,确定所述历史搜索图像对应的意图类别;
根据所述历史搜索图像对应的意图类别,确定所述历史搜索图像对应的图像标签;
从第二图像库中选择与所述历史搜索图像对应的图像标签匹配的多个图像,所述第二图像库中存储了多个图像,每个图像上标注图像标签;
将所述多个图像组成所述第一图像库。
8.根据权利要求2所述的方法,其特征在于,所述根据所述多个目标属性,从所述输入信息中获取所述多个目标属性对应的多个属性信息之后,所述方法还包括:
当所述多个目标属性中的关键属性的属性信息未被填写时,生成反馈信息,所述反馈信息用于提示用户所述输入信息不完整;输出所述反馈信息;
当所述多个目标属性中的关键属性的属性信息均被填写时,执行根据所述意图类别对应的多个属性信息,生成标准查询式的步骤。
9.一种图像搜索装置,其特征在于,所述装置包括:
接收模块,用于接收图像搜索指令,所述图像搜索指令中携带输入信息;
第一确定模块,用于根据所述输入信息,确定所述输入信息对应的意图类别的多个属性信息,所述意图类别为所述输入信息对应的图像搜索意图的类别;
第一生成模块,用于根据所述意图类别对应的多个属性信息,生成标准查询式;
搜索模块,用于根据所述标准查询式,在第一图像库中进行图像搜索,得到符合所述标准查询式的至少一个目标图像,输出所述至少一个目标图像,所述第一图像库中存储多个图像。
10.根据权利要求9所述的装置,其特征在于,所述第一确定模块,还用于根据所述输入信息,对所述输入信息进行意图识别,得到所述输入信息对应的图像搜索意图;根据所述图像搜索意图,确定所述图像搜索意图的意图类别;根据所述意图类别,确定所述意图类别对应的多个目标属性;根据所述多个目标属性,从所述输入信息中获取所述多个目标属性对应的多个属性信息;或者,将所述输入信息输入至意图识别模型中,输出所述输入信息对应的意图类别的多个属性信息。
11.根据权利要求10所述的装置,其特征在于,所述第一确定模块,还用于对所述输入信息进行语义解析,得到所述输入信息的语义解析结果,所述语义解析结果包括多个属性和每个属性对应的属性信息;从所述语义解析结果中,确定所述多个目标属性对应的多个属性信息。
12.根据权利要求9所述的装置,其特征在于,所述搜索模块,还用于确定所述标准查询式对应的搜索字段;根据所述搜索字段,从所述第一图像库中确定与所述搜索字段匹配的至少一个目标描述文本,所述第一图像库中存储多个图像和每个图像对应的描述文本;根据所述至少一个目标描述文本,从所述第一图像库中确定所述至少一个目标描述文本对应的至少一个目标图像。
13.根据权利要求12所述的装置,其特征在于,所述搜索模块,还用于根据所述搜索字段,确定与所述搜索字段匹配的目标图像标签;根据所述目标图像标签,从所述第一图像库中确定所述目标图像标签对应的至少一个图像,所述第一图像库中的每个图像上标注了所述图像对应的图像标签;根据所述至少一个目标描述文本,从所述目标图像标签对应的至少一个图像中确定所述至少一个目标描述文本对应的至少一个目标图像。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取多个图像,对于每个图像,对所述图像进行目标检测,得到所述图像对应的意图类别;
识别模块,用于对所述图像进行图像识别,得到所述图像对应的属性信息;根据所述图像对应的意图类别和属性信息,生成所述图像对应的描述文本,所述图像对应的描述文本中包括所述意图类别和所述属性信息,将所述图像和所述图像的描述文本存储至所述第一图像库中;和/或,根据所述图像对应的意图类别,确定所述图像对应的图像标签;标注所述图像对应的图像标签。
15.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二确定模块,用于确定当前登录账户的目标用户的历史搜索图像;
第三确定模块,用于根据所述历史搜索图像,确定所述历史搜索图像对应的意图类别;
第四确定模块,用于根据所述历史搜索图像对应的意图类别,确定所述历史搜索图像对应的图像标签;
第一选择模块,用于从第二图像库中选择与所述历史搜索图像对应的图像标签匹配的多个图像,所述第二图像库中存储了多个图像,每个图像上标注图像标签;
组成模块,用于将所述多个图像组成所述第一图像库。
16.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第二生成模块,用于当所述多个目标属性中的关键属性的属性信息未被填写时,生成反馈信息,所述反馈信息用于提示用户所述输入信息不完整;输出所述反馈信息;
所述第一生成模块,还用于当所述多个目标属性中的关键属性的属性信息均被填写时,根据所述意图类别对应的多个属性信息,生成标准查询式。
17.一种服务器,其特征在于,所述服务器包括:
至少一个处理器;和
至少一个存储器;
所述至少一个存储器存储有一个或多个程序,所述一个或多个程序被配置成由所述至少一个处理器执行,所述一个或多个程序包含用于进行如权利要求1至8任一项权利要求所述图像搜索方法的指令。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质应用于终端,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现1至8任一项权利要求所述图像搜索方法中的步骤。
CN201910898814.4A 2019-09-23 2019-09-23 图像搜索方法、装置、服务器和存储介质 Pending CN112541091A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910898814.4A CN112541091A (zh) 2019-09-23 2019-09-23 图像搜索方法、装置、服务器和存储介质
PCT/CN2020/116923 WO2021057741A1 (zh) 2019-09-23 2020-09-22 图像搜索方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910898814.4A CN112541091A (zh) 2019-09-23 2019-09-23 图像搜索方法、装置、服务器和存储介质

Publications (1)

Publication Number Publication Date
CN112541091A true CN112541091A (zh) 2021-03-23

Family

ID=75013082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910898814.4A Pending CN112541091A (zh) 2019-09-23 2019-09-23 图像搜索方法、装置、服务器和存储介质

Country Status (2)

Country Link
CN (1) CN112541091A (zh)
WO (1) WO2021057741A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127663A (zh) * 2021-04-01 2021-07-16 深圳力维智联技术有限公司 目标图像搜索方法、装置、设备及计算机可读存储介质
CN117216308A (zh) * 2023-11-09 2023-12-12 天津华来科技股份有限公司 基于大模型的搜索方法、系统、设备及介质
US12038968B2 (en) 2021-08-13 2024-07-16 Samsung Electronics Co., Ltd. Method and device for personalized search of visual media

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488111A (zh) * 2015-11-20 2016-04-13 小米科技有限责任公司 图像搜索方法及装置
CN108681541A (zh) * 2018-01-17 2018-10-19 百度在线网络技术(北京)有限公司 图片搜索方法、装置及计算机设备
CN108733779A (zh) * 2018-05-04 2018-11-02 百度在线网络技术(北京)有限公司 文本配图的方法和装置
CN109635135A (zh) * 2018-11-30 2019-04-16 Oppo广东移动通信有限公司 图像索引生成方法、装置、终端及存储介质
CN109684540A (zh) * 2018-12-11 2019-04-26 北京奇点机智科技有限公司 服务信息交互的方法和装置
CN109710789A (zh) * 2018-12-28 2019-05-03 北京旷视科技有限公司 图像数据的检索方法、装置、电子设备及计算机存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8392430B2 (en) * 2009-09-23 2013-03-05 Microsoft Corp. Concept-structured image search
CN103064936B (zh) * 2012-12-24 2018-03-30 北京百度网讯科技有限公司 一种基于语音输入的图像信息提取分析方法及装置
CN104881451A (zh) * 2015-05-18 2015-09-02 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN105069077A (zh) * 2015-07-31 2015-11-18 百度在线网络技术(北京)有限公司 搜索方法及装置
CN109299287A (zh) * 2018-10-24 2019-02-01 深圳素问智能信息技术有限公司 一种酒类信息的查询方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488111A (zh) * 2015-11-20 2016-04-13 小米科技有限责任公司 图像搜索方法及装置
CN108681541A (zh) * 2018-01-17 2018-10-19 百度在线网络技术(北京)有限公司 图片搜索方法、装置及计算机设备
CN108733779A (zh) * 2018-05-04 2018-11-02 百度在线网络技术(北京)有限公司 文本配图的方法和装置
CN109635135A (zh) * 2018-11-30 2019-04-16 Oppo广东移动通信有限公司 图像索引生成方法、装置、终端及存储介质
CN109684540A (zh) * 2018-12-11 2019-04-26 北京奇点机智科技有限公司 服务信息交互的方法和装置
CN109710789A (zh) * 2018-12-28 2019-05-03 北京旷视科技有限公司 图像数据的检索方法、装置、电子设备及计算机存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127663A (zh) * 2021-04-01 2021-07-16 深圳力维智联技术有限公司 目标图像搜索方法、装置、设备及计算机可读存储介质
CN113127663B (zh) * 2021-04-01 2024-02-27 深圳力维智联技术有限公司 目标图像搜索方法、装置、设备及计算机可读存储介质
US12038968B2 (en) 2021-08-13 2024-07-16 Samsung Electronics Co., Ltd. Method and device for personalized search of visual media
CN117216308A (zh) * 2023-11-09 2023-12-12 天津华来科技股份有限公司 基于大模型的搜索方法、系统、设备及介质
CN117216308B (zh) * 2023-11-09 2024-04-26 天津华来科技股份有限公司 基于大模型的搜索方法、系统、设备及介质

Also Published As

Publication number Publication date
WO2021057741A1 (zh) 2021-04-01

Similar Documents

Publication Publication Date Title
CN111680173B (zh) 统一检索跨媒体信息的cmr模型
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
WO2021253904A1 (zh) 测试案例集生成方法、装置、设备及计算机可读存储介质
CN111368049B (zh) 信息获取方法、装置、电子设备及计算机可读存储介质
US9519686B2 (en) Confidence ranking of answers based on temporal semantics
KR102288249B1 (ko) 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체
CN109726274B (zh) 问题生成方法、装置及存储介质
CN111353310A (zh) 基于人工智能的命名实体识别方法、装置及电子设备
US9760828B2 (en) Utilizing temporal indicators to weight semantic values
WO2021057741A1 (zh) 图像搜索方法、装置、服务器和存储介质
US20220083879A1 (en) Inferring a comparative advantage of multi-knowledge representations
CN111353026A (zh) 一种智能法务律师助手客服系统
CN112632258A (zh) 文本数据处理方法、装置、计算机设备和存储介质
CN113343108A (zh) 推荐信息处理方法、装置、设备及存储介质
CN117010907A (zh) 一种基于语音和图像识别的多模态客户服务方法及系统
CN115438142B (zh) 一种对话式交互数据分析报告系统
Arbaaeen et al. Natural language processing based question answering techniques: A survey
CN114253990A (zh) 数据库查询方法、装置、计算机设备和存储介质
CN117349515A (zh) 搜索处理方法、电子设备和存储介质
CN116361428A (zh) 一种问答召回方法、装置和存储介质
US11314811B1 (en) Systems and methods for semantic search engine analysis
TWI693524B (zh) 專屬個性化圖片搜尋優化方法
JP2021039627A (ja) 発想提案支援システム、発想提案支援装置、発想提案支援方法及びプログラム
CN111026856A (zh) 一种智能交互方法、装置以及计算机可读储存介质
CN113792129B (zh) 一种智能会话方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination