CN112052332A - 检索方法、装置、电子设备及可读存储介质 - Google Patents

检索方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN112052332A
CN112052332A CN202010753083.7A CN202010753083A CN112052332A CN 112052332 A CN112052332 A CN 112052332A CN 202010753083 A CN202010753083 A CN 202010753083A CN 112052332 A CN112052332 A CN 112052332A
Authority
CN
China
Prior art keywords
retrieval
target
resource
determining
resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010753083.7A
Other languages
English (en)
Inventor
聂砂
郑江
罗奕康
白彧斐
贾国琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202010753083.7A priority Critical patent/CN112052332A/zh
Publication of CN112052332A publication Critical patent/CN112052332A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种检索方法、装置、电子设备及可读存储介质,应用于知识图谱技术领域,其中该方法包括:基于预构建的知识图谱对检索关键词进行扩展,然后基于扩展得到的目标素材标签从资源库中确定出目标检索资源反馈给用户,从而不依赖于检索人员的关键词扩展能力,扩展了检索结果的范围,使得检索用户得到想要的资源,提升了检索效率;此外,对于目标资源来说,只要是通过知识图谱联想能得到目标资源对应标签的检索关键词,都能得到包括目标资源的检索结果,与传统方法只有输入目标资源的标签才能得到目标资源相比,提升了目标资源的复用率。

Description

检索方法、装置、电子设备及可读存储介质
技术领域
本申请涉及知识图谱技术领域,具体而言,本申请涉及一种检索装置、装置及电子设备。
背景技术
图片搜索是通过搜索程序,向用户提供互联网上相关的图片资料的服务。目前,对于需要搜索图像素材的场景而言,需要充分依靠系统使用人员的联想和想象,才能找到合适的图像素材。比如制作跟房地产相关的政策解读图片时,我们可能想要放一个建筑工地、或者是一个卡通的房子,如果基于通用的搜索引擎,按“房地产”搜索图片素材,得到的可能是房地产商的售房广告、宣传海报、招聘启事,得到的搜索结果并不是我们想要的结果;如果要想获取到我们想要的图片素材,一定要搜索“建筑工地”或者“卡通房子”,这样对使用搜索工具的人要求较高,而且经常搜不到满意的结果。
此外,对于“卡通房子”而言,同样的图片素材,可能可以用于房地产的政策解读图片生成,也可以用于小区宣传海报的生成,还可以用于租房广告的生成,对同样素材的复用也形成了一个挑战。
发明内容
本申请提供了一种检索方法、装置、电子设备及可读存储介质,不依赖检索人员的关键词联想能力,利用知识图谱的联想能力,扩展检索结果的范围,覆盖用户想要利用的资源,从而提升检索效率,此外,还能提升资源的复用率。。本申请采用的技术方案如下:
第一方面,提供了一种检索方法,该方法包括:
获取至少一个检索关键词;
基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签;
基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。
可选地,基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签,包括:
如果检索关键词为多个,则分别基于各个检索关键词通过预构建的知识图谱确定与各个检索关键词关联的候选素材标签;
将各个检索关键共有的候选素材标签确定为目标素材标签。
可选地,基于确定的至少一个目标素材标签从资源库中确定出目标检索资源,包括:
分别基于各个目标素材标签从资源库中确定候选检索资源;
针对各个目标素材标签分别选取预定数量的候选检索资源作为目标检索资源。
可选地,该方法还包括:
基于各个目标素材标签与检索关键词的关联度对目标检索资源进行排序;
将排序后的目标检索资源反馈给用户。
可选地,资源库包括以下至少一项:图片资源库、视频资源库、文档资源库。
可选地,图片资源库的构建包括:
获取原始图片;
基于预训练的第一深度学习模型对原始图片进行分割处理得到至少一个单一对象图片;
基于预训练的第二深度学习模型对各个单一对象图片进行识别,确定各个单一对象图片的标签;
将各个单一对象图片及其对应的标签进行存储。
可选地,基于预训练的第一深度学习模型对原始图片进行分割处理得到至少一个单一对象图片,之前包括:
判断原始图片是否包括多个对象;
如果包括多个对象,则基于预训练的第一深度学习模型对原始图片进行分割处理得到至少一个单一对象图片。
可选地,预训练的第一深度学习模型为基于以下任一网络的模型:
RCNN、FAST-RCNN、FASTER-RCNN、YOLO、R-FCN、MASK-RCNN。
第二方面,提供了一种检索装置,该装置包括,
获取模块,用于获取至少一个检索关键词;
第一确定模块,用于基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签;
第二确定模块,用于基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。
可选地,第一确定模块包括:
第一确定单元,用于如果检索关键词为多个,则分别基于各个检索关键词通过预构建的知识图谱确定与各个检索关键词关联的候选素材标签;
第二确定单元,用于将各个检索关键共有的候选素材标签确定为目标素材标签。
可选地,第二确定模块,包括:
第三确定单元,用于分别基于各个目标素材标签从资源库中确定候选检索资源;
作为单元,用于针对各个目标素材标签分别选取预定数量的候选检索资源作为目标检索资源。
可选地,该装置还包括:
排序模块,用于基于各个目标素材标签与检索关键词的关联度对目标检索资源进行排序;
反馈模块,用于将排序后的目标检索资源反馈给用户。
可选地,资源库包括以下至少一项:图片资源库、视频资源库、文档资源库。
可选地,该装置还包括:
图片资源库构建模块;
图片资源库构建模块包括:
获取单元,用于获取原始图片;
分割单元,用于基于预训练的第一深度学习模型对原始图片进行分割处理得到至少一个单一对象图片;
识别单元,用于基于预训练的第二深度学习模型对各个单一对象图片进行识别,确定各个单一对象图片的标签;
存储单元,用于将各个单一对象图片及其对应的标签进行存储。
可选地,该装置包括:
判断单元,用于判断原始图片是否包括多个对象;
分割单元,用于如果包括多个对象,则基于预训练的第一深度学习模型对原始图片进行分割处理得到至少一个单一对象图片。
可选地,预训练的第一深度学习模型为基于以下任一网络的模型:
RCNN、FAST-RCNN、FASTER-RCNN、YOLO、R-FCN、MASK-RCNN。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行第一方面所示的检索方法。
第四方面,提供了一种计算机可读存储介质,计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行第一方面所示的检索方法。
本申请提供了一种检索方法、装置、电子设备及可读存储介质,与现有技术需人工联想扩展检索关键词相比,本申请通过获取至少一个检索关键词,并基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签,继而基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。即基于预构建的知识图谱对检索关键词进行扩展,然后基于扩展得到的目标素材标签从资源库中确定出目标检索资源反馈给用户,从而不依赖于检索人员的关键词扩展能力,扩展了检索结果的范围,使得检索用户得到想要的资源,提升了检索效率;此外,对于目标资源来说,只要是通过知识图谱联想能得到目标资源对应标签的检索关键词,都能得到包括目标资源的检索结果,与传统方法只有输入目标资源的标签才能得到目标资源相比,提升了目标资源的复用率。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例的一种检索方法的流程示意图;
图2为本申请实施例的另一种检索装置的结构示意图;
图3为本申请实施例构建的知识图谱示意图;
图4为本申请实施例的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,各实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施例一
本申请实施例提供了一种检索方法,如图1所示,该方法可以包括以下步骤:
步骤S101,获取至少一个检索关键词;
具体地,获取用户输入的检索关键词,其中,该检索关键词可以是用户直接输入的文本关键词;也可以是用户通过语音输入的,如果是输入的语音,则可以对该语音进行识别,识别得到检索关键词。其中,如果用户的语音是完整的一句检索指令,如请检索房产相关图片,则可以先对语音进行识别得到“请检索房产相关图片”文本,然后对文本进行识别处理,得到检索关键词“房产”,继而根据“房产”该关键词进行检索。
步骤S102,基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签;
其中,知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。
其中,基于三元组是知识图谱的一种通用表示方式。三元组的基本形式主要包括(实体1-关系-实体2)和(实体-属性-属性值)等。
具体地,基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签。
即根据检索关键字,通过预构建的知识图谱进行联想,得到了目标素材标签,实现了关键词的扩展,继而能够扩展检索结果的范围。
其中,知识图谱的构建可以是通过多种方式实现的,如自顶向下的构建方式,自顶向下的构建方式,是指先确定知识图谱的数据模型,再根据模型去填充具体数据,最终形成知识图谱。如自下向上的构建方式,是指先按照三元组的方式收集具体数据,然后根据数据内容来提炼数据模型。基于具体应用场景的不同,知识图谱的构建方式的方式可以做出相应调整。
步骤S103,基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。
具体地,根据目标素材标签与资源库中资源的映射关系,可以确定目标检索资源。待确定目标检索资源后,可以将该目标检索资源作为检索结果反馈至用户,也可以对目标检索资源进行相应的处理,在反馈至用户。
示例性地,某一目标资源的标签为A,根据本申请的方法,基于知识图谱的联想能力,基于检索关键词可以扩展得到标签A,从而得到包括目标资源A的检索结果;再者,对于输入其他检索关键词C,如果能够通过知识图谱扩展得到标签A的情形,检索结果也是包括目标资源A的。与传统的方法,只有输入的关键词为标签A才能得到目标资源相比,提升了目标资源的复用率。
本申请实施例提供了一种检索方法,与现有技术需人工联想扩展检索关键词相比,本申请通过获取至少一个检索关键词,并基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签,继而基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。即基于预构建的知识图谱对检索关键词进行扩展,然后基于扩展得到的目标素材标签从资源库中确定出目标检索资源反馈给用户,从而不依赖于检索人员的关键词扩展能力,扩展了检索结果的范围,使得检索用户得到想要的资源,提升了检索效率;此外,对于目标资源来说,只要是通过知识图谱联想能得到目标资源对应标签的检索关键词,都能得到包括目标资源的检索结果,与传统方法只有输入目标资源的标签才能得到目标资源相比,提升了目标资源的复用率。
本申请实施例提供了一种可能的实现方式,具体地,基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签,包括:
如果检索关键词为多个,则分别基于各个检索关键词通过预构建的知识图谱确定与各个检索关键词关联的候选素材标签;
将各个检索关键共有的候选素材标签确定为目标素材标签。
示例性地,如果输入的关键词为两个“美好生活”、“大额消费”,美好生活对应的候选素材标签包括房子、汽车;大额消费对应的候选素材标签包括房子、汽车;则将“美好生活”、“大额消费”两个检索关键词共有的候选素材标房子、汽车作为目标素材标签。
对于本申请实施例,解决了如何根据多个检索关键词确定目标素材标签的问题。
本申请实施例提供了一种可能的实现方式,具体地,基于确定的至少一个目标素材标签从资源库中确定出目标检索资源,包括:
分别基于各个目标素材标签从资源库中确定候选检索资源;
针对各个目标素材标签分别选取预定数量的候选检索资源作为目标检索资源。
示例性地,目标素材标签A对应有x个候选检索资源,目标素材标签B对应用y个候选检索资源,从目标素材标签A对应的x个候选检索资源选取a个作为目标检索资源,从目标素材标签A对应的x个候选检索资源选取b个作为目标检索资源,然后基于该a个作为目标检索资源与b个作为目标检索资源确定最终的目标检索资源。其中,a、b可以相同也可以不同。
本申请实施例提供了一种可能的实现方式,具体地,该方法还包括:
基于各个目标素材标签与检索关键词的关联度对目标检索资源进行排序;
将排序后的目标检索资源反馈给用户。
示例性地,如图3所示,输入检索关键词“房子”,其中,美好生活的关联度为1,汽车的关联度为2,则可以将美好生活对应的检索资源放到汽车对应的检索资源前面。
对于本申请实施例,解决了如何确定目标检索资源的排序问题。
本申请提供了一种可能的实现方式,资源库包括以下至少一项:图片资源库、视频资源库、文档资源库。其中,如果图片资源库的构建包括:
获取原始图片;
基于预训练的第一深度学习模型对原始图片进行分割处理得到至少一个单一对象图片;
基于预训练的第二深度学习模型对各个单一对象图片进行识别,确定各个单一对象图片的标签;
将各个单一对象图片及其对应的标签进行存储。
本申请实施例的一个应用场景,用户可以基于检索的图片资源,直接生成海报,还可以基于检索到图片与输入的文本通过预训练的第三深度学习模型自动生成海报。
其中,第一深度学习模型与第二深度学习模型可以是独立的两个模型,也可以是同一个模型,如果是同同一个模型,则该模型在对对象进行分割的同时实现各个对象的识别,得到各个对象的标签。
其中,还可以对各个对象的图片的背景进行去除,从而不会因为图片背景限制图片的使用场景,也不会由于图片背景与融合的背景不匹配而显得突兀。如制作海报的场景,海报背景为白色的,目标对象的背景为蓝色,则可以将目标对象图片的背景去除,变成透明背景,从而能够扩展目标对象图片的使用场景,也不会由于图片背景与融合的背景不匹配而显得突兀。
其中,深度学习根据百度百科说法,深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,ArtificialIntelligence)。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。
其中,图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程,即把属于同一区域的像素赋予相同的编号。
对于本申请实施例,如果原始图片中包含多个对象,但是可能其中有的对象并不是用户想用的,从而导致该原始图片无法使用,本申请对原始图片进行对象分割识别,得到各个独立的对象的图片,从而用户能对各个独立对象的进行使用,也可以组合使用,从而能够有效提升图片的可使用率。
具体地,基于预训练的第一深度学习模型对原始图片进行分割处理得到至少一个单一对象图片,之前包括:
判断原始图片是否包括多个对象;
如果包括多个对象,则基于预训练的第一深度学习模型对原始图片进行分割处理得到至少一个单一对象图片。
预训练的第一深度学习模型为基于以下任一网络的模型:
RCNN、FAST-RCNN、FASTER-RCNN、YOLO、R-FCN、MASK-RCNN。
目前基于深度学习的目标检测框架主要分为两类,一类是基于two-stage的方法,比如RCNN,Fast RCNN,Faster RCNN,将检测任务分为回归(location)和分类任务。还有基于one-stage的目标检测框架,例如YOLO/YOLOv2,SSD等,同时完成检测和回归任务。
本申请实施例的又一个应用场景,经过了图像素材库的构建后,构建的知识图谱如图3所示,如果搜索中关联上了这些实体,则可以根据这些实体去寻找相应的图像素材。
图像搜索的策略可以较为灵活地定义,一般地,我们定义为输入M关键字,在图谱中检索N度关联关系的实体概念,然后我们根据相应的实体概念去素材库中寻找具备相应标签的素材。
以Cypher语言为例,输入关键字列表为{K},对应的检索为
MATCH(root:PictureTag)-[*1..N]-(n:PictureTag)where root.name in['K1','K2']
with n,COLLECT(DISTINCT(root.name))as set
where size(set)=P
return n.name
比如,输入K=“保险业”(M=1),N=3,则表示“保险业”这个知识概念3度以内的实体概念都可以接受,在上述图中返回的实体概念/标签为“汽车”;输入K=”大额消费美好生活”(M=2),N=2,则表示“大额消费”“美好生活”2度内共同相关的实体概念是可以接受的,基于上图我们返回的应该是“房子”和“汽车”。得到tag列表以后,返回素材库中分别具备这些标签的素材即可,这样可以非常方便地完成图像素材的知识联想搜索。
实施例二
图2为本申请实施例提供的另一种检索装置,包括:
获取模块201,用于获取至少一个检索关键词;
第一确定模块202,用于基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签;
第二确定模块203,用于基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。
具体地,第一确定模块202包括:
第一确定单元,用于如果检索关键词为多个,则分别基于各个检索关键词通过预构建的知识图谱确定与各个检索关键词关联的候选素材标签;
第二确定单元,用于将各个检索关键共有的候选素材标签确定为目标素材标签。
具体地,第二确定模块203,包括:
第三确定单元,用于分别基于各个目标素材标签从资源库中确定候选检索资源;
作为单元,用于针对各个目标素材标签分别选取预定数量的候选检索资源作为目标检索资源。
进一步地,该装置还包括:
排序模块,用于基于各个目标素材标签与检索关键词的关联度对目标检索资源进行排序;
反馈模块,用于将排序后的目标检索资源反馈给用户。
具体地,资源库包括以下至少一项:图片资源库、视频资源库、文档资源库。
进一步地,该装置还包括:
图片资源库构建模块;
图片资源库构建模块包括:
获取单元,用于获取原始图片;
分割单元,用于基于预训练的第一深度学习模型对原始图片进行分割处理得到至少一个单一对象图片;
识别单元,用于基于预训练的第二深度学习模型对各个单一对象图片进行识别,确定各个单一对象图片的标签;
存储单元,用于将各个单一对象图片及其对应的标签进行存储。
进一步地,该装置包括:
判断单元,用于判断原始图片是否包括多个对象;
分割单元,用于如果包括多个对象,则基于预训练的第一深度学习模型对原始图片进行分割处理得到至少一个单一对象图片。
其中,预训练的第一深度学习模型为基于以下任一网络的模型:
RCNN、FAST-RCNN、FASTER-RCNN、YOLO、R-FCN、MASK-RCNN。
本申请实施例,提供了一种检索装置,与现有技术需人工联想扩展检索关键词相比,本申请通过获取至少一个检索关键词,并基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签,继而基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。即基于预构建的知识图谱对检索关键词进行扩展,然后基于扩展得到的目标素材标签从资源库中确定出目标检索资源反馈给用户,从而不依赖于检索人员的关键词扩展能力,扩展了检索结果的范围,使得检索用户得到想要的资源,提升了检索效率;此外,对于目标资源来说,只要是通过知识图谱联想能得到目标资源对应标签的检索关键词,都能得到包括目标资源的检索结果,与传统方法只有输入目标资源的标签才能得到目标资源相比,提升了目标资源的复用率。
本申请实施例的检索装置的有益效果与实施例一所示的检索方法相似,在此不再赘述。
实施例三
本申请实施例提供了一种电子设备,如图4所示,图4所示的电子设备40包括:处理器401和存储器403。其中,处理器401和存储器403相连,如通过总线402相连。进一步地,电子设备40还可以包括收发器404。需要说明的是,实际应用中收发器404不限于一个,该电子设备40的结构并不构成对本申请实施例的限定。其中,处理器401应用于本申请实施例中,用于实现图2所示模块的功能。收发器404包括接收机和发射机。
处理器401可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器401也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线402可包括一通路,在上述组件之间传送信息。总线402可以是PCI总线或EISA总线等。总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器403可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器403用于存储执行本申请方案的应用程序代码,并由处理器401来控制执行。处理器401用于执行存储器403中存储的应用程序代码,以实现图2所示实施例提供的检索装置的功能。
本申请实施例提供了一种电子设备,与现有技术需人工联想扩展检索关键词相比,本申请通过获取至少一个检索关键词,并基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签,继而基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。即基于预构建的知识图谱对检索关键词进行扩展,然后基于扩展得到的目标素材标签从资源库中确定出目标检索资源反馈给用户,从而不依赖于检索人员的关键词扩展能力,扩展了检索结果的范围,使得检索用户得到想要的资源,提升了检索效率;此外,对于目标资源来说,只要是通过知识图谱联想能得到目标资源对应标签的检索关键词,都能得到包括目标资源的检索结果,与传统方法只有输入目标资源的标签才能得到目标资源相比,提升了目标资源的复用率。
本申请实施例提供了一种电子设备适用于上述方法实施例。在此不再赘述。
实施四
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述实施例中所示的方法。
本申请实施例提供了一种计算机可读存储介质,与现有技术需人工联想扩展检索关键词相比,本申请通过获取至少一个检索关键词,并基于至少一个检索关键词通过预构建的知识图谱确定与检索关键词关联的至少一个目标素材标签,继而基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。即基于预构建的知识图谱对检索关键词进行扩展,然后基于扩展得到的目标素材标签从资源库中确定出目标检索资源反馈给用户,从而不依赖于检索人员的关键词扩展能力,扩展了检索结果的范围,使得检索用户得到想要的资源,提升了检索效率;此外,对于目标资源来说,只要是通过知识图谱联想能得到目标资源对应标签的检索关键词,都能得到包括目标资源的检索结果,与传统方法只有输入目标资源的标签才能得到目标资源相比,提升了目标资源的复用率。
本申请实施例提供了一种计算机可读存储介质适用于上述方法实施例。在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (11)

1.一种检索方法,其特征在于,包括:
获取至少一个检索关键词;
基于所述至少一个检索关键词通过预构建的知识图谱确定与所述检索关键词关联的至少一个目标素材标签;
基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。
2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个检索关键词通过预构建的知识图谱确定与所述检索关键词关联的至少一个目标素材标签,包括:
如果所述检索关键词为多个,则分别基于各个所述检索关键词通过预构建的知识图谱确定与各个所述检索关键词关联的候选素材标签;
将各个所述检索关键共有的候选素材标签确定为目标素材标签。
3.根据权利要求1所述的方法,其特征在于,基于确定的至少一个目标素材标签从资源库中确定出目标检索资源,包括:
分别基于各个目标素材标签从资源库中确定候选检索资源;
针对各个目标素材标签分别选取预定数量的候选检索资源作为目标检索资源。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
基于所述各个目标素材标签与所述检索关键词的关联度对目标检索资源进行排序;
将排序后的目标检索资源反馈给用户。
5.根据权利要求1所述的方法,其特征在于,所述资源库包括以下至少一项:图片资源库、视频资源库、文档资源库。
6.根据权利要求5所述的方法,其特征在于,所述图片资源库的构建包括:
获取原始图片;
基于预训练的第一深度学习模型对所述原始图片进行分割处理得到至少一个单一对象图片;
基于预训练的第二深度学习模型对各个所述单一对象图片进行识别,确定各个所述单一对象图片的标签;
将各个所述单一对象图片及其对应的标签进行存储。
7.根据权利要求6所述的方法,其特征在于,所述基于预训练的第一深度学习模型对所述原始图片进行分割处理得到至少一个单一对象图片,之前包括:
判断所述原始图片是否包括多个对象;
如果包括多个对象,则基于预训练的第一深度学习模型对所述原始图片进行分割处理得到至少一个单一对象图片。
8.根据权利要求6所述的方法,其特征在于,所述预训练的第一深度学习模型为基于以下任一网络的模型:
RCNN、FAST-RCNN、FASTER-RCNN、YOLO、R-FCN、MASK-RCNN。
9.一种检索装置,其特征在于,包括:
获取模块,用于获取至少一个检索关键词;
第一确定模块,用于基于所述至少一个检索关键词通过预构建的知识图谱确定与所述检索关键词关联的至少一个目标素材标签;
第二确定模块,用于基于确定的至少一个目标素材标签从资源库中确定出目标检索资源。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1至8任一项所述的检索方法。
11.一种计算机可读存储介质,其特征在于,所述计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1至8中任一项所述的检索方法。
CN202010753083.7A 2020-07-30 2020-07-30 检索方法、装置、电子设备及可读存储介质 Pending CN112052332A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010753083.7A CN112052332A (zh) 2020-07-30 2020-07-30 检索方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010753083.7A CN112052332A (zh) 2020-07-30 2020-07-30 检索方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN112052332A true CN112052332A (zh) 2020-12-08

Family

ID=73602801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010753083.7A Pending CN112052332A (zh) 2020-07-30 2020-07-30 检索方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112052332A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113032609A (zh) * 2021-03-24 2021-06-25 建信金融科技有限责任公司 一种图片检索方法、装置、电子设备及存储介质
CN113849462A (zh) * 2021-09-16 2021-12-28 广东创意热店互联网科技有限公司 一种网络素材的智能推荐方法、系统、计算机设备及介质
CN114547268A (zh) * 2022-02-24 2022-05-27 特赞(上海)信息科技有限公司 检索数据处理方法、装置、设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992689A (zh) * 2019-03-26 2019-07-09 华为技术有限公司 搜索方法、终端及介质
CN110765275A (zh) * 2019-10-14 2020-02-07 平安医疗健康管理股份有限公司 搜索方法、装置、计算机设备和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992689A (zh) * 2019-03-26 2019-07-09 华为技术有限公司 搜索方法、终端及介质
CN110765275A (zh) * 2019-10-14 2020-02-07 平安医疗健康管理股份有限公司 搜索方法、装置、计算机设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113032609A (zh) * 2021-03-24 2021-06-25 建信金融科技有限责任公司 一种图片检索方法、装置、电子设备及存储介质
CN113849462A (zh) * 2021-09-16 2021-12-28 广东创意热店互联网科技有限公司 一种网络素材的智能推荐方法、系统、计算机设备及介质
CN114547268A (zh) * 2022-02-24 2022-05-27 特赞(上海)信息科技有限公司 检索数据处理方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN111680219B (zh) 内容推荐方法、装置、设备及可读存储介质
US11093698B2 (en) Method and apparatus and computer device for automatic semantic annotation for an image
CN111488931B (zh) 文章质量评估方法、文章推荐方法及其对应的装置
CN102902821B (zh) 基于网络热点话题的图像高级语义标注、检索方法及装置
CN112052332A (zh) 检索方法、装置、电子设备及可读存储介质
CN111291210A (zh) 图像素材库生成方法、图像素材推荐方法及相关装置
CN111539197A (zh) 文本匹配方法和装置以及计算机系统和可读存储介质
CN110110090A (zh) 搜索方法、教育搜索引擎系统及装置
CN112052304A (zh) 课程标签确定方法、装置及电子设备
US11645095B2 (en) Generating and utilizing a digital knowledge graph to provide contextual recommendations in digital content editing applications
CN110909768B (zh) 一种标注数据获取方法及装置
CN117556067B (zh) 数据检索方法、装置、计算机设备和存储介质
CN113591881B (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN116702784B (zh) 实体链接方法、装置、计算机设备和存储介质
CN116610304B (zh) 页面代码生成方法、装置、设备和存储介质
CN113254814A (zh) 网络课程视频打标签方法、装置、电子设备及介质
CN117077679A (zh) 命名实体识别方法和装置
CN116755688A (zh) 组件处理方法、装置、计算机设备及存储介质
CN116977992A (zh) 文本信息识别方法、装置、计算机设备和存储介质
CN112883218A (zh) 一种图文联合表征的搜索方法、系统、服务器和存储介质
CN114818639A (zh) 演示文稿生成方法、装置、设备及存储介质
Madan et al. Parsing and summarizing infographics with synthetically trained icon detection
CN113705692A (zh) 基于人工智能的情感分类方法、装置、电子设备及介质
CN111783808B (zh) 用于生成信息的方法和装置
CN112784061A (zh) 知识图谱的构建方法、装置、计算设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220926

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Applicant after: CHINA CONSTRUCTION BANK Corp.

Address before: 25 Financial Street, Xicheng District, Beijing 100033

Applicant before: CHINA CONSTRUCTION BANK Corp.

Applicant before: Jianxin Financial Science and Technology Co.,Ltd.