CN114610955A - 一种智能检索方法、装置、电子设备及存储介质 - Google Patents

一种智能检索方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114610955A
CN114610955A CN202210337541.8A CN202210337541A CN114610955A CN 114610955 A CN114610955 A CN 114610955A CN 202210337541 A CN202210337541 A CN 202210337541A CN 114610955 A CN114610955 A CN 114610955A
Authority
CN
China
Prior art keywords
entity
standard
target
entities
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210337541.8A
Other languages
English (en)
Inventor
吴娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Comac Software Co ltd
Shanghai Aviation Industry Group Co ltd
Original Assignee
Comac Software Co ltd
Shanghai Aviation Industry Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Comac Software Co ltd, Shanghai Aviation Industry Group Co ltd filed Critical Comac Software Co ltd
Priority to CN202210337541.8A priority Critical patent/CN114610955A/zh
Publication of CN114610955A publication Critical patent/CN114610955A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种智能检索方法、装置、电子设备及存储介质,通过获取用户输入的自然语言语句;针对自然语言语句进行分词,确定自然语言语句中包括的待检索实体;在预设的图数据库中匹配出与待检索实体相关联的多个待选实体,其中,图数据库中存储有预先构建好的民机构型知识图谱;根据用户在待选实体中选择出的目标实体,在待选实体中确定与目标实体相关联的目标关联实体,并在预设的关系型数据库中提取目标实体与目标关联实体之间的关联信息;展示待选实体以及目标实体与目标关联实体之间的关联信息。可以实现民机构型业务领域的复杂的逻辑分析与推理工作,通过智能检索方式帮助业务找到待选实体间的隐含关系,并实现实体上下游的顺畅跟踪。

Description

一种智能检索方法、装置、电子设备及存储介质
技术领域
本公开涉及数据查询技术领域,具体而言,涉及一种智能检索方法、装置、电子设备及存储介质。
背景技术
大型民用飞机项目是一项极其复杂的系统工程,民机构型数据具有存储分散、数据关系复杂、平台壁垒较高、依赖隐性经验等特性,给民用飞机制造业构型管理提出挑战,基于民机构型中的知识概念,如何从海量的数据当中分析数据之间潜在的关联关系,如何在特定的业务场景下,理解用户场景问题,获取相关知识,并通过知识和推理计算能力形成答案,挖掘隐含的构型技术知识,如何实现产品构型数据的自动互联,高效便捷的分析数据内在传递机制,赋能业务流程,成为当前信息技术领域迫切需要解决的问题。
现有的针对民用飞机项目的构型管理数据分析机制中,为提高不同平台之间的数据交互,不得不从多数据平台抽取数据,并对数据进行查询分析其相互依赖关系。但是由于工业制造中的构型数据,逻辑关系复杂,符合性检查效率低,限制了工业制造交付与运营的能力,传统的数据结构化存储注重待选实体的内部属性,待选实体和待选实体之间的关联关系需要通过外键来实现,随着数据量的急剧增加,导致关系型数据库难以承载待选实体与待选实体之间深层次关系的待选实体映射,带来的运算复杂性。
发明内容
本公开实施例至少提供一种智能检索方法、装置、电子设备及存储介质,实现民机构型业务领域的复杂的逻辑分析与推理工作,通过智能检索方式挖掘并推理出隐含的待选实体链接关系。
本公开实施例提供了一种智能检索方法,所述方法包括:
获取用户输入的自然语言语句;
针对所述自然语言语句进行分词,确定所述自然语言语句中包括的待检索实体;
在预设的图数据库中匹配出与所述待检索实体间具有关联关系的多个待选实体,其中,所述图数据库中存储有预先构建好的民机构型知识图谱,展示所述待选实体;
根据用户在所述待选实体中选择出的目标实体,在所述待选实体中确定与所述目标实体相关联的目标关联实体,并在预设的关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,展示所述关联信息。
一种可选的实施方式中,基于以下方法构建所述民机构型知识图谱:
获取用户构建所述民机构型知识图谱的源文件;
根据预设的实体识别规则,在所述源文件中识别出多个标准实体,并确定每个所述标准实体对应的实体特征;
针对每个所述标准实体,根据该所述标准实体对应的所述实体特征,在其余所述标准实体中筛选与该所述标准实体具有关联关系的多个关联标准实体;
根据所述标准实体、所述关联标准实体以及所述关联关系,构建所述民机构型知识图谱,并将所述民机构型知识图谱存储于所述图数据库中。
一种可选的实施方式中,所述关联关系包括影响关系,所述影响关系包括初级影响关系和次级影响关系,所述在预设的图数据库中匹配出与所述待检索实体间具有关联关系的多个待选实体,具体包括:
根据所述待检索实体与每个所述标准实体之间的语义相似度,在所述民机构型知识图谱中包括的所述标准实体中确定与所述待检索实体语义相似度最高的目标标准实体;
根据所述初级影响关系,从所述关联标准实体中,确定与所述目标标准实体具有所述初级影响关系的初级关联标准实体;
若所述初级关联标准实体存在对应的次级影响关系,则根据所述初级关联标准实体和所述次级影响关系,从所述关联标准实体中,确定与所述初级关联标准实体具有所述次级影响关系的次级关联标准实体;
将所述次级关联标准实体作为新的初级关联标准实体,并返回若所述初级关联标准实体存在对应的次级影响关系,则根据所述初级关联标准实体和所述次级影响关系,从所述关联标准实体中,确定与所述初级关联标准实体具有所述次级影响关系的次级关联标准实体的步骤,直至所述次级关联标准实体不存在对应的次级影响关系;
将所述目标标准实体、所述初级关联标准实体、所述次级关联标准实体确定为所述待选实体。
一种可选的实施方式中,所述源文件包含以下属性,并通过以下属性确定每个所述标准实体对应的实体特征;
识别符,用于标示所述标准实体在所述源文件中的具体位置;
值属性,用于记录所述源文件文件的具体内容。
一种可选的实施方式中,所述根据用户在所述待选实体中选择出的目标实体,在所述待选实体中确定与所述目标实体相关联的目标关联实体,并在预设的关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,具体包括:
根据所述民机构型知识图谱,在所述待选实体中确定与所述目标实体相关联的目标关联实体;
将所述目标关联实体以及所述目标实体转换为所述关系型数据库对应的查询语句;
基于所述查询语句,在关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,其中,所述关联信息包括:所述目标实体与所述目标关联实体之间的关联关系、所述目标实体对应的实体属性以及所述目标关联实体对应的实体属性。
本公开实施例还提供一种智能检索装置,所述装置包括:
获取模块,用于获取用户输入的自然语言语句;
确定模块,用于针对所述自然语言语句进行分词,确定所述自然语言语句中包括的待检索实体;
第一匹配模块,用于在预设的图数据库中匹配出与所述待检索实体间具有关联关系的多个待选实体,其中,所述图数据库中存储有预先构建好的民机构型知识图谱,展示所述待选实体;
第二匹配模块,用于根据用户在所述待选实体中选择出的目标实体,在所述待选实体中确定与所述目标实体相关联的目标关联实体,并在预设的关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,展示所述关联信息。
一种可选的实施方式中,所述装置还包括构建模块,所述构建模块用于:
获取用户构建所述民机构型知识图谱的源文件;
根据预设的实体识别规则,在所述源文件中识别出多个标准实体,并确定每个所述标准实体对应的实体特征;
针对每个所述标准实体,根据该所述标准实体对应的所述实体特征,在其余所述标准实体中筛选与该所述标准实体具有关联关系的多个关联标准实体;
根据所述标准实体、所述关联标准实体以及所述关联关系,构建所述民机构型知识图谱,并将所述民机构型知识图谱存储于所述图数据库中。
一种可选的实施方式中,所述关联关系包括影响关系,所述影响关系包括初级影响关系和次级影响关系,所述第一匹配模块具体用于:
根据所述待检索实体与每个所述标准实体之间的语义相似度,在所述民机构型知识图谱中包括的所述标准实体中确定与所述待检索实体语义相似度最高的目标标准实体;
根据所述初级影响关系,从所述关联标准实体中,确定与所述目标标准实体具有所述初级影响关系的初级关联标准实体;
若所述初级关联标准实体存在对应的次级影响关系,则根据所述初级关联标准实体和所述次级影响关系,从所述关联标准实体中,确定与所述初级关联标准实体具有所述次级影响关系的次级关联标准实体;
将所述次级关联标准实体作为新的初级关联标准实体,并返回若所述初级关联标准实体存在对应的次级影响关系,则根据所述初级关联标准实体和所述次级影响关系,从所述关联标准实体中,确定与所述初级关联标准实体具有所述次级影响关系的次级关联标准实体的步骤,直至所述次级关联标准实体不存在对应的次级影响关系;
将所述目标标准实体、所述初级关联标准实体、所述次级关联标准实体确定为所述待选实体。
一种可选的实施方式中,所述第二匹配模块具体用于:
根据所述民机构型知识图谱,在所述待选实体中确定与所述目标实体相关联的目标关联实体;
将所述目标关联实体以及所述目标实体转换为所述关系型数据库对应的查询语句;
基于所述查询语句,在关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,其中,所述关联信息包括:所述目标实体与所述目标关联实体之间的关联关系、所述目标实体对应的实体属性以及所述目标关联实体对应的实体属性。
本公开实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述智能检索方法,或上述智能检索方法中任一种可能的实施方式中的步骤。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述智能检索方法,或上述智能检索方法中任一种可能的实施方式中的步骤。
本公开实施例提供的一种智能检索方法、装置、电子设备及存储介质,通过获取用户输入的自然语言语句;针对自然语言语句进行分词,确定自然语言语句中包括的待检索实体;在预设的图数据库中匹配出与待检索实体相关联的多个待选实体,其中,图数据库中存储有预先构建好的民机构型知识图谱;根据用户在待选实体中选择出的目标实体,在待选实体中确定与目标实体相关联的目标关联实体,并在预设的关系型数据库中提取目标实体与目标关联实体之间的关联信息;展示待选实体以及目标实体与目标关联实体之间的关联信息。可以实现民机构型业务领域的复杂的逻辑分析与推理工作,通过智能检索方式挖掘并推理出隐含的待选实体链接关系。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种智能检索方法的流程图;
图2示出了本公开实施例所提供的另一种智能检索方法的流程图;
图3示出了本公开实施例所提供的一种智能检索装置的示意图;
图4示出了本公开实施例所提供的一种电子设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
经研究发现,现有的针对民用飞机项目的构型管理数据分析机制中,为提高不同平台之间的数据交互,不得不从多数据平台抽取数据,并对数据进行查询分析其相互依赖关系。但是由于工业制造中的构型数据,逻辑关系复杂,符合性检查效率低,限制了工业制造交付与运营的能力,传统的数据结构化存储注重待选实体的内部属性,待选实体和待选实体之间的关联关系需要通过外键来实现,随着数据量的急剧增加,导致关系型数据库难以承载待选实体与待选实体之间深层次关系的待选实体映射,带来的运算复杂性。
基于上述研究,本公开提供了一种智能检索方法、装置、电子设备及存储介质,通过获取用户输入的自然语言语句;针对自然语言语句进行分词,确定自然语言语句中包括的待检索实体;在预设的图数据库中匹配出与待检索实体相关联的多个待选实体,其中,图数据库中存储有预先构建好的民机构型知识图谱;根据用户在待选实体中选择出的目标实体,在待选实体中确定与目标实体相关联的目标关联实体,并在预设的关系型数据库中提取目标实体与目标关联实体之间的关联信息;展示待选实体以及目标实体与目标关联实体之间的关联信息。可以实现民机构型业务领域的复杂的逻辑分析与推理工作,通过智能检索方式挖掘并推理出隐含的待选实体链接关系。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种智能检索方法进行详细介绍,本公开实施例所提供的智能检索方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该智能检索方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
参见图1所示,为本公开实施例所提供的一种智能检索方法的流程示意图,所述方法包括步骤S101~S104,其中:
S101、获取用户输入的自然语言语句。
该步骤中,获取用户输入的自然语言语句作为检索过程中的查询语句。
这里,自然语言语句可以为民机构型业务中针对不同业务场景对应的疑问查询语句、陈述句等。例如,自然语言语句可以是“我想了解一下图纸A的修改,对哪些内容有影响?”(疑问查询语句)、“我要修改图纸A。”(陈述句)等。
这样,可以构建在民机构型业务领域中从“问题需求”的形式出发的智能检索过程。
S102、针对所述自然语言语句进行分词,确定所述自然语言语句中包括的待检索实体。
该步骤中,针对获取到的用户输入的自然语言语句进行分词处理,在自然语言语句中解析出用户需要进行检索的待检索实体。
这里,通过自然语言处理提取用户输入的自然语言语句的结构特征,并基于机器学习和规则提取分析出用户输入的自然语言语句包含的语义信息,进一步利用分词技术将用户输入的自然语言语句分割成多个关键词。根据自然语言语句的结构特征以及自然语言语句包含的语义信息,在所述关键词中筛选出待检索实体。
可选的,待检索实体对应的实体属性可以包括:图纸、工程、系统方案等多级属性。
示例性的,当用户输入的自然语言语句为“我想了解一下图纸A的修改,对哪些内容有影响?”时,其中包括的待检索实体为“图纸A”;当用户输入的自然语言语句为“我想了解一下工程B的修改,对哪些内容有影响?”时,其中包括的待检索实体为“工程B”。
S103、在预设的图数据库中匹配出与所述待检索实体间具有关联关系的多个待选实体,其中,所述图数据库中存储有预先构建好的民机构型知识图谱,展示所述待选实体。
该步骤中,针对从用户输入的自然语言语句中解析出的待检索实体,从预设的图数据库中存储的预先构建好的民机构型知识图谱中匹配出与待检索实体相关联的多个待选实体,并将全部待选实体展示在具有显示功能的设备上。
这里,所述关联关系包括归属关系和影响关系,其中,归属关系为:如果待检索实体为图纸A,待选实体为工程B时,工程图纸归属于工程,即待检索实体图纸A与待选实体工程B之间的关联关系为归属关系;影响关系为:当修改待检索实体对应的实际内容时,若待选实体对应的实际内容也会受到影响,即可认为待检索实体与待选实体之间具有影响关系。
在实际应用过程中,由于民用飞机的构型数据通常保存不同的存储平台,例如,产品数据管理(Product Data Management,PDM)的构型管理系统等。由于保存位置的不同,存在平台壁垒,导致民机的构型数据在使用的时候,存在很多问题。针对该问题,本申请将各个民机构型数据源中的不同结构类型的原始构型数据整理为统一的民机构型业务知识图谱。然后使用该统一的民机构型业务知识图谱,进而避免了现有技术中将原始构型数据保存在不同的数据源的中的平台壁垒。
作为一种可能的实施方式,可以基于以下步骤构建所述民机构型知识图谱:
步骤A、获取用户构建所述民机构型知识图谱的源文件。
该步骤中,获取用于构建民机构型知识图谱的记载有多种民用飞机构型数据的源文件。
其中,源文件可以包括文档数据、PDF数据等,这些文件保存不同的存储平台中。
步骤B、根据预设的实体识别规则,在所述源文件中识别出多个标准实体,并确定每个所述标准实体对应的实体特征。
该步骤中,基于预设的实体识别规则,针对每一个源文件进行实体识别,以确定全部源文件中包括的多个标准实体,以及每个标准实体对应的实体特征。
这里,源文件包含以下属性,并通过以下属性确定每个所述标准实体对应的实体特征;识别符,用于标示所述标准实体在所述源文件中的具体位置;值属性,用于记录所述源文件文件的具体内容。
其中,实体特征可以包括标准实体对应的实体属性以及实际内容。
步骤C、针对每个所述标准实体,根据该所述标准实体对应的所述实体特征,在其余所述标准实体中筛选与该所述标准实体具有关联关系的多个关联标准实体。
该步骤中,基于每个标准实体对应的实体属性,在其余的标准实体中筛选与该所述标准实体具有归属关系的多个关联标准实体;基于每个标准实体对应的实际内容,在其余的标准实体中筛选与该所述标准实体具有影响关系的多个关联标准实体。
这里,标准实体间的归属关系是确定的,即如果标准实体A为工程,标准实体B为工程图纸时,工程图纸归属于工程是确定的,即不会存在工程属于工程图的情况。但是在确定影响关系的时候,标准实体A与标准实体B的排列先后顺序不同的话,标准实体A与标准实体B的影响关系不同,例如,标准实体A影响标准实体B,和标准实体B影响标准实体A是不同的。
进一步的,为了去除不符合逻辑的影响关系,本申请进行了标准实体消歧,具体过程为:将标准实体进行前后不同顺序的排列组合,得到标准实体之间对应全部的影响关系;对标准实体对应全部的影响关系进行自然语言分析处理,从全部的影响关系中去除异常的影响关系,得到源文件数据中包括的标准实体之间正常的影响关系。
步骤D、根据所述标准实体、所述关联标准实体以及所述关联关系,构建所述民机构型知识图谱,并将所述民机构型知识图谱存储于所述图数据库中。
该步骤中,根据标准实体与关联标准实体之间的关联关系,将标准实体、与该标准实体具有关联关系的关联标准实体进行整合构成民机构型知识图谱,并将民机构型知识图谱存储于图数据库中。
这样,可以将各个民机构型数据源中的不同结构类型的原始构型数据整理为统一的民机构型知识图谱。然后使用该统一的民机构型知识图谱,进而避免了现有技术中将原始构型数据保存在不同的数据源的中的平台壁垒。
作为一种可能的实施方式,所述关联关系包括影响关系,所述影响关系包括初级影响关系和次级影响关系,可以基于以下步骤在预设的图数据库中匹配出与所述待检索实体间具有关联关系的多个待选实体:
这里所述的初级影响关系和次级影响关系反映影响关系的不同层级,例如:针对图纸-工程-项目三种类型的实体,图纸实体与工程实体之间的影响关系为初级影响关系,工程实体与项目实体之间的影响关系相对于图纸实体为次级影响关系。
步骤1、根据所述待检索实体与每个所述标准实体之间的语义相似度,在所述民机构型知识图谱中包括的所述标准实体中确定与所述待检索实体语义相似度最高的目标标准实体。
该步骤中,确定用户输入的自然语言语句中包括的待检索实体与民机构型知识图谱中包括的每个标准实体之间的语义相似度,将民机构型知识图谱中包括的标准实体中与所述待检索实体语义相似度最高的标准实体确定为目标标准实体。
步骤2、根据所述初级影响关系,从所述关联标准实体中,确定与所述目标标准实体具有所述初级影响关系的初级关联标准实体。
该步骤中,首先在民机构型知识图谱中包括的关联标准实体中,筛选出与所述目标标准实体之间具有所述初级影响关系关联标准实体作为初级关联标准实体。
这里,初级关联标准实体包括归属于目标标准实体同一层级的关联标准实体、归属于目标标准实体的下一层级的关联标准实体以及目标标准实体归属的上一层级的关联标准实体。例如:目标标准实体为工程M,这里的初级关联标准实体可以包括归属于工程M的下一层级的关联标准实体:图纸m、工程M归属的上一层级的关联标准实体:项目M’、与工程M归属于同一层级的其他工程N、工程P、工程Q等。M改变会导致m、M’、N、P、Q等随之发生改变。
步骤3、若所述初级关联标准实体存在对应的次级影响关系,则根据所述初级关联标准实体和所述次级影响关系,从所述关联标准实体中,确定与所述初级关联标准实体之间具有所述次级影响关系的次级关联标准实体。
该步骤中,进一步的对初级关联标准实体发生改变时对其他关联标准实体的影响情况进行检测,即根据初级关联标准实体和初级影响关联实体对应的次级影响关系,确定与目标标准实体之间具有次级影响关系的次级关联标准实体。
例如:当目标标准实体为图纸n时,与图纸n存在对应的初级影响关系的初级关联标准实体为工程N,即针对图纸n进行修改时,工程N的内容也会随之受到影响,若工程N的修改还会影响到工程N归属的上一层级的关联标准实体:项目N’时,则工程N与项目N’之间影响关系相对于图纸n属于次级影响关系,项目N’即为次级关联标准实体。
步骤4、将所述次级关联标准实体作为新的初级关联标准实体,并返回若所述初级关联标准实体存在对应的次级影响关系,则根据所述初级关联标准实体和所述次级影响关系,从所述关联标准实体中,确定与所述初级关联标准实体之间具有所述次级影响关系的次级关联标准实体的步骤,直至所述次级关联标准实体不存在对应的次级影响关系。
该步骤中,将次级关联标准实体作为新的初级关联标准实体,重复步骤3中的内容,直至作为新的初级关联标准实体的次级关联标准实体不存在对应的次级影响关系时,针对目标标准实体的影响深度挖掘完毕,此时已挖掘出与目标标准实体具有影响关系的全部关联标准实体。
步骤5、将所述目标标准实体、所述初级关联标准实体、所述次级关联标准实体确定为所述待选实体。
S104、根据用户在所述待选实体中选择出的目标实体,在所述待选实体中确定与所述目标实体相关联的目标关联实体,并在预设的关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,展示所述关联信息。
该步骤中,检测用户在具有显示功能的设备上显示的待选实体中的选择操作,将用户的选择操作对应的待选实体确定为目标实体,并基于民机构型知识图谱在全部待选实体中确定与目标实体具有关联关系的目标关联实体,在预设的关系型数据库中提取出目标实体与目标关联实体之间的关联信息,进而将目标实体与目标关联实体之间的关联信息展示在具有显示功能的设备上。
这里,所述关联信息包含有目标实体对应的实体属性、目标关联实体对应的实体属性,以及目标实体与目标关联实体之间的关联关系。
可选的,可以采用实体关系图的方式展示目标实体与目标关联实体之间的关联信息,所述实体关系图上标示有目标实体对应的实体属性、目标关联实体对应的实体属性以及目标实体与目标关联实体之间的影响关系,并通过连线的方式标示目标实体与目标关联实体之间的归属关系。
本公开实施例提供的一种智能检索方法,通过获取用户输入的自然语言语句;针对自然语言语句进行分词,确定自然语言语句中包括的待检索实体;在预设的图数据库中匹配出与待检索实体相关联的多个待选实体,其中,图数据库中存储有预先构建好的民机构型知识图谱;根据用户在待选实体中选择出的目标实体,在待选实体中确定与目标实体相关联的目标关联实体,并在预设的关系型数据库中提取目标实体与目标关联实体之间的关联信息;展示待选实体以及目标实体与目标关联实体之间的关联信息。可以实现民机构型业务领域的复杂的逻辑分析与推理工作,通过智能检索方式挖掘并推理出隐含的待选实体链接关系。
参见图2所示,为本公开实施例提供的另一种智能检索方法的流程示意图,所述方法包括步骤S201~S206,其中:
S201、获取用户输入的自然语言语句。
S202、针对所述自然语言语句进行分词,确定所述自然语言语句中包括的待检索实体。
S203、在预设的图数据库中匹配出与所述待检索实体间具有关联关系的多个待选实体,其中,所述图数据库中存储有预先构建好的民机构型知识图谱,展示所述待选实体。
这里,步骤S201-步骤S203所述的方法与步骤S101-步骤S103所述的方法实质相同,具有相同的实施方式并且可以达到相同的技术效果,在此不再赘述。
S204、根据所述民机构型知识图谱,在所述待选实体中确定与所述目标实体相关联的目标关联实体。
S205、将所述目标关联实体以及所述目标实体转换为预设的关系型数据库对应的查询语句。
S206、基于所述查询语句,在关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,其中,所述关联信息包括:所述目标实体与所述目标关联实体之间的关联关系、所述目标实体对应的实体属性以及所述目标关联实体对应的实体属性,展示所述关联信息。
本公开实施例提供的一种智能检索方法,通过获取用户输入的自然语言语句;针对自然语言语句进行分词,确定自然语言语句中包括的待检索实体;在预设的图数据库中匹配出与待检索实体相关联的多个待选实体,其中,图数据库中存储有预先构建好的民机构型知识图谱;根据用户在待选实体中选择出的目标实体,在待选实体中确定与目标实体相关联的目标关联实体,并在预设的关系型数据库中提取目标实体与目标关联实体之间的关联信息;展示待选实体以及目标实体与目标关联实体之间的关联信息。可以实现民机构型业务领域的复杂的逻辑分析与推理工作,通过智能检索方式挖掘并推理出隐含的待选实体链接关系。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与智能检索方法对应的智能检索装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述智能检索方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图3,图3为本公开实施例提供的一种智能检索装置的示意图。如图3中所示,本公开实施例提供的智能检索装置500包括:获取模块510;确定模块520;第一匹配模块530;第二匹配模块540。
获取模块510,用于获取用户输入的自然语言语句;
确定模块520,用于针对所述自然语言语句进行分词,确定所述自然语言语句中包括的待检索实体;
第一匹配模块530,用于在预设的图数据库中匹配出与所述待检索实体间具有关联关系的多个待选实体,其中,所述图数据库中存储有预先构建好的民机构型知识图谱,展示所述待选实体;
第二匹配模块540,用于根据用户在所述待选实体中选择出的目标实体,在所述待选实体中确定与所述目标实体相关联的目标关联实体,并在预设的关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,展示所述关联信息。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本公开实施例提供的一种智能检索装置,通过获取用户输入的自然语言语句;针对自然语言语句进行分词,确定自然语言语句中包括的待检索实体;在预设的图数据库中匹配出与待检索实体相关联的多个待选实体,其中,图数据库中存储有预先构建好的民机构型知识图谱;根据用户在待选实体中选择出的目标实体,在待选实体中确定与目标实体相关联的目标关联实体,并在预设的关系型数据库中提取目标实体与目标关联实体之间的关联信息;展示待选实体以及目标实体与目标关联实体之间的关联信息。可以实现民机构型业务领域的复杂的逻辑分析与推理工作,通过智能检索方式挖掘并推理出隐含的待选实体链接关系。
对应于图1与图2中的智能检索方法,本公开实施例还提供了一种电子设备400,如图4所示,为本公开实施例提供的电子设备400结构示意图,包括:
处理器41、存储器42、和总线43;存储器42用于存储执行指令,包括内存421和外部存储器422;这里的内存421也称内存储器,用于暂时存放处理器41中的运算数据,以及与硬盘等外部存储器422交换的数据,处理器41通过内存421与外部存储器422进行数据交换,当所述电子设备400运行时,所述处理器41与所述存储器42之间通过总线43通信,使得所述处理器41执行图1与图2中的定位检测方法的步骤。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的智能检索方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品包括有计算机指令,所述计算机指令被处理器执行时可以执行上述方法实施例中所述的智能检索方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种智能检索方法,其特征在于,所述方法包括:
获取用户输入的自然语言语句;
针对所述自然语言语句进行分词,确定所述自然语言语句中包括的待检索实体;
在预设的图数据库中匹配出与所述待检索实体间具有关联关系的多个待选实体,其中,所述图数据库中存储有预先构建好的民机构型知识图谱,展示所述待选实体;
根据用户在所述待选实体中选择出的目标实体,在所述待选实体中确定与所述目标实体相关联的目标关联实体,并在预设的关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,展示所述关联信息。
2.根据权利要求1所述的方法,其特征在于,基于以下方法构建所述民机构型知识图谱:
获取用户构建所述民机构型知识图谱的源文件;
根据预设的实体识别规则,在所述源文件中识别出多个标准实体,并确定每个所述标准实体对应的实体特征;
针对每个所述标准实体,根据该所述标准实体对应的所述实体特征,在其余所述标准实体中筛选与该所述标准实体具有关联关系的多个关联标准实体;
根据所述标准实体、所述关联标准实体以及所述关联关系,构建所述民机构型知识图谱,并将所述民机构型知识图谱存储于所述图数据库中。
3.根据权利要求2所述的方法,其特征在于,所述关联关系包括影响关系,所述影响关系包括初级影响关系和次级影响关系,所述在预设的图数据库中匹配出与所述待检索实体间具有关联关系的多个待选实体,具体包括:
根据所述待检索实体与每个所述标准实体之间的语义相似度,在所述民机构型知识图谱中包括的所述标准实体中确定与所述待检索实体语义相似度最高的目标标准实体;
根据所述初级影响关系,从所述关联标准实体中,确定与所述目标标准实体具有所述初级影响关系的初级关联标准实体;
若所述初级关联标准实体存在对应的次级影响关系,则根据所述初级关联标准实体和所述次级影响关系,从所述关联标准实体中,确定与所述初级关联标准实体具有所述次级影响关系的次级关联标准实体;
将所述次级关联标准实体作为新的初级关联标准实体,并返回若所述初级关联标准实体存在对应的次级影响关系,则根据所述初级关联标准实体和所述次级影响关系,从所述关联标准实体中,确定与所述初级关联标准实体具有所述次级影响关系的次级关联标准实体的步骤,直至所述次级关联标准实体不存在对应的次级影响关系;
将所述目标标准实体、所述初级关联标准实体、所述次级关联标准实体确定为所述待选实体。
4.根据权利要求2所述的方法,其特征在于,所述源文件包含以下属性,并通过以下属性确定每个所述标准实体对应的实体特征;
识别符,用于标示所述标准实体在所述源文件中的具体位置;
值属性,用于记录所述源文件文件的具体内容。
5.根据权利要求1所述的方法,其特征在于,所述根据用户在所述待选实体中选择出的目标实体,在所述待选实体中确定与所述目标实体相关联的目标关联实体,并在预设的关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,具体包括:
根据所述民机构型知识图谱,在所述待选实体中确定与所述目标实体相关联的目标关联实体;
将所述目标关联实体以及所述目标实体转换为所述关系型数据库对应的查询语句;
基于所述查询语句,在关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,其中,所述关联信息包括:所述目标实体与所述目标关联实体之间的关联关系、所述目标实体对应的实体属性以及所述目标关联实体对应的实体属性。
6.一种智能检索装置,其特征在于,所述装置包括:
获取模块,用于获取用户输入的自然语言语句;
确定模块,用于针对所述自然语言语句进行分词,确定所述自然语言语句中包括的待检索实体;
第一匹配模块,用于在预设的图数据库中匹配出与所述待检索实体间具有关联关系的多个待选实体,其中,所述图数据库中存储有预先构建好的民机构型知识图谱,展示所述待选实体;
第二匹配模块,用于根据用户在所述待选实体中选择出的目标实体,在所述待选实体中确定与所述目标实体相关联的目标关联实体,并在预设的关系型数据库中提取所述目标实体与所述目标关联实体之间的关联信息,展示所述关联信息。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括构建模块,所述构建模块用于:
获取用户构建所述民机构型知识图谱的源文件;
根据预设的实体识别规则,在所述源文件中识别出多个标准实体,并确定每个所述标准实体对应的实体特征;
针对每个所述标准实体,根据该所述标准实体对应的所述实体特征,在其余所述标准实体中筛选与该所述标准实体具有关联关系的多个关联标准实体;
根据所述标准实体、所述关联标准实体以及所述关联关系,构建所述民机构型知识图谱,并将所述民机构型知识图谱存储于所述图数据库中。
8.根据权利要求6所述的装置,其特征在于,所述第一匹配模块具体用于:
根据所述待检索实体与每个所述标准实体之间的语义相似度,在所述民机构型知识图谱中包括的所述标准实体中确定与所述待检索实体语义相似度最高的目标标准实体;
根据所述初级影响关系,从所述关联标准实体中,确定与所述目标标准实体具有所述初级影响关系的初级关联标准实体;
若所述初级关联标准实体存在对应的次级影响关系,则根据所述初级影响关联实体和所述次级影响关系,从所述关联标准实体中,确定与所述初级影响关联实体具有所述次级影响关系的次级关联标准实体;
将所述次级关联标准实体作为新的初级关联标准实体,并返回若所述初级关联标准实体存在对应的次级影响关系,则根据所述初级影响关联实体和所述次级影响关系,从所述关联标准实体中,确定与所述初级影响关联实体具有所述次级影响关系的次级关联标准实体的步骤,直至所述次级关联标准实体不存在对应的次级影响关系;
将所述目标标准实体、所述初级关联标准实体、所述次级关联标准实体确定为所述待选实体。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至5任一所述的智能检索方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至5任一所述的智能检索的方法的步骤。
CN202210337541.8A 2022-03-31 2022-03-31 一种智能检索方法、装置、电子设备及存储介质 Pending CN114610955A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210337541.8A CN114610955A (zh) 2022-03-31 2022-03-31 一种智能检索方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210337541.8A CN114610955A (zh) 2022-03-31 2022-03-31 一种智能检索方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114610955A true CN114610955A (zh) 2022-06-10

Family

ID=81867834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210337541.8A Pending CN114610955A (zh) 2022-03-31 2022-03-31 一种智能检索方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114610955A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115712667A (zh) * 2022-11-07 2023-02-24 中电科大数据研究院有限公司 一种图数据融合分析方法、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115712667A (zh) * 2022-11-07 2023-02-24 中电科大数据研究院有限公司 一种图数据融合分析方法、装置及存储介质
CN115712667B (zh) * 2022-11-07 2024-03-01 中电科大数据研究院有限公司 一种图数据融合分析方法、装置及存储介质

Similar Documents

Publication Publication Date Title
US9767127B2 (en) Method for record linkage from multiple sources
CN110377558B (zh) 文档查询方法、装置、计算机设备和存储介质
US20180181646A1 (en) System and method for determining identity relationships among enterprise data entities
CN103425687A (zh) 一种基于关键词的检索方法和系统
JP2019502979A (ja) 構造化されたマルチフィールドファイルのレイアウトの自動解釈
CN111767716A (zh) 企业多级行业信息的确定方法、装置及计算机设备
CN112148843B (zh) 文本处理方法、装置、终端设备和存储介质
CN111797594B (zh) 基于人工智能的字符串处理方法及相关设备
CN110795524B (zh) 主数据映射处理方法、装置、计算机设备及存储介质
CN110399448B (zh) 中文地名地址搜索匹配方法、终端、计算机可读存储介质
CN107783976B (zh) 用户信息挖掘方法及装置
CN111209411A (zh) 一种文档分析的方法及装置
CN110705226A (zh) 电子表格的创建方法、装置及计算机设备
CN114610955A (zh) 一种智能检索方法、装置、电子设备及存储介质
CN114356968A (zh) 查询语句生成方法、装置、计算机设备及存储介质
JP2013029891A (ja) 抽出プログラム、抽出方法及び抽出装置
CN112749258A (zh) 数据搜索的方法和装置、电子设备和存储介质
CN114443783B (zh) 一种供应链数据分析和增强处理方法及装置
CN112328653B (zh) 数据识别方法、装置、电子设备及存储介质
CN115291931A (zh) 版本变更的处理方法和装置、电子设备及存储介质
CN111752898B (zh) 一种文件处理方法及装置
CN113064982A (zh) 一种问答库生成方法及相关设备
CN113869408A (zh) 一种分类方法及计算机设备
CN113505117A (zh) 基于数据指标的数据质量评估方法、装置、设备及介质
CN112579944A (zh) 一种页面跳转处理方法、装置以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination