CN111752922A - 一种建立知识数据库、实现知识查询的方法及装置 - Google Patents

一种建立知识数据库、实现知识查询的方法及装置 Download PDF

Info

Publication number
CN111752922A
CN111752922A CN202010596675.2A CN202010596675A CN111752922A CN 111752922 A CN111752922 A CN 111752922A CN 202010596675 A CN202010596675 A CN 202010596675A CN 111752922 A CN111752922 A CN 111752922A
Authority
CN
China
Prior art keywords
knowledge
data
target
attribute
queried
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010596675.2A
Other languages
English (en)
Inventor
申亚坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202010596675.2A priority Critical patent/CN111752922A/zh
Publication of CN111752922A publication Critical patent/CN111752922A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种建立知识数据库、实现知识查询的方法及装置,建立知识数据库的方法包括:获取目标知识数据的特征信息;将目标知识数据的特征信息输入知识分类模型,获得知识分类模型输出的目标知识数据的知识类型;提取目标知识数据的知识属性以及知识属性值;建立目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;根据该对应关系建立知识关系图数据库。在知识关系图数据库中可以体现出各条目标知识数据之间的关联关系,从而以更有条理的方式对目标知识数据进行保存。当需要查找知识数据时,使用建立的知识关系图数据库,可以根据各目标知识数据之间的关联关系,迅速定位到所需要的知识数据,提高了知识数据查找的效率。

Description

一种建立知识数据库、实现知识查询的方法及装置
技术领域
本申请涉及互联网技术领域,具体涉及一种建立知识数据库、实现知识查询的方法及装置。
背景技术
随着企业的发展,知识数据在知识库中不断地积累和沉淀,直接导致了企业的信息过量和知识过量。在现有技术中,通常将海量知识数据直接保存在数据库中,如需查找某些知识数据效率较为低下。
发明内容
有鉴于此,本申请实施例提供一种建立知识数据库、实现知识查询的方法及装置,以解决查找知识数据效率低下的技术问题。
为解决上述问题,本申请实施例提供的技术方案如下:
一种建立知识数据库的方法,所述方法包括:
获取目标知识数据的特征信息;
将所述目标知识数据的特征信息输入知识分类模型,获得所述知识分类模型输出的所述目标知识数据的知识类型,所述知识分类模型是根据待训练知识数据的特征信息以及所述待训练知识数据的类型标签训练得到的;
提取所述目标知识数据的知识属性以及知识属性值;
建立所述目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;
根据各个所述目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,建立知识关系图数据库。
在一种可能的实现方式中,所述知识分类模型的训练过程包括:
获取待训练知识数据的特征信息以及所述待训练知识数据的类型标签;
根据所述待训练知识数据的特征信息以及所述待训练知识数据的类型标签,训练得到知识分类模型。
在一种可能的实现方式中,所述根据各个所述目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,建立知识关系图数据库,包括:
将各个所述目标知识数据的知识类型作为知识关系图的根节点,将各个所述目标知识数据的知识类型对应的知识属性添加为对应的根节点的子节点,将各个所述目标知识数据的知识属性对应的知识属性值添加为对应的子节点的子节点,生成所述知识关系图;
将所述知识关系图保存到知识关系图数据库。
一种实现知识查询的方法,所述方法包括:
获取客户端发送的知识查询请求,所述知识查询请求包括知识查询文本;
从所述知识查询文本中确定待查询知识类别以及待查询知识属性;
在知识关系图数据库中,查找与所述待查询知识类别以及所述待查询知识属性匹配的目标知识属性值,所述知识关系图数据库是根据权利要求1-3任一项所述的建立知识数据库的方法建立的;
将所述待查询知识类别、所述待查询知识属性以及所述目标知识属性值发送给所述客户端。
在一种可能的实现方式中,所述从所述知识查询文本中确定待查询知识类别以及待查询知识属性,包括:
对所述知识查询文本进行分词,从所述知识查询文本的分词中确定实体词作为待查询知识类别;
通过语义分析确定所述知识查询文本中的待查询知识属性。
一种建立知识数据库的装置,所述装置包括:
第一获取单元,用于获取目标知识数据的特征信息;
分类单元,用于将所述目标知识数据的特征信息输入知识分类模型,获得所述知识分类模型输出的所述目标知识数据的知识类型,所述知识分类模型是根据待训练知识数据的特征信息以及所述待训练知识数据的类型标签训练得到的;
提取单元,用于提取所述目标知识数据的知识属性以及知识属性值;
第一建立单元,用于建立所述目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;
第二建立单元,用于根据各个所述目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,建立知识关系图数据库。
在一种可能的实现方式中,所述知识分类模型的训练过程包括:
获取待训练知识数据的特征信息以及所述待训练知识数据的类型标签;
根据所述待训练知识数据的特征信息以及所述待训练知识数据的类型标签,训练得到知识分类模型。
在一种可能的实现方式中,所述第二建立单元,包括:
生成子单元,用于将各个所述目标知识数据的知识类型作为知识关系图的根节点,将各个所述目标知识数据的知识类型对应的知识属性添加为对应的根节点的子节点,将各个所述目标知识数据的知识属性对应的知识属性值添加为对应的子节点的子节点,生成所述知识关系图;
保存子单元,用于将所述知识关系图保存到知识关系图数据库。
一种实现知识查询的装置,所述装置包括:
第二获取单元,用于获取客户端发送的知识查询请求,所述知识查询请求包括知识查询文本;
确定单元,用于从所述知识查询文本中确定待查询知识类别以及待查询知识属性;
查找单元,用于在知识关系图数据库中,查找与所述待查询知识类别以及所述待查询知识属性匹配的目标知识属性值,所述知识关系图数据库是根据上述的建立知识数据库的方法建立的;
发送单元,用于将所述待查询知识类别、所述待查询知识属性以及所述目标知识属性值发送给所述客户端。
在一种可能的实现方式中,所述确定单元,包括:
第一确定子单元,用于对所述知识查询文本进行分词,从所述知识查询文本的分词中确定实体词作为待查询知识类别;
第二确定子单元,用于通过语义分析确定所述知识查询文本中的待查询知识属性。
由此可见,本申请实施例具有如下有益效果:
在本申请实施例中,首先根据目标知识数据的特征信息,利用预先训练的知识分类模型对目标知识数据进行分类,得到目标知识数据的知识类型;然后提取目标知识数据的知识属性以及知识属性值,从而建立各条目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;根据该对应关系建立知识关系图数据库。在知识关系图数据库中可以体现出各条目标知识数据之间的关联关系,从而以更有条理的方式对目标知识数据进行保存。当需要查找知识数据时,使用建立的知识关系图数据库,可以根据各目标知识数据之间的关联关系,迅速定位到所需要的知识数据,提高了知识数据查找的效率。
附图说明
图1为本申请实施例提供的一种应用场景示意图;
图2为本申请实施例提供的一种建立知识数据库的方法的流程图;
图3为本申请实施例提供的一种知识关系图的示意图;
图4为本申请实施例提供的一种实现知识查询的方法的流程图;
图5为本申请实施例提供的一种建立知识数据库的装置结构图;
图6为本申请实施例提供的一种实现知识查询的装置结构图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。
为便于理解本申请提供的技术方案,下面将先对本申请涉及的背景技术进行说明。
发明人在对传统的知识数据保存以及查找方法的研究中发现,随着企业的发展,知识数据在知识库中不断地积累和沉淀,直接导致了企业的信息过量和知识过量。虽然能够使用搜索引擎进行知识数据的检索,但是用户寻找知识数据时处于混乱状态,且查找知识数据效率较为低下。此时需要给用户形象化和具备推理功能的知识库系统。
基于此,本申请实施例提供一种建立知识数据库的方法,一种实现知识查询的方法,能够对现有的目标知识数据进行自动分类,实现对知识数据的细分,然后提取目标知识数据的知识属性以及知识属性值,从而建立各条目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;根据该对应关系建立知识关系图数据库。在知识关系图数据库中可以体现出各条目标知识数据之间的关联关系,从而以更有条理的方式对目标知识数据进行保存。当需要查找知识数据时,能够通过知识关系图数据库详细罗列相关的知识数据,对用户的展现形式更加友好,且提高了知识数据查找的效率。
为便于理解本申请实施例提供的参见图1,该图为本申请实施例提供的示例性应用场景的框架示意图。其中,本申请实施例提供的建立知识数据库的方法,实现知识查询的方法可以应用于服务器20。
具体地,服务器20可以获取目标知识数据的特征信息;将目标知识数据的特征信息输入预先训练得到的知识分类模型,获得知识分类模型输出的目标知识数据的知识类型;提取目标知识数据的知识属性以及知识属性值;建立目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;根据各个目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,建立知识关系图数据库。
用户在需要查询知识数据时,可以通过客户端10输入知识查询请求;服务器20获取客户端发送的知识查询请求;从知识查询请求中的知识查询文本中确定待查询知识类别以及待查询知识属性;在建立的知识关系图数据库中,查找与待查询知识类别以及待查询知识属性匹配的目标知识属性值;最后将待查询知识类别、待查询知识属性以及目标知识属性值发送给客户端10。
本领域技术人员可以理解,图1所示的框架示意图仅是本申请的实施方式可以在其中得以实现的一个示例。本申请实施方式的适用范围不受到该框架任何方面的限制。
需要注意的是,客户端10可以是现有的、正在研发的或将来研发的、能够通过任何形式的有线和/或无线连接(例如,Wi-Fi、LAN、蜂窝、同轴电缆等)相互交互的任何用户设备,包括但不限于:现有的、正在研发的或将来研发的智能可穿戴设备、智能手机、非智能手机、平板电脑、膝上型个人计算机、桌面型个人计算机、小型计算机、中型计算机、大型计算机等。本申请的实施方式在此方面不受任何限制。还需要注意的是,本申请实施例中服务器20可以是现有的、正在研发的或将来研发的、能够向用户提供输入的设备的一个示例。本申请的实施方式在此方面不受任何限制。
为便于理解本申请实施例提供的技术方案,下面将结合附图对本申请实施例提供的建立知识数据库的方法以及实现知识查询的方法进行说明。
参见图2,该图为本申请实施例提供的一种建立知识数据库的方法的流程图,如图2所示,该方法可以包括:
步骤201:获取目标知识数据的特征信息。
在本申请实施例中,已有的大量知识数据可以认为是目标知识数据,需要将大量目标知识数据整理到知识数据库中,从而以更有条理的方式对目标知识数据进行保存、管理。在实际应用中,目标知识数据可以为某一领域的知识数据,例如目标知识数据可以为银行业务知识数据。
每条目标知识数据可以以文档的形式存在,则可以从该文档中获取目标知识数据的特征信息。每条目标知识数据的特征信息可以包括以下一项或多项:知识文档名称、知识标签、知识标题、知识内容、知识目录等。其中,知识文档名称可以为保存目标知识数据的文档的文件名,知识标签可以为预先添加的目标知识数据的相关信息,知识标题为目标知识数据中的文本标题,知识内容为目标知识数据中知识的具体文本内容,知识目录可以为目标知识数据中表征知识层级的目录。可以理解的是,不同的特征信息可能存在重复内容,知识文档名称与知识标题可能重复。
以一条有关“ETC(Electronic Toll Collection,电子不停车收费系统)的办理条件”的目标知识数据作为示例,例如可以提取到知识文档名称、知识标签、知识标题、知识内容这四项特征信息,其中,知识标签可以包括ETC、办理条件,知识文档名称、知识标题为ETC的办理条件,知识内容为ETC的办理条件的具体文本内容。
目标知识数据的特征信息可以作为后续对目标知识数据进行分类的依据。在实际应用中,可以对目标知识数据的特征信息转换为特征向量以便于后续处理。具体的,可以将目标知识数据的每个特征信息包括的文本分别转换为由向量表示,再将目标知识数据的每个特征信息的向量共同组成特征向量作为该目标知识数据的特征信息。
步骤202:将目标知识数据的特征信息输入知识分类模型,获得知识分类模型输出的目标知识数据的知识类型。
为了实现对目标知识数据进行分类,可以将目标知识数据的特征信息输入预先训练的知识分类模型,获得知识分类模型输出的目标知识数据的知识类型。知识分类模型是根据待训练知识数据的特征信息以及待训练知识数据的类型标签训练得到的。
在一种可能的实现方式中,知识分类模型的训练过程可以包括:
获取待训练知识数据的特征信息以及待训练知识数据的类型标签;
根据待训练知识数据的特征信息以及待训练知识数据的类型标签,训练得到知识分类模型。
为了训练得到知识分类模型,预先获取待训练知识数据,每条待训练知识数据预先添加有类型标签,类型标签可以表征待训练知识数据的主题内容。例如,一条有关“ETC的办理条件”的待训练知识数据的类型标签为ETC。类似的,每条待训练知识数据的特征信息可以包括以下一项或多项:知识文档名称、知识标签、知识标题、知识内容、知识目录等。其中,知识文档名称可以为保存待训练知识数据的文档的文件名,知识标签可以为预先添加的待训练知识数据的相关信息,知识标题为待训练知识数据中的文本标题,知识内容为待训练知识数据中知识的具体文本内容,知识目录可以为待训练知识数据中表征知识层级的目录。
在实际应用中,可以对待训练知识数据的特征信息转换为特征向量以便于后续处理。具体的,可以将待训练知识数据的每个特征信息包括的文本分别转换为由向量表示,再将待训练知识数据的每个特征信息的向量共同组成特征向量作为该待训练知识数据的特征信息。
在得到待训练知识数据的特征信息以及待训练知识数据的类型标签后,可以利用大量待训练知识数据的特征信息以及对应的类型标签,循环迭代调整知识分类模型的模型参数,直到达到预设停止条件时训练得到知识分类模型。知识分类模型可以为多层神经网络模型,知识分类模型的结构可以根据实际情况设定,本申请实施例对此不进行限定。
在训练得到知识分类模型之后,可以将目标知识数据的特征信息输入知识分类模型,获得知识分类模型输出的目标知识数据的知识类型,目标知识数据的知识类型可以表征目标知识数据的主题内容。例如,一条有关“ETC的收费标准”的目标知识数据的特征信息输入知识分类模型,得到的知识类型为ETC。
步骤203:提取目标知识数据的知识属性以及知识属性值。
进一步的,目标知识数据中还包括有知识属性以及知识属性值,知识属性可以表示目标知识数据在主题内容之下的分支内容,知识属性值则为识属性的值。例如,一条有关“ETC的办理条件”的目标知识数据的知识类型为ETC,知识属性为办理条件,知识属性值为办理条件的具体本文内容;一条有关“ETC的收费标准”的目标知识数据的知识类型为ETC,知识属性为收费标准,知识属性值为收费标准的具体本文内容。
可以通过对目标知识数据中的知识文档名称以及知识标题进行关键词提取。如果提取到的关键词包括目标知识数据的知识类型,则将关键词中与目标知识数据的知识类型相同的关键词去除,将其他关键词确定为目标知识数据的知识属性。例如,对目标知识数据中的知识文档名称以及知识标题进行关键词提取,得到关键词ETC以及办理条件,ETC是该目标知识数据的知识类型,则可以将关键词办理条件确定为该目标知识数据的知识属性。而知识属性值则可以从目标知识数据中的知识内容提取获得。另外,本申请实施例不限定进行关键词提取的具体实现方式。
步骤204:建立目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系。
在分别得到同一条目标知识数据的知识类型、知识属性以及知识属性值之后,可以建立同一条目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,知识属性表示知识类型包括的分支内容,知识属性值是知识属性的具体内容,从而可以将目标知识数据采用更有条理的方式进行表示。
步骤205:根据各个目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,建立知识关系图数据库。
根据各个目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系可以建立知识关系图。在知识关系图中属于同一知识类型的目标知识数据会归拢在一起,属于同一知识类型的目标知识数据中包括了该知识类型的不同知识属性对应的知识属性值。建立知识关系图可以保存为图数据库,生成知识关系图数据库。
在一种可能的实现方式中,根据各个目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,建立知识关系图数据库的实现过程可以包括:
将各个目标知识数据的知识类型作为知识关系图的根节点,将各个目标知识数据的知识类型对应的知识属性添加为对应的根节点的子节点,将各个目标知识数据的知识属性对应的知识属性值添加为对应的子节点的子节点,生成知识关系图;
将知识关系图保存到知识关系图数据库。
也就是说,首先将不同的知识类型分别作为知识关系图的根节点。然后针对每一个知识类型对应的根节点,将与该知识类型对应的知识属性分别添加为这个根节点的子节点。最后将知识属性对应的知识属性值作为知识属性子节点下一级的子节点,从而生成知识关系图。知识关系图可以保存为知识关系图数据库,以知识地图的形式展示目标知识数据。
参见图3所示,示出了一种知识关系图的示意图。假设存在4条目标知识数据,第一条目标知识数据的知识类型为ETC、知识属性为概念、知识属性值为知识属性值1,第二条目标知识数据的知识类型为ETC、知识属性为办理条件、知识属性值为知识属性值2,第三条目标知识数据的知识类型为ETC、知识属性为收费标准、知识属性值为知识属性值3,第四条目标知识数据的知识类型为ETC、知识属性为使用方式、知识属性值为知识属性值4。
则这4条目标知识数据的知识类型均为ETC,生成一个根节点表示ETC。与ETC这一知识类型对应的知识属性有概念、办理条件、收费标准以及使用方式,则ETC这一根节点的下一级具有4个子节点,分别为子节点1表示概念、子节点2表示办理条件、子节点3表示收费标准以及子节点4表示使用方式。与知识属性对应的知识属性值作为知识属性子节点的下一级子节点,则子节点1的下一级子节点5表示知识属性值1,子节点2的下一级子节点6表示知识属性值2,子节点3的下一级子节点7表示知识属性值3,子节点4的下一级子节点8表示知识属性值4,从而生成知识关系图。
在本申请实施例中,首先根据目标知识数据的特征信息,利用预先训练的知识分类模型对目标知识数据进行分类,得到目标知识数据的知识类型;然后提取目标知识数据的知识属性以及知识属性值,从而建立各条目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;根据该对应关系建立知识关系图数据库。在知识关系图数据库中可以体现出各条目标知识数据之间的关联关系,从而以更有条理的方式对目标知识数据进行保存。
在建立知识关系图数据库之后,可以利用知识关系图数据库实现对知识数据的快速查询。参见图4,该图为本申请实施例提供的一种实现知识查询的方法的流程图,如图4所示,该方法可以包括:
步骤401:获取客户端发送的知识查询请求。
当用户需要对某一知识数据进行查询时,可以使用客户端输入知识查询文本以触发知识查询请求,服务器可以获取客户端发送的知识查询请求。可以理解的是,知识查询请求中包括有知识查询文本。例如,用户使用应用程序客户端查询“ETC的办理条件是什么”,其中,“ETC的办理条件是什么”为知识查询文本。
步骤402:从知识查询文本中确定待查询知识类别以及待查询知识属性。
由于知识查询文本中包括有用户所需要的知识的相关内容,则从知识查询文本中可以确定出待查询知识类别以及待查询知识属性。
在一种可能的实现方式中,从知识查询文本中确定待查询知识类别以及待查询知识属性,包括:
对知识查询文本进行分词,从知识查询文本的分词中确定实体词作为待查询知识类别;
通过语义分析确定知识查询文本中的待查询知识属性。
在本申请实施例中,可以对知识查询文本进行分词,在各个分词中确定出实体词。通常实体词为具有实际意义的名词,则知识查询文本中的实体词有较大可能表示待查询的主题内容,这样知识查询文本中的实体词可以被确定为待查询知识类别。本申请实施例不限定对对知识查询文本进行分词以及确定实体词的具体方式,例如可以训练实体词识别模型,将分词输入实体词识别模型得到分词中的实体词。
然后可以通过对知识查询文本进行语义分析,确定出知识查询文本除主题内容之外进一步包括的查询需求,以确定出待查询知识属性。在实际应用中,还可以对知识查询文本进行关键词提取。如果提取到的关键词包括待查询知识类别,则将关键词中与待查询知识类别相同的关键词去除,将其他关键词确定为待查询知识属性。例如,知识查询文本为“ETC的办理条件是什么”,对知识查询文本进行关键词提取,得到关键词ETC以及办理条件,ETC是已确定出的待查询知识类型,则可以将关键词办理条件确定为待查询知识属性。另外,本申请实施例不限定进行关键词提取的具体实现方式。
步骤403:在知识关系图数据库中,查找与待查询知识类别以及待查询知识属性匹配的目标知识属性值。
在上述实施例中,预先建立了知识关系图数据库,则可以在知识关系图数据库中查询待查询知识类别以及待查询知识属性对应的目标知识属性值。知识关系图数据库是根据上述实施例中建立知识数据库的方法实施例建立的,知识关系图数据库的相关说明可以参见上述实施例,在此不再赘述。
在知识关系图数据库包括的知识关系图中,首先查找待查询知识类别所在的根节点,然后在该根节点下查找待查询知识属性所在的子节点,该子节点对应的子节点则为目标知识属性值。例如,待查询知识类别为ETC,待查询知识属性为办理条件,基于图3所示的知识关系图,找到ETC所在的根节点,该根节点下的第2个子节点对应于待查询知识属性:办理条件,则该子节点对应的知识属性值2为目标知识属性值。
通过知识关系图数据库,查询与待查询知识类别以及待查询知识属性匹配的目标知识属性值,可以在知识关系图中快速逐级确定出所需的目标知识属性值,提高了查询效率。
步骤404:将待查询知识类别、待查询知识属性以及目标知识属性值发送给客户端。
在查询到目标知识属性值之后,可以将待查询知识类别、待查询知识属性以及目标知识属性值发送给客户端,完成对知识数据的查询。
本申请实施例中,当用户需要查找知识数据时会触发知识查询请求,则服务器获取客户端发送的知识查询请求,从知识查询文本中确定待查询知识类别以及待查询知识属性。使用建立的知识关系图数据库,根据各目标知识数据之间的关联关系,查找与待查询知识类别以及待查询知识属性匹配的目标知识属性值。最后将待查询知识类别、待查询知识属性以及目标知识属性值发送给客户端。从而实现了通过知识关系图数据库迅速定位到所需要的知识数据,提高了知识数据查找的效率。
参见图5,该图为本申请实施例提供的一种建立知识数据库的装置结构图,如图5所示,该装置可以包括:
第一获取单元501,用于获取目标知识数据的特征信息;
分类单元502,用于将目标知识数据的特征信息输入知识分类模型,获得知识分类模型输出的目标知识数据的知识类型,知识分类模型是根据待训练知识数据的特征信息以及待训练知识数据的类型标签训练得到的;
提取单元503,用于提取目标知识数据的知识属性以及知识属性值;
第一建立单元504,用于建立目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;
第二建立单元505,用于根据各个目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,建立知识关系图数据库。
可选的,知识分类模型的训练过程包括:
获取待训练知识数据的特征信息以及待训练知识数据的类型标签;
根据待训练知识数据的特征信息以及待训练知识数据的类型标签,训练得到知识分类模型。
可选的,第二建立单元,包括:
生成子单元,用于将各个目标知识数据的知识类型作为知识关系图的根节点,将各个目标知识数据的知识类型对应的知识属性添加为对应的根节点的子节点,将各个目标知识数据的知识属性对应的知识属性值添加为对应的子节点的子节点,生成知识关系图;
保存子单元,用于将知识关系图保存到知识关系图数据库。
在本申请实施例中,首先根据目标知识数据的特征信息,利用预先训练的知识分类模型对目标知识数据进行分类,得到目标知识数据的知识类型;然后提取目标知识数据的知识属性以及知识属性值,从而建立各条目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;根据该对应关系建立知识关系图数据库。在知识关系图数据库中可以体现出各条目标知识数据之间的关联关系,从而以更有条理的方式对目标知识数据进行保存。
参见图6,该图为本申请实施例提供的一种实现知识查询的装置结构图,如图6所示,该装置可以包括:
第二获取单元601,用于获取客户端发送的知识查询请求,知识查询请求包括知识查询文本;
确定单元602,用于从知识查询文本中确定待查询知识类别以及待查询知识属性;
查找单元603,用于在知识关系图数据库中,查找与待查询知识类别以及待查询知识属性匹配的目标知识属性值,知识关系图数据库是上述建立知识数据库的方法建立的;
发送单元604,用于将待查询知识类别、待查询知识属性以及目标知识属性值发送给客户端。
可选的,确定单元,包括:
第一确定子单元,用于对知识查询文本进行分词,从知识查询文本的分词中确定实体词作为待查询知识类别;
第二确定子单元,用于通过语义分析确定知识查询文本中的待查询知识属性。
本申请实施例中,当用户需要查找知识数据时会触发知识查询请求,则服务器获取客户端发送的知识查询请求,从知识查询文本中确定待查询知识类别以及待查询知识属性。使用建立的知识关系图数据库,根据各目标知识数据之间的关联关系,查找与待查询知识类别以及待查询知识属性匹配的目标知识属性值。最后将待查询知识类别、待查询知识属性以及目标知识属性值发送给客户端。从而实现了通过知识关系图数据库迅速定位到所需要的知识数据,提高了知识数据查找的效率。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种建立知识数据库的方法,其特征在于,所述方法包括:
获取目标知识数据的特征信息;
将所述目标知识数据的特征信息输入知识分类模型,获得所述知识分类模型输出的所述目标知识数据的知识类型,所述知识分类模型是根据待训练知识数据的特征信息以及所述待训练知识数据的类型标签训练得到的;
提取所述目标知识数据的知识属性以及知识属性值;
建立所述目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;
根据各个所述目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,建立知识关系图数据库。
2.根据权利要求1所述的方法,其特征在于,所述知识分类模型的训练过程包括:
获取待训练知识数据的特征信息以及所述待训练知识数据的类型标签;
根据所述待训练知识数据的特征信息以及所述待训练知识数据的类型标签,训练得到知识分类模型。
3.根据权利要求1所述的方法,其特征在于,所述根据各个所述目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,建立知识关系图数据库,包括:
将各个所述目标知识数据的知识类型作为知识关系图的根节点,将各个所述目标知识数据的知识类型对应的知识属性添加为对应的根节点的子节点,将各个所述目标知识数据的知识属性对应的知识属性值添加为对应的子节点的子节点,生成所述知识关系图;
将所述知识关系图保存到知识关系图数据库。
4.一种实现知识查询的方法,其特征在于,所述方法包括:
获取客户端发送的知识查询请求,所述知识查询请求包括知识查询文本;
从所述知识查询文本中确定待查询知识类别以及待查询知识属性;
在知识关系图数据库中,查找与所述待查询知识类别以及所述待查询知识属性匹配的目标知识属性值,所述知识关系图数据库是根据权利要求1-3任一项所述的建立知识数据库的方法建立的;
将所述待查询知识类别、所述待查询知识属性以及所述目标知识属性值发送给所述客户端。
5.根据权利要求4所述的方法,其特征在于,所述从所述知识查询文本中确定待查询知识类别以及待查询知识属性,包括:
对所述知识查询文本进行分词,从所述知识查询文本的分词中确定实体词作为待查询知识类别;
通过语义分析确定所述知识查询文本中的待查询知识属性。
6.一种建立知识数据库的装置,其特征在于,所述装置包括:
第一获取单元,用于获取目标知识数据的特征信息;
分类单元,用于将所述目标知识数据的特征信息输入知识分类模型,获得所述知识分类模型输出的所述目标知识数据的知识类型,所述知识分类模型是根据待训练知识数据的特征信息以及所述待训练知识数据的类型标签训练得到的;
提取单元,用于提取所述目标知识数据的知识属性以及知识属性值;
第一建立单元,用于建立所述目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系;
第二建立单元,用于根据各个所述目标知识数据的知识类型、知识属性以及知识属性值之间的对应关系,建立知识关系图数据库。
7.根据权利要求6所述的装置,其特征在于,所述知识分类模型的训练过程包括:
获取待训练知识数据的特征信息以及所述待训练知识数据的类型标签;
根据所述待训练知识数据的特征信息以及所述待训练知识数据的类型标签,训练得到知识分类模型。
8.根据权利要求6所述的装置,其特征在于,所述第二建立单元,包括:
生成子单元,用于将各个所述目标知识数据的知识类型作为知识关系图的根节点,将各个所述目标知识数据的知识类型对应的知识属性添加为对应的根节点的子节点,将各个所述目标知识数据的知识属性对应的知识属性值添加为对应的子节点的子节点,生成所述知识关系图;
保存子单元,用于将所述知识关系图保存到知识关系图数据库。
9.一种实现知识查询的装置,其特征在于,所述装置包括:
第二获取单元,用于获取客户端发送的知识查询请求,所述知识查询请求包括知识查询文本;
确定单元,用于从所述知识查询文本中确定待查询知识类别以及待查询知识属性;
查找单元,用于在知识关系图数据库中,查找与所述待查询知识类别以及所述待查询知识属性匹配的目标知识属性值,所述知识关系图数据库是根据权利要求1-3任一项所述的建立知识数据库的方法建立的;
发送单元,用于将所述待查询知识类别、所述待查询知识属性以及所述目标知识属性值发送给所述客户端。
10.根据权利要求9所述的装置,其特征在于,所述确定单元,包括:
第一确定子单元,用于对所述知识查询文本进行分词,从所述知识查询文本的分词中确定实体词作为待查询知识类别;
第二确定子单元,用于通过语义分析确定所述知识查询文本中的待查询知识属性。
CN202010596675.2A 2020-06-28 2020-06-28 一种建立知识数据库、实现知识查询的方法及装置 Pending CN111752922A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010596675.2A CN111752922A (zh) 2020-06-28 2020-06-28 一种建立知识数据库、实现知识查询的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010596675.2A CN111752922A (zh) 2020-06-28 2020-06-28 一种建立知识数据库、实现知识查询的方法及装置

Publications (1)

Publication Number Publication Date
CN111752922A true CN111752922A (zh) 2020-10-09

Family

ID=72677490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010596675.2A Pending CN111752922A (zh) 2020-06-28 2020-06-28 一种建立知识数据库、实现知识查询的方法及装置

Country Status (1)

Country Link
CN (1) CN111752922A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254571A (zh) * 2021-06-23 2021-08-13 中国银行股份有限公司 知识点存储方法、装置、服务器及介质
CN113627148A (zh) * 2021-05-19 2021-11-09 中国银行股份有限公司 一种知识库中知识的自动关联方法及装置
JP2023014975A (ja) * 2021-07-19 2023-01-31 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073729A (zh) * 2011-01-14 2011-05-25 百度在线网络技术(北京)有限公司 一种关系化知识共享平台及其实现方法
US20150095331A1 (en) * 2012-12-21 2015-04-02 Cloud Computing Center Chinese Academy Of Sciences Establishing and querying methods of knowledge library engine based on emergency management
CN109739964A (zh) * 2018-12-27 2019-05-10 北京拓尔思信息技术股份有限公司 知识数据提供方法、装置、电子设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073729A (zh) * 2011-01-14 2011-05-25 百度在线网络技术(北京)有限公司 一种关系化知识共享平台及其实现方法
US20150095331A1 (en) * 2012-12-21 2015-04-02 Cloud Computing Center Chinese Academy Of Sciences Establishing and querying methods of knowledge library engine based on emergency management
CN109739964A (zh) * 2018-12-27 2019-05-10 北京拓尔思信息技术股份有限公司 知识数据提供方法、装置、电子设备和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627148A (zh) * 2021-05-19 2021-11-09 中国银行股份有限公司 一种知识库中知识的自动关联方法及装置
CN113254571A (zh) * 2021-06-23 2021-08-13 中国银行股份有限公司 知识点存储方法、装置、服务器及介质
CN113254571B (zh) * 2021-06-23 2024-02-23 中国银行股份有限公司 知识点存储方法、装置、服务器及介质
JP2023014975A (ja) * 2021-07-19 2023-01-31 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP7476249B2 (ja) 2021-07-19 2024-04-30 Lineヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム

Similar Documents

Publication Publication Date Title
CN110188168B (zh) 语义关系识别方法和装置
CN108959431B (zh) 标签自动生成方法、系统、计算机可读存储介质及设备
WO2019214245A1 (zh) 一种信息推送方法、装置、终端设备及存储介质
CN109885773B (zh) 一种文章个性化推荐方法、系统、介质及设备
WO2023108980A1 (zh) 基于文本对抗样例的信息推送方法及装置
CN110929125B (zh) 搜索召回方法、装置、设备及其存储介质
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
CN107729336A (zh) 数据处理方法、设备及系统
WO2006108069A2 (en) Searching through content which is accessible through web-based forms
CN108647322B (zh) 基于词网识别大量Web文本信息相似度的方法
CN111752922A (zh) 一种建立知识数据库、实现知识查询的方法及装置
US8463808B2 (en) Expanding concept types in conceptual graphs
US20180341686A1 (en) System and method for data search based on top-to-bottom similarity analysis
US20150154306A1 (en) Method for searching related entities through entity co-occurrence
WO2018176913A1 (zh) 搜索方法、装置及非临时性计算机可读存储介质
CN106789559A (zh) 用于微信公众平台的信息处理方法、装置、及系统
US20160041975A1 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
CN110674087A (zh) 文件查询方法、装置及计算机可读存储介质
CN113704623A (zh) 一种数据推荐方法、装置、设备及存储介质
WO2015084757A1 (en) Systems and methods for processing data stored in a database
JP2003186888A (ja) 部品情報分類装置、部品情報検索装置および部品情報検索サーバ
CN103226601A (zh) 一种图片搜索的方法和装置
CN105159898A (zh) 一种搜索的方法和装置
CN117056477A (zh) 一种案例数据的检索方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201009