CN110597992B - 基于知识图谱的语义推理方法及装置、电子设备 - Google Patents

基于知识图谱的语义推理方法及装置、电子设备 Download PDF

Info

Publication number
CN110597992B
CN110597992B CN201910854946.7A CN201910854946A CN110597992B CN 110597992 B CN110597992 B CN 110597992B CN 201910854946 A CN201910854946 A CN 201910854946A CN 110597992 B CN110597992 B CN 110597992B
Authority
CN
China
Prior art keywords
data
model
vertical domain
dialogue
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910854946.7A
Other languages
English (en)
Other versions
CN110597992A (zh
Inventor
缪畅宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910854946.7A priority Critical patent/CN110597992B/zh
Publication of CN110597992A publication Critical patent/CN110597992A/zh
Application granted granted Critical
Publication of CN110597992B publication Critical patent/CN110597992B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种基于知识图谱的语义推理方法及装置、电子设备;涉及计算机技术领域。所述基于知识图谱的语义推理方法包括:对预先采集的图谱数据进行解耦处理,确定所述图谱数据对应的关系组数据;根据预训练的垂直领域分类模型对所述关系组数据进行分类,确定所述关系组数据对应的垂直领域知识图谱;通过所述垂直领域知识图谱构建语义推理模型,以根据所述语义推理模型确定目标内容对应的语义数据。本公开能够准确地分析目标内容的语义数据,提高了内容识别的准确率以及数据处理的效率,提升用户的使用体验。

Description

基于知识图谱的语义推理方法及装置、电子设备
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种基于知识图谱的语义推理方法、基于知识图谱的语义推理装置、电子设备以及计算机可读存储介质。
背景技术
随着互联网技术的发展,搜索引擎、对话系统、智能客服、聊天机器人等技术也越来越受到人们的重视。
现有的技术方案在面对海量的知识数据时,会暴露出如下的缺点:相关知识图谱的建设过于繁杂,尤其当数据量较多的时候,数据之间的关联关系异常杂乱,导致图谱的维护和推理带来很大不便且数据分析比较容易出错;其次由于知识图谱的关联关系过于繁杂,因此人工参与知识图谱的维护以及推理过程很多,尤其在面对复杂的提问数据时,需要综合运用模板、人工规则、模型等方法,工作效率较低且得到的推理结果也不准确,用户体验较差。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种基于知识图谱的语义推理方法、基于知识图谱的语义推理装置、电子设备以及计算机可读存储介质,进而在一定程度上克服由于相关技术的限制和缺陷而导致的,现有的图谱推理系统在数据量较多时,人工干预较多且推理结果不准确的问题。
根据本公开的第一方面,提供一种基于知识图谱的语义推理方法,包括:
对预先采集的图谱数据进行解耦处理,确定所述图谱数据对应的关系组数据;
根据预训练的垂直领域分类模型对所述关系组数据进行分类,确定所述关系组数据对应的垂直领域知识图谱;
通过所述垂直领域知识图谱构建语义推理模型,以根据所述语义推理模型确定目标内容对应的语义数据。
在本公开的一种示例性实施例中,所述目标内容包括对话数据,所述通过所述垂直领域知识图谱构建语义推理模型,以根据所述语义推理模型确定目标内容对应的语义数据,还包括:
获取上传的对话数据,并对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域;
通过所述目标垂直领域在所述垂直领域知识图谱中匹配与所述对话数据对应的关系组数据;
基于所述语义推理模型,通过所述关系组数据确定所述对话数据对应的语义数据。
在本公开的一种示例性实施例中,在通过所述垂直领域知识图谱构建语义推理模型之前,所述方法还包括:
获取预先设置的提问模型以及实体词典数据;
根据不同所述垂直领域知识图谱中的所述关系组数据、所述提问模型、以及所述实体词典数据生成样本问题数据;
通过所述样本问题数据对预构建的语义推理模型进行训练处理;其中,所述语义推理模型包括垂直领域意图模型、垂直领域关系模型以及垂直领域实体填槽模型中的一种或多种。
在本公开的一种示例性实施例中,根据预训练的垂直领域分类模型对所述关系组数据进行分类,确定所述关系组数据对应的垂直领域知识图谱,还包括:
将不同的所述垂直领域知识图谱上传到区块链进行存储。
在本公开的一种示例性实施例中,对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域,包括:
对所述对话数据进行分词处理以提取所述对话数据对应的实体数据;
获取区块链中存储的所述垂直领域知识图谱,并根据所述实体数据以及所述垂直领域知识图谱对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域。
在本公开的一种示例性实施例中,所述通过所述目标垂直领域在所述垂直领域知识图谱中匹配与所述对话数据对应的关系组数据,包括:
通过所述目标垂直领域匹配与所述对话数据对应的所述垂直领域知识图谱;
根据所述垂直领域知识图谱以及所述垂直领域关系模型确定所述对话数据在所述垂直领域知识图谱中对应的关系组数据。
在本公开的一种示例性实施例中,在根据所述垂直领域知识图谱以及所述垂直领域关系模型确定所述对话数据在所述垂直领域知识图谱中对应的关系组数据之后,还包括:
基于所述垂直领域实体填槽模型,根据所述关系组数据中的实体数据生成所述对话数据对应的检索模式;
根据所述检索模式在所述对话数据对应的垂直领域知识图谱中确定所述对话数据对应的语义数据。
在本公开的一种示例性实施例中,在基于所述语义推理模型,通过所述关系组数据确定所述对话数据对应的语义数据之后,所述方法还包括:
根据所述语义数据生成与所述对话数据对应的回复数据并将所述回复数据返回。
根据本公开的第二方面,提供一种基于知识图谱的语义推理装置,包括:
图谱解耦模块,用于对预先采集的图谱数据进行解耦处理,确定所述图谱数据对应的关系组数据;
垂直领域知识图谱生成模块,用于根据预训练的垂直领域分类模型对所述关系组数据进行分类,确定所述关系组数据对应的垂直领域知识图谱;
语义推理模块,用于通过所述垂直领域知识图谱构建语义推理模型,以根据所述语义推理模型确定目标内容对应的语义数据。
在本公开的一种示例性实施例中,所述基于知识图谱的语义推理装置还包括对话数据语义推理模块,所述对话数据语义推理模块还包括:
对话数据分类单元,用于获取上传的对话数据,并对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域;
关系组数据匹配单元,用于通过所述目标垂直领域在所述垂直领域知识图谱中匹配与所述对话数据对应的关系组数据;
语义推理单元,用于基于所述语义推理模型,通过所述关系组数据确定所述对话数据对应的语义数据。
在本公开的一种示例性实施例中,所述基于知识图谱的语义推理装置还包括语义推理模型训练单元,所述语义推理模型训练单元被配置为:
获取预先设置的提问模型以及实体词典数据;
根据不同所述垂直领域知识图谱中的所述关系组数据、所述提问模型、以及所述实体词典数据生成样本问题数据;
通过所述样本问题数据对预构建的语义推理模型进行训练处理;其中,所述语义推理模型包括垂直领域意图模型、垂直领域关系模型以及垂直领域实体填槽模型中的一种或多种。
在本公开的一种示例性实施例中,所述垂直领域知识图谱生成模块还包括垂直领域知识图谱存储单元,所述垂直领域知识图谱存储单元被配置为:
将不同的所述垂直领域知识图谱上传到区块链进行存储。
在本公开的一种示例性实施例中,所述对话数据分类单元被配置为:
对所述对话数据进行分词处理以提取所述对话数据对应的实体数据;
获取区块链中存储的所述垂直领域知识图谱,并根据所述实体数据以及所述垂直领域知识图谱对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域。
在本公开的一种示例性实施例中,所述关系组数据匹配单元还包括:
垂直领域知识图谱匹配单元,用于通过所述目标垂直领域匹配与所述对话数据对应的所述垂直领域知识图谱;
关系组数据确定单元,用于根据所述垂直领域知识图谱以及所述垂直领域关系模型确定所述对话数据在所述垂直领域知识图谱中对应的关系组数据。
在本公开的一种示例性实施例中,所述基于知识图谱的语义推理装置还包括语义数据确定单元,所述语义数据确定单元被配置为
基于所述垂直领域实体填槽模型,根据所述关系组数据中的实体数据生成所述对话数据对应的检索模式;
根据所述检索模式在所述对话数据对应的垂直领域知识图谱中确定所述对话数据对应的语义数据。
在本公开的一种示例性实施例中,所述基于知识图谱的语义推理装置还包括回复数据返回单元,所述回复数据返回单元被配置为:
根据所述语义数据生成与所述对话数据对应的回复数据并将所述回复数据返回。
根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的方法。
根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法。
本公开示例性实施例可以具有以下部分或全部有益效果:
在本公开的一示例实施方式所提供的基于知识图谱的语义推理方法中,对预先采集的图谱数据进行解耦处理生成对应的关系组数据,将关系组数据进行分类以确定对应的垂直领域知识图谱,通过垂直领域知识图谱构建语义推理模型并根据语义推理模型确定目标内容对应的语义数据。一方面,将图谱数据解耦处理生成对应的关系组数据,并将关系组数据分类到对应的垂直领域知识图谱,能够将数据关系糅杂混乱的图谱数据整理分类到不同的垂直领域知识图谱,便于知识图谱的维护以及使用,其次在使用图谱数据时能够通过垂直领域知识图谱快速定位到需要的垂直领域,提高工作效率;另一方面,根据垂直领域知识图谱构建语义推理模型并根据语义推理模型推理目标内容对应的语义数据,在工作效率提升的同时,提高了分析结果的准确性,提高用户的使用体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本公开实施例的一种基于知识图谱的语义推理方法及装置的示例性系统架构的示意图;
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图;
图3示意性示出了根据本公开的一个实施例的基于知识图谱的语义推理方法的流程示意图;
图4示意性示出了根据本公开的一个实施例的数据共享系统的示意图;
图5示意性示出了根据本公开的一个实施例的数据共享系统中每个节点对应的区块链的示意图;
图6示意性示出了根据本公开的一个实施例的数据共享系统中区块生成的示意图;
图7示意性示出了根据本公开的一个实施例的通过基于知识图谱的语义推理方法进行对话数据分析的示意图;
图8示意性示出了根据本公开的一个实施例的基于知识图谱的语义推理方法对应的应用系统的示意图;
图9示意性示出了根据本公开的一个实施例的基于知识图谱的语义推理装置的示意框图;
图10示出了可以应用本公开实施例的一种基于知识图谱的语义推理方法的一种场景示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本公开实施例的一种基于知识图谱的语义推理方法及装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的基于知识图谱的语义推理方法一般由服务器105执行,相应地,基于知识图谱的语义推理装置一般设置于服务器105中。但本领域技术人员容易理解的是,本公开实施例所提供的基于知识图谱的语义推理方法也可以由终端设备101、102、103执行,相应的,基于知识图谱的语义推理装置也可以设置于终端设备101、102、103中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例中,可以是用户通过终端设备101、102、103将对话数据上传至服务器105,服务器通过本公开实施例所提供的基于知识图谱的语义推理方法将分析结果传输给终端设备101、102、103等。
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图2示出的电子设备的计算机系统200仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从存储部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统操作所需的各种程序和数据。CPU201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的存储部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入存储部分208。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本申请的方法和装置中限定的各种功能。在一些实施例中,计算机系统200还可以包括AI(ArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。例如,所述的电子设备可以实现如图3或图7所示的各个步骤等。
以下对本公开实施例的技术方案进行详细阐述:
知识图谱一般用于刻画实体和实体之间的关系,以及实体自身的属性。因为知识图谱的覆盖面广,而且实体间的关系精准,因此在搜索引擎中已经有广泛应用,例如“姚明的老婆的身高”,系统能够解析这句话的内容,并基于已有的知识图谱,通过知识推理系统,推理该句话对应的精确答案,然后直接返回给用户,而不像传统的模糊搜索会返回一堆候选答案或网页让用户浏览,从而极大地提高用户的检索效率和产品体验。但是传统的基于海量知识图谱的推理系统,面临实体关系复杂、查询逻辑复杂的问题,在实体以及查询逻辑非常复杂的前提下,需要花费大量的时间以及资源进行维护,而且在进行推理时需要大量的人工进行干预,如撰写模板、设置专家规则等,工作效率低下,而且得到的结果准确较低,降低了用户的使用体验。
基于上述一个或多个问题,本示例实施方式提供了一种基于知识图谱的语义推理方法。该基于知识图谱的语义推理方法可以应用于上述服务器105,也可以应用于上述终端设备101、102、103中的一个或多个,本示例性实施例中对此不做特殊限定。本示例实施例以服务器端描述该方法为例进行说明,参考图3所示,该基于知识图谱的语义推理方法可以包括以下步骤S310至步骤S330:
步骤S310、对预先采集的图谱数据进行解耦处理,确定所述图谱数据对应的关系组数据;
步骤S320、根据预训练的垂直领域分类模型对所述关系组数据进行分类,确定所述关系组数据对应的垂直领域知识图谱;
步骤S330、通过所述垂直领域知识图谱构建语义推理模型,以根据所述语义推理模型确定目标内容对应的语义数据。
在本示例实施方式所提供的基于知识图谱的语义推理方法中,一方面,将图谱数据解耦处理生成对应的关系组数据,并将关系组数据分类到对应的垂直领域知识图谱,能够将数据关系糅杂混乱的图谱数据整理分类到不同的垂直领域知识图谱,便于知识图谱的维护以及使用,其次在使用图谱数据时能够通过垂直领域知识图谱快速定位到需要的垂直领域,提高工作效率;另一方面,根据垂直领域知识图谱构建语义推理模型并根据语义推理模型推理目标内容对应的语义数据,在工作效率提升的同时,提高了分析结果的准确性,提高用户的使用体验。
下面,对于本示例实施方式的上述步骤进行更加详细的说明。
在步骤S310中,对预先采集的图谱数据进行解耦处理,确定所述图谱数据对应的关系组数据。
本公开的一个示例实施例中,图谱数据可以是指记载有知识数据间发展与结构关系的系列数据,例如图谱数据可以是知识图谱(Knowledge Graph),也可以是其他能够表征数据或者知识之间的结构关联关系的数据,本示例实施例对此不做特殊限定。解耦处理可以是指将图谱数据中知识数据之间的多方向关联关系进行分解得到单方向关联关系的处理过程。关系组数据可以是指将图谱数据进行解耦处理后生成的、表征知识数据的单方向关联关系的三元组,例如关系组数据可以是“某歌手,演唱,歌曲名称”,也可以是“某演员,出演,某影视剧名称”当然,关系组数据还可以是其他类型的图谱数据解耦得到的数据,此处仅是示意性说明,本示例实施例对此不做特殊限定。
在步骤S320中,根据预训练的垂直领域分类模型对所述关系组数据进行分类,确定所述关系组数据对应的垂直领域知识图谱。
本公开的一个示例实施例中,垂直领域分类模型可以是指预先训练的,能够对关系组数据进行垂直领域分类的模型,例如垂直领域分类模型可以是具有垂直领域分类功能的机器学习模型(如决策树模型等),也可以是具有垂直领域分类功能的深度学习模型(例如卷积神经网络模型等),当然,垂直领域分类模型还可以是其他能够进行垂直领域分类功能的模型,本示例实施例对此不做特殊限定。垂直领域数据可以是指图谱数据解耦得到的所有关系组数据对应的垂直领域的所有分类,例如假设关系组数据有“某歌手,演唱,歌曲名称”、“某演员,出演,某影视剧名称”两组,则将关系组数据“某歌手,演唱,歌曲名称”输入到垂直领域分类模型中,输出的垂直领域是“音乐领域”;而将关系组数据“某演员,出演,某影视剧名称”输入到垂直领域分类模型中,输出的垂直领域是“影视领域”,当然,此处仅是示意性说明,并不应对本示例实施例造成任何特殊限定。
进一步的,根据垂直领域数据以及所述垂直领域数据对应的关系组数据构建不同垂直领域数据对应的垂直领域知识图谱;以及将不同的垂直领域知识图谱上传到区块链进行存储。垂直领域知识图谱可以是指通过属于同一垂直领域的关系组数据及其对应的实体(schema)构成的知识图谱,例如垂直领域知识图谱可以是将关系组数据对应的实体“歌手,演唱,歌曲”存入到知识图谱中构建的音乐领域知识图谱,也可以是将关系组数据对应的实体“演员,出演,影视剧”存入到知识图谱中构建的影视领域知识图谱,当然,垂直领域知识图谱还可以是其他垂直领域对应的知识图谱,本示例实施例对此不做特殊限定。在构建不同垂直领域数据对应的垂直领域知识图谱后,将不同的垂直领域知识图谱上传到区块链进行存储。
参见图4所示的数据共享系统,数据共享系统400是指用于进行节点与节点之间数据共享的系统,该数据共享系统中可以包括多个节点401,多个节点401可以是指数据共享系统中各个客户端。每个节点401在进行正常工作可以接收到输入信息,并基于接收到的输入信息维护该数据共享系统内的共享数据。为了保证数据共享系统内的信息互通,数据共享系统中的每个节点之间可以存在信息连接,节点之间可以通过上述信息连接进行信息传输。例如,当数据共享系统中的任意节点接收到不同的垂直领域知识图谱时,数据共享系统中的其他节点便根据共识算法获取该垂直领域知识图谱,将该垂直领域知识图谱作为共享数据中的数据进行存储,使得数据共享系统中全部节点上存储的数据均一致。
对于数据共享系统中的每个节点,均具有与其对应的节点标识,而且数据共享系统中的每个节点均可以存储有数据共享系统中其他节点的节点标识,以便后续根据其他节点的节点标识,将生成的区块广播至数据共享系统中的其他节点。每个节点中可维护一个如下表所示的节点标识列表,将节点名称和节点标识对应存储至该节点标识列表中。其中,节点标识可为IP(Internet Protocol,网络之间互联的协议)地址以及其他任一种能够用于标识该节点的信息,表1中仅以IP地址为例进行说明。
表1节点标识
节点名称 节点标识
节点1 117.114.151.174
节点2 117.116.189.145
节点N 119.123.789.258
数据共享系统中的每个节点均存储一条相同的区块链。区块链由多个区块组成,参见图5所示,区块链由多个区块组成,创始块中包括区块头和区块主体,区块头中存储有输入信息特征值、版本号、时间戳和难度值,区块主体中存储有输入信息;创始块的下一区块以创始块为父区块,下一区块中同样包括区块头和区块主体,区块头中存储有当前区块的输入信息特征值、父区块的区块头特征值、版本号、时间戳和难度值,并以此类推,使得区块链中每个区块中存储的区块数据均与父区块中存储的区块数据存在关联,保证了区块中输入信息的安全性。
在生成区块链中的各个区块时,参见图6所示,区块链所在的节点在接收到输入信息时,对输入信息进行校验,完成校验后,将输入信息存储至内存池中,并更新其用于记录输入信息的哈希树;之后,将更新时间戳更新为接收到输入信息的时间,并尝试不同的随机数,多次进行特征值计算,使得计算得到的特征值可以满足下述公式(1):
其中,SHA256为计算特征值所用的特征值算法;version(版本号)为区块链中相关区块协议的版本信息;prev_hash为当前区块的父区块的区块头特征值;merkle_root为输入信息的特征值;ntime为更新时间戳的更新时间;nbits为当前难度,在一段时间内为定值,并在超出固定时间段后再次进行确定;x为随机数;TARGET为特征值阈值,该特征值阈值可以根据nbits确定得到。
这样,当计算得到满足上述公式(1)的随机数时,便可将信息对应存储,生成区块头和区块主体,得到当前区块。随后,区块链所在节点根据数据共享系统中其他节点的节点标识,将新生成的区块分别发送给其所在的数据共享系统中的其他节点,由其他节点对新生成的区块进行校验,并在完成校验后将新生成的区块添加至其存储的区块链中。
在步骤S330中,通过所述垂直领域知识图谱构建语义推理模型,以根据所述语义推理模型确定目标内容对应的语义数据。
本公开的一个示例实施例中,语义推理模型可以是指能够对用户输入的内容进行分析并输出回复的模型,语义推理模型可以由一个或者多个模型构成,例如语义推理模型可以包括垂直领域意图模型、垂直领域关系模型以及垂直领域实体填槽模型中的一种或多种,当然,本示例实施例对此不做特殊限定。目标内容可以是指通过语义推理模型进行推理分析的提问或者对话数据,例如目标内容可以是智能客服的应用场景中用户输入的文字信息,也可以是智能机器人的应用场景中用户输入的语音信息,当然,目标内容还可以是搜索引擎的应用场景中用户输入的查询信息,本示例实施例对此不做特殊限定。
可选的,获取预先设置的提问模型以及实体词典数据;根据不同垂直领域数据中的关系组数据以及提问模型、实体词典数据生成样本问题数据;通过样本问题数据对预构建的语义推理模型进行训练处理。提问模型可以是指能够根据关系组数据以及对应的实体生成不同的提问形式的模板,例如提问模型可以是“$(歌手)唱过什么$(歌曲)?”,关系组数据是“小明,演唱,某歌曲名称”,此时对“$(歌手)”赋值为“小明”,“$(歌曲)”赋值为“某歌曲名称”,此时可以构成一个完整对话“小明唱过什么歌曲?小明唱过某歌曲名称”,当然,此处仅是示意性说明,并不应对本示例实施例造成任何特殊限定。实体词典数据可以是指包含图谱数据中所有关联关系的知识数据对应的实体集合。样本问题数据可以是指通过关系组数据以及提问模型、实体词典数据生成的对话数据对,可以作为语义推理模型的训练样本数据,例如样本问题数据可以是“小明唱过什么歌曲?小明唱过某歌曲名称”,也可以是其他根据提问模型生成的对话数据对,本示例实施对此不做特殊限定。语义推理模型可以是指能够对用户输入的内容进行分析并输出回复的模型,语义推理模型可以包括垂直领域意图模型、垂直领域关系模型以及垂直领域实体填槽模型中的一种或多种。
具体的,通过样本问题数据对预构建的语义推理模型进行训练处理得到训练完成的语义推理模型,例如假设语义推理模型是垂直领域意图模型时,如果输入为“某歌手唱过什么歌曲”,垂直领域意图模型输出为“音乐领域知识图谱”,即识别出用户的对话数据提问的是音乐领域的问题;假设语义推理模型是垂直领域关系模型时,如果输入为“某歌手唱过什么歌曲”,垂直领域关系模型输出为“某歌手的歌曲”;假设语义推理模型是垂直领域实体填槽模型时,如果输入为“某歌手唱过什么歌曲”、“歌手={某,某歌,某歌手}”“歌曲={某歌,名称,某歌曲名称}”,输出为“歌手=某歌手,歌曲=某歌曲名称”,其中垂直领域实体填槽模型主要是为了进行实体消歧(如防止因为不同垂直领域的实体名称相同导致结果错误的问题)。当然,此处仅是对垂直领域意图模型、垂直领域关系模型以及垂直领域实体填槽模型的单独举例说明,实际使用中语义推理模型可以是垂直领域意图模型、垂直领域关系模型以及垂直领域实体填槽模型共同协作,本示例示例不以此为限。
参考图7所示,在本示例实施例的一个应用场景中,包括步骤S710至步骤S730。步骤S710,获取上传的对话数据,并对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域。
本公开的一个示例实施例中,对话数据可以是指用户在提供的区域内输入的提问或者搜索的内容,例如对话数据可以是用户在搜索引擎提供的搜索输入栏中输入的查询内容,也可以是用户在智能客服系统提供的对话输入栏中输入的文本聊天内容,当然,对话数据还可以是用户在智能机器人的语音输入处输入的语音数据,本示例实施例对此不做特殊限定。目标垂直领域可以是指对对话数据进行分类后,得到的对话数据的内容对应的垂直领域。
具体的,对对话数据进行分词处理以提取对话数据对应的实体数据;获取区块链中存储的垂直领域知识图谱,并根据实体数据以及垂直领域知识图谱对对话数据进行分类处理以确定所述对话数据对应的目标垂直领域。分词处理可以是指将对话数据中的内容分解成关键词的处理过程,例如分词处理可以是通过条件随机场模型对对话数据进行分词的过程,也可以是神经网络分词模型对对话数据进行分词的过程,当然,本示例实施例对此不做特殊限定。实体数据可以是指对对话数据进行分词处理后得到的关键词中的实体,例如对于对话数据“某歌手唱过什么歌曲”,其中“某歌手”、“歌曲”均是对话数据对应的实体数据,当然,此处仅是示意性说明,并不应对本示例实施例造成任何特殊限定。
步骤S720,通过所述目标垂直领域在所述垂直领域数据中匹配与所述对话数据对应的关系组数据。
本公开的一个示例实施例中,分析结果可以是指对话数据中的内容对应的询问意图、关系、实体等数据,例如将对话数据“某歌手唱过什么歌曲”以及对话数据对应的关系组数据“某歌手,唱过,某歌曲名称”输入到语义推理模型中,得到的分析结果可以是用户意图询问音乐领域的知识数据,具体的关系是“某歌手的歌曲”,得到的实体是“歌手=某歌手,歌曲=某歌曲名称”,当然,此处仅是示意性说明,并不应对本示例实施例造成任何特殊限定。
步骤S730,基于所述语义推理模型,通过所述关系组数据确定所述对话数据对应的语义数据。
本公开的一个示例实施例中,先通过目标垂直领域匹配与对话数据对应的垂直领域知识图谱,根据垂直领域知识图谱以及语义推理模型中的垂直领域关系模型确定对话数据在垂直领域知识图谱中对应的关系组数据,然后通过关系组数据以及垂直领域实体填槽模型在对话数据对应的垂直领域知识图谱中确定对话数据对应的语义数据。
具体的,通过目标垂直领域匹配与对话数据对应的垂直领域知识图谱,例如确定对话数据“某歌手唱过什么歌曲”的目标垂直领域为音乐领域,因此在垂直领域数据中匹配到音乐领域知识图谱。然后根据垂直领域知识图谱以及垂直领域关系模型确定对话数据在垂直领域知识图谱中对应的关系组数据以根据关系组数据确定所述对话数据对应的分析结果。例如将对话数据“某歌手唱过什么歌曲”输入到垂直领域关系模型中得到关系“某歌手的歌曲”,并根据关系“某歌手的歌曲”在音乐领域知识图谱中匹配到关系组数据“某歌手,演唱,某歌曲名称”,最后根据关系组数据以及语义推理模型得到的分析结果可以是用户意图询问音乐领域的知识数据,具体的关系是“某歌手的歌曲”,得到的实体是“歌手=某歌手,歌曲=某歌曲名称”,当然,此处仅是示意性说明,本示例实施例不以此为限。
进一步的,基于垂直领域实体填槽模型,根据关系组数据中的实体数据生成对话数据对应的检索模式;根据检索模式在对话数据对应的垂直领域知识图谱中确定对话数据对应的语义数据。检索模式可以是指将关系组数据中的实体数据输入到垂直领域实体填槽模型中得到的检索逻辑,例如假设对话数据是“某歌手唱过什么歌曲”,对应的检索模式(检索逻辑)是“查询‘某歌手’的歌曲”,根据该检索模式在音乐知识图谱中检索到的分析结果是“某歌手的某歌曲名称”,当然,此处仅是示意性说明,本示例实施例不以此为限。
可选的,根据语义数据生成与对话数据对应的回复数据并将回复数据返回。回复数据可以是指根据对话数据的内容生成的答复语句,例如对话数据是“某歌手唱过什么歌曲”时,根据本示例实施例中的基于知识图谱的语义推理方法对对话数据进行分析后得到的分析结果是“某歌手的某歌曲名称”,最后根据该分析结果生成回复数据“某歌手唱过某歌曲名称”,并将回复数据返回到对话数据上传的位置并呈现给用户。
参考图8所示,基于知识图谱的语义推理系统可以分为包括离线数据流801以及在线推理通道802两部分,离线数据流801通过预先构建好的数据或者模型服务于在线推理通道802。其中离线数据流801部分包括步骤S810至步骤S840,具体的,在步骤S810中,根据知识实体以及原始领域数据进行知识数据提取;在步骤S820中,根据得到的知识数据构建知识图谱;在步骤S830中,根据知识实体、原始领域数据、问法模板以及实体词典生成样本问题数据;在步骤S840中,根据生成的样本问题数据对垂直领域意图模型、垂直领域关系模型以及垂直领域实体填槽模型进行训练;其中在线推理通道802部分包括步骤S850至步骤S890,具体的,在步骤S850中,将用户上传的对话数据输入命名体识别模型(NER)以及将对话数据进行垂直领域分类;在步骤S860中,将命名体识别模型输出的、对话数据对应的实体以及对话数据对应的目标垂直领域输入到离线数据流801训练好的垂直领域实体填槽模型中进行实体槽填充;在步骤S870中,将对话数据进行垂直领域分类得到的目标垂直领域;在步骤S880中,将对话数据对应的目标垂直领域分别进行知识点匹配以及将对话数据以及其对应的目标垂直领域输入到离线数据流801训练好的垂直领域关系模型得到关系数据,最后根据知识点匹配的匹配结果以及关系数据生成对话数据的检索模式;在步骤S890中,根据对话数据的语义数据以及垂直领域知识图谱生成回复数据。
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
进一步的,本示例实施方式中,还提供了一种基于知识图谱的语义推理装置。该基于知识图谱的语义推理装置可以应用于一服务器或终端设备。参考图9所示,该基于知识图谱的语义推理装置900可以包括图谱解耦模块910、垂直领域知识图谱生成模块920以及语义推理模块930。
其中:
图谱解耦模块910用于对预先采集的图谱数据进行解耦处理,确定所述图谱数据对应的关系组数据;
垂直领域知识图谱生成模块920用于根据预训练的垂直领域分类模型对所述关系组数据进行分类,确定所述关系组数据对应的垂直领域知识图谱;
语义推理模块930用于通过所述垂直领域知识图谱构建语义推理模型,以根据所述语义推理模型确定目标内容对应的语义数据。
在本公开的一种示例性实施例中,所述基于知识图谱的语义推理装置900还包括对话数据语义推理模块,所述对话数据语义推理模块还包括:
对话数据分类单元,用于获取上传的对话数据,并对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域;
关系组数据匹配单元,用于通过所述目标垂直领域在所述垂直领域知识图谱中匹配与所述对话数据对应的关系组数据;
语义推理单元,用于基于所述语义推理模型,通过所述关系组数据确定所述对话数据对应的语义数据。
在本公开的一种示例性实施例中,所述基于知识图谱的语义推理装置900还包括语义推理模型训练单元,所述语义推理模型训练单元被配置为:
获取预先设置的提问模型以及实体词典数据;
根据不同所述垂直领域知识图谱中的所述关系组数据、所述提问模型、以及所述实体词典数据生成样本问题数据;
通过所述样本问题数据对预构建的语义推理模型进行训练处理;其中,所述语义推理模型包括垂直领域意图模型、垂直领域关系模型以及垂直领域实体填槽模型中的一种或多种。
在本公开的一种示例性实施例中,所述垂直领域知识图谱生成模块920还包括垂直领域知识图谱存储单元,所述垂直领域知识图谱存储单元被配置为:
将不同的所述垂直领域知识图谱上传到区块链进行存储。
在本公开的一种示例性实施例中,所述对话数据分类单元被配置为:
对所述对话数据进行分词处理以提取所述对话数据对应的实体数据;
获取区块链中存储的所述垂直领域知识图谱,并根据所述实体数据以及所述垂直领域知识图谱对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域。
在本公开的一种示例性实施例中,所述关系组数据匹配单元还包括:
垂直领域知识图谱匹配单元,用于通过所述目标垂直领域匹配与所述对话数据对应的所述垂直领域知识图谱;
关系组数据确定单元,用于根据所述垂直领域知识图谱以及所述垂直领域关系模型确定所述对话数据在所述垂直领域知识图谱中对应的关系组数据。
在本公开的一种示例性实施例中,所述基于知识图谱的语义推理装置900还包括语义数据确定单元,所述语义数据确定单元被配置为
基于所述垂直领域实体填槽模型,根据所述关系组数据中的实体数据生成所述对话数据对应的检索模式;
根据所述检索模式在所述对话数据对应的垂直领域知识图谱中确定所述对话数据对应的语义数据。
在本公开的一种示例性实施例中,所述基于知识图谱的语义推理装置900还包括回复数据返回单元,所述回复数据返回单元被配置为:
根据所述语义数据生成与所述对话数据对应的回复数据并将所述回复数据返回。
上述基于知识图谱的语义推理装置中各模块或单元的具体细节已经在对应的基于知识图谱的语义推理方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
参考图10所示,为本公开示例性实施例中所提供的基于知识图谱的语义推理方法的一种场景示意图,其中,基于知识图谱的语义推理装置具体可以运行在具备储存单元并安装有处理器而具有运算能力的服务器1005中;服务器1005可以为单台服务器、也可以为多个服务器组成的服务器集群、还可以是云服务器等。在步骤S1010中,图示中的终端可以接收用户1001输入的对话(查询)指令,例如用户1001通过搜索引擎1002在图形用户界面提供的搜索栏输入查询指令,或者用户1001通过移动终端1003上的智能客服对话系统输入对话指令,或者用户1001通过智能机器人1004的语音采集单元输入的语音对话指令;在步骤S1020中,图示中的终端能够基于对话(查询)指令获取目标内容(对话数据)并发送至服务器1005;在步骤S1030中,服务器1005基于预先训练的语义推理模型,通过步骤S1020中接收到的对话(查询)指令以及区块链端存储的垂直领域知识图谱确定对话(查询)指令对应的语义数据,以通过该语义数据在垂直领域知识图谱中检索对话(查询)指令对应的回复数据,并将该回复数据(搜索结果)返回到搜索引擎1002或者移动终端1003或者智能机器人1004,通过搜索引擎1002或者移动终端1003或者智能机器人1004的展示单元将回复数据(搜索结果)呈现给用户。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种基于知识图谱的语义推理方法,其特征在于,包括:
对预先采集的图谱数据进行解耦处理,确定所述图谱数据对应的关系组数据;其中,解藕处理是指将图谱数据中知识数据之间的多方向关联关系进行分解得到单方向关联关系的处理过程;关系组数据是指将图谱数据进行解藕处理后生成的、表征知识数据的单方向关联关系的三元组;
根据预训练的垂直领域分类模型对所述关系组数据进行分类,确定所述关系组数据对应的垂直领域知识图谱,垂直领域知识图谱是指通过属于同一垂直领域的关系组数据及关系组数据对应的实体构成的知识图谱;
通过所述垂直领域知识图谱构建语义推理模型;
获取上传的对话数据,并对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域;
通过所述目标垂直领域在所述垂直领域知识图谱中匹配与所述对话数据对应的关系组数据;
基于所述语义推理模型,通过所述关系组数据确定所述对话数据对应的语义数据。
2.根据权利要求1所述的基于知识图谱的语义推理方法,其特征在于,在通过所述垂直领域知识图谱构建语义推理模型之前,所述方法还包括:
获取预先设置的提问模型以及实体词典数据;其中,提问模型是指能够根据关系组数据以及对应的实体生成不同的提问形式的模板;实体词典数据是指包含图谱数据中所有关联关系的知识数据对应的实体集合;
根据不同所述垂直领域知识图谱中的所述关系组数据、所述提问模型、以及所述实体词典数据生成样本问题数据;
通过所述样本问题数据对预构建的语义推理模型进行训练处理;其中,所述语义推理模型包括垂直领域意图模型、垂直领域关系模型以及垂直领域实体填槽模型中的一种或多种;垂直领域意图模型为对所述样本问题数据进行意图分析的模型,垂直领域关系模型为对所述样本问题数据进行关系映射的模型,垂直领域实体填槽模型为对所述样本问题数据进行实体消歧的模型。
3.根据权利要求1所述的基于知识图谱的语义推理方法,其特征在于,根据预训练的垂直领域分类模型对所述关系组数据进行分类,确定所述关系组数据对应的垂直领域知识图谱,还包括:
将不同的所述垂直领域知识图谱上传到区块链进行存储。
4.根据权利要求1所述的基于知识图谱的语义推理方法,其特征在于,对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域,包括:
对所述对话数据进行分词处理以提取所述对话数据对应的实体数据;
获取区块链中存储的所述垂直领域知识图谱,并根据所述实体数据以及所述垂直领域知识图谱对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域。
5.根据权利要求1所述的基于知识图谱的语义推理方法,其特征在于,所述通过所述目标垂直领域在所述垂直领域知识图谱中匹配与所述对话数据对应的关系组数据,包括:
通过所述目标垂直领域匹配与所述对话数据对应的所述垂直领域知识图谱;
根据所述垂直领域知识图谱以及垂直领域关系模型确定所述对话数据在所述垂直领域知识图谱中对应的关系组数据;垂直领域关系模型为对所述对话数据进行关系映射的模型。
6.根据权利要求5所述的基于知识图谱的语义推理方法,其特征在于,在根据所述垂直领域知识图谱以及垂直领域关系模型确定所述对话数据在所述垂直领域知识图谱中对应的关系组数据之后,还包括:
基于垂直领域实体填槽模型,根据所述关系组数据中的实体数据生成所述对话数据对应的检索模式;垂直领域实体填槽模型为对所述对话数据进行实体消歧的模型;检索模式是指将关系组数据中的实体数据输入到垂直领域实体填槽模型中得到的检索逻辑;
根据所述检索模式在所述对话数据对应的垂直领域知识图谱中确定所述对话数据对应的语义数据。
7.根据权利要求1所述的基于知识图谱的语义推理方法,其特征在于,在基于所述语义推理模型,通过所述关系组数据确定所述对话数据对应的语义数据之后,所述方法还包括:
根据所述语义数据生成与所述对话数据对应的回复数据并将所述回复数据返回。
8.一种基于知识图谱的语义推理装置,其特征在于,包括:
图谱解耦模块,用于对预先采集的图谱数据进行解耦处理,确定所述图谱数据对应的关系组数据;其中,解藕处理是指将图谱数据中知识数据之间的多方向关联关系进行分解得到单方向关联关系的处理过程;关系组数据是指将图谱数据进行解藕处理后生成的、表征知识数据的单方向关联关系的三元组;
垂直领域知识图谱生成模块,用于根据预训练的垂直领域分类模型对所述关系组数据进行分类,确定所述关系组数据对应的垂直领域知识图谱;垂直领域知识图谱是指通过属于同一垂直领域的关系组数据及关系组数据对应的实体构成的知识图谱;
语义推理模块,用于通过所述垂直领域知识图谱构建语义推理模型,获取上传的对话数据,并对所述对话数据进行分类处理以确定所述对话数据对应的目标垂直领域;通过所述目标垂直领域在所述垂直领域知识图谱中匹配与所述对话数据对应的关系组数据;基于所述语义推理模型,通过所述关系组数据确定所述对话数据对应的语义数据。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
CN201910854946.7A 2019-09-10 2019-09-10 基于知识图谱的语义推理方法及装置、电子设备 Active CN110597992B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910854946.7A CN110597992B (zh) 2019-09-10 2019-09-10 基于知识图谱的语义推理方法及装置、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910854946.7A CN110597992B (zh) 2019-09-10 2019-09-10 基于知识图谱的语义推理方法及装置、电子设备

Publications (2)

Publication Number Publication Date
CN110597992A CN110597992A (zh) 2019-12-20
CN110597992B true CN110597992B (zh) 2023-08-29

Family

ID=68858627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910854946.7A Active CN110597992B (zh) 2019-09-10 2019-09-10 基于知识图谱的语义推理方法及装置、电子设备

Country Status (1)

Country Link
CN (1) CN110597992B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111221984B (zh) * 2020-01-15 2024-03-01 北京百度网讯科技有限公司 多模态内容处理方法、装置、设备及存储介质
CN111309879A (zh) * 2020-01-20 2020-06-19 北京文思海辉金信软件有限公司 基于知识图谱的人机训练场景构建方法和装置
CN111460096B (zh) * 2020-03-26 2023-12-22 北京金山安全软件有限公司 一种碎片文本的处理方法、装置及电子设备
CN111460168B (zh) * 2020-03-27 2021-06-22 西安交通大学 基于区块链分布式双重共识的知识图谱验证及更新方法
CN111984643A (zh) * 2020-06-29 2020-11-24 联想(北京)有限公司 一种知识图谱的构建方法、装置、知识图谱系统及设备
CN111858962B (zh) * 2020-07-27 2023-04-07 腾讯科技(成都)有限公司 数据处理方法、装置及计算机可读存储介质
CN111917861A (zh) * 2020-07-28 2020-11-10 广东工业大学 基于区块链和知识图谱的知识存储方法、系统及其应用
CN112818696A (zh) * 2020-07-28 2021-05-18 薛杨杨 基于深度学习大数据的信息处理方法、系统及区块链平台
CN113591457B (zh) * 2021-07-30 2023-10-24 平安科技(深圳)有限公司 文本纠错方法、装置、设备及存储介质
CN115051843A (zh) * 2022-06-06 2022-09-13 华北电力大学 基于kge的区块链威胁情报知识图谱推理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550190A (zh) * 2015-06-26 2016-05-04 许昌学院 面向知识图谱的跨媒体检索系统
CN107341215A (zh) * 2017-06-07 2017-11-10 北京航空航天大学 一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法
CN107977393A (zh) * 2017-05-22 2018-05-01 海南大学 一种面向5w问答的基于数据图谱、信息图谱、知识图谱和智慧图谱的推荐引擎设计方法
CN110096584A (zh) * 2019-05-14 2019-08-06 京东数字科技控股有限公司 一种应答方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550190A (zh) * 2015-06-26 2016-05-04 许昌学院 面向知识图谱的跨媒体检索系统
CN107977393A (zh) * 2017-05-22 2018-05-01 海南大学 一种面向5w问答的基于数据图谱、信息图谱、知识图谱和智慧图谱的推荐引擎设计方法
CN107341215A (zh) * 2017-06-07 2017-11-10 北京航空航天大学 一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法
CN110096584A (zh) * 2019-05-14 2019-08-06 京东数字科技控股有限公司 一种应答方法和装置

Also Published As

Publication number Publication date
CN110597992A (zh) 2019-12-20

Similar Documents

Publication Publication Date Title
CN110597992B (zh) 基于知识图谱的语义推理方法及装置、电子设备
CN110413732B (zh) 面向软件缺陷知识的知识搜索方法
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
CN109325040B (zh) 一种faq问答库泛化方法、装置及设备
CN106934068A (zh) 机器人基于环境上下文的语义理解的方法
CN109857846B (zh) 用户问句与知识点的匹配方法和装置
CN114418035A (zh) 决策树模型生成方法、基于决策树模型的数据推荐方法
Subramaniam et al. Cobots-a cognitive multi-bot conversational framework for technical support
CN110807566A (zh) 人工智能模型评测方法、装置、设备及存储介质
CN114332984B (zh) 训练数据处理方法、装置和存储介质
CN116737908A (zh) 知识问答方法、装置、设备和存储介质
CN111506729A (zh) 一种信息处理方法、装置及计算机可读存储介质
CN113821527A (zh) 哈希码的生成方法、装置、计算机设备及存储介质
CN114647713A (zh) 基于虚拟对抗的知识图谱问答方法、设备及存储介质
CN115803734A (zh) 使用动作解释的自然语言丰富
CN114357195A (zh) 基于知识图谱的问答对生成方法、装置、设备及介质
CN111368060B (zh) 对话机器人的自学习方法、装置、系统、电子设备及介质
CN116974626B (zh) 分析序列图生成方法、装置、设备和计算机可读存储介质
CN117010373A (zh) 一种电力设备资产管理数据所属类别和组的推荐方法
CN115757720A (zh) 基于知识图谱的项目信息搜索方法、装置、设备和介质
CN115186077A (zh) 一种槽位信息提取方法、装置、电子设备及存储介质
CN114461813A (zh) 一种基于知识图谱的数据推送方法、系统和存储介质
CN114528973A (zh) 业务处理模型的生成方法、业务处理方法和装置
CN113656545A (zh) 智能面试方法、装置、计算机设备及存储介质
CN113434658A (zh) 火电机组运行问答生成方法、系统、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant