发明内容
鉴于以上现有技术存在的问题,本发明提出一种基于图的逻辑表达方法、系统、介质和设备,主要解决传统知识图谱缺乏逻辑对话控制的问题。
为了实现上述目的及其他目的,本发明采用的技术方案如下。
一种基于图的逻辑表达方法,包括:
创建语料库,提取所述语料库中的文本特征,构建知识图谱;
根据所述知识图谱中的文本的约束条件,构造逻辑节点,并根据所述逻辑节点创建逻辑图谱;
计算所述逻辑图谱中节点与所述知识图谱中对应节点的上下文关联度,将所述逻辑图谱与所述知识图谱进行耦合,构建问答要素网络。
可选地,所述构建知识图谱包括:
计算所述语料库中的文本特征的语义相关度;
设置所述语料库中的文本特征为所述知识图谱的节点,并以计算得到的语义相关度作为对应节点的连接权重,建立节点间的连接关系,获取知识图谱。
可选地,所述创建逻辑图谱包括:
提取所述约束条件中的逻辑特征;
对所述逻辑特征进行分类,根据分类结果构造不同类型的逻辑节点,根据各所述逻辑节点的关系构造逻辑图谱。
可选地,构建问答要素网络包括:
将所述逻辑图谱中节点和所述知识图谱中节点对应的文本分别进行分词处理;
根据所述分词处理结果将词语转换成向量,分别获取逻辑词向量和知识词向量;
计算所述逻辑词向量和知识词向量的上下文关联度,并以最大的上下文关联度值作为对应的所述逻辑节点和所述知识节点的连接权重,将所述逻辑节点和所述知识节点耦合,获取问答要素网络。
可选地,所述逻辑节点包括语义节点、布尔节点、字符串节点和数值节点。
可选地,所述语料库中文本特征包括:语义信息、数字、日期、时间、称谓和地点。
可选地,还包括:
所述逻辑节点中语义节点包括询问文本特征、答复文本特征和节点间逻辑关系中的一种或多种;
所述逻辑节点中其它节点包括答复文本特征和节点间关系中的一种或多种。
一种基于图的逻辑表达系统,包括:
语料库;
知识图谱创建模块,用于提取所述语料库中文本特征,构建知识图谱;
逻辑图谱创建模块,用于根据所述知识图谱中文本的约束条件,构造逻辑节点,并根据所述逻辑节点创建逻辑图谱;
融合模块,用于计算所述逻辑图谱中节点与所述知识图谱中对应节点的上下文关联度,将所述逻辑图谱与所述知识图谱进行耦合,构建问答要素网络。
一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序被处理器加载执行时,实现基于图的逻辑表达方法。
一种设备,包括处理器和存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载并执行所述计算机程序,使得所述设备执行基于图的逻辑表达方法。
如上所述,本发明一种基于图的逻辑表达方法、系统、介质和设备,具有以下有益效果。
通过知识图谱中增加逻辑图谱,实现对话节点的跳转过程控制。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
请参阅图1,本发明提供一种基于图的逻辑表达方法,包括步骤S01-S03。
在步骤S01中,创建语料库,提取语料库中的文本特征,构建知识图谱:
在一实施例中,创建语料库时,可根据不同的技术领域,收集对应领域相关技术文档,整理形成语料库。以法律领域为例,通过收集整理法律条例、法务论坛、相关法律论文期刊和杂志等信息,输入计算机数据库中,形成语料库。
对语料库进行文本特征提取时,可预先对语料库中文本进行分词、分句和分段处理,将文本划分成相对独立的词语、句子和段落。以分词处理为例,可采用基于字符串匹配的分词算法、基于知识理解的分词算法和基于统计的分词算法。这里不对具体的分词、分句、分段算法加以限制,分词、分句、分段均可采用现有的相应算法实现。
此外,还需要对语料库中文本进行标注,标注可采用人工标注或相应的设备进行软件批量标注。根据标注信息提取出语料库中的文本特征。在一实施例中,文本特征包括:语义信息、数字、日期、时间、称谓和地点。
在一实施例中,将前述分词、分句、分段得到的结果转换成文本向量,计算文本序列向量间的上下文关联度。可采用词嵌入和句嵌入的方式再通过构建向量范数距离或向量的余弦距离计算文本临近序列向量两两间的上下文关联度,向量关联度越高,文本特征的语义上下文关联度就越高。
根据计算得到的语义上下文关联度,将对应的文本特征作为知识图谱的节点,以语义上下文关联度的值作为对应两节点连接边的权重,建立节点间的连接关系,获取知识图谱。
在步骤S02中,根据知识图谱中的文本的约束条件,构造逻辑节点,并根据逻辑节点创建逻辑图谱;
约束条件可以针对具体的语料库进行设置,约束条件可以包括相关领域的调查文件,或相关领域的知识论坛中的问答知识文本。可以由相关领域专家设置约束条件,也可以通过软件从网络服务器端获取相关问卷,进行整理得到问答文本。
提取问答文本中的逻辑特征,逻辑特征包括逻辑关系、条件判断关系、算数运算关系等。将逻辑特征进行分类,根据分类结果构造不同类型的逻辑节点。逻辑节点间的逻辑关系类型包括布尔型、数值型、常识型,结论型。其中,常识型即确定为真的数据类型,结论型则表示需要根据最终结果进行判定的数据类型。根据不同的类型可以获取不同的逻辑节点,包括语义节点、布尔节点、字符串节点、数值节点。
可以根据各逻辑节点的逻辑关系、条件判断关系或算数关系构造逻辑节点的连接关系,获取逻辑图谱。其中语义节点可用于记录上下文语义,语义节点间的跳转的依据是语义节点间的布尔逻辑关系。完成跳转则表示语义逻辑关系为布尔真。语义节点包括询问文本特征、答复文本特征和节点间逻辑关系中的一种或多种。除语义节点外,逻辑图谱中的其他节点均不包含询问文本的特征。
布尔节点用于记录某一事件的真假,字符串节点用于记录某个上下文环境下的字符串元素,比如人称、地名等;数值节点用于记录与数值相关的上下文要素。
在步骤S03中,计算逻辑图谱中节点与知识图谱中对应节点的相似度,将逻辑图谱与知识图谱进行耦合,构建问答要素网络:
在获取到知识图谱和逻辑图谱后,将逻辑图谱加入到知识图谱中构建问答要素网络。具体地,将逻辑图谱中的节点所对应问答文本进行分词处理,可采用Hanlp分词算法,获取问答文本的词语。将问答文本的词语转换成逻辑词向量。可采用word2vec转换词向量。
将逻辑词向量与步骤S01中得到的对应节点的知识词向量进行上下文关联度比较。在一实施例中,关联度的计算可采用词嵌入模型和句嵌入模型计算法。以最大的上下文关联度值作为对应的逻辑节点和知识节点的连接权重。通过关联度沟壑的方式建立节点连接,组建问答要素网络。
根据建立的问答要素网络,对于语义的推理流程可表述为:
根据用户的语料,选取某一特征上下文关联度高的节点接入问答要素网络,获取与接入节点连接的下一级节点;
进行跳转时,可通过逻辑与或非运算与同级节点进行逻辑运算,获取该同级节点对应的下一级节点与接入节点的逻辑关系,进行节点选择;
同级节点涉及多种逻辑关系时,可结合逻辑与或非、算数加减乘除运算和逻辑条件判断,对跳转到下一级的节点进行筛选。
根据本发明的实施例,还提供了一种计算机存储介质,存储介质中存储有计算机程序,该计算机程序执行时可以实现前述的语义分析识别方法。计算机存储介质可以包括计算机存储的任何可用介质或者包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质包括磁性介质(如:软盘、硬盘、磁带)、光介质(如:DVD)、半导体介质(如:固态硬盘)等。
请参阅图2,本实施例提供一种语义分析识别系统,用于执行前述方法实施例中所述的语义分析识别方法。由于系统实施例的技术原理与前述方法实施例的技术原理相似,因而不再对同样的技术细节做重复性赘述。
在一实施例中,语义分析识别系统包括语料库10、知识图谱创建模块11、逻辑图谱创建模块12和融合模块13;语料库10和知识图谱创建模块11用于辅助执行执行前述方法实施例介绍的步骤S01,逻辑图谱创建模块12用于执行前述方法实施例介绍的步骤S02,融合模块13用于执行前述方法实施例中的步骤S03。
请参阅图3,本实施例提供一种设备,设备可以是台式机、便携式电脑等,具体地,设备至少包括处理器20和存储器21。
处理器20用于执行前述方法实施例中的全部或部分步骤。处理器20可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
综上所述,本发明一种基于图的逻辑表达方法、系统、介质和设备,通过将逻辑图谱加入知识图谱,可针根据语义逻辑对问答流程进行控制,简化问答流程的同时提高咨询的效率;设计节点的逻辑跳转规则,可有效第对节点进行筛选提高算法的处理效率;通过上下文关联度计算比较设置节点连接边的权重,可通过不断输入新的文本进行节点更新,提升算法的泛化能力。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。