CN110457484B - 一种基于图的逻辑表达方法、系统、介质和设备 - Google Patents

一种基于图的逻辑表达方法、系统、介质和设备 Download PDF

Info

Publication number
CN110457484B
CN110457484B CN201910558040.0A CN201910558040A CN110457484B CN 110457484 B CN110457484 B CN 110457484B CN 201910558040 A CN201910558040 A CN 201910558040A CN 110457484 B CN110457484 B CN 110457484B
Authority
CN
China
Prior art keywords
nodes
logic
graph
knowledge
logical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910558040.0A
Other languages
English (en)
Other versions
CN110457484A (zh
Inventor
彭德光
孙健
唐贤伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Zhaoguang Technology Co ltd
Original Assignee
Chongqing Zhaoguang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Zhaoguang Technology Co ltd filed Critical Chongqing Zhaoguang Technology Co ltd
Priority to CN201910558040.0A priority Critical patent/CN110457484B/zh
Publication of CN110457484A publication Critical patent/CN110457484A/zh
Application granted granted Critical
Publication of CN110457484B publication Critical patent/CN110457484B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Abstract

本发明提出一种基于图的逻辑表达方法、系统、介质和设备,包括创建语料库,提取所述语料库中的文本特征,构建知识图谱;根据所述知识图谱中的文本的约束条件,构造逻辑节点,并根据所述逻辑节点创建逻辑图谱;计算所述逻辑图谱中节点与所述知识图谱中对应节点的上下文关联度,将所述逻辑图谱与所述知识图谱进行耦合,构建问答要素网络;本发明增加逻辑图谱进行问答流程控制,可有效提高咨询效率。

Description

一种基于图的逻辑表达方法、系统、介质和设备
技术领域
本发明涉及自然语言处理领域,尤其涉及一种基于图的逻辑表达方法、系统、介质和设备。
背景技术
知识图谱是一种由实体以及实体关系组成的知识体系,通过将不同实体映射成不停节点,并将实体关系映射为节点的便,构建实体关系网络。这种基于图的数据结构组织实体机实体关系的方式,能够将不同种类的信息连接在一起,形成清晰地网络拓扑结构。随着信息化时代的发展,知识图谱以其强大的语义处理能力和开放组织能力,为互联网时代的信息化和智能化应用奠定了基础。
而传统的构建知识图谱的方法为将原始数据转化为结构化数据导入知识图谱。且大多只针对语义构造知识图谱节点,缺乏针对知识图谱问答流程的控制,无法快速有效地根据知识图谱获取想要信息。
发明内容
鉴于以上现有技术存在的问题,本发明提出一种基于图的逻辑表达方法、系统、介质和设备,主要解决传统知识图谱缺乏逻辑对话控制的问题。
为了实现上述目的及其他目的,本发明采用的技术方案如下。
一种基于图的逻辑表达方法,包括:
创建语料库,提取所述语料库中的文本特征,构建知识图谱;
根据所述知识图谱中的文本的约束条件,构造逻辑节点,并根据所述逻辑节点创建逻辑图谱;
计算所述逻辑图谱中节点与所述知识图谱中对应节点的上下文关联度,将所述逻辑图谱与所述知识图谱进行耦合,构建问答要素网络。
可选地,所述构建知识图谱包括:
计算所述语料库中的文本特征的语义相关度;
设置所述语料库中的文本特征为所述知识图谱的节点,并以计算得到的语义相关度作为对应节点的连接权重,建立节点间的连接关系,获取知识图谱。
可选地,所述创建逻辑图谱包括:
提取所述约束条件中的逻辑特征;
对所述逻辑特征进行分类,根据分类结果构造不同类型的逻辑节点,根据各所述逻辑节点的关系构造逻辑图谱。
可选地,构建问答要素网络包括:
将所述逻辑图谱中节点和所述知识图谱中节点对应的文本分别进行分词处理;
根据所述分词处理结果将词语转换成向量,分别获取逻辑词向量和知识词向量;
计算所述逻辑词向量和知识词向量的上下文关联度,并以最大的上下文关联度值作为对应的所述逻辑节点和所述知识节点的连接权重,将所述逻辑节点和所述知识节点耦合,获取问答要素网络。
可选地,所述逻辑节点包括语义节点、布尔节点、字符串节点和数值节点。
可选地,所述语料库中文本特征包括:语义信息、数字、日期、时间、称谓和地点。
可选地,还包括:
所述逻辑节点中语义节点包括询问文本特征、答复文本特征和节点间逻辑关系中的一种或多种;
所述逻辑节点中其它节点包括答复文本特征和节点间关系中的一种或多种。
一种基于图的逻辑表达系统,包括:
语料库;
知识图谱创建模块,用于提取所述语料库中文本特征,构建知识图谱;
逻辑图谱创建模块,用于根据所述知识图谱中文本的约束条件,构造逻辑节点,并根据所述逻辑节点创建逻辑图谱;
融合模块,用于计算所述逻辑图谱中节点与所述知识图谱中对应节点的上下文关联度,将所述逻辑图谱与所述知识图谱进行耦合,构建问答要素网络。
一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序被处理器加载执行时,实现基于图的逻辑表达方法。
一种设备,包括处理器和存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载并执行所述计算机程序,使得所述设备执行基于图的逻辑表达方法。
如上所述,本发明一种基于图的逻辑表达方法、系统、介质和设备,具有以下有益效果。
通过知识图谱中增加逻辑图谱,实现对话节点的跳转过程控制。
附图说明
图1为本发明一实施例中的基于图的逻辑表达方法的流程图。
图2为本发明一实施例中的基于图的逻辑表达系统的模块图。
图3为本发明一实施例中的设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
请参阅图1,本发明提供一种基于图的逻辑表达方法,包括步骤S01-S03。
在步骤S01中,创建语料库,提取语料库中的文本特征,构建知识图谱:
在一实施例中,创建语料库时,可根据不同的技术领域,收集对应领域相关技术文档,整理形成语料库。以法律领域为例,通过收集整理法律条例、法务论坛、相关法律论文期刊和杂志等信息,输入计算机数据库中,形成语料库。
对语料库进行文本特征提取时,可预先对语料库中文本进行分词、分句和分段处理,将文本划分成相对独立的词语、句子和段落。以分词处理为例,可采用基于字符串匹配的分词算法、基于知识理解的分词算法和基于统计的分词算法。这里不对具体的分词、分句、分段算法加以限制,分词、分句、分段均可采用现有的相应算法实现。
此外,还需要对语料库中文本进行标注,标注可采用人工标注或相应的设备进行软件批量标注。根据标注信息提取出语料库中的文本特征。在一实施例中,文本特征包括:语义信息、数字、日期、时间、称谓和地点。
在一实施例中,将前述分词、分句、分段得到的结果转换成文本向量,计算文本序列向量间的上下文关联度。可采用词嵌入和句嵌入的方式再通过构建向量范数距离或向量的余弦距离计算文本临近序列向量两两间的上下文关联度,向量关联度越高,文本特征的语义上下文关联度就越高。
根据计算得到的语义上下文关联度,将对应的文本特征作为知识图谱的节点,以语义上下文关联度的值作为对应两节点连接边的权重,建立节点间的连接关系,获取知识图谱。
在步骤S02中,根据知识图谱中的文本的约束条件,构造逻辑节点,并根据逻辑节点创建逻辑图谱;
约束条件可以针对具体的语料库进行设置,约束条件可以包括相关领域的调查文件,或相关领域的知识论坛中的问答知识文本。可以由相关领域专家设置约束条件,也可以通过软件从网络服务器端获取相关问卷,进行整理得到问答文本。
提取问答文本中的逻辑特征,逻辑特征包括逻辑关系、条件判断关系、算数运算关系等。将逻辑特征进行分类,根据分类结果构造不同类型的逻辑节点。逻辑节点间的逻辑关系类型包括布尔型、数值型、常识型,结论型。其中,常识型即确定为真的数据类型,结论型则表示需要根据最终结果进行判定的数据类型。根据不同的类型可以获取不同的逻辑节点,包括语义节点、布尔节点、字符串节点、数值节点。
可以根据各逻辑节点的逻辑关系、条件判断关系或算数关系构造逻辑节点的连接关系,获取逻辑图谱。其中语义节点可用于记录上下文语义,语义节点间的跳转的依据是语义节点间的布尔逻辑关系。完成跳转则表示语义逻辑关系为布尔真。语义节点包括询问文本特征、答复文本特征和节点间逻辑关系中的一种或多种。除语义节点外,逻辑图谱中的其他节点均不包含询问文本的特征。
布尔节点用于记录某一事件的真假,字符串节点用于记录某个上下文环境下的字符串元素,比如人称、地名等;数值节点用于记录与数值相关的上下文要素。
在步骤S03中,计算逻辑图谱中节点与知识图谱中对应节点的相似度,将逻辑图谱与知识图谱进行耦合,构建问答要素网络:
在获取到知识图谱和逻辑图谱后,将逻辑图谱加入到知识图谱中构建问答要素网络。具体地,将逻辑图谱中的节点所对应问答文本进行分词处理,可采用Hanlp分词算法,获取问答文本的词语。将问答文本的词语转换成逻辑词向量。可采用word2vec转换词向量。
将逻辑词向量与步骤S01中得到的对应节点的知识词向量进行上下文关联度比较。在一实施例中,关联度的计算可采用词嵌入模型和句嵌入模型计算法。以最大的上下文关联度值作为对应的逻辑节点和知识节点的连接权重。通过关联度沟壑的方式建立节点连接,组建问答要素网络。
根据建立的问答要素网络,对于语义的推理流程可表述为:
根据用户的语料,选取某一特征上下文关联度高的节点接入问答要素网络,获取与接入节点连接的下一级节点;
进行跳转时,可通过逻辑与或非运算与同级节点进行逻辑运算,获取该同级节点对应的下一级节点与接入节点的逻辑关系,进行节点选择;
同级节点涉及多种逻辑关系时,可结合逻辑与或非、算数加减乘除运算和逻辑条件判断,对跳转到下一级的节点进行筛选。
根据本发明的实施例,还提供了一种计算机存储介质,存储介质中存储有计算机程序,该计算机程序执行时可以实现前述的语义分析识别方法。计算机存储介质可以包括计算机存储的任何可用介质或者包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质包括磁性介质(如:软盘、硬盘、磁带)、光介质(如:DVD)、半导体介质(如:固态硬盘)等。
请参阅图2,本实施例提供一种语义分析识别系统,用于执行前述方法实施例中所述的语义分析识别方法。由于系统实施例的技术原理与前述方法实施例的技术原理相似,因而不再对同样的技术细节做重复性赘述。
在一实施例中,语义分析识别系统包括语料库10、知识图谱创建模块11、逻辑图谱创建模块12和融合模块13;语料库10和知识图谱创建模块11用于辅助执行执行前述方法实施例介绍的步骤S01,逻辑图谱创建模块12用于执行前述方法实施例介绍的步骤S02,融合模块13用于执行前述方法实施例中的步骤S03。
请参阅图3,本实施例提供一种设备,设备可以是台式机、便携式电脑等,具体地,设备至少包括处理器20和存储器21。
处理器20用于执行前述方法实施例中的全部或部分步骤。处理器20可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
综上所述,本发明一种基于图的逻辑表达方法、系统、介质和设备,通过将逻辑图谱加入知识图谱,可针根据语义逻辑对问答流程进行控制,简化问答流程的同时提高咨询的效率;设计节点的逻辑跳转规则,可有效第对节点进行筛选提高算法的处理效率;通过上下文关联度计算比较设置节点连接边的权重,可通过不断输入新的文本进行节点更新,提升算法的泛化能力。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (7)

1.一种基于图的逻辑表达方法,其特征在于,包括:
创建语料库,提取所述语料库中的文本特征,构建知识图谱;
根据所述知识图谱中的文本的约束条件,构造逻辑节点,并根据所述逻辑节点创建逻辑图谱,所述创建逻辑图谱包括:提取所述约束条件中的逻辑特征;对所述逻辑特征进行分类,根据分类结果构造不同类型的逻辑节点,根据各所述逻辑节点的关系构造逻辑图谱,其中,所述逻辑节点包括语义节点、布尔节点、字符串节点和数值节点;所述逻辑节点中语义节点包括询问文本特征、答复文本特征和节点间逻辑关系中的一种或多种;所述逻辑节点中其它节点包括答复文本特征和节点间关系中的一种或多种;
计算所述逻辑图谱中节点与所述知识图谱中对应节点的上下文关联度,将所述逻辑图谱与所述知识图谱进行耦合,构建问答要素网络。
2.根据权利要求1所述的基于图的逻辑表达方法,其特征在于,所述构建知识图谱包括:
计算所述语料库中文本特征的语义相关度;
设置所述语料库中文本特征为所述知识图谱的节点,并以计算得到的语义相关度作为对应节点的连接权重,建立节点间的连接关系,获取知识图谱。
3.根据权利要求1所述的基于图的逻辑表达方法,其特征在于,构建问答要素网络包括:
将所述逻辑图谱中节点和所述知识图谱中节点对应的文本分别进行分词处理;
根据所述分词处理结果将词语转换成向量,分别获取逻辑词向量和知识词向量;
计算所述逻辑词向量和知识词向量的上下文关联度,并以最大的上下文关联度值作为对应的所述逻辑节点和知识节点的连接权重,将所述逻辑节点和所述知识节点耦合,获取问答要素网络。
4.根据权利要求1所述的基于图的逻辑表达方法,其特征在于,所述语料库中文本特征包括:语义信息、数字、日期、时间、称谓和地点。
5.一种基于图的逻辑表达系统,其特征在于,包括:
语料库;
知识图谱创建模块,用于提取所述语料库中文本特征,构建知识图谱;
逻辑图谱创建模块,用于根据所述知识图谱中文本的约束条件,构造逻辑节点,并根据所述逻辑节点创建逻辑图谱,所述创建逻辑图谱包括:提取所述约束条件中的逻辑特征;对所述逻辑特征进行分类,根据分类结果构造不同类型的逻辑节点,根据各所述逻辑节点的关系构造逻辑图谱,其中,所述逻辑节点包括语义节点、布尔节点、字符串节点和数值节点;所述逻辑节点中语义节点包括询问文本特征、答复文本特征和节点间逻辑关系中的一种或多种;所述逻辑节点中其它节点包括答复文本特征和节点间关系中的一种或多种;
融合模块,用于计算所述逻辑图谱中节点与所述知识图谱中对应节点的上下文关联度,将所述逻辑图谱与所述知识图谱进行耦合,构建问答要素网络。
6.一种计算机可读存储介质,其中存储有计算机程序,其特征在于,所述计算机程序被处理器加载执行时,实现权利要求1至4任一所述的方法。
7.一种计算机设备,其特征在于,包括处理器和存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载并执行所述计算机程序,使得所述设备执行权利要求1至4中任一所述的方法。
CN201910558040.0A 2019-06-26 2019-06-26 一种基于图的逻辑表达方法、系统、介质和设备 Active CN110457484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910558040.0A CN110457484B (zh) 2019-06-26 2019-06-26 一种基于图的逻辑表达方法、系统、介质和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910558040.0A CN110457484B (zh) 2019-06-26 2019-06-26 一种基于图的逻辑表达方法、系统、介质和设备

Publications (2)

Publication Number Publication Date
CN110457484A CN110457484A (zh) 2019-11-15
CN110457484B true CN110457484B (zh) 2022-02-22

Family

ID=68481083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910558040.0A Active CN110457484B (zh) 2019-06-26 2019-06-26 一种基于图的逻辑表达方法、系统、介质和设备

Country Status (1)

Country Link
CN (1) CN110457484B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111177345B (zh) * 2019-12-19 2023-06-20 中国平安财产保险股份有限公司 基于知识图谱的智能问答方法、装置和计算机设备
CN111125352B (zh) * 2019-12-23 2023-05-16 同方知网数字出版技术股份有限公司 一种基于知识图谱的关联数据可视化数据驾驶舱构建方法
CN114172793B (zh) * 2020-08-21 2023-04-04 华为技术有限公司 一种网络配置知识图谱构建方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447346A (zh) * 2016-08-29 2017-02-22 北京中电普华信息技术有限公司 一种智能电力客服系统的构建方法及系统
CN107729493A (zh) * 2017-09-29 2018-02-23 北京创鑫旅程网络技术有限公司 旅行知识图谱的构建方法、装置及旅行问答方法、装置
CN109670024A (zh) * 2018-12-17 2019-04-23 北京百度网讯科技有限公司 逻辑表达式确定方法、装置、设备和介质
CN109684448A (zh) * 2018-12-17 2019-04-26 北京北大软件工程股份有限公司 一种智能问答方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100020862A1 (en) * 2008-07-25 2010-01-28 Taiwan Semiconductor Manufacturing Co., Ltd. Input control circuit for the summer of a decision feedback equalizer
US9135240B2 (en) * 2013-02-12 2015-09-15 International Business Machines Corporation Latent semantic analysis for application in a question answer system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447346A (zh) * 2016-08-29 2017-02-22 北京中电普华信息技术有限公司 一种智能电力客服系统的构建方法及系统
CN107729493A (zh) * 2017-09-29 2018-02-23 北京创鑫旅程网络技术有限公司 旅行知识图谱的构建方法、装置及旅行问答方法、装置
CN109670024A (zh) * 2018-12-17 2019-04-23 北京百度网讯科技有限公司 逻辑表达式确定方法、装置、设备和介质
CN109684448A (zh) * 2018-12-17 2019-04-26 北京北大软件工程股份有限公司 一种智能问答方法

Also Published As

Publication number Publication date
CN110457484A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
Berkovich et al. On clusterization of" big data" streams
CN110457484B (zh) 一种基于图的逻辑表达方法、系统、介质和设备
CN111753198A (zh) 信息推荐方法和装置、以及电子设备和可读存储介质
CA2515007A1 (en) System and method for semantic software analysis
JP5881048B2 (ja) 情報処理システム、及び、情報処理方法
Gargiulo et al. A deep learning approach for scientific paper semantic ranking
Bharadwaj et al. Development of a pilot manufacturing cyberinfrastructure with an information rich mechanical CAD 3D model repository
Altmeyer et al. Reuse of design objects in CAD frameworks
Budikova et al. ConceptRank for search-based image annotation
Wu et al. An empirical approach for semantic web services discovery
Sunuwar et al. Comparative Analysis of Relational and Graph Databases for Data Provenance: Performance, Queries, and Security Considerations
Hussain et al. A methodology to rank the design patterns on the base of text relevancy
Sangeetha et al. Information retrieval system for laws
CN110457455B (zh) 一种三值逻辑问答咨询优化方法、系统、介质和设备
Rad et al. A multi-view-group non-negative matrix factorization approach for automatic image annotation
EP4185966A1 (en) Generating a knowledge base from mathematical formulae in technical documents
Bender et al. Unsupervised Estimation of Subjective Content Descriptions in an Information System
Reese et al. Java: Data science made easy
JP2008165572A (ja) データ分類装置、データ分類プログラム
CN110688446B (zh) 一种句义数学空间表示方法、系统、介质和设备
Yadav et al. Enhancing the performance of web Focused CRAWLer using ontology
Piech et al. Implementation of the Concept of a Repository for Automated Processing of Semi-Structural Data
Sonawane et al. NLP and IR Applications Using Graph Theory
Gupta Apache Mahout Clustering Designs
Grošup Multi-model approach for effective multimedia exploration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 400000 6-1, 6-2, 6-3, 6-4, building 7, No. 50, Shuangxing Avenue, Biquan street, Bishan District, Chongqing

Applicant after: CHONGQING ZHAOGUANG TECHNOLOGY CO.,LTD.

Address before: 400000 2-2-1, 109 Fengtian Avenue, tianxingqiao, Shapingba District, Chongqing

Applicant before: CHONGQING ZHAOGUANG TECHNOLOGY CO.,LTD.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Graph based Logical Representation Method, System, Media and Equipment

Effective date of registration: 20221115

Granted publication date: 20220222

Pledgee: Bishan sub branch of Chongqing Three Gorges Bank Co.,Ltd.

Pledgor: CHONGQING ZHAOGUANG TECHNOLOGY CO.,LTD.

Registration number: Y2022980021313

PE01 Entry into force of the registration of the contract for pledge of patent right