CN112819164A - 事理图谱的推理方法、装置及计算机设备 - Google Patents
事理图谱的推理方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN112819164A CN112819164A CN202110145802.1A CN202110145802A CN112819164A CN 112819164 A CN112819164 A CN 112819164A CN 202110145802 A CN202110145802 A CN 202110145802A CN 112819164 A CN112819164 A CN 112819164A
- Authority
- CN
- China
- Prior art keywords
- event
- sample
- events
- layer
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000013598 vector Substances 0.000 claims abstract description 106
- 238000012549 training Methods 0.000 claims description 32
- 238000010276 construction Methods 0.000 claims 2
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- APTZNLHMIGJTEW-UHFFFAOYSA-N pyraflufen-ethyl Chemical compound C1=C(Cl)C(OCC(=O)OCC)=CC(C=2C(=C(OC(F)F)N(C)N=2)Cl)=C1F APTZNLHMIGJTEW-UHFFFAOYSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000004399 eye closure Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/045—Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stored Programmes (AREA)
Abstract
本申请提出一种事理图谱的推理方法、装置及计算机设备,其中方法包括:获取事理图谱中待推理的事件对;获取事件对中各个事件对应的向量;根据事件对中各个事件对应的向量,确定各个事件之间的逻辑关系,从而能够结合事理图谱中各个事件对应的向量,来推理各个事件之间的逻辑关系,适用性好,推理效率高。
Description
技术领域
本申请涉及信息处理技术领域,尤其涉及一种事理图谱的推理方法、装置及计算机设备。
背景技术
事理图谱,是指描绘事件之间推理逻辑的知识图谱,其研究对象是谓词性事件及其内外联系,例如打雷要下雨,下雨要打伞等,主要是基于过往事件发生的结果,进一步归纳预测未来的事件。而通常意义上的知识图谱,描述的名词性实体及其属性、关系,为静态的知识。
相关技术中,针对通常意义上的知识图谱,该知识图谱的推理方法主要有实体推理。实体推理,为基于符号逻辑的推理,也就是说,获取知识图谱中实体的描述逻辑,结合多个实体的描述逻辑,来确定多个实体之间的关系。例如,实体“谷歌”的类型为“人工智能公司”,实体“人工智能公司”的类型为“高科技公司”,则推理得到,实体“谷歌”的类型为“高科技公司”。
上述推理方法,仅支持预定义的实体公理上的推理,仅支持对预定义的实体进行推理,难以适用于事件之间逻辑关系的推理,适用性差,推理效率差。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
本申请提出一种事理图谱的推理方法、装置及计算机设备,以实现对事理图谱中事件之间逻辑关系的推理,推理效率高。
本申请第一方面实施例提出了一种事理图谱的推理方法,包括:
获取事理图谱中待推理的事件对;
获取所述事件对中各个事件对应的向量;
根据所述事件对中各个事件对应的向量,确定所述各个事件之间的逻辑关系。
本申请实施例的事理图谱的推理方法,通过获取事理图谱中待推理的事件对;获取事件对中各个事件对应的向量;根据事件对中各个事件对应的向量,确定各个事件之间的逻辑关系,从而能够结合事理图谱中各个事件对应的向量,来推理各个事件之间的逻辑关系,适用性好,推理效率高。
本申请第二方面实施例提出了一种事理图谱的推理装置,包括:
获取模块,用于获取事理图谱中待推理的事件对;
所述获取模块,还用于获取所述事件对中各个事件对应的向量;
确定模块,用于根据所述事件对中各个事件对应的向量,确定所述各个事件之间的逻辑关系。
本申请实施例的事理图谱的推理装置,通过获取事理图谱中待推理的事件对;获取事件对中各个事件对应的向量;根据事件对中各个事件对应的向量,确定各个事件之间的逻辑关系,从而能够结合事理图谱中各个事件对应的向量,来推理各个事件之间的逻辑关系,适用性好,推理效率高。
本申请第三方面实施例提出了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本申请第一方面实施例提出的事理图谱的推理方法。
本申请第四方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行本申请第一方面实施例提出的事理图谱的推理方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例一所提供的事理图谱的推理方法的流程示意图;
图2为本申请实施例二所提供的事理图谱的推理方法的流程示意图;
图3为推理模型推理两个事件之间的逻辑关系的示意图;
图4为本申请实施例三所提供的事理图谱的推理装置的结构示意图;
图5为本申请实施例四所提供的事理图谱的推理装置的结构示意图;
图6示出了适于用来实现本申请实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
传统的实体推理方法,需要结合多个实体的描述逻辑、预定义的实体公理以及预定义的实体,来确定多个实体之间的关系,难以适用于事件之间逻辑关系的推理,适用性差,推理效率差。
因此,本申请主要针对现有技术中适用性差,推理效率差的技术问题,提出一种事理图谱的推理方法。
本申请实施例的事理图谱的推理方法,通过获取事理图谱中待推理的事件对;获取事件对中各个事件对应的向量;根据事件对中各个事件对应的向量,确定各个事件之间的逻辑关系,从而能够结合事理图谱中各个事件对应的向量,来推理各个事件之间的逻辑关系,适用性好,推理效率高。
下面参考附图描述本申请实施例的事理图谱的推理方法、装置及计算机设备。
图1为本申请实施例一所提供的事理图谱的推理方法的流程示意图。
本申请实施例以该事理图谱的推理方法被配置于事理图谱的推理装置中来举例说明,该事理图谱的推理装置可以应用于任一计算机设备中,以使该计算机设备可以执行事理图谱的推理功能。
其中,计算机设备可以为个人电脑(Personal Computer,简称PC)、云端设备、移动设备等,移动设备例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
如图1所示,该事理图谱的推理方法可以包括以下步骤:
步骤101,获取事理图谱中待推理的事件对。
本申请实施例中,事理图谱,为包括事件以及事件之间的逻辑关系的图谱。其中,事件例如“公司估值上行”、“公司财产险估值上行”等。事件之间的逻辑关系,例如因果关系、条件关系、反转关系、顺承关系、上下位关系、组成关系和并发关系等。
以事件A和事件B为例,因果关系指的是事件A导致事件B发生,例如,事件“地震”导致事件“房屋倒塌”。条件关系指的是事件B在事件A发生的条件下发生,例如事件“限制放宽”发生的条件下,事件“立即增产”发生。反转关系指的是事件A和事件B形成对立,例如虽然事件“起步晚”,但是事件“发展快”。
顺承关系指的是事件B紧接着事件A发生,例如事件“去旅游”之后接着事件“买火车票”。上下位关系指的是事件A是事件B的上位事件或者下位事件,例如事件“地震”是事件“地质灾害”的下位事件。组成关系指的是事件A是事件B的组成部分,例如事件“灭火”是事件“火灾救援”的组成部分。并发关系指的是事件A与事件B同时发生,例如事件“睡觉”和事件“闭眼”同时发生。
本申请实施例中,事理图谱中待推理的事件对,为事理图谱中需要进行逻辑关系推理的两个事件组成的事件对。
步骤102,获取事件对中各个事件对应的向量。
本申请实施例中,事理图谱的推理装置执行步骤102的过程例如可以为,针对事件对中的每个事件,获取事件中的各个论元;将各个论元输入推理模型的语义表示层,以获取各个论元对应的向量;以及将事件以及各个论元对应的向量输入所述推理模型的图向量层,以获取事件对应的向量。
本申请实施例中,事件中的各个论元,指的是事件所涉及的实体。以事件“公司估值上行”为例,其中所涉及的实体包括:公司和估值。
本申请实施例中,语义表示层可以为经过预训练的语义表示层,经过预训练的语义表示层,可以学习到论元原有的语义信息以及外部知识,从而能够结合更多的知识来推理事件之间的逻辑关系。
本申请实施例中,图向量层能够获取图结构的向量,而本申请中,事件与各个论元是可以形成图结构,从而图向量层能够结合事件以及各个论元,准确获取到事件对应的向量。其中,事件对应的向量能够表征各个论元原有的语义信息以及外部知识,还能够表征各个论元与事件之间的关系,从而基于事件对应的向量,能够准确的推理事件之间的逻辑关系。
步骤103,根据事件对中各个事件对应的向量,确定各个事件之间的逻辑关系。
本申请实施例中,事理图谱的推理装置执行步骤103的过程例如可以为,对事件对中各个事件对应的向量进行拼接,得到事件对对应的向量;将事件对对应的向量输入推理模型中依次排列的注意力层和多层感知机,以获取各个事件之间的逻辑关系。
本申请实施例中,需要说明的是,注意力层和多层感知机,结合事件对对应的向量,获取事件对中各个向量之间具有各种逻辑关系的概率,将最大概率对应的逻辑关系,作为各个事件之间的逻辑关系,因此,能够获取到各个事件之间具有逻辑关系的概率。因此,事理图谱的推理装置在确定各个事件之间的逻辑关系之后,还可以获取各个事件之间具有逻辑关系的概率;在概率大于等于预设的概率阈值时,将各个事件之间的逻辑关系,更新到事理图谱中;在概率小于预设的概率阈值时,不做更新处理。
本申请实施例的事理图谱的推理方法,通过获取事理图谱中待推理的事件对;获取事件对中各个事件对应的向量;根据事件对中各个事件对应的向量,确定各个事件之间的逻辑关系,从而能够结合事理图谱中各个事件对应的向量,来推理各个事件之间的逻辑关系,适用性好,推理效率高。
图2为本申请实施例二所提供的事理图谱的推理方法的流程示意图。如图2所示,在图1所示实施例的基础上,步骤102之前,该事理图谱的推理方法还可以包括以下步骤:
步骤201,构建初始的推理模型,其中,初始的推理模型包括:依次连接的语义表示层、图向量层、注意力层和多层感知机;语义表示层用于获取事件中论元对应向量;图向量层用于结合论元对应向量获取事件对应向量;注意力层和多层感知机用于获取事件之间逻辑关系。
步骤202,获取训练数据,其中,训练数据包括:大于预设数量的样本事件对,以及样本事件对中各个样本事件之间的样本逻辑关系。
步骤203,以训练数据中的样本事件对为输入,以样本事件对中各个样本事件之间的样本逻辑关系为输出,结合推理模型输出的预测逻辑关系和样本逻辑关系对推理模型的系数进行调整实现训练,以采用训练好的推理模型对事件对进行推理。
本申请实施例中,语义表示层的预训练,指的是采用多个领域下的语料对初始的语义表示层进行训练。语料,例如新闻、聊天对话、论文等,以便语义表示层能够学习到大量的语言知识。
本申请实施例中,在一种实施场景下,事理图谱的推理装置训练推理模型的过程例如可以为,将每个样本事件对输入初始的推理模型,以获取样本事件对中各个样本事件之间的预测逻辑关系;结合预测逻辑关系,以及样本事件对中各个样本事件之间的样本逻辑关系,对语义表示层、图向量层、注意力层和多层感知机进行系数调整,以得到训练好的推理模型。
本申请实施例中,在另一种实施场景下,为了减少推理模型的计算量,且确保训练好的推理模型的准确度,事理图谱的推理装置训练推理模型的过程例如可以为,将每个样本事件对输入初始的推理模型,以获取样本事件对中各个样本事件之间的预测逻辑关系;结合预测逻辑关系,以及样本事件对中各个样本事件之间的样本逻辑关系,对语义表示层的最后一层系数、图向量层的系数、注意力层的系数和多层感知机的系数进行调整,以得到训练好的推理模型。
本申请实施例中,事理图谱的推理装置可以采用训练好的推理模型来实现图1所示实施例中的各个步骤。也就是说,采用训练好的推理模型中的语义表示层,获取事件中各个论元对应的向量;采用训练好的推理模型中的图向量层,结合事件以及事件中各个论元对应的向量,获取事件对应的向量;采用训练好的推理模型中的注意力层和多层感知机,结合两个事件对应的向量拼接得到的向量,确定两个事件之间的逻辑关系。其中,推理模型推理两个事件之间的逻辑关系的示意图可以如图3所示。
本申请实施例的事理图谱的推理方法,通过构建初始的推理模型,其中,初始的推理模型包括:依次连接的语义表示层、图向量层、注意力层和多层感知机;所述语义表示层用于获取事件中论元对应向量;图向量层用于结合论元对应向量获取事件对应向量;注意力层和多层感知机用于获取事件之间逻辑关系;获取训练数据,其中,训练数据包括:大于预设数量的样本事件对,以及样本事件对中各个样本事件之间的样本逻辑关系;以所述训练数据中的样本事件对为输入,以样本事件对中各个样本事件之间的样本逻辑关系为输出,结合所述推理模型输出的预测逻辑关系和所述样本逻辑关系对所述推理模型的系数进行调整实现训练,以采用训练好的推理模型对事件对进行推理,从而能够结合训练好的推理模型来确定各个事件对应的向量,进而推理各个事件之间的逻辑关系,适用性好,推理效率高。
图4为本申请实施例三所提供的事理图谱的推理装置的结构示意图。
如图4所示,该事理图谱的推理装置400可以包括:获取模块410和确定模块420。
其中,获取模块410,用于获取事理图谱中待推理的事件对;
所述获取模块410,还用于获取所述事件对中各个事件对应的向量;
确定模块420,用于根据所述事件对中各个事件对应的向量,确定所述各个事件之间的逻辑关系。
进一步地,在本申请实施例的一种可能的实现方式中,所述获取模块410具体用于,
针对所述事件对中的每个事件,获取所述事件中的各个论元;
将所述各个论元输入推理模型的语义表示层,以获取所述各个论元对应的向量;以及
将所述事件以及所述各个论元对应的向量输入所述推理模型的图向量层,以获取所述事件对应的向量。
进一步地,在本申请实施例的一种可能的实现方式中,所述确定模块420具体用于,
对所述事件对中各个事件对应的向量进行拼接,得到所述事件对对应的向量;
将所述事件对对应的向量输入推理模型中依次排列的注意力层和多层感知机,以获取所述各个事件之间的逻辑关系。
进一步地,在本申请实施例的一种可能的实现方式中,结合参考图5,在图4所示实施例的基础上,所述的装置还可以包括:构建模块430和训练模块440。
其中,所述构建模块430,用于构建初始的推理模型,其中,所述初始的推理模型包括:依次连接的语义表示层、图向量层、注意力层和多层感知机;所述语义表示层用于获取事件中论元对应向量;所述图向量层用于结合论元对应向量获取事件对应向量;所述注意力层和所述多层感知机用于获取事件之间逻辑关系;
所述获取模块410,还用于获取训练数据,其中,所述训练数据包括:大于预设数量的样本事件对,以及所述样本事件对中各个样本事件之间的样本逻辑关系;
所述训练模块440,用于以所述训练数据中的样本事件对为输入,以样本事件对中各个样本事件之间的样本逻辑关系为输出,结合所述推理模型输出的预测逻辑关系和所述样本逻辑关系对所述推理模型的系数进行调整实现训练,以采用训练好的推理模型对事件对进行推理。
进一步地,在本申请实施例的一种可能的实现方式中,所述初始的推理模型中的语义表示层,为经过预训练的语义表示层。
进一步地,在本申请实施例的一种可能的实现方式中,所述训练模块440具体用于,
将每个所述样本事件对输入所述初始的推理模型,以获取所述样本事件对中各个样本事件之间的预测逻辑关系;
结合所述预测逻辑关系,以及所述样本事件对中各个样本事件之间的样本逻辑关系,对所述语义表示层的最后一层系数、所述图向量层的系数、所述注意力层的系数和所述多层感知机的系数进行调整,以得到训练好的推理模型。
进一步地,在本申请实施例的一种可能的实现方式中,所述的装置还包括:更新模块;
所述获取模块410,还用于获取所述各个事件之间具有所述逻辑关系的概率;
所述更新模块,用于在所述概率大于等于预设的概率阈值时,将所述各个事件之间的所述逻辑关系,更新到所述事理图谱中。
需要说明的是,前述实施例一中的解释说明也适用于该实施例的事理图谱的推理装置,此处不再赘述。
本申请实施例的事理图谱的推理装置,通过获取事理图谱中待推理的事件对;获取事件对中各个事件对应的向量;根据事件对中各个事件对应的向量,确定各个事件之间的逻辑关系,从而能够结合事理图谱中各个事件对应的向量,来推理各个事件之间的逻辑关系,适用性好,推理效率高。
为了实现上述实施例,本申请还提出一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现如本申请前述实施例提出的事理图谱的推理方法。
为了实现上述实施例,本申请还提出一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行如本申请前述实施例提出的事理图谱的推理方法。
图6示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图6显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (16)
1.一种事理图谱的推理方法,其特征在于,包括:
获取事理图谱中待推理的事件对;
获取所述事件对中各个事件对应的向量;
根据所述事件对中各个事件对应的向量,确定所述各个事件之间的逻辑关系。
2.根据权利要求1所述的事理图谱的推理方法,其特征在于,所述获取所述事件对中各个事件对应的向量,包括:
针对所述事件对中的每个事件,获取所述事件中的各个论元;
将所述各个论元输入推理模型的语义表示层,以获取所述各个论元对应的向量;以及
将所述事件以及所述各个论元对应的向量输入所述推理模型的图向量层,以获取所述事件对应的向量。
3.根据权利要求1所述的事理图谱的推理方法,其特征在于,所述根据所述事件对中各个事件对应的向量,确定所述各个事件之间的逻辑关系,包括:
对所述事件对中各个事件对应的向量进行拼接,得到所述事件对对应的向量;
将所述事件对对应的向量输入推理模型中依次排列的注意力层和多层感知机,以获取所述各个事件之间的逻辑关系。
4.根据权利要求1至3任一项所述的事理图谱的推理方法,其特征在于,在获取所述事件对中各个事件对应的向量之前,还包括:
构建初始的推理模型,其中,所述初始的推理模型包括:依次连接的语义表示层、图向量层、注意力层和多层感知机;所述语义表示层用于获取事件中论元对应向量;所述图向量层用于结合论元对应向量获取事件对应向量;所述注意力层和所述多层感知机用于获取事件之间逻辑关系;
获取训练数据,其中,所述训练数据包括:大于预设数量的样本事件对,以及所述样本事件对中各个样本事件之间的样本逻辑关系;
以所述训练数据中的样本事件对为输入,以样本事件对中各个样本事件之间的样本逻辑关系为输出,结合所述推理模型输出的预测逻辑关系和所述样本逻辑关系对所述推理模型的系数进行调整实现训练,以采用训练好的推理模型对事件对进行推理。
5.根据权利要求4所述的事理图谱的推理方法,其特征在于,所述初始的推理模型中的语义表示层,为经过预训练的语义表示层。
6.根据权利要求5所述的事理图谱的推理方法,其特征在于,所述以所述训练数据中的样本事件对为输入,以样本事件对中各个样本事件之间的样本逻辑关系为输出,结合所述推理模型输出的预测逻辑关系和所述样本逻辑关系对所述推理模型的系数进行调整实现训练,包括:
将每个所述样本事件对输入所述初始的推理模型,以获取所述样本事件对中各个样本事件之间的预测逻辑关系;
结合所述预测逻辑关系,以及所述样本事件对中各个样本事件之间的样本逻辑关系,对所述语义表示层的最后一层系数、所述图向量层的系数、所述注意力层的系数和所述多层感知机的系数进行调整,以得到训练好的推理模型。
7.根据权利要求1所述的事理图谱的推理方法,其特征在于,还包括:
获取所述各个事件之间具有所述逻辑关系的概率;
在所述概率大于等于预设的概率阈值时,将所述各个事件之间的所述逻辑关系,更新到所述事理图谱中。
8.一种事理图谱的推理装置,其特征在于,包括:
获取模块,用于获取事理图谱中待推理的事件对;
所述获取模块,还用于获取所述事件对中各个事件对应的向量;
确定模块,用于根据所述事件对中各个事件对应的向量,确定所述各个事件之间的逻辑关系。
9.根据权利要求8所述的事理图谱的推理装置,其特征在于,所述获取模块具体用于,
针对所述事件对中的每个事件,获取所述事件中的各个论元;
将所述各个论元输入推理模型的语义表示层,以获取所述各个论元对应的向量;以及
将所述事件以及所述各个论元对应的向量输入所述推理模型的图向量层,以获取所述事件对应的向量。
10.根据权利要求8所述的事理图谱的推理装置,其特征在于,所述确定模块具体用于,
对所述事件对中各个事件对应的向量进行拼接,得到所述事件对对应的向量;
将所述事件对对应的向量输入推理模型中依次排列的注意力层和多层感知机,以获取所述各个事件之间的逻辑关系。
11.根据权利要求8-10任一项所述的事理图谱的推理装置,其特征在于,还包括:构建模块和训练模块;
所述构建模块,用于构建初始的推理模型,其中,所述初始的推理模型包括:依次连接的语义表示层、图向量层、注意力层和多层感知机;所述语义表示层用于获取事件中论元对应向量;所述图向量层用于结合论元对应向量获取事件对应向量;所述注意力层和所述多层感知机用于获取事件之间逻辑关系;
所述获取模块,还用于获取训练数据,其中,所述训练数据包括:大于预设数量的样本事件对,以及所述样本事件对中各个样本事件之间的样本逻辑关系;
所述训练模块,用于以所述训练数据中的样本事件对为输入,以样本事件对中各个样本事件之间的样本逻辑关系为输出,结合所述推理模型输出的预测逻辑关系和所述样本逻辑关系对所述推理模型的系数进行调整实现训练,以采用训练好的推理模型对事件对进行推理。
12.根据权利要求11所述的事理图谱的推理装置,其特征在于,所述初始的推理模型中的语义表示层,为经过预训练的语义表示层。
13.根据权利要求12所述的事理图谱的推理装置,其特征在于,所述训练模块具体用于,
将每个所述样本事件对输入所述初始的推理模型,以获取所述样本事件对中各个样本事件之间的预测逻辑关系;
结合所述预测逻辑关系,以及所述样本事件对中各个样本事件之间的样本逻辑关系,对所述语义表示层的最后一层系数、所述图向量层的系数、所述注意力层的系数和所述多层感知机的系数进行调整,以得到训练好的推理模型。
14.根据权利要求8所述的事理图谱的推理装置,其特征在于,还包括:更新模块;
所述获取模块,还用于获取所述各个事件之间具有所述逻辑关系的概率;
所述更新模块,用于在所述概率大于等于预设的概率阈值时,将所述各个事件之间的所述逻辑关系,更新到所述事理图谱中。
15.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110145802.1A CN112819164B (zh) | 2021-02-02 | 2021-02-02 | 事理图谱的推理方法、装置及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110145802.1A CN112819164B (zh) | 2021-02-02 | 2021-02-02 | 事理图谱的推理方法、装置及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112819164A true CN112819164A (zh) | 2021-05-18 |
CN112819164B CN112819164B (zh) | 2024-05-24 |
Family
ID=75861703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110145802.1A Active CN112819164B (zh) | 2021-02-02 | 2021-02-02 | 事理图谱的推理方法、装置及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819164B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114611816A (zh) * | 2022-03-21 | 2022-06-10 | 中国电信股份有限公司 | 潜在事件预测方法、装置、设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106055536A (zh) * | 2016-05-19 | 2016-10-26 | 苏州大学 | 一种中文事件联合推理方法和系统 |
US9489442B1 (en) * | 2014-02-04 | 2016-11-08 | Emc Corporation | Prevention of circular event publication in publish/subscribe model using path vector |
WO2017149559A1 (en) * | 2016-02-29 | 2017-09-08 | Nec Corporation | An information processing system, an information processing method and a computer readable storage medium |
CN107578106A (zh) * | 2017-09-18 | 2018-01-12 | 中国科学技术大学 | 一种融合单词语义知识的神经网络自然语言推理方法 |
CN110704598A (zh) * | 2019-09-29 | 2020-01-17 | 北京明略软件系统有限公司 | 一种语句信息的抽取方法、抽取装置及可读存储介质 |
CN110796254A (zh) * | 2019-10-30 | 2020-02-14 | 南京工业大学 | 一种知识图谱推理方法、装置、计算机设备及存储介质 |
CN110968699A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 |
CN111651974A (zh) * | 2020-06-23 | 2020-09-11 | 北京理工大学 | 一种隐式篇章关系分析方法和系统 |
CN111967256A (zh) * | 2020-06-30 | 2020-11-20 | 北京百度网讯科技有限公司 | 事件关系的生成方法、装置、电子设备和存储介质 |
CN112084331A (zh) * | 2020-08-27 | 2020-12-15 | 清华大学 | 文本处理、模型训练方法、装置、计算机设备和存储介质 |
-
2021
- 2021-02-02 CN CN202110145802.1A patent/CN112819164B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9489442B1 (en) * | 2014-02-04 | 2016-11-08 | Emc Corporation | Prevention of circular event publication in publish/subscribe model using path vector |
WO2017149559A1 (en) * | 2016-02-29 | 2017-09-08 | Nec Corporation | An information processing system, an information processing method and a computer readable storage medium |
CN106055536A (zh) * | 2016-05-19 | 2016-10-26 | 苏州大学 | 一种中文事件联合推理方法和系统 |
CN107578106A (zh) * | 2017-09-18 | 2018-01-12 | 中国科学技术大学 | 一种融合单词语义知识的神经网络自然语言推理方法 |
CN110704598A (zh) * | 2019-09-29 | 2020-01-17 | 北京明略软件系统有限公司 | 一种语句信息的抽取方法、抽取装置及可读存储介质 |
CN110796254A (zh) * | 2019-10-30 | 2020-02-14 | 南京工业大学 | 一种知识图谱推理方法、装置、计算机设备及存储介质 |
CN110968699A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 |
CN111651974A (zh) * | 2020-06-23 | 2020-09-11 | 北京理工大学 | 一种隐式篇章关系分析方法和系统 |
CN111967256A (zh) * | 2020-06-30 | 2020-11-20 | 北京百度网讯科技有限公司 | 事件关系的生成方法、装置、电子设备和存储介质 |
CN112084331A (zh) * | 2020-08-27 | 2020-12-15 | 清华大学 | 文本处理、模型训练方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
于浏洋 等: "面向知识图谱构建的知识抽取技术综述", 信息工程大学学报, pages 227 - 235 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114611816A (zh) * | 2022-03-21 | 2022-06-10 | 中国电信股份有限公司 | 潜在事件预测方法、装置、设备及存储介质 |
CN114611816B (zh) * | 2022-03-21 | 2024-02-27 | 中国电信股份有限公司 | 潜在事件预测方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112819164B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113240056B (zh) | 多模态数据联合学习模型训练方法及装置 | |
US11100320B2 (en) | Image recognition method and apparatus | |
CN109670029B (zh) | 用于确定问题答案的方法、装置、计算机设备及存储介质 | |
CN112560496B (zh) | 语义分析模型的训练方法、装置、电子设备及存储介质 | |
CN109844773B (zh) | 使用卷积神经网络处理序列 | |
CN111523640B (zh) | 神经网络模型的训练方法和装置 | |
US11922281B2 (en) | Training machine learning models using teacher annealing | |
US11797839B2 (en) | Training neural networks using priority queues | |
US12118064B2 (en) | Training machine learning models using unsupervised data augmentation | |
US20220245424A1 (en) | Microgenre-based hyper-personalization with multi-modal machine learning | |
CN112149615A (zh) | 人脸活体检测方法、装置、介质及电子设备 | |
CN113656587A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
JP2024526395A (ja) | エンドツーエンドセンシティブテキストリコールモデルのトレーニング方法、センシティブテキストリコール方法 | |
WO2024175079A1 (zh) | 一种模型的量化方法以及相关设备 | |
CN116977885A (zh) | 视频文本任务处理方法、装置、电子设备及可读存储介质 | |
US20230245429A1 (en) | Method and apparatus for training lane line detection model, electronic device and storage medium | |
CN112819164A (zh) | 事理图谱的推理方法、装置及计算机设备 | |
CN117351299A (zh) | 图像生成及模型训练方法、装置、设备和存储介质 | |
WO2024072999A1 (en) | Variable length video generation from textual descriptions | |
CN115170887B (zh) | 目标检测模型训练方法、目标检测方法及其装置 | |
CN116030235A (zh) | 目标检测模型训练方法、目标检测方法、装置和电子设备 | |
US20220222491A1 (en) | System and method for lightweight semantic masking | |
CN114792097A (zh) | 预训练模型提示向量的确定方法、装置及电子设备 | |
CN114844889B (zh) | 视频处理模型的更新方法、装置、电子设备及存储介质 | |
US20240028923A1 (en) | Extracting enriched target-oriented common sense from grounded graphs to support next step decision making |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 601, 6 / F, building 2, No. 18, Kechuang 11th Street, Beijing Economic and Technological Development Zone, Beijing 100176 Applicant after: Jingdong Technology Information Technology Co.,Ltd. Address before: 601, 6 / F, building 2, No. 18, Kechuang 11th Street, Beijing Economic and Technological Development Zone, Beijing 100176 Applicant before: Jingdong Shuke Haiyi Information Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |