CN114266258A - 一种语义关系提取方法、装置、电子设备及存储介质 - Google Patents
一种语义关系提取方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114266258A CN114266258A CN202111644051.4A CN202111644051A CN114266258A CN 114266258 A CN114266258 A CN 114266258A CN 202111644051 A CN202111644051 A CN 202111644051A CN 114266258 A CN114266258 A CN 114266258A
- Authority
- CN
- China
- Prior art keywords
- relation
- graph
- information
- semantic
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 102
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 40
- 239000013598 vector Substances 0.000 claims description 61
- 238000013528 artificial neural network Methods 0.000 claims description 19
- 230000014509 gene expression Effects 0.000 claims description 17
- 230000004927 fusion Effects 0.000 claims description 12
- 230000015654 memory Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 6
- 238000003058 natural language processing Methods 0.000 abstract description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 40
- 230000006870 function Effects 0.000 description 15
- 238000012549 training Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000004913 activation Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241001522296 Erithacus rubecula Species 0.000 description 2
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
本公开提供了一种语义关系提取方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及自然语言处理、关系提取等领域。具体实现方案为:从文本数据中获取待查询句子;根据所述待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图;根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系。采用本公开,可以从大量的文本数据中提取出目标实体之间的语义关系。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及自然语言处理、关系提取等领域。
背景技术
针对各种类型的文本数据(如半结构化的表格,非结构化的文本)而言,该文本数据中各个目标实体对(如文本数据的语句中各个词之间)存在不同的语义关系,需要从大量的文本数据中提取出目标实体对之间的语义关系。
发明内容
本公开提供了一种语义关系提取方法、装置、电子设备以及存储介质。
根据本公开的一方面,提供了一种语义关系提取方法,包括:
从文本数据中获取待查询句子;
根据所述待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图;
根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系。
根据本公开的另一方面,提供了一种语义关系提取装置,包括:
获取单元,用于从文本数据中获取待查询句子;
构建单元,用于根据所述待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图;
关系提取单元,用于根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任意一实施例所提供的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使该计算机执行本公开任意一项实施例所提供的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现本公开任意一项实施例所提供的方法。
采用本公开,可以从文本数据中获取待查询句子,根据该待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图。根据该语义关系图进行关系提取处理,可以得到该目标实体之间的语义关系,从而可以从大量的文本数据中提取出目标实体之间的语义关系。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例的一分布式集群处理场景的示意图;
图2是根据本公开实施例的语义关系提取方法的流程示意图;
图3是根据本公开实施例的应用示例中针对语义关系进行关系提取的推理框架示意图;
图4是根据本公开实施例的应用示例中构建推理图的示意图;
图5是根据本公开实施例的应用示例中基于推理图实现的关系提取的示意图;
图6是根据本公开实施例的语义关系提取装置的组成结构示意图;
图7是用来实现本公开实施例的语义关系提取方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。本文中术语“第一”、“第二”表示指代多个类似的技术用语并对其进行区分,并不是限定顺序的意思,或者限定只有两个的意思,例如,第一特征和第二特征,是指代有两类/两个特征,第一特征可以为一个或多个,第二特征也可以为一个或多个。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
针对各种类型的文本数据(如半结构化的表格,非结构化的文本)而言,该文本数据中的词与词之间存在各种语义关系,比如,“江苏省会是南京”这句文本,“江苏”和“南京”是目标实体对,而“省会”是二者的语义关系。可以进行关系提取(或称关系抽取)处理,以从文本数据得到该目标实体对的语义关系。该关系提取可以通过深度学习技术来实现,目前的关系提取模型可以使用各种类型的神经网络对该文本数据中的整个句子进行编码,该关系提取模型可以包括:卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络的改进模型长短期记忆网络(Long Short Term Memory Neural Networks,LSTM)、图卷积神经网络(Graph Convolutional Networks,GCNs)等神经网络模型。这些神经网络模型可以利用单词位置嵌入及外部特征,如词性标注(POS)标记、命名实体信息和依赖关系进行词解析,以基于词解析进一步实现语义关系的提取。其中,POS标记包括:名词、动词、形容词、副词、并列连词等,一个示例中,英文句子中的单词“利润(profits)”在当前句子的上下文语境中代表一个名词,则通过该POS标记将该单词“profits”记为“名词”;另一个示例中,英文句子中的单词“敲打(knock)”在当前句子的上下文语境中代表一个动词,则通过该POS标记将该单词“knock”记为“动词”。
神经网络的特征是可以从大量数据中学习,然而,采用上述神经网络模型,从句子中学习特征(如句子中一个或多个词特征)是隐式的,即:割裂的得到一个或多个词的含义,并不清楚句子中各个词之间真实的语义关系,比如,利用上述POS标记本身就存在歧义,“knock”可以是动词,在上下文语境中也可以代表一个名词“敲击声”或者“敲门/窗”等。可见:采用目前的神经网络模型得到的各种关系提取模型,无法准确的提取出句子中各个词之间真实的语义关系。
各种开放信息提取(Open IE)系统被开发出来,该Open IE系统用于从大规模非结构化纯文本中提取结构化事实。通常,例如“place_of_birth”、“neighborhood_of”等目标实体对,是以抽象的方式来表示,可以视为封闭域的关系。而开放域关系是以叙事的方式表示目标实体对之间的关系,它包含了丰富的用于推断封闭域关系的信息。比如,一个句子“萨姆出生在费城(Sam was born in Philadelphia)”,可以通过该Open IE系统创建一个三元组<Sam,was born in,Philadelphia>,通过该三元组可以得出目标实体对“Sam和Philadelphia”之间的语义关系,即:根据该三元组可以推断出封闭域关系为“people/person/nationality”。又如,给定一个开放域事实<“埃默里大学(Emory University)”、“in”、“亚特兰大(Atlanta)”>,可以推断组织“Emory University”和位置“Atlanta”之间存在封闭域关系“/location/location/contains”。
综上所述,考虑到开放域关系中包含了用于推断封闭域关系的信息,如果能利用开放域关系和封闭域关系二者之间的关系进行关系提取,那么就能在开放域关系和封闭域关系之间建立一座桥梁,为提高针对语义关系实现关系提取的精度,提供更多的帮助,还可以根据业务需求,将由关系提取得到的该语义关系,提供给自然语言处理任务(如阅读理解、协助回答问题)、知识图谱(行业图谱)构建任务、人机对话,文本识别等应用场景使用。
根据本公开的实施例,图1是根据本公开实施例的一分布式集群处理场景的示意图,该分布式集群系统为集群系统的一个示例,示例性的描述了可以利用该分布式集群系统进行语义关系的提取,本公开不限于单机或多机上的语义关系提取,采用分布式的处理可以进一步提高关系提取的精度。如图1所示,在该分布式集群系统中包括多个节点(如服务器集群101、服务器102、服务器集群103、服务器104、服务器105,服务器105还可以连接电子设备,如手机1051及台式机1052),多个节点间,以及多个节点与连接的电子设备间可以共同执行一个或多个语义关系的提取任务。可选地,该分布式集群系统中的多个节点可以采用数据并行的模型训练方式,则多个节点可以基于相同的训练方式执行语义关系提取的训练任务,以更好的实现模型训练;若该分布式集群系统中的多个节点采用的是模型并行的模型训练方式,则多个节点可以基于不同的训练方式执行语义关系提取的训练任务,以更好的实现模型训练。可选地,在每一轮模型训练完成后,多个节点之间都可以进行数据交换(如数据同步)。
根据本公开的实施例,提供了一种语义关系提取方法,图2是根据本公开实施例的语义关系提取方法的流程示意图,该方法可以应用于语义关系提取装置,例如,该装置可以部署于单机、多机或集群系统中的终端或服务器或其它处理设备执行的情况下,可以实现语义关系提取等等处理。其中,终端可以为用户设备(UE,User Equipment)、移动设备、个人数字处理(PDA,Personal Digital Assistant)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该方法还可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。如图2所示,该方法应用于图1所示的集群系统中的任一节点或电子设备(手机或台式机等)中,包括:
S201、从文本数据中获取待查询句子。
S202、根据该待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图。
S203、根据该语义关系图进行关系提取处理,得到该目标实体之间的语义关系。
S201-S203的一示例中,从文本数据中获取待查询句子,该待查询句子由词构成(不限于英文字符构成的词,还可以是中文字符构成的词),在该待查询句子中存在需要提取语义关系的至少两个词(至少两个词称之为目标实体,可以构成目标实体对),根据该待查询句子中该目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图,比如,根据开放域信息注释(OIA)得到OIA图,根据该OIA图进行关系分析后得到OIX推理图(该OIX推理图是该语义关系图的一个示例,本公开不限于OIX推理图,还可以是其他用于关系提取且为图结构的数据结构)。根据该语义关系图进行关系提取处理,得到该目标实体之间的语义关系。
需要指出的是,该封闭域关系用于表征以抽象方式表示的该目标实体对之间的关系;该开放域关系用于表征以叙事方式表示的该目标实体对之间的关系,其中,该开放域关系中可以包括:用于识别该封闭域关系的信息。
采用本公开,可以从文本数据中获取待查询句子,根据该待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图。根据该语义关系图进行关系提取处理,可以得到该目标实体之间的语义关系,从而可以从大量的文本数据中提取出目标实体之间的语义关系。
一实施方式中,根据所述待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图,包括:根据OIA将该待查询句子转换为对应的OIA图,根据所述OIA图中的节点及边,构建对应的语义关系图。其中,该OIA图中的节点(该OIA图中的节点包括对应该目标实体的目标节点)及边用于表征该目标实体之间的封闭域关系及开放域关系。采用本实施方式,可以先把待查询句子利用OIA转换为对应的OIA图,再通过该OIA图构建对应的语义关系图(如OIX推理图),可以通过该OIX推理图在该封闭域关系及该开放域关系之间建立桥梁,充分理解该待查询句子中目标实体之间的语义关系,得到更为丰富的信息,以基于该信息提高关系提取的精度。
一实施方式中,该语义关系图包括:常量节点,事实关系节点,逻辑关系节点,及连接该常量节点、该事实关系节点及该逻辑关系节点中至少两个节点形成的边。其中,该常量节点用于描述该目标实体;该事实关系节点用于描述该目标实体之间的事实关系表达;该逻辑关系节点用于描述该目标实体与开放域事实之间的逻辑关系。采用本实施方式,通过该语义关系图中的各个节点类型及边,可以描述出该待查询句子中目标实体之间的语义关系,从而得到更为丰富的信息,以基于该信息提高关系提取的精度。
一实施方式中,根据所述OIA图中的节点及边,构建对应的所述语义关系图,包括:在该OIA图中标识对应目标实体对的目标节点对,其中,该目标实体对包括至少两个目标实体。
在该OIA图中连接该目标节点对形成的边,得到对应的至少两个开放域事实路径,根据该至少两个开放域事实路径上的所有节点及边,得到该语义关系图;其中,该所有节点中包括该目标节点对、及由该待查询句子中除该目标实体对之外的其他词转换得到的多个非目标节点。采用本实施方式,可以基于该OIA图中的节点及边来构建该语义关系图(如OIX推理图),比如,目标节点对包括两个目标节点,先在该OIA图中标识出这两个目标节点,如目标节点对<Boston,Boston University>中的两个目标节点,分别为“Boston”及“BostonUniversity”,之后,根据连接这两个目标节点形成的边,得到开放域事实路径,以根据该OIX推理图中的该开放域事实路径,得到该待查询句子中描述目标实体之间语义关系的信息,以基于该信息提高关系提取的精度。
一实施方式中,还包括:在该至少两个开放域事实路径上,执行节点信息的查询处理,响应该查询处理,查询到该至少两个开放域事实路径上的一条或多条节点链缺失所述节点信息。在该一条或多条节点链(如描述谓语动词的谓语节点链)上补全所缺失的该节点信息(如常量节点),根据该节点信息,更新该语义关系图。采用本实施方式,在信息不完备的情况下,比如在该至少两个开放域事实路径上的一条或多条谓语节点链上缺失常量节点,需要补齐该常量节点,以补全缺失节点信息的方式来优化该语义关系图,可以得到更为完善的信息,且通过更新后的该语义关系图可以描述出更为全面和精确的信息(即目标实体之间的语义关系的信息),以基于该信息提高关系提取的精度。
一实施方式中,还包括:在该至少两个开放域事实路径上,提取用于描述所述开放域关系的节点表达式,根据该节点表达式,得到开放域事实,根据该开放域事实更新该语义关系图。采用本实施方式,可以定位到开放域事实路径上存在开放域关系(即可能存在紧密关系的语义关系)的所有节点,以得到节点表达式,根据节点表达式可以开放域事实,以定位出开放域事实的方式来优化该语义关系图,可以得到更为完善的信息,且通过更新后的该语义关系图可以描述出更为全面和精确的信息(即目标实体之间的语义关系的信息),以基于该信息提高关系提取的精度。
一实施方式中,根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系,包括:根据图神经网络提取第一关系信息(该第一关系信息包括语义关系图中用于表征该目标实体之间关系的信息),根据该第一关系信息编码后将编码信息输入第一模型,以得到该目标实体之间的语义关系。采用本实施方式,可以利用图神经网络(如GGNN)对该语义关系图中描述的关系进行提取及进行编码,将得到的编码信息作为第一模型(如RE-OIX模型)的输入,由于输入该第一模型的编码信息基于该语义关系图得到,而该语义关系图可以描述出更为全面和精确的信息(即目标实体之间的语义关系的信息),因此,可以提高第一模型后续执行关系提取处理的精度。
一实施方式中,根据所述第一关系信息编码后将编码信息输入第一模型,以得到所述目标实体之间的语义关系,包括:根据该第一关系信息进行编码,得到包括第一特征向量(如图向量)的该编码信息,将该编码信息输入该第一模型,根据该第一模型进行关系提取,得到该目标实体之间的语义关系。采用本实施方式,由于输入该第一模型的编码信息基于该语义关系图得到的,而该语义关系图可以描述出更为全面和精确的信息(即目标实体之间的语义关系的信息),因此,可以提高第一模型执行关系提取处理的精度。
一实施方式中,根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系,包括:根据图神经网络提取第一关系信息(该第一关系信息包括语义关系图中用于表征该目标实体之间关系的信息),根据该第一关系信息进行编码,得到第一特征向量(如图向量),从文本数据中获取与待查询句子相关的上下文信息,将该上下文信息编码为第二特征向量(如词向量)。根据该第一特征向量和该第二特征向量得到融合特征向量,将该融合特征向量输入第一模型(如RE-OIX模型),以得到目标实体之间的语义关系。采用本实施方式,结合上下文信息中的第二特征,可以得到利用该第一特征向量和该第二特征向量得到的融合特征,之后,将该融合特征作为该第一模型的输入,可以提高第一模型执行关系提取处理的精度。
一实施方式中,根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系,包括:根据图神经网络提取第一关系信息(该第一关系信息包括语义关系图中用于表征该目标实体之间关系的信息),根据该第一关系信息进行编码,得到包括第一特征向量的编码信息,将该编码信息输入第一模型,根据第一模型进行关系提取,得到第一语义关系。从文本数据中获取与待查询句子相关的上下文信息,将该上下文信息编码为第二特征向量,将该第一特征向量输入第二模型(如RE-OIX-context模型)进行关系提取,得到第二语义关系。根据该第一语义关系和该第二语义关系,得到目标实体之间的语义关系。采用本实施方式,结合上下文信息中的第二特征,将第一特征和第二特征分别输入各自的模型(如将第一特征输入第一模型,将第二二者输入第二模型),也可以得到利用该第一特征向量和该第二特征向量得到的融合特征分别输入上述两个模型,通过这两个模型联合执行关系提取处理,提高了执行关系提取处理的精度。
下面对上述本公开实施例提供的语义关系提取方法进行示例说明。
关系提取作为自然语言处理任务,可以从非结构化文本中提取目标实体对之间的语义关系。在关系提取设置的上下文中,需要预定义包含该语义关系的语义关系集,例如“place_of_birth”、“neighborhood_of”等,这些语义关系以抽象的方式表示,称之为封闭域关系。开放域关系是以叙事的方式表示目标实体对之间的关系,它包含了丰富的用于推断该封闭域关系的信息。
通过关系抽取来得到非结构化文本中目标实体对之间的语义关系,实际上是为了构建该非结构化文本中目标实体对之间的语义关系,从而形成由一对目标实体和一个语义关系构成的三元组,三元组的格式可以为:<实体、关系、实体>。
需要找到该封闭域关系和该开放域关系二者之间的关系,将该封闭域关系和该开放域关系基于这种关系结合起来,从而在该封闭域关系和该开放域关系之间建立一座桥梁,以促进实现关系提取的精度。
在开放域关系和封闭域关系之间建立桥梁面临着多重挑战。首先,目前的Open IE系统,如Reverb(是从大规模语料库中提取短句,而不需要预先指定词典的任务)、及ClausIE(是获取大量自然语言文本的浅层语义表示),通过词汇约束,使用各自的关系提取模式来识别语义关系。许多非结构化文本内部没有明确的关系触发,采用目前的Open IE系统无法从这些句子中提取语义关系。比如,通过从两个目标实体对之间的文本中删除不相关的词来设置用于关系提取的句法指示符,这种策略非常简单,只能处理目标实体对之间的直接连接关系,对于如下的示例句子,由于目标实体对之间不存在该直接连接关系,实际上无法实现关系提取,换言之,目前的Open IE系统是基于特定的策略,主要针对目标实体对之间存在该直接连接关系的情况。
一示例句子“他搬到波士顿,开始在波士顿大学教书(He moved to Boston andbegan teaching at Boston University)”,根据目标实体对<“Boston University”,“Boston”>执行关系提取,以得到两个开放域关系事实<“He”,“moved to”,“Boston”>,和<“He”,“began teaching at”,“Boston University”。显然:“Boston University”和“Boston”之间没有直接的联系。
本应用示例中,采用了一种通用的开放IE策略,采用该策略可以在不丢失非结构化文本内部信息的情况下提取所有可能的开放域事实,关系提取所涉猎的信息更全面,而且,采用该策略使用的目标实体对之间可以没有直接的开放域关系,采用如下四部分描述并结合多跃式推理框架(如图3所示的针对语义关系进行关系提取的推理框架)来实现关系提取,图3中包括:OIA图301和OIX推理图302,先将非结构化文本中的一段待查询语句转换为OIA图301,然后再基于OIA图301构建OIX推理图302,具体阐述如下。
一:采用开放域信息表达(OIX)推理图
在非结构化文本的待查询语句中给定两个目标实体(两个目标实体可以形成目标实体对),将OIX推理图定义为:包含连接这两个目标实体的所有开放域事实的图。
该OIX推理图可以基于开放域信息注释(OIA)构建,可以采用OIA将待查询语句转换为OIA图后再构建OIX推理图,该OIX推理图可以是具有丰富注释的有向图(如单个有向无环依赖图)。该有向图是利用节点和节点之间连线表示拓扑关系的数据结构,包含节点和边。具体的,该OIX推理图可以由以下节点和边组成:
1)节点:节点包括常量节点、事实关系节点和逻辑关系节点。
·常量节点:该OIX推理图中的常量节点与OIA图中的常量节点相同,一般代表目标实体,如“Boston”、“Boston University”。
·事实关系节点:该OIX推理图中目标实体之间事实关系的紧密表达,一般对应于OIA图中连接两个目标实体的谓语构成的谓词链,如谓语可以是:“moved”、“teaching”等。
·逻辑关系节点:该OIX推理图中表示目标实体与事实之间的逻辑关系,如“and”、“while”、“because”等。
2)边:对于一个开放域事实<h,r,t>,连接一个边“h→r”(如类型为0的边)和边“r→t”(如类型为1的边),其中,节点h和节点t分别为该OIX推理图中头部和尾部的常量节点,节点r为事实关系节点。对于逻辑关系,使用边(如类型为2的边)将逻辑关系节点与对应的每个参数连接。
二:构建OIX推理图的过程
图4是根据本公开实施例的应用示例中构建推理图的示意图,包括:OIA图401和OIX推理图403,以及在推理过程中基于该示例OIA图401得到的OIA变形图402,揭示了根据给定OIA注释(由OIA通道生成)得到上述第一部分定义的OIX推理图的构建过程,以待查询语句“他搬到波士顿,并应校长约翰〃西尔伯的邀请,开始在波士顿大学任教(He moved toBoston and,at the invitation of the chancellor,John Silber,began teaching atBoston University”)为例来描述构建OIX推理图403的过程,在构建的OIX推理图403中包含推断目标实体对之间的语义关系。
1)确定目标实体对之间的开放域事实路径
将待查询语句转换为OIA图401后,可以忽略边的方向,将该OIA图401视为无向图,给定两个目标实体,两个目标实体构成目标实体对。
首先,在OIA图401中标识该目标实体对相应的目标节点,在图4中可以查询到对应该目标实体对的目标节点对<“Boston”,“Boston University”>,OIA图401中的短语与该目标实体对完全匹配。然后,查询到连接该目标节点对的开放域事实路径,可以找到该目标节点对<Boston,Boston University>之间路径中的所有节点,这些节点以OIA变形图402中的粗实线表示,包括:“Boston University”、“at”、“teaching”、“He”、“and”、“moved”、“to”、“Boston”。
此外,对于开放域事实路径中的谓词节点,需要将缺少的常量参数在对应的开放域事实路径中补全,并将缺少的常量参数添加到路径中,以确保可以在后面的步骤中能从确定的路径中找到完整的开放域事实。
2)识别紧密关系表达式
在OIA图401中,椭圆表示常量(即目标实体)节点,矩形表示谓词节点。通过OIA图401中的边将每个谓词节点或常量节点连接到对应的参数(该参数可以是相关的任何常量节点或谓词节点)。比如,OIA变形图402中,节点“He”和“moved”之间的边(如类型为1的边),记为“pred:arg:1”,这意味着“He”是谓词“moved”的头实体。类似地,“Boston”是谓词“to”的尾部实体,因为边(如类型为2的边),记为“pred:arg:2”。
为了构造开放域关系的紧密表达式,可以将图4中OIA变形图402中所有常量节点中间的谓词节点合并为一个开放域关系节点,比如,OIX推理图403中的“began teachingat”。总的来说,通过OIA图401提取了两个开放域事实<“He”,“moved to”,“Boston”>,以及<“He”,“began teaching at”,“Boston University”,如OIA变形图402中所示的开放域事实路径(一条路径为粗实线,一条路径为细实线)。在开放域事实提取之后,开放域事实路径中的左侧节点是逻辑关系节点(逻辑关系节点连接两个具有逻辑关系的开放域事实)比如节点“and”。最后,将确定的开放域事实和逻辑关系节点组合到OIX推理图403中,OIX推理图403构建结束。
三:OIX推理图的关系抽取
图5是根据本公开实施例的应用示例中基于推理图实现的关系提取的示意图,可以使用门控图神经网络(GGNN)对OIX推理图501进行编码。GGNN是一种基于门控循环单元的图神经网络,在固定的T时间步长中展开,以计算梯度,GGNN适用于带标记边的有向图。如图5所示,基于推理图实现的关系提取,需要确保以下几点:
1)使信息流通:初始的OIX推理图(如图4所示的OIX推理图403)是一个有向图,其中尾部节点可以从头部节点获取信息,而头部节点在进行消息传递时不能从尾部节点获取信息。因此,在基于OIX推理图学习过程中,对于每种类型的边,在每种类型边的另一侧的定向边上添加额外的边类型。换言之,初始的OIX推理图中有3种类型的边,则在学习过程,在该3种类型边的另一侧的定向边上添加额外的边类型(以虚线表示)后,可以得到有6种边类型的OIX推理图(如图5所示的OIX推理图501)。
2)嵌入节点:初始节点的嵌入,可以使用预先训练的词向量,如词表示的全局向量(Global Vectors for Word Representation,GloVe)获得。也可以通过将节点短语输入语言模型,如基于转换器的双向编码器表示(Bidirectional Encoder Representation fromTransformers,BERT)来获取。假设节点i的短语包含ni个单词,将把每个单词转换成一个实值向量Ht,t∈ni后,采用如下公式(1)进行平均运算和得到tanh激活函数,tanh激活函数是双曲正切函数,其中,[xi||0]是节点i的初始嵌入。
3)学习OIX推理图:使用GGNN,对于每一个门控图卷积层,采用如下公式(2)-公式(3)进行OIX推理图的学习,其中,i表示节点的索引;t表示步数(即t时间步长);表示头节点的隐藏向量;表示尾节点的隐藏向量。并且当τ∈[0,6)时,因此,GGNN能够编码不同的边缘类型。在每次消息传播时,GGNN使用门控循环单元(GRU)更新隐藏节点表示。在进行t步的递归之后,将头节点的隐藏向量和尾节点的隐藏向量连接起来,并使用全连接层对它们进行变换,以生成图级的输出向量HG。
4)添加实体信息:为了解决头部节点或尾部节点中的短语与头部实体或尾部实体不完全匹配的问题,可以直接使用头部和尾部实体的词嵌入表示,进行实体信息的编码,学习头部实体表示和尾部实体表示的过程,与学习节点嵌入的过程相同。然后,用一个全连接层来变换头部和尾部实体的词嵌入。
5)优化损失函数:基于上述OIX推理图、及通过上述GGNN学习该OIX推理图中的关系以实现编码,得到编码信息后,在RE-OIX模型结构的最后一层,将该编码信息作为该RE-OIX模型的输入。可以将头部实体表示尾部实体表示和GGNN的输出向量HG通过Concat函数连接在一起,即在RE-OIX模型结构中添加一个全连接层执行连接处理,执行连接处理后添加一个softmax层,采用该softmax层来学习条件概率P(r|S,θ),如下公式(4)-公式(5)所示,其中,r是一个封闭域关系,eh是头部实体,et是尾部实体,S是句子,句子可以包含n个词,如S={w1,w2,…,wn},n个词“w1,w2,…,wn”中包括两个目标实体e1和e2,θ是神经网络的参数。
P(r|S,<eh,et>0)=Softmax(h) (5)
可以使用交叉熵损失函数作为该RE-OIX模型的目标训练函数。给定一个句子集合和具有关系标注的目标实体对,如 定义了如下公式(6)计算得到损失函数J(θ),其中关于节点特征的loss部分是可微调的(即:可以更新词嵌入或微调BERT)。
四:将上下文信息与OIX推理图相结合(即:将基于OIX推理图、及通过上述GGNN学习该OIX推理图中的关系以实现编码后得到的RE-OIX模型,与基于该上下文信息得到的RE-OIX-Context模型进行特征融合,得到融合特征,以根据该融合特征得到更精确的语义关系)。
需要指出的是,通过该RE-OIX模型、或该RE-OIX模型与RE-OIX-Context模型的联合处理来实现关系提取,得到精确的语义关系后,还可以进行如下的测试过程。
为了测试通过OIX推理图可以提取重要信息的精度,还可以将上下文信息与OIX推理图相结合。预训练语言模型的最新进展表明,像BERT、RoBERTa这样的模型能够捕获从它们训练的大量文本中得到的语言表示。由此产生的预训练模型可以针对下游任务(如阅读理解、协助回答问题等自然语言处理任务、知识图谱构建任务、人机对话,文本识别等下游任务)进行进一步微调。
在测试过程中,可以使用该预训练的语言模型(如BERT)作为句子嵌入的主干,给定一个包含n个词的句子,S={w1,w2,…,wn},包括两个目标实体e1和e2。可以使用预训练的该BERT模型来生成句子的表示(基于BERT模型生成句子的表示,还可以将特殊的字符[CLS]添加在句子的起始字符之前),使用预训练的该BERT模型将每个词wi都转化为具有真实值的词向量,以表示词汇和语义特征,包括如下内容:
1)实体表示:对句子进行编码,插入一个特殊的字符“$”在第一个目标实体的开头和结尾。然后插入一个特殊的字符“#”在第二个目标实体的开头和结尾。给定一个具有目标实体对<e1e2>的句子S,假设由预训练的该BERT模型输出的最终隐藏状态为H,则提取目标实体e1={wi,…,wj}的最终隐藏状态向量{Hi,…,Hj}。相似的,对于目标实体e2={wk,…,wm},提取得到最终的隐藏状态向量{Hk,…,Hm}。然后,使用平均运算、激活函数(如tanh激活函数)和全连接层来获得目标实体e1和e2分别对应的向量表示和由于包含了整个句子S的信息,因此和中包含了原句子S中的判别性信息,并且能够被很好的分类。
2)句子表示:BERT关于[CLS]的输出H0,可以用于对句子S的表示进行聚合以实现分类。还可以将第一个特殊字符[CLS]的隐藏状态加入到RE-OIX模型的建模中。H0的编码过程可以采用公式(7)得到,其中,HS是该句子S中的目标实体对应的向量;W0是权重;b0是常量;tanh()是激活函数;
HS=W0(tanh(H0))+b0(7)
3)损失函数:与RE-OIX模型相似,对于RE-OIX-Context模型结构的最后一层,可以将HS、和HG通过全连接层连接起来,然后添加一个softmax层来计算条件概率。并且,RE-OIX-Context模型和RE-OIX模型可以使用相同的目标函数。
采用本应用示例,利用构建的OIX推理图可以提升关系抽取的能力以及关系抽取的推理和可解释性,从而提高了关系提取的精度。
根据本公开的实施例,提供了一种语义关系提取装置,图6是根据本公开实施例的语义关系提取装置的组成结构示意图,如图6所示,语义关系提取装置600包括:获取单元601,用于从文本数据中获取待查询句子;构建单元602,用于根据所述待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图;关系提取单元603,用于根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系。
一实施方式中,所述构建单元,用于:根据OIA将所述待查询句子转换为对应的OIA图;根据所述OIA图中的节点及边,构建对应的所述语义关系图。其中,所述OIA图中的节点及边,用于表征所述目标实体之间的封闭域关系及开放域关系,所述OIA图中的节点包括:对应所述目标实体的目标节点。
一实施方式中,所述语义关系图包括:常量节点,事实关系节点,逻辑关系节点,及连接所述常量节点、所述事实关系节点及所述逻辑关系节点中至少两个节点形成的边。其中,所述常量节点,用于描述所述目标实体;所述事实关系节点,用于描述所述目标实体之间的事实关系表达;所述逻辑关系节点,用于描述所述目标实体与开放域事实之间的逻辑关系。
一实施方式中,所述构建单元,用于:在所述OIA图中,标识对应目标实体对的目标节点对,其中,所述目标实体对包括至少两个所述目标实体。在所述OIA图中,连接所述目标节点对形成的边,得到对应的至少两个开放域事实路径,根据所述至少两个开放域事实路径上的所有节点及边,得到所述语义关系图。其中,所述所有节点中包括所述目标节点对、及由所述待查询句子中除所述目标实体对之外的其他词转换得到的多个非目标节点。
一实施方式中,还包括更新单元,用于:在所述至少两个开放域事实路径上,执行节点信息的查询处理,响应所述查询处理,查询到所述至少两个开放域事实路径上的一条或多条节点链缺失所述节点信息,在所述一条或多条节点链上补全所述节点信息,根据所述节点信息,更新所述语义关系图。
一实施方式中,还包括更新单元,用于:在所述至少两个开放域事实路径上,提取用于描述所述开放域关系的节点表达式,根据所述节点表达式,得到开放域事实,根据所述开放域事实,更新所述语义关系图。
一实施方式中,其中,所述关系提取单元,用于:根据图神经网络提取第一关系信息,其中,所述第一关系信息包括所述语义关系图中用于表征所述目标实体之间关系的信息,根据所述第一关系信息编码后将编码信息输入第一模型,以得到所述目标实体之间的语义关系。
一实施方式中,所述关系提取单元,用于:根据所述第一关系信息进行编码,得到包括第一特征向量的所述编码信息,将所述编码信息输入所述第一模型,根据所述第一模型进行关系提取,得到所述目标实体之间的语义关系。
一实施方式中,所述关系提取单元,用于:根据图神经网络提取第一关系信息,其中,所述第一关系信息包括所述语义关系图中用于表征所述目标实体之间关系的信息。根据所述第一关系信息进行编码,得到第一特征向量。从所述文本数据中获取与所述待查询句子相关的上下文信息,将所述上下文信息编码为第二特征向量,根据所述第一特征向量和所述第二特征向量得到融合特征向量,将所述融合特征向量输入第一模型,以得到所述目标实体之间的语义关系。
一实施方式中,所述关系提取单元,用于:根据图神经网络提取第一关系信息,其中,所述第一关系信息包括所述语义关系图中用于表征所述目标实体之间关系的信息,根据所述第一关系信息进行编码,得到包括第一特征向量的编码信息,将所述编码信息输入第一模型,根据第一模型进行关系提取,得到第一语义关系。从所述文本数据中获取与所述待查询句子相关的上下文信息,将所述上下文信息编码为第二特征向量,将所述第一特征向量输入第二模型进行关系提取,得到第二语义关系,根据所述第一语义关系和所述第二语义关系,得到所述目标实体之间的语义关系。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,电子设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储电子设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
电子设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如语义关系提取方法。例如,在一些实施例中,语义关系提取方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到电子设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的语义关系提取方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行语义关系提取方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (23)
1.一种语义关系提取方法,包括:
从文本数据中获取待查询句子;
根据所述待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图;
根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系。
2.根据权利要求1所述的方法,其中,所述根据所述待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图,包括:
根据开放域信息注释OIA,将所述待查询句子转换为对应的OIA图;
根据所述OIA图中的节点及边,构建对应的所述语义关系图;
其中,所述OIA图中的节点及边,用于表征所述目标实体之间的封闭域关系及开放域关系;
所述OIA图中的节点包括:对应所述目标实体的目标节点。
3.根据权利要求2所述的方法,其中,所述语义关系图包括:常量节点,事实关系节点,逻辑关系节点,及连接所述常量节点、所述事实关系节点及所述逻辑关系节点中至少两个节点形成的边;其中,
所述常量节点,用于描述所述目标实体;
所述事实关系节点,用于描述所述目标实体之间的事实关系表达;
所述逻辑关系节点,用于描述所述目标实体与开放域事实之间的逻辑关系。
4.根据权利要求2所述的方法,其中,所述根据所述OIA图中的节点及边,构建对应的所述语义关系图,包括:
在所述OIA图中,标识对应目标实体对的目标节点对,其中,所述目标实体对包括至少两个所述目标实体;
在所述OIA图中,连接所述目标节点对形成的边,得到对应的至少两个开放域事实路径;
根据所述至少两个开放域事实路径上的所有节点及边,得到所述语义关系图;其中,所述所有节点中包括所述目标节点对、及由所述待查询句子中除所述目标实体对之外的其他词转换得到的多个非目标节点。
5.根据权利要求4所述的方法,还包括:
在所述至少两个开放域事实路径上,执行节点信息的查询处理;
响应所述查询处理,查询到所述至少两个开放域事实路径上的一条或多条节点链缺失所述节点信息;
在所述一条或多条节点链上补全所述节点信息;
根据所述节点信息,更新所述语义关系图。
6.根据权利要求4所述的方法,还包括:
在所述至少两个开放域事实路径上,提取用于描述所述开放域关系的节点表达式;
根据所述节点表达式,得到开放域事实;
根据所述开放域事实,更新所述语义关系图。
7.根据权利要求1-6中任一项所述的方法,其中,所述根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系,包括:
根据图神经网络提取第一关系信息,其中,所述第一关系信息包括所述语义关系图中用于表征所述目标实体之间关系的信息;
根据所述第一关系信息编码后将编码信息输入第一模型,以得到所述目标实体之间的语义关系。
8.根据权利要求7所述的方法,其中,所述根据所述第一关系信息编码后将编码信息输入第一模型,以得到所述目标实体之间的语义关系,包括:
根据所述第一关系信息进行编码,得到包括第一特征向量的所述编码信息;
将所述编码信息输入所述第一模型,根据所述第一模型进行关系提取,得到所述目标实体之间的语义关系。
9.根据权利要求1-6中任一项所述的方法,其中,所述根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系,包括:
根据图神经网络提取第一关系信息,其中,所述第一关系信息包括所述语义关系图中用于表征所述目标实体之间关系的信息;
根据所述第一关系信息进行编码,得到第一特征向量;
从所述文本数据中获取与所述待查询句子相关的上下文信息,将所述上下文信息编码为第二特征向量;
根据所述第一特征向量和所述第二特征向量得到融合特征向量,将所述融合特征向量输入第一模型,以得到所述目标实体之间的语义关系。
10.根据权利要求1-6中任一项所述的方法,其中,所述根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系,包括:
根据图神经网络提取第一关系信息,其中,所述第一关系信息包括所述语义关系图中用于表征所述目标实体之间关系的信息;
根据所述第一关系信息进行编码,得到包括第一特征向量的编码信息;
将所述编码信息输入第一模型,根据第一模型进行关系提取,得到第一语义关系;
从所述文本数据中获取与所述待查询句子相关的上下文信息,将所述上下文信息编码为第二特征向量;
将所述第一特征向量输入第二模型进行关系提取,得到第二语义关系;
根据所述第一语义关系和所述第二语义关系,得到所述目标实体之间的语义关系。
11.一种语义关系提取装置,包括:
获取单元,用于从文本数据中获取待查询句子;
构建单元,用于根据所述待查询句子中目标实体之间的封闭域关系及开放域关系,构建用于关系提取的语义关系图;
关系提取单元,用于根据所述语义关系图进行关系提取处理,得到所述目标实体之间的语义关系。
12.根据权利要求11所述的装置,其中,所述构建单元,用于:
根据开放域信息注释OIA,将所述待查询句子转换为对应的OIA图;
根据所述OIA图中的节点及边,构建对应的所述语义关系图;
其中,所述OIA图中的节点及边,用于表征所述目标实体之间的封闭域关系及开放域关系;
所述OIA图中的节点包括:对应所述目标实体的目标节点。
13.根据权利要求12所述的装置,其中,所述语义关系图包括:常量节点,事实关系节点,逻辑关系节点,及连接所述常量节点、所述事实关系节点及所述逻辑关系节点中至少两个节点形成的边;其中,
所述常量节点,用于描述所述目标实体;
所述事实关系节点,用于描述所述目标实体之间的事实关系表达;
所述逻辑关系节点,用于描述所述目标实体与开放域事实之间的逻辑关系。
14.根据权利要求12所述的装置,其中,所述构建单元,用于:
在所述OIA图中,标识对应目标实体对的目标节点对,其中,所述目标实体对包括至少两个所述目标实体;
在所述OIA图中,连接所述目标节点对形成的边,得到对应的至少两个开放域事实路径;
根据所述至少两个开放域事实路径上的所有节点及边,得到所述语义关系图;其中,所述所有节点中包括所述目标节点对、及由所述待查询句子中除所述目标实体对之外的其他词转换得到的多个非目标节点。
15.根据权利要求14所述的装置,还包括更新单元,用于:
在所述至少两个开放域事实路径上,执行节点信息的查询处理;
响应所述查询处理,查询到所述至少两个开放域事实路径上的一条或多条节点链缺失所述节点信息;
在所述一条或多条节点链上补全所述节点信息;
根据所述节点信息,更新所述语义关系图。
16.根据权利要求14所述的装置,还包括更新单元,用于:
在所述至少两个开放域事实路径上,提取用于描述所述开放域关系的节点表达式;
根据所述节点表达式,得到开放域事实;
根据所述开放域事实,更新所述语义关系图。
17.根据权利要求11-16中任一项所述的装置,其中,所述关系提取单元,用于:
根据图神经网络提取第一关系信息,其中,所述第一关系信息包括所述语义关系图中用于表征所述目标实体之间关系的信息;
根据所述第一关系信息编码后将编码信息输入第一模型,以得到所述目标实体之间的语义关系。
18.根据权利要求17所述的装置,其中,所述关系提取单元,用于:
根据所述第一关系信息进行编码,得到包括第一特征向量的所述编码信息;
将所述编码信息输入所述第一模型,根据所述第一模型进行关系提取,得到所述目标实体之间的语义关系。
19.根据权利要求11-16中任一项所述的装置,其中,所述关系提取单元,用于:
根据图神经网络提取第一关系信息,其中,所述第一关系信息包括所述语义关系图中用于表征所述目标实体之间关系的信息;
根据所述第一关系信息进行编码,得到第一特征向量;
从所述文本数据中获取与所述待查询句子相关的上下文信息,将所述上下文信息编码为第二特征向量;
根据所述第一特征向量和所述第二特征向量得到融合特征向量,将所述融合特征向量输入第一模型,以得到所述目标实体之间的语义关系。
20.根据权利要求11-16中任一项所述的装置,其中,所述关系提取单元,用于:
根据图神经网络提取第一关系信息,其中,所述第一关系信息包括所述语义关系图中用于表征所述目标实体之间关系的信息;
根据所述第一关系信息进行编码,得到包括第一特征向量的编码信息;
将所述编码信息输入第一模型,根据第一模型进行关系提取,得到第一语义关系;
从所述文本数据中获取与所述待查询句子相关的上下文信息,将所述上下文信息编码为第二特征向量;
将所述第一特征向量输入第二模型进行关系提取,得到第二语义关系;
根据所述第一语义关系和所述第二语义关系,得到所述目标实体之间的语义关系。
21.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。
23.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111644051.4A CN114266258B (zh) | 2021-12-30 | 2021-12-30 | 一种语义关系提取方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111644051.4A CN114266258B (zh) | 2021-12-30 | 2021-12-30 | 一种语义关系提取方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114266258A true CN114266258A (zh) | 2022-04-01 |
CN114266258B CN114266258B (zh) | 2023-06-23 |
Family
ID=80831535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111644051.4A Active CN114266258B (zh) | 2021-12-30 | 2021-12-30 | 一种语义关系提取方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114266258B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116484870A (zh) * | 2022-09-09 | 2023-07-25 | 北京百度网讯科技有限公司 | 提取文本信息的方法、装置、设备、介质及计算机产品 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150331850A1 (en) * | 2014-05-16 | 2015-11-19 | Sierra Nevada Corporation | System for semantic interpretation |
CN109271459A (zh) * | 2018-09-18 | 2019-01-25 | 四川长虹电器股份有限公司 | 基于Lucene和文法网络的聊天机器人及其实现方法 |
US20190108639A1 (en) * | 2017-10-09 | 2019-04-11 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and Methods for Semantic Segmentation of 3D Point Clouds |
US10387575B1 (en) * | 2019-01-30 | 2019-08-20 | Babylon Partners Limited | Semantic graph traversal for recognition of inferred clauses within natural language inputs |
CN112115245A (zh) * | 2020-08-31 | 2020-12-22 | 深圳市欢太科技有限公司 | 查询语句处理方法、装置、终端及存储介质 |
CN112269884A (zh) * | 2020-11-13 | 2021-01-26 | 北京百度网讯科技有限公司 | 信息抽取方法、装置、设备及存储介质 |
US10943072B1 (en) * | 2019-11-27 | 2021-03-09 | ConverSight.ai, Inc. | Contextual and intent based natural language processing system and method |
CN112507715A (zh) * | 2020-11-30 | 2021-03-16 | 北京百度网讯科技有限公司 | 确定实体之间关联关系的方法、装置、设备和存储介质 |
WO2021147726A1 (zh) * | 2020-01-21 | 2021-07-29 | 京东方科技集团股份有限公司 | 信息抽取方法、装置、电子设备及存储介质 |
US20210264190A1 (en) * | 2020-06-29 | 2021-08-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Image questioning and answering method, apparatus, device and storage medium |
CN113468333A (zh) * | 2021-09-02 | 2021-10-01 | 华东交通大学 | 一种融合层次类别信息的事件检测方法与系统 |
CN113486189A (zh) * | 2021-06-08 | 2021-10-08 | 广州数说故事信息科技有限公司 | 一种开放性知识图谱挖掘方法及系统 |
-
2021
- 2021-12-30 CN CN202111644051.4A patent/CN114266258B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150331850A1 (en) * | 2014-05-16 | 2015-11-19 | Sierra Nevada Corporation | System for semantic interpretation |
US20190108639A1 (en) * | 2017-10-09 | 2019-04-11 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and Methods for Semantic Segmentation of 3D Point Clouds |
CN109271459A (zh) * | 2018-09-18 | 2019-01-25 | 四川长虹电器股份有限公司 | 基于Lucene和文法网络的聊天机器人及其实现方法 |
US10387575B1 (en) * | 2019-01-30 | 2019-08-20 | Babylon Partners Limited | Semantic graph traversal for recognition of inferred clauses within natural language inputs |
US10943072B1 (en) * | 2019-11-27 | 2021-03-09 | ConverSight.ai, Inc. | Contextual and intent based natural language processing system and method |
WO2021147726A1 (zh) * | 2020-01-21 | 2021-07-29 | 京东方科技集团股份有限公司 | 信息抽取方法、装置、电子设备及存储介质 |
US20210264190A1 (en) * | 2020-06-29 | 2021-08-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Image questioning and answering method, apparatus, device and storage medium |
CN112115245A (zh) * | 2020-08-31 | 2020-12-22 | 深圳市欢太科技有限公司 | 查询语句处理方法、装置、终端及存储介质 |
CN112269884A (zh) * | 2020-11-13 | 2021-01-26 | 北京百度网讯科技有限公司 | 信息抽取方法、装置、设备及存储介质 |
CN112507715A (zh) * | 2020-11-30 | 2021-03-16 | 北京百度网讯科技有限公司 | 确定实体之间关联关系的方法、装置、设备和存储介质 |
CN113486189A (zh) * | 2021-06-08 | 2021-10-08 | 广州数说故事信息科技有限公司 | 一种开放性知识图谱挖掘方法及系统 |
CN113468333A (zh) * | 2021-09-02 | 2021-10-01 | 华东交通大学 | 一种融合层次类别信息的事件检测方法与系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116484870A (zh) * | 2022-09-09 | 2023-07-25 | 北京百度网讯科技有限公司 | 提取文本信息的方法、装置、设备、介质及计算机产品 |
CN116484870B (zh) * | 2022-09-09 | 2024-01-05 | 北京百度网讯科技有限公司 | 提取文本信息的方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114266258B (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220350965A1 (en) | Method for generating pre-trained language model, electronic device and storage medium | |
CN112560496B (zh) | 语义分析模型的训练方法、装置、电子设备及存储介质 | |
CN111931506B (zh) | 一种基于图信息增强的实体关系抽取方法 | |
CN111344779A (zh) | 训练和/或使用编码器模型确定自然语言输入的响应动作 | |
KR20220005416A (ko) | 다항 관계 생성 모델의 트레이닝 방법, 장치, 전자 기기 및 매체 | |
CN113127624B (zh) | 问答模型的训练方法及装置 | |
EP4113357A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN113806552B (zh) | 信息提取方法、装置、电子设备和存储介质 | |
Irsoy et al. | Bidirectional recursive neural networks for token-level labeling with structure | |
CN113987179A (zh) | 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质 | |
CN113204611A (zh) | 建立阅读理解模型的方法、阅读理解方法及对应装置 | |
US20230094730A1 (en) | Model training method and method for human-machine interaction | |
EP4109443A2 (en) | Method for correcting text, method for generating text correction model, device and medium | |
US12038955B2 (en) | Method for generating query statement, electronic device and storage medium | |
CN113326367A (zh) | 基于端到端文本生成的任务型对话方法和系统 | |
CN113641830A (zh) | 模型预训练方法、装置、电子设备和存储介质 | |
CN114266258B (zh) | 一种语义关系提取方法、装置、电子设备及存储介质 | |
KR20210125449A (ko) | 업계 텍스트를 증분하는 방법, 관련 장치 및 매체에 저장된 컴퓨터 프로그램 | |
CN112183062A (zh) | 一种基于交替解码的口语理解方法、电子设备和存储介质 | |
US20230267286A1 (en) | Translation model training method, translation method, apparatus, device, and storage medium | |
CN114398903B (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN115964486A (zh) | 一种基于数据增强的小样本意图识别方法 | |
CN112905917B (zh) | 内链生成方法、模型训练方法、相关装置及电子设备 | |
CN114416941A (zh) | 融合知识图谱的对话知识点确定模型的生成方法及装置 | |
Ganesh | Reinforcement Learning on Social Chabot to Improve the Semantic Variation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |