CN116702785B - 关系标签的处理方法和装置、存储介质及电子设备 - Google Patents
关系标签的处理方法和装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN116702785B CN116702785B CN202310970704.0A CN202310970704A CN116702785B CN 116702785 B CN116702785 B CN 116702785B CN 202310970704 A CN202310970704 A CN 202310970704A CN 116702785 B CN116702785 B CN 116702785B
- Authority
- CN
- China
- Prior art keywords
- entity
- vectors
- ith
- tail
- head
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 238000003672 processing method Methods 0.000 title abstract description 16
- 239000013598 vector Substances 0.000 claims abstract description 693
- 238000012512 characterization method Methods 0.000 claims abstract description 113
- 238000000034 method Methods 0.000 claims abstract description 63
- 238000012545 processing Methods 0.000 claims abstract description 51
- 230000008859 change Effects 0.000 claims description 156
- 238000004590 computer program Methods 0.000 claims description 17
- 230000009471 action Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 abstract description 19
- 238000012549 training Methods 0.000 description 19
- 238000000605 extraction Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 9
- 238000010276 construction Methods 0.000 description 6
- 238000012935 Averaging Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了一种关系标签的处理方法和装置、存储介质及电子设备。该方法可以但不限于应用于地图或交通领域,包括:获取N个实体对以及N个类别标签对;获取N个实体对中N个头实体的特征向量,得到N个头实体特征向量,获取N个实体对中N个尾实体的特征向量,得到N个尾实体特征向量,获取N个头实体的实体类别标签的标签向量,得到N个头实体标签向量,获取N个尾实体的实体类别标签的标签向量,得到N个尾实体标签向量;对N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量进行拼接,得到N个表征向量;根据N个表征向量,确定N个关系标签。本申请解决了在关系标签的处理过程中出现的效率较低的技术问题。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种关系标签的处理方法和装置、存储介质及电子设备。
背景技术
随着互联网上非结构化文本数据越来越多,文本中各个实施对之间的关系标签的处理和分析也扮演着愈加重要的作用,目前较为流行的关系抽取模型都是基于一对指定的实体来判定其关系的。
然而,由于中文文本或其他文本的负复杂性,对于多个实体所组成的多个实体对无法直接输出其关系,必须要多次输入模型,才能得到多个关系的判定结果。随着句子中实体的个数的增多,所需要判定的关系(实体对)也成指数型增长,模型推理所需的时间也成指数型增长,耗费了大量的时间,从而造成了关系标签的处理过程中出现的效率较低的技术问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种关系标签的处理方法和装置、存储介质及电子设备,以至少解决关系标签的处理过程中出现的效率较低的技术问题。
根据本申请实施例的一个方面,提供了一种关系标签的处理方法,包括:获取N个实体对以及N个类别标签对,其中,N为大于或等于2的正整数,N个实体对中的每个实体对包括待确定关系标签的头实体和尾实体,N个类别标签对包括N个实体对中的每个头实体和每个尾实体的实体类别标签,每个实体对包括排列在前的一个头实体和排列在后的一个尾实体,头实体包括目标文本中的一个词语或一个短语,尾实体包括目标文本中的一个词语或一个短语;根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定N个实体对的N个关系标签,其中,N个头实体特征向量是N个实体对中的N个头实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体特征向量是N个实体对中的N个尾实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体标签向量是N个尾实体的标签向量;在根据N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,其中,目标场景中的事件发生变化包括事件发生的时间信息和/或动作信息发生变化,目标事件变化信息用于表示目标场景中的事件发生变化。
可选地,上述根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定N个实体对的N个关系标签,包括:获取N个实体对中的N个头实体的特征向量,得到N个头实体特征向量,获取N个实体对中的N个尾实体的特征向量,得到N个尾实体特征向量,获取N个类别标签对中的N个头实体的实体类别标签的标签向量,得到N个头实体标签向量,并获取N个类别标签对中的N个尾实体的实体类别标签的标签向量,得到N个尾实体标签向量;对N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量进行拼接,得到N个实体对对应的N个表征向量;根据N个表征向量,确定N个实体对的N个关系标签,其中,N个关系标签中的每个关系标签用于表示N个实体对中对应的一个实体对中的头实体与尾实体之间的关系。
可选地,上述获取N个实体对中的N个头实体的特征向量,得到N个头实体特征向量,包括:通过以下步骤获取N个头实体中的第i个头实体的特征向量,得到第i个头实体特征向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个头实体包括Mi个字的情况下,获取Mi个字中的每个字的语义表征向量,得到Mi个语义表征向量,其中,Mi为大于或等于1的正整数;对Mi个语义表征向量执行平均操作,得到第i个头实体特征向量;或者,对Mi个语义表征向量执行加权求和操作,得到第i个头实体特征向量。
可选地,上述获取N个实体对中的N个尾实体的特征向量,得到N个尾实体特征向量,包括:通过以下步骤获取N个尾实体中的第i个尾实体的特征向量,得到第i个尾实体特征向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个尾实体包括Pi个字的情况下,获取Pi个字中的每个字的语义表征向量,得到Pi个语义表征向量,其中,Pi为大于或等于1的正整数;对Pi个语义表征向量执行平均操作,得到第i个尾实体特征向量;或者,对Pi个语义表征向量执行加权求和操作,得到第i个尾实体特征向量。
可选地,上述获取N个类别标签对中的N个头实体的实体类别标签的标签向量,得到N个头实体标签向量,包括:通过以下步骤获取N个头实体中的第i个头实体的实体类别标签的标签向量,得到第i个头实体标签向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个头实体的实体类别标签包括第i个词的情况下,获取第i个词的语义表征向量,其中,第i个头实体标签向量为第i个词的语义表征向量。
可选地,上述获取N个类别标签对中的N个尾实体的实体类别标签的标签向量,得到N个尾实体标签向量,包括:通过以下步骤获取N个尾实体中的第i个尾实体的实体类别标签的标签向量,得到第i个尾实体标签向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个尾实体的实体类别标签包括第i个词的情况下,获取第i个词的语义表征向量,其中,第i个尾实体标签向量为第i个词的语义表征向量。
可选地,上述对N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量进行拼接,得到N个实体对对应的N个表征向量,包括:通过以下步骤得到N个实体对中的第i个实体对对应的第i个表征向量,其中,第i个实体对包括第i个头实体和第i个尾实体,i为大于或等于1、且小于或等于N的正整数:对第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到第i个表征向量,其中,第i个头实体特征向量是第i个头实体的特征向量,第i个头实体标签向量是第i个头实体的实体类别标签的标签向量,第i个尾实体特征向量是第i个尾实体的特征向量,第i个尾实体标签向量是第i个尾实体的实体类别标签的标签向量。
可选地,上述对第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到第i个表征向量,包括:对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到第i个表征向量,其中,文本起始特征向量用于表征目标文本的起始位置,N个实体对中的实体是从目标文本中提取到的实体。
可选地,上述对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到第i个表征向量,包括:在文本起始特征向量的维度、第i个头实体特征向量的维度、第i个头实体标签向量的维度、第i个尾实体特征向量的维度与第i个尾实体标签向量的维度均为1×Q的情况下,对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到维度为5×Q的第i个表征向量,其中,Q为大于或等于2的正整数。
可选地,上述根据N个表征向量,确定N个实体对的N个关系标签,包括:通过以下步骤根据N个表征向量中的第i个表征向量确定N个实体对中的第i个实体对的第i个关系标签,其中,i为大于或等于1、且小于或等于N的正整数:将第i个表征向量输入关系分类层,得到与R个关系标签对应的R个预测结果,其中,R个预测结果用于表示第i个关系标签是R个预设关系标签中的各个预设标签的概率,R为大于或等于2的正整数;将第i个关系标签确定等于R个预设关系标签中的目标关系标签,其中,在R个预测结果中,第i个关系标签是目标关系标签的概率最大。
可选地,上述根据N个表征向量,确定N个实体对的N个关系标签,包括:将N个表征向量分批输入到关系分类层,得到每批表征向量对应的预测结果集合,其中,每批表征向量包括N个表征向量中的S个表征向量,每批表征向量对应的预测结果集合包括S组预测结果,S组预测结果中的每组预测结果包括R个预测结果,第j组预测结果包括的R个预测结果用于表示第j个表征向量对应的第j个关系标签是R个预设关系标签中的各个预设标签的概率,第j组预测结果与S个表征向量中的第j个表征向量对应,R为大于或等于2的正整数,S为大于或等于2、且小于N的正整数,j为大于或等于1、且小于或等于S的正整数;根据每批表征向量对应的预测结果集合,确定每批表征向量中包括的S个表征向量对应的S个关系标签。
可选地,上述根据每批表征向量对应的预测结果集合,确定每批表征向量中包括的S个表征向量对应的S个关系标签,包括:通过以下步骤根据预测结果集合中的第j组预测结果确定S个关系标签中的第j个关系标签:将第j个关系标签确定等于R个预设关系标签中的目标关系标签,其中,在第j组预测结果包括的R个预测结果中,第j个关系标签是目标关系标签的概率最大。
可选地,上述获取N个实体对以及N个类别标签对,包括:在目标文本中提取出具有一一对应关系的T个实体和T个实体类别标签,其中,T个实体类别标签包括T个实体中的每个实体的实体类别标签,T个实体中的每个实体包括目标文本中的一个词语或一个短语;将T个实体中N种组合的两个实体组成N个实体对,其中,N个实体对中的每个实体对包括T个实体中一种组合的两个实体,一种组合的两个实体中排列在前的实体为头实体,排列在后的实体为尾实体;在T个实体类别标签中确定N个实体对中的每个实体对中包括的头实体和尾实体的实体类别标签,得到N个类别标签对。
可选地,上述N个关系标签中的每个关系标签表示的头实体与尾实体之间的关系是预设的R种关系中的一种关系,其中,R为大于或等于2的正整数,R种关系包括R-1种预设关系和无关系。
可选地,上述在根据N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,包括:在目标场景中的事件为目标路段的道路通断事件、且一组关系标签包括目标路段的时间关系标签和目标路段的通断状态关系标签的情况下,将目标事件变化信息发送给目标业务平台,其中,目标事件变化信息用于表示目标路段的通断状态发生变化以及通断状态发生变化的时间,通断状态关系标签用于表示目标路段的通断状态发生变化,目标路段的时间关系标签用于表示通断状态发生变化的时间,通断状态用于表示目标路段处于通行状态或封闭状态;或者在目标场景中的事件为目标收费站的收费事件、且一组关系标签包括目标收费站的时间关系标签和目标收费站的收费状态关系标签的情况下,将目标事件变化信息发送给目标业务平台,其中,目标事件变化信息用于表示目标收费站的收费状态发生变化以及收费状态发生变化的时间,收费状态关系标签用于表示目标收费站的收费状态发生变化,目标收费站的时间关系标签用于表示收费状态发生变化的时间,收费状态用于表示目标收费站处于收费状态或免费状态。
可选地,上述将目标事件变化信息发送给目标业务平台,包括:在目标事件变化信息用于表示目标路段的通断状态发生变化以及通断状态发生变化的时间的情况下,将目标事件变化信息发送给目标业务平台,并存储在目标业务平台中的地图数据库中,以在基于地图数据库形成的地图中显示目标路段的道路变化提示信息,其中,道路变化提示信息用于提示目标路段的通断状态发生变化以及通断状态发生变化的时间;或者在目标事件变化信息用于表示目标收费站的收费状态发生变化以及收费状态发生变化的时间的情况下,将目标事件变化信息发送给目标业务平台,并存储在目标业务平台中的地图数据库中,以在基于地图数据库形成的地图中显示目标收费站的收费化提示信息,其中,收费变化提示信息用于提示目标收费站的收费状态发生变化以及收费状态发生变化的时间。
根据本申请实施例的另一方面,还提供了一种关系标签的处理装置,包括:第一获取单元,用于获取N个实体对以及N个类别标签对,其中,N为大于或等于2的正整数,N个实体对中的每个实体对包括待确定关系标签的头实体和尾实体,N个类别标签对包括N个实体对中的每个头实体和每个尾实体的实体类别标签,每个实体对包括排列在前的一个头实体和排列在后的一个尾实体,头实体包括目标文本中的一个词语或一个短语,尾实体包括目标文本中的一个词语或一个短语;第一处理单元,用于根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定N个实体对的N个关系标签,其中,N个头实体特征向量是N个实体对中的N个头实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体特征向量是N个实体对中的N个尾实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体标签向量是N个尾实体的标签向量;第一发送单元,用于在根据N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,其中,目标场景中的事件发生变化包括事件发生的时间信息和/或动作信息发生变化,目标事件变化信息用于表示目标场景中的事件发生变化。
根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述关系标签的处理方法。
根据本申请实施例的又一方面,还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述方法的步骤。
根据本申请实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过计算机程序执行上述关系标签的处理方法。
通过本申请提供的上述实施例,通过对N个实体对中的N个头实体的N个头实体特征向量、N个实体对中的N个尾实体的特征向量、N个头实体标签对中的N个头实体的实体类别标签的标签向量以及N个尾实体的实体类别标签的标签向量进行拼接,得到N个实体对对应的N个表征向量,并根据N个表征向量,确定N个实体对的N个关系标签。也就是说,根据N个实体对的N个表征向量,可以一次输出多个实体对的关系标签,减少了模型训练时间及模型推理时间,提高了确定关系标签的效率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是根据本申请实施例的一种可选的关系标签的处理方法的应用场景的示意图。
图2是根据本申请实施例的一种可选的关系标签的处理方法的流程图。
图3是根据本申请实施例的一种可选的获取N个实体对和N个类别标签对的示意图。
图4是根据本申请实施例的一种可选的数据处理的整体示意图。
图5是根据本申请实施例的一种可选的关系提取模型的整体框架。
图6是是根据本申请实施例的一种可选的获取头实体的语义表征向量的示意图。
图7是根据本申请实施例的一种可选的利用关系分类层确定N个关系标签的示意图(一)。
图8是根据本申请实施例的一种可选的利用关系分类层确定N个关系标签的示意图(二)。
图9是根据本申请实施例的一种可选的利用关系分类层确定N个关系标签的示意图(三)。
图10是根据本申请实施例的一种可选的关系分类层的结构示意图。
图11是根据本申请实施例的一种可选的关系标签的处理装置的结构示意图。
图12是根据本申请实施例的一种可选的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例中的技术方案在实施过程中会遵循法律规定,在按照实施例中的技术方案执行操作时,所使用的数据不会涉及用户隐私,在确保操作过程是合规合法的同时,保证了数据的安全性。
根据本申请实施例的一个方面,提供了一种关系标签的处理方法。作为一种可选的实施方式,上述关系标签的处理方法可以但不限于应用于如图1所示的应用场景。在如图1所示的应用场景中,终端设备102可以但不限于通过网络104与服务器106进行通信,服务器106可以但不限于对数据库108执行操作,例如,写数据操作或读数据操作。上述终端设备102可以但不限包括人机交互屏幕、处理器及存储器。上述人机交互屏幕可以但不限于用于显示在终端设备102上的目标文本、个女警目标文本确定得到的N个实体对等。上述处理器可以但不限于用于响应上述人机交互操作,执行对应的操作,或者,生成对应的指令,并将生成的指令发送给服务器106。上述存储器用于存储相关处理数据,如N个类别标签对、N个表征向量以及N个关系标签等。
作为一种可选的方式,可以在服务器106上执行关系标签的处理方法中的以下步骤:步骤S102,获取N个实体对以及N个类别标签对,其中,N为大于或等于2的正整数,N个实体对中的每个实体对包括待确定关系标签的头实体和尾实体,N个类别标签对包括N个实体对中的每个头实体和每个尾实体的实体类别标签,每个实体对包括排列在前的一个头实体和排列在后的一个尾实体,头实体包括目标文本中的一个词语或一个短语,尾实体包括目标文本中的一个词语或一个短语;步骤S104,根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定N个实体对的N个关系标签,其中,N个头实体特征向量是N个实体对中的N个头实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体特征向量是N个实体对中的N个尾实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体标签向量是N个尾实体的标签向量;步骤S106,在根据N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,其中,目标场景中的事件发生变化包括事件发生的时间信息和/或动作信息发生变化,目标事件变化信息用于表示目标场景中的事件发生变化。
需要说明的是,上述关系标签的处理方法可以但不限于应用于道路开通封闭的文本事件抽取场景中,文本内容均来自网络信息(比如微博、公众号等文章)。在文本事件抽取的场景中,需要对文本中的一些道路名、开通、封闭、施工、时间等实体进行识别出来,同时还需要通过本申请实施例中的技术方案,利用关系抽取将实体之间的关系找出来,并将实体和关系组成相应的开通封闭事件。在开封产线中,如果互联网文本中存在开封相关事件,则会推送到作业平台,经过人工作业后写入地图母库数据。
采用上述方式,通过对N个实体对中的N个头实体的N个头实体特征向量、N个实体对中的N个尾实体的特征向量、N个头实体标签对中的N个头实体的实体类别标签的标签向量以及N个尾实体的实体类别标签的标签向量进行拼接,得到N个实体对对应的N个表征向量,并根据N个表征向量,确定N个实体对的N个关系标签。也就是说,根据N个实体对的N个表征向量,可以一次输出多个实体对的关系标签,减少了模型训练时间及模型推理时间,提高了确定关系标签的效率。
为了解决上述关系标签的确定过程中出现的效率较低的问题,本申请实施例中提出了一种关系标签的处理方法,图2是根据本申请实施例的关系标签的处理方法的流程图,该流程包括以下步骤S202~步骤S206。
步骤S202,获取N个实体对以及N个类别标签对,其中,N为大于或等于2的正整数,N个实体对中的每个实体对包括待确定关系标签的头实体和尾实体,N个类别标签对包括N个实体对中的每个头实体和每个尾实体的实体类别标签,每个实体对包括排列在前的一个头实体和排列在后的一个尾实体,头实体包括目标文本中的一个词语或一个短语,尾实体包括目标文本中的一个词语或一个短语。
步骤S204,根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定N个实体对的N个关系标签,其中,N个头实体特征向量是N个实体对中的N个头实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体特征向量是N个实体对中的N个尾实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体标签向量是N个尾实体的标签向量。
步骤S206,在根据N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,其中,目标场景中的事件发生变化包括事件发生的时间信息和/或动作信息发生变化,目标事件变化信息用于表示目标场景中的事件发生变化。
作为一种可选的示例,上述获取N个实体对以及N个类别标签对,包括:在目标文本中提取出具有一一对应关系的T个实体和T个实体类别标签,其中,T个实体类别标签包括T个实体中的每个实体的实体类别标签,T个实体中的每个实体包括目标文本中的一个词语或一个短语;将T个实体中N种组合的两个实体组成N个实体对,其中,N个实体对中的每个实体对包括T个实体中一种组合的两个实体,一种组合的两个实体中排列在前的实体为头实体,排列在后的实体为尾实体;在T个实体类别标签中确定N个实体对中的每个实体对中包括的头实体和尾实体的实体类别标签,得到N个类别标签对。
举例来说,如图3所示,假设目标文本为“学校门口聚集了三辆客车”,那么将该文本汇总的一个词语或一个短语确定为一个实体,例如,学校为实体1、门口为实体2、聚集为实体3等。
那么将实体1与实体2作为实体对1、实体1和实体3作为实体对2、实体1和实体4作为实体对3等,其中,每个实体对中排列在前的实体作为头实体、排列在后的实体作为尾实体,每个头实体和每个尾实体各自对应一个实体类别标签,该实体类别标签可以但不限于表示头实体中的词语或短语的语义,或者表示尾实体中的词语或短语的语义。
例如,如图4所示,实体1“楚祥街”的实体类别标签为路,实体2“2023年”的实体类别标签为时间,实体3“计划”的实体类别标签为未来等。
在按照预设组合方式得到如图3所示的N个实体对之后,还可以从目标文本中提取出与N个实体对具有一一对应关系的N个类别标签对,例如,实体1和实体2构成的实体对1,具有第1个类别标签对(类别1和类别2);实体1和实体3构成的实体对2,具有第2个类别标签对(类别1和类别3)等。
除了图3所示的获取N个实体对的方式之外,还可以根据T个实体中的词语或短语的词性来构成N个实体对,例如,动词+名词的组合方式,得到实体对;或者形容词+名词的方式构成实体对等。
又例如,按照上述方法,根据图4所示的目标文本,确定出实体对1中的头实体“楚祥街”和尾实体“全封闭”、实体对2中的头实体“楚祥街”和尾实体“施工”、实体对3中的透视实体“楚祥街”和尾实体“2023年”等。
采用上述方式,通过将实体类别标签作为关系判别的其中一个特征,使得参与确定关系标签的各个实体对中的两个实体之间存在一定的逻辑关系。例如,“楚祥街道路全封闭施工公告!公告楚祥街道路建设工程为2023年城建重点工程”这句话,关系抽取的结果可能为“楚祥街”-“楚祥街”(关系类别为“变化”),但是实际上两条“路”之间不可能存在关系,且“变化”这种关系应为是“路”和“动作”(比如这里的“全封闭”、“施工”)。
利用如图5所示的关系提取模型,并根据上述N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定N个实体对的N个关系标签;然后根据N个关系标签中的一组关系标签,确定目标场景中的时间是否发生变化,并在确定目标事件发生变化的情况下,将目标时间的变化信息发送给目标业务平台。
需要说明的是,上述目标场景包括但不限于地图或交通场景,上述目标事件包括但不限于道路封闭或开通的状态变化、交通场景中的收费站的收费或免费的状态发生变化等。下面会结合具体实施例对目标事件的确定及目标事件发生变化后的执行步骤进行详细描述。
作为一种可选的实现方式,上述在根据N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,包括:在目标场景中的事件为目标路段的道路通断事件、且一组关系标签包括目标路段的时间关系标签和目标路段的通断状态关系标签的情况下,将目标事件变化信息发送给目标业务平台,其中,目标事件变化信息用于表示目标路段的通断状态发生变化以及通断状态发生变化的时间,通断状态关系标签用于表示目标路段的通断状态发生变化,目标路段的时间关系标签用于表示通断状态发生变化的时间,通断状态用于表示目标路段处于通行状态或封闭状态;或者在目标场景中的事件为目标收费站的收费事件、且一组关系标签包括目标收费站的时间关系标签和目标收费站的收费状态关系标签的情况下,将目标事件变化信息发送给目标业务平台,其中,目标事件变化信息用于表示目标收费站的收费状态发生变化以及收费状态发生变化的时间,收费状态关系标签用于表示目标收费站的收费状态发生变化,目标收费站的时间关系标签用于表示收费状态发生变化的时间,收费状态用于表示目标收费站处于收费状态或免费状态。
举例来说,当目标场景中的时间为目标路段的道路通断事件时,将目标文本输入如图5所示的关系提取模型,得到一组关系标签,例如,一组关系标签中的第1个关系标签指示目标路段“楚祥街”从开通状态变为“封闭”、第2个关系标签指示目标文本的上传时间为基于当前时间之前的有效时间(例如,距离当前日期的前1天)、第3个关系标签指示“楚祥街”是位于A城市B城区的一个主干道。那么根据这样一组关系标签可以构成有效的目标事件1。
又例如,在将目标文本输入如图5所示的关系提取模型之后,得到一组关系标签,其中,一组关系标签包括但不限于时间关系标签、收费站从收费改为免费的状态变化标签以及地址关系标签为“未变化”,在此情况下,也就意味着在有效的时间段内,目标地点的收费站从收费状态改为免费状态,那么就构成目标事件2。
在确定目标事件1和目标事件2之后,可以但不限于执行如下处理:在目标事件变化信息用于表示目标路段的通断状态发生变化以及通断状态发生变化的时间的情况下,将目标事件变化信息发送给目标业务平台,并存储在目标业务平台中的地图数据库中,以在基于地图数据库形成的地图中显示目标路段的道路变化提示信息,其中,道路变化提示信息用于提示目标路段的通断状态发生变化以及通断状态发生变化的时间;或者在目标事件变化信息用于表示目标收费站的收费状态发生变化以及收费状态发生变化的时间的情况下,将目标事件变化信息发送给目标业务平台,并存储在目标业务平台中的地图数据库中,以在基于地图数据库形成的地图中显示目标收费站的收费化提示信息,其中,收费变化提示信息用于提示目标收费站的收费状态发生变化以及收费状态发生变化的时间。
在根据一组关系标签,确定目标路段的道路通断状态发生变化的情况下,人工审核该路段的通断状态是否发生变化,在审核通过的情况下,将上述道路通断状态变化信息上传到地图数据库,以对客户端侧的地图信息进行更新,例如,在更新后的导航信息中显示目标路段为封闭状态的提示信息。
又例如,在根据一组关系标签,确定收费章的收费状态发生变化的情况下,人工审核该收费站的收费状态是否发生变化,在审核通过的情况下,将上述收费状态变化信息上传到地图数据库,以提醒用户出行线路上即将通过的各个收费站的收费信息。
通过上述方式,利用本申请实施例中得到的一组关系标签,可以对道路信息、收费站的收费信息的时间变化信息进行及时更新,为用户的出行提供了便捷,提高了适用范围。
作为一种可选的示例,上述根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定N个实体对的N个关系标签,包括:获取N个实体对中的N个头实体的特征向量,得到N个头实体特征向量,获取N个实体对中的N个尾实体的特征向量,得到N个尾实体特征向量,获取N个类别标签对中的N个头实体的实体类别标签的标签向量,得到N个头实体标签向量,并获取N个类别标签对中的N个尾实体的实体类别标签的标签向量,得到N个尾实体标签向量;对N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量进行拼接,得到N个实体对对应的N个表征向量;根据N个表征向量,确定N个实体对的N个关系标签,其中,N个关系标签中的每个关系标签用于表示N个实体对中对应的一个实体对中的头实体与尾实体之间的关系。
在获取N个实体对和N个类别标签对之后,采用如图5所示的关系分类模型中的BERT预训练模型对N个实体对中的N个头实体和N个尾实体、以及N个类别标签对中的N个头实体的实体类别标签和N个尾实体的实体类别标签分别进行特征提取,得到N个头实体的特征向量、N个尾实体的特征向量、N个头实体标签向量以及N个尾实体标签向量。
对N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量进行拼接,得到N个实体对对应的N个表征向量,并根据N个表征向量,确定N个实体对的N个关系标签。
通过本申请提供的上述实施例,通过对N个实体对中的N个头实体的N个头实体特征向量、N个实体对中的N个尾实体的特征向量、N个头实体标签对中的N个头实体的实体类别标签的标签向量以及N个尾实体的实体类别标签的标签向量进行拼接,得到N个实体对对应的N个表征向量,并根据N个表征向量,确定N个实体对的N个关系标签。也就是说,根据N个实体对的N个表征向量,可以一次输出多个实体对的关系标签,减少了模型训练时间及模型推理时间,提高了确定关系标签的效率。
作为一种可选的示例,上述获取N个实体对中的N个头实体的特征向量,得到N个头实体特征向量,包括:通过以下步骤获取N个头实体中的第i个头实体的特征向量,得到第i个头实体特征向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个头实体包括Mi个字的情况下,获取Mi个字中的每个字的语义表征向量,得到Mi个语义表征向量,其中,Mi为大于或等于1的正整数;对Mi个语义表征向量执行平均操作,得到第i个头实体特征向量;或者,对Mi个语义表征向量执行加权求和操作,得到第i个头实体特征向量。
如图5所示,假设第i个头实体为“楚祥街”,可以但不限于采用BERT预训练模型,得到“楚祥街”中的每个字的语义表征向量,具体如图6所示,先得到每个字的字向量,然后结合上下文关系,对每个字向量进行特征融合,最后输出每个字的语义表征向量f1、f2和f3。
其中,BERT(Bidirectional Encoder Representations from Transformers的缩写)是一种新型的语言模型,通过联合调节所有层中的双向Transformer来训练预训练深度双向表示。
通常的Transformer使用一组编码器和解码器网络,而BERT只需要一个额外的输出层,对预训练进行fine-tune,就可以满足各种任务。换句话说,BERT是将多个Transformer编码器堆叠在一起,Transformer基于多头注意力(Multi-head Attention)模块,该模块在视觉和语言任务方面均取得了巨大成功。
如图6所示,利用BERT预训练模型,首先得到第i个头实体“楚祥街”中每个字的字向量v1、v2和v3,然后联系上下文得到每个字的语义表征向量V1、V2和V3。
如图5所示,对BERT输出的语义表征向量V1、V2和V3执行平均(average)操作或者执行加权求和操作,得到第i个头实体表征向量f,其中,假设V1、V2和V3的维度分别为1×768,那么对3个维度均为1×768的语义表征向量执行平均操作,得到维度为1×768的第i个头实体特向量。
采用相同的原理,通过下述方式得到N个尾实体特征向量,具体地,通过以下步骤获取N个尾实体中的第i个尾实体的特征向量,得到第i个尾实体特征向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个尾实体包括Pi个字的情况下,获取Pi个字中的每个字的语义表征向量,得到Pi个语义表征向量,其中,Pi为大于或等于1的正整数;对Pi个语义表征向量执行平均操作,得到第i个尾实体特征向量;或者,对Pi个语义表征向量执行加权求和操作,得到第i个尾实体特征向量。
假设第i个尾实体为“全封闭”,利用BERT预训练模型,首先得到第i个尾实体“楚祥街”中每个字的字向量v4、v5和v6,然后联系上下文得到每个字的语义表征向量V4、V5和V6。
如图5所示,对BERT输出的语义表征向量V4、V5和V6执行平均(average)操作或者执行加权求和操作,得到第i个尾实体表征向量f ',其中,假设V4、V5和V6的维度分别为1×768,那么对3个维度均为1×768的语义表征向量执行平均操作,得到维度为1×768的第i个尾实体特向量。
作为一种可选的实现方式,上述获取N个类别标签对中的N个头实体的实体类别标签的标签向量,得到N个头实体标签向量,包括:通过以下步骤获取N个头实体中的第i个头实体的实体类别标签的标签向量,得到第i个头实体标签向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个头实体的实体类别标签包括第i个词的情况下,获取第i个词的语义表征向量,其中,第i个头实体标签向量为第i个词的语义表征向量。
如图5所示,假设第i个头实体“楚祥街”的实体类别标签为“路”,利用实体类别嵌入层,提取得到“路”的语义表征向量,并将该语义表征向量确定为第i个头实体标签向量。
具体通过实体类别嵌入层,将第i个头实体的实体类别标签“路”映射成对应的标签向量,每个标签向量的维度与BERT输出的文本特征向量(第i个头实体特征向量量)的维度保持一致,均设置为1×768维。
作为另一种可选的实现方式,上述获取N个类别标签对中的N个尾实体的实体类别标签的标签向量,得到N个尾实体标签向量,包括:通过以下步骤获取N个尾实体中的第i个尾实体的实体类别标签的标签向量,得到第i个尾实体标签向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个尾实体的实体类别标签包括第i个词的情况下,获取第i个词的语义表征向量,其中,第i个尾实体标签向量为第i个词的语义表征向量。
如图5所示,假设第i个尾实体“全封闭”的实体类别标签为“封闭”,利用实体类别嵌入层,提取得到“封闭”的语义表征向量,并将该语义表征向量确定为第i个尾实体标签向量。
具体是通过实体类别嵌入层,将第i个尾实体的实体类别标签“封闭”映射成对应的标签向量,该标签向量的维度与BERT输出的文本特征向量(第i个尾实体特征向量)的维度保持一致,均设置为1×768维。
根据上述N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量和N个尾实体标签向量,得到N个实体对对应的N个表征向量,具体包括:通过以下步骤得到N个实体对中的第i个实体对对应的第i个表征向量,其中,第i个实体对包括第i个头实体和第i个尾实体,i为大于或等于1、且小于或等于N的正整数:对第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到第i个表征向量,其中,第i个头实体特征向量是第i个头实体的特征向量,第i个头实体标签向量是第i个头实体的实体类别标签的标签向量,第i个尾实体特征向量是第i个尾实体的特征向量,第i个尾实体标签向量是第i个尾实体的实体类别标签的标签向量。
例如,假设第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量的维度均为1×768,那么拼接后的第i个实体对的第i个表征向量的维度则为4×768。
或者对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到第i个表征向量,其中,文本起始特征向量用于表征目标文本的起始位置,N个实体对中的实体是从目标文本中提取到的实体。
上述对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接的具体实现方式,包括:在文本起始特征向量的维度、第i个头实体特征向量的维度、第i个头实体标签向量的维度、第i个尾实体特征向量的维度与第i个尾实体标签向量的维度均为1×Q的情况下,对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到维度为5×Q的第i个表征向量,其中,Q为大于或等于2的正整数。
其中,假设目标文本的起始符为CLS,该起始符的起始特征向量的维度为1×768,且第i个头实体特征向量的维度、第i个头实体标签向量的维度、第i个尾实体特征向量的维度与第i个尾实体标签向量的维度均为1×768的情况下,对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到维度为5×768的第i个表征向量。
需要说明的是,上述获取N个实体对以及N个类别标签对、N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量以及N个表征向量的过程可以但不限于被理解为数据处理过程,其中,数据处理过程的示意图如图4所示。
数据处理包括训练数据的处理和推理数据的处理两部分,下面分别对两部分处理的具体过程进行描述。
(1)训练阶段:由于训练的数据中除了实体的位置和类别标签外,还有关系的标签,这里我们需要对关系增加一个类别,即“非关系”类别。假定训练样本(1条样本)中一共有M个实体、N个关系(N个实体对分别对应的N个关系),那么对关系进行负采样(构建“非关系”实体对的过程),即有个“非关系”的实体对,通过随机采样抽取T个“非关系”的实体对。最终,将所有负采样的实体对和存在关系的实体对合并。对每个实体对的俩俩实体标签转成相应的数字,一起作为模型的输入。
具体可以参考上述实施例中对3部分的描述,此处不再赘述。
(2)推理阶段:由于待预测的数据中仅有实体位置及其类别标签,因此,需要对所有可能的实体对进行判别,因此需要将所有实体俩俩组合构成实体对,同时对每个实体对的俩俩实体标签转成相应的标签向量,一起作为模型的输入。
具体可以参考上述实施例中对5所示的平均操作(average)和向量的拼接部分的描述,此处不再赘述。
采用上述方式,通过对目标文本以及文本中提取到的实体位置及其类别标签进行处理,得到N个实体对的N个表征向量,避免了关系提取模型在推理阶段出现存在毫无逻辑的关系,提高了关系判别结果的合理性。
在通过上述各实施例中的实现方式,得到N个实体对的N个表征向量之后,可以但不限于通过以下方式确定N个实体对的N个关系标签。
具体地,通过以下步骤根据N个表征向量中的第i个表征向量确定N个实体对中的第i个实体对的第i个关系标签,其中,i为大于或等于1、且小于或等于N的正整数:将第i个表征向量输入关系分类层,得到与R个关系标签对应的R个预测结果,其中,R个预测结果用于表示第i个关系标签是R个预设关系标签中的各个预设标签的概率,R为大于或等于2的正整数;将第i个关系标签确定等于R个预设关系标签中的目标关系标签,其中,在R个预测结果中,第i个关系标签是目标关系标签的概率最大。
如图7所示,假设N=100,表示有100个实体对,预设关系标签的数量为R,那么通过图5所示的关系分类层,可以得到100×R个预测结果(预测概率),其中,对于100个实体对中的第i个实体对来说,共得到R个预测结果,并且每个预测结果分别表示第i个关系标签是R个预设标签中的各个预设标签的概率。
对于上述100个实体对对应的100×R个预测结果的实现方式包括但不限于以下两种情况:第一种:每次仅输入100个表征向量中的1个表征向量,然后重复执行该步骤,得到100×R个预测结果;第二种:将100个表征向量分批输入关系分类层,然后经过少量次数的重复执行,得到100×R个预测结果。
下面结合具体实施例对上述两种情况分别进行描述,如图8所示,假设100个表征向量中的第i个表征向量Fi,预设关系标签有4种,分别对应关系标签r1、r2、r3、r4,那么通过关系分类层,分别输出第i个关系标签为r1、r2、r3、r4的概率,其中,第i个关系标签为r1的概率为0.01,第i个关系标签为r2的概率为0.25,第i个关系标签为r3的概率为0.60,第i个关系标签为r4的概率为0.91。那么将概率最大的关系标签r4确定为第i个关系标签。
需要说明的是,Fi的维度可以是4×768,也可以是5×768。换句话说,第i个表征向量可以考虑文本起始特征向量,也可以忽略文本起始特征向量。
对于第二种实现方式,可以但不限于通过以下方式来实现。具体包括:将N个表征向量分批输入到关系分类层,得到每批表征向量对应的预测结果集合,其中,每批表征向量包括N个表征向量中的S个表征向量,每批表征向量对应的预测结果集合包括S组预测结果,S组预测结果中的每组预测结果包括R个预测结果,第j组预测结果包括的R个预测结果用于表示第j个表征向量对应的第j个关系标签是R个预设关系标签中的各个预设标签的概率,第j组预测结果与S个表征向量中的第j个表征向量对应,R为大于或等于2的正整数,S为大于或等于2、且小于N的正整数,j为大于或等于1、且小于或等于S的正整数;根据每批表征向量对应的预测结果集合,确定每批表征向量中包括的S个表征向量对应的S个关系标签。
假设N=100、S=20、R=4,那么将100个表征向量分为5批,也即,每次输入20个表征向量到关系分类层,共得到20×4个预测结果,其中,20×4个预测结果分别对应20个关系标签中的每个关系标签是4个预设标签中的各个预设标签的概率。根据第1批表征向量F1~F20对应的20×4个预测结果,确定20个表征向量对应的20个关系标签。
依次类推,分别输入第2批表征向量F21~F40、第3批表征向量F41~F60、第4批表征向量F61~F80以及第5批表征向量F81~F100,并得到各批表征向量对应的预测结果。
作为一种可选的示例,上述N个关系标签中的每个关系标签表示的头实体与尾实体之间的关系是预设的R种关系中的一种关系,其中,R为大于或等于2的正整数,R种关系包括R-1种预设关系和无关系。
作为一种可选的实现方式,根据每批表征向量对应的预测结果集合,确定每批表征向量中包括的S个表征向量对应的S个关系标签,包括:
通过以下步骤根据预测结果集合中的第j组预测结果确定S个关系标签中的第j个关系标签:将第j个关系标签确定等于R个预设关系标签中的目标关系标签,其中,在第j组预测结果包括的R个预测结果中,第j个关系标签是目标关系标签的概率最大。
例如,如图9所示,对于第1~20个表征向量F1~F20中的20×4个预测结果,将第1个关系标签确定等于4个预设关系标签中的目标关系标签,例如,第1个关系标签为r1、r2、r3、r4的概率依次为0.85、0.67、0.70、0.12,那么将第1个关系标签确定为r1。
按照同样的方式,分别确定第2~5批表征向量中包括的20个表征向量对应的20个关系标签,具体实现过程可参考上述实施例中的描述,此处不再赘述。
为了更加清晰地理解上述关系标签的处理方法,下面结合图5所示的多实体对关系提取模型进一步对其进行描述。
需要说明的是,本申请实施例的核心部分是基于实体类别的多关系抽取网络。此网络的主要创新在于将实体的类别标签与实体的文本特征进行结合来判断关系,同时对于多个实体对而言,只需要经过1次特征抽取层(BERT层和实体类别嵌入层),利用滑块的形式加速分类层的预测。如上图5所示为模型的整体框架图。
具体实现过程包括以下步骤S51~S54,下面对各个步骤分别进行描述。
S51,文本特征抽取:将文本输入到一个预训练BERT模型,得到每个字的文本特征向量,对所有实体对(这里假定共有N个实体对)的头实体、尾实体所在的位置的特征向量求平均,得到N个头实体的特征向量(H1, H2... Hn)和N个尾实体的特征向量(T1, T2... Tn),同时,每个实体的维度为768维。
具体可参考上述实施例中对获取N个头实体特征向量、N个尾实体特征向量部分的描述。
需要说明的是,上述个预训练BERT模型仅为一种示例,并不对其进行限定,例如,还可以使用预训练的词向量+CNN或者LSTM等神经网络模型来抽取各个实体的文本特征。
S52,实体类别标签特征抽取:通过实体类别的嵌入层,将每个实体类别标签映射成对应的标签向量,其中头实体对应的标签特征为{w_h1, w_h2...w_hn},尾实体对应的标签特征为{w_t1, w_t2...w_tn},每个标签向量的维度设置为768维,与BERT输出的文本特征向量维度保持一致。
具体可参考上述实施例中对获取N个头实体标签向量和N个尾实体标签向量部分的描述。
S53,实体对的特征向量拼接:将文本的特征向量CLS(表征整个文本的向量)复制N次,得到N个实体对的文本表征向量(C1, C2... Cn),同时与N个头实体的特征向量(H1,H2... Hn)、头实体对应的标签特征{w_h1, w_h2...w_hn}、N个尾实体的特征向量(T1, T2...Tn)和头实体对应的标签特征{w_t1, w_t2...w_tn}进行横向拼接,得到N个实体对最终的特征向量(F1, F2...Fn),每个特征向量的维度为5*768维。
S54,关系分类层预测:将拼接后的N个实体对的特征向量(F1, F2...Fn)输入到关系分类层(全链接层)后,利用滑块的形式分批次输出关系的结果。其中设置滑动窗口的大小为100,即每次共有100个实体对输入到分类层,同时输出100个实体对的分类结果,因此一共需要N/100次经过分类层。
其中,关系分类层的结构可以但不限于如图10所示,包括输入层(输入特征向量)、隐藏层和输出层,其中,输出层的输出结果是由隐藏层的结构来确定,例如,一次可以输出4个预测结果,或者8个预测结果等。
可见,本申请实施例中提出了一种基于实体类别的多实体对关系提取方法,该方法支持一次多实体对的输入和多关系结果的输出,能极大提升模型应对多实体对的推理速度,具体体现在以下三个方面。
(1)模型方面:利用BERT预训练模型抽取文本特征,并将文本整体特征CLS、实体1所在位置的文本特征、实体2所在位置的文本特征、实体2的类别标签进行合并组成关系特征,并构建基于滑块方式处理多实体对的分类器,加速训练和推理过程。
(2)模型输入方面:训练阶段将非关系的实体对进行抽样(负采样)后,和真实关系的实体对进行合并,同时加上实体对各自的类别标签作为模型的输入,推理阶段将所有的实体俩俩组合,构成多个实体对同时加上实体各自的类别标签作为模型的输入。
(3)模型输出方面:输出为该多个实体对的关系标签。
另外,对于关系提取模型的训练过程,目标函数为最小化判别有效信息的交叉熵损失函数Cross Entropy Loss,由于任务属于多分类任务,其每个实体对的loss计算公式(1)如下:
在训练过程中,对“非关系”这类采用了实体对的负采样,因此,需要对所有N个实体对(包含正样本和负样本)的loss需要加和,总体的loss计算公式(2)如下所示:
结合上述各实施例的描述可知,本申请实施例中提出的将文本和N个实体对及其实体类别标签输入模型,在特征抽取层只需要经过1次,极大的缩短了文本特征计算的时间,同时结合滑动窗口的方式减少分类层的输入次数,大大减少了模型训练和推理时间。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
根据本申请实施例的另一个方面,还提供了如图11所示的一种关系标签的处理装置,该装置包括:第一获取单元1102,用于获取N个实体对以及N个类别标签对,其中,N为大于或等于2的正整数,N个实体对中的每个实体对包括待确定关系标签的头实体和尾实体,N个类别标签对包括N个实体对中的每个头实体和每个尾实体的实体类别标签,每个实体对包括排列在前的一个头实体和排列在后的一个尾实体,头实体包括目标文本中的一个词语或一个短语,尾实体包括目标文本中的一个词语或一个短语;第一处理单元1104,用于根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定N个实体对的N个关系标签,其中,N个头实体特征向量是N个实体对中的N个头实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体特征向量是N个实体对中的N个尾实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体标签向量是N个尾实体的标签向量;第一发送单元1106,用于在根据N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,其中,目标场景中的事件发生变化包括事件发生的时间信息和/或动作信息发生变化,目标事件变化信息用于表示目标场景中的事件发生变化。
可选地, 上述第一处理单元1104,包括:第一获取模块,用于获取N个实体对中的N个头实体的特征向量,得到N个头实体特征向量,获取N个实体对中的N个尾实体的特征向量,得到N个尾实体特征向量,获取N个类别标签对中的N个头实体的实体类别标签的标签向量,得到N个头实体标签向量,并获取N个类别标签对中的N个尾实体的实体类别标签的标签向量,得到N个尾实体标签向量;第一拼接模块,用于对N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量进行拼接,得到N个实体对对应的N个表征向量;第一处理模块,用于根据N个表征向量,确定N个实体对的N个关系标签,其中,N个关系标签中的每个关系标签用于表示N个实体对中对应的一个实体对中的头实体与尾实体之间的关系。
可选地,上述第一获取模块,包括:第一处理子模块,用于通过以下步骤获取N个头实体中的第i个头实体的特征向量,得到第i个头实体特征向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个头实体包括Mi个字的情况下,获取Mi个字中的每个字的语义表征向量,得到Mi个语义表征向量,其中,Mi为大于或等于1的正整数;对Mi个语义表征向量执行平均操作,得到第i个头实体特征向量;或者,对Mi个语义表征向量执行加权求和操作,得到第i个头实体特征向量。
可选地,上述第一获取模块,包括:第二处理子模块,用于通过以下步骤获取N个尾实体中的第i个尾实体的特征向量,得到第i个尾实体特征向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个尾实体包括Pi个字的情况下,获取Pi个字中的每个字的语义表征向量,得到Pi个语义表征向量,其中,Pi为大于或等于1的正整数;对Pi个语义表征向量执行平均操作,得到第i个尾实体特征向量;或者,对Pi个语义表征向量执行加权求和操作,得到第i个尾实体特征向量。
可选地,上述第一获取模块,包括:第三处理子模块,用于通过以下步骤获取N个头实体中的第i个头实体的实体类别标签的标签向量,得到第i个头实体标签向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个头实体的实体类别标签包括第i个词的情况下,获取第i个词的语义表征向量,其中,第i个头实体标签向量为第i个词的语义表征向量。
可选地,上述第一获取模块,还包括:第四处理子模块,用于通过以下步骤获取N个尾实体中的第i个尾实体的实体类别标签的标签向量,得到第i个尾实体标签向量,其中,i为大于或等于1、且小于或等于N的正整数:在第i个尾实体的实体类别标签包括第i个词的情况下,获取第i个词的语义表征向量,其中,第i个尾实体标签向量为第i个词的语义表征向量。
可选地,上述第一拼接模块,包括:第五处理子模块,用于通过以下步骤得到N个实体对中的第i个实体对对应的第i个表征向量,其中,第i个实体对包括第i个头实体和第i个尾实体,i为大于或等于1、且小于或等于N的正整数:对第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到第i个表征向量,其中,第i个头实体特征向量是第i个头实体的特征向量,第i个头实体标签向量是第i个头实体的实体类别标签的标签向量,第i个尾实体特征向量是第i个尾实体的特征向量,第i个尾实体标签向量是第i个尾实体的实体类别标签的标签向量。
可选地,上述第一拼接模块,包括:第一拼接子模块,用于对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到第i个表征向量,其中,文本起始特征向量用于表征目标文本的起始位置,N个实体对中的实体是从目标文本中提取到的实体。
可选地,上述第一拼接模块,包括:第二拼接子模块,用于在文本起始特征向量的维度、第i个头实体特征向量的维度、第i个头实体标签向量的维度、第i个尾实体特征向量的维度与第i个尾实体标签向量的维度均为1×Q的情况下,对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到维度为5×Q的第i个表征向量,其中,Q为大于或等于2的正整数。
可选地,上述第一处理模块,包括:第六处理子模块,用于通过以下步骤根据N个表征向量中的第i个表征向量确定N个实体对中的第i个实体对的第i个关系标签,其中,i为大于或等于1、且小于或等于N的正整数:将第i个表征向量输入关系分类层,得到与R个关系标签对应的R个预测结果,其中,R个预测结果用于表示第i个关系标签是R个预设关系标签中的各个预设标签的概率,R为大于或等于2的正整数;将第i个关系标签确定等于R个预设关系标签中的目标关系标签,其中,在R个预测结果中,第i个关系标签是目标关系标签的概率最大。
可选地,上述第一处理模块,包括:第七处理子模块,用于将N个表征向量分批输入到关系分类层,得到每批表征向量对应的预测结果集合,其中,每批表征向量包括N个表征向量中的S个表征向量,每批表征向量对应的预测结果集合包括S组预测结果,S组预测结果中的每组预测结果包括R个预测结果,第j组预测结果包括的R个预测结果用于表示第j个表征向量对应的第j个关系标签是R个预设关系标签中的各个预设标签的概率,第j组预测结果与S个表征向量中的第j个表征向量对应,R为大于或等于2的正整数,S为大于或等于2、且小于N的正整数,j为大于或等于1、且小于或等于S的正整数;第八处理子模块,用于根据每批表征向量对应的预测结果集合,确定每批表征向量中包括的S个表征向量对应的S个关系标签。
可选地,上述第一处理模块,包括:第八处理子模块,用于通过以下步骤根据预测结果集合中的第j组预测结果确定S个关系标签中的第j个关系标签:将第j个关系标签确定等于R个预设关系标签中的目标关系标签,其中,在第j组预测结果包括的R个预测结果中,第j个关系标签是目标关系标签的概率最大。
可选地,上述第一获取单元1102,包括:提取模块,用于在目标文本中提取出具有一一对应关系的T个实体和T个实体类别标签,其中,T个实体类别标签包括T个实体中的每个实体的实体类别标签,T个实体中的每个实体包括目标文本中的一个词语或一个短语;第二处理模块,用于将T个实体中N种组合的两个实体组成N个实体对,其中,N个实体对中的每个实体对包括T个实体中一种组合的两个实体,一种组合的两个实体中排列在前的实体为头实体,排列在后的实体为尾实体;第三处理模块,用于在T个实体类别标签中确定N个实体对中的每个实体对中包括的头实体和尾实体的实体类别标签,得到N个类别标签对。
其中,N个关系标签中的每个关系标签表示的头实体与尾实体之间的关系是预设的R种关系中的一种关系,其中,R为大于或等于2的正整数,R种关系包括R-1种预设关系和无关系。
可选地,上述第一发送单元,包括:发送模块,用于在目标场景中的事件为目标路段的道路通断事件、且一组关系标签包括目标路段的时间关系标签和目标路段的通断状态关系标签的情况下,将目标事件变化信息发送给目标业务平台,其中,目标事件变化信息用于表示目标路段的通断状态发生变化以及通断状态发生变化的时间,通断状态关系标签用于表示目标路段的通断状态发生变化,目标路段的时间关系标签用于表示通断状态发生变化的时间,通断状态用于表示目标路段处于通行状态或封闭状态;或者在目标场景中的事件为目标收费站的收费事件、且一组关系标签包括目标收费站的时间关系标签和目标收费站的收费状态关系标签的情况下,将目标事件变化信息发送给目标业务平台,其中,目标事件变化信息用于表示目标收费站的收费状态发生变化以及收费状态发生变化的时间,收费状态关系标签用于表示目标收费站的收费状态发生变化,目标收费站的时间关系标签用于表示收费状态发生变化的时间,收费状态用于表示目标收费站处于收费状态或免费状态。
可选地,上述发送模块,包括:发送子模块,用于在目标事件变化信息用于表示目标路段的通断状态发生变化以及通断状态发生变化的时间的情况下,将目标事件变化信息发送给目标业务平台,并存储在目标业务平台中的地图数据库中,以在基于地图数据库形成的地图中显示目标路段的道路变化提示信息,其中,道路变化提示信息用于提示目标路段的通断状态发生变化以及通断状态发生变化的时间;或者在目标事件变化信息用于表示目标收费站的收费状态发生变化以及收费状态发生变化的时间的情况下,将目标事件变化信息发送给目标业务平台,并存储在目标业务平台中的地图数据库中,以在基于地图数据库形成的地图中显示目标收费站的收费化提示信息,其中,收费变化提示信息用于提示目标收费站的收费状态发生变化以及收费状态发生变化的时间。
通过将上述装置应用于通过对N个实体对中的N个头实体的N个头实体特征向量、N个实体对中的N个尾实体的特征向量、N个头实体标签对中的N个头实体的实体类别标签的标签向量以及N个尾实体的实体类别标签的标签向量进行拼接,得到N个实体对对应的N个表征向量,并根据N个表征向量,确定N个实体对的N个关系标签。也就是说,根据N个实体对的N个表征向量,可以一次输出多个实体对的关系标签,减少了模型训练时间及模型推理时间,提高了确定关系标签的效率。
需要说明的是,这里的关系标签的处理装置的实施例可以参考上述关系标签的处理方法的实施例,这里不再赘述。
根据本申请实施例的又一个方面,还提供了一种用于实施上述关系标签的处理方法的电子设备,该电子设备可以是图12所示的终端设备。本实施例以该电子设备为后台设备为例来说明。如图12所示,该电子设备包括存储器1202和处理器1204,该存储器1202中存储有计算机程序,该处理器1204被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取N个实体对以及N个类别标签对,其中,N为大于或等于2的正整数,N个实体对中的每个实体对包括待确定关系标签的头实体和尾实体,N个类别标签对包括N个实体对中的每个头实体和每个尾实体的实体类别标签,每个实体对包括排列在前的一个头实体和排列在后的一个尾实体,头实体包括目标文本中的一个词语或一个短语,尾实体包括目标文本中的一个词语或一个短语。
S2,根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定N个实体对的N个关系标签,其中,N个头实体特征向量是N个实体对中的N个头实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体特征向量是N个实体对中的N个尾实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体标签向量是N个尾实体的标签向量。
S3,在根据N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,其中,目标场景中的事件发生变化包括事件发生的时间信息和/或动作信息发生变化,目标事件变化信息用于表示目标场景中的事件发生变化。
可选地,本领域普通技术人员可以理解,图12所示的结构仅为示意,电子装置电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等目标终端。图12其并不对上述电子装置电子设备的结构造成限定。例如,电子装置电子设备还可包括比图12中所示更多或者更少的组件(如网络接口等),或者具有与图12所示不同的配置。
其中,存储器1202可用于存储软件程序以及模块,如本申请实施例中的关系标签的处理方法和装置对应的程序指令/模块,处理器1204通过运行存储在存储器1202内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的关系标签的处理方法。存储器1202可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1202可进一步包括相对于处理器1204远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1202具体可以但不限于用于存储N个实体对、N个类别标签对以及N个表征向量等。作为一种示例,如图12所示,上述存储器1202中可以但不限于包括上述关系标签的处理装置中的第一获取单元1102、第一处理单元1104和第一发送单元1106。此外,还可以包括但不限于上述关系标签的处理装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1206用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1206包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1206为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器1208,用于显示上述目标声音的方位提示信息;和连接总线1212,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述目标终端或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
根据本申请的又一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述服务器校验处理等方面各种可选实现方式中提供的关系标签的处理方法,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取N个实体对以及N个类别标签对,其中,N为大于或等于2的正整数,N个实体对中的每个实体对包括待确定关系标签的头实体和尾实体,N个类别标签对包括N个实体对中的每个头实体和每个尾实体的实体类别标签,每个实体对包括排列在前的一个头实体和排列在后的一个尾实体,头实体包括目标文本中的一个词语或一个短语,尾实体包括目标文本中的一个词语或一个短语。
S2,根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定N个实体对的N个关系标签,其中,N个头实体特征向量是N个实体对中的N个头实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体特征向量是N个实体对中的N个尾实体的特征向量,N个头实体标签向量是N个头实体的标签向量,N个尾实体标签向量是N个尾实体的标签向量。
S3,在根据N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,其中,目标场景中的事件发生变化包括事件发生的时间信息和/或动作信息发生变化,目标事件变化信息用于表示目标场景中的事件发生变化。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令目标终端相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (19)
1.一种关系标签的处理方法,其特征在于,包括:
获取N个实体对以及N个类别标签对,其中,N为大于或等于2的正整数,所述N个实体对中的每个实体对包括待确定关系标签的头实体和尾实体,所述N个类别标签对包括所述N个实体对中的每个头实体和每个尾实体的实体类别标签,所述每个实体对包括排列在前的一个头实体和排列在后的一个尾实体,所述头实体包括目标文本中的一个词语或一个短语,所述尾实体包括所述目标文本中的一个词语或一个短语;
根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定所述N个实体对的N个关系标签,其中,所述N个头实体特征向量是所述N个实体对中的N个头实体的特征向量,所述N个尾实体特征向量是所述N个实体对中的N个尾实体的特征向量,所述N个头实体标签向量是所述N个头实体的标签向量,所述N个尾实体标签向量是所述N个尾实体的标签向量;
在根据所述N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,其中,所述目标场景中的事件发生变化包括所述事件发生的时间信息和/或动作信息发生变化,所述目标事件变化信息用于表示所述目标场景中的事件发生变化。
2.根据权利要求1所述的方法,其特征在于,所述根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定所述N个实体对的N个关系标签,包括:
获取所述N个实体对中的N个头实体的特征向量,得到N个头实体特征向量,获取所述N个实体对中的N个尾实体的特征向量,得到N个尾实体特征向量,获取所述N个类别标签对中的所述N个头实体的实体类别标签的标签向量,得到N个头实体标签向量,并获取所述N个类别标签对中的所述N个尾实体的实体类别标签的标签向量,得到N个尾实体标签向量;
对所述N个头实体特征向量、所述N个头实体标签向量、所述N个尾实体特征向量、所述N个尾实体标签向量进行拼接,得到所述N个实体对对应的N个表征向量;
根据所述N个表征向量,确定所述N个实体对的N个关系标签,其中,所述N个关系标签中的每个关系标签用于表示所述N个实体对中对应的一个实体对中的所述头实体与所述尾实体之间的关系。
3.根据权利要求2所述的方法,其特征在于,所述获取所述N个实体对中的N个头实体的特征向量,得到N个头实体特征向量,包括:
通过以下步骤获取所述N个头实体中的第i个头实体的特征向量,得到第i个头实体特征向量,其中,i为大于或等于1、且小于或等于N的正整数:
在所述第i个头实体包括Mi个字的情况下,获取所述Mi个字中的每个字的语义表征向量,得到Mi个语义表征向量,其中,Mi为大于或等于1的正整数;
对所述Mi个语义表征向量执行平均操作,得到所述第i个头实体特征向量;或者,对所述Mi个语义表征向量执行加权求和操作,得到所述第i个头实体特征向量。
4.根据权利要求2所述的方法,其特征在于,所述获取所述N个实体对中的N个尾实体的特征向量,得到N个尾实体特征向量,包括:
通过以下步骤获取所述N个尾实体中的第i个尾实体的特征向量,得到第i个尾实体特征向量,其中,i为大于或等于1、且小于或等于N的正整数:
在所述第i个尾实体包括Pi个字的情况下,获取所述Pi个字中的每个字的语义表征向量,得到Pi个语义表征向量,其中,Pi为大于或等于1的正整数;
对所述Pi个语义表征向量执行平均操作,得到所述第i个尾实体特征向量;或者,对所述Pi个语义表征向量执行加权求和操作,得到所述第i个尾实体特征向量。
5.根据权利要求2所述的方法,其特征在于,所述获取所述N个类别标签对中的所述N个头实体的实体类别标签的标签向量,得到N个头实体标签向量,包括:
通过以下步骤获取所述N个头实体中的第i个头实体的实体类别标签的标签向量,得到第i个头实体标签向量,其中,i为大于或等于1、且小于或等于N的正整数:
在所述第i个头实体的实体类别标签包括第i个词的情况下,获取所述第i个词的语义表征向量,其中,所述第i个头实体标签向量为所述第i个词的语义表征向量。
6.根据权利要求2所述的方法,其特征在于,所述获取所述N个类别标签对中的所述N个尾实体的实体类别标签的标签向量,得到N个尾实体标签向量,包括:
通过以下步骤获取所述N个尾实体中的第i个尾实体的实体类别标签的标签向量,得到第i个尾实体标签向量,其中,i为大于或等于1、且小于或等于N的正整数:
在所述第i个尾实体的实体类别标签包括第i个词的情况下,获取所述第i个词的语义表征向量,其中,所述第i个尾实体标签向量为所述第i个词的语义表征向量。
7.根据权利要求2所述的方法,其特征在于,所述对所述N个头实体特征向量、所述N个头实体标签向量、所述N个尾实体特征向量、所述N个尾实体标签向量进行拼接,得到所述N个实体对对应的N个表征向量,包括:
通过以下步骤得到所述N个实体对中的第i个实体对对应的第i个表征向量,其中,所述第i个实体对包括第i个头实体和第i个尾实体,i为大于或等于1、且小于或等于N的正整数:
对第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到所述第i个表征向量,其中,所述第i个头实体特征向量是所述第i个头实体的特征向量,所述第i个头实体标签向量是所述第i个头实体的实体类别标签的标签向量,所述第i个尾实体特征向量是所述第i个尾实体的特征向量,所述第i个尾实体标签向量是所述第i个尾实体的实体类别标签的标签向量。
8.根据权利要求7所述的方法,其特征在于,所述对第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到所述第i个表征向量,包括:
对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到所述第i个表征向量,其中,所述文本起始特征向量用于表征目标文本的起始位置,所述N个实体对中的实体是从所述目标文本中提取到的实体。
9.根据权利要求8所述的方法,其特征在于,所述对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到所述第i个表征向量,包括:
在所述文本起始特征向量的维度、所述第i个头实体特征向量的维度、所述第i个头实体标签向量的维度、所述第i个尾实体特征向量的维度与第i个尾实体标签向量的维度均为1×Q的情况下,对文本起始特征向量、第i个头实体特征向量、第i个头实体标签向量、第i个尾实体特征向量、第i个尾实体标签向量进行拼接,得到维度为5×Q的所述第i个表征向量,其中,Q为大于或等于2的正整数。
10.根据权利要求2所述的方法,其特征在于,所述根据所述N个表征向量,确定所述N个实体对的N个关系标签,包括:
通过以下步骤根据所述N个表征向量中的第i个表征向量确定所述N个实体对中的第i个实体对的第i个关系标签,其中,i为大于或等于1、且小于或等于N的正整数:
将所述第i个表征向量输入关系分类层,得到与R个关系标签对应的R个预测结果,其中,所述R个预测结果用于表示所述第i个关系标签是R个预设关系标签中的各个预设标签的概率,R为大于或等于2的正整数;
将所述第i个关系标签确定等于所述R个预设关系标签中的目标关系标签,其中,在所述R个预测结果中,所述第i个关系标签是所述目标关系标签的概率最大。
11.根据权利要求2所述的方法,其特征在于,所述根据所述N个表征向量,确定所述N个实体对的N个关系标签,包括:
将所述N个表征向量分批输入到关系分类层,得到每批表征向量对应的预测结果集合,其中,所述每批表征向量包括所述N个表征向量中的S个表征向量,所述每批表征向量对应的预测结果集合包括S组预测结果,所述S组预测结果中的每组预测结果包括R个预测结果,第j组预测结果包括的R个预测结果用于表示第j个表征向量对应的第j个关系标签是R个预设关系标签中的各个预设标签的概率,所述第j组预测结果与所述S个表征向量中的所述第j个表征向量对应,R为大于或等于2的正整数,S为大于或等于2、且小于N的正整数,j为大于或等于1、且小于或等于S的正整数;
根据所述每批表征向量对应的预测结果集合,确定所述每批表征向量中包括的所述S个表征向量对应的S个关系标签。
12.根据权利要求11所述的方法,其特征在于,所述根据所述每批表征向量对应的预测结果集合,确定所述每批表征向量中包括的所述S个表征向量对应的S个关系标签,包括:
通过以下步骤根据所述预测结果集合中的所述第j组预测结果确定所述S个关系标签中的所述第j个关系标签:
将所述第j个关系标签确定等于所述R个预设关系标签中的目标关系标签,其中,在所述第j组预测结果包括的所述R个预测结果中,所述第j个关系标签是所述目标关系标签的概率最大。
13.根据权利要求1至12中任一项所述的方法,其特征在于,所述获取N个实体对以及N个类别标签对,包括:
在所述目标文本中提取出具有一一对应关系的T个实体和T个实体类别标签,其中,所述T个实体类别标签包括所述T个实体中的每个实体的实体类别标签,所述T个实体中的每个实体包括所述目标文本中的一个词语或一个短语;
将所述T个实体中N种组合的两个实体组成所述N个实体对,其中,所述N个实体对中的每个实体对包括所述T个实体中一种组合的两个实体,所述一种组合的两个实体中排列在前的实体为所述头实体,排列在后的实体为所述尾实体;
在所述T个实体类别标签中确定所述N个实体对中的每个实体对中包括的所述头实体和所述尾实体的实体类别标签,得到所述N个类别标签对。
14.根据权利要求1至12中任一项所述的方法,其特征在于,所述N个关系标签中的每个关系标签表示的所述头实体与所述尾实体之间的关系是预设的R种关系中的一种关系,其中,R为大于或等于2的正整数,所述R种关系包括R-1种预设关系和无关系。
15. 根据权利要求1至12中任一项所述的方法,其特征在于,所述在根据所述N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,包括:
在所述目标场景中的事件为目标路段的道路通断事件、且所述一组关系标签包括所述目标路段的时间关系标签和所述目标路段的通断状态关系标签的情况下,将所述目标事件变化信息发送给所述目标业务平台,其中,所述目标事件变化信息用于表示所述目标路段的通断状态发生变化以及所述通断状态发生变化的时间,所述通断状态关系标签用于表示所述目标路段的通断状态发生变化,所述目标路段的所述时间关系标签用于表示所述通断状态发生变化的时间,所述通断状态用于表示所述目标路段处于通行状态或封闭状态;或者
在所述目标场景中的事件为目标收费站的收费事件、且所述一组关系标签包括所述目标收费站的时间关系标签和所述目标收费站的收费状态关系标签的情况下,将所述目标事件变化信息发送给所述目标业务平台,其中,所述目标事件变化信息用于表示所述目标收费站的收费状态发生变化以及所述收费状态发生变化的时间,所述收费状态关系标签用于表示所述目标收费站的收费状态发生变化,所述目标收费站的所述时间关系标签用于表示所述收费状态发生变化的时间,所述收费状态用于表示所述目标收费站处于收费状态或免费状态。
16. 根据权利要求15所述的方法,其特征在于,所述将所述目标事件变化信息发送给所述目标业务平台,包括:
在所述目标事件变化信息用于表示所述目标路段的通断状态发生变化以及所述通断状态发生变化的时间的情况下,将所述目标事件变化信息发送给所述目标业务平台,并存储在所述目标业务平台中的地图数据库中,以在基于所述地图数据库形成的地图中显示所述目标路段的道路变化提示信息,其中,所述道路变化提示信息用于提示所述目标路段的通断状态发生变化以及所述通断状态发生变化的时间;或者
在所述目标事件变化信息用于表示所述目标收费站的收费状态发生变化以及所述收费状态发生变化的时间的情况下,将所述目标事件变化信息发送给所述目标业务平台,并存储在所述目标业务平台中的地图数据库中,以在基于所述地图数据库形成的地图中显示所述目标收费站的收费化提示信息,其中,所述收费变化提示信息用于提示所述目标收费站的收费状态发生变化以及所述收费状态发生变化的时间。
17.一种关系标签的处理装置,其特征在于,包括:
第一获取单元,用于获取N个实体对以及N个类别标签对,其中,N为大于或等于2的正整数,所述N个实体对中的每个实体对包括待确定关系标签的头实体和尾实体,所述N个类别标签对包括所述N个实体对中的每个头实体和每个尾实体的实体类别标签,所述每个实体对包括排列在前的一个头实体和排列在后的一个尾实体,所述头实体包括目标文本中的一个词语或一个短语,所述尾实体包括所述目标文本中的一个词语或一个短语;
第一处理单元,用于根据N个头实体特征向量、N个头实体标签向量、N个尾实体特征向量、N个尾实体标签向量,确定所述N个实体对的N个关系标签,其中,所述N个头实体特征向量是所述N个实体对中的N个头实体的特征向量,所述N个尾实体特征向量是所述N个实体对中的N个尾实体的特征向量,所述N个头实体标签向量是所述N个头实体的标签向量,所述N个尾实体标签向量是所述N个尾实体的标签向量;
第一发送单元,用于在根据所述N个关系标签中的一组关系标签指示目标场景中的事件发生变化的情况下,将目标事件变化信息发送给目标业务平台,其中,所述目标场景中的事件发生变化包括所述事件发生的时间信息和/或动作信息发生变化,所述目标事件变化信息用于表示所述目标场景中的事件发生变化。
18.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序可被终端设备或计算机运行时执行所述权利要求1至16任一项中所述的方法。
19.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至16任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310970704.0A CN116702785B (zh) | 2023-08-03 | 2023-08-03 | 关系标签的处理方法和装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310970704.0A CN116702785B (zh) | 2023-08-03 | 2023-08-03 | 关系标签的处理方法和装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116702785A CN116702785A (zh) | 2023-09-05 |
CN116702785B true CN116702785B (zh) | 2023-10-24 |
Family
ID=87832501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310970704.0A Active CN116702785B (zh) | 2023-08-03 | 2023-08-03 | 关系标签的处理方法和装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116702785B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709240A (zh) * | 2020-05-14 | 2020-09-25 | 腾讯科技(武汉)有限公司 | 实体关系抽取方法、装置、设备及其存储介质 |
CN113947087A (zh) * | 2021-12-20 | 2022-01-18 | 太极计算机股份有限公司 | 一种基于标签的关系构建方法、装置、电子设备及存储介质 |
CN114297375A (zh) * | 2021-11-24 | 2022-04-08 | 北京天融信网络安全技术有限公司 | 网络安全实体与关系的网络模型的训练方法及抽取方法 |
CN116150308A (zh) * | 2022-07-14 | 2023-05-23 | 马上消费金融股份有限公司 | 识别模型的训练方法、识别方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165385B (zh) * | 2018-08-29 | 2022-08-09 | 中国人民解放军国防科技大学 | 一种基于实体关系联合抽取模型的多三元组抽取方法 |
-
2023
- 2023-08-03 CN CN202310970704.0A patent/CN116702785B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709240A (zh) * | 2020-05-14 | 2020-09-25 | 腾讯科技(武汉)有限公司 | 实体关系抽取方法、装置、设备及其存储介质 |
CN114297375A (zh) * | 2021-11-24 | 2022-04-08 | 北京天融信网络安全技术有限公司 | 网络安全实体与关系的网络模型的训练方法及抽取方法 |
CN113947087A (zh) * | 2021-12-20 | 2022-01-18 | 太极计算机股份有限公司 | 一种基于标签的关系构建方法、装置、电子设备及存储介质 |
CN116150308A (zh) * | 2022-07-14 | 2023-05-23 | 马上消费金融股份有限公司 | 识别模型的训练方法、识别方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116702785A (zh) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263324B (zh) | 文本处理方法、模型训练方法和装置 | |
CN111177393B (zh) | 一种知识图谱的构建方法、装置、电子设备及存储介质 | |
CN113627447B (zh) | 标签识别方法、装置、计算机设备、存储介质及程序产品 | |
CN112329467A (zh) | 地址识别方法、装置、电子设备以及存储介质 | |
CN116664719B (zh) | 一种图像重绘模型训练方法、图像重绘方法及装置 | |
CN113392197B (zh) | 问答推理方法、装置、存储介质及电子设备 | |
CN116861258B (zh) | 模型处理方法、装置、设备及存储介质 | |
CN111767720B (zh) | 一种标题生成方法、计算机及可读存储介质 | |
CN116702785B (zh) | 关系标签的处理方法和装置、存储介质及电子设备 | |
CN113362852A (zh) | 一种用户属性识别方法和装置 | |
CN112861474B (zh) | 一种信息标注方法、装置、设备及计算机可读存储介质 | |
CN113741759B (zh) | 评论信息的展示方法、装置、计算机设备和存储介质 | |
CN115129885A (zh) | 实体链指方法、装置、设备及存储介质 | |
CN114330296A (zh) | 新词发现方法、装置、设备以及存储介质 | |
CN117057343B (zh) | 道路事件识别方法、装置、设备及存储介质 | |
CN113626564B (zh) | 一种概念标签生成方法、装置、电子设备和存储介质 | |
CN116737756B (zh) | 一种数据查询方法、装置、设备及存储介质 | |
CN116956941B (zh) | 一种文本识别方法、装置、设备及介质 | |
CN116976309A (zh) | 数据解析方法、装置、计算机、可读存储介质及程序产品 | |
CN117407507A (zh) | 基于大语言模型的事件处理方法、装置、设备及介质 | |
CN116989805A (zh) | 一种路径规划方法、装置、设备、存储介质及程序产品 | |
CN115292620A (zh) | 地域信息识别方法、装置、电子设备和存储介质 | |
CN116977691A (zh) | 角色识别模型的训练方法、装置、设备及存储介质 | |
CN116975016A (zh) | 一种数据处理方法、装置、设备以及可读存储介质 | |
CN116956908A (zh) | 一种自然语言处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |