CN117171653B - 一种识别信息关系的方法、装置、设备及存储介质 - Google Patents

一种识别信息关系的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117171653B
CN117171653B CN202311444555.0A CN202311444555A CN117171653B CN 117171653 B CN117171653 B CN 117171653B CN 202311444555 A CN202311444555 A CN 202311444555A CN 117171653 B CN117171653 B CN 117171653B
Authority
CN
China
Prior art keywords
relation
preset
information
target
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311444555.0A
Other languages
English (en)
Other versions
CN117171653A (zh
Inventor
梁通
王凌云
郑玉玲
宋丹丹
王梓凝
刘兆蓬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengfang Financial Technology Co ltd
Original Assignee
Chengfang Financial Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengfang Financial Technology Co ltd filed Critical Chengfang Financial Technology Co ltd
Priority to CN202311444555.0A priority Critical patent/CN117171653B/zh
Publication of CN117171653A publication Critical patent/CN117171653A/zh
Application granted granted Critical
Publication of CN117171653B publication Critical patent/CN117171653B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种识别信息关系的方法、装置、设备及存储介质。该方法包括:利用预设关系识别模型从待识别信息中确定目标信息;利用预设关系识别模型对目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度;利用预设关系识别模型和关系置信度,输出目标触发词、主体、客体以及主体与客体间的关系。本发明实施例的技术方案,利用预设关系识别模型对待识别信息中的目标信息进行掩码处理,并预测关系类别,再利用预设关系识别模型和关系置信度,可以输出主体、客体、主体与客体间的关系以及用于解释该关系的目标触发词,提高了关系识别结果的可解释性,保证了决策者针对待识别信息作决策时的准确性和可靠性。

Description

一种识别信息关系的方法、装置、设备及存储介质
技术领域
本发明涉及信息处理技术领域,尤其涉及一种识别信息关系的方法、装置、设备及存储介质。
背景技术
金融领域关系抽取是自然语言处理中的一个重要方向,其可以用于金融风险评估、金融市场监管以及投资决策等方面。其可以从大量的金融文本中提取出重要信息,如实体、关系和事件等,以便进行金融业务的分析、评估和决策。关系抽取具体指的是从自然语言文本中识别出实体之间的语义关系,如从一段文本中抽取(主体、关系和客体)三元组。
目前,主流的关系抽取方法主要分为两类:基于特征工程的方法和基于神经网络的方法。基于特征工程的方法依赖于人工设计的特征和规则,如词性标注、句法分析和依存分析等,来表示实体和关系。基于神经网络的方法利用深度学习模型可以克服特征工程的局限性,提高关系抽取的效果和泛化能力。
由于金融领域的决策需要模型的可解释性来保证决策的准确性和可靠性,但基于神经网络的方法输出的关系识别结果却存在可解释性差的问题。
发明内容
本发明提供了一种识别信息关系的方法、装置、设备及存储介质,以解决关系识别结果可解释性差的问题。
第一方面,本发明提供了一种识别信息关系的方法,包括:
利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息;
利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度;
利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息。
第二方面,本发明提供了一种识别信息关系的装置,包括:
目标信息确定模块,用于利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息;
关系置信度确定模块,用于利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度;
结果输出模块,用于利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息。
第三方面,本发明提供了一种电子设备,该电子设备包括:
至少一个处理器;
以及与至少一个处理器通信连接的存储器;
其中,存储器存储有可被至少一个处理器执行的计算机程序,该计算机程序被至少一个处理器执行,以使至少一个处理器能够执行上述第一方面的识别信息关系的方法。
第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现上述第一方面的识别信息关系的方法。
本发明提供的识别信息关系的方案,利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息,利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度,利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息。通过采用上述技术方案,利用预设关系识别模型对待识别信息中除主体和客体外的信息,进行掩码处理并进行关系类别预测,得到关系置信度,再利用预设关系识别模型和该关系置信度,可以输出主体、客体、主体与客体间的关系以及用于解释该关系的目标触发词,其提高了模型输出的关系识别结果的可解释性,保证了决策者针对待识别信息作决策时的准确性和可靠性。
应当理解,本部分所描述的内容并非旨在标识本发明的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种识别信息关系的方法的流程图;
图2是根据本发明实施例二提供的一种识别信息关系的方法的流程图;
图3是根据本发明实施例三提供的一种识别信息关系的装置的结构示意图;
图4是根据本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。在本发明的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A 和/或 B,可以表示:单独存在 A,同时存在 A 和 B,单独存在 B 这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供了一种识别信息关系的方法的流程图,本实施例可适用于识别信息间关系的情况,该方法可以由识别信息关系的装置来执行,该识别信息关系的装置可以采用硬件和/或软件的形式实现,该识别信息关系的装置可配置于电子设备中,该电子设备可以是两个或多个物理实体构成,也可以是一个物理实体构成。
如图1所示,该本发明实施例一提供的一种识别信息关系的方法,具体包括如下步骤:
S101、利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息。
在本实施例中,可以预先确定预设关系识别模型,该模型可以从待识别信息中筛选出目标信息。待识别信息可以为金融领域的数据,如,若待识别信息为:“R银行于4月底披露一季度财报,营收录得87.4亿美元”,则主体可以为“R银行”,客体可以为“87.4亿美元”,则目标信息包括“营收录得”、“于”、“4月”、“披露”“一季度”以及“财报”。
S102、利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度。
在本实施例中,预设关系识别模型可以对目标信息进行掩码处理,得到掩码处理结果。如,可以对上文中的多个目标信息分别进行掩码,再对每次掩码后得到的掩码处理结果进行关系预测,得到每个目标信息对应的关系置信度,也可以先根据上文中的多个目标信息的词性对目标信息进行筛选,然后对筛选后的目标信息分别进行掩码,再对每次掩码后得到的掩码处理结果进行关系预测。其中,上述被筛除的目标信息的词性可以包括数字、地点词、时间词、连词、代词以及介词等中的至少一项。
S103、利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息。
在本实施例中,目标触发词可以解释说明主体与客体间的关系,且目标触发词影响预设关系识别模型对主体与客体间的关系的识别结果,如,当目标触发词被掩码时与不对目标信息进行掩码时相比,关系置信度会变小。示例性的,可以利用预设关系识别模型从上述关系置信度中筛选出目标关系置信度,该目标关系置信度对应的目标信息即为目标触发词,从而该模型可以输出目标触发词、主体、客体以及主体与客体间的关系,该目标触发词可以解释说明客体以及主体与客体间的关系。如,上文所述的待识别信息输入预设关系识别模型后,输出可以为,主体:“R银行”,客体:“87.4亿美元”,关系:“经营数据”,目标触发词:“营收录得”。其中,目标关系置信度可以为,未掩码的待识别信息对应的关系置信度M分别与对每个目标信息进行掩码时对应的关系置信度m1、m2、…、mn的差值中的最大差值。
本发明实施例提供的识别信息关系的方法,利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息,利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度,利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息。本发明实施例技术方案,利用预设关系识别模型对待识别信息中除主体和客体外的信息,进行掩码处理并进行关系类别预测,得到关系置信度,再利用预设关系识别模型和该关系置信度,可以输出主体、客体、主体与客体间的关系以及用于解释该关系的目标触发词,其提高了模型输出的关系识别结果的可解释性,保证了决策者针对待识别信息作决策时的准确性和可靠性。
可选的,所述预设关系识别模型的确定方式,包括:利用初始训练样本,从预设领域数据库中确定扩充训练样本;利用类别表征向量和所述扩充训练样本的标签,确定所述扩充训练样本与第一类别表征向量的注意力值,并利用所述注意力值和所述扩充训练样本,确定伪标签样本,其中,所述初始训练样本的样本数据输入预设初始模型的第一子模型后,输出的所述第一类别表征向量以及所述扩充训练样本的样本数据输入预设初始模型的第二子模型后,输出的第二类别表征向量,所述伪标签样本的样本数据属于所述扩充训练样本,所述伪标签样本的标签为所述注意力值;将所述伪标签样本的样本数据输入所述预设初始模型,得到第一输出结果,并根据所述注意力值调整目标权重,其中,所述目标权重为所述预设初始模型的损失函数中所述伪标签样本对应的权重;利用输出结果和调整后的损失函数,确定损失函数值,并利用所述损失函数值确定预设关系识别模型,其中,所述输出结果包括所述第一输出结果和初始训练样本对应的第二输出结果。这样设置的好处在于,利用扩充训练样本与第一类别表征向量的注意力值,确定了伪标签样本,提升了小样本模型训练的鲁棒性。
具体的,为了得到识别效果较好的预设关系识别模型,可以从预设领域数据库中挑选数据,来对初始训练样本进行扩充。初始训练样本也为预设领域数据库中的数据,该预设领域数据库中的数据可以为金融等领域的数据,该库中可以包括有标签数据和无标签数据,有标签数据的标签可以包括主体、客体以及主体与客体的关系。
示例性的,第j个扩充训练样本与第一类别表征向量的注意力值N的确定方式包括:
其中,,/>和/>为第二子模型输出的第二类别表征向量,其分别为主体、客体和关系的表征向量,/>为/>与第一子模型输出的第j个主体的第一类别表征向量的点乘,/>为/>与第j个客体的第一类别表征向量的点乘,为/>与第j个关系的第一类别表征向量的点乘。第一子模型的输入可以为掩码处理后的初始训练样本的样本数据,第二子模型的输入可以为有标签的扩充训练样本,/>和/>分别为扩充训练样本中,第j个有标签的扩充训练样本的主体的标签、客体的标签和关系的标签。max()表示取最大值,/>表示向量点乘,/>表示求累和,n1为第一子模型输出的主体的第一类别表征向量的数量,n2为第一子模型输出的客体的第一类别表征向量的数量,n3为第一子模型输出的关系的第一类别表征向量的数量。若该注意力值N大于预设阈值时,可以将该第j个扩充训练样本的标签替换为该注意力值N,从而得到伪标签样本。可以将预设初始模型的损失函数中,伪标签样本对应的权重确定为/>,m为预设初始模型的迭代训练次数。当损失函数值较小时,可以得到预设关系识别模型。
可选的,所述利用初始训练样本,从预设领域数据库中确定扩充训练样本,包括以下1)至3)至少一项:
1)从预设领域数据库中,筛选出包含预设近似关键词和所述初始训练样本的样本数据中的预设关键词一致的数据,得到第一扩充训练样本。
具体的,从预设领域数据库中,筛选出包含预设近似关键词和初始训练样本的样本数据中的预设关键词一致的数据,得到第一扩充训练样本。其中,预设关键词包括初始训练样本的样本数据中的主体、客体以及初始训练样本所属的领域等。
2)从预设领域数据库中,筛选出与初始训练样本的样本数据的编辑距离最小的数据,得到第二扩充训练样本。
3)将预设领域数据库中的数据输入所述第一子模型,得到第一文本表征向量,将所述初始训练样本的样本数据输入所述第一子模型,得到第二文本表征向量,并筛选出小于预设值的文本欧式距离对应的所述预设领域数据库中的数据,得到第三扩充训练样本,其中,所述预设近似关键词为所述预设关键词的近似词,所述文本欧式距离为所述第一文本表征向量与所述第一文本表征向量的欧式距离。
示例性的,文本欧式距离D的确定方式可以包括:
其中,hi’为第一文本表征向量中第i维的数值,hi为第二文本表征向量中第i维的数值,i=1,…,n,n为第一文本表征向量和第二文本表征向量的维数,筛选出小于预设值ζ的文本欧式距离对应的预设领域数据库中的数据,得到第三扩充训练样本。
具体的,上述这样设置的好处在于,通过从预设领域数据库中筛选扩充训练样本,实现了对小样本模型训练样本的扩充,进一步保证了模型训练的效果,解决了因样本稀疏导致的模型训练效果不佳的问题。
可选的,在所述利用类别表征向量和所述扩充训练样本的标签,确定所述扩充训练样本与第一类别表征向量的注意力值之前,还包括:对所述扩充训练样本的标签进行标签平滑处理,得到平滑后的扩充训练样本;其中,所述利用所述注意力值从所述扩充训练样本中,确定伪标签样本,包括:判断所述注意力值是否大于预设阈值;若是,则将所述注意力值对应的所述平滑后的扩充训练样本的标签替换为所述注意力值,得到伪标签样本。这样设置的好处在于,通过对扩充训练样本的标签进行标签平滑处理,保证了标签的准确度,并通过筛选大于预设阈值的注意力值,得到了合适的伪标签。
示例性的,平滑后的扩充训练样本的标签可以为多维的标签,若预设阈值为A,则当注意力值大于A时,则可以将该注意力值对应的平滑后的扩充训练样本的标签替换为该注意力值,从而得到伪标签样本。
实施例二
图2为本发明实施例二提供的一种识别信息关系的方法的流程图,本发明实施例的技术方案在上述各可选技术方案的基础上进一步优化,给出了识别信息间关系的具体方式。
可选的,所述利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,包括:针对每个所述目标信息,利用所述预设关系识别模型对当前目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到所述当前目标信息对应的关系置信度。这样设置的好处在于,通过利用预设关系识别模型,迅速且准确的确定了每个目标信息对应的关系置信度。
可选的,所述利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,包括:利用所述预设关系识别模型,从所述目标信息的关系置信度中确定目标置信度,并将所述目标置信度对应的目标信息确定为目标触发词;利用所述预设关系识别模型输出所述待识别信息中的所述主体、所述客体、所述主体与所述客体间的关系以及所述目标触发词。这样设置的好处在于,由于对目标触发词掩码会影响预设关系识别模型输出的关系置信度,故利用贝叶斯因果推断方法可从关系置信度中确定目标置信度,从而快速的从目标信息中确定目标触发词,利用该目标触发词即可实现对预设关系识别模型输出的主体与客体的关系的解释说明。
如图2所示,本发明实施例二提供的一种识别信息关系的方法,具体包括如下步骤:
S201、利用预设关系识别模型从待识别信息中确定目标信息。
S202、针对每个目标信息,利用预设关系识别模型对当前目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到当前目标信息对应的关系置信度。
示例性的,若目标信息包括“营收录得”、“于”、“4月”、“披露”“一季度”以及“财报”,则可以利用预设关系识别模型对“营收录得”进行掩码处理,并根据掩码处理结果AN1进行关系预测,得到“营收录得”对应的关系置信度I1,以此类推,可以得到剩余的目标信息对应的关系置信度,记作I2、I3、I4、I5 以及I6
S203、利用预设关系识别模型,从目标信息的关系置信度中确定目标置信度,并将目标置信度对应的目标信息确定为目标触发词。
示例性的,可以将关系置信度I1、I2、I3、I4、I5 以及I6中处于预设范围内的最小置信度确定为目标置信度。
可选的,利用预设关系识别模型,从目标信息的关系置信度中确定目标置信度,包括:当所述关系置信度为多个时,将未掩码的待识别信息输入预设关系识别模型,得到未掩码关系置信度;确定所述未掩码关系置信度与所述关系置信度的最大差值,并将所述最大差值对应的关系置信度确定为目标置信度。这样设置的好处在于,通过确定未掩码关系置信度与关系置信度的最大差值,可以准确的确定出对主体与客体关系影响最大的触发词对应的置信度。
示例性的,目标触发词的确定方式包括:
其中,Y表示预设关系识别模型,do(Z=k)表示对第k个目标信息采取掩码操作,do(Z=0)表示不进行掩码操作,X表示待识别信息,θ表示预设关系识别模型的网络参数,A表示待识别信息的领域,B表示第一子模型输出的第一类别表征向量,Pr(Y|do(Z=0),X,θ,A,B)表示在do(Z=0)、X、θ、A以及B条件下,预设关系识别模型输出的关系置信度,Pr(Y|do(Z=k),X,θ,A,B)表示在do(Z=k)、X、θ、A以及B条件下,预设关系识别模型输出的关系置信度,arg()表示取反,即根据关系置信度求对应的触发词,该触发词即为目标触发词。
S204、利用预设关系识别模型输出待识别信息中的主体、客体、主体与客体间的关系以及目标触发词。
本发明实施例提供的识别信息关系的方法,通过利用预设关系识别模型,迅速且准确的确定了每个目标信息对应的关系置信度,同时由于对目标触发词掩码会影响预设关系识别模型输出的关系置信度,故利用贝叶斯因果推断方法可从关系置信度中确定目标置信度,从而快速的从目标信息中确定目标触发词,利用该目标触发词即可实现对预设关系识别模型输出的主体与客体的关系的解释说明。
实施例三
图3为本发明实施例三提供的一种识别信息关系的装置的结构示意图。如图3所示,该装置包括:目标信息确定模块301、关系置信度确定模块302、以及结果输出模块303,其中:
目标信息确定模块,用于利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息;
关系置信度确定模块,用于利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度;
结果输出模块,用于利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息。
本发明实施例提供的识别信息关系的装置,利用预设关系识别模型对待识别信息中除主体以及客体外的信息,进行掩码处理并进行关系类别预测,得到关系置信度关系类别置信度,再利用预设关系识别模型和该类别置信度关系置信度,可以输出主体、客体、主体与客体间的关系以及用于解释该关系的目标触发词,其提高了模型输出的关系识别结果的可解释性,保证了决策者针对待识别信息作决策时的准确性和可靠性。
可选的,所述预设关系识别模型的确定方式,包括:利用初始训练样本,从预设领域数据库中确定扩充训练样本;利用类别表征向量和所述扩充训练样本的标签,确定所述扩充训练样本与第一类别表征向量的注意力值,并利用所述注意力值和所述扩充训练样本,确定伪标签样本,其中,所述类别表征向量包括所述初始训练样本的样本数据输入预设初始模型的第一子模型后,输出的所述第一类别表征向量以及所述扩充训练样本的样本数据输入预设初始模型的第二子模型后,输出的第二类别表征向量,所述伪标签样本的样本数据属于所述扩充训练样本,所述伪标签样本的标签为所述注意力值;将所述伪标签样本的样本数据输入所述预设初始模型,得到第一输出结果,并根据所述注意力值调整目标权重,其中,所述目标权重为所述预设初始模型的损失函数中所述伪标签样本对应的权重;利用输出结果和调整后的损失函数,确定损失函数值,并利用所述损失函数值确定预设关系识别模型,其中,所述输出结果包括所述第一输出结果和初始训练样本对应的第二输出结果。
进一步的,所述利用初始训练样本,从预设领域数据库中确定扩充训练样本,包括以下至少一项:从预设领域数据库中,筛选出包含预设近似关键词和所述初始训练样本的样本数据中的预设关键词一致的数据,得到第一扩充训练样本;从预设领域数据库中,筛选出与初始训练样本的样本数据的编辑距离最小的数据,得到第二扩充训练样本;以及将预设领域数据库中的数据输入所述第一子模型,得到第一文本表征向量,将所述初始训练样本的样本数据输入所述第一子模型,得到第二文本表征向量,并筛选出小于预设值的文本欧式距离对应的所述预设领域数据库中的数据,得到第三扩充训练样本,其中,所述预设近似关键词为所述预设关键词的近似词,所述文本欧式距离为所述第一文本表征向量与所述第一文本表征向量的欧式距离。
进一步的,在所述利用类别表征向量和所述扩充训练样本的标签,确定所述扩充训练样本与第一类别表征向量的注意力值之前,还包括:对所述扩充训练样本的标签进行标签平滑处理,得到平滑后的扩充训练样本;其中,所述利用所述注意力值从所述扩充训练样本中,确定伪标签样本,包括:判断所述注意力值是否大于预设阈值;若是,则将所述注意力值对应的所述平滑后的扩充训练样本的标签替换为所述注意力值,得到伪标签样本。
可选的,关系置信度确定模块具体用于,针对每个所述目标信息,利用所述预设关系识别模型对当前目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到所述当前目标信息对应的关系置信度。
可选的,结果输出模块包括:
目标触发词确定单元,用于利用所述预设关系识别模型,从所述目标信息的关系置信度中确定目标置信度,并将所述目标置信度对应的目标信息确定为目标触发词;
结果输出单元,用于利用所述预设关系识别模型输出所述待识别信息中的所述主体、所述客体、所述主体与所述客体间的关系以及所述目标触发词。
可选的,所述利用所述预设关系识别模型,从所述目标信息的关系置信度中确定目标置信度,包括:当所述关系置信度为多个时,将未掩码的待识别信息输入预设关系识别模型,得到未掩码关系置信度;确定所述未掩码关系置信度与所述关系置信度的最大差值,并将所述最大差值对应的关系置信度确定为目标置信度。
本发明实施例所提供的识别信息关系的装置可执行本发明任意实施例所提供的识别信息关系的方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实施本发明的实施例的电子设备40的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备40包括至少一个处理器41,以及与至少一个处理器41通信连接的存储器,如只读存储器(ROM)42、随机访问存储器(RAM)43等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器41可以根据存储在只读存储器(ROM)42中的计算机程序或者从存储单元48加载到随机访问存储器(RAM)43中的计算机程序,来执行各种适当的动作和处理。在RAM 43中,还可存储电子设备40操作所需的各种程序和数据。处理器41、ROM 42以及RAM 43通过总线44彼此相连。输入/输出(I/O)接口45也连接至总线44。
电子设备40中的多个部件连接至I/O接口45,包括:输入单元46,例如键盘、鼠标等;输出单元47,例如各种类型的显示器、扬声器等;存储单元48,例如磁盘、光盘等;以及通信单元49,例如网卡、调制解调器、无线通信收发机等。通信单元49允许电子设备40通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器41可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器41的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器41执行上文所描述的各个方法和处理,例如识别信息关系的方法。
在一些实施例中,识别信息关系的方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元48。在一些实施例中,计算机程序的部分或者全部可以经由ROM 42和/或通信单元49而被载入和/或安装到电子设备40上。当计算机程序加载到RAM 43并由处理器41执行时,可以执行上文描述的识别信息关系的方法的一个或多个步骤。备选地,在其他实施例中,处理器41可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行识别信息关系的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
上述提供的计算机设备可用于执行上述任意实施例提供的识别信息关系的方法,具备相应的功能和有益效果。
实施例五
在本发明的上下文中,计算机可读存储介质可以是有形的介质,所述计算机可执行指令在由计算机处理器执行时用于执行识别信息关系的方法,该方法包括:
利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息;
利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度;
利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
上述提供的计算机设备可用于执行上述任意实施例提供的识别信息关系的方法,具备相应的功能和有益效果。
值得注意的是,上述识别信息关系的装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种识别信息关系的方法,其特征在于,包括:
利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息;
利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度;
利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息;
其中,所述目标触发词的确定方式包括:
其中,Y表示所述预设关系识别模型,do(Z=k)表示对第k个目标信息采取掩码操作,do(Z=0)表示不进行掩码操作,X表示所述待识别信息,θ表示所述预设关系识别模型的网络参数,A表示所述待识别信息的领域,B表示所述预设关系识别模型的第一子模型输出的第一类别表征向量,Pr(Y|do(Z=0),X,θ,A,B)表示在do(Z=0)、X、θ、A以及B条件下,预设关系识别模型输出的关系置信度,Pr(Y|do(Z=k),X,θ,A,B)表示在do(Z=k)、X、θ、A以及B条件下,所述预设关系识别模型输出的关系置信度,arg()表示取反。
2.根据权利要求1所述的方法,其特征在于,所述预设关系识别模型的确定方式,包括:
利用初始训练样本,从预设领域数据库中确定扩充训练样本;
利用类别表征向量和所述扩充训练样本的标签,确定所述扩充训练样本与第一类别表征向量的注意力值,并利用所述注意力值和所述扩充训练样本,确定伪标签样本,其中,所述类别表征向量包括所述初始训练样本的样本数据输入预设初始模型的第一子模型后,输出的所述第一类别表征向量以及所述扩充训练样本的样本数据输入预设初始模型的第二子模型后,输出的第二类别表征向量,所述伪标签样本的样本数据属于所述扩充训练样本,所述伪标签样本的标签为所述注意力值;
将所述伪标签样本的样本数据输入所述预设初始模型,得到第一输出结果,并根据所述注意力值调整目标权重,其中,所述目标权重为所述预设初始模型的损失函数中所述伪标签样本对应的权重;
利用输出结果和调整后的损失函数,确定损失函数值,并利用所述损失函数值确定预设关系识别模型,其中,所述输出结果包括所述第一输出结果和初始训练样本对应的第二输出结果。
3.根据权利要求2所述的方法,其特征在于,所述利用初始训练样本,从预设领域数据库中确定扩充训练样本,包括以下至少一项:
从预设领域数据库中,筛选出包含预设近似关键词和所述初始训练样本的样本数据中的预设关键词一致的数据,得到第一扩充训练样本;
从预设领域数据库中,筛选出与初始训练样本的样本数据的编辑距离最小的数据,得到第二扩充训练样本;以及
将预设领域数据库中的数据输入所述第一子模型,得到第一文本表征向量,将所述初始训练样本的样本数据输入所述第一子模型,得到第二文本表征向量,并筛选出小于预设值的文本欧式距离对应的所述预设领域数据库中的数据,得到第三扩充训练样本,其中,所述预设近似关键词为所述预设关键词的近似词,所述文本欧式距离为所述第一文本表征向量与所述第一文本表征向量的欧式距离。
4.根据权利要求2所述的方法,其特征在于,在所述利用类别表征向量和所述扩充训练样本的标签,确定所述扩充训练样本与第一类别表征向量的注意力值之前,还包括:
对所述扩充训练样本的标签进行标签平滑处理,得到平滑后的扩充训练样本;
其中,所述利用所述注意力值从所述扩充训练样本中,确定伪标签样本,包括:
判断所述注意力值是否大于预设阈值;
若是,则将所述注意力值对应的所述平滑后的扩充训练样本的标签替换为所述注意力值,得到伪标签样本。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,包括:
针对每个所述目标信息,利用所述预设关系识别模型对当前目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到所述当前目标信息对应的关系置信度。
6.根据权利要求5所述的方法,其特征在于,所述利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,包括:
利用所述预设关系识别模型,从所述目标信息的关系置信度中确定目标置信度,并将所述目标置信度对应的目标信息确定为目标触发词;
利用所述预设关系识别模型输出所述待识别信息中的所述主体、所述客体、所述主体与所述客体间的关系以及所述目标触发词。
7.根据权利要求6所述的方法,其特征在于,所述利用所述预设关系识别模型,从所述目标信息的关系置信度中确定目标置信度,包括:
当所述关系置信度为多个时,将未掩码的待识别信息输入预设关系识别模型,得到未掩码关系置信度;确定所述未掩码关系置信度与所述关系置信度的最大差值,并将所述最大差值对应的关系置信度确定为目标置信度。
8.一种识别信息关系的装置,其特征在于,包括:
目标信息确定模块,用于利用预设关系识别模型从待识别信息中确定目标信息,其中,所述目标信息为所述待识别信息中除主体和客体外的信息;
关系置信度确定模块,用于利用所述预设关系识别模型对所述目标信息进行掩码处理,并根据掩码处理结果进行关系预测,得到关系置信度,其中,所述关系置信度为所述待识别信息中所述主体与所述客体间的关系的置信度;
结果输出模块,用于利用所述预设关系识别模型和所述关系置信度,输出目标触发词、所述主体、所述客体以及所述主体与所述客体间的关系,其中,所述目标触发词为所述关系的解释信息,所述目标触发词属于所述目标信息;
其中,所述目标触发词的确定方式包括:
其中,Y表示所述预设关系识别模型,do(Z=k)表示对第k个目标信息采取掩码操作,do(Z=0)表示不进行掩码操作,X表示所述待识别信息,θ表示所述预设关系识别模型的网络参数,A表示所述待识别信息的领域,B表示所述预设关系识别模型的第一子模型输出的第一类别表征向量,Pr(Y|do(Z=0),X,θ,A,B)表示在do(Z=0)、X、θ、A以及B条件下,预设关系识别模型输出的关系置信度,Pr(Y|do(Z=k),X,θ,A,B)表示在do(Z=k)、X、θ、A以及B条件下,所述预设关系识别模型输出的关系置信度,arg()表示取反。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的识别信息关系的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的识别信息关系的方法。
CN202311444555.0A 2023-11-02 2023-11-02 一种识别信息关系的方法、装置、设备及存储介质 Active CN117171653B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311444555.0A CN117171653B (zh) 2023-11-02 2023-11-02 一种识别信息关系的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311444555.0A CN117171653B (zh) 2023-11-02 2023-11-02 一种识别信息关系的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN117171653A CN117171653A (zh) 2023-12-05
CN117171653B true CN117171653B (zh) 2024-01-23

Family

ID=88945302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311444555.0A Active CN117171653B (zh) 2023-11-02 2023-11-02 一种识别信息关系的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117171653B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114169332A (zh) * 2021-11-30 2022-03-11 科讯嘉联信息技术有限公司 一种基于深度学习模型的地址命名实体识别的调优方法
CN114491024A (zh) * 2021-12-31 2022-05-13 长城信息股份有限公司 一种基于小样本的特定领域多标签文本分类方法
CN114528394A (zh) * 2022-04-22 2022-05-24 杭州费尔斯通科技有限公司 一种基于掩码语言模型的文本三元组提取方法及装置
JP2023039102A (ja) * 2021-09-08 2023-03-20 沖電気工業株式会社 データ拡張用情報取得装置、及びデータ拡張用情報取得プログラム
CN115879453A (zh) * 2022-11-17 2023-03-31 常州大学 一种融合词汇边界及语义信息的实体识别及关系抽取方法
CN116562263A (zh) * 2023-05-08 2023-08-08 华侨大学 一种文档衔接连贯性的评测方法、装置、设备及存储介质
CN116757164A (zh) * 2023-06-21 2023-09-15 张丽莉 一种gpt生成语言识别与检测系统
CN116795979A (zh) * 2023-04-14 2023-09-22 天津大学 一种基于触发词增强的标签信号指导事件检测方法
CN116861894A (zh) * 2023-03-17 2023-10-10 国网冀北电力有限公司 一种基于半监督学习的电网领域实体关系抽取
CN116882413A (zh) * 2023-07-13 2023-10-13 中国人民解放军国防科技大学 一种中文实体识别方法、装置及设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023039102A (ja) * 2021-09-08 2023-03-20 沖電気工業株式会社 データ拡張用情報取得装置、及びデータ拡張用情報取得プログラム
CN114169332A (zh) * 2021-11-30 2022-03-11 科讯嘉联信息技术有限公司 一种基于深度学习模型的地址命名实体识别的调优方法
CN114491024A (zh) * 2021-12-31 2022-05-13 长城信息股份有限公司 一种基于小样本的特定领域多标签文本分类方法
CN114528394A (zh) * 2022-04-22 2022-05-24 杭州费尔斯通科技有限公司 一种基于掩码语言模型的文本三元组提取方法及装置
CN115879453A (zh) * 2022-11-17 2023-03-31 常州大学 一种融合词汇边界及语义信息的实体识别及关系抽取方法
CN116861894A (zh) * 2023-03-17 2023-10-10 国网冀北电力有限公司 一种基于半监督学习的电网领域实体关系抽取
CN116795979A (zh) * 2023-04-14 2023-09-22 天津大学 一种基于触发词增强的标签信号指导事件检测方法
CN116562263A (zh) * 2023-05-08 2023-08-08 华侨大学 一种文档衔接连贯性的评测方法、装置、设备及存储介质
CN116757164A (zh) * 2023-06-21 2023-09-15 张丽莉 一种gpt生成语言识别与检测系统
CN116882413A (zh) * 2023-07-13 2023-10-13 中国人民解放军国防科技大学 一种中文实体识别方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于事件本体的文本事件要素提取方法;刘炜;刘菲京;王东;刘宗田;;中文信息学报(第04期);第167-175页 *

Also Published As

Publication number Publication date
CN117171653A (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
CN108121700B (zh) 一种关键词提取方法、装置及电子设备
CN107798136B (zh) 基于深度学习的实体关系抽取方法、装置及服务器
US10163063B2 (en) Automatically mining patterns for rule based data standardization systems
CN109299228B (zh) 计算机执行的文本风险预测方法及装置
CN107368542B (zh) 一种涉密数据的涉密等级评定方法
CN107102993B (zh) 一种用户诉求分析方法和装置
CN111079186B (zh) 数据分析的方法、装置、设备和存储介质
US11651016B2 (en) System and method for electronic text classification
CN113688631B (zh) 一种嵌套命名实体识别方法、系统、计算机和存储介质
CN116720515A (zh) 基于大语言模型的敏感词审核方法、存储介质及电子设备
CN109271624B (zh) 一种目标词确定方法、装置及存储介质
CN113486178B (zh) 文本识别模型训练方法、文本识别方法、装置以及介质
CN111091004B (zh) 一种语句实体标注模型的训练方法、训练装置及电子设备
CN113743111A (zh) 基于文本预训练和多任务学习的金融风险预测方法及装置
CN110298024A (zh) 涉密文档的检测方法、装置及存储介质
CN110888983A (zh) 一种正负面情感分析方法、终端设备及存储介质
CN107527289B (zh) 一种投资组合行业配置方法、装置、服务器和存储介质
CN114202443A (zh) 政策分类方法、装置、设备及存储介质
CN114722162B (zh) 特征类别确定方法、装置、电子设备及存储介质
CN117171653B (zh) 一种识别信息关系的方法、装置、设备及存储介质
CN116340752A (zh) 一种面向预测性分析结果的数据故事生成方法及系统
Cao et al. Intention classification in multiturn dialogue systems with key sentences mining
CN112579774B (zh) 模型训练方法、模型训练装置及终端设备
CN115169345A (zh) 文本情感分析模型的训练方法、装置、设备及存储介质
CN114090781A (zh) 基于文本数据的容斥事件检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant