CN111552812B - 确定实体之间关系类别的方法、装置和计算机设备 - Google Patents

确定实体之间关系类别的方法、装置和计算机设备 Download PDF

Info

Publication number
CN111552812B
CN111552812B CN202010355497.4A CN202010355497A CN111552812B CN 111552812 B CN111552812 B CN 111552812B CN 202010355497 A CN202010355497 A CN 202010355497A CN 111552812 B CN111552812 B CN 111552812B
Authority
CN
China
Prior art keywords
word
text
entity
target
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010355497.4A
Other languages
English (en)
Other versions
CN111552812A (zh
Inventor
周阳
王文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shuliantianxia Intelligent Technology Co Ltd
Original Assignee
Shenzhen Shuliantianxia Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shuliantianxia Intelligent Technology Co Ltd filed Critical Shenzhen Shuliantianxia Intelligent Technology Co Ltd
Priority to CN202010355497.4A priority Critical patent/CN111552812B/zh
Publication of CN111552812A publication Critical patent/CN111552812A/zh
Application granted granted Critical
Publication of CN111552812B publication Critical patent/CN111552812B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种确定实体之间关系类别的方法、装置和计算机设备,包括:对待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述邻接字为在所述待识别文本中与所述字相邻的字;根据所述待识别文本中每个字对应的目标字向量得到待识别文本中每个字对应的实体标注结果;根据待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,进而根据待识别文本中每个实体对应的特征向量实现对待识别文本中的至少两个实体的关系分类结果的确定。通过本发明能够提高关系分类的准确率。

Description

确定实体之间关系类别的方法、装置和计算机设备
技术领域
本发明涉及信息抽取技术领域,尤其涉及一种确定实体之间关系类别的方法、装置和计算机设备。
背景技术
实体抽取是指从文本中抽取出实体,现有的实体抽取方法主要是通过训练实体抽取模型,然后将文本输入训练好的实体·抽取模型,得到实体抽取模型输出的实体。一般的,实体抽取模型有机器学习模型、深度学习模型。
在抽取出实体之后,如果文本中包含多个实体,还需要确定这多个实体之间的关系类别。例如,实体“周杰伦”与实体“台湾”的关系类别为“出生于”;实体“科比”与“湖人队”的关系类别为“就职于”。通常,需要预先训练关系分类模型,将从文本中提取出来的多个实体的实体特征输入训练好的关系分类模型,即可得到关系分类模型输出的关系类别。一般的,关系分类模型有机器学习模型、深度学习模型。
但是,现有的实体抽取模型只是单纯的抽取出实体的特征,并没有对实体所涉及的上下文信息进行充分的挖掘,从而导致提取出来的实体特征并不准确,进而导致最终确定的关系类别的准确率低。
发明内容
基于此,有必要针对上述问题,提出一种准确率高的确定实体之间关系类别的方法、装置和计算机设备。
第一方面,提供了一种确定实体之间关系类别的方法,所述方法包括:
获取待识别文本中每个字对应的初步字向量,所述待识别文本中包括至少两个实体;
对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述字对应的邻接字为在所述待识别文本中与所述字相邻的字;
根据预设的第一权重矩阵,对所述待识别文本中每个字对应的目标字向量进行标注,得到所述待识别文本中每个字对应的实体标注结果,所述实体标注结果为实体结果或非实体结果中的一个;
根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量;
根据预设的第二权重矩阵,对所述待识别文本中每个实体对应的特征向量进行关系分类,得到所述待识别文本中的至少两个实体的关系分类结果。
在一个实施例中,所述根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,包括:将所述字和所述字对应的邻接字之间的权重与所述字对应的邻接字的初步字向量相乘,得到所述字对应的邻接字的更新字向量;根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量。
在一个实施例中,所述根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量,包括:获取预设的权重系数;将所述权重系数与所述字对应的初步字向量相乘,得到第一字向量;根据所述权重系数和所述字对应的邻接字的更新字向量,得到第二字向量;将所述第一字向量和所述第二字向量求和,得到所述字对应的目标字向量。
在一个实施例中,所述根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,包括:根据所述待识别文本中每个字对应的实体标注结果,得到所述待识别文本中每个实体对应的目标字;根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量。
在一个实施例中,所述根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量,包括:根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征矩阵;对所述待识别文本中每个实体对应的特征矩阵进行维度处理,得到所述待识别文本中每个实体对应的特征向量,所述待识别文本中每个实体对应的特征向量的维度相同。
在一个实施例中,在所述获取待识别文本中每个字对应的初步字向量之前,还包括:获取训练文本中每个字对应的初步字向量,所述训练文本中每个字对应的目标实体标注结果和所述训练文本中至少两个实体的目标关系分类结果;对所述训练文本中的每个字,根据所述第一权重矩阵、所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述训练文本中每个字对应的初步实体标注结果;根据所述训练文本中每个字对应的初步实体标注结果和目标实体标注结果,计算第一损失;根据所述第二权重矩阵、所述训练文本中每个字对应的初步实体标注结果和训练文本中每个字对应的目标字向量,得到所述训练文本中至少两个实体的初步关系分类结果;根据所述训练文本中至少两个实体的初步关系分类结果和目标关系分类结果,计算第二损失;根据所述第一损失和所述第二损失之和,对所述字和所述字对应的邻接字之间的权重、所述第一权重矩阵和所述第二权重矩阵进行调整,以使所述训练文本中每个字对应的初步实体标注结果逼近于所述训练文本中每个字对应的目标实体标注结果,同时,所述训练文本中至少两个实体的初步关系分类结果逼近于所述训练文本中至少两个实体的目标关系分类结果。
在一个实施例中,所述获取待识别文本中每个字对应的初步字向量,包括:获取待识别文本;对所述待识别文本进行字分割,得到所述待识别文本中的每个字;根据所述待识别文本中每个字对应的字标识,从预设的字表矩阵中获取到所述待识别文本中每个字对应的初步字向量。
第二方面,提供了一种确定实体之间关系类别的装置,包括:
初步获取模块,用于获取待识别文本中每个字对应的初步字向量,所述待识别文本中包括至少两个实体;
目标获取模块,用于对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述字对应的邻接字为在所述待识别文本中与所述字相邻的字;
实体标注模块,用于根据预设的第一权重矩阵,对所述待识别文本中每个字对应的目标字向量进行标注,得到所述待识别文本中每个字对应的实体标注结果,所述实体标注结果为实体结果或非实体结果中的一个;
实体特征模块,用于根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量;
关系分类模块,用于根据预设的第二权重矩阵,对所述待识别文本中每个实体对应的特征向量进行关系分类,得到所述待识别文本中的至少两个实体的关系分类结果。
在一个实施例中,所述目标获取模块,具体用于:将所述字和所述字对应的邻接字之间的权重与所述字对应的邻接字的初步字向量相乘,得到所述字对应的邻接字的更新字向量;根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量。
在一个实施例中,所述目标获取模块,具体用于:获取预设的权重系数;将所述权重系数与所述字对应的初步字向量相乘,得到第一字向量;根据所述权重系数和所述字对应的邻接字的更新字向量,得到第二字向量;将所述第一字向量和所述第二字向量求和,得到所述字对应的目标字向量。
在一个实施例中,所述实体特征模块,具体用于:根据所述待识别文本中每个字对应的实体标注结果,得到所述待识别文本中每个实体对应的目标字;根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量。
在一个实施例中,所述实体特征模块,具体用于:根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征矩阵;对所述待识别文本中每个实体对应的特征矩阵进行维度处理,得到所述待识别文本中每个实体对应的特征向量,所述待识别文本中每个实体对应的特征向量的维度相同。
在一个实施例中,所述装置,还包括:训练模块,用于获取训练文本中每个字对应的初步字向量,所述训练文本中每个字对应的目标实体标注结果和所述训练文本中至少两个实体的目标关系分类结果;对所述训练文本中的每个字,根据所述第一权重矩阵、所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述训练文本中每个字对应的初步实体标注结果;根据所述训练文本中每个字对应的初步实体标注结果和目标实体标注结果,计算第一损失;根据所述第二权重矩阵、所述训练文本中每个字对应的初步实体标注结果和训练文本中每个字对应的目标字向量,得到所述训练文本中至少两个实体的初步关系分类结果;根据所述训练文本中至少两个实体的初步关系分类结果和目标关系分类结果,计算第二损失;根据所述第一损失和所述第二损失之和,对所述字和所述字对应的邻接字之间的权重、所述第一权重矩阵和所述第二权重矩阵进行调整,以使所述训练文本中每个字对应的初步实体标注结果逼近于所述训练文本中每个字对应的目标实体标注结果,同时,所述训练文本中至少两个实体的初步关系分类结果逼近于所述训练文本中至少两个实体的目标关系分类结果。
在一个实施例中,所述初步获取模块,具体用于:获取待识别文本;对所述待识别文本进行字分割,得到所述待识别文本中的每个字;根据所述待识别文本中每个字对应的字标识,从预设的字表矩阵中获取到所述待识别文本中每个字对应的初步字向量。
第三方面,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取待识别文本中每个字对应的初步字向量,所述待识别文本中包括至少两个实体;
对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述字对应的邻接字为在所述待识别文本中与所述字相邻的字;
根据预设的第一权重矩阵,对所述待识别文本中每个字对应的目标字向量进行标注,得到所述待识别文本中每个字对应的实体标注结果,所述实体标注结果为实体结果或非实体结果中的一个;
根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量;
根据预设的第二权重矩阵,对所述待识别文本中每个实体对应的特征向量进行关系分类,得到所述待识别文本中的至少两个实体的关系分类结果。
第四方面,提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取待识别文本中每个字对应的初步字向量,所述待识别文本中包括至少两个实体;
对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述字对应的邻接字为在所述待识别文本中与所述字相邻的字;
根据预设的第一权重矩阵,对所述待识别文本中每个字对应的目标字向量进行标注,得到所述待识别文本中每个字对应的实体标注结果,所述实体标注结果为实体结果或非实体结果中的一个;
根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量;
根据预设的第二权重矩阵,对所述待识别文本中每个实体对应的特征向量进行关系分类,得到所述待识别文本中的至少两个实体的关系分类结果。
实施本发明实施例,将具有如下有益效果:
本发明提出了一种确定实体之间关系类别的方法、装置和计算机设备,首先,对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述邻接字为在所述待识别文本中与所述字相邻的字;然后,根据所述待识别文本中每个字对应的目标字向量得到待识别文本中每个字对应的实体标注结果;最后,根据待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,进而根据待识别文本中每个实体对应的特征向量实现对待识别文本中的至少两个实体的关系分类结果的确定。可见,由于字对应的目标字向量是根据该字的初步字向量、字与邻接字之间的权重以及邻接字的初步字向量得到的,也就是说,字对应的目标字向量是充分挖掘了该字上下文的信息,使得最终得到的目标字向量对该字的表达更加的准确,由于通过目标字向量能够对字进行更加准确的表达,因此,基于目标字向量得到的该字的实体标注结果也将更准确,即对实体的预测将更加的准确,确定的实体的特征向量也将更加的准确,基于实体的特征向量进行关系分类得到的关系分类结果也将更加的准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中确定实体之间关系类别的方法的实现流程示意图;
图2为一个实施例中步骤102的实现流程示意图;
图3为一个实施例中步骤104的实现流程示意图;
图4为一个实施例中步骤104B的实现流程示意图;
图5为一个实施例中步骤108的实现流程示意图;
图6为一个实施例中步骤108B的实现流程示意图;
图7为一个实施例中确定实体之间关系类别的装置的结构框图;
图8为一个实施例中计算机设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在一个实施例中,提供了一种确定实体之间关系类别的方法,本发明实施例所述的确定实体之间关系类别的方法的执行主体为能够实现本发明实施例所述的确定实体之间关系类别的方法的设备,该设备可以包括但不限于终端和服务器。其中,终端包括台式终端和移动终端,台式终端包括但不限于台式电脑和车载电脑;移动终端包括但不限于手机、平板、笔记本电脑和智能手表。服务器包括高性能计算机和高性能计算机集群。
如图1所示,本发明实施例所述的确定实体之间关系类别的方法,具体包括:
步骤102,获取待识别文本中每个字对应的初步字向量,所述待识别文本中包括至少两个实体。
其中,待识别文本,为需要对其中的实体进行关系分类的文本。
其中,字向量,在机器领域,用字向量来表示一个字,以便机器识别不同的字。
其中,初步字向量,为通过字向量的方式对字进行原始的表达,该原始的表达未包含该字的上下文信息。
可以通过以下方式获取到字对应的初步字向量。
示例性的,预先构建一个大的字表矩阵,该字表矩阵记录了各个领域的字对应的字向量,后续可以根据该大的字表矩阵,实现对各个领域的字的初步字向量的查询。
示例性的,不同的领域构建不同的字表矩阵,该字表矩阵只用于记录该领域的字对应的初步字向量,以便根据不同领域的字表矩阵查询不同领域的字的初步字向量,提高初步字向量的查询效率。
由于字表矩阵中记录了不同的字对应的初步字向量,因此,当待识别文本确定的时候,待识别文本中的每个字就已经确定,此时,便可以通过字表矩阵查询到待识别文本中每个字对应的初步字向量。
其中,实体,为文本中的事物,例如,人名、地名、电影名、公司名、动物名,这些都可以看做是实体。实体可以包括多个字,例如,张三;也可以只包括一个字,例如,狗。
步骤104,对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述字对应的邻接字为在所述待识别文本中与所述字相邻的字。
其中,字对应的邻接字,为在待识别文本中与该字相邻的字。
字和邻接字的关系可以是一对一的关系,即在待识别文本中,一个字只对应一个邻接字,例如,待识别文本中“ABCDEFG”,字D的邻接字为字E。
进一步的,为了挖掘出更多的上下文信息,字和邻接字的关系还可以是一对多的关系,即在待识别文本中,一个字可以对应多个邻接字,例如,待识别文本中“ABCDEFG”,字D的邻接字为字B、C、E和F。
其中,权重,为一个值,反映在确定实体特征或者在进行关系分类的时候,邻接字对字的影响程度的大小。在确定实体特征或者在进行关系分类的时候,邻接字对字的影响程度越大,则字与该字对应的邻接字之间的权重越大;相反,在确定实体特征或者在进行关系分类的时候,邻接字对字的影响程度越小,则字与该字对应的邻接字之间的权重越小。
其中,目标字向量,为结合了字的上下文信息的字向量。由于目标字向量是根据字对应的初步字向量、字与邻接字之间的权重以及邻接字的初步字向量得到的,因此,目标字向量充分融入了文本的上下文信息,相较于初步字向量,在待识别文本中对字的表达将更加的准确。
步骤106,根据预设的第一权重矩阵,对所述待识别文本中每个字对应的目标字向量进行标注,得到所述待识别文本中每个字对应的实体标注结果,所述实体标注结果为实体结果或非实体结果中的一个。
其中,第一权重矩阵,为为了确定字的实体标注结果而设置的权重矩阵,其中,权重矩阵,为包含多个权重值的矩阵。
其中,实体结果,指示该字为实体或者实体的组成部分。例如,实体为一个字,则实体结果对应的字即为实体;再如,实体为两个字,则实体结果对应的字为实体的组成部分。
其中,非实体结果,指示字不是实体,也不是实体的组成部分。
将第一权重矩阵与字对应的目标字向量相乘,得到字特征向量;使用softmax函数对字特征向量进行归一化处理,得到标签的概率分布;从所述概率分布中获取到最大概率,将最大概率对应的标签作为对该字的实体标注结果。
例如,标签为B(实体的开始字,例如,实体为周杰伦,则周字为开始字)、I(实体的中间字或者实体的结束字,例如,杰字为中间字,伦字为结束字)和O(不是实体也不是实体的组成部分),目标字向量为r’,第一权重矩阵为W0,将r’与W0相乘,得到字特征向量r”;使用softmax函数对r”进行归一化处理,得到B、I和O的概率分布为[0.1,0.05,0.85];从该概率分布中挑选出最大概率0.85,0.85对应的标签为O,于是,该标签O作为对该字的实体标注结果。
需要说明的是,第一权重矩阵W0的行数等于目标字向量r’的维度,例如,目标字向量r’的维度为n,即目标字向量r’为1×n的向量,则第一权重矩阵W0的行数为n;第一权重矩阵W0的列数等于标签的数量,例如,标签有:B、I和O,即标签的数量为3,于是,第一权重矩阵W0的列数为3。
步骤108,根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量。
由于已经确定了待识别文本中每个字对应的实体标注结果,即确定了待识别文本中的字是否是实体或者是否是实体的组成部分,从而确定了待识别文本中的实体;由于待识别文本中每个字对应的目标字向量已经确定,因此,可以根据每个字对应的目标字向量,确定实体对应的特征向量。
步骤110,根据预设的第二权重矩阵,对所述待识别文本中每个实体对应的特征向量进行关系分类,得到所述待识别文本中的至少两个实体的关系分类结果。
其中,第二权重矩阵,为为了实体的关系分类结果而设置的权重矩阵。
其中,关系分类结果,反映待识别文本中的至少两个实体之间的关系。例如,实体“周杰伦”与实体“台湾”之间的关系为“出生于”,则关系分类结果为“出生于”;实体“科比”与“湖人队”之间的关系为“就职于”,则关系分类结果为“就职于”。
将待识别文本中各个实体对应的特征向量进行组合,得到组合向量;将第二权重矩阵与组合向量相乘,得到组合特征向量;使用softmax函数对组合特征向量进行归一化处理,得到标签的概率分布;从所述概率分布中获取到最大概率,将最大概率对应的标签作为对待识别文本中的至少两个实体的关系分类结果。
例如,标签为B(指示关系分类结果为“出生于”)、I(指示关系分类结果为“就职于”)和O(指示关系分类结果为“就读于”),实体1对应的特征向量为r1’(维度1×n),实体2对应的特征向量为r2’(维度1×n),r1’和r2’的组合向量为rc’(维度1×2n);第二权重矩阵为Wc,将rc’与Wc相乘,得到组合特征向量rc”;使用softmax函数对rc”进行归一化处理,得到B、I和O的概率分布为[0.1,0.05,0.85];从该概率分布中挑选出最大概率0.85,0.85对应的标签为O,于是,该标签O作为待识别文本中的实体1和实体2的关系分类结果,即实体1和实体2之间的关系为“就读于”。
需要说明的是,第二权重矩阵Wc的行数等于组合向量rc’的维度,例如,组合向量rc’的维度为2n,即组合向量rc’为1×2n的向量,则第二权重矩阵Wc的行数为2n;第二权重矩阵Wc的列数等于标签的数量,例如,标签有:B、I和O,即标签的数量为3,于是,第二权重矩阵Wc的列数为3。
上述确定实体之间关系类别的方法,首先,对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述邻接字为在所述待识别文本中与所述字相邻的字;然后,根据所述待识别文本中每个字对应的目标字向量得到待识别文本中每个字对应的实体标注结果;最后,根据待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,进而根据待识别文本中每个实体对应的特征向量实现对待识别文本中的至少两个实体的关系分类结果的确定。可见,由于字对应的目标字向量是根据该字的初步字向量、字与邻接字之间的权重以及邻接字的初步字向量得到的,也就是说,字对应的目标字向量是充分挖掘了该字上下文的信息,使得最终得到的目标字向量对该字的表达更加的准确,由于通过目标字向量能够对字进行更加准确的表达,因此,基于目标字向量得到的该字的实体标注结果也将更准确,即对实体的预测将更加的准确,确定的实体的特征向量也将更加的准确,基于实体的特征向量进行关系分类得到的关系分类结果也将更加的准确。
在一个实施例中,提高了一种生成初步字向量的方法,能够通过字标识,快速生成初步字向量。如图2所示,步骤102所述获取待识别文本中每个字对应的初步字向量,包括:
步骤102A,获取待识别文本。
步骤102B,对所述待识别文本进行字分割,得到所述待识别文本中的每个字。
示例性的,采用特征提取的方法,实现对待识别文本中的字的分割和识别,得到待识别文本中的各个字。
步骤102C,根据所述待识别文本中每个字对应的字标识,从预设的字表矩阵中获取到所述待识别文本中每个字对应的初步字向量。
其中,字标识,用于唯一标识一个字。预先为不同的字建立字标识,后续在查询初步字向量的时候,就可以根据字标识从预设的字表矩阵中查询到每个字对应的初步字向量。例如,某一个的字的字标识为50,意味着预设的字表矩阵中第50行对应的字向量为该字的初步字向量。
在一个实施例中,提供了一种具体的确定目标字向量的方法,该方法在字有多个邻接字的时候,根据多个邻接字对应的更新字向量得到目标更新字向量,从而根据目标更新字向量和字的初步字向量得到字的目标字向量,由于目标更新字向量是从多个邻接字的初步字向量中提取出的最大参数得到的,使得对上下文信息的提取更加的有效。如图3所示,步骤104所述所述根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,包括:
步骤104A,将所述字和所述字对应的邻接字之间的权重与所述字对应的邻接字的初步字向量相乘,得到所述字对应的邻接字的更新字向量。
其中,更新字向量,为使用权重对邻接字的字向量进行更新后得到的字向量。例如,字A与字A对应的邻接字B之间的权重为a,字A对应的邻接字B的初步字向量为rb,则字A对应的邻接字B的更新字向量为a×rb
步骤104B,根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量。
示例性的,当字对应的邻接字只有一个的时候,字对应的目标字向量=(a×rb+ra)/2,其中,ra为字A对应的初步字向量。
示例性的,当字对应的邻接字有多个的时候,根据所述字对应的各个邻接字的更新字向量,得到目标更新字向量;根据所述目标更新字向量与所述字对应的初步字向量,得到所述字对应的目标字向量。
例如,当字n对应的邻接字有多个的时候,目标更新字向量为:
Figure BDA0002473295930000111
字n对应的目标字向量=(Mn+rn)/2。
其中,ra为字n的邻接字对应的初步字向量,ean为字n和字n对应的邻接字a之间的权重,ean×ra为邻接字a的更新字向量,
Figure BDA0002473295930000112
为字n对应的各个邻接字组成的集合,邻接字a为该集合
Figure BDA0002473295930000113
中的某一个邻接字。
下面说明下根据max公式如何得到目标更新字向量。例如,字n有3个邻接字,3个邻接字对应的更新字向量分别为A1=[0.1,0.1,0.8],A2=[0.2,0.1,0.7],A3=[0.4,0.2,0.4],则目标更新字向量:
Figure BDA0002473295930000114
将每一列的最大值挑选出来,得到目标更新字向量Mn=[0.4,0.2,0.8]。
在一个实施例中,预先设置权重系数,权重系数不同,意味着字的上下文对字的目标字向量的影响的大小不同,通过这样的方法,能够根据实际的应用场景设置不同的权重系数,使得最终确定的字的目标字向量更加的准确。如图4所示,步骤104B所述根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量,包括:
步骤104B1,获取预设的权重系数。
其中,预设的权重系数,为预先设置的权重系数,该权重系数可以根据具体的应用场景进行设置。
步骤104B2,将所述权重系数与所述字对应的初步字向量相乘,得到第一字向量。
其中,第一字向量,为使用权重系数对字的初步字向量进行更新后得到的字向量。例如,权重系数为m,字对应的初步字向量为:rn,则第一字向量为m×rn
步骤104B3,根据所述权重系数和所述字对应的邻接字的更新字向量,得到第二字向量。
其中,第二字向量,为使用权重系数对字对应的邻接字的更新字向量进行处理后得到的字向量。
示例性的,当字对应的邻接字只有一个的时候,若邻接字对应的更新字向量为:rb,则第二字向量为:(1-m)×rb
示例性的,当字对应的邻接字有多个的时候,根据所述字对应的各个邻接字的更新字向量,得到目标更新字向量;使用所述权重系数对所述目标更新字向量进行处理,得到第二字向量。例如,若目标更新字向量为Mn,则第二字向量为:(1-m)×Mn
步骤104B4,将所述第一字向量和所述第二字向量求和,得到所述字对应的目标字向量。
当字对应的邻接字只有一个的时候,目标字向量=m×rn+(1-m)×rb;当字对应的邻接字有多个的时候,目标字向量=m×rn+(1-m)×Mn
在一个实施例中,由于对字进行了实体标注,即区分了该字是否是实体或者实体的组成部分,因此,根据对字的实体标注结果,可以快速的确定实体,进而得到实体对应的特征向量。如图5所示,步骤108所述根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,包括:
步骤108A,根据所述待识别文本中每个字对应的实体标注结果,得到所述待识别文本中每个实体对应的目标字。
其中,目标字,为组成实体的字。
例如,用B和I标注为实体的字和为实体的组成部分的字,用O标注不为实体的字和不为实体的组成部分的字,待识别文本为“周杰伦的出生地为台湾”,则每个字对应的实体标注结果为:B、I、I、O、O、O、O、O、B、I,根据每个字的实体标注结果,确定待识别文本中的实体为“周杰伦(BII)”和“台湾(BI)”,实体“周杰伦”对应的目标字为:周、杰、伦,实体“台湾”对应的目标字为:台、湾。
进一步的,对字进行更加精细的标注,从而在对各个参数(权重、权重矩阵等)进行调整后,得到更加准确的字的标注结果和实体之间的关系分类结果。
例如,用B_per和I_per标注人物实体,用B_loc和I_loc标注地点实体,待识别文本为“周杰伦的出生地为台湾”,则每个字对应的实体标注结果为:B_per、I_per、I_per、O、O、O、O、O、B_loc、I_loc。
步骤108B,根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量。
其中,实体对应的特征向量,为反映实体特征的向量。
在确定了实体对应的目标字和字对应的目标字向量之后,将实体中各个目标字对应的目标字向量进行组合,从而得到实体对应的特征向量。
在一个实施例中,不同实体对应的特征矩阵可能维度不同,如果不将它们的维度设置为相同,则后续将无法将它们进行组合并进行关系分类的预测,因此,需要对各个实体对应的特征矩阵进行维度处理,将它们的维度进行统一。如图6所示,步骤108B所述根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量,包括:
步骤108B1,根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征矩阵。
例如,实体“台湾”,“台”字对应的目标字向量为[0.1,0.2,0.7],“湾”字对应的目标字向量为[0.2,0.3,0.5],则实体“台湾”对应的特征矩阵为:
Figure BDA0002473295930000131
再如,实体“周杰伦”,“周”字对应的目标字向量为[0.2,0.2,0.6],“杰”字对应的目标字向量为[0.1,0.3,0.6],“伦”字对应的目标字向量为[0.3,0.2,0.5],则实体“周杰伦”对应的特征矩阵为:
Figure BDA0002473295930000132
可以看出,实体“台湾”对应的特征矩阵和实体“周杰伦”对应的特征矩阵的维度不同,实体“台湾”对应的特征矩阵的维度为2×3,实体“周杰伦”对应的特征矩阵的维度为3×3,无法实现组合,因此,需要对它们的维度进行统一。
其中,实体对应的特征矩阵,为反映实体特征的矩阵。
步骤108B2,对所述待识别文本中每个实体对应的特征矩阵进行维度处理,得到所述待识别文本中每个实体对应的特征向量,所述待识别文本中每个实体对应的特征向量的维度相同。
实体对应的特征矩阵进行降维处理,以实现对各个实体的维度的统一,包括:对实体对应的特征矩阵中的每一列,计算该列的平均值;将每列对应的平均值进行组合,得到实体对应的特征向量。
例如,实体“台湾”对应的特征矩阵的每一列的平均值分别为:0.15、0.25、0.6,则实体“台湾”对应的特征向量为[0.15,0.25,0.6];再如,实体“周杰伦”对应的特征矩阵的每一列的平均值分别为:0.2、0.23、0.57,则实体“周杰伦”对应的特征向量为[0.2,0.23,0.57]。可以看出,通过对维度进行处理,每个实体对应的特征向量的维度均相同了。
在一个实施例中,提供了一种对字和邻接字之间的权重、第一权重矩阵和第二权重矩阵进行训练的方法,该方法求得第一损失和第二损失之和,然后根据第一损失和第二损失之和,对字和邻接字之间的权重、第一权重矩阵和第二权重矩阵进行调整,由于将字对应的实体标注与实体之间的关系分类进行了联合训练,因此,加强了字的标注过程与实体关系分类过程之间的相互感知能力,提高了字的标注过程与实体关系分类过程的准确率,并且由于是字的标注过程与实体关系分类过程同时训练,相较于单独训练的方式,这样的方式也能提高训练效率。具体的,在一个实施例中,在步骤102所述获取待识别文本中每个字对应的初步字向量之前,还包括:
步骤112,获取训练文本中每个字对应的初步字向量,所述训练文本中每个字对应的目标实体标注结果和所述训练文本中至少两个实体的目标关系分类结果。
其中,训练文本,为在调整字和邻接字之间的权重、第一权重矩阵和第二权重矩阵的过程中用到的文本。
其中,目标实体标注结果,为字的人工标注结果。
其中,目标关系分类结果,为人工确定的关系分类的结果。
步骤114,对所述训练文本中的每个字,根据所述第一权重矩阵、所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述训练文本中每个字对应的初步实体标注结果。
其中,初步实体标注结果,为根据调整结束前的(非最终的)第一权重矩阵,和,字与邻接字的权重,得到的实体标注结果。
采用和步骤104到步骤106相同的方法可以得到训练文本中每个字对应的初步实体标注结果,在此不再详述。
步骤116,根据所述训练文本中每个字对应的初步实体标注结果和目标实体标注结果,计算第一损失。
其中,第一损失,用于衡量初步实体标注结果和目标实体标注结果之间的差异的大小。
具体的,第一损失可以用交叉熵的形式表示,其中,交叉熵用于度量两个概率分布间的差异,即通过交叉熵可以度量初步实体标注结果和目标实体标注结果之间的概率分布的差异,从而确定初步实体标注结果和目标实体标注结果之间的差异的大小。例如,第一损失用L(y1,y)表示,其中,y1为初步实体标注结果,y为目标实体标注结果,假设初步实体标注结果(概率分布)y1=[y11,y12,…y1n],目标实体标注结果(概率分布)y=[y1,y2,…yn],则第一损失
Figure BDA0002473295930000141
步骤118,根据所述第二权重矩阵、所述训练文本中每个字对应的初步实体标注结果和训练文本中每个字对应的目标字向量,得到所述训练文本中至少两个实体的初步关系分类结果。
其中,初步关系分类结果,为根据调整结束前的(非最终的)第一权重矩阵,字与邻接字的权重,以及,第二权重矩阵,得到的关系分类结果。
采用和步骤104相同的方法,可以得到训练文本中每个字对应的目标字向量;进一步的,采用和步骤108到步骤110相同的方法可以得到训练文本中至少两个实体的初步关系分类结果,在此不再详述。
步骤120,根据所述训练文本中至少两个实体的初步关系分类结果和目标关系分类结果,计算第二损失。
其中,第二损失,用于衡量初步关系分类结果和目标关系分类结果之间的差异的大小。同样,第二损失也可以用交叉熵的形式表示,即通过交叉熵度量初步关系分类结果和目标关系分类结果之间的概率分布的差异,从而确定初步关系分类结果和目标关系分类结果之间的差异的大小。第二损失的计算方法和第一损失的计算方法相同,在此不再详述。
步骤122,根据所述第一损失和所述第二损失之和,对所述字和所述字对应的邻接字之间的权重、所述第一权重矩阵和所述第二权重矩阵进行调整,以使所述训练文本中每个字对应的初步实体标注结果逼近于所述训练文本中每个字对应的目标实体标注结果,同时,所述训练文本中至少两个实体的初步关系分类结果逼近于所述训练文本中至少两个实体的目标关系分类结果。
将第一损失和第二损失求和,得到一个综合的损失,然后根据综合的损失,对字和字对应的权重、第一权重矩阵和第二权重矩阵进行调整,每次调整后,利用调整后的参数得到初步实体标注结果和初步关系分类结果,使得初步实体标注结果不断逼近目标实体标注结果同时初步关系分类结果逼近目标关系分类结果,在初步实体标注结果与目标实体标注结果差异最小且初步关系分类结果与目标关系分类结果差异最小的时候,停止训练,即停止进行参数调整,此时得到的字和字对应的权重、第一权重矩阵和第二权重矩阵即为最终的参数。
在一个实施例中,还可以对字向量模型进行训练,以更新字向量模型,以便使用更新后的字向量模型去确定更多的字的初步字向量,从而使用字向量模型输出的初步字向量去更新预设的字表矩阵中的字向量。具体的,在所述获取待识别文本中每个字对应的初步字向量之前,还包括:
获取训练文本中每个字对应的原始字向量、所述训练文本中每个字对应的目标实体标注结果和所述训练文本中至少两个实体的目标关系分类结果;
将所述训练文本中每个字对应的原始字向量输入字向量模型,得到所述字向量模型输出的所述训练文本中每个字对应的初步字向量;
对所述训练文本中的每个字,根据所述第一权重矩阵、所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述训练文本中每个字对应的初步实体标注结果;根据所述训练文本中每个字对应的初步实体标注结果和目标实体标注结果,计算第一损失;根据所述第二权重矩阵、所述训练文本中每个字对应的初步实体标注结果和训练文本中每个字对应的目标字向量,得到所述训练文本中至少两个实体的初步关系分类结果;根据所述训练文本中至少两个实体的初步关系分类结果和目标关系分类结果,计算第二损失;
根据所述第一损失和所述第二损失之和,对所述字向量模型中的参数、所述字和所述字对应的邻接字之间的权重、所述第一权重矩阵和所述第二权重矩阵进行调整,以使所述训练文本中每个字对应的初步实体标注结果逼近于所述训练文本中每个字对应的目标实体标注结果,同时,所述训练文本中至少两个实体的初步关系分类结果逼近于所述训练文本中至少两个实体的目标关系分类结果。
其中,字对应的原始字向量,为使用字向量模型处理之前的字向量,经过字向量模型处理之后,得到初步字向量,具体的,该原始字向量可以是从预设的字表矩阵中获取到的,经过字向量模型对从预设的字表矩阵中获取到的原始字向量进行处理之后,使用字向量模型输出的初步字向量更新预设的字表矩阵。
如图7所示,提供了一种确定实体之间关系类别的装置700,具体包括:
初步获取模块702,用于获取待识别文本中每个字对应的初步字向量,所述待识别文本中包括至少两个实体;
目标获取模块704,用于对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述字对应的邻接字为在所述待识别文本中与所述字相邻的字;
实体标注模块706,用于根据预设的第一权重矩阵,对所述待识别文本中每个字对应的目标字向量进行标注,得到所述待识别文本中每个字对应的实体标注结果,所述实体标注结果为实体结果或非实体结果中的一个;
实体特征模块708,用于根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量;
关系分类模块710,用于根据预设的第二权重矩阵,对所述待识别文本中每个实体对应的特征向量进行关系分类,得到所述待识别文本中的至少两个实体的关系分类结果。
上述确定实体之间关系类别的装置,首先,对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述邻接字为在所述待识别文本中与所述字相邻的字;然后,根据所述待识别文本中每个字对应的目标字向量得到待识别文本中每个字对应的实体标注结果;最后,根据待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,进而根据待识别文本中每个实体对应的特征向量实现对待识别文本中的至少两个实体的关系分类结果的确定。可见,由于字对应的目标字向量是根据该字的初步字向量、字与邻接字之间的权重以及邻接字的初步字向量得到的,也就是说,字对应的目标字向量是充分挖掘了该字上下文的信息,使得最终得到的目标字向量对该字的表达更加的准确,由于通过目标字向量能够对字进行更加准确的表达,因此,基于目标字向量得到的该字的实体标注结果也将更准确,即对实体的预测将更加的准确,确定的实体的特征向量也将更加的准确,基于实体的特征向量进行关系分类得到的关系分类结果也将更加的准确。
在一个实施例中,所述目标获取模块704,具体用于:将所述字和所述字对应的邻接字之间的权重与所述字对应的邻接字的初步字向量相乘,得到所述字对应的邻接字的更新字向量;根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量。
在一个实施例中,所述目标获取模块704,具体用于:获取预设的权重系数;将所述权重系数与所述字对应的初步字向量相乘,得到第一字向量;根据所述权重系数和所述字对应的邻接字的更新字向量,得到第二字向量;将所述第一字向量和所述第二字向量求和,得到所述字对应的目标字向量。
在一个实施例中,所述实体特征模块708,具体用于:根据所述待识别文本中每个字对应的实体标注结果,得到所述待识别文本中每个实体对应的目标字;根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量。
在一个实施例中,所述实体特征模块708,具体用于:根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征矩阵;对所述待识别文本中每个实体对应的特征矩阵进行维度处理,得到所述待识别文本中每个实体对应的特征向量,所述待识别文本中每个实体对应的特征向量的维度相同。
在一个实施例中,所述装置700,还包括:训练模块,用于获取训练文本中每个字对应的初步字向量,所述训练文本中每个字对应的目标实体标注结果和所述训练文本中至少两个实体的目标关系分类结果;对所述训练文本中的每个字,根据所述第一权重矩阵、所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述训练文本中每个字对应的初步实体标注结果;根据所述训练文本中每个字对应的初步实体标注结果和目标实体标注结果,计算第一损失;根据所述第二权重矩阵、所述训练文本中每个字对应的初步实体标注结果和训练文本中每个字对应的目标字向量,得到所述训练文本中至少两个实体的初步关系分类结果;根据所述训练文本中至少两个实体的初步关系分类结果和目标关系分类结果,计算第二损失;根据所述第一损失和所述第二损失之和,对所述字和所述字对应的邻接字之间的权重、所述第一权重矩阵和所述第二权重矩阵进行调整,以使所述训练文本中每个字对应的初步实体标注结果逼近于所述训练文本中每个字对应的目标实体标注结果,同时,所述训练文本中至少两个实体的初步关系分类结果逼近于所述训练文本中至少两个实体的目标关系分类结果。
在一个实施例中,所述初步获取模块702,具体用于:获取待识别文本;对所述待识别文本进行字分割,得到所述待识别文本中的每个字;根据所述待识别文本中每个字对应的字标识,从预设的字表矩阵中获取到所述待识别文本中每个字对应的初步字向量。
图8示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端或服务器。如图8所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现确定实体之间关系类别的方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行确定实体之间关系类别的方法。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的确定实体之间关系类别的方法可以实现为一种计算机程序的形式,计算机程序可在如图8所示的计算机设备上运行。计算机设备的存储器中可存储组成确定实体之间关系类别的装置的各个程序模板。比如,初步获取模块702、目标获取模块704和实体标注模块706。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取待识别文本中每个字对应的初步字向量,所述待识别文本中包括至少两个实体;
对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述字对应的邻接字为在所述待识别文本中与所述字相邻的字;
根据预设的第一权重矩阵,对所述待识别文本中每个字对应的目标字向量进行标注,得到所述待识别文本中每个字对应的实体标注结果,所述实体标注结果为实体结果或非实体结果中的一个;
根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量;
根据预设的第二权重矩阵,对所述待识别文本中每个实体对应的特征向量进行关系分类,得到所述待识别文本中的至少两个实体的关系分类结果。
上述计算机设备,首先,对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述邻接字为在所述待识别文本中与所述字相邻的字;然后,根据所述待识别文本中每个字对应的目标字向量得到待识别文本中每个字对应的实体标注结果;最后,根据待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,进而根据待识别文本中每个实体对应的特征向量实现对待识别文本中的至少两个实体的关系分类结果的确定。可见,由于字对应的目标字向量是根据该字的初步字向量、字与邻接字之间的权重以及邻接字的初步字向量得到的,也就是说,字对应的目标字向量是充分挖掘了该字上下文的信息,使得最终得到的目标字向量对该字的表达更加的准确,由于通过目标字向量能够对字进行更加准确的表达,因此,基于目标字向量得到的该字的实体标注结果也将更准确,即对实体的预测将更加的准确,确定的实体的特征向量也将更加的准确,基于实体的特征向量进行关系分类得到的关系分类结果也将更加的准确。
在一个实施例中,所述根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,包括:将所述字和所述字对应的邻接字之间的权重与所述字对应的邻接字的初步字向量相乘,得到所述字对应的邻接字的更新字向量;根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量。
在一个实施例中,所述根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量,包括:获取预设的权重系数;将所述权重系数与所述字对应的初步字向量相乘,得到第一字向量;根据所述权重系数和所述字对应的邻接字的更新字向量,得到第二字向量;将所述第一字向量和所述第二字向量求和,得到所述字对应的目标字向量。
在一个实施例中,所述根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,包括:根据所述待识别文本中每个字对应的实体标注结果,得到所述待识别文本中每个实体对应的目标字;根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量。
在一个实施例中,所述根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量,包括:根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征矩阵;对所述待识别文本中每个实体对应的特征矩阵进行维度处理,得到所述待识别文本中每个实体对应的特征向量,所述待识别文本中每个实体对应的特征向量的维度相同。
在一个实施例中,所述计算机程序被处理器执行时,还用于:在所述获取待识别文本中每个字对应的初步字向量之前,获取训练文本中每个字对应的初步字向量,所述训练文本中每个字对应的目标实体标注结果和所述训练文本中至少两个实体的目标关系分类结果;对所述训练文本中的每个字,根据所述第一权重矩阵、所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述训练文本中每个字对应的初步实体标注结果;根据所述训练文本中每个字对应的初步实体标注结果和目标实体标注结果,计算第一损失;根据所述第二权重矩阵、所述训练文本中每个字对应的初步实体标注结果和训练文本中每个字对应的目标字向量,得到所述训练文本中至少两个实体的初步关系分类结果;根据所述训练文本中至少两个实体的初步关系分类结果和目标关系分类结果,计算第二损失;根据所述第一损失和所述第二损失之和,对所述字和所述字对应的邻接字之间的权重、所述第一权重矩阵和所述第二权重矩阵进行调整,以使所述训练文本中每个字对应的初步实体标注结果逼近于所述训练文本中每个字对应的目标实体标注结果,同时,所述训练文本中至少两个实体的初步关系分类结果逼近于所述训练文本中至少两个实体的目标关系分类结果。
在一个实施例中,所述获取待识别文本中每个字对应的初步字向量,包括:获取待识别文本;对所述待识别文本进行字分割,得到所述待识别文本中的每个字;根据所述待识别文本中每个字对应的字标识,从预设的字表矩阵中获取到所述待识别文本中每个字对应的初步字向量。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取待识别文本中每个字对应的初步字向量,所述待识别文本中包括至少两个实体;
对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述字对应的邻接字为在所述待识别文本中与所述字相邻的字;
根据预设的第一权重矩阵,对所述待识别文本中每个字对应的目标字向量进行标注,得到所述待识别文本中每个字对应的实体标注结果,所述实体标注结果为实体结果或非实体结果中的一个;
根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量;
根据预设的第二权重矩阵,对所述待识别文本中每个实体对应的特征向量进行关系分类,得到所述待识别文本中的至少两个实体的关系分类结果。
上述计算机可读存储介质,首先,对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述邻接字为在所述待识别文本中与所述字相邻的字;然后,根据所述待识别文本中每个字对应的目标字向量得到待识别文本中每个字对应的实体标注结果;最后,根据待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,进而根据待识别文本中每个实体对应的特征向量实现对待识别文本中的至少两个实体的关系分类结果的确定。可见,由于字对应的目标字向量是根据该字的初步字向量、字与邻接字之间的权重以及邻接字的初步字向量得到的,也就是说,字对应的目标字向量是充分挖掘了该字上下文的信息,使得最终得到的目标字向量对该字的表达更加的准确,由于通过目标字向量能够对字进行更加准确的表达,因此,基于目标字向量得到的该字的实体标注结果也将更准确,即对实体的预测将更加的准确,确定的实体的特征向量也将更加的准确,基于实体的特征向量进行关系分类得到的关系分类结果也将更加的准确。
在一个实施例中,所述根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,包括:将所述字和所述字对应的邻接字之间的权重与所述字对应的邻接字的初步字向量相乘,得到所述字对应的邻接字的更新字向量;根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量。
在一个实施例中,所述根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量,包括:获取预设的权重系数;将所述权重系数与所述字对应的初步字向量相乘,得到第一字向量;根据所述权重系数和所述字对应的邻接字的更新字向量,得到第二字向量;将所述第一字向量和所述第二字向量求和,得到所述字对应的目标字向量。
在一个实施例中,所述根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,包括:根据所述待识别文本中每个字对应的实体标注结果,得到所述待识别文本中每个实体对应的目标字;根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量。
在一个实施例中,所述根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量,包括:根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征矩阵;对所述待识别文本中每个实体对应的特征矩阵进行维度处理,得到所述待识别文本中每个实体对应的特征向量,所述待识别文本中每个实体对应的特征向量的维度相同。
在一个实施例中,所述计算机程序被处理器执行时,还用于:在所述获取待识别文本中每个字对应的初步字向量之前,获取训练文本中每个字对应的初步字向量,所述训练文本中每个字对应的目标实体标注结果和所述训练文本中至少两个实体的目标关系分类结果;对所述训练文本中的每个字,根据所述第一权重矩阵、所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述训练文本中每个字对应的初步实体标注结果;根据所述训练文本中每个字对应的初步实体标注结果和目标实体标注结果,计算第一损失;根据所述第二权重矩阵、所述训练文本中每个字对应的初步实体标注结果和训练文本中每个字对应的目标字向量,得到所述训练文本中至少两个实体的初步关系分类结果;根据所述训练文本中至少两个实体的初步关系分类结果和目标关系分类结果,计算第二损失;根据所述第一损失和所述第二损失之和,对所述字和所述字对应的邻接字之间的权重、所述第一权重矩阵和所述第二权重矩阵进行调整,以使所述训练文本中每个字对应的初步实体标注结果逼近于所述训练文本中每个字对应的目标实体标注结果,同时,所述训练文本中至少两个实体的初步关系分类结果逼近于所述训练文本中至少两个实体的目标关系分类结果。
在一个实施例中,所述获取待识别文本中每个字对应的初步字向量,包括:获取待识别文本;对所述待识别文本进行字分割,得到所述待识别文本中的每个字;根据所述待识别文本中每个字对应的字标识,从预设的字表矩阵中获取到所述待识别文本中每个字对应的初步字向量。
需要说明的是,上述确定实体之间关系类别的方法、确定实体之间关系类别的装置、计算机设备及计算机可读存储介质属于一个总的发明构思,确定实体之间关系类别的方法、确定实体之间关系类别的装置、计算机设备及计算机可读存储介质实施例中的内容可相互适用。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种确定实体之间关系类别的方法,其特征在于,包括:
获取待识别文本中每个字对应的初步字向量,所述待识别文本中包括至少两个实体;
对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述字对应的邻接字为在所述待识别文本中与所述字相邻的字;
根据预设的第一权重矩阵,对所述待识别文本中每个字对应的目标字向量进行标注,得到所述待识别文本中每个字对应的实体标注结果,所述实体标注结果为实体结果或非实体结果中的一个;
根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量;
根据预设的第二权重矩阵,对所述待识别文本中每个实体对应的特征向量进行关系分类,得到所述待识别文本中的至少两个实体的关系分类结果;
其中,所述根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,包括:
将所述字和所述字对应的邻接字之间的权重与所述字对应的邻接字的初步字向量相乘,得到所述字对应的邻接字的更新字向量;
根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量。
2.如权利要求1所述的方法,其特征在于,所述根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量,包括:
获取预设的权重系数;
将所述权重系数与所述字对应的初步字向量相乘,得到第一字向量;
根据所述权重系数和所述字对应的邻接字的更新字向量,得到第二字向量;
将所述第一字向量和所述第二字向量求和,得到所述字对应的目标字向量。
3.如权利要求1所述的方法,其特征在于,所述根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量,包括:
根据所述待识别文本中每个字对应的实体标注结果,得到所述待识别文本中每个实体对应的目标字;
根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量。
4.如权利要求3所述的方法,其特征在于,所述根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征向量,包括:
根据所述待识别文本中每个实体对应的目标字和所述待识别文本中每个字对应的目标字向量,得到所述待识别文本中每个实体对应的特征矩阵;
对所述待识别文本中每个实体对应的特征矩阵进行维度处理,得到所述待识别文本中每个实体对应的特征向量,所述待识别文本中每个实体对应的特征向量的维度相同。
5.如权利要求1所述的方法,其特征在于,在所述获取待识别文本中每个字对应的初步字向量之前,还包括:
获取训练文本中每个字对应的初步字向量,所述训练文本中每个字对应的目标实体标注结果和所述训练文本中至少两个实体的目标关系分类结果;
对所述训练文本中的每个字,根据所述第一权重矩阵、所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述训练文本中每个字对应的初步实体标注结果;
根据所述训练文本中每个字对应的初步实体标注结果和目标实体标注结果,计算第一损失;
根据所述第二权重矩阵、所述训练文本中每个字对应的初步实体标注结果和训练文本中每个字对应的目标字向量,得到所述训练文本中至少两个实体的初步关系分类结果;
根据所述训练文本中至少两个实体的初步关系分类结果和目标关系分类结果,计算第二损失;
根据所述第一损失和所述第二损失之和,对所述字和所述字对应的邻接字之间的权重、所述第一权重矩阵和所述第二权重矩阵进行调整,以使所述训练文本中每个字对应的初步实体标注结果逼近于所述训练文本中每个字对应的目标实体标注结果,同时,所述训练文本中至少两个实体的初步关系分类结果逼近于所述训练文本中至少两个实体的目标关系分类结果。
6.如权利要求1所述的方法,其特征在于,所述获取待识别文本中每个字对应的初步字向量,包括:
获取待识别文本;
对所述待识别文本进行字分割,得到所述待识别文本中的每个字;
根据所述待识别文本中每个字对应的字标识,从预设的字表矩阵中获取到所述待识别文本中每个字对应的初步字向量。
7.一种确定实体之间关系类别的装置,其特征在于,包括:
初步获取模块,用于获取待识别文本中每个字对应的初步字向量,所述待识别文本中包括至少两个实体;
目标获取模块,用于对所述待识别文本中的每个字,根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,所述字对应的邻接字为在所述待识别文本中与所述字相邻的字,其中,所述根据所述字对应的初步字向量、所述字和所述字对应的邻接字之间的权重以及所述字对应的邻接字的初步字向量,得到所述字对应的目标字向量,包括:将所述字和所述字对应的邻接字之间的权重与所述字对应的邻接字的初步字向量相乘,得到所述字对应的邻接字的更新字向量;根据所述字对应的邻接字的更新字向量和所述字对应的初步字向量,得到所述字对应的目标字向量;
实体标注模块,用于根据预设的第一权重矩阵,对所述待识别文本中每个字对应的目标字向量进行标注,得到所述待识别文本中每个字对应的实体标注结果,所述实体标注结果为实体结果或非实体结果中的一个;
实体特征模块,用于根据所述待识别文本中每个字对应的实体标注结果和目标字向量,得到所述待识别文本中每个实体对应的特征向量;
关系分类模块,用于根据预设的第二权重矩阵,对所述待识别文本中每个实体对应的特征向量进行关系分类,得到所述待识别文本中的至少两个实体的关系分类结果。
8.一种计算机设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述确定实体之间关系类别的方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述确定实体之间关系类别的方法的步骤。
CN202010355497.4A 2020-04-29 2020-04-29 确定实体之间关系类别的方法、装置和计算机设备 Active CN111552812B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010355497.4A CN111552812B (zh) 2020-04-29 2020-04-29 确定实体之间关系类别的方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010355497.4A CN111552812B (zh) 2020-04-29 2020-04-29 确定实体之间关系类别的方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN111552812A CN111552812A (zh) 2020-08-18
CN111552812B true CN111552812B (zh) 2023-05-12

Family

ID=72005990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010355497.4A Active CN111552812B (zh) 2020-04-29 2020-04-29 确定实体之间关系类别的方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN111552812B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792539B (zh) * 2021-09-15 2024-02-20 平安科技(深圳)有限公司 基于人工智能的实体关系分类方法、装置、电子设备及介质
CN115358239B (zh) * 2022-08-17 2023-08-22 北京中科智加科技有限公司 一种命名实体和关系识别方法及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522557A (zh) * 2018-11-16 2019-03-26 中山大学 文本关系抽取模型的训练方法、装置及可读存储介质
CN110457677A (zh) * 2019-06-26 2019-11-15 平安科技(深圳)有限公司 实体关系识别方法及装置、存储介质、计算机设备
CN110569500A (zh) * 2019-07-23 2019-12-13 平安国际智慧城市科技股份有限公司 文本语义识别方法、装置、计算机设备和存储介质
CN110765779A (zh) * 2019-11-07 2020-02-07 苏州跃盟信息科技有限公司 字矩阵的训练方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522557A (zh) * 2018-11-16 2019-03-26 中山大学 文本关系抽取模型的训练方法、装置及可读存储介质
CN110457677A (zh) * 2019-06-26 2019-11-15 平安科技(深圳)有限公司 实体关系识别方法及装置、存储介质、计算机设备
CN110569500A (zh) * 2019-07-23 2019-12-13 平安国际智慧城市科技股份有限公司 文本语义识别方法、装置、计算机设备和存储介质
CN110765779A (zh) * 2019-11-07 2020-02-07 苏州跃盟信息科技有限公司 字矩阵的训练方法及装置

Also Published As

Publication number Publication date
CN111552812A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
US11232141B2 (en) Method and device for processing an electronic document
CN109740620B (zh) 人群画像分类模型的建立方法、装置、设备和存储介质
CN109783604B (zh) 基于少量样本的信息提取方法、装置和计算机设备
JP7266674B2 (ja) 画像分類モデルの訓練方法、画像処理方法及び装置
WO2021043076A1 (zh) 网络发布数据处理方法、装置、计算机设备和存储介质
CN111552812B (zh) 确定实体之间关系类别的方法、装置和计算机设备
WO2019075967A1 (zh) 企业名称识别方法、电子设备及计算机可读存储介质
CN111860669B (zh) Ocr识别模型的训练方法、装置和计算机设备
CN110362798B (zh) 裁决信息检索分析方法、装置、计算机设备和存储介质
CN113837151B (zh) 表格图像处理方法、装置、计算机设备及可读存储介质
CN112395412B (zh) 文本分类的方法、装置以及计算机可读介质
CN111552811B (zh) 知识图谱中信息补全的方法、装置、计算机设备和存储介质
CN112686046A (zh) 模型训练方法、装置、设备及计算机可读介质
CN112699923A (zh) 文档分类预测方法、装置、计算机设备及存储介质
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN111552810B (zh) 实体抽取与分类方法、装置、计算机设备和存储介质
WO2020179378A1 (ja) 情報処理システム、情報処理方法および記録媒体
CN115994232A (zh) 在线多版本文献同一性鉴别方法、系统及计算机设备
US20230177251A1 (en) Method, device, and system for analyzing unstructured document
CN115018608A (zh) 风险预测方法、装置、计算机设备
CN114373088A (zh) 一种图像检测模型的训练方法和相关产品
CN112307170A (zh) 关系抽取模型的训练方法、关系抽取方法、设备及介质
CN113515920B (zh) 从表格中提取公式的方法、电子设备和计算机可读介质
CN117612181A (zh) 图像识别方法、装置、计算机设备和存储介质
EP4007173A1 (en) Data storage method, and data acquisition method and apparatus therefor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant