CN111444715B

CN111444715B - 实体关系识别方法、装置、计算机设备和存储介质

Info

Publication number: CN111444715B
Application number: CN202010212393.8A
Authority: CN
Inventors: 杨培
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-03-24
Filing date: 2020-03-24
Publication date: 2022-12-02
Anticipated expiration: 2040-03-24
Also published as: CN111444715A

Abstract

本申请涉及一种实体关系识别方法、装置、计算机设备和存储介质。所述方法涉及人工智能技术，包括：获取语句，对语句进行分词处理获得语句元素，并从语句元素中确定语句中的头实体；基于头实体对各语句元素进行编码，根据获得的语句元素对应的语句元素特征得到语句对应的编码特征；根据编码特征进行迭代解码以进行实体识别，获得指向尾实体的概率分布；每次迭代解码时根据编码特征和当前解码状态进行解码，且当前解码状态采用前一次迭代解码获得的概率分布；在满足迭代解码停止条件后，基于历次迭代解码获得的概率分布所指向的尾实体，确定语句中与头实体具有实体对应关系的尾实体。采用本方法能够提高实体关系识别的处理效率。

Description

实体关系识别方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种实体关系识别方法、装置、计算机设备和存储介质，以及一种实体关系识别模型训练方法、装置、计算机设备和存储介质。

背景技术

实体关系识别，即实体关系抽取，旨在从大规模非结构或半结构的自然语言语句中抽取结构化信息，以确定自然语言语句中的各实体之间的语义关系，可以解决自然语言语句中实体之间分类的问题，也是构建复杂知识库系统的重要基础，如文本摘要、自动问答、机器翻译、搜索引擎、知识图谱等。对于实体间存在一对多的实体关系进行识别时，如医疗实体中部位实体与症状实体间的一对多实体关系，例如部位实体为皮肤，症状实体为瘙痒、疼痛等，传统方法多是建立二分类任务，分别确定两两实体间的实体关系，再根据各两两识别关系识别的结果确定实体间一对多的实体关系。

然而，重复将自然语言语句中的实体两两进行实体关系识别处理，过程繁琐，且工作量大，导致实体关系识别的处理效率较低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高识别处理效率的实体关系识别方法、装置、计算机设备和存储介质，以及一种实体关系识别模型训练方法、装置、计算机设备和存储介质。

一种实体关系识别方法，所述方法包括：

获取语句，对语句进行分词处理获得语句元素，并从语句元素中确定语句中的头实体；

基于头实体对各语句元素进行编码，根据获得的语句元素对应的语句元素特征得到语句对应的编码特征；

根据编码特征进行迭代解码以进行实体识别，获得指向尾实体的概率分布；每次迭代解码时根据编码特征和当前解码状态进行解码，且当前解码状态采用前一次迭代解码获得的概率分布；

在满足迭代解码停止条件后，基于历次迭代解码获得的概率分布所指向的尾实体，确定语句中与头实体具有实体对应关系的尾实体。

一种实体关系识别装置，所述装置包括：

语句获取模块，用于获取语句，对语句进行分词处理获得语句元素，并从语句元素中确定语句中的头实体；

语句编码模块，用于基于头实体对各语句元素进行编码，根据获得的语句元素对应的语句元素特征得到语句对应的编码特征；

迭代解码模块，用于根据编码特征进行迭代解码以进行实体识别，获得指向尾实体的概率分布；每次迭代解码时根据编码特征和当前解码状态进行解码，且当前解码状态采用前一次迭代解码获得的概率分布；

识别结果获取模块，用于在满足迭代解码停止条件后，基于历次迭代解码获得的概率分布所指向的尾实体，确定语句中与头实体具有实体对应关系的尾实体。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

上述实体关系识别方法、装置、计算机设备和存储介质，对语句进行分词处理获得语句元素，并从语句元素中确定语句中的头实体，并基于头实体对各语句元素进行编码，根据获得的语句元素对应的语句元素特征得到语句对应的编码特征，根据得到的编码特征进行迭代解码以进行实体识别，得到指向尾实体的概率分布，每次迭代解码时根据编码特征和前一次迭代解码获得的概率分布确定的当前解码状态进行解码，满足迭代解码停止条件后，根据历次迭代解码获得的概率分布所指向的尾实体，从语句中确定与头实体具有实体对应关系的尾实体。在实体关系识别过程中，直接根据语句对应的编码特征和前一次迭代解码获得的概率分布确定的当前解码状态进行迭代解码，实现实体识别，并根据历次迭代解码获得的概率分布确定与头实体具有实体对应关系的尾实体，简化了实体关系识别的处理过程，不需要将实体两两进行实体关系识别，可以快速从语句中识别实体间一对多的实体关系，提高了实体关系识别的处理效率。

一种实体关系识别模型训练方法，包括：

获取训练语句，对训练语句进行分词处理获得训练语句元素，并从训练语句元素中确定训练语句中携带尾实体标签的训练头实体；

通过待训练的模型基于训练头实体对各训练语句元素进行编码，根据获得的训练语句元素对应的训练语句元素特征得到训练语句对应的训练编码特征；

通过模型根据训练编码特征进行迭代解码以进行实体识别，获得指向尾实体的训练概率分布；每次迭代解码时根据训练编码特征和当前训练解码状态进行解码，且当前训练解码状态采用前一次迭代解码获得的训练概率分布；

在满足迭代解码停止条件后，基于历次迭代解码获得的训练概率分布所指向的尾实体，确定训练语句中与训练头实体具有实体对应关系的尾实体；

根据尾实体和尾实体标签调整模型的参数后继续进行训练，直至满足训练结束条件时结束训练，得到训练完成的实体关系识别模型。

一种实体关系识别模型训练装置，所述装置包括：

训练语句获取模块，用于获取训练语句，对训练语句进行分词处理获得训练语句元素，并从训练语句元素中确定训练语句中携带尾实体标签的训练头实体；

训练语句编码模块，用于通过待训练的模型基于训练头实体对各训练语句元素进行编码，根据获得的训练语句元素对应的训练语句元素特征得到训练语句对应的训练编码特征；

迭代解码训练模块，用于通过模型根据训练编码特征进行迭代解码以进行实体识别，获得指向尾实体的训练概率分布；每次迭代解码时根据训练编码特征和当前训练解码状态进行解码，且当前训练解码状态采用前一次迭代解码获得的训练概率分布；

训练识别结果模块，用于在满足迭代解码停止条件后，基于历次迭代解码获得的训练概率分布所指向的尾实体，确定训练语句中与训练头实体具有实体对应关系的尾实体；

模型调整模块，用于根据尾实体和尾实体标签调整模型的参数后继续进行训练，直至满足训练结束条件时结束训练，得到训练完成的实体关系识别模型。

上述实体关系识别模型训练方法、装置、计算机设备和存储介质，对训练语句进行分词处理获得训练语句元素，并从训练语句元素中确定训练语句中的携带尾实体标签的训练头实体，并通过待训练的模型基于训练头实体对各训练语句元素进行编码，根据获得的训练语句元素对应的训练语句元素特征得到训练语句对应的训练编码特征，根据得到的训练编码特征进行迭代解码以进行实体识别，得到指向尾实体的训练概率分布，每次迭代解码时根据训练编码特征和前一次迭代解码获得的训练概率分布确定的当前训练解码状态进行解码，满足迭代解码停止条件后，根据历次迭代解码获得的训练概率分布所指向的尾实体，从训练语句中确定与训练头实体具有实体对应关系的尾实体，并根据尾实体和尾实体标签调整模型的参数后继续进行训练，直至满足训练结束条件时结束训练，得到训练完成的实体关系识别模型。训练得到的实体关系识别模型可以对输入的语句进行实体关系识别，以直接根据语句对应的编码特征和前一次迭代解码获得的概率分布确定的当前解码状态进行迭代解码，实现实体识别，并根据历次迭代解码获得的概率分布确定与头实体具有实体对应关系的尾实体，简化了实体关系识别的处理过程，不需要将实体两两进行实体关系识别，可以快速从语句中识别实体间一对多的实体关系，提高了实体关系识别的处理效率。

附图说明

图1为一个实施例中实体关系识别方法的应用环境图；

图2为一个实施例中实体关系识别方法的流程示意图；

图3为一个实施例中迭代解码处理的流程示意图；

图4为一个实施例中seq2seq模型的处理流程示意图；

图5为另一个实施例中实体关系识别方法的流程示意图；

图6为一个实施例中实体关系识别方法通过模型实现的示意图；

图7为一个实施例中实体关系识别模型训练方法的流程示意图；

图8为一个实施例中实体关系识别装置的结构框图；

图9为一个实施例中实体关系识别模型训练装置的结构框图；

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

本申请实施例提供的方案涉及人工智能的自然语言处理、机器学习等技术，具体通过如下实施例进行说明。

实体关系识别，即实体关系抽取可以解决原始文本中目标实体之间的关系分类问题，它也被广泛应用于文本摘要、自动问答系统、知识图谱、搜索引擎和机器翻译中。中文实体关系抽取由于中文句式和语法结构复杂，汉语有更多歧义，会影响关系分类的效果。其中，实体是指具有可描述意义，或具有特定含义的词汇或短语，通常可以是人名、地名、组织机构名、产品名称，或者在某个领域内具有一定含义的内容，比如医学领域内疾病、药物、生物体名称，或者法律学涉及到的专有词汇等。例如，医疗领域中部位“面部”、“腿部”，症状“咳嗽”、“发热”均可以认为是实体。

实体关系是指不同实体之间的相互的联系，实体与实体之间并不是相互独立的，往往存在一定的关联。例如，医疗实体中，这种实体关系可以为复杂的关系，例如抑制、促进关系，或者是简单的是否具有关系。在医疗实体关系识别中，即需要从在给定句子中实体的位置以及实体的上下文，然后判断目标实体之间是否具有某种关系。例如，给定医疗语句“接触农药后面部皮肤和眼睛疼痛、瘙痒1天”和部位实体“面部皮肤”“眼睛”、症状实体“瘙痒”和症状实体“疼痛”，以及这些实体在句中的位置信息(5,9)、(10,12)、(12,14)、(15,17)，需要判定这些症状实体与哪些部位实体具有的修饰关系。

通常，对于医疗实体关系识别，业界会将医疗实体关系识别抽象为一个分类问题，即在给定句子和相关实体信息的输入下，采用不同的编码手段，对输入信息进行抽取、融合和理解，最终输出这个句子的类别(具有关系和不具有关系)。目前的现有方案，按其采用的核心算法，可以分为机器学习方法和深度学习方法，机器学习方法主要是基于SVM(SupportVector Machines，支持向量机)的方法，SVM是机器学习的常用算法，因算法的核心是切分超平面，而超平面是由支持向量决定的，因此而得名，具体通过各种核方法(线性核、树核、图核)等方法对输入的信息编码，然后输出不同的分值，从而判定实体间是否具有关系；而深度学习方法主要是基于深度学习的方法，通过深度网络，例如CNN(ConvolutionalNeural Networks，卷积神经网络)、LSTM(Long Short-Term Memory，长短期记忆网络)对输入信息(词向量、位置向量)进行编码，然后输出对应不同类别的概率。其中，LSTM为一种深度学习网络，能够处理序列数据，针对不同输入序列中不同时刻的输入分别输出向量表达，因其能够编码离当前时刻较远的信息，因而备受关注。

而在医疗实体关系识别这一任务中，按照实体之间存在关系的数目，可以分为一个实体只与另一个实体有关系(1vs1)、一个实体与多个实体有关系(1vsN)，以及多个实体与多个实体存在关系(NvsN)。NvsN的关系可以转化为N个1vsN的关系进行处理，同样1vsN的关系可以转化为N个1vs1的关系进行处理。业界普遍将医疗实体关系识别任务建模为一个1vs1的二分类任务，即将句子中的实体进行两两配对，然后对这些配对的实体对预测关系。例如，“接触农药后面部皮肤和眼睛疼痛、瘙痒1天”可以产生<面部皮肤，疼痛>、<面部皮肤，瘙痒>、<眼睛，疼痛>、<眼睛，瘙痒>四个实体对，模型需要对这些实体对分别计算属于有关系和无关系的概率，即需要重复将两两实体构建的实体对分别进行实体关系识别，过程繁琐，且工作量大，导致实体关系识别的处理效率较低。同时，无论是机器学习方法还是深度学习方法，都是监督学习方法、即需要人工标注语料来进行训练和学习。在构造语料时，不仅需要构造正例，即找出有关系的实体对，还需要构造负例，即找出没有关系的实体对。如果句子中的实体数目非常多，同时1vsN或NvsN关系的占比较大时，这种1vs1的两两配对的方式将会造成大量的负例实体对，这将对人工标注语料产生较大的负担，同时也将会引入正负例不均衡的问题。此外，受人力和物力的限制，人工标注的语料不会非常大，当同一句中出现多个实体时，这种两两配对的方式会造成这一个句子在训练集中出现多次，而对于表达能力较强的深度模型来说，模型可能会直接学习到这个句子、而没有学习到需要学习的规律，从而造成泛化性能的降低。

本申请正是针对目前实体关系识别中存在的实体关系识别的处理效率较低问题，提出了一种可以提高处理效率的实体关系识别方法、装置、计算机设备和存储介质，以及一种实体关系识别模型训练方法、装置、计算机设备和存储介质。

本申请提供的实体关系识别方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。终端102将语句发送至服务器104，服务器104对接收到的语句进行分词处理获得语句元素，并从语句元素中确定语句中的头实体，并基于头实体对各语句元素进行编码，根据获得的语句元素对应的语句元素特征得到编码特征，根据得到的编码特征进行迭代解码以进行实体识别，得到指向尾实体的概率分布，每次迭代解码时根据编码特征和前一次迭代解码获得的概率分布确定的当前解码状态进行解码，满足迭代解码停止条件后，根据历次迭代解码获得的概率分布所指向的尾实体，从语句中确定与头实体具有实体对应关系的尾实体。此外，在其他应用环境中，也可以单独由终端102或单独由服务器104对语句进行实体关系处理。

本申请提供的实体关系识别模型训练方法，也可以应用于如图1所示的应用环境中。终端102将训练语句发送至服务器104，服务器104对训练语句进行分词处理获得训练语句元素，并从训练语句元素中确定训练语句中的携带尾实体标签的训练头实体，并通过待训练的模型基于训练头实体对各训练语句元素进行编码，根据获得的训练语句元素对应的训练语句元素特征得到训练语句对应的训练编码特征，根据得到的训练编码特征进行迭代解码以进行实体识别，得到指向尾实体的训练概率分布，每次迭代解码时根据训练编码特征和前一次迭代解码获得的训练概率分布确定的当前训练解码状态进行解码，满足迭代解码停止条件后，根据历次迭代解码获得的训练概率分布所指向的尾实体，从训练语句中确定与训练头实体具有实体对应关系的尾实体，并根据尾实体和尾实体标签调整模型的参数后继续进行训练，直至满足训练结束条件时结束训练，得到训练完成的实体关系识别模型。

其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种实体关系识别方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

S202，获取语句，对语句进行分词处理获得语句元素，并从语句元素中确定语句中的头实体。

其中，语句可以为需要进行实体关系识别的自然语言文本，例如可以为新闻语句文本，语句一般由词汇、短语和标点符号等语句元素组成，语句的最大长度可以根据实体关系识别对所识别语句的长度要求确定。实体为语句元素中具有特征含义的语句元素，通常为词汇或短语。例如，对于医疗领域的语句“患者于50余年前出疹后出现阵发性咳嗽、咳痰，不剧，痰色白粘稠，易咳出，量少，有活动后胸闷气促”，其中，“阵发性”“咳嗽”“咳痰”“不剧”“痰色白”“粘稠”“易咳出”“量少”“胸闷”“气促”等均为实体。

其中，分词处理可以通过正向最大匹配法、反向最大匹配法、最短路径分词法、双向最大匹配法、词义分词法或统计分词法等算法实现，以将语句拆分成各语句元素，语句元素为语句的组成单位，具体形式如词汇、短语和标点符号等，语句元素特征反映了对应的语句元素的独特性，可以用于区别各语句元素以进行实体关系识别。在具体实现时，可以直接获取确定头实体时将语句进行分词处理得到各语句元素。例如，对于语句“接触农药后面部皮肤和眼睛疼痛、瘙痒1天”，对语句进行分词处理后，可以得到“接触|农药|后|面部|皮肤|和|眼睛|疼痛|、|瘙痒|1天|”(“|”表示各语句元素间的分词边界)，从而得到组成语句的各语句元素。

头实体为需要识别在语句中与其存在实体关系的实体，根据识别的不同的实体关系，与头实体存在实体关系的数量会不同，可能存在一个或者多个或者不存在。如上例医疗领域的语句中，“咳嗽”作为头实体，识别在该与语句中存在与“咳嗽”存在实体关系的实体时，可以得知“阵发性”为“咳嗽”的症状性质，“不剧”为“咳嗽”的症状程度；而“咳痰”作为头实体，识别在该与语句中存在与“咳痰”存在实体关系的实体时，可以得知“阵发性”“易咳出”为“咳痰”的症状性质，“不剧”“量少”为“咳痰”的症状程度。即对于不同的头实体，与其存在实体关系的实体数量不一。一般在医疗领域的语句中，描述疾病的部位类型实体往往会对应于多个症状类型实体，部位类型实体与症状类型实体之间存在一对多的实体关系，即多个症状类型实体均用于描述同一部位类型实体，在确定部位类型实体的实体关系时，有必要快速准确识别出该一对多的实体关系。

在具体实现时，可以将获得的语句进行分词处理，如可以通过正向最大匹配法、反向最大匹配法、最短路径分词法、双向最大匹配法、词义分词法或统计分词法等对语句进行分词处理，将语句分词成各语句元素，并从语句元素中确定需要进行实体关系识别的头实体，如识别医疗领域的语句中与部位类型实体具有实体对应关系的症状类型实体。

S204，基于头实体对各语句元素进行编码，根据获得的语句元素对应的语句元素特征得到语句对应的编码特征。

确定语句中的头实体后，基于该头实体对各语句元素进行编码，例如可以通过编码网络基于头实体对语句元素进行编码，得到语句元素对应的语句元素特征，并根据各语句元素对应的语句元素特征得到语句对应的编码特征，编码特征表征了语句的实体关系特征，根据编码特征进行解码可以实现对语句的实体关系识别，从而从语句中确定与头实体具有实体对应关系的实体。

在具体实现时，可以基于头实体分别对组成语句的各语句元素分别进行特征映射，如通过embedding算法将各语句元素进行特征映射，得到各语句元素的语句元素特征，并分别对各语句元素的语句元素特征进行编码，如通过BiLSTM(Bi-directional LongShort-Term Memory，双向长短期记忆)算法对各语句元素的语句元素特征分别进行编码，并根据各语句元素的语句元素特征的编码结果得到语句的对应的编码特征。其中，embedding方法的主要目的是对(稀疏)特征进行降维，它降维的方式可以类比为一个全连接层(没有激活函数)，通过embedding层的权重矩阵计算来降低维度，即可以将大型稀疏向量转换为保留语义关系的低维空间，具体可以将语句元素映射至一固定维度的向量特征，实现对语句元素的特征提取。

S206，根据编码特征进行迭代解码以进行实体识别，获得指向尾实体的概率分布；每次迭代解码时根据编码特征和当前解码状态进行解码，且当前解码状态采用前一次迭代解码获得的概率分布。

获得语句对应的编码特征后，基于该编码特征进行迭代解码以进行实体识别，得到指向尾实体的概率分布。其中，尾实体为与语句中与头实体存在实体对应关系的实体，如医疗中病症实体与部位实体往往存在修饰关系。迭代解码为根据编码特征和每次解码的结果迭代进行解码，以实现对语句中各实体进行实体关系识别。具体地，每次迭代解码时根据编码特征和当前解码状态进行解码，而当前解码状态采用前一次迭代解码获得的概率分布。其中，概率分布为解码预测的输出取值为语句中各语句元素的概率，具体可以将概率分布中概率最大对应的语句元素或实体确定为与头实体具有实体对应关系的尾实体。由于迭代解码的解码结果为概率分布，且根据概率分布可以确定其指向的尾实体，故迭代解码获得的概率分布可以作为指向尾实体的指针，并从语句中确定与头实体具有实体对应关系的尾实体。

在具体实现时，可以采用指针网络(pointer-network)实现对语句的编码及解码处理。指针网络每次的输出为指向输入的指针，即指针网络解码的输出直接从输入确定。通过指针网络的Encoder基于头实体对语句进行编码，得到语句对应的编码特征，并通过指针网络的Decoder根据编码特征解码，从语句的各语句元素中确定指向尾实体的概率分布，从而实现对语句中与头实体具有实体对应关系的实体的识别。

S208，在满足迭代解码停止条件后，基于历次迭代解码获得的概率分布所指向的尾实体，确定语句中与头实体具有实体对应关系的尾实体。

在根据编码特征进行迭代解码以进行实体识别过程中，检测是否满足迭代解码停止条件，如迭代次数达到次数阈值、语句中各语句元素均识别完成时，若满足与头实体具有实体对应关系的尾实体，则获取历次迭代解码获得的概率分布，该概率分布所指向的尾实体，确定语句中与头实体具有实体对应关系的尾实体。在具体实现时，可以在语句的尾部加入伪输入，当迭代解码获得的概率分布为解码结束类型分布，即获得的概率分布指向该伪输入时，认为满足迭代解码停止条件，根据历次迭代解码获得的概率分布从语句中确定与头实体具有实体对应关系的尾实体。

在一具体应用中，对于医疗语句的实体关系识别，可以对医疗语句中实体的关系进行判断，为医生或者患者提供更加丰富的信息。例如“患者于50余年前出疹后出现阵发性咳嗽、咳痰，不剧，痰色白粘稠，易咳出，量少，有活动后胸闷气促”，经过实体识别后，可以得到症状“咳嗽”、“咳痰”、“胸闷”和“气促”，以及症状的性质“阵发性”和“易咳出”、症状的程度“不剧”和“量少”、以及症状的诱因“活动”。经过医疗实体关系识别后，可以得到“咳嗽”的性质是“阵发性”并且程度是“不剧”，“咳痰”的性质是“易咳出”和“不剧”，“胸闷气促”的诱因是“活动”，从而便于对病症进行管控，为医疗服务提供支持。

上述实体关系识别方法中，对语句进行分词处理获得语句元素，并从语句元素中确定语句中的头实体，并基于头实体对各语句元素进行编码，根据获得的语句元素对应的语句元素特征得到语句对应的编码特征，根据得到的编码特征进行迭代解码以进行实体识别，得到指向尾实体的概率分布，每次迭代解码时根据编码特征和前一次迭代解码获得的概率分布确定的当前解码状态进行解码，满足迭代解码停止条件后，根据历次迭代解码获得的概率分布所指向的尾实体，从语句中确定与头实体具有实体对应关系的尾实体。在实体关系识别过程中，直接根据语句对应的编码特征和前一次迭代解码获得的概率分布确定的当前解码状态进行迭代解码，实现实体识别，并根据历次迭代解码获得的概率分布确定与头实体具有实体对应关系的尾实体，简化了实体关系识别的处理过程，不需要将实体两两进行实体关系识别，可以快速从语句中识别实体间一对多的实体关系，提高了实体关系识别的处理效率。

在一个实施例中，基于头实体对各语句元素进行编码，根据获得的语句元素对应的语句元素特征得到语句对应的编码特征包括：对语句元素进行属性特征映射，得到语句元素的元素属性特征；根据语句元素的元素类型进行类型特征映射，得到语句元素的元素类型特征；根据头实体在语句中的头实体位置对语句元素进行位置特征映射，得到语句元素的元素位置特征；语句元素对应的语句元素特征包括元素属性特征、元素类型特征和元素位置特征；对各语句元素对应的语句元素特征进行编码，得到语句对应的编码特征。

本实施例中，根据各语句元素本身的属性、所属的元素类型及相对头实体的位置分别进行特征映射，并综合特征映射结果得到语句元素对应的语句元素特征，并对各语句元素对应的语句元素特征进行编码，得到语句对应的编码特征。具体地，基于头实体对各语句元素进行特征映射时，对语句元素进行属性特征映射，得到语句元素的元素属性特征，元素属性特征可以反映语句元素本身的属性，如语句元素对应的名称。根据语句元素的元素类型进行类型特征映射，得到语句元素的元素类型特征，元素类型特征反映了语句元素所属的元素类型，元素类型可以根据实体关系的场景进行设置，如医疗领域中，元素类型可以包括非实体类型、部位实体类型和症状实体类型，从而可以对语句进行实体关系识别，以识别出部位实体与症状实体之间的实体关系。根据头实体在语句中的头实体位置对语句元素进行位置特征映射，得到语句元素的元素位置特征，头实体位置可以为头实体在语句中所处的位置，对语句元素进行位置特征映射，可以根据各语句元素相对于头实体位置的相对位置进行特征映射，得到语句元素的元素位置特征，元素位置特征反映了在语句中各语句元素与头实体的相对距离。根据获得的元素属性特征、元素类型特征和元素位置特征得到语句元素对应的语句元素特征，如语句元素特征可以包括元素属性特征、元素类型特征和元素位置特征，语句元素特征反映了语句元素进行实体关系识别时的独特性，根据语句元素特征可以准确确定语句元素与头实体之间的实体关系。

在具体实现时，属性特征映射、类型特征映射和位置特征映射均可以通过embedding方法实现。例如，对于属性特征映射处理，可以预先通过embedding方法为各语句元素训练对应的向量特征，通过查询语句元素的对应embedding可以获得各语句元素的元素属性特征；对于类型特征映射，可以确定语句元素的类型，并查询该类型对应的embedding得到语句元素的元素类型特征，如具体可以为固定维度的向量特征，语句元素的类型对应的embedding可以预先进行训练得到；同样的，对于位置特征映射，可以确定语句元素相对于头实体的相对位置，并查询该相对位置的embedding得到语句元素的元素位置特征，如具体可以为固定维度的向量特征，语句元素相对于头实体的相对位置的embedding可以预先进行训练得到。

得到各语句元素对应的语句元素特征后，对各语句元素的语句元素特征分别进行编码，具体可以通过编码网络，如通过Encoder编码网络对各语句元素特征进行编码，得到语句对应的编码特征，具体可以根据各语句元素对应的语句元素特征进行编码得到结果组合得到语句对应的编码特征，该编码特征反映了语句整体的特性，基于该编码特征对语句中头实体的实体关系进行识别，以确定语句中与头实体具备实体对应关系的实体。在具体实现时，Encoder编码网络具体形式可以为LSTM网络模型、BiLSTM网络模型等。

在一具体应用中，元素属性特征为词向量特征，由语句经过分词后查找每个词对应的embedding后得到的向量特征确定；元素类型特征为类型向量，用于指示当前词的类型的特征，根据当前语句元素的类型查找对应的embedding得到固定维度的向量；元素位置特征为位置向量，用于指示当前语句元素与头实体的位置关系的特征，根据不同的位置值查找对应的embedding得到固定维度的向量。其中，词向量的embedding利用word2vec得到的词向量进行初始化，类型向量和位置向量的embedding采用随机初始化，词向量、类型向量和位置向量均随着模型一起训练并调整，以得到最终满足需求的embedding。

例如，“接触农药后面部皮肤和眼睛疼痛、瘙痒1天”经过分词后可以得到“接触|农药|后|面部|皮肤|和|眼睛|疼痛|、|瘙痒|1天|”，其中“面部”、“皮肤”、“眼睛”属于部位实体，“疼痛”和“瘙痒”属于症状实体，则元素类型特征为“1|1|1|2|2|1|2|3|1|3|1|”(使用1表示非实体类型，2表示部位实体类型，3表示症状实体类型)，当“瘙痒”为头实体，所有部位实体的为尾实体，即与头实体“瘙痒”具有实体对应关系的实体时，位置特征可以为“max_len-9|max_len-8|max_len-7|max_len-6|max_len-5|max_len-4|max_len-3|max_len-2|max_len-1|max_len+0|max_len+1|”(max_len为模型能够处理的语句的最大长度，根据组成语句的语句元素数目确定)。

在一个实施例中，元素类型包括部位实体、症状实体类型、症状性质实体、症状程度实体、症状诱因实体和非实体元素中的至少一种。

本实施例中，实体关系识别方法应用于医疗领域，即对医疗语句进行实体关系识别时，组成语句的语句元素的元素类型包括部位实体、症状实体类型、症状性质实体、症状程度实体、症状诱因实体和非实体元素中的至少一种。其中，部位实体为描述疾病部位的实体，例如头、面部、背部、脚等；症状实体类型为描述疾病症状的实体，如咳嗽、头晕、目眩等；症状性质实体为描述疾病症状性质的实体，如阵发性、易咳的、经常性等；症状程度实体为描述疾病症状的程度的实体，如不剧、剧烈、量少、大量等；症状诱因实体为描述疾病诱发症状的实体，如活动、进食、运动等；非实体元素为不属于实体关系识别的实体，例如标点符号，与实体关系识别场景中无关的实体等。

在一个实施例中，根据头实体在语句中的头实体位置对语句元素进行位置特征映射，得到语句元素的元素位置特征包括：确定头实体在语句中的头实体位置；确定在语句中各语句元素分别与头实体位置相对的元素相对位置；根据语句元素的元素相对位置进行位置特征映射，得到语句元素的元素位置特征。

本实施例中，根据在语句中，各语句元素与头实体的相对位置进行位置特征映射，得到语句元素的元素位置特征。具体地，对语句元素进行位置特征映射时，确定头实体在语句中的头实体位置，具体可以根据头实体对应的语句元素在各语句元素中的位置序号，确定头实体在语句中的头实体位置。得到头实体位置后，确定在语句中各语句元素分别与头实体位置相对的元素相对位置，具体可以根据各语句元素的位置序号与头实体位置进行比较，确定各语句元素与头实体位置相对的元素相对位置。根据语句元素的元素相对位置进行位置特征映射，如通过embedding方法进行位置特征映射，得到语句元素的元素位置特征，元素位置特征反映了在语句中各语句元素与头实体的相对距离，参考该相对距离可以进一步提升实体关系识别的准确度。

例如，对于语句接触农药后面部皮肤和眼睛疼痛、瘙痒1天”，分词后得到“接触|农药|后|面部|皮肤|和|眼睛|疼痛|、|瘙痒|1天|”包括11个语句元素，位置序号从0-10，若“瘙痒”为头实体，则以“瘙痒”的位置作为各语句元素的基准位置，可以得到各语句元素的位置特征为“max_len-9|max_len-8|max_len-7|max_len-6|max_len-5|max_len-4|max_len-3|max_len-2|max_len-1|max_len+0|max_len+1|”(max_len为模型能够处理的语句的最大长度，根据组成语句的语句元素数目确定)。

在一个实施例中，对各语句元素对应的语句元素特征进行编码，得到语句对应的编码特征包括：根据各语句元素对应的语句元素特征在语句中的先后顺序，分别按照前向方向和后向方向进行按序编码，得到各语句元素对应的前向编码特征和后向编码特征；将前向编码特征和后向编码特征进行拼接，得到语句元素对应的元素编码特征；根据各语句元素对应的元素编码特征得到语句对应的编码特征。

本实施例中，按照语句中各语句元素的前向方向和后向方向进行按序编码，并根据得到的前向编码特征和后向编码特征得到语句对应的编码特征。具体地，对得到的各语句元素对应的语句元素特征进行编码时，根据各语句元素对应的语句元素特征在语句中的先后顺序，即按照语句中各语句元素的先后顺序，分别按照前向方向和后向方向进行按序编码，即将语句中各语句元素按照正序和倒序的方式按序依次进行编码，具体可以通过LSTM网络模型对各语句元素进行编码，得到各语句元素对应的前向编码特征和后向编码特征。其中，前向编码特征可以为按照语句正序编码得到的特征，其可以包括各语句元素的前向信息；而后向编码特征可以为按照语句倒序编码得到的特征，其可以包括各语句元素的后向信息。将前向编码特征和后向编码特征进行拼接，从而将各语句元素的前向信息和后向信息进行融合，得到同时包括前向信息和后向信息的前向信息和后向信息。根据各语句元素对应的元素编码特征得到语句对应的编码特征，具体可以将各语句元素对应的元素编码特征进行组合，如按照语句中各语句元素的顺序将相应的元素编码特征组合，得到语句对应的编码特征。

在一个具体应用中，对各语句元素对应的语句元素特征进行编码，得到语句对应的编码特征通过Encoder编码网络实现，Encoder编码网络具体采用BiLSTM，而BiLSTM是根据前向LSTM和后向LSTM得到的。对于LSTM，其具体实现如下式(1)-(4)，

f_t＝σ(W_fx_t+U_fh_t-1+b_f) (1)

i_t＝σ(W_ix_t+U_ih_t-1+b_i) (2)

o_t＝σ(W_ox_t+U_oh_t-1+b_o) (3)

c_t＝f_t·c_t-1+i_t·σ(W_cx_t+U_ch_t-1+b_c) (4)

其中，[W_f,U_f,b_f,W_i,U_i,b_i,W_o,U_o,b_o]均为相应的权重，为LSTM的网络模型参数；f_t为LSTM网络中遗忘门t时刻的输出，σ为sigmoid函数，x_t为当前时刻输入，h_t-1为t-1时刻LSTM网络的输出；i_t为LSTM网络中输入门的输出；o_t为LSTM网络中输出门的输出；c_t为t时刻的细胞记忆，c_t-1为t-1时刻的细胞记忆。BiLSTM为两个不同方向的LSTM的输出拼接而成，即

为前向LSTM的输出，

为后向LSTM的输出。

在一个实施例中，如图3所示，迭代解码的处理，即根据编码特征进行迭代解码以进行实体识别，获得指向尾实体的概率分布包括：

S302，将前一次迭代解码获得的概率分布确定为当前解码状态。

本实施例中，根据每次迭代解码获得的解码结果，即概率分布更新当前解码状态，通过当前解码状态和编码特征进行解码，得到每次迭代解码的指向尾实体的概率分布。具体地，在根据编码特征进行迭代解码时，确定前一次迭代解码获得的概率分布，将该前一次迭代解码获得的概率分布确定为当前解码状态。特别地，在第一次进行解码时，可以通过初始化当前解码状态进行解码处理，例如可以将当前解码状态初始化为均匀概率([1/n,1/n,...,1/n])，其中n为语句长度，即语句中语句元素的数目。

S304，根据当前解码状态和编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布。

确定当前解码状态后，根据当前解码状态和编码特征进行解码，得到本次迭代解码的解码结果，即指向尾实体的概率分布。在具体实现时，根据当前解码状态和编码特征进行解码可以通过解码网络进行实现，如Decoder解码网络进行解码处理，Decoder解码网络的具体网络模型可以采用BiLSTM，而当前解码状态和编码特征均作为Decoder解码网络的输入，得到迭代解码的指向尾实体的概率分布。

S306，将本次迭代解码的指向尾实体的概率分布作为当前解码状态，并返回根据当前解码状态和编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布的步骤。

得到本次迭代解码的指向尾实体的概率分布后，将其作为当前解码状态，并返回根据当前解码状态和编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布的步骤，即根据本次迭代解码的解码结果更新当前解码状态进行下一次迭代解码处理。通过网络对语句的编码特征进行迭代解码，可以直接根据编码特征识别出实体关系，而不需要构建两两实体对进行实体关系识别，简化了实体关系识别的处理过程，不需要将实体两两进行实体关系识别，可以快速从语句中识别实体间一对多的实体关系，提高了实体关系识别的处理效率。

在一个实施例中，根据当前解码状态和编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布包括：根据当前解码状态和编码特征进行特征融合，得到解码融合特征；对解码融合特征进行特征映射，得到本次迭代解码的指向尾实体的概率分布。

本实施例中，通过指针网络对编码特征进行解码，得到指向尾实体的概率分布。具体地，对编码特征进行解码时，根据当前解码状态和编码特征进行特征融合，得到解码融合特征，特征融合的权重可以根据指针网络训练确定。具体实现时，可以根据编码特征中各语句元素对应的元素编码特征分别与当前解码状态进行特征融合，并进行加权融合，得到解码融合特征。对得到的解码融合特征进行特征映射，得到本次迭代解码的指向尾实体的概率分布，具体可以通过激活函数实现特征映射，如通过softmax激活函数进行特征映射，得到本次迭代解码的指向尾实体的概率分布，该概率分布反映了将语句中各语句元素作为解码输出的概率，概率最大对应的语句元素可以作为与头实体具有实体对应关系的尾实体。通过融合特征进行解码，获得指向尾实体的概率分布，从而可以在语句的各语句元素中迭代识别出与头实体具有实体对应关系的尾实体，实现了一次性判断与头实体的各种实体对应的尾实体，不需要进行两两匹配。而且不需如两两匹配处理般构造特殊的负例关系，只需要进行正负样本标注，而只需要得到正例的关系，可以降低标注成本；同时，不进行两两实体匹配，可以避免一个句子在训练集中出现多次，降低了重复句子的比例，从而提高了模型的泛化能力，提高了实体关系识别效果。

其中，指针网络是seq2seq模型的一种变型。seq2seq模型是一种编码-解码(Encoder-Decoder)框架的端到端生成模型，已经在机器翻译、对话生成、语法改错等领域有了成功的进展。seq2seq最早出现与机器翻译中，它的输入是一个序列，输出也是一个序列。Encoder将变长的输入信息编码为一个固定长度的向量表示，通常称为contentvector，随后，decoder将content vector作为初始的状态，对不同的输入信息输出不同的信号。如图4所示，一个具体应用中，a、b和c为encoder的输入，decoder在content vector和起始标签<GO>的输入下得到A，然后反复如此，得到B、C以及结束标签<EOS>。

传统的seq2seq模型的输出为输出词表中的内容，即输出的内容是固定的，并不能随着输入序列的改变而随意改变。因此，传统的seq2seq并不能解决输出会跟随输入变化的情况。为此，Vinyals提出了指针网络用于此类问题。简单而言，指针网络每次的输出为指向输入的指针。指针网络同样采用Encoder-Decoder的结果，只不过在解码时加入了如下式(5)、(6)的处理，

u_i,j＝v^Ttanh(W₁e_j+W₂d_i) (5)

p_i＝softmax(u_i) (6)

其中，[v,W₁,W₂]为模型可训练的参数；e_j为编码时刻j时encoder的输出，即各时刻的编码特征，j取值为0-n，n为语句长度；d_i为解码时刻i的输出，即各时刻得到的指向尾实体的概率分布；u_i，j为各语句元素对应的元素融合特征；u_i为根据各语句元素对应的元素融合特征得到的解码融合特征；p_i即为指针网络的输出，是一个对输入序列位置的概率分布，即对语句中各语句元素位置的概率分布，基于该概率分布可以确定语句中与头实体具有实体对应关系的尾实体。

可以理解，本实施例通过指针网络对语句进行实体关系识别，不仅可以一次性判断一个实体与其他多个实体的关系(1vsN的实体关系)，无需两两匹配，而且无需如两两匹配处理般构造特殊的负例关系，只需要进行正负样本标注，而只需要得到正例的关系，可以降低标注成本；同时，不进行两两实体匹配，可以避免一个句子在训练集中出现多次，降低了重复句子的比例，从而提高了模型的泛化能力，提高了实体关系识别效果。

在一个实施例中，根据当前解码状态和编码特征进行特征融合，得到解码融合特征包括：从编码特征中确定各语句元素对应的元素编码特征；将当前解码状态分别与各语句元素对应的元素编码特征进行特征融合，得到各语句元素对应的元素融合特征；根据各语句元素对应的元素融合特征得到解码融合特征。

本实施例中，根据编码特征中各语句元素对应的元素编码特征分别与当前解码状态进行特征融合，并进行加权融合，得到解码融合特征。具体地，在根据当前解码状态和编码特征进行特征融合时，从编码特征中确定各语句元素对应的元素编码特征，其中，元素编码特征可以根据相应的语句元素经过前向编码特征和后向编码特征后得到的前向编码特征和后向编码特征进行拼接得到，元素编码特征反映了对应语句元素的前向信息和后向信息。将当前解码状态分别与各语句元素对应的元素编码特征进行特征融合，具体可以通过设置权重进行加权融合的方式将各元素编码特征分别与当前解码状态融合，得到各语句元素对应的元素融合特征，具体可以如式(5)所示，u_i，j为各语句元素对应的元素融合特征。根据各语句元素对应的元素融合特征得到解码融合特征，具体可以将各语句元素对应的元素融合特征组合得到语句的解码融合特征。

本实施例中，通过将各语句元素对应的元素编码特征分别与当前解码状态进行特征融合，以得到语句的解码融合特征，可以一次性将语句中的所有语句元素进行迭代解码以进行实体识别，避免进行两两实体配对，简化了实体关系识别的处理过程，可以快速从语句中识别实体间一对多的实体关系，提高了实体关系识别的处理效率。

在一个实施例中，在满足迭代解码停止条件后，基于历次迭代解码获得的概率分布所指向的尾实体，确定语句中与头实体具有实体对应关系的尾实体包括：当迭代解码获得的概率分布为解码结束类型分布时，确定历次迭代解码获得的概率分布所指向的尾实体对应的尾实体位置；从语句中确定尾实体位置对应的目标语句元素；根据目标语句元素得到语句中与头实体具有实体对应关系的尾实体。

本实施例中，在满足迭代解码停止条件时，根据历次迭代解码获得的概率分布所指向的尾实体的尾实体位置从语句中确定与头实体具有实体对应关系的尾实体。具体地，在根据编码特征进行迭代解码以进行实体识别过程中，确定迭代解码获得的概率分布的类型，具体可以根据概率分布所指向的内容进行确定，如概率分布指向非语句中的实体或语句元素，或概率分布指向语句中新增的伪输入时，则可以确定迭代解码获得的概率分布为解码结束类型分布，认为满足迭代解码停止条件，确定历次迭代解码获得的概率分布所指向的尾实体对应的尾实体位置。其中，尾实体位置可以为概率分布所指向的尾实体在语句的各语句元素中的位置序号。根据尾实体位置从语句中确定对应的目标语句元素，目标语句元素即为在语句中概率分布指向的尾实体的尾实体位置上对应的语句元素，根据该目标语句元素得到语句中与头实体具有实体对应关系的尾实体。具体地，可以直接将在语句中概率分布指向的尾实体的尾实体位置上对应的目标语句元素确定为与与头实体具有实体对应关系的尾实体。而在迭代解码过程中，会遍历语句中的各语句元素，历次迭代解码获得的概率分布会指出语句中所有与头实体具有实体对应关系的尾实体，从而可以快速、准确地从语句中确定与头实体存在实体对应关系的尾实体，实现一对多实体关系的快速识别，提高了实体关系识别的处理效率。

在一个实施例中，如图5所示，提供了一种实体关系识别方法，包括：

S502，获取语句，对语句进行分词处理获得语句元素，并从语句元素中确定语句中的头实体。

本实施例中，应用于医疗领域中一对多实体关系识别的场景中时，语句可以为医疗语句，如记载患者疾病状况的语句，头实体为语句中需要识别“一对多”实体关系中的“一”，如部位实体对应于多个症状实体时，头实体可以为部位实体。

S504，对语句元素进行属性特征映射，得到语句元素的元素属性特征；

S506，根据语句元素的元素类型进行类型特征映射，得到语句元素的元素类型特征，并根据头实体在语句中的头实体位置对语句元素进行位置特征映射，得到语句元素的元素位置特征；

S508，对各语句元素对应的语句元素特征进行编码，得到语句对应的编码特征；

S510，将前一次迭代解码获得的概率分布确定为当前解码状态；

S512，从编码特征中确定各语句元素对应的元素编码特征；

S514，将当前解码状态分别与各语句元素对应的元素编码特征进行特征融合，得到各语句元素对应的元素融合特征；

S516，根据各语句元素对应的元素融合特征得到解码融合特征；

S518，对解码融合特征进行特征映射，得到本次迭代解码的指向尾实体的概率分布；

S520，将本次迭代解码的指向尾实体的概率分布作为当前解码状态，并返回根据当前解码状态和编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布的步骤；

S522，在满足迭代解码停止条件后，基于历次迭代解码获得的概率分布所指向的尾实体，确定语句中与头实体具有实体对应关系的尾实体。

本实施例中，将组成语句的各语句元素进行编码，得到语句的编码特征，并根据编码特征进行迭代解码以进行实体识别，获得指向尾实体的概率分布。其中，每次迭代解码时根据编码特征和当前解码状态进行解码，且当前解码状态采用前一次迭代解码获得的概率分布。具体地，将前一次迭代解码获得的概率分布确定为当前解码状态；根据当前解码状态和编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布；将本次迭代解码的指向尾实体的概率分布作为当前解码状态，并返回根据当前解码状态和编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布的步骤。在迭代解码过程中，会遍历语句中的各语句元素，历次迭代解码获得的概率分布会指出语句中所有与头实体具有实体对应关系的尾实体，从而可以快速、准确地从语句中确定与头实体存在实体对应关系的尾实体，实现一对多实体关系的快速识别，提高了实体关系识别的处理效率。

本申请还提供一种应用场景，该应用场景应用上述的实体关系识别方法。具体地，该实体关系识别方法在该应用场景的应用如下：

通过预先训练的指针网络对医疗语句进行实体关系识别，指针网络为seq2seq模型的变型，采用Encoder-Decoder的网络架构，其中，编码网络Encoder和解码网络Encoder均采用BiLSTM网络模型。

对于医疗语句的特征表示，通过元素属性特征、元素类型特征和元素位置特征表征语句中各语句元素的特征。其中，元素属性特征为词向量特征，由语句经过分词后查找每个词对应的embedding后得到的向量特征确定；元素类型特征为类型向量，用于指示当前词的类型的特征，根据当前语句元素的类型查找对应的embedding得到固定维度的向量；元素位置特征为位置向量，用于指示当前语句元素与头实体的位置关系的特征，根据不同的位置值查找对应的embedding得到固定维度的向量。其中，词向量的embedding利用word2vec得到的词向量进行初始化，类型向量和位置向量的embedding采用随机初始化，词向量、类型向量和位置向量均随着模型一起训练并调整，以得到最终满足需求的embedding。

例如，对于医疗语句“接触农药后面部皮肤和眼睛疼痛、瘙痒1天”，经过分词后可以得到“接触|农药|后|面部|皮肤|和|眼睛|疼痛|、|瘙痒|1天|”(“|”表示分词边界)，其中“面部”、“皮肤”、“眼睛”属于部位实体，“疼痛”和“瘙痒”属于症状实体，则类型特征为“1|1|1|2|2|1|2|3|1|3|1|”(使用1表示非实体，2表示部位实体，3表示症状实体)，当“瘙痒”为头实体，所有部位实体的为尾实体时，位置特征可以为“max_len-9|max_len-8|max_len-7|max_len-6|max_len-5|max_len-4|max_len-3|max_len-2|max_len-1|max_len+0|max_len+1|”(max_len为模型能够处理的句子的最大长度)。

如图6所示，得到医疗语句的特征表示，即得到各语句元素对应的语句元素特征后，通过指针网络中的编码网络Encoder对各语句元素对应的语句元素特征进行编码，得到语句对应的编码特征，将编码特征输入指针网络中的解码网络Encoder进行迭代解码。对于指针网络的解码网络Encoder，其输出的为输入序列位置的概率分布，即输出为指向输入的指针。Decoder解码需要有起始标签<GO>和<EOS>，如图6所示，均匀概率([1/n,1/n,...,1/n])作为起始标签，其中n为语句长度。同时，在输入序列的尾部加入一个伪输入，如果解码的指针指向此伪输入，则认为到达EOS，不再继续进行解码。

图6展示了以“疼痛”作为头实体进行实体关系识别的识别处理过程，输入“接触|农药|后|面部|皮肤|和|眼睛|疼痛|、|瘙痒|1天|”后，在解码阶段首先输入<GO>标签后，得到指向输入序列3的指针(指向“面部”)，随后将指针3继续输入Decoder后，得到指向输入序列4的指针(指向“皮肤”)，如此反复，直到出现EOS标签。最终可以得到<疼痛，面部，皮肤，眼睛>具有修饰关系，即得到了头实体“疼痛”具有实体对应关系的多个尾实体。

该实体关系识别方法，可以解决目前由于实体关系识别需要两两配对所带来的产生大量的实体对的问题，能够一次性同时预测一个实体与其他多个实体的关系，提高了系统的运行效率，同时也无需构造大量的负例，降低了构造人工标注语料的难度，也降低了重复句子在语料集中出现的频率，提高了模型的泛化能力。

在一个实施例中，如图7所示，提供了一种实体关系识别模型训练方法，通过该实体关系识别模型训练方法训练得到的实体关系识别模型可以对输入的语句进行实体关系识别，确定语句中的实体关系。该方法包括：

S702，获取训练语句，对训练语句进行分词处理获得训练语句元素，并从训练语句元素中确定训练语句中携带尾实体标签的训练头实体。

训练语句可以为历史已经确定、标注实体关系的自然语言文本，训练头实体为训练语句中待训练实体关系识别的实体，训练头实体携带尾实体标签，即训练语句中训练头实体的实体关系已确定，基于该训练语句和训练头实体进行训练。

S704，通过待训练的模型基于训练头实体对各训练语句元素进行编码，根据获得的训练语句元素对应的训练语句元素特征得到训练语句对应的训练编码特征。

本实施例中，通过待训练的模型基于训练头实体对训练语句进行编码，训练编码特征用于表征训练语句的实体关系特征。

S706，通过模型根据训练编码特征进行迭代解码以进行实体识别，获得指向尾实体的训练概率分布；每次迭代解码时根据训练编码特征和当前训练解码状态进行解码，且当前训练解码状态采用前一次迭代解码获得的训练概率分布。

基于训练编码特征进行迭代解码以进行实体识别，得到指向尾实体的训练概率分布，且每次迭代解码时根据训练编码特征和当前训练解码状态进行解码，而当前训练解码状态采用前一次迭代解码获得的训练概率分布。其中，训练概率分布为解码预测的输出取值为训练语句中各训练语句元素的概率，具体可以将训练概率分布中概率最大对应的训练语句元素或训练实体确定为与训练头实体具有实体对应关系的尾实体。

S708，在满足迭代解码停止条件后，基于历次迭代解码获得的训练概率分布所指向的尾实体，确定训练语句中与训练头实体具有实体对应关系的尾实体。

根据训练编码特征进行迭代解码过程中，检测是否满足迭代解码停止条件，若满足，则获取历次迭代解码获得的训练概率分布，并确定各训练概率分布所指向的尾实体，从而确定训练语句中与训练头实体具有实体对应关系的尾实体。

S710，根据尾实体和尾实体标签调整模型的参数后继续进行训练，直至满足训练结束条件时结束训练，得到训练完成的实体关系识别模型。

通过模型对训练语句进行实体关系识别处理得到模型识别的尾实体后，根据尾实体和尾实体标签调整模型的参数后继续进行训练，直至满足训练结束条件时，如训练次数达到次数阈值，或模型泛化能力达到要求时，结束训练，得到训练完成的实体关系识别模型。该实体关系识别模型可以对输入的语句进行实体关系识别，从输入的语句中识别出与头实体具有实体对应关系的各个尾实体。

上述实体关系识别模型训练方法，对训练语句进行分词处理获得训练语句元素，并从训练语句元素中确定训练语句中的携带尾实体标签的训练头实体，并通过待训练的模型基于训练头实体对各训练语句元素进行编码，根据获得的训练语句元素对应的训练语句元素特征得到训练语句对应的训练编码特征，根据得到的训练编码特征进行迭代解码以进行实体识别，得到指向尾实体的训练概率分布，每次迭代解码时根据训练编码特征和前一次迭代解码获得的训练概率分布确定的当前训练解码状态进行解码，满足迭代解码停止条件后，根据历次迭代解码获得的训练概率分布所指向的尾实体，从训练语句中确定与训练头实体具有实体对应关系的尾实体，并根据尾实体和尾实体标签调整模型的参数后继续进行训练，直至满足训练结束条件时结束训练，得到训练完成的实体关系识别模型。训练得到的实体关系识别模型可以对输入的语句进行实体关系识别，以直接根据语句对应的编码特征和前一次迭代解码获得的概率分布确定的当前解码状态进行迭代解码，实现实体识别，并根据历次迭代解码获得的概率分布确定与头实体具有实体对应关系的尾实体，简化了实体关系识别的处理过程，不需要将实体两两进行实体关系识别，可以快速从语句中识别实体间一对多的实体关系，提高了实体关系识别的处理效率。

在一个实施例中，通过待训练的模型基于训练头实体对各训练语句元素进行编码，根据获得的训练语句元素对应的训练语句元素特征得到训练语句对应的训练编码特征包括：对训练语句元素进行属性特征映射，得到训练语句元素的元素属性特征；根据训练语句元素的元素类型进行类型特征映射，得到训练语句元素的元素类型特征；根据训练头实体在训练语句中的训练头实体位置对训练语句元素进行位置特征映射，得到训练语句元素的元素位置特征；训练语句元素对应的训练语句元素特征包括元素属性特征、元素类型特征和元素位置特征；对各训练语句元素对应的训练语句元素特征进行编码，得到训练语句对应的训练编码特征。

在一个实施例中，根据训练头实体在训练语句中的训练头实体位置对训练语句元素进行位置特征映射，得到训练语句元素的元素位置特征包括：确定训练头实体在训练语句中的训练头实体位置；确定在训练语句中各训练语句元素分别与训练头实体位置相对的元素相对位置；根据训练语句元素的元素相对位置进行位置特征映射，得到训练语句元素的元素位置特征。

在一个实施例中，对各训练语句元素对应的训练语句元素特征进行编码，得到训练语句对应的训练编码特征包括：根据各训练语句元素对应的训练语句元素特征在训练语句中的先后顺序，分别按照前向方向和后向方向进行按序编码，得到各训练语句元素对应的前向编码特征和后向编码特征；将前向编码特征和后向编码特征进行拼接，得到训练语句元素对应的元素编码特征；根据各训练语句元素对应的元素编码特征得到训练语句对应的训练编码特征。

在一个实施例中，通过模型根据训练编码特征进行迭代解码以进行实体识别，获得指向尾实体的训练概率分布包括：通过模型将前一次迭代解码获得的训练概率分布确定为当前训练解码状态；根据当前训练解码状态和训练编码特征进行解码，得到本次迭代解码的指向尾实体的训练概率分布；将本次迭代解码的指向尾实体的训练概率分布作为当前训练解码状态，并返回根据当前训练解码状态和训练编码特征进行解码，得到本次迭代解码的指向尾实体的训练概率分布的步骤。

在一个实施例中，根据当前训练解码状态和训练编码特征进行解码，得到本次迭代解码的指向尾实体的训练概率分布包括：根据当前训练解码状态和训练编码特征进行特征融合，得到训练解码融合特征；对训练解码融合特征进行特征映射，得到本次迭代解码的指向尾实体的训练概率分布。

在一个实施例中，根据当前训练解码状态和训练编码特征进行特征融合，得到训练解码融合特征包括：从训练编码特征中确定各训练语句元素对应的元素编码特征；将当前训练解码状态分别与各训练语句元素对应的元素编码特征进行特征融合，得到各训练语句元素对应的元素融合特征；根据各训练语句元素对应的元素融合特征得到训练解码融合特征。

在一个实施例中，在满足迭代解码停止条件后，基于历次迭代解码获得的训练概率分布所指向的尾实体，确定训练语句中与训练头实体具有实体对应关系的尾实体包括：当迭代解码获得的训练概率分布为解码结束类型分布时，确定历次迭代解码获得的训练概率分布所指向的尾实体对应的尾实体位置；从语句中确定尾实体位置对应的目标训练语句元素；根据目标训练语句元素得到训练语句中与训练头实体具有实体对应关系的尾实体。

应该理解的是，虽然图2-3、5和7的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-3、5和7中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图8所示，提供了一种实体关系识别装置800，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：语句获取模块802、语句编码模块804、迭代解码模块806和识别结果获取模块808，其中：

语句获取模块802，用于获取语句，对语句进行分词处理获得语句元素，并从语句元素中确定语句中的头实体；

语句编码模块804，用于基于头实体对各语句元素进行编码，根据获得的语句元素对应的语句元素特征得到语句对应的编码特征；

迭代解码模块806，用于根据编码特征进行迭代解码以进行实体识别，获得指向尾实体的概率分布；每次迭代解码时根据编码特征和当前解码状态进行解码，且当前解码状态采用前一次迭代解码获得的概率分布；

识别结果获取模块808，用于在满足迭代解码停止条件后，基于历次迭代解码获得的概率分布所指向的尾实体，确定语句中与头实体具有实体对应关系的尾实体。

在一个实施例中，语句编码模块804包括属性特征映射模块、类型特征映射模块、位置特征映射模块和特征编码模块；其中：属性特征映射模块，用于对语句元素进行属性特征映射，得到语句元素的元素属性特征；类型特征映射模块，用于根据语句元素的元素类型进行类型特征映射，得到语句元素的元素类型特征；位置特征映射模块，用于根据头实体在语句中的头实体位置对语句元素进行位置特征映射，得到语句元素的元素位置特征；语句元素对应的语句元素特征包括元素属性特征、元素类型特征和元素位置特征；特征编码模块，用于对各语句元素对应的语句元素特征进行编码，得到语句对应的编码特征。

在一个实施例中，位置特征映射模块包括头实体位置模块、相对位置模块和元素位置特征模块；其中：头实体位置模块，用于确定头实体在语句中的头实体位置；相对位置模块，用于确定在语句中各语句元素分别与头实体位置相对的元素相对位置；元素位置特征模块，用于根据语句元素的元素相对位置进行位置特征映射，得到语句元素的元素位置特征。

在一个实施例中，特征编码模块包括双向编码模块、特征拼接模块和特征编码获得模块；其中：双向编码模块，用于根据各语句元素对应的语句元素特征在语句中的先后顺序，分别按照前向方向和后向方向进行按序编码，得到各语句元素对应的前向编码特征和后向编码特征；特征拼接模块，用于将前向编码特征和后向编码特征进行拼接，得到语句元素对应的元素编码特征；特征编码获得模块，用于根据各语句元素对应的元素编码特征得到语句对应的编码特征。

在一个实施例中，迭代解码模块806包括解码状态确定模块、解码处理模块和解码状态更新模块；其中：解码状态确定模块，用于将前一次迭代解码获得的概率分布确定为当前解码状态；解码处理模块，用于根据当前解码状态和编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布；解码状态更新模块，用于将本次迭代解码的指向尾实体的概率分布作为当前解码状态，并返回根据当前解码状态和编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布的步骤。

在一个实施例中，解码处理模块包括特征融合模块和融合特征映射模块；其中：特征融合模块，用于根据当前解码状态和编码特征进行特征融合，得到解码融合特征；融合特征映射模块，用于对解码融合特征进行特征映射，得到本次迭代解码的指向尾实体的概率分布。

在一个实施例中，特征融合模块包括元素编码特征确定模块、元素编码特征融合模块和解码融合特征获得模块；其中：元素编码特征确定模块，用于从编码特征中确定各语句元素对应的元素编码特征；元素编码特征融合模块，用于将当前解码状态分别与各语句元素对应的元素编码特征进行特征融合，得到各语句元素对应的元素融合特征；解码融合特征获得模块，用于根据各语句元素对应的元素融合特征得到解码融合特征。

在一个实施例中，识别结果获取模块808包括尾实体位置模块、目标元素确定模块和尾实体确定模块；其中：尾实体位置模块，用于当迭代解码获得的概率分布为解码结束类型分布时，确定历次迭代解码获得的概率分布所指向的尾实体对应的尾实体位置；目标元素确定模块，用于从语句中确定尾实体位置对应的目标语句元素；尾实体确定模块，用于根据目标语句元素得到语句中与头实体具有实体对应关系的尾实体。

在一个实施例中，如图9所示，提供了一种实体关系识别模型训练装置900，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：训练语句获取模块902、训练语句编码模块904、迭代解码训练模块906、训练识别结果模块908和模型调整模块910，其中：

训练语句获取模块902，用于获取训练语句，对训练语句进行分词处理获得训练语句元素，并从训练语句元素中确定训练语句中携带尾实体标签的训练头实体；

训练语句编码模块904，用于通过待训练的模型基于训练头实体对各训练语句元素进行编码，根据获得的训练语句元素对应的训练语句元素特征得到训练语句对应的训练编码特征；

迭代解码训练模块906，用于通过模型根据训练编码特征进行迭代解码以进行实体识别，获得指向尾实体的训练概率分布；每次迭代解码时根据训练编码特征和当前训练解码状态进行解码，且当前训练解码状态采用前一次迭代解码获得的训练概率分布；

训练识别结果模块908，用于在满足迭代解码停止条件后，基于历次迭代解码获得的训练概率分布所指向的尾实体，确定训练语句中与训练头实体具有实体对应关系的尾实体；

模型调整模块910，用于根据尾实体和尾实体标签调整模型的参数后继续进行训练，直至满足训练结束条件时结束训练，得到训练完成的实体关系识别模型。

在一个实施例中，训练语句元素特征模块包括属性特征映射模块、类型特征映射模块、位置特征映射模块和训练特征编码模块；其中：属性特征映射模块，用于对训练语句元素进行属性特征映射，得到训练语句元素的元素属性特征；类型特征映射模块，用于根据训练语句元素的元素类型进行类型特征映射，得到训练语句元素的元素类型特征；位置特征映射模块，用于根据训练头实体在训练语句中的训练头实体位置对训练语句元素进行位置特征映射，得到训练语句元素的元素位置特征；训练语句元素对应的训练语句元素特征包括元素属性特征、元素类型特征和元素位置特征；训练特征编码模块，用于对各训练语句元素对应的训练语句元素特征进行编码，得到训练语句对应的训练编码特征。

在一个实施例中，位置特征映射模块包括训练头实体位置模块、训练相对位置模块和元素位置特征模块；其中：训练头实体位置模块，用于确定训练头实体在训练语句中的训练头实体位置；训练相对位置模块，用于确定在训练语句中各训练语句元素分别与训练头实体位置相对的元素相对位置；元素位置特征模块，用于根据训练语句元素的元素相对位置进行位置特征映射，得到训练语句元素的元素位置特征。

在一个实施例中，训练特征编码模块包括训练双向编码模块、训练特征拼接模块和训练特征编码获得模块；其中：训练双向编码模块，用于根据各训练语句元素对应的训练语句元素特征在训练语句中的先后顺序，分别按照前向方向和后向方向进行按序编码，得到各训练语句元素对应的前向编码特征和后向编码特征；训练特征拼接模块，用于将前向编码特征和后向编码特征进行拼接，得到训练语句元素对应的元素编码特征；训练特征编码获得模块，用于根据各训练语句元素对应的元素编码特征得到训练语句对应的训练编码特征。

在一个实施例中，迭代解码训练模块906包括训练解码状态确定模块、训练解码处理模块和训练解码状态更新模块；其中：训练解码状态确定模块，用于通过模型将前一次迭代解码获得的训练概率分布确定为当前训练解码状态；训练解码处理模块，用于根据当前训练解码状态和训练编码特征进行解码，得到本次迭代解码的指向尾实体的训练概率分布；训练解码状态更新模块，用于将本次迭代解码的指向尾实体的训练概率分布作为当前训练解码状态，并返回根据当前训练解码状态和训练编码特征进行解码，得到本次迭代解码的指向尾实体的训练概率分布的步骤。

在一个实施例中，训练解码处理模块包括训练特征融合模块和融合特征映射模块；其中：训练特征融合模块，用于根据当前训练解码状态和训练编码特征进行特征融合，得到训练解码融合特征；融合特征映射模块，用于对训练解码融合特征进行特征映射，得到本次迭代解码的指向尾实体的训练概率分布。

在一个实施例中，特征融合模块包括元素编码特征确定模块、元素编码特征融合模块和解码融合特征获得模块；其中：元素编码特征确定模块，用于从训练编码特征中确定各训练语句元素对应的元素编码特征；元素编码特征融合模块，用于将当前训练解码状态分别与各训练语句元素对应的元素编码特征进行特征融合，得到各训练语句元素对应的元素融合特征；解码融合特征获得模块，用于根据各训练语句元素对应的元素融合特征得到训练解码融合特征。

在一个实施例中，训练识别结果模块908包括尾实体位置模块、目标训练元素确定模块和尾实体确定模块；其中：尾实体位置模块，用于当迭代解码获得的训练概率分布为解码结束类型分布时，确定历次迭代解码获得的训练概率分布所指向的尾实体对应的尾实体位置；目标训练元素确定模块，用于从语句中确定尾实体位置对应的目标训练语句元素；尾实体确定模块，用于根据目标训练语句元素得到训练语句中与训练头实体具有实体对应关系的尾实体。

关于实体关系识别装置的具体限定可以参见上文中对于实体关系识别方法的限定，关于实体关系识别模型训练装置的具体限定可以参见上文中对于实体关系识别模型训练方法的限定在此不再赘述。上述实体关系识别装置和实体关系识别模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储模型数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种实体关系识别方法或一种实体关系识别模型训练方法。

本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。计算机可以终端计算机或服务器，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种实体关系识别方法，其特征在于，所述方法包括：

获取语句，对所述语句进行分词处理获得语句元素，并从所述语句元素中确定所述语句中需要识别实体关系的头实体；

基于所述头实体对各所述语句元素进行编码，根据获得的所述语句元素对应的语句元素特征进行编码，根据编码结果组合得到所述语句对应的编码特征；所述语句元素特征包括所述语句元素的元素位置特征，所述元素位置特征用于表征在所述语句中所述语句元素相对于所述头实体的相对位置；

将前一次迭代解码获得的概率分布确定为当前解码状态；

通过解码网络，根据所述当前解码状态和所述编码特征进行解码，得到本次迭代解码的指向所述语句中的尾实体的概率分布；所述概率分布中最大概率所对应的语句元素，为所述本次迭代解码得到与所述头实体具有实体对应关系的尾实体；

将本次迭代解码的指向尾实体的概率分布作为所述当前解码状态，并返回所述通过解码网络，根据所述当前解码状态和所述编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布的步骤；每次迭代解码时根据所述编码特征和当前解码状态进行解码，且所述当前解码状态采用前一次迭代解码获得的概率分布；

在满足迭代解码停止条件后，基于历次迭代解码获得的概率分布所指向的尾实体，确定所述语句中与所述头实体具有实体对应关系的尾实体。

2.根据权利要求1所述的方法，其特征在于，所述基于所述头实体对各所述语句元素进行编码，根据获得的所述语句元素对应的语句元素特征进行编码，根据编码结果组合得到所述语句对应的编码特征包括：

对所述语句元素进行属性特征映射，得到所述语句元素的元素属性特征；

根据所述语句元素的元素类型进行类型特征映射，得到所述语句元素的元素类型特征；

根据所述头实体在所述语句中的头实体位置对所述语句元素进行位置特征映射，得到所述语句元素的元素位置特征；所述语句元素对应的语句元素特征包括所述元素属性特征、所述元素类型特征和所述元素位置特征；

对各所述语句元素对应的语句元素特征进行编码，根据编码结果组合得到所述语句对应的编码特征。

3.根据权利要求2所述的方法，其特征在于，所述元素类型包括部位实体、症状实体类型、症状性质实体、症状程度实体、症状诱因实体和非实体元素中的至少一种。

4.根据权利要求2所述的方法，其特征在于，所述根据所述头实体在所述语句中的头实体位置对所述语句元素进行位置特征映射，得到所述语句元素的元素位置特征包括：

确定所述头实体在所述语句中的头实体位置；

确定在所述语句中各所述语句元素分别与所述头实体位置相对的元素相对位置；

根据所述语句元素的元素相对位置进行位置特征映射，得到所述语句元素的元素位置特征。

5.根据权利要求2所述的方法，其特征在于，所述对各所述语句元素对应的语句元素特征进行编码，根据编码结果组合得到所述语句对应的编码特征包括：

根据各所述语句元素对应的语句元素特征在所述语句中的先后顺序，分别按照前向方向和后向方向进行按序编码，得到各所述语句元素对应的前向编码特征和后向编码特征；

将所述前向编码特征和所述后向编码特征进行拼接，得到所述语句元素对应的元素编码特征；

根据各所述语句元素对应的元素编码特征的组合，得到所述语句对应的编码特征。

6.根据权利要求1所述的方法，其特征在于，所述根据所述当前解码状态和所述编码特征进行解码，得到本次迭代解码的指向所述语句中的尾实体的概率分布包括：

根据所述当前解码状态和所述编码特征进行特征融合，得到解码融合特征；

对所述解码融合特征进行特征映射，得到本次迭代解码的指向所述语句中的尾实体的概率分布。

7.根据权利要求6所述的方法，其特征在于，所述根据所述当前解码状态和所述编码特征进行特征融合，得到解码融合特征包括：

从所述编码特征中确定各语句元素对应的元素编码特征；

将所述当前解码状态分别与各语句元素对应的元素编码特征进行特征融合，得到各所述语句元素对应的元素融合特征；

根据各所述语句元素对应的元素融合特征得到解码融合特征。

8.根据权利要求1所述的方法，其特征在于，所述在满足迭代解码停止条件后，基于历次迭代解码获得的概率分布所指向的尾实体，确定所述语句中与所述头实体具有实体对应关系的尾实体包括：

当迭代解码获得的概率分布为解码结束类型分布时，确定历次迭代解码获得的概率分布所指向的尾实体对应的尾实体位置；

从所述语句中确定所述尾实体位置对应的目标语句元素；

根据所述目标语句元素得到所述语句中与所述头实体具有实体对应关系的尾实体。

9.一种实体关系识别模型训练方法，其特征在于，所述方法包括：

获取训练语句，对所述训练语句进行分词处理获得训练语句元素，并从所述训练语句元素中确定所述训练语句中携带尾实体标签且需要识别实体关系的训练头实体；

通过待训练的模型基于所述训练头实体对各所述训练语句元素进行编码，根据获得的所述训练语句元素对应的训练语句元素特征进行编码，根据编码结果组合得到所述训练语句对应的训练编码特征；所述训练语句元素特征包括所述训练语句元素的元素位置特征，所述元素位置特征用于表征在所述训练语句中所述训练语句元素相对于所述训练头实体的相对位置；

通过所述模型将前一次迭代解码获得的训练概率分布确定为当前训练解码状态；根据所述当前训练解码状态和所述训练编码特征进行解码，得到本次迭代解码的指向所述训练语句中的尾实体的训练概率分布；所述训练概率分布中最大概率所对应的训练语句元素，为所述本次迭代解码得到与所述头实体具有实体对应关系的尾实体；将本次迭代解码的指向尾实体的训练概率分布作为所述当前训练解码状态，并返回所述根据所述当前训练解码状态和所述训练编码特征进行解码，得到本次迭代解码的指向尾实体的训练概率分布的步骤；每次迭代解码时根据所述训练编码特征和当前训练解码状态进行解码，且所述当前训练解码状态采用前一次迭代解码获得的训练概率分布；

在满足迭代解码停止条件后，基于历次迭代解码获得的训练概率分布所指向的尾实体，确定所述训练语句中与所述训练头实体具有实体对应关系的尾实体；

根据所述尾实体和所述尾实体标签调整所述模型的参数后继续进行训练，直至满足训练结束条件时结束训练，得到训练完成的实体关系识别模型。

10.根据权利要求9所述的方法，其特征在于，所述通过待训练的模型基于所述训练头实体对各所述训练语句元素进行编码，根据获得的所述训练语句元素对应的训练语句元素特征进行编码，根据编码结果组合得到所述训练语句对应的训练编码特征包括：

对所述训练语句元素进行属性特征映射，得到所述训练语句元素的元素属性特征；

根据所述训练语句元素的元素类型进行类型特征映射，得到所述训练语句元素的元素类型特征；

根据所述训练头实体在所述训练语句中的训练头实体位置对所述训练语句元素进行位置特征映射，得到所述训练语句元素的元素位置特征；所述训练语句元素对应的训练语句元素特征包括所述元素属性特征、所述元素类型特征和所述元素位置特征；

对各所述训练语句元素对应的训练语句元素特征进行编码，根据编码结果组合得到所述训练语句对应的训练编码特征。

11.一种实体关系识别装置，其特征在于，所述装置包括：

语句获取模块，用于获取语句，对所述语句进行分词处理获得语句元素，并从所述语句元素中确定所述语句中需要识别实体关系的头实体；

语句编码模块，用于基于所述头实体对各所述语句元素进行编码，根据获得的所述语句元素对应的语句元素特征进行编码，根据编码结果组合得到所述语句对应的编码特征；所述语句元素特征包括所述语句元素的元素位置特征，所述元素位置特征用于表征在所述语句中所述语句元素相对于所述头实体的相对位置；

迭代解码模块，用于将前一次迭代解码获得的概率分布确定为当前解码状态；通过解码网络，根据所述当前解码状态和所述编码特征进行解码，得到本次迭代解码的指向所述语句中的尾实体的概率分布；所述概率分布中最大概率所对应的语句元素，为所述本次迭代解码得到与所述头实体具有实体对应关系的尾实体；将本次迭代解码的指向尾实体的概率分布作为所述当前解码状态，并返回所述通过解码网络，根据所述当前解码状态和所述编码特征进行解码，得到本次迭代解码的指向尾实体的概率分布的步骤；每次迭代解码时根据所述编码特征和当前解码状态进行解码，且所述当前解码状态采用前一次迭代解码获得的概率分布；

识别结果获取模块，用于在满足迭代解码停止条件后，基于历次迭代解码获得的概率分布所指向的尾实体，确定所述语句中与所述头实体具有实体对应关系的尾实体。

12.根据权利要求11所述的装置，其特征在于，所述语句编码模块，包括：

属性特征映射模块，用于对所述语句元素进行属性特征映射，得到所述语句元素的元素属性特征；

类型特征映射模块，用于根据所述语句元素的元素类型进行类型特征映射，得到所述语句元素的元素类型特征；

位置特征映射模块，用于根据所述头实体在所述语句中的头实体位置对所述语句元素进行位置特征映射，得到所述语句元素的元素位置特征；所述语句元素对应的语句元素特征包括所述元素属性特征、所述元素类型特征和所述元素位置特征；

特征编码模块，用于对各所述语句元素对应的语句元素特征进行编码，根据编码结果组合得到所述语句对应的编码特征。

13.根据权利要求12所述的装置，其特征在于，所述元素类型包括部位实体、症状实体类型、症状性质实体、症状程度实体、症状诱因实体和非实体元素中的至少一种。

14.根据权利要求12所述的装置，其特征在于，所述位置特征映射模块，包括：

头实体位置模块，用于确定所述头实体在所述语句中的头实体位置；

相对位置模块，用于确定在所述语句中各所述语句元素分别与所述头实体位置相对的元素相对位置；

元素位置特征模块，用于根据所述语句元素的元素相对位置进行位置特征映射，得到所述语句元素的元素位置特征。

15.根据权利要求12所述的装置，其特征在于，所述特征编码模块，包括：

双向编码模块，用于根据各所述语句元素对应的语句元素特征在所述语句中的先后顺序，分别按照前向方向和后向方向进行按序编码，得到各所述语句元素对应的前向编码特征和后向编码特征；

特征拼接模块，用于将所述前向编码特征和所述后向编码特征进行拼接，得到所述语句元素对应的元素编码特征；

特征编码获得模块，用于根据各所述语句元素对应的元素编码特征的组合，得到所述语句对应的编码特征。

16.根据权利要求11所述的装置，其特征在于，所述解码处理模块，包括：

特征融合模块，用于根据所述当前解码状态和所述编码特征进行特征融合，得到解码融合特征；

融合特征映射模块，用于对所述解码融合特征进行特征映射，得到本次迭代解码的指向所述语句中的尾实体的概率分布。

17.根据权利要求16所述的装置，其特征在于，所述特征融合模块，包括：

元素编码特征确定模块，用于从所述编码特征中确定各语句元素对应的元素编码特征；

元素编码特征融合模块，用于将所述当前解码状态分别与各语句元素对应的元素编码特征进行特征融合，得到各所述语句元素对应的元素融合特征；

解码融合特征获得模块，用于根据各所述语句元素对应的元素融合特征得到解码融合特征。

18.根据权利要求11所述的装置，其特征在于，所述识别结果获取模块，包括：

尾实体位置模块，用于当迭代解码获得的概率分布为解码结束类型分布时，确定历次迭代解码获得的概率分布所指向的尾实体对应的尾实体位置；

目标元素确定模块，用于从所述语句中确定所述尾实体位置对应的目标语句元素；

尾实体确定模块，用于根据所述目标语句元素得到所述语句中与所述头实体具有实体对应关系的尾实体。

19.一种实体关系识别模型训练装置，其特征在于，所述装置包括：

训练语句获取模块，用于获取训练语句，对所述训练语句进行分词处理获得训练语句元素，并从所述训练语句元素中确定所述训练语句中携带尾实体标签且需要识别实体关系的训练头实体；

训练语句编码模块，用于通过待训练的模型基于所述训练头实体对各所述训练语句元素进行编码，根据获得的所述训练语句元素对应的训练语句元素特征进行编码，根据编码结果组合得到所述训练语句对应的训练编码特征；所述训练语句元素特征包括所述训练语句元素的元素位置特征，所述元素位置特征用于表征在所述训练语句中所述训练语句元素相对于所述训练头实体的相对位置；

迭代解码训练模块，用于通过所述模型将前一次迭代解码获得的训练概率分布确定为当前训练解码状态；根据所述当前训练解码状态和所述训练编码特征进行解码，得到本次迭代解码的指向所述训练语句中的尾实体的训练概率分布；所述训练概率分布中最大概率所对应的训练语句元素，为所述本次迭代解码得到与所述头实体具有实体对应关系的尾实体；将本次迭代解码的指向尾实体的训练概率分布作为所述当前训练解码状态，并返回所述根据所述当前训练解码状态和所述训练编码特征进行解码，得到本次迭代解码的指向尾实体的训练概率分布的步骤；每次迭代解码时根据所述训练编码特征和当前训练解码状态进行解码，且所述当前训练解码状态采用前一次迭代解码获得的训练概率分布；

训练识别结果模块，用于在满足迭代解码停止条件后，基于历次迭代解码获得的训练概率分布所指向的尾实体，确定所述训练语句中与所述训练头实体具有实体对应关系的尾实体；

模型调整模块，用于根据所述尾实体和所述尾实体标签调整所述模型的参数后继续进行训练，直至满足训练结束条件时结束训练，得到训练完成的实体关系识别模型。

20.根据权利要求19所述的装置，其特征在于，所述训练语句编码模块，包括：

属性特征映射模块，用于对所述训练语句元素进行属性特征映射，得到所述训练语句元素的元素属性特征；

类型特征映射模块，用于根据所述训练语句元素的元素类型进行类型特征映射，得到所述训练语句元素的元素类型特征；

位置特征映射模块，用于根据所述训练头实体在所述训练语句中的训练头实体位置对所述训练语句元素进行位置特征映射，得到所述训练语句元素的元素位置特征；所述训练语句元素对应的训练语句元素特征包括所述元素属性特征、所述元素类型特征和所述元素位置特征；

训练特征编码模块，用于对各所述训练语句元素对应的训练语句元素特征进行编码，根据编码结果组合得到所述训练语句对应的训练编码特征。

21.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。

22.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。