CN117034943B

CN117034943B - 论证提取以及关系识别方法、装置、设备以及存储介质

Info

Publication number: CN117034943B
Application number: CN202311294228.1A
Authority: CN
Inventors: 刘俊希; 薛云; 林逸浩; 吴承彦; 郑章楷
Original assignee: South China Normal University
Current assignee: South China Normal University
Priority date: 2023-10-09
Filing date: 2023-10-09
Publication date: 2024-02-06
Anticipated expiration: 2043-10-09
Also published as: CN117034943A

Abstract

本发明涉及论证处理领域，特别涉及一种论证提取以及关系识别方法、装置、设备以及存储介质，通过预设的论证挖掘模型，对待提取文本进行命题划分以及命题的词嵌入特征表示以及上下文特征表示的特征提取，基于上下文特征表示，对命题进行论证片段提取，构建若干个论证片段对，并结合命题中的若干个实体对应的实体路径信息，使得模型能更全面考虑论证片段中实体之间的联系，更加全面地对各个论证片段对进行论证关系识别，提高了论证结构信息以及论证关系信息提取的精准性以及效率性，降低了成本。

Description

论证提取以及关系识别方法、装置、设备以及存储介质

技术领域

本发明涉及论证处理领域，特别涉及一种论证提取以及关系识别方法、装置、设备以及存储介质。

背景技术

主观题评分是教育技术和自然语言处理领域的课题之一。主观题评分是指对学生提交的主观性答案进行评估和打分的任务，是涉及文本理解、情感分析、语义相似性等技术的任务，通过对学生答案进行语义理解、情感分析和语法检查，从而辅助评分过程。这类问题常见于考试、作文、论文等评估场景，其中学生的答案可能涉及多个方面和主观性观点。

然而，主观题文本中通常包含大量的论证结构信息以及论证关系信息，目前的技术方案，主要依赖于评分人员的经验，对主观题文本中的论证进行提取，以及对各个论证之间的关系进行识别，由于受主观因素等因素的影响，人工获得的论证结构信息以及论证关系信息的精度低、效率差，成本高。

发明内容

基于此，本发明提供一种论证提取以及关系识别方法、装置、设备以及存储介质，通过预设的论证挖掘模型，对待提取文本进行命题划分以及命题的词嵌入特征表示以及上下文特征表示的特征提取，基于上下文特征表示，对命题进行论证片段提取，构建若干个论证片段对，并结合命题中的若干个实体对应的实体路径信息，使得模型能更全面考虑论证片段中实体之间的联系，更加全面地对各个论证片段对进行论证关系识别，提高了论证结构信息以及论证关系信息提取的精准性以及效率性，降低了成本。该技术方法如下：

第一方面，本申请实施例提供了一种论证提取以及关系识别方法，包括以下步骤：

获得待提取文本以及预设的论证挖掘模型，其中，所述论证挖掘模型包括命题划分模块、论证提取模块以及关系识别模块；

将所述待提取文本输入至所述命题划分模块中，获得所述待提取文本的若干个命题以及所述命题对应的词嵌入特征表示以及上下文特征表示；

将各个所述命题对应的上下文特征表示输入至所述论证提取模块，获得各个所述命题的论证片段，构建所述待提取文本的论证片段集，将所述论证片段集中的论证片段进行两两组合，构建若干个论证片段对，获得若干个所述论证片段对的论证片段对应的词嵌入特征表示，其中，所述论证片段包括若干个实体；

构建各个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵，将同一个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵进行编码处理，获得各个所述论证片段对的实体路径信息表示；

将各个所述论证片段对的论证片段对应的词嵌入特征表示以及实体路径信息表示输入至所述关系识别模块中进行关系识别，获得各个所述论证片段对的论证关系识别结果。

第二方面，本申请实施例提供了一种论证提取以及关系识别装置，包括：

数据获取模块，用于获得待提取文本以及预设的论证挖掘模型，其中，所述论证挖掘模型包括命题划分模块、论证提取模块以及关系识别模块；

命题划分模块，用于将所述待提取文本输入至所述命题划分模块中，获得所述待提取文本的若干个命题以及所述命题对应的词嵌入特征表示以及上下文特征表示；

论证提取模块，用于将各个所述命题对应的上下文特征表示输入至所述论证提取模块，获得各个所述命题的论证片段，构建所述待提取文本的论证片段集，将所述论证片段集中的论证片段进行两两组合，构建若干个论证片段对，获得若干个所述论证片段对的论证片段对应的词嵌入特征表示，其中，所述论证片段包括若干个实体；

实体信息获取模块，用于构建各个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵，将同一个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵进行编码处理，获得各个所述论证片段对的实体路径信息表示；

关系识别模块，用于将各个所述论证片段对的论证片段对应的词嵌入特征表示以及实体路径信息表示输入至所述关系识别模块中进行关系识别，获得各个所述论证片段对的论证关系识别结果。

第三方面，本申请实施例提供了一种计算机设备，包括：处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序；所述计算机程序被所述处理器执行时实现如第一方面所述的论证提取以及关系识别方法的步骤。

第四方面，本申请实施例提供了一种存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的论证提取以及关系识别方法的步骤。

在本实施例中，提供一种论证提取以及关系识别方法、装置、设备以及存储介质，通过预设的论证挖掘模型，对待提取文本进行命题划分以及命题的词嵌入特征表示以及上下文特征表示的特征提取，基于上下文特征表示，对命题进行论证片段提取，构建若干个论证片段对，并结合命题中的若干个实体对应的实体路径信息，使得模型能更全面考虑论证片段中实体之间的联系，更加全面地对各个论证片段对进行论证关系识别，提高了论证结构信息以及论证关系信息提取的精准性以及效率性，降低了成本。

为了更好地理解和实施，下面结合附图详细说明本发明。

附图说明

图1为本申请第一实施例提供的论证提取以及关系识别方法的流程示意图；

图2为本申请第一实施例提供的论证提取以及关系识别方法中S2的流程示意图；

图3为本申请第一实施例提供的论证提取以及关系识别方法中S3的流程示意图；

图4为本申请第二实施例提供的论证提取以及关系识别方法的流程示意图；

图5为本申请第一实施例提供的论证提取以及关系识别方法中S3的流程示意图；

图6为本申请第三实施例提供的论证提取以及关系识别方法的流程示意图；

图7为本申请第一实施例提供的论证提取以及关系识别方法中S5的流程示意图；

图8为本申请第四实施例提供的论证提取以及关系识别装置的结构示意图；

图9为本申请第五实施例提供的计算机设备的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。

请参阅图1，图1为本申请第一实施例提供的论证提取以及关系识别方法的流程示意图，包括如下步骤：

S1：获得待提取文本以及预设的论证挖掘模型。

本申请的论证提取以及关系识别方法的执行主体为论证提取以及关系识别方法的处理设备（以下简称处理设备）。

在一个可选的实施例中，处理设备可以是一台计算机设备，可以是服务器，或多台计算机设备联合而成的服务器机群。

在本实施例中，处理设备可以获取用户输入的待提取文本，其中，所述待测语句包括若干个单词。

处理设备获得预设的论证挖掘模型，其中，所述论证挖掘模型包括命题划分模块、论证提取模块以及关系识别模块。

S2：将所述待提取文本输入至所述命题划分模块中，获得所述待提取文本的若干个命题以及所述命题对应的词嵌入特征表示以及上下文特征表示。

在本实施例中，处理设备将所述待提取文本输入至所述命题划分模块中，获得所述待提取文本的若干个命题以及所述命题对应的词嵌入特征表示以及上下文特征表示。

请参阅图2，图2为本申请第一实施例提供的论证提取以及关系识别方法中S2的流程示意图，包括步骤S21~S25，具体如下：

S21：对所述待提取文本进行词嵌入处理，获得所述待提取文本对应的词嵌入特征表示。

在本实施例中，处理设备采用BERT（Bidirectional Encoder Representaionfrom Transformers）预训练语言模型以及条件随机场（CRF），对所述待提取文本进行词嵌入处理，获得所述待提取文本对应的词嵌入特征表示，其中，所述词嵌入特征表示包括若干个单词的词嵌入向量，所述词嵌入特征表示为：

式中，为所述词嵌入特征表示，/>为第n个单词对应的词嵌入向量，n为所述待提取文本的单词的数目。

S22：对所述词嵌入特征表示进行语义特征提取，获得语义特征表示。

在本实施例中，处理设备采用LSTM（Long Short Term Memory）长短期神经网络，对所述词嵌入特征表示进行语义特征提取，获得语义特征表示，其中，所述语义特征表示包括若干个单词的语义特征向量，所述语义特征表示为：

式中，为第n个单词对应的语义特征向量，/>为第n个单词对应的词嵌入向量，n为所述待提取文本的单词的数目。

S23：获得所述待提取文本的词性标注表示，对所述词性标注表示进行编码处理，获得句法特征表示。

在本实施例中，处理设备通过CoreNLP，提取所述待提取文本的每个单词的词性（POS）标记，获得所述待提取文本的词性标注表示，其中，所述词性标注表示包括若干个单词的词性标注向量，所述词性标注表示为：

式中，为第n个单词对应的词性标注向量。

处理设备对所述词性标注表示进行编码处理，获得句法特征表示，其中，所述句法特征表示包括若干个单词的句法特征向量，所述句法特征表示为：

式中，为第n个单词对应的句法特征向量，Embedding（）为编码函数。

S24：获得所述待提取文本的结构标注表示，对所述结构标注表示进行编码处理，获得结构特征表示。

在本实施例中，处理设备使用CoreNLP识别待提取文本中的片段、从句和短语，获得所述待提取文本的结构标注表示，其中，所述结构标注表示包括若干个单词的结构标注向量，所述结构标注表示为：

式中，为第n个单词对应的结构标注向量。

处理设备对所述结构标注表示进行编码处理，获得结构特征表示，其中，所述结构特征表示包括若干个单词的结构特征向量，所述结构特征表示为：

式中，为第n个单词对应的句法特征向量。

S25：将所述语义特征表示、句法特征表示以及结构特征表示输入至预设的解码器中进行解码处理，获得所述待提取文本的识别结构标注表示，根据所述识别结构标注表示中各个单词的识别结构标注向量，将所述待提取文本划分为若干个命题，获得各个所述命题对应的词嵌入特征表示，分别对各个所述命题进行上下文特征提取，获得各个所述命题对应的上下文特征表示。

所述解码器包括BiLSTM（Bi-directional Long Short-Term Memory）双向长短期记忆网络以及条件随机场（CRF），在本实施例中，处理设备将所述语义特征表示、句法特征表示以及结构特征表示输入至预设的解码器中进行解码处理，获得所述待提取文本的识别结构标注表示，其中，所述识别结构标注表示包括个若干个单词的识别结构标注向量，用以表示B（开始），I（内部），O（结束），作为每个单词的识别结构标注来表示命题的边界。

处理设备获得相邻的表示B（开始）的单词的位置索引以及表示O（结束）的单词的位置索引，根据所述位置索引，从所述待测文本中提取若干个目标片段，作为所述命题，从而实现对所述待提取文本的命题划分，获得各个所述命题对应的词嵌入特征表示。

处理设备分别对各个所述命题进行上下文特征提取，获得各个所述命题对应的上下文特征表示，其中，所述上下文特征表示为：

式中，为所述上下文特征表示，/>为第p个单词对应的词嵌入向量。

S3：将各个所述命题对应的上下文特征表示输入至所述论证提取模块，获得各个所述命题的论证片段，构建所述待提取文本的论证片段集，将所述论证片段集中的论证片段进行两两组合，构建若干个论证片段对，获得若干个所述论证片段对的论证片段对应的词嵌入特征表示。

在本实施例中，处理设备将各个所述命题对应的上下文特征表示输入至所述论证提取模块，获得各个所述命题的论证片段，构建所述待提取文本的论证片段集，将所述论证片段集中的论证片段进行两两组合，构建若干个论证片段对，获得若干个所述论证片段对的论证片段对应的词嵌入特征表示，其中，所述论证片段包括若干个实体。

所述论证片段包括论点片段，所述论证提取模块包括论点片段提取模块；请参阅图3，图3为本申请第一实施例提供的论证提取以及关系识别方法中S3的流程示意图，包括步骤S31~S32，具体如下：

S31：将各个所述命题对应的上下文特征表示输入至所述论点片段提取模块，根据预设的论点评分数据计算算法，获得各个所述命题的若干个单词的论点评分数据。

所述论点评分数据包括论点片段开始分数以及论点片段结束分数，所述论点评分数据计算算法为：

式中，为第i个单词的论点片段开始评分数据，/>为第i个单词的论点片段结束评分数据，/>为第一可学习参数矩阵，/>为第i个单词的上下文嵌入向量。

在本实施例中，处理设备将各个所述命题对应的上下文特征表示输入至所述论点片段提取模块，根据预设的论点评分数据计算算法，获得各个所述命题的若干个单词的论点评分数据。

S32：根据各个所述命题的若干个单词的论点评分数据以及预设的论点概率向量计算算法，获得各个所述命题的若干个单词之间的论点概率向量，获得各个所述命题的最大论点概率向量对应的两个单词的位置索引，根据所述位置索引，获得各个所述命题的论点片段。

所述论点概率向量计算算法为：

式中，为第i个单词与第j个单词之间的论点概率向量，/>为命题中的单词数目，/>为第m个单词的论点片段开始评分数据，/>为第o个单词的论点片段结束评分数据。

在本实施例中，处理设备根据各个所述命题的若干个单词的论点评分数据以及预设的论点概率向量计算算法，获得各个所述命题的若干个单词之间的论点概率向量，获得各个所述命题的最大论点概率向量对应的两个单词的位置索引，根据所述位置索引，获得各个所述命题的论点片段。

一个论点片段中由三部分组成，即主语、谓语动词和宾语，在一个可选的实施例中，处理设备采用过滤规则，对各个所述命题的论点片段进行过滤，以去除明显错误和重叠的论点片段，处理设备遍历各个所述论点片段，将少于3个单词的论点片段进行移除。

请参阅图4，图4为本申请第二实施例提供的论证提取以及关系识别方法的流程示意图，还包括步骤S6：训练所述论点片段提取模块，所述步骤S6在步骤S3之前，包括步骤S61~S62，具体如下：

S61：获得若干个样本命题的若干个单词的论点评分数据，根据所述若干个样本命题的若干个单词的论点评分数据以及预设的第一标签预测算法，获得所述若干个样本命题的若干个单词的预测位置标签数据。

所述预测位置标签数据包括预测开始位置标签数据以及预测结束位置标签数据，所述第一标签预测算法为：

式中，为第i个单词的预测开始位置标签数据，/>为第i个单词的预测结束位置标签数据，softmax( )为归一化函数。

在本实施例中，处理设备获得若干个样本命题的若干个单词的论点评分数据，根据所述若干个样本命题的若干个单词的论点评分数据以及预设的第一标签预测算法，获得所述若干个样本命题的若干个单词的预测位置标签数据。

S62：获得所述若干个样本命题的若干个单词的真实位置标签数据，根据所述真实位置标签数据、预测位置标签数据以及预设的第一损失函数，获得第一损失值，根据所述第一损失值，对所述论点片段提取模块进行训练，获得目标论点片段提取模块。

所述第一损失函数为：

式中，为第一函数值，/>为第i个单词的真实开始位置标签数据、/>为第i个单词的真实结束位置标签数据。

在本实施例中，处理设备获得所述若干个样本命题的若干个单词的真实位置标签数据，根据所述真实位置标签数据、预测位置标签数据以及预设的第一损失函数，获得第一损失值，根据所述第一损失值，对所述论点片段提取模块进行训练，获得目标论点片段提取模块。

所述论证片段包括论据片段，所述论证提取模块包括论据片段提取模块；请参阅图5，图5为本申请第一实施例提供的论证提取以及关系识别方法中S3的流程示意图，包括步骤S33~S34，具体如下：

S33：将各个所述命题对应的上下文特征表示输入至所述论据片段提取模块，根据预设的标签概率评分数据计算算法，获得各个命题的若干个单词的标签概率评分数据。

所述标签概率评分数据包括若干个标签类型的概率评分数据，所述标签类型概率评分数据计算算法为：

式中，为第i个单词的第k个标签类型的概率评分数据，/>为可学习第二权重参数，/>为第i个单词的上下文嵌入向量。

在本实施例中，处理设备将各个所述命题对应的上下文特征表示输入至所述论据片段提取模块，根据预设的标签概率评分数据计算算法，获得各个所述命题的若干个单词的标签概率评分数据。

S34：获得各个单词的标签概率评分数据中最大概率评分数据的标签类型，作为各个所述单词的标签类型数据，根据各个所述单词的标签类型数据，获得各个所述命题的论据片段。

在本实施例中，处理设备获得各个所述单词的标签概率评分数据中最大概率评分数据的标签类型，作为各个所述单词的标签类型数据，其中，所述标签类型数据包括开头标签、内部标签以及尾部标签。

处理设备根据各个所述单词的标签类型数据，获得相邻的表示开头标签的单词的位置索引以及表示尾部标签的单词的位置索引，根据所述位置索引，从所述命题中提取若干个目标片段，作为所述论据片段，获得各个所述命题的论据片段。

在一个可选的实施例中，处理设备对于各个所述命题的论点片段以及论证片段，若所述论点片段以及论据片段存在重叠，则保留优先级较高的片段，即论点片段，将重叠的所述论据片段进行移除。

图6为本申请第三实施例提供的论证提取以及关系识别方法的流程示意图，还包括步骤S7：训练所述论据片段提取模块，所述步骤S7在步骤S3之前，包括步骤S71~S72，具体如下：

S71：获得各个所述样本命题的若干个单词的标签概率评分数据，根据各个所述样本命题的若干个单词的标签概率评分数据以及预设的第二标签预测算法，构建若干个标签类型对应的预测评分标签数据。

所述第二标签预测算法为：

式中，为第t个标签类型对应的预测评分标签数据，/>为第i个单词的第个标签类型的概率评分数据，/>表示由第/>个标签类型转移至/>个标签类型的标签转移矩阵。

在本实施例中，处理设备获得各个所述样本命题的若干个单词的标签概率评分数据，根据各个所述样本命题的若干个单词的标签概率评分数据以及预设的第二标签预测算法，构建若干个标签类型对应的预测评分标签数据。

S72：获得各个所述标签类型对应的真实评分标签数据，根据所述真实评分标签数据、预测评分标签数据以及预设的第二损失函数，获得第二损失值，根据所述第二损失值，对所述论据片段提取模块进行训练，获得目标论据片段提取模块。

所述第二损失函数为：

式中，为第二损失值，/>为真实评分标签数据，T为标签类型数目。

在本实施例中，处理设备获得各个所述标签类型对应的真实评分标签数据，根据所述真实评分标签数据、预测评分标签数据以及预设的第二损失函数，获得第二损失值，根据所述第二损失值，对所述论据片段提取模块进行训练，获得目标论据片段提取模块。

S4：构建各个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵，将同一个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵进行编码处理，获得各个所述论证片段对的实体路径信息表示。

在本实施例中，处理设备构建各个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵，具体地，处理设备获得事理图谱，其中，所述事理图谱包括若干个事件节点，所述事件节点为事件簇，包括若干个实体；所述事理图谱包括事件节点之间连接的边关系，所述边关系用于表示连接的两个事件节点之间包含的实体是同义词或指向相同。

处理设备利用事理图谱中存在有边关系的事件节点，构建若干个事件路径表示，其中，所述事件路径表示为：

式中，为第i个事件节点与第j个事件节点连接的事件路径表示，/>为第i个事件节点的概念向量，/>为第j个事件节点的概念向量，概念向量为事件节点对应的概念的向量表示。

考虑到所述实体事件路径矩阵中，各个所述事件路径中的实体节点的前后关系，构建各个所述事件路径表示对应的位置嵌入表示，其中，所述位置嵌入表示为：

式中，为第i个事件节点与第j个事件节点连接的位置嵌入表示，/>为第i个事件节点的位置嵌入向量，/>为第j个事件节点的位置嵌入向量，位置嵌入为事件节点在事理图谱上对应的位置的向量表示。

处理设备获得各个所述论证片段对的中各个所述论证片段中的实体，遍历所述事理图谱，判断所述实体所属的事件节点，根据所述实体所属的事件节点以及所述事件路径表示、位置嵌入表示，构建各个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵，其中，所述实体事件路径矩阵包括若干个所述实体与其他实体连接的事件路径表示，所述实体与其他实体连接的事件路径表示为：

式中，为所述论证片段对中第i个实体与第j个实体连接的事件路径表示，/>为第/>个论证片段中第i个实体的概念向量，/>为第/>个论证片段中第j个实体的概念向量。

所述实体位置嵌入矩阵包括若干个所述实体与其他实体连接的位置嵌入表示，所述实体与其他实体连接的位置嵌入表示为：

式中，为所述论证片段对中第i个实体与第j个实体连接的位置嵌入表示，/>为第/>个论证片段中第i个实体的位置嵌入向量，/>为第/>个论证片段中第j个实体的位置嵌入向量。

处理设备将同一个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵进行编码处理，获得各个所述论证片段对的实体路径信息表示，具体如下：

式中，为所述论证片段对中第i个实体与第j个实体连接的实体路径信息表示，Transformer（）为编码函数。

S5：将各个所述论证片段对的论证片段对应的词嵌入特征表示以及实体路径信息表示输入至所述关系识别模块中进行关系识别，获得各个所述论证片段对的论证关系识别结果。

在本实施例中，处理设备将各个所述论证片段对的论证片段对应的词嵌入特征表示以及实体路径信息表示输入至所述关系识别模块中进行关系识别，获得各个所述论证片段对的论证关系识别结果。

请参阅图7，图7为本申请第一实施例提供的论证提取以及关系识别方法中S5的流程示意图，包括步骤S51~S54，具体如下：

S51：根据各个所述论证片段对的论证片段对应的词嵌入特征表示以及预设的词嵌入算法，获得各个所述论证片段对的词嵌入表示。

所述词嵌入算法为：

式中，为所述论证片段对的词嵌入表示，BERT（）为词嵌入函数，[CLS]为分类标志位，[SEP]为片段分隔标志位，/>、/>分别为所述论证片段对中的第/>个、第/>个论证片段对应的词嵌入特征表示。

在本实施例中，处理设备根据各个所述论证片段对的论证片段对应的词嵌入特征表示以及预设的词嵌入算法，获得各个所述论证片段对的词嵌入表示。

S52：根据各个所述论证片段对的词嵌入表示、实体路径信息表示以及预设的全局路径信息提取算法，获得全局路径信息表示。

所述全局路径信息提取算法为：

式中，为所述全局路径信息表示，k表示第k个论证片段对，/>为第三可学习参数矩阵，/>为第l个论证片段对的实体路径信息表示。

在本实施例中，处理设备根据各个所述论证片段对的词嵌入表示、实体路径信息表示以及预设的全局路径信息提取算法，获得全局路径信息表示。

S53：获得各个所述论证片段对中各个论证片段的命名实体数据，根据所述全局路径信息表示、各个所述论证片段对的命名实体数据以及预设的全局实体信息提取算法，获得各个所述论证片段对中的各个论证片段的全局实体信息表示。

所述命名实体数据包括若干个实体的向量表示，所述全局实体信息提取算法为：

式中，为第s个论证片段的全局实体信息表示，s为论证片段的索引，，/>为第四可学习参数矩阵，/>、/>分别为所述论证片段中第i个实体、第j个实体的向量表示。

在本实施例中，处理设备获得各个所述论证片段对中各个论证片段的命名实体数据，根据所述全局路径信息表示、各个所述论证片段对的命名实体数据以及预设的全局实体信息提取算法，获得各个所述论证片段对中的各个论证片段的全局实体信息表示。

S54：将所述全局路径信息表示、各个所述论证片段对的词嵌入表示以及全局实体信息表示进行拼接，获得各个所述论证片段对的拼接向量。

所述拼接向量为：

/>

式中，f为所述拼接向量，、/>分别为所述论证片段对中第/>个、第/>个论证片段的全局实体信息表示。

在本实施例中，处理设备将同一个所述论证片段对的词嵌入表示、全局路径信息表示以及论证片段的全局实体信息表示进行拼接，获得各个所述论证片段对的拼接向量。

S55：根据各个所述论证片段对的拼接向量以及预设的关系识别概率向量算法，获得各个所述论证片段对的关系识别概率向量，根据所述关系识别概率向量，获得关系识别概率向量最大的维度对应的关系信息，作为所述论证关系识别结果。

所述关系识别概率向量算法为：

式中，为所述关系识别概率向量，/>为非线性激活函数，/>为第五可学习参数矩阵，/>为偏置参数矩阵。

在本实施例中，处理设备根据各个所述论证片段对的拼接向量以及预设的关系识别概率向量算法，获得各个所述论证片段对的关系识别概率向量，根据所述关系识别概率向量，获得关系识别概率向量最大的维度对应的关系信息，作为所述论证关系识别结果。

请参阅图8，图8为本申请第四实施例提供的论证提取以及关系识别装置的结构示意图，该装置可以通过软件、硬件或两者的结合实现论证提取以及关系识别方法的全部或一部分，该装置8包括：

数据获取模块81，用于获得待提取文本以及预设的论证挖掘模型，其中，所述论证挖掘模型包括命题划分模块、论证提取模块以及关系识别模块；

命题划分模块82，用于将所述待提取文本输入至所述命题划分模块中，获得所述待提取文本的若干个命题以及所述命题对应的词嵌入特征表示以及上下文特征表示；

论证提取模块83，用于将各个所述命题对应的上下文特征表示输入至所述论证提取模块，获得各个所述命题的论证片段，构建所述待提取文本的论证片段集，将所述论证片段集中的论证片段进行两两组合，构建若干个论证片段对，获得若干个所述论证片段对的论证片段对应的词嵌入特征表示，其中，所述论证片段包括若干个实体；

实体信息获取模块84，用于构建各个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵，将同一个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵进行编码处理，获得各个所述论证片段对的实体路径信息表示；

关系识别模块85，用于将各个所述论证片段对的论证片段对应的词嵌入特征表示以及实体路径信息表示输入至所述关系识别模块中进行关系识别，获得各个所述论证片段对的论证关系识别结果。

在本申请的实施例中，通过数据获取模块，获得待提取文本以及预设的论证挖掘模型，其中，所述论证挖掘模型包括命题划分模块、论证提取模块以及关系识别模块；通过命题划分模块，将所述待提取文本输入至所述命题划分模块中，获得所述待提取文本的若干个命题以及所述命题对应的词嵌入特征表示以及上下文特征表示；通过论证提取模块，将各个所述命题对应的上下文特征表示输入至所述论证提取模块，获得各个所述命题的论证片段，构建所述待提取文本的论证片段集，将所述论证片段集中的论证片段进行两两组合，构建若干个论证片段对，获得若干个所述论证片段对的论证片段对应的词嵌入特征表示，其中，所述论证片段包括若干个实体；通过实体信息获取模块，构建各个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵，将同一个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵进行编码处理，获得各个所述论证片段对的实体路径信息表示；通过关系识别模块，将各个所述论证片段对的论证片段对应的词嵌入特征表示以及实体路径信息表示输入至所述关系识别模块中进行关系识别，获得各个所述论证片段对的论证关系识别结果。通过预设的论证挖掘模型，对待提取文本进行命题划分以及命题的词嵌入特征表示以及上下文特征表示的特征提取，基于上下文特征表示，对命题进行论证片段提取，构建若干个论证片段对，并结合命题中的若干个实体对应的实体路径信息，使得模型能更全面考虑论证片段中实体之间的联系，更加全面地对各个论证片段对进行论证关系识别，提高了论证结构信息以及论证关系信息提取的精准性以及效率性，降低了成本。

请参考图9，图9为本申请第五实施例提供的计算机设备的结构示意图，计算机设备9包括：处理器91、存储器92以及存储在存储器92上并可在处理器91上运行的计算机程序93；计算机设备可以存储有多条指令，指令适用于由处理器91加载并执行上述第一至第三所述实施例的方法步骤，具体执行过程可以参见第一至第三所述实施例的具体说明，在此不进行赘述。

其中，处理器91可以包括一个或多个处理核心。处理器91利用各种接口和线路连接服务器内的各个部分，通过运行或执行存储在存储器92内的指令、程序、代码集或指令集，以及调用存储器92内的数据，执行论证提取以及关系识别装置8的各种功能和处理数据，可选的，处理器91可以采用数字信号处理（Digital Signal Processing,DSP）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）、可编程逻辑阵列（ProgrambleLogic Array，PLA）中的至少一个硬件形式来实现。处理器91可集成中央处理器91（CentralProcessing Unit，CPU）、图像处理器91（Graphics Processing Unit，GPU）和调制解调器等中的一个或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器91中，单独通过一块芯片进行实现。

其中，存储器92可以包括随机存储器92（Random Access Memory，RAM），也可以包括只读存储器92（Read-Only Memory）。可选的，该存储器92包括非瞬时性计算机可读介质（non-transitory computer-readable storage medium）。存储器92可用于存储指令、程序、代码、代码集或指令集。存储器92可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令（比如触控指令等）、用于实现上述各个方法实施例的指令等；存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器92可选的还可以是至少一个位于远离前述处理器91的存储装置。

本申请实施例还提供了一种存储介质，所述存储介质可以存储有多条指令，所述指令适用于由处理器加载并执行所示实施例一至实施例三的方法步骤，具体执行过程可以参见所示第一至第三所述实施例的具体说明，在此不进行赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。

本发明并不局限于上述实施方式，如果对本发明的各种改动或变形不脱离本发明的精神和范围，倘若这些改动和变形属于本发明和等同技术范围之内，则本发明也意图包含这些改动和变形。

Claims

1.一种论证提取以及关系识别方法，其特征在于，包括以下步骤：

获得事理图谱，所述事理图谱包括若干个事件节点，所述事件节点为事件簇，包括若干个实体；所述事理图谱包括事件节点之间连接的边关系，所述边关系用于表示连接的两个事件节点之间包含的实体是同义词或指向相同；利用事理图谱中存在有边关系的事件节点，构建若干个事件路径表示，其中，所述事件路径表示为：

式中，为第i个事件节点与第j个事件节点连接的事件路径表示，/>为第i个事件节点的概念向量，/>为第j个事件节点的概念向量，概念向量为事件节点对应的概念的向量表示；

根据若干个所述事件路径表示，构建各个所述论证片段对的实体事件路径矩阵，其中，所述实体事件路径矩阵包括若干个所述实体与其他实体连接的事件路径表示，所述实体与其他实体连接的事件路径表示为：

式中，为所述论证片段对中第i个实体与第j个实体连接的事件路径表示，/>为第个论证片段中第i个实体的概念向量，/>为第/>个论证片段中第j个实体的概念向量；

构建各个所述论证片段对的实体位置嵌入矩阵，将同一个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵进行编码处理，获得各个所述论证片段对的实体路径信息表示；

2.根据权利要求1所述的论证提取以及关系识别方法，其特征在于，所述将所述待提取文本输入至所述命题划分模块中，获得所述待提取文本的若干个命题以及所述命题对应的词嵌入特征表示以及上下文特征表示，包括步骤：

对所述待提取文本进行词嵌入处理，获得所述待提取文本对应的词嵌入特征表示，其中，所述词嵌入特征表示包括若干个单词的词嵌入向量；

对所述词嵌入特征表示进行语义特征提取，获得语义特征表示，其中，所述语义特征表示包括若干个单词的语义特征向量；

获得所述待提取文本的词性标注表示，对所述词性标注表示进行编码处理，获得句法特征表示，其中，所述词性标注表示包括若干个单词的词性标注向量，所述句法特征表示包括若干个单词的句法特征向量；

获得所述待提取文本的结构标注表示，对所述结构标注表示进行编码处理，获得结构特征表示，其中，所述结构标注表示包括若干个单词的结构标注向量，所述结构特征表示包括若干个单词的结构特征向量；

将所述语义特征表示、句法特征表示以及结构特征表示输入至预设的解码器中进行解码处理，获得所述待提取文本的识别结构标注表示，根据所述识别结构标注表示中各个单词的识别结构标注向量，将所述待提取文本划分为若干个命题，获得各个所述命题对应的词嵌入特征表示，分别对各个所述命题进行上下文特征提取，获得各个所述命题对应的上下文特征表示，其中，所述上下文特征表示包括若干个单词的上下文嵌入向量。

3.根据权利要求2所述的论证提取以及关系识别方法，其特征在于：所述论证片段包括论点片段，所述论证提取模块包括论点片段提取模块；

所述将各个所述命题对应的上下文特征表示输入至所述论证提取模块，获得各个所述命题的论证片段，包括步骤：

将各个所述命题对应的上下文特征表示输入至所述论点片段提取模块，根据预设的论点评分数据计算算法，获得各个所述命题的若干个单词的论点评分数据，其中，所述论点评分数据包括论点片段开始分数以及论点片段结束分数，所述论点评分数据计算算法为：

式中，为第i个单词的论点片段开始评分数据，/>为第i个单词的论点片段结束评分数据，/>为第一可学习参数矩阵，/>为第i个单词的上下文嵌入向量；

根据各个所述命题的若干个单词的论点评分数据以及预设的论点概率向量计算算法，获得各个所述命题的若干个单词之间的论点概率向量，获得各个所述命题的最大论点概率向量对应的两个单词的位置索引，根据所述位置索引，获得各个所述命题的论点片段，其中，所述论点概率向量计算算法为：

式中，为第i个单词与第j个单词之间的论点概率向量，/>为命题中的单词数目。

4.根据权利要求3所述的论证提取以及关系识别方法，其特征在于，还包括步骤：训练所述论点片段提取模块，所述训练所述论点片段提取模块，包括步骤：

获得若干个样本命题的若干个单词的论点评分数据，根据所述若干个样本命题的若干个单词的论点评分数据以及预设的第一标签预测算法，获得所述若干个样本命题的若干个单词的预测位置标签数据，其中，所述预测位置标签数据包括预测开始位置标签数据以及预测结束位置标签数据，所述第一标签预测算法为：

式中，为第i个单词的预测开始位置标签数据，/>为第i个单词的预测结束位置标签数据，softmax( )为归一化函数；

获得所述若干个样本命题的若干个单词的真实位置标签数据，根据所述真实位置标签数据、预测位置标签数据以及预设的第一损失函数，获得第一损失值，根据所述第一损失值，对所述论点片段提取模块进行训练，获得目标论点片段提取模块，其中，所述第一损失函数为：

5.根据权利要求4所述的论证提取以及关系识别方法，其特征在于：所述论证片段包括论据片段，所述论证提取模块包括论据片段提取模块；

将各个所述命题对应的上下文特征表示输入至所述论据片段提取模块，根据预设的标签概率评分数据计算算法，获得各个命题的若干个单词的标签概率评分数据，其中，所述标签概率评分数据包括若干个标签类型的概率评分数据，所述标签类型概率评分数据计算算法为：

式中，为第i个单词的第k个标签类型的概率评分数据，/>为可学习第二权重参数，/>为第i个单词的上下文嵌入向量；

获得各个单词的标签概率评分数据中最大概率评分数据的标签类型，作为各个所述单词的标签类型数据，根据各个所述单词的标签类型数据，获得各个所述命题的论据片段，其中，所述标签类型数据包括开头标签、内部标签以及尾部标签。

6.根据权利要求5所述的论证提取以及关系识别方法，其特征在于，还包括步骤：训练所述论据片段提取模块，所述训练所述论据片段提取模块，包括步骤：

获得各个所述样本命题的若干个单词的标签概率评分数据，根据各个所述样本命题的若干个单词的标签概率评分数据以及预设的第二标签预测算法，构建若干个标签类型对应的预测评分标签数据，其中，所述第二标签预测算法为：

式中，为第t个标签类型对应的预测评分标签数据，/>为第i个单词的第/>个标签类型的概率评分数据，/>表示由第/>个标签类型转移至/>个标签类型的标签转移矩阵；

获得各个所述标签类型对应的真实评分标签数据，根据所述真实评分标签数据、预测评分标签数据以及预设的第二损失函数，获得第二损失值，根据所述第二损失值，对所述论据片段提取模块进行训练，获得目标论据片段提取模块，其中，所述第二损失函数为：

7.根据权利要求6所述的论证提取以及关系识别方法，其特征在于，所述将各个所述论证片段对的论证片段对应的词嵌入特征表示以及实体路径信息表示输入至所述关系识别模块中进行关系识别，获得各个所述论证片段对的论证关系识别结果，包括步骤：

根据各个所述论证片段对的论证片段对应的词嵌入特征表示以及预设的词嵌入算法，获得各个所述论证片段对的词嵌入表示，其中，所述词嵌入算法为：

式中，为所述论证片段对的词嵌入表示，BERT（）为词嵌入函数，[CLS]为分类标志位，[SEP]为片段分隔标志位，/>、/>分别为所述论证片段对中的第/>个、第/>个论证片段对应的词嵌入特征表示；

根据各个所述论证片段对的词嵌入表示、实体路径信息表示以及预设的全局路径信息提取算法，获得全局路径信息表示，其中，所述全局路径信息提取算法为：

式中，为所述全局路径信息表示，k表示第k个论证片段对，/>为第三可学习参数矩阵，/>为第l个论证片段对的实体路径信息表示；

获得各个所述论证片段对中各个论证片段的命名实体数据，根据所述全局路径信息表示、各个所述论证片段对的命名实体数据以及预设的全局实体信息提取算法，获得各个所述论证片段对中的各个论证片段的全局实体信息表示，其中，所述命名实体数据包括若干个实体的向量表示，所述全局实体信息提取算法为：

式中，为第s个论证片段的全局实体信息表示，s为论证片段的索引，/>，为第四可学习参数矩阵，/>、/>分别为所述论证片段中第i个实体、第j个实体的向量表示；

将所述全局路径信息表示、各个所述论证片段对的词嵌入表示以及全局实体信息表示进行拼接，获得各个所述论证片段对的拼接向量，其中，所述拼接向量为：

式中，f为所述拼接向量，、/>分别为所述论证片段对中第/>个、第/>个论证片段的全局实体信息表示；

根据各个所述论证片段对的拼接向量以及预设的关系识别概率向量算法，获得各个所述论证片段对的关系识别概率向量，根据所述关系识别概率向量，获得关系识别概率向量最大的维度对应的关系信息，作为所述论证关系识别结果，其中，所述关系识别概率向量算法为：

8.一种论证提取以及关系识别装置，其特征在于，包括：

实体信息获取模块，用于获得事理图谱，所述事理图谱包括若干个事件节点，所述事件节点为事件簇，包括若干个实体；所述事理图谱包括事件节点之间连接的边关系，所述边关系用于表示连接的两个事件节点之间包含的实体是同义词或指向相同；利用事理图谱中存在有边关系的事件节点，构建若干个事件路径表示，其中，所述事件路径表示为：

9.一种计算机设备，其特征在于，包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的论证提取以及关系识别方法的步骤。

10.一种存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的论证提取以及关系识别方法的步骤。