CN113468288B

CN113468288B - 基于人工智能的文本课件的内容抽取方法及相关设备

Info

Publication number: CN113468288B
Application number: CN202110839260.8A
Authority: CN
Inventors: 王异秀
Original assignee: Ping An International Smart City Technology Co Ltd
Current assignee: Ping An International Smart City Technology Co Ltd
Priority date: 2021-07-23
Filing date: 2021-07-23
Publication date: 2024-04-16
Anticipated expiration: 2041-07-23
Also published as: CN113468288A

Abstract

本发明涉及人工智能，提供一种基于人工智能的文本课件的内容抽取方法及相关设备，在提取课件页面中的实体及实体的属性值后，搜索每个实体的最近邻实体，在实体与最近邻实体之间生成实体边，根据属性值计算每个实体边的边特征，从而得到实体网络结构图，利用图卷积神经网络基于预设线性约束对实体网络结构图进行预测，得到实体边的类别，通过设置线性约束能够有效的保证预测结果的准确性；在得到图卷积神经网络的目标层的各个节点的隐藏状态之后，对隐藏状态进行最大池化处理，最大池化可以将参数隐藏状态中的参数极大地缩小，减少了信息的冗余度，提高了全局嵌入表示的效率和文字描述的生成效率，进而提高了课件语义结构树的生成效率。

Description

基于人工智能的文本课件的内容抽取方法及相关设备

技术领域

本发明涉及人工智能技术领域，具体涉及一种基于人工智能的文本课件的内容抽取方法、装置、电子设备及存储介质。

背景技术

PPT课件是网络课程的重要组成部分，承载了网络课程中重要的知识点和教学逻辑脉络。如何有效地管理和处理这些课件也成为网络课程提供商的重要课题。从PPT课件中对知识内容进行合理的分析和归纳，能够有效地提高网络课程教学的效率。

发明人在实现本发明的过程中发现，由于PPT课件往往具有丰富的内容结构，传统的自动化处理方式只能利用文本检测技术(OCR)等提取PPT课件中的文字，并使用一些启发式规则将识别到的不同文字段落组合在一起，这样PPT课件的段落、标题等结构信息很容易丢失，使得最终解析结果不正确或者不完整。另外，PPT课件通常含有大量不规范的文本，如斜着的文字，竖着的文字，动画效果也会造成识别的失效。

发明内容

鉴于以上内容，有必要提出一种基于人工智能的文本课件的内容抽取方法、装置、电子设备及存储介质，将一份包括多个文本页面(例如，PPT页面)的课件作为一个整体进行处理，从中自动化的抽取语义信息，抽取的语义信息的准确度高。

本发明的第一方面提供一种基于人工智能的文本课件的内容抽取方法，所述方法包括：

获取文本课件中的多个课件页面，并提取每个所述课件页面中的多个实体；

提取每个所述实体的属性值；

对于每个所述课件页面，搜索每个所述实体的多个最近邻实体，在每个所述实体与每个所述最近邻实体之间生成实体边，并根据所述属性值计算每个所述实体边的边特征，得到每个所述课件页面的实体网络结构图；

调用预先训练的图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别；

获取所述图卷积神经网络的目标层的各个节点的隐藏状态，对所述隐藏状态进行最大池化，得到全局嵌入表示，根据所述全局嵌入表示生成文字描述；

根据每个所述实体结构图中所述实体边的类别及对应的所述文字描述生成课件语义结构树。

在一个可选的实施方式中，所述搜索每个所述实体的多个最近邻实体包括：

根据所述实体的属性值确定所述实体的位置坐标；

根据所述位置坐标确定多个搜索方向；

在每个所述搜索方向上搜索一个实体，作为所述搜索方向上的最近邻实体。

在一个可选的实施方式中，所述根据所述属性值计算每个所述实体边的边特征包括：

根据所述实体的属性值中的第一属性值及每个所述最近邻实体的属性值中的第一属性值计算距离边特征；

根据所述实体的属性值中的第二属性值及每个所述最近邻实体的属性值中的第二属性值计算内容边特征；

拼接所述距离边特征及对应的所述内容边特征得到所述实体边的边特征。

在一个可选的实施方式中，所述预设线性约束包括：

c(e，i)∈{0，1}，

其中，p(e，i)为实体边e为第i分类的概率，c(e，i)为选择实体边e的类别为第i类的指示变量，

是指每条实体边上必须有一个且只有一个类别，

是指每个节点最多只有一个父亲或文本合并目标。

在一个可选的实施方式中，所述实体边的类别包括如下中的一种：

实体边的两个节点之间是父亲-儿子关系；

实体边的两个节点之间是儿子-父亲关系；

实体边的两个节点之间是需要合并的文字段落；

实体边的两个节点之间无关系。

在一个可选的实施方式中，所述对所述隐藏状态进行最大池化，得到全局嵌入表示包括：

根据池化滤波器的大小对所述隐藏状态进行区块分割；

选择每个所述区块中的最大值作为特征值；

将所述特征值按照顺序进行拼接得到全局嵌入表示。

在一个可选的实施方式中，所述提取实体的属性值包括：

识别所述实体的类型；

根据预设实体类型属性字段表获取与所述类型对应的属性字段；

根据所述属性字段提取所述实体的属性值。

本发明的第二方面提供一种基于人工智能的文本课件的内容抽取装置，所述装置包括：

获取模块，用于获取文本课件中的多个课件页面，并提取每个所述课件页面中的多个实体；

提取模块，用于提取每个所述实体的属性值；

构建模块，用于对于每个所述课件页面，搜索每个所述实体的多个最近邻实体，在每个所述实体与每个所述最近邻实体之间生成实体边，并根据所述属性值计算每个所述实体边的边特征，得到每个所述课件页面的实体网络结构图；

预测模块，用于调用预先训练的图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别；

池化模块，用于获取所述图卷积神经网络的目标层的各个节点的隐藏状态，对所述隐藏状态进行最大池化，得到全局嵌入表示，根据所述全局嵌入表示生成文字描述；

生成模块，用于根据每个所述实体结构图中所述实体边的类别及对应的所述文字描述生成课件语义结构树。

本发明的第三方面提供一种电子设备，所述电子设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现所述基于人工智能的文本课件的内容抽取方法。

本发明的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现所述基于人工智能的文本课件的内容抽取方法。

综上所述，本发明所述的基于人工智能的文本课件的内容抽取方法、装置、电子设备及存储介质，在获取到文本课件中的多个课件页面之后，提取每个课件页面中的多个实体及每个实体的属性值，对于每个课件页面，搜索每个实体的多个最近邻实体，在每个实体与每个最近邻实体之间生成实体边，并根据所述属性值计算每个实体边的边特征，从而得到实体网络结构图，利用图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别，通过设置线性约束，能够有效的保证预测结果的准确性；在得到图卷积神经网络的目标层的各个节点的隐藏状态之后，对所述隐藏状态进行最大池化处理，最大池化可以将参数隐藏状态中的参数极大地缩小，从而减少信息的冗余度，提高全局嵌入表示的效率，提高文字描述的生成效率，进而提高了课件语义结构树的生成效率。

附图说明

图1是本发明实施例一提供的基于人工智能的文本课件的内容抽取方法的流程图。

图2是本发明实施例二提供的基于人工智能的文本课件的内容抽取装置的结构图。

图3是本发明实施例三提供的电子设备的结构示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本发明的实施例及实施例中的特征可以相互组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述在一个可选的实施方式中实施例的目的，不是旨在于限制本发明。

本发明实施例提供的基于人工智能的文本课件的内容抽取方法由电子设备执行，相应地，基于人工智能的文本课件的内容抽取装置运行于电子设备中。

实施例一

图1是本发明实施例一提供的基于人工智能的文本课件的内容抽取方法的流程图。本申请实施例可以基于人工智能技术对文本课件的内容进行抽取。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

所述基于人工智能的文本课件的内容抽取方法具体包括以下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些可以省略。

S11，获取文本课件中的多个课件页面，并提取每个课件页面中的多个实体。

其中，文本课件包括一组按顺序排列的课件页面，课件页面是文本课件的组成单元，每个课件页面中包含多个实体。

可以采用实体抽取模型抽取每个课件页面中的多个实体，实体抽取模型为现有模型且具体抽取实体的过程不详细描述。

所述每个课件页面中的多个实体可以包括，但不限于：文字段落、图片、音频、超链接。文字段落实体为水平的文本段落，通常由文本识别工具或PPT解析工具获得，每个文本段落可能并不包含完整的文本，完整的文本需要解析方法通过合并多个文字段落形成。图片实体为嵌入到页面中的图片。音频实体为嵌入到页面中的音频。超链接实体为特殊的文字段落，除了基本的文字段落属性外，还具有一个链接到的网络地址。图片实体、音频实体及超链接实体均可以通过PPT解析工具获得。

S12，提取每个实体的属性值。

不同的实体具有不同的属性值。

在一个可选的实施方式中，所述提取实体的属性值包括：

识别实体的类型；

根据所述属性字段提取所述实体的属性值。

计算机设备中预先存储有实体类型属性字段表，实体类型属性字段表中存储有实体类型与属性字段之间的对应关系，不同类型的实体对应不同的属性字段，属性字段用于指示计算机设备提取实体的属性值，避免漏掉实体的属性信息，使得实体的属性值的提取更为完全。

对于文字段落实体而言，提取文字段落实体的属性值包括文本内容，文字段落的水平坐标、垂直坐标，文字段落的长度、宽度，文字大小，文字颜色，文字字体类型等。

对于图片实体而言，提取图片实体的属性值包括图片中的文本内容，图片的水平坐标、垂直坐标，图片的长度、宽度，图片大小，图片类型，文字大小，文字颜色，文字字体类型等。

对于音频图片而言，提取音频图片的属性值包括根据音频识别到的文本内容，音频的水平坐标、垂直坐标，音频格式，音频长度等。

S13，对于每个课件页面，搜索每个实体的多个最近邻实体，在每个实体与每个最近邻实体之间生成实体边，并根据所述属性值计算每个实体边的边特征，得到实体网络结构图。

每个课件页面对应生成一个实体网络结构图，多个课件页面对应生成多个实体网络结构图，不同的课件页面生成不同的实体网络结构图。

在一个可选的实施方式中，所述搜索每个实体的多个最近邻实体包括：

根据所述实体的属性值确定所述实体的位置坐标；

根据所述位置坐标确定多个搜索方向；

在每个搜索方向上搜索一个实体，作为所述搜索方向上的最近邻实体。

每个实体的属性值中均包括水平坐标和垂直坐标，因而根据水平坐标及垂直坐标可以确定实体的位置坐标。根据所述位置坐标中的水平坐标确定向左和向右两条搜索方向，根据所述位置坐标的垂直坐标可以确定向上和向下两条搜索方向。

从所述实体开始，沿着向左方向上进行搜索，将首次搜索到的实体作为向左方向上的最近邻实体并停止搜索；沿着向右方向上进行搜索，将首次搜索到的实体作为向右方向上的最近邻实体并停止搜索；沿着向上方向上进行搜索，将首次搜索到的实体作为向左方向上的最近邻实体并停止搜索；沿着向下方向上进行搜索，将首次搜索到的实体作为向下方向上的最近邻实体并停止搜索。

在一个可选的实施方式中，所述根据所述属性值计算每个实体边的边特征包括：

根据所述实体的属性值中的第一属性值及每个最近邻实体的属性值中的第一属性值计算距离边特征；

根据所述实体的属性值中的第二属性值及每个最近邻实体的属性值中的第二属性值计算内容边特征；

可以将实体的属性值中的水平坐标和垂直坐标作为第一属性值，将实体的属性值中的文本内容、文字大小、文字颜色、文字字体类型作为第二属性值。

如此，距离特征可以包括：节点之间的水平距离，节点之间的垂直距离，节点之间的重叠度，节点之间的长度比例，节点之间的宽度比例，节点之间连线的角度。内容边特征可以包括：文本内容之间的相似度，文字颜色之间的差距，文字大小之间的差距，文字间距差距。

示例性的，假设距离边特征为(X1，X2，X3)，对应的内容边特征为(Y1，Y2，Y3)，则对距离边特征及对应的内容边特征进行拼接得到的实体边的边特征为(X1，X2，X3，Y1，Y2，Y3)。

S14，调用预先训练的图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别。

可以使用人工标注的课件页面作为训练数据，以预设四个类别为标签，训练图卷积神经网络，训练完成的图卷积神经网络用来预测实体结构图中每个实体边属于四个类别的概率。即，通过图卷积神经网络进行四分类预测。

其中，四个类别包括：

1)实体边的两个节点之间是父亲-儿子关系；

2)实体边的两个节点之间是儿子-父亲关系；

3)实体边的两个节点之间是需要合并的文字段落；

4)实体边的两个节点之间无关系。

其中，预设线性约束是指为不同实体边上的分类设置约束条件，即约束同一节点最多只能存在一个父亲/或文本合并节点。

预设线性约束包括：

c(e，i)∈{0，1}，

其中，p(e，i)为实体边e为第i分类的概率，c(e，i)为选择实体边e的类别为第i类的指示变量。

是指每条实体边上必须有一个且只有一个类别。

是指每个节点最多只有一个父亲或文本合并目标。

S15，获取所述图卷积神经网络的目标层的各个节点的隐藏状态，对所述隐藏状态进行最大池化，得到全局嵌入表示，根据所述全局嵌入表示生成文字描述。

最大池化层后面桥接有一层循环神经网络RNN的decoder层，在得到全局嵌入表示之后，调用预设激活函数对所述全局嵌入表示进行计算并通过RNN的decoder层生成页面的文字描述。

其中，目标层是预先指定的层，通常为图卷积神经网络的倒数第二层，即位于最大池化层之前的一个网络层。

根据池化滤波器的大小对所述隐藏状态进行区块分割；

选择每个区块中的最大值作为特征值；

将所述特征值按照顺序进行拼接得到全局嵌入表示。

示例性的，假设第1个区块中的最大值为T1，第2个区块中的最大值为T2，第3个区块中的最大值为T4，第4个区块中的最大值为T4，则全局嵌入表示为(T1，T2，T3，T4)。

该可选的实施例中，通过对隐藏状态进行分割，得到多个区块，然后将每个区块中的最大值作为该区块的特征值，相当于对隐藏状态进行了最大池化。最大池化可以将参数隐藏状态中的参数极大地缩小，从而减少信息的冗余度，提高全局嵌入表示。

S16，根据所述实体结构图中每条实体边的类别及所述文字描述生成课件语义结构树。

生成的课件语义结构树包含两部分，其中，一部分为页面概括，另一部分为页面结构。页面概括为文字描述概括该课件页面的整体内容，例如，一个课件页面的标题可以作为该课件页面的内容概括。页面结构为一个页面下的所有实体组织成的多颗语义树(森林)，并且将前置输入的所有文字段落合并成一个或多个语义连贯的多行文本段落。例如，课件页面下的标题可以根据标题的父子关系组织成森林树的形式。

本发明实施例所述的基于人工智能的文本课件的内容抽取方法，在获取到文本课件中的多个课件页面之后，提取每个课件页面中的多个实体及每个实体的属性值，对于每个课件页面，搜索每个实体的多个最近邻实体，在每个实体与每个最近邻实体之间生成实体边，并根据所述属性值计算每个实体边的边特征，从而得到实体网络结构图，利用图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别，获取所述图卷积神经网络的目标层的各个节点的隐藏状态，对所述隐藏状态进行最大池化，得到全局嵌入表示，根据所述全局嵌入表示生成文字描述，最后根据所述实体结构图中每条实体边的类别及所述文字描述生成课件语义结构树。

本发明能够将一份包括多个文本页面的课件作为一个整体进行处理，从中自动化的抽取完整可读性、可处理性、结构化的语义信息，抽取的语义信息的准确度高。此外，本发明在使用图卷积神经网络进行分类预测时，设置了线性约束，能够有效的保证预测结果的准确性。在得到图卷积神经网络的目标层的各个节点的隐藏状态之后，对所述隐藏状态进行最大池化处理，最大池化可以将参数隐藏状态中的参数极大地缩小，从而减少信息的冗余度，提高全局嵌入表示的效率，从而提高文字描述的生成效率，进而提高了课件语义结构树的生成效率。

实施例二

在一些实施例中，所述基于人工智能的文本课件的内容抽取装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的文本课件的内容抽取装置20中的各个程序段的计算机程序可以存储于电子设备的存储器中，并由至少一个处理器所执行，以执行(详见图1描述)文本课件的内容抽取的功能。

本实施例中，所述基于人工智能的文本课件的内容抽取装置20根据其所执行的功能，可以被划分为多个功能模块。所述功能模块可以包括：获取模块201、提取模块202、构建模块203、预测模块204、池化模块205及生成模块206。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段，其存储在存储器中。在本实施例中，关于各模块的功能将在后续的实施例中详述。

所述获取模块201，由于获取文本课件中的多个课件页面，并提取每个课件页面中的多个实体。

所述提取模块202，由于提取每个实体的属性值。

不同的实体具有不同的属性值。

在一个可选的实施方式中，所述提取模块202提取实体的属性值包括：

识别实体的类型；

根据所述属性字段提取所述实体的属性值。

所述构建模块203，用于对于每个课件页面，搜索每个实体的多个最近邻实体，在每个实体与每个最近邻实体之间生成实体边，并根据所述属性值计算每个实体边的边特征，得到实体网络结构图。

在一个可选的实施方式中，所述构建模块203搜索每个实体的多个最近邻实体包括：

根据所述实体的属性值确定所述实体的位置坐标；

根据所述位置坐标确定多个搜索方向；

在一个可选的实施方式中，所述构建模块203根据所述属性值计算每个实体边的边特征包括：

所述预测模块204，用于调用预先训练的图卷积神经网络(GCN)基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别。

其中，四个类别包括：

1)实体边的两个节点之间是父亲-儿子关系；

2)实体边的两个节点之间是儿子-父亲关系；

3)实体边的两个节点之间是需要合并的文字段落；

4)实体边的两个节点之间无关系。

预设线性约束包括：

c(e，i)∈{0，1}，

是指每条实体边上必须有一个且只有一个类别。

是指每个节点最多只有一个父亲或文本合并目标。

所述池化模块205，用于获取所述图卷积神经网络的目标层的各个节点的隐藏状态，对所述隐藏状态进行最大池化，得到全局嵌入表示，根据所述全局嵌入表示生成文字描述。

在一个可选的实施方式中，所述池化模块205对所述隐藏状态进行最大池化，得到全局嵌入表示包括：

根据池化滤波器的大小对所述隐藏状态进行区块分割；

选择每个区块中的最大值作为特征值；

将所述特征值按照顺序进行拼接得到全局嵌入表示。

所述生成模块206，用于根据所述实体结构图中每条实体边的类别及所述文字描述生成课件语义结构树。

本发明实施例所述的基于人工智能的文本课件的内容抽取装置，在获取到文本课件中的多个课件页面之后，提取每个课件页面中的多个实体及每个实体的属性值，对于每个课件页面，搜索每个实体的多个最近邻实体，在每个实体与每个最近邻实体之间生成实体边，并根据所述属性值计算每个实体边的边特征，从而得到实体网络结构图，利用图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别，获取所述图卷积神经网络的目标层的各个节点的隐藏状态，对所述隐藏状态进行最大池化，得到全局嵌入表示，根据所述全局嵌入表示生成文字描述，最后根据所述实体结构图中每条实体边的类别及所述文字描述生成课件语义结构树。

实施例三

本实施例提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述基于人工智能的文本课件的内容抽取方法实施例中的步骤，例如图1所示的S11-S16：

S11，获取文本课件中的多个课件页面，并提取每个课件页面中的多个实体；

S12，提取每个实体的属性值；

S13，对于每个课件页面，搜索每个实体的多个最近邻实体，在每个实体与每个最近邻实体之间生成实体边，并根据所述属性值计算每个实体边的边特征，得到实体网络结构图；

S14，调用预先训练的图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别；

S15，获取所述图卷积神经网络的目标层的各个节点的隐藏状态，对所述隐藏状态进行最大池化，得到全局嵌入表示，根据所述全局嵌入表示生成文字描述；

或者，该计算机程序被处理器执行时实现上述装置实施例中各模块/单元的功能，例如图2中的模块201-206：

所述获取模块201，用于获取文本课件中的多个课件页面，并提取每个课件页面中的多个实体；

所述提取模块202，用于提取每个实体的属性值；

所述构建模块203，用于对于每个课件页面，搜索每个实体的多个最近邻实体，在每个实体与每个最近邻实体之间生成实体边，并根据所述属性值计算每个实体边的边特征，得到实体网络结构图；

所述预测模块204，用于调用预先训练的图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别；

所述池化模块205，用于获取所述图卷积神经网络的目标层的各个节点的隐藏状态，对所述隐藏状态进行最大池化，得到全局嵌入表示，根据所述全局嵌入表示生成文字描述；

实施例四

参阅图3所示，为本发明实施例三提供的电子设备的结构示意图。在本发明较佳实施例中，所述电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。

本领域技术人员应该了解，图3示出的电子设备的结构并不构成本发明实施例的限定，既可以是总线型结构，也可以是星形结构，所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置。

在一些实施例中，所述电子设备3是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备，所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、数码相机等。

需要说明的是，所述电子设备3仅为举例，其他现有的或今后可能出现的电子产品如可适应于本发明，也应包含在本发明的保护范围以内，并以引用方式包含于此。

在一些实施例中，所述存储器31中存储有计算机程序，所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的文本课件的内容抽取方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory，EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory，OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

进一步地，所述计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

在一些实施例中，所述至少一个处理器32是所述电子设备3的控制核心(ControlUnit)，利用各种接口和线路连接整个电子设备3的各个部件，通过运行或执行存储在所述存储器31内的程序或者模块，以及调用存储在所述存储器31内的数据，以执行电子设备3的各种功能和处理数据。例如，所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的基于人工智能的文本课件的内容抽取方法的全部或者部分步骤；或者实现基于人工智能的文本课件的内容抽取装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(CentralProcessing unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。

在一些实施例中，所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。

尽管未示出，所述电子设备3还可以包括给各个部件供电的电源(比如电池)，优选的，电源可以通过电源管理装置与所述至少一个处理器32逻辑相连，从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等，在此不再赘述。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，既可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或，单数不排除复数。说明书中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种基于人工智能的文本课件的内容抽取方法，其特征在于，所述方法包括：

提取每个所述实体的属性值；

对于每个所述课件页面，搜索每个所述实体的多个最近邻实体，在每个所述实体与每个所述最近邻实体之间生成实体边，其中，所述搜索每个所述实体的多个最近邻实体包括：根据所述实体的属性值确定所述实体的位置坐标；根据所述位置坐标确定多个搜索方向；在每个所述搜索方向上搜索一个实体，作为所述搜索方向上的最近邻实体，并根据所述属性值计算每个所述实体边的边特征，得到每个所述课件页面的实体网络结构图，其中，所述根据所述属性值计算每个所述实体边的边特征包括：根据所述实体的属性值中的第一属性值及每个所述最近邻实体的属性值中的第一属性值计算距离边特征；根据所述实体的属性值中的第二属性值及每个所述最近邻实体的属性值中的第二属性值计算内容边特征；拼接所述距离边特征及对应的所述内容边特征得到所述实体边的边特征；

调用预先训练的图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别，其中，所述预设线性约束包括：

c(e,i)∈{0,1}，

其中，p(e,i)为实体边e为第i分类的概率，c(e,i)为选择实体边e的类别为第i类的指示变量，

是指每条实体边上必须有一个且只有一个类别，

是指每个节点最多只有一个父亲或文本合并目标；

获取所述图卷积神经网络的目标层的各个节点的隐藏状态，对所述隐藏状态进行最大池化，得到全局嵌入表示，根据所述全局嵌入表示生成文字描述，其中，所述对所述隐藏状态进行最大池化包括：根据池化滤波器的大小对所述隐藏状态进行区块分割；选择每个所述区块中的最大值作为特征值；将所述特征值按照顺序进行拼接得到全局嵌入表示；

根据每个所述实体网络结构图中所述实体边的类别及对应的所述文字描述生成课件语义结构树。

2.如权利要求1所述的基于人工智能的文本课件的内容抽取方法，其特征在于，所述实体边的类别包括如下中的一种：

实体边的两个节点之间是父亲-儿子关系；

实体边的两个节点之间是儿子-父亲关系；

实体边的两个节点之间是需要合并的文字段落；

实体边的两个节点之间无关系。

3.如权利要求1至2中任意一项所述的基于人工智能的文本课件的内容抽取方法，其特征在于，所述提取实体的属性值包括：

识别所述实体的类型；

根据所述属性字段提取所述实体的属性值。

4.一种基于人工智能的文本课件的内容抽取装置，其特征在于，所述装置包括：

提取模块，用于提取每个所述实体的属性值；

构建模块，用于对于每个所述课件页面，搜索每个所述实体的多个最近邻实体，在每个所述实体与每个所述最近邻实体之间生成实体边，其中，所述搜索每个所述实体的多个最近邻实体包括：根据所述实体的属性值确定所述实体的位置坐标；根据所述位置坐标确定多个搜索方向；在每个所述搜索方向上搜索一个实体，作为所述搜索方向上的最近邻实体，并根据所述属性值计算每个所述实体边的边特征，得到每个所述课件页面的实体网络结构图，其中，所述根据所述属性值计算每个所述实体边的边特征包括：根据所述实体的属性值中的第一属性值及每个所述最近邻实体的属性值中的第一属性值计算距离边特征；根据所述实体的属性值中的第二属性值及每个所述最近邻实体的属性值中的第二属性值计算内容边特征；拼接所述距离边特征及对应的所述内容边特征得到所述实体边的边特征；

预测模块，用于调用预先训练的图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测，得到每条实体边的分类概率，并根据所述分类概率确定所述实体边的类别，其中，所述预设线性约束包括：

c(e,i)∈{0,1}，

是指每条实体边上必须有一个且只有一个类别，

是指每个节点最多只有一个父亲或文本合并目标；

池化模块，用于获取所述图卷积神经网络的目标层的各个节点的隐藏状态，对所述隐藏状态进行最大池化，得到全局嵌入表示，根据所述全局嵌入表示生成文字描述，其中，所述对所述隐藏状态进行最大池化包括：根据池化滤波器的大小对所述隐藏状态进行区块分割；选择每个所述区块中的最大值作为特征值；将所述特征值按照顺序进行拼接得到全局嵌入表示；

生成模块，用于根据每个所述实体网络结构图中所述实体边的类别及对应的所述文字描述生成课件语义结构树。

5.一种电子设备，其特征在于，所述电子设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至3中任意一项所述基于人工智能的文本课件的内容抽取方法。

6.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至3中任意一项所述基于人工智能的文本课件的内容抽取方法。