CN117132997B

CN117132997B - 一种基于多头注意力机制和知识图谱的手写表格识别方法

Info

Publication number: CN117132997B
Application number: CN202311398545.8A
Authority: CN
Inventors: 李帆; 童超; 严稽精; 陈柯; 华桦; 梅宇聪; 杨柳; 胡岸; 李阳林
Original assignee: Nanchang Kechen Electric Power Test And Research Co ltd; State Grid Jiangxi Electric Power Co ltd; State Grid Corp of China SGCC; Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Current assignee: Nanchang Kechen Electric Power Test And Research Co ltd; State Grid Jiangxi Electric Power Co ltd; State Grid Corp of China SGCC; Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Priority date: 2023-10-26
Filing date: 2023-10-26
Publication date: 2024-03-12
Anticipated expiration: 2043-10-26
Also published as: CN117132997A

Abstract

本发明公开了一种基于多头注意力机制和知识图谱的手写表格识别方法，该方法对输入的手写表格图像进行预处理；然后进行特征提取得到手写表格图像特征图；通过CRNN模型对手写表格图像特征图进行序列标注，将手写表格图像特征图上的每个位置上的文字或标签视为一个序列标注任务；通过解码算法将序列标注得到的序列标签转化为识别结果，最后通过电力知识图谱模型将识别结果进行逻辑梳理，并将识别到的内容按照表格的结构进行聚合、整理和转换，得到最终所需表格模板的规范表格数据。本发明结合了CRNN网络、多头自注意力机制和知识图谱的优势，提高了手写表格识别和生成的准确性和效果。

Description

一种基于多头注意力机制和知识图谱的手写表格识别方法

技术领域

本发明涉及运维检修图像识别技术领域，具体为一种基于多头注意力机制和知识图谱的手写表格识别方法。

背景技术

随着智能电网的发展，采用数字化减负基层以提升基层工作效率是当今电网发展的必由之路。然而，电网大部分运维检修的数据都储存在纸质报告中，这些数据在设备智能分析方面起着巨大作用；随着数字化时代的到来，大量的结构化数据以表格的形式存在，导致手写表格的自动识别和生成也成为了研究领域中的一个重要方向，其中手写表格数据更是存在识别困难，无法准确提取知识逻辑等问题。

所以，如何设计一种基于多头注意力机制和知识图谱的手写表格识别方法，成为我们当前需要解决的问题。

发明内容

针对现有技术的不足，本发明提供了一种基于多头注意力机制和知识图谱的手写表格识别方法，其目的在于能够有效建立表格的逻辑关系，可以有效帮助模型更好地理解和识别手写文字，并提高手写文字识别系统的准确性和鲁棒性。

为实现上述目的，本发明提供如下技术方案：一种基于多头注意力机制和知识图谱的手写表格识别方法，包括如下步骤：

步骤S1：对输入的手写表格图像进行预处理；

步骤S2：使用带多头注意力机制的特征提取模型对预处理后的手写表格图像进行特征提取，得到手写表格图像特征图；

步骤S3：通过CRNN模型对手写表格图像特征图进行序列标注，将手写表格图像特征图上的每个位置上的文字或标签视为一个序列标注任务；

步骤S4：使用电力文本对Roberta预训练语言模型进行预训练，通过数据预处理将电力文本转换成电力文本序列，然后输入到Roberta预训练语言模型的电力文本序列输入层，通过词嵌入层，句嵌入层和位置嵌入层中进行提取，将输入的电力文本序列转化为词向量、句向量以及位置向量，利用图自注意力编码器（Transformer-Encoder）中的多头自注意力机制和全连接层对输入的电力文本序列进行建模，从电力文本序列中选择出和当前任务目标更契合的有效信息；将巡检的电力文本序列以句子为单位输入进已预训练的Roberta预训练语言模型得到词向量，再利用BiLSTM层学习巡检的电力文本序列的上下文特征，从而实现全局文本信息抽取，接着进行知识加工和知识融合，最后将构建的知识图谱用Neo4j储存与表示，形成电力知识图谱模型；

步骤S5：通过解码算法将序列标注得到的序列标签转化为识别结果，最后通过电力知识图谱模型将识别结果进行逻辑梳理，得到手写表格图像的识别文本；根据识别文本的节点和边的信息，识别其中表头、行标、列标和单元格中的内容，将识别到的内容按照表格的结构进行聚合、整理和转换，得到最终所需表格模板的规范表格数据。

进一步优选，所述Roberta预训练语言模型依次由一个电力文本序列输入层、一个嵌入层、多个图自注意力编码器（Transformer-Encoder）以及一个输出层组成，所述电力文本序列输入层由词嵌入层、句嵌入层和位置嵌入层组成，图自注意力编码器依次由多头自注意力机制、第一归一化层、全连接层、第二归一化层组成，利用Roberta预训练语言模型中的图自注意力编码器（Transformer-Encoder）对输入的电力文本序列进行编码，使用多头自注意力机制对编码后的电力文本序列训练得到对应的向量。

进一步优选，对于输入的电力文本序列，分别为第1,2，3，…，n个词，n为词的个数，将每个词采用独热向量(one-hot)表示，设维度为k，则输入的电力文本序列对应的嵌入矩阵为，Roberta预训练语言模型中图自注意力编码器的多头注意力机制的输入为嵌入矩阵；自注意力表示如下：

；

式中，为查询矩阵；为键矩阵；为值矩阵，为查询矩阵的映射权重参数，为键矩阵的映射权重参数，为值矩阵的映射权重参数；是向量的维度，为Q、K的列数；softmax为归一化函数；为缩放因子，表示自注意力, 为键矩阵的转置；

使用图自注意力编码器（Transformer-Encoder）中多头注意力机制拼接各自注意力得到多头自注意力输出。

进一步优选，所述BiLSTM层包括前向LSTM单元和后向LSTM单元，Roberta预训练语言模型将电力文本序列转换为嵌入向量，一个句向量为，其中是对应于经过Roberta预训练语言模型处理后的句向量中第m个词的D维词向量，η表示给句向量的长度；对于第m个词，前向LSTM单元过结合第m个词的上下文信息进行编码，标记为编码信息，同样地，后向LSTM单元通过结合第m个词上下文信息进行编码，标记为，最后，将和连接起来，代表第m个词的编码信息，表示为。

进一步优选，所述步骤S2利用多头注意力机制确保关注到手写表格图像不同位置的重要特征；对手写表格图像中的文字内容和结构信息进行建模和学习；根据手写表格图像中的结构信息和文字内容，计算手写表格图像节点之间的注意力权重，用于手写表格图像数据的提取和整合，最终得到手写表格图像特征图。

进一步优选，特征提取模型包括若干个时序卷积子网络和多头注意力机制，每个时序卷积子网络的每个卷积层都采用多头注意力机制理解特征向量之间的相互关系。

进一步优选，所述预处理包括降噪处理、二值化处理和倾斜矫正处理。

进一步优选，所述降噪处理是：采用高斯滤波的方法对输入的手写表格图像进行降噪处理。

进一步优选，所述倾斜矫正处理采用霍夫变换进行，首先识别输入的手写表格图像中的几何图形，从中检测到对应的直线，然后通过计算直线的倾斜角度判断几何图形的倾斜度数，最后进行旋转校正。

与现有的技术相比，本发明具备以下有益效果：本发明结合了CRNN网络、多头注意力机制和知识图谱的优势，可以提高特征表示能力、增强对结构和语义信息的理解、更好地建模上下文关系，并具有更强的泛化能力。本发明通过知识图谱模型将识别结果进行逻辑梳理，得到手写表格图像的识别文本；根据识别文本的节点和边的信息，识别其中表头、行标、列标和单元格中的内容，将识别到的内容按照表格的结构进行聚合、整理和转换，得到最终所需表格模板的规范表格数据；这些优点有助于提升手写表格识别的准确性、鲁棒性和应用范围。

附图说明

图1为本发明的方法流程图。

图2为本发明的电力知识图谱模型构建过程图。

图3为本发明的Roberta预训练语言模型构架图。

具体实施方式

如图1所示，本发明提供技术方案：一种基于多头注意力机制和知识图谱的手写表格识别方法，包括如下步骤：

步骤S1：对输入的手写表格图像进行预处理。为了优化图像，以使得后续的处理步骤更加准确、高效和可靠，首先需要对输入的手写表格图像进行预处理，包括对输入的手写表格图像进行降噪处理、二值化处理和倾斜矫正处理。

降噪处理：先采用高斯滤波的方法对输入的手写表格图像进行降噪处理（高斯滤波是一种线性的平滑滤波，它将频域处理和时域处理相结合），对输入的手写表格图像进行平均加权计算，使得手写表格图像上每一个像素点都是由它本身和相邻其他像素点值计算得到，从而实现将噪声信息过滤掉，对输入手写表格图像起到一个平滑作用。高斯函数是单值函数，它在所有的方向上都是单调递减的，其中心点像素不会受到距离中心点较远处像素过大的影响，从而能保证中心点和边缘处的特性；并且，二维高斯函数是旋转对称的，它在各个方向上的平滑程度都是相同的，因此使用高斯滤波能有效消除输入的手写表格图像中的噪声影响。

二值化处理：在对图像进行数字化处理的过程中，二值化处理是不可或缺的步骤，它将灰度图像转化为二值图像，能显著减少图像中的干扰信息；采用多阈值二值化方法，将手写表格图像转换为二值图像。

倾斜矫正处理：因手写表格图像为纸质数据，在拍摄时难免存在倾斜现象，会对后期表格处理造成干扰，尤其对表格中的文字不能分割成单个字符时，会降低识别的准确率，因此对倾斜的图像进行校正，会对识别准确率有很大程度的提高。输入手写表格图像进行二值化处理后，对倾斜手写表格图像校正的关键问题在于要准确找到它的倾斜角度，本发明采用霍夫变换，其基本实现原理是：首先识别输入的手写表格图像中的几何图形，从中检测到对应的直线，然后通过计算直线的倾斜角度判断几何图形的倾斜度数，最后进行旋转校正；而手写表格图像的框线是横平竖直的，所以使用霍夫变换对手写表格图像进行倾斜校正，能获得一个很好的识别结果。

平面直角坐标系中的一条直线对应霍夫空间中的一个点；同理，霍夫空间中的一条直线映射到平面为一个点坐标。将平面直角坐标系转换为极坐标系；极坐标系与平面直角坐标系是一样的，极坐标系上的点对应霍夫空间的线；由此，使用霍夫变换检测出手写表格图像中的所有直线，对每条直线计算得出它们的倾斜角度，之后使用平均倾斜角度对表格图像进行旋转校正。

本发明利用多头注意力机制确保关注到手写表格图像不同位置的重要特征；对手写表格图像中的文字内容和结构信息进行建模和学习；根据手写表格图像中的结构信息和文字内容，计算手写表格图像节点之间的注意力权重，用于手写表格图像数据的提取和整合，最终得到手写表格图像特征图。

为了实现更全面、准确的特征学习，对预处理后的手写表格图像进行特征提取采用的特征提取模型包括若干个时序卷积子网络和多头注意力机制。时序卷积子网络捕获局部特征，而多头注意力机制则能够捕获全局依赖性，将二者的结合使得模型能够既关注到局部细节又能够捕获全局信息，从而提高了特征提取模型在处理时序数据时的性能和表现力。

为了有效地整合时序卷积子网络和多头注意力机制，可以将手写表格图像特征经过卷积层和批量归一化层进行处理，卷积层是用于处理图像数据的神经网络层，有助于捕捉图像中的局部特征，对于处理手写表格图像非常有用，批量归一化层是一种正则化技术，它有助于特征提取模型的稳定性和训练速度，通常，在卷积层后添加批量归一化层；添加卷积层和批量归一化层可以提高特征提取模型性能和训练稳定性，有助于更好地提取图像特征和提高特征提取模型的泛化能力。

对预处理后的手写表格图像进行特征提取按照以下步骤进行：首先，将预处理后的手写表格图像特征经过卷积层和批量归一化层进行处理，随后将处理后的手写表格图像特征转化为一系列的特征向量，接下来将这些特征向量送入多头注意力机制，多头注意力机制可以帮助特征提取模型理解特征向量之间的相互关系，通过学习这些相互关系，多头注意力机制能够生成更具表达能力的特征表示。通过整合时序卷积子网络和多头注意力机制的过程，可以提高手写表格图像识别的性能。

多头注意力机制（Multi-head Attention）是一种用于增强深度学习模型记忆能力和更好捕捉输入之间关联信息的机制，它最常用于自然语言处理领域，特别是在机器翻译任务中的Transformer模型中，在传统的注意力机制中，通过计算查询（query）和键（key）之间的相似度，然后将相似度作为值（value）进行加权求和，以得到注意力表示，而多头注意力机制则通过引入多个注意力头（attention head）来拓展注意力表示的能力。

手写表格图像通常包含多个文本区域和结构信息，因此可以使用多头注意力机制来聚焦并提取这些信息；多头注意力机制使用自注意力机制来计算手写表格图像的每个特征与其他特征之间的关联性，并将不同的特征表示加权融合，多头注意力机制其实就是将原始的输入序列进行多组的自注意力处理过程；然后再将每一组自注意力的结果拼接起来进行一次线性变换得到最终的输出结果，其计算公式为：

（1）；

（2）；

（3）；

（4）；

（5）；

式中，为输入向量；表示第i个注意力头的查询矩阵，表示第i个注意力头的键矩阵、表示第i个注意力头的值矩阵；为查询矩阵的映射权重参数，为键矩阵的映射权重参数，为值矩阵的映射权重参数，将输入向量X映射至d维的输出，表示拼接操作，为缩放因子；为第i个注意力头的计算结果，h为注意力头数量，为线性变换参数矩阵，为多头注意力机制计算结果；为的转置。

第e个时序卷积子网络第f个卷积层的卷积操作可以表示为：

（6）；

式中，和分别表示第e个时序卷积子网络的卷积核权重和偏置项；是激活函数；∗表示卷积操作；表示第e个时序卷积子网络第f个卷积层的输出。

将作为计算查询矩阵、键矩阵、值矩阵的输入：

（7）；

（8）；

（9）；

式中，为第e个时序卷积子网络第f个卷积层的查询矩阵；为第e个时序卷积子网络查询矩阵的映射权重参数；为第e个时序卷积子网络第f个卷积层的键矩阵；为第e个时序卷积子网络键矩阵的映射权重参数；为第e个时序卷积子网络第f个卷积层的值矩阵；为第e个时序卷积子网络值矩阵的映射权重参数。

第e个时序卷积子网络第f个卷积层第i个注意力头的查询矩阵、键矩阵、值矩阵计算方式如下：

（10）；

（11）；

（12）；

式中，为第e个时序卷积子网络第f个卷积层第i个注意力头的查询矩阵；为第e个时序卷积子网络第f个卷积层第i个注意力头的键矩阵；为第e个时序卷积子网络第f个卷积层第i个注意力头的值矩阵；为第e个时序卷积子网络第i个注意力头查询矩阵的映射权重参数；为第e个时序卷积子网络第i个注意力头键矩阵的映射权重参数；为第e个时序卷积子网络第i个注意力头值矩阵的映射权重参数。

第e个时序卷积子网络第f个卷积层第i个注意力头的注意力输出为，如下式所示：

（13）；

式中，为的转置。

最后将h个注意力头的输出连接起来，并进行线性变换，以获得最终第e个时序卷积子网络第f个卷积层的多头注意力输出，如下式所示：

（14）；

式中，为第e个时序卷积子网络第f个卷积层第1个注意力头的注意力输出，为第e个时序卷积子网络第f个卷积层第h个注意力头的注意力输出，为第e个时序卷积子网络的线性变换参数矩阵。

令为第e个时序卷积子网络的多头注意力输出，为第e个时序卷积子网络的输出，则：

（15）；

式中，和分别表示第e个时序卷积子网络的卷积核权重和偏置项。

将三个时序卷积子网络输出结果进行融合，得到一个融合特征向量：

（16）；

式中，表示融合特征向量，表示第1个时序卷积子网络的输出，表示第2 个时序卷积子网络的输出，表示第3个时序卷积子网络的输出。

步骤S3：通过CRNN模型对手写表格图像特征图进行序列标注，将手写表格图像特征图上的每个位置上的文字或标签视为一个序列标注任务。CRNN模型包括12层网络，且从上往下进行，每一层网络的输入为上一层网络的输出，输入层大小为96×96×1，使用32个3×3的卷积核对输入的手写表格图像特征图进行卷积，然后进行大小为2×2的池化，手写数字识别的网络结构与汉字识别的网络结构相比较为简单，设置输入层大小为28×28×1，使用32个4×4的卷积核对输入的手写表格图像特征图进行5层网络的卷积即可。

步骤S4、构建电力知识图谱模型：参照图2，使用电力文本对Roberta预训练语言模型进行预训练，通过数据预处理将电力文本转换成电力文本序列，然后输入到Roberta预训练语言模型的电力文本序列输入层，通过词嵌入层，句嵌入层和位置嵌入层中进行提取，将输入的电力文本序列转化为词向量、句向量以及位置向量，利用图自注意力编码器（Transformer-Encoder）中的多头自注意力机制和全连接层对输入的电力文本序列进行建模，从电力文本序列中选择出和当前任务目标更契合的有效信息；将巡检的电力文本序列以句子为单位输入进已预训练的Roberta预训练语言模型得到词向量，再利用BiLSTM层学习巡检的电力文本序列的上下文特征，从而实现全局文本信息抽取，接着进行知识加工和知识融合，最后将构建的知识图谱用Neo4j储存与表示，形成电力知识图谱模型；

Roberta预训练语言模型使用了全词掩码策略，能够完整获取中文电力文本中词的信息，提高对电力文本粗粒度语义的建模能力，从而显著提升模型性能，同时Roberta预训练语言模型使用动态掩码策略，每次向Roberta预训练语言模型输入一个序列时都生成新的掩码模式，动态地改变应用于训练数据的遮蔽模式，与传统的静态词向量训练相比，Roberta预训练语言模型训练输出的动态词向量包含了词的含义和上下文词之间的特征，不断适应时刻变化的掩码策略，能够更灵活地学习电力语料特征，更适用于中文电力领域的实体关系抽取任务，由于电力文本中通常存在分布更密集的专业词汇，因此本发明使用GB/T50297-2018电力工程基本术语标准、GB/T2900.1-2008电工术语基本术语、《电力设备运行规程及管理规定》等电力文本对Roberta预训练语言模型进行了预训练，构建出专属电力领域的Roberta预训练语言模型。

如图3所示， Roberta预训练语言模型依次由一个电力文本序列输入层、一个嵌入层、多个图自注意力编码器（Transformer-Encoder）以及一个输出层组成，所述电力文本序列输入层由词嵌入层、句嵌入层和位置嵌入层组成，图自注意力编码器依次由多头自注意力机制、第一归一化层、全连接层、第二归一化层组成，利用Roberta预训练语言模型中的图自注意力编码器（Transformer-Encoder）对输入的电力文本序列进行编码，使用多头自注意力机制对编码后的电力文本序列训练得到对应的向量，对于输入的电力文本序列，分别为第1,2，3，…，n个词，n为词的个数，将每个词采用独热向量(one-hot)表示，设维度为k，则输入的电力文本序列对应的嵌入矩阵为， Roberta预训练语言模型中图自注意力编码器的多头注意力机制的输入为嵌入矩阵。

自注意力表示如下：

（17）；

（18）；

式中，为查询矩阵；为键矩阵；为值矩阵，为查询矩阵的映射权重参数，为键矩阵的映射权重参数，为值矩阵的映射权重参数；是向量的维度，为Q、K的列数；softmax为归一化函数；为缩放因子，表示自注意力, 为键矩阵的转置。

BiLSTM层也叫BiLSTM（双向长短时记忆网络），是LSTM（长短时记忆网络）的扩展，它通过在输入序列的两个方向上分别处理数据，从而更好地捕捉序列中的上下文信息；LSTM（长短时记忆网络）有输入门、遗忘门和输出门，以及内部细胞状态，这些门控单元通过学习来控制信息的流动，使得LSTM（长短时记忆网络）能够处理长期依赖关系；BiLSTM（双向长短时记忆网络）引入了前向（正向）和后向（反向）两个方向的LSTM层，从而能够同时考虑过去和未来的信息。

在BiLSTM（双向长短时记忆网络）中，输入序列被分别输入到前向和后向的LSTM层；每个时刻的前向LSTM单元计算基于过去的信息，而后向LSTM单元计算基于未来的信息，这两个方向上的隐藏状态被拼接在一起，从而获得更全面的上下文信息，这使得BiLSTM（双向长短时记忆网络）在许多序列建模任务中表现出色，如自然语言处理中的命名实体识别、情感分析等。

总的来说，BiLSTM（双向长短时记忆网络）通过利用前向和后向两个方向上的信息，更好地捕捉了输入电力文本序列中的上下文关系，使得模型能够更全面地理解和处理时序数据。

BiLSTM层可以获得双向语义依赖并获得更全面的文本信息，BiLSTM层中LSTM（长短时记忆网络）用于计算当前的隐藏向量，在前一时刻隐藏向量基础上，前一时刻单元向量和当前的输入词嵌入，BiLSTM层是通过输入门、遗忘门和输出门这三个门来控制信息的流动和计算处理， Roberta预训练语言模型将电力文本序列转换为嵌入向量，因此一个句向量为，其中是对应于经过Roberta预训练语言模型处理后的句向量中第m个词的D维词向量，η表示给句向量的长度。对于第m个词，前向LSTM 单元过结合第m个词的上下文信息进行编码，标记为编码信息，同样地，后向LSTM单元通过结合第m个词上下文信息进行编码，标记为，最后，将和连接起来，代表第m个词的编码信息，表示为。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于多头注意力机制和知识图谱的手写表格识别方法，其特征在于，包括如下步骤：

步骤S1：对输入的手写表格图像进行预处理；

利用多头注意力机制确保关注到手写表格图像不同位置的重要特征；对手写表格图像中的文字内容和结构信息进行建模和学习；根据手写表格图像中的结构信息和文字内容，计算手写表格图像节点之间的注意力权重，用于手写表格图像数据的提取和整合，最终得到手写表格图像特征图；

特征提取模型包括若干个时序卷积子网络和多头注意力机制，每个时序卷积子网络的每个卷积层都采用多头注意力机制理解特征向量之间的相互关系；

第e个时序卷积子网络第f个卷积层的卷积操作表示为：

；

式中，分别表示第e个时序卷积子网络的卷积核权重和偏置项；/>是激活函数；∗表示卷积操作；/>表示第e个时序卷积子网络第f个卷积层的输出；/>表示输入向量；

将作为计算查询矩阵、键矩阵、值矩阵的输入：

；

式中，为第e个时序卷积子网络第f个卷积层的查询矩阵；/>为第e个时序卷积子网络查询矩阵的映射权重参数；/>为第e个时序卷积子网络第f个卷积层的键矩阵；/>为第e个时序卷积子网络键矩阵的映射权重参数；/>为第e个时序卷积子网络第f个卷积层的值矩阵；/>为第e个时序卷积子网络值矩阵的映射权重参数；

；

式中，为第e个时序卷积子网络第f个卷积层第i个注意力头的查询矩阵； />为第e个时序卷积子网络第f个卷积层第i个注意力头的键矩阵；/>为第e个时序卷积子网络第f个卷积层第i个注意力头的值矩阵；/>为第e个时序卷积子网络第i个注意力头查询矩阵的映射权重参数；/>为第e个时序卷积子网络第i个注意力头键矩阵的映射权重参数；为第e个时序卷积子网络第i个注意力头值矩阵的映射权重参数；

；

式中，为/>的转置；/>为向量的维度；

；

式中，为第e个时序卷积子网络第f个卷积层第1个注意力头的注意力输出，/>为第e个时序卷积子网络第f个卷积层第h个注意力头的注意力输出，/>为第e个时序卷积子网络的线性变换参数矩阵；

令为第e个时序卷积子网络的多头注意力输出， />为第e个时序卷积子网络的输出，则：

；

式中，分别表示第e个时序卷积子网络的卷积核权重和偏置项；

将若干个时序卷积子网络输出结果进行融合，得到一个融合特征向量；

步骤S4：使用电力文本对Roberta预训练语言模型进行预训练，通过数据预处理将电力文本转换成电力文本序列，然后输入到Roberta预训练语言模型的电力文本序列输入层，通过词嵌入层，句嵌入层和位置嵌入层中进行提取，将输入的电力文本序列转化为词向量、句向量以及位置向量，利用图自注意力编码器中的多头自注意力机制和全连接层对输入的电力文本序列进行建模，从电力文本序列中选择出和当前任务目标更契合的有效信息；将巡检的电力文本序列以句子为单位输入进已预训练的Roberta预训练语言模型得到词向量，再利用BiLSTM层学习巡检的电力文本序列的上下文特征，从而实现全局文本信息抽取，接着进行知识加工和知识融合，最后将构建的知识图谱用Neo4j储存与表示，形成电力知识图谱模型；

2.根据权利要求1所述的基于多头注意力机制和知识图谱的手写表格识别方法，其特征在于，所述Roberta预训练语言模型依次由一个电力文本序列输入层、一个嵌入层、多个图自注意力编码器以及一个输出层组成，所述嵌入层由词嵌入层、句嵌入层和位置嵌入层组成，图自注意力编码器依次由多头自注意力机制、第一归一化层、全连接层、第二归一化层组成，利用Roberta预训练语言模型中的图自注意力编码器对输入的电力文本序列进行编码，使用多头自注意力机制对编码后的电力文本序列训练得到对应的向量。

3.根据权利要求2所述的基于多头注意力机制和知识图谱的手写表格识别方法，其特征在于，对于输入的电力文本序列，/>分别为第1,2，3，…，n个词，n为词的个数，将每个词采用独热向量表示，设维度为/>，则输入的电力文本序列对应的嵌入矩阵为/>，Roberta预训练语言模型中图自注意力编码器的多头注意力机制的输入为嵌入矩阵/>；自注意力表示如下：

；

式中，为查询矩阵；/>为键矩阵；/>为值矩阵，/>为查询矩阵的映射权重参数，/>为键矩阵的映射权重参数，/>为值矩阵的映射权重参数；/>是向量的维度，为Q、K的列数；softmax为归一化函数；/>为缩放因子，/>表示自注意力, />为键矩阵/>的转置；

使用图自注意力编码器中多头注意力机制拼接各自注意力得到多头自注意力输出。

4.根据权利要求1所述的基于多头注意力机制和知识图谱的手写表格识别方法，其特征在于，所述BiLSTM层包括前向LSTM单元和后向LSTM单元，Roberta预训练语言模型将电力文本序列转换为嵌入向量，一个句向量为，其中/>是对应于经过Roberta预训练语言模型处理后的句向量中第m个词的D维词向量，η表示给句向量的长度；对于第m个词，前向LSTM单元过结合第m个词的上下文信息进行编码，标记为编码信息，同样地，后向LSTM单元通过结合第m个词上下文信息进行编码，标记为/>，最后，将连接起来，代表第m个词的编码信息，表示为/>。

5.根据权利要求1所述的基于多头注意力机制和知识图谱的手写表格识别方法，其特征在于，所述预处理包括降噪处理、二值化处理和倾斜矫正处理。

6.根据权利要求5所述的基于多头注意力机制和知识图谱的手写表格识别方法，其特征在于，所述降噪处理是：采用高斯滤波的方法对输入的手写表格图像进行降噪处理。

7.根据权利要求6所述的基于多头注意力机制和知识图谱的手写表格识别方法，其特征在于，所述倾斜矫正处理采用霍夫变换进行，首先识别输入的手写表格图像中的几何图形，从中检测到对应的直线，然后通过计算直线的倾斜角度判断几何图形的倾斜度数，最后进行旋转校正。