CN116563875B

CN116563875B - 一种具有加密功能的智能图文识别方法及系统

Info

Publication number: CN116563875B
Application number: CN202310815676.5A
Authority: CN
Inventors: 严松; 黄奎; 刘利科
Original assignee: Beijing Jixian Information Technology Co ltd
Current assignee: Beijing Jixian Information Technology Co ltd
Priority date: 2023-07-05
Filing date: 2023-07-05
Publication date: 2023-09-08
Anticipated expiration: 2043-07-05
Also published as: CN116563875A

Abstract

本发明公开了一种具有加密功能的智能图文识别方法及系统，属于数据处理技术领域，本发明先对图像灰度处理，便于提取轮廓图，在轮廓图提取后，对灰度值进行归一化处理，降低计算量，再对归一化轮廓图进行分类处理，得到图像上各个轮廓对象的类型，在存在文字类型时，从归一化轮廓图上提取出文字部分的文字轮廓图，避免其他非文字部分对文字识别过程的影响，提高文字识别精度，采用文字识别模型对文字轮廓图进行识别，得到文字信息，将文字信息和类型信息加密输出，避免识别方随意获取图文信息。

Description

一种具有加密功能的智能图文识别方法及系统

技术领域

本发明涉及数据处理技术领域，具体涉及一种具有加密功能的智能图文识别方法及系统。

背景技术

现有针对电子设备（例如扫描仪或数码相机）检查纸上打印的字符，采用光学字符识别技术OCR，但通常情况下，图和文字均在一个图像上，若仅采用光学字符识别技术OCR来识别图像上的文字，那么图像上的非文字部分则会干扰文字部分的检测，影响文字的识别精度。同时，现有识别文字的方法将识别后的文字直接展示出来，造成内容信息容易被窃取，不便于信息的管理。

发明内容

针对现有技术中的上述不足，本发明提供的一种具有加密功能的智能图文识别方法及系统解决了光学字符识别技术OCR存在识别精度不高，且信息容易被窃取的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种具有加密功能的智能图文识别方法，包括以下步骤：

S1、采集待识别图文的图像，并对图像灰度处理，得到灰度图；

S2、对灰度图提取轮廓，得到轮廓图；

S3、将轮廓图的灰度值进行归一化处理，得到归一化轮廓图；

S4、对归一化轮廓图进行分类，得到归一化轮廓图上各对象的类型；

S5、在对象类型存在文字时，提取归一化轮廓图上文字所在区域，得到文字轮廓图；

S6、采用文字识别模型对文字轮廓图进行处理，得到文字信息；

S7、将文字信息和对象类型加密输出，得到加密的图文信息。

进一步地，所述S2包括以下分步骤：

S21、设定轮廓提取窗口；

S22、采用轮廓提取窗口在灰度图上滑动；

S23、以轮廓提取窗口中心的像素点作为当前待处理的像素点；

S24、判断当前待处理的像素点是否满足轮廓像素点条件，若是，则将当前待处理的像素点保留，作为轮廓图的像素点，若否，则将当前待处理的像素点剔除。

上述进一步地方案的有益效果为：轮廓提取窗口在灰度图上滑动，每滑动一次后，就要进行步骤S24的判断，判断轮廓提取窗口下中心像素点是否满足轮廓像素点条件，如果满足，则保留下来，如果不满足，则剔除，将轮廓像素点选出来，从而实现轮廓图的提取，通过轮廓提取窗口不断滑动实现对灰度图上像素点的遍历。

进一步地，所述S24中轮廓像素点条件为：

条件一：

，

条件二：

或/>，

其中，为轮廓提取窗口中第/>个像素点的灰度值，/>为当前待处理的像素点的灰度值，/>为灰度差阈值，/>为轮廓提取窗口下像素点数量，/>为当前待处理的像素点右侧的第/>个像素点的灰度值，/>为当前待处理的像素点左侧的第/>个像素点的灰度值，/>为当前待处理的像素点上侧的第/>个像素点的灰度值，/>为当前待处理的像素点下侧的第/>个像素点的灰度值，/>为当前待处理的像素点左侧、右侧、上侧或下侧的像素点数量。

上述进一步地方案的有益效果为：上述条件一和条件二轮廓像素点均需满足，在条件一中，需要判断该像素点是否与周边像素点存在较大灰度差，若存在较大灰度差，则该像素点可能是在轮廓上，若不存在，则该像素点肯定不是轮廓像素点，在该像素点满足条件一的情况下，通过条件二尽可能的去避免该像素点为异常点的可能性，通过条件二中任一不等式，去判断该像素点周边像素值的分布情况，若该像素点为轮廓像素点则其周边像素点也存在轮廓像素点，因此其上下左右也存在满足条件二的像素点，通过条件二来进一步确定该像素点为轮廓像素点。

进一步地，所述S3中归一化处理的公式为：

，

其中，为第/>个像素点的归一化灰度值，/>为轮廓图上最大灰度值，/>为轮廓图上最小灰度值，/>为轮廓图上第/>个像素点的灰度值。

上述进一步地方案的有益效果为：本发明对轮廓图的灰度值归一化处理，减少计算量。

进一步地，所述S6中文字识别模型包括：CNN神经网络、最大池化层、平均池化层、第一LSTM层、第二LSTM层、特征拼接层和特征识别网络；

所述CNN神经网络的输入端作为文字识别模型的输入端，其输出端分别与最大池化层的输入端和平均池化层的输入端连接；所述第一LSTM层的输入端与最大池化层的输出端连接；所述第二LSTM层的输入端与平均池化层的输出端连接；所述特征拼接层的输入端分别与第一LSTM层的输出端和第二LSTM层的输出端连接，其输出端与特征识别网络的输入端连接；所述特征识别网络的输出端作为文字识别模型的输出端。

进一步地，所述特征识别网络包括：第一卷积块、第二卷积块、第一加法器A1、第二加法器A2、第三加法器A3、上采样层、第一卷积层和第二卷积层；

所述第一卷积块的输入端分别与第一加法器A1的第一输入端和第三加法器A3的第一输入端连接，并作为特征识别网络的输入端；所述第一加法器A1的第二输入端与第一卷积块的输出端连接，其输出端分别与第二卷积块的输入端和第二加法器A2的第一输入端连接；所述第二卷积块的输出端与第二加法器A2的第二输入端连接；所述第二加法器A2的输出端与第三加法器A3的第二输入端连接；所述上采样层的输入端与第三加法器A3的输出端连接，其输出端与第一卷积层的输入端连接；所述第二卷积层的输入端与第一卷积层的输出端连接，其输出端作为特征识别网络的输出端。

上述进一步地方案的有益效果为：本发明中采用CNN神经网络提取特征，通过最大池化层和平均池化层再分别提取显著特征和全局特征，显著特征传输给第一LSTM层处理，全局特征传输给第二LSTM层处理，将第二LSTM层和第一LSTM层处理后的特征输入特征拼接层，进行特征拼接，再将拼接后的特征输入到特征识别网络中，进行文字识别，本发明为了解决梯度消失的问题，将特征拼接层连接到第三加法器A3，一方面能保障特征的丰富性，另一方面能增强部分特征的表达，提高识别精度。

进一步地，所述特征拼接层的表达式为：

，

其中，为特征拼接层的输出特征，/>为第一LSTM层输出后的压缩特征，/>为第二LSTM层输出后的压缩特征，/>为特征的长度，/>为特征的宽度，/>为第一LSTM层的输出特征第/>行第/>列元素，/>为第二LSTM层的输出特征第/>行第/>列元素，/>为激活函数，/>为第一权值，/>为第二权值，/>为特征拼接符号。

上述进一步地方案的有益效果为：本发明先对第一LSTM层和第一LSTM层输出后的特征进行压缩处理，实现数据空间上的融合，再将数据分别赋予不同权值，再采用激活函数解决梯度消失的问题，增强模型的适应性。

进一步地，所述S7包括以下分步骤：

S71、将文字信息和对象类型转成二进制码，得到信息向量；

S72、将信息向量进行切分，得到多份子信息向量；

S73、将每份子信息向量转成十进制数，得到多个信息值；

S74、采用加密序列中加密元素与信息值一对一相乘，得到加密的图文信息。

上述进一步地方案的有益效果为：本发明中将文字信息和对象类型转成二进制码，将二进制码构成的信息向量进行切分，实现对数据的第一层加密，再将每份子信息向量转成十进制数，得到信息值，再采用加密元素对信息值进行第二层加密，得到加密的图文信息，在解密时，将加密的图文信息除以加密元素，还原信息值，将信息值再转成二进制码，得到子信息向量，将子信息向量进行拼接，得到信息向量，实现一种快速的加密解密过程。

一种具有加密功能的智能图文识别方法的系统，包括：灰度处理单元、图文轮廓提取单元、归一化单元、分类单元、文字轮廓提取单元、文字识别单元和加密单元；

所述灰度处理单元用于采集待识别图文的图像，并对图像灰度处理，得到灰度图；所述图文轮廓提取单元用于对灰度图提取轮廓，得到轮廓图；所述归一化单元用于将轮廓图的灰度值进行归一化处理，得到归一化轮廓图；所述分类单元用于对归一化轮廓图进行分类，得到归一化轮廓图上各对象的类型；所述文字轮廓提取单元用于在对象类型存在文字时，提取归一化轮廓图上文字所在区域，得到文字轮廓图；所述文字识别单元用于采用文字识别模型对文字轮廓图进行处理，得到文字信息；所述加密单元用于将文字信息和对象类型加密输出，得到加密的图文信息。

综上，本发明的有益效果为：本发明先对图像灰度处理，便于提取轮廓图，在轮廓图提取后，对灰度值进行归一化处理，降低计算量，再对归一化轮廓图进行分类处理，得到图像上各个轮廓对象的类型，在存在文字类型时，从归一化轮廓图上提取出文字部分的文字轮廓图，避免其他非文字部分对文字识别过程的影响，提高文字识别精度，采用文字识别模型对文字轮廓图进行识别，得到文字信息，将文字信息和类型信息加密输出，避免识别方随意获取图文信息。

附图说明

图1为一种具有加密功能的智能图文识别方法的流程图；

图2为文字识别模型的结构示意图；

图3为第一LSTM层的输出门的结构示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，一种具有加密功能的智能图文识别方法，包括以下步骤：

S2、对灰度图提取轮廓，得到轮廓图；

所述S2包括以下分步骤：

S21、设定轮廓提取窗口；

S22、采用轮廓提取窗口在灰度图上滑动；

所述S24中轮廓像素点条件为：

条件一：

，

条件二：

或/>，

在本实施例中，的大小根据需求进行选取。

所述S3中归一化处理的公式为：

，

在步骤S4中，可采用YOLO神经网络实现对轮廓图上各个轮廓对象的分类。

如图2所示，所述S6中文字识别模型包括：CNN神经网络、最大池化层、平均池化层、第一LSTM层、第二LSTM层、特征拼接层和特征识别网络；

所述特征识别网络包括：第一卷积块、第二卷积块、第一加法器A1、第二加法器A2、第三加法器A3、上采样层、第一卷积层和第二卷积层；

在本实施例中，卷积块包括：卷积层、批归一化层和ReLU层。

对第一卷积块输出的特征施加权重W₁，对第二卷积块输出的特征施加权重W₂，对第二加法器A2输出的特征施加权重W₃，实现自适应的关注重点特征，提高模型识别精度。

所述特征拼接层的表达式为：

，

第一LSTM层和第二LSTM层之间共享状态量，两个LSTM层中输出门的表达式均为：

，

其中，为输出门第/>时刻的输出，/>为sigmoid激活函数，/>为输出门的第一权重，/>为输出门的第一偏置，/>为输出门的第二权重，/>为输出门的第二偏置，/>为双曲正切激活函数，/>为第一LSTM层的第/>时刻的状态量，/>为第二LSTM层的第/>时刻的状态量，/>为输出门第/>时刻的输出，/>为输出门第/>时刻的输入。

如图3所示，第一LSTM层的来自于第二LSTM层，同理，第二LSTM层的/>来自于第一LSTM层。

所述S7包括以下分步骤：

S71、将文字信息和对象类型转成二进制码，得到信息向量；

S72、将信息向量进行切分，得到多份子信息向量；

S73、将每份子信息向量转成十进制数，得到多个信息值；

在本实施例，加密序列相当于是密码，在知道加密序列中所有元素的情况下，才能正确解密加密图文信息，在解密得到信息值后，还要进行二进制转换，转换后再拼接，才能实现完全解密，但本发明中的加密解密过程简单，不涉及复杂的计算公式，因此，本发明在保障数据安全的同时，也能快速加解密。

在本实施例中，系统的具体实现过程与方法的具体实现过程一致。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种具有加密功能的智能图文识别方法，其特征在于，包括以下步骤：

S2、对灰度图提取轮廓，得到轮廓图；

S7、将文字信息和对象类型加密输出，得到加密的图文信息；

所述S6中文字识别模型包括：CNN神经网络、最大池化层、平均池化层、第一LSTM层、第二LSTM层、特征拼接层和特征识别网络；

所述CNN神经网络的输入端作为文字识别模型的输入端，其输出端分别与最大池化层的输入端和平均池化层的输入端连接；所述第一LSTM层的输入端与最大池化层的输出端连接；所述第二LSTM层的输入端与平均池化层的输出端连接；所述特征拼接层的输入端分别与第一LSTM层的输出端和第二LSTM层的输出端连接，其输出端与特征识别网络的输入端连接；所述特征识别网络的输出端作为文字识别模型的输出端；

所述第一卷积块的输入端分别与第一加法器A1的第一输入端和第三加法器A3的第一输入端连接，并作为特征识别网络的输入端；所述第一加法器A1的第二输入端与第一卷积块的输出端连接，其输出端分别与第二卷积块的输入端和第二加法器A2的第一输入端连接；所述第二卷积块的输出端与第二加法器A2的第二输入端连接；所述第二加法器A2的输出端与第三加法器A3的第二输入端连接；所述上采样层的输入端与第三加法器A3的输出端连接，其输出端与第一卷积层的输入端连接；所述第二卷积层的输入端与第一卷积层的输出端连接，其输出端作为特征识别网络的输出端；

所述特征拼接层的表达式为：

，

其中，为特征拼接层的输出特征，/>为第一LSTM层输出后的压缩特征，/>为第二LSTM层输出后的压缩特征，/>为特征的长度，/>为特征的宽度，/>为第一LSTM层的输出特征第/>行第/>列元素，/>为第二LSTM层的输出特征第/>行第/>列元素，/>为激活函数，为第一权值，/>为第二权值，/>为特征拼接符号。

2.根据权利要求1所述的具有加密功能的智能图文识别方法，其特征在于，所述S2包括以下分步骤：

S21、设定轮廓提取窗口；

S22、采用轮廓提取窗口在灰度图上滑动；

3.根据权利要求2所述的具有加密功能的智能图文识别方法，其特征在于，所述S24中轮廓像素点条件为：

条件一：

，

条件二：

或/>，

其中，为轮廓提取窗口中第/>个像素点的灰度值，/>为当前待处理的像素点的灰度值，为灰度差阈值，/>为轮廓提取窗口下像素点数量，/>为当前待处理的像素点右侧的第/>个像素点的灰度值，/>为当前待处理的像素点左侧的第/>个像素点的灰度值，/>为当前待处理的像素点上侧的第/>个像素点的灰度值，/>为当前待处理的像素点下侧的第/>个像素点的灰度值，/>为当前待处理的像素点左侧、右侧、上侧或下侧的像素点数量。

4.根据权利要求1所述的具有加密功能的智能图文识别方法，其特征在于，所述S3中归一化处理的公式为：

，

5.根据权利要求1所述的具有加密功能的智能图文识别方法，其特征在于，所述S7包括以下分步骤：

S71、将文字信息和对象类型转成二进制码，得到信息向量；

S72、将信息向量进行切分，得到多份子信息向量；

S73、将每份子信息向量转成十进制数，得到多个信息值；

6.根据权利要求1~5任一项所述的具有加密功能的智能图文识别方法的系统，其特征在于，包括：灰度处理单元、图文轮廓提取单元、归一化单元、分类单元、文字轮廓提取单元、文字识别单元和加密单元；