CN114937271B

CN114937271B - 一种通信数据智能录入校对方法

Info

Publication number: CN114937271B
Application number: CN202210508448.9A
Authority: CN
Inventors: 尹进; 洪球; 高朝; 尹胜; 欧军; 刘方科; 李智军
Original assignee: Zhongweijian Communication Technology Service Co ltd
Current assignee: Zhongweijian Communication Technology Service Co ltd
Priority date: 2022-05-11
Filing date: 2022-05-11
Publication date: 2023-04-18
Anticipated expiration: 2042-05-11
Also published as: CN114937271A

Abstract

本发明涉及文档校对的技术领域，公开了一种通信数据智能录入校对方法，包括：构建扭曲文档图像样本数据集合；构建扭曲文档矫正模型，并利用样本数据集合训练所构建的模型，得到最优的扭曲文档矫正模型；利用扭曲文档检测模型对纸质通信数据进行扭曲检测，将检测到扭曲的纸质通信数据作为扭曲数据；利用扭曲文档矫正模型对扭曲数据进行矫正；构建文字识别模型，利用文字识别模型对矫正后的扭曲数据以及未检测到扭曲的纸质通信数据进行文字识别，将识别结果作为电子文本材料，并将电子文本材料与对应的电子注册材料进行信息校对。本发明所述方法通过构建扭曲文档矫正模型实现扭曲文档的矫正处理，进而实现图像中的文本识别。

Description

一种通信数据智能录入校对方法

技术领域

本发明涉及文档校对的技术领域，尤其涉及一种通信数据智能录入校对方法。

背景技术

目前信件通信数据电子化主要通过人工录入的方法，虽然目前光学字符识别已经取得良好效果，但是应用于企业信件通信数据存在如下难点：一是通信票据可能存在弯曲折叠的情况，导致每行文本存在弯曲现象，从而影响文字识别；二是印章中的弯曲文本识别存在较大困难。针对上述问题，本专利提出一种通信数据智能录入校对方法。

发明内容

本发明提供一种通信数据智能录入校对方法，目的在于（1）实现扭曲文档的矫正处理；（2）实现图像中的文本识别。

实现上述目的，本发明提供的一种通信数据智能录入校对方法，包括以下步骤：

S1：构建扭曲文档图像样本数据集合，用于训练扭曲文档矫正模型；

S2：构建扭曲文档矫正模型，并利用样本数据集合训练所构建的模型，得到最优的扭曲文档矫正模型；

S3：利用扭曲文档检测模型对纸质通信数据进行扭曲检测，将检测到扭曲的纸质通信数据作为扭曲数据；

S4：利用扭曲文档矫正模型对扭曲数据进行矫正；

S5：构建文字识别模型，利用文字识别模型对矫正后的扭曲数据以及未检测到扭曲的纸质通信数据进行文字识别，将识别结果作为电子文本材料，并将电子文本材料与对应的电子注册材料进行信息校对。

作为本发明的进一步改进方法：

所述S1步骤中构建扭曲文档图像样本数据集合，包括：

所构建的扭曲文档图像样本数据集合 data为：

其中：

(I_i,t_i)表示所采集的第i组扭曲文档图像样本数据，I_i表示扭曲文档图像样本，t_i表示I_i矫正后的文档图像数据；

n表示扭曲文档图像样本数据集合data中的样本数量；

在本发明一个具体实施例中，本发明采集n张平整的文档图像数据作为矫正后的文档图像数据

，对于任意文档图像数据t_i，从图像数据中任意选择一个像素点e_i作为初始扭曲点，并为初始扭曲点随机生成扭曲向量v_i=[tv_i,vv_i]，其中 tv_i表示初始扭曲点在水平方向的受力强度，vv_i表示初始扭曲点在竖直方向的受力强度，则初始扭曲点的更新位置为

，对所有文档图像的初始扭曲点进行位置更新，使得平整的文档图像发生扭曲形变，得到对应的扭曲文档图像数据

，其中weight_i表示初始扭曲点e_i的位置更新权重：

其中：

表示扭曲形变的传播程度，

，较小的

会将基于初始扭曲点的图像扭曲形变限制在局部区域，即

值越大，文档图像的扭曲形变范围越大；

distance(e_i)表示初始扭曲点e_i与图像中心的距离。

所述S2步骤中构建扭曲文档矫正模型，并利用S1步骤中的样本数据集合训练所构建的模型，包括：

所构建的扭曲文档矫正模型包括采样层、控制点生成网络、矫正参数生成网络以及图像生成网络，所述扭曲文档矫正模型的输入为存在扭曲形变的文档图像数据，输出为矫正后的文档图像；

所述扭曲文档矫正模型中采样层的采样公式为：

其中：

s表示对文档图像数据的下采样倍数，即设置s×s大小的像素窗口，计算像素窗口内的像素均值p，将p作为该像素窗口的采样像素值；

表示像素窗口的所有像素的像素值之和；

将采样处理后的文档图像数据输入到控制点生成网络，控制点生成网络分别计算像素灰度值在[0,M)与[M,L]出现的概率P₁,P₂，其中[0,L]表示灰度级，L=255，P₁+P₂=1；计算像素灰度值在[0,M)与[M,L]的平均灰度值μ₁,μ₂，以及文档图像数据整体的平均灰度值μ，则文档图像数据灰度方差σ²的计算公式为：

遍历M∈[0,L]的所有灰度级数M，当σ²最大时的M即为文档图像分割阈值

，则对于采样处理后的文档图像数据，将像素灰度值大于等于

的像素的灰度值调整为255，将其余像素的灰度值调整为0，则灰度值为255的所有像素即为生成的控制点，并在采样处理后的文档图像数据中标记控制点的位置，将标记后的文档图像数据输入到矫正参数生成网络；

矫正参数生成网络将文档图像均分为6个子区域，对于每个子区域，连接子区域中的控制点得到二维曲面R²，则该子区域的矫正参数为：

其中：

z表示子区域垂直于平面的偏移量；

表示矫正参数；

将矫正参数与存在扭曲形变的文档图像数据输入到图像生成网络中，图像生成网络依据矫正参数对存在扭曲形变的文档图像数据进行矫正处理，所述矫正处理的公式为：

其中：

表示卷积层；

I表示存在扭曲形变的文档图像数据；

b表示卷积层的偏置向量；

w表示卷积层的权重；

表示矫正后的文档图像数据；

将所构建的扭曲文档图像样本数据集合data作为扭曲文档矫正模型的训练数据，构建扭曲文档矫正模型训练的损失函数Loss：

其中：

表示图像概率分布密度图计算；

表示模型对训练数据I_i进行矫正的图像数据，t_i表示训练数据I_i对应的实际矫正后图像数据；

随机生成图像生成网络中卷积层初始参数w₀,b₀，所述初始参数分布表示卷积层的权重和偏置向量，并设置参数更新次数为Max，利用梯度下降算法对卷积层中的参数进行更新，参数更新公式如下：

其中：

为学习率，将其设置为0.6；

表示第k次更新得到的卷积层参数值，k的初始值为0；

重复上述更新步骤，直到参数更新次数达到预设的更新次数Max，将最终训练得到的参数作为扭曲文档矫正模型的参数。

所述S3步骤中利用扭曲文档检测模型对纸质通信数据进行扭曲检测，包括：

信件发送方分别向信件接收方提供纸质通信数据以及填写电子注册材料，信件接收方将纸质通信数据扫描为图像数据；

信件接收方利用扭曲文档检测模型对纸质通信数据进行扭曲检测，所述扭曲检测流程为：

1）依据图像分割阈值

，对纸质通信数据进行二值化处理，将像素灰度值大于等于

的像素的灰度值调整为255，将其余像素的灰度值调整为0；

2）利用像素框对二值化处理后纸质通信数据的黑色像素区域进行遍历，并对黑色像素区域进行像素框标记，比较任意一行的黑色像素区域高度是否相同，并比较任意一列的黑色像素区域宽度是否相同，若两者均相同，则认为当前提供的纸质通信数据不存在扭曲，否则认为当前提供的纸质通信区域存在扭曲，并将检测到扭曲的纸质通信数据作为扭曲数据。

所述S4步骤中利用扭曲文档矫正模型对检测到扭曲的纸质通信数据进行矫正，包括：

将检测到扭曲的纸质通信数据作为扭曲数据，并将扭曲数据作为扭曲文档矫正模型的输入，且扭曲文档矫正模型输出矫正后的纸质通信数据。

所述S5步骤中构建文字识别模型，包括：

所构建的文字识别模型的输入为进行扭曲检测后的纸质通信数据，所述扭曲检测后的纸质通信数据具有像素框标记，像素框标记的区域即为文字区域；

所述文字识别模型的结构包括输入层、卷积层、输出层，输入层的输入值为扭曲检测后的纸质通信数据，输入层对纸质通信数据进行尺寸统一处理，即将输入的纸质通信数据尺寸统一处理为100×100像素，并将尺寸统一后的纸质通信数据输入到卷积层；

卷积层对接收到的纸质通信数据进行卷积处理、池化处理以及批归一化处理，所述卷积层的层数为5层，则第k层卷积层的输出结果为：

其中：

表示第k-1层卷积层的输出，第k层卷积层的输入，y₀表示尺寸统一后的纸质通信数据；

表示第k层卷积层中卷积处理、池化处理以及批归一化处理的累加；

将最后一层卷积层的输出结果y₅作为输出层的输入，输出层利用softmax函数对y₅进行文字识别softmax(y₅)，输出识别得到的文字，将识别结果作为电子文本材料。

所述S5步骤中利用文字识别模型对矫正后的扭曲数据以及未检测到扭曲的纸质通信数据进行文字识别，并将文字识别结果与对应的电子注册材料进行信息校对，包括：

利用文字识别模型对矫正后的扭曲数据以及未检测到扭曲的纸质通信数据进行文字识别，将识别结果作为电子文本材料，并将电子文本材料与对应的电子注册材料进行信息校对，若信息校对失败则向信件接收方发出警告信息。

相对于现有技术，本发明提出一种通信数据智能录入校对方法，该技术具有以下优势：

首先，由于扭曲文档数据较难采集，且采集结果大多无对应的平整文档图像，因此本方案提出一种扭曲文档数据集的采集方案，通过采集n张平整的文档图像数据作为矫正后的文档图像数据

，其中weight_i表示初始扭曲点e_i的位置更新权重：

其中：

表示扭曲形变的传播程度，

，较小的

会将基于初始扭曲点的图像扭曲形变限制在局部区域，即

值越大，文档图像的扭曲形变范围越大；

表示初始扭曲点

与图像中心的距离，因此本案得到n张相互对应的扭曲文档图像数据和平整文档图像数据，实现扭曲文档矫正模型的训练。

同时，本方案提出一种扭曲文档矫正模型，所构建的扭曲文档矫正模型包括采样层、控制点生成网络、矫正参数生成网络以及图像生成网络，所述扭曲文档矫正模型的输入为存在扭曲形变的文档图像数据，输出为矫正后的文档图像；所述扭曲文档矫正模型中采样层的采样公式为：

其中：s表示对文档图像数据的下采样倍数，即设置

大小的像素窗口，计算像素窗口内的像素均值

，将p作为该像素窗口的采样像素值；

表示像素窗口的所有像素的像素值之和；将采样处理后的文档图像数据输入到控制点生成网络，控制点生成网络分别计算像素灰度值在

与

出现的概率

,

，其中[0,L]表示灰度级，L=255，

+

；计算像素灰度值在

与

的平均灰度值

,

，以及文档图像数据整体的平均灰度值

，则文档图像数据灰度方差

的计算公式为：

遍历

的所有灰度级数M，当

最大时的M即为文档图像分割阈值

的像素的灰度值调整为255，将其余像素的灰度值调整为0，则灰度值为255的所有像素即为生成的控制点，并在采样处理后的文档图像数据中标记控制点的位置，将标记后的文档图像数据输入到矫正参数生成网络；矫正参数生成网络将文档图像均分为6个子区域，对于每个子区域，连接子区域中的控制点得到二维曲面

，则该子区域的矫正参数为：

其中：z表示子区域垂直于平面的偏移量；

表示矫正参数；将矫正参数与存在扭曲形变的文档图像数据输入到图像生成网络中，图像生成网络依据矫正参数对存在扭曲形变的文档图像数据进行矫正处理，所述矫正处理的公式为：

其中：

表示卷积层；I表示存在扭曲形变的文档图像数据；b表示卷积层的偏置向量；w表示卷积层的权重；

表示矫正后的文档图像数据。对于矫正后的图像，本方案利用文本识别模型对纸质通信数据进行文字识别，将识别结果作为电子文本材料，实现将纸质通信数据转化为电子文本，并将电子文本材料与对应的电子注册材料进行信息校对，实现通信数据校对。

附图说明

图1为本发明一实施例提供的一种通信数据智能录入校对方法的流程示意图；

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

S1：构建扭曲文档图像样本数据集合，用于训练扭曲文档矫正模型。

所述S1步骤中构建扭曲文档图像样本数据集合，包括：

所构建的扭曲文档图像样本数据集合data为：

其中：

n表示扭曲文档图像样本数据集合data中的样本数量；

，对于任意文档图像数据t_i，从图像数据中任意选择一个像素点e_i作为初始扭曲点，并为初始扭曲点随机生成扭曲向量v_i=[tv_i,vv_i]，其中 tv_i表示初始扭曲点在水平方向的受力强度， vv_i表示初始扭曲点在竖直方向的受力强度，则初始扭曲点的更新位置为

，其中weight_i表示初始扭曲点e_i的位置更新权重：

其中：

表示扭曲形变的传播程度，

，较小的

会将基于初始扭曲点的图像扭曲形变限制在局部区域，即

值越大，文档图像的扭曲形变范围越大；

表示初始扭曲点

与图像中心的距离。

S2：构建扭曲文档矫正模型，并利用样本数据集合训练所构建的模型，得到最优的扭曲文档矫正模型。

所述扭曲文档矫正模型中采样层的采样公式为：

其中：

表示像素窗口的所有像素的像素值之和；

其中：

z表示子区域垂直于平面的偏移量；

表示矫正参数；

其中：

表示卷积层；

I表示存在扭曲形变的文档图像数据；

b表示卷积层的偏置向量；

w表示卷积层的权重；

表示矫正后的文档图像数据；

其中：

表示图像概率分布密度图计算；

其中：

为学习率，将其设置为0.6；

表示第k次更新得到的卷积层参数值，k的初始值为0；

S3：利用扭曲文档检测模型对纸质通信数据进行扭曲检测，将检测到扭曲的纸质通信数据作为扭曲数据。

1）依据图像分割阈值

，对纸质通信数据进行二值化处理，将像素灰度值大于等于

的像素的灰度值调整为255，将其余像素的灰度值调整为0；

S4：利用扭曲文档矫正模型对扭曲数据进行矫正。

所述S5步骤中构建文字识别模型，包括：

其中：

需要说明的是，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种通信数据智能录入校对方法，其特征在于，所述方法包括：

S4：利用扭曲文档矫正模型对扭曲数据进行矫正；

S5：构建文字识别模型，利用文字识别模型对矫正后的扭曲数据以及未检测到扭曲的纸质通信数据进行文字识别，将识别结果作为电子文本材料，并将电子文本材料与对应的电子注册材料进行信息校对；

其中，步骤S1中，所构建的扭曲文档图像样本数据集合data为：

data＝{(I₁，t₁)，(I₂，t₂)，...，(I_i，t_i)，...，(I_n，t_n)}

其中：

(I_i，t_i)表示所采集的第i组扭曲文档图像样本数据，I_i表示扭曲文档图像样本，t_i表示I_i矫正后的文档图像数据；

n表示扭曲文档图像样本数据集合data中的样本数量，

采集n张平整的文档图像数据作为矫正后的文档图像数据{t₁，t₂，...，t_i，...，t_n}，对于任意文档图像数据t_i，从图像数据中任意选择一个像素点e_i作为初始扭曲点，并为初始扭曲点随机生成扭曲向量v_i＝[tv_i，vv_i]，其中tv_i表示初始扭曲点在水平方向的受力强度，vv_i表示初始扭曲点在竖直方向的受力强度，则初始扭曲点的更新位置为e′_i＝e_i+v_iweight_i，对所有文档图像的初始扭曲点进行位置更新，使得平整的文档图像发生扭曲形变，得到对应的扭曲文档图像数据{I₁，I₂，...，I_i，...，I_n}，其中weight_i表示初始扭曲点e_i的位置更新权重：

其中：

θ_i表示扭曲形变的传播程度，0＜θ_i≤1，θ_i值越大，文档图像的扭曲形变范围越大；

distance(e_i)表示初始扭曲点e_i与图像中心的距离；

所述扭曲文档矫正模型中采样层的采样公式为：

其中：

Σx_i表示像素窗口的所有像素的像素值之和；

将采样处理后的文档图像数据输入到控制点生成网络，控制点生成网络分别计算像素灰度值在[0，M]与[M，L]出现的概率P₁,P₂，其中[0,L]表示灰度级，L＝255，P₁+P₂＝1；计算像素灰度值在[0，M)与[M，L]的平均灰度值μ₁,μ₂，以及文档图像数据整体的平均灰度值μ，则文档图像数据灰度方差σ²的计算公式为：

σ²＝P₁(μ-μ₁)²+P₂(μ-μ₂)²

遍历M∈[0，L}的所有灰度级数M，当σ²最大时的M即为文档图像分割阈值

则对于采样处理后的文档图像数据，将像素灰度值大于等于

其中：

z表示子区域垂直于平面的偏移量；

α表示矫正参数；

I′＝Conv(I，αw，b)

其中：

Conv(·)表示卷积层；

I表示存在扭曲形变的文档图像数据；

b表示卷积层的偏置向量；

w表示卷积层的权重；

I′表示矫正后的文档图像数据；

其中：

pdf(·)表示图像概率分布密度图计算；

随机生成图像生成网络中卷积层初始参数w₀，b₀，所述初始参数分布表示卷积层的权重和偏置向量，并设置参数更新次数为Max，利用梯度下降算法对卷积层中的参数进行更新，参数更新公式如下：

其中：

∈为学习率，将其设置为0.6；

w_k，b_k表示第k次更新得到的卷积层参数值，k的初始值为0；

2.如权利要求1所述的一种通信数据智能录入校对方法，其特征在于，所述S3步骤中利用扭曲文档检测模型对纸质通信数据进行扭曲检测，包括：

1)依据图像分割阈值

对纸质通信数据进行二值化处理，将像素灰度值大于等于

的像素的灰度值调整为255，将其余像素的灰度值调整为0；

2)利用像素框对二值化处理后纸质通信数据的黑色像素区域进行遍历，并对黑色像素区域进行像素框标记，比较任意一行的黑色像素区域高度是否相同，并比较任意一列的黑色像素区域宽度是否相同，若两者均相同，则认为当前提供的纸质通信数据不存在扭曲，否则认为当前提供的纸质通信区域存在扭曲，并将检测到扭曲的纸质通信数据作为扭曲数据。

3.如权利要求2所述的一种通信数据智能录入校对方法，其特征在于，所述S4步骤中利用扭曲文档矫正模型对检测到扭曲的纸质通信数据进行矫正，包括：

4.如权利要求1所述的一种通信数据智能录入校对方法，其特征在于，所述S5步骤中构建文字识别模型，包括：

y_k＝H_k(y_k-1)+y_k-1

其中：

y_k-1表示第k-1层卷积层的输出，第k层卷积层的输入，y₀表示尺寸统一后的纸质通信数据；

H_k(·)表示第k层卷积层中卷积处理、池化处理以及批归一化处理的累加；

5.如权利要求4所述的一种通信数据智能录入校对方法，其特征在于，所述S5步骤中利用文字识别模型对矫正后的扭曲数据以及未检测到扭曲的纸质通信数据进行文字识别，并将文字识别结果与对应的电子注册材料进行信息校对，包括：