CN111898402A

CN111898402A - 一种智能排版系统

Info

Publication number: CN111898402A
Application number: CN202010483074.0A
Authority: CN
Inventors: 王昌龙; 李虎; 刘爽
Original assignee: Individual
Current assignee: Individual
Priority date: 2020-06-01
Filing date: 2020-06-01
Publication date: 2020-11-06

Abstract

本发明公开了一种智能文案排版系统，包括：图像灰度化处理、图像倾斜校正、图像表格识别、表格内容提取、文字域切分、手写字符识别、文案排版。本发明主要由表格识别、手写字符识别和文案排版三部分组成，表格识别部分使用hough变换实现图像倾斜校正，然后再次使用hough变换对校正后图像进行表格线识别，最后通过连接横坐标或纵坐标相等的表格线交点完成表格线修复；手写字符部分首先分离横坐标或纵坐标相等的单元格实现文字区域切分，再使用卷积神经网络对表格内容识别；文案排版部分，将以上识别结果通过固定坐标输出到word文档，实现纸质文案的智能录入与排版。

Description

一种智能排版系统

技术领域

本发明涉及文案排版领域，尤其涉及一种纸质文案排版与重构的系统。

背景技术

表格作为数据信息的主要载体，在纸质文案中被广泛应用。同时，纸质文案便于携带，符合大众阅读习惯，但大量的纸张要求会造成资源浪费。相比之下，电子文案占用空间资源少、方便存储、便于检索。目前，把纸质文案存储为电子档大多采用人工录入完成，这样会造成工作量大、繁琐和准确率低等问题。

发明内容

为实现纸质文案信息的快速录入与存储，本发明提供了一种智能文案排版系统，该系统能快速、准确的将纸质文案装换成便于存储、归档的电子档文件。

本发明提供一种智能文案排版系统，其特征包括：纸质文案图像灰度化处理、图像倾斜校正、图像表格识别共同完成的表格识别部分；由表格内容提取、文字域切分、手写字符识别共同完成的手写字符识别部分；由按固定坐标重构完成的文案排版部分；以及文案排版结果输出到word生成可编辑文件。

所述的智能文案排版系统，其图片灰度化处理是由平均红(R)、绿(G)、蓝(B)三种颜色通道的值完成的；

优选地，所述图像倾斜校正由霍夫变换完成的；

将所述完成倾斜校正的图像再次由霍夫变换检测表格线，然后使用确定 A4纸边框坐标的方法分离拍摄背景与表格线，接着定位分离出的表格线的横纵交点，将横坐标或者纵坐标相等的交点连接起来的方法完成表格线的修复；

优选地，所述的文字域切分由单元格切分即由将横坐标或纵相等的单元格提取出来的方法完成；

优选地，所述的手写字符识别是利用HWDB1.1脱机字库子集作为训练集，采用卷积神经网络的算法对切分完毕的表格区域进行识别完成；

将所述表格线交点坐标信息、单元格矩形框的坐标信息、完成识别的表格线和完成识别的手写字符输出到word完成文案排版和输出。

附图说明

图1示出了本发明的智能文案排版系统的结构图；

图2示出了本发明的智能文案排版系统的流程图；

图3示出了本发明一个实施例的智能文案排版系统的文案灰度化图；

图4示出了本发明的一个实施例的智能文案排版系统的图像倾斜校正图；

图5示出了本发明的一个实施例的智能文案排版系统的表格直线检测图；

图6示出了本发明的一个实施例的智能文案排版系统的表格线修复完成图；

图7示出了本发明的一个实施例的智能文案排版系统的单元格切分图；

图8示出了本发明的一个实施例的智能文案排版系统的文案重构结果图。

具体实施方式

为了使本发明的内容更清晰、易懂，下面将结合一个实例并参照附图对本发明作进一步描述。本发明针对此实例所选取的中科院的CASIA手写中文字库中的HWDB1.1脱机字库子集作为卷积神经网络的训练集与测试集，不应以此作为对本发明的限定。

本发明提供了一种智能文案排版系统，包括表格识别、手写字符识别和文案排版三部分，表格识别部分作用是完整的提取出表格线并记录表格线交点坐标信息，表格识别部分包括以下步骤：

步骤S1、将需要排版的纸质文案以图像的形式输入；

步骤S2、利用平均红(R)、绿(G)、蓝(B)三种颜色通道值的方法对步骤S1输入的图像灰度化处理，如图3。

公式为：

灰度化后的R＝(处理前的R+处理前的G+处理前的B)/3

灰度化后的G＝(处理前的R+处理前的G+处理前的B)/3

灰度化后的B＝(处理前的R+处理前的G+处理前的B)/3

步骤S3、利用霍夫变换对步骤S2灰度化后的图像进行图形校正，如图4。

其具体方法如下：

在空间直角坐标系中一条直线可以表示为：

y＝k*x+h

其中k表示斜率，h表示截距。对应在极坐标空间中为：

ρ＝x*cosθ+y*sinθ

其中ρ表示直线到原点的距离，θ表示x轴到直线垂线的角度，取值范围为±90度。直角坐标空间中直线上的点(x，y)与极坐标空间中正弦曲线ρ相对应并在参数空间交于一点(ρ，θ)，这个参数空间也被叫做霍夫空间。计算霍夫空间中经过每点的曲线数目就可以判断该点对应到直角坐标系上是不是有直线存在并得知相应直线的长度，之后求出一条与图像方向平行的直线，利用这条直线的角度就可以得出倾斜角度。最后根据直线倾斜角度判断该直线是水平方向还是竖直方向，并根据如下公式：

算出整个图像的倾斜角度，按相应角度旋转图像，完成图像的倾斜校正。其中，β表示图像的倾斜角度，α为线段的倾斜角度。

步骤S4、对步骤S3校正后的图像再次使用霍夫变换检测图像中的表格线，如图5。其中绿线是检测到的直线，黄点是直线的起点，红色是直线的终点。

步骤S5、为排除图像背景所产生的直线对步骤S4检测出的表格线的影响，通过确定纸质文案的4个顶点，分离出背景图像。

步骤S6、为解决步骤S5所得图像中表格直线间断的问题，利用定位步骤 S5所得图像的表格线的横纵交点，将横坐标或者纵坐标相等的交点连接起来的方法完成表格线的修复，如图6。并记录表格线的交点坐标信息。

手写字符识别部分作用识别出表格中的手写文字信息，并记录单元格的坐标信息，手写字符识别部分包括以下步骤：

步骤S7、对步骤S1输入的纸质文案图像，利用提取横坐标或纵坐标相等的单元格的方法完成文字域切分，如图7。并记录单元格矩形框的左上角坐标信息。

步骤S8、利用训练好的卷积神经网络模型对步骤S7中2提取的单元格完成表格内容识别。

步骤S9、分别对步骤S6中所记录的表格交点信息和修复的表格线，步骤S7所记录的单元格矩形框的左上角坐标信息的排版及步骤S8中所识别的表格内容输出到word文档，最终完成文案的重构。如图8。

虽然本发明主要描述了以上实施例,但是只是作为实施例来加以描述,而本发明并不限于此。本领域的技术人员能做出多种变型和应用而不脱离实施例的实质特性。例如，对实施例描述的每个步骤都可以修改和运行,与所述变型和应用相关的差异可认为包括在所附权利要求所限定的本发明的保护范围内。

Claims

1.一种智能文案排版系统，其特征包括：

由图像灰度化处理、图像倾斜校正、图像表格识别共同完成的表格识别部分；

由表格内容提取、文字域切分、手写字符识别共同完成的手写字符识别部分；

由坐标标记完成的文案排版部分；

以及文案重构结果输出到word生成可编辑文件。

2.根据权利要求1所述智能文案排版系统，其特征包括：利用标记已识别出的表格线横纵交点的坐标，并将横坐标或者纵坐标相等的交点连接起来完成表格线的修复。同时，记录交点的坐标信息。

3.根据权利要求1所述智能文案排版系统，其特征包括：利用将横坐标或纵相等的单元格提取出来的方法完成文字域的切分，并利用经过训练好的卷积神经网络对文字域内手写字符的识别。同时，记录单元格矩形框的左上角坐标信息。

4.根据权利要求1所述智能文案排版系统，其特征包括：利用分别将权利要求2所述表格线交点坐标信息、修复的表格线和权利要求3所述的单元格矩形框的坐标信息、识别的手写字符输出到word的方法完成表格线和手写字符的重构。