CN111898402A - 一种智能排版系统 - Google Patents
一种智能排版系统 Download PDFInfo
- Publication number
- CN111898402A CN111898402A CN202010483074.0A CN202010483074A CN111898402A CN 111898402 A CN111898402 A CN 111898402A CN 202010483074 A CN202010483074 A CN 202010483074A CN 111898402 A CN111898402 A CN 111898402A
- Authority
- CN
- China
- Prior art keywords
- image
- typesetting
- recognition
- character
- intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000012937 correction Methods 0.000 claims abstract description 9
- 230000011218 segmentation Effects 0.000 claims abstract description 9
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 5
- 238000000605 extraction Methods 0.000 claims abstract description 3
- 238000000034 method Methods 0.000 abstract description 6
- 230000009466 transformation Effects 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 7
- 238000012935 Averaging Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种智能文案排版系统,包括:图像灰度化处理、图像倾斜校正、图像表格识别、表格内容提取、文字域切分、手写字符识别、文案排版。本发明主要由表格识别、手写字符识别和文案排版三部分组成,表格识别部分使用hough变换实现图像倾斜校正,然后再次使用hough变换对校正后图像进行表格线识别,最后通过连接横坐标或纵坐标相等的表格线交点完成表格线修复;手写字符部分首先分离横坐标或纵坐标相等的单元格实现文字区域切分,再使用卷积神经网络对表格内容识别;文案排版部分,将以上识别结果通过固定坐标输出到word文档,实现纸质文案的智能录入与排版。
Description
技术领域
本发明涉及文案排版领域,尤其涉及一种纸质文案排版与重构的系统。
背景技术
表格作为数据信息的主要载体,在纸质文案中被广泛应用。同时,纸质文案便于携带,符合大众阅读习惯,但大量的纸张要求会造成资源浪费。相比之下,电子文案占用空间资源少、方便存储、便于检索。目前,把纸质文案存储为电子档大多采用人工录入完成,这样会造成工作量大、繁琐和准确率低等问题。
发明内容
为实现纸质文案信息的快速录入与存储,本发明提供了一种智能文案排版系统,该系统能快速、准确的将纸质文案装换成便于存储、归档的电子档文件。
本发明提供一种智能文案排版系统,其特征包括:纸质文案图像灰度化处理、图像倾斜校正、图像表格识别共同完成的表格识别部分;由表格内容提取、文字域切分、手写字符识别共同完成的手写字符识别部分;由按固定坐标重构完成的文案排版部分;以及文案排版结果输出到word生成可编辑文件。
所述的智能文案排版系统,其图片灰度化处理是由平均红(R)、绿(G)、蓝(B)三种颜色通道的值完成的;
优选地,所述图像倾斜校正由霍夫变换完成的;
将所述完成倾斜校正的图像再次由霍夫变换检测表格线,然后使用确定 A4纸边框坐标的方法分离拍摄背景与表格线,接着定位分离出的表格线的横纵交点,将横坐标或者纵坐标相等的交点连接起来的方法完成表格线的修复;
优选地,所述的文字域切分由单元格切分即由将横坐标或纵相等的单元格提取出来的方法完成;
优选地,所述的手写字符识别是利用HWDB1.1脱机字库子集作为训练集,采用卷积神经网络的算法对切分完毕的表格区域进行识别完成;
将所述表格线交点坐标信息、单元格矩形框的坐标信息、完成识别的表格线和完成识别的手写字符输出到word完成文案排版和输出。
附图说明
图1示出了本发明的智能文案排版系统的结构图;
图2示出了本发明的智能文案排版系统的流程图;
图3示出了本发明一个实施例的智能文案排版系统的文案灰度化图;
图4示出了本发明的一个实施例的智能文案排版系统的图像倾斜校正图;
图5示出了本发明的一个实施例的智能文案排版系统的表格直线检测图;
图6示出了本发明的一个实施例的智能文案排版系统的表格线修复完成图;
图7示出了本发明的一个实施例的智能文案排版系统的单元格切分图;
图8示出了本发明的一个实施例的智能文案排版系统的文案重构结果图。
具体实施方式
为了使本发明的内容更清晰、易懂,下面将结合一个实例并参照附图对本发明作进一步描述。本发明针对此实例所选取的中科院的CASIA手写中文字库中的HWDB1.1脱机字库子集作为卷积神经网络的训练集与测试集,不应以此作为对本发明的限定。
本发明提供了一种智能文案排版系统,包括表格识别、手写字符识别和文案排版三部分,表格识别部分作用是完整的提取出表格线并记录表格线交点坐标信息,表格识别部分包括以下步骤:
步骤S1、将需要排版的纸质文案以图像的形式输入;
步骤S2、利用平均红(R)、绿(G)、蓝(B)三种颜色通道值的方法对步骤S1输入的图像灰度化处理,如图3。
公式为:
灰度化后的R=(处理前的R+处理前的G+处理前的B)/3
灰度化后的G=(处理前的R+处理前的G+处理前的B)/3
灰度化后的B=(处理前的R+处理前的G+处理前的B)/3
步骤S3、利用霍夫变换对步骤S2灰度化后的图像进行图形校正,如图4。
其具体方法如下:
在空间直角坐标系中一条直线可以表示为:
y=k*x+h
其中k表示斜率,h表示截距。对应在极坐标空间中为:
ρ=x*cosθ+y*sinθ
其中ρ表示直线到原点的距离,θ表示x轴到直线垂线的角度,取值范围为±90度。直角坐标空间中直线上的点(x,y)与极坐标空间中正弦曲线ρ相对应并在参数空间交于一点(ρ,θ),这个参数空间也被叫做霍夫空间。计算霍夫空间中经过每点的曲线数目就可以判断该点对应到直角坐标系上是不是有直线存在并得知相应直线的长度,之后求出一条与图像方向平行的直线,利用这条直线的角度就可以得出倾斜角度。最后根据直线倾斜角度判断该直线是水平方向还是竖直方向,并根据如下公式:
算出整个图像的倾斜角度,按相应角度旋转图像,完成图像的倾斜校正。其中,β表示图像的倾斜角度,α为线段的倾斜角度。
步骤S4、对步骤S3校正后的图像再次使用霍夫变换检测图像中的表格线,如图5。其中绿线是检测到的直线,黄点是直线的起点,红色是直线的终点。
步骤S5、为排除图像背景所产生的直线对步骤S4检测出的表格线的影响,通过确定纸质文案的4个顶点,分离出背景图像。
步骤S6、为解决步骤S5所得图像中表格直线间断的问题,利用定位步骤 S5所得图像的表格线的横纵交点,将横坐标或者纵坐标相等的交点连接起来的方法完成表格线的修复,如图6。并记录表格线的交点坐标信息。
手写字符识别部分作用识别出表格中的手写文字信息,并记录单元格的坐标信息,手写字符识别部分包括以下步骤:
步骤S7、对步骤S1输入的纸质文案图像,利用提取横坐标或纵坐标相等的单元格的方法完成文字域切分,如图7。并记录单元格矩形框的左上角坐标信息。
步骤S8、利用训练好的卷积神经网络模型对步骤S7中2提取的单元格完成表格内容识别。
步骤S9、分别对步骤S6中所记录的表格交点信息和修复的表格线,步骤S7所记录的单元格矩形框的左上角坐标信息的排版及步骤S8中所识别的表格内容输出到word文档,最终完成文案的重构。如图8。
虽然本发明主要描述了以上实施例,但是只是作为实施例来加以描述,而本发明并不限于此。本领域的技术人员能做出多种变型和应用而不脱离实施例的实质特性。例如,对实施例描述的每个步骤都可以修改和运行,与所述变型和应用相关的差异可认为包括在所附权利要求所限定的本发明的保护范围内。
Claims (4)
1.一种智能文案排版系统,其特征包括:
由图像灰度化处理、图像倾斜校正、图像表格识别共同完成的表格识别部分;
由表格内容提取、文字域切分、手写字符识别共同完成的手写字符识别部分;
由坐标标记完成的文案排版部分;
以及文案重构结果输出到word生成可编辑文件。
2.根据权利要求1所述智能文案排版系统,其特征包括:利用标记已识别出的表格线横纵交点的坐标,并将横坐标或者纵坐标相等的交点连接起来完成表格线的修复。同时,记录交点的坐标信息。
3.根据权利要求1所述智能文案排版系统,其特征包括:利用将横坐标或纵相等的单元格提取出来的方法完成文字域的切分,并利用经过训练好的卷积神经网络对文字域内手写字符的识别。同时,记录单元格矩形框的左上角坐标信息。
4.根据权利要求1所述智能文案排版系统,其特征包括:利用分别将权利要求2所述表格线交点坐标信息、修复的表格线和权利要求3所述的单元格矩形框的坐标信息、识别的手写字符输出到word的方法完成表格线和手写字符的重构。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010483074.0A CN111898402A (zh) | 2020-06-01 | 2020-06-01 | 一种智能排版系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010483074.0A CN111898402A (zh) | 2020-06-01 | 2020-06-01 | 一种智能排版系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111898402A true CN111898402A (zh) | 2020-11-06 |
Family
ID=73207661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010483074.0A Pending CN111898402A (zh) | 2020-06-01 | 2020-06-01 | 一种智能排版系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111898402A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113723252A (zh) * | 2021-08-23 | 2021-11-30 | 上海财联社金融科技有限公司 | 一种表格型文本图片的识别方法和系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110164813A1 (en) * | 2010-01-06 | 2011-07-07 | Canon Kabushiki Kaisha | Apparatus and method for digitizing documents |
CN106156761A (zh) * | 2016-08-10 | 2016-11-23 | 北京交通大学 | 面向移动终端拍摄的图像表格检测与识别方法 |
CN107066997A (zh) * | 2016-12-16 | 2017-08-18 | 浙江工业大学 | 一种基于图像识别的电气元件报价方法 |
CN108491789A (zh) * | 2018-03-20 | 2018-09-04 | 上海眼控科技股份有限公司 | 一种用于财务报表的汉字识别方法及装置 |
CN109086714A (zh) * | 2018-07-31 | 2018-12-25 | 国科赛思(北京)科技有限公司 | 表格识别方法、识别系统及计算机装置 |
CN109241894A (zh) * | 2018-08-28 | 2019-01-18 | 南京安链数据科技有限公司 | 一种基于表格定位和深度学习的针对性票据内容识别系统和方法 |
CN109726628A (zh) * | 2018-11-05 | 2019-05-07 | 东北大学 | 一种表格图像的识别方法及系统 |
CN110363095A (zh) * | 2019-06-20 | 2019-10-22 | 华南农业大学 | 一种针对表格字体的识别方法 |
CN110738219A (zh) * | 2019-10-15 | 2020-01-31 | 腾讯科技(深圳)有限公司 | 图像中线条提取方法和装置、存储介质及电子装置 |
-
2020
- 2020-06-01 CN CN202010483074.0A patent/CN111898402A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110164813A1 (en) * | 2010-01-06 | 2011-07-07 | Canon Kabushiki Kaisha | Apparatus and method for digitizing documents |
CN106156761A (zh) * | 2016-08-10 | 2016-11-23 | 北京交通大学 | 面向移动终端拍摄的图像表格检测与识别方法 |
CN107066997A (zh) * | 2016-12-16 | 2017-08-18 | 浙江工业大学 | 一种基于图像识别的电气元件报价方法 |
CN108491789A (zh) * | 2018-03-20 | 2018-09-04 | 上海眼控科技股份有限公司 | 一种用于财务报表的汉字识别方法及装置 |
CN109086714A (zh) * | 2018-07-31 | 2018-12-25 | 国科赛思(北京)科技有限公司 | 表格识别方法、识别系统及计算机装置 |
CN109241894A (zh) * | 2018-08-28 | 2019-01-18 | 南京安链数据科技有限公司 | 一种基于表格定位和深度学习的针对性票据内容识别系统和方法 |
CN109726628A (zh) * | 2018-11-05 | 2019-05-07 | 东北大学 | 一种表格图像的识别方法及系统 |
CN110363095A (zh) * | 2019-06-20 | 2019-10-22 | 华南农业大学 | 一种针对表格字体的识别方法 |
CN110738219A (zh) * | 2019-10-15 | 2020-01-31 | 腾讯科技(深圳)有限公司 | 图像中线条提取方法和装置、存储介质及电子装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113723252A (zh) * | 2021-08-23 | 2021-11-30 | 上海财联社金融科技有限公司 | 一种表格型文本图片的识别方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814722B (zh) | 一种图像中的表格识别方法、装置、电子设备及存储介质 | |
CN106156761B (zh) | 面向移动终端拍摄的图像表格检测与识别方法 | |
CN110378310B (zh) | 一种基于答案库的手写样本集的自动生成方法 | |
US6813381B2 (en) | Method and apparatus for identification of documents, and computer product | |
US6778703B1 (en) | Form recognition using reference areas | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
CN109784342B (zh) | 一种基于深度学习模型的ocr识别方法及终端 | |
CN110020692B (zh) | 一种基于印刷体模板的手写体分离与定位方法 | |
CN114299528B (zh) | 一种针对扫描文档的信息提取和结构化方法 | |
CN112183038A (zh) | 一种表格识别套打方法、计算机设备及计算机可读存储介质 | |
CN106980857B (zh) | 一种基于碑帖的毛笔字分割识别方法 | |
CN110738216A (zh) | 基于改进surf算法的药品识别方法 | |
CN115457565A (zh) | 一种ocr文字识别方法、电子设备及存储介质 | |
Tardón et al. | Optical music recognition for scores written in white mensural notation | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN112364834A (zh) | 一种基于深度学习和图像处理的表格识别的还原方法 | |
CN112541922A (zh) | 基于数字图像的试卷布局分割方法、电子设备及存储介质 | |
CN113011426A (zh) | 一种识别证件的方法和装置 | |
CN111626145A (zh) | 一种简捷有效的残缺表格识别及跨页拼接方法 | |
CN115512381A (zh) | 文本识别方法、装置、设备、存储介质及作业机械 | |
CN115063802A (zh) | 一种基于PSENet的圆形印章识别方法、设备及介质 | |
CN114663897A (zh) | 表格提取方法与表格提取系统 | |
CN112508000B (zh) | 一种用于ocr图像识别模型训练数据生成的方法及设备 | |
CN111898402A (zh) | 一种智能排版系统 | |
CN110826551B (zh) | 一种机动车vin码拓印模图像的智能甄别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: No.59 Daxue Road, Deyang City, Sichuan Province Applicant after: Wang Changlong Address before: No. 59, Daxue Road, Mianyang City, Sichuan Province Applicant before: Wang Changlong |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |