CN101877062A - 图像版面区域轮廓分析方法 - Google Patents
图像版面区域轮廓分析方法 Download PDFInfo
- Publication number
- CN101877062A CN101877062A CN2009102427941A CN200910242794A CN101877062A CN 101877062 A CN101877062 A CN 101877062A CN 2009102427941 A CN2009102427941 A CN 2009102427941A CN 200910242794 A CN200910242794 A CN 200910242794A CN 101877062 A CN101877062 A CN 101877062A
- Authority
- CN
- China
- Prior art keywords
- current region
- described current
- profile
- pixel
- boundary rectangle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明提出一种图像版面区域轮廓分析方法,属于数字图像处理技术及文字识别领域。该图像版面区域轮廓分析方法包括:步骤(1),计算每个版面区域的最小外接矩形;步骤(2),找出与当前区域外接矩形相交的其他区域外接矩形,如果没有所述其他区域,则记录所述当前区域外接矩形的顶点形成所述当前区域的直线多边形;如果有所述其他区域,则继续以下步骤;步骤(3),对所述当前区域外接矩形内的像素点分类标记;步骤(4),根据分类标记的像素点对所述当前区域外接矩形内的像素点进行分割;步骤(5),根据步骤(4)分割得到的像素点,获取所述当前区域的直线多边形轮廓;步骤(6),记录所述直线多边形轮廓的顶点,形成所述当前区域的直线多边形。
Description
技术领域
本发明属于数字图像处理技术及文字识别(OCR,Optical CharacterRecognition)技术领域,特别涉及一种图像版面区域轮廓分析方法。
背景技术
文档图像中的内容可以分为文本(text)、表格(table)、图像(picture)、图形(graphics)、分隔符(separator)等,由同一种内容构成的区域称为同质区域(homogeneous region)。版面分析就是将文档图像中的同质区域进行分割、标注的一种方法,它是进行文档图像分析(DIA,Document ImageAnalysis)和OCR处理的首要步骤。
文档图像经过版面分析后,得到一系列版面区域,为了后续处理方便,一般采用这些区域的最小外接矩形来对其轮廓进行分析。当各个区域外接矩形彼此无交叠时,这种分析方法是有效的。但是,当文档图像中存在不规则形状的文本、插入图片或者文档图像存在倾斜时,各区域的外接矩形会发生重叠,导致版面区域拟合的准确性差。
发明内容
本发明针对文档图像版面区域轮廓外接矩形分析方法存在的缺陷,提出了一种图像版面区域轮廓分析方法。所谓直线多边形,就是只由水平边和竖直边构成的多边形,它一方面能够对版面区域轮廓进行有效拟合,另一方面便于记录和处理。
为解决上述技术问题,本发明提供一种图像版面区域轮廓分析方法,该方法包括:步骤(1),计算每个版面区域的最小外接矩形;步骤(2),找出其外接矩形与当前区域外接矩形相交的其他区域,如果没有所述其他区域,则记录所述当前区域外接矩形的顶点形成所述当前区域的直线多边形;如果有所述其他区域,则继续以下步骤;步骤(3),对所述当前区域外接矩形内的像素点分类标记;步骤(4),根据分类标记的像素点对所述当前区域外接矩形内的像素点进行分割;步骤(5),根据步骤(4)分割得到的像素点,获取所述当前区域的直线多边形轮廓;步骤(6),记录所述直线多边形轮廓的顶点,形成所述当前区域的直线多边形。
优选地,步骤(3)中像素点包括:背景点、属于所述当前区域的前景点和属于所述其他区域的前景点。
优选地,步骤(4)中可以使用四叉树递归分割法分割所述当前区域外接矩形内的像素点。
优选地,所述四叉树递归分割法具体可以为:根据只含有背景点的叶子节点、只含有所述当前区域前景点的叶子节点、只含有其他区域前景点的叶子节点、含有背景点和属于所述当前区域的前景点的叶子节点、含有背景点和属于所述其他区域的前景点的叶子节点对所述当前区域外接矩形的像素点进行分割。
优选地,步骤(5)中可以将只含有所述当前区域前景点的叶子节点、只含有背景点和所述当前区域前景点的叶子节点加和得到所述当前区域的直线多边形轮廓。
优选地,所述步骤(6)具体可以为:在所述当前区域的直线多边形轮廓上,以任一顶点为起始点,按照顺序方向,依次记录所有的顶点,形成所述当前区域的直线多边形。
优选地,在步骤(1)之前还可以包括:
获取需要处理的文档图像;所述文档图像先进行二值化,然后进行版面分析,得到各个版面区域。
优选地,所述方法还可以包括步骤(7),优化所述直线多边形轮廓的顶点。
本发明还提供了一种图像版面区域分析系统,该系统包括:计算单元、判断单元、分类单元和分割单元,其中,
计算单元,用于计算所述所有版面区域的最小外接矩形;
判断单元,用于找出与当前区域外接矩形相交的其他区域外接矩形,如果没有所述其他区域,则记录所述当前区域外接矩形的顶点作为对所述当前区域轮廓的分析,并且结束分析;
分类单元,用于在所述判断单元找到所述其他区域外接矩形时对所述当前区域外接矩形内的像素点分类标记;
分割单元,用于对所述当前区域外接矩形内的像素点进行分割;
由计算单元根据所述分割单元分割得到的像素点获取所述当前区域的直线多边形轮廓,记录所述直线多边形轮廓的顶点,形成所述当前区域的直线多边形。
本发明中,通过直线多边形进行版面区域轮廓的分析,大大提高了版面区域轮廓拟合的准确性,方便了后续记录和处理。
附图说明
图1为本发明实施例中文档图像版面区域轮廓分析方法的流程图。
图2a为本发明实施例中文档图像的二值图像。
图2b为本发明实施例中文档图像版面分析结果。
图3为对图2b所示的版面区域201进行四叉树分割的示意图。
图4a为本实施例中的版面区域201根据四叉树分割得到的直线多边形轮廓。
图4b为本实施例中的版面区域201经直线多边形优化后的轮廓。
图5为本发明实施例的文档图像的直线多边形轮廓分析结果。
具体实施方式
为了能更清楚地理解本发明的技术内容,特举以下实施例详细说明。
本发明首先提供一文档图像版面区域轮廓分析方法的实施例,结合附图具体分析如下。
通过图像获取单元如扫描单元获取需要处理文档的图像,由分析单元对所述文档图像先进行二值化,然后进行版面分析,二值化和版面分析有很多成熟的算法,此处不赘述。经过版面分析后,得到一系列版面区域,需要对其轮廓进行直线多边形分析。图2a所示为本实施例中的文档图像的二值图像,图2b所示为本实施例中文档图像版面分析结果,版面共分为三个区域201、202、203,每个区域轮廓用其最小外接矩形分析,为了便于区分,三个区域用是三个不同的灰度级进行表示。
在通过版面分析得到各版面区域后,利用本发明提出的版面区域轮廓分析方法对各版面区域的轮廓进行分析。图1所示为本实施例的实施流程图,以图2b中的区域201为例,本实施例的版面区域轮廓分析方法的具体实施步骤如下:
步骤101,由计算单元计算文档图像所有版面区域的最小外接矩形。通过计算每个版面区域的最上端像素点、最下端像素点、最左端像素点、最右端像素点的位置,可得到版面区域的最小外接矩形,为叙述方便,后面简称为外接矩形。
步骤102,由判断单元找出与当前所要处理的版面区域外接矩形相交的其他区域外接矩形。如果没有其他区域外接矩形与当前区域外接矩形相交,则记录所述当前区域外接矩形的顶点形成所述当前区域的直线多边形;否则转入下一步。如图2b所示,版面区域203的外接矩形与版面区域201的外接矩形相交,所以继续执行下一步。
步骤103,由分类单元对当前所要处理的版面区域外接矩形内的像素点进行分类标记。所述当前区域外接矩形内的像素点可以分为三类,即背景点、属于所述当前区域的前景点和属于其他区域的前景点,这三类像素点可用不同的标识进行区分,比如,背景点用0表示,属于所述当前区域的前景点用1表示,属于其他区域的前景点用2表示。对像素点进行分类是为了下一步中四叉树递归分割使用。
步骤104,由分割单元利用四叉树递归分割方法分割所述当前区域外接矩形内的像素点。对像素点的分割时根据分类标记的像素点进行的。四叉树递归分割方法如下:其根节点对应于当前区域的外接矩形,将所述当前区域的外接矩形均分为四份,每个子矩形分别对应于四叉树的第一层四个节点中的一个,再将第一层各节点对应矩形分别均分为四份,则形成四叉树的第二层节点,以此类推,进行递归分割,当节点矩形范围内只含有单一类型像素点如只含有背景点的叶子节点、只含有所述当前区域前景点的叶子节点、只含有其他区域前景点的叶子节点或者含有背景点和属于所述当前区域的前景点或者含有背景点和属于其他区域的前景点时,节点停止分裂,该节点即为四叉树的叶子节点。对区域201,图3对其四叉树递归分割过程进行了描述。301为四叉树的根节点,对图像均分为4份后,得到四叉树的第一层节点,其中有三个节点需要进一步分割。以节点302为例,说明其整个递归分割过程:节点302均分为四份,得到四叉树的第二层节点,其中节点303需要进一步分割;将节点303均分为四份,得到四叉树的第三层节点,其中节点304、305需要进一步分割;将节点304、305分别均分为四份,得到四叉树的第四层节点,其中节点306、307需要进一步分割;将节点306、307分别均分为四份,得到四叉树的第五层节点,这些节点都不再需要进一步分割,节点302的递归分割过程结束。
步骤105,由计算单元根据上述分割所得四叉树叶子节点获取所述当前区域的直线多边形轮廓。经过四叉树递归分割后,四叉树中的所有叶子节点可分为五类,即只含有背景点的叶子节点(C1)、只含有所述当前区域前景点的叶子节点(C2)、只含有其他区域前景点的叶子节点(C3)、只含有背景点和所述当前区域前景点的叶子节点(C4)、只含有背景点和其他区域前景点的叶子节点(C5)。将类别为C2和C4的叶子节点加和得到的区域的轮廓,即为所述当前区域的直线多边形轮廓。图4a所示为版面区域201经过四叉树递归分割后得到的直线多边形轮廓。
步骤106,由计算单元记录直线多边形轮廓的顶点。在所述当前区域的直线多边形轮廓上,以某个顶点为起始点,按照一定顺序方向,依次记录所有的顶点,形成直线多边形。对版面区域201,以左上点为起始点,依次记录各顶点,结果为{(25,77),(25,732),(523,732),(523,692),(488,692),(488,609),(594,609),(594,527),(879,527),(879,517),(897,517),(897,493),(888,493),(888,486),(897,486),(897,445),(951,445),(951,404),(987,404),(987,363),(1022,363),(1022,322),(1164,322),(1164,77)},共24个顶点。
步骤107,由优化单元优化所述当前区域直线多边形轮廓的顶点。在上述得到的直线多边形顶点中,去掉某些顶点并不影响对当前区域轮廓分析的有效性,相反,由于顶点数目的减少,会简化后续处理,所以需要对已得的直线多边形顶点进行优化,即在不影响当前区域轮廓分析有效性的前提下,尽量减少顶点数目。优化时,每四个相邻顶点为一组,如果中间两个顶点相对于两端两个顶点形成凹陷或者凸起,且其凹陷或凸起区域内没有前景像素点,则可将该凹陷或凸起抹平,即可去掉中间两个顶点并调整两端顶点的坐标。逐顶点测试这种四点组,四点中如果存在已经被抹去的顶点,则跳过该组,如此遍历所有的顶点。最后,从顶点分析中去掉这些被抹去顶点,并去掉由于抹平而引起合并的直线多边形边上的多余顶点,得到最终的分析结果。对版面区域201,以左上点为起始点,依次记录各顶点,结果为{(25,77),(25,732),(488,732),(488,609),(594,609),(594,527),(879,527),(879,517),(888,517),(888,486),(897,486),(897,445),(951,445),(951,404),(987,404),(987,363),(1022,363),(1022,322),(1164,322),(1164,77)},共20个顶点。图4b为本实施例中的版面区域201经直线多边形优化后的轮廓。
当处理完一个版面区域后,该版面区域直线多边形轮廓内的像素点全部置为前景点,再进行其他未处理区域的处理。图5示出了当所有版面区域轮廓都经过直线多边形分析后的结果。
本发明中,通过直线多边形进行版面区域轮廓的分析,大大提高了版面区域轮廓拟合的准确性,方便了后续记录和处理。
Claims (10)
1.一种图像版面区域轮廓分析方法,其特征在于,包括:
步骤(1),计算每个版面区域的最小外接矩形;
步骤(2),找出与当前区域外接矩形相交的其他区域外接矩形,如果没有所述其他区域,则记录所述当前区域外接矩形的顶点形成所述当前区域的直线多边形;如果有所述其他区域,则继续以下步骤;
步骤(3),对所述当前区域外接矩形内的像素点分类标记;
步骤(4),根据分类标记的像素点对所述当前区域外接矩形内的像素点进行分割;
步骤(5),根据步骤(4)分割得到的像素点,获取所述当前区域的直线多边形轮廓;
步骤(6),记录所述直线多边形轮廓的顶点,形成所述当前区域的直线多边形。
2.根据权利要求1所述的方法,其特征在于,步骤(3)中像素点包括:背景点、属于所述当前区域的前景点和属于所述其他区域的前景点。
3.根据权利要求1所述的方法,其特征在于,步骤(4)中使用四叉树递归分割法分割所述当前区域外接矩形内的像素点。
4.根据权利要求3所述的方法,其特征在于,所述四叉树递归分割法为:根据只含有背景点的叶子节点、只含有所述当前区域前景点的叶子节点、只含有其他区域前景点的叶子节点、含有背景点和属于所述当前区域的前景点的叶子节点、含有背景点和属于所述其他区域的前景点的叶子节点对所述当前区域外接矩形的像素点进行分割。
5.根据权利要求4所述的方法,其特征在于,步骤(5)中将只含有所述当前区域前景点的叶子节点、只含有背景点和所述当前区域前景点的叶子节点加和得到所述当前区域的直线多边形轮廓。
6.根据权利要求1所述的方法,其特征在于,所述步骤(6)具体为:在所述当前区域的直线多边形轮廓上,以任一顶点为起始点,按照顺序方向,依次记录所有的顶点,形成所述当前区域的直线多边形。
7.根据权利要求1所述的方法,其特征在于,在步骤(1)之前还包括:
通过扫描获取需要处理的文档图像;
对所述文档图像先进行二值化,然后进行版面分析,得到各个版面区域。
8.根据权利要求1、6或7所述的方法,其特征在于,还包括步骤(7),优化所述直线多边形轮廓的顶点。
9.一种图像版面区域分析系统,其特征在于,包括:计算单元、判断单元、分类单元和分割单元,其中,
计算单元,用于计算各个版面区域的最小外接矩形;
判断单元,用于找出与当前区域外接矩形相交的其他区域外接矩形,如果没有所述其他区域,则记录所述当前区域外接矩形的顶点作为对所述当前区域轮廓的分析,并且结束分析;
分类单元,用于在所述判断单元找到所述其他区域外接矩形时对所述当前区域外接矩形内的像素点分类标记;
分割单元,用于对所述当前区域外接矩形内的像素点进行分割,由计算单元根据所述分割单元分割得到的像素点获取所述当前区域的直线多边形轮廓,记录所述直线多边形轮廓的顶点,形成所述当前区域的直线多边形。
10.根据权利要求9所述的系统,其特征在于,还包括:
图像获取单元,用于获取需要处理的文档的图像;
分析单元,用于对所述文档图像先进行二值化,然后进行版面分析,得到各个版面区域;
优化单元,用于对所述当前区域轮廓的直线多边形顶点进行优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102427941A CN101877062A (zh) | 2009-12-21 | 2009-12-21 | 图像版面区域轮廓分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102427941A CN101877062A (zh) | 2009-12-21 | 2009-12-21 | 图像版面区域轮廓分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101877062A true CN101877062A (zh) | 2010-11-03 |
Family
ID=43019614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009102427941A Pending CN101877062A (zh) | 2009-12-21 | 2009-12-21 | 图像版面区域轮廓分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101877062A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101989353A (zh) * | 2010-12-10 | 2011-03-23 | 中国科学院深圳先进技术研究院 | 图像抠图方法 |
CN103559500A (zh) * | 2013-10-15 | 2014-02-05 | 北京航空航天大学 | 一种基于光谱与纹理特征的多光谱遥感图像地物分类方法 |
CN103617610A (zh) * | 2013-11-07 | 2014-03-05 | 国家电网公司 | 根据区域发展规划图获得电网规划数据的方法 |
CN106407902A (zh) * | 2016-08-31 | 2017-02-15 | 西北工业大学 | 一种基于几何差异的飞机目标识别方法 |
CN107797972A (zh) * | 2017-10-26 | 2018-03-13 | 福建网龙计算机网络信息技术有限公司 | 一种显示字符的方法及终端 |
CN109948510A (zh) * | 2019-03-14 | 2019-06-28 | 北京易道博识科技有限公司 | 一种文档图像实例分割方法及装置 |
CN113177607A (zh) * | 2021-05-21 | 2021-07-27 | 浙江大华技术股份有限公司 | 一种对训练对象的标注方法及客户端 |
-
2009
- 2009-12-21 CN CN2009102427941A patent/CN101877062A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101989353A (zh) * | 2010-12-10 | 2011-03-23 | 中国科学院深圳先进技术研究院 | 图像抠图方法 |
CN101989353B (zh) * | 2010-12-10 | 2012-10-17 | 中国科学院深圳先进技术研究院 | 图像抠图方法 |
CN103559500A (zh) * | 2013-10-15 | 2014-02-05 | 北京航空航天大学 | 一种基于光谱与纹理特征的多光谱遥感图像地物分类方法 |
CN103559500B (zh) * | 2013-10-15 | 2016-11-23 | 北京航空航天大学 | 一种基于光谱与纹理特征的多光谱遥感图像地物分类方法 |
CN103617610A (zh) * | 2013-11-07 | 2014-03-05 | 国家电网公司 | 根据区域发展规划图获得电网规划数据的方法 |
CN103617610B (zh) * | 2013-11-07 | 2016-08-17 | 国家电网公司 | 根据区域发展规划图获得电网规划数据的方法 |
CN106407902A (zh) * | 2016-08-31 | 2017-02-15 | 西北工业大学 | 一种基于几何差异的飞机目标识别方法 |
CN107797972A (zh) * | 2017-10-26 | 2018-03-13 | 福建网龙计算机网络信息技术有限公司 | 一种显示字符的方法及终端 |
CN107797972B (zh) * | 2017-10-26 | 2020-12-18 | 福建网龙计算机网络信息技术有限公司 | 一种显示字符的方法及终端 |
CN109948510A (zh) * | 2019-03-14 | 2019-06-28 | 北京易道博识科技有限公司 | 一种文档图像实例分割方法及装置 |
CN113177607A (zh) * | 2021-05-21 | 2021-07-27 | 浙江大华技术股份有限公司 | 一种对训练对象的标注方法及客户端 |
CN113177607B (zh) * | 2021-05-21 | 2023-01-31 | 浙江大华技术股份有限公司 | 一种对训练对象的标注方法及客户端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814722B (zh) | 一种图像中的表格识别方法、装置、电子设备及存储介质 | |
CN110516208B (zh) | 一种针对pdf文档表格提取的系统及方法 | |
CN101877062A (zh) | 图像版面区域轮廓分析方法 | |
Kumar et al. | Segmentation of isolated and touching characters in offline handwritten Gurmukhi script recognition | |
US7298900B2 (en) | Image processing method, image processing apparatus and image processing program | |
CN105469027B (zh) | 针对文档图像的水平和垂直线检测和移除 | |
US10643094B2 (en) | Method for line and word segmentation for handwritten text images | |
US20120213429A1 (en) | System and method for extracting flowchart information from digital images | |
CN105426856A (zh) | 一种图像表格文字识别方法 | |
CN102156868A (zh) | 图像二值化方法和装置 | |
Arai et al. | Method for automatic e-comic scene frame extraction for reading comic on mobile devices | |
CN114005123A (zh) | 一种印刷体文本版面数字化重建系统及方法 | |
CN113537227B (zh) | 一种结构化文本识别方法及系统 | |
US20070133029A1 (en) | Method of recognizing text information from a vector/raster image | |
CN116311259B (zh) | 一种pdf业务文档的信息抽取方法 | |
CN106909869A (zh) | 一种矩阵式二维码的采样网格划分方法及装置 | |
US7769234B2 (en) | Ruled line extracting program, ruled line extracting apparatus and ruled line extracting method | |
CN112241730A (zh) | 一种基于机器学习的表格提取方法和系统 | |
CN116824608A (zh) | 基于目标检测技术的答题卡版面分析方法 | |
CN111611933A (zh) | 文档图像的信息提取方法及系统 | |
Liang et al. | Performance evaluation of document layout analysis algorithms on the UW data set | |
CN110516592A (zh) | 一种基于手写数字字符的识别方法 | |
CN106991753A (zh) | 一种图像二值化方法及装置 | |
CN108717544A (zh) | 一种基于智能图像分析的报纸样稿文字自动检测方法 | |
CN101901333B (zh) | 文本图像中切分词的方法及使用该方法的识别装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20101103 |