CN101425142A - 页面倾斜角度的确定方法和装置 - Google Patents

页面倾斜角度的确定方法和装置 Download PDF

Info

Publication number
CN101425142A
CN101425142A CNA2008102224815A CN200810222481A CN101425142A CN 101425142 A CN101425142 A CN 101425142A CN A2008102224815 A CNA2008102224815 A CN A2008102224815A CN 200810222481 A CN200810222481 A CN 200810222481A CN 101425142 A CN101425142 A CN 101425142A
Authority
CN
China
Prior art keywords
pixel
page
unit
angle
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008102224815A
Other languages
English (en)
Other versions
CN101425142B (zh
Inventor
亓文法
卢一锋
李晓龙
杨斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Peking University
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University
Priority to CN2008102224815A priority Critical patent/CN101425142B/zh
Publication of CN101425142A publication Critical patent/CN101425142A/zh
Application granted granted Critical
Publication of CN101425142B publication Critical patent/CN101425142B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种确定页面倾斜角度的方法,涉及数字图像处理技术领域,用于提高确定页面的倾斜角度的速度,该方法为:选取所述页面中的多个像素点;利用所述多个像素点进行直线拟和,确定拟和出的直线的斜率;根据确定的斜率确定所述页面的倾斜角度。本发明实施例还公开了一种确定页面倾斜角度的装置。采用本发明,能够大大提高确定页面的倾斜角度的速度。

Description

页面倾斜角度的确定方法和装置
技术领域
本发明涉及数字图像处理技术领域,尤其涉及一种页面倾斜角度的确定方法和装置。
背景技术
电子设备中存储的页面可能会存在一定的角度倾斜,比如,由于人为摆放位置因素或自动走纸机械本身存在误差等原因,纸质页面通过数码相机、高速扫描仪等图像获取设备转化为电子形式的页面后,该页面可能会存在一定的角度倾斜。
以文字识别、图像检索、表格自动录入等为目的的文档图像处理系统中,页面的倾斜会给整个系统的性能带来较大的影响,因此,对存在角度倾斜的页面进行位置校正是一项非常重要的预处理步骤。
在对页面进行位置校正时,首先需要确定页面的倾斜角度,若倾斜角度不为0,则根据确定的倾斜角度对页面进行旋转处理,使得页面的位置倾斜得到纠正。
目前,确定页面的倾斜角度的具体方法有:矩形块临接图算法、基于子空间直线检测法、基于傅立叶(Fourier)谱分析法、基于梯度分析法、神经网络法等。上述方法在确定页面的倾斜角度时,首先需要找出页面中的所有连通区域,然后根据该连通区域进行后续处理,由于一个页面中可能存在大量的连通区域,找到这些连通区域需要花费大量的时间,使得倾斜角度确定的整个流程的速度较低;另外由于处理的对象中包含很多不具备页面倾斜特征的元素,这些元素的干扰在一定程度上影响了倾斜角度检测的准确性。
发明内容
本发明实施例提供一种页面倾斜角度的确定方法,用于提高确定页面倾斜角度的速度。
本发明实施例提供一种确定页面倾斜角度的方法,该方法包括:
选取所述页面中的多个像素点;
利用所述多个像素点进行直线拟和,确定拟和出的直线的斜率;
根据确定的斜率确定所述页面的倾斜角度。
本发明实施例提供一种确定页面倾斜角度的装置,该装置包括:
像素点单元,用于选取所述页面中的多个像素点;
直线单元,用于利用所述像素点单元选取的多个像素点进行直线拟和;
斜率单元,用于确定所述拟和单元拟和出的直线的斜率;
倾斜角度单元,用于根据所述斜率单元确定的斜率确定所述页面的倾斜角度。
本发明中,通过对页面中的像素点进行直线拟和,根据拟和出的直线的斜率来确定页面的倾斜角度,实现起来较容易,能够大大提高确定页面的倾斜角度的速度。
附图说明
图1为本发明实施例提供的方法流程示意图;
图2为本发明实施例提供的方法实例的流程示意图;
图3A为本发明实施例中的原始页面示意图;
图3B为本发明实施例中对原始页面进行区域划分后的示意图;
图4A为本发明实施例中确定的文本区域中字符的外接矩形的示意图;
图4B为本发明实施例中对图4A中的外接矩形按文本行进行分组的示意图;
图4C为本发明实施例中图4B中字符的外接矩形的中心点示意图;
图5为本发明实施例提供的装置的结构示意图。
具体实施方式
在确定页面的倾斜角度时,为了提高处理速度,本发明实施例提供一种页面倾斜角度的确定方法,本方法中,通过选取页面中的多个像素点,利用选取的多个像素点进行直线拟和,根据拟和出的直线的斜率确定页面的倾斜角度。
参见图1,本发明实施例提供的页面倾斜角度的确定方法,具体包括:
步骤101:选取页面中的多个像素点;
步骤102:利用选取的多个像素点进行直线拟和;
步骤103:确定拟和出的直线的斜率;
步骤104:根据确定的斜率确定页面的倾斜角度。
参见图2,本发明实施例提供的上述方法应用在可能包含文本区域、图像区域、表格区域的复杂页面中,其具体实现如下:
步骤201:对待校正页面进行区域划分,划分后的页面包括一个或多个版面区域,某个版面区域的类别为文本区域或表格区域或图像区域;
本步骤中,对于文本区域来说,该区域内仅包含属于文字类的像素点;对于表格区域来说,该区域内仅包含属于表格类的像素点;对于图像区域来说,该区域内仅包含属于图像类的像素点。
可以采用基于神经的模糊学习算法对待校正页面进行区域划分,该算法中,首先将页面中的像素点进行分类,分类后,某个像素点属于文字类或图像类或表格类;然后,通过经典的形态学操作将像素点进行分组,在同一组内的像素点构成一个连通的区域,该区域内的所有像素点属于文字类或图像类或表格类,若该区域内的所有像素点属于文字类,则该区域为文本区域,若该区域内的所有像素点属于表格类,则该区域为表格区域,若该区域内的所有像素点属于图像类,则该区域为图像区域;最后,基于形状规则,提炼分类结果,最终得到精确的版面区域划分。如图3A所示,为原始的进行版面分析之前的页面,如图3B所示,为采用基于神经的模糊学习算法进行版面分析之后得到的区域划分示意图,该页面包括4个文本(TEXT)区域、1个表格(TABLE)区域和一个图像(IMAGE)区域。
基于神经的模糊学习算法的具体实现可以参见文献:Laura Caponetti,CiroCastiello,Przemyslaw Górecki.“Document page segmentation using neuro-fuzzyapproach”,Applied Soft Computing,2008,Page(s):118-126。
步骤202:根据分析结果判断待校正页面中是否包含文本区域,若是,则到步骤203;否则到步骤204;
步骤203:确定待校正页面中包含的各个文本区域的倾斜角度;
本步骤中,确定文本区域的倾斜角度,具体包括如下两个步骤:
步骤A:利用直线拟和算法在文本区域中拟和出能够体现文本区域倾斜特征的基准直线;
步骤B:利用拟和出的基准直线确定文本区域的倾斜角度。
若文本区域中的文字采用横排方式排列,步骤A的具体实现如下:
步骤A1:对文本区域内的文字进行字符切分;
步骤A2:确定各个字符的外接矩形,如图4A所示;
步骤A3:将确定的各个外接矩形进行分组,将同一文本行内的字符的外接矩形分为同一分组;
具体的,对于文本区域内最左边的某个外接矩形,将该外接矩形作为起始外接矩形,并将该起始外接矩形加入第一分组,在当前起始外接矩形周围搜索与该起始外接矩形的距离最近、并且距离小于文本行间距的另一个外接矩形,将该另一个外接矩形作为起始外接矩形,并将该起始外接矩形加入第一分组;
再在当前起始外接矩形周围搜索与该起始外接矩形的距离最近、该距离小于文本行间距、并且未包含在第一分组中的另一个外接矩形,将该另一个外接矩形作为起始外接矩形,继续进行搜索。如此循环,直到找不到与当前起始外接矩形的距离小于文本行间距、并且未包含在第一分组中的其他外接矩形时,第一分组确定完毕,第一分组中的外接矩形属于同一文本行内字符的外接矩形。
按照上述方法,对于文本区域内最左边的其他外接矩形,可以分别确定一个分组。
如图4B所示,对于附图4A所示的文本区域,以字符“市”的外接矩形开始进行搜索,得到第一分组,该分组中包含以下字符的外接矩形:“市”、“重”、“点”、“发”、“展”、“的”、“电”、“子”、“信”、“息”、“产”;以字符“业”的外接矩形开始进行搜索,得到第二分组,该分组中包含以下字符的外接矩形:“业”、“务”、“必”、“将”、“不”、“断”、“做”、“大”、“做”、“强”;以字符“有”的外接矩形开始进行搜索,得到第三分组,该分组中包含以下字符的外接矩形:“有”、“利”、“于”、“产”、“业”、“结”、“构”、“优”、“化”、“升”。
步骤A4:选取一个或多个分组;
步骤A5:对于选取的每个分组,确定该分组内的外接矩形的特征点,利用直线拟和算法将确定的各个特征点拟和为一条直线,将拟和出的直线作为能够体现文本区域倾斜特征的基准直线。
外接矩形的特征点可以是外接矩形的中心点、顶点等,根据分组内各个外接矩形的中心点可以拟和得到一条基准直线,如图4C所示,为某个字符的外接矩形的中心点;根据分组内各个外接矩形的左上顶点可以拟和得到一条基准直线,根据分组内各个外接矩形的左下顶点可以拟和得到一条基准直线,根据分组内各个外接矩形的右上顶点可以拟和得到一条基准直线,根据分组内各个外接矩形的右下顶点可以拟和得到一条基准直线,因此,根据特征点选取个数的不同,对于一个分组可以拟和出的一个或多个基准直线。
若文本区域中字符按照竖排方式排列,则步骤A的具体实现与步骤A1到步骤A5相似,不同之处仅在于步骤A3中是将同一文本列内的字符的外接矩形分为同一分组,具体实现时是对于文本区域内最上边的各个外接矩形分别确定分组。
步骤A中若确定了一条基准直线,步骤B中,根据该基准直线确定文本区域的倾斜角度的方法为:计算该基准直线的斜率,将计算得到的斜率对应的角度值确定为文本区域的倾斜角度。例如,计算得到的基准直线的斜率为1,那么文本区域的倾斜角度为45度;计算得到的基准直线的斜率为-1,那么文本区域的倾斜角度为135度;计算得到的基准直线的斜率为0,那么文本区域的倾斜角度为0度。
步骤A中若确定了多条基准直线,步骤B中,根据该多条基准直线确定文本区域的倾斜角度的方法可以有多种,例如:
第一种,从确定的多条基准直线中选择一条基准直线,计算选择的基准直线的斜率,将该斜率对应的角度值确定为文本区域的倾斜角度;
第二种,首先,对于确定的每条基准直线:计算基准直线的斜率,将计算得到的斜率对应的角度值确定为该基准直线的倾斜角度;然后,将确定的每条基准直线的倾斜角度进行加权平均,将相加平均结果确定为文本区域的倾斜角度。
本文中提及的直线拟和算法有:最小二乘法、线性回归算法、Hough变换算法等。
步骤204:根据分析结果判断待校正页面中是否包含表格区域,若是,则到步骤205;否则到步骤206;
步骤205:确定待校正页面中包含的各个表格区域的倾斜角度;
本步骤中,确定表格区域的倾斜角度,具体包括步骤C和步骤D:
步骤C:在表格区域中确定出能够体现表格区域倾斜特征的基准直线;
步骤D:利用拟和出的基准直线确定表格区域的倾斜角度。
步骤C的具体实现可以有多种方式,例如:
第一种,具体包括如下步骤:
步骤C01:识别表格区域中的表格单元线;
步骤C02:从识别出的表格单元线中选取一条表格单元线,利用直线拟和算法将选取的表格单元线上的像素点拟和为一条直线,将拟和出的直线确定为能够体现表格区域倾斜特征的基准直线。
第二种,具体包括如下步骤:
步骤C11:识别表格区域中的表格单元线;
步骤C12:将识别出的表格单元线进行分组;
具体分组方法为:首先,取出识别出的一条表格单元线1,计算该表格单元线1的方向角度,将计算得到的角度值记为主方向角度值α1,并将表格单元线1加入第一分组;接着,取出识别出的其他表格单元线2,计算表格单元线2的方向角度,判断计算得到的方向角度与α1之差的绝对值是否小于预定的角度阈值,若是,则将表格单元线2加入第一分组,否则,将表格单元线2加入第二分组,并记表格单元线2的方向角度为主方向角度值α2;在确定两个主方向角度值后,遍历识别出的其他还未加入分组的各条表格单元线,判断该表格单元线的方向角度与α1之差的绝对值小于预定的角度阈值或是与α2之差的绝对值小于预定的角度阈值,如果与α1之差的绝对值小于预定的角度阈值,则将该表格单元线加入第一分组,如果与α2之差的绝对值小于预定的角度阈值,则将该表格单元线加入第二分组。预定的角度阈值的取值可以根据需要设置,具体可以取45度或小于45度的其他值。
上述计算表格单元线的方向角度的方法为:计算该表格单元线的两个端点所构成的直线的斜率,确定该斜率对应的角度值,将计算得到的角度值作为该表格单元线的方向角度。
步骤C13:选取一个分组,将该分组中各个表格单元线上的像素点拟和为一条直线。将拟和出的直线确定为能够体现表格区域倾斜特征的基准直线。
第三种,具体包括如下步骤:
步骤C21:识别表格区域中的表格单元线;
步骤C22:将识别出的表格单元线进行分组;具体实现方法可以参见对步骤C12的描述。
步骤C23:选取多个分组,对于每个分组,将该分组中的各个表格单元线上的像素点拟和为一条直线。将拟和出的各条直线确定为能够体现表格区域倾斜特征的基准直线。
较佳的,在根据某个分组中的表格单元线上的像素点拟和出直线后,可以进一步判断该分组内各表格单元线上的所有像素点到拟和出的直线的距离的方差,是否小于预定的方差阈值,如果小于,则将该拟和出的直线确定为基准直线,否则,说明直线拟和精度较差,不将该拟和出的直线确定为基准直线。
对应于步骤C的三种实现方式,步骤D也有以下三种实现方式:
对应于步骤C的第一种实现方式,步骤D的实现方式为:计算选取的一个表格单元线的斜率,确定该斜率对应的角度值,将该角度值确定为表格区域的倾斜角度。
对应于步骤C的第二种实现方式,步骤D的实现方式为:计算选取的分组中的各条基准直线的斜率,确定计算得到的各个斜率对应的角度值,将确定出的各个角度值进行加权平均,将加权平均结果确定为表格区域的倾斜角度。
对应于步骤C的第三种实现方式,步骤D的实现方式为:首先,对于选取的每个分组:计算该分组中的各条基准直线的斜率,确定计算得到的各个斜率对应的角度值,将确定出的各个角度值进行加权平均;然后,将各个加权平均结果再进行加权平均,将该加权平均结果确定为表格区域的倾斜角度。
步骤206:根据分析结果判断待校正页面中是否包含图像区域,若是,则到步骤207;否则到步骤208;
步骤207:确定待校正页面中包含的各个图像区域的倾斜角度;
本步骤中,确定图像区域的倾斜角度的方法,具体包括步骤E和步骤F:
步骤E:在图像区域中确定出能够体现图像区域倾斜特征的基准直线;
步骤F:根据确定的基准直线确定图像区域的倾斜角度。
在步骤E中,确定图像区域的基准直线的具体方法包括:
步骤E1:确定图像区域的边缘像素点;
具体的,对于二值图像,确定图像区域的边缘像素点的方法为:首先,确定图像区域的外接矩形;然后,对外接矩形的像素点二维矩阵的每一列或每一行进行扫描,在扫描某一列或某一行时,将该列中的某个或某几个像素点作为边缘像素点,边缘像素点需满足如下条件:该边缘像素点之前的设定数量的像素点为白色像素点,该边缘像素点为黑色像素点,该边缘像素点之后的设定数量的像素点为黑色像素点;或者,该边缘像素点之前的设定数量的像素点为黑色像素点,该边缘像素点为黑色像素点,该边缘像素点之后的设定数量的像素点为白色像素点。设定数量可以根据需要设置,具体可以取4或大于4的整数。
对于灰度图像,可以采用基于方向导数的边缘检测算法进行边缘检测,得到图像区域的边缘像素点,边缘检测算法有:Robert边缘算法、Sobel边缘算法、拉普拉斯算子、Canny算法等。
步骤E2:利用直线拟和算法将边缘像素点拟和为一条直线,将该直线确定为图像区域的基准直线。
较佳的,在拟和出直线后,可以进一步判断所有边缘像素点到拟和出的直线的距离的方差,是否小于预定阈值,如果小于,则将该拟和出的直线确定为基准直线,否则,说明直线拟和精度较差,不将该拟和出的直线确定为基准直线,认为无法确定图像区域的倾斜角度。
在步骤F中,计算确定的基准直线的斜率,将计算得到的斜率对应的角度值确定为图像区域的倾斜角度。
步骤208:根据确定的各个倾斜角度确定待校正页面的倾斜角度。
本步骤中,待校正页面的倾斜角度的具体确定方法有多种,例如:
第一种,从确定的倾斜角度中选取一个作为待校正页面的倾斜角度;
第二种,将确定的所有或部分倾斜角度进行加权平均,将加权平均结果确定为待校正页面的倾斜角度;在进行加权平均时,每个倾斜角度的权重可以根据预先定义的函数确定。
需要说明的是,步骤202和步骤203、步骤204和步骤205、步骤206和步骤207,三者的执行顺序并不限于附图2所示的顺序,还可以是其它任意执行顺序,或者,三者也可以并行执行。
在确定待校正页面的倾斜角度后,可以根据确定出的倾斜角度对页面进行旋转处理,以达到纠正页面位置的目的。例如,若确定出待校正页面的倾斜角度为45度,则将页面逆时针转动45度,若确定出待校正页面的倾斜角度为-45度,则将页面顺时针转动45度。
较佳的,为了使得页面倾斜角度的确定结果更加准确,在步骤201之前,可以将待纠正页面进行预处理,预处理内容包括:采用固定阈值化方法,比如大津法、迭代法和双峰法等,将待纠正页面进行二值化处理;通过移除待纠正页面中的小连通区域的方法进行噪音去除等。
参见图5,本发明实施例还提供一种确定页面倾斜角度的装置,该装置包括:
像素点单元50,用于选取所述页面中的多个像素点;
直线单元51,用于利用所述像素点单元选取的多个像素点进行直线拟和;
斜率单元52,用于确定所述拟和单元拟和出的直线的斜率;
倾斜角度单元53,用于根据所述斜率单元确定的斜率确定所述页面的倾斜角度。
所述像素点单元50包括:
文本单元,用于在所述页面中包含文本区域时,确定所述文本区域内的字符的外接矩形;
特征点单元,用于选取所述文本区域中同一文本行或同一文本列中各个字符的外接矩形的特征点,将选取的各个特征点作为所述多个像素点。
所述外接矩形的特征点为:
所述外接矩形的中心点,或所述外接矩形的顶点,或所述外接矩形的边上的点。
所述像素点单元50包括:
表格线单元,用于在所述页面中包含表格区域时,识别所述表格区域中的表格单元线;
第一选取单元,用于选取所述表格线单元识别出的表格单元线上的像素点作为所述多个像素点。
所述第一选取单元包括:
第一选择单元,用于从所述表格线单元识别出的表格单元线中选择一条表格单元线;
第一结果单元,用于选取所述第一选择单元所选择的表格单元线上的像素点作为所述多个像素点。
所述第一选取单元包括:
第二选择单元,用于从所述表格线单元识别出的表格单元线中选择倾斜角度的差值小于预定的角度阈值的表格单元线;
第二结果单元,用于选取所第二选择单元所选择的表格单元线上的像素点作为所述多个像素点。
所述像素点单元50包括:
检测单元,用于在所述页面中包含图像区域时,检测所述图像区域的边缘像素点;
第二选取单元,用于选取所述检测单元检测得到的边缘像素点作为所述多个像素点。
所述检测单元包括:
图像单元,用于确定所述图像区域的外接矩形;
扫描单元,用于对所述外接矩形对应的像素点二维矩阵进行行扫描或列扫描,将扫描到的满足设定条件的像素点作为所述图像区域的边缘像素点,所述设定条件为:
所述像素点之前的设定数量的像素点为白色像素点,所述像素点为黑色像素点,所述像素点之后的设定数量的像素点为黑色像素点;或者,所述像素点之前的设定数量的像素点为黑色像素点,所述像素点为黑色像素点,所述像素点之后的设定数量的像素点为白色像素点。
所述倾斜角度单元53包括:
计算单元,计算确定出的斜率对应的角度值;
确定单元,用于从所述计算单元计算得到的角度值中选择一个角度值,将选择的角度值确定为所述页面的倾斜角度;或者,将计算得到的角度值进行加权平均,将加权平均结果确定为所述页面的倾斜角度。
该装置进一步包括:
方差单元54,用于计算所述多个像素点到利用该多个像素点拟和出的直线的距离的方差,判断所述方差是否小于预定的方差阈值;所述直线单元51用于:在所述方差单元判断所述方差小于预定的方差阈值时,确定拟和出的直线的斜率。
该装置进一步包括:
预处理单元55,用于在选取所述页面中的多个像素点之前,对所述页面进行二值化处理和/或噪声去除处理。
该装置进一步包括:
纠正单元56,用于在确定所述页面的倾斜角度之后,根据该倾斜角度对所述页面进行位置旋转处理。
综上,本发明的有益效果在于:
本发明中,通过对页面中的像素点进行直线拟和,根据拟和出的直线的斜率来确定页面的倾斜角度,实现起来较容易,能够大大提高确定页面的倾斜角度的速度。
同时,本发明中,将页面划分为文字区域、图像区域和表格区域三类区域,然后分别采用不同的方法选取像素点并进行直线拟和,对于图像区域和表格区域而言,由于图像内部的细节和表格内的文字块不具备明显的倾斜特征,对于页面倾斜角度确定的贡献不大,因此在选取像素点时未考虑图像内部的细节和表格内的文字块,有利于提高确定倾斜角度的速度,同时也保证了较高的准确性。对于文本区域而言,选取字符的外接矩形的特征点,包括中心点、顶点等,进行直线拟和,由于中心点以及顶点拟和出的直线最能代表页面实际的倾斜特征,因此不仅大大提高了确定倾斜角度的速度,同时也保证了较高的准确性。将页面划分为文字区域、图像区域和表格区域三类区域,可以适用于复杂结构的页面,具有普遍应用意义。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (22)

1、一种确定页面倾斜角度的方法,其特征在于,该方法包括:
选取所述页面中的多个像素点;
利用所述多个像素点进行直线拟和,确定拟和出的直线的斜率;
根据确定的斜率确定所述页面的倾斜角度。
2、如权利要求1所述的方法,其特征在于,在所述页面中包含文本区域时,所述选取所述页面中的多个像素点包括:
确定所述文本区域内的字符的外接矩形;
选取同一文本行或同一文本列中各个字符的外接矩形的特征点;
将选取的各个特征点作为所述多个像素点。
3、如权利要求2所述的方法,其特征在于,所述外接矩形的特征点为:
所述外接矩形的中心点,或所述外接矩形的顶点,或所述外接矩形的边上的点。
4、如权利要求1所述的方法,其特征在于,在所述页面中包含表格区域时,所述选取所述页面中的多个像素点包括:
识别所述表格区域中的表格单元线;
选取识别出的表格单元线上的像素点作为所述多个像素点。
5、如权利要求4所述的方法,其特征在于,所述选取识别出的表格单元线上的像素点作为所述多个像素点包括:
从识别出的表格单元线中选择一条表格单元线;
选取所选择的表格单元线上的像素点作为所述多个像素点。
6、如权利要求4所述的方法,其特征在于,所述选取识别出的表格单元线上的像素点作为所述多个像素点包括:
确定识别出的表格单元线的两个主方向角度值;
根据所述两个主方向角度值将识别出的表格单元线进行分组;
选取同一分组中的表格单元线上的像素点作为所述多个像素点。
7、如权利要求1所述的方法,其特征在于,在所述页面中包含图像区域时,所述选取所述页面中的多个像素点包括:
检测所述图像区域的边缘像素点;
选取检测得到的边缘像素点作为所述多个像素点。
8、如权利要求7所述的方法,其特征在于,在所述图像区域中的图像为二值图像时,所述检测所述图像区域的边缘像素点包括:
确定所述图像区域的外接矩形;
对所述外接矩形对应的像素点二维矩阵进行行扫描或列扫描,将扫描到的满足设定条件的像素点作为所述图像区域的边缘像素点,所述设定条件为:
所述像素点之前的设定数量的像素点为白色像素点,所述像素点为黑色像素点,所述像素点之后的设定数量的像素点为黑色像素点;或者,所述像素点之前的设定数量的像素点为黑色像素点,所述像素点为黑色像素点,所述像素点之后的设定数量的像素点为白色像素点。
9、如权利要求1-8中任一所述的方法,其特征在于,所述根据确定的斜率确定所述页面的倾斜角度包括:
计算确定出的斜率对应的角度值;
从计算得到的角度值中选择一个角度值,将选择的角度值确定为所述页面的倾斜角度;或者,将计算得到的角度值进行加权平均,将加权平均结果确定为所述页面的倾斜角度。
10、如权利要求1所述的方法,其特征在于,在利用所述多个像素点进行直线拟和之后,并且确定拟和出的直线的斜率之前,该方法进一步包括:
计算所述多个像素点到利用该多个像素点拟和出的直线的距离的方差;
判断所述方差是否小于预定的方差阈值;
所述确定拟和出的直线的斜率包括:
在判断所述方差小于预定的方差阈值时,确定拟和出的直线的斜率。
11、如权利要求1所述的方法,其特征在于,在选取所述页面中的多个像素点之前,该方法进一步包括:
对所述页面进行图像二值化处理和/或噪声去除处理。
12、一种确定页面倾斜角度的装置,其特征在于,该装置包括:
像素点单元,用于选取所述页面中的多个像素点;
直线单元,用于利用所述像素点单元选取的多个像素点进行直线拟和;
斜率单元,用于确定所述拟和单元拟和出的直线的斜率;
倾斜角度单元,用于根据所述斜率单元确定的斜率确定所述页面的倾斜角度。
13、如权利要求12所述的装置,其特征在于,所述像素点单元包括:
文本单元,用于在所述页面中包含文本区域时,确定所述文本区域内的字符的外接矩形;
特征点单元,用于选取所述文本区域中同一文本行或同一文本列中各个字符的外接矩形的特征点,将选取的各个特征点作为所述多个像素点。
14、如权利要求13所述的装置,其特征在于,所述外接矩形的特征点为:
所述外接矩形的中心点,或所述外接矩形的顶点,或所述外接矩形的边上的点。
15、如权利要求12所述的装置,其特征在于,所述像素点单元包括:
表格线单元,用于在所述页面中包含表格区域时,识别所述表格区域中的表格单元线;
第一选取单元,用于选取所述表格线单元识别出的表格单元线上的像素点作为所述多个像素点。
16、如权利要求15所述的装置,其特征在于,所述第一选取单元包括:
第一选择单元,用于从所述表格线单元识别出的表格单元线中选择一条表格单元线;
第一结果单元,用于选取所述第一选择单元所选择的表格单元线上的像素点作为所述多个像素点。
17、如权利要求15所述的装置,其特征在于,所述第一选取单元包括:
第二选择单元,用于确定所述表格线单元识别出的表格单元线的两个主方向角度值,根据所述两个主方向角度值将识别出的表格单元线进行分组;
第二结果单元,用于选取同一分组中的表格单元线上的像素点作为所述多个像素点。
18、如权利要求12所述的装置,其特征在于,所述像素点单元包括:
检测单元,用于在所述页面中包含图像区域时,检测所述图像区域的边缘像素点;
第二选取单元,用于选取所述检测单元检测得到的边缘像素点作为所述多个像素点。
19、如权利要求18所述的装置,其特征在于,所述检测单元包括:
图像单元,用于确定所述图像区域的外接矩形;
扫描单元,用于对所述外接矩形对应的像素点二维矩阵进行行扫描或列扫描,将扫描到的满足设定条件的像素点作为所述图像区域的边缘像素点,所述设定条件为:
所述像素点之前的设定数量的像素点为白色像素点,所述像素点为黑色像素点,所述像素点之后的设定数量的像素点为黑色像素点;或者,所述像素点之前的设定数量的像素点为黑色像素点,所述像素点为黑色像素点,所述像素点之后的设定数量的像素点为白色像素点。
20、如权利要求12-19中任一所述的装置,其特征在于,所述倾斜角度单元包括:
计算单元,计算确定出的斜率对应的角度值;
确定单元,用于从所述计算单元计算得到的角度值中选择一个角度值,将选择的角度值确定为所述页面的倾斜角度;或者,将计算得到的角度值进行加权平均,将加权平均结果确定为所述页面的倾斜角度。
21、如权利要求12所述的装置,其特征在于,该装置进一步包括:
方差单元,用于计算所述多个像素点到利用该多个像素点拟和出的直线的距离的方差,判断所述方差是否小于预定的方差阈值;
所述直线单元用于:
在所述方差单元判断所述方差小于预定的方差阈值时,确定拟和出的直线的斜率。
22、如权利要求12所述的装置,其特征在于,该装置进一步包括:
预处理单元,用于在选取所述页面中的多个像素点之前,对所述页面进行图像二值化处理和/或噪声去除处理。
CN2008102224815A 2008-09-17 2008-09-17 页面倾斜角度的确定方法和装置 Expired - Fee Related CN101425142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102224815A CN101425142B (zh) 2008-09-17 2008-09-17 页面倾斜角度的确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102224815A CN101425142B (zh) 2008-09-17 2008-09-17 页面倾斜角度的确定方法和装置

Publications (2)

Publication Number Publication Date
CN101425142A true CN101425142A (zh) 2009-05-06
CN101425142B CN101425142B (zh) 2011-05-11

Family

ID=40615746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102224815A Expired - Fee Related CN101425142B (zh) 2008-09-17 2008-09-17 页面倾斜角度的确定方法和装置

Country Status (1)

Country Link
CN (1) CN101425142B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101924856A (zh) * 2009-06-17 2010-12-22 北京大学 文稿倾斜角度检测的方法和装置
CN102201053A (zh) * 2010-12-10 2011-09-28 上海合合信息科技发展有限公司 一种文本图像的切边方法
CN102938062A (zh) * 2012-10-16 2013-02-20 山东山大鸥玛软件有限公司 一种基于内容的文档图像倾斜角估计方法
CN101639933B (zh) * 2009-07-16 2013-03-27 上海合合信息科技发展有限公司 图像旋转校正方法及系统、电子设备
CN103400130A (zh) * 2013-07-22 2013-11-20 哈尔滨工业大学 基于能量最小化框架的文档图像倾斜度检测与纠正方法
CN105426887A (zh) * 2015-10-30 2016-03-23 北京奇艺世纪科技有限公司 一种文本图像校正的方法及装置
CN105913060A (zh) * 2016-04-29 2016-08-31 广东小天才科技有限公司 图片的校正方法、装置及智能设备
CN105913061A (zh) * 2016-04-29 2016-08-31 广东小天才科技有限公司 图片的校正方法及装置
CN106295632A (zh) * 2016-08-03 2017-01-04 广东小天才科技有限公司 搜题内容的调整方法及装置
CN107680108A (zh) * 2017-07-28 2018-02-09 平安科技(深圳)有限公司 倾斜图像的倾斜值获取方法、装置、终端及存储介质
CN108600644A (zh) * 2018-07-17 2018-09-28 广东小天才科技有限公司 一种拍照方法、装置及可穿戴设备
CN109993161A (zh) * 2019-02-25 2019-07-09 众安信息技术服务有限公司 一种文本图像旋转矫正方法及系统
CN110135217A (zh) * 2018-02-02 2019-08-16 兴业数字金融服务(上海)股份有限公司 用于识别图像中的表格内的字符的方法和装置
CN110211048A (zh) * 2019-05-28 2019-09-06 湖北华中电力科技开发有限责任公司 一种基于卷积神经网络的复杂档案图像倾斜矫正方法
CN110363196A (zh) * 2019-06-20 2019-10-22 吴晓东 一种倾斜文本的文字精准识别的方法
CN111062874A (zh) * 2019-12-12 2020-04-24 腾讯科技(深圳)有限公司 文本图像显示方法、装置、设备及存储介质
CN111985459A (zh) * 2020-09-18 2020-11-24 北京百度网讯科技有限公司 表格图像校正方法、装置、电子设备和存储介质
CN116664554A (zh) * 2023-07-26 2023-08-29 微山晟轩机械制造有限公司 一种基于图像处理的螺栓螺纹缺陷检测方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427939A (zh) * 2019-08-02 2019-11-08 泰康保险集团股份有限公司 校正倾斜文本图像的方法、装置、介质及电子设备

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101924856A (zh) * 2009-06-17 2010-12-22 北京大学 文稿倾斜角度检测的方法和装置
CN101639933B (zh) * 2009-07-16 2013-03-27 上海合合信息科技发展有限公司 图像旋转校正方法及系统、电子设备
CN102201053A (zh) * 2010-12-10 2011-09-28 上海合合信息科技发展有限公司 一种文本图像的切边方法
CN102201053B (zh) * 2010-12-10 2013-07-24 上海合合信息科技发展有限公司 一种文本图像的切边方法
US9082192B2 (en) 2010-12-10 2015-07-14 Intsig Information Co., Ltd Text image trimming method
CN102938062A (zh) * 2012-10-16 2013-02-20 山东山大鸥玛软件有限公司 一种基于内容的文档图像倾斜角估计方法
CN102938062B (zh) * 2012-10-16 2015-08-19 山东山大鸥玛软件有限公司 一种基于内容的文档图像倾斜角估计方法
CN103400130B (zh) * 2013-07-22 2016-07-20 哈尔滨工业大学 基于能量最小化框架的文档图像倾斜度检测与纠正方法
CN103400130A (zh) * 2013-07-22 2013-11-20 哈尔滨工业大学 基于能量最小化框架的文档图像倾斜度检测与纠正方法
CN105426887A (zh) * 2015-10-30 2016-03-23 北京奇艺世纪科技有限公司 一种文本图像校正的方法及装置
CN105426887B (zh) * 2015-10-30 2019-04-12 北京奇艺世纪科技有限公司 一种文本图像校正的方法及装置
CN105913060A (zh) * 2016-04-29 2016-08-31 广东小天才科技有限公司 图片的校正方法、装置及智能设备
CN105913061A (zh) * 2016-04-29 2016-08-31 广东小天才科技有限公司 图片的校正方法及装置
CN106295632A (zh) * 2016-08-03 2017-01-04 广东小天才科技有限公司 搜题内容的调整方法及装置
CN107680108A (zh) * 2017-07-28 2018-02-09 平安科技(深圳)有限公司 倾斜图像的倾斜值获取方法、装置、终端及存储介质
US11074443B2 (en) 2017-07-28 2021-07-27 Ping An Technology (Shenzhen) Co., Ltd. Method and device for acquiring slant value of slant image, terminal and storage medium
CN110135217B (zh) * 2018-02-02 2021-07-23 兴业数字金融服务(上海)股份有限公司 用于识别图像中的表格内的字符的方法和装置
CN110135217A (zh) * 2018-02-02 2019-08-16 兴业数字金融服务(上海)股份有限公司 用于识别图像中的表格内的字符的方法和装置
CN108600644A (zh) * 2018-07-17 2018-09-28 广东小天才科技有限公司 一种拍照方法、装置及可穿戴设备
CN109993161A (zh) * 2019-02-25 2019-07-09 众安信息技术服务有限公司 一种文本图像旋转矫正方法及系统
CN110211048B (zh) * 2019-05-28 2020-06-16 国家电网有限公司 一种基于卷积神经网络的复杂档案图像倾斜矫正方法
CN110211048A (zh) * 2019-05-28 2019-09-06 湖北华中电力科技开发有限责任公司 一种基于卷积神经网络的复杂档案图像倾斜矫正方法
CN110363196A (zh) * 2019-06-20 2019-10-22 吴晓东 一种倾斜文本的文字精准识别的方法
CN110363196B (zh) * 2019-06-20 2022-02-08 吴晓东 一种倾斜文本的文字精准识别的方法
CN111062874A (zh) * 2019-12-12 2020-04-24 腾讯科技(深圳)有限公司 文本图像显示方法、装置、设备及存储介质
CN111062874B (zh) * 2019-12-12 2023-03-31 腾讯科技(深圳)有限公司 文本图像显示方法、装置、设备及存储介质
CN111985459A (zh) * 2020-09-18 2020-11-24 北京百度网讯科技有限公司 表格图像校正方法、装置、电子设备和存储介质
CN111985459B (zh) * 2020-09-18 2023-07-28 北京百度网讯科技有限公司 表格图像校正方法、装置、电子设备和存储介质
CN116664554A (zh) * 2023-07-26 2023-08-29 微山晟轩机械制造有限公司 一种基于图像处理的螺栓螺纹缺陷检测方法
CN116664554B (zh) * 2023-07-26 2023-10-20 微山晟轩机械制造有限公司 一种基于图像处理的螺栓螺纹缺陷检测方法

Also Published As

Publication number Publication date
CN101425142B (zh) 2011-05-11

Similar Documents

Publication Publication Date Title
CN101425142B (zh) 页面倾斜角度的确定方法和装置
CN108596066B (zh) 一种基于卷积神经网络的字符识别方法
US20190188528A1 (en) Text detection method and apparatus, and storage medium
CN106570453B (zh) 用于行人检测的方法、装置和系统
CN109343920B (zh) 一种图像处理方法及其装置、设备和存储介质
CN110942004A (zh) 基于神经网络模型的手写识别方法、装置及电子设备
CN107452035B (zh) 车道线图像分析方法、装置及其计算机可读取式媒体
SK3196A3 (en) Method for recognizing handwritten input
CN101727580A (zh) 图像处理装置、电子介质和图像处理方法
CN102870399A (zh) 在ocr过程中将词语位图分割为单个字符或字形
CN110942074A (zh) 字符切分识别方法、装置、电子设备、存储介质
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN111310746A (zh) 文本行检测方法、模型训练方法、装置、服务器及介质
CN1198238C (zh) 图象处理设备和由一个多级图象产生二进制图象的方法
Shi et al. Skew detection for complex document images using fuzzy runlength
CN111738252B (zh) 图像中的文本行检测方法、装置及计算机系统
KR101725501B1 (ko) 문자 인식 방법 및 장치
CN110516592A (zh) 一种基于手写数字字符的识别方法
CN106951902B (zh) 一种图像二值化处理方法及装置
CN106846610B (zh) 一种纸币版本识别方法及装置
CN109145916B (zh) 一种图像文字识别切割方法及一种存储设备
JP6355908B2 (ja) シンボル認識装置および車両用標識認識装置
CN1035844C (zh) 在字符识别系统中选取候选字符的方法
CN112288372B (zh) 一种可同时识别一维条码和三段码字符的快递单识别方法
JP7211166B2 (ja) 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220620

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: Peking University

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 9 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: Peking University

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110511

CF01 Termination of patent right due to non-payment of annual fee