CN105787415B - 文档图像的处理装置、方法以及扫描仪 - Google Patents

文档图像的处理装置、方法以及扫描仪 Download PDF

Info

Publication number
CN105787415B
CN105787415B CN201410795249.6A CN201410795249A CN105787415B CN 105787415 B CN105787415 B CN 105787415B CN 201410795249 A CN201410795249 A CN 201410795249A CN 105787415 B CN105787415 B CN 105787415B
Authority
CN
China
Prior art keywords
line
text
lines
suspected
straight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410795249.6A
Other languages
English (en)
Other versions
CN105787415A (zh
Inventor
孙俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN201410795249.6A priority Critical patent/CN105787415B/zh
Publication of CN105787415A publication Critical patent/CN105787415A/zh
Application granted granted Critical
Publication of CN105787415B publication Critical patent/CN105787415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明实施例提供一种文档图像的处理装置、方法以及扫描仪,其中,该装置包括:读取单元,读取文档图像,获得所述文档图像中的所有文本行;检测单元,检测所述读取单元获得的所有文本行中每个文本行的邻近区域中的直线;第一确定单元,确定所述检测单元检测到的每条直线的性质是上划线还是下划线;第二确定单元,根据所述第一确定单元确定的每条直线的性质,确定所有文本行的类别;排序单元,根据所述第二确定单元确定的所有文本行的类别,对所有文本行进行排序;处理单元,对所述排序单元排序后的文本行进行处理。能够不依赖于文本的语种、简单快速的实现印刷体文本行与手写体文本行的分离,从而有效的提高处理的准确度。

Description

文档图像的处理装置、方法以及扫描仪
技术领域
本发明涉及图像处理领域,尤其涉及一种文档图像的处理装置、方法以及扫描仪。
背景技术
在使用很多对文档图像的处理功能时,都需要对文本行进行分类和排序,再进行相应的处理。例如,在进行文本的定向检测或文本的语种识别时,首先检测出文本行,然后使用光学字符识别(OCR,Optical Character Recognition)或其他方法,并根据某种投票策略确定文本行的排版方向或文本的语种。其中,由于在使用光学字符识别或其他方法进行识别时,印刷体文本行的识别精度远高于手写体文本行,优先使用印刷体文本行进行识别。因此,将印刷体文本行与手写体文本行进行分离显得非常重要。
目前,通常提取并利用图像的特征来实现印刷体文本行与手写体文本行的分离。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
如果采用现有的提取并利用图像特征的方法来进行印刷体文本行与手写体文本行的分离,计算量较大且处理过程较为复杂,例如,当待处理的文档包括了多种语言时,样本的收集将非常的困难,并且,不同语种之间的特征差异将导致现有的方法更加复杂和困难。
本发明实施例提供一种文档图像的处理装置、方法以及扫描仪,利用文档图像中的下划线和上划线对文本行进行分类和排序,能够不依赖于文本的语种、简单快速的实现印刷体文本行与手写体文本行的分离,从而有效的提高处理的准确度。
根据本发明实施例的一个方面,提供一种文档图像的处理装置,包括:读取单元,所述读取单元用于读取文档图像,获得所述文档图像中的所有文本行;检测单元,所述检测单元用于检测所述读取单元获得的所有文本行中每个文本行的邻近区域中的直线;第一确定单元,所述第一确定单元用于确定所述检测单元检测到的每条直线的性质是上划线还是下划线;第二确定单元,所述第二确定单元用于根据所述第一确定单元确定的每条直线的性质,确定所有文本行的类别;排序单元,所述排序单元用于根据所述第二确定单元确定的所有文本行的类别,对所有文本行进行排序;处理单元,所述处理单元用于对所述排序单元排序后的文本行进行处理。
根据本发明实施例的另一个方面,提供一种扫描仪,所述扫描仪包括根据上述一个方面所述的文档图像的处理装置。
根据本发明实施例的又一个方面,提供一种文档图像的处理方法,包括:读取文档图像,获得所述文档图像中的所有文本行;检测所有文本行中每个文本行的邻近区域中的直线;确定每条直线的性质是上划线还是下划线;根据确定的每条直线的性质,确定所有文本行的类别;根据确定的所有文本行的类别,对所有文本行进行排序;对排序后的文本行进行处理。
本发明的有益效果在于:通常,在文本中设置下划线以供用户在该下划线的上方进行书写,因此,通过检测文档图像中的直线并确定这些直线的性质是上划线还是下划线,并根据这些直线的性质确定所有文本行的类别并进行排序,从而能够不依赖于文本的语种、简单快速的实现印刷体文本行与手写体文本行的分离,从而有效的提高处理的准确度。
参照后文的说明和附图,详细公开了本发明的特定实施方式,指明了本发明的原理可以被采用的方式。应该理解,本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本发明的实施方式包括许多改变、修改和等同。
针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。
附图说明
所包括的附图用来提供对本发明实施例的进一步的理解,其构成了说明书的一部分,用于例示本发明的实施方式,并与文字描述一起来阐释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。在附图中:
图1是本发明实施例1的文档图像的处理装置100的组成示意图;
图2是本发明实施例1的检测单元102的组成示意图;
图3是本发明实施例1的文档图像300的一示意图;
图4是将图3的文档图像300旋转了180度后的文档图像400的一示意图;
图5是将图3的文档图像300向右旋转90度后的文档图像500的一示意图;
图6是将图3的文档图像300向左旋转90度后的文档图像600的一示意图;
图7是本发明实施例2的扫描仪700的系统构成的一示意框图;
图8是本发明实施例3的文档图像的处理方法的流程图。
具体实施方式
参照附图,通过下面的说明书,本发明的前述以及其它特征将变得明显。在说明书和附图中,具体公开了本发明的特定实施方式,其表明了其中可以采用本发明的原则的部分实施方式,应了解的是,本发明不限于所描述的实施方式,相反,本发明包括落入所附权利要求的范围内的全部修改、变型以及等同物。
实施例1
本发明实施例提供了一种文档图像的处理装置,图1是本发明实施例1的文档图像的处理装置100的组成示意图。如图1所示,该装置100包括:
读取单元101,用于读取文档图像,获得该文档图像中的所有文本行;
检测单元102,用于检测所有文本行中每个文本行的邻近区域中的直线;
第一确定单元103,用于确定检测单元102检测到的每条直线的性质是上划线还是下划线;
第二确定单元104,用于根据第一确定单元103确定的每条直线的性质,确定所有文本行的类别;
排序单元105,用于根据第二确定单元104确定的所有文本行的类别,对所有文本行进行排序;
处理单元106,用于对所述排序单元排序后的文本行进行处理。
由上述实施例可知,通过检测文档图像中的直线并确定这些直线的性质是上划线还是下划线,并根据这些直线的性质确定所有文本行的类别并进行排序,从而能够不依赖于文本的语种、简单快速的实现印刷体文本行与手写体文本行的分离,从而有效的提高处理的准确度。
在本实施例中,文档图像可利用现有的扫描方法对文档进行扫描而获得,并且,本发明实施例对文档的放置方向不进行限制。例如,文档可以是垂直放置的,也可以是水平放置的。
在本实施例中,读取单元101通过读取文档图像而获得该文档图像中的所有文本行,例如,可使用基于区域检测的方法获得文档图像中的所有文本行。但本发明实施例不对获得文本行的方法进行限制。
在本实施例中,检测单元102检测所有文本行中每个文本行的邻近区域中的直线。其中,文本行的方向指的是该文本行是水平的还是垂直的,例如,当普通的水平排版的文档垂直放置时,文本行的方向是水平的,即文本行的方向是0度或180度,当该文档水平放置时,文本行的方向是垂直的,即文本行的方向是90度或270度。
以下对检测单元102的结构进行示例性的说明。图2是本实施例的检测单元102的一组成示意图。如图2所示,检测单元102包括:
第一检测单元201,用于检测文本行的方向;
第三确定单元202,用于根据每个文本行的高度,确定每个文本行的邻近区域的范围;
第二检测单元203,用于检测在每个文本行的邻近区域的范围内的、沿着该文本行的方向延伸的直线。
在本实施例中,第一检测单元201例如可通过检测文档的放置方向来确定文本行是水平的还是垂直的,但本发明实施例不对具体的检测方法进行限制。
在本实施例中,第三确定单元202根据每个文本行的高度,确定每个文本行的邻近区域的范围,例如,可通过区域检测的方法获得文本行的高度,根据该高度设定一阈值,将与文本行的距离小于或等于该阈值的区域确定为该文本行的邻近区域,但本发明实施例不对阈值的数值以及具体的确定方法进行限制。
在本实施例中,第二检测单元203,用于检测在每个文本行的邻近区域的范围内的、沿着该文本行的方向延伸的直线,例如,可利用霍夫(Hough)变换等方法提取特征从而检测该直线,但本发明实施例不对检测直线的方法进行限制。
在本实施例中,在检测单元102检测到所有文本行的邻近区域中的直线之后,第一确定单元103确定这些直线中每条直线的性质是上划线还是下划线。其中,第一确定单元103可以先根据预先设定的规则确定每条直线是疑似上划线还是疑似下划线,再根据所有直线中疑似上划线和疑似下划线的数量确定每条直线是上划线还是下划线。
在一个实施方式中,第一确定单元103可以根据每条直线与和该直线相邻的文本行的相对位置以及该直线与相邻的文本行的距离,确定该直线是疑似上划线还是疑似下划线,计算并比较疑似上划线和疑似下划线的数量,根据比较结果确定该直线是上划线还是下划线。
以下结合图3至图6对第一确定单元103如何确定文档图像中的直线是上划线还是下划线进行示例性的说明。
图3是本实施例的文档图像300的一示意图。以文档垂直放置且文本行的方向是0度为例进行说明,如图3所示,文档图像300中包括文本行301-306以及直线307-310,其中,文本行301、303、305是印刷体文本行,文本行302、304、306是手写体文本行。图中文本行的边框仅示意性的表示文本行的范围,而并不表示该文本行具有该边框。
首先,由于直线307位于文本行301的上方,且在直线307的上方预定距离之内不具有文本行,那么将直线307作为疑似上划线,其中,该预定距离例如是文本行的高度,由于直线308、309位于上下两个文本行之间,且直线308、309离上方的文本行较近,则将直线308、309作为疑似下划线,而直线310位于文本行306的下方且直线310的下方预定距离内不具有文本行,那么将直线310作为疑似下划线,其中,该预定距离例如是文本行的高度。这样,疑似上划线为直线307,疑似下划线为直线308、309、310,可以计算出疑似上划线的数量为1,疑似下划线的数量为3,进一步判断出疑似下划线的数量大于疑似上划线的数量,那么,基于一般情况下文档中的下划线较多的原则,将疑似上划线307确定为上划线,将疑似下划线308-310确定为下划线。
图4是将图3的文档图像300旋转了180度后的文档图像400的一示意图。如图4所示,文本行401-406分别对应于图3中文本行301-306,文本行的方向为180度,直线407-410分别对应于图3中的直线307-310,按照相同的方法,将直线408、409、410作为疑似上划线,将直线407作为疑似下划线,那么疑似上划线的数量为3,疑似下划线的数量为1,因此疑似上划线的数量大于疑似下划线的数量,同样,基于一般情况下文档中的下划线较多的原则,将疑似上划线408、409、410确定为下划线,将疑似下划线407确定为上划线。
图5是将图3的文档图像300向右旋转90度后的文档图像500的一示意图。如图5所示,文本行501-506分别对应于图3中文本行301-306,文本行的方向为270度,直线507-510分别对应于图3中的直线307-310。
由于文本行的方向为垂直的,因此不能直观的看出文本行与直线的上下位置关系,因此,对于文本行的方向为垂直的情况,可以预先定义如何确定疑似上划线和疑似下划线。例如,可以定义如果直线位于文本行的左侧且距离该文本行较近,则认为该直线为疑似下划线,如果直线位于文本行的右侧且距离该文本行较近,则认为该直线为疑似上划线。也可以进行相反的定义,例如,如果直线位于文本行的右侧且距离该文本行较近,则认为该直线为疑似下划线,如果直线位于文本行的左侧且距离该文本行较近,则认为该直线为疑似上划线。基于一般情况下文档中的下划线较多的原则,上述两种定义得到的结果是相同的。按照与图3和图4中相同的方法,可以确定直线508-510为下划线,直线507为上划线。
图6是将图3的文档图像300向左旋转90度后的文档图像600的一示意图。如图6所示,文本行601-606分别对应于图3中文本行301-306,文本行的方向为90度,直线607-610分别对应于图3中的直线307-310。图6中的文本行方向也是垂直的,同样可以采用上述两种定义来确定疑似上划线和疑似下划线。基于一般情况下文档中的下划线较多的原则,上述两种定义得到的结果是相同的。按照与图3和图4中相同的方法,可以确定直线608-610为下划线,直线607为上划线。
在另一个实施方式中,第一确定单元103还可以仅根据每条直线与和该直线相邻的文本行的相对位置,确定该直线是疑似上划线还是疑似下划线,计算并比较疑似上划线和疑似下划线的数量,根据比较结果确定该直线是上划线还是下划线。例如,不考虑直线与相邻两条文本行的距离,而将位于两条文本行之间的直线既作为疑似上划线,又作为疑似下划线。
在本实施例中,第二确定单元104根据第一确定单元103确定的每条直线的性质,确定所有文本行的类别,例如,第二确定单元104将不具有上划线或者下划线的文本行确定为疑似印刷体文本行,将具有上划线的文本行确定为属性不明确文本行,将具有下划线的文本行确定为疑似手写体文本行。
以图3中的文本行为例进行说明,如图3所示,文本行301具有上划线,文本行302、304、306具有下划线,文本行303、305不具有上划线和下划线,那么,可以将文本行303、305确定为疑似印刷体文本行,将文本行301确定为属性不明确文本行,将文本行302、304、306确定为疑似手写体文本行。
在本实施例中,排序单元105根据第二确定单元104确定的所有文本行的类别,对所有文本行进行排序,例如,排序单元105按照疑似印刷体文本行、属性不明确文本行以及疑似手写体文本行的顺序对所有文本行进行排序。以图3中的文本行为例进行说明,如图3所示,以“(文本行303、305)、(文本行301)、(文本行302、304、306)”的顺序进行排序。
这样,通过文本行的上划线和下划线对所有文本行进行分类和排序,能够不依赖于文本的语种、简单快速的实现印刷体文本行与手写体文本行的分离。
在本实施例中,处理单元106对排序单元105排序后的文本行进行处理。其中,该处理可以是根据需要而进行的各种处理。例如,可以对排序后的文本行进行文本行的定向检测,或者对排序后的文本行进行语种识别。本发明实施例不对处理的具体形式进行限制。
这样,由于排序后的文本行已经实现了印刷体文本行与手写体文本行的分离,在对这些文本行进行定向检测或语种识别等处理时,首先对排在前面的印刷体文本行进行处理,从而有效的提高处理的准确度。
另外,在处理之前只是对所有文本行进行了分类和排序,保留了所有文本行的内容,从而能够保证文档的完整性。
在本实施例中,处理单元106例如包括一选择单元,该选择单元根据预先设定的投票策略,对排序单元105排序后的文本行进行选择。其中,该投票策略可根据实际需要而设定,本发明实施例不对投票策略的具体设定规则进行限制。
这样,根据投票策略对文本行进行选择,能够进一步提高处理的准确度。
由上述实施例可知,通过检测文档图像中的直线并确定这些直线的性质是上划线还是下划线,并根据这些直线的性质确定所有文本行的类别并进行排序,从而能够不依赖于文本的语种、简单快速的实现印刷体文本行与手写体文本行的分离,从而有效的提高处理的准确度。
实施例2
本发明实施例还提供了一种扫描仪,该扫描仪包括实施例1所述的文档图像的处理装置,图7是本发明实施例2的扫描仪700的系统构成的一示意框图。如图7所示,扫描仪700可以包括中央处理器701和存储器702;存储器702耦合到中央处理器701。该图是示例性的;还可以使用其它类型的结构,来补充或代替该结构,以实现电信功能或其它功能。
如图7所示,该扫描仪700还可以包括:输入单元703、显示器704、光学组件705以及电源706。
在一个实施方式中,实施例1所述的文档图像的处理装置的功能可以被集成到中央处理器701中。其中,中央处理器701可以被配置为:读取文档图像,获得所述文档图像中的所有文本行;检测所有文本行中每个文本行的邻近区域中的直线;确定每条直线的性质是上划线还是下划线;根据确定的每条直线的性质,确定所有文本行的类别;根据确定的所有文本行的类别,对所有文本行进行排序;对排序后的文本行进行处理。
其中,所述检测所有文本行中每个文本行的邻近区域中的直线的步骤,包括:检测所述文本行的方向;根据每个文本行的高度,确定每个文本行的邻近区域的范围;检测在每个文本行的邻近区域的范围内的、沿着所述文本行的方向延伸的直线。
其中,所述确定每条直线的性质是上划线还是下划线的步骤,包括:根据预定规则确定所述检测单元检测到的每条直线是疑似上划线还是疑似下划线,并根据所有直线中疑似上划线和疑似下划线的数量确定每条直线是上划线还是下划线。
其中,可以根据每条直线与和所述直线相邻的文本行的相对位置以及所述直线与所述相邻的文本行的距离,确定每条直线是疑似上划线还是疑似下划线,计算并比较所有直线中疑似上划线和疑似下划线的数量,根据比较结果确定每条直线是上划线还是下划线。
其中,可以根据每条直线与和所述直线相邻的文本行的相对位置,确定每条直线是疑似上划线还是疑似下划线,计算并比较所有直线中疑似上划线和疑似下划线的数量,根据比较结果确定每条直线是上划线还是下划线。
其中,所述根据确定的每条直线的性质确定所有文本行的类别的步骤,包括:将不具有上划线或者下划线的文本行确定为疑似印刷体文本行,将具有上划线的文本行确定为属性不明确文本行,将具有下划线的文本行确定为疑似手写体文本行;所述根据确定的所述文本行的类别对所有文本行进行排序的步骤,包括:按照所述疑似印刷体文本行、属性不明确文本行以及疑似手写体文本行的顺序对所有文本行进行排序。
其中,所述对排序后的文本行进行处理的步骤,包括:根据预先设定的投票策略,对排序后的文本行进行选择。
在另一个实施方式中,实施例1所述的文档图像的处理装置可以与中央处理器701分开配置,例如可以将文档图像的处理装置配置为与中央处理器701连接的芯片,通过中央处理器701的控制来实现文档图像的处理装置的功能。
在本实施例中扫描仪700也并不是必须要包括图7中所示的所有部件。
如图7所示,中央处理器701有时也称为控制器或操作控件,可以包括微处理器或其它处理器装置和/或逻辑装置,中央处理器701接收输入并控制扫描仪700的各个部件的操作。
存储器702,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器701可执行该存储器702存储的该程序,以实现信息存储或处理等。其它部件的功能与现有类似,此处不再赘述。扫描仪700的各部件可以通过专用硬件、固件、软件或其结合来实现,而不偏离本发明的范围。
由上述实施例可知,通过检测文档图像中的直线并确定这些直线的性质是上划线还是下划线,并根据这些直线的性质确定所有文本行的类别并进行排序,从而能够不依赖于文本的语种、简单快速的实现印刷体文本行与手写体文本行的分离,从而有效的提高处理的准确度。
本发明实施例还提供了一种文档图像的处理方法,如下面的实施例3所述,由于该方法解决问题的原理与实施例1的文档图像的处理装置的各组成部分的功能类似,因此其具体的实施可以参照实施例1的处理装置的实施,内容相同之处不再重复说明。
实施例3
图8是本发明实施例3的文档图像的处理方法的流程图。如图8所示,该方法包括:
步骤801:读取文档图像,获得所述文档图像中的所有文本行;
步骤802:检测所有文本行中每个文本行的邻近区域中的直线;
步骤803:确定每条直线的性质是上划线还是下划线;
步骤804:根据确定的每条直线的性质,确定所有文本行的类别;
步骤805:根据确定的所有文本行的类别,对所有文本行进行排序;
步骤806:对排序后的文本行进行处理。
由上述实施例可知,通过检测文档图像中的直线并确定这些直线的性质是上划线还是下划线,并根据这些直线的性质确定所有文本行的类别并进行排序,从而能够不依赖于文本的语种、简单快速的实现印刷体文本行与手写体文本行的分离,从而有效的提高处理的准确度。
本实施例的获得所述文档图像中的所有文本行的方法、根据所述文本行的方向检测所有文本行中每个文本行的邻近区域中的直线的方法、确定每条直线的性质是上划线还是下划线的方法、根据确定的每条直线的性质确定所有文本行的类别的方法、根据确定的所有文本行的类别对所有文本行进行排序的方法以及对排序后的文本行进行处理的方法与实施例1中的记载相同,此处不再赘述。
例如,
在本实施例的一个实施方式中,所述检测所有文本行中每个文本行的邻近区域中的直线的步骤可以包括:检测所述文本行的方向;根据每个文本行的高度,确定每个文本行的邻近区域的范围;检测在每个文本行的邻近区域的范围内的、沿着所述文本行的方向延伸的直线。
在本实施例的一个实施方式中,所述确定每条直线的性质是上划线还是下划线的步骤可以包括:确定所述检测单元检测到的每条直线是疑似上划线还是疑似下划线,并根据所有直线中疑似上划线和疑似下划线的数量确定每条直线是上划线还是下划线。
在本实施例的一个实施方式中,根据每条直线与和所述直线相邻的文本行的相对位置以及所述直线与所述相邻的文本行的距离,确定每条直线是疑似上划线还是疑似下划线,计算并比较所有直线中疑似上划线和疑似下划线的数量,根据比较结果确定每条直线是上划线还是下划线。
在本实施例的一个实施方式中,根据每条直线与和所述直线相邻的文本行的相对位置,确定每条直线是疑似上划线还是疑似下划线,计算并比较所有直线中疑似上划线和疑似下划线的数量,根据比较结果确定每条直线是上划线还是下划线。
在本实施例的一个实施方式中,所述根据确定的每条直线的性质确定所有文本行的类别的步骤可以包括:将不具有上划线或者下划线的文本行确定为疑似印刷体文本行,将具有上划线的文本行确定为属性不明确文本行,将具有下划线的文本行确定为疑似手写体文本行;所述根据确定的所述文本行的类别对所有文本行进行排序的步骤,包括:按照所述疑似印刷体文本行、属性不明确文本行以及疑似手写体文本行的顺序对所有文本行进行排序。
在本实施例的一个实施方式中,所述对排序后的文本行进行处理的步骤可以包括:根据预先设定的投票策略,对排序后的文本行进行选择。
本发明实施例还提供一种计算机可读程序,其中当在文档图像的处理装置或扫描仪中执行所述程序时,所述程序使得计算机在所述文档图像的处理装置或扫描仪中执行实施例3所述的处理方法。
本发明实施例还提供一种存储有计算机可读程序的存储介质,其中所述计算机可读程序使得计算机在文档图像的处理装置或扫描仪中执行实施例3所述的处理方法。
本发明以上的装置和方法可以由硬件实现,也可以由硬件结合软件实现。本发明涉及这样的计算机可读程序,当该程序被逻辑部件所执行时,能够使该逻辑部件实现上文所述的装置或构成部件,或使该逻辑部件实现上文所述的各种方法或步骤。本发明还涉及用于存储以上程序的存储介质,如硬盘、磁盘、光盘、DVD、flash存储器等。
以上结合具体的实施方式对本发明进行了描述,但本领域技术人员应该清楚,这些描述都是示例性的,并不是对本发明保护范围的限制。本领域技术人员可以根据本发明的精神和原理对本发明做出各种变型和修改,这些变型和修改也在本发明的范围内。
关于包括以上实施例的实施方式,还公开下述的附记:
附记1、一种文档图像的处理装置,包括:
读取单元,所述读取单元用于读取文档图像,获得所述文档图像中的所有文本行;
检测单元,所述检测单元用于检测所述读取单元获得的所有文本行中每个文本行的邻近区域中的直线;
第一确定单元,所述第一确定单元用于确定所述检测单元检测到的每条直线的性质是上划线还是下划线;
第二确定单元,所述第二确定单元用于根据所述第一确定单元确定的每条直线的性质,确定所有文本行的类别;
排序单元,所述排序单元用于根据所述第二确定单元确定的所有文本行的类别,对所有文本行进行排序;
处理单元,所述处理单元用于对所述排序单元排序后的文本行进行处理。
附记2、根据附记1所述的装置,其中,所述检测单元包括:
第一检测单元,所述第一检测单元用于检测所述文本行的方向;
第三确定单元,所述第三确定单元用于根据每个文本行的高度,确定每个文本行的邻近区域的范围;
第二检测单元,所述第二检测单元用于检测在每个文本行的邻近区域的范围内的、沿着所述文本行的方向延伸的直线。
附记3、根据附记1所述的装置,其中,所述第一确定单元根据预定规则确定所述检测单元检测到的每条直线是疑似上划线还是疑似下划线,并根据所有直线中疑似上划线和疑似下划线的数量确定每条直线是上划线还是下划线。
附记4、根据附记3所述的装置,其中,所述第一确定单元根据每条直线与和所述直线相邻的文本行的相对位置以及所述直线与所述相邻的文本行的距离,确定每条直线是疑似上划线还是疑似下划线,计算并比较所有直线中疑似上划线和疑似下划线的数量,根据比较结果确定每条直线是上划线还是下划线。
附记5、根据附记3所述的装置,其中,所述第一确定单元根据每条直线与和所述直线相邻的文本行的相对位置,确定每条直线是疑似上划线还是疑似下划线,计算并比较所有直线中疑似上划线和疑似下划线的数量,根据比较结果确定每条直线是上划线还是下划线。
附记6、根据附记1所述的装置,其中,所述第二确定单元将不具有上划线或者下划线的文本行确定为疑似印刷体文本行,将具有上划线的文本行确定为属性不明确文本行,将具有下划线的文本行确定为疑似手写体文本行;
所述排序单元按照所述疑似印刷体文本行、属性不明确文本行以及疑似手写体文本行的顺序对所有文本行进行排序。
附记7、根据附记1所述的装置,其中,所述处理单元包括:
选择单元,所述选择单元根据预先设定的投票策略,对所述排序单元排序后的文本行进行选择。
附记8、一种扫描仪,所述扫描仪包括根据附记1-7的任一项所述的装置。
附记9、一种文档图像的处理方法,包括:
读取文档图像,获得所述文档图像中的所有文本行;
检测所有文本行中每个文本行的邻近区域中的直线;
确定每条直线的性质是上划线还是下划线;
根据确定的每条直线的性质,确定所有文本行的类别;
根据确定的所有文本行的类别,对所有文本行进行排序;
对排序后的文本行进行处理。
附记10、根据附记9所述的方法,其中,所述根据所述文本行的方向检测所有文本行中每个文本行的邻近区域中的直线的步骤,包括:
检测所述文本行的方向;
根据每个文本行的高度,确定每个文本行的邻近区域的范围;
检测在每个文本行的邻近区域的范围内的、沿着所述文本行的方向延伸的直线。
附记11、根据附记9所述的方法,其中,所述确定每条直线的性质是上划线还是下划线的步骤,包括:
根据预定规则确定所述检测单元检测到的每条直线是疑似上划线还是疑似下划线,并根据所有直线中疑似上划线和疑似下划线的数量确定每条直线是上划线还是下划线。
附记12、根据附记11所述的方法,其中,所述根据预定规则确定所述检测单元检测到的每条直线是疑似上划线还是疑似下划线,并根据所有直线中疑似上划线和疑似下划线的数量确定每条直线是上划线还是下划线的步骤,包括:
根据每条直线与和所述直线相邻的文本行的相对位置以及所述直线与所述相邻的文本行的距离,确定每条直线是疑似上划线还是疑似下划线,计算并比较所有直线中疑似上划线和疑似下划线的数量,根据比较结果确定每条直线是上划线还是下划线。
附记13、根据附记11所述的方法,其中,所述根据预定规则确定所述检测单元检测到的每条直线是疑似上划线还是疑似下划线,并根据所有直线中疑似上划线和疑似下划线的数量确定每条直线是上划线还是下划线的步骤,包括:
根据每条直线与和所述直线相邻的文本行的相对位置,确定每条直线是疑似上划线还是疑似下划线,计算并比较所有直线中疑似上划线和疑似下划线的数量,根据比较结果确定每条直线是上划线还是下划线。
附记14、根据附记9所述的方法,其中,所述根据确定的每条直线的性质确定所有文本行的类别的步骤,包括:将不具有上划线或者下划线的文本行确定为疑似印刷体文本行,将具有上划线的文本行确定为属性不明确文本行,将具有下划线的文本行确定为疑似手写体文本行;
所述根据确定的所述文本行的类别对所有文本行进行排序的步骤,包括:按照所述疑似印刷体文本行、属性不明确文本行以及疑似手写体文本行的顺序对所有文本行进行排序。
附记15、根据附记9所述的方法,其中,所述对排序后的文本行进行处理的步骤,包括:
根据预先设定的投票策略,对排序后的文本行进行选择。

Claims (8)

1.一种文档图像的处理装置,包括:
读取单元,所述读取单元用于读取文档图像,获得所述文档图像中的所有文本行;
检测单元,所述检测单元用于检测所述读取单元获得的所有文本行中每个文本行的邻近区域中的直线;
第一确定单元,所述第一确定单元用于确定所述检测单元检测到的每条直线的性质是上划线还是下划线;
第二确定单元,所述第二确定单元用于根据所述第一确定单元确定的每条直线的性质,确定所有文本行的类别;
排序单元,所述排序单元用于根据所述第二确定单元确定的所有文本行的类别,对所有文本行进行排序;
处理单元,所述处理单元用于对所述排序单元排序后的文本行进行处理,
其中,所述检测单元包括:
第一检测单元,所述第一检测单元用于检测所述文本行的方向;
第三确定单元,所述第三确定单元用于根据每个文本行的高度,确定每个文本行的邻近区域的范围;
第二检测单元,所述第二检测单元用于检测在每个文本行的邻近区域的范围内的、沿着所述文本行的方向延伸的直线。
2.根据权利要求1所述的装置,其中,所述第一确定单元根据预定规则确定所述检测单元检测到的每条直线是疑似上划线还是疑似下划线,并根据所有直线中疑似上划线和疑似下划线的数量确定每条直线是上划线还是下划线。
3.根据权利要求2所述的装置,其中,所述第一确定单元根据每条直线与和所述直线相邻的文本行的相对位置以及所述直线与所述相邻的文本行的距离,确定每条直线是疑似上划线还是疑似下划线,计算并比较所有直线中疑似上划线和疑似下划线的数量,根据比较结果确定每条直线是上划线还是下划线。
4.根据权利要求2所述的装置,其中,所述第一确定单元根据每条直线与和所述直线相邻的文本行的相对位置,确定每条直线是疑似上划线还是疑似下划线,计算并比较所有直线中疑似上划线和疑似下划线的数量,根据比较结果确定每条直线是上划线还是下划线。
5.根据权利要求1所述的装置,其中,所述第二确定单元将不具有上划线或者下划线的文本行确定为疑似印刷体文本行,将具有上划线的文本行确定为属性不明确文本行,将具有下划线的文本行确定为疑似手写体文本行;
所述排序单元按照所述疑似印刷体文本行、属性不明确文本行以及疑似手写体文本行的顺序对所有文本行进行排序。
6.根据权利要求1所述的装置,其中,所述处理单元包括:
选择单元,所述选择单元根据预先设定的投票策略,对所述排序单元排序后的文本行进行选择。
7.一种扫描仪,所述扫描仪包括根据权利要求1-6的任一项所述的装置。
8.一种文档图像的处理方法,包括:
读取文档图像,获得所述文档图像中的所有文本行;
检测所有文本行中每个文本行的邻近区域中的直线;
确定每条直线的性质是上划线还是下划线;
根据确定的每条直线的性质,确定所有文本行的类别;
根据确定的所有文本行的类别,对所有文本行进行排序;
对排序后的文本行进行处理,
其中,所述检测所有文本行中每个文本行的邻近区域中的直线的步骤,包括:
检测所述文本行的方向;
根据每个文本行的高度,确定每个文本行的邻近区域的范围;
检测在每个文本行的邻近区域的范围内的、沿着所述文本行的方向延伸的直线。
CN201410795249.6A 2014-12-18 2014-12-18 文档图像的处理装置、方法以及扫描仪 Active CN105787415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410795249.6A CN105787415B (zh) 2014-12-18 2014-12-18 文档图像的处理装置、方法以及扫描仪

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410795249.6A CN105787415B (zh) 2014-12-18 2014-12-18 文档图像的处理装置、方法以及扫描仪

Publications (2)

Publication Number Publication Date
CN105787415A CN105787415A (zh) 2016-07-20
CN105787415B true CN105787415B (zh) 2020-04-07

Family

ID=56384647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410795249.6A Active CN105787415B (zh) 2014-12-18 2014-12-18 文档图像的处理装置、方法以及扫描仪

Country Status (1)

Country Link
CN (1) CN105787415B (zh)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5396566A (en) * 1993-03-04 1995-03-07 International Business Machines Corporation Estimation of baseline, line spacing and character height for handwriting recognition
JP2000181993A (ja) * 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置
AUPQ363299A0 (en) * 1999-10-25 1999-11-18 Silverbrook Research Pty Ltd Paper based information inter face
JP3812719B2 (ja) * 2001-04-16 2006-08-23 三菱電機株式会社 文書検索装置
US8750624B2 (en) * 2010-10-19 2014-06-10 Doron Kletter Detection of duplicate document content using two-dimensional visual fingerprinting
JP5699623B2 (ja) * 2011-01-20 2015-04-15 村田機械株式会社 画像処理装置、画像処理システム、画像処理方法、および、プログラム
CN103455814B (zh) * 2012-05-31 2017-04-12 佳能株式会社 用于文档图像的文本行分割方法和系统
CN103455806B (zh) * 2012-05-31 2017-06-13 富士通株式会社 文档处理装置、文档处理方法以及扫描仪
CN102938062B (zh) * 2012-10-16 2015-08-19 山东山大鸥玛软件有限公司 一种基于内容的文档图像倾斜角估计方法

Also Published As

Publication number Publication date
CN105787415A (zh) 2016-07-20

Similar Documents

Publication Publication Date Title
Saabni et al. Text line extraction for historical document images
JP5837205B2 (ja) 画像領域を使用するテキスト検出
JP5884560B2 (ja) 文字認識のための画像処理方法、およびこの方法を用いた文字認識装置およびプログラム
Antonacopoulos et al. ICDAR2015 competition on recognition of documents with complex layouts-RDCL2015
US20150095769A1 (en) Layout Analysis Method And System
JP5492205B2 (ja) 印刷媒体ページの記事へのセグメント化
US9104940B2 (en) Line segmentation method applicable to document images containing handwriting and printed text characters or skewed text lines
US20070160295A1 (en) Method and apparatus of extracting text from document image with complex background, computer program and storage medium thereof
US10740899B2 (en) Image processing apparatus for identifying region within image, information processing method, and storage medium
US20130343658A1 (en) System and method for identifying regular geometric structures in document pages
RU2014112237A (ru) Ввод данных с изображений документов с фиксированной структурой
US20180082456A1 (en) Image viewpoint transformation apparatus and method
KR20140031742A (ko) 이미지 특징 추출 장치 및 이미지 특징 추출 방법, 그를 이용한 영상 처리 시스템
JP2011188465A (ja) 原稿レイアウトの方向検出方法及び装置
CN112766246A (zh) 基于深度学习的文档标题识别方法、系统、终端及介质
KR101793184B1 (ko) 촬영된 음악 악보 영상의 자동연주를 위한 가사 영역 추출장치 및 방법
RU2595557C2 (ru) Выявление снимков экрана на изображениях документов
CN105787415B (zh) 文档图像的处理装置、方法以及扫描仪
JP5677139B2 (ja) 帳票文字認識装置
US8731296B2 (en) Contact text detection in scanned images
US9152876B1 (en) Methods and systems for efficient handwritten character segmentation
EP3267360A1 (en) Systems and methods for strike through detection
Singh et al. Document layout analysis for Indian newspapers using contour based symbiotic approach
US9811726B2 (en) Chinese, Japanese, or Korean language detection
US20180174324A1 (en) Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant