CN102375978A - 处理图像的方法和设备 - Google Patents

处理图像的方法和设备 Download PDF

Info

Publication number
CN102375978A
CN102375978A CN2010102576648A CN201010257664A CN102375978A CN 102375978 A CN102375978 A CN 102375978A CN 2010102576648 A CN2010102576648 A CN 2010102576648A CN 201010257664 A CN201010257664 A CN 201010257664A CN 102375978 A CN102375978 A CN 102375978A
Authority
CN
China
Prior art keywords
ruling
pixel
pixel value
template
real number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102576648A
Other languages
English (en)
Inventor
何源
孙俊
于浩
直井聪
堀田悦伸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN2010102576648A priority Critical patent/CN102375978A/zh
Priority to US13/067,389 priority patent/US20120045131A1/en
Priority to JP2011177999A priority patent/JP2012043433A/ja
Publication of CN102375978A publication Critical patent/CN102375978A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

公开了一种处理图像的方法和设备。从多个图像的每个中提取格线且将所提取的格线拟合到实数二维空间中。通过将每个图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与格线模板的模板单元格间的对应关系。针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到实数二维空间中的实数位置。根据图像中具有与实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与实数位置对应的模板单元格中的像素的像素值。通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于图像的合成图像。根据多个图像的相应合成图像获得表格模板。

Description

处理图像的方法和设备
技术领域
本发明涉及图像处理技术,并且更具体地,涉及处理图像以获得表格的模板的方法和设备。
背景技术
在许多文档成像系统中,大量的表格被扫描进计算机系统中,而计算机系统则处理所得到的文档图像以提取出相关信息。通常,表格包括预印制的格线和例如文字、符号等等的固定内容。格线围成的单元格中可以通过手工填写或机器打印来填入可变的内容。为提取所填写或打印的信息,计算机系统首先识别格线和固定内容以作为表格模板。根据表格模板可以识别文档图像中单元格的区域并且去除格线和固定内容部分以获得填入的可变内容部分,并接着识别通过人工填写或机器打印来填入的内容。
为识别表格模板并且将填写或打印的内容指派给对应的单元格,常用的技术是把文档图像注册到表格模板。在自动表格处理方法中,计算机系统需要具有针对每种要处理的表格的表格模板,其中定义有表格中格线、单元格的位置和固定内容。表格模板可以是预定义的,例如由操作人员手工输入,也可以根据输入文档图像自动生成,例如在美国专利US6886136号中公开了自动生成表格模板的方法。
发明内容
本发明的一个实施例是一种处理图像的设备。设备可以包含格线提取装置、对应关系确定装置、位置映射装置、像素值生成装置、图像生成装置和表格模板生成装置。格线提取装置可以从多个图像的每个中提取格线并且将所提取的格线拟合到实数二维空间中。对应关系确定装置可以通过将每个图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与格线模板的模板单元格间的对应关系。位置映射装置可以针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到实数二维空间中的实数位置。像素值生成装置可以根据图像中具有与实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与实数位置对应的模板单元格中的像素的像素值。图像生成装置可以通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于图像的合成图像。表格模板生成装置可以根据多个图像的相应合成图像获得表格模板。
本发明的一个实施例是一种处理图像的方法。根据该方法,可以从多个图像的每个中提取格线并且将所提取的格线拟合到实数二维空间中。通过将每个图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与所述格线模板的模板单元格间的对应关系。针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到实数二维空间中的实数位置。根据图像中具有与实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与实数位置对应的模板单元格中的像素的像素值。通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于图像的合成图像。根据多个图像的相应合成图像获得表格模板。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。
图1是示出根据本发明一个实施例的处理图像的设备的示例性结构的框图。
图2是示出包含表格的文档图像的示例的图。
图3是示出格线模板的一个示例的图。
图4是示出实线二维空间中拟合的格线及其所置成的拟合单元格的示例的图。
图5是示出模板单元格与拟合单元格之间的仿射变换的示意图。
图6是示出根据仿射变换从模板单元格中像素的位置实数二维空间中的实数位置的映射的示意图。
图7是示出根据平行平面间的仿射变换从模板单元格中像素的位置实数二维空间中的实数位置的映射的示意图。
图8是示出实数位置与其相邻像素位置间的关系的示意图。
图9是示出根据本发明一个实施例的处理图像的方法的示例性过程的流程图。
图10是示出根据本发明一个实施例的生成格线模板的部分的示例性结构的框图。
图11是示出根据本发明一个实施例的生成格线模板的示例性过程的示意图。
图12是示出其中实现本发明的设备和方法的计算机的示例性结构的框图。
具体实施方式
本文中所用的术语,仅仅是为了描述特定的实施例,而不意图限定本发明。本文中所用的单数形式的“一”和“该”,旨在也包括复数形式,除非上下文中明确地另行指出。还要知道,“包含”一词在本说明书中使用时,说明存在所指出的特征、整体、步骤、操作、单元和/或组件,但是并不排除存在或增加一个或多个其它特征、整体、步骤、操作、单元和/或组件,以及/或者它们的组合。
以下参照按照本发明实施例的方法、设备的流程图和/或框图描述本发明。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得通过计算机或其它可编程数据处理装置执行的这些指令,产生实现流程图和/或框图中的方框中规定的功能/操作的装置。
也可以把这些计算机程序指令存储在能指令计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令产生一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instruction means)的制造品。
也可以把计算机程序指令加载到计算机或其它可编程数据处理装置上,使得在计算机或其它可编程数据处理装置上执行一系列操作步骤,以产生计算机实现的过程,从而在计算机或其它可编程装置上执行的指令就提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
应当明白,附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在现有技术的方法中,通过把包含相同表格的文档图像彼此对齐并提取其中相对不变的部分,来提取表格模板。然而在获得文档图像的过程中,可能会因文档的倾斜、旋转等而使得文档图像中的表格发生变形和扭曲,尤其是不同程度的局部变形和扭曲。虽然对齐能够部分地克服文档整体旋转的影响,然而并不能克服文档局部扭曲和局部变形的影响。
尤其是,表格的单元格内可能包含固定的内容,例如文字、符号等等。文档图像的不同程度的局部变形和扭曲会导致不能将这样的固定内容识别到表格模板,使得在处理文档图像时将固定内容识别为可变内容。
图1是示出根据本发明一个实施例的处理图像的设备100的示例性结构的框图。
如图1所示,设备100包括格线提取装置101、对应关系确定装置102、位置映射装置103、像素值生成装置104、图像生成装置105和表格模板生成装置106。
格线提取装置101从多个图像的每个中提取格线并且将所提取的格线拟合到实数二维空间中。
多个图像中的每个图像是包含相同表格的文档图像。图2是示出包含表格的文档图像的示例的图。如图2所示,格线围成各个单元格。单元格内包含的浅色文字是固定内容部分,深色文字是人工填写或机器打印的可变内容部分。可选地,也可以把文档图像的边缘作为缺省的格线,并且在这样的情况下,可以通过延伸非缺省格线与缺省格线相交来获得文档图像边缘部分的单元格。
可以通过已知的方法来从文档图像中提取格线。例如可采用美国专利US7039235号和美国专利申请US2005031208号中描述的方法。此外,可以采用诸如最小二乘法的直线拟合方法来将提取的格线拟合到实数二维空间中。这里,所提取的格线上的点对应于文档图像中的像素,其位置为整数的纵坐标和横坐标。拟合到实数二维空间的格线由相应函数来描述,其上的点的位置不限于离散的整数值,也可以是实数值。图4是示出实线二维空间中拟合的格线及其所置成的拟合单元格的示例的图。如图4所示,X和Y轴坐标值(x,y)表示实数二维空间中点的位置。直线401、402、403和404分别是通过拟合所提取的格线而得到是实数二维空间中的直线。如图4所示,这些直线围成一个单元格。
经过格线装置101的处理,可以得到提取的格线和由拟合的格线围成的拟合单元格110。
回到图1,对应关系确定装置102通过将每个图像中所提取的格线110与格线模板111对齐来确定所拟合的格线围成的拟合单元格110与格线模板111的模板单元格间的对应关系。
图3示出格线模板的一个示例的图。如图3所示,格线模板中包含格线和由格线围成的单元格。可以通过从多个图像中随机选择或指定的图像中提取格线来形成格线模板。
可采用已知的方法来将每个图像中所提取的格线与格线模板对齐。例如,可以相对格线模板不断地整体移动所提取的格线并计算格线模板与所提取格线间的相似度。如果根据格线模板与所提取格线间的某种相对位置关系获得最大的相似度,则确定在此相对位置关系下格线模板与所提取格线间对齐。
在彼此对齐的情况下,能够确定格线模板中的模板单元格与所提取的格线围成的单元格之间的对应关系。由于所提取格线围成的单元格与拟合单元格的对应关系是已知的,因此也能够确定格线模板中的模板单元格与拟合单元格之间的对应关系。
回到图1,位置映射装置103针对相对应的每对单元格(格线模板中的模板单元格和实数二维空间中的拟合单元格),根据其间的仿射变换将模板单元格中每个像素的位置映射到所述实数二维空间中的实数位置。
图5是示出模板单元格与拟合单元格之间的仿射变换的示意图。
仿射变换是仿射平面(或空间)到自身的一类变换。仿射变换的性质包括保持点的共线性(或共面性)以及共线三点的简比不变。如图5所示,平面501中的单元格ABCD是模板单元格,平面502中的单元格A′B′C′D′是对单元格ABCD进行仿射变换得到的拟合单元格。
根据点的共线性,在平面501中点A、E、B共线并且点D、F、C共线,则在平面502中通过对这些点进行仿射变换点而得到的对应点A′、E′、B′共线,并且点D′、F′、C′。根据共线三点简比不变性质,Len(A,E)/Len(E,B)=Len(A′,E′)/Len(E′,B′),Len(D,F)/Len(F,C)=Len(D′,F′)/Len(F′,C′),其中Len(,)表示两点之间的距离。
在假设对应的模板单元格与拟合单元格间存在仿射变换关系的情况下,可以利用上述性质确定模板单元格中任何像素所映射到的拟合单元格中的点。下面以图6示出的情形为例来说明这样的映射方法。
图6是示出根据仿射变换从模板单元格中像素的位置实数二维空间中的实数位置的映射的示意图,其中图6(b)示出一个模板单元格601(顶点为P1、P3、P5、P7),图6(a)示出与之相对应的拟合单元格602(顶点为P1′、P3′、P5′、P7′)。对于模板单元格601中的任意一点P,可以将其视为两个直线的交点,其中一个直线与格线的交点为P4和P8,另一个直线与格线的交点为P2和P6。在假定顶点P1′、P3′、P5′、P7′分别与顶点P1、P3、P5、P7对应的情况下,根据共线性和简比不变性,可以确定拟合单元602中与分别点P2、P4、P6、P8对应的P2′、P4′、P6′、P8′。再根据共线性,可以确定直线P2′P6′与直线P4′P8′的交点P′即为与点P对应的点。交点P′的位置即为模板单元格中的像素的位置P所映射到的实数二维空间中的实数位置P′。
在一个可选实施例中,仿射变换可以被简化为平行平面间的仿射变换。在这样的情况下,可以将拟合单元格视为通过旋转相应的模板单元格而得到的。在该实施例中,可以计算拟合单元格相对模板单元格的旋转角度,并且根据旋转角度计算模板单元格中任意点在拟合单元格中的相应点的位置。
图7是示出根据平行平面间的仿射变换从模板单元格中像素的位置实数二维空间中的实数位置的映射的示意图,其中图7(b)示出一个模板单元格,图7(a)示出与相对应的拟合单元格。对于模板单元格中的任意一点P,可以计算其与模板单元格中一个参考点的连线与X和Y轴之一(在图7的例子中为模板单元格的底边,其与X轴方向相同)的夹角α。参考点可以是模板单元格或甚至是模板单元格所处平面中的任意点,只要能够确定其在相应拟合单元格所处平面中的映射参考点。优选地,参考点可以是便于确定映射参考点的点,例如模板单元格的顶点。针对拟合单元格,计算模板单元格的上述底边在拟合单元格中的对应边相对于上述X和Y轴之一的夹角θ,从而得到上述连线在拟合单元格中的对应连线相对于上述X和Y轴之一的夹角α+θ。由于上述连线和对应连线的长度不变,在映射参考点和夹角α+θ已知的情况下,能够计算对应点P′的在实数二维空间的位置。
回到图1,像素值生成装置104根据图像中具有与实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与实数位置对应的模板单元格中的该像素的像素值。
图8是示出实数位置与其相邻像素位置间的关系的示意图。图8(a)中示出一个实数位置(i′+a,j′+b),其中i′,j′为实数的整数部分,a,b为实数的小数部分。与实数位置(i′+a,j′+b)相邻的像素位置分别为(i′,j′),(i′+1,j′),(i′,j′),(i′+1,j′+1)。需要注意的是,相邻的像素位置不限于所列的像素位置,而是还可以包括其它相邻像素位置。图8(b)示出了与实数位置对应的模板单元格中的像素的位置(i,j)。
在一个实施例中,像素值生成装置104可以通过计算图像中具有与实数位置相邻的位置的多个像素(例如,(i′,j′),(i′+1,j′),(i′,j′),(i′+1,j′+1))的像素值的加权和来生成像素值,其中每个像素的位置与实数位置的距离越小,则相应像素值的权重就越大。例如,假设实数位置为(i′+a,j′+b),则所生成的像素值可以是(1-a)×(1-b)×f(i′,j′)+a×(1-b)×f(i′+1,j′)+b×(1-a)×f(i′,j′+1)+a×b×f(i′+1,j′+1),其中f(x,y)是所述图像中像素(x,y)的像素值。
在另一个实施例中,像素值生成装置104可以将图像中具有与实数位置相邻的位置的多个像素(例如,(i′,j′),(i′+1,j′),(i′,j′),(i′+1,j′+1))的像素值中的最小值,即min{fi′,j′),f(i′+1,j′),f(i′,j′+1),f(i′+1,j′+1)},作为所生成的像素值,其中f(x,y)是图像中像素(x,y)的像素值。
回到图1,图像生成装置105通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于图像的合成图像112。也就说,合成图像112包括格线模板中的格线,以及模板单元格中的非格线像素。对于合成图像112中的非格线像素,其像素值为像素值生成装置104获得的像素值。
表格模板生成装置106根据多个图像的相应合成图像112获得表格模板。可采用已知的方法来根据多个图像的相应合成图像获得表格模板。例如可采用美国专利US6886136号中描述的方法。可选地,表格模板生成装置106可以通过下述方式来获得表格模板:对于表格模板中的每个像素,把多个合成图像中对应像素的最大像素值作为该像素的像素值。
图9是示出根据本发明一个实施例的处理图像的方法的示例性过程的流程图。
如图9所示,方法从步骤900开始。在步骤902,从多个图像的每个中提取格线并且将所提取的格线拟合到实数二维空间中。
多个图像中的每个图像是包含相同表格的文档图像。格线围成各个单元格。单元格内包含的浅色文字是固定内容部分,深色文字是人工填写或机器打印的可变内容部分。可选地,也可以把文档图像的边缘作为缺省的格线,并且在这样的情况下,可以通过延伸非缺省格线与缺省格线相交来获得文档图像边缘部分的单元格。
可以通过已知的方法来从文档图像中提取格线。例如可采用美国专利US7039235号和美国专利申请US2005031208号中描述的方法。此外,可以采用诸如最小二乘法的直线拟合方法来将提取的格线拟合到实数二维空间中。这里,所提取的格线上的点对应于文档图像中的像素,其位置为整数的纵坐标和横坐标。拟合到实数二维空间的格线由相应函数来描述,其上的点的位置不限于离散的整数值,也可以是实数值。
经过步骤902的处理,可以得到提取的格线和由拟合的格线围成的拟合单元格。
在步骤904,通过将每个图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与格线模板的模板单元格间的对应关系。
可以通过从多个图像中随机选择或指定的图像中提取格线来形成格线模板。
可采用已知的方法来将每个图像中所提取的格线与格线模板对齐。例如,可以相对格线模板不断地整体移动所提取的格线并计算格线模板与所提取格线间的相似度。如果根据格线模板与所提取格线间的某种相对位置关系获得最大的相似度,则确定在此相对位置关系下格线模板与所提取格线间对齐。
在彼此对齐的情况下,能够确定格线模板中的模板单元格与所提取的格线围成的单元格之间的对应关系。由于所提取格线围成的单元格与拟合单元格的对应关系是已知的,因此也能够确定格线模板中的模板单元格与拟合单元格之间的对应关系。
在步骤906,针对相对应的每对单元格(格线模板中的模板单元格和实数二维空间中的拟合单元格),根据其间的仿射变换将模板单元格中每个像素的位置映射到所述实数二维空间中的实数位置。
在假设对应的模板单元格与拟合单元格间存在仿射变换关系的情况下,可以利用共线性和简比不变性确定模板单元格中任何像素所映射到的拟合单元格中的点。
在一个可选实施例中,仿射变换可以被简化为平行平面间的仿射变换。在这样的情况下,可以将拟合单元格视为通过旋转相应的模板单元格而得到的。在该实施例中,可以计算拟合单元格相对模板单元格的旋转角度,并且根据旋转角度计算模板单元格中任意点在拟合单元格中的相应点的位置。
在步骤908,根据图像中具有与实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与实数位置对应的模板单元格中的该像素的像素值。
假设一个实数位置(i′+a,j′+b),其中i′,j′为实数的整数部分,a,b为实数的小数部分。与实数位置(i′+a,j′+b)相邻的像素位置分别为(i′,j′),(i′+1,j′),(i′,j′),(i′+1,j′+1)。需要注意的是,相邻的像素位置不限于所列的像素位置,而是还可以包括其它相邻像素位置。与实数位置对应的模板单元格中的像素的位置为(i,j)。
在一个实施例中,可以通过计算图像中具有与实数位置相邻的位置的多个像素(例如,(i′,j′),(i′+1,j′),(i′,j′),(i′+1,j′+1))的像素值的加权和来生成像素值,其中每个像素的位置与实数位置的距离越小,则相应像素值的权重就越大。例如,假设实数位置为(i′+a,j′+b),则所生成的像素值可以是(1-a)×(1-b)×f(i′,j′)+a×(1-b)×f(i′+1,j′)+b×(1-a)×f(i′,j′+1)+a×b×f(i′+1,j′+1),其中f(x,y)是所述图像中像素(x,y)的像素值。
在另一个实施例中,可以将图像中具有与实数位置相邻的位置的多个像素(例如,(i′,j′),(i′+1,j′),(i′,j′),(i′+1,j′+1))的像素值中的最小值,即min{f(i′,j′),f(i′+1,j′),f(i′,j′+1),f(i′+1,j′+1)},作为所生成的像素值,其中f(x,y)是图像中像素(x,y)的像素值。
在步骤910,通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于图像的合成图像。也就说,合成图像包括格线模板中的格线,以及模板单元格中的非格线像素。对于合成图像中的非格线像素,其像素值为通过步骤908获得的像素值。
在步骤912,根据多个图像的相应合成图像获得表格模板。可采用已知的方法来根据多个图像的相应合成图像获得表格模板。例如可采用美国专利US6886136号中描述的方法。方法在步骤914结束。可选地,在步骤912,可以通过下述方式来获得表格模板:对于表格模板中的每个像素,把多个合成图像中对应像素的最大像素值作为该像素的像素值。
根据本发明的实施例,由于以单元格为单位来进行变形和扭曲校正,因此能够更加准确地消除文档图像的畸变,保证文档对齐的质量,从而提高表格模板的准确性。
此外,也可以根据多个图像来获得格线模板。
图10是示出根据本发明一个实施例的生成格线模板的部分的示例性结构的框图,这个部分可以单独实现,也可以被包含在结合图1描述的设备中。
如图10所示,生成格线模板的部分包括格线累加装置1001和格线模板生成装置1002。
格线累加装置1001在多个图像之间彼此对齐所提取的格线并且在空白图像上累加多个图像的所提取的格线的像素的像素值。
格线模板生成装置1002通过将空白图像上累加值超过预定阈值的像素识别为格线的像素来生成格线模板。
图11是示出根据本发明一个实施例的生成格线模板的示例性过程的示意图。
如图11所示,作为过程的开始,从多个图像中分别提取出格线11011,...,1101n。在多个图像之间彼此对齐所提取的格线11011,...,1101n。在步骤1102,在空白图像上累加多个图像的所提取的格线11011,...,1101n的像素的像素值。在步骤1103,将空白图像上累加值超过预定阈值的像素识别为格线的像素,从而生成格线模板1104。
所属技术领域的技术人员知道,本发明可以体现为系统、方法或计算机程序产品。因此,本发明可以具体实现为以下形式,即,可以是完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、或者本文一般称为“电路”、“模块”或“系统”的软件部分与硬件部分的组合。此外,本发明还可以采取体现在任何有形的表达介质(medium of expression)中的计算机程序产品的形式,该介质中包含计算机可用的程序码。
可以使用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质,计算机可读存储介质例如可以是--但不限于--电的、磁的、光的、电磁的、红外线的、或半导体的系统、装置、器件或传播介质、或前述各项的任何适当的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括以下:有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或前述各项的任何适当的组合。在本文语境中,计算机可读存储介质可以是任何含有或存储供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的有形介质。
计算机可读信号介质可以包括例如在基带中或作为载波的一部分传播的带有计算机可读程序代码的数据信号。这样一种传播信号可以采取任何适当的形式,包括--但不限于--电磁的、光的或其任何适当的组合。计算机可读信号介质可以是不同于计算机可读存储介质的、可以传达、传播或传输供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的任何一种计算机可读介质。包含在计算机可读介质中的程序代码可以采用任何适当的介质传输,包括-但不限于-无线、有线、光缆、射频等等、或上述各项的任何适当的组合。
用于执行本发明的操作的计算机程序码,可以以一种或多种程序设计语言的任何组合来编写,所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++之类,还包括常规的过程式程序设计语言-诸如”C”程序设计语言或类似的程序设计语言。程序码可以完全地在用户的计算上执行、部分地在用户的计算机上执行、作为一个独立的软件包执行、部分在用户的计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何种类的网络--包括局域网(LAN)或广域网(WAN)--连接到用户的计算机,或者,可以(例如利用因特网服务提供商来通过因特网)连接到外部计算机。
图12是示出其中实现本发明的设备和方法的计算机的示例性结构的框图。
在图12中,中央处理单元(CPU)1201根据只读映射数据(ROM)1202中存储的程序或从存储部分1208加载到随机存取映射数据(RAM)1203的程序执行各种处理。在RAM 1203中,也根据需要存储当CPU 1201执行各种处理等等时所需的数据。
CPU 1201、ROM 1202和RAM 1203经由总线1204彼此连接。输入/输出接口1205也连接到总线1204。
下述部件连接到输入/输出接口1205:输入部分1206,包括键盘、鼠标等等;输出部分1207,包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等等,和扬声器等等;存储部分1208,包括硬盘等等;和通信部分1209,包括网络接口卡比如LAN卡、调制解调器等等。通信部分1209经由网络比如因特网执行通信处理。
根据需要,驱动器1210也连接到输入/输出接口1205。可拆卸介质1211比如磁盘、光盘、磁光盘、半导体映射数据等等根据需要被安装在驱动器1210上,使得从中读出的计算机程序根据需要被安装到存储部分1208中。
在通过软件实现上述步骤和处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1211安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图12所示的其中存储有程序、与方法相分离地分发以向用户提供程序的可拆卸介质1211。可拆卸介质1211的例子包含磁盘、光盘(包含光盘只读映射数据(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)和半导体映射数据。或者,存储介质可以是ROM 1202、存储部分1208中包含的硬盘等等,其中存有程序,并且与包含它们的方法一起被分发给用户。
以下的权利要求中的对应结构、材料、操作以及所有功能性限定的装置(means)或步骤的等同替换,旨在包括任何用于与在权利要求中具体指出的其它单元相组合地执行该功能的结构、材料或操作。所给出的对本发明的描述其目的在于示意和描述,并非是穷尽性的,也并非是要把本发明限定到所表述的形式。对于所属技术领域的普通技术人员来说,在不偏离本发明范围和精神的情况下,显然可以作出许多修改和变型。对实施例的选择和说明,是为了最好地解释本发明的原理和实际应用,使所属技术领域的普通技术人员能够明了,本发明可以有适合所要的特定用途的具有各种改变的各种实施方式。
附记1.一种处理图像的设备,包括:
格线提取装置,从多个图像的每个中提取格线并且将所提取的格线拟合到实数二维空间中;
对应关系确定装置,通过将每个所述图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与所述格线模板的模板单元格间的对应关系;
位置映射装置,针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到所述实数二维空间中的实数位置;
像素值生成装置,根据所述图像中具有与所述实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与所述实数位置对应的模板单元格中的所述像素的像素值;
图像生成装置,通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于所述图像的合成图像;和
表格模板生成装置,根据所述多个图像的相应合成图像获得表格模板。
附记2.如附记1所述的设备,还包括:
格线累加装置,在所述多个图像之间彼此对齐所提取的格线并且在空白图像上累加所述多个图像的所提取的格线的像素的像素值;和
格线模板生成装置,通过将所述空白图像上累加值超过预定阈值的像素识别为格线的像素来生成所述格线模板。
附记3.如附记1或2所述的设备,其中所述仿射变换为平行平面间的仿射变换。
附记4.附记1或2所述的设备,其中假设所述实数位置为(i+a,j+b),则所生成的像素值=(1-a)×(1-b)×f(i,j)+a×(1-b)×f(i+1,j)+b×(1-a)×f(i,j+1)+a×b×f(i+1,j+1),其中f(x,y)是所述图像中像素(x,y)的像素值。
附记5.如附记1或2所述的设备,其中假设所述实数位置为(i+a,j+b),则所生成的像素值=min{f(i,j),f(i+1,j),f(i,j+1),f(i+1,j+1)},其中f(x,y)是所述图像中像素(x,y)的像素值。
附记6.附记1或2所述的设备,其中所述表格模板生成装置进一步被配置为对于表格模板中的每个像素,把所述多个合成图像中对应像素的最大像素值作为所述像素的像素值。
附记7.一种处理图像的方法,包括:
从多个图像的每个中提取格线并且将所提取的格线拟合到实数二维空间中;
通过将每个所述图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与所述格线模板的模板单元格间的对应关系;
针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到所述实数二维空间中的实数位置;
根据所述图像中具有与所述实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与所述实数位置对应的模板单元格中的所述像素的像素值;
通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于所述图像的合成图像;和
根据所述多个图像的相应合成图像获得表格模板。
附记8.如附记7所述的方法,还包括:
通过在所述多个图像之间彼此对齐所提取的格线并且在空白图像上累加所述多个图像的所提取的格线的像素的像素值;和
通过将所述空白图像上累加值超过预定阈值的像素识别为格线的像素来生成所述格线模板。
附记9.如附记7或8所述的方法,其中所述仿射变换为平行平面间的仿射变换。
附记10.如附记7或8所述的方法,其中假设所述实数位置为(i+a,j+b),则所生成的像素值=(1-a)×(1-b)×f(i,j)+a×(1-b)×f(i+1,j)+b×(1-a)×f(i,j+1)+a×b×f(i+1,j+1),其中f(x,y)是所述图像中像素(x,y)的像素值。
附记11.如附记7或8所述的方法,其中假设所述实数位置为(i+a,j+b),则所生成的像素值=min{f(i,j),f(i+1,j),f(i,j+1),f(i+1,j+1)},其中f(x,y)是所述图像中像素(x,y)的像素值。
附记12.如附记7或8所述的方法,其中所述生成表格模板包括对于表格模板中的每个像素,把所述多个合成图像中对应像素的最大像素值作为所述像素的像素值。

Claims (10)

1.一种处理图像的设备,包括:
格线提取装置,从多个图像的每个中提取格线并且将所提取的格线拟合到实数二维空间中;
对应关系确定装置,通过将每个所述图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与所述格线模板的模板单元格间的对应关系;
位置映射装置,针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到所述实数二维空间中的实数位置;
像素值生成装置,根据所述图像中具有与所述实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与所述实数位置对应的模板单元格中的所述像素的像素值;
图像生成装置,通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于所述图像的合成图像;和
表格模板生成装置,根据所述多个图像的相应合成图像获得表格模板。
2.如权利要求1所述的设备,还包括:
格线累加装置,在所述多个图像之间彼此对齐所提取的格线并且在空白图像上累加所述多个图像的所提取的格线的像素的像素值;和
格线模板生成装置,通过将所述空白图像上累加值超过预定阈值的像素识别为格线的像素来生成所述格线模板。
3.如权利要求1或2所述的设备,其中假设所述实数位置为(i+a,j+b),则所生成的像素值=(1-a)×(1-b)×f(i,j)+a×(1-b)×f(i+1,j)+b×(1-a)×f(i,j+1)+a×b×f(i+1,j+1),其中f(x,y)是所述图像中像素(x,y)的像素值。
4.如权利要求1或2所述的设备,其中假设所述实数位置为(i+a,j+b),则所生成的像素值=min{f(i,j),f(i+1,j),f(i,j+1),f(i+1,j+1)},其中f(x,y)是所述图像中像素(x,y)的像素值。
5.如权利要求1或2所述的设备,其中所述表格模板生成装置进一步被配置为对于表格模板中的每个像素,把所述多个合成图像中对应像素的最大像素值作为所述像素的像素值。
6.一种处理图像的方法,包括:
从多个图像的每个中提取格线并且将所提取的格线拟合到实数二维空间中;
通过将每个所述图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与所述格线模板的模板单元格间的对应关系;
针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到所述实数二维空间中的实数位置;
根据所述图像中具有与所述实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与所述实数位置对应的模板单元格中的所述像素的像素值;
通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于所述图像的合成图像;和
根据所述多个图像的相应合成图像获得表格模板。
7.如权利要求6所述的方法,还包括:
通过在所述多个图像之间彼此对齐所提取的格线并且在空白图像上累加所述多个图像的所提取的格线的像素的像素值;和
通过将所述空白图像上累加值超过预定阈值的像素识别为格线的像素来生成所述格线模板。
8.如权利要求6或7所述的方法,其中假设所述实数位置为(i+a,j+b),则所生成的像素值=(1-a)×(1-b)×f(i,j)+a×(1-b)×f(i+1,j)+b×(1-a)×f(i,j+1)+a×b×f(i+1,j+1),其中f(x,y)是所述图像中像素(x,y)的像素值。
9.如权利要求6或7所述的方法,其中假设所述实数位置为(i+a,j+b),则所生成的像素值=min{f(i,j),f(i+1,j),f(i,j+1),f(i+1,j+1)},其中f(x,y)是所述图像中像素(x,y)的像素值。
10.如权利要求6或7所述的方法,其中所述生成表格模板包括对于表格模板中的每个像素,把所述多个合成图像中对应像素的最大像素值作为所述像素的像素值。
CN2010102576648A 2010-08-17 2010-08-17 处理图像的方法和设备 Pending CN102375978A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN2010102576648A CN102375978A (zh) 2010-08-17 2010-08-17 处理图像的方法和设备
US13/067,389 US20120045131A1 (en) 2010-08-17 2011-05-27 Method of and apparatus for processing images
JP2011177999A JP2012043433A (ja) 2010-08-17 2011-08-16 画像処理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102576648A CN102375978A (zh) 2010-08-17 2010-08-17 处理图像的方法和设备

Publications (1)

Publication Number Publication Date
CN102375978A true CN102375978A (zh) 2012-03-14

Family

ID=45594122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102576648A Pending CN102375978A (zh) 2010-08-17 2010-08-17 处理图像的方法和设备

Country Status (3)

Country Link
US (1) US20120045131A1 (zh)
JP (1) JP2012043433A (zh)
CN (1) CN102375978A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109218725A (zh) * 2016-07-12 2019-01-15 联发科技股份有限公司 一种视频编码器、视频解码器及视频处理系统
WO2019104879A1 (zh) * 2017-11-30 2019-06-06 平安科技(深圳)有限公司 表格类图像的信息识别方法、电子装置及可读存储介质
CN110135217A (zh) * 2018-02-02 2019-08-16 兴业数字金融服务(上海)股份有限公司 用于识别图像中的表格内的字符的方法和装置
CN111406262A (zh) * 2017-12-01 2020-07-10 国际商业机器公司 认知文档图像数字化
CN113496162A (zh) * 2020-04-01 2021-10-12 顺丰科技有限公司 停车规范识别方法、装置、计算机设备和存储介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4940270B2 (ja) * 2009-07-06 2012-05-30 シャープ株式会社 画像形成装置
JP6187323B2 (ja) * 2014-03-05 2017-08-30 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN103902995B (zh) * 2014-03-17 2017-11-07 西安汇龙科技股份有限公司 表格内容自动录入方法和装置
CN109035170B (zh) * 2018-07-26 2022-07-01 电子科技大学 基于单网格图分段映射的自适应广角图像校正方法及装置
CN111989692A (zh) * 2019-09-30 2020-11-24 北京市商汤科技开发有限公司 表单识别方法、表格提取方法及相关装置
CN113160145B (zh) * 2021-03-29 2024-04-02 深圳中科飞测科技股份有限公司 检测方法、检测装置、检测设备及计算机可读存储介质
US12008829B2 (en) * 2022-02-16 2024-06-11 Vastec, Inc. System and method for improved OCR efficacy through image segmentation

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020021840A1 (en) * 2000-08-15 2002-02-21 Fujitsu Limited Apparatus for extracting ruled line from multiple-valued image
US6886136B1 (en) * 2000-05-05 2005-04-26 International Business Machines Corporation Automatic template and field definition in form processing
US20060066921A1 (en) * 2004-09-30 2006-03-30 Konica Minolta Business Technologies, Inc. Image reading apparatus reading an original while transporting the same
US20080118144A1 (en) * 2005-01-27 2008-05-22 Shu Lin Edge Based Cmy Automatic Picture Registration
US20080136815A1 (en) * 2006-12-12 2008-06-12 Ziosoft, Inc. Image display controlling apparatus, image display controlling program and image display controlling method
CN101430761A (zh) * 2007-11-09 2009-05-13 富士通株式会社 计算机可读记录介质、表格数据提取装置和方法
US20090190148A1 (en) * 2008-01-24 2009-07-30 Canon Kabushiki Kaisha Printing apparatus and printing method, and program therefor
CN101551861A (zh) * 2008-03-31 2009-10-07 富士通先端科技株式会社 字符识别装置
US20090316219A1 (en) * 2008-06-18 2009-12-24 Canon Kabushiki Kaisha Image processing apparatus, image processing method and computer-readable storage medium
CN101622632A (zh) * 2007-03-08 2010-01-06 富士通株式会社 账票种类识别程序、账票种类识别方法以及账票种类识别装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08320990A (ja) * 1995-05-26 1996-12-03 Japan Radio Co Ltd 車番読み取り装置
JP3378439B2 (ja) * 1996-07-19 2003-02-17 株式会社リコー 帳票画像作成装置
DE60037169T2 (de) * 1999-05-04 2008-10-09 Koninklijke Philips Electronics N.V. Chrominanzsignalinterpolation
JP4078009B2 (ja) * 2000-02-28 2008-04-23 東芝ソリューション株式会社 帳票における文字記録領域の検出装置、帳票における文字記録領域の検出方法、記憶媒体及び帳票フォーマット作成装置
RU2251738C2 (ru) * 2003-01-28 2005-05-10 "Аби Софтвер Лтд." Способ приведения в соответствие заполненной машиночитаемой формы и ее шаблона при наличии искажений (варианты)
WO2004107257A1 (ja) * 2003-05-30 2004-12-09 Fujitsu Limited 帳票処理プログラム、方法及び装置
JP4864332B2 (ja) * 2004-07-13 2012-02-01 株式会社リコー 解像度変換の補間方法、画像処理装置、画像表示装置、プログラムおよび記録媒体
JP2007274597A (ja) * 2006-03-31 2007-10-18 Oki Electric Ind Co Ltd 帳票処理装置、帳票処理システム及び帳票画像補正方法
US8311306B2 (en) * 2008-04-30 2012-11-13 Otismed Corporation System and method for image segmentation in generating computer models of a joint to undergo arthroplasty
US8972437B2 (en) * 2009-12-23 2015-03-03 Apple Inc. Auto-population of a table

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6886136B1 (en) * 2000-05-05 2005-04-26 International Business Machines Corporation Automatic template and field definition in form processing
US20020021840A1 (en) * 2000-08-15 2002-02-21 Fujitsu Limited Apparatus for extracting ruled line from multiple-valued image
US20050031208A1 (en) * 2000-08-15 2005-02-10 Fujitsu Limited Apparatus for extracting ruled line from multiple-valued image
US20060066921A1 (en) * 2004-09-30 2006-03-30 Konica Minolta Business Technologies, Inc. Image reading apparatus reading an original while transporting the same
US20080118144A1 (en) * 2005-01-27 2008-05-22 Shu Lin Edge Based Cmy Automatic Picture Registration
US20080136815A1 (en) * 2006-12-12 2008-06-12 Ziosoft, Inc. Image display controlling apparatus, image display controlling program and image display controlling method
CN101622632A (zh) * 2007-03-08 2010-01-06 富士通株式会社 账票种类识别程序、账票种类识别方法以及账票种类识别装置
CN101430761A (zh) * 2007-11-09 2009-05-13 富士通株式会社 计算机可读记录介质、表格数据提取装置和方法
US20090190148A1 (en) * 2008-01-24 2009-07-30 Canon Kabushiki Kaisha Printing apparatus and printing method, and program therefor
CN101551861A (zh) * 2008-03-31 2009-10-07 富士通先端科技株式会社 字符识别装置
US20090316219A1 (en) * 2008-06-18 2009-12-24 Canon Kabushiki Kaisha Image processing apparatus, image processing method and computer-readable storage medium

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109218725A (zh) * 2016-07-12 2019-01-15 联发科技股份有限公司 一种视频编码器、视频解码器及视频处理系统
CN109218725B (zh) * 2016-07-12 2021-01-26 联发科技股份有限公司 一种视频编码器、视频解码器及视频处理系统
WO2019104879A1 (zh) * 2017-11-30 2019-06-06 平安科技(深圳)有限公司 表格类图像的信息识别方法、电子装置及可读存储介质
CN111406262A (zh) * 2017-12-01 2020-07-10 国际商业机器公司 认知文档图像数字化
CN111406262B (zh) * 2017-12-01 2023-09-22 国际商业机器公司 认知文档图像数字化
CN110135217A (zh) * 2018-02-02 2019-08-16 兴业数字金融服务(上海)股份有限公司 用于识别图像中的表格内的字符的方法和装置
CN110135217B (zh) * 2018-02-02 2021-07-23 兴业数字金融服务(上海)股份有限公司 用于识别图像中的表格内的字符的方法和装置
CN113496162A (zh) * 2020-04-01 2021-10-12 顺丰科技有限公司 停车规范识别方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
JP2012043433A (ja) 2012-03-01
US20120045131A1 (en) 2012-02-23

Similar Documents

Publication Publication Date Title
CN102375978A (zh) 处理图像的方法和设备
US8213748B2 (en) Generating an electronic document with reference to allocated font corresponding to character identifier from an image
US8958644B2 (en) Creating tables with handwriting images, symbolic representations and media images from forms
CN107679024B (zh) 识别表格的方法、系统、计算机设备、可读存储介质
US9070034B2 (en) Method and system for correcting QR code image
US11017498B2 (en) Ground truth generation from scanned documents
US10331949B2 (en) Splitting merged table cells
CN112560861A (zh) 票据处理方法、装置、设备及存储介质
CN110414502B (zh) 图像处理方法及装置、电子设备和计算机可读介质
JP2011022867A (ja) 画像処理装置、画像処理システムおよびプログラム
CN106126491A (zh) 一种纸质表单转换为网页表单的方法及系统
CN106845314B (zh) 一种二维码的快速定位方法
CN108875855A (zh) 打印矢量图的方法、装置、设备及存储介质
CN114663397A (zh) 可行驶区域的检测方法、装置、设备及存储介质
CN105551044A (zh) 一种图片对比方法和装置
US8611671B2 (en) Thin line detection and enhancement for electronic images having different resolutions
CN110162757A (zh) 一种表格结构提取方法及系统
CN112329649A (zh) 一种城市植被种类识别方法、系统、设备以及介质
CN111814542A (zh) 地理对象的提取方法、装置及电子设备
CN116050379A (zh) 文档对比方法及存储介质
CN105739260A (zh) 图像形成装置及图像形成方法
RU2642409C1 (ru) Редактирование текста на изображении документа
CN114580510A (zh) 骨髓细胞细粒度分类方法、系统、计算机设备及存储介质
CN110490825B (zh) 一种编码图片的矫正方法、装置、设备和存储介质
CN113129437B (zh) 一种标志物的空间坐标确定方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120314