CN104657730B - 文档图像的校正装置、方法以及扫描仪 - Google Patents
文档图像的校正装置、方法以及扫描仪 Download PDFInfo
- Publication number
- CN104657730B CN104657730B CN201310589148.9A CN201310589148A CN104657730B CN 104657730 B CN104657730 B CN 104657730B CN 201310589148 A CN201310589148 A CN 201310589148A CN 104657730 B CN104657730 B CN 104657730B
- Authority
- CN
- China
- Prior art keywords
- lines
- picture
- file
- border
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000001914 filtration Methods 0.000 claims abstract description 88
- 238000000605 extraction Methods 0.000 claims abstract description 41
- 238000010276 construction Methods 0.000 claims abstract description 22
- 238000012937 correction Methods 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims description 28
- 238000009499 grossing Methods 0.000 claims description 27
- 238000010586 diagram Methods 0.000 description 13
- 239000000284 extract Substances 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000000205 computational method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000009432 framing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/06—Topological mapping of higher dimensional structures onto lower dimensional surfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0081—Image reader
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/04—Scanning arrangements
- H04N2201/0402—Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207
- H04N2201/0434—Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207 specially adapted for scanning pages of a book
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Geometry (AREA)
Abstract
本发明实施例提供一种文档图像的校正装置、方法以及扫描仪,其中,该装置包括:提取文档图像的沿第一方向的边界以及根据文档图像的内容提取沿第一方向的线条的提取单元、对提取的线条进行过滤的过滤单元、对过滤后的线条进行延长和调整并构建校正网格的构建单元以及利用该校正网格进行校正的校正单元。通过在构建校正模型时同时考虑了文档边界以及文档内容,并且,在对提取的线条进行过滤、延长和调整后构建校正网格,从而能够构建出准确的校正模型,有效的消除了文档图像中的畸变。
Description
技术领域
本发明涉及图像处理领域,尤其涉及一种文档图像的校正装置、方法以及扫描仪。
背景技术
目前,利用扫描仪获得的文档图像中,由于文档的非平面形状特性导致图像中存在畸变。在现有的校正方法中,文档的表面被假定为一个柱形模型(cylinder model),然后利用文档的边界或者文档内容区域的边界,根据柱形模型进行校正。图1是利用现有的扫描仪获得的文档图像,如图1所示,扫描获得的文档图像中具有六个书页角点和书本的边界。图2是利用现有的校正方法对图1的文档图像进行校正后的图像。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
在现有的校正方法中,文档的表面被假定为一个柱形模型,但是,实际的文档表面并不是一个严格的柱形,在现有方法中根据柱形模型进行校正后,文档图像中的畸变依然存在。
本发明实施例提供一种文档图像的校正装置、方法以及扫描仪,能够构建准确的校正模型,有效的消除文档图像中的畸变。
根据本发明实施例的一个方面,提供一种文档图像的校正装置,其中,所述装置包括:提取单元,所述提取单元用于提取文档图像的沿第一方向的边界,并根据所述沿第一方向的边界确定文档图像的沿第二方向的边界,以及根据文档图像的内容提取沿第一方向的线条,其中,所述第一方向是文档图像的水平方向或垂直方向,所述第二方向与所述第一方向垂直;过滤单元,所述过滤单元用于对所述沿第一方向的线条进行过滤,使得过滤后的线条和所述沿第一方向的边界的形状差异在预定的范围之内;构建单元,所述构建单元用于根据所述沿第一方向的边界将过滤后的线条延长至文档图像的沿第二方向的边界,以及根据与所述过滤后的线条在第二方向上相邻的线条和/或所述沿第一方向的边界对所述过滤后的线条的延长线进行调整,并且,根据所述沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格;校正单元,所述校正单元用于根据所述校正网格,对所述文档图像进行校正。
根据本发明实施例的另一个方面,提供一种扫描仪,所述扫描仪包括根据上述一个方面所述的装置。
根据本发明实施例的又一个方面提供一种文档图像的校正方法,其中,所述方法包括:提取文档图像的沿第一方向的边界,并根据所述沿第一方向的边界确定文档图像的沿第二方向的边界,以及根据文档图像的内容提取沿第一方向的线条,其中,所述第一方向是文档图像的水平方向或垂直方向,所述第二方向与所述第一方向垂直;对所述沿第一方向的线条进行过滤,使得过滤后的线条和所述沿第一方向的边界的形状差异在预定的范围之内;根据所述沿第一方向的边界将过滤后的线条延长至文档图像的沿第二方向的边界,以及根据与所述过滤后的线条在第二方向上相邻的线条和/或所述沿第一方向的边界对所述过滤后的线条的延长线进行调整,并且,根据所述沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格;根据所述校正网格,对所述文档图像进行校正。
本发明的有益效果在于:在构建校正模型时同时考虑了文档边界以及文档内容,并且,在对根据文档内容提取的线条进行过滤、延长和调整后构建校正网格,从而构建出准确的校正模型,有效的消除了文档图像中的畸变。
参照后文的说明和附图,详细公开了本发明的特定实施方式,指明了本发明的原理可以被采用的方式。应该理解,本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本发明的实施方式包括许多改变、修改和等同。
针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。
附图说明
所包括的附图用来提供对本发明实施例的进一步的理解,其构成了说明书的一部分,用于例示本发明的实施方式,并与文字描述一起来阐释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是利用现有的扫描仪获得的文档图像;
图2是利用现有的校正方法对图1的文档图像进行校正后的图像;
图3是本发明实施例1的文档图像的校正装置300的结构示意图;
图4是本发明实施例1的从文档图像中的文本行提取该水平方向的线条的方法流程图;
图5是本发明实施例1的从文档图像中的图像边框或水平线条提取该水平方向的线条的方法流程图;
图6是本发明实施例1的过滤单元的结构示意图;
图7是本发明实施例1的过滤单元进行计算时获得控制点的方法流程图;
图8是本发明实施例1的构建单元的结构示意图;
图9是本发明实施例1的延长单元对过滤后的线条进行延长的方法流程图;
图10是本发明实施例1的调整单元对过滤后的线条的延长线进行调整的方法流程图;
图11是本发明实施例1的划分单元进行区域划分的方法流程图;
图12是本发明实施例1的划分单元进行区域划分时选取参照点的示意图;
图13是本发明实施例1的利用校正网格对图像进行校正的方法流程图;
图14是本发明实施例2的扫描仪的结构示意图;
图15是本发明实施例3的文档图像校正方法的流程图。
具体实施方式
参照附图,通过下面的说明书,本发明的前述以及其它特征将变得明显。在说明书和附图中,具体公开了本发明的特定实施方式,其表明了其中可以采用本发明的原则的部分实施方式,应了解的是,本发明不限于所描述的实施方式,相反,本发明包括落入所附权利要求的范围内的全部修改、变型以及等同物。
实施例1
图3是本发明实施例1的文档图像的校正装置300的结构示意图。如图3所示,该装置300包括提取单元301、过滤单元302、构建单元303以及校正单元304,其中,
提取单元301用于提取文档图像的沿第一方向的边界,并根据所述沿第一方向的边界确定文档图像的沿第二方向的边界,以及根据文档图像的内容提取沿第一方向的线条,其中,该第一方向是文档图像的水平方向或垂直方向,该第二方向与第一方向垂直;
过滤单元302用于对沿第一方向的线条进行过滤,使得过滤后的线条和所述沿第一方向的边界的形状差异在预定的范围之内;
构建单元303用于根据沿第一方向的边界将过滤后的线条延长至文档图像的沿第二方向的边界,以及根据与过滤后的线条在第二方向上相邻的线条和/或沿第一方向的边界对过滤后的线条的延长线进行调整,并且,根据沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格;
校正单元304用于根据该校正网格,对该文档图像进行校正。
由上述实施例可知,本发明实施例在构建校正模型时同时考虑了文档边界以及文档内容,并且,在对提取的线条进行过滤、延长和调整后构建校正网格,从而能够构建出准确的校正模型,有效的消除了文档图像中的畸变。
在本实施例中,文档图像可利用现有的扫描方法对文档进行扫描而获得,并且,本发明实施例对文档的类型不进行限制。本实施例以水平展开后包括左、右页面的双页文档为例进行说明,但本实施例还可以应用于其他类型的文档,例如,垂直展开后包括上、下页面的双页文档以及单页文档。
在本实施例中,提取单元301提取文档图像的沿第一方向的边界,并根据沿第一方向的边界确定文档图像的沿第二方向的边界,以及根据文档图像的内容提取沿第一方向的线条可使用现有方法中的任一种,本发明实施例并不对该方法进行限制。本实施例以水平展开的双页文档为例进行说明,其中,第一方向是文档图像的水平方向,第二方向是文档图像的垂直方向,左、右页面交界处的边界称为“脊线”,即,在本实施例中,文档图像的沿第一方向的边界指的是上、下边界,沿第二方向的边界指的是左、右边界,第一方向坐标指的是横坐标,第二方向坐标指的是纵坐标。
另外,如果将本实施例应用在垂直展开的双页文档中,那么第一方向则相应的变为文档图像的垂直方向,第二方向则相应的变为文档图像的水平方向。
在本实施例中,提取单元301提取文档图像的沿水平方向的边界例如可通过现有的人工标注或自动提取方法获得,在获得沿水平方向的边界后,可通过将水平方向的边界的端点相连获得文档图像的沿垂直方向的边界。但本发明实施例并不对该方法进行限制。
其中,提取单元301根据文档图像的内容提取沿水平方向的线条,即提取沿水平方向的线条时,例如可以使用现有的方法从文档图像中的文本行提取该线条,还可以使用现有的方法从文档图像中的图像边框或水平线条提取该线条,本发明实施例并不对该提取的方法进行限制。以下对本实施例的提取方法进行示例性的说明。
图4是本实施例的从文档图像中的文本行提取该水平方向的线条的方法流程图。如图4所示,该方法包括:
步骤401:利用局部二值化方法对文档图像处理,得到二值化图像;
步骤402:利用连通域标记方法检测二值化图像中的连通域(ConnectedComponent,CC);
步骤403:对所有检测到的连通域,去掉高度超过阈值T1或者小于阈值T2的连通域;
步骤404:对剩余的连通域,统计连通域高度的频数并选择频数最大的值作为图像中文本行的主要高度,记为htxt;
步骤405:对剩余的每个连通域,计算其高度与htxt的比值,将比值不在[T3,T4]区间内的连通域去掉;
步骤406:在剩余的连通域中,选择一个连通域作为种子连通域,按照预定的规则将剩余的连通域与该种子连通域相连得到文本行;将剩余的连通域按照预定的规则与该文本行继续连接,直到该文本行无法再更新为止;
步骤407:重复步骤406,直到所有剩余的连通域都有文本行标记。
步骤408:从连接为文本行的连通域中提取该线条,并且,利用多项式拟合技术使该线条更加平滑。
图5是本实施例的从文档图像中的图像边框或水平线条提取该水平方向的线条的方法流程图。如图5所示,该方法包括:
步骤501:在二值化图像中选择连通域宽度超过设定阈值T5的连通域;
步骤502:在选择出的连通域中,分别检测最上侧和最下侧的前景像素,得到该连通域的上边界线和下边界线;
步骤503:对检测得到的边界线,计算相邻点纵坐标之间的差值并去掉差值超过设定阈值T6的水平方向的线条,并且,利用多项式拟合技术使该线条更加平滑。
在本实施例中,过滤单元302用于对根据文档图像的内容提取出的沿水平方向的线条进行过滤,使得过滤后的线条和上、下边界的形状差异在预定的范围之内,即利用该过滤单元去除一部分提取出的沿水平方向的线条,使得过滤后剩下的沿水平方向的线条与上、下边界的形状差异在预定的范围之内。其中,对线条进行过滤可使用现有方法中的任一种,本发明实施例并不对该过滤方法进行限制。
这样,利用文档图像沿第一方向的边界(在本实施例中指的是沿水平方向的边界,即上、下边界),对提取出的线条进行过滤,能够去除明显不合理的线条,从而提高构建的校正模型的准确性。
图6是本实施例的过滤单元的结构示意图,但本发明实施例不限于这种结构。如图6所示,该过滤单元302包括:第一过滤子单元601、第二过滤子单元602以及第三过滤子单元603,其中,
第一过滤子单元601用于计算每一条沿水平方向的线条上的点的纵坐标的标准差,并计算文档图像上、下边界上对应点的纵坐标的标准差,进而计算每一条沿水平方向的线条上该点的纵坐标的标准差与上、下边界上该对应点的纵坐标的标准差最大值的差值,并且,将该差值大于预先设定的第一阈值的点所在的线条去除;
第二过滤子单元602用于计算沿水平方向的线条上相邻点沿垂直方向坐标之间的差值,并且,将沿垂直方向坐标之间的差值大于预先设定的第二阈值的点所在的线条去除;
第三过滤子单元603用于计算相邻的两条沿水平方向的线条之间的距离,并且,在相邻的两条沿水平方向的线条之间的距离大于预先设定的第三阈值时,将相邻的两条沿水平的线条中较短的线条去除。
其中,第二过滤子单元602和第三过滤子单元603为可选部件,即该过滤单元302可以不包括第二过滤子单元602和第三过滤子单元603,也可以包括第二过滤子单元602或第三过滤子单元603,也可以同时包括第二过滤子单元602和第三过滤子单元603。
在本实施例中,可以使用现有方法中的任一种方法计算上述标准差的差值、相邻点沿垂直方向坐标之间的差值以及相邻的两条沿水平方向的线条之间的距离,本发明实施例并不对该计算方法进行限制。例如,本发明实施例可以采取以下的方法进行计算。
图7是本实施例的过滤单元302进行计算时获得控制点的方法流程图。如图7所示,文档图像的六个角点分别被记为C1,C2,C3,C4,C5和C6,这六个角点确定了三条直线,即:C1C4,C2C5和C3C6。通过计算两条直线C1C4和C2C5以及C2C5和C3C6的交点可得到两个消失点VP1和VP2,根据这两个消失点可计算得到文档图像的边界和提取的沿水平方向的线条上的对应点。以文档图像的左页为例,将文档图像的下边界C4C5上的每个点Pbot,i与消失点VP1相连得到一条直线,计算该直线与其他线条的交点。因此,对于提取的水平方向的线条上的每个点,都可得到其在上边界和下边界上的对应点。对于每条提取的线条,根据预先设定的采样间隔得到一些点,记为Pi,1,Pi,2,…,Pi,K,这些点在文档图像的上边界和下边界上的对应点记为Pi,1 top,Pi,2 top,…,Pi,k top和Pi,1 bot,Pi,2 bot,…,Pi,k bot,其中,i和k是正整数。本发明实施例将这些点称为过滤单元进行计算时使用的“控制点”,在本发明实施例中简称为“点”;线条上的各个点可对应于图像的像素点,也可不对应于像素点,即各个点的坐标可以是整数,也可以是非整数,本发明实施例并不对此进行限制。
在本实施例中,第一过滤子单元601在计算该标准差的差值时,首先,计算文档图像的上边界和下边界上对应点纵坐标的标准差,分别记为stdtop和stdbot,同时计算提取的水平方向线条上采样点纵坐标的标准差stdi,在获得这些标准差之后,可以按照下式(1)来判断是否需要将该线条去除:
stdi>max(stdtop,stdbot)+T7 (1)
其中,T7表示预先设定的阈值,如果满足上述式(1),第一过滤子单元601将该线条去除,从而使得过滤后的线条和沿水平的边界的形状差异在预定的范围之内。
在本实施例中,第二过滤子单元602可根据下式(2)计算各个提取的水平方向的线条上相邻点的纵坐标之间的差异Difi,j:
Difi,j=|yi,j-yi,j+1| (2)
其中,yi,j表示采样点Pi,j的纵坐标,yi,j+1表示采样点Pi,j+1的纵坐标,i,j是大于等于0的整数。
当Difi,j超过预先设定的阈值T8时,第二过滤子单元602将该线条去除,能够进一步的提高构建的校正模型的准确性。
在本实施例中,第三过滤子单元603在计算相邻的两条沿水平方向的线条的距离时,可采用现有方法中的任一种,例如,将相邻的两条沿水平方向的线条上对应点的纵坐标之差作为该两条线条的距离,但本发明实施例并不对该计算方法进行限制。
这样,可以避免利用过于密集的线条进行校正,从而减少了计算量。
在本实施例中,在利用过滤单元302获得经过过滤的线条后,构建单元303对该过滤后的线条进行延长和调整,并根据上、下边界和经过延长和调整的线条构建校正网格。图8是本实施例的构建单元303的结构示意图,但本发明实施例不限于这种结构。如图8所示,该构建单元303包括:延长单元801、调整单元802、平滑单元803以及划分单元804,其中,
延长单元801用于根据上、下边界将过滤后的线条延长至左、右边界,其中,使得该延长线上各个点与文档图像的上、下边界对应点的纵向距离之比均与该延长线的端点与文档图像的上、下边界对应点的纵向距离之比相等,从而确定该延长线上各个点的纵坐标,并且,根据文档图像的上、下边界对应点所确定的直线以及该点的纵坐标确定该点的横坐标;
调整单元802用于根据与过滤后的线条在垂直方向上相邻的线条和/或上、下边界对过滤后的线条的延长线进行调整,其中,使得调整后的延长线上各个点与在垂直方向上相邻的线条和/或文档图像的上、下边界对应点的纵向距离之比均与该延长线的端点与在垂直方向上相邻的线条和/或文档图像的上、下边界对应点的沿垂直方向的距离之比相等,从而确定调整后的延长线上各个点的纵坐标,并且,根据文档图像的上、下边界对应点所确定的直线以及该点的纵坐标确定该点的横坐标;
平滑单元803用于对延长线经过调整的线条进行平滑处理;
划分单元804用于根据上、下边界和左、右边界以及平滑处理后的线条对文档图像进行区域划分,其中,根据平滑处理后的线条上各个点与文档图像的上、下对应点的距离以及文档图像的上、下边界之间的距离确定平滑处理后的线条在区域划分后的文档图像中对应的沿水平方向直线的位置;或者,根据平滑处理后的线条上与文档图像的脊线邻近的点与文档图像的上、下边界对应点的距离以及文档图像的上、下边界之间的距离确定平滑处理后的线条在区域划分后的文档图像中对应的沿水平方向直线的位置。
另外,划分单元804也可以不经过该平滑处理,而直接根据调整后的线条进行划分。本发明实施例并不对此进行限制。
在本实施例中,对于水平展开的包括左、右页面的双页文档,延长单元801根据上、下边界,将左页中过滤后的沿水平方向的线条延长至左边界以及脊线,将右页中过滤后的沿水平方向的线条延长至右边界以及脊线。例如,本实施例可采用以下的方法对过滤后的线条进行延长。
图9是本实施例的延长单元801对过滤后的线条进行延长的方法流程图。如图9所示,假定第i条提取线的两个端点分别是Pi,1和Pi,n,i,n是正整数。这两个端点在文档图像的上边界和下边界上的对应点分别是Ptop,1,Ptop,n,Pbot,1,Pbot,n。利用Pi,1,Ptop,1和Pbot,1这三个点的纵坐标之间的比值Ratio可通过下式(3)计算得到:
Ratio=(yi,1-ytop,1)/(ybot,1-ytop,1) (3)
其中,yi,1,ytop,1和ybot,1分别表示点Pi,1,Ptop,1和Pbot,1的纵坐标。
根据该比值,从点Pi,1到其左侧端点Pi,l之间点的坐标可通过计算得到,例如,根据下边界上的点Pbot,1和消失点VP1可得到一条直线,用下式(4)表示:
A*x+B*y+C=0 (4)
按照等式(3)计算得到的比值Ratio,根据上边界和下边界上的对应点利用下式(5)计算得到待求点的纵坐标:
yi=ytop,i+(ybot,i-ytop,i)*Ratio (5)
其中,yi表示待求点的纵坐标。根据式(4)和得到的待求点的纵坐标,可以计算得到待求点的横坐标。按照这样的计算方法,可计算得到所有位于Pi,1和Pi,l之间的点的坐标;类似地,也可计算得到位于点Pi,n和Pi,r之间点的坐标。从而,能够获得延长线上所有点的坐标,从而确定延长线上各个点的位置。
在本实施例中,调整单元802用于根据与过滤后的线条在垂直方向上相邻的线条和/或上、下边界对过滤后的线条的延长线进行调整,例如,本实施例可采用以下的方法对过滤后的线条的延长线进行调整。
图10是本实施例的调整单元802对过滤后的线条的延长线进行调整的方法流程图。如图10所示,线条lk位于线条lk-1和lk+1之间,k为正整数,线条lk的延长线上的点可以根据相邻的线条lk-1和lk+1进一步的调整。将点Pk,l和Pk,1之间的点划分为两部分:Pk,lPk,0和Pk, 0Pk,1,其中,Pk,0由线条lk-1和lk+1具有较大横坐标的左侧端点确定。对于位于点Pk,0和Pk,1之间的点,其调整方法与根据上、下边界计算点的坐标类似,不同之处在于利用线条lk-1和lk+1分别代替了上边界和下边界;对于位于点Pk,l和Pk,0之间的点,其纵坐标可根据点Pk,0纵坐标的变化量进行调整,如下式(6)所示:
yk,j’=yk,j+dyk,0 (6)
其中,yk,j’表示点Pk,j的调整后的纵坐标,yk,j表示点Pk,j的调整前的纵坐标,dyk,0表示点Pk,0的y坐标的变化量。类似地,位于线条lk+1右侧的点也根据线条lk和lbot进行调整。
这样,通过调整单元802对线条的延长线进行了调整,能够进一步的提高构建的校正模型的准确性。
在本实施例中,平滑单元803用于对延长线经过调整的线条进行平滑处理,能够避免校正后的文档图像上出现毛刺现象,提高文档图像的质量。其中,该平滑处理可使用现有方法中的任一种,本发明实施例并不对该平滑处理方法进行限制。
在本实施例中,划分单元804用于根据上、下边界和左、右边界以及平滑处理后的线条对文档图像进行区域划分,其中,该区域划分可使用现有方法中的任一种,本发明实施例并不对此进行限制。例如,本实施例可采用以下的方法进行区域划分。
图11是本实施例的划分单元804进行区域划分的方法流程图。如图11所示,每条平滑处理后的线条上的点在校正图像中具有相同的纵向位置,该纵向位置可通过以下方法计算得到:对于上边界上的点Ptop,i(其中,i=1,2,…,n),得到这些点在其他线条和下边界上的对应点,即Pk,i(其中,k=1,2,…,K,i=1,2,…,n)和Pbot,i(其中,i=1,2,…,n)。利用下式(7)计算第k条线与上边界之间的距离:
dk,top=[len(Pk,1,Ptop,1)+len(Pk,2,Ptop,2)+…+len(Pk,n,Ptop,n)]/n (7)
其中,dk,top表示第k条线与上边界之间的距离,len(Pk,i,Ptop,i)表示点Pk,i和Ptop,i之间的欧氏距离,以此类推。
第k条线在校正图像上的纵向位置可按照下式(8)计算得到:
yk=h*dk,top/dbot,top (8)
其中,yk表示第k条线在纵坐标,h表示校正图像的高度,dbot,top表示下边界与上边界之间的距离。
这样,通过划分单元804进行的区域划分,从而构建了整个校正网格。
在本实施例的另一种实施方式中,可以利用靠近书脊线的点来计算dk,top,图12是本实施例的划分单元804进行区域划分时选取参照点的示意图。如图12所示,选取靠近书脊线的点来计算dk,top,其计算方法与上述相同,此处不再赘述。
这样,通过选取靠近书脊线的点来进行区域划分,能够保证横跨左、右页的图像在校正图像上有很好的接续性。
在本实施例中,校正单元304用于根据构建单元303构建的校正网格,对文档图像进行校正。其中,利用校正网格对图像进行校正可使用现有方法中的任一种,本发明实施例并不对此进行限制。例如,本实施例可采用以下的方法进行校正。
其中,根据柱形模型的假设,校正图像的宽度和高度可通过现有方法计算得到,例如,校正图像的宽度等于文档图像的下边界的长度,其高度等于文档图像高度的平均值。图13是本实施例的利用校正网格对图像进行校正的方法流程图。如图13所示,根据延长的线条可计算得到文档图像和校正图像之间的变换,其中,对于校正图像上的点(xdst,ydst),其在文档图像上的点(xsrc,ysrc)可按照下式(9)和(10)计算得到:
xsrc=curvelen*xdst/w (9)
ysrc=ysrc 0+(ysrc 1-ysrc 0)*(ydst-ydst 0)/(ydst 1-ydst 0) (10)
其中w表示校正图像的宽度;curvelen表示文档图像的下边界长度;ydst 0和ydst 1分别表示校正图像中上侧线条和下侧线条的对应点的纵坐标,(xsrc 0,ysrc 0)和(xsrc 1,ysrc 1)分别表示在文档图像上的对应点的坐标。
根据计算得到的校正图像中点的坐标,校正图像中的点(xdst,ydst)的颜色值或亮度值可通过现有方法中的任一种计算得到,例如,可通过双线性插值计算得到。对文档图像中的所有点重复上述计算过程,即可得到整幅校正图像。
由上述实施例可知,本发明实施例在构建校正模型时同时考虑了文档边界以及文档内容,并且,在对提取的线条进行过滤、延长和调整后构建校正网格,从而能够构建出准确的校正模型,有效的消除了文档图像中的畸变。
实施例2
图14是本发明实施例2的扫描仪的结构示意图,该图仅仅是示意性的,该扫描仪还可以具有其他类型的电路部件,来补充或代替该操作电路,以实现扫描功能或其他功能。显然该扫描仪也并不是必须要包括图14中所示的所有部件。
如图14所示,该扫描仪1400包括:主控制电路1401、输入单元1402、显示器1403、光学组件1404、存储器1405、电源1406以及校正单元1407,其中,
主控制电路1401有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该主控制电路1401接收输入并控制扫描仪1400的各个部件的操作。
存储器1405例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。并且主控制电路1401可执行该存储器1405存储的程序。
其他部件的功能与现有技术类似,此处不再赘述。
校正单元1407具有根据实施例1记载的校正装置的结构,此处不再赘述。
扫描仪1400的各部件可以通过专用硬件、固件、软件或其结合来实现,而不偏离本发明的范围。
由上述实施例可知,本发明实施例在构建校正模型时同时考虑了文档边界以及文档内容,并且,在对提取的线条进行过滤、延长和调整后构建校正网格,从而能够构建出准确的校正模型,有效的消除了文档图像中的畸变。
本发明实施例还提供了一种文档图像的校正方法,如下面的实施例3所述,由于该方法解决问题的原理与实施例1的校正装置的各组成部分的功能类似,因此其具体的实施可以参照实施例1的校正装置的实施,内容相同之处不再重复说明。
实施例3
图15是本发明实施例3的文档图像校正方法的流程图。如图15所示,该方法包括:
步骤1501:提取文档图像的沿第一方向的边界,并根据沿第一方向的边界确定文档图像的沿第二方向的边界,以及根据文档图像的内容提取沿第一方向的线条,其中,第一方向是文档图像的水平方向或垂直方向,第二方向与第一方向垂直;
步骤1502:对沿第一方向的线条进行过滤,使得过滤后的线条和沿第一方向的边界的形状差异在预定的范围之内;
步骤1503:根据沿第一方向的边界将过滤后的线条延长至文档图像的沿第二方向的边界,以及根据与过滤后的线条在第二方向上相邻的线条和/或沿第一方向的边界对过滤后的线条的延长线进行调整,并且,根据沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格;
步骤1504:根据该校正网格,对该文档图像进行校正。
由上述实施例可知,本发明实施例在构建校正模型时同时考虑了文档边界以及文档内容,并且,在对提取的线条进行过滤、延长和调整后构建校正网格,从而能够构建出准确的校正模型,有效的消除了文档图像中的畸变。
本实施例的提取边界和线条的方法、对线条进行过滤、延长和调整的方法、构建校正网格的方法以及根据校正网格对图像进行校正的方法与实施例1中的记载相同,此处不再赘述。
例如,
在本实施例的一个实施方式中,所述对所述沿第一方向的线条进行过滤的步骤包括:计算每一条所述沿第一方向的线条上的点的第二方向坐标的标准差,并计算文档图像沿第一方向的边界上对应点的第二方向坐标的标准差,进而计算每一条所述沿第一方向的线条上所述点的第二方向坐标的标准差与所述沿第一方向的边界上所述对应点的第二方向坐标的标准差最大值的差值;将所述差值大于预先设定的第一阈值的点所在的线条去除。
在本实施例的另一个实施方式中,所述对所述沿第一方向的线条进行过滤的步骤还包括:对每一条所述沿第一方向的线条上相邻点沿第二方向的坐标之间的差值进行计算,并且,将所述沿第二方向的坐标之间的差值大于预先设定的第二阈值的点所在的线条去除;和/或对任意两条相邻的沿第一方向的线条之间的距离进行计算,并且,在所述相邻的两条沿第一方向的线条之间的距离大于预先设定的第三阈值时,将所述相邻的两条沿第一方向的线条中较短的线条去除。在本实施例的另一个实施方式中,所述根据所述沿第一方向的边界将过滤后的线条延长至文档图像的沿第二方向的边界的步骤包括:使得所述延长线上各个点与文档图像的沿第一方向的边界上对应点的纵向距离之比均与所述过滤后的线条的端点与文档图像的沿第一方向的边界上对应点的纵向距离之比相等,从而确定所述延长线上各个点的第二方向坐标;根据文档图像的沿第一方向的边界上对应点所确定的直线以及所述点的第二方向坐标确定所述点的第一方向坐标。
在本实施例的另一个实施方式中,所述根据与所述过滤后的线条在第二方向上相邻的线条和/或所述沿第一方向的边界对所述过滤后的线条的延长线进行调整的步骤包括:使得调整后的延长线上各个点与在第二方向上相邻的线条和/或文档图像的沿第一方向的边界上对应点的纵向距离之比均与所述延长线的端点与在第二方向上相邻的线条和/或文档图像的沿第一方向的边界上对应点的沿第二方向的距离之比相等,从而确定调整后的延长线上各个点的第二方向坐标;根据文档图像的沿第一方向的边界上对应点所确定的直线以及所述点的第二方向坐标确定所述点的第一方向坐标。在本实施例的另一个实施方式中,所述根据所述沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格的步骤包括:对延长线经过调整的线条进行平滑处理。在本实施例的另一个实施方式中,所述根据所述沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格的步骤还包括:根据所述沿第一方向和第二方向的边界以及平滑处理后的线条对文档图像进行区域划分,其中,根据平滑处理后的线条上各个点与文档图像的沿第一方向的边界上对应点的距离以及文档图像的沿第一方向的两个边界之间的距离确定平滑处理后的线条在区域划分后的文档图像中对应的沿第一方向直线的位置;或根据平滑处理后的线条上与文档图像的脊线邻近的点与文档图像的沿第一方向的边界上对应点的距离以及文档图像的沿第一方向的两个边界之间的距离确定平滑处理后的线条在区域划分后的文档图像中对应的沿第一方向直线的位置。
本发明以上的装置和方法可以由硬件实现,也可以由硬件结合软件实现。本发明涉及这样的计算机可读程序,当该程序被逻辑部件所执行时,能够使该逻辑部件实现上文所述的装置或构成部件,或使该逻辑部件实现上文所述的各种方法或步骤。本发明还涉及用于存储以上程序的存储介质,如硬盘、磁盘、光盘、DVD、flash存储器等。
以上结合具体的实施方式对本发明进行了描述,但本领域技术人员应该清楚,这些描述都是示例性的,并不是对本发明保护范围的限制。本领域技术人员可以根据本发明的精神和原理对本发明做出各种变型和修改,这些变型和修改也在本发明的范围内。
关于包括以上实施例的实施方式,还公开下述的附记:
附记1、一种文档图像的校正装置,其中,所述装置包括:
提取单元,所述提取单元用于提取文档图像的沿第一方向的边界,并根据所述沿第一方向的边界确定文档图像的沿第二方向的边界,以及根据文档图像的内容提取沿第一方向的线条,其中,所述第一方向是文档图像的水平方向或垂直方向,所述第二方向与所述第一方向垂直;
过滤单元,所述过滤单元用于对所述沿第一方向的线条进行过滤,使得过滤后的线条和所述沿第一方向的边界的形状差异在预定的范围之内;
构建单元,所述构建单元用于根据所述沿第一方向的边界将过滤后的线条延长至所述沿第二方向的边界;以及根据与所述过滤后的线条在第二方向上相邻的线条和/或所述沿第一方向的边界对所述过滤后的线条的延长线进行调整,并且,根据所述沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格;
校正单元,所述校正单元用于根据所述校正网格,对所述文档图像进行校正。
附记2、根据附记1所述的装置,其中,所述过滤单元包括:
第一过滤子单元,所述第一过滤子单元用于计算每一条所述沿第一方向的线条上的点的第二方向坐标的标准差,并计算文档图像沿第一方向的边界上对应点的第二方向坐标的标准差,进而计算每一条所述沿第一方向的线条上所述点的第二方向坐标的标准差与所述沿第一方向的边界上所述对应点的第二方向坐标的标准差最大值的差值,并且,将所述差值大于预先设定的第一阈值的点所在的线条去除。
附记3、根据附记2所述的装置,其中,所述过滤单元还包括:
第二过滤子单元,所述第二过滤子单元用于对每一条所述沿第一方向的线条上相邻点沿第二方向的坐标之间的差值进行计算,并且,将所述沿第二方向的坐标之间的差值大于预先设定的第二阈值的点所在的线条去除;和/或
第三过滤子单元,所述第三过滤子单元用于对任意两条相邻的沿第一方向的线条之间的距离进行计算,并且,在所述相邻的两条沿第一方向的线条之间的距离大于预先设定的第三阈值时,将所述相邻的两条沿第一方向的线条中较短的线条去除。
附记4、根据附记1所述的装置,其中,所述构建单元包括:
延长单元,所述延长单元用于根据所述沿第一方向的边界将过滤后的线条延长至所述沿第二方向的边界,其中,使得所述延长线上各个点与文档图像的沿第一方向的边界上对应点的纵向距离之比均与所述过滤后的线条的端点与文档图像的沿第一方向的边界上对应点的纵向距离之比相等,从而确定所述延长线上各个点的第二方向坐标,并且,根据文档图像的沿第一方向的边界上对应点所确定的直线以及所述点的第二方向坐标确定所述点的第一方向坐标。
附记5、根据附记4所述的装置,其中,所述构建单元还包括:
调整单元,所述调整单元用于根据与所述过滤后的线条在第二方向上相邻的线条和/或所述沿第一方向的边界对所述过滤后的线条的延长线进行调整,其中,使得调整后的延长线上各个点与在第二方向上相邻的线条和/或文档图像的沿第一方向的边界上对应点的纵向距离之比均与所述延长线的端点与在第二方向上相邻的线条和/或文档图像的沿第一方向的边界上对应点的沿第二方向的距离之比相等,从而确定调整后的延长线上各个点的第二方向坐标,并且,根据文档图像的沿第一方向的边界上对应点所确定的直线以及所述点的第二方向坐标确定所述点的第一方向坐标。
附记6、根据附记5所述的装置,其中,所述构建单元还包括:
平滑单元,所述平滑单元用于对延长线经过调整的线条进行平滑处理。
附记7、根据附记6所述的装置,其中,所述构建单元还包括:
划分单元,所述划分单元用于根据所述沿第一方向和第二方向的边界以及平滑处理后的线条对文档图像进行区域划分,其中,
根据平滑处理后的线条上各个点与文档图像的沿第一方向的边界上对应点的距离以及文档图像的沿第一方向的两个边界之间的距离确定平滑处理后的线条在区域划分后的文档图像中对应的沿第一方向直线的位置;或
根据平滑处理后的线条上与文档图像的脊线邻近的点与文档图像的沿第一方向的边界上对应点的距离以及文档图像的沿第一方向的两个边界之间的距离确定平滑处理后的线条在区域划分后的文档图像中对应的沿第一方向直线的位置。
附记8、一种扫描仪,包括根据附记1所述的装置。
附记9、一种文档图像的校正方法,其中,所述方法包括:
提取文档图像的沿第一方向的边界,并根据所述沿第一方向的边界确定文档图像的沿第二方向的边界,以及根据文档图像的内容提取沿第一方向的线条,其中,所述第一方向是文档图像的水平方向或垂直方向,所述第二方向与所述第一方向垂直;
对所述沿第一方向的线条进行过滤,使得过滤后的线条和所述沿第一方向的边界的形状差异在预定的范围之内;
根据所述沿第一方向的边界将过滤后的线条延长至文档图像的沿第二方向的边界,以及根据与所述过滤后的线条在第二方向上相邻的线条和/或所述沿第一方向的边界对所述过滤后的线条的延长线进行调整,并且,根据所述沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格;
根据所述校正网格,对所述文档图像进行校正。
附记10、根据附记9所述的方法,其中,所述对所述沿第一方向的线条进行过滤的步骤包括:
计算每一条所述沿第一方向的线条上的点的第二方向坐标的标准差,并计算文档图像沿第一方向的边界上对应点的第二方向坐标的标准差,进而计算每一条所述沿第一方向的线条上所述点的第二方向坐标的标准差与所述沿第一方向的边界上所述对应点的第二方向坐标的标准差最大值的差值;
将所述差值大于预先设定的第一阈值的点所在的线条去除。
附记11、根据附记10所述的方法,其中,所述对所述沿第一方向的线条进行过滤的步骤还包括:
对每一条所述沿第一方向的线条上相邻点沿第二方向的坐标之间的差值进行计算,并且,将所述沿第二方向的坐标之间的差值大于预先设定的第二阈值的点所在的线条去除;和/或
对任意两条相邻的沿第一方向的线条之间的距离进行计算,并且,在所述相邻的两条沿第一方向的线条之间的距离大于预先设定的第三阈值时,将所述相邻的两条沿第一方向的线条中较短的线条去除。
附记12、根据附记9所述的方法,其中,所述根据所述沿第一方向的边界将过滤后的线条延长至文档图像的沿第二方向的边界的步骤包括:
使得所述延长线上各个点与文档图像的沿第一方向的边界上对应点的纵向距离之比均与所述过滤后的线条的端点与文档图像的沿第一方向的边界上对应点的纵向距离之比相等,从而确定所述延长线上各个点的第二方向坐标;
根据文档图像的沿第一方向的边界上对应点所确定的直线以及所述点的第二方向坐标确定所述点的第一方向坐标。
附记13、根据附记12所述的方法,其中,所述根据与所述过滤后的线条在第二方向上相邻的线条和/或所述沿第一方向的边界对所述过滤后的线条的延长线进行调整的步骤包括:
使得调整后的延长线上各个点与在第二方向上相邻的线条和/或文档图像的沿第一方向的边界上对应点的纵向距离之比均与所述延长线的端点与在第二方向上相邻的线条和/或文档图像的沿第一方向的边界上对应点的沿第二方向的距离之比相等,从而确定调整后的延长线上各个点的第二方向坐标;
根据文档图像的沿第一方向的边界上对应点所确定的直线以及所述点的第二方向坐标确定所述点的第一方向坐标。
附记14、根据附记13所述的方法,其中,所述根据所述沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格的步骤包括:
对延长线经过调整的线条进行平滑处理。
附记15、根据附记14所述的方法,其中,所述根据所述沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格的步骤还包括:
根据所述沿第一方向和第二方向的边界以及平滑处理后的线条对文档图像进行区域划分,其中,
根据平滑处理后的线条上各个点与文档图像的沿第一方向的边界上对应点的距离以及文档图像的沿第一方向的两个边界之间的距离确定平滑处理后的线条在区域划分后的文档图像中对应的沿第一方向直线的位置;或
根据平滑处理后的线条上与文档图像的脊线邻近的点与文档图像的沿第一方向的边界上对应点的距离以及文档图像的沿第一方向的两个边界之间的距离确定平滑处理后的线条在区域划分后的文档图像中对应的沿第一方向直线的位置。
Claims (10)
1.一种文档图像的校正装置,其中,所述装置包括:
提取单元,所述提取单元用于提取文档图像的沿第一方向的边界,并根据所述沿第一方向的边界确定文档图像的沿第二方向的边界,以及根据文档图像的内容提取沿第一方向的线条,其中,所述第一方向是文档图像的水平方向或垂直方向,所述第二方向与所述第一方向垂直;
过滤单元,所述过滤单元用于对所述沿第一方向的线条进行过滤,使得过滤后的线条和所述沿第一方向的边界的形状差异在预定的范围之内;
构建单元,所述构建单元用于根据所述沿第一方向的边界将过滤后的线条延长至所述沿第二方向的边界;以及根据与所述过滤后的线条在第二方向上相邻的线条和/或所述沿第一方向的边界对所述过滤后的线条的延长线进行调整,并且,根据所述沿第一方向和第二方向的边界以及延长线经过调整的线条构建校正网格;
校正单元,所述校正单元用于根据所述校正网格,对所述文档图像进行校正。
2.根据权利要求1所述的文档图像的校正装置,其中,所述过滤单元包括:
第一过滤子单元,所述第一过滤子单元用于计算每一条所述沿第一方向的线条上点的第二方向坐标的标准差,并计算文档图像沿第一方向的边界上对应点的第二方向坐标的标准差,进而计算每一条所述沿第一方向的线条上所述点的第二方向坐标的标准差与所述沿第一方向的边界上所述对应点的第二方向坐标的标准差最大值的差值,并且,将所述差值大于预先设定的第一阈值的点所在的线条去除。
3.根据权利要求2所述的文档图像的校正装置,其中,所述过滤单元还包括:
第二过滤子单元,所述第二过滤子单元用于对每一条所述沿第一方向的线条上相邻点沿第二方向的坐标之间的差值进行计算,并且,将所述沿第二方向的坐标之间的差值大于预先设定的第二阈值的点所在的线条去除;和/或
第三过滤子单元,所述第三过滤子单元用于对任意两条相邻的沿第一方向的线条之间的距离进行计算,并且,在所述相邻的两条沿第一方向的线条之间的距离大于预先设定的第三阈值时,将所述相邻的两条沿第一方向的线条中较短的线条去除。
4.根据权利要求1所述的文档图像的校正装置,其中,所述构建单元包括:
延长单元,所述延长单元用于根据所述沿第一方向的边界将过滤后的线条延长至所述沿第二方向的边界,其中,使得所述延长线上各个点与文档图像的沿第一方向的边界上对应点的纵向距离之比均与所述过滤后的线条的端点与文档图像的沿第一方向的边界上对应点的纵向距离之比相等,从而确定所述延长线上各个点的第二方向坐标,并且,根据文档图像的沿第一方向的边界上对应点所确定的直线以及所述点的第二方向坐标确定所述点的第一方向坐标。
5.根据权利要求4所述的文档图像的校正装置,其中,所述构建单元还包括:
调整单元,所述调整单元用于根据与所述过滤后的线条在第二方向上相邻的线条和/或所述沿第一方向的边界对所述过滤后的线条的延长线进行调整,其中,使得调整后的延长线上各个点与在第二方向上相邻的线条和/或文档图像的沿第一方向的边界上对应点的纵向距离之比均与所述调整后的延长线的端点与在第二方向上相邻的线条和/或文档图像的沿第一方向的边界上对应点的沿第二方向的距离之比相等,从而确定调整后的延长线上各个点的第二方向坐标,并且,根据文档图像的沿第一方向的边界上对应点所确定的直线以及所述点的第二方向坐标确定所述点的第一方向坐标。
6.根据权利要求5所述的文档图像的校正装置,其中,所述构建单元还包括:
平滑单元,所述平滑单元用于对延长线经过调整的线条进行平滑处理。
7.根据权利要求6所述的文档图像的校正装置,其中,所述构建单元还包括:
划分单元,所述划分单元用于根据所述沿第一方向和第二方向的边界以及平滑处理后的线条对文档图像进行区域划分,其中,
根据平滑处理后的线条上各个点与文档图像的沿第一方向的边界上对应点之间的距离以及文档图像的沿第一方向的两个边界之间的距离确定平滑处理后的线条在区域划分后的文档图像中对应的沿第一方向直线的位置;或
根据平滑处理后的线条上与文档图像的脊线邻近的点与文档图像的沿第一方向的边界上对应点之间的距离以及文档图像的沿第一方向的两个边界之间的距离确定平滑处理后的线条在区域划分后的文档图像中对应的沿第一方向直线的位置。
8.一种扫描仪,包括根据权利要求1所述的文档图像的校正装置。
9.一种文档图像的校正方法,其中,所述方法包括:
提取文档图像的沿第一方向的边界,并根据所述沿第一方向的边界确定文档图像的沿第二方向的边界,以及根据文档图像的内容提取沿第一方向的线条,其中,所述第一方向是文档图像的水平方向或垂直方向,所述第二方向与所述第一方向垂直;
对所述沿第一方向的线条进行过滤,使得过滤后的线条和所述沿第一方向的边界的形状差异在预定的范围之内;
根据所述沿第一方向的边界将过滤后的线条延长至文档图像的沿第二方向的边界,以及根据与所述过滤后的线条在第二方向上相邻的线条和/或所述沿第一方向的边界对所述过滤后的线条的延长线进行调整,并且,根据所述沿第一方向和第二方向的边界以及延长线经过调整后的线条构建校正网格;
根据所述校正网格,对所述文档图像进行校正。
10.根据权利要求9所述的文档图像的校正方法,其中,所述对所述沿第一方向的线条进行过滤的步骤包括:
计算每一条所述沿第一方向的线条上点的第二方向坐标的标准差,并计算文档图像沿第一方向的边界上对应点的第二方向坐标的标准差,进而计算每一条所述沿第一方向的线条上所述点的第二方向坐标的标准差与所述沿第一方向的边界上所述对应点的第二方向坐标的标准差最大值的差值;
将所述差值大于预先设定的第一阈值的点所在的线条去除。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310589148.9A CN104657730B (zh) | 2013-11-20 | 2013-11-20 | 文档图像的校正装置、方法以及扫描仪 |
JP2014229646A JP6303988B2 (ja) | 2013-11-20 | 2014-11-12 | 文書画像の補正装置、補正方法及びスキャナ |
US14/547,472 US9083909B2 (en) | 2013-11-20 | 2014-11-19 | Device, method, and scanner correcting document image using correcting mesh constructed according to vertical and horizontal boundaries and adjusted extended filtered lines |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310589148.9A CN104657730B (zh) | 2013-11-20 | 2013-11-20 | 文档图像的校正装置、方法以及扫描仪 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104657730A CN104657730A (zh) | 2015-05-27 |
CN104657730B true CN104657730B (zh) | 2018-01-05 |
Family
ID=53173025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310589148.9A Active CN104657730B (zh) | 2013-11-20 | 2013-11-20 | 文档图像的校正装置、方法以及扫描仪 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9083909B2 (zh) |
JP (1) | JP6303988B2 (zh) |
CN (1) | CN104657730B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6148976B2 (ja) * | 2013-12-18 | 2017-06-14 | 株式会社ミマキエンジニアリング | 境界決定方法およびメディア切断方法 |
CN106910196B (zh) * | 2015-12-23 | 2021-01-29 | 北京奇虎科技有限公司 | 一种图像检测方法及装置 |
US10402671B2 (en) * | 2016-03-28 | 2019-09-03 | General Dynamics Mission Systems, Inc. | System and methods for automatic solar panel recognition and defect detection using infrared imaging |
JP6200040B1 (ja) | 2016-06-17 | 2017-09-20 | 株式会社Pfu | 画像処理装置、画像処理方法、および、プログラム |
CN110390642B (zh) * | 2018-04-20 | 2023-12-08 | 西南民族大学 | 一种对木刻版藏文图像几何校正的方法 |
CN115187995B (zh) * | 2022-07-08 | 2023-04-18 | 北京百度网讯科技有限公司 | 文档矫正方法、装置、电子设备和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831578A (zh) * | 2011-06-15 | 2012-12-19 | 富士通株式会社 | 图像处理方法和图像处理设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005041123A1 (ja) * | 2003-10-24 | 2005-05-06 | Fujitsu Limited | 画像歪み補正プログラム,画像歪み補正装置並びに画像歪み補正方法 |
CN101267493B (zh) * | 2007-03-16 | 2011-01-19 | 富士通株式会社 | 透视变形文档图像的校正装置和校正方法 |
CN101789122B (zh) * | 2009-01-22 | 2013-06-26 | 佳能株式会社 | 用于校正畸变文档图像的方法和系统 |
JP2011091533A (ja) * | 2009-10-21 | 2011-05-06 | Sony Corp | 画像処理装置および方法、並びに、プログラム |
CN103455995B (zh) * | 2012-05-31 | 2016-08-03 | 富士通株式会社 | 图像处理装置、图像处理方法和扫描仪 |
CN103455996B (zh) * | 2012-05-31 | 2016-05-25 | 富士通株式会社 | 边缘提取方法和设备 |
CN103473543B (zh) * | 2012-06-07 | 2016-10-05 | 富士通株式会社 | 用于提取图像中对象边界的装置、方法以及电子设备 |
-
2013
- 2013-11-20 CN CN201310589148.9A patent/CN104657730B/zh active Active
-
2014
- 2014-11-12 JP JP2014229646A patent/JP6303988B2/ja active Active
- 2014-11-19 US US14/547,472 patent/US9083909B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831578A (zh) * | 2011-06-15 | 2012-12-19 | 富士通株式会社 | 图像处理方法和图像处理设备 |
Also Published As
Publication number | Publication date |
---|---|
CN104657730A (zh) | 2015-05-27 |
JP6303988B2 (ja) | 2018-04-04 |
US9083909B2 (en) | 2015-07-14 |
JP2015104127A (ja) | 2015-06-04 |
US20150138610A1 (en) | 2015-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104657730B (zh) | 文档图像的校正装置、方法以及扫描仪 | |
JP2018520428A5 (zh) | ||
JP5055449B2 (ja) | ページ境界を検出する方法及び装置 | |
CN101902547B (zh) | 图像处理方法以及图像处理装置 | |
CN104809436B (zh) | 一种弯曲书面文字识别方法 | |
CN103996170A (zh) | 一种具有超高解析度的图像边缘锯齿消除方法 | |
CN106485182B (zh) | 一种基于仿射变换的模糊qr码复原方法 | |
US20150170602A1 (en) | Apparatus and method for stabilizing image of display | |
CN109858452A (zh) | 建筑图纸自动比对方法和装置 | |
CN102930515A (zh) | 数字图像的几何畸变自动校正方法 | |
CN109998706A (zh) | 牙齿矫正影像生成装置及方法 | |
CN102915521A (zh) | 一种移动终端图像处理方法及装置 | |
CN106204441A (zh) | 一种图像局部放大的方法及装置 | |
JP2008512767A (ja) | 一般的な2次元空間変換の表現システム及び方法 | |
CN104735360B (zh) | 光场图像处理方法和装置 | |
CN108364249A (zh) | 图像处理装置以及图像处理方法 | |
CN106504294A (zh) | 基于扩散曲线的rgbd图像矢量化方法 | |
CN106909869A (zh) | 一种矩阵式二维码的采样网格划分方法及装置 | |
CN111145305A (zh) | 一种文档图像处理方法 | |
US7561306B2 (en) | One-dimensional lens shading correction | |
CN101777176A (zh) | 一种去除挂网图像锯齿的方法及装置 | |
CN106408533A (zh) | 一种卡片图像提取方法及系统 | |
CN104835120B (zh) | 一种基于基准线的弯曲书面展平方法 | |
CN113658153A (zh) | 一种轮廓数据特征点检测方法及装置 | |
EP1486919A3 (en) | Print tone measuring method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |