CN108073924B - 图像处理方法和装置 - Google Patents
图像处理方法和装置 Download PDFInfo
- Publication number
- CN108073924B CN108073924B CN201611013599.8A CN201611013599A CN108073924B CN 108073924 B CN108073924 B CN 108073924B CN 201611013599 A CN201611013599 A CN 201611013599A CN 108073924 B CN108073924 B CN 108073924B
- Authority
- CN
- China
- Prior art keywords
- line
- point
- candidate
- ruled
- ruled line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
Abstract
本发明涉及图像处理方法和装置,该方法用于处理通过对图像进行三维扫描而得到的三维数据,包括:针对三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的候选抽样点的直线作为预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线;选定任一最终规则线上的一个点作为初始准线点,将与初始准线点相邻的最终规则线上与初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点;以及基于所确定的所有准线点,通过曲线拟合获得准线。
Description
技术领域
本发明涉及图像处理领域,更具体地涉及一种用于对书籍图像进行校正的图像处理方法和装置。
背景技术
随着扫描仪的广泛使用,书籍数字化在生活中扮演越来越重要的角色。置顶式扫描仪能在不损坏书籍的情况下对图像进行数字化,但是由于例如书籍、杂志等书籍页面不在一个平面上,在数字化的图像中往往存在扭曲。
书籍图像校正技术能够展平扭曲的图像,改善阅读体验及提高OCR的识别精度。大部分传统的方法更关注于固定的书籍模型或者书籍内容。比如筒形模型方法有以下缺点:书籍曲面不是一个严格的筒形模型,在扫描的书籍中存在局部畸变,并且很难估计书籍的内边界。而基于书籍内容的图像校正有以下缺点:校正精度严格依赖于书籍内容的提取,如:书籍直线、文本行等,但书籍的布局和文本内容又很难有效的提取,或者没有足够的书籍内容来校正图像。
因此,需要一种能够有效地对书籍图像进行校正的图像处理方法和装置。
发明内容
在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本发明的一个主要目的在于,提供了一种图像处理方法,用于处理通过对图像进行三维扫描而得到的三维数据,该方法包括:针对三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的候选抽样点的直线作为预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线;选定任一最终规则线上的一个点作为初始准线点,将与初始准线点相邻的最终规则线上与初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点;以及基于所确定的所有准线点,通过曲线拟合获得准线。
根据本发明的一个方面,提供一种图像处理装置,用于处理通过对图像进行三维扫描而得到的三维数据,该装置包括:规则线确定单元,被配置为针对三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的候选抽样点的直线作为预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则;准线点确定单元,被配置为选定任一最终规则线上的一个点作为初始准线点,将与初始准线点相邻的最终规则线上与初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点;以及准线确定单元,被配置为基于所确定的所有准线点,通过曲线拟合获得准线。
另外,本发明的实施例还提供了用于实现上述方法的计算机程序。
此外,本发明的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
图1示出了根据本发明的图像处理方法对文档图像进行校正的方法的总体框架图;
图2示意性地示出了书籍的图像边界;
图3示意性地示出了候选中线三维点;
图4示出了根据本发明的一个实施例的图像处理方法400的示例性过程的流程图;
图5示意性地示出了初始三维数据点和多条候选规则线;
图6示意性地示出了所确定的规则线;
图7示出了校正前后的图像对比;
图8是示出根据本发明的一个实施例的图像处理装置800的示例性配置的框图;以及
图9是示出可以用于实施本发明的图像处理方法和装置的计算设备的示例性结构图。
具体实施方式
下面参照附图来说明本发明的实施例。在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
本发明提出了一种图像处理方法和装置。具体地,本发明提出一种基于三维数据的校正方法来重构和展平扭曲的书籍图像。本发明的方法和传统方法相比有如下优点:
1)全局误差最小的动态规划(DP)算法能有效的提高参数估计的性能;
2)基于准线和规则线(ruling)的方法能够有效的校正扭曲的书籍图像。
下面结合附图详细说明根据本发明的实施例的图像处理方法和装置。
图1示出了利用根据本发明的一个实施例的图像处理方法对书籍图像进行校正处理的总体框架图。
从图1中可以看出,简单来说,对书籍图像进行校正的方法包括:输入二维图像(即书籍图像)和对图像进行三维扫描而得到的三维数据,对文档边界进行提取,对三维扫描线进行曲线拟合,进行规则线估计,进行准线估计,最后基于规则线和准线可以输出校正的图像。
本领域普通技术人员可以理解,书籍图像在三维空间上的三维数据点可以通过利用三维扫描仪对书籍进行三维扫描来得到,在此不做赘述。
在执行根据本发明的一个实施例的图像处理方法之前,先利用二维图像和三维数据信息提取书籍的图像边界,如图2中的两条黑粗实线所示。
具体地,首先定位右边界。对于每个三维数据扫描线,候选右边界三维点被定义为两个连续的“潜在书籍上的三维点”,然后利用RANSAC方法针对候选三维点拟合一条基于(x,y)坐标的直线,将此拟合的直线作为书籍右边界线。
然后进行书籍的中线提取。对于每个三维数据扫描线,候选中线三维点被定义为和相邻三维数据点有最大距离的三维数据点。图3示意性地示出了候选中线三维点。候选中线三维点满足以下公式(1):
argmax|2*zi-zi+d-zi-d| (1)
最后通过对候选中线点采用RANSAC方法拟合一条直线,将此直线作为书籍中线。
接下来,对三维扫描线进行曲线拟合。通过最小二乘法对每个三维扫描线进行拟合z=f(x,y),针对当前三维数据扫描线,对于任意输入(x,y)坐标都能计算出其z-坐标,三维曲线可以是多项式曲线,Bezier曲线等等。
在对书籍图像进行了上述初始处理之后,执行根据本发明的一个实施例的图像处理方法。图4示出了根据本发明的一个实施例的图像处理方法400的示例性过程的流程图。
在步骤S402中,针对三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的候选抽样点的直线作为预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线。
然后,针对该另一三维扫描线上的多个候选三维数据点,可以得到通过该初始三维数据点的多条候选规则线的集合。图5示意性地示出了初始三维数据点与另一条三维扫描线上的多个候选三维数据点之间的多条候选规则线。对于每条候选规则线,其误差可以通过计算该规则线和每条三维数据扫描线之间的最短距离之和来计算,计算公式如下式(2)。
其中,E(r)表示规则线ruling的误差,Disti,ruling表示规则线ruling和第i条三维数据扫描线之间的距离,n表示三维数据扫描线的数目。
接着,对邻近三维数据点进行抽样。设置初始三维数据点邻近的三维数据点其中z=f(x0,y0+Δ)。通过上述方法,可以得到针对三维数据点的候选规则线集合。迭代地,可以获取该扫描线上的所有抽样点及其对应的候选规则线集合。
最后,从候选集合中找到针对每个抽样点的最优的规则线。
优选地,可以利用基于全局误差最小的动态规划算法来确定最优的规则线。
具体地,在每个预定抽样点的候选规则线中选择一条候选规则线,利用上式(2)分别对于每个抽样点计算所选择的候选规则线与所有扫描线之间的最短距离之和,将所有候选规则线的代价函数定义为:将所有抽样点的所计算的最短距离之和求总和,可以表示为下式(3):
其中,m是抽样点的个数,E(rj)是一个抽样点的一条规则线的误差。
对每个预定抽样点的候选规则线的选择进行遍历,即选择每个预定抽样点的候选规则线的所有可能的组合,使得代价函数(即总和)最小的候选规则线则是满足预定条件的候选规则线。
优选地,预定扫描线是处于书籍图像的中央位置的扫描线,并且另一扫描线是处于书籍图像的边缘位置的扫描线。
优选地,最终规则线两两之间没有交叠,并且所有的最终规则线都被约束在书籍的边界之内。
一条规则线与另一规则线之间交叠表示:在xy平面上,该规则线的投影与另一规则线的投影的交点在书籍的两个边界之内。
规则线在书籍的边界之内表示:在xy平面上,该规则线的投影与书籍的两个边界没有交点。
优选地,在针对每个预定抽样点获取候选规则线时,使得所获取的候选规则线之间的夹角在预定的角度范围内。
优选地,使得规则线之间满足以下关系式(4):
其中,Yruling_upper表示上面的规则线,Yruling_lower表示下面的规则线。
其含义为:如果抽样点之间的位置关系为抽样点1在抽样点2的下方,则其对应的规则线也存在这样的关系,如果满足这个关系,其代价函数还是原来的值,如果不满足,则将其代价函数设为无穷大来避免出现这种情况。
图6示出了所确定的规则线的示意图,如其中的水平方向上的若干条直线。
通过以上步骤,确定了规则线。接下来,在步骤S404中,选定任一最终规则线上的一个点作为初始准线点,将与初始准线点相邻的最终规则线上与初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点。
具体地,可以将三维数据点作为准线上的一个初始准线点,可以计算其相邻规则线上的准线点本领域技术人员可以理解,该初始准线点可以选择任意规则线上的一个点,而不一定是三维数据点假设此规则线通过三维数据点方向向量为(a,b,c),其直线方程可表示为此准线点在规则线上,因此因为所以,a(xd-lx)+b(yd-ly)+c(zd-lz)=0。通过这些方程,可以得到以下公式(5),来计算准线点
按照上述方法依次迭代,可以确定所有规则线上的准线点。
最后,在步骤S406中,基于所确定的所有准线点,通过曲线拟合获得准线。
可以通过最小二乘拟合的方法拟合所有的准线点来得到其准线曲线方程z=f(x,y),此曲线方程可以为多项式曲线、Bezier曲线等。
利用根据本发明的一个实施例的图像处理方法所确定的规则线和准线,可以校正扭曲的书籍图像。
准线为测地线,因此,书籍图像校正后,这些曲线应该被校正成一条直线。假设准线上的两个相邻点为(x0,y0,z0)和(x1,y1,z1),准线上的曲线长度s等于校正后的直线长度同时:校正前后准线方向向量L(s)和规则线方向向量η(s)之间的角度应该是相同的。
基于可展曲面的书籍校正过程如下:
1)设置准线上的校正起始点(x,y,z),并计算映射到二维图像上的对应点(u,v)。
2)对于准线上的三维点(从起始点到结束点)采用如下操作:
a)计算准线上的当前三维点的曲线长度;
b)计算对应点三维点在原始图像上的uv坐标;
c)计算校正后图像的uv坐标;
d)把原始图像上对应的像素值拷贝到校正后的图像;
e)根据规则线,校正当前规则线对应的图像,采用如下操作:
i)计算校正后图像的方向向量;
ii)对于每个x方向的步长,计算原始图像的uv坐标
iii)计算校正后图像的uv坐标;
iv)把原始图像上对应的像素值拷贝到校正后的图像;
图7示出了校正前后的图像对比。可以看到,图7中上部的书籍图像存在扭曲的现象,而在经过对图像的校正之后,下部的书籍图像有效地得到改善。
图8是示出根据本发明的一个实施例的图像处理装置800的示例性配置的框图。
如图8所示,图像处理装置800包括规则线确定单元802、准线点确定单元804和准线确定单元806。
图像处理装置800用于处理通过对图像进行三维扫描而得到的三维数据。
其中,规则线确定单元802被配置为针对三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的候选抽样点的直线作为预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则。
准线点确定单元804被配置为选定任一最终规则线上的一个点作为初始准线点,将与初始准线点相邻的最终规则线上与初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点。
准线确定单元806被配置为基于所确定的所有准线点,通过曲线拟合获得准线。
其中,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线是利用动态规划算法来实现的。
其中,规则线确定单元802进一步被配置为:
在每个预定抽样点的候选规则线中选择一条候选规则线,分别计算所选择的候选规则线与所有扫描线之间的最短距离之和,对所计算的最短距离之和求总和;以及
对每个预定抽样点的候选规则线的选择进行遍历,使得总和最小的候选规则线则是满足预定条件的候选规则线。
其中,预定条件还包括:所有候选规则线不超出图像所在区域的范围和/或所有候选规则线在图像所在区域的范围内彼此不交叠。
其中,预定扫描线是处于三维数据的中央位置的扫描线,并且另一扫描线是处于三维数据的边缘位置的扫描线。
其中,使用xyz坐标系表示三维数据,并且不超出图像所在区域的范围的候选规则线是下述候选规则线:在xy平面上,该候选规则线的投影与图像所在区域的给定边界没有交点。
其中,使用xyz坐标系表示三维数据,并且在图像所在区域的范围内与另一预定抽样点的候选规则线不存在交叠的候选规则线是下述候选规则线:在xy平面上,该候选规则线的投影与另一预定抽样点的候选规则线的投影在图像所在区域的两个给定边界内不存在交点。
图像处理装置800,还包括:图像校正单元(图中未示出),被配置为基于最终规则线和准线,将三维数据中的扫描点变换到二维平面上。
其中,在针对每个预定抽样点获取候选规则线时,使得所获取的候选规则线之间的夹角在预定的角度范围内。
关于图像处理装置800的各个部分的操作和功能的细节可以参照结合图1-7描述的本发明的图像处理方法的实施例,这里不再详细描述。
在此需要说明的是,图8所示的装置及其组成单元的结构仅仅是示例性的,本领域技术人员可以根据需要对图8所示的结构框图进行修改。
本发明提出一种基于三维数据来校正扭曲的书籍图像的方法和装置。本发明的方法和传统方法相比有如下优点:
1)全局误差最小的动态规划(DP)算法能有效的提高参数估计的性能;
2)基于准线和规则线(ruling)的方法能够有效的校正扭曲的书籍图像。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。
在通过软件和/或固件实现本发明的实施例的情况下,从存储介质或网络向具有专用硬件结构的计算机,例如图9所示的通用计算机900安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等等。
在图9中,中央处理单元(CPU)901根据只读存储器(ROM)902中存储的程序或从存储部分908加载到随机存取存储器(RAM)903的程序执行各种处理。在RAM 903中,也根据需要存储当CPU 901执行各种处理等等时所需的数据。CPU 901、ROM 902和RAM 903经由总线904彼此链路。输入/输出接口905也链路到总线904。
下述部件链路到输入/输出接口905:输入部分906(包括键盘、鼠标等等)、输出部分907(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分908(包括硬盘等)、通信部分909(包括网络接口卡比如LAN卡、调制解调器等)。通信部分909经由网络比如因特网执行通信处理。根据需要,驱动器910也可链路到输入/输出接口905。可拆卸介质911比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器910上,使得从中读出的计算机程序根据需要被安装到存储部分908中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质911安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图9所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质911。可拆卸介质911的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 902、存储部分908中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明还提出一种存储有机器可读取的指令代码的程序产品。指令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等。
本领域的普通技术人员应理解,在此所例举的是示例性的,本发明并不局限于此。
在本说明书中,“第一”、“第二”以及“第N个”等表述是为了将所描述的特征在文字上区分开,以清楚地描述本发明。因此,不应将其视为具有任何限定性的含义。
作为一个示例,上述方法的各个步骤以及上述设备的各个组成模块和/或单元可以实施为软件、固件、硬件或其组合,并作为相应设备中的一部分。上述装置中各个组成模块、单元通过软件、固件、硬件或其组合的方式进行配置时可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。
作为一个示例,在通过软件或固件实现的情况下,可以从存储介质或网络向具有专用硬件结构的计算机(例如图9所示的通用计算机900)安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其他实施方式中使用,与其他实施方式中的特征相组合,或替代其他实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其他特征、要素、步骤或组件的存在或附加。
此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
本发明及其优点,但是应当理解在不超出由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。而且,本发明的范围不仅限于说明书所描述的过程、设备、手段、方法和步骤的具体实施例。本领域内的普通技术人员从本发明的公开内容将容易理解,根据本发明可以使用执行与在此的相应实施例基本相同的功能或者获得与其基本相同的结果的、现有和将来要被开发的过程、设备、手段、方法或者步骤。因此,所附的权利要求旨在在它们的范围内包括这样的过程、设备、手段、方法或者步骤。
基于以上的说明,可知公开至少公开了以下技术方案:
1.一种图像处理方法,用于处理通过对图像进行三维扫描而得到的三维数据,所述方法包括:
针对所述三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的抽样点的直线作为所述预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线;
选定任一最终规则线上的一个点作为初始准线点,将与所述初始准线点相邻的最终规则线上与所述初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点;以及
基于所确定的所有准线点,通过曲线拟合获得准线。
2.如附记1所述的图像处理方法,其中,
利用动态规划算法来找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线。
3.如附记1所述的图像处理方法,其中,找到满足预定条件的候选规则线包括:
在每个预定抽样点的候选规则线中选择一条候选规则线,分别计算所选择的候选规则线与所有扫描线之间的最短距离之和,对所计算的所述最短距离之和求总和;以及
对每个预定抽样点的候选规则线的选择进行遍历,使得所述总和最小的候选规则线则是满足所述预定条件的候选规则线。
4.如附记3所述的图像处理方法,其中,
所述预定条件还包括:所有候选规则线不超出所述图像所在区域的范围和/或所有候选规则线在所述图像所在区域的范围内彼此不交叠。
5.如附记1所述的图像处理方法,其中,
所述预定扫描线是处于所述三维数据的中央位置的扫描线,并且
所述另一扫描线是处于所述三维数据的边缘位置的扫描线。
6.如附记4所述的图像处理方法,其中,
使用xyz坐标系表示所述三维数据,并且
不超出所述图像所在区域的范围的候选规则线是下述候选规则线:在xy平面上,该候选规则线的投影与所述图像所在区域的给定边界没有交点。
7.如附记4所述的图像处理方法,其中,
使用xyz坐标系表示所述三维数据,并且
在所述图像所在区域的范围内与另一预定抽样点的候选规则线不存在交叠的候选规则线是下述候选规则线:在xy平面上,该候选规则线的投影与另一预定抽样点的候选规则线的投影在所述图像所在区域的两个给定边界内不存在交点。
8.如附记1所述的图像处理方法,还包括:
基于所述最终规则线和所述准线,将所述三维数据中的扫描点变换到二维平面上。
9.如附记1所述的图像处理方法,其中,
在针对每个预定抽样点获取候选规则线时,使得所获取的候选规则线之间的夹角在预定的角度范围内。
10.一种图像处理装置,用于处理通过对图像进行三维扫描而得到的三维数据,所述装置包括:
规则线确定单元,被配置为针对所述三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的候选抽样点的直线作为所述预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则;
准线点确定单元,被配置为选定任一最终规则线上的一个点作为初始准线点,将与所述初始准线点相邻的最终规则线上与所述初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点;以及
准线确定单元,被配置为基于所确定的所有准线点,通过曲线拟合获得准线。
11.如附记10所述的图像处理装置,其中,
找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线是利用动态规划算法来实现的。
12.如附记10所述的图像处理装置,其中,所述规则线确定单元进一步被配置为:
在每个预定抽样点的候选规则线中选择一条候选规则线,分别计算所选择的候选规则线与所有扫描线之间的最短距离之和,对所计算的所述最短距离之和求总和;以及
对每个预定抽样点的候选规则线的选择进行遍历,使得所述总和最小的候选规则线则是满足所述预定条件的候选规则线。
13.如附记12所述的图像处理装置,其中,
所述预定条件还包括:所有候选规则线不超出所述图像所在区域的范围和/或所有候选规则线在所述图像所在区域的范围内彼此不交叠。
14.如附记10所述的图像处理装置,其中,
所述预定扫描线是处于所述三维数据的中央位置的扫描线,并且
所述另一扫描线是处于所述三维数据的边缘位置的扫描线。
15.如附记13所述的图像处理装置,其中,
使用xyz坐标系表示所述三维数据,并且
不超出所述图像所在区域的范围的候选规则线是下述候选规则线:在xy平面上,该候选规则线的投影与所述图像所在区域的给定边界没有交点。
16.如附记13所述的图像处理装置,其中,
使用xyz坐标系表示所述三维数据,并且
在所述图像所在区域的范围内与另一预定抽样点的候选规则线不存在交叠的候选规则线是下述候选规则线:在xy平面上,该候选规则线的投影与另一预定抽样点的候选规则线的投影在所述图像所在区域的两个给定边界内不存在交点。
17.如附记10所述的图像处理装置,还包括:
图像校正单元,被配置为基于所述最终规则线和所述准线,将所述三维数据中的扫描点变换到二维平面上。
18.如附记10所述的图像处理装置,其中,
在针对每个预定抽样点获取候选规则线时,使得所获取的候选规则线之间的夹角在预定的角度范围内。
19.一种非暂态计算机可读存储介质,所述存储介质上存储有图像处理方法,所述图像处理方法包括:
针对所述三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的候选抽样点的直线作为所述预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线;
选定任一最终规则线上的一个点作为初始准线点,将与所述初始准线点相邻的最终规则线上与所述初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点;以及
基于所确定的所有准线点,通过曲线拟合获得准线。
Claims (10)
1.一种图像处理方法,用于处理通过对图像进行三维扫描而得到的三维数据,所述方法包括:
针对所述三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的抽样点的直线作为所述预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线;
选定任一最终规则线上的一个点作为初始准线点,将与所述初始准线点相邻的最终规则线上与所述初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点;以及
基于所确定的所有准线点,通过曲线拟合获得准线。
2.如权利要求1所述的图像处理方法,其中,
利用动态规划算法来找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线。
3.如权利要求1所述的图像处理方法,其中,找到满足预定条件的候选规则线包括:
在每个预定抽样点的候选规则线中选择一条候选规则线,分别计算所选择的候选规则线与所有扫描线之间的最短距离之和,对所计算的所述最短距离之和求总和;
对每个预定抽样点的候选规则线的选择进行遍历,使得所述总和最小的候选规则线则是满足所述预定条件的候选规则线。
4.如权利要求3所述的图像处理方法,其中,
所述预定条件还包括:所有候选规则线不超出所述图像所在区域的范围和/或所有候选规则线在所述图像所在区域的范围内彼此不交叠。
5.如权利要求1所述的图像处理方法,其中,
所述预定扫描线是处于所述三维数据的中央位置的扫描线,并且
所述另一扫描线是处于所述三维数据的边缘位置的扫描线。
6.如权利要求4所述的图像处理方法,其中,
使用xyz坐标系表示所述三维数据,并且
不超出所述图像所在区域的范围的候选规则线是下述候选规则线:在xy平面上,该候选规则线的投影与所述图像所在区域的给定边界没有交点。
7.如权利要求4所述的图像处理方法,其中,
使用xyz坐标系表示所述三维数据,并且
在所述图像所在区域的范围内与另一预定抽样点的候选规则线不存在交叠的候选规则线是下述候选规则线:在xy平面上,该候选规则线的投影与另一预定抽样点的候选规则线的投影在所述图像所在区域的两个给定边界内不存在交点。
8.如权利要求1所述的图像处理方法,还包括:
基于所述最终规则线和所述准线,将所述三维数据中的扫描点变换到二维平面上。
9.如权利要求1所述的图像处理方法,其中,
在针对每个预定抽样点获取候选规则线时,使得所获取的候选规则线之间的夹角在预定的角度范围内。
10.一种图像处理装置,用于处理通过对图像进行三维扫描而得到的三维数据,所述装置包括:
规则线确定单元,被配置为针对所述三维数据中的预定扫描线上的每个预定抽样点,获取通过预定抽样点和另一扫描线上的抽样点的直线作为所述预定抽样点的候选规则线,找到满足预定条件的候选规则线作为每个预定抽样点的最终规则线;
准线点确定单元,被配置为选定任一最终规则线上的一个点作为初始准线点,将与所述初始准线点相邻的最终规则线上与所述初始准线点的距离最近的点确定为该最终规则线上的准线点,依次迭代确定所有最终规则线上的准线点;以及
准线确定单元,被配置为基于所确定的所有准线点,通过曲线拟合获得准线。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611013599.8A CN108073924B (zh) | 2016-11-17 | 2016-11-17 | 图像处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611013599.8A CN108073924B (zh) | 2016-11-17 | 2016-11-17 | 图像处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108073924A CN108073924A (zh) | 2018-05-25 |
CN108073924B true CN108073924B (zh) | 2021-06-22 |
Family
ID=62160177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611013599.8A Active CN108073924B (zh) | 2016-11-17 | 2016-11-17 | 图像处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108073924B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111932448B (zh) * | 2020-09-09 | 2021-03-26 | 南昌虚拟现实研究院股份有限公司 | 一种数据处理方法、装置、存储介质及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1342021A (zh) * | 2000-09-04 | 2002-03-27 | 富士通株式会社 | 校正输入图象失真的设备与方法 |
CN103839059A (zh) * | 2012-11-22 | 2014-06-04 | 富士通株式会社 | 用于提取文档图像中的文档边界的装置、方法及电子设备 |
CN105118040A (zh) * | 2015-09-18 | 2015-12-02 | 中国科学院自动化研究所 | 基于结构激光线的文档图像畸变矫正方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005041123A1 (ja) * | 2003-10-24 | 2005-05-06 | Fujitsu Limited | 画像歪み補正プログラム,画像歪み補正装置並びに画像歪み補正方法 |
-
2016
- 2016-11-17 CN CN201611013599.8A patent/CN108073924B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1342021A (zh) * | 2000-09-04 | 2002-03-27 | 富士通株式会社 | 校正输入图象失真的设备与方法 |
CN103839059A (zh) * | 2012-11-22 | 2014-06-04 | 富士通株式会社 | 用于提取文档图像中的文档边界的装置、方法及电子设备 |
CN105118040A (zh) * | 2015-09-18 | 2015-12-02 | 中国科学院自动化研究所 | 基于结构激光线的文档图像畸变矫正方法 |
Non-Patent Citations (1)
Title |
---|
面阵CCD航空相机斜视图像几何畸变校正误差分析;周前飞等;《仪器仪表学报》;20140630;第35卷(第6期);第1-8页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108073924A (zh) | 2018-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5183392B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
Stamatopoulos et al. | Goal-oriented rectification of camera-based document images | |
US8717632B2 (en) | Image processing method, image processing device and scanner | |
US10289924B2 (en) | System and method for scanned document correction | |
US8355592B1 (en) | Generating a modified image with semantic constraint | |
RU2631765C1 (ru) | Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот | |
CN107368829B (zh) | 确定输入图像中的矩形目标区域的方法和设备 | |
JP5561100B2 (ja) | 隠蔽された文字の復元方法及び画像処理装置 | |
JP6167528B2 (ja) | 画像コーナーを修正する方法及び装置並びに画像処理設備 | |
US10977511B2 (en) | Optical character recognition of series of images | |
CN103839059B (zh) | 用于提取文档图像中的文档边界的装置、方法及电子设备 | |
US9077926B2 (en) | Image processing method and image processing apparatus | |
CN110827301A (zh) | 用于处理图像的方法和装置 | |
CN115082935A (zh) | 用于对文档图像进行矫正的方法、设备及存储介质 | |
CN108073924B (zh) | 图像处理方法和装置 | |
JP4867620B2 (ja) | 画像処理装置及び画像処理プログラム | |
RU2597163C2 (ru) | Сравнение документов с использованием достоверного источника | |
US10366284B1 (en) | Image recognition and parsing | |
JP4970385B2 (ja) | 2次元コード読取装置とそのプログラム | |
CN107305683B (zh) | 图像处理方法、图像处理设备及图像处理装置 | |
US11699294B2 (en) | Optical character recognition of documents having non-coplanar regions | |
JP2007011529A (ja) | Ocr処理における文字認識位置の決定方法 | |
CN109559271B (zh) | 对深度图像进行优化的方法和装置 | |
KR20100009452A (ko) | 영상 처리 방법 | |
Zheng et al. | Self-Adaptive Reality-Guided Diffusion for Artifact-Free Super-Resolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |