CN115760585A - 图像矫正方法、装置、存储介质及电子设备 - Google Patents
图像矫正方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN115760585A CN115760585A CN202111034357.8A CN202111034357A CN115760585A CN 115760585 A CN115760585 A CN 115760585A CN 202111034357 A CN202111034357 A CN 202111034357A CN 115760585 A CN115760585 A CN 115760585A
- Authority
- CN
- China
- Prior art keywords
- target
- vertical
- transverse
- line set
- transformation matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
Abstract
本公开涉及一种图像矫正方法、装置、存储介质及电子设备,以减少图像矫正后的变形情况,提高图像矫正后的显示效果。其中,该方法包括:获取待矫正的目标图像;对所述目标图像中的直线进行分类,得到横线集合和竖线集合;对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,并对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合;根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,并通过所述目标矫正变换矩阵对所述目标图像进行变换处理,得到矫正图像。
Description
技术领域
本公开涉及图像处理技术领域,尤其涉及图像矫正方法、装置、存储介质及电子设备。
背景技术
图像矫正可以对由于俯拍或者仰拍导致拍摄物体存在透视变形的图像,通过找到图像中物体的几何关系,求出变换矩阵,从而根据该变换矩阵对原始图像进行变换,得到矫正后的图像。
相关技术中的图像矫正主要是先对图像进行直线检测,然后通过检测到的直线做灭点检测,再通过检测到的灭点求取矫正变换矩阵,最后利用矫正变换矩阵对图片进行变换。
发明内容
为克服相关技术中存在的问题,本公开提供一种图像矫正方法、装置、存储介质及电子设备。
根据本公开实施例的第一方面,提供一种图像矫正方法,包括:
获取待矫正的目标图像;
对所述目标图像中的直线进行分类,得到横线集合和竖线集合;
对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,并对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合;
根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,并通过所述目标矫正变换矩阵对所述目标图像进行变换处理,得到矫正图像。
可选地,所述对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,包括:
在所述横线集合中选取任意两条横线作为初始的目标横线,并执行以下过程:
确定所述目标横线的灭点与所述横线集合中每一其他横线的距离,若所述距离小于预设距离,则将所述其他横线归类到包括所述目标横线的候选集合,并在所述横线集合中选取除所述目标横线外的任意两条横线作为新的目标横线,直到所述横线集合中每一横线均被选取为目标横线;
在得到的多个候选集合中确定横线数量最多的集合为目标横线集合。
可选地,所述对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合,包括:
在所述竖线集合中选取任意两条竖线作为初始的目标竖线,并执行以下过程:
确定所述目标竖线的灭点与所述竖线集合中每一其他竖线的距离,若所述距离小于预设距离,则将所述其他竖线归类到包括所述目标竖线的候选集合,并在所述竖线集合中选取除所述目标竖线外的任意两条竖线作为新的目标竖线,直到所述竖线集合中每一竖线均被选取为目标竖线;
在得到的多个候选集合中确定竖线数量最多的集合为目标竖线集合。
可选地,所述根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,包括:
将预设的透视变换矩阵作为初始的矫正变换矩阵,对所述横线集合和所述竖线集合中的直线迭代执行矫正变换过程,直到迭代次数达到预设次数,得到所述目标矫正变换矩阵,其中,所述矫正变换过程包括:
按照本次迭代过程的矫正变换矩阵对所述横线集合和所述竖线集合中的直线进行变换;
根据变换后的横线与所述目标图像平面内纵轴的点乘结果和变换后的竖线与所述目标图像平面内横轴的点乘结果,确定目标优化函数,并以最小化所述目标优化函数为目标,更新所述矫正变换矩阵;
将更新后的所述矫正变换矩阵作为下一次迭代过程的矫正变换矩阵。
可选地,所述预设的透视变换矩阵是通过如下方式确定的:
根据预设的横向变换参数、所述目标图像的高度和所述目标图像的宽度,确定横向变换矩阵,所述横向变换参数用于沿所述横轴方向进行矫正变换;
根据预设的竖向变换参数、所述目标图像的高度和所述目标图像的宽度,确定竖向变换矩阵,所述竖向变换参数用于沿所述纵轴方向进行矫正变换;
根据预设的平面旋转参数、所述目标图像的高度和所述目标图像的宽度,确定平面变换矩阵,所述平面旋转参数用于对所述目标图像平面进行旋转变换;
将所述横向变换矩阵、所述竖向变换矩阵和所述平面变换矩阵的乘积结果作为预设的透视变换矩阵;
所述更新所述矫正变换矩阵,包括:
更新所述矫正变换矩阵的横向变换参数、竖向变换参数和平面旋转参数中的至少一者。
可选地,所述目标矫正变换矩阵包括横向变换矩阵和竖向变换矩阵,所述根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,包括:
确定所述目标横线集合中各横线的灭点与所述目标图像平面的夹角,得到横向透视角,并确定所述目标竖线集合中各竖线的灭点与所述目标图像平面的夹角,得到竖向透视角;
根据所述横向透视角与第一预设角度的数值关系、以及所述竖向透视角与第二预设角度的数值关系,确定对所述目标图像进行矫正处理的矫正方向,所述矫正方向包括横向矫正或竖向矫正;
在所述横向变换矩阵和所述竖向变换矩阵中,根据所述矫正方向确定目标矫正变换矩阵。
可选地,所述对所述目标图像中的直线进行分类,得到横线集合和竖线集合,包括:
对所述目标图像进行直线检测,并针对检测到的每一直线,确定所述直线与所述目标图像平面内横轴的夹角、以及所述直线与所述目标图像平面内纵轴的夹角;
若所述直线与所述横轴的夹角小于所述直线与所述纵轴的夹角,则将所述直线归类到横线集合,若所述直线与所述横轴的夹角大于或等于所述直线与所述纵轴的夹角,则将所述直线归类到竖线集合。
根据本公开实施例的第一方面,提供一种图像矫正装置,所述装置包括:
获取模块,被配置为获取待矫正的目标图像;
分类模块,被配置为对所述目标图像中的直线进行分类,得到横线集合和竖线集合;
过滤模块,被配置为对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,并对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合;
矫正模块,被配置为根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,并通过所述目标矫正变换矩阵对所述目标图像进行变换处理,得到矫正图像。
可选地,所述过滤模块被配置为:
在所述横线集合中选取任意两条横线作为初始的目标横线,并执行以下过程:
确定所述目标横线的灭点与所述横线集合中每一其他横线的距离,当所述距离小于预设距离时,将所述其他横线归类到包括所述目标横线的候选集合,并在所述横线集合中选取除所述目标横线外的任意两条横线作为新的目标横线,直到所述横线集合中每一横线均被选取为目标横线;
在得到的多个候选集合中确定横线数量最多的集合为目标横线集合。
可选地,所述过滤模块被配置为:
在所述竖线集合中选取任意两条竖线作为初始的目标竖线,并执行以下过程:
确定所述目标竖线的灭点与所述竖线集合中每一其他竖线的距离,当所述距离小于预设距离时,将所述其他竖线归类到包括所述目标竖线的候选集合,并在所述竖线集合中选取除所述目标竖线外的任意两条竖线作为新的目标竖线,直到所述竖线集合中每一竖线均被选取为目标竖线;
在得到的多个候选集合中确定竖线数量最多的集合为目标竖线集合。
可选地,所述矫正模块被配置为:
将预设的透视变换矩阵作为初始的矫正变换矩阵,对所述横线集合和所述竖线集合中的直线迭代执行矫正变换过程,直到迭代次数达到预设次数,得到所述目标矫正变换矩阵,其中,所述矫正变换过程包括:
按照本次迭代过程的矫正变换矩阵对所述横线集合和所述竖线集合中的直线进行变换;
根据变换后的横线与所述目标图像平面内纵轴的点乘结果和变换后的竖线与所述目标图像平面内横轴的点乘结果,确定目标优化函数,并以最小化所述目标优化函数为目标,更新所述矫正变换矩阵;
将更新后的所述矫正变换矩阵作为下一次迭代过程的矫正变换矩阵。
可选地,所述装置还包括用于确定预设的所述透视变换矩阵矫正的矩阵确定模块,所述矩阵确定模块被配置为:
根据预设的横向变换参数、所述目标图像的高度和所述目标图像的宽度,确定横向变换矩阵,所述横向变换参数用于沿所述横轴方向进行矫正变换;
根据预设的竖向变换参数、所述目标图像的高度和所述目标图像的宽度,确定竖向变换矩阵,所述竖向变换参数用于沿所述纵轴方向进行矫正变换;
根据预设的平面旋转参数、所述目标图像的高度和所述目标图像的宽度,确定平面变换矩阵,所述平面旋转参数用于对所述目标图像平面进行旋转变换;
将所述横向变换矩阵、所述竖向变换矩阵和所述平面变换矩阵的乘积结果作为预设的透视变换矩阵;
所述矫正模块被配置为:
更新所述矫正变换矩阵的横向变换参数、竖向变换参数和平面旋转参数中的至少一者。
可选地,所述目标矫正变换矩阵包括横向变换矩阵和竖向变换矩阵,所述矫正模块包括:
透视角确定模块,被配置为确定所述目标横线集合中各横线的灭点与所述目标图像平面的夹角,得到横向透视角,并确定所述目标竖线集合中各竖线的灭点与所述目标图像平面的夹角,得到竖向透视角;
矫正方向确定模块,被配置为根据所述横向透视角与第一预设角度的数值关系、以及所述竖向透视角与第二预设角度的数值关系,确定对所述目标图像进行矫正处理的矫正方向,所述矫正方向包括横向矫正和竖向矫正;
矩阵确定模块,被配置为在所述横向变换矩阵和所述竖向变换矩阵中,根据所述矫正方向确定目标矫正变换矩阵。
可选地,所述分类模块被配置为:
对所述目标图像进行直线检测,并针对检测到的每一直线,确定所述直线与所述横轴的夹角、以及所述直线与所述纵轴的夹角;
当所述直线与所述横轴的夹角小于所述直线与所述纵轴的夹角时,将所述直线归类到横线集合,当所述直线与所述横轴的夹角大于或等于所述直线与所述纵轴的夹角时,将所述直线归类到竖线集合。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待矫正的目标图像;
对所述目标图像中的直线进行分类,得到横线集合和竖线集合;
对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,并对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合;
根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,并通过所述目标矫正变换矩阵对所述目标图像进行变换处理,得到矫正图像。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现第一方面中任一项所述图像矫正方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
可以对待矫正的目标图像中的直线进行分类,得到横线集合和竖线集合,然后对横线集合和竖线集合进行过滤处理,以去除离群直线(即噪声直线),得到目标横向集合和目标竖线集合,最后根据该目标横向集合和目标竖线集合求解目标矫正变换矩阵来进行图像矫正。相较于相关技术中的方式,对直线检测的结果进行过滤处理,可以减少离群直线对于变换矩阵求解的影响,提高变换矩阵求解的准确性,从而减少图像矫正后的图像变形情况,提高图像矫正后的显示效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种图像矫正方法的流程图。
图2是根据一示例性实施例示出的一种图像矫正方法中直线分类过程中直线与目标图像平面内横轴和纵轴的夹角示意图。
图3是根据另一示例性实施例示出的一种图像矫正方法的流程图。
图4是根据另一示例性实施例示出的一种图像矫正装置的框图。
图5是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
正如背景技术所言,相关技术中的图像矫正主要是先对图像进行直线检测,然后通过检测到的直线做灭点检测,再通过检测到的灭点求取矫正变换矩阵,最后利用矫正变换矩阵对图片进行变换。
发明人研究发现,按照相关技术中的此种方式,将直线检测的结果直接用于求取矫正变换矩阵,由于直线检测的结果中可能会包含很多噪声,因此通过这些噪声直线进行灭点检测,会导致灭点检测的结果不准确,从而根据该灭点检测结果求出来的单应性矩阵进行图像矫正,会导致矫正后的图像变形严重,影响矫正后图像的显示效果。
有鉴于此,本公开提供一种新的图像矫正方法,以解决相关技术中存在的问题,减少图像矫正后的图像变形情况,提高图像矫正后的显示效果。
首先说明本公开提供的图像矫正方法可能的实施场景。该图像矫正方法可以应用于例如手机、平板电脑等不同类型的电子设备,从而该电子设备可以执行本公开提供的图像矫正方法进行图像矫正。比如,将该图像矫正方法集成在手机相册功能中,当用户拍摄照片因为拍摄角度倾斜而导致所拍摄的主体出现透视变形时,比如,由于仰拍导致拍摄的建筑物扭曲,则在手机相册功能中可以根据用户的图像矫正选择操作,通过本公开提供的图像矫正方法对拍摄的照片进行后续的处理和优化,不仅可以非常方便的完成照片美化,还可以减少矫正后图像的变形情况。
图1是根据一示例性实施例示出的一种图像矫正方法的流程图,如图1所示,该图像矫正方法可以应用于不同类型的电子设备中,包括:
在步骤S11中,获取待矫正的目标图像。
在步骤S12中,对目标图像中的直线进行分类,得到横线集合和竖线集合。
在步骤S13中,对横线集合中的横线进行过滤处理,以去除横线集合中的离群横线,得到目标横线集合,并对竖线集合中的竖线进行过滤处理,以去除竖线集合中的离群竖线,得到目标竖线集合。
在步骤S14中,根据目标横线集合和目标竖线集合中的直线确定目标矫正变换矩阵,并通过目标矫正变换矩阵对目标图像进行变换处理,得到矫正图像。
通过上述方式,可以对待矫正的目标图像中的直线进行分类,得到横线集合和竖线集合,然后对横线集合和竖线集合进行过滤处理,以去除离群直线(即噪声直线),得到目标横向集合和目标竖线集合,最后根据该目标横向集合和目标竖线集合求解目标矫正变换矩阵来进行图像矫正。相较于相关技术中的方式,对直线检测的结果进行过滤处理,可以减少离群直线(即噪声直线)对于变换矩阵求解的影响,提高变换矩阵求解的准确性,从而减少图像矫正后的图像变形情况,提高图像矫正后的显示效果。
为了使得本领域技术人员更加理解本公开提供的图像矫正方法,下面对上述各步骤进行详细举例说明。
示例地,在步骤S11中,待矫正的目标图像可以是电子设备拍摄的图像,或者该目标图像可以是电子设备通过网络下载的图像,又或者该目标图像还可以是从视频中提取到的视频帧图像,等等,本公开实施例对于该目标图像的获取方式和具体形式不作限定。
在获取到待矫正的目标图像后,可以先对目标图像的直线进行分类,得到横线集合和竖线集合,从而根据该横线集合和竖线集合来求取矫正变换矩阵进行图像矫正。
示例地,可以先对目标图像进行直线检测,以确定目标图像包括的所有直线。比如,可以通过EDLines直线检测算法和LSD直线检测算法对目标图像进行直线检测。之后,对于直线检测得到的所有直线,可以进行直线分类,将目标图像中的所有直线分类为横线或竖线。
在可能的方式中,可以对目标图像进行直线检测,并针对检测到的每一直线,确定该直线与目标图像平面内横轴的夹角、以及直线与目标图像平面内纵轴的夹角,若直线与横轴的夹角小于直线与纵轴的夹角,则将直线归类到横线集合,若直线与横轴的夹角大于或等于直线与纵轴的夹角,则将直线归类到竖线集合。
示例地,可以将目标图像的左上顶点为原点,将沿该左上顶点往右的方向为X轴正方向,将沿该左上顶点往下的方向为Y轴负方向,建立坐标轴。当然,也可以通过其他方式建立目标图像平面内的坐标轴,本公开实施例对此不作限定。在建立目标图像平面内的坐标轴之后,目标平面内横轴可以是与该坐标轴的X轴重合或平行的任一横轴,目标平面内纵轴可以是该坐标轴的Y轴重合或平行的任一纵轴,本公开实施例对此不作限定。
针对直线检测到的任一直线,可以先确定该直线与目标图像平面内横轴的夹角,以及该直线与目标图像平面内纵轴的夹角,然后根据这两个夹角之间的大小关系,将目标图像内的直线分类为横线或竖线。例如,目标平面内横轴为如图2所示的X轴,目标平面内纵轴为如图2所示的Y轴,直线L与X轴的夹角为a,直线L与Y轴的夹角为b,由于夹角a小于夹角b,因此可以将直线L归类到横线集合。反之,若直线L与X轴的夹角大于或等于直线L与Y轴的夹角,则可以将直线L归类到竖线集合。
在将目标图像中的直线进行分类得到横线集合和竖线集合后,为了减少噪声直线对后续求解矫正变换矩阵的影响,减少图像矫正后的变形情况,可以对横线集合和竖线集合中的直线进行过滤处理。
在可能的方式中,对横线集合中的直线进行过滤处理,以去除横线集合中的离群直线,得到目标横线集合可以是:在横线集合中选取任意两条直线作为初始的目标横线,并执行以下过程:确定目标横线的灭点与横线集合中每一其他横线的距离,若距离小于预设距离,则将其他横线归类到包括目标横线的候选集合,并在横线集合中选取除目标横线外的任意两条横线作为新的目标横线,直到横线集合中每一横线均被选取为目标横线,最后在得到的多个候选集合中确定横线数量最多的集合为目标横线集合。
其中,预设距离可以根据实际情况设定,本公开实施例对此不作限定。
应当理解的是,灭点是指两条或多条直线向远处地平线伸展直至聚合的点。在本公开实施例中,针对横线集合中的横线过滤离群直线,可以先随机选取横线集合中的两条横线,求出这两条横线在平面外的交点,该交点即为这两条横线的灭点。然后,可以计算横线集合中除该两条横线外的其他横线与所求灭点的距离,如果其他横线与灭点的距离小于预设距离,则认为该其他横线与灭点对应的两条横线属于同一横线集,可以将该其他横线归类到包括灭点对应的两条横线的候选集合。如果其他横线与灭点的距离大于或等于预设距离,则将认为该其他横线是离群直线,且与灭点对应的两条横线不属于同一集合。由此,可以根据选取出的两条横线的灭点将横线集合中的剩余横线进行分类,得到一候选集合。之后,重新随机选择两条直线,重复执行上述过程,直到横线集合中的每一横线均被选取进行灭点计算。由此,可以得到多个候选集合S(L1)、S(L2)、…、S(Ln),其中n为大于2的正整数。最后,可以在多个候选集合中确定横线数量最多的集合为目标横线集合。
类似地,在可能的方式中,对竖线集合中的直线进行过滤处理,以去除竖线集合中的离群直线,得到目标竖线集合,可以是:在竖线集合中选取任意两条直线作为初始的目标竖线,并执行以下过程:确定目标竖线的灭点与竖线集合中每一其他竖线的距离,若距离小于预设距离,则将其他竖线归类到包括目标竖线的候选集合,并在竖线集合中选取除目标竖线外的任意两条竖线作为新的目标竖线,直到竖线集合中每一竖线均被选取为目标竖线,最后在得到的多个候选集合中确定竖线数量最多的集合为目标竖线集合。
通过上述方式,可以分别对横线集合和竖线集合过滤离群直线(即噪声直线),从而减少离群直线对于变换矩阵求解的影响,提高变换矩阵求解的准确性,进而减少图像矫正后的图像变形情况,提高图像矫正后的显示效果。
在过滤掉横线集合和竖线集合中的离群直线后,即得到目标横线集合和目标竖线集合后,可以根据目标横线集合和目标竖线集合中的直线确定目标矫正变换矩阵。
在可能的方式中,根据目标横线集合和目标竖线集合中的直线确定目标矫正变换矩阵则可以是:先确定目标横线集合中各横线的灭点与目标图像平面的夹角,得到横向透视角,并确定目标竖线集合中各竖线的灭点与目标图像平面的夹角,得到竖向透视角,然后根据横向透视角与第一预设角度的数值关系、以及竖向透视角与第二预设角度的数值关系,确定对目标图像进行矫正处理的矫正方向,该矫正方向包括横向矫正或竖向矫正。最后,在横向变换矩阵和竖向变换矩阵中,根据矫正方向确定目标矫正变换矩阵。
应当理解的是,在实际应用中,对于图像的矫正通常会包括横向的透视矫正和竖向的透视矫正。因此,可以先确定图像矫正的方向,然后根据矫正方向选择对应的矫正方式,而不是针对每一图像均进行横向的透视矫正和竖向的透视矫正。由此,可以减少计算量,提高图像矫正的效率。
示例地,若目标横线集合中各横线的灭点坐标为(x,y,z),则可以按照如下公式计算各横线的灭点与目标平面的夹角,得到横向透视角:
类似地,对于竖向透视角,也可以在得到目标竖线集合中各竖线的灭点坐标后,按照上述公式进行计算得到。
在得到横向透视角和竖向透视角后,可以根据横向透视角与第一预设角度的数值关系、以及竖向透视角与第二预设角度的数值关系,确定对目标图像进行矫正处理的矫正方向。其中,第一预设角度和第二预设角度可以相同。比如,第一预设角度和第二预设角度均设置为15度。在此种情况下,若横向透视角小于15度,则可以确定矫正方向为横向矫正,否则可以不作横向矫正。若竖向透视角小于15度,则可以确定矫正方向为竖向矫正,否则可以不作竖向矫正。若横向透视角和竖向透视角都小于15度,则确定矫正方向为横向矫正和竖向矫正。若横向透视角和竖向透视角都大于15度,则可以不进行矫正处理。
也即是说,在目标矫正变换矩阵包括横向变换矩阵和竖向变换矩阵的情况下,可以根据矫正方向确定目标矫正变换矩阵,以提高图像矫正的效率。
在可能的方式中,根据目标横线集合和目标竖线集合中的直线确定目标矫正变换矩阵可以是迭代执行的过程。示例地,可以将预设的透视变换矩阵作为初始的矫正变换矩阵,对横线集合和竖线集合中的直线迭代执行矫正变换过程,直到迭代次数达到预设次数,得到目标矫正变换矩阵。其中,矫正变换过程包括:按照本次迭代过程的矫正变换矩阵对横线集合和竖线集合中的直线进行变换,然后根据变换后的横线与目标图像平面内横轴的点乘结果和变换后的竖线与目标图像平面内纵轴的点乘结果,确定目标优化函数,并以最小化目标优化函数为目标,更新矫正变换矩阵,然后将更新后的矫正变换矩阵作为下一次迭代过程的矫正变换矩阵。
其中,预设次数可以根据实际情况设定,本公开实施例对此不作限定。
在可能的方式中,预设的透视变换矩阵可以是通过如下方式确定的:首先根据预设的横向变换参数、目标图像的高度和目标图像的宽度,确定横向变换矩阵,该横向变换参数用于沿横轴方向进行矫正变换,并根据预设的竖向变换参数、目标图像的高度和目标图像的宽度,确定竖向变换矩阵,该竖向变换参数用于沿纵轴方向进行矫正变换,根据预设的平面旋转参数、目标图像的高度和目标图像的宽度,确定平面变换矩阵,该平面旋转参数用于对目标图像平面进行旋转变换。最后,可以将横向变换矩阵、竖向变换矩阵和平面变换矩阵的乘积结果作为预设的透视变换矩阵。相应地,更新矫正变换矩阵则可以是更新矫正变换矩阵的横向变换参数、竖向变换参数和平面旋转参数中的至少一者。
应当理解的是,本公开实施例中的图像矫正可以分解为三部分:横轴方向上的透视矫正、纵轴方向上的透视矫正、平面内的旋转矫正。其中,横轴方向上的矫正目的是所有的横线经过校正后都平行,且与纵轴垂直,纵轴方向上的矫正目的是所有的竖线经过校正后都平行,且与横轴垂直。同时,由于拍照过程中常常容易出现相机与地平线不平行的情况,因此还可以进行平面内变换旋转,使得图像中的线条对齐地平线。
例如,横轴和纵轴上的透视矫正模拟了移位透镜的效果,可以分别通过一个透镜移位参数shift_x和shift_y来矫正一个方向上的直线,并且可以通过平面旋转参数angle来矫正相机与地平线不平行的情况。在此种情况下,矫正系数的求解过程可以包括:先将shift_x、shift_y和angle都初始化为0,即预设的横向变换参数、预设的竖向变换参数和预设的平面旋转参数均为0。然后可以根据预设的横向变换参数、目标图像的高度和目标图像的宽度,确定横向变换矩阵Mx:
其中,e_x=exp(shift_x),height表示目标图像的高度,width表示目标图像的宽度。
类似地,可以根据预设的竖向变换参数、目标图像的高度和目标图像的宽度,确定横向变换矩阵My:
其中,e_y=exp(shift_y)。
另外,还可以根据预设的平面旋转参数、目标图像的高度和目标图像的宽度,确定平面变换矩阵Mr:
其中,tx=-0.5×height×cos(angle)+0.5×width×sin(angle)+0.5×height,ty=-0.5×height×sin(angle)-0.5×width×cos(angle)+0.5×width。
通过上述方式,可以求解得到横向变换矩阵、竖向变换矩阵和平面变换矩阵,之后则可以将横向变换矩阵、竖向变换矩阵和平面变换矩阵的乘积结果作为预设的透视变换矩阵,即可以通过如下方式确定预设的透视变换矩阵:
M=Mx×My×Mr
之后,则可以将该预设的透视变换矩阵作为初始的矫正变换矩阵,对目标横线集合和目标竖线集合中的直线迭代执行矫正变换过程,直到迭代次数达到预设次数。在每次迭代过程中,可以按照本次迭代过程的矫正变换矩阵对横线集合和竖线集合中的直线进行变换,然后根据变换后的横线与目标图像平面内纵轴的点乘结果和变换后的竖线与目标图像平面内横轴的点乘结果,确定目标优化函数。
应当理解的是,对横线计算其变换后得到的直线与纵轴的点乘,当变换后得到的直线与横轴垂直时,它们之间的点乘为0,反之垂直度越小,点乘结果越大。同理,对竖线计算其变换后得到的直线与横轴的点乘,当变换后得到的直线与纵轴垂直时,它们之间的点乘为0,反之垂直度越小,点乘结果越大。因此,在本公开实施例中,可以根据变换后的横线与目标图像平面内纵轴的点乘结果和变换后的竖线与目标图像平面内横轴的点乘结果,确定目标优化函数。比如,可以将变换后的横线与目标图像平面内纵轴的点乘结果和变换后的竖线与目标图像平面内横轴的点乘结果直接作为目标优化函数,或者也可以将变换后的横线与目标图像平面内纵轴的点乘结果和变换后的竖线与目标图像平面内横轴的点乘结果的加权和确定为目标优化函数,其中加权权重可以是对应直线的长度。
然后,以最小化目标优化函数为目标,更新矫正变换矩阵。比如,可以更新矫正变换矩阵的横向变换参数、竖向变换参数和平面旋转参数中的至少一者。然后,根据更新后的矫正变换参数再次执行上述求解矫正变换矩阵的过程,并根据重新求解出的矫正变换矩阵对目标横线集合和目标竖线集合中的直线进行矫正变换,再按照上述方式根据矫正变换的结果更新矫正变换矩阵。由此,不断迭代矫正变换的过程,直到迭代次数达到预设次数,将迭代停止时的矫正变换矩阵确定为最终用于图像矫正的目标矫正变换矩阵。
通过上述方式,可以通过迭代求解的方式进一步优化用于图像矫正的目标矫正变换矩阵,从而可以进一步减少图像矫正后的变形情况,提高图像矫正后的显示效果。
在得到目标矫正变换矩阵后,可以根据该目标矫正变换矩阵对目标图像进行变换处理,从而得到矫正图像。由于在目标矫正变换矩阵求解之前,先过滤了噪声直线,则可以减少噪声直线对目标矫正变换矩阵求解的影响,从而可以减少图像矫正后的变形情况,提高图像矫正后的显示效果。
下面通过另一示例性实施例对本公开提供的图像矫正方法进行说明。
参照图3,该图像矫正方法可以包括:
在步骤S301中,获取待矫正的目标图像。
在步骤S302中,对目标图像进行直线检测,得到目标图像中的所有直线。
在步骤S303中,针对检测到的每一直线,确定直线与目标图像平面内横轴的夹角、以及直线与目标图像平面内纵轴的夹角。
在步骤S304中,若直线与横轴的夹角小于直线与纵轴的夹角,则将直线归类到横线集合,若直线与横轴的夹角大于或等于直线与纵轴的夹角,则将直线归类到竖线集合。
在步骤S305中,对横线集合中的直线进行过滤处理,以去除横线集合中的离群直线,得到目标横线集合,并对竖线集合中的竖线进行过滤处理,以去除竖线集合中的离群竖线,得到目标竖线集合。应当理解的是,该过滤处理过程已在上文进行说明,这里不再赘述。
在步骤S306中,确定目标横线集合中各横线的灭点与目标图像平面的夹角,得到横向透视角,并确定目标竖线集合中各竖线的灭点与目标图像平面的夹角,得到竖向透视角。
在步骤S307中,根据横向透视角与第一预设角度的数值关系、以及竖向透视角与第二预设角度的数值关系,确定对目标图像进行矫正处理的矫正方向。
在步骤S308中,根据矫正方向和预设的透视变换矩阵确定初始的矫正变换矩阵。应当理解的是,若矫正方向为横向矫正,则可以将预设的透视变换矩阵中竖向矫正对应的竖向变换矩阵取值为1,即上文中的My取值为1。若矫正方向为竖向矫正,则可以将预设的透视变换矩阵中横向矫正对应的横向变换矩阵取值为1,即上文中的Mx取值为1。
在步骤S309中,根据矫正变换矩阵对横线集合和竖线集合中的直线执行矫正变换过程。
在步骤S310中,判断迭代次数是否达到预设次数,若是则进入步骤S312,否则进入步骤S311。
在步骤S311中,根据矫正变换结果更新矫正变换矩阵,并返回步骤S309。应当理解的是,该更新过程已在上文进行说明,这里不再赘述。
在步骤S312,根据迭代结束后的目标矫正变换矩阵对目标图像进行变换处理,得到矫正图像。
上述各步骤的具体实施方式已在上文进行详细举例说明,这里不再赘述。另外应当理解的是,对于上述方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受上文所描述的动作顺序的限制。其次,本领域技术人员也应该知悉,上文所描述的实施例属于优选实施例,所涉及的步骤并不一定是本公开所必须的。
通过上述方式,可以去除直线检测结果中的离群直线(即噪声直线),得到目标横向集合和目标竖线集合,然后根据该目标横向集合和目标竖线集合求解目标矫正变换矩阵来进行图像矫正。相较于相关技术中的方式,可以减少离群直线对于变换矩阵求解的影响,提高变换矩阵求解的准确性,从而减少图像矫正后的图像变形情况,提高图像矫正后的显示效果。并且,可以迭代求解矫正变换矩阵,相较于一次性求解的方式,可以进一步优化矫正变换矩阵,提高变换矩阵求解的准确性,从而进一步减少图像矫正后的图像变形情况,提高图像矫正后的显示效果。
基于同一构思,本公开还提供一种图像矫正装置,该装置可以通过软件、硬件或者两者结合的方式成为电子设备的部分或全部。参照图4,该图像矫正装置400包括获取模块401,分类模块402、过滤模块403和矫正模块404。
该获取模块401被配置为获取待矫正的目标图像。
该分类模块402被配置为对所述目标图像中的直线进行分类,得到横线集合和竖线集合。
该过滤模块403被配置为对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,并对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合。
该矫正模块404被配置为根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,并通过所述目标矫正变换矩阵对所述目标图像进行变换处理,得到矫正图像。
可选地,所述过滤模块403被配置为:
在所述横线集合中选取任意两条横线作为初始的目标横线,并执行以下过程:
确定所述目标横线的灭点与所述横线集合中每一其他横线的距离,当所述距离小于预设距离时,将所述其他横线归类到包括所述目标横线的候选集合,并在所述横线集合中选取除所述目标横线外的任意两条横线作为新的目标横线,直到所述横线集合中每一横线均被选取为目标横线;
在得到的多个候选集合中确定横线数量最多的集合为目标横线集合。
可选地,所述过滤模块403被配置为:
在所述竖线集合中选取任意两条竖线作为初始的目标竖线,并执行以下过程:
确定所述目标竖线的灭点与所述竖线集合中每一其他竖线的距离,当所述距离小于预设距离时,将所述其他竖线归类到包括所述目标竖线的候选集合,并在所述竖线集合中选取除所述目标竖线外的任意两条竖线作为新的目标竖线,直到所述竖线集合中每一竖线均被选取为目标竖线;
在得到的多个候选集合中确定竖线数量最多的集合为目标竖线集合。
可选地,所述矫正模块404被配置为:
将预设的透视变换矩阵作为初始的矫正变换矩阵,对所述横线集合和所述竖线集合中的直线迭代执行矫正变换过程,直到迭代次数达到预设次数,得到所述目标矫正变换矩阵,其中,所述矫正变换过程包括:
按照本次迭代过程的矫正变换矩阵对所述横线集合和所述竖线集合中的直线进行变换;
根据变换后的横线与所述目标图像平面内纵轴的点乘结果和变换后的竖线与所述目标图像平面内横轴的点乘结果,确定目标优化函数,并以最小化所述目标优化函数为目标,更新所述矫正变换矩阵;
将更新后的所述矫正变换矩阵作为下一次迭代过程的矫正变换矩阵。
可选地,所述装置400还包括用于确定预设的所述透视变换矩阵矫正的矩阵确定模块,所述矩阵确定模块被配置为:
根据预设的横向变换参数、所述目标图像的高度和所述目标图像的宽度,确定横向变换矩阵,所述横向变换参数用于沿所述横轴方向进行矫正变换;
根据预设的竖向变换参数、所述目标图像的高度和所述目标图像的宽度,确定竖向变换矩阵,所述竖向变换参数用于沿所述纵轴方向进行矫正变换;
根据预设的平面旋转参数、所述目标图像的高度和所述目标图像的宽度,确定平面变换矩阵,所述平面旋转参数用于对所述目标图像平面进行旋转变换;
将所述横向变换矩阵、所述竖向变换矩阵和所述平面变换矩阵的乘积结果作为预设的透视变换矩阵;
所述矫正模块被配置为:
更新所述矫正变换矩阵的横向变换参数、竖向变换参数和平面旋转参数中的至少一者。
可选地,所述目标矫正变换矩阵包括横向变换矩阵和竖向变换矩阵,所述矫正模块404被配置为:
确定所述目标横线集合中各横线的灭点与所述目标图像平面的夹角,得到横向透视角,并确定所述目标竖线集合中各竖线的灭点与所述目标图像平面的夹角,得到竖向透视角;
根据所述横向透视角与第一预设角度的数值关系、以及所述竖向透视角与第二预设角度的数值关系,确定对所述目标图像进行矫正处理的矫正方向,所述矫正方向包括横向矫正和竖向矫正;
在所述横向变换矩阵和所述竖向变换矩阵中,根据所述矫正方向确定目标矫正变换矩阵。
可选地,所述分类模块402被配置为:
对所述目标图像进行直线检测,并针对检测到的每一直线,确定所述直线与所述横轴的夹角、以及所述直线与所述纵轴的夹角;
当所述直线与所述横轴的夹角小于所述直线与所述纵轴的夹角时,将所述直线归类到横线集合,当所述直线与所述横轴的夹角大于或等于所述直线与所述纵轴的夹角时,将所述直线归类到竖线集合。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于同一构思,本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的图像矫正方法的步骤。
基于同一构思,本公开还提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待矫正的目标图像;
对所述目标图像中的直线进行分类,得到横线集合和竖线集合;
对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,并对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合;
根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,并通过所述目标矫正变换矩阵对所述目标图像进行变换处理,得到矫正图像。
当然,该电子设备的处理器还可以执行上述任一图像矫正方法的步骤,本公开实施例对此不作限定。
在可能的方式中,该电子设备的框图如图5所示。应当理解的是,该电子设备500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述图像矫正方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为电子设备800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图像矫正方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由电子设备800的处理器820执行以完成上述图像矫正方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的图像矫正方法的代码部分。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (16)
1.一种图像矫正方法,其特征在于,所述方法包括:
获取待矫正的目标图像;
对所述目标图像中的直线进行分类,得到横线集合和竖线集合;
对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,并对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合;
根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,并通过所述目标矫正变换矩阵对所述目标图像进行变换处理,得到矫正图像。
2.根据权利要求1所述的方法,其特征在于,所述对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,包括:
在所述横线集合中选取任意两条横线作为初始的目标横线,并执行以下过程:
确定所述目标横线的灭点与所述横线集合中每一其他横线的距离,若所述距离小于预设距离,则将所述其他横线归类到包括所述目标横线的候选集合,并在所述横线集合中选取除所述目标横线外的任意两条横线作为新的目标横线,直到所述横线集合中每一横线均被选取为目标横线;
在得到的多个候选集合中确定横线数量最多的集合为目标横线集合。
3.根据权利要求1所述的方法,其特征在于,所述对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合,包括:
在所述竖线集合中选取任意两条竖线作为初始的目标竖线,并执行以下过程:
确定所述目标竖线的灭点与所述竖线集合中每一其他竖线的距离,若所述距离小于预设距离,则将所述其他竖线归类到包括所述目标竖线的候选集合,并在所述竖线集合中选取除所述目标竖线外的任意两条竖线作为新的目标竖线,直到所述竖线集合中每一竖线均被选取为目标竖线;
在得到的多个候选集合中确定竖线数量最多的集合为目标竖线集合。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,包括:
将预设的透视变换矩阵作为初始的矫正变换矩阵,对所述横线集合和所述竖线集合中的直线迭代执行矫正变换过程,直到迭代次数达到预设次数,得到所述目标矫正变换矩阵,其中,所述矫正变换过程包括:
按照本次迭代过程的矫正变换矩阵对所述横线集合和所述竖线集合中的直线进行变换;
根据变换后的横线与所述目标图像平面内纵轴的点乘结果和变换后的竖线与所述目标图像平面内横轴的点乘结果,确定目标优化函数,并以最小化所述目标优化函数为目标,更新所述矫正变换矩阵;
将更新后的所述矫正变换矩阵作为下一次迭代过程的矫正变换矩阵。
5.根据权利要求4所述的方法,其特征在于,所述预设的透视变换矩阵是通过如下方式确定的:
根据预设的横向变换参数、所述目标图像的高度和所述目标图像的宽度,确定横向变换矩阵,所述横向变换参数用于沿所述横轴方向进行矫正变换;
根据预设的竖向变换参数、所述目标图像的高度和所述目标图像的宽度,确定竖向变换矩阵,所述竖向变换参数用于沿所述纵轴方向进行矫正变换;
根据预设的平面旋转参数、所述目标图像的高度和所述目标图像的宽度,确定平面变换矩阵,所述平面旋转参数用于对所述目标图像平面进行旋转变换;
将所述横向变换矩阵、所述竖向变换矩阵和所述平面变换矩阵的乘积结果作为预设的透视变换矩阵;
所述更新所述矫正变换矩阵,包括:
更新所述矫正变换矩阵的横向变换参数、竖向变换参数和平面旋转参数中的至少一者。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述目标矫正变换矩阵包括横向变换矩阵和竖向变换矩阵,所述根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,包括:
确定所述目标横线集合中各横线的灭点与所述目标图像平面的夹角,得到横向透视角,并确定所述目标竖线集合中各竖线的灭点与所述目标图像平面的夹角,得到竖向透视角;
根据所述横向透视角与第一预设角度的数值关系、以及所述竖向透视角与第二预设角度的数值关系,确定对所述目标图像进行矫正处理的矫正方向,所述矫正方向包括横向矫正或竖向矫正;
在所述横向变换矩阵和所述竖向变换矩阵中,根据所述矫正方向确定目标矫正变换矩阵。
7.根据权利要求1-3任一项所述的方法,其特征在于,所述对所述目标图像中的直线进行分类,得到横线集合和竖线集合,包括:
对所述目标图像进行直线检测,并针对检测到的每一直线,确定所述直线与所述目标图像平面内横轴的夹角、以及所述直线与所述目标图像平面内纵轴的夹角;
若所述直线与所述横轴的夹角小于所述直线与所述纵轴的夹角,则将所述直线归类到横线集合,若所述直线与所述横轴的夹角大于或等于所述直线与所述纵轴的夹角,则将所述直线归类到竖线集合。
8.一种图像矫正装置,其特征在于,所述装置包括:
获取模块,被配置为获取待矫正的目标图像;
分类模块,被配置为对所述目标图像中的直线进行分类,得到横线集合和竖线集合;
过滤模块,被配置为对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,并对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合;
矫正模块,被配置为根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,并通过所述目标矫正变换矩阵对所述目标图像进行变换处理,得到矫正图像。
9.根据权利要求8所述的装置,其特征在于,所述过滤模块被配置为:
在所述横线集合中选取任意两条横线作为初始的目标横线,并执行以下过程:
确定所述目标横线的灭点与所述横线集合中每一其他横线的距离,当所述距离小于预设距离时,将所述其他横线归类到包括所述目标横线的候选集合,并在所述横线集合中选取除所述目标横线外的任意两条横线作为新的目标横线,直到所述横线集合中每一横线均被选取为目标横线;
在得到的多个候选集合中确定横线数量最多的集合为目标横线集合。
10.根据权利要求8所述的装置,其特征在于,所述过滤模块被配置为:
在所述竖线集合中选取任意两条竖线作为初始的目标竖线,并执行以下过程:
确定所述目标竖线的灭点与所述竖线集合中每一其他竖线的距离,当所述距离小于预设距离时,将所述其他竖线归类到包括所述目标竖线的候选集合,并在所述竖线集合中选取除所述目标竖线外的任意两条竖线作为新的目标竖线,直到所述竖线集合中每一竖线均被选取为目标竖线;
在得到的多个候选集合中确定竖线数量最多的集合为目标竖线集合。
11.根据权利要求8-10任一项所述的装置,其特征在于,所述矫正模块被配置为:
将预设的透视变换矩阵作为初始的矫正变换矩阵,对所述横线集合和所述竖线集合中的直线迭代执行矫正变换过程,直到迭代次数达到预设次数,得到所述目标矫正变换矩阵,其中,所述矫正变换过程包括:
按照本次迭代过程的矫正变换矩阵对所述横线集合和所述竖线集合中的直线进行变换;
根据变换后的横线与所述目标图像平面内纵轴的点乘结果和变换后的竖线与所述目标图像平面内横轴的点乘结果,确定目标优化函数,并以最小化所述目标优化函数为目标,更新所述矫正变换矩阵;
将更新后的所述矫正变换矩阵作为下一次迭代过程的矫正变换矩阵。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括用于确定预设的所述透视变换矩阵矫正的矩阵确定模块,所述矩阵确定模块被配置为:
根据预设的横向变换参数、所述目标图像的高度和所述目标图像的宽度,确定横向变换矩阵,所述横向变换参数用于沿所述横轴方向进行矫正变换;
根据预设的竖向变换参数、所述目标图像的高度和所述目标图像的宽度,确定竖向变换矩阵,所述竖向变换参数用于沿所述纵轴方向进行矫正变换;
根据预设的平面旋转参数、所述目标图像的高度和所述目标图像的宽度,确定平面变换矩阵,所述平面旋转参数用于对所述目标图像平面进行旋转变换;
将所述横向变换矩阵、所述竖向变换矩阵和所述平面变换矩阵的乘积结果作为预设的透视变换矩阵;
所述矫正模块被配置为:
更新所述矫正变换矩阵的横向变换参数、竖向变换参数和平面旋转参数中的至少一者。
13.根据权利要求8-10任一项所述的装置,其特征在于,所述目标矫正变换矩阵包括横向变换矩阵和竖向变换矩阵,所述矫正模块被配置为:
确定所述目标横线集合中各横线的灭点与所述目标图像平面的夹角,得到横向透视角,并确定所述目标竖线集合中各竖线的灭点与所述目标图像平面的夹角,得到竖向透视角;
根据所述横向透视角与第一预设角度的数值关系、以及所述竖向透视角与第二预设角度的数值关系,确定对所述目标图像进行矫正处理的矫正方向,所述矫正方向包括横向矫正和竖向矫正;
在所述横向变换矩阵和所述竖向变换矩阵中,根据所述矫正方向确定目标矫正变换矩阵。
14.根据权利要求8-10任一项所述的装置,其特征在于,所述分类模块被配置为:
对所述目标图像进行直线检测,并针对检测到的每一直线,确定所述直线与所述横轴的夹角、以及所述直线与所述纵轴的夹角;
当所述直线与所述横轴的夹角小于所述直线与所述纵轴的夹角时,将所述直线归类到横线集合,当所述直线与所述横轴的夹角大于或等于所述直线与所述纵轴的夹角时,将所述直线归类到竖线集合。
15.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待矫正的目标图像;
对所述目标图像中的直线进行分类,得到横线集合和竖线集合;
对所述横线集合中的横线进行过滤处理,以去除所述横线集合中的离群横线,得到目标横线集合,并对所述竖线集合中的竖线进行过滤处理,以去除所述竖线集合中的离群竖线,得到目标竖线集合;
根据所述目标横线集合和所述目标竖线集合中的直线确定目标矫正变换矩阵,并通过所述目标矫正变换矩阵对所述目标图像进行变换处理,得到矫正图像。
16.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1~7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111034357.8A CN115760585A (zh) | 2021-09-03 | 2021-09-03 | 图像矫正方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111034357.8A CN115760585A (zh) | 2021-09-03 | 2021-09-03 | 图像矫正方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115760585A true CN115760585A (zh) | 2023-03-07 |
Family
ID=85332673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111034357.8A Pending CN115760585A (zh) | 2021-09-03 | 2021-09-03 | 图像矫正方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115760585A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116628834A (zh) * | 2023-07-26 | 2023-08-22 | 北京飞渡科技股份有限公司 | 一种基于神经网络的轮廓分段矫正方法及装置 |
-
2021
- 2021-09-03 CN CN202111034357.8A patent/CN115760585A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116628834A (zh) * | 2023-07-26 | 2023-08-22 | 北京飞渡科技股份有限公司 | 一种基于神经网络的轮廓分段矫正方法及装置 |
CN116628834B (zh) * | 2023-07-26 | 2023-10-20 | 北京飞渡科技股份有限公司 | 一种基于神经网络的轮廓分段矫正方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109697734B (zh) | 位姿估计方法及装置、电子设备和存储介质 | |
CN107798669B (zh) | 图像去雾方法、装置及计算机可读存储介质 | |
CN106250894B (zh) | 卡片信息识别方法及装置 | |
CN106331504B (zh) | 拍摄方法及装置 | |
CN106557759B (zh) | 一种标志牌信息获取方法及装置 | |
CN106296570B (zh) | 图像处理方法及装置 | |
CN107944367B (zh) | 人脸关键点检测方法及装置 | |
CN106446946B (zh) | 图像识别方法及装置 | |
CN109840939B (zh) | 三维重建方法、装置、电子设备及存储介质 | |
KR20160021737A (ko) | 이미지 분할 방법, 장치, 기기, 프로그램 및 기록매체 | |
EP3312702B1 (en) | Method and device for identifying gesture | |
EP2975574B1 (en) | Method, apparatus and terminal for image retargeting | |
CN113643356B (zh) | 相机位姿确定、虚拟物体显示方法、装置及电子设备 | |
CN108648280B (zh) | 虚拟角色驱动方法及装置、电子设备和存储介质 | |
CN106503682B (zh) | 视频数据中的关键点定位方法及装置 | |
EP3173978A1 (en) | Method and device for characteristic extraction | |
CN114170324A (zh) | 标定方法及装置、电子设备和存储介质 | |
CN110930351A (zh) | 一种光斑检测方法、装置及电子设备 | |
US9665925B2 (en) | Method and terminal device for retargeting images | |
CN107992894B (zh) | 图像识别方法、装置及计算机可读存储介质 | |
CN115760585A (zh) | 图像矫正方法、装置、存储介质及电子设备 | |
CN110826463B (zh) | 人脸识别方法及装置、电子设备和存储介质 | |
CN106203436A (zh) | 图像二值化方法和装置 | |
CN113920083A (zh) | 基于图像的尺寸测量方法、装置、电子设备及存储介质 | |
CN112070681B (zh) | 图像处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |