CN112465716A - 图像转换方法、装置、计算机可读存储介质及电子设备 - Google Patents
图像转换方法、装置、计算机可读存储介质及电子设备 Download PDFInfo
- Publication number
- CN112465716A CN112465716A CN202011339332.4A CN202011339332A CN112465716A CN 112465716 A CN112465716 A CN 112465716A CN 202011339332 A CN202011339332 A CN 202011339332A CN 112465716 A CN112465716 A CN 112465716A
- Authority
- CN
- China
- Prior art keywords
- image
- camera
- distortion
- parameters
- coordinate system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 55
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000012937 correction Methods 0.000 claims abstract description 21
- 230000009467 reduction Effects 0.000 claims abstract description 10
- 230000009466 transformation Effects 0.000 claims description 15
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 13
- 238000013507 mapping Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 3
- 238000003384 imaging method Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000004438 eyesight Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012634 optical imaging Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/18—Image warping, e.g. rearranging pixels individually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/80—Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Studio Devices (AREA)
Abstract
本公开实施例公开了一种图像转换方法、装置、计算机可读存储介质及电子设备,其中,该方法包括:确定用于采集第一图像的相机的内参和畸变参数;基于内参和畸变参数,对第一图像进行畸变矫正处理,得到第二图像;在相机的三维局部坐标系下,基于相机的内参和预设的相机旋转角度,将第二图像转换为第三图像;基于内参和畸变参数,对第三图像进行畸变还原处理,得到第四图像。本公开实施例可以在相机拍摄角度变换后又对图像进行畸变操作,使相机拍摄角度变换后的图像与原始图像的成像质量保持一致,实现方式简单,生成图像的效率较高,生成的图像更接近真实场景。
Description
技术领域
本公开涉及计算机技术领域,尤其是一种图像转换方法、装置、计算机可读存储介质及电子设备。
背景技术
在计算机视觉领域,很多应用场景需要用到多种人眼的视线角度下的图像。但受实际条件限制,有时无法利用相机对各种视线角度逐一拍摄,因此,需要基于现有的图像进行相机拍摄角度转换,这样可以得到不同视线角度的图像。
例如,基于深度学习的视线估计算法需要大量的视线数据进行训练。视线数据通常包含两个部分:图像和图像对应的视线角度,为了能够对不同的视线角度(pitch/yaw)数据都取得比较好的预测结果,需要参与模型训练的视线数据能够覆盖大多数视线角度区域。然而在实际视线数据采集过程中,采集成本(包括人力/时间/物力等)比较昂贵,而且很难覆盖大多数视线区域,所以会出现空洞区域。如何有效利用现有数据,生成比较贴合实际的视线数据来补充视线空洞区域是一个非常值得探究的问题。
发明内容
本公开的实施例提供了一种图像转换方法、装置、计算机可读存储介质及电子设备。
本公开的实施例提供了一种图像转换方法,该方法包括:确定用于采集第一图像的相机的内参和畸变参数;基于内参和畸变参数,对第一图像进行畸变矫正处理,得到第二图像;在相机的三维局部坐标系下,基于相机的内参和预设的相机旋转角度,将第二图像转换为第三图像;基于内参和畸变参数,对第三图像进行畸变还原处理,得到第四图像。
根据本公开实施例的另一个方面,提供了一种图像转换装置,该装置包括:第一确定模块,用于确定用于采集第一图像的相机的内参和畸变参数;矫正模块,用于基于内参和畸变参数,对第一图像进行畸变矫正处理,得到第二图像;第一转换模块,用于在相机的三维局部坐标系下,基于相机的内参和预设的相机旋转角度,将第二图像转换为第三图像;还原模块,用于基于内参和畸变参数,对第三图像进行畸变还原处理,得到第四图像。
根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序用于执行上述图像转换方法。
根据本公开实施例的另一个方面,提供了一种电子设备,电子设备包括:处理器;用于存储处理器可执行指令的存储器;处理器,用于从存储器中读取可执行指令,并执行指令以实现上述图像转换方法。
基于本公开上述实施例提供的图像转换方法、装置、计算机可读存储介质及电子设备,通过确定用于采集第一图像的相机的内参和畸变参数,基于内参和畸变参数,对第一图像进行畸变矫正处理,得到第二图像,在相机的三维局部坐标系下,基于相机的内参和预设的相机旋转角度,将第二图像转换为第三图像;基于内参和畸变参数,对第三图像进行畸变还原处理,得到第四图像,实现了在相机拍摄角度变换前对图像进行畸变矫正,减少图像畸变对相机拍摄角度变换的影响,在相机拍摄角度变换后又对图像进行畸变操作,使相机拍摄角度变换后的图像与原始图像的成像质量保持一致。本公开的实施例的实现方式简单,只需使用相机的内参和畸变参数,即可生成模拟同一相机在不同相机拍摄角度下拍摄的图像,生成图像的效率较高。由于生成的图像的像素由原始图像的像素转变而来,从而使生成的图像更接近真实场景。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开所适用的系统图。
图2是本公开一示例性实施例提供的图像转换方法的流程示意图。
图3是本公开另一示例性实施例提供的图像转换方法的流程示意图。
图4是本公开另一示例性实施例提供的图像转换方法的流程示意图。
图5是本公开一示例性实施例提供的图像转换装置的结构示意图。
图6是本公开另一示例性实施例提供的图像转换装置的结构示意图。
图7是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
申请概述
为了生成不同视线角度或相机拍摄角度下的图像,现有技术通常采用如下两种方案:
(1)在2D空间中进行数据增广的方式来补充空洞区域,比如:旋转、镜像等。
(2)基于深度学习方法合成空洞区域的视线数据。
方案(1)只是基于2D信息进行变换,变换过程中可能会不符合光学成像原理,会造成图像失真;空洞补充不具有针对性;可能会导致与实际应用场景产生较大差异(大角度旋转与实际场景会产生较大差异);
方案(2)受到模型精度影响较大,且图像中的像素值都是通过模型合成的,所以图像易失真。
示例性系统
图1示出了可以应用本公开的实施例的图像转换方法或图像转换装置的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101,网络102和服务器103。网络102用于在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101通过网络102与服务器103交互,以接收或发送消息等。终端设备101上可以安装有各种通讯客户端应用,例如图像处理应用、人机交互应用、搜索类应用、网页浏览器应用、即时通信工具等。
终端设备101可以是各种电子设备,包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。
服务器103可以是提供各种服务的服务器,例如对终端设备101上传的图像进行相机拍摄角度转换的后台图像处理服务器。后台图像处理服务器可以对接收到的图像进行处理,得到处理结果(例如相机拍摄角度转换后的图像)。
需要说明的是,本公开的实施例所提供的图像转换方法可以由服务器103执行,也可以由终端设备101执行,相应地,图像转换装置可以设置于服务器103中,也可以设置于终端设备101中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。在用于进行相机拍摄角度转换的图像不需要从远程获取的情况下,上述系统架构可以不包括网络,只包括服务器或终端设备。
示例性方法
图2是本公开一示例性实施例提供的图像转换方法的流程示意图。本实施例可应用在电子设备(如图1所示的终端设备101或服务器103)上,如图2所示,该方法包括如下步骤:
步骤201,确定用于采集第一图像的相机的内参和畸变参数。
在本实施例中,电子设备可以确定用于采集第一图像的相机的内参和畸变参数。其中,确定相机内参的方法可以为现有方法,例如张正友标定法等。
一般的,相机成像公式为:
相机畸变包含径向畸变与切向畸变,整合后的畸变公式:
ud=u*(1+k1r2+k2r4+k3r6)+2p1u*v*+p2(r2+2u*2) (2)
vd=v*(1+k1r2+k2r4+k3r6)+p1(r2+2v*2)+2p2u*v* (3)
其中,r2=u*2+v*2,(k1,k2,p1,p2,k3)为相机的畸变参数。表示有畸变的图像在二维坐标系下的坐标,表示无畸变的图像在二维坐标系下中的坐标。式(2)和式(3)将图像从有畸变到无畸变的坐标转换公式。
步骤202,基于内参和畸变参数,对第一图像进行畸变矫正处理,得到第二图像。
在本实施例中,电子设备可以基于内参和畸变参数,对第一图像进行畸变矫正处理,得到第二图像。
具体地,电子设备可以利用上述式(2)和式(3)进行逆变换以对第一图像进行畸变矫正处理。
步骤203,在相机的三维局部坐标系下,基于相机的内参和预设的相机旋转角度,将第二图像转换为第三图像。
在本实施例中,电子设备可以在相机的三维局部坐标系下,基于相机的内参和预设的相机旋转角度,将第二图像转换为第三图像。其中,相机旋转角度可以是预先指定的角度。通常,相机旋转角度可以包括俯仰角(pitch)、偏航角(yaw)、翻滚角(roll)。相机旋转角度是在第二图像的相机拍摄角度的基础上,相机拍摄角度发生的变化。
通常,可以基于相机的内参,将第二图像中的像素点转换到相机的三维局部坐标系下,在三维局部坐标系下进行仿射变换,完成像素点的旋转,然后再映射回二维坐标系下,从而得到第三图像。
步骤204,基于内参和畸变参数,对第三图像进行畸变还原处理,得到第四图像。
在本实施例中,电子设备可以基于内参和畸变参数,对第三图像进行畸变还原处理,得到第四图像。具体地,电子设备可以基于上述式(2)和式(3)以实现对第三图像进行畸变还原处理。
本公开的上述实施例提供的方法,通过确定用于采集第一图像的相机的内参和畸变参数,基于内参和畸变参数,对第一图像进行畸变矫正处理,得到第二图像,在相机的三维局部坐标系下,基于相机的内参和预设的相机旋转角度,将第二图像转换为第三图像;基于内参和畸变参数,对第三图像进行畸变还原处理,得到第四图像,实现了在相机拍摄角度变换前对图像进行畸变矫正,减少图像畸变对相机拍摄角度变换的影响,在相机拍摄角度变换后又对图像进行畸变操作,使相机拍摄角度变换后的图像与原始图像的成像质量保持一致。本公开的实施例的实现方式简单,只需使用相机的内参和畸变参数,即可生成模拟同一相机在不同相机拍摄角度下拍摄的图像,生成图像的效率较高。由于生成的图像的像素由原始图像的像素转变而来,从而使生成的图像更接近真实场景。
在一些可选的实现方式中,电子设备还可以执行如下步骤:
步骤一,确定第一图像在相机的三维局部坐标系下的视线角度。
其中,视线角度用于表征在相机的三维局部坐标系下,人眼的视线(即人眼和视点之间的连线)相对于三维局部坐标系的原点的旋转角度。第一图像的视线角度可以为第一图像对应的标签。通常,第一图像的视线角度是已知的,可以预先在对人脸拍摄时设定人眼的视点,以确定视线角度,或者利用现有的视线角度估计方法,对相机拍摄的图像进行视线角度估计得到。
步骤二,基于相机旋转角度,将第一图像的视线角度转换到目标视线角度。
作为示例,第一图像的视线角度为(pitch0,yaw0,roll0),根据相机旋转角度,可以计算出在旋转后的相机的三维局部坐标系下的视线角度为(pitch1,yaw1,roll1),即目标视线角度为(pitch1,yaw1,roll1)。
步骤三,将目标视线角度确定为第四图像的视线角度。
这里,目标视线角度即为第四图像对应的标签。
本实现方式通过确定第四图像的视线角度,实现了对第四图像设置视线角度标签,从而可以将第四图像及对应的视线角度标签应用到视线估计模型的训练。实现了基于已有的图像生成不同相机拍摄角度下的训练样本图像,无需利用实际相机采集相应相机拍摄角度的图像,提高了模型训练的效率。
在一些可选的实现方式中,上述步骤二可以如下执行:
首先,在三维局部坐标系下对第一图像的视线角度进行向量化处理,得到第一向量。
其中,向量化处理为将相机拍摄角度转换为上述三维局部坐标系下的向量。作为示例,设第一图像的相机拍摄角度为(pitch,yaw),基于如下公式,得到第一向量(x,y,z):
x=cos(pitch)*sin(yaw)
y=sin(pitch) (4)
z=-cos(pitch)*cos(yaw)
需要说明的是,这里进行向量化处理时,视线角度可以不包括roll,因为在确定坐标系和顺位关系的基础上,通过pitch,yaw可以获得空间向量(x,y,z),通过空间向量可以推出来roll角度。
然后,基于相机旋转角度,对第一向量进行仿射变换,得到第二向量。
具体地,仿射变换公式如下式所示:
其中,
Rx表示绕x轴的旋转矩阵,Ry表示绕y轴的旋转矩阵,Rz表示绕z轴的旋转矩阵。旋转矩阵中的pitch、yaw、roll为相机旋转角度。
基于上述式(5),可以得到第二向量(xr,yr,zr)。
最后,将第二向量转换为目标视线角度。
具体地,可以利用向量转欧拉角的公式,将第二向量转换为目标视线角度。
继续上述示例,基于如下公式,可以将第二向量转换为目标视线角度(pitch',yaw'):
pitch'=arcsin(y)
需要说明的是,上式只包括pitch和yaw,是因为通常情况下,视线角度只需用pitch和yaw即可表示,一般不使用roll。但是可以根据pitch,yaw推算出来roll。向量和欧拉角之间的转换过程是目前的公知技术,这里不再赘述。
本实现方式通过对第一图像的视线角度进行向量化处理,再对向量进行仿射变换,最终得到目标视线角度,从而可以精确地在上述相机的三维局部坐标系下进行视线角度旋转,得到准确的目标视线角度。
进一步参考图3,示出了图像转换方法的又一个实施例的流程示意图。如图3所示,在上述图2所示实施例的基础上,步骤203可以包括如下步骤:
步骤2031,从第一图像中提取包含预设数量个点的第一像素点集。
其中,预设数量可以任意设置,例如预设数量为4。电子设备可以基于各种方式提取第一像素点集。例如随机提取、按指定提取等。
可选的,电子设备可以从第一图像中提取包含预设数量个不共线的点的第一像素点集。不共线的第一像素点集可以是第一像素点集充分表征图像的二维特征,提高后续仿射变换的准确性。
步骤2032,基于内参和畸变参数,将第一像素点集转换为第二像素点集。
具体地,电子设备可以基于上述式(2)和式(3),对第一像素点集中的每个点的坐标进行变换,得到第二像素点集。
步骤2033,在第一图像的二维像面坐标系下,基于内参和相机旋转角度,将第二像素点集转换为第三像素点集。
通常,电子设备可以基于相机的内参,将第二像素点集转换到相机的三维局部坐标系下,在三维局部坐标系下进行仿射变换,完成像素点的旋转,然后再映射回二维坐标系下,从而得到第三像素点集。
步骤2034,确定第二像素点集和第三像素点集在二维像面坐标系下坐标映射关系。
具体地,上述映射关系可以基于如下公式得到:
步骤2035,根据坐标映射关系,将第二图像转换为第三图像。
具体地,基于上述f,可以将第二图像中的每个像素的坐标进行转换,最终得到第三图像。
上述图3对应实施例提供的方法,通过从第一图像中提取第一像素点集,基于内参和相机旋转角度,得到第三像素点集,从而可以得到像素点集的坐标映射关系,从而实现了使用较少的像素点确定坐标映射关系,有助于降低计算量,提高图像转换的效率。
在一些可选的实现方式中,如图4所示,步骤2033可以包括如下步骤:
步骤20331,基于内参,将第二像素点集转换为三维局部坐标系下的第一空间点集。
具体地,由上述式(1),可以得到从图像的二维坐标系到相机的三维局部坐标系的转换公式为:
基于式(8),可以将第二像素点集转换为三维局部坐标系下的第一空间点集。
步骤20332,基于相机旋转角度,对第一空间点集的坐标进行仿射变换,得到第二空间点集。
具体地,可以按照上述式(5)对第一空间点集的坐标进行仿射变换。
步骤20333,基于内参,将第二空间点集转换到在二维像面坐标系下的第三像素点集。
具体地,基于公式(1),可以将相机的三维局部坐标系下的第二空间点集转换到在二维像面坐标系下的第三像素点集。
本实现方式通过将第二像素点集转换到三维局部坐标系下进行仿射变换,再从三维局部坐标系下转换回二维坐标系,从而可以准确地对第二像素点集进行相机拍摄角度转换,有助于提高确定第二图像与第三图像的坐标映射关系的准确性。
示例性装置
图5是本公开一示例性实施例提供的图像转换装置的结构示意图。本实施例可应用在电子设备上,如图5所示,图像转换装置包括:第一确定模块501,用于确定用于采集第一图像的相机的内参和畸变参数;矫正模块502,用于基于内参和畸变参数,对第一图像进行畸变矫正处理,得到第二图像;第一转换模块503,用于在相机的三维局部坐标系下,基于相机的内参和预设的相机旋转角度,将第二图像转换为第三图像;还原模块504,用于基于内参和畸变参数,对第三图像进行畸变还原处理,得到第四图像。
在本实施例中,第一确定模块501可以确定用于采集第一图像的相机的内参和畸变参数。其中,确定相机内参的方法可以为现有方法,例如张正友标定法等。
在本实施例中,矫正模块502可以基于内参和畸变参数,对第一图像进行畸变矫正处理,得到第二图像。
具体地,电子设备可以利用上述式(2)和式(3)进行逆变换以对第一图像进行畸变矫正处理。
在本实施例中,第一转换模块503可以在相机的三维局部坐标系下,基于相机的内参和预设的相机旋转角度,将第二图像转换为第三图像。其中,相机旋转角度可以是预先指定的角度。通常,相机旋转角度可以包括俯仰角(pitch)、偏航角(yaw)、翻滚角(roll)。相机旋转角度是在第二图像的相机拍摄角度的基础上,相机拍摄角度发生的变化。
通常,可以基于相机的内参,将第二图像中的像素点转换到相机的三维局部坐标系下,在三维局部坐标系下进行仿射变换,完成像素点的旋转,然后再映射回二维坐标系下,从而得到第三图像。
在本实施例中,还原模块504可以基于内参和畸变参数,对第三图像进行畸变还原处理,得到第四图像。具体地,电子设备可以基于上述式(2)和式(3)以实现对第三图像进行畸变还原处理。
参照图6,图6是本公开另一示例性实施例提供的图像转换装置的结构示意图。
在一些可选的实现方式中,第一转换模块503包括:提取单元5031,用于从第一图像中提取包含预设数量个点的第一像素点集;第一转换单元5032,用于基于畸变参数,将第一像素点集转换为第二像素点集;第二转换单元5033,用于在第一图像的二维像面坐标系下,基于内参和相机旋转角度,将第二像素点集转换为第三像素点集;确定单元5034,用于确定第二像素点集和第三像素点集在二维像面坐标系下坐标映射关系;第三转换单元5035,用于根据坐标映射关系,将第二图像转换为第三图像。
在一些可选的实现方式中,第二转换单元5033包括:第一转换子单元50331,用于基于内参,将第二像素点集转换为三维局部坐标系下的第一空间点集;第二转换子单元50332,用于基于相机旋转角度,对第一空间点集的坐标进行仿射变换,得到第二空间点集;第三转换子单元50333,用于基于内参,将第二空间点集转换到在二维像面坐标系下的第三像素点集。
在一些可选的实现方式中,提取单元5031进一步用于:从第一图像中提取包含预设数量个不共线的点的第一像素点集。
在一些可选的实现方式中,该装置还包括:第二确定模块505,用于确定第一图像在相机的三维局部坐标系下的视线角度;第二转换模块506,用于基于相机旋转角度,将第一图像的视线角度转换到目标视线角度;第三确定模块507,用于将目标视线角度确定为第四图像的视线角度。
在一些可选的实现方式中,第二转换模块506包括:处理单元5061,用于在三维局部坐标系下对第一图像的视线角度进行向量化处理,得到第一向量;第四转换单元5062,用于基于相机旋转角度,对第一向量进行仿射变换,得到第二向量;第五转换单元5063,用于将第二向量转换为目标视线角度。
本公开上述实施例提供的图像转换装置,通过确定用于采集第一图像的相机的内参和畸变参数,基于内参和畸变参数,对第一图像进行畸变矫正处理,得到第二图像,在相机的三维局部坐标系下,基于相机的内参和预设的相机旋转角度,将第二图像转换为第三图像;基于内参和畸变参数,对第三图像进行畸变还原处理,得到第四图像,实现了在相机拍摄角度变换前对图像进行畸变矫正,减少图像畸变对相机拍摄角度变换的影响,在相机拍摄角度变换后又对图像进行畸变操作,使相机拍摄角度变换后的图像与原始图像的成像质量保持一致。本公开的实施例的实现方式简单,只需使用相机的内参和畸变参数,即可生成模拟同一相机在不同相机拍摄角度下拍摄的图像,生成图像的效率较高。由于生成的图像的像素由原始图像的像素转变而来,从而使生成的图像更接近真实场景。
示例性电子设备
下面,参考图7来描述根据本公开实施例的电子设备。该电子设备可以是如图1所示的终端设备101和服务器103中的任一个或两者、或与它们独立的单机设备,该单机设备可以与终端设备101和服务器103进行通信,以从它们接收所采集到的输入信号。
图7图示了根据本公开实施例的电子设备的框图。
如图7所示,电子设备700包括一个或多个处理器701和存储器702。
处理器701可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备700中的其他组件以执行期望的功能。
存储器702可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器701可以运行程序指令,以实现上文的本公开的各个实施例的图像转换方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如第一图像、第四图像等各种内容。
在一个示例中,电子设备700还可以包括:输入装置703和输出装置704,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
例如,在该电子设备是终端设备101或服务器103时,该输入装置703可以是相机、鼠标、键盘等设备,用于输入图像。在该电子设备是单机设备时,该输入装置703可以是通信网络连接器,用于从终端设备101和服务器103接收所输入的图像。
该输出装置704可以向外部输出各种信息,包括相机拍摄角度转换后的第四图像。该输出设备704可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图7中仅示出了该电子设备700中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备700还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的图像转换方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的图像转换方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种图像转换方法,包括:
确定用于采集第一图像的相机的内参和畸变参数;
基于所述内参和所述畸变参数,对所述第一图像进行畸变矫正处理,得到第二图像;
在所述相机的三维局部坐标系下,基于所述相机的内参和预设的相机旋转角度,将所述第二图像转换为第三图像;
基于所述内参和所述畸变参数,对所述第三图像进行畸变还原处理,得到第四图像。
2.根据权利要求1所述的方法,其中,所述基于所述相机的内参和预设的相机旋转角度,将所述第二图像转换为第三图像,包括:
从所述第一图像中提取包含预设数量个点的第一像素点集;
基于所述内参和所述畸变参数,将所述第一像素点集转换为第二像素点集;
在所述第一图像的二维像面坐标系下,基于所述内参和所述相机旋转角度,将所述第二像素点集转换为第三像素点集;
确定所述第二像素点集和所述第三像素点集在所述二维像面坐标系下坐标映射关系;
根据所述坐标映射关系,将所述第二图像转换为所述第三图像。
3.根据权利要求2所述的方法,其中,所述基于所述内参和所述相机旋转角度,将所述第二像素点集转换为第三像素点集,包括:
基于所述内参,将所述第二像素点集转换为所述三维局部坐标系下的第一空间点集;
基于所述相机旋转角度,对所述第一空间点集的坐标进行仿射变换,得到第二空间点集;
基于所述内参,将所述第二空间点集转换到在所述二维像面坐标系下的第三像素点集。
4.根据权利要求2所述的方法,其中,所述从所述第一图像中提取包含预设数量个点的第一像素点集,包括:
从所述第一图像中提取包含预设数量个不共线的点的第一像素点集。
5.根据权利要求1所述的方法,其中,所述方法还包括:
确定所述第一图像在所述相机的三维局部坐标系三维坐标系下的视线角度;
基于所述相机旋转角度,将所述第一图像的视线角度转换到目标视线角度;
将所述目标视线角度确定为所述第四图像的视线角度。
6.根据权利要求5所述的方法,其中,所述基于所述相机旋转角度,将所述第一图像的视线角度转换到目标视线角度,包括:
在所述三维局部坐标系下对所述第一图像的视线角度进行向量化处理,得到第一向量;
基于所述相机旋转角度,对所述第一向量进行仿射变换,得到第二向量;
将所述第二向量转换为所述目标视线角度。
7.一种图像转换装置,包括:
第一确定模块,用于确定用于采集第一图像的相机的内参和畸变参数;
矫正模块,用于基于所述内参和所述畸变参数,对所述第一图像进行畸变矫正处理,得到第二图像;
第一转换模块,用于在所述相机的三维局部坐标系下,基于所述相机的内参和预设的相机旋转角度,将所述第二图像转换为第三图像;
还原模块,用于基于所述内参和所述畸变参数,对所述第三图像进行畸变还原处理,得到第四图像。
8.根据权利要求7所述的装置,其中,所述第一转换模块包括:
提取单元,用于从所述第一图像中提取包含预设数量个点的第一像素点集;
第一转换单元,用于基于所述畸变参数,将所述第一像素点集转换为第二像素点集;
第二转换单元,用于在所述第一图像的二维像面坐标系下,基于所述内参和所述相机旋转角度,将所述第二像素点集转换为第三像素点集;
确定单元,用于确定所述第二像素点集和所述第三像素点集在所述二维像面坐标系下坐标映射关系;
第三转换单元,用于根据所述坐标映射关系,将所述第二图像转换为所述第三图像。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-6任一所述的方法。
10.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-6任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011339332.4A CN112465716A (zh) | 2020-11-25 | 2020-11-25 | 图像转换方法、装置、计算机可读存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011339332.4A CN112465716A (zh) | 2020-11-25 | 2020-11-25 | 图像转换方法、装置、计算机可读存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112465716A true CN112465716A (zh) | 2021-03-09 |
Family
ID=74807854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011339332.4A Pending CN112465716A (zh) | 2020-11-25 | 2020-11-25 | 图像转换方法、装置、计算机可读存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112465716A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114972008A (zh) * | 2021-11-04 | 2022-08-30 | 华为技术有限公司 | 一种坐标还原方法、装置以及相关设备 |
-
2020
- 2020-11-25 CN CN202011339332.4A patent/CN112465716A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114972008A (zh) * | 2021-11-04 | 2022-08-30 | 华为技术有限公司 | 一种坐标还原方法、装置以及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112489114B (zh) | 图像转换方法、装置、计算机可读存储介质及电子设备 | |
CN110288547A (zh) | 用于生成图像去噪模型的方法和装置 | |
CN106846497B (zh) | 应用于终端的呈现三维地图的方法和装置 | |
WO2018228436A1 (zh) | 双视角图像校准及图像处理方法、装置、存储介质和电子设备 | |
CN110517214B (zh) | 用于生成图像的方法和装置 | |
CN111402404B (zh) | 全景图补全方法、装置、计算机可读存储介质及电子设备 | |
CN111429354B (zh) | 图像拼接及全景图拼接方法和装置、存储介质、电子设备 | |
WO2022005611A1 (en) | Image super-resolution reconstructing | |
CN111432119B (zh) | 图像拍摄方法、装置、计算机可读存储介质及电子设备 | |
WO2020211573A1 (zh) | 用于处理图像的方法和装置 | |
CN111612842A (zh) | 生成位姿估计模型的方法和装置 | |
CN111784776B (zh) | 视觉定位方法及装置、计算机可读介质和电子设备 | |
CN109754464B (zh) | 用于生成信息的方法和装置 | |
JP7411114B2 (ja) | 空間幾何情報推定モデルの生成方法及び装置 | |
WO2023005170A1 (zh) | 全景视频的生成方法和装置 | |
CN110349107A (zh) | 图像增强的方法、装置、电子设备、及存储介质 | |
WO2020092051A1 (en) | Rolling shutter rectification in images/videos using convolutional neural networks with applications to sfm/slam with rolling shutter images/videos | |
CN111325792A (zh) | 用于确定相机位姿的方法、装置、设备和介质 | |
CN111429501A (zh) | 深度图预测模型生成方法和装置、深度图预测方法和装置 | |
CN114047823A (zh) | 三维模型展示方法、计算机可读存储介质及电子设备 | |
CN111402136A (zh) | 全景图生成方法、装置、计算机可读存储介质及电子设备 | |
CN111985556A (zh) | 关键点识别模型的生成方法和关键点识别方法 | |
CN113129211B (zh) | 光心对齐检测方法和装置、存储介质、电子设备 | |
CN111179328A (zh) | 数据同步标定方法、装置、可读存储介质及电子设备 | |
CN111445518A (zh) | 图像转换方法和装置、深度图预测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |