CN115619855A - 深度图像的稳像方法、电子设备及存储介质 - Google Patents
深度图像的稳像方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115619855A CN115619855A CN202211545567.8A CN202211545567A CN115619855A CN 115619855 A CN115619855 A CN 115619855A CN 202211545567 A CN202211545567 A CN 202211545567A CN 115619855 A CN115619855 A CN 115619855A
- Authority
- CN
- China
- Prior art keywords
- current frame
- depth image
- camera
- image
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000000087 stabilizing effect Effects 0.000 title claims abstract description 9
- 238000009499 grossing Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000006243 chemical reaction Methods 0.000 claims abstract description 13
- 238000013507 mapping Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 66
- 230000006641 stabilisation Effects 0.000 claims description 39
- 238000011105 stabilization Methods 0.000 claims description 39
- 238000013519 translation Methods 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 9
- 239000011800 void material Substances 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30244—Camera pose
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
Abstract
本申请实施例涉及图像处理领域,公开了一种深度图像的稳像方法、电子设备及存储介质。深度图像的稳像方法包括:根据拍摄截止到当前帧的连续K帧中每帧深度图像的相机的原始的位姿参数,对当前帧的原始相机位姿进行平滑处理,得到当前帧的平滑后的位姿参数;根据当前帧的所述平滑后的位姿参数和当前帧的所述原始的位姿参数,将当前帧的深度图像的点云数据映射到图像坐标系,得到当前帧的稳像后的深度图像;其中,所述原始的位姿参数为相机坐标系转换到预设基准坐标系的转换参数。本申请采用包含当前帧的连续K帧深度图像对当前帧深度图像进行稳像处理,能有效滤除图像抖动的同时,还能达到较快的处理速度。
Description
技术领域
本申请实施例涉及图像处理领域,特别涉及一种深度图像的稳像方法、电子设备及存储介质。
背景技术
基于二维图像的稳像算法是一种较为成熟的技术,其原理是通过陀螺仪、或基于特征的图像算法获取视频中帧间图像的运动路径,对运动路径进行平滑处理,从而消除视频图像中的随机抖动,实现稳像。
随着光电技术的发展,表达所拍摄场景的三维信息的深度图像在工业、消费电子等领域得到了广泛应用,如:三维环境感知、VR技术、人脸识别、活体检测等等应用场景。由此也催生了深度图像的防抖功能。如车载相机、户外运动相机在拍摄深度图像时,若抖动严重,极易影响图像数据的采集和操控体验;又比如在VR相关应用中,常使用深度相机来获取人体姿态、位置,若不添加抖动功能,原始图像数据中的噪声极易产生眩晕感,VR体验效果差。
然而,目前没有一种效果较好的基于深度图像的稳像算法。另外,由于二维图像在稳像处理时采用RGB颜色信息进行计算,而深度图像存储的是三维信息,两者蕴含的信息有根本差别,导致基于二维图像的稳像方法也无法用于深度图像上。
发明内容
本申请实施方式的目的在于提供一种深度图像的稳像方法、电子设备及存储介质,采用包含当前帧的连续K帧深度图像对当前帧深度图像进行稳像处理,能有效滤除图像抖动的同时,还能达到较快的处理速度。
为解决上述技术问题,本申请的实施方式提供了一种深度图像的稳像方法,包括:根据拍摄截止到当前帧的连续K帧中每帧深度图像的相机的原始的位姿参数,对当前帧的原始相机位姿进行平滑处理,得到当前帧的平滑后的位姿参数;根据当前帧的所述平滑后的位姿参数和当前帧的所述原始的位姿参数,将当前帧的深度图像的点云数据映射到图像坐标系,得到当前帧的稳像后的深度图像;其中,所述原始的位姿参数为相机坐标系转换到预设基准坐标系的转换参数。
本申请的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使所述至少一个处理器能够执行以上实施方式所述的深度图像的稳像方法。
本申请的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述实施方式提及的深度图像的稳像方法。
本申请实施方式提供的深度图像的稳像方法,根据截止到当前帧的连续K帧中每帧深度图像对应的相机的原始的位姿参数,即每帧深度图像对应的相机坐标系转换到基准坐标系的转换参数,对当前帧的相机位姿(位置和姿态)进行平滑处理,滤除随机抖动,得到平滑后的位姿参数,然后根据平滑后的位姿参数和原始的位姿参数,将当前帧深度图像的点云数据映射到图像坐标系,即可得到稳像后的深度图像。整个方法只采用包含当前帧的连续K帧深度图像进行稳像处理,在能有效滤除图像抖动的同时,还能达到较快的处理速度。
另外,本申请实施方式提供的深度图像的稳像方法,对于所述连续K帧中每帧深度图像,判断所述深度图像的空洞率是否小于第一阈值;若是,确定所述深度图像为有效深度图像;若否,确定所述深度图像为无效深度图像;获取拍摄所述连续K帧中有效深度图像的相机的所述原始的位姿参数,对当前帧的相机位姿进行平滑处理,得到所述平滑后的位姿参数。本申请通过对当前帧是否为有效深度图像进行判断,提高处理效率,减少不必要的计算。
另外,本申请实施方式提供的深度图像的稳像方法,将当前帧的深度图像的点云数据和与当前帧最临近帧的有效深度图像的点云数据进行点云匹配,确定各点云数据的一一对应关系;根据所述各点云数据的一一对应关系,计算当前帧的相机坐标系转换到与当前帧最临近帧的相机坐标系的中间位姿参数;根据所述中间位姿参数和与当前帧最临近帧的原始的位姿参数,获取当前帧的深度图像的原始的位姿参数。本申请将最临近帧的有效深度图像作为当前帧的深度图像的相机坐标系与基准坐标系之间的转换桥梁,以降低转换过程中点云匹配难度,提高处理速度。
另外,本申请实施方式提供的深度图像的稳像方法,对所述拍摄截止到当前帧的连续K帧中有效深度图像的相机的原始的位姿参数中平移矩阵进行平均计算,得到平滑后的平移矩阵;对所述拍摄截止到当前帧的连续K帧中有效深度图像的相机的原始的位姿参数中旋转矩阵进行平均计算和叉乘计算,得到平滑后的旋转矩阵,并将所述平滑后的平移矩阵和所述平滑后的旋转矩阵作为所述平滑后的位姿参数。本申请通过对原始的位姿参数中平移矩阵进行平均计算,对原始的位姿参数中旋转矩阵进行平均计算和叉乘计算获得平滑后的相机位姿,平滑方法简单有效、速度快。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本申请实施方式提供的深度图像的稳像方法的流程图;
图2是本申请实施方式提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本申请各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
下面对本实施方式的深度图像的稳像系统方法的实现细节进行举例说明。以下内容仅为方便理解而提供的实现细节,并非实施本方案的必须。
本申请的实施方式涉及一种深度图像的稳像方法,如图1所示,包括。
步骤101,根据拍摄截止到当前帧的连续K帧中每帧深度图像的相机的原始的位姿参数,对当前帧的原始相机位姿进行平滑处理,得到当前帧的平滑后的位姿参数。
本实施例中,深度图像抖动的本质原因是运动过程中,深度感知设备位姿变换过快。因此,若要对深度图像进行稳像处理,就需要对相机的位姿或运动路径进行平滑,以滤除拍摄过程中的抖动。而由于相机在拍摄获取深度图像的过程中,相机位姿不断变化,相机坐标系也不断变化,因此,在稳像处理前需要将每一帧深度图像对应的相机坐标系统一到一个基准坐标系。原始的位姿参数就是相机坐标系转换到预设基准坐标系的转换参数。
可以理解的是,每一帧深度图像都是相机在不同相机位姿下拍摄的,因此,每一帧都对应一个原始的位姿参数,该原始的位姿参数表示拍摄该帧深度图像时的相机坐标系转换到预设基准坐标系的转换参数。
在一实施例中,步骤101包括:对于连续K帧中每帧深度图像,判断深度图像的空洞率是否小于第一阈值;若是,确定深度图像为有效深度图像;若否,确定深度图像为无效深度图像;获取拍摄所述连续K帧中有效深度图像的相机的所述原始的位姿参数,对当前帧的相机位姿进行平滑处理,得到平滑后的位姿参数。
具体地说,在对每一个当前帧进行处理时,先判断当前帧的深度图像是否为有效深度图像,若是有效深度图像,则获取当前帧深度图像对应的相机原始的位姿参数,并对当前帧的原始相机位姿进行平滑处理;若当前帧深度图像为无效深度图像,则直接采用截止到当前帧的连续K帧中有效深度图像对应的相机原始的位姿参数,对当前帧的相机位姿进行平滑处理。
对于深度感知设备输出的深度图像数据流,例如:假设K=5,则在截止到当前帧的连续5帧中,有4帧深度图像为有效深度图像,根据4帧有效深度图像对应的相机原始的位姿参数,对当前帧的原始相机位姿进行平滑处理。也就是说,对当前帧的平滑处理,采用的是当前帧和历史K-1帧,共连续K帧中全部或部分的原始的位姿参数。当然,平滑帧数K的设置可以根据对处理速度的要求、稳像效果的要求、稳像处理设备的性能等各种因素综合考虑。
需要注意的是,深度感知设备输出的深度图像的数据流是不断刷新的,当前帧的深度图像也是不断刷新变化的,因此截止到当前帧的连续K帧的深度图像也是不断变化的。
例如:K=4,截止到当前帧的连续4帧中,第K帧(当前帧)、第K-1帧、第K-2帧对应的深度图像均为有效深度图像,第K-3帧为无效深度图像,则计算时采用第K帧(当前帧)、第K-1帧、第K-2帧对应的原始的位姿参数对当前帧的相机位姿进行平滑处理。
下一时刻,当前帧的深度图像刷新为新的深度图像,在截止到当前帧的连续4帧中,若当前帧为有效深度图像,则计算时采用第K帧(当前帧)、第K-1帧(上一时刻的当前帧)、第K-2帧(上一时刻的第K-1帧)、第K-3帧(上一时刻的第K-2帧)对应的原始的位姿参数,对当前帧的原始相机位姿进行平滑处理。若当前帧为无效深度图像,则计算时采用第K-1帧(上一时刻的当前帧)、第K-2帧(上一时刻的第K-1帧)、第K-3帧(上一时刻的第K-2帧)对应的第一旋转矩阵和第一平移矩阵对当前帧的相机位姿进行平滑处理。
由此可见,对不同时刻的当前帧的相机位姿进行平滑处理时采用的数据可能相同,也可能不同。
可以理解的是,进行稳像处理的电子设备在获取每个当前帧的有效深度图像对应的原始的位姿参数后,都会将原始的位姿参数的数据保存,以便对下一时刻的深度图像的相机位姿进行平滑处理。如此,在处理前判断深度图像的有效性可以进一步提高深度视频稳像处理效率,避免深度图像中无效像素点过多影响稳像效果。
其中,有效深度图像为深度图像的空洞率小于第一阈值的深度图像。无效深度图像为深度图像的空洞率大于或等于第一阈值的深度图像。空洞率指的是深度图像中像素点深度值为无效值(例如深度值为0)的像素点数量占总像素点数量的比例。
另外,基准坐标系为当前帧的深度图像所在深度视频中空洞率小于第二阈值的任一帧深度图像的相机坐标系;其中第二阈值小于第一阈值。比如:在深度视频中起始帧的深度图像的空洞率小于第二阈值,则将起始帧的相机坐标系作为基准坐标系,则起始帧对应的原始的位姿参数中旋转矩阵为单位矩阵,起始帧对应的原始的位姿参数中平移矩阵为0。当然,也可选取其他空洞率小于第二阈值的深度图像的相机坐标系作为基准坐标系。
进一步地,获取拍摄连续K帧中有效深度图像的相机的原始的位姿参数,包括:将当前帧的深度图像的点云数据和与当前帧最临近帧的有效深度图像的点云数据进行点云匹配,确定各点云数据的一一对应关系;根据各点云数据的一一对应关系,计算当前帧的相机坐标系转换到与当前帧最临近帧的相机坐标系的中间位姿参数;根据中间位姿参数和与当前帧最临近帧的原始的位姿参数,获取当前帧的深度图像的原始的位姿参数。
具体地说,由于基准坐标系为深度视频中空洞率小于第二阈值的任一帧深度图像的相机坐标系,若基准坐标系对应的帧时刻与当前帧之间存在较多无效深度图像,或基准坐标系对应的帧时刻的相机视角(拍摄场景)与当前帧时刻的相机视角(拍摄场景)差异过大,都有可能导致点云匹配失败,无法获取原始的位姿参数。因此,本申请将与当前帧最临近帧的有效深度图像作为当前帧的相机坐标系和基准坐标系之间的转换桥梁,先将当前帧的相机坐标系转换到与当前帧最临近帧有效深度图像对应的相机坐标系,转换关系表示为中间位姿参数。然后再根据历史时刻计算的、与当前帧最临近帧的相机坐标系转换到基准坐标系的原始的位姿参数,获取当前帧的原始的位姿参数。
通过如下公式将当前帧的相机坐标系转换到最临近帧有效深度图像对应的相机坐标系:
其中,Pi-a为与当前帧最临近帧的有效深度图像的点云数据,Pi为当前帧深度图像的点云数据,Ri(i-a)为当前帧i的相机坐标系转换到最临近帧i-a的有效深度图像的相机坐标系的旋转矩阵,即中间位姿参数中的旋转矩阵,Ti(i-a)为当前帧i的相机坐标系转换到最临近帧i-a的有效深度图像的相机坐标系的平移矩阵,即中间位姿参数中的平移矩阵。i(0)表示当前帧的相机坐标系转换到基准坐标系,i(i-a)表示当前帧的相机坐标系转换到最临近帧的有效深度图像的相机坐标系,
例如:当前帧i的前一帧为有效深度图像,则最临近的有效深度图像的帧时刻表示为i-1,若当前帧i的前两帧均为无效深度图像,当前帧之前第三帧为有效深度图像,则最临近的有效深度图像的帧时刻表示为i-3。
通过如下公式获取当前帧的原始的位姿参数:
其中,Ri(0)为当前帧原始的位姿参数中的旋转矩阵,Ti(0)为当前帧原始的位姿参数中的平移矩阵,Ri-a(0)为与当前帧最临近帧的有效深度图像对应的原始的位姿参数中的旋转矩阵,Ti-a(0)为与当前帧最临近帧的有效深度图像对应的原始的位姿参数中的平移矩阵,Ri(i-a)为中间位姿参数中的旋转矩阵,Ti(i-a)为中间位姿参数中的平移矩阵。
其中,在将当前帧的深度图像的点云数据和与当前帧最临近帧的有效深度图像的点云数据进行点云匹配的过程中,若点云匹配失败,则将当前帧的深度图像作为无效深度图像。对该无效深度图像也采用截止到当前帧的连续K帧中有效深度图像对应的原始的位姿参数进行平滑处理。
在一实施例中,位姿参数包括:旋转矩阵和平移矩阵;根据拍摄截止到当前帧的连续K帧中每帧深度图像的相机的原始的位姿参数,对当前帧的相机位姿进行平滑处理,得到平滑后的位姿参数,包括:对拍摄截止到当前帧的连续K帧中有效深度图像的相机的原始的位姿参数中平移矩阵进行平均计算,得到平滑后的平移矩阵;对拍摄截止到当前帧的连续K帧中有效深度图像的相机的原始的位姿参数中旋转矩阵进行平均计算和叉乘计算,得到平滑后的旋转矩阵,并将平滑后的平移矩阵和平滑后的旋转矩阵作为平滑后的位姿参数。
具体地说,平滑后的旋转矩阵获取步骤为:对于拍摄截止到当前帧的连续K帧中有效深度图像的相机的原始的位姿参数,计算这些原始的位姿参数中旋转矩阵中z轴参数的平均值和x轴参数的平均值;将z轴参数的平均值与x轴参数的平均值进行叉乘得到平滑后的旋转矩阵中的y轴参数;将y轴参数与z轴参数的平均值进行叉乘得到平滑后的旋转矩阵中的x轴参数,并将x轴参数、y轴参数和z轴参数的平均值组合得到平滑后的旋转矩阵。
通过如下公式获取第二平移矩阵:
其中,m为包含当前帧的连续K帧中有效深度图像的数量,Vi=1表示第i帧的深度图像为有效深度图像,Ti(0)为第i帧的原始的位姿参数中的平移矩阵。例如:假设K=4,当前帧和前三帧的深度图像均为有效深度图像,则m=4,平滑后的平移矩阵就是将当前帧i的原始的位姿参数中的平移矩阵、第i-1帧的原始的位姿参数中的平移矩阵、第i-2帧的原始的位姿参数中的平移矩阵、第i-3帧的原始的位姿参数中的平移矩阵求和再平均后的平均值。
通过如下公式获取第二旋转矩阵:
其中,rz smooth为当前帧平滑后的旋转矩阵中的z轴参数,rz i(0)为当前帧原始的位姿参数中的旋转矩阵中的z轴参数,rx i(0)为当前帧原始的位姿参数中的旋转矩阵中的x轴参数,ry smooth为当前帧平滑后的旋转矩阵中的y轴参数,rx smooth为当前帧平滑后的旋转矩阵中的x轴参数。
在计算过程中,由于rz smooth与rx_avg通常接近于正交的但非绝对正交,故rx_avg不能直接作为平滑后的x轴,可以先用叉乘计算平滑后的y轴参数,再计算平滑后的x轴参数。然后得到平滑后的旋转矩阵Rsmooth=(rx smooth,ry smooth,rz smooth),旋转矩阵中x轴参数、y轴参数、z轴参数表示x轴方向向量、y轴方向向量、z轴方向向量。
步骤102,根据当前帧的平滑后的位姿参数和当前帧的原始的位姿参数,将当前帧的深度图像的点云数据映射到图像坐标系,得到当前帧的稳像后的深度图像。
本实施例中,在获取平滑后的相机位姿(第二旋转矩阵和第二平移矩阵)后,将当前帧点云数据转换到平滑后的相机坐标系中,将在平滑后的相机坐标系中的点云数据重新映射到图像坐标系即可得到稳像处理后的深度图像。
在一实施例中,步骤102包括:根据当前帧的平滑后的位姿参数和当前帧的原始的位姿参数,计算得到当前帧深度图像在平滑相机位姿参数后的相机坐标系上的点云数据;根据相机的焦距、相机的主点坐标和点云数据,映射得到当前帧各像素点的图像坐标和各像素点的深度值,并将图像坐标和对应的深度值组合得到当前帧的稳像后的深度图像。
采用如下公式得到当前帧深度图像在平滑后的相机坐标系上的点云数据:
其中,Psmooth为当前帧深度图像在平滑相机位姿参数后的相机坐标系上的点云数据,Rsmooth为相机在当前帧的平滑后的位姿参数中的旋转矩阵,Tsmooth为相机在当前帧的平滑后的位姿参数中的平移矩阵,Ri(0)为相机在当前帧的原始的位姿参数中的旋转矩阵,Ti(0)为相机在当前帧的原始的位姿参数中的平移矩阵。
采用如下公式得到稳像后的深度图像:
其中,xsmooth、ysmooth、zsmooth为当前帧深度图像在平滑后的相机坐标系上的点云数据Psmooth的x坐标、y坐标和z坐标,F为相机焦距,Cx、Cy为相机主点坐标。usmooth、vsmooth为稳像后的深度图像的像素坐标,zsmooth为稳像后深度图像的深度值。
本申请实施方式提供的深度图像的稳像方法,根据截止到当前帧的连续K帧中每帧深度图像对应的相机的原始的位姿参数,即每帧深度图像对应的相机坐标系转换到基准坐标系的转换参数,对当前帧的相机位姿(位置和姿态)进行平滑处理,滤除随机抖动,得到平滑后的位姿参数,然后根据平滑后的位姿参数和原始的位姿参数,将当前帧深度图像的点云数据映射到图像坐标系,即可得到稳像后的深度图像。整个方法只采用包含当前帧的连续K帧深度图像进行稳像处理,在能有效滤除图像抖动的同时,还能达到较快的处理速度。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本申请的实施方式涉及一种电子设备,如图2所示,包括:
至少一个处理器201;以及,与至少一个处理器201通信连接的存储器202;其中,存储器202存储有可被至少一个处理器201执行的指令,指令被至少一个处理器201执行,以使至少一个处理器201能够执行如上述实施方式提及的深度图像的稳像方法。
该电子设备包括:一个或多个处理器201以及存储器202,图2中以一个处理器201为例。处理器201、存储器202可以通过总线或者其他方式连接,图2中以通过总线连接为例。存储器202作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器201通过运行存储在存储器202中的非易失性软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述深度图像的稳像方法。
存储器202可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储选项列表等。此外,存储器202可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施方式中,存储器202可选包括相对于处理器201远程设置的存储器,这些远程存储器可以通过网络连接至外接设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器202中,当被一个或者多个处理器201执行时,执行上述任意实施方式中的深度图像的稳像方法。
上述产品可执行本申请实施方式所提供的方法,具备执行方法相应的功能模块和有益效果,未在本实施方式中详尽描述的技术细节,可参见本申请实施方式所提供的深度图像的稳像方法。
本申请的实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述深度图像的稳像方法的实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本申请的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本申请的精神和范围。
Claims (10)
1.一种深度图像的稳像方法,其特征在于,包括:
根据拍摄截止到当前帧的连续K帧中每帧深度图像的相机的原始的位姿参数,对当前帧的原始相机位姿进行平滑处理,得到当前帧的平滑后的位姿参数;
根据当前帧的所述平滑后的位姿参数和当前帧的所述原始的位姿参数,将当前帧的深度图像的点云数据映射到图像坐标系,得到当前帧的稳像后的深度图像;
其中,所述原始的位姿参数为相机坐标系转换到预设基准坐标系的转换参数。
2.根据权利要求1所述的深度图像的稳像方法,其特征在于,所述根据拍摄截止到当前帧的连续K帧中每帧深度图像的相机的原始的位姿参数,对当前帧的原始相机位姿进行平滑处理,得到当前帧的平滑后的位姿参数,包括:
对于所述连续K帧中每帧深度图像,判断所述深度图像的空洞率是否小于第一阈值;
若是,确定所述深度图像为有效深度图像;若否,确定所述深度图像为无效深度图像;
获取拍摄所述连续K帧中有效深度图像的相机的所述原始的位姿参数,对当前帧的相机位姿进行平滑处理,得到所述平滑后的位姿参数。
3.根据权利要求2所述的深度图像的稳像方法,其特征在于,所述获取拍摄所述连续K帧中有效深度图像的相机的所述原始的位姿参数,包括:
将当前帧的深度图像的点云数据和与当前帧最临近帧的有效深度图像的点云数据进行点云匹配,确定各点云数据的一一对应关系;
根据所述各点云数据的一一对应关系,计算当前帧的相机坐标系转换到与当前帧最临近帧的相机坐标系的中间位姿参数;
根据所述中间位姿参数和与当前帧最临近帧的原始的位姿参数,获取当前帧的深度图像的原始的位姿参数。
4.根据权利要求3中所述的深度图像的稳像方法,其特征在于,在将当前帧的深度图像的点云数据和与当前帧最临近帧的有效深度图像的点云数据进行点云匹配的过程中,若点云匹配失败,则将当前帧的深度图像作为无效深度图像。
5.根据权利要求1至4中任一项所述的深度图像的稳像方法,其特征在于,所述位姿参数包括:旋转矩阵和平移矩阵;
所述根据拍摄截止到当前帧的连续K帧中每帧深度图像的相机的原始的位姿参数,对当前帧的相机位姿进行平滑处理,得到平滑后的位姿参数,包括:
对所述拍摄截止到当前帧的连续K帧中有效深度图像的相机的原始的位姿参数中平移矩阵进行平均计算,得到平滑后的平移矩阵;
对所述拍摄截止到当前帧的连续K帧中有效深度图像的相机的原始的位姿参数中旋转矩阵进行平均计算和叉乘计算,得到平滑后的旋转矩阵,并将所述平滑后的平移矩阵和所述平滑后的旋转矩阵作为所述平滑后的位姿参数。
6.根据权利要求1-4中任一项所述的深度图像的稳像方法,所述根据当前帧的所述平滑后的位姿参数和当前帧的所述原始的位姿参数,将当前帧的深度图像的点云数据映射到图像坐标系,得到当前帧的稳像后的深度图像,包括:
根据当前帧的所述平滑后的位姿参数和当前帧的所述原始的位姿参数,计算得到当前帧深度图像在平滑相机位姿参数后的相机坐标系上的点云数据;
根据相机的焦距、相机的主点坐标和所述点云数据,映射得到当前帧各像素点的图像坐标和各像素点的深度值,并将所述图像坐标和对应的深度值组合得到所述当前帧的稳像后的深度图像。
8.根据权利要求1所述的深度图像的稳像方法,其特征在于,所述基准坐标系为当前帧的深度图像所在深度视频中空洞率小于第二阈值的任一帧深度图像的相机坐标系;所述第二阈值小于第一阈值。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8中任一所述的深度图像的稳像方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的深度图像的稳像方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211545567.8A CN115619855A (zh) | 2022-12-05 | 2022-12-05 | 深度图像的稳像方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211545567.8A CN115619855A (zh) | 2022-12-05 | 2022-12-05 | 深度图像的稳像方法、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115619855A true CN115619855A (zh) | 2023-01-17 |
Family
ID=84880087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211545567.8A Pending CN115619855A (zh) | 2022-12-05 | 2022-12-05 | 深度图像的稳像方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115619855A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106780576A (zh) * | 2016-11-23 | 2017-05-31 | 北京航空航天大学 | 一种面向rgbd数据流的相机位姿估计方法 |
CN110288657A (zh) * | 2019-05-23 | 2019-09-27 | 华中师范大学 | 一种基于Kinect的增强现实三维注册方法 |
CN112785682A (zh) * | 2019-11-08 | 2021-05-11 | 华为技术有限公司 | 模型的生成方法、模型的重建方法及装置 |
-
2022
- 2022-12-05 CN CN202211545567.8A patent/CN115619855A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106780576A (zh) * | 2016-11-23 | 2017-05-31 | 北京航空航天大学 | 一种面向rgbd数据流的相机位姿估计方法 |
CN110288657A (zh) * | 2019-05-23 | 2019-09-27 | 华中师范大学 | 一种基于Kinect的增强现实三维注册方法 |
CN112785682A (zh) * | 2019-11-08 | 2021-05-11 | 华为技术有限公司 | 模型的生成方法、模型的重建方法及装置 |
Non-Patent Citations (1)
Title |
---|
杨诚笃: ""基于视角优化的便携像机视频去抖算法"" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7078139B2 (ja) | ビデオ安定化方法及び装置、並びに非一時的コンピュータ可読媒体 | |
US10021381B2 (en) | Camera pose estimation | |
CN109040575B (zh) | 全景视频的处理方法、装置、设备、计算机可读存储介质 | |
CN107566688B (zh) | 一种基于卷积神经网络的视频防抖方法、装置及图像对齐装置 | |
CN113286194A (zh) | 视频处理方法、装置、电子设备及可读存储介质 | |
CN110533694B (zh) | 图像处理方法、装置、终端及存储介质 | |
CN109618103B (zh) | 无人机图传视频的防抖方法及无人机 | |
WO2021232963A1 (zh) | 视频去噪方法、装置、移动终端和存储介质 | |
WO2018102880A1 (en) | Systems and methods for replacing faces in videos | |
WO2010151215A1 (en) | Real time video stabilization | |
KR20220008334A (ko) | 포즈 추적 방법, 포즈 추적 장치 및 전자 기기 | |
JP7253621B2 (ja) | パノラマ映像の手ぶれ補正方法及び携帯端末 | |
CN114429191B (zh) | 基于深度学习的电子防抖方法、系统及存储介质 | |
WO2020257999A1 (zh) | 图像处理方法、装置、云台和存储介质 | |
US10764500B2 (en) | Image blur correction device and control method | |
US10708600B2 (en) | Region of interest determination in video | |
CN115705651A (zh) | 视频运动估计方法、装置、设备和计算机可读存储介质 | |
WO2020019239A1 (zh) | 一种定位方法、装置、终端和可读存储介质 | |
CN117011660A (zh) | 一种低纹理场景下融合深度信息的点线特征slam方法 | |
CN115619855A (zh) | 深度图像的稳像方法、电子设备及存储介质 | |
US20230290061A1 (en) | Efficient texture mapping of a 3-d mesh | |
CN114095659B (zh) | 一种视频防抖方法、装置、设备及存储介质 | |
CN112804444A (zh) | 一种视频处理方法、装置、计算设备及存储介质 | |
Russo et al. | Blurring prediction in monocular slam | |
CN116266356A (zh) | 全景视频转场渲染方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230117 |