CN104992417A - 基于Kinect的人脸视频目光修正方法及系统 - Google Patents

基于Kinect的人脸视频目光修正方法及系统 Download PDF

Info

Publication number
CN104992417A
CN104992417A CN201510386743.1A CN201510386743A CN104992417A CN 104992417 A CN104992417 A CN 104992417A CN 201510386743 A CN201510386743 A CN 201510386743A CN 104992417 A CN104992417 A CN 104992417A
Authority
CN
China
Prior art keywords
face
point
kinect
seam
theta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510386743.1A
Other languages
English (en)
Other versions
CN104992417B (zh
Inventor
盛斌
张雨
申瑞民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201510386743.1A priority Critical patent/CN104992417B/zh
Publication of CN104992417A publication Critical patent/CN104992417A/zh
Application granted granted Critical
Publication of CN104992417B publication Critical patent/CN104992417B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

一种基于Kinect的人脸视频目光修正方法及系统,首先通过Kinect识别出视频流中的人脸部分,根据当前人脸的不同状态,通过椭圆拟合方法捕捉得到脸部轮廓,然后对人脸位姿进行调整,再对人脸细节进行微调处理,最后将调整后的人脸与背景融合,本发明能够解决视频会议中失去眼神交流的问题,并能解决调整目光后的眼镜变形、双下巴、背景混入人物图像、嘴部变形的问题。

Description

基于Kinect的人脸视频目光修正方法及系统
技术领域
本发明涉及的是一种视频图像处理领域的技术,具体是一种基于Kinect的人脸视频目光修正方法及系统。
背景技术
失去在视频会议目光接触是常见的问题,它使沟通不自然的和低效。其原因是摄像头和屏幕之间的差距:用户通常是看另一个在屏幕上的形象,然而,只有用户看摄像头时才会有眼神交互。目光校正的目的是用户自然地看着屏幕的同时与对方实现眼神接触。
有很多试图消除屏幕和相机之间的差距的尝试,后来的一些研究集中在如何获得场景的几何结构并从新的角度来生成的图像,一般是使用相机阵列和立体分析或深度相机或混合。一个常见的问题是,他们不能保证背景的完整。除此之外,它也不便宜,校准是复杂的。Kuster等人在"Gazecorrectionforhomevideoconferencing(家用视频会议视线校准方法)"ACMTransactionsonGraphics(TOG)31.6(2012):174.中提出了一种矫正方法,只需要替换的场景图像的纠正,在2012年举行的SIGGRAPHAsia,此方法取得了巨大的成功。但该技术尚无法解决如:眼镜问题,遮挡问题等。
Kinect是微软公司研制的一款体感外设,实际上是一种3D体感摄影机。该设备共有3个摄像头,中间是RGB彩色摄像头,左右两边分别为红外投影机(红外线发射器)和红外摄像头(CMOS红外感应设备),用于深度探测。Kinect搭配了追焦技术,底座马达会随着对焦物体移动而转动。同时Kinect还内置麦克风阵列,用于语音识别。另外,Kinect作为一款体感设备价格低廉,但目前暂无将上述两种技术有机结合的先例。
发明内容
本发明针对现有技术存在的上述不足,提出一种基于Kinect的人脸视频目光修正方法及系统,针对用户不同的状态,用新的椭圆拟合方法捕捉用户的脸部轮廓,并有效解决针对眼睛重建、旋转、背景混合(前景过滤)、深度不连续区域的不真实等问题,并最终将处理后的脸部重新融合到原背景中,得到一个用户正视摄像头的视频流。
本发明是通过以下技术方案实现的:
本发明首先通过Kinect识别出视频流中的人脸部分,根据当前人脸的不同状态,通过椭圆拟合方法捕捉得到脸部轮廓,然后对人脸位姿进行调整,再对人脸细节进行微调处理,最后将调整后的人脸与背景融合,得到的视频流中的人的视线朝向摄像头,实现眼神交互的效果。
所述的视频流来自于Kinect在线视频,或者Kinect视频文件。
所述的当前人脸的不同状态是指除去用户的正常姿势,在用户向上或者向下看时也能够识别用户的整个脸部轮廓。
所述的椭圆拟合方法是指:根据脸部特征点估计自然空间椭圆的中心、长短轴,并将其映射回图片空间。
所述的微调处理包括:眼镜图像重建处理、前景过滤处理、旋转处理以及孔填充处理四种处理。
所述的眼镜图像重建处理是指:在大多数情况下,没有深度信息的眼镜就像被粘贴在脸上。缺乏深度信息,旋转后的眼镜变得扭曲。此外,旋转后,眼镜架的位置不再匹配原始:如果缝穿过眼镜架,眼镜架部分会折断;如果缝从眼镜架的一端到另一端,眼镜架部分闪烁。更糟糕的是,眼镜架周围的大洞也使眼镜架闪烁。为解决失真问题,提出了一个技术:改造的眼镜形状。为了解决眼镜架问题,额外的规则在缝优化和孔填充应用于避免眼镜腿的裂纹和闪烁。
所述的旋转处理是指:由于人脸朝下旋转,使下巴比实际看上去要小,特别是当用户向下看,随着项目的长度变短,到摄像头的距离变长,而且它将双下巴问题即新的下巴与原始下巴融合,但没有覆盖原来的一个。旋转处理通过提出修正角的处理,不需要固定在校准角度的方案,并在此基础上,解决了双下巴的问题。现在,调整角度成为当前角度的函数,在用户向下看时它将顺利减少修正角,并保持修正角几乎校准的角度,而用户看屏幕。用户向上看的情况扩展版的自适应修正角也会减少修正角,从而改善了当用户脸部过高的输出。
所述的前景过滤处理是指:只需要新图形的脸部部分,过滤背景会加快很多其他进程,例如,孔填充。根据背景技术中的记载,Kuster等人使用一个简单的阈值过滤背景,深度是不够精确的过滤所有的背景。使用脸平面作为参考来过滤背景,消除所有脸平面以外的点。它可以彻底地去除背景,同时,它还可以去除不可靠的深度点不连续区域,为孔填充提供方便。同样以此技术,避免对象遮挡旋转后的脸部,解决了最遮挡的问题。
所述的孔填充处理是指:当用户打开他们的嘴,它形成了一个深度不连续区域,因此,嘴周围的深度值变得不可靠,导致畸形的嘴。为了解决这个问题,删除和补充嘴部深度信息。去除的嘴被认为是深度值中正常的洞,总是如此,孔填充的结果就像自然的嘴的形状。
本发明涉及一种实现上述方法的系统,包括:KINECT模块、椭圆拟合模块、人脸位姿调整模块以及脸部背景融合模块,其中:KINECT模块与提供输入信息,椭圆拟合模块、人脸位姿调整模块、脸部背景融合模块进一步处理调整后视频的失真问题,并最终输出目光矫正后的视频流。
技术效果
与现有技术相比,本发明能够解决视频会议中失去眼神交流的问题,并能解决调整目光后的眼镜变形、双下巴、背景混入人物图像、嘴部变形的问题。
附图说明
图1为本发明流程图。
图2为实施例针对眼镜重建、前景过滤、双下巴、深度不连续区域的失真问题本发明与一般方法的对比图;
图中:第一列为原图,第二列为普通方法效果,第三列为本方法处理效果。
图3为实施例针对背景混合、椭圆拟合过小、椭圆拟合过大、旋转后头发问题本发明与一般方法的对比图;
图中:第一列为原图,第二列为普通方法效果,第三列为本方法处理效果。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例1
如图1所示,本实施例包括以下步骤:
第一步、从Kinect中获得信息。
本实施例中信息是指在线Kinect输入或者Kinect的文件。
第二步、根据第一步获得的视频流捕获出用户的脸部区域。
所述的脸部区域的捕获采用改善的椭圆拟合方法,改善方法为:根据脸部特征点估计自然空间椭圆的中心、长短轴,并将其映射回图片空间。
第三步、调整脸部区域。
通过对比旋转的方法调整脸部。将旋转中心的概念引入到系统,使旋转更加直观。选择头中心为旋转中心,的系统不再需要匹配的旋转的脸以及原来的脸,因此,避免不稳定带来的闪烁的匹配。
第四步、针对细节进行的微调处理,包括:眼镜图像重建处理、前景过滤处理、旋转处理以及孔填充处理。
所述的微调处理具体包括以下步骤:
4.1)初始化轮廓接缝:
a)在第一帧在系统复位后,沿着椭圆生成缝点;
b)如果不是第一次复位后,使用椭圆来转移前一帧的接缝所为当前的初始,这样可以稳定接缝。
c)缝点的形式是相对椭圆的长度和相对椭圆的方向的。形成一个新的椭圆,新的相应的缝形成的。
d)这种方法确保缝点总是生成均匀;它适用于所有类型的变化:改变大小,旋转。
4.2)接缝最佳化:
a)底部一半缝点,直接用下巴点的新面孔。因此,新下巴将覆盖原来的,完全或大部分,随后的混合使其平滑。
b)上半部分使用传统的一个最优的优化算法。在每次迭代中,优化所有奇数点首先,然后优化甚至点,避免相互影响在一个迭代。
c)对于每一个点,不同椭圆中心的相对长度,并找到最优。错误定义的总误差(色差)沿着两个相邻边缘的宽度宽。总误差沿缝是混合的总误差。
4.3)眼镜重建处理:
脸上给定区域的某个点满足:(Point-FaceCenter)·FaceNormal=PlaneDistance
FaceCenter是脸部中心,FaceNormal是脸上的任一点,PlaneDistance为平面距。
点计算的形式为:
P o int = ( w x , w y , w z ) = d e p t h f o c u s ( i m x , i m y , f o c u s )
其中:depth、focus分别为该点的深度和专注度,imx、imy为相对平面的直角坐标值。
转换自然空间点的坐标与图像空间的坐标。最后得到眼镜深度以重建眼镜:
depth′=wz·(PlaneDistance+FaceCenter·FaceNormal)/(Point·FaceNormal)
4.4)针对旋转问题采用以下公式矫正角度: &omega; = k e ( &theta; - &theta; 0 ) 2 &theta; 0 &theta; < &theta; 0 &theta; 0 &theta; &GreaterEqual; &theta; 0 , 其中:Θ为平面的脸部平面与x‐y平面的角θ0是用户最近一次按下一键矫正键时脸部平面与x‐y平面间的矫正角度。Ω是要得到的矫正角度。
第五步、融合背景与脸部:赋予两幅图中每个像素质量等级,即接缝的法线方向,在新图像像素的重量从一个零,在原始图像和像素的重量从0到1。
每个像素质量等级为: weight g r a d a t i o n a l = exp ( - distance l o c a t i o n theta l o c a t i o n ) * exp ( - distance c o l o r theta c o l o r ) , 其中:distancecolor为每个图像像素的距离值,thetalocation是每个像素的角度值。

Claims (7)

1.一种基于Kinect的人脸视频目光修正方法,其特征在于,首先通过Kinect识别出视频流中的人脸部分,根据当前人脸的不同状态,通过椭圆拟合方法捕捉得到脸部轮廓,然后对人脸位姿进行调整,再对人脸细节进行微调处理,最后将调整后的人脸与背景融合。
2.根据权利要求1所述的方法,其特征是,所述的视频流来自于Kinect在线视频,或者Kinect视频文件。
3.根据权利要求1所述的方法,其特征是,所述的当前人脸的不同状态是指除去用户的正常姿势,在用户向上或者向下看时也能够识别用户的整个脸部轮廓。
4.根据权利要求1所述的方法,其特征是,所述的椭圆拟合方法是指:根据脸部特征点估计自然空间椭圆的中心、长短轴,并将其映射回图片空间。
5.根据权利要求1所述的方法,其特征是,所述的微调处理包括:眼镜图像重建处理、前景过滤处理、旋转处理以及孔填充处理。
6.根据权利要求1或5所述的方法,其特征是,所述的微调处理具体包括:
4.1)初始化轮廓接缝,具体包括:
4.1.1)在第一帧在系统复位后,沿着椭圆生成缝点;
4.1.2)如果不是第一次复位后,使用椭圆来转移前一帧的接缝所为当前的初始,这样可以稳定接缝;
4.1.3)缝点的形式是相对椭圆的长度和相对椭圆的方向的,形成一个新的椭圆,新的相应的缝形成的;
4.1.4)这种方法确保缝点总是生成均匀;它适用于所有类型的变化:改变大小,旋转;
4.2)接缝最佳化,具体包括:
4.2.1)底部一半缝点,直接用下巴点的新面孔,因此,新下巴将覆盖原来的,完全或大部分,随后的混合使其平滑;
4.2.2)上半部分使用传统的一个最优的优化算法,在每次迭代中,优化所有奇数点首先,然后优化甚至点,避免相互影响在一个迭代;
4.2.3)对于每一个点,不同椭圆中心的相对长度,并找到最优,错误定义的总误差,即色差,沿着两个相邻边缘的宽度宽,总误差沿缝是混合的总误差;
4.3)眼镜重建处理,具体包括:
4.3.1)脸上给定区域的某个点满足:
(Point-FaceCenter)·FaceNormal=PlaneDistance
其中:FaceCenter是脸部中心,FaceNormal是脸上的任一点,PlaneDistance为平面距;
4.3.2)点计算的形式为:
P o int = ( w x , w y , w z ) = d e p t h f o c u s ( i m x , i m y , f o c u s )
其中:depth、focus分别为该点的深度和专注度,imx、imy为相对平面的直角坐标值;
4.3.3)转换自然空间点的坐标与图像空间的坐标,最后得到眼镜深度以重建眼镜:
depth &prime; = w z &CenterDot; P l a n e D i s tan c e + F a c e C e n t e r &CenterDot; F a c e N o r m a l P o int &CenterDot; F a c e N o r m a l
4.4)针对旋转问题采用以下方式矫正角度: &omega; = k e ( &theta; - &theta; 0 ) 2 &theta; 0 &theta; < &theta; 0 &theta; 0 &theta; &GreaterEqual; &theta; 0 , 其中:Θ为平面的脸部平面与x-y平面的角θ0是用户最近一次按下一键矫正键时脸部平面与x-y平面间的矫正角度,Ω是要得到的矫正角度。
7.一种实现上述任一权利要求所述方法的系统,其特征在于,包括:KINECT模块、椭圆拟合模块、人脸位姿调整模块以及脸部背景融合模块,其中:KINECT模块与PC相连并提供图片来源,再经椭圆拟合模块、人脸位姿调整模块、脸部背景融合模块矫正输入在线视频或离线视频中人物的目光,得到目光矫正的输出流。
CN201510386743.1A 2015-06-30 2015-06-30 基于Kinect的人脸视频目光修正方法及系统 Active CN104992417B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510386743.1A CN104992417B (zh) 2015-06-30 2015-06-30 基于Kinect的人脸视频目光修正方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510386743.1A CN104992417B (zh) 2015-06-30 2015-06-30 基于Kinect的人脸视频目光修正方法及系统

Publications (2)

Publication Number Publication Date
CN104992417A true CN104992417A (zh) 2015-10-21
CN104992417B CN104992417B (zh) 2017-12-19

Family

ID=54304225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510386743.1A Active CN104992417B (zh) 2015-06-30 2015-06-30 基于Kinect的人脸视频目光修正方法及系统

Country Status (1)

Country Link
CN (1) CN104992417B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107622495A (zh) * 2017-09-11 2018-01-23 广东欧珀移动通信有限公司 图像处理方法及装置、电子装置和计算机可读存储介质
WO2018119938A1 (zh) * 2016-12-29 2018-07-05 华为技术有限公司 图片处理方法和装置
CN109376618A (zh) * 2018-09-30 2019-02-22 北京旷视科技有限公司 图像处理方法、装置及电子设备
CN109639962A (zh) * 2018-11-22 2019-04-16 深圳艺达文化传媒有限公司 自拍短视频模式选择方法及相关产品
CN109658327A (zh) * 2018-11-26 2019-04-19 深圳艺达文化传媒有限公司 自拍视频发型生成方法及相关产品
CN111627087A (zh) * 2020-06-03 2020-09-04 上海商汤智能科技有限公司 一种人脸图像的展示方法、装置、计算机设备及存储介质
CN112085647A (zh) * 2019-06-14 2020-12-15 华为技术有限公司 一种人脸校正方法及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006154964A (ja) * 2004-11-25 2006-06-15 Matsushita Electric Works Ltd インターホンシステム
CN1952953A (zh) * 2006-11-16 2007-04-25 上海交通大学 基于受限玻尔兹曼机神经网络的人脸姿态识别方法
CN101021900A (zh) * 2007-03-15 2007-08-22 上海交通大学 利用降维方法进行人脸姿态估计的方法
CN101650782A (zh) * 2009-09-16 2010-02-17 上海电力学院 基于肤色模型和形状约束的正面人脸轮廓提取方法
CN101916370A (zh) * 2010-08-31 2010-12-15 上海交通大学 人脸检测中非特征区域图像处理的方法
CN103258078A (zh) * 2013-04-02 2013-08-21 上海交通大学 融合Kinect设备和Delmia环境的人机交互虚拟装配系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006154964A (ja) * 2004-11-25 2006-06-15 Matsushita Electric Works Ltd インターホンシステム
CN1952953A (zh) * 2006-11-16 2007-04-25 上海交通大学 基于受限玻尔兹曼机神经网络的人脸姿态识别方法
CN101021900A (zh) * 2007-03-15 2007-08-22 上海交通大学 利用降维方法进行人脸姿态估计的方法
CN101650782A (zh) * 2009-09-16 2010-02-17 上海电力学院 基于肤色模型和形状约束的正面人脸轮廓提取方法
CN101916370A (zh) * 2010-08-31 2010-12-15 上海交通大学 人脸检测中非特征区域图像处理的方法
CN103258078A (zh) * 2013-04-02 2013-08-21 上海交通大学 融合Kinect设备和Delmia环境的人机交互虚拟装配系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018119938A1 (zh) * 2016-12-29 2018-07-05 华为技术有限公司 图片处理方法和装置
CN108513668A (zh) * 2016-12-29 2018-09-07 华为技术有限公司 图片处理方法和装置
CN108513668B (zh) * 2016-12-29 2020-09-08 华为技术有限公司 图片处理方法和装置
US11055829B2 (en) 2016-12-29 2021-07-06 Huawei Technologies Co., Ltd. Picture processing method and apparatus
CN107622495A (zh) * 2017-09-11 2018-01-23 广东欧珀移动通信有限公司 图像处理方法及装置、电子装置和计算机可读存储介质
CN109376618A (zh) * 2018-09-30 2019-02-22 北京旷视科技有限公司 图像处理方法、装置及电子设备
CN109639962A (zh) * 2018-11-22 2019-04-16 深圳艺达文化传媒有限公司 自拍短视频模式选择方法及相关产品
CN109658327A (zh) * 2018-11-26 2019-04-19 深圳艺达文化传媒有限公司 自拍视频发型生成方法及相关产品
CN112085647A (zh) * 2019-06-14 2020-12-15 华为技术有限公司 一种人脸校正方法及电子设备
WO2020249076A1 (zh) * 2019-06-14 2020-12-17 华为技术有限公司 一种人脸校正方法及电子设备
CN112085647B (zh) * 2019-06-14 2024-01-19 华为技术有限公司 一种人脸校正方法及电子设备
CN111627087A (zh) * 2020-06-03 2020-09-04 上海商汤智能科技有限公司 一种人脸图像的展示方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN104992417B (zh) 2017-12-19

Similar Documents

Publication Publication Date Title
CN104992417A (zh) 基于Kinect的人脸视频目光修正方法及系统
CN109064397B (zh) 一种基于摄像耳机的图像拼接方法及系统
CN101884222B (zh) 用于支持立体呈现的图像处理
EP3410388A2 (en) Capture and render of panoramic virtual reality content
US10778955B2 (en) Methods for controlling scene, camera and viewing parameters for altering perception of 3D imagery
JP5204350B2 (ja) 撮影装置、再生装置、および画像処理方法
KR20180101165A (ko) 파노라마 프레임으로의 프레임 스티칭
CN111047709B (zh) 一种双目视觉裸眼3d图像生成方法
JP5320524B1 (ja) ステレオ撮影装置
WO2013099169A1 (ja) ステレオ撮影装置
JP5204349B2 (ja) 撮影装置、再生装置、および画像処理方法
US10356383B2 (en) Adjustment of perceived roundness in stereoscopic image of a head
TWI527434B (zh) 利用光場相機產生立體影像的方法及光場相機
CN103034330B (zh) 一种用于视频会议的眼神交互方法及系统
US9294663B2 (en) Imaging apparatus and imaging method for generating increased resolution images, hyperspectral images, steroscopic images, and/or refocused images
WO2020011112A1 (zh) 图像处理方法、系统、可读存储介质及终端
CN111757090A (zh) 基于注视点信息的实时vr图像过滤方法、系统和存储介质
CN105139336B (zh) 一种多通道全景影像转换球幕鱼眼影片的方法
JP5820985B2 (ja) 立体画像処理装置および立体画像処理方法
TW202238222A (zh) 用於擴增實境及虛擬實境裝置的反向穿透式眼鏡
CN110211220A (zh) 全景鱼眼摄像机的图像校准缝合和深度重建方法及其系统
CN114945943A (zh) 基于虹膜大小估计深度
JP2012182738A (ja) ステレオ画像撮像装置
KR20050100095A (ko) 보정 영상 신호 처리를 이용한 주시각 제어 장치 및 그방법과 그를 이용한 평행축 입체 카메라 시스템
CN108307090A (zh) 一种摄像头模组、移动终端及其拍摄图像的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant