CN117459840A - 人物图像的处理方法、装置、电子设备和可读存储介质 - Google Patents
人物图像的处理方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN117459840A CN117459840A CN202311458513.2A CN202311458513A CN117459840A CN 117459840 A CN117459840 A CN 117459840A CN 202311458513 A CN202311458513 A CN 202311458513A CN 117459840 A CN117459840 A CN 117459840A
- Authority
- CN
- China
- Prior art keywords
- image
- image area
- processed
- processing
- principal angle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 13
- 238000003672 processing method Methods 0.000 title abstract description 8
- 238000000034 method Methods 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 46
- 238000004590 computer program Methods 0.000 claims description 24
- 238000012937 correction Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 10
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000005520 cutting process Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 230000002596 correlated effect Effects 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 claims 1
- 230000000007 visual effect Effects 0.000 abstract description 10
- 238000001514 detection method Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000012805 post-processing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000981 bystander Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/95—Computational photography systems, e.g. light-field imaging systems
- H04N23/958—Computational photography systems, e.g. light-field imaging systems for extended depth of field imaging
- H04N23/959—Computational photography systems, e.g. light-field imaging systems for extended depth of field imaging by adjusting depth of field during image capture, e.g. maximising or setting range based on scene characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/695—Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
Abstract
本申请适用于图像技术领域,提供了一种人物图像的处理方法、装置、电子设备和可读存储介质。其中,所述人物图像的处理方法包括:获取待处理图像;在所述待处理图像内的人物中确定出当前主角;依据所述当前主角的图像深度信息和所述当前主角在所述待处理图像内的第一位置信息,从所述待处理图像中确定出第一候选图像区域;依据所述第一候选图像区域,确定用于显示画面输出的目标图像区域。本申请的实施例可以提升人物图像画面输出的视觉效果。
Description
技术领域
本申请属于图像技术领域,尤其涉及一种人物图像的处理方法、装置、电子设备和可读存储介质。
背景技术
在视频通话场景中,人物跟随功能可在使用者走动时协助将使用者和旁边的人保持在画面中。一些相关技术会基于三轴云台控制,达到人物跟随的效果,其本质上是利用软件算法控制硬件的物理运动,使得画面能够跟随人物移动,但这种方式不适用于不具有三轴云台等硬件条件的设备。另一些相关技术会通过图像处理的方式实现人物跟随,其算法通常考虑将所有人物包含在输出画面内,但实际应用中发现,其输出画面的视觉效果较差。
发明内容
本申请实施例提供一种人物图像的处理方法、装置、电子设备和可读存储介质,可以提升人物图像画面输出的视觉效果。
本申请实施例第一方面提供一种人物图像的处理方法,包括:获取待处理图像;在所述待处理图像内的人物中确定出当前主角;依据所述当前主角的图像深度信息和所述当前主角在所述待处理图像内的第一位置信息,从所述待处理图像中确定出第一候选图像区域;依据所述第一候选图像区域,确定用于显示画面输出的目标图像区域。
本申请实施例第二方面提供的一种人物图像的处理装置,包括:获取单元,用于获取待处理图像;主角锁定单元,用于在所述待处理图像内的人物中确定出当前主角;搜索单元,用于依据所述当前主角的图像深度信息和所述当前主角在所述待处理图像内的第一位置信息,从所述待处理图像中确定出第一候选图像区域;画面输出单元,用于依据所述第一候选图像区域,确定用于显示画面输出的目标图像区域。
本申请实施例第三方面提供一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述人物图像的处理方法的步骤。
本申请实施例第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述人物图像的处理方法的步骤。
本申请实施例第五方面提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述人物图像的处理方法的步骤。
在本申请的实施方式中,通过获取待处理图像,并在待处理图像内的人物中确定出当前主角,依据当前主角的图像深度信息和当前主角在待处理图像内的第一位置信息,从待处理图像中确定出第一候选图像区域,并依据第一候选图像区域,确定用于显示画面输出的目标图像区域,一方面,能够以图像内的主角作为画面输出的主要参考对象,避免其他人物影响主角在输出画面中的位置,另一方面,能够以主角的图像深度信息和第一位置信息作为画面输出的主要参考依据,有助于提升主角在画面中位置的合理性,进而可以提升画面输出的视觉效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种人物图像的处理方法的实现流程示意图;
图2是本申请实施例提供的一种主角跟踪系统的架构示意图;
图3是本申请实施例提供的一种人物图像的处理方法的具体实现流程示意图;
图4是图2所示的主角跟踪系统中搜索模块的具体架构示意图;
图5是本申请实施例提供的一种人物图像的处理装置的结构示意图;
图6是本申请实施例提供的电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护。
在视频通话场景中,人物跟随功能可在使用者走动时协助将使用者和旁边的人保持在画面中。一些相关技术会基于三轴云台控制,达到人物跟随的效果,其本质上是利用软件算法控制硬件的物理运动,使得画面能够跟随人物移动,但这种方式不适用于不具有三轴云台等硬件条件的设备。另一些相关技术会通过图像处理的方式实现人物跟随,其算法通常考虑将所有人物包含在输出画面内,但实际应用中发现,其输出画面的视觉效果较差。
鉴于此,本申请提出一种人物图像的处理方法,综合考虑了主角锁定、追随速度、摄影构图、镜头旋转模拟等要素,模拟摄影师追踪主角拍摄的效果,能够提升画面输出的视觉效果。
为了说明本申请的技术方案,下面通过具体实施例来进行说明。
图1示出了本申请实施例提供的一种人物图像的处理方法的实现流程示意图,该方法可以应用于电子设备上,可适用于需提升画面输出的视觉效果的情形。其中,上述电子设备可以是计算机、智能手机、平板电脑、便携式穿戴设备等智能设备,对此本申请不做限制。
具体的,上述人物图像的处理方法可以包括以下步骤S101至步骤S104。
步骤S101,获取待处理图像。
其中,待处理图像是指用于画面输出的原始图像,例如成像设备拍摄到的原始图像。在本申请的实施方式中,待处理图像的获取方式可自由选择,对此本申请不做限制。作为示例而非限定,可以从成像设备获取待处理图像。成像设备为能够获取并传输图像的设备,一个典型的成像设备可以由广角镜头、图像传感器、接收和处理图像信号的装置组成。其他实施方式中,待处理图像也可以基于网络通信获取,例如可以将已授权下载的图像作为待处理图像。
步骤S102,在待处理图像内的人物中确定出当前主角。
当前主角即待处理图像内的主角,是待处理图像内的构图的主要参考对象。当前主角的数量可以为一个或多个。具体的,电子设备可以通过深度学习、阈值分割等方式在图像中进行人物识别,并基于人物特征在待处理图像内的人物中确定出当前主角。
示例性的,电子设备可以基于人物的位置、画面占比等,在待处理图像内的人物中确定出当前主角,使得当前主角为待处理图像靠近图像中心的人物,或者画面占比大于一定阈值的人物。电子设备也可以基于人物的瞳孔特征、人脸特征确定人物身份,并将具有特定人物身份的人物作为当前主角。对此本申请不做限制。
步骤S103,依据当前主角的图像深度信息和当前主角在待处理图像内的第一位置信息,从待处理图像中确定出第一候选图像区域。
其中,第一候选图像区域是从待处理图像中确定出的图像区域,可作为对当前帧的待处理图像进行画面输出时选用的图像区域。
在本申请的实施方式中,图像深度信息可以表示当前主角相对于拍摄待处理图像的镜头的距离,当前主角在待处理图像内的第一位置信息可以表示当前主角在待处理图像内的坐标位置。基于图像深度信息和第一位置信息,可以在第一候选图像区域中选择一个第一候选图像区域,使得各个当前主角在第一候选图像区域内的位置更加合理。
步骤S104,依据第一候选图像区域,确定用于显示画面输出的目标图像区域。
在本申请的实施方式中,电子设备可以将第一候选图像区域作为目标图像区域,依据目标图像区域进行本次画面的输出,也可以在第一候选图像区域的基础上进一步进行图像处理,例如进行位置的微调,以确定出用于显示画面输出的目标图像区域,对此本申请不做限制。
在本申请的实施方式中,通过获取待处理图像,并在待处理图像内的人物中确定出当前主角,依据当前主角的图像深度信息和当前主角在待处理图像内的第一位置信息,从待处理图像中确定出第一候选图像区域,并依据第一候选图像区域,确定用于显示画面输出的目标图像区域,一方面,能够以图像内的主角作为画面输出的主要参考对象,避免其他人物影响主角在输出画面中的位置,另一方面,能够以主角的图像深度信息和第一位置信息作为画面输出的主要参考依据,有助于提升主角在画面中位置的合理性,进而可以提升画面输出的视觉效果。
请参考图2,图2示出了采用本申请提供的人物图像的处理方法的主角追随系统的架构示意图。具体的,主角追随系统可以包括抓图模块、检测模块、搜索模块、更新模块以及显示模块。其中,抓图模块可用于进行待处理图像的拍摄,实现前述步骤S101。检测模块可用于进行人物识别及人物信息的检测。搜索模块可用于实现前述步骤S102和步骤S103,进行第一候选图像区域的输出,同时,还可以基于第一候选图像区域确定目标图像区域。更新模块和显示模块可用于实现画面的输出显示。
结合图2所示的五个功能模块,下面通过具体的实施例对本申请提供的人物图像的处理方法进行说明。
如图3所示,在本申请的一些实施方式中,上述步骤S102可以包括以下步骤S301至步骤S302。
步骤S301,对待处理图像进行人物识别,以获取待处理图像内每一人物的画面占比、每一人物的图像深度信息,以及每一人物与其他人物之间的相对距离。
具体的,检测模块可获取由抓图模块提供的待处理图像。优选的,此处的待处理图像可以为全景视图,即,通过广角镜头拍到的存在畸变的图像。获得待处理图像后,检测模块可通过对待处理图像进行人物识别,利用人脸检测模型获取人脸的检测框坐标和人脸关键点坐标,同时,利用人体检测模型获取人体的检测框坐标和人体关键点坐标。可以理解的是,人脸检测模型和人体检测模型可以为卷积神经网络(Convolutional NeuralNetworks,CNN)、循环神经网络(Recurrent Neural Network,RNN)等深度学习模型,对此本申请不做限制。并且,人脸关键点和人体关键点的数量可根据人物检测算法的不同适应性调整。
对于单个人物的检测框,检测模块通过计算检测框的面积与待处理图像的总面积之间的比值,可以得到该人物的画面占比。同时,检测模块还可以基于检测框获得人物的图像深度信息,例如,对于单个人物,可以基于与待处理图像同步获取到的深度图像,获得对应检测框内的图像深度信息,也可以通过对该人物的检测框进行深度图估计,获得该人物的图像深度信息,对此本申请不做限制。同时,基于不同人物之间的检测框,可以计算检测框之间的欧式距离,以获得人物与人物之间的相对距离。
步骤S302,根据每一人物的画面占比、每一人物的图像深度信息,以及每一人物与其他人物之间的相对距离,在待处理图像内的人物中确定出当前主角。
在本申请的实施方式中,搜索模块可用于在单帧的待处理图像中,基于所获得到的画面占比、图像深度学习和相对距离,锁定一个或多个人物作为当前主角。如此,可以使当前主角尽可能在当前显示画面中出现,且离镜头距离较近,或是相对于其余主角距离较近。
作为示例而非限定,对于单个人物,可以将画面占比、图像深度信息以及与其他人物之间的相对距离(此处可以取与其他人物的最近距离或平均距离)进行加权相加,得到单个人物对应的加权值。在待处理图像中,可将对应的加权值大于预设阈值的人物作为当前主角。
完成当前主角的锁定后,搜索模块可以基于当前主角的相关信息在单帧画待处理图像中寻找到一个最佳的构图区域,得到第一候选图像区域。
在本申请的一些实施方式中,第一候选图像区域的画面广度可以与当前主角的图像深度信息呈正相关、第一候选图像区域的上边界与当前主角之间的相对位置可以满足预设留白条件,并且,当前主角与第一候选图像区域内图像参考标识之间的相对位置可以满足预设位置条件。
具体的,画面广度可以与当前主角离镜头的距离成正比。以单人为例,依据图像深度信息,若当前主角离画面距离极近,则只有脸部包含在第一候选图像区域中;若当前主角离镜头距离较远,则当前主角的全身均可包含在第一候选图像区域中。如此,可以使得当前主角在第一候选图像区域中的身形比例更加合理。
对于预设留白条件,则可以确定上边界与当前主角的顶部之间的第一距离,并在第一距离位于预设距离范围内的情况下,判定上边界与当前主角之间的相对位置满足预设留白条件。其中,当前主角的顶部可以选择检测模块检测到的头顶特征点。也就是说,可以使当前主角头顶的坐标与第一候选图像区域的上边界之间的第一距离在一定的距离范围内,使得当前主角头顶留白量更加合理。
图像参考标识可以包括第一候选图像区域在竖直方向上的三等分割线中的上分割线以及上分割线的中心点。其中,三等分割线包含两条分割线,该两条分割线可在竖直方向上将第一候选图像区域均匀划分为三等份,其中靠近第一候选图像区域上边界的分割线即为上分割线。
对于预设位置条件,可以计算当前主角与上分割线之间的第二距离,以及当前主角与中心点之间的第三距离,在第二距离小于第一距离阈值,且第三距离小于第二距离阈值的情况下,判定当前主角与图像参考标识之间的相对位置满足预设位置条件。也就是说,可以使当前主角的坐标在第一候选图像区域内水平方向上尽可能居中,并在竖直方向上尽可能地位于上分割线上。
可以理解的是,如果当前主角的数量为一个,则可以基于该当前主角的坐标搜索第一候选图像区域,如果当前主角的数量为多个,则可以计算该多个当前主角的平均坐标,并基于平均坐标搜索第一候选图像区域。进一步的,在计算平均坐标时,可以按照图像深度信息计算加权平均值,对于距离镜头近的当前主角,其坐标的加权权重更大,如此,可以使构图更关注距离镜头近的当前主角。
搜索模块通过在待处理图像中进行图像区域的搜索,可以获得画面广度、当前主角头顶的坐标与第一候选图像区域的上边界之间的第一距离、当前主角与上分割线之间的第二距离,以及当前主角与中心点之间的第三距离均满足对应条件的第一候选图像区域,并记录下第一候选图像区域在待处理图像中的位置。
考虑到初次确定出的第一候选图像区域内,受限于固定的屏幕显示比例,已锁定的当前主角可能无法在全部出现于画面中,导致无法维持最佳构图比例,在本申请的一些实施方式中,在从待处理图像中确定出第一候选图像区域之后,搜索模块还可以根据第一候选图像区域内每个主角的图像深度信息、在第一候选图像区域中的第二位置信息以及运动状态信息,对当前主角进行主角筛除。若存在被筛除的主角,则依据剩余的当前主角,重新确定第一候选图像区域。
其中,运动状态信息可以表示当前主角的运动趋势。运动状态信息获得后,可以灵活选择锁定当前画面中运动着的人,或者锁定静止的人。针对运动的人,既可以选择锁定远离镜头的人,也可以选择靠近镜头的人,对此不作限制。而在本实施例中,基于图像深度信息、第二位置信息以及运动状态信息,可以分析第一候选图像区域内是否存在逐渐远离镜头(或逐渐远离第一候选图像区域)的当前主角。若存在,可以将该当前主角作为需要筛除主角,以取消对该当前主角的锁定,并基于剩余的当前主角,重新确定第一候选图像区域。若不存在,则可确认不存在被筛除的主角,保持第一候选图像区域。应理解,重新确定第一候选图像区域的方式可以参考前文描述,对此本申请不做限制。
如此,可以在保证最佳构图的前提下,使得第一候选图像区域尽可能地涵盖更多的主角。
并且,对于确定出的第一候选图像区域,搜索模块还可以进行各类后处理操作。示例性的,由于第一候选图像区域为基于全景视图得到的,广角镜头畸变校正后的图像在边缘处通常存在黑边,为防止画面输出时出现黑边区域,上述后处理操作可以是在维持画面比例的情况下进行平移或缩放。
在确定出第一候选图像区域之后,为了避免主角跟踪时出现画面突变的情况,搜索模块还可以结合从历史帧图像中确定出的第二候选图像区域,确定出一个能够使画面变化平滑的目标图像区域。
具体的,电子设备可以获取从历史帧图像中确定出的第二候选图像区域,并将第一候选图像区域的位置和第二候选图像区域的位置进行加权相加,得到目标图像区域的位置,然后,依据目标图像区域的位置,在待处理图像中确定出目标图像区域。
其中,历史帧图像可以指在待处理图像之前采集到的图像,例如可以指视频中待处理图像的前n帧图像(n大于0)。电子设备可以依次对每帧图像分别确定对应的候选图像区域,并记录对应的候选图像区域的位置,在对当前帧的待处理图像进行处理时,可以将待处理图像确定出的第一候选图像区域的位置和历史帧图像确定出的第二候选图像区域的位置进行加权相加,以得到目标图像区域的位置。
具体的,假设目标图像区域的位置为St,上一时刻的历史帧图像确定出的第二候选图像区域的位置为St-1,当前待处理图像确定出的第一候选图像区域的位置为Pt,加权权重为α,则St=(1-α)St-1+αPt。其中,α可根据实际情况调整,取值为0至1之间。
在本申请的一些实施方式中,为了避免主角出画,在当前主角与第一候选图像区域的边界之间的第四距离小于第三距离阈值时,可以增加第一候选图像区域的位置对应的加权权重。具体的,可以将加权权重设置为1,进而,目标候选图像区域趋近于第一候选图像区域,以便能尽快跟上主角。
在本申请的一些实施方式中,当历史帧图像中不存在主角时,第二候选图像区域可以为首个历史帧图像的图像中心区域。更具体的,基于多帧历史帧图像,如果不存在主角的时长大于时长阈值,可以将最初始的历史帧图像的图像中心区域作为第二候选图像区域,进而与第一候选图像区域加权后,目标图像区域Pt将以图像中心区域替代,模拟镜头缓缓回到原点的过程。
为了便于理解,图4示出了搜索模块的架构示意图,搜索模块可以具体包括:主角锁定模块、构图实现模块、后处理模块以及序列更新模块。主角锁定模块可用于确定当前主角。构图实现模块则是基于主角锁定模块确定出的当前主角,确定最佳的第一候选图像区域。后处理模块可进行主角筛除、平移、缩放等后处理操作。完成后处理操作之后,序列更新模块可以基于存储序列中记录的第二候选图像的位置,进一步确定出目标图像区域的位置。
确定出目标图像区域之后,更新模块可以在目标图像区域满足图像输出条件时,根据目标图像区域,对新的显示画面进行输出。
具体的,在满足以下至少一个条件时,判定目标图像区域满足图像输出条件:第一候选图像区域和从历史帧图像中确定出的第二候选图像区域之间的第一位置偏差小于或等于第一偏差阈值、目标图像区域和当前显示画面之间的第二位置偏差大于第二偏差阈值、当前显示画面内的主角与当前显示画面的边界之间的第五距离小于第四距离阈值。
也就是说,在连续多帧图像中候选图像区域的位置相对稳定、最新的候选图像区域的位置与当前显示位置差异较大,或者主角快要出画时,可以确认需要对新的显示画面进行输出。一旦需要输出新的显示画面,则可根据目标图像区域的位置在待处理图像中选择所需作为新的显示画面的图像区域。若无需更换视角,则可以以当前显示画面对应的当前显示位置,在待处理图像中选择该位置上的图像区域进行画面输出。
为了使画面变化更加平滑,更新模块可以依据当前显示画面的位置和目标图像区域的位置,确定显示画面的变化路径,并依据变化路径,将当前显示画面更新为新的显示画面。
更具体地说,在显示画面的变化路径上可以包括若干个路径点,每个路径点可依次用于作为显示画面的位置,进而,在接下来的一段时间中,通过显示画面的位置变化,可以模拟镜头转动的过程,将显示画面从当前显示画面对应的当前显示位置逐渐调整至目标图像区域的位置。
优选的,变化路径可上包含路径点,每一个路径点依次用于作为显示画面的位置,其中,变化路径上相邻路径点之间的间距逐渐减小。如此,可以模拟镜头由快到慢的变化过程,提升视觉效果。
随着显示画面的位置更新,显示模块可以输出新的显示画面。
如果只在畸变校正后的图像上进行矩形区域的裁切,则不同位置之间的变换是二维的,显示画面的变化缺少空间变换感。为了模拟真实的镜头转动感,前述各个功能模块在确定显示画面的位置时,均是基于畸变校正前的图像。因此,在显示时,显示模块可以依据新的显示画面的位置,对待处理图像进行畸变矫正,得到畸变矫正后的图像,即根据畸变校正矩阵,得到上述目标图像区域的位置在畸变矫正后的图像上的坐标。然后,对畸变矫正后的图像进行裁剪和仿射变换,得到新的显示画面。
本申请的实施方式中,考虑了追随速度、摄影构图、镜头旋转模拟几方面要素,以最优的摄影构图为最高优先级,尽可能地模拟摄影师追踪聚焦主角拍摄的效果,可适用于视频会议、公开讲演、直播等场景中。在搜索模块中,能够计算出呈现最优构图的显示区域的位置,来保障画面输出的视觉效果。在更新模块中,基于多种条件的判定,能够保证追随过程平滑、追随速度合理。在显示模块中,利用图像坐标在畸变校正前后的映射关系,模拟广角镜头旋转。因此,本申请提供的处理方法,能够在主角追踪的过程中,达到更好的视觉效果。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为根据本申请,某些步骤可以采用其它顺序进行。
如图5所示为本申请实施例提供的一种人物图像的处理装置500的结构示意图,所述人物图像的处理装置500配置于电子设备上。
人物图像的处理装置500可以包括:
获取单元501,用于获取待处理图像;
主角锁定单元502,用于在所述待处理图像内的人物中确定出当前主角;
搜索单元503,用于依据所述当前主角的图像深度信息和所述当前主角在所述待处理图像内的第一位置信息,从所述待处理图像中确定出第一候选图像区域;
画面输出单元504,用于依据所述第一候选图像区域,确定用于显示画面输出的目标图像区域。
在本申请的一些实施方式中,上述主角锁定单元502可以具体用于:对所述待处理图像进行人物识别,以获取所述待处理图像内每一人物的画面占比、每一人物的图像深度信息,以及每一人物与其他人物之间的相对距离;根据每一人物的画面占比、每一人物的图像深度信息,以及每一人物与其他人物之间的相对距离,在所述待处理图像内的人物中确定出所述当前主角。
在本申请的一些实施方式中,上述第一候选图像区域的画面广度与所述当前主角的图像深度信息呈正相关、所述第一候选图像区域的上边界与所述当前主角之间的相对位置满足预设留白条件,并且,所述当前主角与所述第一候选图像区域内图像参考标识之间的相对位置满足预设位置条件。
在本申请的一些实施方式中,上述搜索单元503可以具体用于:确定所述上边界与所述当前主角的顶部之间的第一距离;在所述第一距离位于预设距离范围内的情况下,判定所述上边界与所述当前主角之间的相对位置满足预设留白条件。
在本申请的一些实施方式中,上述图像参考标识包括所述第一候选图像区域在竖直方向上的三等分割线中的上分割线以及所述上分割线的中心点;上述搜索单元503可以具体用于:计算所述当前主角与所述上分割线之间的第二距离,以及所述当前主角与所述中心点之间的第三距离;在所述第二距离小于第一距离阈值,且所述第三距离小于第二距离阈值的情况下,判定所述当前主角与所述图像参考标识之间的相对位置满足预设位置条件。
在本申请的一些实施方式中,上述搜索单元503还可以具体用于:根据所述第一候选图像区域内每个所述主角的图像深度信息、在所述第一候选图像区域中的第二位置信息以及运动状态信息,对所述当前主角进行主角筛除;若存在被筛除的主角,则依据剩余的所述当前主角,重新确定第一候选图像区域。
在本申请的一些实施方式中,上述画面输出单元504还可以具体用于:获取从历史帧图像中确定出的第二候选图像区域;将所述第一候选图像区域的位置和所述第二候选图像区域的位置进行加权相加,得到所述目标图像区域的位置;依据所述目标图像区域的位置,在所述待处理图像中确定出所述目标图像区域。
在本申请的一些实施方式中,当所述当前主角与所述第一候选图像区域的边界之间的第四距离小于第三距离阈值时,增加所述第一候选图像区域的位置对应的加权权重。
在本申请的一些实施方式中,当所述历史帧图像中不存在主角时,所述第二候选图像区域为首个历史帧图像的图像中心区域。
在本申请的一些实施方式中,上述画面输出单元504还可以具体用于:在所述目标图像区域满足图像输出条件时,根据所述目标图像区域,对新的显示画面进行输出。
在本申请的一些实施方式中,上述画面输出单元504还可以具体用于:在满足以下至少一个条件时,判定所述目标图像区域满足图像输出条件:所述第一候选图像区域和从历史帧图像中确定出的第二候选图像区域之间的第一位置偏差小于或等于第一偏差阈值、所述目标图像区域和当前显示画面之间的第二位置偏差大于第二偏差阈值、所述当前显示画面内的主角与所述当前显示画面的边界之间的第五距离小于第四距离阈值。
在本申请的一些实施方式中,上述画面输出单元504还可以具体用于:依据当前显示画面的位置和所述目标图像区域的位置,确定显示画面的变化路径;依据所述变化路径,将所述当前显示画面更新为所述新的显示画面。
在本申请的一些实施方式中,上述变化路径上包含路径点,每一个路径点依次用于作为显示画面的位置,其中,所述变化路径上相邻路径点之间的间距逐渐减小。
在本申请的一些实施方式中,上述画面输出单元504还可以具体用于:依据所述新的显示画面的位置,对所述待处理图像进行畸变矫正,得到畸变矫正后的图像;对畸变矫正后的图像进行裁剪和仿射变换,得到所述新的显示画面。
需要说明的是,为描述的方便和简洁,上述人物图像的处理装置500的具体工作过程,可以参考图1至图4所述方法的对应过程,在此不再赘述。
如图6所示,为本申请实施例提供的一种电子设备的示意图。具体的,电子设备6可以包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62,例如人物图像的处理程序。所述处理器60执行所述计算机程序62时实现上述各个人物图像的处理方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器60执行所述计算机程序62时实现上述各装置实施例中各模块/单元的功能,例如图5所示的获取单元501、主角锁定单元502、搜索单元503和画面输出单元504的功能。
所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备中的执行过程。
例如,所述计算机程序可以被分割成:获取单元、主角锁定单元、搜索单元和画面输出单元。各单元具体功能如下:获取单元,用于获取待处理图像;主角锁定单元,用于在所述待处理图像内的人物中确定出当前主角;搜索单元,用于依据所述当前主角的图像深度信息和所述当前主角在所述待处理图像内的第一位置信息,从所述待处理图像中确定出第一候选图像区域;画面输出单元,用于依据所述第一候选图像区域,确定用于显示画面输出的目标图像区域。
所述电子设备可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是电子设备的示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述电子设备的内部存储单元,例如电子设备的硬盘或内存。所述存储器61也可以是所述电子设备的外部存储设备,例如所述电子设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述电子设备的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述电子设备所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,为描述的方便和简洁,上述电子设备的结构还可以参考方法实施例中对结构的具体描述,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对各个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/电子设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (17)
1.一种人物图像的处理方法,其特征在于,包括:
获取待处理图像;
在所述待处理图像内的人物中确定出当前主角;
依据所述当前主角的图像深度信息和所述当前主角在所述待处理图像内的第一位置信息,从所述待处理图像中确定出第一候选图像区域;
依据所述第一候选图像区域,确定用于显示画面输出的目标图像区域。
2.如权利要求1所述的人物图像的处理方法,其特征在于,所述在所述待处理图像内的人物中确定出当前主角,包括:
对所述待处理图像进行人物识别,以获取所述待处理图像内每一人物的画面占比、每一人物的图像深度信息,以及每一人物与其他人物之间的相对距离;
根据每一人物的画面占比、每一人物的图像深度信息,以及每一人物与其他人物之间的相对距离,在所述待处理图像内的人物中确定出所述当前主角。
3.如权利要求1所述的人物图像的处理方法,其特征在于,所述第一候选图像区域的画面广度与所述当前主角的图像深度信息呈正相关、所述第一候选图像区域的上边界与所述当前主角之间的相对位置满足预设留白条件,并且,所述当前主角与所述第一候选图像区域内图像参考标识之间的相对位置满足预设位置条件。
4.如权利要求3所述的人物图像的处理方法,其特征在于,所述人物图像的处理方法还包括:
确定所述上边界与所述当前主角的顶部之间的第一距离;
在所述第一距离位于预设距离范围内的情况下,判定所述上边界与所述当前主角之间的相对位置满足预设留白条件。
5.如权利要求3所述的人物图像的处理方法,其特征在于,所述图像参考标识包括所述第一候选图像区域在竖直方向上的三等分割线中的上分割线以及所述上分割线的中心点;
所述人物图像的处理方法还包括:
计算所述当前主角与所述上分割线之间的第二距离,以及所述当前主角与所述中心点之间的第三距离;
在所述第二距离小于第一距离阈值,且所述第三距离小于第二距离阈值的情况下,判定所述当前主角与所述图像参考标识之间的相对位置满足预设位置条件。
6.如权利要求1所述的人物图像的处理方法,其特征在于,在从所述待处理图像中确定出第一候选图像区域之后,所述人物图像的处理方法还包括:
根据所述第一候选图像区域内每个所述主角的图像深度信息、在所述第一候选图像区域中的第二位置信息以及运动状态信息,对所述当前主角进行主角筛除;
若存在被筛除的主角,则依据剩余的所述当前主角,重新确定第一候选图像区域。
7.如权利要求1所述的人物图像的处理方法,其特征在于,所述依据所述第一候选图像区域,确定用于显示画面输出的目标图像区域,包括:
获取从历史帧图像中确定出的第二候选图像区域;
将所述第一候选图像区域的位置和所述第二候选图像区域的位置进行加权相加,得到所述目标图像区域的位置;
依据所述目标图像区域的位置,在所述待处理图像中确定出所述目标图像区域。
8.如权利要求7所述的人物图像的处理方法,其特征在于,所述人物图像的处理方法还包括:
当所述当前主角与所述第一候选图像区域的边界之间的第四距离小于第三距离阈值时,增加所述第一候选图像区域的位置对应的加权权重。
9.如权利要求7所述的人物图像的处理方法,其特征在于,当所述历史帧图像中不存在主角时,所述第二候选图像区域为首个历史帧图像的图像中心区域。
10.如权利要求1至9任意一项所述的人物图像的处理方法,其特征在于,在所述依据所述第一候选图像区域,确定用于显示画面输出的目标图像区域之后,所述人物图像的处理方法还包括:
在所述目标图像区域满足图像输出条件时,根据所述目标图像区域,对新的显示画面进行输出。
11.如权利要求10所述的人物图像的处理方法,其特征在于,所述人物图像的处理方法还包括:
在满足以下至少一个条件时,判定所述目标图像区域满足图像输出条件:所述第一候选图像区域和从历史帧图像中确定出的第二候选图像区域之间的第一位置偏差小于或等于第一偏差阈值、所述目标图像区域和当前显示画面之间的第二位置偏差大于第二偏差阈值、所述当前显示画面内的主角与所述当前显示画面的边界之间的第五距离小于第四距离阈值。
12.如权利要求10所述的人物图像的处理方法,其特征在于,所述根据所述目标图像区域,对新的显示画面进行输出,包括:
依据当前显示画面的位置和所述目标图像区域的位置,确定显示画面的变化路径;
依据所述变化路径,将所述当前显示画面更新为所述新的显示画面。
13.如权利要求12所述的人物图像的处理方法,其特征在于,所述变化路径上包含路径点,每一个路径点依次用于作为显示画面的位置,其中,所述变化路径上相邻路径点之间的间距逐渐减小。
14.如权利要求10所述的人物图像的处理方法,其特征在于,所述对新的显示画面进行输出,包括:
依据所述新的显示画面的位置,对所述待处理图像进行畸变矫正,得到畸变矫正后的图像;
对畸变矫正后的图像进行裁剪和仿射变换,得到所述新的显示画面。
15.一种人物图像的处理装置,其特征在于,包括:
获取单元,用于获取待处理图像;
主角锁定单元,用于在所述待处理图像内的人物中确定出当前主角;
搜索单元,用于依据所述当前主角的图像深度信息和所述当前主角在所述待处理图像内的第一位置信息,从所述待处理图像中确定出第一候选图像区域;
画面输出单元,用于依据所述第一候选图像区域,确定用于显示画面输出的目标图像区域。
16.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至14任一项所述人物图像的处理方法的步骤。
17.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至14任一项所述人物图像的处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311458513.2A CN117459840A (zh) | 2023-11-03 | 2023-11-03 | 人物图像的处理方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311458513.2A CN117459840A (zh) | 2023-11-03 | 2023-11-03 | 人物图像的处理方法、装置、电子设备和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117459840A true CN117459840A (zh) | 2024-01-26 |
Family
ID=89587151
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311458513.2A Pending CN117459840A (zh) | 2023-11-03 | 2023-11-03 | 人物图像的处理方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117459840A (zh) |
-
2023
- 2023-11-03 CN CN202311458513.2A patent/CN117459840A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111402135B (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN112419170B (zh) | 遮挡检测模型的训练方法及人脸图像的美化处理方法 | |
CN109889724B (zh) | 图像虚化方法、装置、电子设备及可读存储介质 | |
CN108537155B (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN110493527B (zh) | 主体对焦方法、装置、电子设备和存储介质 | |
CN113630545B (zh) | 一种拍摄方法及设备 | |
CN111723707A (zh) | 一种基于视觉显著性的注视点估计方法及装置 | |
CN110650288B (zh) | 对焦控制方法和装置、电子设备、计算机可读存储介质 | |
CN113658197B (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
WO2023151511A1 (zh) | 模型训练方法、图像去摩尔纹方法、装置及电子设备 | |
CN114096994A (zh) | 图像对齐方法及装置、电子设备、存储介质 | |
CN113129229A (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
JP2013137604A (ja) | 画像照合処理装置、画像照合処理方法及び画像照合処理プログラム | |
CN111488779A (zh) | 视频图像超分辨率重建方法、装置、服务器及存储介质 | |
Li et al. | Deep online video stabilization using imu sensors | |
CN111062279B (zh) | 照片处理方法及照片处理装置 | |
CN117409463A (zh) | 直播播放策略管理系统 | |
WO2022206679A1 (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN117459840A (zh) | 人物图像的处理方法、装置、电子设备和可读存储介质 | |
CN115623313A (zh) | 图像处理方法、图像处理装置、电子设备、存储介质 | |
CN115514887A (zh) | 视频采集的控制方法、装置、计算机设备和存储介质 | |
CN114339029A (zh) | 拍摄方法、装置及电子设备 | |
Zhang et al. | Semantic saliency driven camera control for personal remote collaboration | |
CN115037869A (zh) | 自动对焦方法、装置、电子设备及计算机可读存储介质 | |
CN113691731B (zh) | 一种处理方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |