CN113382154A - 基于深度的人体图像美化方法及电子设备 - Google Patents

基于深度的人体图像美化方法及电子设备 Download PDF

Info

Publication number
CN113382154A
CN113382154A CN202010117261.7A CN202010117261A CN113382154A CN 113382154 A CN113382154 A CN 113382154A CN 202010117261 A CN202010117261 A CN 202010117261A CN 113382154 A CN113382154 A CN 113382154A
Authority
CN
China
Prior art keywords
image
human body
human
key points
electronic device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010117261.7A
Other languages
English (en)
Inventor
刘梦莹
钟顺才
朱聪超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honor Device Co Ltd
Original Assignee
Honor Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honor Device Co Ltd filed Critical Honor Device Co Ltd
Priority to CN202010117261.7A priority Critical patent/CN113382154A/zh
Priority to PCT/CN2020/126954 priority patent/WO2021169394A1/zh
Publication of CN113382154A publication Critical patent/CN113382154A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • H04N23/632Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters for displaying or modifying preview images prior to image capturing, e.g. variety of image resolutions or capturing parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/64Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种基于深度的人体图像美化方法,应用于具有显示屏和摄像头的电子设备,其中,方法包括:检测到用户的第一操作;在显示屏显示用户界面,用户界面的预览框内包括被拍摄人物的第一人体图像,第一人体图像包括深度图像及彩色图像;利用预设的关键点检测模型确定彩色图像中的多个人体关键点,并根据深度图像及摄像头的参数确定多个人体关键点的位置信息;根据多个人体关键点的位置信息确定被拍摄人物的身材比例参数;检测到用户的第二操作;在预览框内显示被拍摄人物的第二人体图像,第二人体图像中的被拍摄人物的身材比例参数自适应进行了调整处理。本发明实施例提供的方法能够自适应地对人体图像进行美体塑形,为用户带来更新的使用体验。

Description

基于深度的人体图像美化方法及电子设备
技术领域
本申请涉及电子设备技术领域,具体涉及基于深度的人体图像美化方法及+电子设备。
背景技术
目前,现有的人体美化方法主要集中在电脑端,例如现有的abode photoshop软件,用户需要将人像照片输入软件,人为标记出人体的各个部位,然后人工手动调节人体局部的胖瘦比例。在美化处理过程中,不能自动准确地检测出人像照片中的身体各个部位,需要手动标记身体部位,导致塑形部位不够准确;并且,需要反复人工手动调节,直至调节到自己满意的效果。
有些移动终端(例如手机)的应用软件也实现了美体功能,通过摄像头采集到图像,然后检测出人体,估计出各身体部位,根据用户设定的美体塑形参数来对各个身体部位进行美体塑形。美化过程中,用户需要一一选择需要美体的各个身体部位,容易导致人体整体比例失调,例如把头部拉长了,影响美感。而且,有些软件因为功能本身预设的限制,在调节过程中难以达到预期的效果。
发明内容
本发明实施例提供基于深度的人体图像美化方法及电子设备,利用关键点检测技术,能够自适应地对人体图像进行美体塑形,无需手动反复调节,避免人体整体比例失调,为用户带来更新的使用体验。
第一方面,本发明提供一种基于深度的人体图像美化方法,应用于具有显示屏和摄像头的电子设备,所述方法包括:
检测到用户用于打开相机的第一操作;
响应于所述第一操作,在所述显示屏显示用户界面,所述用户界面包括预览框,所述预览框内包括被拍摄人物的第一人体图像,所述第一人体图像包括深度图像及彩色图像;
利用预设的关键点检测模型确定所述彩色图像中的多个人体关键点,并根据所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息;
根据所述多个人体关键点的位置信息确定所述被拍摄人物的身材比例参数;
检测到所述用户用于指示体型模板的第二操作;
响应于所述第二操作,在所述预览框内显示所述被拍摄人物的第二人体图像,所述第二人体图像中所述被拍摄人物的身材比例参数根据所述体型模板的身材比例参数自适应进行了调整处理。
结合第一方面,在一种可行的实施方式中,检测到所述用户用于指示体型模板的第二操作,包括:
检测到所述用户将拍摄的人体图像作为体型模板的第二操作;或
检测到所述用户从预设的体型模板库中选择体型模板的第二操作;或
检测到所述用户从预设的图库中选择的人体图像作为体型模板的第二操作。
结合第一方面,在一种可行的实施方式中,所述身材比例参数包括头身比、上下身比、下身比、头肩比、头腰比、头臀比及肩身比中的一种或多种;所述第二人体图像中所述被拍摄人物的身材比例参数根据所述体型模板的身材比例参数自适应进行了调整处理,包括:
将所述被拍摄人物的身材比例参数与所述体型模板的身材比例参数一一进行比对,将参数差值超出预设范围的身材比例参数确定为待调整的身材比例参数;
根据所述体型模板的身材比例参数调整所述待调整的身材比例参数;
根据调整后所述被拍摄人物的身材比例参数确定相应的关键点所需要的调整位置信息;
根据所述关键点所需要的调整位置信息对所述关键点进行调整,以使得所述被拍摄人物的身材比例参数与所述体型模板的身材比例参数相适应。
结合第一方面,在一种可行的实施方式中,所述用户界面还包括:拍摄控件;所述方法还包括:
响应于检测到的作用于所述拍摄控件的用户操作,保存所述预览框中显示的所述第二人体图像。
结合第一方面,在一种可行的实施方式中,在所述利用预设的关键点检测算法确定所述彩色图像中的多个人体关键点,并根据所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息之前,所述方法还包括:
构建关键点检测模型,其中,关键点检测模型由四个密集连接的沙漏网络构成;
利用预设的训练集对所述关键点检测模型进行训练,训练过程中采用最小均方误差损失函数使得所述沙漏网络收敛,得到训练好的关键点检测模型。
结合第一方面,在一种可行的实施方式中,所述利用所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息,包括:
根据所述彩色图像中识别得到的人体关键点的坐标,从所述深度图像确定相同坐标下的所述人体关键点的深度值;
根据所述人体关键点的深度值及所述人体关键点的坐标得到所述人体关键点的位置信息。
结合第一方面,在一种可行的实施方式中,所述方法还包括:
利用摄像头采集体型模板的彩色图像及深度图像;
利用预设的关键点检测模型确定所述彩色图像中的多个人体关键点,并利用所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息;
根据所述体型模板的所述多个人体关键点的位置信息确定所述体型模板的身材比例参数;
将所述体型模板的彩色图像及所述体型模板的身材比例参数一起保存至预设的体型模板库中。
第二方面,本发明还提供了一种电子设备,包括:
显示屏;摄像头;一个或多个处理器;存储器;多个应用程序;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述设备执行时,使得所述设备执行以下步骤:
检测到用户用于打开相机的第一操作;
响应于所述第一操作,在所述显示屏显示用户界面,所述用户界面包括预览框,所述预览框内包括被拍摄人物的第一人体图像,所述第一人体图像包括深度图像及彩色图像;
利用预设的关键点检测算法确定所述彩色图像中的多个人体关键点,并利用所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息;
根据所述多个人体关键点的位置信息确定所述被拍摄人物的身材比例参数;
检测到所述用户用于指示体型模板的第二操作;
响应于所述第二操作,在所述预览框内显示所述被拍摄人物的第二人体图像,所述第二人体图像中所述被拍摄人物的身材比例参数根据所述体型模板的身材比例参数自适应进行了调整处理。
结合第二方面,在一种可行的实施方式中,当所述指令被所述设备执行时,使得所述设备具体执行以下步骤:
检测到所述用户将拍摄的人体图像作为体型模板的第二操作;或
检测到所述用户从预设的体型模板库中选择体型模板的第二操作;或
检测到所述用户从预设的图库中选择的人体图像作为体型模板的第二操作。10、如权利要求8所述的电子设备,其特征在于,所述身材比例参数包括头身比、上下身比、下身比、头肩比、头腰比、头臀比及肩身比中的一种或多种;当所述指令被所述设备执行时,使得所述设备具体执行以下步骤:
将所述被拍摄人物的身材比例参数与所述体型模板的身材比例参数一一进行比对,将参数差值超出预设范围的身材比例参数确定为待调整的身材比例参数;
根据所述体型模板的身材比例参数调整所述待调整的身材比例参数;
根据调整后所述被拍摄人物的身材比例参数确定相应的关键点所需要的调整位置信息;
根据所述关键点所需要的调整位置信息对所述关键点进行调整,以使得所述被拍摄人物的身材比例参数与所述体型模板的身材比例参数相适应。
结合第二方面,在一种可行的实施方式中,所述用户界面还包括:拍摄控件;当所述指令被所述设备执行时,使得所述设备具体执行以下步骤:
响应于检测到的作用于所述拍摄控件的用户操作,保存所述预览框中显示的所述第二人体图像。
结合第二方面,在一种可行的实施方式中,当所述指令被所述设备执行时,使得所述设备具体执行以下步骤:
构建关键点检测模型,其中,所述关键点检测模型由四个密集连接的沙漏网络构成;
利用预设的训练集对所述关键点检测模型进行训练,训练过程中采用最小均方误差损失函数使得所述沙漏网络收敛,得到训练好的关键点检测模型。
结合第二方面,在一种可行的实施方式中,当所述指令被所述设备执行时,使得所述设备具体执行以下步骤:
根据所述彩色图像中识别得到的人体关键点的坐标,从所述深度图像确定相同坐标下的所述人体关键点的深度值;
根据所述人体关键点的深度值及所述人体关键点的坐标得到所述人体关键点的位置信息。
第三方面,本发明还提供一种计算机设备,包括存储器,处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时使得所述计算机设备实现上述的基于深度的人体图像美化方法。
第四方面,本发明还提供一种包含指令的计算机程序产品,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行上述的基于深度的人体图像美化方法。
第五方面,本发明还提供一种计算机可读存储介质,包括指令,当所述指令在电子设备上运行时,使得所述电子设备执行上述的基于深度的人体图像美化方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1A为本发明实施例提供的电子设备的硬件结构示意图;
图1B为本发明实施例提供的电子设备的软件结构示意图;
图2A为本发明实施例提供的电子设备的主视图;
图2B为本发明实施例提供的电子设备的后视图;
图3A为本发明实施例提供的电子设备的一种图形用户界面示意图;
图3B为本发明实施例提供的电子设备的另一种图形用户界面示意图;
图3C为本发明实施例提供的电子设备的另一种图形用户界面示意图;
图3D为本发明实施例提供的电子设备的另一种图形用户界面示意图;
图4为现有技术提供的一种图形用户界面示意图;
图5为本发明实施例提供的基于深度的人体图像美化方法的流程示意图;
图6A为本发明实施例提供的彩色图像的在2D坐标空间中的像素点示意图;
图6B为本发明实施例提供的深度图像的在2D坐标空间中的像素点示意图;
图6C为本发明实施例提供的彩色图像的在3D坐标空间中的像素点示意图;
图7为本发明实施例提供的人体骨骼点的示意图;
图8为根据骨骼点的深度值以及2D坐标确定骨骼点之间的骨骼的长度的计算示意图;
图9A为本发明实施例提供的电子设备的另一种图形用户界面示意图;
图9B为本发明实施例提供的电子设备的另一种图形用户界面示意图。
具体实施方式
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a, b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a, b,c可以是单个,也可以是多个。
为了便于理解,示例的给出了部分与本申请实施例相关概念的说明以供参考。如下所示:
本申请实施例提供的基于深度的人体图像美化方法,可以应用于电子设备,也可是单独的应用程序,该应用程序可实现本申请中在拍照后自动实现基于深度的人体图像美化方法。具体地,本申请提供的基于深度的人体图像美化方法可以通过关键点检测技术和图像处理技术为用户实现实时自适应人体美化塑身功能,为用户带来全新的体验。
本申请实施例提供的基于深度的人体图像美化方法可以应用于手机、平板电脑、可穿戴设备等具有拍照功能的电子设备上,本申请实施例对电子设备的具体类型不作任何限制。
本申请以下实施例中,智能手机等电子设备的应用程序“相机”可提供“美体”功能。其中,“美体”功能可用于在拍照预览或录像预览过程中对被拍摄人物的身体图像进行调整,使得调整后的身体图像所表现的体型相较于被拍摄人物的实际体型发生了体型美化。体型美化可包括:美化身体比例(如拉长腿部、扩宽肩部等)。“美体”功能所涉及的对身体图像进行调整可以包括:确定关键点需要调整到的目标位置,然后可以采用双立方、双线性、近邻等常见的图像缩放算法对关键点之间的人体图像进行缩放(scale)处理,使得在人体图像被缩放后关键点能够位于其对应的目标位置,以实现美化身体比例的目的。
“美体”功能所涉及的对人体图像进行调整还可以包括:采用双立方、双线性、近邻等常见的图像缩放算法来对被拍摄人物的整体身体图像进行图像缩放(scale)处理来实现调整身体胖瘦或塑形的目的。例如瘦腿涉及的图像处理可包括采用图像缩放算法对腿部图像进行压缩处理,压缩处理后的腿部图像表现的腿部比被拍摄人物的实际腿部更苗条。又例如腰部塑形设计的图像处理可包括:采用图像缩放算法对腰部图像的中间部分进行压缩处理,对腰部图像的上下两端进行拉伸处理,经过这种图像处理后的腰部图像所表现的腰部比被拍摄人物的实际腰部更有曲线,经过这种图像处理后的腰部图像所表现的腰部可以为S形腰部(腰部中间细)。本申请以下实施例中,对身体图像进行的这种处理可以称为美体处理。
本申请以下实施例中,“美体”功能可以集成于“相机”应用程序中包括的“人像”拍照功能、录像功能。“美体”功能也可以作为“相机”应用程序中的独立的摄像功能。“人像”拍照功能是针对拍摄对象为人物时设置的摄像功能,以突出人物,提升拍摄图片中人物的美感。当电子设备开启“人像”拍照功能时,电子设备可以采用较大的光圈保持景深较浅,以突出人物,并可以改善色彩效果,以优化人物肤色。在检测到环境光线强度低于一定阈值时,电子设备还可以开启闪光灯进行光照补偿。
“相机”是智能手机、平板电脑等电子设备上的一款图像拍摄的应用程序,本申请对该应用程序的名称不做限制。“人像”拍照功能、录像功能可以是“相机”应用程序中包括的摄像功能。除此之外,“相机”应用程序还可以包括其他多种摄像功能,在不同摄像功能对应的光圈大小、快门速度以及感光度等摄像参数可以不相同,可以呈现出不同的摄像效果。摄像功能又可以称为摄像模式,例如“人像”拍照功能又可以称为“人像”拍照模式。
可以理解的是,“美体”、“人像”只是本实施例中所使用的一些词语,其代表的含义在本实施例中已经记载,其名称并不能对本实施例构成任何限制。本申请实施例中提到的“美体”,在其他一些实施例中也可以被称为例如“瘦身塑型”等其他名字。
首先介绍本申请以下实施例中提供的示例性电子设备100。图1A示出了电子设备100的结构示意图。电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块 180,按键190,马达191,指示器192,3D摄像模组193,显示屏194,以及用户标识模块(subscriber identificationmodule,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit, GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S) 接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组 I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,3D摄像模组193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100 的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170 之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160 传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,3D摄像模组193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(display serial interface,DSI)等。在一些实施例中,处理器110和3D摄像模组193通过CSI 接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与3D摄像模组193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB 接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB 接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140 可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池 142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,3D摄像模组193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器 110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110 的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth, BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术 (infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access, TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system, GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode, OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED), Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes, QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1 的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
摄像头193可用于采集拍摄对象的彩色图像数据以及深度数据。ISP可用于处理3D摄像模组193采集的彩色图像数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给 ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
在一些实施例中,摄像头193可以由彩色摄像模组和3D感测模组组成。
在一些实施例中,彩色摄像模组的摄像头的感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxidesemiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。
在一些实施例中,3D感测模组可以是(time of flight,TOF)3D感测模块或结构光(structured light)3D感测模块。其中,结构光3D感测是一种主动式深度感测技术,结构光3D感测模组的基本零组件可包括红外线(Infrared)发射器、IR相机模等。结构光 3D感测模组的工作原理是先对被拍摄物体发射特定图案的光斑(pattern),再接收该物体表面上的光斑图案编码(light coding),进而比对与原始投射光斑的异同,并利用三角原理计算出物体的三维坐标。该三维坐标中就包括电子设备100距离被拍摄物体的距离。其中,TOF 3D感测也是主动式深度感测技术,TOF 3D感测模组的基本组件可包括红外线(Infrared)发射器、IR相机模等。TOF 3D感测模组的工作原理是通过红外线折返的时间去计算TOF 3D感测模组跟被拍摄物体之间的距离(即深度),以得到3D景深图。
结构光3D感测模组还可应用于人脸识别、体感游戏机、工业用机器视觉检测等领域。TOF 3D感测模组还可应用于游戏机、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)等领域。
在另一些实施例中,摄像头193还可以由两个或更多个摄像头构成。这两个或更多个摄像头可包括彩色摄像头,彩色摄像头可用于采集被拍摄物体的彩色图像数据。这两个或更多个摄像头可采用立体视觉(stereo vision)技术来采集被拍摄物体的深度数据。立体视觉技术是基于人眼视差的原理,在自然光源下,透过两个或两个以上的摄像头从不同的角度对同一物体拍摄影像,再进行三角测量法等运算来得到电子设备100 与被拍摄物之间的距离信息,即深度信息。
在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。具体的,电子设备100可以包括1个前置摄像头193以及1个后置摄像头193。其中,前置摄像头193通常可用于采集面对显示屏194的拍摄者自己的彩色图像数据以及深度数据,后置3D摄像模组193可用于采集拍摄者所面对的拍摄对象(如人物、风景等)的彩色图像数据以及深度数据。
在一些实施例中,处理器110中的CPU或GPU或NPU可以对3D摄像模组193 所采集的彩色图像数据和深度数据进行处理。在一些实施例中,NPU可以通过关键点识别技术所基于的神经网络算法,例如卷积神经网络算法(CNN),来识别3D摄像模组 193(具体是彩色摄像模组)所采集的彩色图像数据,以确定被拍摄人物的关键点。CPU 或GPU也可来运行神经网络算法以实现根据彩色图像数据确定被拍摄人物的关键点。在一些实施例中,CPU或GPU或NPU还可用于根据3D摄像模组193(具体是3D感测模组)所采集的深度数据和已识别出的关键点来确认被拍摄人物的身材(如身体比例、关键点之间的身体部位的胖瘦情况),并可以进一步确定针对该被拍摄人物的身体美化参数,最终根据该身体美化参数对被拍摄人物的拍摄图像进行处理,以使得该拍摄图像中该被拍摄人物的体型被美化。后续实施例中会详细介绍如何基于3D摄像模组193所采集的彩色图像数据和深度数据对被拍摄人物的图像进行美体处理,这里先不赘述。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等) 等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage, UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备100的各种功能应用以及数据处理。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100 接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A 的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器 180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B 检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100 可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,电子设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控面板”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏 194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M 可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM 卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM 卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100 中,不能和电子设备100分离。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本发明实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。
图1B是本发明实施例的电子设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。
如图1B所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图1B所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG, PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
下面结合捕获拍照场景,示例性说明电子设备100软件以及硬件的工作流程。
当触摸传感器180K接收到触摸操作,相应的硬件中断被发给内核层。内核层将触摸操作加工成原始输入事件(包括触摸坐标,触摸操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件,识别该输入事件所对应的控件。以该触摸操作是触摸单击操作,该单击操作所对应的控件为相机应用图标的控件为例,相机应用调用应用框架层的接口,启动相机应用,进而通过调用内核层启动摄像头驱动,通过3D摄像模组193捕获静态图像或视频。
下面介绍电子设备100上的用于应用程序菜单的示例性用户界面。
图2A示例性示出了电子设备100上的用于应用程序菜单的示例性用户界面21。如图 2A所示,电子设备100可以配置有3D摄像模组193。在一些实施例中,193-1可以是彩色摄像头,193-2可以是结构光3D摄像模组。在另一些实施例中,193-1可以是彩色摄像头,193-2可以是TOF 3D摄像模组。在再一些实施例中,193-1、193-2可以是两个彩色摄像头。如图2A所示,3D摄像模组193可设置于电子设备100的顶端,如电子设备100 的“刘海”位置(即图2A中示出的区域AA)。可以知道,区域AA中除了包括3D摄像模组193之外,还可以包括照明器197(未在图1A中示出)、扬声器170A、接近光传感器 180G、环境光传感器180L等。在一些实施例中,如图2B所示,电子设备100的背面也可以配置有3D摄像模组193,以及照明器197。
如图2A所示,用户界面21可包括:状态栏201,具有常用应用程序图标的托盘223,日历指示符203,天气指示符205,导航栏225,以及其他应用程序图标。其中:
状态栏201可包括:移动通信信号(又可称为蜂窝信号)的一个或多个信号强度指示符201-1、移动通信信号的运营商的指示符201-2、时间指示符201-3、电池状态指示符201-4等。
日历指示符203可用于指示当前时间,例如日期、星期几、时分信息等。
天气指示符205可用于指示天气类型,例如多云转晴、小雨等,还可以用于指示气温等信息。
具有常用应用程序图标的托盘223可展示:电话图标223-1、短消息图标223-2、联系人图标221-4等。
导航栏225可包括:返回按键225-1、主界面(Gome screen)按键225-3、呼出任务历史按键225-5等系统导航键。当检测到用户点击返回按键225-1时,电子设备100可显示当前页面的上一个页面。当检测到用户点击主界面按键225-3时,电子设备100可显示主界面。当检测到用户点击呼出任务历史按键225-5时,电子设备100可显示用户最近打开的任务。各导航键的命名还可以为其他,本申请对此不做限制。不限于虚拟按键,导航栏225中的各导航键也可以实现为物理按键。
其他应用程序图标可例如:微信TM(WechatTM)的图标211、QQTM的图标212、推特TM(TwitterTM)的图标213、脸书TM(FacebookTM)的图标214、邮箱TM的图标215、云共享的图标216、备忘录的图标217、设置的图标218、图库的图标219、相机的图标220。用户界面21还可包括页面指示符221。其他应用程序图标可分布在多个页面,页面指示符 221可用于指示用户当前浏览的是哪一个页面中的应用程序。用户可以左右滑动其他应用程序图标的区域,来浏览其他页面中的应用程序图标。
在一些实施例中,图2A示例性所示的用户界面21可以为主界面(Gome screen)。
在其他一些实施例中,电子设备100还可以包括主屏幕键。该主屏幕键可以是实体按键,也可以是虚拟按键(如按键225-3)。该主屏幕键可用于接收用户的指令,将当前显示的UI返回到主界面,这样可以方便用户随时查看主屏幕。上述指令具体可以是用户单次按下主屏幕键的操作指令,也可以是用户在短时间内连续两次按下主屏幕键的操作指令,还可以是用户在预定时间内长按主屏幕键的操作指令。在本申请其他一些实施例中,主屏幕键还可以集成指纹识别器,以便用于在按下主屏幕键的时候,随之进行指纹采集和识别。
下面分别描述本申请涉及的一种应用场景:图像拍摄场景。
如图3A所示,电子设备可以检测到作用于相机的图标220的触控操作(如在图标220 上的点击操作),响应于该操作,可以显示图3B示例性所示的用户界面31。用户界面31可以是“相机”应用程序的用户界面,可用于用户进行摄像,例如拍照片、录像。“相机”是智能手机、平板电脑等电子设备上的一款图像拍摄的应用程序,本申请对该应用程序的名称不做限制。也即是说,用户可以点击图标220来打开“相机”的用户界面 31。不限于此,用户还可以在其他应用程序中打开用户界面31,例如用户在“微信TM”中点击拍摄控件来打开用户界面31。“微信TM”是一款社交类应用程序,可支持用户向他人分享所拍摄的照片等。
图3B示例性示出了智能手机等电子设备上的“相机”应用程序的一个用户界面31。
如图3B所示,用户界面31可包括:区域301、拍摄模式列表302、控件303、控件304及控件305。其中:
区域301可以称为预览框301。预览框301可用于显示3D摄像模组193实时采集的彩色图像。电子设备可以实时刷新其中的显示内容,以便于用户预览摄像头193当前采集的彩色图像。这里,3D摄像模组193可以是后置摄像头,或者是前置摄像头。
拍摄模式列表302中可以显示有一个或多个拍摄模式选项。这一个或多个摄像选项可以包括:夜景模式选项302A、人像模式选项302B、拍照模式选项302C、录像模式选项302D以及更多拍摄模式选项302E。这一个或多个摄像选项在界面上可以表现为文字信息,例如夜景模式选项302A、人像模式选项302B、拍照模式选项302C、录像模式选项302D以及更多拍摄模式选项302E可以分别对应文字“夜景”、“人像”、“拍照”、“录像”、“更多”。不限于此,这一个或多个摄像选项在界面上还可以表现为图标或者其他形式的交互元素(interactive element,IE)。在一些实施例中,电子设备100可以默认选定拍照模式选项302C,拍照模式选项302C的显示状态(如拍照模式选项302C 被高亮)可表示拍照模式选项302C已被选定。
电子设备100可以检测到作用于拍摄模式选项的用户操作,该用户操作可用于选择拍摄模式,响应该操作,电子设备100可以开启用户选择的拍摄模式。特别的,当该用户操作作用于更多拍摄模式选项302E时,电子设备100可以进一步显示更多的其他拍摄模式选项,如大光圈拍摄模式选项、慢动作拍摄模式选项等等,可以向用户展示更丰富的摄像功能。不限于图3B所示,拍摄模式列表302中可以不显示更多拍摄模式选项 302E,用户可以通过在拍摄模式列表302中向左/右滑动来浏览其他拍摄模式选项。
控件303可用于监听触发拍摄(拍照或录像)的用户操作。电子设备可以检测到的作用于控件303的用户操作(如在控件303上的点击操作),响应于该操作,电子设备100可以保存预览框301中的图像。保存的图像可以是图片或视频。另外,电子设备100还可以在控件304中显示所保存的图像的缩略图。也即是说,用户可以点击控件303来触发拍摄。其中,控件303可以是按钮或者其他形式的控件。本申请中,可以将控件303称为拍摄控件。
控件304可用于监听触发切换摄像头的用户操作。电子设备100可以检测到作用于控件304的用户操作(如在控件304上的点击操作),响应于该操作,电子设备100可以切换摄像头(如将后置摄像头切换为前置摄像头,或者将前置摄像头切换为后置摄像头)。
控件305可用于监听触发打开“图库”的用户操作。电子设备100可以检测到作用于控件305的用户操作(如在控件305上的点击操作),响应于该操作,电子设备100可以显示“图库”的用户界面,该用户界面中可显示有电子设备100保存的图片。这里,“图库”是智能手机、平板电脑等电子设备上的一款图片管理的应用程序,又可以称为“相册”,本实施例对该应用程序的名称不做限制。“图库”可以支持用户对存储于电子设备上的图片进行各种操作,例如浏览、编辑、删除、选择等操作。
可以看出,用户界面31可向用户展示“相机”所提供的多种摄像功能(模式),用户可以通过点击拍摄模式选项来选择开启相应的拍摄模式。
基于上述图像拍摄场景,下面介绍电子设备100上实现的用户界面(userinterface,UI)的一些实施例。
图3C示例性示出了“相机”应用程序的“人像”拍照功能所提供的用户界面32。
在拍摄模式列表302中,电子设备100可以检测到作用于人像模式选项302B的用户操作(如在人像模式选项302B上的点击操作),响应于该用户操作,电子设备100可以开启“人像”拍照功能,并显示图3C示例性所示用的用户界面。前述内容中已经阐述了电子设备100开启“人像”拍照功能的定义,这里不再赘述。本申请中,人像模式选项可以称为第一拍摄模式选项。
如图3C所示,用户界面32包括:预览框301、拍摄模式列表302、控件303、控件304、控件305,以及306、控件207。其中:预览框301、拍摄模式列表302、控件303、控件 304、控件305可以参考用户界面31中的相关描述,这里不再赘述。控件306可用于监听打开光效模板选项的用户操作,控件307可用于监听打开人物美化选项的用户操作。
当检测到作用于控件306(如在控件306上的点击操作)的用户操作时,电子设备100 可以在用户界面31中显示多种光效模板选项。不同的光效模板可以代表(或对应)不同的光效参数,如光源位置、图层融合参数、纹理图案投影的位置、投影的方向等。用户可以选择不同的光效模板使得拍摄得到的照片呈现出不同的效果。本申请对多种光效模板选项在用户界面31中的界面表现形式不做限制。
当检测到作用于控件307的用户操作(如在控件307上的点击操作)时,电子设备100 可以显示图3C示例性所示的用户界面33。图3C示例性示出了人物美化功能所提供的用户界面。后续内容中会详细介绍图3C示例性示出的用户界面,这里先不赘述。
在一些实施例中,响应于作用于人像模式选项302B的用户操作,电子设备100还可以更新人像拍摄模式选项的显示状态,更新后的显示状态可表示人像拍摄模式已被选定。
例如,更新后的显示状态可以是高亮拍摄模式选项303B对应的文本信息“人像”。不限于此,更新后的显示状态还可以呈现其他界面表现形式,如该文本信息“人像”的字体变大、该文本信息“人像”被加框、该文本信息“人像”被加下划线、选项303B 颜色加深等。
在一些实施例中,在电子设备100开启“人像”拍照功能之后,如果电子设备100 从3D摄像模组193采集到的彩色图像中没有检测到人物,则可以在预览框301中输出提示信息308,提示信息308可以是文字“未检测到人物”,可用于提示电子设备100未检测到人物。
从图3C可以看出,人物美化功能可以集成于“人像”拍照功能中。不限于此,人物美化功能也可以为“相机”应用程序中的摄像功能,此时,用户界面31中的拍摄模式列表302中可以显示有人物美化模式选项。响应于作用于人物美化模式选项的用户操作,电子设备100可以显示图3D示例性所示的人物美化功能所提供的用户界面。
图3D示例性示出了“相机”应用程序的人物美化功能所提供的用户界面33。如图3D所示,用户界面33包括:预览框301、拍摄模式列表302、控件303、控件304、控件 305,以及美肤选项309、美体选项310。其中:预览框301、拍摄模式列表302、控件 303、控件304、控件305可以参考用户界面31中的相关描述,这里不再赘述。
美肤选项309、美体选项310在界面上可以表现为图标,可如图3D所示。不限于图标,美肤选项309、美体选项310在界面上还可以表现为文字(如文字“美肤”、“美体”) 或者其他形式的交互元素(IE)。
当电子设备100检测到作用于美体选项310的用户操作(如在美体选项310上的点击操作)时,该用户操作用于选定美体选项310。
在一些实施例中,在电子设备100开启“美体”功能之后,如果电子设备100从摄像头193采集的彩色图像中没有检测到人物,则可以在预览框301中输出提示信息308,提示信息308可以是文字“未检测到人物”,可用于提示电子设备100未检测到人物。具体的,电子设备100可以基于关键点识别技术来分析3D摄像模组193采集的彩色图像中是否包含人体关键点,如果包含人体关键点,则确定检测到人物,否则确定没有检测到人物。基于关键点识别技术确定人体关键点的具体实现后续内容中会详细介绍,这里先不展开。
为了便于理解,本申请以下实施例将以具有图1A和图1B所示结构的电子设备(智能手机)为例,结合附图和应用场景,对本申请实施例提供的基于深度的人体图像美化方法进行具体阐述。
目前,现有的人体美化方法主要集中在电脑端,例如现有的abode photoshop软件,用户需要将人像照片输入软件,人为标记出人体的各个部位,然后人工手动调节人体局部的胖瘦比例。在美化处理过程中,不能自动准确地检测出人像照片中的身体各个部位,需要手动标记身体部位,导致塑形部位不够准确;并且,需要反复人工手动调节,直至调节到自己满意的效果。
如图4所示,有些移动终端(例如手机)的应用软件也实现了美体功能,通过摄像头采集到图像,然后检测出人体,估计出各身体部位,根据用户设定的美体塑形参数来对各个身体部位(如图4所示区域A)进行美体塑形。美化过程中,用户需要一一选择需要美体的各个身体部位,容易导致人体整体比例失调,例如把头部拉长了,影响美感。而且,有些软件因为功能本身预设的限制,在调节过程中难以达到预期的效果。
进一步地,现有的人像照片缺失3D深度信息,通过单目摄像头,获取2D彩色图像,丢掉了3D深度信息,无法知道美化前后的身体比例数据,调节具有盲目性。
本申请实施例提供了一种基于深度的人体图像美化方法,该方法可以在具有深度摄像头及RGB摄像头的电子设备(例如手机、平板电脑等)中实现。图5是本申请实施例提供的基于深度的人体图像美化方法的示意性流程图,如图5所示,该方法可以包括以下步骤:
本申请实施例提供了一种基于深度的人体图像美化方法,该方法可以具有深度摄像头及RGB摄像头的电子设备(例如手机、平板电脑等)中实现。图6是本申请实施例提供的基于深度的人体图像美化方法的示意性流程图,如图6所示,该方法可以包括以下步骤:
步骤S01,检测到用户用于打开相机的第一操作;
步骤S02,响应于所述第一操作,在显示屏显示用户界面,所述用户界面包括预览框,所述预览框内包括被拍摄人物的第一人体图像,所述第一人体图像包括深度图像及彩色图像;
步骤S03,利用预设的关键点检测模型确定所述彩色图像中的多个人体关键点,并利用所述深度图像数据及摄像头参数确定所述多个人体关键点的位置信息;
步骤S04,根据所述多个人体关键点的位置信息确定所述被拍摄人物的身材比例参数;
步骤S05,检测到所述用户指示相机的第二操作,所述第二操作为所述用户指示体型模板的操作;
步骤S06,响应于所述第二操作,在所述预览框内显示所述被拍摄人物的第二人体图像,所述第二人体图像中所述被拍摄人物的身材比例参数被所述体型模板的身材比例参数自适应进行了调整处理。
在本方案中,利用关键点检测模型识别多个人体关键点,并根据人体关键点的位置信息确定被拍摄人物的身材比例参数,然后根据用户设定的体型模板的身材比例参数自适应调节所述被拍摄人物的身材比例参数,得到美化后的人体美化图像。用户在使用过程中只需要选择相应的体型模板即可对拍摄的人体图像进行美体处理,无需手动反复调节,避免人体整体比例失调,为用户带来更新的使用体验。
下面对本实施例提供的基于深度的人体图像美化方法的具体技术方案进行详细的说明。
步骤S01,检测到用户用于打开相机的第一操作;
步骤S02,响应于所述第一操作,在所述显示屏显示用户界面,所述用户界面包括预览框,所述预览框内包括被拍摄人物的第一人体图像,所述第一人体图像包括深度图像及彩色图像。
在一个示例中,用户的拍摄行为可以包括用户打开相机的第一操作;响应于所述第一操作,在显示屏上显示用户界面。
图3A示出了手机的一种图形用户界面(graphical user interface,GUI),该GUI为手机的桌面。当电子设备检测到用户点击桌面上的相机应用(application,APP)的图标220的操作后,可以启动相机应用,显示如图3B所示的另一GUI,该GUI可以称为用户界面31。该用户界面31上可以包括预览框301。在预览状态下,该预览框 301内可以实时显示预览图像。
电子设备在启动相机后,预览框301内可以显示有第一人体图像,该第一人体图像为彩色图像。用户界面上还可以包括用于指示拍照模式的控件303,以及其它拍摄控件。
具体地,电子设备可以开启3D摄像模组,并通过3D摄像模组采集彩色图像和深度图像,该深度图像包括被拍摄人物的深度信息。彩色图像包括被拍摄人物的图像(即前景图像)和背景图像。
彩色图像可以包括多个像素点,每个像素点都具有二维坐标以及颜色值。颜色值可以是RGB值或YUV值。深度图像可以包括多个像素点,每个像素点具有二维坐标以及深度值。针对被拍摄人物身体上的某个位置,该位置在彩色图像中对应的像素点的颜色值表示该位置的颜色(例如服饰的颜色、裸露的皮肤的颜色等),该位置在深度图像中对应的像素点的深度值表示该位置与电子设备(具体可以为3D摄像模组)之间的垂直距离。例如,如图6A-图6B所示,针对被拍摄人物身体上的位置A(左髋点),位置A 在彩色图像中对应的像素点的二维坐标为(x1,y1),该像素点的RGB值(255,255,255);位置A在深度图像中对应的像素点的二维坐标为(x1,y1),该像素点的深度值为350厘米。这表示位置A处的颜色为白色,位置A和电子设备之间的垂直距离为350厘米。
步骤S03,利用预设的关键点检测模型确定所述彩色图像中的多个人体关键点,并根据所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息。
具体的,电子设备可以利用被拍摄人物的彩色图像和关键点检测模型,识别出被拍摄人物的人体关键点。识别出人体关键点是指确定关键点的2D坐标。
其中,关键点检测模型的输入可以是人体的彩色图像,输出可以是人体的关键点的2D坐标。这样,电子设备具体可以将被拍摄人物的彩色图像作为输入,经过关键点检测模型的识别,得到被拍摄人物的彩色图像中各关键点的2D坐标。
如图7所示,人体关键点包括头关键点1、右耳关键点2、左耳关键点3、颈关键点4、右肩关键点5、左肩关键点6、右胸关键点7、左胸关键点8、右腰关键点9、左腰关键点 10、右髋关键点11、左髋关键点12、右膝关键点13、左膝关键点14、右脚关键点15、左脚关键点16、裆部关键点17、右肘关键点18、右腕关键点19、左肘关键点20、左腕关键点21。
在一种实施方式中,关键点检测模型例如可以是沙漏网络模型。具体地,关键点点检测模型由四个密集连接的沙漏网络构成;利用预设的训练集对关键点点检测模型进行训练,训练过程中采用最小均方误差损失函数使得沙漏网络收敛,得到训练好的关键点点检测模型。
可以理解地,沙漏网络能够对目标对象的关键点点进行有效检测,沙漏网络包括输入层、卷积层、池化层、上采样层、下采样层等。当四个沙漏网络连接在一起时,前一个沙漏网络的输出为相邻一个沙漏网络的输入。为了保证底层参数的正常更新,每个沙漏网络采用中继监督策略来对网络的损失进行监督训练。
卷积层可以包括很多个卷积算子,卷积算子也称为核,其在图像处理中的作用相当于一个从输入图像矩阵中提取特定信息的过滤器,卷积算子本质上可以是一个权重矩阵,这个权重矩阵通常被预先定义,在对图像进行卷积操作的过程中,权重矩阵通常在输入图像上沿着水平方向一个像素接着一个像素(或两个像素接着两个像素取决于步长stride的取值)的进行处理,从而完成从图像中提取特定特征的工作。
由于常常需要减少训练参数的数量,因此,卷积层之后常常需要周期性的引入池化层,可以是一层卷积层后面跟一层池化层,也可以是多层卷积层后面接一层或多层池化层。在图像处理过程中,池化层的唯一目的就是减少图像的空间大小。池化层可以包括平均池化算子和/或最大池化算子,以用于对输入图像进行采样得到较小尺寸的图像。平均池化算子可以在特定范围内对图像中的像素值进行计算产生平均值作为平均池化的结果。最大池化算子可以在特定范围内取该范围内值最大的像素作为最大池化的结果。另外,就像卷积层中用权重矩阵的大小应该与图像尺寸相关一样,池化层中的运算符也应该与图像的大小相关。通过池化层处理后输出的图像尺寸可以小于输入池化层的图像的尺寸,池化层输出的图像中每个像素点表示输入池化层的图像的对应子区域的平均值或最大值。
可选地,利用预设的关键点检测模型确定所述彩色图像中的多个人体关键点之前,方法还包括:
构建关键点检测模型,其中,关键点检测模型由四个密集连接的沙漏网络构成;
利用预设的训练集对关键点检测模型进行训练,训练过程中采用最小均方误差损失函数使得沙漏网络收敛,得到训练好的关键点检测模型。
所述训练集包括多个人体图像样本,训练前,需要对训练集中的人体图像样本进行预处理,例如将人体图像样本进行裁剪至标准大小,去除环境干扰区域,并对裁剪后的人体图像样本人工标记各个关键点。
然后将预处理后的训练样本输入四阶沙漏网络,沙漏网络包括上级路和下级路。生猪图像样本进行四次降采样,每次降采样之前,上级路处理原尺寸的人体图像,下级路对原尺寸的人体图像进行降采样之后再进行升采样处理。在本实施方式中,可以从原始尺寸中提取到原始尺寸、1/2、1/4、1/8的中间特性,每次提取特征后通过升采样使图像恢复至原始大小,与原始尺寸特征的数据进行相加,再通过一个残差网络进行特征提取;两次降采样之间,使用三个初级模块提取特征;两次相加之间,使用一个初级模块提取特征。
四阶沙漏网络中,每个沙漏网络都是通过池化层进行向降采样、临近插值进行升采样,从而自顶而下和自底而上地在每个尺寸上都能提取关键点特征。沙漏之间采用跳跃连接,使得每个分辨率下的关键点位置信息保存下来。
训练得到的关键点检测模型的骨骼识别准确度满足预设要求。
进一步地,根据所述深度图像及摄像头参数确定所述多个人体关键点的位置信息。
具体地,根据所述彩色图像中识别得到的人体关键点的坐标,从深度图像确定相同坐标下的关键点的深度值;
根据人体关键点的深度值及人体关键点的坐标得到人体关键点的位置信息,即3D坐标。例如3D坐标为(x,y,z),x表示像素点的横坐标,y表示像素点的纵坐标,z 表示像素点的深度值。
可以看出,结合被拍摄人物的彩色图像和深度图像,可以确定出被拍摄人物的每一个被拍摄部位的二维坐标、相对于3D摄像模组的深度值,以及颜色值。其中,二维坐标和深度值可表示3D坐标。
例如,图6A和图6B分别所示的彩色图像、深度图像可结合为颜色值在3D坐标空间中的分布,可如图6C所示。z轴表示深度值。其中,位置A的3D坐标为(x1,y1,z1),z1 =350厘米,该3D坐标处的RGB值为(255,255,255);位置B的3D坐标为(x2,y2,z2),z2= 345厘米,该3D坐标处的RGB值为(0,0,0)。
这里,被拍摄部位是指被3D摄像模组采集到图像的部位,例如当被拍摄人物正面面对3D摄像模组站立时,该被拍摄人物的被拍摄部位可以包括脸部、肚子等正面面对 3D摄像模组的身体部位,而臀部、后背则不属于被拍摄部位。
步骤S04,根据所述多个人体关键点的位置信息确定所述被拍摄人物的身材比例参数。所述身材比例参数包括头身比、上下身比、下身比、头肩比、头腰比、头臀比及肩身比中的一种或多种。
具体地,电子设备可以根据关键点的深度值以及关键点的2D坐标确定关键点之间的骨骼的长度。例如,如图8所示,被拍摄人物的左髋点P1、左膝点P2和电子设备之间的垂直距离分别会是D1、D2。
头身比X1=2*D1-4/(D4-15+D4-16),其中,Dn-m代表利用3D深度信息计算的关键点n到关键点m的长度。
例如,如图8所示,被拍摄人物的左髋关键点12、左膝关键点14和电子设备之间的垂直距离分别会是D1、D2。在被拍摄人物的彩色图像中,左髋点12、左膝点14之间的距离L可以由12的2D坐标和14的2D坐标计算得到。因此,可以计算出左髋关键点12、左膝关键点14之间的长度
Figure RE-GDA0002476695330000231
同样地,上下身比X2=(D4-12+D4-11)/(D11-15+D12-16),其中,4表示颈关键点,11表示右髋关键点,12表示左髋关键点,15表示右脚关键点,16表示左脚关键点。
下身比X3=(D11-13+D12-14)/(D13-15+D14-16),其中,11表示右髋关键点,12表示左髋关键点,13表示右膝关键点,14表示左膝关键点,15表示右脚关键点,16表示左脚关键点。
头肩比X4=D2-3/D5-6,其中,2表示右耳关键点,3表示左耳关键点,5表示右肩关键点,6表示左肩关键点。
头腰比X5=D2-3/D9-10,其中,2表示右耳关键点,3表示左耳关键点,9表示右腰关键点,10表示左腰关键点。
头臀比X6=D2-3/D11-12,其中,2表示右耳关键点,3表示左耳关键点,11表示右髋关键点,12表示左髋关键点。
肩身比X7=2*D5-6/(D5-15+D6-16),其中,5表示右肩关键点,6表示左肩关键点,15 表示右脚关键点,16表示左脚关键点。
具体地,在确定了被拍摄人物的身材比例参数后,进一步确定体型模板的身材比例参数,并将被拍摄人物的身材比例参数与体型模板的身材比例参数一一进行比对。
步骤S05,检测到所述用户指示体型模板的第二操作。
在一种实施方式中,检测到所述用户将拍摄的人体图像作为体型模板的第二操作。
检测到所述用户从预设的体型模板库中选择体型模板的第二操作;或
检测到所述用户从预设的图库中选择的人体图像作为体型模板的第二操作。
具体地,用户可以随机选择图库中的任意一张包含人体图像的照片作为体型模板,也可以选择体型模板库中默认的体型模板,或者用户通过拍摄他人的图像导入作为体型模板。
如图9A所示,在一种实施方式中,当用户选择的是体型模板库中默认的体型模板时,所述默认的体型模板的身材比例参数已存储于“相机”应用程序中,从而能够快速地根据体型模板的身材比例参数与被拍摄人物的身材比例参数进行比对。
需要说明的是,如图9B所示,体型模板库里面有很多体型模板,例如某位明星的体型模板,或者大众审美体型模板等等,在用户选定了体型模板后,“相机”应用就能自适应地根据用户选定的体型模板对彩色图像进行调整,使其被拍摄人物的身材比例参数接近该体型模板的身材比例参数。
具体地,在制作体型模板时,方法包括:
利用摄像头采集体型模板的彩色图像及深度图像;
利用预设的关键点检测模型确定所述彩色图像中的多个人体关键点,并利用所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息;
根据所述体型模板的所述多个人体关键点的位置信息确定所述体型模板的身材比例参数;
将所述体型模板的彩色图像及所述体型模板的身材比例参数一起保存至预设的体型模板库中。
可以理解地,将体型模板与其身材比例参数保存至体型模板库中,从而方便用户能够及时调用。
当用户通过拍摄他人的图像导入作为体型模板时,同样需要拍摄体型模板的彩色图像及深度图像,并识别所述彩色图像得到体型模板的多个人体关键点,再利用所述深度图像及摄像头参数确定所述体型模板的多个人体关键点的位置信息;根据所述体型模板的多个人体关键点的位置信息确定所述体型模板的身材比例参数。
在另一种实施方式中,当用户选择的是图库中的包含人体图像的照片作为体型模板时,所述体型模板的身材比例参数同样由关键点检测模型先进行关键点检测,得到然后根据识别得到的多个人体关键点的2D坐标计算身材比例参数。需要注意的是,用户选择非体型模板库中的体型模板中的人物姿态应当与被拍摄人物的姿态相近。
具体地,如图7所示,体型模板中的人体的左髋关键点12的2D坐标为(x12,y12)、左膝关键点14的2D坐标为(x14,y14)。因此,可以计算出左髋关键点12、左膝关键点 14之间的长度
Figure RE-GDA0002476695330000241
同样计算体型模板的身材比例参数,包括头身比、上下身比、下身比、头肩比、头腰比、头臀比及肩身比。
最后将体型模板的身材比例参数与被拍摄人物的身材比例参数进行比对,得到待调整的身材比例参数。
步骤S06,响应于所述第二操作,在所述预览框内显示所述被拍摄人物的第二人体图像,所述第二人体图像中所述被拍摄人物的身材比例参数被所述体型模板的身材比例参数自适应进行了调整处理。
具体地,步骤S06,包括:
将所述被拍摄人物的身材比例参数与所述体型模板的身材比例参数一一进行比对,将参数差值超出预设范围的身材比例参数确定为待调整的身材比例参数;
根据所述体型模板的身材比例参数调整所述待调整的身材比例参数;
根据调整后所述被拍摄人物的身材比例参数确定相应的关键点所需要的调整位置信息;
根据所述关键点所需要的调整位置信息对所述关键点进行调整,以使得所述被拍摄人物的身材比例参数与所述体型模板的身材比例参数相适应。
根据体型模板的身材比例参数调整待调节的身材比例参数。例如参数差值的预设范围为±5%,例如体型模板的身材比例参数中的头肩比X4=2/3,当被拍摄人物的头肩比X4’=2.3/3,X4’-X4=2.3/3-2/3=0.3/3=10%﹥5%,则表示被拍摄人物的头肩比需要调整,即将头肩比由2.3/3调整为2/3。
需要说明的是,体型模板的姿态和被拍摄对象的姿态可能不同。被拍摄对象的姿态可以根据被拍摄人物的彩色图像、被拍摄人物的深度信息确定。此时,电子设备可以通过相似变换将体型模板的姿态变换为被拍摄人物的姿态。具体的,电子设备可以比较这两个姿态的骨骼点在二维空间中的位移,以及被拍摄人物的骨骼点连接的两段肢体的相对夹角。
然后,电子设备可以将体型模板的骨骼点以及骨骼点连接的肢体进行旋转或平移,使得变换后的体型模板的姿态和被拍摄对象的姿态一致。在调整体型模板的姿态之后,电子设备体型模板的身材比例参数调整待调节的身材比例参数。
本实施例还提供一种计算机存储介质,该计算机存储介质中存储有计算机指令,
当该计算机指令在电子设备上运行时,使得电子设备执行上述相关方法步骤实现上述实施例中的基于深度的人体图像美化方法。
本实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的基于深度的人体图像美化方法。
另外,本申请的实施例还提供一种装置,这个装置具体可以是芯片,组件或模块,该装置可包括相连的处理器和存储器;其中,存储器用于存储计算机执行指令,当装置运行时,处理器可执行存储器存储的计算机执行指令,以使芯片执行上述各方法实施例中的基于深度的人体图像美化方法。
其中,本实施例提供的电子设备、计算机存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
通过以上实施方式的描述,所属领域的技术人员可以了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (16)

1.一种基于深度的人体图像美化方法,其特征在于,应用于具有显示屏和摄像头的电子设备,所述方法包括:
检测到用户用于打开相机的第一操作;
响应于所述第一操作,在所述显示屏显示用户界面,所述用户界面包括预览框,所述预览框内包括被拍摄人物的第一人体图像,所述第一人体图像包括深度图像及彩色图像;
利用预设的关键点检测模型确定所述彩色图像中的多个人体关键点,并根据所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息;
根据所述多个人体关键点的位置信息确定所述被拍摄人物的身材比例参数;
检测到所述用户用于指示体型模板的第二操作;
响应于所述第二操作,在所述预览框内显示所述被拍摄人物的第二人体图像,所述第二人体图像中所述被拍摄人物的身材比例参数根据所述体型模板的身材比例参数自适应进行了调整处理。
2.如权利要求1所述的方法,其特征在于,检测到所述用户用于指示体型模板的第二操作,包括:
检测到所述用户将拍摄的人体图像作为体型模板的第二操作;或
检测到所述用户从预设的体型模板库中选择体型模板的第二操作;或
检测到所述用户从预设的图库中选择的人体图像作为体型模板的第二操作。
3.如权利要求1~2所述的方法,其特征在于,所述身材比例参数包括头身比、上下身比、下身比、头肩比、头腰比、头臀比及肩身比中的一种或多种;所述第二人体图像中所述被拍摄人物的身材比例参数根据所述体型模板的身材比例参数自适应进行了调整处理,包括:
将所述被拍摄人物的身材比例参数与所述体型模板的身材比例参数一一进行比对,将参数差值超出预设范围的身材比例参数确定为待调整的身材比例参数;
根据所述体型模板的身材比例参数调整所述待调整的身材比例参数;
根据调整后所述被拍摄人物的身材比例参数确定相应的关键点所需要的调整位置信息;
根据所述关键点所需要的调整位置信息对所述关键点进行调整,以使得所述被拍摄人物的身材比例参数与所述体型模板的身材比例参数相适应。
4.如权利要求1~2所述的方法,其特征在于,所述用户界面还包括:拍摄控件;所述方法还包括:
响应于检测到的作用于所述拍摄控件的用户操作,保存所述预览框中显示的所述第二人体图像。
5.如权利要求1所述的方法,其特征在于,在所述利用预设的关键点检测算法确定所述彩色图像中的多个人体关键点,并根据所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息之前,所述方法还包括:
构建关键点检测模型,其中,所述关键点检测模型由四个密集连接的沙漏网络构成;
利用预设的训练集对所述关键点检测模型进行训练,训练过程中采用最小均方误差损失函数使得所述沙漏网络收敛,得到训练好的关键点检测模型。
6.如权利要求1所述的方法,其特征在于,所述利用所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息,包括:
根据所述彩色图像中识别得到的人体关键点的坐标,从所述深度图像确定相同坐标下的所述人体关键点的深度值;
根据所述人体关键点的深度值及所述人体关键点的坐标得到所述人体关键点的位置信息。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
利用摄像头采集体型模板的彩色图像及深度图像;
利用预设的关键点检测模型确定所述彩色图像中的多个人体关键点,并利用所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息;
根据所述体型模板的所述多个人体关键点的位置信息确定所述体型模板的身材比例参数;
将所述体型模板的彩色图像及所述体型模板的身材比例参数一起保存至预设的体型模板库中。
8.一种电子设备,其特征在于,包括:
显示屏;摄像头;一个或多个处理器;存储器;多个应用程序;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述设备执行时,使得所述设备执行以下步骤:
检测到用户用于打开相机的第一操作;
响应于所述第一操作,在所述显示屏显示用户界面,所述用户界面包括预览框,所述预览框内包括被拍摄人物的第一人体图像,所述第一人体图像包括深度图像及彩色图像;
利用预设的关键点检测算法确定所述彩色图像中的多个人体关键点,并根据所述深度图像及所述摄像头的参数确定所述多个人体关键点的位置信息;
根据所述多个人体关键点的位置信息确定所述被拍摄人物的身材比例参数;
检测到所述用户用于指示体型模板的第二操作;
响应于所述第二操作,在所述预览框内显示所述被拍摄人物的第二人体图像,所述第二人体图像中所述被拍摄人物的身材比例参数根据所述体型模板的身材比例参数自适应进行了调整处理。
9.如权利要求8所述的电子设备,其特征在于,当所述指令被所述设备执行时,使得所述设备具体执行以下步骤:
检测到所述用户将拍摄的人体图像作为体型模板的第二操作;或
检测到所述用户从预设的体型模板库中选择体型模板的第二操作;或
检测到所述用户从预设的图库中选择的人体图像作为体型模板的第二操作。
10.如权利要求8~9所述的电子设备,其特征在于,所述身材比例参数包括头身比、上下身比、下身比、头肩比、头腰比、头臀比及肩身比中的一种或多种;当所述指令被所述设备执行时,使得所述设备具体执行以下步骤:
将所述被拍摄人物的身材比例参数与所述体型模板的身材比例参数一一进行比对,将参数差值超出预设范围的身材比例参数确定为待调整的身材比例参数;
根据所述体型模板的身材比例参数调整所述待调整的身材比例参数;
根据调整后所述被拍摄人物的身材比例参数确定相应的关键点所需要的调整位置信息;
根据所述关键点所需要的调整位置信息对所述关键点进行调整,以使得所述被拍摄人物的身材比例参数与所述体型模板的身材比例参数相适应。
11.如权利要求8~9所述的电子设备,其特征在于,所述用户界面还包括:拍摄控件;当所述指令被所述设备执行时,使得所述设备具体执行以下步骤:
响应于检测到的作用于所述拍摄控件的用户操作,保存所述预览框中显示的所述第二人体图像。
12.如权利要求8所述的电子设备,其特征在于,当所述指令被所述设备执行时,使得所述设备具体执行以下步骤:
构建关键点检测模型,其中,所述关键点检测模型由四个密集连接的沙漏网络构成;
利用预设的训练集对所述关键点检测模型进行训练,训练过程中采用最小均方误差损失函数使得所述沙漏网络收敛,得到训练好的关键点检测模型。
13.如权利要求8所述的电子设备,其特征在于,当所述指令被所述设备执行时,使得所述设备具体执行以下步骤:
根据所述彩色图像中识别得到的人体关键点的坐标,从所述深度图像确定相同坐标下的所述人体关键点的深度值;
根据所述人体关键点的深度值及所述人体关键点的坐标得到所述人体关键点的位置信息。
14.一种计算机设备,包括存储器,处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时使得所述计算机设备实现如权利要求1至7任一项所述的基于深度的人体图像美化方法。
15.一种包含指令的计算机程序产品,其特征在于,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行如权利要求1至7任一项所述的基于深度的人体图像美化方法。
16.一种计算机可读存储介质,包括指令,其特征在于,当所述指令在电子设备上运行时,使得所述电子设备执行如权利要求1至7任一项所述的基于深度的人体图像美化方法。
CN202010117261.7A 2020-02-25 2020-02-25 基于深度的人体图像美化方法及电子设备 Pending CN113382154A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010117261.7A CN113382154A (zh) 2020-02-25 2020-02-25 基于深度的人体图像美化方法及电子设备
PCT/CN2020/126954 WO2021169394A1 (zh) 2020-02-25 2020-11-06 基于深度的人体图像美化方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010117261.7A CN113382154A (zh) 2020-02-25 2020-02-25 基于深度的人体图像美化方法及电子设备

Publications (1)

Publication Number Publication Date
CN113382154A true CN113382154A (zh) 2021-09-10

Family

ID=77489843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010117261.7A Pending CN113382154A (zh) 2020-02-25 2020-02-25 基于深度的人体图像美化方法及电子设备

Country Status (2)

Country Link
CN (1) CN113382154A (zh)
WO (1) WO2021169394A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114549706A (zh) * 2022-02-21 2022-05-27 成都工业学院 一种动画生成方法及动画生成装置
CN115359194A (zh) * 2022-10-20 2022-11-18 北京百度网讯科技有限公司 图像处理方法、装置、电子设备及存储介质
CN116074624A (zh) * 2022-07-22 2023-05-05 荣耀终端有限公司 一种对焦方法和装置
CN116362977A (zh) * 2021-12-23 2023-06-30 荣耀终端有限公司 一种消除图像中干涉图案的方法及装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115767257A (zh) * 2021-09-03 2023-03-07 北京字跳网络技术有限公司 拍摄方法、装置、电子设备和存储介质
CN115776532B (zh) * 2021-09-07 2023-10-20 荣耀终端有限公司 一种录像中抓拍图像的方法及电子设备
CN113763287A (zh) * 2021-09-27 2021-12-07 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN116156317A (zh) * 2021-11-16 2023-05-23 Oppo广东移动通信有限公司 相机控制方法、存储介质、协处理芯片及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090257654A1 (en) * 2008-04-11 2009-10-15 Roizen Michael F System and Method for Determining an Objective Measure of Human Beauty
CN108549873A (zh) * 2018-04-19 2018-09-18 北京华捷艾米科技有限公司 三维人脸识别方法和三维人脸识别系统
CN108765272A (zh) * 2018-05-31 2018-11-06 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及可读存储介质
CN108830150A (zh) * 2018-05-07 2018-11-16 山东师范大学 一种基于三维人体姿态估计方法及装置
CN109495688A (zh) * 2018-12-26 2019-03-19 华为技术有限公司 电子设备的拍照预览方法、图形用户界面及电子设备
CN109938737A (zh) * 2019-03-01 2019-06-28 苏州博慧智能科技有限公司 一种基于深度学习关键点检测的人体身型测量方法及装置
CN110677575A (zh) * 2019-11-12 2020-01-10 Oppo广东移动通信有限公司 图像传感器、相机模组和终端

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090257654A1 (en) * 2008-04-11 2009-10-15 Roizen Michael F System and Method for Determining an Objective Measure of Human Beauty
CN108549873A (zh) * 2018-04-19 2018-09-18 北京华捷艾米科技有限公司 三维人脸识别方法和三维人脸识别系统
CN108830150A (zh) * 2018-05-07 2018-11-16 山东师范大学 一种基于三维人体姿态估计方法及装置
CN108765272A (zh) * 2018-05-31 2018-11-06 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及可读存储介质
CN109495688A (zh) * 2018-12-26 2019-03-19 华为技术有限公司 电子设备的拍照预览方法、图形用户界面及电子设备
CN109938737A (zh) * 2019-03-01 2019-06-28 苏州博慧智能科技有限公司 一种基于深度学习关键点检测的人体身型测量方法及装置
CN110677575A (zh) * 2019-11-12 2020-01-10 Oppo广东移动通信有限公司 图像传感器、相机模组和终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吴春梅等: "利用改进生成对抗网络进行人体姿态识别", 《计算机工程与应用》 *
朱凌飞等: "基于骨架模型的人体行为分析", 《电子测量技术》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116362977A (zh) * 2021-12-23 2023-06-30 荣耀终端有限公司 一种消除图像中干涉图案的方法及装置
CN116362977B (zh) * 2021-12-23 2023-12-22 荣耀终端有限公司 一种消除图像中干涉图案的方法及装置
CN114549706A (zh) * 2022-02-21 2022-05-27 成都工业学院 一种动画生成方法及动画生成装置
CN116074624A (zh) * 2022-07-22 2023-05-05 荣耀终端有限公司 一种对焦方法和装置
CN116074624B (zh) * 2022-07-22 2023-11-10 荣耀终端有限公司 一种对焦方法和装置
CN115359194A (zh) * 2022-10-20 2022-11-18 北京百度网讯科技有限公司 图像处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2021169394A1 (zh) 2021-09-02

Similar Documents

Publication Publication Date Title
CN109495688B (zh) 电子设备的拍照预览方法、图形用户界面及电子设备
CN112130742B (zh) 一种移动终端的全屏显示方法及设备
WO2021169394A1 (zh) 基于深度的人体图像美化方法及电子设备
CN112262563B (zh) 图像处理方法及电子设备
CN114915726A (zh) 一种拍摄方法及电子设备
CN111327814A (zh) 一种图像处理的方法及电子设备
CN112887583B (zh) 一种拍摄方法及电子设备
WO2020029306A1 (zh) 一种图像拍摄方法及电子设备
CN110471606B (zh) 输入方法及电子设备
CN114466128A (zh) 目标用户追焦拍摄方法、电子设备及存储介质
CN113170037A (zh) 一种拍摄长曝光图像的方法和电子设备
CN114111704B (zh) 测量距离的方法、装置、电子设备及可读存储介质
CN115619858A (zh) 一种物体重建方法以及相关设备
CN113497890B (zh) 一种拍摄方法及设备
CN113542580A (zh) 去除眼镜光斑的方法、装置及电子设备
CN115147451A (zh) 目标跟踪方法及其装置
CN115115679A (zh) 一种图像配准方法及相关设备
US20230162529A1 (en) Eye bag detection method and apparatus
CN114444000A (zh) 页面布局文件的生成方法、装置、电子设备以及可读存储介质
CN114359335A (zh) 一种目标跟踪方法及电子设备
CN113542574A (zh) 变焦下的拍摄预览方法、终端、存储介质及电子设备
US20240046560A1 (en) Three-Dimensional Model Reconstruction Method, Device, and Storage Medium
WO2022078116A1 (zh) 笔刷效果图生成方法、图像编辑方法、设备和存储介质
CN114283195A (zh) 生成动态图像的方法、电子设备及可读存储介质
WO2024125319A1 (zh) 虚拟人物的显示方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210910

RJ01 Rejection of invention patent application after publication