CN113744286A - 虚拟头发生成方法及装置、计算机可读介质和电子设备 - Google Patents

虚拟头发生成方法及装置、计算机可读介质和电子设备 Download PDF

Info

Publication number
CN113744286A
CN113744286A CN202111075181.0A CN202111075181A CN113744286A CN 113744286 A CN113744286 A CN 113744286A CN 202111075181 A CN202111075181 A CN 202111075181A CN 113744286 A CN113744286 A CN 113744286A
Authority
CN
China
Prior art keywords
hair
image
model
style
contour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111075181.0A
Other languages
English (en)
Inventor
靳亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN202111075181.0A priority Critical patent/CN113744286A/zh
Publication of CN113744286A publication Critical patent/CN113744286A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Architecture (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供一种虚拟头发生成方法及装置、计算机可读介质和电子设备,涉及虚拟现实技术领域。该方法包括:获取当前图像,所述当前图像包括人像区域:对所述人像区域进行图像分割,得到头发轮廓图像;对所述头发轮廓图像进行特征提取,得到头发风格特征;根据所述头发风格特征从头发模型特征库中确定目标头发模型,以基于所述目标头发模型生成三维虚拟头发。本公开能够根据当前图像中包含的头发图像,自动生成符合原人像发型特征的三维虚拟头发,保证三维虚拟头发的真实性,实现虚拟发型试戴、虚拟化身等效果。

Description

虚拟头发生成方法及装置、计算机可读介质和电子设备
技术领域
本公开涉及虚拟现实技术领域,具体涉及一种虚拟头发生成方法、虚拟头发生成装置、计算机可读介质和电子设备。
背景技术
伴随着人们生活水平的不断提高,虚拟现实技术(Virtual Reality,VR)作为一个新的科学技术领域,各行各业对VR技术的需求越来越大。
由于不同的头发风格能够显著体现人物的特征,因此构建真实感较强的虚拟头发,成为虚拟化身构建方案的关键。然而目前,相关的虚拟化身构建方案中,没有提到如何构建真实感较强的三维虚拟头发。
发明内容
本公开的目的在于提供一种虚拟头发生成方法、虚拟头发生成装置、计算机可读介质和电子设备,进而至少在一定程度上解决相关技术方案中不能生成真实感较强的三维虚拟头发的问题,有效提升生成的三维虚拟头发的真实感与准确度。
根据本公开的第一方面,提供一种虚拟头发生成方法,包括:
获取当前图像,所述当前图像包括人像区域:
对所述人像区域进行图像分割,得到头发轮廓图像;
对所述头发轮廓图像进行特征提取,得到头发风格特征;
根据所述头发风格特征从头发模型特征库中确定目标头发模型,以基于所述目标头发模型生成三维虚拟头发。
根据本公开的第二方面,提供一种虚拟头发生成装置,包括:
图像获取模块,用于获取当前图像,所述当前图像包括人像区域:
图像分割模块,用于对所述人像区域进行图像分割,得到头发轮廓图像;
头发风格特征提取模块,用于对所述头发轮廓图像进行特征提取,得到头发风格特征;
三维虚拟头发生成模块,用于根据所述头发风格特征从头发模型特征库中确定目标头发模型,以基于所述目标头发模型生成三维虚拟头发。
根据本公开的第三方面,提供一种计算机可读介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法。
根据本公开的第四方面,提供一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述的方法。
本公开的一种实施例所提供的虚拟头发生成方法,获取包含人像区域的当前图像,对人像区域进行图像分割,得到头发轮廓图像,然后对头发轮廓图像进行特征提取,得到头发风格特征,根据头发风格特征从头发模型特征库中确定目标头发模型,以基于目标头发模型生成三维虚拟头发。一方面,人像区域进行图像分割,得到头发轮廓图像,然后从头发轮廓图像中提取头发风格特征,进而根据头发风格特征匹配目标头发模型,能够有效保证生成的三维虚拟头发与头发轮廓图像的匹配性,提升三维虚拟头发的真实感;另一方面,根据头发风格特征从头发模型特征库中确定目标头发模型,进而基于目标头发模型生成三维虚拟头发,能够实现从二维头发图像到三维头发模型的自动转换,提高三维头发模型的生成效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本公开实施例的一种示例性系统架构的示意图;
图2示出了可以应用本公开实施例的一种电子设备的示意图;
图3示意性示出本公开示例性实施例中一种虚拟头发生成方法的流程示意图;
图4示意性示出本公开示例性实施例中一种对人像区域进行图像分割得到头发轮廓图像的流程示意图;
图5示意性示出本公开示例性实施例中一种基于图像语义分割得到头发轮廓图像的流程示意图;
图6示意性示出本公开示例性实施例中一种训练头发风格提取器的流程示意图;
图7示意性示出本公开示例性实施例中一种从头发模型特征库中确定目标头发模型的流程示意图;
图8示意性示出本公开示例性实施例中虚拟头发生成装置的组成示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本公开实施例的一种虚拟头发生成方法及装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是各种具有图像处理功能的电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的虚拟头发生成方法一般由终端设备101、102、103中执行,相应地,虚拟头发生成装置一般设置于终端设备101、102、103中。但本领域技术人员容易理解的是,本公开实施例所提供的虚拟头发生成方法也可以由服务器105执行,相应的,虚拟头发生成装置也可以设置于服务器105中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例中,可以是用户通过终端设备101、102、103包括的用于采集图像的图像传感器收集当前图像,然后将当前图像上传至服务器105,服务器通过本公开实施例所提供的虚拟头发生成方法生成三维虚拟头发后,将三维虚拟头发渲染到终端设备101、102、103等的显示区域中。
本公开的示例性实施方式提供一种用于实现虚拟头发生成方法的电子设备,其可以是图1中的终端设备101、102、103或服务器105。该电子设备至少包括处理器和存储器,存储器用于存储处理器的可执行指令,处理器配置为经由执行可执行指令来执行虚拟头发生成方法。
下面以图2中的移动终端200为例,对电子设备的构造进行示例性说明。本领域技术人员应当理解,除了特别用于移动目的的部件之外,图2中的构造也能够应用于固定类型的设备。在另一些实施方式中,移动终端200可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现。各部件间的接口连接关系只是示意性示出,并不构成对移动终端200的结构限定。在另一些实施方式中,移动终端200也可以采用与图2不同的接口连接方式,或多种接口连接方式的组合。
如图2所示,移动终端200具体可以包括:处理器210、内部存储器221、外部存储器接口222、通用串行总线(Universal Serial Bus,USB)接口230、充电管理模块240、电源管理模块241、电池242、天线1、天线2、移动通信模块250、无线通信模块260、音频模块270、扬声器271、受话器272、麦克风273、耳机接口274、传感器模块280、显示屏290、摄像模组291、指示器292、马达293、按键294以及用户标识模块(subscriber identification module,SIM)卡接口295等。其中传感器模块280可以包括深度传感器2801、压力传感器2802、陀螺仪传感器2803等。
处理器210可以包括一个或多个处理单元,例如:处理器210可以包括应用处理器(Application Processor,AP)、调制解调处理器、图形处理器(Graphics ProcessingUnit,GPU)、图像信号处理器(Image Signal Processor,ISP)、控制器、视频编解码器、数字信号处理器(Digital Signal Processor,DSP)、基带处理器和/或神经网络处理器(Neural-Network Processing Unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
NPU为神经网络(Neural-Network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现移动终端200的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
处理器210中设置有存储器。存储器可以存储用于实现六个模块化功能的指令:检测指令、连接指令、信息管理指令、分析指令、数据传输指令和通知指令,并由处理器210来控制执行。
充电管理模块240用于从充电器接收充电输入。电源管理模块241用于连接电池242、充电管理模块240与处理器210。电源管理模块241接收电池242和/或充电管理模块240的输入,为处理器210、内部存储器221、显示屏290、摄像模组291和无线通信模块260等供电。
移动终端200的无线通信功能可以通过天线1、天线2、移动通信模块250、无线通信模块260、调制解调处理器以及基带处理器等实现。其中,天线1和天线2用于发射和接收电磁波信号;移动通信模块250可以提供应用在移动终端200上的包括2G/3G/4G/5G等无线通信的解决方案;调制解调处理器可以包括调制器和解调器;无线通信模块260可以提供应用在移动终端200上的包括无线局域网(Wireless Local Area Networks,WLAN)(如无线保真(Wireless Fidelity,Wi-Fi)网络)、蓝牙(Bluetooth,BT)等无线通信的解决方案。在一些实施例中,移动终端200的天线1和移动通信模块250耦合,天线2和无线通信模块260耦合,使得移动终端200可以通过无线通信技术与网络以及其他设备通信。
移动终端200通过GPU、显示屏290及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏290和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器210可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
移动终端200可以通过ISP、摄像模组291、视频编解码器、GPU、显示屏290及应用处理器等实现拍摄功能。其中,ISP用于处理摄像模组291反馈的数据;摄像模组291用于捕获静态图像或视频;数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号;视频编解码器用于对数字视频压缩或解压缩,移动终端200还可以支持一种或多种视频编解码器。
外部存储器接口222可以用于连接外部存储卡,例如Micro SD卡,实现扩展移动终端200的存储能力。外部存储卡通过外部存储器接口222与处理器210通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器221可以用于存储计算机可执行程序代码,可执行程序代码包括指令。内部存储器221可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储移动终端200使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器221可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(Universal Flash Storage,UFS)等。处理器210通过运行存储在内部存储器221的指令和/或存储在设置于处理器中的存储器的指令,执行移动终端200的各种功能应用以及数据处理。
移动终端200可以通过音频模块270、扬声器271、受话器272、麦克风273、耳机接口274及应用处理器等实现音频功能。例如音乐播放、录音等。
深度传感器2801用于获取景物的深度信息。在一些实施例中,深度传感器可以设置于摄像模组291。
压力传感器2802用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器2802可以设置于显示屏290。压力传感器2802的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。
陀螺仪传感器2803可以用于确定移动终端200的运动姿态。在一些实施方式中,可以通过陀螺仪传感器2803确定移动终端200围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器2803可以用于拍摄防抖、导航、体感游戏场景等。
此外,还可以根据实际需要在传感器模块280中设置其他功能的传感器,例如气压传感器、磁传感器、加速度传感器、距离传感器、接近光传感器、指纹传感器、温度传感器、触摸传感器、环境光传感器、骨传导传感器等。
移动终端200中还可包括其它提供辅助功能的设备。例如,按键294包括开机键,音量键等,用户可以通过按键输入,产生与移动终端200的用户设置以及功能控制有关的键信号输入。再如,指示器292、马达293、SIM卡接口295等。
下面以终端设备执行为例,对本公开示例性实施方式的虚拟头发生成方法和虚拟头发生成装置进行具体说明。
图3示出了本示例性实施方式中一种虚拟头发生成方法的流程示意图,包括以下步骤S310至步骤S340:
在步骤S310中,获取当前图像,所述当前图像包括人像区域。
在一示例性实施例中,当前图像是指包含人像区域并且用于生成与该人像区域对应的三维虚拟头发的图像,例如,当前图像可以是通过终端设备的图像传感器实时采集的、包含人像区域的图像,也可以是预先存储的、包含人像区域的图像,当然,还可以是绘制的、包含人像线条的图像等,本示例实施例对此不做特殊限定。
人像区域是指包含人体特征(至少包含完整的头发区域)的图像区域,例如,人像区域可以是当前图像中包含的人脸图像,也可以是当前图像中包含的半身人体图像,还可以是当前图像中包含的全身人体图像,本示例实施例不对此做特殊限定。
在步骤S320中,对所述人像区域进行图像分割,得到头发轮廓图像。
在一示例性实施例中,图像分割是指将当前图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的处理过程,头发轮廓图像是指对人像区域进行图像分割得到的包含头发图像纹理的图像区域。
可以通过较成熟的图像分割算法对人像区域进行图像分割,例如,图像分割算法可以是DeepLabel算法,也可以是Unet算法,还可以是全卷积神经网络(FullyConvolutional Networks,FCN)算法,当然,还可以是其他类型的、至少包含特征编码模块Encoder以及特征解码模块Decoder的图像分割算法,本示例实施例对此不做任何特殊限定。
在步骤S330中,对所述头发轮廓图像进行特征提取,得到头发风格特征。
在一示例性实施例中,特征提取是指对头发轮廓图像中的关键特征进行抽象化表达的处理过程,例如,可以通过特征提取确定头发轮廓图像中的头发的形状特征、颜色特征、纹理特征等,并将形状特征、颜色特征、纹理特征等抽象化表达为特征向量的处理过程。
头发风格特征是指表征头发轮廓图像中用于描述头发发型风格的关键信息的特征,例如,头发风格特征可以包括头发形状特征、头发颜色特征、头发纹理特征,当然,头发风格特征还可以包括其他的用于描述头发发型风格的关键信息的特征,本示例实施例不以此为限。
在步骤S340中,根据所述头发风格特征从头发模型特征库中确定目标头发模型,以基于所述目标头发模型生成三维虚拟头发。
在一示例性实施例中,头发模型特征库是指预先收集构建的、用于存储多种不同发型风格的三维头发模型对应的头发风格特征以及该头发风格特征关联的三维头发模型(渲染数据)的数据库。
可以根据头发风格特征以及头发模型特征库中的头发风格特征的相似性,匹配与头发轮廓图像最为相似的目标头发模型,进而可以获取该目标头发模型的渲染数据,根据渲染数据渲染生成头发轮廓图像对应的三维虚拟头发。
下面对步骤S310至步骤S340进行详细说明。
在一示例性实施例中,可以通过图4中的步骤从人像区域中提取头发轮廓图像,参考图4所示,具体可以包括:
步骤S410,对所述人像区域进行人脸框检测,确定人脸图像框;
步骤S420,对所述人脸图像框中的人脸图像进行图像分割,得到头发轮廓图像。
其中,人脸框检测是指通过检测框的形式从人像区域确定人脸图像的检测方法,例如,可以通过多任务卷积神经网络(Multi-task convolutional neural network,MTCNN)对人像区域进行人脸框检测,也可以通过人脸检测器Retinaface对人像区域进行人脸框检测,还可以目标检测算法YOLO对人像区域进行人脸框检测,当然,还可以是其他能够从人像区域中确定人脸图像的检测算法,本示例实施例对此不做任何特殊限定。
人脸图像框是指从人像区域中确定人脸图像位置的最小包围盒,通过人脸图像框从人像区域中确定人脸图像的位置,可以缩小需要进行图像分割的图像尺寸,降低图像分割算法的计算量,同时,通过人脸图像框框选人脸图像进行图像分割,相比于直接将人像区域对应的图像作为图像分割算法的输入,能够有效提升分割得到的头发轮廓图像的准确性以及精准度。
在一示例性实施例中,可以通过图5中的步骤对人脸图像进行图像分割,参考图5所示,具体可以包括:
步骤S510,对所述人脸图像框中的人脸图像的像素点进行语义分类,确定属于头发区域的目标像素点;
步骤S520,根据所述目标像素点对所述人脸图像进行图像分割,得到头发轮廓图像。
其中,目标像素点是指人脸图像中被识别为头发区域的像素点,语义分类(Semantic Segmentation)是指对图像中每一个像素点进行分类,确定每个点的类别(如属于背景、人或车等),从而进行图像区域划分。
通过对人脸图像中的像素点进行语义分类,确定属于头发区域的目标像素点,能够避免相关基于图像边缘梯度方法对图像划分的方案中容易出现图像划分错误的问题,有效保证划分得到的头发轮廓图像的准确性与精准度。
在一示例性实施例中,可以根据预训练的头发风格提取器对头发轮廓图像进行特征提取,得到头发风格特征。该头发风格提取器可以包括用于图像分类的深度学习网络,例如,深度学习网络可以是残差神经网络Resnet,Vggnet,Facenet,Arcface等深度学习网络框架;该头发风格提取器的损失函数可以采用三元组损失函数TripletLoss,三元组损失函数可以包括锚样本(目标样本)anchor、正样本positive sample以及负样本negativesample,其中,正样本表示与锚样本属于同类别的样本,负样本标识与锚样本属于不同类别的样本,三元组损失函数的目的是使锚样本的嵌入特征embedding跟正样本的距离尽可能接近,跟负样本的距离仅可能远离。当然,本示例实施例中的头发风格提取器的损失函数还可以是其他类型的损失函数,对此并不做任何特殊限定。
由于各头发轮廓图像之间的类内差异可能较小,而三元组损失函数的优势是能够将较小的差异进行区分,因此通过基于三元组损失函数的头发风格提取器提取头发轮廓图像中的头发风格特征,能够有效将头发轮廓图像中的较小差异区分开,提升头发风格特征的准确度以及精确度。
具体的,可以将头发轮廓图像输入到头发风格提取器中,输出头发轮廓图像对应的嵌入式特征向量,其中嵌入式特征向量为高维特征数据,是对该输入的头发轮廓图像的抽象表达,并将该嵌入式特征向量作为头发风格特征,便于计算机进行后续的计算。
在一示例性实施例中,可以通过图6中的步骤实现对头发风格提取器的训练以及数据库的构建,参考图6所示,具体可以包括:
步骤S610,获取头发模型数据库与样本头发轮廓图;
步骤S620,根据所述头发模型数据库与所述样本头发轮廓图对构建的头发风格提取器进行训练,得到训练完成的头发风格提取器;以及
步骤S630,基于所述头发模型数据库构建头发模型特征库。
其中,样本头发轮廓图是指预先采集的、用于训练头发风格提取器的不同头发风格的头发轮廓图,头发模型数据库是指包含与样本头发轮廓图对应的三维头发模型的数据库,用于辅助训练头发风格提取器。
举例而言,假设头发风格提取器的损失函数为三元组损失函数,那么在将样本头发轮廓图输入到构建的头发风格提取器之前,可以结合头发模型数据库对样本头发轮廓图进行预处理,构建样本头发轮廓图对应的三元组(目标样本,正样本,负样本),进而将三元组(目标样本,正样本,负样本)作为构建的头发风格提取器的输入数据batch,对构建的头发风格提取器进行训练,直到三元组损失函数收敛,完成对头发风格提取器的训练。
另一方面,可以基于头发模型数据库构建头发模型特征库,具体的,可以根据头发模型数据库关联的头发轮廓图构建各三维头发模型对应的头发风格特征,然后可以根据各三维头发模型对应的头发风格特征构建头发模型特征库,用于后续的三维头发模型匹配。
在一示例性实施例中,可以通过图7中的步骤实现从头发模型特征库中确定目标头发模型,参考图7所示,具体可以包括:
步骤S710,计算所述头发风格特征与所述头发模型特征库中的候选头发特征的相似度;
步骤S720,根据所述相似度对所述候选头发特征进行排序;
步骤S730,将最大相似度的候选头发特征对应的三维头发模型确定为目标头发模型。
其中,候选头发特征是指头发模型特征库中各三维头发模型对应的头发风格特征,用于与当前图像对应的头发风格特征进行匹配。
相似度是指用于衡量当前图像中人脸图像对应的头发风格特征与头发模型特征库中的候选头发特征的相似程度的数据,例如,相似度可以是头发风格特征与候选头发特征之间的余弦相似度,也可以是头发风格特征与候选头发特征之间的欧氏距离,当然,还可以是其他类型的用于衡量当前图像中人脸图像对应的头发风格特征与头发模型特征库中的候选头发特征的相似程度的数据,本示例实施例对此不做特殊限定。
可以根据相似度对候选头发特征进行排序,例如,可以根据相似度对候选头发特征进行顺序排列,也可以根据相似度对候选头发特征进行倒序排列,本示例实施例对此不做特殊限定。
可以将最大相似度的候选头发特征对应的三维头发模型确定为目标头发模型,此时可以认为目标头发模型与头发轮廓图像的头发风格最为接近,因此可以将其作为头发轮廓图像对应的三维头发模型,进而生成头发轮廓图像对应三维虚拟头发。
在一示例性实施例中,生成的三维虚拟头发可以用于实现用户的虚拟化身,并将该虚拟化身添加到虚拟现实场景中,例如,在启动虚拟化身的应用程序时,通过图像传感器实时获取用户的当前图像,然后将当前图像基于本示例实施例中的虚拟头发生成方法生成三维虚拟头发,然后根据当前图像中的人脸关键特征(如五官特征、面部轮廓特征等)生成三维脸部模型,然后根据用户选择或者系统随机的方式生成三维身体模型,最后根据生成的三维虚拟头发、三维脸部模型和三维身体模型构成该用户对应的虚拟化身。
另一方面,生成的三维虚拟头发也可以用于虚拟发型试戴,例如,在启动虚拟发型试戴的应用程序时,通过图像传感器实时获取的当前图像,或者用户选择输入的当前图像,并将当前图像基于本示例实施例中的虚拟头发生成方法生成三维虚拟头发,最后将该三维虚拟头发渲染到当前图像中的头发区域,或者用户指定的图像中,实现虚拟发型试戴的功能。
当然,基于本示例实施例中的虚拟头发生成方法生成的三维虚拟头发还可以用于其他应用场景,此处仅是示意性举例说明,本示例实施例不以此为限。
综上所述,本示例性实施方式中,获取包含人像区域的当前图像,对人像区域进行图像分割,得到头发轮廓图像,然后对头发轮廓图像进行特征提取,得到头发风格特征,根据头发风格特征从头发模型特征库中确定目标头发模型,以基于目标头发模型生成三维虚拟头发。一方面,人像区域进行图像分割,得到头发轮廓图像,然后从头发轮廓图像中提取头发风格特征,进而根据头发风格特征匹配目标头发模型,能够有效保证生成的三维虚拟头发与头发轮廓图像的匹配性,提升三维虚拟头发的真实感;另一方面,根据头发风格特征从头发模型特征库中确定目标头发模型,进而基于目标头发模型生成三维虚拟头发,能够实现从二维头发图像到三维头发模型的自动转换,提高三维头发模型的生成效率。
需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
进一步的,参考图8所示,本示例的实施方式中还提供一种虚拟头发生成装置800,可以包括图像获取模块810、图像分割模块820、头发风格特征提取模块830以及三维虚拟头发生成模块840。其中:
图像获取模块810用于获取当前图像,所述当前图像包括人像区域:
图像分割模块820用于对所述人像区域进行图像分割,得到头发轮廓图像;
头发风格特征提取模块830用于对所述头发轮廓图像进行特征提取,得到头发风格特征;
三维虚拟头发生成模块840用于根据所述头发风格特征从头发模型特征库中确定目标头发模型,以基于所述目标头发模型生成三维虚拟头发。
在一示例性实施例中,图像分割模块820可以包括:
人脸图像框检测单元,用于对所述人像区域进行人脸框检测,确定人脸图像框;
人脸图像分割单元,用于对所述人脸图像框中的人脸图像进行图像分割,得到头发轮廓图像。
在一示例性实施例中,人脸图像分割单元还可以用于:
对所述人脸图像框中的人脸图像的像素点进行语义分类,确定属于头发区域的目标像素点;
根据所述目标像素点对所述人脸图像进行图像分割,得到头发轮廓图像。
在一示例性实施例中,头发风格特征提取模块830可以用于:
根据预训练的头发风格提取器对所述头发轮廓图像进行特征提取,得到头发风格特征,所述头发风格提取器包括用于图像分类的深度学习网络和三元组损失函数。
在一示例性实施例中,头发风格特征提取模块830还可以用于:
将所述头发轮廓图像输入到所述头发风格提取器中,输出所述头发轮廓图像对应的嵌入式特征向量;
将所述嵌入式特征向量作为所述头发风格特征。
在一示例性实施例中,虚拟头发生成装置800可以包括头发风格提取器训练模块,头发风格提取器训练模块可以用于:
获取头发模型数据库与样本头发轮廓图;
根据所述头发模型数据库与所述样本头发轮廓图对构建的头发风格提取器进行训练,得到训练完成的头发风格提取器;以及
基于所述头发模型数据库构建头发模型特征库。
在一示例性实施例中,三维虚拟头发生成模块840可以用于:
计算所述头发风格特征与所述头发模型特征库中的候选头发特征的相似度;
根据所述相似度对所述候选头发特征进行排序;
将最大相似度的候选头发特征对应的三维头发模型确定为目标头发模型。
上述装置中各模块的具体细节在方法部分实施方式中已经详细说明,未披露的细节内容可以参见方法部分的实施方式内容,因而不再赘述。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
本公开的示例性实施方式还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤,例如可以执行图3至图7中任意一个或多个步骤。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
此外,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

Claims (10)

1.一种虚拟头发生成方法,其特征在于,包括:
获取当前图像,所述当前图像包括人像区域;
对所述人像区域进行图像分割,得到头发轮廓图像;
对所述头发轮廓图像进行特征提取,得到头发风格特征;
根据所述头发风格特征从头发模型特征库中确定目标头发模型,以基于所述目标头发模型生成三维虚拟头发。
2.根据权利要求1所述的方法,其特征在于,所述对所述人像区域进行图像分割,得到头发轮廓图像,包括:
对所述人像区域进行人脸框检测,确定人脸图像框;
对所述人脸图像框中的人脸图像进行图像分割,得到头发轮廓图像。
3.根据权利要求2所述的方法,其特征在于,所述对所述人脸图像框中的人脸图像进行图像分割,得到头发轮廓图像,包括:
对所述人脸图像框中的人脸图像的像素点进行语义分类,确定属于头发区域的目标像素点;
根据所述目标像素点对所述人脸图像进行图像分割,得到头发轮廓图像。
4.根据权利要求1所述的方法,其特征在于,所述对所述头发轮廓图像进行特征提取,得到头发风格特征,包括:
根据预训练的头发风格提取器对所述头发轮廓图像进行特征提取,得到头发风格特征,所述头发风格提取器包括用于图像分类的深度学习网络和三元组损失函数。
5.根据权利要求4所述的方法,其特征在于,所述根据预训练的头发风格提取器对所述头发轮廓图像进行特征提取,得到头发风格特征,包括:
将所述头发轮廓图像输入到所述头发风格提取器中,输出所述头发轮廓图像对应的嵌入式特征向量;
将所述嵌入式特征向量作为所述头发风格特征。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取头发模型数据库与样本头发轮廓图;
根据所述头发模型数据库与所述样本头发轮廓图对构建的头发风格提取器进行训练,得到训练完成的头发风格提取器;以及
基于所述头发模型数据库构建头发模型特征库。
7.根据权利要求1或6所述的方法,其特征在于,所述根据所述头发风格特征从头发模型特征库中确定目标头发模型,包括:
计算所述头发风格特征与所述头发模型特征库中的候选头发特征的相似度;
根据所述相似度对所述候选头发特征进行排序;
将最大相似度的候选头发特征对应的三维头发模型确定为目标头发模型。
8.一种虚拟头发生成装置,其特征在于,包括:
图像获取模块,用于获取当前图像,所述当前图像包括人像区域:
图像分割模块,用于对所述人像区域进行图像分割,得到头发轮廓图像;
头发风格特征提取模块,用于对所述头发轮廓图像进行特征提取,得到头发风格特征;
三维虚拟头发生成模块,用于根据所述头发风格特征从头发模型特征库中确定目标头发模型,以基于所述目标头发模型生成三维虚拟头发。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的方法。
CN202111075181.0A 2021-09-14 2021-09-14 虚拟头发生成方法及装置、计算机可读介质和电子设备 Pending CN113744286A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111075181.0A CN113744286A (zh) 2021-09-14 2021-09-14 虚拟头发生成方法及装置、计算机可读介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111075181.0A CN113744286A (zh) 2021-09-14 2021-09-14 虚拟头发生成方法及装置、计算机可读介质和电子设备

Publications (1)

Publication Number Publication Date
CN113744286A true CN113744286A (zh) 2021-12-03

Family

ID=78738792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111075181.0A Pending CN113744286A (zh) 2021-09-14 2021-09-14 虚拟头发生成方法及装置、计算机可读介质和电子设备

Country Status (1)

Country Link
CN (1) CN113744286A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114187633A (zh) * 2021-12-07 2022-03-15 北京百度网讯科技有限公司 图像处理方法及装置、图像生成模型的训练方法及装置
CN115018992A (zh) * 2022-06-29 2022-09-06 北京百度网讯科技有限公司 发型模型的生成方法、装置、电子设备及存储介质
CN115311403A (zh) * 2022-08-26 2022-11-08 北京百度网讯科技有限公司 深度学习网络的训练方法、虚拟形象生成方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114187633A (zh) * 2021-12-07 2022-03-15 北京百度网讯科技有限公司 图像处理方法及装置、图像生成模型的训练方法及装置
CN114187633B (zh) * 2021-12-07 2023-06-16 北京百度网讯科技有限公司 图像处理方法及装置、图像生成模型的训练方法及装置
CN115018992A (zh) * 2022-06-29 2022-09-06 北京百度网讯科技有限公司 发型模型的生成方法、装置、电子设备及存储介质
CN115311403A (zh) * 2022-08-26 2022-11-08 北京百度网讯科技有限公司 深度学习网络的训练方法、虚拟形象生成方法及装置
CN115311403B (zh) * 2022-08-26 2023-08-08 北京百度网讯科技有限公司 深度学习网络的训练方法、虚拟形象生成方法及装置

Similar Documents

Publication Publication Date Title
JP7130057B2 (ja) 手部キーポイント認識モデルの訓練方法及びその装置、手部キーポイントの認識方法及びその装置、並びにコンピュータプログラム
CN109214343B (zh) 用于生成人脸关键点检测模型的方法和装置
CN111476783B (zh) 基于人工智能的图像处理方法、装置、设备及存储介质
CN113744286A (zh) 虚拟头发生成方法及装置、计算机可读介质和电子设备
CN112562019A (zh) 图像色彩调整方法及装置、计算机可读介质和电子设备
CN110009059B (zh) 用于生成模型的方法和装置
CN112598780B (zh) 实例对象模型构建方法及装置、可读介质和电子设备
CN113362263B (zh) 变换虚拟偶像的形象的方法、设备、介质及程序产品
CN111950570B (zh) 目标图像提取方法、神经网络训练方法及装置
CN111327772B (zh) 进行自动语音应答处理的方法、装置、设备及存储介质
CN109754464B (zh) 用于生成信息的方法和装置
CN112927363A (zh) 体素地图构建方法及装置、计算机可读介质和电子设备
CN111541951B (zh) 基于视频的交互处理方法、装置、终端及可读存储介质
CN112927362A (zh) 地图重建方法及装置、计算机可读介质和电子设备
CN111967515A (zh) 图像信息提取方法、训练方法及装置、介质和电子设备
CN112069309A (zh) 信息获取方法、装置、计算机设备及存储介质
CN113705302A (zh) 图像生成模型的训练方法、装置、计算机设备及存储介质
CN110728319B (zh) 一种图像生成方法、装置以及计算机存储介质
CN114495916A (zh) 背景音乐的插入时间点确定方法、装置、设备和存储介质
CN113284206A (zh) 信息获取方法及装置、计算机可读存储介质、电子设备
CN113205569A (zh) 图像绘制方法及装置、计算机可读介质和电子设备
CN114049674A (zh) 一种三维人脸重建方法、装置及存储介质
CN112037305B (zh) 对图像中的树状组织进行重建的方法、设备及存储介质
CN115578494B (zh) 中间帧的生成方法、装置、设备及存储介质
CN111814811A (zh) 图像信息提取方法、训练方法及装置、介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination