CN112991208A - 图像处理方法及装置、计算机可读介质和电子设备 - Google Patents
图像处理方法及装置、计算机可读介质和电子设备 Download PDFInfo
- Publication number
- CN112991208A CN112991208A CN202110265898.5A CN202110265898A CN112991208A CN 112991208 A CN112991208 A CN 112991208A CN 202110265898 A CN202110265898 A CN 202110265898A CN 112991208 A CN112991208 A CN 112991208A
- Authority
- CN
- China
- Prior art keywords
- image
- face
- processing
- processed
- position information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 130
- 238000000034 method Methods 0.000 claims abstract description 88
- 230000008569 process Effects 0.000 claims abstract description 31
- 238000001514 detection method Methods 0.000 claims description 13
- 230000004927 fusion Effects 0.000 claims description 11
- 238000012937 correction Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 10
- 230000001788 irregular Effects 0.000 description 8
- 238000003062 neural network model Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
Abstract
本公开提供一种图像处理方法、图像处理装置、计算机可读介质和电子设备,涉及图像处理技术领域。该方法包括:获取待处理图像中包括的人脸图像和人脸图像的位置信息;对待处理图像进行第一处理过程,得到第一中间图像,以及对人脸图像进行第二处理过程,得到第二中间图像;基于位置信息将第二中间图像与第一中间图像融合,得到目标图像。本公开能够对待处理图像的不同区域采用不同的处理过程,即针对人脸图像和非人脸图像选择更加适应该图像的处理过程进行处理,提升了处理效果。
Description
技术领域
本公开涉及图像处理技术领域,具体涉及一种图像处理方法、图像处理装置、计算机可读介质和电子设备。
背景技术
在计算机发展迅速的时代,依托手机、数码相机等电子设备记录生活已经成为人类生活中不可或缺的一部分。为了使得手机、数码相机等电子设备拍摄出的图像更加清晰等原因,开发人员开发了很多图像处理软件。例如,有些图像处理软件能够改变图像的色调、风格;有些图像处理软件则可以向图像增加滤镜、贴纸等。
发明内容
本公开的目的在于提供一种图像处理方法、图像处理装置、计算机可读介质和电子设备,使得图像处理的过程中,可以针对人脸图像和非人脸图像分别选择更加匹配的处理方式进行处理,以避免采用统一处理方法对图像整体进行处理时,处理过程不匹配导致的处理结果差的问题。
根据本公开的第一方面,提供一种图像处理方法,包括:获取待处理图像中包括的人脸图像和人脸图像的位置信息;对待处理图像进行第一处理过程,得到第一中间图像,以及对人脸图像进行第二处理过程,得到第二中间图像;基于位置信息将第二中间图像与第一中间图像融合,得到目标图像。
根据本公开的第二方面,提供一种图像处理装置,包括:图像获取模块,用于获取待处理图像中包括的人脸图像和人脸图像的位置信息;图像处理模块,用于对待处理图像进行第一处理过程,得到第一中间图像,以及对人脸图像进行第二处理过程,得到第二中间图像;图像融合模块,用于基于位置信息将第二中间图像与第一中间图像融合,得到目标图像。
根据本公开的第三方面,提供一种计算机可读介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法。
根据本公开的第四方面,提供一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述的方法。
本公开的一种实施例所提供的图像处理方法,通过对待处理图像进行第一处理过程得到第一中间图像,同时对待处理图像中的人脸图像进行第二处理过程得到第二中间图像,最后基于人脸图像的位置信息将第一中间图像和第二中间图像融合,得到目标图像。本公开实施例的技术方案,对待处理图像的不同区域采用不同的处理过程,即针对人脸图像和非人脸图像选择更加适应该图像的处理过程进行处理,提升了处理效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本公开实施例的一种示例性系统架构的示意图;
图2示出了可以应用本公开实施例的一种电子设备的示意图;
图3示意性示出本公开示例性实施例中一种图像处理方法的流程图;
图4示意性示出本公开示例性实施例中一种获取人脸图像和位置信息的方法的流程图;
图5示意性示出本公开示例性实施例中一种对边界框进行外扩的示意图;
图6示意性示出本公开示例性实施例中一种从待处理图像中抠取人脸图像的示意图;
图7示意性示出本公开示例性实施例中另一种图像处理方法的流程图;
图8示意性示出本公开示例性实施例中图像处理装置的组成示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本公开实施例的一种图像处理方法及装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是各种具有图像处理功能的电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的图像处理方法一般由终端设备101、102、103中执行,相应地,图像处理装置一般设置于终端设备101、102、103中。但本领域技术人员容易理解的是,本公开实施例所提供的图像处理方法也可以由服务器105执行,相应的,图像处理装置也可以设置于服务器105中,本示例性实施例中对此不做特殊限定。
本公开的示例性实施方式提供一种用于实现图像处理方法的电子设备,其可以是图1中的终端设备101、102、103或服务器105。该电子设备至少包括处理器和存储器,存储器用于存储处理器的可执行指令,处理器配置为经由执行可执行指令来执行图像处理方法。
下面以图2中的移动终端200为例,对电子设备的构造进行示例性说明。本领域技术人员应当理解,除了特别用于移动目的的部件之外,图2中的构造也能够应用于固定类型的设备。在另一些实施方式中,移动终端200可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现。各部件间的接口连接关系只是示意性示出,并不构成对移动终端200的结构限定。在另一些实施方式中,移动终端200也可以采用与图2不同的接口连接方式,或多种接口连接方式的组合。
如图2所示,移动终端200具体可以包括:处理器210、内部存储器221、外部存储器接口222、通用串行总线(Universal Serial Bus,USB)接口230、充电管理模块240、电源管理模块241、电池242、天线1、天线2、移动通信模块250、无线通信模块260、音频模块270、扬声器271、受话器272、麦克风273、耳机接口274、传感器模块280、显示屏290、摄像模组291、指示器292、马达293、按键294以及用户标识模块(subscriber identification module,SIM)卡接口295等。其中传感器模块280可以包括深度传感器2801、压力传感器2802、陀螺仪传感器2803等。
处理器210可以包括一个或多个处理单元,例如:处理器210可以包括应用处理器(Application Processor,AP)、调制解调处理器、图形处理器(Graphics ProcessingUnit,GPU)、图像信号处理器(Image Signal Processor,ISP)、控制器、视频编解码器、数字信号处理器(Digital Signal Processor,DSP)、基带处理器和/或神经网络处理器(Neural-Network Processing Unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
NPU为神经网络(Neural-Network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。在本公开的一些实施例中,NPU可以用于对待处理图像进行人脸检测,也可以用于根据图像处理模型对人脸图像或待处理图像进行图像处理过程。
处理器210中设置有存储器。存储器可以存储用于实现六个模块化功能的指令:检测指令、连接指令、信息管理指令、分析指令、数据传输指令和通知指令,并由处理器210来控制执行。
移动终端200通过GPU、显示屏290及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏290和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器210可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
深度传感器2801用于获取景物的深度信息。在一些实施例中,深度传感器可以设置于摄像模组291。
压力传感器2802用于感受压力信号,可以将压力信号转换成电信号。陀螺仪传感器2803可以用于确定移动终端200的运动姿态。此外,还可以根据实际需要在传感器模块280中设置其他功能的传感器,例如气压传感器、磁传感器、加速度传感器、距离传感器、接近光传感器、指纹传感器、温度传感器、触摸传感器、环境光传感器、骨传导传感器等。
在相关技术中,通常需要针对待处理图像整体进行图像处理。例如,公开号为CN111724327A的专利申请提供了一种图像修复模型训练方法及图像修复方法。在该专利申请中,通过对若干原图图像进行随机掩膜处理生成训练数据集,对构建的图像修复深度神经网络模型进行训练得到训练好图像修复深度神经网络模型;在得到待修复图像后,对待修复图像进行待修复区域的标注,然后基于训练好图像修复深度神经网络模型对带有标注的待修复图像进行训练。然而,上述方案采用统一模型修复图像的不同区域,可能由于模型无法适配所有类型的图像,导致修复效果差的问题。具体的,假设训练图像修复深度神经网络模型的训练集中包含更多风景图像,因此训练好的图像修复深度神经网络模型更加适配修复风景图像,而不适配人物、动物等图像。
基于上述一个或多个问题,本示例实施方式提供了一种图像处理方法。该图像处理方法可以应用于上述服务器105,也可以应用于上述终端设备101、102、103中的一个或多个,本示例性实施例中对此不做特殊限定。参考图3所示,该图像处理方法可以包括以下步骤S310至S330:
在步骤S310中,获取待处理图像中包括的人脸图像和人脸图像的位置信息。
其中,待处理图像中可以包括一个人脸图像,也可以包括多个人脸图像。例如,待处理图像A中包括1个人脸图像,则对应的获取1个人脸图像和该人脸图像的位置信息;再如,待处理图像B中包括3个人脸图像,则对应的获取3个人脸图像,以及每个人脸图像的位置信息。
需要说明的是,在获取人脸图像和人脸图像的位置信息时,为了保证人脸图像和位置信息一一对应,可以将人脸图像和位置信息成对存储;也可以对人脸图像和其对应的位置信息做相同的标记后进行存储,以区分每个人脸图像和位置信息的关系;还可以采用其他的存储方式,本公开对此不做特殊限定。
在一示例性实施例中,参照图4所示,获取待处理图像中包括的人脸图像和人脸图像对应的位置信息,可以包括以下步骤S410和S420:
在步骤S410中,对待处理图像进行人脸检测,以获取待处理图像中包括的人脸对应的边界框。
其中,对待处理图像进行人脸检测时,可以采用训练好的人脸检测模型进行检测,以得到每个人脸对应的边界框。
在一示例性实施例中,上述边界框可以包括各种形状的边界框。例如,上述边界框可以是人脸轮廓形状的边界框、矩形的边界框、圆形的边界框、椭圆形的边界框等形状的边界框,也可以是不规则形状的边界框,本公开对边界框的形状不做特殊限定。
此外,为了能够让边界框能够更好的表征人脸所在的区域,还可以通过训练好的形状确定模型自动确定边界框的形状,进而更准确的确定待处理图像中人脸所在的区域。
在一示例性实施例中,在对待处理图像进行人脸检测得到人脸对应的边界框之后,由于人脸检测得到的边界框可能无法包围全部的人脸部分,因此可以在基于边界框获取人脸图像之前,先对边界框进行外扩处理,以保证边界框可以包围全部的人脸区域。
例如,在边界框为正方形的边界框时,可以通过对正方形的边界框的四条边向相互远离的方向平移,并延长四条边得到外扩后的正方形。具体平移的距离可以根据正方形的边长与预设比例确定。具体的,假设某一人脸图像的边界框为50×50的正方形边界框,预设比例为1.2,则外扩后边界框为60×60的正方形边界框。在具体外扩时,参照图5所示,可以将50×50的正方形510的边界分别相互相远离的方向平移5个单位,然后将其延迟至互相相交,就可以得到60×60的正方形边界框520;再如,在边界框为不规则形状时,可以以不规则形状的中心为基础,对不规则形状进行放大,以实现外扩的目的。
需要说明的是,在一些实施例中,为了便于对边界框进行外扩,在得到原始边界框后,还可以对原始边界框进行变换得到便于进行外扩的边界框。例如,假设原始边界框为40×60的矩形边界框,为了便于外扩,可以先将其转换为60×60的正方形边界框,再进行外扩。具体的,可以将矩形中长度为60的边分别向相互远离的方向平移10个单位,并将长度为40的边长向两侧延长10个单位,则60×60的正方形边界框;再如,针对不规则形状的边界框,可以将变换为恰好可以包围该不规则形状的正方形边界框。
在步骤S420中,基于边界框在待处理图像中抠取人脸图像,并确定人脸图像对应的位置信息。
在一示例性实施例中,在得到人脸图像的边界框后,以基于边界框在待处理图像中扣取人脸图像。具体的,参照图6,在待处理图像C中确定了边界框1和边界框2之后,可以直接从待处理图像C中扣取边界框1和边界框2所包围的图像区域,得到人脸图像1和人脸图像2。
在一示例性实施例中,在扣取人脸图像的同时,还可以确定该人脸图像对应的位置信息。其中,位置信息用于表示人脸图像在待处理图像中的位置。具体的,上述位置信息可以包括边界框某一点的坐标和边界框的大小、形状等信息。例如,在边界框为正方形时,可以将正方形的任意一个顶点的位置坐标,和正方形的大小作为该边界框所包围的人脸图像的位置信息;再如,在边界框为不规则形状时,可以将不规则形状中心的位置坐标,和不规则形状的形状和大小作为该边界框所包围的人脸图像的位置信息。
在步骤S320中,对待处理图像进行第一处理过程,得到第一中间图像,以及对人脸图像进行第二处理过程,得到第二中间图像。
在一示例性实施例中,在得到人脸图像后,可以分别对人脸图像和待处理图像做不同的处理,以适应人脸图像和非人脸图像各自的特性。具体的,可以对待处理图像进行第一处理过程得到第一中间图像,同时对待处理图像中包括的人脸图像进行第二处理过程得到第二中间图像。
其中,第一处理过程可以包括图像去噪处理、图像细节增强处理和图像动态范围调节处理等多种处理过程中的一种或者多种的组合。例如,可以先对待处理图像进行图像去噪处理,然后基于去噪后的待处理图像进行细节增强处理,得到第一中间图像;再如,在待处理图像细节丰富时,可以只对待处理图像进行去噪处理,直接得到第一中间图像。
同时,第二处理过程则可以包括人脸矫正处理、人脸修复处理、人脸卡通化处理、人脸美妆处理和人脸动态范围调节处理等多种处理过程中的一种或者多种的组合。例如,可以先对人脸图像进行人脸矫正处理,基于矫正后的人脸图像进行人脸修复处理,得到第二中间图像;再如,可以只对人脸图像进行卡通画处理,将人脸图像中包括的人脸转换为卡通人脸,得到第二中间图像。
在一示例性实施例中,在第二处理过程包括人脸矫正处理过程时,可以先对人脸图像进行人脸角度估计,然后根据人脸角度的估计结果,将人脸图像中包括的人脸矫正为正脸,进而得到第二中间图像。
需要说明的是,在一些实施例中,上述第一图像处理过程和第二图像处理过程可以借助于深度神经网络模型或者机器学习模型等人工智能模型实现。例如,上述人脸矫正过程,可以通过训练好的人脸角度估计模型对人脸图像中的人脸进行人脸角度估计,然后根据估计结果将人脸矫正为正脸;再如,对人脸图像进行人脸修复处理时,可以直接通过训练好的人脸修复网络进行修复,进而得到修复后的人脸图像;此外,针对待处理图像进行图像去噪处理、图像细节增强处理以及图像动态范围调节处理时,也可以借助于训练好的图像去噪处理模型、图像增强模型以及动态范围调节模型实现。
在通过借助于深度神经网络模型或者机器学习模型等人工智能模型实现图像处理过程时,若直接对待处理图像全图进行处理,则会存在模型参数量巨大、算法耗时较长,同时可能由于模型的适用范围导致处理效果不佳等问题;反观本公开的实施例,可以针对人脸图像和非人脸图像进行不同的处理,降低了每个处理模型的复杂程度,也减少了模型参数数量,提高了处理效率,综合考虑了图像整体的处理效果;同时,在对人脸图像和非人脸图像进行处理时,可以根据图像的处理需求调整灵活调整所使用的模型,相较于采用统一模型进行处理,可以选择与图像特性更加匹配的模型进行处理,提高了图像处理的效果。
此外,在一些实施例中,还可以通过一个人工智能的机器学习模型或者深度神经网络模型,或者人工设定的映射表等方式,在用户输入图像处理需求后确定图像处理所需使用的图像处理模型,然后自动进行第一处理过程或第二处理过程。通过这种设定可以实现根据需求自动化处理图像的效果。
需要说明的是,上述第一处理过程和第二处理过程可以是作用相同的处理过程,但处理的具体方式存在差别。例如,需要对待处理图像进行修复时,可以依赖两种复杂程度不同的模型分别进行修复,虽然两者均为修复作用,但由于模型的复杂程度不同,修复的结果也存在差别。
在步骤S330中,基于位置信息将第二中间图像与第一中间图像融合,得到目标图像。
在一示例性实施例中,在得到第一中间图像和第二中间图像之后,可以基于人脸图像的位置信息将第二中间图像与第一中间图像融合。具体的,由于第二中间图像为通过人脸图像处理得到的,因此其在待处理图像中的位置与人脸图像在待处理图像中的位置一致。在这种情况下,则可以直接根据人脸图像的位置信息实现将第二中间图像与第一中间图像融合的目的。
在一示例性实施例中,在将第二中间图像与第一中间图像融合时,可以基于人脸图像的位置信息生成权重掩膜,进而通过权重掩膜对第二中间图像和第一中间图像进行加权融合得到目标图像。
进一步地,在基于位置信息生成权重掩膜时,为了使得第一中间图像和第二中间图像的融合边界过渡更加自然,可以先根据位置信息确定一个与第一中间图像形状、大小一致的掩膜,然后通过高斯分布向该掩膜赋予权重。基于高斯分布得到的权重,可以使得掩膜的权重越靠近掩膜中心越大,越远离掩膜中心越小。这种基于高斯分布的掩膜权重,可以使得第二中间图像与第一中间图像的融合边界更加自然,避免融合导致区域间过渡生硬、不自然的情况。
以下以图像修复任务为例,对本公开实施例的技术方案进行详细说明。
参照图7所示,在步骤S701中,在输入待处理图像后,先通过训练好的人脸检测模型对待处理图像进行人脸检测,可以检测出待处理图像中包括的人脸的边界框;在步骤S703中,对人脸检测得到的边界框进行外扩处理;步骤S705中,基于外扩后的边界框在待处理图像中抠取人脸区域的人脸图像,并同时获取人脸图像在待处理图像中的位置信息;在步骤S707中,通过训练好的人脸角度估计模型计算出抠取的每个人脸的角度,并根据计算出的角度将人脸矫正到正脸;在步骤S709中,通过训练好的修复网络对矫正后的人脸图像进行修复,得到第二中间图像;在步骤S711中,通过训练好的去噪模型对待处理图像进行去噪;在步骤S713中,通过训练好的增强模型对去噪后的待处理图像进行细节增强,得到第一中间图像;在步骤S715中,根据人脸图像在待处理图像中的位置信息生成符合高斯分布的权重掩膜,通过权重掩膜对第二中间图像和第一中间图像做加权融合,得到目标图像。
综上,本示例性实施方式中,针对用户关注的人脸区域,由于人脸区域一般较小,可以采用复杂度较高的模型提升修复效果;对非人脸区域,由于尺寸较大,可以采用复杂度较低的模型进行修复,相比于只修复人脸或将人脸和非人脸区域采用统一模型修复,效果更优。
此外,在一示例性实施例中,还可以通过训练好的卡通化模型对人脸区域进行处理,得到人脸被卡通化的第二中间图像;同时在待处理图像中添加滤镜得到第一中间图像,最后将两者融合得到目标图像。
需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
进一步的,参考图8所示,本示例的实施方式中还提供一种图像处理装置800,包括图像获取模块810,图像处理模块820和图像融合模块830。其中:
图像获取模块810可以用于获取待处理图像中包括的人脸图像和人脸图像的位置信息。
图像处理模块820可以用于对待处理图像进行第一处理过程,得到第一中间图像,以及对人脸图像进行第二处理过程,得到第二中间图像。
图像融合模块830可以用于基于位置信息将第二中间图像与第一中间图像融合,得到目标图像。
在一示例性实施例中,图像获取模块810可以用于对待处理图像进行人脸检测,以获取待处理图像中包括的人脸对应的边界框;基于边界框在待处理图像中抠取人脸图像,并确定人脸图像对应的位置信息。
在一示例性实施例中,图像获取模块810可以用于对边界框进行外扩处理,以获取外扩后的边界框。
在一示例性实施例中,图像融合模块830可以用于基于位置信息生成权重掩膜,并根据权重掩膜将第二中间图像与第一中间图像加权融合。
在一示例性实施例中,图像融合模块830可以用于根据位置信息确定掩膜,并通过高斯分布向掩膜赋予权重,得到权重掩膜。
在一示例性实施例中,第二处理过程包括以下一种或多种图像处理过程的组合:人脸矫正处理、人脸修复处理、人脸卡通化处理、人脸美妆处理和人脸动态范围调节处理。
在一示例性实施例中,第一图像处理过程包括以下一种或多种图像处理过程的组合:图像去噪处理、图像细节增强处理和图像动态范围调节处理。
在一示例性实施例中,图像处理模块820可以用于对人脸图像进行人脸角度估计,并根据估计结果将人脸图像包括的人脸矫正为正脸,得到第二中间图像。
上述装置中各模块的具体细节在方法部分实施方式中已经详细说明,未披露的细节内容可以参见方法部分的实施方式内容,因而不再赘述。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
本公开的示例性实施方式还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤,例如可以执行图3或图7中任意一个或多个步骤。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
此外,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
Claims (11)
1.一种图像处理方法,其特征在于,包括:
获取待处理图像中包括的人脸图像和所述人脸图像的位置信息;
对所述待处理图像进行第一处理过程,得到第一中间图像,以及对所述人脸图像进行第二处理过程,得到第二中间图像;
基于所述位置信息将所述第二中间图像与所述第一中间图像融合,得到目标图像。
2.根据权利要求1所述的方法,其特征在于,所述获取待处理图像中包括的人脸图像和所述人脸图像对应的位置信息,包括:
对所述待处理图像进行人脸检测,以获取所述待处理图像中包括的人脸对应的边界框;
基于所述边界框在所述待处理图像中抠取人脸图像,并确定所述人脸图像对应的位置信息。
3.根据权利要求2所述的方法,其特征在于,在所述获取所述待处理图像中包括的人脸对应的边界框之后,所述方法还包括:
对所述边界框进行外扩处理,以获取外扩后的边界框。
4.根据权利要求1所述的方法,其特征在于,所述基于所述位置信息将所述第二中间图像与所述第一中间图像融合,包括:
基于所述位置信息生成权重掩膜,并根据所述权重掩膜将所述第二中间图像与所述第一中间图像加权融合。
5.根据权利要求4所述的方法,其特征在于,所述基于所述位置信息生成权重掩膜,包括:
根据所述位置信息确定所述掩膜,并通过高斯分布向所述掩膜赋予权重,得到权重掩膜。
6.根据权利要求1所述的方法,其特征在于,所述第二处理过程包括以下一种或多种图像处理过程的组合:
人脸矫正处理、人脸修复处理、人脸卡通化处理、人脸美妆处理和人脸动态范围调节处理。
7.根据权利要求6所述的方法,其特征在于,在所述第二处理过程包括人脸矫正处理过程时,所述对所述人脸图像进行第二处理过程,包括:
对所述人脸图像进行人脸角度估计,并根据所述估计结果将所述人脸图像包括的人脸矫正为正脸,得到第二中间图像。
8.根据权利要求1所述的方法,其特征在于,所述第一图像处理过程包括以下一种或多种图像处理过程的组合:
图像去噪处理、图像细节增强处理和图像动态范围调节处理。
9.一种图像处理装置,其特征在于,包括:
图像获取模块,用于获取待处理图像中包括的人脸图像和所述人脸图像的位置信息;
图像处理模块,用于对所述待处理图像进行第一处理过程,得到第一中间图像,以及对所述人脸图像进行第二处理过程,得到第二中间图像;
图像融合模块,用于基于所述位置信息将所述第二中间图像与所述第一中间图像融合,得到目标图像。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的方法。
11.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110265898.5A CN112991208B (zh) | 2021-03-11 | 2021-03-11 | 图像处理方法及装置、计算机可读介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110265898.5A CN112991208B (zh) | 2021-03-11 | 2021-03-11 | 图像处理方法及装置、计算机可读介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112991208A true CN112991208A (zh) | 2021-06-18 |
CN112991208B CN112991208B (zh) | 2024-05-07 |
Family
ID=76336352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110265898.5A Active CN112991208B (zh) | 2021-03-11 | 2021-03-11 | 图像处理方法及装置、计算机可读介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112991208B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627328A (zh) * | 2021-08-10 | 2021-11-09 | 安谋科技(中国)有限公司 | 电子设备及其图像识别方法、片上系统和介质 |
CN113673474A (zh) * | 2021-08-31 | 2021-11-19 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105847728A (zh) * | 2016-04-13 | 2016-08-10 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及终端 |
WO2019200807A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 图像合成装置、方法及计算机可读存储介质 |
CN111163265A (zh) * | 2019-12-31 | 2020-05-15 | 成都旷视金智科技有限公司 | 图像处理方法、装置、移动终端及计算机存储介质 |
CN111489320A (zh) * | 2019-01-29 | 2020-08-04 | 华为技术有限公司 | 图像处理的方法和装置 |
CN111652796A (zh) * | 2020-05-13 | 2020-09-11 | 上海连尚网络科技有限公司 | 图像处理方法、电子设备及计算机可读存储介质 |
CN112116624A (zh) * | 2019-06-21 | 2020-12-22 | 华为技术有限公司 | 一种图像处理方法和电子设备 |
CN112330527A (zh) * | 2020-05-29 | 2021-02-05 | 北京沃东天骏信息技术有限公司 | 图像处理方法、装置、电子设备和介质 |
-
2021
- 2021-03-11 CN CN202110265898.5A patent/CN112991208B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105847728A (zh) * | 2016-04-13 | 2016-08-10 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及终端 |
WO2019200807A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 图像合成装置、方法及计算机可读存储介质 |
CN111489320A (zh) * | 2019-01-29 | 2020-08-04 | 华为技术有限公司 | 图像处理的方法和装置 |
CN112116624A (zh) * | 2019-06-21 | 2020-12-22 | 华为技术有限公司 | 一种图像处理方法和电子设备 |
CN111163265A (zh) * | 2019-12-31 | 2020-05-15 | 成都旷视金智科技有限公司 | 图像处理方法、装置、移动终端及计算机存储介质 |
CN111652796A (zh) * | 2020-05-13 | 2020-09-11 | 上海连尚网络科技有限公司 | 图像处理方法、电子设备及计算机可读存储介质 |
CN112330527A (zh) * | 2020-05-29 | 2021-02-05 | 北京沃东天骏信息技术有限公司 | 图像处理方法、装置、电子设备和介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627328A (zh) * | 2021-08-10 | 2021-11-09 | 安谋科技(中国)有限公司 | 电子设备及其图像识别方法、片上系统和介质 |
CN113673474A (zh) * | 2021-08-31 | 2021-11-19 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN113673474B (zh) * | 2021-08-31 | 2024-01-12 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112991208B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109816589B (zh) | 用于生成漫画风格转换模型的方法和装置 | |
CN109902659B (zh) | 用于处理人体图像的方法和装置 | |
CN111524216B (zh) | 生成三维人脸数据的方法和装置 | |
US20240046557A1 (en) | Method, device, and non-transitory computer-readable storage medium for reconstructing a three-dimensional model | |
CN110490959B (zh) | 三维图像处理方法及装置、虚拟形象生成方法以及电子设备 | |
CN112562019A (zh) | 图像色彩调整方法及装置、计算机可读介质和电子设备 | |
CN112991208B (zh) | 图像处理方法及装置、计算机可读介质和电子设备 | |
CN109754464B (zh) | 用于生成信息的方法和装置 | |
CN112598780B (zh) | 实例对象模型构建方法及装置、可读介质和电子设备 | |
US20230077356A1 (en) | Method, apparatus, electronic device, and storage medium for processing image | |
CN111292427A (zh) | 骨骼位移信息获取方法、装置、设备及存储介质 | |
CN111612897B (zh) | 三维模型的融合方法、装置、设备及可读存储介质 | |
CN111368668B (zh) | 三维手部识别方法、装置、电子设备及存储介质 | |
CN111589138B (zh) | 动作预测方法、装置、设备及存储介质 | |
CN111340865B (zh) | 用于生成图像的方法和装置 | |
CN116012913A (zh) | 模型训练方法、人脸关键点检测方法、介质及装置 | |
CN114049674A (zh) | 一种三维人脸重建方法、装置及存储介质 | |
CN112037305B (zh) | 对图像中的树状组织进行重建的方法、设备及存储介质 | |
CN111447379B (zh) | 生成信息的方法和装置 | |
CN116188742A (zh) | 虚拟对象的控制方法、装置、设备及存储介质 | |
CN115731326A (zh) | 虚拟角色生成方法及装置、计算机可读介质和电子设备 | |
CN116029912A (zh) | 图像处理模型的训练、图像处理方法、装置、设备及介质 | |
US11836839B2 (en) | Method for generating animation figure, electronic device and storage medium | |
CN117115321B (zh) | 虚拟人物眼睛姿态的调整方法、装置、设备及存储介质 | |
CN114049417B (zh) | 虚拟角色图像的生成方法、装置、可读介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |