CN117011324A - 图像处理方法、装置、电子设备及存储介质 - Google Patents
图像处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117011324A CN117011324A CN202211192854.5A CN202211192854A CN117011324A CN 117011324 A CN117011324 A CN 117011324A CN 202211192854 A CN202211192854 A CN 202211192854A CN 117011324 A CN117011324 A CN 117011324A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- spherical
- background image
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 59
- 230000004927 fusion Effects 0.000 claims abstract description 57
- 238000012545 processing Methods 0.000 claims abstract description 36
- 238000007499 fusion processing Methods 0.000 claims abstract description 22
- 230000006870 function Effects 0.000 claims description 59
- 230000000007 visual effect Effects 0.000 claims description 37
- 238000005286 illumination Methods 0.000 claims description 33
- 230000011218 segmentation Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 19
- 238000013507 mapping Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 23
- 238000013473 artificial intelligence Methods 0.000 abstract description 16
- 238000009877 rendering Methods 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
Abstract
本申请公开了一种图像处理方法、装置、电子设备及存储介质。本发明实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。该方法包括:若目标图像中存在目标对象,对目标图像进行分割,得到包括目标对象的前景区域;根据前景区域中每个像素点的像素值,从预置查找表中确定对应每个像素点的目标调整像素值;将前景区域中每个像素点的像素值调整至该像素点对应的目标调整像素值,得到调整后的前景区域;对调整后的前景区域与目标背景图像进行融合处理,得到融合图像。在本申请中,不需要根据目标图像渲染出阴影区域以及非阴影区域,省去了大量的渲染时间,从而提高了前景区域的处理效率,进而提高了融合图像的获得效率。
Description
技术领域
本申请涉及互联网信息处理技术领域,更具体地,涉及一种图像处理方法、装置、电子设备及存储介质。
背景技术
人像背景融合是指利用计算机视觉技术,将图像中的人像融合到指定的背景图像中,以得到融合图像,且背景图像中的人像的光照与背景图像的光照是一致的。
目前,可以获取包括人像图像、该人像图像的光照条件以及该人像图像的深度图,并根据深度图和光照条件,渲染出人像图像的阴影区域和非阴影区域,然后通过阴影区域和非阴影区域对该人像图像进行重打光处理,得到重打光图像,以实现对人像图像的背景调整。但是,采用该方法对人像图像的处理效率较低,导致生成融合图像的效率较低。
发明内容
有鉴于此,本申请实施例提出了一种图像处理方法、装置、电子设备及存储介质。
第一方面,本申请实施例提供了一种图像处理方法,方法包括:若目标图像中存在目标对象,对目标图像进行分割,得到包括目标对象的前景区域;根据前景区域中每个像素点的像素值,从预置查找表中确定对应每个像素点的目标调整像素值,预置查找表包括不同像素值对应的调整像素值,预置查找表是对待融合的目标背景图像进行光照估计后获得的;将前景区域中每个像素点的像素值调整至该像素点对应的目标调整像素值,得到调整后的前景区域;将目标背景图像作为目标图像的背景,对调整后的前景区域与目标背景图像进行融合处理,得到融合图像。
第二方面,本申请实施例提供了一种图像处理装置,装置包括:分割模块,用于若目标图像中存在目标对象,对目标图像进行分割,得到包括目标对象的前景区域;确定模块,用于根据前景区域中每个像素点的像素值,从预置查找表中确定对应每个像素点的目标调整像素值,预置查找表包括不同像素值对应的调整像素值,预置查找表是对待融合的目标背景图像进行光照估计后获得的;调整模块,用于将前景区域中每个像素点的像素值调整至该像素点对应的目标调整像素值,得到调整后的前景区域;融合模块,用于将目标背景图像作为目标图像的背景,对调整后的前景区域与目标背景图像进行融合处理,得到融合图像。
可选地,融合模块,还用于根据目标图像,获取对应前景区域的可视化轮廓图像;对可视化轮廓图像进行高斯模糊处理,得到对应可视化轮廓图像的第一模糊参数;根据可视化轮廓图像的模糊参数、目标背景图像以及前景区域,得到融合图像。
可选地,可视化轮廓图像的模糊参数包括可视化轮廓图像中每个像素点对应的模糊参数;融合模块,还用于根据可视化轮廓图像中每个像素点对应的模糊参数,确定目标背景图像每个像素点的模糊参数以及前景区域中每个像素点的模糊参数;根据目标背景图像中每个像素点的像素值与该像素点对应的模糊参数的乘积,对该像素点的像素值进行替换,得到对应目标背景图像的预处理背景图像;根据前景区域中每个像素点的像素值与该像素点对应的模糊参数的乘积,对该像素点的像素值进行替换,得到对应前景区域的预处理前景区域;对预处理背景图像以及预处理前景区域进行融合处理,得到融合图像。
可选地,装置还包括查找表获得模块,用于获取目标背景图像;对目标背景图像进行球面映射,得到球面背景图像;根据球面背景图像以及预设球谐基函数,确定球谐基参数;根据球谐基参数以及预设球谐基函数,得到预置查找表。
可选地,查找表获得模块,还用于构建球面模型,球面模型的球面点的数量与目标背景图像的像素点的数量相同;从球面模型中确定与目标背景图像中每个像素点对应的球面点;将每个球面点的像素值调整为目标背景图像中与该球面点对应的像素点的像素值,得到球面背景图像。
可选地,查找表获得模块,还用于获取目标背景图像中每个像素点的坐标信息、目标背景图像的宽度以及目标背景图像的高度;根据目标背景图像中每个像素点的坐标信息、目标背景图像的宽度以及目标背景图像的高度,确定对应目标背景图像中每个像素点的偏航角以及俯仰角;根据目标背景图像中每个像素点的偏航角以及俯仰角,从球面模型中确定对应该像素点的球面点。
可选地,查找表获得模块,还用于通过预设球谐基函数,确定球面背景图像中每个球面点的函数运算结果;计算球面背景图像中每个球面点的函数运算结果与该球面点的像素值的乘积,作为该球面点的第一乘积结果;对球面背景图像中所有球面点的第一乘积结果求和,得到球谐基参数。
可选地,查找表获得模块,还用于获取自然颜色查找表;根据预设球谐基函数、球谐基参数以及自然颜色查找表,得到预置查找表。
可选地,自然颜色查找表包括多个像素值对应的调整像素值;查找表获得模块,还用于获取对应目标背景图像的法向向量;获取球面背景图像中每个球面点分别对应的方向向量;通过预设球谐基函数,确定球面背景图像中每个球面点的运算结果;计算球面背景图像中每个球面点的运算结果、该球面点的方向向量、球谐基参数以及法向向量的乘积,作为该球面点的第二乘积结果;对球面背景图像中所有球面点的第二乘积结果求和,得到求和结果;计算求和结果与自然颜色查找表中每个像素值的调整像素值的乘积,作为该像素值的预置调整像素值;根据自然颜色查找表中每个像素值以及该像素值对应的预置调整像素值,得到预置查找表。
可选地,分割模块,还用于若目标图像中存在目标对象,通过预置的语义分割网络对所述目标图像进行分割,得到包括所述目标对象的前景区域。
第三方面,本申请实施例提供了一种电子设备,包括处理器以及存储器;存储器存储有计算机程序,处理器执行计算机程序时实现上述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法。
第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法。
本申请实施例提供的一种图像处理方法、装置、电子设备及计算机可读存储介质,通过前景区域中每个像素点的像素值,直接从预置查找表中确定目标调整像素值,并将前景区域中每个所述像素点的像素值调整至对应的目标调整像素值,得到调整后的前景区域,然后对调整后的前景区域与目标背景图像进行融合处理,得到融合图像,并不需要根据目标图像的深度图和光照条件渲染出阴影区域以及非阴影区域,省去了大量的渲染时间,从而提高了前景区域的处理效率,进而提高了融合图像的获得效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例提出的一种系统架构示意图;
图2示出了本申请一个实施例提出的一种图像处理方法的流程图;
图3示出了本申请实施例中一种目标图像的示意图;
图4示出了图3中的目标图像对应的前景区域的示意图;
图5示出了图3中的目标图像对应的背景区域的示意图;
图6示出了本申请又一个实施例提出的一种图像处理方法的流程图;
图7示出了图3中的目标图像对应的可视化轮廓图像的示意图;
图8示出了本申请再一个实施例提出的一种图像处理方法的流程图;
图9示出了本申请实施例中一种目标背景图像的示意图;
图10示出了图9中的目标背景图像对应的球面背景图像的示意图;
图11示出了本申请实施例中图像处理过程的示意图;
图12示出了本申请实施例中又一种目标背景图像的示意图;
图13示出了本申请实施例中又一种目标图像的示意图;
图14示出了图13中的目标图像对应的前景区域的示意图;
图15示出了图12的目标背景图像与图13的目标图像融合后的融合图像的示意图;
图16示出了本申请一个实施例提出的一种图像处理装置的框图;
图17示出了本申请一个实施例提出的一种电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。根据本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在以下的描述中,所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
需要说明的是:在本文中提及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
针对背景技术的问题,电子设备可以对原人像图像进行本征分解得到材质信息,利用渲染技术获得指定光照下的阴影区域和非阴影区域,原人像图像、阴影区域和非阴影区域三者结合得到最终的融合图像,该融合图像相较于原人像图像,背景发生改变。但是,该方法需要大量的时间和资源来渲染指定光照下的阴影区域和非阴影区域,导致渲染时长较大,融合图像的获得效率较低。
基于此,发明人提出了一种图像处理方法、装置、电子设备及计算机可读存储介质,通过前景区域中每个像素点的像素值,直接从预置查找表中确定目标调整像素值,并将前景区域中每个所述像素点的像素值调整至对应的目标调整像素值,得到调整后的前景区域,然后对调整后的前景区域与目标背景图像进行融合处理,得到融合图像,并不需要根据目标图像的深度图和光照条件渲染出阴影区域以及非阴影区域,省去了大量的渲染时间,从而提高了前景区域的处理效率,进而提高了融合图像的获得效率。
本申请实施例提供的方案涉及人工智能的语义分割、图像融合等技术,具体通过如下实施例进行说明:
本申请中提供的图像处理方法可以应用于如图1所示的系统中,该系统可以包括服务器10以及用户终端20。
其中,系统中的服务器10可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据、人工智能、智能交通、辅助驾驶平台等基础云计算服务的云服务器。
系统中的用户终端20可以是智能手机、平板电脑、笔记本电脑、台式计算机、游戏控制台、车载设备、飞行器、可穿戴设备以及电视等,但并不局限于此。
为实现用户终端20之间的即时通信,用户终端20和服务器10可以通过网络连接。网络可以是广域网或者局域网,又或者是二者的组合。
在本申请实施例中,可以通过用户终端20发送获取到的待融合的目标背景图像,并将目标背景图像发送至服务器10,由服务器10对目标背景图像进行光照估计,获得预置查找表,并由服务器10将预置查找表以及目标背景图像返回至用户终端20,由用户终端20根据预置查找表以及目标背景图像,对目标图像进行处理,得到融合图像。
目标背景图像可以是指用作背景的图像,目标背景图像可以是建筑物、自然景观、室内等场景对应的拍摄图像,目标背景图像还可以是人工合成的用作背景的图像。目标图像可以是指待进行处理的图像,目标图像可以包括目标对象以及目标对象的背景区域,目标图像的背景区域与目标背景图像是不同的。目标对象可以是指人、物品或动物等,例如,目标对象为猫、人或者汽车等。
在另一实施方式中,可以通过用户终端20获取待融合的目标背景图像,由用户终端20对目标背景图像进行光照估计,获得预置查找表,然后由用户终端20根据预置查找表以及目标背景图像,对目标图像进行处理,得到融合图像。
在又一实施方式中,可以通过服务器10获取待融合的目标背景图像(或者通过用户终端20将获取到的待融合的目标背景图像发送至服务器10),并由服务器10对目标背景图像进行光照估计,获得预置查找表;当用户终端20获取到目标图像时,将目标图像发送至服务器10,由服务器10根据预置查找表以及目标背景图像,对目标图像进行处理,得到融合图像,并将融合图像反馈至用户终端20。
为了方便表述,下述各个实施例中,以图像处理方法由电子设备执行为例进行说明。
下面将结合附图,对本申请实施例中的方案进行详细的说明。
请参阅图2,图2示出了本申请一个实施例提出的一种图像处理方法的流程图,该方法可以应用于电子设备,该电子设备可以为图1所示的用户终端20或服务器10,该方法包括:
S110、若目标图像中存在目标对象,对目标图像进行分割,得到包括目标对象的前景区域。
在本实施例中,目标图像可以是单一的图像,也可以是从视频信息中确定的视频帧,例如,视频信息的时长为60s,每1s包括40帧图像,则目标图像可以是指该视频信息包括的2400帧图像。
针对获取的每个目标图像,确定图像中是否存在目标对象。可以是通过语义分割模型对目标图像进行识别,以确定目标图像中是否存在目标对象,语义分割模型可以是根据包括目标对象的样本图像,对神经网络模型进行训练获得的,语义分割模型也可以是通用的DeeLab V3、FCN、UNet、SegNet等模型。
若目标图像中存在目标对象,则对目标图像进行分割,得到包括目标对象的前景区域以及不包括目标对象的背景区域。可以是通过预置的语义分割网络对目标图像进行分割,得到包括目标对象的前景区域以及不包括目标对象的背景区域,其中,预置的语义分割网络可以是指上述语义分割模型。
示例性的,目标对象为用户A,目标图像为用户A在山谷B中的拍摄图像,如图3所示,此时,通过语义分割网络对目标图像进行分割,得到仅包括用户A的前景区域以及不包括用户A的背景区域,其中,前景区域如图4所示,背景区域如图5所示。
S120、根据前景区域中每个像素点的像素值,从预置查找表中确定对应每个像素点的目标调整像素值,预置查找表包括不同像素值对应的调整像素值,预置查找表是对待融合的目标背景图像进行光照估计后获得的。
可以对目标背景图像进行光照估计,获得预置查找表,光照估计可以是指将目标背景图像映射为球面背景图像,在对球面背景图像进行处理,得到预置查找表。
预置查找表可以包括多个像素值以及多个像素值分别对应的调整像素值,例如,预置查找表包括0-255共256个像素值,每个像素值对应一个调整像素值。可以根据前景区域中每个像素点的像素值,从预置查找表中确定与该像素点对应的调整像素值作为目标调整像素值。例如,像素点B的像素值为b1,预设查找表中像素值b1对应的调整像素值为b2,则像素点B的目标调整像素值为b2。
作为一种实施方式,目标图像以及目标背景图像均为RGB图像,每个像素点由R像素(红色像素)、G像素(绿色像素)以及B像素(蓝色像素)构成,每个像素点的像素值包括R像素、G像素以及B像素分别对应的像素值,则预设查找表中,包括每个R像素对应的调整像素值、每个G像素对应的调整像素值以及每个B像素对应的调整像素值,因此,确定的目标调整像素值包括R像素、G像素以及B像素分别对应的目标调整像素值。
例如,像素点c1的R像素的像素值为d1、G像素的像素值为d2、B像素的像素值为d3,在预置查找表中,R像素的像素值d1对应的调整像素值为e1、G像素的像素值d2对应的调整像素值为e2、B像素的像素值d3对应的调整像素值为e3,则像素点c1的目标调整像素值分别为R像素的e1、G像素的e2以及B像素的e3。
S130、将前景区域中每个像素点的像素值调整至该像素点对应的目标调整像素值,得到调整后的前景区域。
针对前景区域中每个像素点,将该像素点的像素值调整为对应的目标调整像素值,遍历前景区域中全部的像素点,得到调整后的前景区域,调整后的前景区域的光照条件与目标背景图像的光照调条件匹配,从而实现了对前景区域的重打光处理。
例如,前景区域包括5000个像素点,每个像素点包括R像素、G像素以及B像素,预置查找表包括每个R像素对应的调整像素值、每个G像素对应的调整像素值以及每个B像素对应的调整像素值;针对其中的像素点F,根据该像素点的R像素的像素值,确定对应的R像素目标调整像素值f1,根据该像素点的G像素的像素值,确定对应的G像素目标调整像素值f2,根据该像素点的B像素的像素值,确定对应的B像素目标调整像素值f3,然后将该像素点的R像素的像素值调整为f1,将该像素点的G像素的像素值调整为f2,将该像素点的B像素的像素值调整为f3,得到该像素点F对应的调整后的像素值,遍历该前景区域的5000个像素点,得到调整后的前景区域。
S140、将目标背景图像作为目标图像的背景,对调整后的前景区域与目标背景图像进行融合处理,得到融合图像。
对调整后的前景区域与目标背景图像进行融合处理,是指将调整后的前景区域直接叠加于目标背景图像之上,且图像叠加部分的像素点的像素值取调整后的前景区域的像素值,图像未叠加部分的像素点的像素值取目标背景图像的像素值。
作为一种实施方式,在S140之前,还可以接收针对目标对象的前景区域的设置位置信息,根据设置位置信息确定调整后的前景区域在目标背景图像中的叠加位置信息,根据叠加位置信息对调整后的前景区域与目标背景图像进行融合处理,以使融合图像中,目标对象处于叠加位置信息对应的位置处。
例如,设置位置信息为目标背景图像的右上角,则根据设置位置信息,对调整后的前景区域与目标背景图像进行融合处理,得到融合图像,该融合图像中目标对象处于融合图像的右上角。
在本实施例中,通过前景区域中每个像素点的像素值,直接从预置查找表中确定目标调整像素值,并将前景区域中每个所述像素点的像素值调整至对应的目标调整像素值,得到调整后的前景区域,然后对调整后的前景区域与目标背景图像进行融合处理,得到融合图像,并不需要根据目标图像的深度图和光照条件渲染出阴影区域以及非阴影区域,省去了大量的渲染时间,从而提高了前景区域的处理效率,进而提高了融合图像的获得效率。
相较于现有的人像重打光技术,本申请不依赖目标图像的深度信息,从而避免对深度信息的处理导致的噪声较大的情况发生,从而降低了噪声对融合图像的影响。也不需要人工设计一些环境光照贴图,减少了人工处理流程,提高了融合图像的获得效率,同时,省去了人工设计环境光照贴图的成本,降低了融合图像的获得成本。
请参阅图6,图6示出了本申请又一个实施例提出的一种图像处理方法的流程图,该方法可以应用于电子设备,该电子设备可以为图1所示的用户终端20或服务器10,该方法包括:
S210、若目标图像中存在目标对象,对目标图像进行分割,得到包括目标对象的前景区域。
S220、根据前景区域中每个像素点的像素值,从预置查找表中确定对应每个像素点的目标调整像素值,预置查找表包括不同像素值对应的调整像素值,预置查找表是对待融合的目标背景图像进行光照估计后获得的。
S230、将前景区域中每个像素点的像素值调整至该像素点对应的目标调整像素值,得到调整后的前景区域。
其中,S210-S230的描述参照上文S110-S130的描述,此处不再赘述。
S240、根据目标图像,获取对应前景区域的可视化轮廓图像;并对可视化轮廓图像进行高斯模糊处理,得到对应可视化轮廓图像的模糊参数。
可视化轮廓图像可以是以目标对象的轮廓线为分割线,将目标图像分割为前景区域以及背景区域,且前景区域的所有像素点的像素值为固定值x(例如255),背景区域的所有像素点的像素值为y(0),且x和y不同。
例如,目标图像如图3所示,目标对象为人,图3中的目标图像对应的前景区域如图4所示,背景区域如图5所示,可视化轮廓图像为图7所示。
可以是通过上述语义分割模型,对目标图像进行处理,得到包括目标对象的前景区域以及可视化轮廓图像。
对前景区域对应的可视化轮廓图像进行高斯模糊处理,得到可视化轮廓图像的模糊参数,可视化轮廓图像的模糊参数可以包括可视化轮廓图像中每个像素点对应的模糊参数。可视化轮廓图像的前景部分(与前景区域对应的部分区域)中远离轮廓线的每个像素点的模糊参数通常为1,可视化轮廓图像的背景部分(与背景区域对应的部分区域)中远离轮廓线的每个像素点的模糊参数通常为0,可视化轮廓图像的靠近轮廓线的像素点的模糊参数通常是0-1之间的值。
S250、根据可视化轮廓图像的模糊参数、目标背景图像以及前景区域,得到融合图像。
可以根据可视化轮廓图像的模糊参数,对目标背景图像进行处理,得到处理后的目标背景图像,并根据可视化轮廓图像的模糊参数对前景区域进行处理,得到处理后的前景区域;再对处理后的目标背景图像与处理后的前景区域进行融合处理,得到融合图像,其中,对处理后的目标背景图像与处理后的前景区域进行融合处理的过程与上文S140的融合处理过程类似,不再赘述。
作为一种实施方式,S250包括:根据可视化轮廓图像中每个像素点对应的模糊参数,确定目标背景图像每个像素点的模糊参数以及前景区域中每个像素点的模糊参数;根据目标背景图像中每个像素点的像素值与该像素点对应的模糊参数的乘积,对该像素点的像素值进行替换,得到对应目标背景图像的预处理背景图像;根据前景区域中每个像素点的像素值与该像素点对应的模糊参数的乘积,对该像素点的像素值进行替换,得到对应前景区域的预处理前景区域;对预处理背景图像以及预处理前景区域进行融合处理,得到融合图像。
可视化轮廓图像中前景部分的像素点与前景区域中的像素点是一一对应的,将可视化轮廓图像中前景部分每个像素点的模糊参数,作为前景区域中与该像素点对应的像素点的模糊参数。
可以根据前景区域的设置位置信息,从目标背景图像确定与背景区域对应的目标背景区域。
若目标背景图像与目标图像尺寸相同,则可视化轮廓图像中背景部分的像素点与目标背景区域中的像素点是一一对应的,则将固定值(例如1)与可视化轮廓图像中背景部分每个像素点的模糊参数的差,作为目标背景区域中与背景部分中该像素点对应的像素点的模糊参数。
若目标背景图像大于目标图像尺寸的图像,则从目标背景区域中确定与可视化轮廓图像中背景部分的像素点一一对应的像素点,则将固定值(例如1)与可视化轮廓图像中前景部分每个像素点的模糊参数的差,作为目标背景区域中与背景部分中该像素点对应的像素点的模糊参数,目标背景区域中未与可视化轮廓图像中背景部分的像素点对应的像素点的模糊参数确定为1。
若目标背景图像小于目标图像尺寸的图像,则从目标背景区域中确定与可视化轮廓图像中背景部分的像素点一一对应的像素点,则将固定值(例如1)与可视化轮廓图像中前景部分每个像素点的模糊参数的差,作为目标背景区域中与背景部分中该像素点对应的像素点的模糊参数。
上述通过可视化轮廓图像的模糊参数,对目标背景图像以及前景区域进行处理的过程可以表述为公式一,公式一如下:
公式一为:
I=(1-α)Ibg+αIrelight
其中,Ibg为目标背景图像,Irelight为前景区域,α为可视化轮廓图像的模糊参数,I为融合图像。
根据前景区域中每个像素点的像素值与该像素点对应的模糊参数的乘积,对该像素点的像素值进行替换,得到对应前景区域的预处理前景区域;根据目标背景图像中每个像素点的像素值与该像素点对应的模糊参数的乘积,对该像素点的像素值进行替换,得到对应目标背景图像的预处理背景图像;然后对预处理背景图像以及预处理前景区域进行融合处理,得到融合图像,其中对预处理背景图像以及预处理前景区域进行融合处理的过程与S140中融合处理的过程类似,不再赘述。
在本实施例中,通过可视化轮廓图像的第一模糊参数,对目标背景图像以及前景区域进行处理,实现了目标对象的前景区域的边缘模糊处理,使得融合图像中前景部分与背景部分之间的过渡更加和谐,消除了融合图像中前景部分与背景部分之间的割裂感,提高了融合图像的融合效果。
请参阅图8,图8示出了本申请再一个实施例提出的一种图像处理方法的流程图,该方法可以应用于电子设备,该电子设备可以为图1所示的用户终端20或服务器10,该方法包括:
S310、获取目标背景图像;对目标背景图像进行球面映射,得到球面背景图像。
目标背景图像是平面图像,对目标背景图像进行球面映射可以是指将目标背景图像映射为球面的图像,该球面的图像作为球面背景图像。
作为一种实施方式,S310包括:获取目标背景图像;构建球面模型,球面模型的球面点的数量与目标背景图像的像素点的数量相同;从球面模型中确定与目标背景图像中每个像素点对应的球面点;将每个球面点的像素值调整为目标背景图像中与该球面点对应的像素点的像素值,得到球面背景图像。
例如,目标背景图像包括1000个像素点,构建的球面模型包括1000个球面点,然后从球面模型中确定与目标背景图像中每个像素点对应的球面点,以确定目标背景图像中像素点与球面模型中球面点的一一对应关系,根据该一一对应关系,将每个球面点的像素值调整为目标背景图像中与该球面点对应的像素点的像素值,得到球面背景图像。如图9所示,目标背景图像为平面图像,将其映射为球面的图像,得到如图10所示的球面背景图像。
从球面模型中确定与目标背景图像中每个像素点对应的球面点,包括:获取目标背景图像中每个像素点的坐标信息、目标背景图像的宽度以及目标背景图像的高度;根据目标背景图像中每个像素点的坐标信息、目标背景图像的宽度以及目标背景图像的高度,确定对应目标背景图像中每个像素点的偏航角以及俯仰角;根据目标背景图像中每个像素点的偏航角以及俯仰角,从球面模型中确定对应该像素点的球面点。
其中,从球面模型中确定与目标背景图像中每个像素点对应的球面点的过程可以表述为公式二,公式二为:
其中,xp和yp分别为目标背景图像中第p个像素点的横坐标以及纵坐标,θq以及φq分别为球面模型中第q个球面点的俯仰角和偏航角,第q个球面点为与第p个像素点对应的球面点,w为背景图像的宽度,h为背景图像的高度。
根据上述公式二可以确定对应背景图像中第p个像素点对应的θq以及φq,将θq以及φq所代表的球面点作为对应第p个像素点的球面点。
S320、根据球面背景图像以及预设球谐基函数,确定球谐基参数。
通过预设球谐基函数对球面背景图像进行处理,得到球谐基参数。其中,在本申请中,预设球谐基函数如下:
其中,m为预设球谐基函数的阶,l为预设球谐基函数的度,θ以及φ分别为球面背景图像中任意一个球面点的俯仰角和偏航角。在本申请中,l取值0、1以及2,m取值为[-l,l]。也即,在本实施例中预设球谐基函数包括9组球谐基函数。
作为一种实施方式,S320可以包括:通过预设球谐基函数,确定球面背景图像中每个球面点的函数运算结果;计算球面背景图像中每个球面点的函数运算结果与该球面点的像素值的乘积,作为该球面点的第一乘积结果;对球面背景图像中所有球面点的第一乘积结果求和,得到球谐基参数。
上述确定球谐基参数的过程可以表达为公式三,公式三如下:
/>
其中,yl,m为球谐基参数,θi为球面背景图像中第i个球面点的俯仰角,φi为第i个球面点的偏航角,N为球面背景图像中球面点总数,Pl,m为预设球谐基函数,Pl,m(θi,φi)为预设球谐基函数对第i个球面点的运算结果,m为预设球谐基函数的阶,l为预设球谐基函数的度,Isphere(θi,φi)为第i个球面点的像素值。
S330、据球谐基参数以及预设球谐基函数,得到预置查找表。
得到球谐基参数之后,通过球谐基参数以及预设球谐基函数,得到预置查找表,其中,可以首先获取自然颜色查找表,然后根据预设球谐基函数、球谐基参数以及自然颜色查找表,得到预置查找表。
其中,自然颜色查找表是指自然状态的颜色查找表,自然颜色查找表包括多个像素值以及多个像素值各自对应的调整像素值,在自然颜色查找表中,任意一个像素值对应的调整像素值为该像素值本身,例如,自然颜色查找表中像素值g1对应的调整像素值也为g1。
可以理解的是,若目标图像以及目标背景图像均为RGB图像,每个像素点由R像素、G像素以及B像素构成,自然颜色查找表包括每个R像素对应的调整像素值、每个G像素对应的调整像素值以及每个B像素对应的调整像素值。
作为一种实施方式,根据预设球谐基函数、球谐基参数以及自然颜色查找表,得到预置查找表,包括:获取对应目标背景图像的法向向量;获取球面背景图像中每个球面点分别对应的方向向量;通过预设球谐基函数,确定球面背景图像中每个球面点的运算结果;计算球面背景图像中每个球面点的运算结果、该球面点的方向向量、球谐基参数以及法向向量的乘积,作为该球面点的第二乘积结果;对球面背景图像中所有球面点的第二乘积结果求和,得到求和结果;计算求和结果与自然颜色查找表中每个像素值的调整像素值的乘积,作为该像素值的预置调整像素值;根据自然颜色查找表中每个像素值以及该像素值对应的预置调整像素值,得到预置查找表。
上述预置查找表的确定过程可以表达为公式四,公式四如下:
其中,yl,m为球谐基参数,θi为球面背景图像中第i个球面点的俯仰角,φi为第i个球面点的偏航角,N为球面背景图像中球面点总数,Pl,m为预设球谐基函数,Pl,m(θi,φi)为预设球谐基函数对第i个球面点的运算结果,l为预设球谐基函数的度,n为法向向量(在本申请中,n可以为(0,0,1)),ωi为第i个球面点的方向向量,为自然查找表,ILUT为预设查找表。
S340、若目标图像中存在目标对象,对目标图像进行分割,得到包括目标对象的前景区域。
S350、根据前景区域中每个像素点的像素值,从预置查找表中确定对应每个像素点的目标调整像素值,预置查找表包括不同像素值对应的调整像素值,预置查找表是对待融合的目标背景图像进行光照估计后获得的。
S360、将前景区域中每个像素点的像素值调整至该像素点对应的目标调整像素值,得到调整后的前景区域。
S370、将目标背景图像作为目标图像的背景,对调整后的前景区域与目标背景图像进行融合处理,得到融合图像。
其中,S340-S370的描述参照上文S110-S140的描述,不再赘述。
在本实施例中,根据预设球谐基函数对球面背景图像处理,得到球谐基参数,并根据预设球谐基函数、球谐基参数以及自然颜色查找表,得到预置查找表,预置查找表可以准确的反映以目标背景图像做背景是,各个像素值对应的调整像素值,使得根据预置查找表得到的调整后的前景区域与目标背景图像的光照条件更加契合,提高了融合图像的融合效果。
本实施例中,以RGB目标背景图像出发,提出一种基于RGB图像的球谐光照估计的自动化方法,得到高质量复杂光照的数据,从而使得预置查找表更加契合目标背景图像的光照条件,使得获得的融合图像更加准确。
为了便于理解本申请实施例提供的方案,下面将结合一个示例性场景以及附图对本申请的图像处理方法进行描述,在该示例场景中,目标对象为戴眼镜的人。
如图11所示,在该示例场景中通过光照估计模块以及人像背景融合模块实现本申请的图像处理方法,其中,光照估计模块用于获取预置LUT(也即上文实施例的预置查找表),人像背景融合模块用于获得融合图像。
1、光照估计模块的处理过程
获取背景图像:获取山谷M对应的图像作为目标背景图像m1,目标背景图像如图12所示。
光照参数估计:构建球面模型,通过上述公式二在球面模型中确定目标背景图像中每个像素点对应的球面点;再将每个球面点的像素值调整为与该球面点对应的像素点的像素值,得到球面背景图像m2,球面背景图像m2中的球面点与背景图像中m1中的像素点一一对应;之后,通过预设球谐基函数以及公式三,对球面背景图像m2进行处理,得到球谐基参数,该球谐基参数作为山谷M对应的光照参数。
球谐光LUT渲染:首先获取自然颜色查找表、背景图像m1的法向向量以及球面背景图像m2中每个球面点的方向向量,然后根据公式四、预设球谐基函数、球谐基参数、自然颜色查找表、方向向量以及法向向量,得到预置查找表,该预置查找表即为渲染得到的预置LUT。
2、人像背景融合模块的处理过程
获取人像视频流:获取待处理的人像视频流NL;
语义分割:通过预置的语义分割网络对人像视频流NL中存在人像的视频帧N(可以是存在人像的每一个视频帧,视频帧如图13所示)进行语义分割,得到分割后的人像区域n1(人像区域为戴眼镜的人对应的人像区域,该人像区域即为上文实施例中分割出前景区域,人像区域n1如图14所示);
LUT变换:根据人像区域n1中每个像素点的像素值,从预置LUT中确定对应人像区域n1中每个像素点的目标调整像素值,并将人像区域n1中每个像素点的像素值调整至该像素点对应的目标调整像素值,得到调整后的人像区域n2;
背景融合:对人像区域n1对应的可视化轮廓图像n3进行高斯模糊处理,得到n3对应的第一模糊参数,根据第一模糊参数、公式一、目标背景图像m1以及人像区域n2,得到融合图像,融合图像如图15所示,该融合图像作为最终的人像融合结果。
针对人像视频流中存在人像的每个视频帧均执行上述过程,得到各个视频帧对应的人像融合结果,以获得对应人像视频流的背景替换视频流,在背景替换视频流中,存在人像的视频帧的均以背景图像m1作为背景。
请参阅图16,图16示出了本申请一个实施例提出的一种图像处理装置的框图,电子设备可以是图1中的用户终端20或服务器10,装置1100包括:
分割模块1110,用于若目标图像中存在目标对象,对目标图像进行分割,得到包括目标对象的前景区域;
确定模块1120,用于根据前景区域中每个像素点的像素值,从预置查找表中确定对应每个像素点的目标调整像素值,预置查找表包括不同像素值对应的调整像素值,预置查找表是对待融合的目标背景图像进行光照估计后获得的;
调整模块1130,用于将前景区域中每个像素点的像素值调整至该像素点对应的目标调整像素值,得到调整后的前景区域;
融合模块1140,用于将目标背景图像作为目标图像的背景,对调整后的前景区域与目标背景图像进行融合处理,得到融合图像。
可选地,融合模块1140,还用于根据目标图像,获取对应前景区域的可视化轮廓图像;对可视化轮廓图像进行高斯模糊处理,得到对应可视化轮廓图像的第一模糊参数;根据可视化轮廓图像的模糊参数、目标背景图像以及前景区域,得到融合图像。
可选地,可视化轮廓图像的模糊参数包括可视化轮廓图像中每个像素点对应的模糊参数;融合模块1140,还用于根据可视化轮廓图像中每个像素点对应的模糊参数,确定目标背景图像每个像素点的模糊参数以及前景区域中每个像素点的模糊参数;根据目标背景图像中每个像素点的像素值与该像素点对应的模糊参数的乘积,对该像素点的像素值进行替换,得到对应目标背景图像的预处理背景图像;根据前景区域中每个像素点的像素值与该像素点对应的模糊参数的乘积,对该像素点的像素值进行替换,得到对应前景区域的预处理前景区域;对预处理背景图像以及预处理前景区域进行融合处理,得到融合图像。
可选地,装置还包括查找表获得模块,用于获取目标背景图像;对目标背景图像进行球面映射,得到球面背景图像;根据球面背景图像以及预设球谐基函数,确定球谐基参数;根据球谐基参数以及预设球谐基函数,得到预置查找表。
可选地,查找表获得模块,还用于构建球面模型,球面模型的球面点的数量与目标背景图像的像素点的数量相同;从球面模型中确定与目标背景图像中每个像素点对应的球面点;将每个球面点的像素值调整为目标背景图像中与该球面点对应的像素点的像素值,得到球面背景图像。
可选地,查找表获得模块,还用于获取目标背景图像中每个像素点的坐标信息、目标背景图像的宽度以及目标背景图像的高度;根据目标背景图像中每个像素点的坐标信息、目标背景图像的宽度以及目标背景图像的高度,确定对应目标背景图像中每个像素点的偏航角以及俯仰角;根据目标背景图像中每个像素点的偏航角以及俯仰角,从球面模型中确定对应该像素点的球面点。
可选地,查找表获得模块,还用于通过预设球谐基函数,确定球面背景图像中每个球面点的函数运算结果;计算球面背景图像中每个球面点的函数运算结果与该球面点的像素值的乘积,作为该球面点的第一乘积结果;对球面背景图像中所有球面点的第一乘积结果求和,得到球谐基参数。
可选地,查找表获得模块,还用于获取自然颜色查找表;根据预设球谐基函数、球谐基参数以及自然颜色查找表,得到预置查找表。
可选地,自然颜色查找表包括多个像素值对应的调整像素值;查找表获得模块,还用于获取对应目标背景图像的法向向量;获取球面背景图像中每个球面点分别对应的方向向量;通过预设球谐基函数,确定球面背景图像中每个球面点的运算结果;计算球面背景图像中每个球面点的运算结果、该球面点的方向向量、球谐基参数以及法向向量的乘积,作为该球面点的第二乘积结果;对球面背景图像中所有球面点的第二乘积结果求和,得到求和结果;计算求和结果与自然颜色查找表中每个像素值的调整像素值的乘积,作为该像素值的预置调整像素值;根据自然颜色查找表中每个像素值以及该像素值对应的预置调整像素值,得到预置查找表。
可选地,分割模块1110,还用于若目标图像中存在目标对象,通过预置的语义分割网络对目标图像进行分割,得到包括目标对象的前景区域。
需要说明的是,本申请中的装置实施例与前述方法实施例是相互对应的,装置实施例中具体的原理可以参见前述方法实施例中的内容,此处不再赘述。
图17示出了本申请一个实施例提出的一种电子设备的结构框图。该电子设备可以是图1中的用户终端20或服务器10,图17示出的电子设备的计算机系统1300仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图17所示,计算机系统1200包括中央处理单元(Central Processing Unit,CPU)1201,其可以根据存储在只读存储器(Read-Only Memory,ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(Random Access Memory,RAM)1203中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在RAM 1203中,还存储有系统操作所需的各种程序和数据。CPU1201、ROM1202以及RAM 1203通过总线1204彼此相连。输入/输出(Input/Output,I/O)接口1205也连接至总线1204。
在一些实施例中,以下部件连接至I/O接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid CrystalDisplay,LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被中央处理单元(CPU)1201执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读介质可以是上述实施例中描述的用户终端和服务器中所包含的;也可以是单独存在,而未装配入该用户终端和服务器中。上述计算机可读存储介质上存储有计算机程序,当该计算机程序被处理器执行时,实现上述任一实施例中的方法。
根据本申请实施例的一个方面,提供了计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。用户终端或服务器的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该用户终端或服务器执行上述任一实施例中的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台用户终端或服务器执行根据本申请实施方式的方法。
需要说明的是,在本申请中,对象互动数据、对象的身份信息以及对象的订阅信息等信息需要获取该对象的授权,在得到该对象对对象互动数据、对象的身份信息以及对象的订阅信息等信息的授权之后,可以对上述信息进行处理,从而符合相关法律的规定。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (13)
1.一种图像处理方法,其特征在于,所述方法包括:
若目标图像中存在目标对象,对所述目标图像进行分割,得到包括所述目标对象的前景区域;
根据所述前景区域中每个像素点的像素值,从预置查找表中确定对应每个所述像素点的目标调整像素值,所述预置查找表包括不同像素值对应的调整像素值,所述预置查找表是对待融合的目标背景图像进行光照估计后获得的;
将所述前景区域中每个所述像素点的像素值调整至该像素点对应的目标调整像素值,得到调整后的前景区域;
将所述目标背景图像作为所述目标图像的背景,对所述调整后的前景区域与所述目标背景图像进行融合处理,得到融合图像。
2.根据权利要求1所述的方法,其特征在于,所述对所述调整后的前景区域与所述目标背景图像进行融合处理,得到融合图像,包括:
根据所述目标图像,获取对应所述前景区域的可视化轮廓图像;
对所述可视化轮廓图像进行高斯模糊处理,得到对应所述可视化轮廓图像的模糊参数;
根据所述可视化轮廓图像的模糊参数、所述目标背景图像以及所述前景区域,得到融合图像。
3.根据权利要求2所述的方法,其特征在于,所述可视化轮廓图像的模糊参数包括所述可视化轮廓图像中每个像素点对应的模糊参数;所述根据所述可视化轮廓图像的模糊参数、所述目标背景图像以及所述前景区域,得到融合图像,包括:
根据所述可视化轮廓图像中每个像素点对应的模糊参数,确定所述目标背景图像每个像素点的模糊参数以及所述前景区域中每个像素点的模糊参数;
根据所述目标背景图像中每个像素点的像素值与该像素点对应的模糊参数的乘积,对该像素点的像素值进行替换,得到对应所述目标背景图像的预处理背景图像;
根据所述前景区域中每个像素点的像素值与该像素点对应的模糊参数的乘积,对该像素点的像素值进行替换,得到对应所述前景区域的预处理前景区域;
对所述预处理背景图像以及所述预处理前景区域进行融合处理,得到融合图像。
4.根据权利要求1所述的方法,其特征在于,所述预置查找表的获取方法包括:
获取所述目标背景图像;
对所述目标背景图像进行球面映射,得到球面背景图像;
根据所述球面背景图像以及预设球谐基函数,确定球谐基参数;
根据所述球谐基参数以及所述预设球谐基函数,得到所述预置查找表。
5.根据权利要求4所述的方法,其特征在于,所述对所述目标背景图像进行球面映射,得到球面背景图像,包括:
构建球面模型,所述球面模型的球面点的数量与所述目标背景图像的像素点的数量相同;
从所述球面模型中确定与所述目标背景图像中每个像素点对应的球面点;
将每个所述球面点的像素值调整为所述目标背景图像中与该球面点对应的像素点的像素值,得到球面背景图像。
6.根据权利要求5所述的方法,其特征在于,所述从所述球面模型中确定与所述目标背景图像中每个像素点对应的球面点,包括:
获取所述目标背景图像中每个像素点的坐标信息、所述目标背景图像的宽度以及所述目标背景图像的高度;
根据所述目标背景图像中每个像素点的坐标信息、所述目标背景图像的宽度以及所述目标背景图像的高度,确定对应所述目标背景图像中每个像素点的偏航角以及俯仰角;
根据所述目标背景图像中每个像素点的偏航角以及俯仰角,从所述球面模型中确定对应该像素点的球面点。
7.根据权利要求4所述的方法,其特征在于,所述根据所述球面背景图像以及预设球谐基函数,确定球谐基参数,包括:
通过所述预设球谐基函数,确定所述球面背景图像中每个球面点的函数运算结果;
计算所述球面背景图像中每个球面点的函数运算结果与该球面点的像素值的乘积,作为该球面点的第一乘积结果;
对所述球面背景图像中所有球面点的第一乘积结果求和,得到所述球谐基参数。
8.根据权利要求4所述的方法,其特征在于,所述根据所述球谐基参数以及所述预设球谐基函数,得到所述预置查找表,包括:
获取自然颜色查找表;
根据所述预设球谐基函数、所述球谐基参数以及所述自然颜色查找表,得到所述预置查找表。
9.根据权利要求8所述的方法,其特征在于,所述自然颜色查找表包括多个像素值对应的调整像素值;所述根据所述预设球谐基函数、所述球谐基参数以及所述自然颜色查找表,得到所述预置查找表,包括:
获取对应所述目标背景图像的法向向量;
获取所述球面背景图像中每个球面点分别对应的方向向量;
通过所述预设球谐基函数,确定所述球面背景图像中每个球面点的运算结果;
计算所述球面背景图像中每个球面点的运算结果、该球面点的方向向量、所述球谐基参数以及所述法向向量的乘积,作为该球面点的第二乘积结果;
对所述球面背景图像中所有球面点的第二乘积结果求和,得到求和结果;
计算所述求和结果与所述自然颜色查找表中每个像素值的调整像素值的乘积,作为该像素值的预置调整像素值;
根据所述自然颜色查找表中每个像素值以及该像素值对应的预置调整像素值,得到所述预置查找表。
10.根据权利要求1所述的方法,其特征在于,所述若目标图像中存在目标对象,对所述目标图像进行分割,得到包括所述目标对象的前景区域,包括:
若目标图像中存在目标对象,通过预置的语义分割网络对所述目标图像进行分割,得到包括所述目标对象的前景区域。
11.一种图像处理装置,其特征在于,所述装置包括:
分割模块,用于若目标图像中存在目标对象,对所述目标图像进行分割,得到包括所述目标对象的前景区域;
确定模块,用于根据所述前景区域中每个像素点的像素值,从预置查找表中确定对应每个所述像素点的目标调整像素值,所述预置查找表包括不同像素值对应的调整像素值,所述预置查找表是对待融合的目标背景图像进行光照估计后获得的;
调整模块,用于将所述前景区域中每个所述像素点的像素值调整至该像素点对应的目标调整像素值,得到调整后的前景区域;
融合模块,用于将所述目标背景图像作为所述目标图像的背景,对所述调整后的前景区域与所述目标背景图像进行融合处理,得到融合图像。
12.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211192854.5A CN117011324A (zh) | 2022-09-28 | 2022-09-28 | 图像处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211192854.5A CN117011324A (zh) | 2022-09-28 | 2022-09-28 | 图像处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117011324A true CN117011324A (zh) | 2023-11-07 |
Family
ID=88567838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211192854.5A Pending CN117011324A (zh) | 2022-09-28 | 2022-09-28 | 图像处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117011324A (zh) |
-
2022
- 2022-09-28 CN CN202211192854.5A patent/CN117011324A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108122234B (zh) | 卷积神经网络训练及视频处理方法、装置和电子设备 | |
US11830230B2 (en) | Living body detection method based on facial recognition, and electronic device and storage medium | |
CN111488865B (zh) | 图像优化方法、装置、计算机存储介质以及电子设备 | |
WO2022156640A1 (zh) | 一种图像的视线矫正方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
WO2022156622A1 (zh) | 脸部图像的视线矫正方法、装置、设备、计算机可读存储介质及计算机程序产品 | |
Liu et al. | LAE-Net: A locally-adaptive embedding network for low-light image enhancement | |
Xiao et al. | Single image dehazing based on learning of haze layers | |
CN115457531A (zh) | 用于识别文本的方法和装置 | |
CN111681177A (zh) | 视频处理方法及装置、计算机可读存储介质、电子设备 | |
CN111754622B (zh) | 脸部三维图像生成方法及相关设备 | |
CN113205507A (zh) | 一种视觉问答方法、系统及服务器 | |
Cui et al. | ECANet: enhanced context aggregation network for single image dehazing | |
CN114187515A (zh) | 图像分割方法和图像分割装置 | |
CN115147261A (zh) | 图像处理方法、装置、存储介质、设备及产品 | |
CN114299573A (zh) | 视频处理方法、装置、电子设备及存储介质 | |
CN116664603B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN113706400A (zh) | 图像矫正方法、装置、显微镜图像的矫正方法及电子设备 | |
CN116798041A (zh) | 图像识别方法、装置和电子设备 | |
CN113673567B (zh) | 基于多角度子区域自适应的全景图情感识别方法及系统 | |
CN117011324A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
Zhang et al. | A compensation textures dehazing method for water alike area | |
CN112862840B (zh) | 图像分割方法、装置、设备及介质 | |
CN116362981A (zh) | 色调映射方法、计算机程序产品、电子设备以及存储介质 | |
CN115222621A (zh) | 图像校正方法、电子设备、存储介质及计算机程序产品 | |
CN113505866B (zh) | 基于边缘素材数据增强的图像分析方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |