CN116703797A - 图像融合方法、图像融合系统、计算机设备及存储介质 - Google Patents
图像融合方法、图像融合系统、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN116703797A CN116703797A CN202310835661.5A CN202310835661A CN116703797A CN 116703797 A CN116703797 A CN 116703797A CN 202310835661 A CN202310835661 A CN 202310835661A CN 116703797 A CN116703797 A CN 116703797A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- data
- spliced
- gradient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 92
- 238000007500 overflow downdraw method Methods 0.000 title abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000012545 processing Methods 0.000 claims abstract description 33
- 238000004364 calculation method Methods 0.000 claims abstract description 27
- 238000012216 screening Methods 0.000 claims abstract description 27
- 238000003709 image segmentation Methods 0.000 claims abstract description 16
- 238000007499 fusion processing Methods 0.000 claims abstract description 12
- 238000005070 sampling Methods 0.000 claims description 15
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 abstract description 18
- 238000013473 artificial intelligence Methods 0.000 abstract description 15
- 210000003128 head Anatomy 0.000 description 18
- 230000008859 change Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 11
- 238000003058 natural language processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 210000000746 body region Anatomy 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008921 facial expression Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformation in the plane of the image
- G06T3/40—Scaling the whole image or part thereof
- G06T3/4038—Scaling the whole image or part thereof for image mosaicing, i.e. plane images composed of plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Abstract
本申请实施例提供了一种图像融合方法、图像融合系统、计算机设备及存储介质,属于人工智能及金融科技领域。该方法包括:对获取的初始拼接图像进行图像分割,得到第一区域图像和第二区域图像;根据预设亮度数据对第一区域图像进行亮度增强处理,得到第一增强图像;对第一增强图像和第二区域图像进行图像拼接,得到第一拼接图像,第一拼接图像包括第一拼接区域;根据第一拼接区域对第一拼接图像进行像素梯度计算,得到第一梯度数据;根据第一梯度数据和预设梯度阈值从第一拼接图像筛选出目标拼接图像;根据预设权重序列对目标拼接图像进行像素融合处理,得到目标融合图像。本申请实施例能够提高对拼接图像的图像融合的质量。
Description
技术领域
本申请涉及人工智能及金融科技领域,尤其涉及一种图像融合方法、图像融合系统、计算机设备及存储介质。
背景技术
随着银行业务的大力拓展以及计算机技术的不断更新,银行的业务系统也在不断进行着升级与更新。例如,由于银行的业务种类较多,为了更好地为客户进行业务介绍,则根据音频驱动口型自动生成虚拟视频,可以有效减少金融科技领域中需要对每个业务介绍单独录制的录制成本。但是,由于在自动生成虚拟视频时,需要先对口型进行单独变化,再将变化后的图像进行图像融合,则图像融合的质量会影响生成的虚拟视频的整体真实度。目前,相关的虚拟视频合成技术可以根据输入的图像,生成包括多个拼接图像的虚拟视频。但是,由于背景颜色的变化、动作变化等因素的影响,使得生成的拼接图像中的颜色过度不自然,因此需要采用图像融合方法对拼接图像进行图像融合处理。相关技术的图像融合方法通常采用泊松融合的方式,但泊松融合在融合边缘处色彩相差太大,且容易导致融合后失真的问题,降低了图像融合的质量。因此,如何提供一种图像融合方法,能够提高对拼接图像的图像融合的质量,成为了亟待解决的技术问题。
发明内容
本申请实施例的主要目的在于提出了一种图像融合方法、图像融合系统、计算机设备及存储介质,能够提高对拼接图像的图像融合的质量。
为实现上述目的,本申请实施例的第一方面提出了一种图像融合方法,所述方法包括:
获取初始拼接图像,并对所述初始拼接图像进行图像分割,得到第一区域图像和第二区域图像;
根据预设亮度数据对所述第一区域图像进行亮度增强处理,得到第一增强图像;
对所述第一增强图像和所述第二区域图像进行图像拼接,得到第一拼接图像,所述第一拼接图像包括第一拼接区域;
根据所述第一拼接区域对所述第一拼接图像进行像素梯度计算,得到第一梯度数据;其中,所述第一梯度数据用于表征所述第一拼接区域中所述第一增强图像和所述第二区域图像的像素差值;
根据所述第一梯度数据和预设梯度阈值从所述第一拼接图像筛选出目标拼接图像;
根据预设权重序列对所述目标拼接图像进行像素融合处理,得到目标融合图像。
在一些实施例中,在所述根据预设亮度数据对所述第一区域图像进行亮度增强处理,得到第一增强图像之前,所述方法还包括:
获取亮度增强区间;
根据预设亮度间隔对所述亮度增强区间进行亮度采样,得到所述预设亮度数据。
在一些实施例中,所述根据所述第一梯度数据和预设梯度阈值从所述第一拼接图像筛选出目标拼接图像,包括:
从所述第一梯度数据筛选出第一目标梯度数据;其中,所述第一目标梯度数据是所述第一梯度数据中数值最小的数据;
将所述第一目标梯度数据和所述预设梯度阈值进行数值比较,若所述第一目标梯度数据小于或等于所述预设梯度阈值,根据所述第一目标梯度数据从所述第一拼接图像筛选出所述目标拼接图像。
在一些实施例中,在所述将所述第一目标梯度数据和所述预设梯度阈值进行数值比较之后,所述根据所述第一梯度数据和预设梯度阈值从所述第一拼接图像筛选出目标拼接图像还包括:
若所述第一目标梯度数据大于所述预设梯度阈值,根据所述第一拼接区域和所述第一目标梯度数据对所述第一拼接图像进行图像分割,得到候选增强图像;
根据所述候选增强图像和所述第二区域图像确定所述目标拼接图像。
在一些实施例中,所述根据所述候选增强图像和所述第二区域图像确定所述目标拼接图像,包括:
根据所述预设亮度数据对所述第二区域图像进行亮度增强处理,得到第二增强图像;
对所述第二增强图像和所述候选增强图像进行图像拼接,得到第二拼接图像,所述第二拼接图像包括第二拼接区域;
根据所述第二拼接区域对所述第二拼接图像进行像素梯度计算,得到第二梯度数据;其中,所述第二梯度数据用于表征所述第二拼接区域中所述第二增强图像和所述候选增强图像的像素差值;
从所述第二梯度数据筛选出第二目标梯度数据;其中,所述第二目标梯度数据是所述第二梯度数据中数值最小的数据;
将所述第二目标梯度数据和所述预设梯度阈值进行数值比较,若所述第二目标梯度数据小于或等于所述预设梯度阈值,根据所述第二目标梯度数据从所述第二拼接图像筛选出所述目标拼接图像。
在一些实施例中,所述根据预设权重序列对所述目标拼接图像进行像素融合处理,得到目标融合图像,包括:
获取所述目标拼接图像的初始像素数据;
根据预设的图像融合数据进行权重采样,得到所述预设权重序列;所述图像融合数据包括单位像素高度数据,所述预设权重序列包括所述单位像素高度数据的单位融合权重数据;
根据所述单位像素高度数据对所述单位融合权重数据和所述初始像素数据进行加权计算,得到目标像素数据;
根据所述目标像素数据对所述目标拼接图像进行像素更新,得到所述目标融合图像。
在一些实施例中,所述获取初始拼接图像,包括:
获取目标音频和具有口型的初始图像;
将所述初始图像和所述目标音频输入至预设的音频驱动口型模型进行口型变换处理,得到语音合成视频;
对所述语音合成视频进行视频帧采样,得到所述初始拼接图像。
为实现上述目的,本申请实施例的第二方面提出了一种图像融合系统,所述系统包括:
图像获取模块,用于获取初始拼接图像,并对所述初始拼接图像进行图像分割,得到第一区域图像和第二区域图像;
亮度增强模块,用于根据预设亮度数据对所述第一区域图像进行亮度增强处理,得到第一增强图像;
图像拼接模块,用于对所述第一增强图像和所述第二区域图像进行图像拼接,得到第一拼接图像,所述第一拼接图像包括第一拼接区域;
梯度计算模块,用于根据所述第一拼接区域对所述第一拼接图像进行像素梯度计算,得到第一梯度数据;其中,所述第一梯度数据用于表征所述第一拼接区域中所述第一增强图像和所述第二区域图像的像素差值;
图像筛选模块,用于根据所述第一梯度数据和预设梯度阈值从所述第一拼接图像筛选出目标拼接图像;
图像融合模块,用于根据预设权重序列对所述目标拼接图像进行像素融合处理,得到目标融合图像。
为实现上述目的,本申请实施例的第三方面提出了一种计算机设备,包括:
至少一个存储器;
至少一个处理器;
至少一个计算机程序;
所述至少一个计算机程序被存储在所述至少一个存储器中,所述至少一个处理器执行所述至少一个计算机程序以实现上述第一方面所述的图像融合方法。
为实现上述目的,本申请实施例的第四方面提出了一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于使计算机执行上述第一方面所述的图像融合方法。
本申请实施例提出的一种图像融合方法、图像融合系统、计算机设备及存储介质,首先,获取初始拼接图像,并对该初始拼接图像进行图像分割,得到第一区域图像和第二区域图像。根据预设亮度数据对第一区域图像进行亮度增强处理,得到第一增强图像。然后,对第一增强图像和第二区域图像进行图像拼接,得到第一拼接图像,该第一拼接图像包括第一拼接区域。根据第一拼接区域对第一拼接图像进行像素梯度计算,得到第一梯度数据。其中,第一梯度数据用于表征第一拼接区域中第一增强图像和第二区域图像的像素差值。根据第一梯度数据和预设梯度阈值从第一拼接图像筛选出目标拼接图像,根据预设权重序列对目标拼接图像进行像素融合处理,得到目标融合图像。本申请实施例能够提高对拼接图像的图像融合的质量。
附图说明
图1是本申请实施例提供的图像融合方法的一个流程图;
图2是图1中的步骤S110的一个流程图;
图3是本申请实施例提供的初始拼接图像的一个结构示意图;
图4是本申请实施例提供的图像融合方法的另一个流程图;
图5是图1中的步骤S150的一个流程图;
图6是图1中的步骤S150的另一个流程图;
图7是图6中的步骤S620的流程图;
图8是图1中的步骤S160的一个流程图;
图9是本申请实施例提供的图像融合方法的一个执行示意图;
图10是本申请实施例提供的图像融合系统的结构示意图;
图11是本申请实施例提供的计算机设备的硬件结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
首先,对本申请中涉及的若干名词进行解析:
人工智能(Artificial Intelligence,AI):是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;人工智能是计算机科学的一个分支,人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
计算机视觉技术(Computer Vision,CV):是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉技术通常包括图像处理、图像识别、图像分割、图像语义理解、图像检索、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
自然语言处理(Natural Language Processing,NLP):NLP用计算机来处理、理解以及运用人类语言(如中文、英文等),NLP属于人工智能的一个分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学。自然语言处理包括语法分析、语义分析、篇章理解等。自然语言处理常用于机器翻译、手写体和印刷体字符识别、语音识别及文语转换、信息检索、信息抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等技术领域,它涉及与语言处理相关的数据挖掘、机器学习、知识获取、知识工程、人工智能研究和与语言计算相关的语言学研究等。
目前,相关的虚拟视频合成技术可以根据输入的图像,生成包括多个拼接图像的虚拟视频。但是,由于背景颜色的变化、动作变化等因素的影响,使得生成的拼接图像中的颜色过度不自然,因此需要采用图像融合方法对拼接图像进行图像融合处理。相关技术的图像融合方法通常采用泊松融合的方式,但泊松融合在融合边缘处色彩相差太大,且容易导致融合后失真的问题,降低了图像融合的质量。因此,如何提供一种图像融合方法,能够提高对拼接图像的图像融合的质量,成为了亟待解决的技术问题。
基于此,本申请实施例提供了一种图像融合方法、图像融合系统、计算机设备及存储介质,能够提高对拼接图像的图像融合的质量。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的图像融合方法,涉及人工智能技术领域。本申请实施例提供的图像融合方法可应用于终端中,也可应用于服务器端中,还可以是运行于终端或服务器端中的软件。在一些实施例中,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等;服务器端可以配置成独立的物理服务器,也可以配置成多个物理服务器构成的服务器集群或者分布式系统,还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)以及大数据和人工智能平台等基础云计算服务的云服务器;软件可以是实现图像融合方法的应用等,但并不局限于以上形式。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络个人计算机(Personal Computer,PC)、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
需要说明的是,在本申请的各个具体实施方式中,当涉及到需要根据用户信息、用户行为数据,用户历史数据以及用户位置信息等与用户身份或特性相关的数据进行相关处理时,都会先获得用户的许可或者同意,而且,对这些数据的收集、使用和处理等,都会遵守相关法律法规和标准。此外,当本申请实施例需要获取用户的敏感个人信息时,会通过弹窗或者跳转到确认页面等方式获得用户的单独许可或者单独同意,在明确获得用户的单独许可或者单独同意之后,再获取用于使本申请实施例能够正常运行的必要的用户相关数据。
请参阅图1,图1是本申请实施例提供的图像融合方法的一个可选的流程图。在本申请的一些实施例中,图1中的方法具体可以包括但不限于步骤S110至步骤S160,下面结合图1对这六个步骤进行详细介绍。
步骤S110,获取初始拼接图像,并对初始拼接图像进行图像分割,得到第一区域图像和第二区域图像;
步骤S120,根据预设亮度数据对第一区域图像进行亮度增强处理,得到第一增强图像;
步骤S130,对第一增强图像和第二区域图像进行图像拼接,得到第一拼接图像,第一拼接图像包括第一拼接区域;
步骤S140,根据第一拼接区域对第一拼接图像进行像素梯度计算,得到第一梯度数据;其中,第一梯度数据用于表征第一拼接区域中第一增强图像和第二区域图像的像素差值;
步骤S150,根据第一梯度数据和预设梯度阈值从第一拼接图像筛选出目标拼接图像;
步骤S160,根据预设权重序列对目标拼接图像进行像素融合处理,得到目标融合图像。
需要说明的是,图像拼接是指将两张或多张图像拼在一起,且由于待拼接的图像存在颜色、背景等差异,使得生成的拼接图像在拼接处存在明显的拼接痕迹。例如,在虚拟人视频合成场景中,由于该虚拟视频场景是将处理后的人头图像和人身体图像进行拼接。为了使拼接后的图像看起来更自然,相关技术通过美颜算法不断地调整拼接处的颜色,该技术方法的操作繁琐且拼接处的颜色不自然。
在一些实施例的步骤S110中,由于在虚拟的语音合成视频在生成的过程中,为了使所生成的视频更具真实性,则除了满足包含音视频同步的口型,还可能同时生成了与说话内容匹配的面部表情。但由于口型、面部表情、背景颜色的变化、动作变化等因素的影响,该虚拟的语音合成视频中的每一视频帧图像在拼接处存在明显的差异,从而影响虚拟视频的合成效果。为了使拼接图像的颜色过度更自然,以消除拼接处存在的明显的拼接痕迹。首先,当初始拼接图像为目标对象的头部和身体拼接图像,则根据人像分割算法对初始拼接图像进行图像分割,以将该初始拼接图像分成包含目标对象头部的第一区域图像和包含目标对象身体部分的第二区域图像。其中,第一区域图像和第二区域图像为存在颜色差异的不同图像,且第一区域图像和第二区域图像在初始拼接图像中不存在重合区域。本申请实施例通过对初始拼接图像进行图像分割,能够确定颜色差异较大且需要进行图像融合的区域图像。
需要说明的是,本申请实施例并不限定于将包含目标对象头部的图像作为第一区域图像,也可以将包含目标对象身体部分的图像作为第一区域图像,则第二区域图像为不同于第一区域图像的另一个分割图像。
需要说明的是,当初始拼接图像不是目标对象的头部和身体拼接图像,对该初始拼接图像进行拼接位置识别,确定图像拼接区域。根据该图像拼接区域对初始拼接图像进行图像分割,则分割得到的第一区域图像和第二区域图像为颜色差异明显的不同区域。
需要说明的是,本申请实施例所提供的图像融合方法可以适用于虚拟现实、虚拟试衣、虚拟社交、图像美化、一键成片视频等场景,将需要进行图像融合的图像作为初始拼接图像。
请参阅图2,图2是本申请实施例提供的获取初始拼接图像的一个可选的流程图。在本申请的一些实施例中,步骤S110中获取初始拼接图像的步骤具体可以包括但不限于步骤S210至步骤S230,下面结合图2对这三个步骤进行详细介绍。
步骤S210,获取目标音频和具有口型的初始图像;
步骤S220,将初始图像和目标音频输入至预设的音频驱动口型模型进行口型变换处理,得到语音合成视频;
步骤S230,对语音合成视频进行视频帧采样,得到初始拼接图像。
在一些实施例的步骤S210至步骤S220中,例如,在金融科技的智能虚拟人视频合成场景中,为了实现目标对象的静态图像到动态视频的转换,将具有目标对象口型的初始图像和目标音频输入至预设的音频驱动口型模型进行口型变换处理。其中,生成的语音合成视频中目标对象的虚拟口型可以准确对应目标音频中每个语音波形的发音口型,从而实现了虚拟视频的生成。
在一些实施例的步骤S230中,由于虚拟人视频合成场景中,由于生成的语音合成视频中的每一帧的初始拼接图像,因为人脸口型和面部发生了对应的变化,则容易导致人脸下巴肤色与身体颈脖的拼接区域肤色过渡不自然的问题。例如,音频驱动口型生成虚拟视频的场景中,本申请实施例会先根据人像分割算法将初始图像进行图像分割,得到目标对象的头部区域的图像和身体区域的图像,并对分割出来的头部区域的图像匹配对应的语音波形的发音口型进行口型更新。之后,将更新口型后的头部区域的图像按照目标音频的音频时间生成对应的人头视频。然而,由于通过音频驱动口型算法生成的人头视频和原来的身体区域的图像存在明显的颜色差异,则容易导致生成的语音合成视频中目标对象的头部和身体的颜色过渡不自然,有明显的拼接痕迹。因此,对语音合成视频进行视频帧采样,得到每一帧的初始拼接图像,并将该初始拼接图像执行本申请所提出的图像融合方法,以提高对拼接图像的图像融合的质量,从而提高生成视频的质量。
需要说明的是,预设的音频驱动口型模型可以为基于Wavedev2结构、WINCE接口等任一种构建的模型结构,并根据预先构建的图像训练集对模型训练得到。
示例性的,将目标音频和具有口型的初始图像输入预设的音频驱动口型模型中进行口型变换处理得到虚拟合成的语音合成视频。对该语音合成视频340进行视频帧采样,即可得到多个初始拼接图像。如图3所示,每个初始拼接图像310根据图像拼接区域划分为第一区域图像311和第二区域图像312,其中,图像拼接区域用于表征第一区域图像和第二区域图像的拼接线,即图中所示的虚线。
在一些实施例的步骤S120中,为了使拼接图像的颜色亮度更自然,且能够有效减小后续图像融合的压力,以提高图像融合的效率。本申请实施例通过结合格子搜索方法,以根据多个预设亮度数据对第一区域图像进行亮度增强处理,得到多个第一增强图像。
请参阅图4,图4是本申请实施例提供的图像融合方法的另一个可选的流程图。在本申请的一些实施例中,在步骤S120之前,本申请实施例提供的图像融合方法具体还可以包括但不限于步骤S410至步骤S420,下面结合图4对这两个步骤进行详细介绍。
步骤S410,获取亮度增强区间;
步骤S420,根据预设亮度间隔对亮度增强区间进行亮度采样,得到预设亮度数据。
在一些实施例的步骤S410和步骤S420中,为了使拼接图像的颜色亮度更自然,本申请实施例可以先获取一个预设的亮度增强区间。根据预设亮度间隔对该亮度增强区间进行亮度采样,以得到多个预设亮度数据。之后,本申请实施例可以根据这些预设亮度数据对第一区域图像进行亮度增强,以得到多个第一增强图像。
需要说明的是,在进行亮度增强时,由于图像是由多个像素点构成,则先获取第一区域图像中每个像素点的初始像素值。然后,遍历每个预设亮度数据,并根据遍历到的预设亮度数据对第一区域图像中的每个初始像素值进行亮度增强。其中,由于亮度增强是对图像的像素值整体进行增强变化,因此,增强后得到的第一增强图像中每个像素点的像素值可能相同也可能不同。
示例性的,假设获取的亮度增强区间为[0.05,1.0],且预设亮度间隔为0.05,则根据预设亮度间隔对亮度增强区间进行亮度采样,可以依次得到预设亮度数据为0.05、0.1、0.15、…、1.0的20个亮度值。其中,亮度值的单位是坎德拉/平方米(cd/m2)。然后,根据采样得到的20个预设亮度数据对第一区域图像进行亮度增强处理,得到20个第一增强图像。
需要说明的是,亮度增强区域可以根据实际需要进行灵活调整,如为[1.0,2.0],在此不再赘述。预设亮度间隔也可以根据实际需要进行灵活调整,如设为0.1、0.5等,在此不再赘述。
在一些实施例的步骤S130中,在通过格子搜索方法得到多个第一增强图像后,将增强后的第一增强图像和第二区域图像进行图像拼接。具体地,将增强后的包含目标对象头部的第一增强图像和包含目标对象身体部分的第二区域图像进行图像拼接,则第一次拼接后的图像在拼接区域能够有效缩小了一些颜色差异,并减小了后续图像融合的压力,从而提高了图像融合的效率。其中,第一拼接区域用于表征第一增强图像和第二区域图像的拼接线。
在一些实施例的步骤S140中,为了从多个第一拼接图像中搜索出差异最小的图像,本申请实施例根据第一拼接区域对第一拼接图像进行像素梯度计算,则可以得到能够反映图像变化速度的第一梯度数据。其中,若第一梯度数据越大,则表示靠近第一拼接区域的第二区域图像的像素点和第一增强图像的像素差值越大;若第一梯度数据越小,则表示靠近第一拼接区域的第二区域图像的像素点和第一增强图像的像素差值越小。
在一些实施例的步骤S150中,当预设亮度数据的数量为20,得到20个第一增强图像,并将每张第一增强图像和第二区域图像拼接后得到20个第一拼接图像。之后,对第一拼接图像进行像素梯度计算,可以得到20个第一梯度数据。因此,本申请实施例可以先通过对第二区域图像固定,对第一区域图像进行图像增强,以确定拼接后的梯度值,以从第一拼接图像筛选出目标拼接图像。其中,该目标拼接图像用于表征第一拼接图像中第一增强图像和第二区域图像差异最小的图像。
需要说明的是,由于图像是由多个像素点构成,则可以根据像素在第一拼接区域的像素差值确定第一梯度数据。具体地,将第一拼接图像的横向方向作为X轴,将第一拼接图像的纵向高度方向作为Y轴。其中,将y用于表示第一拼接区域的像素取值高度。因此,在同一横向宽度x的上下像素点进行取值,例如,f(y,x)表示第一拼接区域中第二区域图像在高度y且横向宽度为x的像素点处的第一像素值,f(y+a,x)表示第一拼接区域中第一增强区域在高度(y+a)且横向宽度为x的像素点处的第二像素值。则a用于表示第一像素值和第二像素值的像素高度差。如下公式(1)所示,第一梯度数据根据第一像素值和第二像素值的像素差值得到。此外,为了便于进行数值比较,本申请实施例将像素差值的绝对值作为梯度数据。
grad=abs(f(y,x)-f(y+a,x)) (1)。
其中,grad用于表示得到的梯度数据,abs用于表示绝对值计算,f用于表示所选择的图像。
需要说明的是,第一梯度数据可以为第一拼接区域中全部横向宽度对应得到的像素差值的均值,也可以为第一拼接区域中全部横向宽度对应得到的像素差值的梯度和,以便于进行梯度数据的数值比较。
请参阅图5,图5是本申请实施例提供的步骤S150的一个可选的流程图。在本申请的一些实施例中,步骤S150具体可以包括但不限于步骤S510至步骤S520,下面结合图5对这两个步骤进行详细介绍。
步骤S510,从第一梯度数据筛选出第一目标梯度数据;其中,第一目标梯度数据是第一梯度数据中数值最小的数据;
步骤S520,将第一目标梯度数据和预设梯度阈值进行数值比较,若第一目标梯度数据小于或等于预设梯度阈值,根据第一目标梯度数据从第一拼接图像筛选出目标拼接图像。
在一些实施例的步骤S510中,为了选出第一区域图像亮度增强后拼接出的颜色差异较小的图像,对多个第一梯度数据进行排序,得到第一梯度序列。其中,该排序方式可以为升序排列或降序排列,以从第一梯度序列中选出梯度数值最小的数据,即为第一目标梯度数据。
在一些实施例的步骤S520中,本申请实施例预先设置了一个预设梯度阈值,该预设梯度阈值用于表示满足颜色差异要求的梯度数值,以使得所选择的拼接图像颜色差异不明显,即颜色过度更自然,从而提高对拼接图像的图像融合的质量。具体地,将第一目标梯度数据和预设梯度阈值进行数值比较,若第一目标梯度数据小于或等于预设梯度阈值,确定第一目标梯度数据对应的第一拼接图像。由于相同第一目标梯度数据可能对应不同的第一拼接图像,则根据第一目标梯度数据从第一拼接图像筛选出一个目标拼接图像。
请参阅图6,图6是本申请实施例提供的步骤S150的另一个可选的流程图。在本申请的一些实施例中,在将第一目标梯度数据和预设梯度阈值进行数值比较之后,步骤S150具体还可以包括但不限于步骤S610和步骤S620,下面结合图6对这两个步骤进行详细介绍。
步骤S610,若第一目标梯度数据大于预设梯度阈值,根据第一拼接区域和第一目标梯度数据对第一拼接图像进行图像分割,得到候选增强图像;
步骤S620,根据候选增强图像和第二区域图像确定目标拼接图像。
在一些实施例的步骤S610和步骤S620中,第一拼接图像为对第二区域图像不变,对第一区域图像的亮度增强后的图像拼接得到的。若第一目标梯度数据大于预设梯度阈值,则表示当前差异较小的第一拼接图像仍未符合预设要求,此时根据第一拼接区域和第一目标梯度数据对第一拼接图像进行图像分割,得到候选增强图像。该候选增强图像用于表征梯度数据最小的第一目标梯度数据所对应的第一拼接图像中除去第二区域图像后得到的图像。之后,固定候选增强图像,并对第二区域图像进行处理,以确定符合要求的目标拼接图像。本申请实施例通过结合格子搜索方法,分别对包含头部的第一区域图像和包含身体的第二区域图像进行处理,以得到颜色差异较小即颜色过度更自然的目标拼接图像。
请参阅图7,图7是本申请实施例提供的步骤S620的一个可选的流程图。在本申请的一些实施例中,步骤S620具体可以包括但不限于步骤S710至步骤S750,下面结合图7对这五个步骤进行详细介绍。
步骤S710,根据预设亮度数据对第二区域图像进行亮度增强处理,得到第二增强图像;
步骤S720,对第二增强图像和候选增强图像进行图像拼接,得到第二拼接图像,第二拼接图像包括第二拼接区域;
步骤S730,根据第二拼接区域对第二拼接图像进行像素梯度计算,得到第二梯度数据;其中,第二梯度数据用于表征第二拼接区域中第二增强图像和候选增强图像的像素差值;
步骤S740,从第二梯度数据筛选出第二目标梯度数据;其中,第二目标梯度数据是第二梯度数据中数值最小的数据;
步骤S750,将第二目标梯度数据和预设梯度阈值进行数值比较,若第二目标梯度数据小于或等于预设梯度阈值,根据第二目标梯度数据从第二拼接图像筛选出目标拼接图像。
在一些实施例的步骤S710中,由于第一目标梯度数据大于预设梯度阈值,则表示固定第二区域图像不变,对第二区域图像的亮度增强后的图像拼接得到的第一拼接图像中并未存在符合要求的图像。为了使拼接图像的颜色亮度更自然,根据预设亮度间隔对该亮度增强区间进行亮度采样,以得到多个预设亮度数据。并根据每个预设亮度数据对第二区域图像进行亮度增强处理,得到多个第二增强图像。其中,此时的预设亮度间隔与上述对第一区域图像进行亮度增强是所采用的预设亮度间隔相同,在此不再赘述。本申请实施例根据自动化采样的多个预设亮度数据,能够自动的生成多个增强图像,从而得到亮度差异修正的拼接图像,提高了图像融合效率。
在一些实施例的步骤S720至步骤S730中,通过格子搜索方法得到多个第二增强图像后,将增强后的第二增强图像和候选增强图像进行图像拼接,得到多个第二拼接图像。因此,第二次拼接后的图像在拼接区域能够进一步缩小了一些颜色差异,减小了后续图像融合的压力,从而提高了图像融合的效率。其中,第二拼接区域用于表征第二增强图像和候选增强图像的拼接线,且第二拼接区域和第一拼接区域在初始拼接图像所对应的区域相同。之后,为了从多个第二拼接图像中搜索出差异最小的图像,本申请实施例根据第二拼接区域对第二拼接图像进行像素梯度计算,则可以得到能够反映图像变化速度的第二梯度数据。其中,若第二梯度数据越大,则表示靠近第二拼接区域的候选增强区域图像的像素点和第二增强图像的像素差值越大;若第二梯度数据越小,则表示靠近第二拼接区域的候选增强图像的像素点和第二增强图像的像素差值越小。
需要说明的是,本申请实施例的第二梯度数据与上述第一梯度数据的计算方式相同,且可参考上述公式(1)进行计算,在此不再赘述。
在一些实施例的步骤S740至步骤S750中,对多个第二梯度数据进行排序,得到第二梯度序列。其中,该排序方式可以为升序排列或降序排列,以从第二梯度序列中选出梯度数值最小的数据,即为第二目标梯度数据。之后,为了进一步使得所选择的拼接图像颜色差异不明显,即颜色过度更自然,将第二目标梯度数据和预设梯度阈值进行数值比较,若第二目标梯度数据小于或等于预设梯度阈值,确定第二目标梯度数据对应的第一拼接图像。由于相同第二目标梯度数据可能对应不同的第二拼接图像,则根据第二目标梯度数据从第二拼接图像筛选出一个目标拼接图像。
需要说明的是,若第二目标梯度数据仍大于预设梯度阈值,则可以调整亮度增强区间或预设亮度间隔。例如,初始获取的亮度增强区域为[0.05,1.0],则可以调整为[1.0,2.0]。或者,初始设置的预设亮度间隔为0.05,则可以调整为0.01,并再次执行本申请实施例的图像融合方法,以得到梯度数据小于或等于预设梯度阈值的拼接图像,即确定了颜色差异较小的图像。
本申请实施例在对第一区域图像经过格子搜索方法和梯度比较后,若未确定符合要求的拼接图像,则根据第二区域图像采用格子搜索方法和梯度比较。因此,本申请能够自动进行亮度增强和图像拼接得到多个拼接图像,以筛选出颜色差异较小的图像的拼接图像,提高了图像融合的效率和质量。
在一些实施例的步骤S160中,为了实现对目标拼接图像的图像优化,即实现在拼接区域生成颜色渐变的效果,从而使拼接图像更加自然,提高了对拼接图像的图像融合的质量。
请参阅图8,图8是本申请实施例提供的步骤S160的一个可选的流程图。在本申请的一些实施例中,步骤S160具体可以包括但不限于步骤S810至步骤S840,下面结合图8对这四个步骤进行详细介绍。
步骤S810,获取目标拼接图像的初始像素数据;
步骤S820,根据预设的图像融合数据进行权重采样,得到预设权重序列;图像融合数据包括单位像素高度数据,预设权重序列包括所述单位像素高度数据的单位融合权重数据;
步骤S830,根据单位像素高度数据对单位融合权重数据和初始像素数据进行加权计算,得到目标像素数据;
步骤S840,根据目标像素数据对目标拼接图像进行像素更新,得到目标融合图像。
在一些实施例的步骤S810和步骤S820中,为了实现在拼接区域生成颜色渐变的效果,则先确定一个图像融合数据,该图像融合数据用于表征需要进行像素融合的区域。例如,将目标拼接图像在拼接区域上方的头部区域高度的三分之一高度作为图像融合数据。如该图像融合数据为50个像素高度,则每个像素高度用于表征一个单位像素高度数据。根据等差排列的方式对图像融合数据的50个像素高度分配对应的权重,则预设权重序列w可以记为w=[0,0.02,0.04,…,1],其中的0、0.02等都表示对应的一个单位融合权重数据。因此,每个单位像素高度数据对应一个单位融合权重数据。本申请实施例通过结合等差排列的方式得到预设权重序列,从而为图像融合数据中的每个单位像素高度数据分配对应的权重数据,以实现图像的渐变效果。
在一些实施例的步骤S830和步骤S840中,将单位像素高度数据对应的单位融合权重数据和目标拼接图像的初始像素数据进行加权计算。例如,目标拼接图像包括增强后的头部区域图像和增强后的身体区域图像,则在单位像素高度数据h的加权计算为:目标拼接图像在h位置融合后的目标像素数据=权重w[h]*(头部区域图像在h高度的像素值)+(1-w[h])*(身体区域图像在h高度的像素值)。之后,根据目标像素数据对目标拼接图像对应的位置进行像素更新,得到目标融合图像。
本申请实施例根据预设权重序列和加权平均的方式对目标拼接图像进行像素值更新,以实现图像融合,且融合后的图像能够更好地实现图像的渐变效果,且降低了图像拼接的颜色差异,提高了对拼接图像的图像融合的质量。
示例性的,在金融科技的音频驱动口型生成虚拟视频的场景中,例如,对保险理赔相关流程的说明进行虚拟视频的生成。具体地,先将关于保险理赔相关流程的介绍文本进行音频转换,得到目标音频。然后将目标音频和具有口型的初始人物图像输入预设的音频驱动口型模型进行口型变换处理,得到语音合成视频,即该语音合成视频为初始人物图像中的目标对象口型变化和目标音频匹配后生成的虚拟视频。由于通过音频驱动口型算法生成的虚拟视频中人头视频和原来的身体区域的图像存在明显的颜色差异,则容易导致生成的语音合成视频中目标对象的头部和身体的颜色过渡不自然,有明显的拼接痕迹。为了提高虚拟视频生成的真实性,则将生成的虚拟视频中的每一帧图像作为初始拼接图像,并输入包含本申请图像融合方法的图像融合系统。最后,将得到的每一帧图像融合后的目标融合图像根据该图像在虚拟视频中的位置进行图像拼接,得到真实度更高的目标视频。
因此,如图9所示,对语音合成视频进行视频帧采样,得到每一帧的初始拼接图像910,并将该初始拼接图像执行本申请所提出的图像融合方法,以得到初始拼接图像对应的目标融合图像920。之后,可以对得到的每一帧的目标融合图像进行视频生成,以得到每一帧图像都没有颜色差异的目标虚拟视频。
请参阅图10,图10是本申请实施例提供的图像融合系统的模块结构示意图,该系统可以实现上述实施例的图像融合方法,该系统包括图像获取模块1010、亮度增强模块1020、图像拼接模块1030、梯度计算模块1040、图像筛选模块1050和图像融合模块1060。
图像获取模块1010,用于获取初始拼接图像,并对初始拼接图像进行图像分割,得到第一区域图像和第二区域图像;
亮度增强模块1020,用于根据预设亮度数据对第一区域图像进行亮度增强处理,得到第一增强图像;
图像拼接模块1030,用于对第一增强图像和第二区域图像进行图像拼接,得到第一拼接图像,第一拼接图像包括第一拼接区域;
梯度计算模块1040,用于根据第一拼接区域对第一拼接图像进行像素梯度计算,得到第一梯度数据;其中,第一梯度数据用于表征第一拼接区域中第一增强图像和第二区域图像的像素差值;
图像筛选模块1050,用于根据第一梯度数据和预设梯度阈值从第一拼接图像筛选出目标拼接图像;
图像融合模块1060,用于根据预设权重序列对目标拼接图像进行像素融合处理,得到目标融合图像。
需要说明的是,本申请实施例的图像融合系统用于实现上述实施例的图像融合方法,本申请实施例的图像融合系统与前述的图像融合方法相对应,具体的处理过程请参照前述的图像融合方法,在此不再赘述。
本申请实施例还提供了一种计算机设备,该计算机设备包括:
至少一个存储器;
至少一个处理器;
至少一个计算机程序;
至少一个计算机程序被存储在至少一个存储器中,至少一个处理器执行至少一个计算机程序以实现上述实施例中任一种的图像融合方法。该计算机设备可以为包括平板电脑、车载电脑等任意智能终端。
请参阅图11,图11示意了另一实施例的一种计算机设备的硬件结构,该计算机设备包括:
处理器1110,可以采用通用的中央处理器(Central Processing Unit,CPU)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请实施例所提供的技术方案;
存储器1120,可以采用只读存储器(Read Only Memory,ROM)、静态存储设备、动态存储设备或者随机存取存储器(Random Access Memory,RAM)等形式实现。存储器1120可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1120中,并由处理器1110来调用执行本申请实施例的图像融合方法;
输入/输出接口1130,用于实现信息输入及输出;
通信接口1140,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信;
总线1150,在设备的各个组件(例如处理器1110、存储器1120、输入/输出接口1130和通信接口1140)之间传输信息;
其中处理器1110、存储器1120、输入/输出接口1130和通信接口1140通过总线1150实现彼此之间在设备内部的通信连接。
本申请实施例还提供了一种存储介质,该存储介质为计算机可读存储介质,该计算机可读存储介质存储有计算机程序,计算机程序用于使计算机执行上述实施例中图像融合方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请实施例所提供的一种图像融合方法、图像融合系统、计算机设备及存储介质,通过结合格子搜索方法分别对人脸区域和身体区域进行亮度增强,并结合梯度计算的方法,能够有效缩小拼接图像的颜色差异,并减小了后续图像融合的压力。之后,本申请实施例通过结合等差排列的方式得到预设权重序列,能够为图像融合数据中的每个单位像素高度数据分配对应的权重数据,实现了图像的渐变效果,从而提高了对拼接图像的图像融合的质量和效率。
本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本领域技术人员可以理解的是,图中示出的技术方案并不构成对本申请实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例的方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序的介质。
以上参阅附图说明了本申请实施例的优选实施例,并非因此局限本申请实施例的权利范围。本领域技术人员不脱离本申请实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本申请实施例的权利范围之内。
Claims (10)
1.一种图像融合方法,其特征在于,所述方法包括:
获取初始拼接图像,并对所述初始拼接图像进行图像分割,得到第一区域图像和第二区域图像;
根据预设亮度数据对所述第一区域图像进行亮度增强处理,得到第一增强图像;
对所述第一增强图像和所述第二区域图像进行图像拼接,得到第一拼接图像,所述第一拼接图像包括第一拼接区域;
根据所述第一拼接区域对所述第一拼接图像进行像素梯度计算,得到第一梯度数据;其中,所述第一梯度数据用于表征所述第一拼接区域中所述第一增强图像和所述第二区域图像的像素差值;
根据所述第一梯度数据和预设梯度阈值从所述第一拼接图像筛选出目标拼接图像;
根据预设权重序列对所述目标拼接图像进行像素融合处理,得到目标融合图像。
2.根据权利要求1所述的方法,其特征在于,在所述根据预设亮度数据对所述第一区域图像进行亮度增强处理,得到第一增强图像之前,所述方法还包括:
获取亮度增强区间;
根据预设亮度间隔对所述亮度增强区间进行亮度采样,得到所述预设亮度数据。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一梯度数据和预设梯度阈值从所述第一拼接图像筛选出目标拼接图像,包括:
从所述第一梯度数据筛选出第一目标梯度数据;其中,所述第一目标梯度数据是所述第一梯度数据中数值最小的数据;
将所述第一目标梯度数据和所述预设梯度阈值进行数值比较,若所述第一目标梯度数据小于或等于所述预设梯度阈值,根据所述第一目标梯度数据从所述第一拼接图像筛选出所述目标拼接图像。
4.根据权利要求3所述的方法,其特征在于,在所述将所述第一目标梯度数据和所述预设梯度阈值进行数值比较之后,所述根据所述第一梯度数据和预设梯度阈值从所述第一拼接图像筛选出目标拼接图像还包括:
若所述第一目标梯度数据大于所述预设梯度阈值,根据所述第一拼接区域和所述第一目标梯度数据对所述第一拼接图像进行图像分割,得到候选增强图像;
根据所述候选增强图像和所述第二区域图像确定所述目标拼接图像。
5.根据权利要求4所述的方法,其特征在于,所述根据所述候选增强图像和所述第二区域图像确定所述目标拼接图像,包括:
根据所述预设亮度数据对所述第二区域图像进行亮度增强处理,得到第二增强图像;
对所述第二增强图像和所述候选增强图像进行图像拼接,得到第二拼接图像,所述第二拼接图像包括第二拼接区域;
根据所述第二拼接区域对所述第二拼接图像进行像素梯度计算,得到第二梯度数据;其中,所述第二梯度数据用于表征所述第二拼接区域中所述第二增强图像和所述候选增强图像的像素差值;
从所述第二梯度数据筛选出第二目标梯度数据;其中,所述第二目标梯度数据是所述第二梯度数据中数值最小的数据;
将所述第二目标梯度数据和所述预设梯度阈值进行数值比较,若所述第二目标梯度数据小于或等于所述预设梯度阈值,根据所述第二目标梯度数据从所述第二拼接图像筛选出所述目标拼接图像。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述根据预设权重序列对所述目标拼接图像进行像素融合处理,得到目标融合图像,包括:
获取所述目标拼接图像的初始像素数据;
根据预设的图像融合数据进行权重采样,得到所述预设权重序列;所述图像融合数据包括单位像素高度数据,所述预设权重序列包括所述单位像素高度数据的单位融合权重数据;
根据所述单位像素高度数据对所述单位融合权重数据和所述初始像素数据进行加权计算,得到目标像素数据;
根据所述目标像素数据对所述目标拼接图像进行像素更新,得到所述目标融合图像。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述获取初始拼接图像,包括:
获取目标音频和具有口型的初始图像;
将所述初始图像和所述目标音频输入至预设的音频驱动口型模型进行口型变换处理,得到语音合成视频;
对所述语音合成视频进行视频帧采样,得到所述初始拼接图像。
8.一种图像融合系统,其特征在于,所述系统包括:
图像获取模块,用于获取初始拼接图像,并对所述初始拼接图像进行图像分割,得到第一区域图像和第二区域图像;
亮度增强模块,用于根据预设亮度数据对所述第一区域图像进行亮度增强处理,得到第一增强图像;
图像拼接模块,用于对所述第一增强图像和所述第二区域图像进行图像拼接,得到第一拼接图像,所述第一拼接图像包括第一拼接区域;
梯度计算模块,用于根据所述第一拼接区域对所述第一拼接图像进行像素梯度计算,得到第一梯度数据;其中,所述第一梯度数据用于表征所述第一拼接区域中所述第一增强图像和所述第二区域图像的像素差值;
图像筛选模块,用于根据所述第一梯度数据和预设梯度阈值从所述第一拼接图像筛选出目标拼接图像;
图像融合模块,用于根据预设权重序列对所述目标拼接图像进行像素融合处理,得到目标融合图像。
9.一种计算机设备,其特征在于,包括:
至少一个存储器;
至少一个处理器;
至少一个计算机程序;
所述至少一个计算机程序被存储在所述至少一个存储器中,所述至少一个处理器执行所述至少一个计算机程序以实现:
如权利要求1至7中任一项所述的方法。
10.一种存储介质,所述存储介质为计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于使计算机执行:
如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310835661.5A CN116703797A (zh) | 2023-07-07 | 2023-07-07 | 图像融合方法、图像融合系统、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310835661.5A CN116703797A (zh) | 2023-07-07 | 2023-07-07 | 图像融合方法、图像融合系统、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116703797A true CN116703797A (zh) | 2023-09-05 |
Family
ID=87827713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310835661.5A Pending CN116703797A (zh) | 2023-07-07 | 2023-07-07 | 图像融合方法、图像融合系统、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116703797A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117474983A (zh) * | 2023-12-27 | 2024-01-30 | 广东力创信息技术有限公司 | 一种基于光视联动的预警方法以及相关装置 |
-
2023
- 2023-07-07 CN CN202310835661.5A patent/CN116703797A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117474983A (zh) * | 2023-12-27 | 2024-01-30 | 广东力创信息技术有限公司 | 一种基于光视联动的预警方法以及相关装置 |
CN117474983B (zh) * | 2023-12-27 | 2024-03-12 | 广东力创信息技术有限公司 | 一种基于光视联动的预警方法以及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109688463B (zh) | 一种剪辑视频生成方法、装置、终端设备及存储介质 | |
US20220237829A1 (en) | Artificial intelligence-based image generation method, device and apparatus, and storage medium | |
CN110798636B (zh) | 字幕生成方法及装置、电子设备 | |
EP4293567A1 (en) | Three-dimensional face reconstruction method and apparatus, device, and storage medium | |
CN112967212A (zh) | 一种虚拟人物的合成方法、装置、设备及存储介质 | |
CN108846792B (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
CN110795925B (zh) | 基于人工智能的图文排版方法、图文排版装置及电子设备 | |
CN110909680A (zh) | 人脸图像的表情识别方法、装置、电子设备及存储介质 | |
KR20200059993A (ko) | 웹툰 제작을 위한 콘티를 생성하는 장치 및 방법 | |
EP4187492A1 (en) | Image generation method and apparatus, and computer device and computer-readable storage medium | |
CN112101344B (zh) | 一种视频文本跟踪方法及装置 | |
CN114241558A (zh) | 模型的训练方法、视频生成方法和装置、设备、介质 | |
CN116703797A (zh) | 图像融合方法、图像融合系统、计算机设备及存储介质 | |
WO2023056835A1 (zh) | 视频封面生成方法、装置、电子设备及可读介质 | |
CN114529785A (zh) | 模型的训练方法、视频生成方法和装置、设备、介质 | |
CN114049290A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN114360073A (zh) | 一种图像识别方法及相关装置 | |
Liu et al. | A3GAN: An attribute-aware attentive generative adversarial network for face aging | |
US20220375223A1 (en) | Information generation method and apparatus | |
CN114513706B (zh) | 视频生成方法和装置、计算机设备、存储介质 | |
CN110427920B (zh) | 一种面向监控环境的实时行人解析方法 | |
CN112784631A (zh) | 一种基于深度神经网络进行人脸情绪识别的方法 | |
CN112132912A (zh) | 建立人脸生成模型以及生成人脸图像的方法、装置 | |
CN116597147A (zh) | 视频合成方法、视频合成装置、电子设备及存储介质 | |
CN117472257B (zh) | 一种基于ai算法的自动转正楷的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |