CN114219744A - 图像生成方法、装置、设备及存储介质 - Google Patents

图像生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114219744A
CN114219744A CN202111415439.7A CN202111415439A CN114219744A CN 114219744 A CN114219744 A CN 114219744A CN 202111415439 A CN202111415439 A CN 202111415439A CN 114219744 A CN114219744 A CN 114219744A
Authority
CN
China
Prior art keywords
semantic
image
candidate image
semantics
brightness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111415439.7A
Other languages
English (en)
Other versions
CN114219744B (zh
Inventor
魏胜禹
杜宇宁
郭若愚
崔程
董水龙
陆彬
郜廷权
刘其文
胡晓光
于佃海
马艳军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111415439.7A priority Critical patent/CN114219744B/zh
Publication of CN114219744A publication Critical patent/CN114219744A/zh
Application granted granted Critical
Publication of CN114219744B publication Critical patent/CN114219744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/94Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20216Image averaging

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Studio Devices (AREA)

Abstract

本公开提供了一种图像生成方法、装置、设备及存储介质,涉及机器学习与智能成像等人工智能技术领域。具体实现方案为:采集同一场景、多组不同曝光参数下拍摄的多张图像;对所述多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域;基于所述至少两个语义中各所述语义对应的所述多个候选图像区域,获取对应所述语义的最佳曝光图像区域;基于所述至少两个语义中各所述语义的所述最佳曝光图像区域,生成目标图像。本公开的技术,能够有效地提高生成的目标图像的质量。

Description

图像生成方法、装置、设备及存储介质
技术领域
本公开涉及计算机技术领域,具体涉及机器学习与智能成像等人工智能技术领域,尤其涉及一种图像生成方法、装置、设备及存储介质。
背景技术
在拍摄图像时,若处于复杂的光线场景中,单次曝光的结果往往成像效果不佳。这时,经常采用多曝光的方法,对同一个场景,用多组不同的感光度、曝光时间和光圈等参数,拍摄得到多张图像;再通过后期的图像融合的方式,合成一张完整的图像。
目前,通过多曝光并融合生成图像的方式,可以根据多张图像的统计信息,进行加权采样,并融合得到。
发明内容
本公开提供了一种图像生成方法、装置、设备及存储介质。
根据本公开的一方面,提供了一种图像生成方法,包括:
采集同一场景、多组不同曝光参数下拍摄的多张图像;
对所述多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域;
基于所述至少两个语义中各所述语义对应的所述多个候选图像区域,获取对应所述语义的最佳曝光图像区域;
基于所述至少两个语义中各所述语义的所述最佳曝光图像区域,生成目标图像。
根据本公开的另一方面,提供了一种图像生成装置,包括:
采集模块,用于采集同一场景、多组不同曝光参数下拍摄的多张图像;
语义分割模块,用于对所述多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域;
获取模块,用于基于所述至少两个语义中各所述语义对应的所述多个候选图像区域,获取对应所述语义的最佳曝光图像区域;
生成模块,用于基于所述至少两个语义中各所述语义的所述最佳曝光图像区域,生成目标图像。根据本公开的再一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。
根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方面和任一可能的实现方式的方法。
根据本公开的再另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。
根据本公开的技术,能够有效地提高生成的目标图像的质量。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是根据本公开第二实施例的示意图;
图3是根据本公开第三实施例的示意图;
图4是根据本公开第四实施例的示意图;
图5是根据本公开第五实施例的示意图;
图6是用来实现本公开实施例的上述方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
需要说明的是,本公开实施例中所涉及的终端设备可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(TabletComputer)等智能设备;显示设备可以包括但不限于个人电脑、电视等具有显示功能的设备。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
考虑到现有的通过多曝光并融合生成图像的方式,主要根据多张图像的亮度进行加权采样,并融合得到。但是该种方法运算较为简单,得到的融合图像多有失真。基于此,本公开提供一种提高图像的质量的图像生成方案。
图1是根据本公开第一实施例的示意图;如图1所示,本实施例提供一种图像生成方法,可以用于任意的图像生成装置中,具体可以包括如下步骤:
S101、采集同一场景、多组不同曝光参数下拍摄的多张图像;
具体地,该多张图像的拍摄时,可以采用同一个图像生成装置静止不动,采用多组不同曝光参数拍摄的。
本实施例中采集的多张图像中除了曝光参数不同导致的亮度不同,其他内容信息完全相同。
S102、对多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域;
S103、基于至少两个语义中各语义对应的多个候选图像区域,获取对应语义的最佳曝光图像区域;
S104、基于至少两个语义中各语义的最佳曝光图像区域,生成目标图像。
在对各图像进行语义分割时,所参考的语义可以指的是图像中的对象,一个对象便对应一个语义。
由于在拍摄图像的过程中,要实现将要拍摄的对象完全纳入图像中,难免会拍摄到其他相关的对象如背景中包括的对象,所以在一张图像中可以包括至少两个对象,即至少两个语义。例如,本实施例中的对象可以为一个物体、一个人、或者一个动物,或者还可以为其他的,如天空、白云、树木花草等都可以作为一个独立的对象。例如,在拍摄人物时,生成的图像中,人物是一个独立的对象,人物背景中的物体是一个对象,若还拍摄到动物、天空或者草地,动物、天空或者草地都是一个独立的对象。当然,若拍摄人物图像中,包括多个人物,每个人物都是一个单独的对象。
具体地,可以通过对图像中的不同对象进行识别,进而基于识别结果对图像进行语义分割,每张图像可以得到至少两个语义的图像区域。对于同一个语义来讲,多张图像中每一张图像中都分割出一个对应的候选图像区域,共可以得到多个候选图像区域。同一语义的多个候选图像区域包括的对象信息除了亮度值不同,其他参数值相同。
每个语义对应的各候选图像区域的曝光参数都不相同,可以参考该语义的所有候选图像区域,获取该语义的最佳曝光图像区域。最后基于获取到至少两个语义中每个语义的最佳曝光图像区域,生成目标图像。即相对于原始的多张图像,目标图像中的语义区域分布与原始的多张图像中完全相同,但是每个语义区域都是最佳曝光图像,所以能够有效地提高生成的图像的质量。
本实施例的图像生成方法,通过语义分割,获取到至少两个语义中各语义对应的多个候选图像区域,并进一步获取各语义的最佳曝光图像区域;进而基于至少两个语义中各语义的最佳曝光图像区域,生成目标图像,能够使得目标图像中各语义的图像区域都是最佳曝光图像区域,不会出现失真等问题,能够有效地提高生成的目标图像的质量。
图2是根据本公开第二实施例的示意图;本实施例在上述图1所示实施例的技术方案的基础上,进一步更加详细地介绍本公开的技术方案。如图2所示,本实施例的图像生成方法,具体可以包括如下步骤:
S201、采集同一场景、多组不同曝光参数下拍摄的多张图像;
S202、采用预先训练的语义分割模型,对多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域;
本实施例的语义分割模型,为一个预先训练的神经网络模型。使用时,将一张图像输入至该语义分割模型中,该语义分割模型可以将图像中的每个语义区域分割出来,得到多个图像区域,每个图像区域都是对应语义的一个候选图像区域。采用该语义分割模型对多张图像分别进行语义分割出来,这样,可以得到每个语义的多个候选图像区域。
本实施例的语义分割模型,可以采用多张训练图像以及各训练图像对应的至少两个语义的图像区域,对其进行训练,使得语义分割模型学习到对图像中的至少两个语义区域进行语义分割。
本实施例中,采用该语义分割模型对对图像进行语义分割,能够提高得到的各语义对应的多个候选图像区域的准确性和智能性。
S203、统计各语义对应的各候选图像区域内各像素点的亮度值;
具体地,对于每个语义对应的每个候选图像区域,统计该候选图像区域内所有像素点的亮度值。
S204、检测各语义对应的各候选图像区域内亮度值高于第一预设亮度阈值、或者低于第二预设亮度阈值的像素点是否超过对应的候选图像区域内的像素点数量的预设比例;若是,执行步骤S205;否则,暂不做任何处理,即保留该候选图像区域,然后执行步骤S206;
S205;舍弃对应的候选图像区域;执行步骤S206;
本实施例中,第二预设亮度阈值大于第一预设亮度阈值。第一预设亮度阈值和第二预设亮度阈值可以根据实际经验来设置。实际应用中,若像素点的亮度值大于该第二预设亮度阈值,则认为该像素点过曝。而多某个像素点的亮度值小于第一预设亮度阈值,则认为该像素点欠曝。过曝和欠曝都会影响图像质量。所以,该步骤中,可以检测每个语义对应的每个候选图像区域内过曝或者欠曝的像素点的数量是否超过预设比例,若超过,则说明该候选图像区域的质量较差,此时可以舍弃该候选图像区域。
本实施例中的预设比例可以基于经验来设置,如20%,30%或者其他比例。
S206、检测所有语义的所有候选块是否都被检测过,若是,执行步骤S207,否则,返回步骤S204继续检测;
S207、对于各语义,统计该语义的多个候选图像区域中各像素点的亮度的平均值,作为对应的语义的最佳曝光图像区域中各像素点的亮度值;
例如,一个语义对应K个候选图像区域,且K个候选图像区域的像素点的位置完全对应。对于每个像素点,可以分别获取K个候选图像区域中该像素点上的亮度值,并求平均,作为该语义的最佳曝光图像区域的该像素点的亮度值。
S208、基于各语义的最佳曝光图像区域中各像素点的亮度值,生成对应语义的最佳曝光图像区域;
具体地,得到各语义的最佳曝光图像区域中各像素点的亮度值之后,将各语义的最佳曝光图像区域内各像素点的亮度值,融合在一起,生成该语义的最佳曝光区域。
步骤S207-S208为上述图1所示实施例的步骤S103的一种实现方式。该方式生成的每个语义的最佳曝光区域中,各像素点的亮度值取有效地的候选图像区域的亮度的平均值,能够有效地保证亮度值的合理性和准确性。
S209、基于至少两个语义中各语义的最佳曝光图像区域,生成目标图像。
具体地,将至少两个语义中各语义的最佳曝光图像区域,按照原来的多张图像中各语义的区域所在的位置进行拼接,生成目标图像。
需要说明的是,本实施例的步骤S203-S206为每个语义的多个候选图像区域进行过曝或者欠曝的检测,去除质量较差的候选图像区域,能够提高获取的语义的最佳曝光图像区域的准确性。当然,实际应用中,若语义的多个候选图像区域中不存在过曝或者欠曝的问题,也可以去除步骤S203-S206,能够节省流程,有效地提高图像生成的效率。
本实施例的图像生成方法,通过采用上述方式,能够确保生成的每个语义的最佳曝光图像区域的准确性,进而可以有效地保证生成的目标图像的准确性,不会出现失真等问题,能够有效地提高生成的目标图像的质量。
图3是根据本公开第三实施例的示意图;本实施例在上述图1所示实施例的技术方案的基础上,进一步更加详细地介绍本公开的技术方案。如图3所示,本实施例的图像生成方法,具体可以包括如下步骤:
S301、采集同一场景、多组不同曝光参数下拍摄的多张图像;
S302、从多张图像中选取一张,作为参考图像;
具体地,可以从多张个图像中随机选取一张作为参考图像。但是为了避免选取到低质量的参考图像,优选地,可以从多张图像中获取曝光参数居中的一张,作为参考图像。例如,可以从多张图像中获取曝光时长居中的一张,作为参考图像,以保证选取的参考图像的质量。
S303、采用预先训练的语义分割模型,对参考图像进行语义分割,得到参考图像中的至少两个语义中各语义对应的候选图像区域以及对应的分割信息;
具体地,语义分割模型的分割方式可以参考上述图2所示实施例的步骤S202。其中各语义对应的候选图像区域的分割信息可以为各语义的候选图像区域的边界像素点坐标。每个候选图像区域的边界像素点坐标正好可以围起来候选图像区域。
S304、参考参考图像中各语义对应的候选图像区域的分割信息,对多张图像中参考图像之外的其他图像按照语义进行分割,共得到至少两个语义中各语义对应的多个候选图像区域;
由于同一语义的各候选图像区域内的信息,除了亮度值不同,其他内容完全相同。所以,可以参考参考图像中各语义的候选图像区域的分割信息,对其他各图像按照语义进行分割,最终使得多张图像都进行了语义分割,可以得到每个语义对应的多个候选图像区域。通过该方式,也能够准确地得到至少两个语义中各语义对应的多个候选图像区域。
S305、统计各语义对应的各候选图像区域内各像素点的亮度值;
S306、检测各语义对应的各候选图像区域内亮度值高于第一预设亮度阈值、或者低于第二预设亮度阈值的像素点是否超过对应的候选图像区域内的像素点数量的预设比例;若是,执行步骤S307;否则,暂不做任何处理,即保留该候选图像区域,然后执行步骤S308;
第二预设亮度阈值大于第一预设亮度阈值。
S307;舍弃对应的候选图像区域;执行步骤S308;
S308、检测所有语义的所有候选块是否都被检测过,若是,执行步骤S309,否则,返回步骤S306继续检测;
步骤S305-S308可以参考上述图2所示实施例的步骤203-S206,在此不再赘述。
S309、对于各语义,计算对应的各候选图像区域内所有像素点的亮度的平均值;执行步骤S310;
具体地,对于一个语义而言,计算该语义的每个候选图像区域内所有像素点的亮度的平均值,这样,一个候选图像区域,对应一个亮度平均值。
S310、基于各候选图像区域内所有像素点的亮度的平均值,计算多个候选图像区域的所有像素点的亮度的平均值的平均值,作为亮度参考值;执行步骤S311;
具体地,将同一个语义的多个候选图像区域的多个亮度平均值再求平均,作为亮度参考值。
S311、从多个候选图像区域中,获取所有像素点的亮度的平均值与亮度参考值最接近的候选图像区域,作为语义的最佳曝光图像区域。
例如,一个语义,对应N个候选图像区域,按照步骤S309,每个候选图像区域对应一个亮度平均值,则可以得到N个亮度平均值。再按照步骤S310,计算N个亮度平均值的平均值,如即为O。那么按照步骤S311,从N个亮度平均值中获取距离O最近的亮度平均值对应的候选图像区域,作为该语义的最佳曝光图像区域。
步骤S309-S311为上述图1所示实施例的步骤S103的一种实现方式。与上述图2所示实施例的步骤S207-S208相比,本实施例中,没有融合新的图像区域作为语义的最佳曝光图像区域,而是从语义的多个候选图像区域中获取亮度值距离亮度参考值最近的候选图像区域,作为该语义的最佳曝光图像区域。该方式得到的语义的最佳曝光图像区域由于不用融合新的区域,所以获取过程更加快捷。而且获取过程也非常合理,能够保证最佳曝光图像区域的质量最佳。
S312、基于至少两个语义中各语义的最佳曝光图像区域,生成目标图像。
具体地,将至少两个语义中各语义的最佳曝光图像区域,按照原来的多张图像中各语义的区域所在的位置进行拼接,生成目标图像。
本实施例的图像生成方法,通过采用上述方式,能够确保生成的每个语义的最佳曝光图像区域的合理性,进而可以有效地保证生成的目标图像的准确性及合理性,不会出现失真等问题,能够有效地提高生成的目标图像的质量。
图4是根据本公开第四实施例的示意图;如图4所示,本实施例提供一种图像生成装置400,包括:
采集模块401,用于采集同一场景、多组不同曝光参数下拍摄的多张图像;
语义分割模块402,用于对多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域;
获取模块403,用于基于至少两个语义中各语义对应的多个候选图像区域,获取对应语义的最佳曝光图像区域;
生成模块404,用于基于至少两个语义中各语义的最佳曝光图像区域,生成目标图像。
本实施例的图像生成装置400,通过采用上述模块实现图像生成的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述相关实施例的记载,在此不再赘述。
图5是根据本公开第五实施例的示意图;在上述图4所示实施例的基础上,进一步更加详细地描述本公开的技术方案。如图5所示,本实施例的成像中的图像生成装置500,包括图4所述实施例的同名同功能模块采集模块501、语义分割模块502、获取模块503和生成模块504。
在本实施例中,语义分割模块502,用于:
采用预先训练的语义分割模型,对多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域。
在本公开的一个实施例中,语义分割模块502,用于:
从多张图像中获取一张,作为参考图像;
采用预先训练的语义分割模型,对参考图像进行语义分割,得到参考图像中的至少两个语义中各语义对应的候选图像区域以及对应的分割信息;
参考参考图像中各语义对应的候选图像区域的分割信息,对多张图像中参考图像之外的其他图像按照语义进行分割,得到至少两个语义中各语义对应的多个候选图像区域。
在本公开的一个实施例中,语义分割模块502,用于:
从多张图像中选取曝光参数居中的一张,作为参考图像。
在本公开的一个实施例中,获取模块503,用于:
对于至少两个语义中各语义,统计语义对应的多个候选图像区域中各像素点的亮度的平均值,作为对应的语义的最佳曝光图像区域中各像素点的亮度值;
基于各语义的最佳曝光图像区域中各像素点的亮度值,融合生成对应语义的最佳曝光图像区域。
如图5所示,在本公开的一个实施例中,图像生成装置500,还包括:
统计模块505,用于统计至少两个语义中各语义对应的各候选图像区域内各像素点的亮度值;
检测模块506,用于检测各语义对应的各候选图像区域内亮度值高于第一预设亮度阈值、或者低于第二预设亮度阈值的像素点是否超过对应的候选图像区域内的像素点数量的预设比例;
处理模块507,用于若是,舍弃对应的候选图像区域。
在本公开的一个实施例中,获取模块503,用于:
对于至少两个语义中各语义,计算对应的各候选图像区域内所有像素点的亮度的平均值;
基于各候选图像区域内所有像素点的亮度的平均值,计算多个候选图像区域的所有像素点的亮度的平均值的平均值,作为亮度参考值;
从多个候选图像区域中,获取所有像素点的亮度的平均值与亮度参考值最接近的候选图像区域,作为语义的最佳曝光图像区域。
本实施例的图像生成装置500,通过采用上述模块实现图像生成的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述相关实施例的记载,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如本公开的上述方法。例如,在一些实施例中,本公开的上述方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的本公开的上述方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行本公开的上述方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (17)

1.一种图像生成方法,包括:
采集同一场景、多组不同曝光参数下拍摄的多张图像;
对所述多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域;
基于所述至少两个语义中各所述语义对应的所述多个候选图像区域,获取对应所述语义的最佳曝光图像区域;
基于所述至少两个语义中各所述语义的所述最佳曝光图像区域,生成目标图像。
2.根据权利要求1所述的方法,其中,对所述多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域,包括:
采用预先训练的语义分割模型,对所述多张图像中的各图像进行语义分割,得到所述至少两个语义中各所述语义对应的所述多个候选图像区域。
3.根据权利要求1所述的方法,其中,对所述多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域,包括:
从所述多张图像中获取一张,作为参考图像;
采用预先训练的语义分割模型,对所述参考图像进行语义分割,得到所述参考图像中的至少两个语义中各所述语义对应的候选图像区域以及对应的分割信息;
参考所述参考图像中各所述语义对应的候选图像区域的分割信息,对所述多张图像中所述参考图像之外的其他图像按照语义进行分割,得到所述至少两个语义中各所述语义对应的所述多个候选图像区域。
4.根据权利要求3所述的方法,其中,从所述多张图像中获取一张,作为参考图像,包括:
从所述多张图像中选取曝光参数居中的一张,作为所述参考图像。
5.根据权利要求1所述的方法,其中,基于所述至少两个语义中各所述语义对应的所述多个候选图像区域,获取对应所述语义的最佳曝光图像区域,包括:
对于所述至少两个语义中各所述语义,统计所述语义对应的所述多个候选图像区域中各像素点的亮度的平均值,作为对应的所述语义的最佳曝光图像区域中各像素点的亮度值;
基于各所述语义的最佳曝光图像区域中各像素点的亮度值,融合生成对应所述语义的最佳曝光图像区域。
6.根据权利要求5所述的方法,其中,对于所述至少两个语义中各所述语义,统计所述语义对应的所述多个候选图像区域中各像素点的亮度的平均值,作为对应的所述语义的最佳曝光图像区域中各像素点的亮度值之前,还包括:
统计所述至少两个语义中各所述语义对应的各所述候选图像区域内各所述像素点的亮度值;
检测各所述语义对应的各所述候选图像区域内所述亮度值高于第一预设亮度阈值、或者低于第二预设亮度阈值的像素点是否超过对应的所述候选图像区域内的像素点数量的预设比例;
若是,舍弃对应的所述候选图像区域。
7.根据权利要求1-6任一所述的方法,其中,基于所述至少两个语义中各所述语义对应的所述多个候选图像区域,获取对应所述语义的最佳曝光图像区域,包括:
对于所述至少两个语义中各所述语义,计算对应的各所述候选图像区域内所有像素点的亮度的平均值;
基于各所述候选图像区域内所有像素点的亮度的平均值,计算所述多个候选图像区域的所有像素点的亮度的平均值的平均值,作为亮度参考值;
从所述多个候选图像区域中,获取所有像素点的亮度的平均值与所述亮度参考值最接近的所述候选图像区域,作为所述语义的最佳曝光图像区域。
8.一种图像生成装置,包括:
采集模块,用于采集同一场景、多组不同曝光参数下拍摄的多张图像;
语义分割模块,用于对所述多张图像中的各图像进行语义分割,得到至少两个语义中各语义对应的多个候选图像区域;
获取模块,用于基于所述至少两个语义中各所述语义对应的所述多个候选图像区域,获取对应所述语义的最佳曝光图像区域;
生成模块,用于基于所述至少两个语义中各所述语义的所述最佳曝光图像区域,生成目标图像。
9.根据权利要求8所述的装置,其中,所述语义分割模块,用于:
采用预先训练的语义分割模型,对所述多张图像中的各图像进行语义分割,得到所述至少两个语义中各所述语义对应的所述多个候选图像区域。
10.根据权利要求8所述的装置,其中,所述语义分割模块,用于:
从所述多张图像中获取一张,作为参考图像;
采用预先训练的语义分割模型,对所述参考图像进行语义分割,得到所述参考图像中的至少两个语义中各所述语义对应的候选图像区域以及对应的分割信息;
参考所述参考图像中各所述语义对应的候选图像区域的分割信息,对所述多张图像中所述参考图像之外的其他图像按照语义进行分割,得到所述至少两个语义中各所述语义对应的所述多个候选图像区域。
11.根据权利要求10所述的装置,其中,所述语义分割模块,用于:
从所述多张图像中选取曝光参数居中的一张,作为所述参考图像。
12.根据权利要求8所述的装置,其中,所述获取模块,用于:
对于所述至少两个语义中各所述语义,统计所述语义对应的所述多个候选图像区域中各像素点的亮度的平均值,作为对应的所述语义的最佳曝光图像区域中各像素点的亮度值;
基于各所述语义的最佳曝光图像区域中各像素点的亮度值,融合生成对应所述语义的最佳曝光图像区域。
13.根据权利要求12所述的装置,其中,所述装置还包括:
统计模块,用于统计所述至少两个语义中各所述语义对应的各所述候选图像区域内各所述像素点的亮度值;
检测模块,用于检测各所述语义对应的各所述候选图像区域内所述亮度值高于第一预设亮度阈值、或者低于第二预设亮度阈值的像素点是否超过对应的所述候选图像区域内的像素点数量的预设比例;
处理模块,用于若是,舍弃对应的所述候选图像区域。
14.根据权利要求8-13任一所述的装置,其中,所述获取模块,用于:
对于所述至少两个语义中各所述语义,计算对应的各所述候选图像区域内所有像素点的亮度的平均值;
基于各所述候选图像区域内所有像素点的亮度的平均值,计算所述多个候选图像区域的所有像素点的亮度的平均值的平均值,作为亮度参考值;
从所述多个候选图像区域中,获取所有像素点的亮度的平均值与所述亮度参考值最接近的所述候选图像区域,作为所述语义的最佳曝光图像区域。
15.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
CN202111415439.7A 2021-11-25 2021-11-25 图像生成方法、装置、设备及存储介质 Active CN114219744B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111415439.7A CN114219744B (zh) 2021-11-25 2021-11-25 图像生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111415439.7A CN114219744B (zh) 2021-11-25 2021-11-25 图像生成方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114219744A true CN114219744A (zh) 2022-03-22
CN114219744B CN114219744B (zh) 2023-01-06

Family

ID=80698384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111415439.7A Active CN114219744B (zh) 2021-11-25 2021-11-25 图像生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114219744B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106791410A (zh) * 2016-12-28 2017-05-31 深圳天珑无线科技有限公司 一种拍照装置及其拍照方法
CN106851063A (zh) * 2017-02-27 2017-06-13 努比亚技术有限公司 一种基于双摄像头的曝光调节终端及方法
CN109104578A (zh) * 2018-09-21 2018-12-28 维沃移动通信有限公司 一种图像处理方法及移动终端
CN111028189A (zh) * 2019-12-09 2020-04-17 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质及电子设备
CN112153298A (zh) * 2019-06-28 2020-12-29 北京地平线机器人技术研发有限公司 确定目标对象理想亮度的方法及装置
CN112449120A (zh) * 2019-08-30 2021-03-05 华为技术有限公司 高动态范围视频生成方法及装置
CN112767295A (zh) * 2021-01-14 2021-05-07 Oppo广东移动通信有限公司 图像处理方法、图像处理装置、存储介质与电子设备
CN113170037A (zh) * 2018-12-06 2021-07-23 华为技术有限公司 一种拍摄长曝光图像的方法和电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106791410A (zh) * 2016-12-28 2017-05-31 深圳天珑无线科技有限公司 一种拍照装置及其拍照方法
CN106851063A (zh) * 2017-02-27 2017-06-13 努比亚技术有限公司 一种基于双摄像头的曝光调节终端及方法
CN109104578A (zh) * 2018-09-21 2018-12-28 维沃移动通信有限公司 一种图像处理方法及移动终端
CN113170037A (zh) * 2018-12-06 2021-07-23 华为技术有限公司 一种拍摄长曝光图像的方法和电子设备
CN112153298A (zh) * 2019-06-28 2020-12-29 北京地平线机器人技术研发有限公司 确定目标对象理想亮度的方法及装置
CN112449120A (zh) * 2019-08-30 2021-03-05 华为技术有限公司 高动态范围视频生成方法及装置
CN111028189A (zh) * 2019-12-09 2020-04-17 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质及电子设备
CN112767295A (zh) * 2021-01-14 2021-05-07 Oppo广东移动通信有限公司 图像处理方法、图像处理装置、存储介质与电子设备

Also Published As

Publication number Publication date
CN114219744B (zh) 2023-01-06

Similar Documents

Publication Publication Date Title
CN108337551B (zh) 一种屏幕录制方法、存储介质及终端设备
CN107908998B (zh) 二维码解码方法、装置、终端设备及计算机可读存储介质
CN111368587B (zh) 场景检测方法、装置、终端设备及计算机可读存储介质
CN112989995B (zh) 文本检测方法、装置及电子设备
CN112861885B (zh) 图像识别方法、装置、电子设备及存储介质
CN111985281A (zh) 图像生成模型的生成方法、装置及图像生成方法、装置
CN112561879A (zh) 模糊度评价模型训练方法、图像模糊度评价方法及装置
CN113705381B (zh) 雾天的目标检测方法、装置、电子设备以及存储介质
CN117152182B (zh) 一种超低照度网络相机图像处理方法、装置及电子设备
CN113158773B (zh) 一种活体检测模型的训练方法及训练装置
CN112732553A (zh) 图像测试方法、装置、电子设备及存储介质
CN114255177B (zh) 成像中的曝光控制方法、装置、设备及存储介质
CN114219744B (zh) 图像生成方法、装置、设备及存储介质
CN114255493A (zh) 图像检测方法、人脸检测方法及装置、设备及存储介质
CN114387651B (zh) 一种人脸识别方法、装置、设备及存储介质
CN115937039A (zh) 数据扩充方法、装置、电子设备及可读存储介质
CN113011328B (zh) 图像处理方法、装置、电子设备及存储介质
CN115273184A (zh) 人脸活体检测模型训练方法及装置
CN112085002A (zh) 人像分割方法、装置、存储介质及电子设备
CN112861687A (zh) 用于门禁系统的口罩佩戴检测方法、装置、设备和介质
CN112183431A (zh) 实时行人数量统计方法、装置、相机和服务器
CN114581746B (zh) 物体检测方法、装置、设备及介质
CN111383237B (zh) 一种图像分析方法、装置及终端设备
CN113643266B (zh) 图像检测方法、装置及电子设备
CN112785487B (zh) 图像处理方法及装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant