CN114945944A - 用于数字图像的噪声合成 - Google Patents

用于数字图像的噪声合成 Download PDF

Info

Publication number
CN114945944A
CN114945944A CN202080092488.9A CN202080092488A CN114945944A CN 114945944 A CN114945944 A CN 114945944A CN 202080092488 A CN202080092488 A CN 202080092488A CN 114945944 A CN114945944 A CN 114945944A
Authority
CN
China
Prior art keywords
noise
image
block
probability
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080092488.9A
Other languages
English (en)
Inventor
H·卡杜
B·维斯瓦纳特
苏冠铭
S·N·胡利亚卡尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN114945944A publication Critical patent/CN114945944A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/265Mixing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/52Parallel processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Discrete Mathematics (AREA)
  • Image Processing (AREA)
  • Image Generation (AREA)

Abstract

用于对合成数字图像的噪声的问题提供基于软件和硬件的解决方案的装置和方法。根据一个方面,生成概率图像并且将噪声块随机放在所述概率图像中的位置处,从而创建合成的噪声图像,其中,所述位置具有与阈值准则作比较的概率值。实施例包括生成合成的胶片颗粒图像以及合成的数字相机噪声图像。

Description

用于数字图像的噪声合成
相关申请的交叉引用
本申请要求于2019年12月19日提交的美国临时专利申请号62/950,466以及于2019年12月19日提交的欧洲专利申请号19218144.4的优先权权益,这两个专利申请通过引用以其全文并入本文。
技术领域
本公开总体上涉及图像。更特别地,本公开的实施例涉及合成图像的胶片颗粒和相机噪声。
背景技术
如本文所使用的,术语噪声合成是指通过与噪声正常发生方式不同的手段来为数字图像(包括视频帧)生成噪声效应。除非在本文的描述中明确指定特定意义在任何时候都具有特定含义,否则应推断出,可以在任一意义上例如可互换地使用所述术语。
在数字技术出现之前,照相胶片条是传统照相术的画布。这种胶片是用感光材料(例如,卤化银)覆盖以吸收从要拍摄的对象发出或反射的光的薄塑料片材。在处理这些胶片之后,可以将所捕获的光转化成图像。如本文所使用的,“胶片颗粒”是指由于染料云(或银粒子)接收足够的光子而在经处理的图像中形成的视觉纹理。它是由在胶片的处理期间发生的化学过程引起的光学现象,并且取决于观察胶片所用的清晰度和所使用的胶片库的类型两者。
数字照相术本质上缺乏胶片颗粒效应。但由于艺术和质量的原因,它仍然是被期望的。例如,好莱坞工作室更喜欢电影内容具有胶片颗粒。对于数字图像,胶片颗粒图案必须在后期处理期间合成并覆加在图像上。
“相机噪声”是指由于相机的电子器件(如传感器大小、曝光时间、ISO设置等)而导致的数字图像中的明亮度和/或颜色(图像上的彩色斑点)的变化。典型地,通过不同的技术将相机噪声从数字图像移除以便避免压缩的问题,但在一些情况下期望相机噪声使图像保持所述图像在被捕获时具有的原始“外观”。
如本文所使用的,术语“元数据”与作为经编码比特流的一部分传输并且辅助解码器渲染经解码图像的任何辅助信息有关。这种元数据可以包括但不限于如本文所描述的颜色空间或色域信息、参考显示器参数和辅助信号参数。
实际上,数字图像包括一个或多个颜色分量(例如,亮度Y以及色度Cb和Cr),其中,每个颜色分量由每像素n位的精度表示(例如,n=8)。使用线性光亮度编码,其中n<8的图像(例如,彩色24位JPEG图像)被视为标准动态范围(SDR)的图像,而其中n>8的图像可以被视为增强动态范围(EDR)的图像。EDR和高动态范围(HDR)图像还可以使用高精度(例如,16位)浮点格式来存储和分布,如由工业光魔公司(Industrial Light and Magic)开发的OpenEXR文件格式。
如本文所使用的,术语“噪声合成”包括但不限于在数字图像中合成通常由胶片/视频/图像捕获或显影引起的噪声(如胶片颗粒或相机噪声)。所述术语还可以是指出于任何目的而人为地插入到数字图像中的任何噪声。
在本节中描述的方法是可以追寻的方法,但不一定是先前已经设想到或追寻的方法。因此,除非另有指明,否则不应该认为本节中所描述的任何方法仅凭其纳入本节就可被视为现有技术。类似地,除非另有指明,否则不应认为基于本节而已经在任何现有技术中认识到关于一种或多种方法所识别的问题。
发明内容
根据本公开的装置和方法对合成数字图像的噪声的问题提供解决方案。根据本公开的实施例,将合成的胶片颗粒添加到清洁的(即,无噪声的)数字序列。
如本文所呈现的合成噪声的过程在图像传输和显示中具有许多优势。例如,在传输后合成噪声的能力允许传输无噪声的压缩图像,这可以提供提高的传输效率(数据速度、带宽等)。将合成的噪声添加到未压缩图像可以降低所显示图像中的压缩伪影的效应。使用噪声块允许实现对胶片颗粒大小、清晰度和类型(噪声源模仿)的控制,并且噪声块在图像中的随机放置防止会由平铺放置导致的阻挡伪影。此外,对于基于硬件的实施方式,使用按线处理允许实现噪声合成的资源高效植入。
根据本公开的第一方面,公开了一种用于为数字图像创建合成的噪声图像的基于计算机的方法,所述方法包括:提供多个噪声块图案;初始化噪声图像;生成概率图像,所述概率图像包括在所述概率图像的每个像素处的随机生成的概率值,将所述概率图像中的每个概率值与阈值准则作比较;如果所述概率值满足所述阈值准则,则从所述多个噪声块图案中选择噪声块图案,所述噪声块图案具有锚点;以及如果所述概率值满足所述阈值准则,则通过将所述噪声块图案放在所述噪声图像中使得所述锚点与所述概率图像中符合所述阈值准则的像素相对应来创建合成的噪声图像。
所述噪声颗粒块图案可以是随机选择的。所述概率图像的所述概率值可以是均匀分布的概率值。所述噪声块图案可以包括胶片颗粒块图案。所述方法还可以包括聚合所述噪声图像的其中所述噪声块图案重叠的区域中的值。所述方法可以包括在生成所述噪声图像之前生成所述噪声块图案,其中,所述噪声块图案是通过逆DCT技术生成的。这个生成可以包括移除低频率DCT系数和/或移除高频率DCT系数。所述概率图像和所述噪声图像的大小可以被确定为与视频帧相匹配。所述方法可以包括通过将所述噪声图像添加到内容图像的通道来编辑所述内容图像。所述方法可以包括在将所述噪声图像添加到所述内容图像之前将所述噪声图像中的值乘以调制因数。所述值可以是所述噪声图像的亮度强度值。所述方法可以包括基于所述经编辑的内容图像来生成YUV内容图像。所述方法可以包括基于所述YUV内容图像来生成RGB内容图像。所述方法可以在计算机程序产品上运行,所述计算机程序产品包括被编码成执行所述方法的数据。
可以通过噪声合成模块运行所述方法以为设备创建合成的噪声图像。所述设备可以包括解码器,所述解码器对经编码图像进行解码,从而创建经解码的清洁序列,其中,所述解码器被配置成组合所述合成的噪声图像与所述经解码的清洁序列,从而创建用于显示的经渲染图像。所述设备可以包括调制曲线模块,所述调制曲线模块用于在与所述经解码的清洁序列组合之前调制所述合成的噪声图像。
根据本公开的第二方面,一种用于在图像中创建合成的噪声的设备,所述设备包括:线缓冲器,所述线缓冲器包括来自所述图像的行;固件,所述固件包括噪声块图案;伪随机数生成器,所述伪随机数生成器为所述行中的像素提供随机值;用于将所述随机值与阈值准则作比较的逻辑;NBMT数据存储区,所述NBMT数据存储区包括噪声块管理表;基于来自所述固件的随机噪声块图案与所述行中的像素相关联来填充所述噪声块管理表的逻辑,其中,与所述像素相关联的所述随机值符合所述阈值准则;基于所述噪声块管理表来计算所述图像的行中的每个像素位置的噪声值的逻辑;以及基于所述噪声值来修改所述行的逻辑。
所述设备可以包括用于从所述图像确定调制曲线、计算调制因数且在修改所述行之前将所述调制因数应用于所述噪声值的逻辑。所述伪随机噪声生成器可以基于行索引和随机偏移值来生成随机数。所述图像可以是亮度通道图像或色度通道图像。所述设备可以包括并行处理所述图像的多个伪随机数生成器和多个线缓冲器。
根据本公开的第三方面,一种用于为解码器生成元数据的方法,所述方法包括:设置噪声类别参数;设置块大小参数;设置阈值参数;以及设置调制因数曲线参数。
用于生成元数据的所述方法可以包括设置噪声方差参数、设置多个块图案参数和/或设置噪声块管理表条目参数。
附图说明
图1根据实施例描绘了包括噪声合成模块的示例解码器系统。
图2A和图2B根据实施例图示了用于生成胶片颗粒块图案的示例性DCT矩阵。
图3根据实施例描绘了利用合成的噪声生成的示例解码器系统。
图4根据实施例描绘了将噪声添加到图像的亮度通道的过程的示例流程图。
图5根据实施例示出了具有固定α的亮度调制曲线的示例。
图6根据实施例示出了具有固定β的亮度调制曲线的示例。
图7根据实施例示出了具有颜色转换的胶片颗粒合成的示例。
图8根据实施例示出了具有颜色转换的相机噪声合成的示例。
图9根据实施例示出了用于通过硬件生成注入合成的胶片颗粒的内容的示例框图。
图10根据实施例示出了可以如何在硬件中在胶片颗粒方面评估图像的每个像素的示例。
图11根据实施例示出了用于与硬件实施方式一起使用的示例16位寄存器。
图12根据实施例示出了如何从伪随机数生成器中挑选块ID位的示例。
图13根据实施例示出了NBMT到像素值逻辑的示例。
图14根据实施例示出了将基于软件的(原始)调制曲线和基于硬件的(分段线性)调制曲线作比较的示例曲线图。
图15根据实施例示出了数字相机噪声合成的硬件实施方式的示例框图。
图16根据实施例示出了用于色度通道的示例简化相机噪声合成系统/方法。
图17根据实施例示出了用于硬件实施方式的示例统一噪声注入架构。
定义
在整个公开中,概率图像被定义为由随机值构成的数字图像。
噪声是指由除使环境成像以外的效应导致的数字图像中的明亮度(亮度)和/或颜色(色度)信息的随机变化。
胶片颗粒是指图像上的如将由胶片处理引起的随机光学纹理。胶片颗粒是亮度通道中的噪声。
颗粒大小是指胶片颗粒的单独颗粒的平均直径。
相机噪声是指图像上的如将由数字相机硬件引起的随机光学纹理。相机噪声是亮度通道和色度通道两者中的噪声。非合成的相机噪声由包括传感器大小、热效应、长曝光时间、高ISO设置等的多个原因引起。
DCT是指离散余弦变换,并且IDCT是指逆离散余弦变换。
数字图像是指用数字表示的图像或视频的帧。
具体实施方式
本文描述了用于将如胶片颗粒或相机噪声等噪声合成到数字图像(包括视频)上的系统和方法。在以下描述中,出于解释的目的,阐述了许多具体细节以便提供对本公开的透彻理解。然而,显而易见的是,可以在没有这些具体细节的情况下实践当前要求保护的主题。在其他情形中,为了避免不必要的遮蔽、模糊或混淆本公开,没有详尽地描述众所周知的结构和设备。
图1描绘了实施噪声合成的解码器的示例架构。发送经编码图像(111)和其对应的元数据(112)的比特流(110)被系统接收。解码器(120)将图像解码成经解码的清洁序列(125)。由于经编码图像(111)是由清除了任何噪声预编码的图像产生的,因此经解码的清洁序列(125)也是(大多数情况)无噪声的。元数据(112)向噪声合成模块(130)提供参数,并且可选地向调制曲线模块(140)提供参数。噪声合成模块(130)使用元数据(112)来创建合成的噪声图像(135)。这个合成的噪声图像(135)可以从调制曲线模块(140)中穿过以产生经调制噪声图像(145)。经解码的清洁序列(125)和经调制噪声图像(145)(或如果未执行调制,则是合成的噪声图像(135))在一个或多个通道中被组合(150)以产生用于显示的经渲染图像(155)或用于在显示之前进行颜色转换。
噪声合成不需要捆绑到解码器。例如,视频制作者可以使用噪声合成进行视频制作预发布。对于非解码器实施方式的情况,经解码的清洁序列(125)可替换为要编辑的内容图像。例如,噪声图像可以通过调色师来合成,然后在被添加到内容图像之前稍后被调制。
取决于期望的效应,噪声可以在亮度通道、色度通道或两者中。例如,为了模仿胶片颗粒,噪声可以仅在亮度通道中。为了模仿由数字相机硬件引发的噪声,噪声可以在亮度通道和色度通道中。可以通过适当地调整元数据参数来进行各种类型的噪声模仿。
可以通过如下过程来合成数字图像的噪声:通过概率图像将噪声块图案添加到图像。构思是在逐像素的基础上添加块图案,而不是将原始图像划分成块。
为了合成大小为B×B的胶片颗粒块图案,以标准正态随机数(例如,B=4、8等)的B×B矩阵M开始。矩阵M表示2D DCT系数,其中,左上是DC(频率=0)系数并且右下是最高频率AC(频率>0)系数。DC系数被标记为1(210)并且标签以之字形顺序增加,如在图2A中针对4×4块示例所示出的。
这些频率系数可以大体上分类为三个带,即低、中和高,如图2B所示出的。保留M中的中频带(230),而移除低频率分量(220)和高频率分量(240)(或替代性地,仅移除多个或一个低频率分量(220))。例如,在4×4块中,可以保留标记为4至10的频率系数并且可以移除系数1至3和11至16。可以被保留的频率系数的范围是可定制的,其中,至少移除系数1。
让Mmid表示矩阵M,其中仅保留中频率系数且将低/高系数设置为零。胶片颗粒块Graw以通过对Mmid进行逆DCT来构建,如方程1中所示出的。
Graw=iDCT(Mmid) 方程1
块是通过将每个元素除以能量E来归一化的,并且然后将块缩放到期望的乘数V,如方程2中所示出的。
Figure BDA0003735331620000061
Thnorm是被归一化到区间[0,1)的阈值。Thnorm的示例值是0.1。
Figure BDA0003735331620000063
是噪声方差。噪声方差是可调参数。16位图像的示例范围可以是1000至6000。
在最后执行四舍五入以去掉任何小数部分,如方程3中所示出的。
Figure BDA0003735331620000062
在下文概述用于计算胶片颗粒矩阵G的伪代码。函数zigzag()给出了在矩阵中的每个位置处的频率标签。要保留的频率系数的范围是[fs,fe]。
Figure BDA0003735331620000071
可以构建具有不同块尺寸的多个噪声图案以稍后用于将合成的噪声图像放在一起。4×4、8×8、16×16和32×32是一些典型的块大小。可以通过修改频率范围来改变胶片颗粒的大小。如果更接近LF区域的频率系数的比例在频率范围[fs,fe]中是显著的,则颗粒大小将更大。相反,如果更接近HF区域的频率系数的部分是显著的,则其将产生更小的颗粒。对于8×8块示例,与[4-36]相比较,频率系数范围[4-10]将产生更大的颗粒。
具有不同大小的若干噪声块可以被预计算并存储在块图案数据集
Figure BDA0003735331620000072
中。这个数据库可以被视为具有Q数量个前后堆叠的2D噪声块的3D矩阵。如果L×L是胶片颗粒块的最大大小,则
Figure BDA0003735331620000073
的尺寸是L×L×Q。可以维持具有Q个元素的向量S以存储图案数据集中的每个块的对应大小,即S(i)≤L,其中i∈[0,Q-1]。
图3示出了构建合成的噪声图像的示例。在这个示例中,噪声模仿胶片颗粒。为了依据块图案(301)构建尺寸为H×W的合成的噪声图像(302),以相同大小的概率图像(300)开始。胶片颗粒的典型噪声图像是FHD(全高清,例如1080p)、UHD(超高清,例如4K)和8K分辨率。概率图像是具有例如在区间[0,1)中的均匀随机数的矩阵。选择阈值Thnorm(例如,0.1),并且将概率图像(300)中的每个条目与阈值作比较。在图3中,圆(310)表示具有小于阈值的概率的位置。替代性地,可以在具有大于、小于或等于或者大于或等于阈值的概率的像素处选择所述位置。基本上,存在将给定像素处的概率值与阈值作比较的准则。为简单起见,仅示出了几个位置,但实际的概率图像可以具有更多的位置。噪声块被放在所述圆处。这些位置由集合Ψ表示。
噪声块可以被放置成使得概率图像中的位置在噪声块的左上角(320),如图3中所示出的。替代性地,位置可以设置在中心、其他角或与噪声块相关的任何指定位置。噪声块与位置相对应的点是噪声块的“锚点”,并且对于所有噪声块可以是相同的。
块图案选择器(305)将随机挑选要在集合Ψ中的位置处插入的胶片颗粒块图案。这个块选择器可以是均匀随机数生成器。在将块放在适当的位置处之后,存在这些块可能重叠的概率,如图3中所示出的。来自重叠块中的并置单元的单元被加在一起。这个聚合值变成输出噪声图像(302)。由于将重叠区域聚合而非平均化,可以使胶片颗粒块缩放乘数V而非噪声方差
Figure BDA0003735331620000082
(参见方程2)。这防止聚合噪声像素值变得太大。
为了合成胶片颗粒图像I,考虑块图案数据集
Figure BDA0003735331620000083
在集合Ψ中的每个位置处,可以从数据集中随机挑选要插入到胶片颗粒图像中的块。让r是当前位置的所述随机选择的块的索引,其中,r~Uniform[0,Q-1]。这个块G'的尺寸是S(r)×S(r),使得
Figure BDA0003735331620000084
每当存在要在当前位置处插入的新块时可以选择不同的随机数r。这个的伪代码可以被示出为:
Figure BDA0003735331620000081
G'表示基于随机数r而为位置i,j选择的随机块。换句话说,为每个位置i,j选择随机数r,然后生成G'作为r的函数。
对于合成胶片颗粒或类似噪声的情况,在图像的明亮区域中,噪声可能是相当烦人的且是侵入性的。基于强度的亮度调制曲线降低了这些明亮区域中的噪声的强度,使得观看者更期望注入胶片颗粒的图像。预先生成胶片颗粒图像,如在先前章节中所描述的。然后基于并置的亮度强度来调制这些图像并且将所述图像添加到亮度通道。
图4针对实施例而不是以限制的方式示出了用于将噪声添加到图像的亮度通道(例如,Y通道)的一般方法。首先,初始化噪声图像I(405)。噪声图像可以具有与Y通道图像相同的尺寸。初始化可以将噪声图像的所有像素值设置为0或某个其他设置值。接下来,生成概率图像P(410),其中,在P中的每个位置处生成随机值。概率图像可以具有与噪声图像相同的尺寸。随机值可以介于从0至1的范围内,或在任何两个值之间。然后通过将P中每个像素位置的每个概率值与阈值准则作比较(例如,小于或等于设置的阈值)来生成位置图Ψ(415)。对于Ψ中被识别为符合阈值准则的每个位置,随机选择的噪声块被添加到I中对应的像素位置。如果块大于1×1,则块可以被赋予锚点(例如,块的左上角像素),其中,块将锚定到I中对应的像素位置。当已处理Ψ中所有所识别的位置时,被添加的噪声块的聚合在I中形成合成的噪声图像(425)。可以通过调制因数来调制合成的噪声图像(435),可以依据亮度通道计算所述调制因数(430)。然后可以将经调制合成的噪声图像添加到图像的亮度通道(440)。
在图5和图6中示出了样本亮度调制曲线。这些图表针对亮度强度的不同值给出调制因数。调制因数是在范围(0,1]中的有理数。在实施例中,在没有限制的情况下,调制因数对于低强度码字是接近一并且随着强度增加而减小。在将胶片颗粒像素添加到亮度通道中的并置像素之前,系统可以将胶片颗粒值乘以其调制因数。调制因数是从并置的亮度强度值和调制曲线导出的。由于曲线的衰减趋势,因此当针对图像中的明亮区域时胶片颗粒强度降低。
假设亮度通道的强度值由在Bt位码字范围内的l表示。作为示例,在没有限制的情况下,可以计算调制因数曲线f(·),如方程4中所示出的。
Figure BDA0003735331620000091
其中
Figure BDA0003735331620000092
方程4
在方程4中,α和β表示曲线参数。
图5示出了变化的α和β=2(Bt=16)的亮度调制曲线的示例。示出了其中α=0.15(501)、0.25(502)和0.4(503)的曲线。
图6示出了α=0.25和变化的β(Bt=16)的亮度调制曲线的示例。示出了其中β=1.0(601)、2.0(602)和4.0(603)的曲线。
选择α或β的自由使得可以针对不同的电光传递函数(EOTF)使用相同的方程。
如果Y(i,j)=yij是Y通道图像中的位置(i,j)处的亮度强度,则可以将在噪声图像中的位置(i,j)处的噪声值乘以f(yij)并且添加到亮度通道以得出注入噪声的亮度值
Figure BDA0003735331620000102
图7示出了具有颜色转换的胶片颗粒合成的示例。创建概率图像(705)并且通过将概率图像(705)的每个像素处的值与阈值作比较来选择位置(710),在这个示例中,所述位置是具有低于阈值的值的那些像素。预生成一组胶片颗粒图案(715)并且随机选择块(720),要将所述块注入到概率图像中(725),从而创建胶片颗粒图像(730)。调制(740)图像的Y(亮度)通道(735)以用噪声的调制因数(745)创建图像。组合(750)胶片颗粒图像(730)与调制因数图像(745)以产生亮度经调制的胶片颗粒图像(755)。组合(760)亮度经调制的胶片颗粒图像(755)与Y通道图像(735)以产生添加胶片颗粒的Y通道图像(765)。可以对包括添加胶片颗粒的Y通道的YUV图像进行颜色转换(770)以产生针对所有通道都添加胶片颗粒噪声的RGB图像(775)。
可以使用高斯随机数合成数字相机噪声。例如,可以使用箱穆勒变换(Box MullerTransform)或马沙利亚极坐标法(Marsaglia Polar Method)依据均匀随机数生成随机数。
对于用于依据均匀随机数生成高斯随机数的马沙利亚极坐标法,假设u1和u2是选自范围[0,1]的两个均匀随机数。如果满足条件0<u1 2+u2 2<1,则数
Figure BDA0003735331620000101
是具有零均值和单位标准偏差的高斯随机数。应当注意避免在满足条件之前让过程循环太久。
由于可以用高斯随机数来模拟数字相机噪声,因此合成相机噪声图像归结为生成具有图像的尺寸且包含具有零均值的高斯随机数的2D矩阵。关于亮度强度调制噪声图像,如先前所讨论的。然后可以将噪声图像添加到内容的Y、U和V通道,后面接着可选地进行颜色空间转换(例如,转换成RGB)。
图8示出了具有颜色转换的相机噪声合成的示例。这是噪声合成的进一步实施例,并且因此对于两个实施例共同的特征可以从描述中省略,但应被理解为对两个实施例仍然是共同的。调制(805)图像的Y(亮度)通道(810)以产生调制因数图像(“MFI”,815)。产生三个随机高斯图像(“RGI”,820),每个通道一个,并且利用调制因数图像(815)产生三个亮度经调制的噪声图像(830)。将这些噪声图像(830)添加(835)到原始图像中它们的相应通道(840)。然后可以将这些通道(840)转换(845)成不同的颜色编码方案(850),如RGB。亮度经调制的噪声图像(830)表示MFI图像(815)与对应通道的RGI图像(820)的逐像素相乘(825)。
当在硬件(与软件相反)解决方案中实施噪声合成时,应考虑四个因素进行优化。
1.在软件实施方式中,单独合成噪声图像并且然后将所述噪声图像添加到亮度通道。由于硬件中的存储器限制,因此仅计算胶片颗粒图像的一个像素并且将所述像素直接添加到内容的亮度通道。这个方法去除了用于存储整个胶片颗粒图像的任何中间存储器缓冲器,并且节省了大量芯片上存储器。
2.在硬件实施方式中,通过线缓冲器访问图像。线缓冲器可以存储图像的行。由于硬件存储器昂贵,线缓冲器的数量典型地受限制,因此无法将整个图像加载到这几个线缓冲器中。对存储器的读取和写入也是耗费时间的。由于这个原因,硬件解决方案应将图像的行读取到线缓冲器中一次,进行整个处理,并且然后将结果写出到存储器仅一次。多次将图像的相同部分读取和写入到线缓冲器中是次优的。
3.浮点表示对硬件并不友好,因此值当对于硬件实施方式呈整数格式时处理起来更高效。可以以整数格式表示噪声块图案、图像像素、阈值等以允许实现更简单的硬件实施方式。例如,不是将概率设置为从0至1(实数),而是可以将它们设置为从0至255(整数)。
4.硬件实施方式中的块大小是固定的(例如,所有块是8×8)以跨所有解码器硬件芯片达到一致性。在剩下的描述中,固定的块大小将由B×B表示。
为了优化硬件实施方式的系统,可以调整噪声合成算法以将这些因素考虑在内。
图9示出了通过硬件生成注入噪声(在这种情况下是胶片颗粒)的内容的示例框图。仅将胶片颗粒(945)添加到Y(亮度)通道(955)上,但其他噪声注入技术也可以包括V通道和U通道。可以利用处理器时钟(时间戳/日期/当日时间/等)作为帧级随机种子(905)。使用这个随机种子来初始化所有行级伪随机数生成器(910)。在胶片颗粒方面评估每个像素(920)并且然后在调制(930,935)之后将所述像素添加(940)到内容的亮度通道(925)。最终将添加胶片颗粒的内容(956)转换(960)成用于显示(970)的RGB(965)。
图10示出了可以如何在胶片颗粒方面评估每个像素的示例。对于胶片颗粒块图案数据集,假定均匀块大小为B×B。不同的块大小将有助于改变胶片颗粒的大小,但可以通过改变相等大小的块的频率范围来实现相同效应。因此,为了减小变量的数量,当在硬件中实施时可以将胶片颗粒图案的块大小设置为固定大小。可以使用针对软件实施方式描述的相同方案来生成胶片颗粒块图案。图10示出了在R行中的C列(1050)处生成胶片颗粒值的步骤。
在硬件解决方案中不存在显式的概率图像。相反,针对图像的每个行都存在伪随机数(PRN)序列生成器(1010至1015)。对于R行中的每个条目(像素),PRN模块生成新的随机数。可以从行索引和随机偏移的函数选取PRN(1005)。如果随机数小于阈值(1020),并且噪声块管理表(NBMT)(1090)中存在足够的空间,则从胶片颗粒图案(1030)集中随机选择要在这个位置(1065)处开始插入的胶片颗粒块(1070)。块不是直接添加到图像,而是系统将所述块的条目(1025)放在NBMT(1090)中。NBMT到像素值逻辑块(1035)计算亮度通道图像(1045)中的当前位置处的噪声值。对于硬件实施方式,阈值Th未被归一化,因此降低了计算成本。非归一化阈值被表示为在符号中没有下标“norm”,并且其通过方程
Figure BDA0003735331620000121
来与归一化阈值相关。
当计算当前位置处的噪声值时使用来自先前行的伪随机数生成器的原因是效率问题。如果B(噪声块大小)显著大,则在每个遍次时读取/写入B行将由于需要存储器中的B个线缓冲器而显著添加存储器输入/输出(I/O)和硬件成本。
相反,目前的解决方案仅需要一个线缓冲器,而不管块大小。对于给定的位置,可能存在来自先前行的重叠块。这些块由图10中的图像(1060)中的虚线正方形(1070)表示。由于每个PRN生成器的随机种子是确定性的,因此可以再生前面几行经过的随机数序列。这些序列提供在前面几行中使用的块和块图案的确切位置。信息允许仅使用一个线缓冲器来计算任何位置的正确胶片颗粒值,因此降低I/O时延和硬件成本。为每个行维持噪声块管理表(990)以记录重叠块。
尽管在图10中单独示出原始和注入胶片颗粒的亮度通道行R,但可以就地更新原始行R以得到注入胶片颗粒的行R。
使用与针对基于软件的解决方案描述的过程类似的过程生成胶片颗粒块图案。由于用于计算这些块图案的机制需要使用复杂的数学运算,因此这项任务可以移交给固件。稍后可以将合成的块存储在芯片上SRAM中以便容易访问硬件。
硬件实施方式的另一个主要挑战是随机数生成器。对于更快的实施方式,可以使用基于线性反馈移位寄存器的伪随机数生成器。那些随机数中的一些位被用于从块图案的数据集中选择胶片颗粒块。
线性反馈移位寄存器通常用于在硬件芯片中生成随机数序列。考虑图11中示出的示例16位寄存器。通过使寄存器的内容向右移位1并在最高有效位(MSB)位置(1110)处插入新位来获得下一个随机数。新位是在寄存器中的某些预定义位置(1120)处的位的异或(XOR)。对于图11中所示出的示例,对索引位置3、12、14和15处的位进行“异或”运算。将“异或”门(1115)的输出馈送到MSB位置(1110)中。
如果恰当地选择分接点位置,则寄存器在返回到相同数之前经过所有不同的16位数一次。换句话说,序列在某个周期之后自身重复。可以看到,下一个随机数是寄存器的当前状态的函数。因此,必须留意确保寄存器未被初始化为全零。对于全零情况,过程将会被锁定在那种状态中。
硬件实施方式未显式地产生H×W尺寸的概率图像。作为暂时解决方法,可以使用线性反馈移位寄存器生成每个行中的随机数。分配给每个行的移位寄存器用不同的随机种子进行初始化。这个种子是行索引R和随机偏移的函数,SeedR=(Const+R×Offset)mod 2D,其中,D是寄存器的长度。随机偏移是从当前时间戳导出的,并且常量被设置为任何大的数,如16位移位寄存器的214。偏移是随机选择的,但它对于当前帧中的每个行都是固定的。尽管每个行存在不同的伪随机数生成器,但在任何给定的时间点,在硬件中存在不超过B个移位寄存器。在这里,B×B是块图案数据集中的块的尺寸。
种子作为常量是确定性的,偏移和行索引是已知的。使这个种子为确定性的背后的想法是为了在处理当前行R时再生前几个行已经过的随机数序列。这允许确定来自前几个行的重叠胶片颗粒块的位置并且使用所述知识来计算当前位置的胶片颗粒值。
与随机序列生成器一起,表可以用于存储关于先前行中的块的位置的信息。这个表被称作噪声块管理表(NBMT)。
NBMT存储注入到特定行的亮度通道中的胶片颗粒块的信息。每个PRN序列生成器(参见图10)具有对应的NBMT。表中的条目的数目是可配置的参数并且每个条目保存以下三列,如表1中所示出的。
表1:噪声块管理表
块ID 位置-x 位置-y
b<sub>i</sub> x<sub>i</sub> y<sub>i</sub>
为了计算每个位置处的最终值,系统需要考虑与所述位置重叠的所有块。噪声块管理表通过将块idbi、块的原点X坐标xi和原点Y坐标yi存储在图像中来记录这些重叠的块。为了速度和计算效率,表中的条目的最大数量被限制为ceil(B/4)。
例如,假设胶片颗粒块图案的大小是B×B并且系统正在计算注入噪声的亮度通道图像中的位置(C,R)处的胶片颗粒注入值,则在上面以B-1个行或在左边以B-1个列起源的块仍然可以影响当前位置。由于这个原因,当处理当前行R时,系统考虑在所述当前行上面的B-1个行。
如图10中所图示的,系统为当前行R上面的B-1个行发起伪随机数生成器以找到重叠的块。当前行还可以具有其自身的由PRN行R表示的随机数生成器。由于随机种子是确定性的,因此系统可以总是再生前几个行经过的序列。除了行特定的随机数生成器,这B个行中的每一个还可以具有其自身的NBMT。
让C表示正被处理的行R中的当前列。亮度通道图像的行R被读取到线缓冲器中。列C以1的步长从C=0递增到C=W-1。对于C的每个值,系统可以执行以下步骤:
1.B个随机数生成器中的每一个产生随机数。如果所述数大于或等于阈值Th,则不做任何操作。
2.此外如果随机数小于阈值,则
a.移除NBMT中不影响当前位置的任何条目。例如,移除块大小B×B,其中,xi<C-B+1或yi<R-B+1。
b.如果所述行的NBMT不满,则从胶片颗粒图案数据集中选择随机块。来自所述行的伪随机数生成器的位被用于选择块ID bi。图12呈现了如何从伪随机数生成器中挑选块ID位的示例。对于16个不同块图案的数据集,块ID PRN[15:12]=7是指块ID 7,其是数据集中的第7个图案。排序以索引0开始。
c.所述块的条目被添加到NBMT,其中,xi=C且原点Y坐标等于行索引。块ID源是从先前步骤导出的。
3.计算来自所有R个行的NBMT的位置(C,R)处的胶片颗粒值。这个步骤被称为通过示例在图13中图示的NBMT到像素值逻辑。
a.对于每个NBMT中的每个条目,检查块是否与当前位置重叠(1310)。当xi≤C≤B+xi-1且yi≤R≤B+yi-1时,块重叠。
b.使用从PRN生成器提取的块ID来从块图案数据集中选择对应的块(1320)。挑选块中与当前位置重叠的值。
c.可以存在多个这样的重叠块,因此将这些值加到一起(1330)。
d.将值移交到计算噪声值的亮度调制因数(1340)的下一个阶段。将亮度经调制的噪声值添加(1350)到原始亮度(1355)并且写入到列C处的线缓冲器(1360)。
4.每个行都经历这个过程,一次一个,以得到注入胶片颗粒的亮度通道图像。对于其上面没有B-1个行的行,仅考虑可用的行。
对于硬件实施的基于亮度强度的噪声调制技术,软件实施方式的非线性曲线应替换为分段线性段,以避免在非线性算术上浪费存储器周期。可以在元数据中将这些线段的参数发信号给解码器。系统然后可以依据分段线性曲线计算每个亮度强度值的调制因数。
此外,用于软件实施方式的曲线中的值是小数。在硬件中,操作小数是麻烦的。因此,曲线
Figure BDA0003735331620000151
中的值可以在分段线性近似法、即
Figure BDA0003735331620000156
(其中
Figure BDA0003735331620000152
)之前被缩放到Bc=8位整数。然后使用T+1个枢轴点将曲线fhw(·)分割为T个段。让枢轴点的位置由向量Ω表示,使得
Figure BDA0003735331620000153
其中0≤k≤T。
对于曲线上的每两个枢轴,即,x1=Ω(k)和x2=Ω(k+1),系统计算连接点y1=fhw(x1)和y2=fhw(x2)的第k个线段的方程。线的方程具有三个参数、斜率、X截距(x1)和Y截距(y1)。
Figure BDA0003735331620000154
y-y1=slopek×(x-x1) 方程6
每个段的斜率、枢轴和Y截距参数被发送到解码器。在解码器处重构曲线以计算每个亮度强度的调制因数。为了图示,图14绘制了原始(基于软件的)和分段线性曲线,其中α=0.25,β=2。如果Y(C,R)=yCR是Y通道图像中的位置(C,R)处的亮度强度,则噪声值、即nCR乘以f(yCR)并且被添加到亮度通道以得到注入噪声的亮度值
Figure BDA0003735331620000155
由于调制因数在Bc位码字范围内,因此胶片颗粒值和调制因数的乘积可以右移Bc个位以得到正确的亮度经调制的胶片颗粒值。
与胶片颗粒噪声类似,数字相机噪声的硬件实施方式还具有若干个限制。
1.由于涉及到的log函数,在硬件中合成高斯随机数是昂贵的。作为暂时解决方法,这些数可以在固件中生成并且存储为数字相机噪声块。
2.由于存储器限制,因此将数字相机噪声图像存储在芯片上的存储器中是昂贵的。可以计算噪声像素并且在调制之后直接将噪声像素添加到Y、U和V通道。
3.将Y、U和V通道的仅几个行作为用于处理的线缓冲器读取到存储器中。由于图像大小可以是巨大的,因此处理整个图像将是I/O和存储器密集的。线缓冲器将有助于缓解时延和存储器要求。但可以显著更改架构以实现与软件解决方案类似的结果。
4.浮点算术对于硬件实施方式更复杂,因此所有值被转换为固定点格式。当从浮点移动到固定点算术时对架构的一些改变是必要的。
5.数字相机噪声图案的块大小可以固定到1×1(B=1),这基本上意味着系统在每个位置处仅添加一个高斯随机数。这与软件解决方案一致。
硬件中的数字相机噪声合成的一个实施例将数字相机噪声图案的块大小限制为1×1,并且行R的概率阈值设置为2D,而其他行具有为零的阈值。将概率阈值设置为2D确保块被添加到Y通道中的每个像素位置。由于块大小被限制为1×1,因此块之间不存在重叠。因此,在行R的NMBT中仅存在一个条目。
每个行都存在伪随机数生成器。当处理行R和列C时,如果伪随机数小于2D,则系统将数字相机块添加到所述像素。由于这些随机数总是小于2D,系统在每个位置处添加高斯随机数。使用伪随机数生成器的前导位来随机选择块。可以在所述行的NBMT中插入所述块的信息。NBMT到像素值逻辑计算数字相机噪声值。这个值用调制因数来调制并且被添加到线缓冲器的列C。对于大小为1×1的块,B=1,并且NBMT到像素值逻辑很简单,因为相邻块没有重叠。图15示出了数字相机噪声合成的硬件实施方式的示例框图,这可以被描述为图10的特殊情况。
数字相机噪声还被添加到色度通道,与仅被添加到亮度通道的胶片颗粒相反。用于将相机噪声注入到亮度通道和色度通道中的架构基本上是相同的。可以通过从图15的硬件架构移除像额外伪随机数生成器的多余部件、阈值块、NBMT和NBMT到像素值逻辑等来简化色度通道的设计,如图16的示例中所示出的。
对于示例,假设存在数字相机噪声的1024个块图案。则PRN行R的前10个位可以被用于计算块索引bi。1×1块是从数据集中挑选的,用亮度强度进行调制并且被添加到当前位置处的色度通道线缓冲器。
对于YUV 444序列,可以依据亮度通道中的并置强度来计算调制因数。在调制之后将噪声值添加到色度通道。换句话说,首先用亮度强度调制噪声值并且然后将噪声值添加到色度通道。
对于YUV 422序列,可以将Y通道二次采样到宽度的一半,并且然后依据Y通道中的并置像素来计算调制因数。用降采样的亮度强度调制噪声值并且然后添加到色度通道。使用传统的滤波方法进行的降采样对于硬件来说可能是昂贵的。但调制因数可以与粗略和近似的降采样一起发挥作用。为了降低硬件复杂性,通过亮度通道行中的相邻元素的简单求平均来对亮度通道进行二次采样。在以下伪代码中详尽阐述了所述过程。符号Yhh表示通过获得相同行中的相邻元素的平均值而得到的亮度通道Y的水平降采样版本。
Figure BDA0003735331620000171
图17示出了允许合成多个类型的噪声的硬件实施方式的示例统一噪声注入架构(在这个示例中,胶片颗粒和相机)。伪随机数生成器(1710)可以产生随机数序列。如果这些随机数满足阈值条件,则使用胶片颗粒(1721)或数字相机噪声(1722)块数据集来计算(1720)聚合噪声值,这取决于确定需要什么类型的噪声(1715)。用亮度强度调制(1730)值并且将值添加到原始亮度或色度通道。一次处理一个行(1740),因此线缓冲器仅需要足够大以容纳YUV内容的行。注入噪声的YUV内容被转换(1750)为用于显示的RGB。
存在两种不同的场景,其中,噪声注入模型将被用于将噪声注入到内容中。在第一场景中,内容提供者可以控制要添加到视频的噪声的外观。将在编码器端处设置参数并且将参数作为元数据的一部分传输到解码器。对于第二场景,解码器可以基于观看条件或显示规格来合成噪声。内容提供者的设置可以具有比本地调整更高的优先级,反之亦然。
可以在工作流程的不同阶段设置噪声合成参数,即,编码器端内容提供者更喜欢的设置或解码器端本地自适应的设置。解码器参数可以被配置到固件或硬件中。
出于艺术的原因,内容提供者可能想要将胶片颗粒或相机噪声添加到视频序列以达到电影的效果。噪声在编码时被压缩,并且因此,电影效果在解码器端被减弱。此外,需要更高的位速率来压缩有噪声的序列,因此与参数一起发送无噪声的序列以在解码器端生成噪声降低了位速率要求,但仍保留了电影效果。为此,存在在编码器端设置参数并通过元数据将它们发送到解码器的选项。在表2中列出了参数。
表2
Figure BDA0003735331620000181
可以从元数据读取参数以初始化解码器端的噪声生成模块。同样地,可以在解码器端基于观看环境或显示规格来调整参数。无论哪种方式,解码器必须在给定一组参数的情况下合成噪声。解码器由固件或处理器以及硬件系统构成。固件可以以速度为代价计算复杂的数学函数,但硬件可以以更快的速率执行低级别的逻辑操作。
基于速度要求和计算的复杂性,噪声图像生成的任务必须分担到固件和硬件中。合成胶片颗粒或相机噪声块对于硬件来说是计算密集的,因此它可以被移交到固件。仅存在几个块图案要构建,因此在系统启动期间可以容易地构建这些固件而没有太多的处理开销。
示例实施例
EE1.一种用于为数字图像创建合成的噪声图像的基于计算机的方法,所述方法包括:提供多个噪声块图案;初始化噪声图像;生成概率图像,所述概率图像包括在所述概率图像的每个像素处的随机生成的概率值,将所述概率图像中的每个概率值与阈值准则作比较;如果所述概率值满足所述阈值准则,则从所述多个噪声块图案中选择噪声块图案,所述噪声块图案具有锚点;以及如果所述概率值满足所述阈值准则,则通过将所述噪声块图案放在所述噪声图像中使得所述锚点与所述概率图像中符合所述阈值准则的像素相对应来创建合成的噪声图像。
EE2.如EE1所述的基于计算机的方法,其中,所述噪声颗粒块图案是随机选择的。
EE3.如EE1或EE2所述的基于计算机的方法,其中,所述概率图像的所述概率值是均匀分布的概率值。
EE4.如EE1至EE3中任一项所述的基于计算机的方法,其中,所述噪声块图案包括胶片颗粒块图案。
EE5.如EE1至EE4中任一项所述的基于计算机的方法,进一步包括聚合所述噪声图像的其中所述噪声块图案重叠的区域中的值。
EE6.如EE1至EE5中任一项所述的基于计算机的方法,进一步包括在生成所述噪声图像之前生成所述噪声块图案,其中,所述噪声块图案是通过逆DCT技术生成的。
EE7.如EE6所述的基于计算机的方法,其中,所述生成进一步包括移除低频率DCT系数。
EE8.如EE6或EE7所述的基于计算机的方法,其中,所述生成进一步包括移除高频率DCT系数。
EE9.如EE1至EE8中任一项所述的基于计算机的方法,其中,所述概率图像和所述噪声图像的大小被设定为与视频帧相匹配。
EE10.如EE1至EE9中任一项所述的基于计算机的方法,进一步包括:通过将所述噪声图像添加到内容图像的通道来编辑所述内容图像。
EE11.如EE10所述的基于计算机的方法,进一步包括:在将所述噪声图像添加到所述内容图像之前将所述噪声图像中的值乘以调制因数。
EE12.如EE11所述的基于计算机的方法,其中,所述值是所述噪声图像的亮度强度值。
EE13.如权利要求EE10至EE12中任一项所述的基于计算机的方法,进一步包括:基于所述经编辑的内容图像来生成YUV内容图像。
EE14.如EE13所述的基于计算机的方法,进一步包括:基于所述YUV内容图像来生成RGB内容图像。
EE15.一种设备,包括:解码器,所述解码器解码经编码图像,从而创建经解码的清洁序列;噪声合成模块,所述噪声合成模块执行如EE1至EE14中任一项所述的方法,从而创建合成的噪声图像;其中,所述解码器被配置成组合所述合成的噪声图像与所述经解码的清洁序列,从而创建用于显示的经渲染图像。
EE16.如EE15所述的设备,进一步包括调制曲线模块,所述调制曲线模块用于在与所述经解码的清洁序列组合之前调制所述合成的噪声图像。
EE17.一种计算机程序产品,包括被编码成当在处理器上运行时执行如EE1至EE14中任一项所述的方法的数据。
EE18.一种用于在图像中创建合成的噪声的设备,所述设备包括:线缓冲器,所述线缓冲器包括来自所述图像的行;固件,所述固件包括噪声块图案;伪随机数生成器,所述伪随机数生成器为所述行中的像素提供随机值;用于将所述随机值与阈值准则作比较的逻辑;数据存储区,所述数据存储区包括噪声块管理表;基于来自所述固件的随机噪声块图案与所述行中的像素相关联来填充所述噪声块管理表的逻辑,其中,与所述像素相关联的所述随机值符合所述阈值准则;基于所述噪声块管理表来计算所述图像的行中的每个像素位置的噪声值的逻辑;以及基于所述噪声值来修改所述行的逻辑。
EE19.如EE18所述的设备,进一步包括:用于从所述图像确定调制曲线、计算调制因数且在修改所述行之前将所述调制因数应用于所述噪声值的逻辑。
EE20.如EE18或EE19所述的设备,其中,所述伪随机噪声生成器基于行索引和随机偏移值来生成随机数。
EE21.如EE18至EE20中任一项所述的设备,其中,所述图像是亮度通道图像。
EE22.如EE18至EE20中任一项所述的设备,其中,所述图像是色度通道图像。
EE23.如EE18至EE22中任一项所述的设备,进一步包括并行处理所述图像的多个伪随机数生成器和多个线缓冲器。
EE24.一种解码器系统,包括:解码器,所述解码器对经编码图像进行解码,从而创建经解码的清洁序列;噪声合成模块,所述噪声合成模块包括如EE18至EE23中任一项所述的设备,从而创建合成的噪声图像;其中,所述解码器被配置成组合所述合成的噪声图像与所述经解码的清洁序列,从而创建用于显示的经渲染图像。
EE25.一种用于为解码器生成元数据的方法,所述方法包括:设置噪声类别参数;设置块大小参数;设置阈值参数;以及设置调制因数曲线参数。
EE26.如EE25所述的方法,进一步包括设置噪声方差参数。
EE27.如EE25至EE26中任一项所述的方法,进一步包括设置离散余弦变换频率范围参数。
EE28.如EE25至EE27中任一项所述的方法,进一步包括设置多个块图案参数。
EE29.如EE25至EE28中任一项所述的方法,进一步包括设置噪声块管理表条目参数。
已经描述了本公开的多个实施例。然而,应当理解的是,可以做出各种修改而不脱离本公开的精神和范围。因此,其他实施例也在所附权利要求的范围内。本实施例的任何显著特征在适当情况下对所有实施例都是共同的。
上文阐述的示例作为对如何制造和使用本公开的实施例的完整公开和描述提供给本领域普通技术人员,并且不旨在限制被发明人/多个发明人视为他们的公开的内容的范围。
对本领域技术人员显而易见的用于执行本文公开的方法和系统的上述图案的修改旨在落入所附权利要求的范围内。说明书中提到的所有专利和公开文本都指示与本公开所属技术领域的技术人员的技术水平。本公开中所引用的所有参考文献以相同的程度通过引用并入,就好像每个参考文献已单独通过引用以其全文并入一样。
应当理解,本公开不限于特定的方法或系统,所述方法或系统当然可以变化。还应当理解,本文所使用的术语仅出于描述特定实施例的目的,并不旨在进行限制。除非内容另有清楚地规定,否则如本说明书和所附权利要求中所使用的,单数形式“一个(a)”、“一种(an)”和“所述(the)”包括复数个指示物。除非内容另有清楚地规定,否则术语“多个”包括两个或更多个指示物。除非另有定义,否则本文所使用的全部技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。

Claims (29)

1.一种用于为数字图像创建合成的噪声图像的基于计算机的方法,所述方法包括:
提供多个噪声块图案;
初始化噪声图像;
生成概率图像,所述概率图像包括在所述概率图像的每个像素处的随机生成的概率值,
将所述概率图像中的每个概率值与阈值准则作比较;
如果所述概率值满足所述阈值准则,则从所述多个噪声块图案中选择噪声块图案,所述噪声块图案具有锚点;以及
如果所述概率值满足所述阈值准则,则通过将所述噪声块图案放在所述噪声图像中使得所述锚点与所述概率图像中符合所述阈值准则的像素相对应来创建合成的噪声图像。
2.如权利要求1所述的方法,其中,所述噪声颗粒块图案是随机选择的。
3.如权利要求1或2所述的方法,其中,所述概率图像的所述概率值是均匀分布的概率值。
4.如权利要求1至3中任一项所述的方法,其中,所述噪声块图案包括胶片颗粒块图案。
5.如权利要求1至4中任一项所述的方法,进一步包括聚合所述噪声图像的其中所述噪声块图案重叠的区域中的值。
6.如权利要求1至5中任一项所述的方法,进一步包括在生成所述噪声图像之前生成所述噪声块图案,其中,所述噪声块图案通过逆DCT技术来被生成。
7.如权利要求6所述的方法,其中,所述生成进一步包括移除低频率DCT系数。
8.如权利要求6或7所述的方法,其中,所述生成进一步包括移除高频率DCT系数。
9.如权利要求1至8中任一项所述的方法,其中,所述概率图像和所述噪声图像的大小被设定为与视频帧相匹配。
10.如权利要求1至9中任一项所述的方法,进一步包括:通过将所述噪声图像添加到内容图像的通道来编辑所述内容图像。
11.如权利要求10所述的方法,进一步包括:在将所述噪声图像添加到所述内容图像之前将所述噪声图像中的值乘以调制因数。
12.如权利要求11所述的方法,其中,所述值是所述噪声图像的亮度强度值。
13.如权利要求10至12中任一项所述的方法,进一步包括:基于所编辑的内容图像来生成YUV内容图像。
14.如权利要求13所述的方法,进一步包括:基于所述YUV内容图像来生成RGB内容图像。
15.一种设备,包括:
解码器,所述解码器用于对经编码图像进行解码,以创建经解码的清洁序列;
噪声合成模块,所述噪声合成模块用于执行如权利要求1至14中任一项所述的方法,以创建合成的噪声图像;
其中,所述解码器被配置成对所合成的噪声图像与所述经解码的清洁序列进行组合,以创建经渲染图像以供显示。
16.如权利要求15所述的设备,进一步包括调制曲线模块,所述调制曲线模块用于在与所述经解码的清洁序列组合之前调制所述合成的噪声图像。
17.一种计算机程序产品,包括被编码成当在处理器上运行时执行如权利要求1至14中任一项所述的方法的数据。
18.一种用于在图像中创建合成的噪声的设备,所述设备包括:
线缓冲器,所述线缓冲器包括来自所述图像的行;
固件,所述固件包括噪声块图案;
伪随机数生成器,所述伪随机数生成器用于为所述行中的像素提供随机值;
用于将所述随机值与阈值准则作比较的逻辑;
数据存储,所述数据存储包括噪声块管理表;
用于基于来自所述固件的随机噪声块图案与所述行中的像素相关联来填充所述噪声块管理表的逻辑,其中,与所述像素相关联的所述随机值符合所述阈值准则;
用于基于所述噪声块管理表来计算所述图像的所述行中的每个像素位置的噪声值的逻辑;以及
用于基于所述噪声值来修改所述行的逻辑。
19.如权利要求18所述的设备,进一步包括:用于从所述图像确定调制曲线、计算调制因数且在修改所述行之前将所述调制因数应用于所述噪声值的逻辑。
20.如权利要求18或19所述的设备,其中,所述伪随机噪声生成器基于行索引和随机偏移值来生成随机数。
21.如权利要求18至20中任一项所述的设备,其中,所述图像是亮度通道图像。
22.如权利要求18至20中任一项所述的设备,其中,所述图像是色度通道图像。
23.如权利要求18至22中任一项所述的设备,进一步包括用于并行处理所述图像的多个伪随机数生成器和多个线缓冲器。
24.一种解码器系统,包括:
解码器,所述解码器用于对经编码图像进行解码,以创建经解码的清洁序列;
噪声合成模块,所述噪声合成模块包括如权利要求18至23中任一项所述的设备,以创建合成的噪声图像;
其中,所述解码器被配置成对所合成的噪声图像与所述经解码的清洁序列进行组合,以创建经渲染图像以供显示。
25.一种用于为解码器生成元数据的方法,所述方法包括:
设置噪声类别参数;
设置块大小参数;
设置阈值参数;以及
设置调制因数曲线参数。
26.如权利要求25所述的方法,进一步包括设置噪声方差参数。
27.如权利要求25或26中任一项所述的方法,进一步包括设置离散余弦变换频率范围参数。
28.如权利要求25至27中任一项所述的方法,进一步包括设置多个块图案参数。
29.如权利要求25至28中任一项所述的方法,进一步包括设置噪声块管理表条目参数。
CN202080092488.9A 2019-12-19 2020-12-21 用于数字图像的噪声合成 Pending CN114945944A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962950466P 2019-12-19 2019-12-19
EP19218144.4 2019-12-19
US62/950,466 2019-12-19
EP19218144 2019-12-19
PCT/US2020/066366 WO2021127628A1 (en) 2019-12-19 2020-12-21 Noise synthesis for digital images

Publications (1)

Publication Number Publication Date
CN114945944A true CN114945944A (zh) 2022-08-26

Family

ID=74125718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080092488.9A Pending CN114945944A (zh) 2019-12-19 2020-12-21 用于数字图像的噪声合成

Country Status (5)

Country Link
US (1) US20230050950A1 (zh)
EP (1) EP4078526B1 (zh)
JP (1) JP7451710B2 (zh)
CN (1) CN114945944A (zh)
WO (1) WO2021127628A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023122039A1 (en) 2021-12-22 2023-06-29 Dolby Laboratories Licensing Corporation Film grain parameters adaptation based on viewing environment
CN115855017B (zh) * 2023-02-28 2023-05-02 中国船舶集团有限公司第七〇七研究所 基于光纤陀螺的噪声压缩调制方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ZA200601707B (en) 2003-08-29 2008-09-25 Thomson Licensing Sa Method and apparatus for modeling film grain patterns in the frequency domain
US7945106B2 (en) * 2003-09-23 2011-05-17 Thomson Licensing Method for simulating film grain by mosaicing pre-computer samples
WO2005057936A1 (en) 2003-12-05 2005-06-23 Thomson Licensing Technique for film grain simulation using a database of film grain patterns
JP6120665B2 (ja) * 2013-04-26 2017-04-26 オリンパス株式会社 撮像装置、画像処理装置、画像処理方法及び画像処理プログラム
US9747673B2 (en) * 2014-11-05 2017-08-29 Dolby Laboratories Licensing Corporation Systems and methods for rectifying image artifacts

Also Published As

Publication number Publication date
US20230050950A1 (en) 2023-02-16
EP4078526A1 (en) 2022-10-26
EP4078526B1 (en) 2023-11-15
JP2023507589A (ja) 2023-02-24
WO2021127628A1 (en) 2021-06-24
JP7451710B2 (ja) 2024-03-18

Similar Documents

Publication Publication Date Title
Xing et al. Invertible image signal processing
JP6255063B2 (ja) Hdr画像のための画像処理
JP6039763B2 (ja) 局所トーンマッピングのための方法、装置及び記憶媒体
CN107995497B (zh) 高动态范围视频的屏幕自适应解码
TWI521973B (zh) 高動態範圍影像的編碼、解碼及表示
US8948248B2 (en) Tiered signal decoding and signal reconstruction
JP5086067B2 (ja) 高ダイナミックレンジ画像を符号化するための方法、表現するためのデータ構造、及び符号化装置
AU2005309975B2 (en) Low-complexity film grain simulation technique
US7567723B2 (en) Resolution changing method and apparatus
JP7451710B2 (ja) デジタル画像のためのノイズ合成
US8396313B2 (en) Image compression and decompression using the PIXON method
US9098916B2 (en) Bit-accurate film grain simulation method based on pre-computed transformed coefficients
CN114418882A (zh) 处理方法、训练方法、装置、电子设备及介质
Zhang et al. Lookup Table meets Local Laplacian Filter: Pyramid Reconstruction Network for Tone Mapping
Wolf et al. Image and Video Enhancement
EP4377879A1 (en) Neural networks for dynamic range conversion and display management of images
WO2023205144A1 (en) Metadata-aided removal of film grain
CN118075493A (zh) 一种基于动态NeRF的体积视频处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination