CN1656516A - 将像素分类为自然或合成图像内容 - Google Patents

将像素分类为自然或合成图像内容 Download PDF

Info

Publication number
CN1656516A
CN1656516A CNA038120356A CN03812035A CN1656516A CN 1656516 A CN1656516 A CN 1656516A CN A038120356 A CNA038120356 A CN A038120356A CN 03812035 A CN03812035 A CN 03812035A CN 1656516 A CN1656516 A CN 1656516A
Authority
CN
China
Prior art keywords
pixel
value
classified
content
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038120356A
Other languages
English (en)
Inventor
M·马科尼
A·里滋
M·特雷维桑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1656516A publication Critical patent/CN1656516A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

一种用于分析由像素矩阵构成的图像的方法,每个像素都由至少一个排列在参数矩阵(Y)中的参数值定义。该方法包括在参数矩阵(Y)上执行微分操作从而形成多个排列在矩阵中的微分项(D)的步骤。具有几乎相同的微分项的相邻微分项的组被确定。确定每个组中的像素的路径长度,该长度指示该组中的多个项目。基于路径长度和微分项,像素被分类为自然或合成图像内容。

Description

将像素分类为自然或合成图像内容
本发明涉及一种分析图像的方法。本发明还涉及一种计算机程序产品、一种设备、一种处理装置系统以及一种计算机可读介质。
CRT/LCD监视器,即用于计算机和计算机系统的监视器的特征在于具有高分辨率和低亮度。这些显示系统在下文种统称为监视器,它们典型地用于显示合成内容,比如本文或图形。现在它们都需要越来越多地显示自然内容,比如图像或视频。特别地,相对于TV监视器,CRT监视器的特征在于高分辨率和更低的亮度。这是由于实际上最初在监视器即计算机的监视器等上面所显示的内容,都是专门合成的,并且实际上特别以文本为代表。这种内容明确地需要一个高清晰度来令用户感到舒服,但是例如由于CRT中电子束的所需小点的尺寸,这也造成了亮度的降低。
合成内容将在下文中被理解为一幅图像的内容,相对于自然内容而言,由于它的合成起源而具有一定更高的有序度。除去以上提到的文本例子是合成内容之外,图标、符号和任意种类的某些构造形式、图形或图片都必须被理解为合成内容。相反地,自然内容在下文中被理解为任何自然起源的图像,特别地不是类似于数字照片、视频片断和类似图像的构造起源,该类似图像是任意输入合成光栅图像的部分。
现今的形势已可观地改变:因特网和多媒体技术(比如DVD和图像存储与传输)引起了自然TV形式的内容在监视器中应用的增加。这种新形势造成了监视器的一系列问题,因为它们最初都不是为显示合成图像以及自然图像而设计的。特别地,用于PC应用的任何监视器都面临这个问题,特别是CRT和LCD监视器和平面监视器。此外,相关的处理器装置系统比如视频卡、视频芯片、多媒体芯片、处理器单元、帧缓冲器和VRAM存储器(即适用于处理包括合成和自然内容的图像)都面临这样的问题。
包括合成和自然内容的图像被称为具有复合内容。
当今的普通显示装置,特别是监视器装置、装置以及处理器装置系统都需要以高分辨率和可忽略的亮度损失、以及用于复合内容图像的可接受的处理性能和时间来执行图像处理。
已有了增强的方法来显著提高上述性能,特别是视觉性能。为了有效加强图像处理的性能,上述处理可被应用并且限制在显示系统的特定区域内,比如在一个显示自然内容的屏幕中。这样的“基于视窗”的由用户进行的手动选择是一个尽管低效但是简单的识别区域的方法,当整个视窗的内容都是自然的时可被采用。
如US 6,195,459B1所述的基于模糊检测规则的图像检测的检测方案是可用的,但是缺乏可靠性。
遗憾的是,同样的方法不能被用于同一个视窗中的复合内容,该内容典型的是网页,这是因为对纯文本或图形的增强技术的应用可能导致显著的可察觉视觉质量的降低。然而,为了获得显示于监视器上的自然图像的质量的显著提高而应用的视频增强算法,当应用于纯文本或图形时是不利的。因此,应用这样的算法的结果通常不充分。
因此,对于任意种类的复合内容图像,可靠地分辨出自然和合成内容变得尤为重要。
本发明的目的在于提供一种用于分析图像的改进方法,即特别的是用于检测复合内容的数字图像中的哪些区域包含自然图像内容而哪些区域包含合成图像内容的方法。此外,本发明的目的在于提供一种计算机程序产品、一种设备、一种处理器装置系统以及一种可执行上述方法的计算机可读介质。
本发明由独立权利要求所定义的。从属权利要求定义优选的实施例。
本发明的基本优点在于根据本发明的方法使得图像处理自动适应于在一个特定时刻所显示或处理的图像内容成为可能。基本的思想是能够从合成图像中分辨出自然图像内容。该分辨是根据本发明的基本构思通过局部图像信息和整体图像信息的混合的方法来执行的。整体信息是关于组的信息,比如路径长度。局部信息由每个像素的微分项提供。
可从这种分辨受益的其它应用是图像压缩技术,它可对自然和合成图像内容分别采用不同的编码方案。特别地,这涉及到图像压缩技术,比如编码视频图像和文本/图形。
上述提出的方法实质上可被划分为三个步骤,其中每个步骤包括出其不意的观念。
在第一步中,该方法处理像素的一个或多个相关的参数值。此外,局部图像信息通过参数矩阵的微分给出,而整体图像信息则通过具有相同微分项的相邻像素组给出。
关于第二步,所有的实验观察都显示对于自然图像内容找到长路径的几率是很低的。该几率随着微分项的增加而减小。相反地,在合成图像内容中这个几率较高。概念就是使用这个特征来在复合图像内容中一方面分辨自然图像内容,另一方面分辨合成图像内容。特别地,考虑到复合图像内容,这个观念可通过观察自然图像内容比合成图像内容更加“破碎”,因此自然图像内容的路径长度更难变得很长来解释。考虑到自然图像内容和合成图像内容的一般比较,因此自然图像内容的路径更不可能变得很长。
因而,该方法的第三步利用一个阈值函数T(D)来执行阈值操作。计算每个组的长度:如果路径长度和微分项的组合高于阈值,那么所有属于这个组的像素被认为是合成的,并且这个组被标记为属于合成图像内容。否则,像素被认为是自然的并且该组被标记为属于自然图像内容。
考虑到梯度值,自然图像内容的阈值更高一些,因为自然图像通常的特征在于像素之间具有较低的梯度,因而更可能具有长的组。由于考虑到较低梯度和较高梯度之间的比较,因此在较低梯度的情况下长的组更可能对应于自然图像内容。相反地,在高梯度值时阈值必须较低,因为高梯度值典型的属于合成图像。
上述方法提供了对从包括在复合图像内容中的合成图像内容中分辨出自然图像的质量改进。
在一种优选的配置方案中,如果微分项D中一个像素的微分项不大于一个最小项目值,该像素就被分类为背景图像内容。所述改进从下列观念获得,具有低值的像素被分开考虑,因为它们代表背景,并且可能属于合成图像内容也可能属于自然图像内容。因此,所有具有不大于最小项目值的组都被标记为属于背景图像内容,与路径长度无关。
如果预定的最大差值为零,将获得一种更进一步改进的配置方案。这个配置方案减短了处理时间。
如果至少一个参数值对应于像素的亮度也同样是优选的。亮度是用于分析图像的相关参数,因为它包含图像能量以及关于形状的信息的主要部分,换句话说,包括内容检测所需的内容。
如果通过选择两个梯度的最大值来确定像素的微分项,将更加有利:
-亮度的第一梯度为沿着矩阵中一行像素的第一方向的矩阵中的像素位置的函数;以及
-亮度的第二梯度为沿着矩阵中另一行像素的与第一方向垂直的第二方向的矩阵中的位置的函数。
第一和第二梯度可以是梯度的正或负值,或者梯度的绝对值。
如果最小项目值是零将更加有利。它已经作为一个合适的值来将像素分类为背景图像内容。
在一种进一步优选的方案中,具有被分类为背景图像内容的像素的背景组中的像素,被分类为自然图像内容,如果
-背景组具有少于预定数量的具有被分类为合成图像内容SYNT的像素的相邻组,并且
-背景组具有最小数量的具有被分类为自然图像内容NAT的像素的邻近组。
否则就被分类为合成图像内容。
通过对被标记为背景图像内容的像素执行关系分析,被标记为背景图像内容的像素可转换成合成图像内容或自然图像内容。这可通过分析背景图像内容的周围图像内容来执行。
如下将获得进一步的改进,在被分类为自然图像内容的组中的那些像素,在下列情况被分类为合成图像内容,即如果
-相邻组具有被分类为合成图像内容的像素,以及
-该组的路径长度低于阈值长度。
重要的是,上述最后提及的改进步骤是在前述步骤之后执行来改进图像内容的校正检测。
在一种更优选的配置方案中,该方法可以通过第三部分来完成。在第三部分中,具有主要被标记为自然图像内容的像素的区域中的不规则性将被校正。特别地,一系列邻近的被分类为合成图像内容的像素,在该系列的长度低于一个最大长度的情况下,就被分类为自然图像内容。
一种更优选的配置方案提供了在具有被分类为自然图像内容的像素的图像的区域中:
-检测每个像素的饱和参数值,并且
-如果具有高于饱和阈值的饱和参数值的像素的百分比超过一个阈值百分比,那么该区域中的像素被分类为合成图像内容。
最后还有一个优点,如果
-产生在被分类为自然图像内容的图像区域中的像素的微分项的绝对值d,
-产生直方图H(d)
-具有在零和最大范围值之间的绝对值d的范围,
-包含该区域中具有相同绝对值d的多个像素的计数作为绝对值d的范围的函数
-在绝对值d具有峰值,如果
-邻近的直方图值H(d-1)、H(d+1)小于H(d),并且
-在绝对值d和最大范围值之间的绝对值d的范围内,H(d)为最大值,并且
-该区域中的像素被分类为合成图像内容,如果:
-对于H(d)具有峰值的绝对值d的最小值超过第一阈值距离,或者
-属于直方图H(d)的两个邻近峰值的绝对值(d)之间的差值超过第二阈值距离。
微分项的绝对值的直方图用于检验被分类为自然图像内容的图像区域是否真是自然的。
根据本发明通过执行上述提出的方法的计算机程序产品,当其在计算机上执行时,关于计算机程序产品的目标即可达到。
特别地,计算机程序产品的一种改进提供了下述关于阈值利用的伪码
                    pixelin position(i,j)
                calculateD(i,j)(gradient value)
                 calculateP(i,j)(path length)
calculateT(D(i,j))(threshold function,taken from a lookup table)
        if D(i,j)=o then S(i,j)is labeled as BACK else
if P ( i , j ) &GreaterEqual; T ( D ( i , j ) ) then S ( i , j ) is labeled as SYNT if P ( i , j ) < T ( D ( i , j ) ) then S ( i , j ) is labeled as NAT
标记i和j被用于标记各个矩阵的项目,S(i,j)是包含每个像素的图像内容(自然、合成或背景)的语义矩阵。
关于设备的问题将根据本发明通过如下设备来解决,该设备包括用于分析由像素矩阵构成的图像的电路和/或计算机程序,每个像素都由至少一个参数值定义,每个像素的至少一个参数值的值都排列在参数矩阵(Y)中,该设备包括用于执行如权利要求1所述方法的处理电路。
该设备可以是计算机、显示装置、监视器、电视或任何其它包括显示装置或具有用于处理图像的处理电路的产品。
关于处理器装置系统和/或计算机可读介质的目标是通过具有为执行所提出方法装载的计算机程序产品的处理器装置系统和/或计算机可读介质来实现的。
本发明的机箱和设备的这些和其它方面将参考附图进行进一步的解释和描述,其中:
图1是说明该方法第一实施例的流程图;
图2所示是用于第一实施例的阈值函数;
图3是说明完成第一实施例的第二实施例的流程图。
图1分三个步骤描述了关于上述分析图像的方法的主要特征。
在图1中使用的符号:
Y包括构成图像的像素矩阵的参数值的参数矩阵,
D包含参数值的微分项的梯度矩阵
P路径矩阵。它包含每个像素的路径长度。
S语义矩阵。对于每一个像素,它都包含三个标记NAT、SYNT或BACK之一,这些标记将在以下描述。
图像由像素矩阵构成。每个像素由至少一个参数值定义。像素矩阵的参数值排列在参数矩阵Y中。参数值通常以数字形式存在。优选将亮度作为参数。在第一步中,梯度操作1在矩阵Y的亮度参数上执行,且梯度值由排列在微分矩阵D中的多个微分项提供。
在第二步中,相邻的微分项的组被确定,其相互偏离不超过预定的最大差值。对于每个组,路径长度由指示这个组中的项目数量的路径查找器(finder)2来确定。
一种简化所需计算的替换方案可使预定的最大差值等于零。
在第三步中,通过对于每个像素检查该像素的微分项和路径长度的组合是否超过预定阈值函数T(D)来执行阈值检查3。
对于每个组,通过将路径长度和微分项的变量与阈值函数T(D)进行比较,如果变量超过阈值函数T(D),那么与该组相关的像素被分类为合成图像内容SYNT,如果变量保持低于阈值函数T(D),那么与该组相关的像素就被分类为自然图像内容。
图2描述了一个用于优选实施例中的优选阈值函数T(D)。给出阈值函数作为微分项的绝对值d的函数。在自然图像中,像素之间更可能具有较低梯度,于是从统计角度看,对于低梯度形成较长的路径长度。这就形成了一个如图2所示的优选的阈值函数T(D),其中当微分项的绝对值d增加时,阈值函数T(D)减小。在图1的比较步骤中,微分项与最小项目值进行比较。
微分项低于或等于最小项目值的像素被分类为背景图像内容BACK。由于被分类为背景图像内容BACK的像素可能属于合成图像内容SYNT也可能属于自然图像内容NAT,所以需要如下所述的更进一步的处理。
优选的是最小项目值为零。
由于上述步骤,语义矩阵S可以被形成,对每个像素包含标记NAT、SYNT或BACK之一。
关于梯度操作,有许多算符都适合来执行这个任务,但是经过实验检验后发现使用不同的梯度算符的结果并没有显著不同。因此从计算的角度来说优选使用最简单的范数(norm),即最大范数:
D ( i , j ) = max { | &PartialD; Y ( i , j ) &PartialD; i | , | &PartialD; Y ( i , j ) &PartialD; j | }
其中D(i,j)表示具有多个在行方向上被标记为i以及在列方向上被标记为j的微分项的矩阵D,以及其中 &PartialD; Y ( i , j ) &PartialD; i , &PartialD; Y ( i , j ) &PartialD; j 分别表示关于在行方向上和在列方向上的项目的矩阵Y的偏微分。
特别地,根据
D(i,j)=max,{|Y(i,j)-Y(i-1,j)|,|Y(i,j)-Y(i,j-1)|}
提供公式。通常,任何一种梯度操作都适合,比如:
D ( i , j ) = | | ( Y ( i , j ) - Y ( i - 1 , j ) ) , ( Y ( i , j ) - Y ( i , j - 1 ) ) | | N
= ( Y ( i , j ) - Y ( i - 1 , j ) ) N + ( Y ( i , j ) - Y ( i , j - 1 ) ) N N ,
其中N是整数。
当N=2时,这产生欧几里德范数:
D ( i , j ) = ( Y ( i , j ) - Y ( i - 1 , j ) ) 2 + ( Y ( i , j ) - Y ( i , j - 1 ) ) 2 2
当N=∞时,这产生用于优选实施例中的最大范数。
对于每个像素,微分项可以被存储在额外存储器中。但是,在一种优选实施例中,用于存储微分项矩阵D的额外存储器并不是必需的。矩阵Y可存储在帧存储器中。对于每个已经计算出微分项的像素,其可将这个微分项存储在对应的参数值所存储的同一个帧存储器中,因为这个参数值在该方法接下来的步骤中都不再使用。为了实现上述过程,仅需要一个额外的线存储器(line memory)。
作为上述方法部分1的结果,三个可能的标记NAT、SYNT或BACK之一被指定给每个像素。
具有被分类为背景图像内容BACK值的像素的组被按照如图3的流程图所示进行进一步处理。这些组是图像的均匀区域。通常,均匀区域表示图像的背景,因此它可同时属于图像的自然内容或/和合成内容。例如,一幅风景天空中的白色区域在经JPEG压缩的量化后呈现为均匀的,并且以同样方式使图表的文本具有均匀的背景。对于均匀区域中组的处理分为两个步骤:BACK路径处理步骤4,接着是短NAT路径处理步骤5。
两个必须为属于自然图像的均匀区域进行检验的不同特性被确定:
1.在均匀区域周围图像的区域不应包含(或仅应包含少许)文本字符或图形部分,换句话说,它不应包含太多具有被分类为SYNT的像素的组。
2.均匀区域必须至少部分地与具有被分类为NAT的像素的组邻近。否则,就没有理由认为它们是视频图像的一部分。
通过分析语义矩阵S而在BACK路径处理步骤4中检验了两个特性。如果找到具有用这些特性分类为BACK的像素的组,那么这个组中的像素被转换为NAT,否则它们被转换为SYNT。作为BACK路径处理步骤4的结果,产生一个修改的语义矩阵S1,它包含被分类为NAT或SYNT的像素。
在一种优选实施例中,上述两个特性被用来分类背景组中的像素,该背景组具有被分类为背景图像内容BACK的像素。如果满足下列两个特性,那么背景组中的像素被分类为自然图像内容:
1.背景组具有少于预定数量的具有被分类为合成图像内容SYNT的像素的相邻组,并且
2.背景组具有最小数量的具有被分类为自然图像内容NAT的像素的邻近组。
在所有其它的情况下,在背景组中的像素被分类为合成图像内容SYNT。
上述操作的结果是修改的语义矩阵S1,它包含被分类为NAT或SYNT的像素。
当背景被正确地分类,该优选实施例继续在短NAT路径处理步骤5中,对被分类为NAT的组进行转换,这些组是孤立的并且太短以致于不被认为是自然图像内容。这些组可被称为短NAT路径并且被认为是伪路径(spurious path),因为它们通常产生于小图标或按照JPEG压缩的合成图像的部分。在短NAT路径处理步骤5中,在短NAT路径中的像素被转换成SYNT。短NAT路径处理的结果被存储在第二修改的语义矩阵S2中。
重要的是注意最后两个步骤的顺序不能被颠倒。
事实上,经常发生的是自然图像的一小部分从图像的其余部分被背景孤立出来。这种路径可以被称为真实短NAT路径,因为它们是由优选实施例分类为属于自然图像的路径,这些路径是很短但是不像绝大部分的短NAT路径那样是错误检测的。如果优选实施例在BACK部分之前处理短NAT路径,那么所有的短NAT路径都被转换为SYNT;因此有可能发生的是一些真实短NAT路径(它们是短NAT路径的子集)也被转换为SYNT。这将导致检测性能的降低。因此,保持步骤的正确描述顺序可避免不希望的结果。
如图3所示在BACK路径处理步骤4和短NAT路径处理步骤5之后,该算法产生第二修改的语义矩阵S2作为输出,其只包含两种标记:NAT和SYNT。每个像素都被以这两种标记进行分类。被标记为NAT的像素的组代表输出屏蔽。这样的屏蔽经常会在其中和在边界处包含一些不规则性。因此,不规则性降低操作步骤6被应用在本发明的优选实施例中,以便减小这些不规则性。
第二修改的语义矩阵在其行和列的方向上进行扫描。通过此操作,可表征下列两种情形:“屏蔽-非屏蔽”过渡和相反的“非屏蔽-屏蔽”过渡。第一个术语是指该算法首先遇到一个属于屏蔽的像素然后遇到一个不属于屏蔽的像素的情形。第二个术语是指相反的情形。当在一行中发现了“屏蔽-非屏蔽”过渡,计数器就增加直到相反的过渡发生或者这一行结束。然后计数器被估值,如果它的值低于某一个阈值,则所有来自最后的“屏蔽-非屏蔽”事件的像素都被转换成属于屏蔽的像素。
换句话说,如果被分类为合成图像内容SYNT的邻近像素系列的长度低于最大长度,则该系列就被分类为自然图像内容NAT。
这种处理消除了绝大部分屏蔽的不规则性。
最后两个测试T1、T2在处理的结尾处执行,其目的是增加自然区域的检测的可靠度。
如图3所示的第一测试T1在屏蔽中的像素的颜色饱和参数上执行。在被分类为自然的区域中饱和参数的饱和值Sv被按照逐个像素进行估算。
每个像素的饱和值Sv可由下列公式通过该像素的RGB颜色分量获得:
S v = 1 - min { R , G , B } ( R + G + B ) / 3
为每个像素确定饱和阈值Sv,并且屏蔽中那些饱和值高于饱和阈值的像素的百分比被确定。如果该像素的百分比高于饱和阈值,那么该屏蔽就被认为是合成区域,并且相关的像素和路径就被标记为合成图像内容SYNT。
最后,第二测试T2在每个被识别为自然的区域中的微分项的直方图上执行。已发现该直方图在自然图像的情况下必须满足两个标准。因此,第二测试的目的就是在被检测为自然图像内容NAT的区域中检验这些标准,并且如果该区域的直方图满足这两个标准时,将被测试区域保持分类为自然图像内容NAT。否则,该分类就变成合成图像内容SYNT。
在优选实施例中,被测试的区域中的像素的微分项的绝对值d被用来产生直方图H(d)作为绝对值d的函数。
在一种可替换的实施例中,可使用微分项的正或负值。
绝对值d的直方图H(d)对于每个值d,都包含多个被测试的区域中的具有值d作为微分项的绝对值的像素。
绝对值d可在零到最大范围值之间变化。最大范围值对应于最大微分项,该微分项发生在参数矩阵Y中的两个邻近项具有最大差值时,例如,由于从零亮度值到最大亮度值的过渡或反之亦然产生的。
直方图H(d)中的峰值基于如下标准定义:
1)H(d)是相对最大值,即H(d)>H(d-1)以及H(d)>H(d+1);
2)H(d)在该范围(d,最大范围值)中是绝对最大值。
在具有自然图像内容NAT的图像(比如视频图像)的直方图中,所有的峰值(如果大于一个)以低梯度出现,并且峰值之间的距离很小。在文本和图形图像的直方图中,峰值之间的距离显然高于视频图像中的峰值距离,并且第一峰值经常表现为一个比视频图像中大得多的绝对值。在处理大数量的输入图像之后,可发现对于第一阈值距离的合适的阈值(即对于具有d的最低值的第一峰值的d的绝对值),以及发现对于在邻近峰值间的第二阈值距离的合适的阈值。
基于上述的两个阈值,具有自然图像内容NAT的区域为了保持该分类而需满足的两个标准是:
1)第一峰值必须出现在低于第一阈值距离的绝对值d,以及
2)两个连续的峰值之间的距离必须小于第二阈值距离。
在一种优选实施例中,应用上述标准的分类如下执行:
-产生在被分类为自然图像内容(NAT)的图像的区域中的像素的微分项的绝对值d,
-产生直方图H(d)
-具有在零和最大范围值之间的绝对值d的范围,
-包含该区域中具有相同绝对值d的多个像素的计数作为绝对值d的范围的函数
-在绝对值d具有峰值,如果
-邻近的直方图值H(d-1)、H(d+1)小于H(d),并且
-在绝对值d和最大范围值之间的绝对值d的范围内,H(d)为最大值,并且
-该区域中的像素被分类为合成图像内容(SYNT),如果:
-对于H(d)具有峰值的绝对值d的最小值超过第一阈值距离,或者
-属于直方图值H(d)的两个邻近峰值的绝对值(d)之间的差值超过第二阈值距离。
如图3所示的最后的屏蔽M(即具有被标记为NAT的像素的区域,该区域在两个测试T1、T2之后保持自然内容NAT的分类),以良好的可靠度表示图像中的自然区域。
应该注意的是上述实施例仅仅是说明而不是限定本发明,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出许多可替换的实施例。在权利要求中,所有置于括号中的附图标记都不应被认为是对权利要求的限定。动词“包括”以及它的变化形式并不排除除该权利要求所述之外的部件或步骤的存在。部件之前的“一”或“一个”并不排除多个这种部件的存在。本发明可由包括多个不同部件的硬件来实现,也可由适当编程的计算机来实现。在设备权利要求中举出了多个装置,这些装置中的一些可通过同一个硬件项来实现。在互不相同的从属权利要求中所叙述的某些手段并不说明这些手段的结合不能被有利地利用。

Claims (14)

1.一种分析由像素矩阵构成的图像的方法,每个像素都由至少一个排列在参数矩阵(Y)中的参数值定义,该方法包括下列步骤:
-在参数矩阵(Y)上执行微分操作来提供多个排列在矩阵中的微分项(D),
-确定相邻微分项的组相互之间偏离不超过预定的最大差值;
-为每个组确定路径长度,指示该组中的多个相邻微分项,并且将所述的路径长度分配给所述组中的每个像素,
-将像素分类
-为合成图像内容(SYNT),如果分配给所述像素的路径长度和所述像素的微分项的组合超过阈值函数(T(D)),以及
-为自然图像内容(NAT),如果分配给所述像素的路径长度和所述像素的微分项的组合低于阈值函数(T(D))。
2.如权利要求1所述的方法,其特征在于如果在微分项(D)中所述像素的微分项不大于最小项目值,那么该像素被分类为背景图像内容(BACK)。
3.如权利要求1所述的方法,其特征在于预定最大差值为零。
4.如权利要求1所述的方法,其特征在于至少一个参数值对应于像素的亮度。
5.如权利要求4所述方法,其特征在于像素的微分项通过从两个梯度中选择最大值来确定:
-亮度的第一梯度为沿着矩阵中一行像素的第一方向的矩阵中的像素位置的函数;
-亮度的第二梯度为沿着矩阵中另一行像素的与第一方向垂直的第二方向的矩阵中的位置的函数。
6.如权利要求2所述的方法,其特征在于最小项目值为零。
7.如权利要求2所述的方法,其特征在于具有被分类为背景图像内容(BACK)的像素的背景组中的像素,在下列情况下被分类为自然图像内容(NAT),即如果
-背景组具有少于预定数量的具有被分类为合成图像内容SYNT的像素的相邻组,并且
-背景组具有最小数量的具有被分类为自然图像内容NAT的像素的邻近组,
否则就被分类为合成图像内容(SYNT)。
8.如权利要求7所述的方法,其特征在于在一个组中被分类为自然图像内容(NAT)的那些像素,在下列情况被分类为合成图像内容(SYNT),即如果
-相邻组具有被分类为合成图像内容(SYNT)的像素,以及
-该组的路径长度低于阈值长度。
9.如权利要求1所述的方法,其特征在于一系列被分类为合成图像内容(SYNT)的邻近的像素,在该系列的长度低于最大长度的情况下,就被分类为自然图像内容(NAT)。
10.如权利要求1所述的方法,其特征在于在具有被分类为自然图像内容(NAT)的像素的图像区域中:
-检测每个像素的饱和参数值,并且
-如果饱和参数值高于饱和阈值的像素的百分比超过阈值百分比,那么该区域中的像素被分类为合成图像内容(SYNT)。
11.如权利要求1所述的方法,其特征在于
-产生在图像区域中被分类为自然图像内容(NAT)的像素的微分项的绝对值d,
-产生直方图H(d)
-具有在零和最大范围值之间的绝对值d的范围,
-包含该区域中具有相同绝对值d的多个像素的计数作为绝对值d的范围的函数
-在绝对值d具有峰值,如果
-邻近的直方图值H(d-1)、H(d+1)小于H(d),并且
-在绝对值d和最大范围值之间的绝对值d的范围内,H(d)为最大值,并且
-该区域中的像素被分类为合成图像内容(SYNT),如果:
-对于H(d)具有峰值的绝对值d的最小值超过第一阈值距离,或者
-属于直方图H(d)的两个邻近峰值的绝对值(d)之间的差值超过第二阈值距离。
12.一种可存储于计算机可读介质上的计算机程序产品,包括用于执行如权利要求1所述方法的软件装置。
13.一种用于分析由像素矩阵构成的图像的设备,每个像素都由至少一个参数值定义,每个像素的至少一个参数值的值排列在参数矩阵(Y)中,该设备包括用于执行如权利要求1所述方法的处理装置。
14.一种处理器装置系统和/或计算机可读介质,具有存储于其上的用于执行如权利要求1所述方法的计算机程序。
CNA038120356A 2002-03-26 2003-03-12 将像素分类为自然或合成图像内容 Pending CN1656516A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02076184 2002-03-26
EP02076184.7 2002-03-26

Publications (1)

Publication Number Publication Date
CN1656516A true CN1656516A (zh) 2005-08-17

Family

ID=28051811

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA038120356A Pending CN1656516A (zh) 2002-03-26 2003-03-12 将像素分类为自然或合成图像内容

Country Status (6)

Country Link
EP (1) EP1490834A2 (zh)
JP (1) JP2005521169A (zh)
CN (1) CN1656516A (zh)
AU (1) AU2003212574A1 (zh)
TW (1) TW200404268A (zh)
WO (1) WO2003081533A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100570629C (zh) * 2006-03-16 2009-12-16 索尼株式会社 图像处理装置和方法
CN117390600A (zh) * 2023-12-08 2024-01-12 中国信息通信研究院 用于深度合成信息的检测方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006087666A1 (en) * 2005-02-16 2006-08-24 Koninklijke Philips Electronics N.V. Method for natural content detection and natural content detector
EP2442238A1 (en) 2010-09-29 2012-04-18 Accenture Global Services Limited Processing a reusable graphic in a document
US11521378B2 (en) 2020-01-06 2022-12-06 International Business Machines Corporation Refined searching based on detected object configurations
US11366624B2 (en) 2020-03-30 2022-06-21 Kyocera Document Solutions Inc. Super-resolution convolutional neural network with gradient image detection

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100570629C (zh) * 2006-03-16 2009-12-16 索尼株式会社 图像处理装置和方法
CN117390600A (zh) * 2023-12-08 2024-01-12 中国信息通信研究院 用于深度合成信息的检测方法
CN117390600B (zh) * 2023-12-08 2024-02-13 中国信息通信研究院 用于深度合成信息的检测方法

Also Published As

Publication number Publication date
AU2003212574A1 (en) 2003-10-08
JP2005521169A (ja) 2005-07-14
TW200404268A (en) 2004-03-16
EP1490834A2 (en) 2004-12-29
WO2003081533A3 (en) 2004-08-26
AU2003212574A8 (en) 2003-10-08
WO2003081533A2 (en) 2003-10-02

Similar Documents

Publication Publication Date Title
CN1155233C (zh) 数字电视图像自动宽高比格式检测方法和装置
CN100351868C (zh) 利用多帧图像的静止图像的生成
CN1276382C (zh) 用于辨别图像不同区域的方法和装置
CN1441595A (zh) 对比度校正电路
CN1308891C (zh) 用于图象处理中边缘增强的装置和方法
CN1617567A (zh) 彩色图像压缩方法和装置
CN1685715A (zh) 图像显示装置和图像显示方法
CN1922631A (zh) 创建深度图
CN1655582A (zh) 连续具有相似特性的图像数据的区域的系统和方法
CN1311394C (zh) 用于二进制化图像的设备和方法
CN1615029A (zh) 用于增强图像的局部亮度的方法、装置及记录介质
CN1842134A (zh) 噪声降低装置和噪声降低方法
CN1933549A (zh) 用于确定图像质量的图像处理装置及其方法
CN1867928A (zh) 用于分析物体轮廓图像的方法与图像处理装置 ,用于检测物体的方法与图像处理装置 ,工业视觉设备 ,智能相机,图像显示器 ,安全系统 ,以及计算机程序产品
CN1370309A (zh) 数字图像分段的方法和装置
CN101059951A (zh) 图像处理设备和方法
CN1920539A (zh) 缺陷检测方法与缺陷检测装置
CN1719455A (zh) 基于色彩的彩色图像的区域分割技术
CN1179064A (zh) 动态矢量高速测算装置和动态矢量测算方法
CN101031029A (zh) 一种视频图像处理的方法及其装置
CN1195284C (zh) 图像处理设备
CN1753035A (zh) 图形处理系统、装置及其材质数据的处理方法
CN1909670A (zh) 图像表示和分析方法
CN1343421A (zh) 图像内插系统和图像内插方法
CN1878231A (zh) 用于检测安全文件的装置和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication