CN102663451A

CN102663451A - 一种基于色彩空间特征的图形图像分类方法

Info

Publication number: CN102663451A
Application number: CN2012100939580A
Authority: CN
Inventors: 蔡圣燕; 聂旋; 郭淑勤
Original assignee: Tianjin University of Science and Technology
Current assignee: Tianjin University of Science and Technology
Priority date: 2012-03-29
Filing date: 2012-03-29
Publication date: 2012-09-12

Abstract

本发明涉及一种用于自然图片和计算机图形的分类方法，其步骤为：(1)输入图像，提取输入图像特征，选取图像特征，所选取的图像特征根据常规公知计算方法执行计算，得到上述图像特征的特征值，(2)将得到的单个图像特征或多个图像特征组合的特征值与每个所选图像特征预设的阈值进行比较，通过采用分类器进行分类来判断输入图像的类别，得出分类结果；(3)根据分类结果选择相应的处理方式，分类结果将输入图像判断为自然图片或计算机图形后，分别采用各自对应的再现意图的色域映射方式。本发明实现了自然图片和计算机图形的自动分类以及再现意图的自动选择，简化了色彩管理软件的操作，图像的显示或打印质量将得到显著改善和提高。

Description

一种基于色彩空间特征的图形图像分类方法

技术领域

本发明属于数字图像处理领域，涉及图形图像分类方法，尤其是一种基于色彩空间特征的分类方法。

背景技术

在色彩管理过程中，为了实现色彩在不同设备间准确的传递和再现，需要进行色彩空间的转换和匹配，但由于不同设备的色空间之间存在较大差异，因此在进行色域映射的时候，往往会遇到源设备色域大于输出设备色域的情况，而我们将源设备色域大于输出设备色域的部分称之为色域外颜色。为了能够更好地再现色域外的颜色，国际色彩联盟ICC为人们提供了四种再现意图，分别是感觉目的(perceptual intent)、相对色度目的(media-relative colorimetricintent)、绝对色度目的(absolute intent)和饱和度目的(saturation intent)。使用不同的再现意图得到的印刷复制的效果具有很大的差异。

上述四种再现意图主要的区别在于色貌变换方式和色域映射方法的不同，其中：(1)相对色度目的的色貌变换包括色适应和白点适应，色域映射采用色域裁剪方法，此法不仅保持了色域内颜色的相互关系，而且还考虑了介质的色度对人眼的影响，能够在不同类型的介质上呈现出比较接近的颜色，最适合于复制位于色域内或接近色域边缘的专色，也适用于正常动态范围的反射稿，不适合用于复制高动态范围的图像；(2)绝对色度再现意图的色貌变换仅有色适应，不进行白点映射，采用了色域裁剪的方法，此法适用于要求精确复制的专色以及中间调居多、具有极窄动态范围、低饱和度的反射稿，还可用于打样；(3)感觉目的的色貌变换包括亮度适应、色适应和白点适应，色域映射采用色域压缩算法，能够较好保持图像的层次信息，此法适用于海报、自然照片的复制，在印刷领域的应用较多；(4)饱和度目的可以使得处于目标色域内的颜色不变，色域外的颜色用最接近饱和度的颜色复制，保持颜色的饱和度，此法适用于图形、表格、地图等。因此，不同类型的图像原稿在复制时需要选择合适的再现意图。

在印刷过程中，针对不同的原稿，从业者首先要对其类型进行判断，然后选择合适的再现意图，以得到满意的复制效果。然而对于缺乏专业知识的印刷从业者来说，这些选项要么被忽略，要么过于复杂而难于正常操作，与此同时，越来越多的企业在其生产中开始应用色彩管理。

要实现色彩管理智能化首先要解决再现意图的自动选择，而在选择再现意图时必须对图像原稿进行分类。图像原稿总体上可以分为两类：计算机图形和自然图片，其中：自然图片主要包括：照片、电影截图等；计算机图形主要包括：地图、卡通、漫画、标识、工程图和游戏场景等。通常来说，自然图片适合采用感觉目的再现意图；而计算机图形则适合采用饱和度目的再现意图。除了用于再现意图的自动选择之外，计算机图形和自然图片的分类在其他领域也有着重要的应用，例如图像编码和图像检索等领域。

通过对放大后的数字图像进行观察，我们可以发现，自然图片的特点在于层次丰富，相邻像素颜色变化小，而计算机图形的特点在于颜色数少，多平网色块，且色块间的颜色变化大。根据对计算机图形和自然图片特点的分析，它们之间的根本差异在于相邻像素颜色的变化。连续调图像相邻颜色变化平缓，层次细腻；图形相邻颜色之间绝大部分没有差异，只在色块边缘有较大的变化。因此可以将相邻像素颜色变化作为分类判断的根本依据。也就是说，凡是能够反映数字图像相邻像素颜色变化的特征都可以作为图形图像分类的依据。现有的分类方法主要是通过分析图像的空间特性、纹理边缘和颜色三个方面的信息来进行分类。

经检索，发现一篇与本专利内容相关的专利文献，公开号为CN101222575A的中国专利提出了基于图像属性将图像分类的方法、介质和系统。该专利通过提取和分析图像的亮度、饱和度和边缘特征，将输入图像分类为商业图形图像和照片图像，并将适当的色域映射技术用于分类后图像。现有分类方法的不足在于单个特征鲁棒性较差，判别精度较低：将大面积纯色背景图像误判为图形；将具有复杂纹理信息的图形误判为图像。

发明内容

本发明的目的在于克服现有技术不足之处，提供一种分类精度高、灵活性强、智能化的基于色彩空间特征的图形图像分类方法。

本发明解决其技术问题是采取以下技术方案实现的：

一种用于自然图片和计算机图形的分类方法，其步骤为：

(1)输入图像，图像颜色模式为RGB、Lab、YCbCr或CMYK，提取输入图像特征，选取单个图像特征或多个图像特征组合，所选取的图像特征根据计算方法执行计算，得到上述单个图像特征或多个图像特征组合的特征值；

(2)将得到的单个图像特征或多个图像特征组合的特征值分别与每个所选图像特征预设的阈值进行比较，通过采用分类器进行分类，判断输入图像的类别，得出分类结果；

(3)根据分类结果选择相应的处理方式，分类结果将输入图像判断为自然图片或计算机图形后，分别采用各自对应的再现意图。

而且，步骤(1)所述提取输入图像的特征为空间特征和颜色特征，且至少包括以下一个特征：空间特征包括：基于行程长度统计矩阵的行程比、灰度直方图平滑度、梯度、邻域内最大灰度差级数、邻域内最大灰度差最大频率、邻域内最大灰度差平滑度、邻域相似比等特征；颜色特征包括：灰度级数、颜色相似度、颜色渐变和饱和度，所选取的图像特征为上述特征的任意顺序组合，并可同时进行。

而且，步骤(2)所述的分类器为单个分类器和/或综合分类器。

而且，所述的单个分类器使用输入图像单个特征的特征值与其对应的预先设定的阈值进行比较来判断分类结果，单个分类器可以选择颜色通道中任意一个或多个通道来提取图像特征进行分类，并且各通道之间没有先后顺序，同时提取或用于判断。

而且，所述的综合分类器利用多个特征组合进行分类的方法步骤为：

(1)选取多个特征值，依次判断每个特征值是否大于其对应的预先设定的阈值：

(2)判断方法为：如果第一个特征值不大于其预先设定的阈值，则判断为自然图片，判断终止；

(3)如果第一个特征值大于其对应的预先设定的阈值，则执行下一个特征值与其预先设定的阈值的判断比较，以此类推，依次判断，当判断结果为自然图片时或当最后一个特征值大于其对应的预先设定的阈值时，则判断为计算机图形，判断终止。

而且，所述综合分类器利用判别分析得到的二次判别函数或BP神经网络进行判断分类。

而且，所述利用判别分析得到的二次判别函数进行判断分类的方法步骤为：

(1)对训练集图像提取特征，判别分析，得到二次判别函数；

(2)提取输入图像特征，利用特征值计算二次判别函数值；

(3)比较二次判别函数值的大小，将输入图像判为函数值最大的类别。

而且，所述利用BP神经网络进行判断分类的方法步骤为：

(1)提取训练图像特征，求得训练特征均值，根据特征均值对图像特征进行归一化；

(2)确定BP神经网络结构和BP神经网络初始权值，利用遗传算法优化BP神经网络初始权值，采用归一化的特征数据训练网络，得到训练好的BP神经网络；

(3)提取输入图像特征，采用训练特征均值对输入图像特征进行归一化；

(4)采用训练好的BP神经网络对输入图像进行判断，根据输出结果进行分类。

一种用于自然图片和计算机图形的分类的处理系统，包括：

(1)输入图像模块，用于输入图像，提取输入图像特征，所选特征根据其对应的计算方法执行计算，得到各对应特征值；

(2)特征选取模块，用于选取单个特征或多个特征组合，将其对应的特征值与每个所选特征设定的阈值进行比较，来判断输入图像的类别，得出分类结果；

(3)图片处理模块，用于根据分类结果选择相应的处理方式，分类结果将输入图像判断为自然图片或计算机图形后，分别采用各自对应的再现意图。

而且，所述输入图像模块连接扫描仪或数码相机；所述图片处理模块连接显示器或打印机。

本发明的优点和积极效果是：

1、本发明提供的图形图像分类方法提取特征采用BP神经网络进行分类，所述BP神经网络初始权值采用遗传算法优化，本发明通过利用训练集中的图像特征和分类结果对BP神经网络进行训练，得到了特征和分类结果的映射关系。利用该关系(即训练好的网络)就可以完成图形图像的分类工作，并且能够能到较高的分类精度。

2、本发明提供的图形图像分类方法将计算机图形和自然图片分类结果和图像处理过程相连接，使本系统包括提取图像特征单元、分类器分类单元以及分类处理单元，根据分类结果选择相应的处理方式，在实现分类的同时实现了再现意图的自动选择。

3、本发明提供的图形图像分类方法采用了融合算法，并且还结合新特征和融合算法进行分类，通过梯度算法进行迭代运算求解权值的过程，通过训练不断地调整网络的权值和阈值，以使得输出结果与实际数据的误差最小，从而使网络实现给定的输入输出映射关系，使分类精度比以前的分类器有显著提高。

4、本发明提供的图形图像分类方法简化了色彩管理操作，实现了再现意图的自动选择，简化软件操作，由此提高生产效率，从而为实现色彩管理自动化、智能化奠定基础。

5、本发明提供的图形图像分类方法可用于扫描仪和数码相机等图像输入设备，针对不同原稿采用不同输入及压缩编码方式，提高图像输入、压缩和传输的效率。

6、本发明提供的图形图像分类方法可用于显示器和打印机等图像输出设备，针对不同原稿采用不同再现意图，显著改善和提高显示器或打印机的输出质量，快速精确地实现图像颜色的再现。

7、本发明提供的图形图像分类方法还可用于图像检索，针对不同图片采用不同检索方式，以达到提高检索精度，提升检索速度的目的。

附图说明

图1为本发明对输入图像进行分类后自动选择再现意图的方法及其步骤的流程图；

图2为本发明的输入图像提取特征以及利用特征阈值进行分类判断的方法及其步骤的流程图；

图3为本发明利用单个特征不同通道的组合进行分类的方法及其步骤的流程图；

图4为本发明利用多个特征组合进行分类的方法及其步骤的流程图；

图5为本发明利用二次判别函数进行分类的方法及其步骤的流程图；

图6为本发明利用BP神经网络进行分类的方法及其步骤的流程图；

图7为本发明作为图像处理开关的装置。

具体实施方式

下面结合附图并通过具体实施例对本发明作进一步详述，以下实施例只是描述性的，不是限定性的，不能以此限定本发明的保护范围。

图1示出了本发明对输入图像进行分类后自动选择再现意图的方法及其步骤的流程图。如图1所示，根据本发明实施例的对输入图像进行分类后自动选择再现意图的方法包括以下步骤：S102，提取特征；S104，分类器分类；S106，根据分类结果选择相应的再现意图。

其中，参见图2，在提取特征时，首先需要选择一个或多个分类特征组合，S102-2。提取的特征至少包括以下一个特征。空间特征有基于行程长度统计矩阵的行程比(RPG)、灰度直方图平滑度(Smoothness，S)、梯度(Gradient，G)、邻域内最大灰度差级数(Farthest NeighbourLevels，FNL)、邻域内最大灰度差最大频率(Farthest Neighbour Max Frequency，FNMF)、邻域内最大灰度差平滑度(Farthest Neighbour Smoothness，FNS)、邻域相似比(NSR)等特征；颜色特征包括：灰度级数(Gray Levels，GLS)、颜色相似度(Color Similarity，CS)、颜色渐变(Color Transition Smoothness，CTS)和饱和度(Saturation Smoothness，SS)。

其中，在提取特征时，在选择一个或多个特征组合之后，执行所选特征的算法，S102-4。其中，行程比RPG反映的是行程长度统计矩阵的阵元情况。行程长度是统计图像沿某一方向θ上连接n个像素都具有灰度值g发生的概率p(n，g)。对于数字图像，由所有p(n，g)组成的矩阵P(n，g)，则构成了该图像的行程长度统计矩阵。RPG的值可以由下述公式计算得出。

RPG = \frac{\underset{g, n}{Σ} p (g, n)}{M * N}

其中M*N为图像像素总数。

其中，平滑度S的计算方法如下：首先统计总的灰度级数，然后计算各个灰度级的像素数目即频数，再分别除以总的像素数，得到频率。最后通过计算相邻灰度频率差的总和就得到了直方图平滑度。

H (i) = \frac{I (i)}{Σ_{i = \min (g)}^{\max (g)} I (i)}

S = Σ_{i = \min (g) + 1}^{\max (g)} | H (i) - H (i - 1) |

式中，g为灰度级数，I(i)为灰度级为i的像素数，H(i)为灰度级i的出现频率，S为图像平滑度。

其中，梯度(Gradient，G)是图像中每个像素与其水平方向相邻像素的色差绝对值和其垂直方向相邻像素的色差绝对值之和。梯度的简化计算方法如下：

|g(i，j)|＝|f(i，j)-f(i+1，j)|+|f(i，j)-f(i，j+1)|

式中，f(i，j)为图像(i，j)点的灰度值，g(i，j)为(i，j)点的梯度大小。

G = \frac{\underset{| g ((i, j) | = 0}{Σ} I (i, j)}{M * N}

上式中，I(i，j)为图像中的像素，M*N为图像总像素数，G值为0梯度的像素占图像总像素的频率。

其中，邻域内最大灰度差(FarthestNeighbour，FN)是通过计算邻域内像素灰度值之间的差值大小，来反映边缘的变化情况。邻域内最大灰度差越大，灰度变化越剧烈，纹理边缘越清晰。图像纹理的边缘变化是一种平滑地过渡，变化比较平稳，没有剧烈的变化。而图形边缘的变化则比较剧烈。

邻域内最大灰度差的算法如下：对于图像中的一个像素，与其8邻域内其他像素的灰度求差，将其中绝对值最大的差值作为该点的邻域内最大灰度差值，记为FN值。我们将整幅图像的FN值记为FN矩阵。在对整幅图像进行FN值统计的时候发现，FN矩阵的灰度级数(Farthest Neighbour Levels，FNL)，最大频率(Farthest Neighbour Max Frequecy，FNMF)以及直方图平滑度(Farthest Neighbour Smoothness，FNS)三个子特征都能够显著地区分图形和图像。

FNL＝∑(g)

FNMF = \frac{\max [I (i)]}{Σ_{i = \min (g)}^{\max (g)} I (i)}

式中，g为FN矩阵的灰度级，I(i)为FN矩阵中灰度级为i的像素的个数，FNS的计算公式可以参考S的计算公式。

其中，邻域相似比(Neighborhood Similar Ratio，NSR)是指在3*3邻域内至少有一个相同灰度值的像素的个数占图片总像素数的百分比。它反映了图像细微层次的变化，当该特征值达到一定阈值时，即判断为图形，否则判断为图像。

邻域相似比的计算公式如下，

NSR = \frac{NS}{M * N}

式中，NS为在3*3邻域内至少有一个相同灰度值的像素的总数，M*N为图像像素总数。

其中，灰度级数(Gray Levels，GLS)是指数字图像本身所能呈现的灰度范围。GLS的计算公式如下，

GLS＝∑(g)

式中，g为图像单个通道的灰度级。

其中，颜色相似度(Color Similarity，CS)是指每个像素与其8邻域内像素的相似个数的平均值。其中只要两个像素的灰度值之差在一定阈值范围内，就称两者相似。为了和判别阈值相区别，我们将这个阈值称之为相似阈值。

具体算法如下：对于图像中的每一个像素，将其灰度值与其8邻域像素的灰度值进行求差，如果绝对值小于相似阈值，则相似数加1。求出相似个数，再除以8，得到单个像素的邻域相似度。最终将所有像素的相似度加起来，除以总像素数，就得到该图像的CS值了。

其中，颜色渐变(Color Transition，CT)综合了三个通道的颜色信息，通过统计分析相邻像素间的色差来进行分类。通常，给定两个相邻像素的RGB值，可以根据公式计算色差如下：

ΔE = \sqrt{{(ΔR)}^{2} + {(ΔG)}^{2} + {(ΔB)}^{2}}

为了简化计算，我们采用以下方式来计算：

ΔE＝|ΔR|+|ΔG|+|ΔB|＝|R(i，j)-R(i+1，j)|+|G(i，j)-G(i+1，j)|+|B(i，j)-B(i+1，j)|

为了提高判别精度，我们采用色差矩阵的直方图平滑度(Color Transition Smoothness，CTS)来进行判别，CTS的计算可参考S的计算公式。

其中，自然图片色彩的饱和度比较一致，不会出现较大的变化。而计算机图形中往往会出现少数特别饱和的颜色，饱和度比较高。饱和度的计算方法如下：

对于给定像素的RGB值，

Saturation＝max(|R-G|，|G-B|，|B-R|)

采用该方法可以计算得到图像的饱和度矩阵。将该矩阵求和，再除以总像素数，就可以得到平均饱和度。由于计算机图形和自然图片之间的饱和度矩阵的直方图存在较大差异。我们仍然采用直方图平滑度来定量描述这一特征，称之为饱和度平滑度(Saturation Smoothness，SS)。根据饱和度矩阵计算SS时，可参考S的计算公式。

其中，在步骤S104分类器分类中，我们使用的分类器主要有单个分类器和综合分类器。单个分类器是指用单个的阈值来进行判断的分类器；综合分类器则使用多个特征组合判断、SAS判别分析得到的判别函数和BP神经网络来进行判断。

其中，在步骤S106分类处理中，如果将输入图像判断为自然图片，则采用感觉目的再现意图；如果判为计算机图形，则采用饱和度目的再现意图。

图2示出了本发明对输入图像提取特征以及利用特征阈值进行分类判断的方法及其步骤的流程图。如图2所示，根据本发明实施例的对输入图像提取特征以及利用特征阈值进行分类判断的方法包括以下步骤：S102-2，选择一个或多个分类特征组合；S102-4，执行所选特征算法；S202，根据特征值和相应阈值进行比较，确定输入图像分类结果。

其中，在选择一个特征进行分类时，可以参照图3的方法和步骤进行。图3示出了利用单个特征不同通道的组合进行分类的方法及其步骤的流程图。本发明所用到的图像为RGB格式的图像，然而本方法同样适用于其他任何色彩格式的图像。如图3所示，以平滑度为例，根据本发明实施例的利用单个特征不同通道的组合进行分类的方法包括以下步骤：S302，提取R通道的平滑度S_R；S202，判断S_R是否大于阈值th，如果是则判为计算机图形，否则往下进行；S304，提取G通道的平滑度S_G；S202，判断S_G是否大于阈值th，如果是则判为计算机图形，否则往下进行；S306，提取B通道的平滑度S_B；S202，判断S_B是否大于阈值th，如果是则判为计算机图形，否则判为自然图片。其中各通道的阈值各不相同。在进行实施的时候，可以选择任意一个通道或多个通道的组合来进行分类，通道的顺序没有先后之分，而且可以同时进行；在比较特征值和阈值大小时，也可以用小于或大于阈值的条件来判断。

其中，在选择多个特征利用各个特征阈值进行分类时，可以参照图4的方法和步骤进行。图4示出了利用多个特征组合进行分类的方法及其步骤的流程图。如图4所示，以选取FNMF和FNS两个特征为例，根据本发明实施例的利用多个特征组合进行分类的方法包括以下步骤：S402，提取FNMF；S202，判断FNMF是否大于阈值，如果否，则判断为自然图片，如果是则继续往下进行；S404提取FNS；S202，判断FNS是否小于阈值，如果否，则判断为自然图片，如果是则判断为计算机图形；在利用多特征组合进行判断时，单个特征的判断可以参照图3中所示的方法和步骤，所选特征可以是图2所示11个特征的任意组合，没有先后顺序，也可以同时进行。

其中，在选择多个特征进行分类时，可以参照图5的方法和步骤进行。图5示出了利用二次判别函数进行分类的方法及其步骤的流程图。如图5所示，利用二次判别函数进行分类的方法包括以下步骤：S102，对训练集图像提取特征；S502，判别分析；S504得到二次判别函数；S102，对输入图像提取特征；S504，利用特征值计算二次判别函数值；S506，比较两种类型二次判别函数值的大小，将输入图像判为函数值最大的类别。

在步骤S502中，判别分析(Discriminate Analysis)是用来判别个体所属类体的一种统计方法。判别分析方法的任务是根据已掌握的一批分类明确的样品，建立一个较好的判别函数，使得用此判别函数进行判别时错判事例最少，进而能用此判别函数对给定的一个新样品判别它来自哪个总体。

判别分析方法通常要给出一个判别指标——判别函数借以判定新样品的归属。判别函数是指基于一定的判别准则计算出的用于衡量新样品与各已知组别接近程度的函数式或描述指标。训练图像集包含了已经分类好的计算机图形和自然图片，比例为1∶1。通过对训练图像集提取特征量进行判别分析可以得到用于分类的二次判别函数。在步骤S504中，就可以利用得到的二次判别函数对输入图像进行判断。

图6示出了利用BP神经网络进行分类的方法及其步骤的流程图。如图6所示，根据本发明实施例的利用BP神经网络进行分类的方法包括以下步骤：S102，提取训练图像特征；S602，求得训练特征均值；S604，根据特征均值，对特征进行归一化；S606，确定BP神经网络结构；S608利用遗传算法优化网络权值；S610，采用归一化的特征数据训练网络；S612，得到训练好的BP神经网络。S102，提取输入图像特征；S604，采用训练特征均值对输入图像特征进行归一化；S612，采用训练好的BP神经网络对输入图像进行判断；S614，根据输出结果进行分类。

其中，在步骤S604中，为了使各个输入特征在神经网络判别中都能发挥作用，保持贡献率的均衡，就应该将这些特征的数值归一化到规定的范围内。这样就可以充分利用各个特征的信息来进行训练网络和判别分类，得到的结果也将更加可靠和精确。为了将各个特征的分布值转换到特定的范围内，就需要按照某种效用函数对原有特征进行归一化处理。

下面对归一化函数做简要介绍：设P＝{P1，P2，P3，Pm}是m张图片的集合，Z＝{Z1，Z2，Z3，Zn}是由n个分类特征组成的特征集合，这些特征具有不同的类型和量纲。分类图集的特征矩阵X如下：

X = [\begin{matrix} X_{11} & X_{12} & . . . & X_{1 n} \\ X_{21} & X_{22} & . . . & X_{2 n} \\ . \\ . \\ . \\ X_{m 1} & X_{m 2} & . . . & X_{mn} \end{matrix}]

其中，Xij代表了第i个对象的第j个特征值。一般情况下，将特征集合里面的特征分为三种类型，即效益型、成本型和区间型。效益型指标其值愈大愈好；成本型指标其值愈小愈好；区间型指标以其值落在某一特定区域为最佳。在本文中仅将特征分为效益型和成本型两种类型。如果特征值越大，判为图形的概率越大，则说明该特征是效益型；相反，如果越小，判为图形的概率越大，则定义为成本型。RPG、GLS、FNL是成本型，其他特征都是效益型的。

记第j个特征Zj的均值为

{\overset{&OverBar;}{Z}}_{j} = \overset{&OverBar;}{X_{j}} = \frac{(Σ_{i = 1}^{m} X_{ij})}{m}

j＝1，2，...n

对效益型指标，记中间变量

M_{ij} = \frac{X_{ij} - \overset{&OverBar;}{Z_{j}}}{| \overset{&OverBar;}{Z_{j}} |}

b).对成本型指标，记中间变量

M_{ij} = \frac{\overset{&OverBar;}{Z_{j}} - X_{ij}}{| \overset{&OverBar;}{Z_{j}} |}

将原始指标值Xij按以下公式转化到[-1，1]区间上的效用函数值Yij

Y_{ij} = \frac{1 - e^{- M_{ij}}}{1 + e^{- M_{ij}}}

Yij＝f(Mij)是一条S型曲线。注意到Mij反映了原始数据偏离平均值Zj的程度.当

则M ij＝0；且Y ij随M ij的增长非线性递增。

其中，在S606中，确定BP神经网络的结构。神经网络一般分为输入层、隐含层和输出层。第一层为输入层，共有n个节点，分别输入经效用函数转化后各特征数值Yij(i＝1，2，3，m；j＝1，2，3，n})。第二层为隐含层，隐节点数没有统一的规则，根据具体对象而定；第三层为输出层，只有一个节点，代表输出结果J。隐含层神经元的变换函数通常采用S型函数，输出层神经元的变换函数采用线性函数。BP神经网络的结构允许前一层的神经元接受后一层神经元的输出。

其中，S608，采用遗传算法对BP神经网络初始权值进行优化。在遗传算法中，将网络权值通过编码组成初始群体后，遗传操作的任务就是对群体的个体按照它们对环境适应度(适应度评估)施加一定的操作，从而实现优胜劣汰的进化过程。它通过对对象系统第一代群体及其后代群体中的个体不断地选优汰劣与随机性遗传变异来获得对象的一个非线性映射模型。这个映射模型就是采用遗传算法对对象系统的第一代群体学习的结果，也就是对象系统的知识表示。从优化搜索的角度而言，遗传操作可使问题的解，一代又一代地优化，并逼进最优解，从而得到最优的网络权值。

其中，S604，采用训练特征均值对输入图像特征进行归一化。该步骤中采用的归一化函数和S604中的一样，不过采用的是训练图像特征的平均值。步骤S612，采用训练好的BP神经网络对输入图像进行判断，输出结果为1和0；S614，根据神经网络的输出结果进行分类，输出结果为1则输入图像为自然图片，输出结果为0则输入图像为计算机图形。

图7示出了根据本发明实施例的用于图像处理开关的装置700。上面所述的用于自然图片和计算机图形的分类方法(图2至6)都可以用在本装置中。如图7所示，图像处理开关的装置700可包括：特征提取单元702；分类单元704；处理开关单元706；计算机图形处理单元708；以及，自然图片处理单元710。

本实施例中，特征提取单元702可将提取到的特征数据传递给分类单元704，由分类单元704给出分类结果；处理开关单元706根据分类结果选择相应的处理单元，如果输入图像被判为计算机图形，则将输入图像数据传递到计算机图形处理单元708进行处理，如果判为自然图片，则将输入图形数据传递到自然图片处理单元710进行处理。

其中，特征提取单元702，输入图像可以从数码相机以及扫描仪等数码输入设备获取，还可通过网络下载或计算机制作、以及计算机屏幕截图来获取。所述输入图像为RGB格式或其他色彩格式的图像(例如Lab、YIQ、HSV、YCbCr、CMYK等)。

其中，提取输入图像的特征至少包括以下一个特征：空间特征有基于行程长度统计矩阵的行程比(RPG)、灰度直方图平滑度(Smoothness，S)、梯度(Gradient，G)、邻域内最大灰度差级数(Farthest Neighbour Levels，FNL)、邻域内最大灰度差最大频率(FarthestNeighbour Max Frequency，FNMF)、邻域内最大灰度差平滑度(Farthest Neighbour Smoothness，FNS)、邻域相似比(NSR)等特征；颜色特征包括：灰度级数(Gray Levels，GLS)、颜色相似度(Color Similarity，CS)、颜色渐变(Color Transition Smoothness，CTS)和饱和度(Saturation Smoothness，SS)。

其中，在选择一个或多个特征组合之后，执行所选特征的算法，S102-4。行程比RPG反映的是行程长度统计矩阵的阵元情况。行程长度是统计图像沿某一方向θ上连接n个像素都具有灰度值g发生的概率p(n，g)。对于数字图像，由所有p(n，g)组成的矩阵P(n，g)，则构成了该图像的行程长度统计矩阵。RPG的值可以由下述公式计算得出。

RPG = \frac{\underset{g, n}{Σ} p (g, n)}{M * N}

其中M*N为图像像素总数。

H (i) = \frac{I (i)}{Σ_{i = \min (g)}^{\max (g)} I (i)}

S = Σ_{i = \min (g) + 1}^{\max (g)} | H (i) - H (i - 1) |

式中，g为灰度级数，I(i)为灰度级为i的像素数，H(i)为灰度级为i的频率，S为图像的平滑度。

其中，梯度(Gradient，G)的计算是通过图像中每个像素与其水平方向相邻像素的色差绝对值和其垂直方向相邻像素的色差绝对值之和得到的。梯度的简化计算方法如下：

|g(i，j)|＝|f(i，j)-f(i+1，j)|+|f(i，j)-f(i，j+1)|

G = \frac{\underset{| g ((i, j) | = 0}{Σ} I (i, j)}{M * N}

其中，邻域内最大灰度差(Farthest Neighbour，FN)是通过计算邻域内像素灰度值之间的差值大小，来反映边缘的变化情况。邻域内最大灰度差越大，灰度变化越剧烈，纹理边缘越清晰。图像纹理的边缘变化是一种平滑地过渡，变化比较平稳，没有剧烈的变化。而图形边缘的变化则比较剧烈。

FNL＝∑(g)

FNMF = \frac{\max [I (i)]}{Σ_{i = \min (g)}^{\max (g)} I (i)}

其中，邻域相似比(Neighborhood Similar Ratio，NSR)是指在3*3邻域内具有至少一个相同灰度值像素的个数占图片总像素数的百分比。它反映了图像细微层次的变化，当该特征值达到一定阈值时，即判断为图形，否则判断为图像。

邻域相似比的计算公式如下：

NSR = \frac{NS}{M * N}

其中，灰度级数(Gray Levels，GLS)是指数字图像本身所能呈现的灰度范围。GLS的计算公式如下：

GLS＝∑(g)

式中，g为图像单个通道的灰度级。

ΔE = \sqrt{{(ΔR)}^{2} + {(ΔG)}^{2} + {(ΔB)}^{2}}

为了简化计算，我们采用以下方式来计算：

对于给定像素的RGB值，

Saturation＝max(|R-G|，|G-B|，|B-R|)

在本实施例中，分类单元704，分类单元可以使用单个分类器和综合分类器进行判断分类。

其中，单个分类器使用输入图像单个特征的特征值与预先设定的阈值进行比较来判断分类结果。单个分类器可以选择RGB三个通道中任意一个或多个通道来提取图像特征进行分类，并且三个通道之间没有先后顺序，可以同时提取或用于判断。

其中，综合分类器可以使用多个特征组合来判断，或者使用判别分析得到的判别函数和BP神经网络来进行判断。综合分类器可以提取多个特征组合同时或按照一定顺序与每个所选特征设定的阈值进行比较，来判断输入图像的类别。综合分类器可以提取多个特征组合，利用判别分析得到的二次判别函数进行判断分类。综合分类器还可以提取多个特征组合，对提取的特征数据按照一定的效用函数进行归一化，采用遗传算法优化BP神经网络初始权值，然后利用BP神经网络进行分类。分类单元704将分类结果传递给处理开关单元706。

在本实施例中，处理开关单元706根据分类结果选择相应的处理单元，如果输入图像被判为计算机图形，则将输入图像数据传递到计算机图形处理单元708进行处理，如果判为自然图片，则将输入图像数据传递到自然图片处理单元710进行处理。

其中，如果处理开关单元706后接色彩转换引擎模块(例如Adobe ACE或Microsoft ICM)，计算机图形处理单元708将会采用饱和度目的再现意图进行色彩转换，而自然图片处理单元710将会采用感觉目的再现意图进行色彩转换。将该模块嵌入到图形图像编辑排版软件的色彩管理模块当中，对输入图像进行自动色彩转换，不仅简化操作，而且显著改善和提高显示器或打印机的输出质量，快速精确地实现输入图像颜色的再现。

其中，如果处理开关单元706后接扫描仪、数码相机等图像输入设备，则可以实现针对不同原稿采用不同的输入方式。计算机图形处理单元708针对计算机图形，只需获取其轮廓和填充的颜色即可，同时采用适合计算机图形的压缩编码方式(例如行程编码)来压缩图像尺寸。而自然图片处理单元710则需要获取图片的每一个像素，采用适合自然图片的压缩编码方式(例如JPEG)。这样不仅提高了输入设备的输入速度，而且有效地压缩了计算机图形的尺寸，提高了输入图像的压缩和传输效率。

其中，如果处理开关单元706后接图片搜索引擎，可以针对不同图片采用不同的检索方式。计算机图形处理单元708针对计算机图形，只需检索其轮廓和填充的颜色即可得知其是否与检索的目标匹配。自然图片处理单元710不仅要获得轮廓、颜色信息，而且还要检索其他细节信息，例如文件属性、备注、相关描述等。

除了上述实施例之外，还可通过介质(例如计算机可读介质)上的计算机可读代码来实现本发明的实施例，以控制至少一个处理组件来实现任意的上述实施例。所述介质可以对应于任意允许存储或传输计算机可读代码的介质，并且可以至少是一个处理组件。所述介质还可以是装置实施例的示例。

计算机可读代码能够以各种方式被记录或传送到介质上。根据本发明的实施例，介质可以是包括或承载信号或信息的限定的并且可以测量的结构，诸如承载比特流的装置。介质还可以是分布式网络，从而以分布式的方式存储或传送以及执行计算机可读代码。

Claims

1.一种用于自然图片和计算机图形的分类方法，其特征在于：其步骤为：

2.根据权利要求1所述的用于自然图片和计算机图形的分类方法，其特征在于：步骤(1)所述提取输入图像的特征为空间特征和颜色特征，且至少包括以下一个特征：空间特征包括：基于行程长度统计矩阵的行程比、灰度直方图平滑度、梯度、邻域内最大灰度差级数、邻域内最大灰度差最大频率、邻域内最大灰度差平滑度、邻域相似比等特征；颜色特征包括：灰度级数、颜色相似度、颜色渐变和饱和度，所选取的图像特征为上述特征的任意顺序组合，并可同时进行。

3.根据权利要求1所述的用于自然图片和计算机图形的分类方法，其特征在于：步骤(2)所述的分类器为单个分类器和/或综合分类器。

4.根据权利要求3所述的用于自然图片和计算机图形的分类方法，其特征在于：所述的单个分类器使用输入图像单个特征的特征值与其对应的预先设定的阈值进行比较来判断分类结果，单个分类器可以选择颜色通道中任意一个或多个通道来提取图像特征进行分类，并且各通道之间没有先后顺序，同时提取或用于判断。

5.根据权利要求3所述的用于自然图片和计算机图形的分类方法，其特征在于：所述的综合分类器利用多个特征组合进行分类的方法步骤为：

6.根据权利要求5所述的用于自然图片和计算机图形的分类方法，其特征在于：所述综合分类器利用判别分析得到的二次判别函数或BP神经网络进行判断分类。

7.根据权利要求6所述的用于自然图片和计算机图形的分类方法，其特征在于：所述利用判别分析得到的二次判别函数进行判断分类的方法步骤为：

(1)对训练集图像提取特征，判别分析，得到二次判别函数；

(2)提取输入图像特征，利用特征值计算二次判别函数值；

8.根据权利要求6所述的用于自然图片和计算机图形的分类方法，其特征在于：所述利用BP神经网络进行判断分类的方法步骤为：

9.一种用于自然图片和计算机图形的分类的处理系统，其特征在于：包括：

10.根据权利要求9所述的用于自然图片和计算机图形的分类处理系统，其特征在于：所述输入图像模块连接扫描仪或数码相机；所述图片处理模块连接显示器或打印机。