CN110147824B

CN110147824B - 一种图像的自动分类方法及装置

Info

Publication number: CN110147824B
Application number: CN201910313919.9A
Authority: CN
Inventors: 沙晓强
Original assignee: Weibo Internet Technology China Co Ltd
Current assignee: Weibo Internet Technology China Co Ltd
Priority date: 2019-04-18
Filing date: 2019-04-18
Publication date: 2021-04-02
Anticipated expiration: 2039-04-18
Also published as: CN110147824A

Abstract

本发明实施例提供一种图像的自动分类方法及装置，其中，所述方法包括：根据预处理后的待分类图像的不同特性对应的评价指标，获得每个图像的每一个评价指标对应的评价值；通过对所有图像的不同评价指标对应的评价值进行奇异值分解，对所有图像进行一次分类；根据分类后每两个图像类别之间的相似性，将大于设定的当前相似性阈值的相似性所对应的两个图像类别进行合并；重复进行该步骤，直至某两个图像类别之间的相似性小于设定的最小相似性阈值、或者图像类别数不超过设定的类别数阈值时，分类完成。本技术方案通过非监督分类自动对待分类图像进行评价，并通过粗分类和精分类，使图像分类更精确，分类结果更适用于后续图像处理过程。

Description

一种图像的自动分类方法及装置

技术领域

本发明涉及图像分类领域，尤其涉及一种图像的自动分类方法及装置。

背景技术

人类获取的信息中，有83％来自视觉。图像是视觉的产物，是物体在平面坐标上的直观再现，能够直接表示和概况表示其所表示物体的信息。图像处理是对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术，能够为人类理解和分析世界提供信息。二十世纪以来，由于计算机技术的高速发展，图像处理得以迅速发展。

图像分类是图像处理中重要的一环，根据各自在图像信息中所反映的不同特征，把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析，把图像或图像中的每个像元或区域归为若干个类别的某一种，以代替人的视觉判读。

目前图像分类按照统计方法可以分为两种，监督分类法和非监督分类法。监督分类是根据预先已知类别的训练样本，求出各类在特征空间的分布，然后利用它对未知数据进行分类；而比较常用的非监督分类在无法得知图像类别先验知识的情况下，主要根据模式之间的相似性进行类别划分，将相似性强正相关的模式划分为同一个类别。这是一种“物以类聚”的思想，所以这种非监督分类的方法又被称为聚类分析法。K-means聚类是最常用的非监督分类方法，该算法框架清晰，简单易理解，但是由于它需要事先给定分类类别数，并且对异常数据较为敏感，算法精度较差。

发明内容

本发明实施例提供一种图像的自动分类方法及装置，通过基于评价的非监督自动分类方法能够自动对待分类图像进行评价，并通过粗分类和精分类两个步骤，使得图像分类更精确，分类结果更适用于后续图像处理过程。

为实现上述目的，一方面，本发明实施例提供了一种图像的自动分类方法，所述方法包括：

获取待分类图像，对待分类图像进行预处理；

根据预处理后的图像的不同特性对应的评价指标，获得每个图像的每一个评价指标对应的评价值；

通过对所有图像的不同评价指标对应的评价值进行奇异值分解，对所有图像进行一次分类；

根据分类后每个图像类别中各图像的评价值，将分类后的图像类别进行两两比较，得出每两个图像类别之间的相似性，将大于设定的当前相似性阈值的相似性所对应的两个图像类别进行合并，获得进一步分类后的图像类别；重复进行该步骤，直至某两个图像类别之间的相似性小于设定的最小相似性阈值、或者图像类别数不超过设定的类别数阈值时，分类完成。

另一方面，本发明实施例提供了一种图像的自动分类装置，所述装置包括：

预处理单元：用于获取待分类图像，对待分类图像进行预处理；

评价值获取单元，用于根据预处理后的图像的不同特性对应的评价指标，获得每个图像的每一个评价指标对应的评价值；

一次分类单元：用于通过对所有图像的不同评价指标对应的评价值进行奇异值分解，对所有图像进行一次分类；

二次分类单元：根据分类后每个图像类别中各图像的评价值，将分类后的图像类别进行两两比较，得出每两个图像类别之间的相似性，将大于设定的当前相似性阈值的相似性所对应的两个图像类别进行合并，获得进一步分类后的图像类别；重复进行该步骤；直至某两个图像类别之间的相似性小于设定的最小相似性阈值、或者图像类别数不超过设定的类别数阈值时，分类完成。

上述技术方案具有如下有益效果：

本发明采用基于评价的非监督自动分类的技术手段，在事先并不知道有什么样的类别存在，已知类别的训练样本不容易获取，或者需要人工标注的情况下，通过非监督分类，能直接提取待分类图像的特征信息，按照相似性对其进行类别划分，人为干预较少，自动化程度更高，适用性更强；本文提出的非监督分类方法能够自动对待分类图像进行评价，并通过粗分类和精分类两个步骤，使得图像分类更精确，分类结果更适用于后续图像处理过程。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一种图像的自动分类方法的流程图；

图2是本发明实施例一种图像的自动分类装置的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，是本发明实施例一种图像的自动分类方法的流程图，所述方法包括：

S101：获取待分类图像，对待分类图像进行预处理；

获取待分类的k幅图像，对这k幅图像进行预处理，从而消除图像中无关的信息，恢复有用的真实信息，增强有关信息的可检测性和最大限度地简化数据从而改进特征抽取、图像分割、匹配和识别的可靠性。主要包含以下两个部分：

对所有待分类的图像进行去噪处理。数字图像在获取、传输的过程中都可能会受到噪声的污染，而噪声会对图像的输入、采集、处理的各个环节以及最终输出结果产生一定的影响。常见的噪声包括高斯噪声和椒盐噪声等。可以利用噪声的具体种类来选择不同的去噪方法，滤波方法包括均值滤波、中值滤波和小波滤波等都可以对噪声的滤除起到较好的结果。

对去噪处理后的图像进行归一化处理。采用基于矩的图像归一化技术，利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响，将待处理的原始图像转换成相应的唯一标准形式，对平移、旋转、缩放等仿射变换具有不变特性。

S102：根据预处理后的图像的不同特性对应的评价指标，获得每个图像的每一个评价指标对应的评价值；

经过步骤101的待分类图像，记为I₁,I₂,…,I_k，对这k幅图像进行无参考图像评价。在无监督图像分类中，由于参考图像不存在或者难以获得，所以选取的评价指标应该是客观反映单幅图像自身的特征，是该图像在某评价指标上的具体表现。按照评价算法理论大致可分为3类：①基于信息论的评价方法，如信息熵；②基于统计特性的评价方法，如平均梯度、峰值信噪比等；③基于人眼视觉特性的评价方法。这些图像质量评价指标通常基于根据图像的某一方面特性，利用数学公式来进行计算。在具体实验中，可根据不同的应用需求，选择不同特性对应的评价指标，来对图像质量进行评价。

常用的无参考图像质量客观评价指标如下：

(1)均值：图像像素的平均值，反应图像的平均亮度，平均亮度越大，图像质量越好。

其中，M、N分别表示图像的长和宽，F(a,b)表示图像在坐标为(a,b)处对应的像素值。

(2)标准差：图像像素标准差由图像像素均值间接求得的，反映图像当前的像素值与整体像素均值的离散程度。一般来说，其取值越大则图像的整体像素灰度级分布越分散，视觉效果越好。

(3)平均梯度：图像清晰度平均梯度是比较图像清晰度的一个至关重要的指标，其取值能够反映出图像中微小细节反差的变化程度。图像中某一方向的灰度级变化率越大或层次越多，平均梯度值就越大，即图像的清晰度越好。

其中，M、N分别表示图像的长和宽，F(x,y)表示图像在坐标为(x,y)处对应的像素值。

表示的是图像在坐标为(x,y)处对应的梯度，这个梯度可以有很多种计算方法，最普通的是

(4)信息熵：图像信息熵含义为图像的平均信息量。对于一幅独立的图像，可认为其每个元素的灰度值是相互独立的，定义图像I的灰度分布为p＝{p₁，p₂，…，p_L}，p_m为灰度值等于m的像素值与图像总像素数之比，0<m≤L(n＝1,2,…,L)，L为灰度级总数，则信息熵H_L定义为：

其中，e为一常数，

一般情况下，信息熵值越大表明图像信息保留的程度越好，其携带信息量的能力越强。

(5)信噪比：图像信噪比，考虑噪声对图像的影响，信噪比越大，图像质量越好。在图像中选取一块区域(可以是整个图像，也可以是某一个均匀的图像区块)，计算所选区域的均值μ和标准差σ，均值与标准差的比值就认为是信噪比。

还有一些需要将图像变换到频率域后来计算相应的评价参数，这里不再赘述。在选取了n个评价指标后，对待分类的k幅图像进行评价，得到每幅图像的每一个评价指标对应的评价值r_ij，其中0<i≤k,0<j≤n，r_ij表示第i副图像I_i在第j个评价指标对应的评价值。

S103：通过对所有图像的不同评价指标对应的评价值进行奇异值分解，对所有图像进行一次分类；

经过步骤2对待分类图像进行图像质量评价得到评价指标对应的评价值后，可以对待分类图像进行粗分类。这里选用奇异值分解来进行分类。每幅图像的个评价指标对应的评价值r_ij可以组成一个评价矩阵R：

其中，r_ij代表了图像I_i在第j个评价指标对应的评价值，0<i≤k,0<j≤n。

通过奇异值分解来进行粗分类具体做法如下：

(1)把评价矩阵R分解成三个小矩阵，即R可以表示为：

R_kn＝X_kk×A_kn×Y_nn

其中，X_kk和Y_nn都是方阵，X_kk是一个酉矩阵，Y_nn是一个酉矩阵的共轭矩阵。而A_kn是一个只有对角线上才是非零值的对角阵，且非零值的数量等于矩阵R的秩r。

(2)假设粗分类对图像分成a类(0<a≤r)，这样我们可以对R进行奇异值分解，具体为一种近似奇异值分解：

R_kn≈U_ka×B_aa×V_an

其中U_ka表示对图像进行分类的一个结果，B_aa表示各个评价指标的重要性，V_an表示a类指标在所有指标中的相关性。U可以表示为：

对第i幅图像来说，[u_i1,u_i2,…u_ia]表示第i幅图像I_i在a个类别中对应的相关性。取该向量中的最大值，可将该图像划分为对应的类别中。这样对每幅待分类图像计算后，可以将这些图像粗分类到这a个类别中。

S104：根据分类后每个图像类别中各图像的评价值，将分类后的图像类别进行两两比较，得出每两个图像类别之间的相似性，将大于设定的当前相似性阈值的相似性所对应的两个图像类别进行合并，获得进一步分类后的图像类别；重复进行该步骤，直至某两个图像类别之间的相似性小于设定的最小相似性阈值、或者图像类别数不超过设定的类别数阈值时，分类完成。

对每个粗分类类别，将每个粗分类类别中所有待分类图像作为一个整体，可以将该类别的所有图像的每一个评价指标的评价值进行向量归一化后计算均值，作为该粗分类后图像类别的特征向量r_p＝[r_p1,r_p2,…,r_pn]，其中0<p≤a。分类计算a个粗分类类别的所有特征向量两两之间的余弦相似性。如粗分类A的指标向量r_A与粗分类B的指标向量r_B之间的余弦相似性可以表示为：

选取阈值t₁，当余弦值大于t₁时，就将这两种粗分类类别合并成一个小类。这样计算一次后，a个粗分类别就可以合并成a₁个小类，a₁<a。

重复上述过程，计算a₁个类别分别得每个图像类别的特征向量，计算两两的余弦相似性，同样选取阈值t₂，将a₁个类别合并成a₂个小类，a₂<a₁。这样不断迭代计算，每个类越来越大，而类别数越来越小。当某一类太大导致类内的相似性很小，例如达不到设定的最小阈值时或者达到要求的分类数时，停止迭代过程。至此，图像的自动分类完成。

对应于上述分类方法，如图2所示，是本发明实施例一种图像的自动分类装置的示意图，所述装置包括：

预处理单元21：用于获取待分类图像，对待分类图像进行预处理；

评价值获取单元22：用于根据预处理后的图像的不同特性对应的评价指标，获得每个图像的每一个评价指标对应的评价值；

一次分类单:23：用于通过对所有图像的不同评价指标对应的评价值进行奇异值分解，对所有图像进行一次分类；

二次分类单元24：用于根据分类后每个图像类别中各图像的评价值，将分类后的图像类别进行两两比较，得出每两个图像类别之间的相似性，将大于设定的当前相似性阈值的相似性所对应的两个图像类别进行合并，获得进一步分类后的图像类别；重复进行该步骤；直至某两个图像类别之间的相似性小于设定的最小相似性阈值、或者图像类别数不超过设定的类别数阈值时，分类完成。

进一步地，所述预处理单元包括：

去噪模块：用于对对待分类图像进行去噪处理；

归一化模块：用于对去噪处理后的图像进行归一化处理。

进一步地，所述图像的不同特性对应的评价指标包括：

图像亮度特性对应的图像像素均值；

图像的整体像素灰度级分布特性对应的图像像素标准差；

图像清晰度特性对应的图像清晰度平均梯度；

图像的平均信息量特性对应的图像信息熵；以及，

图像的质量特性对应的图像信噪比。

进一步地，所述一次分类单元具体用于：

以每幅图像的每个评价指标对应的评价值r_ij组成评价矩阵R：

其中，r_ij代表图像I_i的第j个评价指标对应的评价值，且0<i≤k,0<j≤n，k表示图像总数，n表示评价指标总数；

将图像分成a个类别，其中0<a≤r，r为矩阵R的秩，对R进行奇异值分解得到：

R_kn≈U_ka×B_aa×V_an

其中，U_ka表示对图像进行分类的结果，U_ka表示为：

其中，向量[u_i1,u_i2,…u_ia]表示第i幅图像I_i在a个类别中的相关性；

将所述向量对应的图像I_i划分到所述向量中最大值所对应的类别中，获得经过一次分类后的a个图像类别。

进一步地，所述二次分类单元包括相似性获取模块：

用于将每个图像类别中的各图像的评价值进行向量归一化后，分别计算每个图像类别中的各图像的每一个评价指标对应的评价值的平均值；由每个图像类别中的各图像的每一个评价指标对应的评价值的平均值组成每个图像类别的特征向量；根据每个图像类别的特征向量，计算每两个图像类别的特征向量之间的余弦相似性，作为每两个图像类别之间的相似性。

与传统的图像监督分类相比，本发明不需要参考图像，在对图像进行评价的基础上，直接提取待分类图像的特征信息，根据模式之间的相似性进行类别划分，将相似性强的模式划分为同一个类别，人为干预较少，自动化程度更高，适用性更强。在计算过程中，采用粗分类和精分类两步进行分类，充分结合了两种方法的优势，节省时间的基础上又能得到较高的分类准确性，更适用于待分类图像多且杂的分类场景。

本发明的创新点在选取了无参考的图像质量评价指标来表征图像的特征，适用于不存在监督图像的图像分类场景。同时，本发明也利用不同的方法对待分类图像进行粗分类和精分类，充分利用了不同方法分类的优势，使得计算过程中迭代更快，分类效率更高，分类结果更好。

应该明白，公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好，应该理解，过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素，并且不是要限于所述的特定顺序或层次。

在上述的详细描述中，各种特征一起组合在单个的实施方案中，以简化本公开。不应该将这种公开方法解释为反映了这样的意图，即，所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反，如所附的权利要求书所反映的那样，本发明处于比所公开的单个实施方案的全部特征少的状态。因此，所附的权利要求书特此清楚地被并入详细描述中，其中每项权利要求独自作为本发明单独的优选实施方案。

为使本领域内的任何技术人员能够实现或者使用本发明，上面对所公开实施例进行了描述。对于本领域技术人员来说；这些实施例的各种修改方式都是显而易见的，并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此，本公开并不限于本文给出的实施例，而是与本申请公开的原理和新颖性特征的最广范围相一致。

上文的描述包括一个或多个实施例的举例。当然，为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的，但是本领域普通技术人员应该认识到，各个实施例可以做进一步的组合和排列。因此，本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外，就说明书或权利要求书中使用的术语“包含”，该词的涵盖方式类似于术语“包括”，就如同“包括，”在权利要求中用作衔接词所解释的那样。此外，使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。

本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block)，单元，和步骤可以通过电子硬件、电脑软件，或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability)，上述的各种说明性部件(illustrative components)，单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用，可以使用各种方法实现所述的功能，但这种实现不应被理解为超出本发明实施例保护的范围。

本发明实施例中所描述的各种说明性的逻辑块，或单元都可以通过通用处理器，数字信号处理器，专用集成电路(ASIC)，现场可编程门阵列或其它可编程逻辑装置，离散门或晶体管逻辑，离散硬件部件，或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器，可选地，该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现，例如数字信号处理器和微处理器，多个微处理器，一个或多个微处理器联合一个数字信号处理器核，或任何其它类似的配置来实现。

本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地，存储媒介可以与处理器连接，以使得处理器可以从存储媒介中读取信息，并可以向存储媒介存写信息。可选地，存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中，ASIC可以设置于用户终端中。可选地，处理器和存储媒介也可以设置于用户终端中的不同的部件中。

在一个或多个示例性的设计中，本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现，这些功能可以存储与电脑可读的媒介上，或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如，这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置，或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外，任何连接都可以被适当地定义为电脑可读媒介，例如，如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘，磁盘通常以磁性复制数据，而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种图像的自动分类方法，其特征在于，所述方法包括：

获取待分类图像，对待分类图像进行预处理；

2.如权利要求1所述的图像的自动分类方法，其特征在于，所述对待分类图像进行预处理，包括：

对待分类图像进行去噪处理；

对去噪处理后的图像进行归一化处理。

3.如权利要求1所述的图像的自动分类方法，其特征在于，所述图像的不同特性对应的评价指标包括：

图像亮度特性对应的图像像素均值；

图像的整体像素灰度级分布特性对应的图像像素标准差；

图像清晰度特性对应的图像清晰度平均梯度；

图像的平均信息量特性对应的图像信息熵；以及，

图像的质量特性对应的图像信噪比。

4.如权利要求1所述的图像的自动分类方法，其特征在于，所述通过对所有图像的不同评价指标对应的评价值进行奇异值分解，对所有图像进行一次分类，包括：

其中，r_ij代表图像I_i的第j个评价指标对应的评价值，且0＜i≤k,0＜j≤n，k表示图像总数，n表示评价指标总数；

将图像分成a个类别，其中0＜a≤r，r为矩阵R的秩，对R进行奇异值分解得到：

R_kn≈U_ka×B_aa×V_an

其中，U_ka表示对图像进行分类的结果，U_ka表示为：

5.如权利要求4所述的图像的自动分类方法，其特征在于，所述根据分类后每个图像类别中各图像的评价值，将分类后的图像类别进行两两比较，得出每两个图像类别之间的相似性，包括：

将每个图像类别中的各图像的评价值进行向量归一化后，分别计算每个图像类别中的各图像的每一个评价指标对应的评价值的平均值；

由每个图像类别中的各图像的每一个评价指标对应的评价值的平均值组成每个图像类别的特征向量；

根据每个图像类别的特征向量，计算每两个图像类别的特征向量之间的余弦相似性，作为每两个图像类别之间的相似性。

6.一种图像的自动分类装置，其特征在于，所述装置包括：

二次分类单元：用于根据分类后每个图像类别中各图像的评价值，将分类后的图像类别进行两两比较，得出每两个图像类别之间的相似性，将大于设定的当前相似性阈值的相似性所对应的两个图像类别进行合并，获得进一步分类后的图像类别；重复进行该步骤；直至某两个图像类别之间的相似性小于设定的最小相似性阈值、或者图像类别数不超过设定的类别数阈值时，分类完成。

7.如权利要求6所述的图像的自动分类装置，其特征在于，所述预处理单元包括：

去噪模块：用于对对待分类图像进行去噪处理；

归一化模块：用于对去噪处理后的图像进行归一化处理。

8.如权利要求6所述的图像的自动分类装置，其特征在于，所述图像的不同特性对应的评价指标包括：

图像亮度特性对应的图像像素均值；

图像的整体像素灰度级分布特性对应的图像像素标准差；

图像清晰度特性对应的图像清晰度平均梯度；

图像的平均信息量特性对应的图像信息熵；以及，

图像的质量特性对应的图像信噪比。

9.如权利要求6所述的图像的自动分类装置，其特征在于，所述一次分类单元具体用于：

R_kn≈U_ka×B_aa×V_an

其中，U_ka表示对图像进行分类的结果，U_ka表示为：

10.如权利要求9所述的图像的自动分类装置，其特征在于，所述二次分类单元包括相似性获取模块：