CN102034117A - 一种图像分类方法和装置 - Google Patents

一种图像分类方法和装置 Download PDF

Info

Publication number
CN102034117A
CN102034117A CN 201010594266 CN201010594266A CN102034117A CN 102034117 A CN102034117 A CN 102034117A CN 201010594266 CN201010594266 CN 201010594266 CN 201010594266 A CN201010594266 A CN 201010594266A CN 102034117 A CN102034117 A CN 102034117A
Authority
CN
China
Prior art keywords
classification
image
classified
characteristic
data sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010594266
Other languages
English (en)
Other versions
CN102034117B (zh
Inventor
赵大哲
栗伟
杨金柱
李博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN2010105942665A priority Critical patent/CN102034117B/zh
Publication of CN102034117A publication Critical patent/CN102034117A/zh
Application granted granted Critical
Publication of CN102034117B publication Critical patent/CN102034117B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本申请实施例公开了一种图像分类方法和装置。其中,所述方法包括:将从待分类图像中提取出的特征数据划分为至少两个特征数据块;对划分得到的特征数据块进行分类,得到反映特征数据块类别的数据块分类结果;计算数据块分类结果中的每个类别的后验概率;从数据块分类结果的所有类别中,选择后验概率最大的类别作为所述待分类图像的分类结果。根据本申请实施例,可以在避免特征数据的信息丢失的同时,提高分类器效率和准确度。

Description

一种图像分类方法和装置
技术领域
本申请涉及图像处理技术,特别是涉及一种图像分类方法和装置。
背景技术
数字化的医学影像设备,如CT、MRI、PET等在临床医学中被大量应用,使得医学图像的数据量急剧增长,以至于现有的图像存储及管理方式、图像处理与分析方法都面临着巨大的挑战。而基于内容的医学图像分类技术作为一种图像处理技术,可以完成医学图像类别的自动标注任务,使新产生的医学图像自动实现类别标注,并进一步完善医学图像资源的存储与检索功能。目前的图像分类技术主要是先根据训练数据进行分类器的训练,当通过训练得到一个分类器后,再利用训练得到的分类器对待分类图像进行分类。
基于内容的医学图像分类技术以医学图像特征参数的提取为实现前提。由于医学图像自身的特定和应用背景特点使得单一的特征参数提取方法难以在医学图像内容的表达中取得理想的效果。同时,实验数据也表明,采用多特征参数实现的医学图像分类的准确率要高于采用单一特征参数实现的医学图像分类的准确率。因此,采用多特征参数实现医学图像分类成为一个重要的研究内容。
在采用多特征参数实现医学图像分类的过程中,会出现提取出的特征参数的特征数据的维度较高问题。例如,对一个待分类的图像提取Haralick、灰度直方图、形状上下文、FFT、Gabor这几种特征参数时,Haralick的特征数据的维度为14,灰度直方图的特征数据的维度为16,形状上下文的特征数据的维度为72,FFT的特征数据的维度为10,Gabor的特征数据的维度为64。显然,从待分类图像中提取的特征参数的特征数据的维度较高。
发明人在研究中发现,如果直接利用高维特征数据进行图像分类,由于数据维度过高,以及不同特征数据间的关系被忽略的因素,会直接导致分类器效率和准确度的下降。如果对高维特征数据进行降维处理,如采用PCA(Principal Component Analysis,主成分分析)降维方法,会使得原特征数据的信息丢失,没有充分利用提取的特征信息。
发明内容
为了解决上述技术问题,本申请实施例提供了一种分类方法和装置,以在避免特征数据的信息丢失的同时,提高分类器效率和准确度。
本申请实施例公开了如下技术方案:
一种图像分类方法,包括:分别将从M个已知类别的训练图像样本中提取出的每一个特征数据划分为N个训练数据样本块,对所述训练数据样本块进行分类,根据位于同一顺位的训练数据样本块的分类结果统计出实际类别为Ci’而分类结果为Cj’的训练数据样本块个数,将统计得到的训练数据样本块个数除以训练图像的样本总数M,得到概率集合,预存所述概率集合,其中,其中M、N均为不小于2的整数,Ci’为所述训练图像的第i个类别,Cj’为所述训练图像的第j个类别,i=1,2,......m,j=1,2,......m,m为所述训练图像的类别总数;将从待分类图像中提取出的特征数据按照所述训练图像的划分方式划分为N个特征数据块,对所述特征数据块进行分类,得到反映特征数据块类别的数据块分类结果,从预存的概率集合中提取出实际类别为所述数据块分类结果中的类别而被判为Ck的概率,将提取出的概率值进行乘积运算,得到数据块分类结果中的每个类别的后验概率,从所述数据块分类结果的所有类别中,选择后验概率最大的类别作为所述待分类图像的分类结果,其中,Ck为第k个特征数据块的类别,k=1,2,......N。
一种图像分类装置,包括:图像训练单元,用于分别将从M个已知类别的训练图像样本中提取出的每一个特征数据划分为N个训练数据样本块,对所述训练数据样本块进行分类,根据位于同一顺位的训练数据样本块的分类结果统计出实际类别为Ci’而分类结果为Cj’的训练数据样本块个数,将统计得到的训练数据样本块个数除以训练图像的样本总数M,得到概率集合,预存所述概率集合,其中,其中M、N均为不小于2的整数,Ci’为所述训练图像的第i个类别,Cj’为所述训练图像的第j个类别,i=1,2,......m,j=1,2,......m,m为所述训练图像的类别总数;图像分类单元,用于将从待分类图像中提取出的特征数据按照所述训练图像的划分方式划分为N个特征数据块,对所述特征数据块进行分类,得到反映特征数据块类别的数据块分类结果,从预存的概率集合中提取出实际类别为所述数据块分类结果中的类别而被判为Ck的概率,将提取出的概率值进行乘积运算,得到数据块分类结果中的每个类别的后验概率,从所述数据块分类结果的所有类别中,选择后验概率最大的类别作为所述待分类图像的分类结果,其中,Ck为第k个特征数据块的类别,k=1,2,......N。
由上述实施例可以看出,与现有技术相比,本申请具有如下优点:
(1)高维特征数据被充分利用
高维特征数据全部都参与分类过程,特征数据得到充分利用。因此,避免了高维特征数据的信息丢失。
(2)基于概率统计决策
在分类过程中,每个划分后的特征数据块之间相互独立,互不干扰,基于后验概率统计原理进行最终分类决策。因为分类决策基于统计原理,所以特征数据块的数量越多,分类决策越准确。
(3)抗干扰能力强
噪音产生的对某些特征描述效果的干扰会被多个具有异构分类器的叶子分类结点弱化,提高了分类方法的抗干扰能力。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一种图像分类方法的一个实施例的流程图;
图2为本申请的图像分类过程中分类训练阶段的流程图;
图3为本申请一种高维特征数据划分后的数据结构示意图;
图4为本申请一种数据分配后的数据结构示意图;
图5为本申请的图像分类过程中分类应用阶段的流程图;
图6为本申请一种图像分类装置的一个实施例的结构图;
图7(a)为本申请一种均匀四分法的图像分区示意图;
图7(b)为本申请一种由外向内平分法的图像分区示意图;
图7(c)为本申请一种由内向外平分法的图像分区示意图;
图8为本申请中基于多特征的医学图像分类的区域准确性比对图。
具体实施方式
下面结合附图及实施例,对本申请实施例进行详细描述。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
实施例一
请参阅图1,其为本申请一种图像分类方法的一个实施例的流程图,包括以下步骤:
步骤101:分别将从M个已知类别的训练图像样本中提取出的特征数据划分为N个训练数据样本块,对所述训练数据样本块进行分类,根据位于同一顺位的训练数据样本块的分类结果统计出实际类别为Ci’而分类结果为Cj’的训练数据样本块个数,将统计得到的训练数据样本块个数除以训练图像的样本总数,得到概率集合,预存所述概率集合,其中,其中M、N均为不小于2的整数,Ci’为所述训练图像的第i个类别,Cj’为所述训练图像的第j个类别,i=1,2,......m,j=1,2,......m,m为所述训练图像的类别总数;
步骤102:将从待分类图像中提取出的特征数据按照所述训练图像的划分方式划分为N个特征数据块,对划分得到的特征数据块进行分类,得到反映特征数据块类别的数据块分类结果,从预存的概率集合中提取出实际类别为所述数据块分类结果中的类别而被判为Ck的概率,将提取出的概率值进行乘积运算,得到数据块分类结果中的每个类别的后验概率,从所述数据块分类结果的所有类别中,选择后验概率最大的类别作为所述待分类图像的分类结果,其中,Ck为第k个特征数据块的类别,k=1,2,......N。
其中,从训练图像或者待分类图像中提取出的特征数据通常是高维数据,将高维的特征数据划分为一个个的训练数据样本块或者特征数据块,这样,每一个划分后的训练数据样本块或者特征数据块都是低维数据。
需要说明的是,本申请实施例对划分方式不进行具体限定,从划分的结果来看,划分后的训练数据样本块或者特征数据块之间相互重叠或者互不重叠。另外,本申请实施例对所划分的训练数据样本块或者特征数据块的个数也不进行具体限定,维数越高,所划分的特征数据块的个数越多。
优选的,当特征数据的维度为1000以上时,训练数据样本块或者特征数据块的个数至少为15。
还需要说明的是,本申请实施例可以采用现有的任意一种分类方法对划分得到的特征数据块或者训练数据样本块进行分类,因此,本申请实施例对采用的分类方法并不进行限定。
其中,所述对训练数据样本块进行分类具体包括:采用相同的分类方法对划分得到的训练数据样本块进行分类;或者,采用不同的分类方法对划分得到的训练数据样本块进行分类。
所述特征数据块进行分类具体包括:采用相同的分类方法对划分得到的特征数据块进行分类;或者,采用不同的分类方法对划分得到的特征数据块进行分类。
例如,在对5个特征数据块进行分类时,5个特征数据块可以采用相同的分类方法进行分类,也可以分别采用不同的分类方法对5个特征数据块进行分类,如,前三个特征数据块采用分类方法1进行分类,后两个特征数据块采用分类方法2进行分类。并且,每个特征数据块的分类方法既可以固定不变,也可以被改变。
通过分类后,得到了反映了每一个特征数据块类别的数据块分类结果。如,当待分类图像的类别共有A和B两种时,通过分类后,5个特征数据块的分类结果分别为:A类别、B类别、A类别、B类、A类别。
下面通过一个简单的例子,来说明上述复杂的后验概率计算过程。例如,假设,训练图像样本包括:训练图像1、训练图像2......训练数据5,且,训练图像1-训练图像5的类别都已知。假设待分类图像的特征数据被划分为5个特征数据块,则按照待分类图像的划分方式,将训练图像1的特征数据划分为5个训练数据样本块:训练数据样本块11、训练数据样本块12......训练数据样本块15,将训练图像2的特征数据划分为5个训练数据样本块:训练数据样本块21、训练数据样本块22......训练数据样本块25。以此类推,可以获得共5*5=25个训练数据样本块,对上述划分的25个训练数据样本块分别进行分类。假设,待训练图像的类别共有A和B两种时,在位于同一顺位的训练数据样本块中,如,训练数据样本块11、训练数据样本块21......训练数据样本块51在各自的训练图像的特征数据中都位于第一顺位,即属于同一顺位,因此,在位于第一顺位的这5个训练数据样本块中,根据这5个训练数据样本块的分类结果统计得到,实际类别为A而分类结果为A的训练数据样本块个数为2,实际类别为A而分类结果为B的训练数据样本块个数为1,实际类别为B而分类结果为A的训练数据样本块个数为1,实际类别为B而分类结果为B的训练数据样本块个数为1。将统计得到的个数除以总数5,因此,根据位于第一顺位的5个训练数据样本块而获得的概率:实际类别为A而分类结果为A的概率为2/5,实际类别为A而分类结果为B的概率为1/5,实际类别为B而分类结果为A的概率为1/5,实际类别为B而分类结果为B的概率为1/5。如果用矩阵的形式表示,则为:
Figure BDA0000038943280000061
同样,根据位于其它顺位的4个训练数据样本块也可以获得相应的概率,最终得到一个概率集合,预存最终得到的概率集合。
假设待分类图像的类别共有A和B两种时,通过分类后,待分类图像的5个特征数据块的分类结果分别为:A类别、B类别、A类别、B类、A类别。其中,对于A类别来说,类别A的后验概率的计算方法为:从上述概率集合的P1中提取出实际类别为A而被分类为A的概率,从P2中提取出实际类别为A而被分类为B的概率,从P3中提取出实际类别为A而被分类为A的概率,从P4中提取出实际类别为A而被分类为B的概率,从P5中提取出实际类别为A而被分类为A的概率,将上述提取出的5个概率进行乘积,最终得到A类别的后验概率。根据同样的方法,:从上述概率集合的P1中提取出实际类别为B而被分类为A的概率,从P2中提取出实际类别为B而被分类为B的概率,从P3中提取出实际类别为B而被分类为A的概率,从P4中提取出实际类别为B而被分类为B的概率,从P5中提取出实际类别为B而被分类为A的概率,将上述提取出的5个概率进行乘积,最终得到B类别的后验概率。
得到类别A和类别B的后验概率后,择后验概率最大的类别作为所述待分类图像的分类结果。例如,通过比较发现,类别A的后验概率最大,因此,待分类图像的分类结果为A类。
由上述实施例可以看出,与现有技术相比,本申请具有如下优点:
(1)高维特征数据被充分利用
高维特征数据全部都参与分类过程,特征数据得到充分利用。因此,避免了高维特征数据的信息丢失。
(2)基于概率统计决策
在分类过程中,每个划分后的特征数据块之间相互独立,互不干扰,基于后验概率统计原理进行最终分类决策。因为分类决策基于统计原理,所以特征数据块的数量越多,分类决策越准确。
(3)抗干扰能力强
噪音产生的对某些特征描述效果的干扰会被多个具有异构分类器的叶子分类结点弱化,提高了分类方法的抗干扰能力。
实施例二
下面将结合计算公式详细说明本发明中图像分类的具体实现过程。在本实施例中,将整个图像分类过程主要分为两个阶段,第一阶段是分类训练阶段,第二个阶段是分类应用阶段。以下将分别对这两个阶段加以说明。首先,请参阅图2,其为本申请的图像分类过程中分类训练阶段的流程图。包括以下步骤:
步骤201:从训练图像样本中提取特征数据;
例如,将8154幅已知类别的医学图像作为分类训练阶段的训练图像样本,样本数为8154,并最终得到8154组高维特征数据。
步骤202:将训练图像样本的特征数据划分为训练数据样本块;
例如,请参阅图3,其为本申请一种高维特征数据划分后的数据结构示意图。如图3所示,将8154组高维特征数据分别划分为N个训练数据样本块,最终得到8154*N个训练数据样本块。
步骤203:将每组高维特征数据的N个训练数据样本块轮询地分配给N个分类器,由分类器对训练数据样本快进行分类;
例如,请参阅图4,其为本申请一种数据分配后的数据结构示意图。如图4所示,每组高维特征数据中的第一个训练数据样本块都被分配到了第一个分类器,每组高维特征数据中的第二个训练数据样本块都被分配到了第二个分类器,......直至每组高维特征数据中的第N个训练数据样本块都被分配到了第N个分类器。
这里需要说明的是,N个分类器可以采用相同的分类方法对训练数据样本块进行分类,也可以采用不同的分类方法进行分类。
步骤204:在同一顺位的各个训练数据样本块的分类结果中,统计出实际类别为Ci’而分类结果为Cj’的训练数据样本块个数;
例如,已知的训练图像的类别共有m种,则将第k顺位中的各个训练数据样本块的统计结果以矩阵的形式表示如下:
M k = N k ( c 1 , c 1 ) N k ( c 1 , c 2 ) . . . N k ( c 1 , c m ) N k ( c 2 , c 1 ) N k ( c 2 , c 2 ) . . . N k ( c 2 , c m ) . . . . . . . . . . . . N k ( c m , c 1 ) N k ( c m , c 2 ) . . . N k ( c m , c m ) , k=(1,2,...,n)
其中,Ci’为所述训练图像的第i个类别,Cj’为所述训练图像的第j个类别,i=1,2,......m,j=1,2,......m,而矩阵元素Nk(ci,cj)表示第k顺位的各个训练数据样本块中实际类别为Ci’而分类结果为Cj’的训练数据样本块个数。
步骤205:将同一顺位中统计得到的训练数据样本块个数除以位于同一顺位的训练数据样本块的样本总数,得到一个概率集合。
例如,将第k顺位中统计得到的训练数据样本块个数除以位于同一顺位的训练数据样本块的样本总数
Figure BDA0000038943280000082
得到第k顺位的概率矩阵:
P k = p k ( c 1 | c 1 ) p k ( c 1 | c 2 ) . . . p k ( c 1 | c m ) p k ( c 2 | c 1 ) p k ( c 2 | c 2 ) . . . p k ( c 2 | c m ) . . . . . . . . . . . . p k ( c m | c 1 ) p k ( c m | c 2 ) . . . p k ( c m | c m ) , k=(1,2,...,n)
其中, p k ( c i | c j ) = N k ( c i , c j ) / Σ i = 1 m Σ j = 1 m N k ( c i , c j )
最后,Pk,k=(1,2,...,n)构成一个概率集合。
步骤206:存储概率集合。
至此,第一阶段结束,进入第二阶段。请参阅图5,其为本申请的图像分类过程中分类应用阶段的流程图。包括以下步骤:
步骤501:从待分类图像中提取高维特征数据;
步骤502:将待分类图像的高维特征数据划分为特征数据块;
其中,将待分类图像的高维特征数据同样划分为N个特征数据块。其具体的划分方式可以参见图3。
步骤503:对划分得到的特征数据块进行分类,得到反映特征数据块类别的数据块分类结果;
分块后,由N个分类器对N个特征数据块进行分类。
这里也需要说明的是,N个分类器可以采用相同的分类方法对训练数据样本块进行分类,也可以采用不同的分类方法进行分类。
但是,对于每一个特征数据块来说,其分类方法与同一顺位的训练数据样本块的分类方法相同。
步骤504:从预存的概率集合中提取出实际类别为所述数据块分类结果中的类别而被判为Ck的概率;
其中,Ck为第k个特征数据块的类别,k=1,2,......N。
例如,为了获得C1类别的后验概率,
则从
Figure BDA0000038943280000093
k=(1,2,...,n)中提取出实际类别为c1而被判类别为ck的概率为pk(c1|ck)。
步骤505:将提取出的概率值进行乘积运算,得到数据块分类结果中的每个类别的后验概率;
例如,C1类别的后验概率为
Figure BDA0000038943280000101
k=1,2,...,N。
步骤506:从所述数据块分类结果的所有类别中,选择后验概率最大的类别作为所述待分类图像的分类结果。
由上述实施例可以看出,与现有技术相比,本申请具有如下优点:
(1)高维特征数据被充分利用
高维特征数据全部都参与分类过程,特征数据得到充分利用。因此,避免了高维特征数据的信息丢失。
(2)基于概率统计决策
在分类过程中,每个划分后的特征数据块之间相互独立,互不干扰,基于后验概率统计原理进行最终分类决策。因为分类决策基于统计原理,所以特征数据块的数量越多,分类决策越准确。
(3)抗干扰能力强
噪音产生的对某些特征描述效果的干扰会被多个具有异构分类器的叶子分类结点弱化,提高了分类方法的抗干扰能力。
实施例三
与上述一种图像分类方法相对应,本申请实施例还提供了一种图像分类装置。请参阅图6,其为本申请一种图像分类装置的一个实施例的结构图。该装置包括:图像训练单元601和图像分类单元602。其中,
图像训练单元,用于分别将从M个已知类别的训练图像样本中提取出的特征数据划分为N个训练数据样本块,对所述训练数据样本块进行分类,根据位于同一顺位的训练数据样本块的分类结果统计出实际类别为Ci’而分类结果为Cj’的训练数据样本块个数,将统计得到的训练数据样本块个数除以训练图像的样本总数,得到概率集合,预存所述概率集合,其中,其中M、N均为不小于2的整数,Ci’为所述训练图像的第i个类别,Cj’为所述训练图像的第j个类别,i=1,2,......m,j=1,2,......m,m为所述训练图像的类别总数;
图像分类单元602,用于将从待分类图像中提取出的特征数据按照所述训练图像的划分方式划分为N个特征数据块,对所述特征数据块进行分类,得到反映特征数据块类别的数据块分类结果,从预存的概率集合中提取出实际类别为所述数据块分类结果中的类别而被判为Ck的概率,将提取出的概率值进行乘积运算,得到数据块分类结果中的每个类别的后验概率,从所述数据块分类结果的所有类别中,选择后验概率最大的类别作为所述待分类图像的分类结果,其中,Ck为第k个特征数据块的类别,k=1,2,......N。
优选的,图像训练单元601包括:第一划分子单元,用于采用相同的分类方法对划分得到的训练数据样本块进行分类;或者,第二划分子单元,用于采用不同的分类方法对划分得到的训练数据样本块进行分类。
优选的,图像分类单元602包括:第三划分子单元,用于采用相同的分类方法对划分得到的特征数据块进行分类;或者,第四划分子单元,用于采用不同的分类方法对划分得到的特征数据块进行分类。
优选的,训练数据样本块之间,以及,特征数据块之间数据互相重叠或者互不重叠。
进一步优选的,当特征数据的维度为1000以上时,训练数据样本块或者特征数据块的个数至少为15。
由上述实施例可以看出,与现有技术相比,本申请具有如下优点:
(1)高维特征数据被充分利用
高维特征数据全部都参与分类过程,特征数据得到充分利用。因此,避免了高维特征数据的信息丢失。
(2)基于概率统计决策
在分类过程中,每个划分后的特征数据块之间相互独立,互不干扰,基于后验概率统计原理进行最终分类决策。因为分类决策基于统计原理,所以特征数据块的数量越多,分类决策越准确。
(3)抗干扰能力强
噪音产生的对某些特征描述效果的干扰会被多个具有异构分类器的叶子分类结点弱化,提高了分类方法的抗干扰能力。
需要说明的是,本申请中的图像分类方法并不局限于基于高维特征数据分类的医学图像中,也可以应用与其它领域中的高维数据分类问题。
另外本申请中的“待分类图像”不仅包括一个完整的图像,也包括来自于一个完整图像中的某个图像片段。
例如,医学图像的内容通常是人体的组织器官,组织器官有相应的位置关系。医学图像组织器官分割是一个比较复杂的任务,在医学图像分类任务中,依靠组织器官分割来提取空间位置关系特征的方法不易实现。但是,空间位置关系又是医学图像的一大特性,为了更多地考虑医学图像的局部特性,将医学图像均匀分区后再对分区后的每个图像片段进行特征提取与分类的方法,保留空间关系特征,分区策略可以采用如图7所示。对图像作分区不仅可以表达出一定的空间位置关系特征,而且还可以通过分区面积的大小起到对图像区域特征加权处理的效果。假设对分区后得到的各图像片段提取出的特征作相同的分析,面积越小的图像片段,像素灰度级的变化对图像片段的区域特征的作用越明显,相当于区域的权重越大。
对医学图像采取如图7(a)的方法进行分区,然后对每个图像片段和完整图像进行特征提取,如前文所述,基于提取的高维特征数据进行分类,结果如图8所示。
图(8)中横轴代表均匀四分法中各图像片段及医学图像全局区域,纵轴是分类准确率。并且,在每个图像片段都基于四种特征提取方法提取出的特数据进行分类,测试在不同图像片段单独使用本申请分类方法的分类效果。可见,分类方法有效结合了每个图像片段中各种特征提取方法提取出的医学图像特征信息,使其分类准确率一直高于单独使用任何一种特征提取方法。
以上对本申请所提供的一种图像分类方法和装置进行了详细介绍,本文中应用了具体实施例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,在不脱离本发明描述的原理前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种图像分类方法,其特征在于,包括:
分别将从M个已知类别的训练图像样本中提取出的每一个特征数据划分为N个训练数据样本块,对所述训练数据样本块进行分类,根据位于同一顺位的训练数据样本块的分类结果统计出实际类别为Ci’而分类结果为Cj’的训练数据样本块个数,将统计得到的训练数据样本块个数除以训练图像的样本总数M,得到概率集合,预存所述概率集合,其中,其中M、N均为不小于2的整数,Ci’为所述训练图像的第i个类别,Cj’为所述训练图像的第j个类别,i=1,2,......m,j=1,2,......m,m为所述训练图像的类别总数;
将从待分类图像中提取出的特征数据按照所述训练图像的划分方式划分为N个特征数据块,对所述特征数据块进行分类,得到反映特征数据块类别的数据块分类结果,从预存的概率集合中提取出实际类别为所述数据块分类结果中的类别而被判为Ck的概率,将提取出的概率值进行乘积运算,得到数据块分类结果中的每个类别的后验概率,从所述数据块分类结果的所有类别中,选择后验概率最大的类别作为所述待分类图像的分类结果,其中,Ck为第k个特征数据块的类别,k=1,2,......N。
2.根据权利要求1所述的方法,其特征在于,所述对训练数据样本块进行分类具体包括:
采用相同的分类方法对划分得到的训练数据样本块进行分类;
或者,
采用不同的分类方法对划分得到的训练数据样本块进行分类。
3.根据权利要求1所述的方法,其特征在于,所述对特征数据块进行分类具体包括:
采用相同的分类方法对划分得到的特征数据块进行分类;
或者,
采用不同的分类方法对划分得到的特征数据块进行分类。
4.根据权利要求1所述的方法,其特征在于,所述训练数据样本块之间,以及,特征数据块之间数据互相重叠或者互不重叠。
5.根据权利要求1-4中的任意一项所述的方法,其特征在于,当特征数据的维度为1000以上时,训练数据样本块或者特征数据块的个数至少为15。
6.一种图像分类装置,其特征在于,包括:
图像训练单元,用于分别将从M个已知类别的训练图像样本中提取出的每一个特征数据划分为N个训练数据样本块,对所述训练数据样本块进行分类,根据位于同一顺位的训练数据样本块的分类结果统计出实际类别为Ci’而分类结果为Cj’的训练数据样本块个数,将统计得到的训练数据样本块个数除以训练图像的样本总数M,得到概率集合,预存所述概率集合,其中,其中M、N均为不小于2的整数,Ci’为所述训练图像的第i个类别,Cj’为所述训练图像的第j个类别,i=1,2,......m,j=1,2,......m,m为所述训练图像的类别总数;
图像分类单元,用于将从待分类图像中提取出的特征数据按照所述训练图像的划分方式划分为N个特征数据块,对所述特征数据块进行分类,得到反映特征数据块类别的数据块分类结果,从预存的概率集合中提取出实际类别为所述数据块分类结果中的类别而被判为Ck的概率,将提取出的概率值进行乘积运算,得到数据块分类结果中的每个类别的后验概率,从所述数据块分类结果的所有类别中,选择后验概率最大的类别作为所述待分类图像的分类结果,其中,Ck为第k个特征数据块的类别,k=1,2,......N。
7.根据权利要求6所述的装置,其特征在于,所述图像训练单元包括:
第一划分子单元,用于采用相同的分类方法对划分得到的训练数据样本块进行分类;
或者,
第二划分子单元,用于采用不同的分类方法对划分得到的训练数据样本块进行分类。
8.根据权利要求6所述的装置,其特征在于,所述图像分类单元包括:
第三划分子单元,用于采用相同的分类方法对划分得到的特征数据块进行分类;
或者,
第四划分子单元,用于采用不同的分类方法对划分得到的特征数据块进行分类。
9.根据权利要求6所述的装置,其特征在于,所述训练数据样本块之间,以及,特征数据块之间数据互相重叠或者互不重叠。
10.根据权利要求6-9中的任意一项所述的装置,其特征在于,当特征数据的维度为1000以上时,训练数据样本块或者特征数据块的个数至少为15。
CN2010105942665A 2010-12-17 2010-12-17 一种图像分类方法和装置 Expired - Fee Related CN102034117B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105942665A CN102034117B (zh) 2010-12-17 2010-12-17 一种图像分类方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105942665A CN102034117B (zh) 2010-12-17 2010-12-17 一种图像分类方法和装置

Publications (2)

Publication Number Publication Date
CN102034117A true CN102034117A (zh) 2011-04-27
CN102034117B CN102034117B (zh) 2012-08-22

Family

ID=43886979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105942665A Expired - Fee Related CN102034117B (zh) 2010-12-17 2010-12-17 一种图像分类方法和装置

Country Status (1)

Country Link
CN (1) CN102034117B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214233A (zh) * 2011-06-28 2011-10-12 东软集团股份有限公司 一种对文本进行分类的方法及装置
CN106663198A (zh) * 2014-09-05 2017-05-10 高通股份有限公司 用于超声波指纹的基于图像的活性检测
CN109145933A (zh) * 2017-06-28 2019-01-04 腾讯科技(深圳)有限公司 媒体资源的分类器训练方法及装置
CN109377477A (zh) * 2018-09-26 2019-02-22 广东毅达医疗科技股份有限公司 一种图像分类的方法、装置及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070271075A1 (en) * 2006-05-22 2007-11-22 Xuewen Chen Method of classifying data using shallow feature selection
CN101303767A (zh) * 2007-11-15 2008-11-12 复旦大学 基于块图像内容自适应分类的数字剪影图像配准方法
CN101593214A (zh) * 2008-05-28 2009-12-02 美国日本电气实验室公司 用于处理高维数据的系统和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070271075A1 (en) * 2006-05-22 2007-11-22 Xuewen Chen Method of classifying data using shallow feature selection
CN101303767A (zh) * 2007-11-15 2008-11-12 复旦大学 基于块图像内容自适应分类的数字剪影图像配准方法
CN101593214A (zh) * 2008-05-28 2009-12-02 美国日本电气实验室公司 用于处理高维数据的系统和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《电讯技术》 20100331 黄荣顺等 多分类器融合的快速高维特征聚类图像分割 12-17 1-10 第50卷, 第3期 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214233A (zh) * 2011-06-28 2011-10-12 东软集团股份有限公司 一种对文本进行分类的方法及装置
CN102214233B (zh) * 2011-06-28 2013-04-10 东软集团股份有限公司 一种对文本进行分类的方法及装置
CN106663198A (zh) * 2014-09-05 2017-05-10 高通股份有限公司 用于超声波指纹的基于图像的活性检测
CN109145933A (zh) * 2017-06-28 2019-01-04 腾讯科技(深圳)有限公司 媒体资源的分类器训练方法及装置
CN109145933B (zh) * 2017-06-28 2022-02-08 腾讯科技(深圳)有限公司 媒体资源的分类器训练方法及装置
CN109377477A (zh) * 2018-09-26 2019-02-22 广东毅达医疗科技股份有限公司 一种图像分类的方法、装置及计算机可读存储介质
CN109377477B (zh) * 2018-09-26 2020-09-18 苏州六莲科技有限公司 一种图像分类的方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN102034117B (zh) 2012-08-22

Similar Documents

Publication Publication Date Title
CN105224951B (zh) 一种车型分类方法及分类装置
Nguyen et al. Pavement crack detection using convolutional neural network
CN103942562B (zh) 基于多分类器组合的高光谱图像分类方法
CN104834940A (zh) 一种基于支持向量机的医疗影像检查疾病分类方法
CN105894046A (zh) 卷积神经网络训练及图像处理的方法和系统、计算机设备
CN105718937B (zh) 多类别对象分类方法及系统
CN103886077B (zh) 短文本的聚类方法和系统
CN102495901B (zh) 通过局部均值保持实现类数据平衡的方法
CN102411592B (zh) 一种文本分类方法和装置
CN101251896B (zh) 一种基于多分类器的物体检测系统及方法
CN109993201A (zh) 一种图像处理方法、装置和可读存储介质
CN102034117B (zh) 一种图像分类方法和装置
Nanni et al. How could a subcellular image, or a painting by Van Gogh, be similar to a great white shark or to a pizza?
CN103077399A (zh) 基于集成级联架构的生物显微图像分类方法
Rauf et al. Attention-guided multi-scale deep object detection framework for lymphocyte analysis in IHC histological images
Hiippala Recognizing military vehicles in social media images using deep learning
CN104268557B (zh) 基于协同训练和深度svm的极化sar分类方法
Jeyavathana et al. An efficient feature extraction method for tuberculosis detection using chest radiographs
CN110852255B (zh) 一种基于u型特征金字塔的交通目标检测方法
Won Feature extraction and evaluation using edge histogram descriptor in MPEG-7
CN102103700A (zh) 基于陆地移动距离的相似度检测图像型垃圾邮件的方法
AU2021103837A4 (en) CNN based leukocytes classification in blood images and WBC count detection
Hauri Detecting signatures in scanned document images
Nurahmadan et al. A mobile based waste classification using mobilenets-v1 architecture
CN110032933B (zh) 一种图像数据的获取方法、装置、终端及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120822

Termination date: 20201217

CF01 Termination of patent right due to non-payment of annual fee