CN108154172A - 基于三支决策的图像识别方法 - Google Patents
基于三支决策的图像识别方法 Download PDFInfo
- Publication number
- CN108154172A CN108154172A CN201711390560.2A CN201711390560A CN108154172A CN 108154172 A CN108154172 A CN 108154172A CN 201711390560 A CN201711390560 A CN 201711390560A CN 108154172 A CN108154172 A CN 108154172A
- Authority
- CN
- China
- Prior art keywords
- decision
- image
- data set
- sample data
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及高性能图像识别领域,特别涉及基于三支决策的图像识别方法;所述方法包括训练样本数据集图像;利用样本数据集图像对基于三支决策的分类器进行训练,得到待识别图像所需要的分类器,即基于三支决策的图像识别分类器;对所述待识别图像进行分割;把待识别图像划分为三个区域;对基于三支决策分类器分割出的延迟决策区域进行迭代分类处理;对剩下的延迟决策区域进行判断,是否达到临界值;当延迟决策区域达到临界值,说明待识别图像已经不可再分割,然后对所有的正区域识别;本发明可以充分利用图像中有用信息,使图像识别技术和三支决策理论结合起来,达到更高的识别率。
Description
技术领域
本发明涉及高性能图像识别领域,特别涉及一种基于三支决策的图像识别方法。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。基于内容的图像识别从70年代开始便成为一个非常活跃的研究领域,其推动力来源于两大研究方向:数据库系统和计算机视觉。
基于内容的图像识别是多媒体数据挖掘领域的一个重要分支,图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。最初的图像识别研究主要集中于如何选择合适的全局特征去描述图像内容和用什么样的相似度度量进行图像匹配。由于计算机视觉以及人工智能发展的不成熟,目前图像识别的进一步发展受到影响。由于使用了全局的图像特征,这种方法只适用于简单的图像或背景较为单一的图像,近年来,基于图像识别的相关反馈技术也成为一个研究热点。它根据用户的需求随时调整系统检索时用的特征和相似度量算法,尽量减少低层特征和高级语义间的差别。
目前计算机视觉和模式识别技术还不能达到对目标进行高效识别的水准,导致了描述对象层语义和抽象层语义比较困难,因此现在对于图像语义特征的研究集中在语义特征模型的第一层,即特征语义层。因为简单语义特征的提取与分析是利用复杂语义信息的基础,而计算机对图像内容的理解一般指图像的低层视觉特征,如颜色、纹理、形状等;而实际上,人类对图像的理解即图像语义信息表达的内容要远远多于图像的视觉特征。这种从图像低层视觉特征与图像高层语义特征之间存在着的较大差距,即“语义鸿沟”。
综上所述,现在一般的图像识别方法都是基于图像的低层语义进行研究的,由于计算机自身性能的问题,只能程序化的执行单一的操作指令,导致一般方法对图像的识别率低,而如何提高图像识别率,理解图像深层语义成了现在亟待解决的研究方向。
三支决策(Three-way Decision,简称3WD)是近几年发展起来的一种处理不确定性决策的方法,是一种复合人类认知的“三分而治”(Trisecting and Acting)模型。三支决策是一种基于符合人类认知的决策模式,它认为:人们在实际决策过程中,对于具有充分把握接受或拒绝的事物能够立即做出快速的判断;对于哪些不能立即做出决策的事物,人们往往会推迟对事件的判断,即延迟决策。在更多的实际决策过程中,存在决策环境的复杂性,信息获取的不完备性,群决策中各专家意见不一致性,决策者所具备知识的有限性和思维模糊性等不确定情况,决策者在大多数情况下很难准确的给出损失函数的具体取值。一般来说,不确定的含义很广泛,主要包括随机性、模糊性、不完全性、不稳定性和不一致性等方面。通常而言,三支决策分为两种模式:基于双评价函数的三支决策和基于单评价函数的三支决策。
因为,如何将三支决策方法与图像识别方法结合起来,实现更优的图像识别技术成为亟待解决的问题。
发明内容
为了解决上述技术问题,本发明提出基于三支决策的图像识别方法。
本发明一种基于三支决策的图像识别方法,如图1所示:
一种基于三支决策的图像识别方法:包括:
S1、输入待识别的图像;
S2、利用样本数据集图像得到三支决策分类器;
S3、根据所述三支决策分类器的分类条件,把所述待识别的图像分为三个区域,包括:正区域、负区域、延迟决策区域;
S4、利用复合型支持向量机SVM对所述三支决策分类器分类出的正区域部分进行图像识别处理;
S5、输出图像识别结果。
优选的,所述利用样本数据集图像得到的三支决策分类器,如图2所示,包括:
S201、输入训练样本数据集图像;
S202、根据三支决策的属性,对样本数据集进行训练,包括:将第i类样本数据集图像分别按照第i类数据样本集图像的图像特征进行分割,得到第i类样本数据集图像的图像特征属性值,根据所述第i类样本数据集图像的图像特征属性值得到第i类样本数据集图像,得到第i类样本数据集图像训练所需属性值λiαp,λiαn,λiβp,λiβn,λiξp,λiξn;其中,λiαp表示满足第i类决策条件下采取接受决策的代价,λiαn表示不满足第i类样本数据集图像的决策条件下采取接受决策的代价,λiβp表示满足第i类样本数据集图像的决策条件下采取拒绝决策的代价,λiβn表示不满足第i类样本数据集图像的决策条件下的采取拒绝决策的代价,λiξp表示满足第i类样本数据集图像的决策条件下采取不承诺决策的代价,λiξn表示不满足第i类样本数据集图像的决策条件下的采取不承诺决策的代价,i∈{1,2,...,N},N为样本数据集中图像总类数;
S203、利用三支决策的决策问题代价矩阵,分别计算出第i类样本数据集图像的正区域和负区域的最优值:
其中,αi表示第i类样本数据集图像的正区域的最优值、βi表示第i类样本数据集图像的负区域的最优值;
表1两种状态决策问题代价矩阵
S204、根据所述第i类样本数据集图像的正区域最优值αi和所述第i类样本数据集图像的负区域的最优值βi,得到第i类样本数据集图像的延迟决策区域值ξi:βi<ξi<αi;
S205、根据所述αi、βi和ξi,得到第i类样本数据集图像的三支决策分类器。
进一步的,所述第i类图像特征包括:图像轮廓、亮度、颜色中的一种或多种。
优选的,根据所述三支决策分类器的分类条件,把所述待识别的图像分为三个区域包括:将第i类样本数据集图像量化为大小为1的区域,将所述大小为1的区域按照所述三支决策器分类得到的第i类样本数据集图像的正区域最优值和所述第i类样本数据集图像的负区域的最优值分为三个区域,根据风险函数,选择风险最小的决策,得到风险估计;根据所述风险估计,所述待识别图像采取进入所述三个区域中的某一个区域的决策;
其中,所述三个区域具体为:[αi,1]为第i类样本数据集图像的正区域,[0,βi]为第i类样本数据集图像的负区域,(αi,βi)为第i类样本数据集图像的延迟决策区域;其中,αi表示第i类样本数据集图像的正区域的最优值、βi表示第i类样本数据集图像的负区域的最优值;
对应三支决策,分别用αi对第i类样本数据集图像的采取接受决策、βi表示对第i类样本数据集图像的采取拒绝决策、ξi表示对第i类样本数据集图像的采取不承诺决策;
所述风险估计包括:
接受风险:
拒绝风险:
不承诺风险:R(ξi|y)=λiξp·Pβi(Y|[y])+(1-Pβi(Y|[y]));
根据所述风险估计,所述待识别图像采取进入所述三个区域中的某一个区域的决策包括:
当满足条件R(αi|y)≤R(ri|y)∧R(αi|y)≤R(ni|y)时,待识别图像采取对第i类样本数据集图像的接受的决策;
当满足条件R(ri|y)≤R(αi|y)∧R(ri|y)≤R(ni|y)时,待识别图像采取对第i类样本数据集图像的拒绝的决策;
当满足条件R(ni|y)≤R(αi|y)∧R(ni|y)≤R(ri|y)时,待识别图像采取对第i类样本数据集图像的不承诺的决策;
其中,评价函数定义为Pr(Y|[y]),风险函数为R(Δ|y),其中,Y表示对y决策动作,Δ表示对y的决策动作,y表示决定,R(αi|y)表示在对第i类样本数据集图像决策过程中接受状态的风险函数,R(βi|y)表示在对第i类样本数据集图像决策过程中拒绝状态的风险函数,R(ξi|y)表示在对第i类样本数据集图像决策过程中延迟决策状态的风险函数;表示在对第i类样本数据集图像决策过程中拒绝状态的评价函数;风险函数R(ri|y)表示第i类样本数据集图像决策动作ri的风险的数学期望,风险函数R(ni|y)表示第i类样本数据集图像中决策动作ni的风险的数学期望。
进一步的,根据所述风险估计,所述待识别图像采取进入所述三个区域中的某一个区域的决策还包括:
确保时;
当待识别图像采取对第i类样本数据集图像的接受的决策;
当待识别图像采取对第i类样本数据集图像的拒绝的决策;
当待识别图像采取对第i类样本数据集图像的不承诺的决策;
其中,表示表示在对第i类样本数据集图像决策过程中的决策动作ri的风险的评价函数,λiαp表示满足第i类样本数据集图像的决策条件下采取接受决策的代价,λiαn表示不满足第i类样本数据集图像的决策条件下采取接受决策的代价,λiβp表示满足第i类样本数据集图像的决策条件下采取拒绝决策的代价,λiβn表示不满足第i类样本数据集图像的决策条件下的采取拒绝决策的代价,λiξp表示满足第i类样本数据集图像的决策条件下采取不承诺决策的代价,λiξn表示不满足第i类样本数据集图像的决策条件下的采取不承诺决策的代价,i∈{1,2,...,N},N为样本数据集中图像总类数。
优选的,所述根据所述三支决策分类器的分类条件,把所述待识别的图像分为三个区域还包括:引入一对阈值(αi,βi),则将样本数据集图像集合U分为以下三个区域:
正区域:POS(αi,βi)={x∈∪|v(x)≥αi};
负区域:NEG(αi,βi)={x∈∪|v(x)≤βi};
边界域:
通过上述三个区域可以构造三支决策规则:正区域对应接受,负区域对应拒绝,边界域对应延迟决策,边界域也叫做延迟决策区域,其中,{u∈∪|v(u)≥αi}表示满足v(u)≥αi且u∈∪时,样本图像u的取值;{u∈∪|v(u)≤βi}表示满足v(u)≤βi且u∈∪时,样本图像u的取值;表示满足且u∈∪时,样本图像u的取值;对应全序关系≤,表示严格的全序关系;即:当且仅当βi≤v(u)≤αi且βi≠v(u)≠αi;αi表示对第i类样本数据集图像的采取接受决策、βi表示对第i类样本数据集图像的采取拒绝决策、ξi表示对第i类样本数据集图像的采取不承诺决策;u表示样本图像,v(u)表示对样本图像u量化后的值。
优选的,根据所述三支决策分类器的分类条件,把所述待识别的图像分为三个区域后,对所述延迟决策区域再次分类,包括:将已分类出的正区域作为新的正样本、已分类出的负区域作为新的负样本为训练条件,对所述三支决策分类器进行再次训练,直到所述延迟决策区域部分不可再分,达到临界值。
进一步的,所述利用复合型支持向量机SVM对所述三支决策分类器分类出的正区域部分进行图像识别处理包括:利用复合型支持向量机SVM通过一对多分类方法,生成分类器,根据所述分类器将所述三支决策分类器分类出的正区域部分进行图像识别,实现最终的检测识别。
优选的,所述复合型支持向量机SVM为基于SVM识别的改进版;具体的,所述复合型支持向量机SVM包括:在所述待识别图像的样本空间中,划分超平面,找到与所述超平面距离最近的待识别图像的样本数据点,得到和所述超平面平行且距离相等的第一超平面和第二超平面,根据所述第一超平面和所述第二超平面分隔所述待识别图像;所述超平面可通过如下线性方程来描述:
g(x)=wTx+b=0
所述第一超平面为:H1:g1(x)=wTx+b=+1
所述第二超平面为:H2:g2(x)=wTx+b=-1
当g(x)=0时,x是位于超平面上的点,向量w为垂直于超平面g(x)=0的向量,wT表示w向量的转置,b表示常数;在所述第一超平面和所述第二超平面上的待识别图像的样本数据点也就是离分隔超平面最近的点。
优选的,所述分类器包括:根据待识别图像的样本数据点得到的三类样本,制作分类器;其中,所述三类样本具体包括:将所述第一超平面上的待识别图像的样本数据点归为第一类,将所述第二超平面上的待识别图像的样本数据点归为第二类;将除去所述第一超平面和所述第二超平面上的待识别图像的样本数据点归为第三类。
本发明基于三支决策的图像识别方法,针对图像识别技术的自适应性差等问题,使用三支决策的理论,充分利用图像中有用信息,使图像识别技术和三支决策理论结合起来,达到更高的识别率;本发明能够通过三支决策的延迟决策有效的识别出图像的模糊部分,针对传统图像识别的图像分割可能导致的把相同目标分到不同子块的问题,本发明对图像本身的要求最低化,能够更加准确的分割图像,并有效的识别图像类别,通过一对多分类方法,能够实现多分类图像的识别。
附图说明
图1为本发明基于三支决策的图像识别方法的流程示意图;
图2为本发明的三支决策分类器的流程示意图;
具体实施方式
本发明一种基于三支决策的图像识别方法,如图1所示:
一种基于三支决策的图像识别方法:包括:
S1、输入待识别的图像;
S2、利用样本数据集图像得到三支决策分类器;
S3、根据所述三支决策分类器的分类条件,把所述待识别的图像分为三个区域,包括:正区域、负区域、延迟决策区域;
S4、利用复合型支持向量机SVM对所述三支决策分类器分类出的正区域部分进行图像识别处理;
S5、输出图像识别结果。
优选的,所述利用训练样本数据集图像得到的三支决策分类器包括:
S201、输入训练样本数据集图像;
S202、根据三支决策的属性,对样本数据集图像进行训练,包括:将第i类样本数据集图像分别按照第i类数据样本集图像的图像特征进行分割,得到第i类样本数据集图像的图像特征属性值,根据所述第i类样本数据集图像的图像特征属性值得到第i类样本数据集图像训练所需属性值λiαp,λiαn,λiβp,λiβn,λiξp,λiξn;其中,λiαp表示满足第i类决策条件下采取接受决策的代价,λiαn表示不满足第i类样本数据集图像的决策条件下采取接受决策的代价,λiβp表示满足第i类样本数据集图像的决策条件下采取拒绝决策的代价,λiβn表示不满足第i类样本数据集图像的决策条件下的采取拒绝决策的代价,λiξp表示满足第i类样本数据集图像的决策条件下采取不承诺决策的代价,λiξn表示不满足第i类样本数据集图像的决策条件下的采取不承诺决策的代价,i∈{1,2,...,N},N为样本数据集中图像总类数;
S203、利用三支决策的决策问题代价矩阵,分别计算出第i类样本数据集图像的正区域和负区域的最优值:
其中,αi表示第i类样本数据集图像的正区域的最优值、βi表示第i类样本数据集图像的负区域的最优值;
表1两种状态决策问题代价矩阵
S204、根据所述第i类样本数据集图像的正区域最优值αi和所述第i类样本数据集图像的负区域的最优值βi,得到第i类样本数据集图像的延迟决策区域值ξi:βi<ξi<αi;
S205、根据所述αi、βi和ξi,得到第i类样本数据集图像的三支决策分类器。
进一步的,所述第i类图像特征包括:图像轮廓、亮度、颜色和灰度等中的一种或多种。
优选的,作为一种可选方式,根据所述三支决策分类器的分类条件,把所述待识别的图像分为三个区域包括:将所述大小为1的区域按照所述三支决策器分类得到的第i类样本数据集图像的正区域最优值和所述第i类样本数据集图像的负区域的最优值分为三个区域,根据风险函数,选择风险最小的决策,得到风险估计;根据所述风险估计,所述待识别图像采取进入所述三个区域中的某一个区域的决策;
其中,三个区域分别为:[αi,1]为第i类样本数据集图像的正区域,[0,βi]为第i类样本数据集图像的负区域,(αi,βi)为第i类样本数据集图像的延迟决策区域;其中,αi表示第i类样本数据集图像的正区域的最优值、βi表示第i类样本数据集图像的负区域的最优值;
对应三支决策,分别用αi对第i类样本数据集图像的采取接受决策、βi表示对第i类样本数据集图像的采取拒绝决策、ξi表示对第i类样本数据集图像的采取不承诺决策;
所述风险估计包括:
接受风险:
拒绝风险:
不承诺风险:R(ξi|y)=λiξp·Pβi(Y|[y])+(1-Pβi(Y|[y]));
根据所述风险估计,所述待识别图像采取进入所述三个区域中的某一个区域的决策包括:
当满足条件R(αi|y)≤R(ri|y)∧R(αi|y)≤R(ni|y)时,待识别图像采取对第i类样本数据集图像的接受的决策;
当满足条件R(ri|y)≤R(αi|y)∧R(ri|y)≤R(ni|y)时,待识别图像采取对第i类样本数据集图像的拒绝的决策;
当满足条件R(ni|y)≤R(αi|y)∧R(ni|y)≤R(ri|y)时,待识别图像采取对第i类样本数据集图像的不承诺的决策;
其中,评价函数定义为Pr(Y|[y]),风险函数为R(Δ|y),其中,Y表示对y决策动作,Δ表示对y的决策动作,y表示决定,R(αi|y)表示在对第i类样本数据集图像决策过程中接受状态的风险函数,R(βi|y)表示在对第i类样本数据集图像决策过程中拒绝状态的风险函数,R(ξi|y)表示在对第i类样本数据集图像决策过程中延迟决策状态的风险函数;表示在对第i类样本数据集图像决策过程中拒绝状态的评价函数;风险函数R(ri|y)表示第i类样本数据集图像决策动作ri的风险的数学期望,风险函数R(ni|y)表示第i类样本数据集图像中决策动作ni的风险的数学期望,∧表示同时满足。
进一步的,根据所述风险估计,所述待识别图像采取进入所述三个区域中的某一个区域的决策还包括:
确保
当待识别图像采取对第i类样本数据集图像的接受的决策;
当待识别图像采取对第i类样本数据集图像的拒绝的决策;
当待识别图像采取对第i类样本数据集图像的不承诺的决策;其中,表示表示在对第i类样本数据集图像决策过程中的决策动作ri的风险的评价函数,λiαp表示满足第i类样本数据集图像的决策条件下采取接受决策的代价,λiαn表示不满足第i类样本数据集图像的决策条件下采取接受决策的代价,λiβp表示满足第i类样本数据集图像的决策条件下采取拒绝决策的代价,λiβn表示不满足第i类样本数据集图像的决策条件下的采取拒绝决策的代价,λiξp表示满足第i类样本数据集图像的决策条件下采取不承诺决策的代价,λiξn表示不满足第i类样本数据集图像的决策条件下的采取不承诺决策的代价,i∈{1,2,...,N},N为样本数据集中图像总类数。
作为另一种实施方式,所述根据所述三支决策分类器的分类条件,把所述待识别的图像分为三个区域还包括:引入一对阈值(αi,βi),则将样本数据集图像集合U分为以下三个区域:
正区域:POS(αi,βi)={x∈∪|v(x)≥αi};
负区域:NEG(αi,βi)={x∈∪|v(x)≤βi};
边界域:
通过上述三个区域可以构造三支决策规则:正区域对应接受,负区域对应拒绝,边界域对应延迟决策,边界域也即延迟决策区域,其中,{u∈∪|v(u)≥αi}表示满足v(u)≥αi且u∈∪时,样本图像u的取值;{u∈∪|v(u)≤βi}表示满足v(u)≤βi且u∈∪时,样本图像u的取值;表示满足且u∈∪时,样本图像u的取值;对应全序关系≤,表示严格的全序关系;即:当且仅当βi≤v(u)≤αi且βi≠v(u)≠αi;αi表示对第i类样本数据集图像的采取接受决策、βi表示对第i类样本数据集图像的采取拒绝决策、ξi表示对第i类样本数据集图像的采取不承诺决策;u表示样本图像,v(u)表示对样本图像u量化后的值。
优选的,根据所述三支决策分类器的分类条件,把待识别图像分为三个区域后,对所述延迟决策区域再次分类,包括:将已分类出的正区域作为新的正样本、已分类出的负区域作为新的负样本为训练条件,对所述三支决策分类器进行再次训练,直到所述延迟决策区域部分不可再分,达到临界值。
进一步的,所述利用复合型支持向量机SVM对所述三支决策分类器分类出的正区域部分进行图像识别处理包括:利用复合型支持向量机SVM通过一对多分类方法,生成分类器,根据所述分类器将所述三支决策分类器分类出的正区域部分进行图像识别,实现最终的检测识别。
优选的,所述复合型支持向量机SVM包括:所述复合型支持向量机SVM为基于SVM识别的改进版;具体的,所述复合型支持向量机SVM包括:在所述待识别图像的样本空间中,划分超平面,找到与所述超平面距离最近的待识别图像的样本数据点,得到和所述超平面平行且距离相等的第一超平面和第二超平面,根据所述第一超平面和所述第二超平面分隔所述待识别图像;所述超平面可通过如下线性方程来描述:
g(x)=wTx+b=0
所述第一超平面为:H1:g1(x)=wTx+b=+1
所述第二超平面为:H2:g2(x)=wTx+b=-1
当g(x)=0时,x是位于超平面上的点,向量w为垂直于超平面g(x)=0的向量,wT表示w向量的转置,b表示常数;在所述第一超平面和所述第二超平面上的待识别图像的样本数据点也就是离分隔超平面最近的点。
优选的,所述分类器包括:根据待识别图像的样本数据点得到的三类样本,制作分类器;其中,所述三类样本具体包括:将所述第一超平面上的待识别图像的样本数据点归为第一类,将所述第二超平面上的待识别图像的样本数据点归为第二类;将除去所述第一超平面和所述第二超平面上的待识别图像的样本数据点归为第三类。
进一步的,利用样本数据集cifar-10包含的60,000个32×32的彩色图像,共有10类。有50,000个训练图像和10,000个测试图像。样本数据集分为5个训练块和1个测试块,每个块有10,000个图像。测试块包含从每类随机选择的1,000个图像;其中,训练块为本发明的样本数据集图像,测试块也即本发明的待识别图像集,测试图像即为本发明的待识别图像。
根据三支决策分类器决策要求使用样本数据集中训练样本中的正样本作为训练对象,得到实验所需的决策条件并得到决策状态的文件λiαp和λiαn;同理使用样本数据集中训练样本中的负样本作为训练对象,得到实验所需的决策条件并得到决策状态的文件λiβp和λiβp;根据所得λiαp,λiβp,λiαn,λiβp得到λiξp,λiξn。根据以上所得公式算出第i类样本数据集图像的正区域的最优值;根据公式算出第i类样本数据集图像的负区域的最优值。
训练块以随机的顺序包含这些样本数据集图像,但一些训练块可能比其它分类包含更多的图像。训练块钟每一类包含5000个图像。原始数据集都为单目标图像,为了验证三支决策分类器的准确率,本发明把原始的样本数据集图像中的4张图像合成一张,即每个测试项有4个待识别目标。
进一步的,作为一种可选方式,选取样本数据集图像中所提供的4000张图片作为待识别的图像,其中,每类随机选择图片400张,每次实验为100张图片,最后结果取平均值。统计数据可得表2,如表2所示,基于三支决策的图像识别是可以实现多目标图像的识别。
根据表2的数据可知,本发明的方法在数据集cifar-10中平均的准确率为87.58%,平均F值为87.06%,由此可得基于三支决策分类器的图像识别能得到较高的识别率和准确率,cifar-10是加拿大政府牵头投资的一个先进科学项目研究所收集的一个用于普适物体识别的数据集。
表2基于三支决策cifar-10多目标识别率
进一步的,作为另一种可选方式,采用Car detection on UIUC数据集作为待识别的图像:
进一步的,对Car detection on UIUC数据集的多目标识别对比,为了验证三支决策分类器对于多目标识别的准确率,本发明使用了数据集Car detection on UIUC作为对比。其中,Car detection on UIUC数据集是伊利诺伊大学汽车检测图像数据库,其中包含1,050个训练图像,将这1050个训练图像按照图像特征进行分割,得到正样本550个,负样本500个;有两个测试数据集,一个包含170个图片有200个待识别目标,另一个包含108个图片有139个待识别目标。
如表3所示,对于UIUC数据集来说,样本数据集图像中图像特征的识别目标比较零散,比较容易忽略有用信息,其中,3WD为本发明所提出方法,FD为快速检测框架,Precision为准确率,Recall为召回率,F-Measure为F值,表中所有数据为数据集中所有图像数据取平均值,分析可得本发明的基于三支决策的图像识别精确率高于快速检测框架FD。本文方法识别率达到99.41%,F值为99.26%略高于FD方法。
表3基于UIUC识别率对比
进一步的,作为一种补充方式,利用KITTI数据集对本发明的基于三支决策的图像识别方法进行验证。其中,KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。该评测数据集包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多达15辆车和30个行人,还有各种程度的遮挡与截断。
其中,CS-AdaBoost为Masnadishirazi H在论文Cost-sensitive boosting中提出的方法,AdaBoost+LDA为Wu J,Brubaker S C,Mullin M D,et al在论文Fast AsymmetricLearning for Cascade Face Detection中提出的方法,AdaBoost为Viola P,Jones M在论文Robust real-time face detection中提出的方法,Pruning为Paisitkriangkrai S在论文Asymmetric Pruning for Learning Cascade Detectors中提出的方法,FD为Hu Q,Paisitkriangkrai S,Shen C,et al在论文Fast Detection of Multiple Objects inTraffic Scenes With a Common Detection Framework中提出的方法;
KITTI数据集分为三个类别,分别是车辆、行人和自行车,但由于行人和自行车样本图像本身存在相互干扰的情况,并且其判定标准也不确定,所以本发明采用车辆的图像进行实验和比较,作比较的方法也是采用的图像中车辆信息作为实验目标。
由表4所示,对于数据集KITTI中车辆信息识别,3WD方法的识别率为89.27%,F值为88.86%,高于FD,由于该数据集的特殊性,本文只训练了车辆的图像,所得结果和其他方法的车辆信息做比较,如表4所示,本发明所采用的方法相比其他方法有更高的准确率和F值。
表4基于KITTI数据集识别率对比
其中,mBoW为Behley J在论文Laser-based segment classification using amixture of bag-of-words中提出的方法,MDPM为Forsyth D在论文Object Detectionwith Discriminatively Trained Part-Based Models中提出的方法,DPM-C8B1为Yebes JJ在论文Supervised learning and evaluation of KITTI's cars detector with DPM中提出的方法,OC-DPM为Pepikj B在论文Occlusion Patterns for Object ClassDetection中提出的方法,AOG为Li B,Wu T,Zhu S C在论文Integrating Context andOcclusion for Car Detection by Hierarchical And-Or Model中提出的方法,SubCat为Ohn-Bar E在论文Fast and Robust Object Detection Using Visual Subcategories中提出的方法,Regionlets为Wang X在论文Regionlets for Generic Object Detection中提出的方法。
本发明以上实施例对本发明的目的、技术方案和优点进行了进一步详细说明,所应理解的是,以上所举实施方式或者实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于三支决策的图像识别方法,其特征在于:包括:
S1、输入待识别的图像;
S2、利用样本数据集图像得到三支决策分类器;
S3、根据所述三支决策分类器的分类条件,把所述待识别的图像分为三个区域,包括:正区域、负区域、延迟决策区域;
S4、利用复合型支持向量机SVM对所述三支决策分类器分类出的正区域部分进行图像识别处理;
S5、输出图像识别结果。
2.根据权利要求1所述一种基于三支决策的图像识别方法,其特征在于,所述利用样本数据集图像得到的三支决策分类器包括:
S201、输入训练样本数据集图像;
S202、根据三支决策的属性,对样本数据集图像进行训练,包括:将第i类样本数据集图像分别按照第i类数据样本集图像的图像特征进行分割,得到第i类样本数据集图像的图像特征属性值,根据所述第i类样本数据集图像的图像特征属性值得到第i类样本数据集图像训练所需属性值λiαp,λiαn,λiβp,λiβn,λiξp,λiξn;其中,λiαp表示满足第i类样本数据集图像的决策条件下采取接受决策的代价,λiαn表示不满足第i类样本数据集图像的决策条件下采取接受决策的代价,λiβp表示满足第i类样本数据集图像的决策条件下采取拒绝决策的代价,λiβn表示不满足第i类样本数据集图像的决策条件下的采取拒绝决策的代价,λiξp表示满足第i类样本数据集图像的决策条件下采取不承诺决策的代价,λiξn表示不满足第i类样本数据集图像的决策条件下的采取不承诺决策的代价,i∈{1,2,...,N},N为样本数据集中图像总类数;
S203、利用三支决策的决策问题代价矩阵,分别计算出第i类样本数据集图像的正区域和负区域的最优值:
其中,αi表示第i类样本数据集图像的正区域的最优值、βi表示第i类样本数据集图像的负区域的最优值;
S204、根据所述第i类样本数据集图像的正区域最优值αi和所述第i类样本数据集图像的负区域的最优值βi,得到第i类样本数据集图像的延迟决策区域值ξi:βi<ξi<αi;
S205、根据所述αi、βi和ξi,得到第i类样本数据集图像的三支决策分类器。
3.根据权利要求2所述一种基于三支决策的图像识别方法,其特征在于,所述第i类样本数据集图像的图像特征包括:图像轮廓、亮度、颜色、灰度中的一种或多种。
4.根据权利要求1所述一种基于三支决策的图像识别方法,其特征在于:根据所述三支决策分类器的分类条件,把所述待识别的图像分为三个区域包括:将第i类样本数据集图像量化为大小为1的区域,将所述大小为1的区域按照所述三支决策器分类得到的第i类样本数据集图像的正区域最优值和所述第i类样本数据集图像的负区域的最优值分为三个区域,根据风险函数,选择风险最小的决策,得到风险估计;根据所述风险估计,所述待识别图像采取进入所述三个区域中的某一个区域的决策;
其中,所述三个区域具体为:[αi,1]为第i类样本数据集图像的正区域,[0,βi]为第i类样本数据集图像的负区域,(αi,βi)为第i类样本数据集图像的延迟决策区域;其中,αi表示第i类样本数据集图像的正区域的最优值、βi表示第i类样本数据集图像的负区域的最优值;对应三支决策,用αi表示对第i类样本数据集图像采取接受决策、βi表示对第i类样本数据集图像采取拒绝决策、ξi表示对第i类样本数据集图像采取不承诺决策;
所述风险估计包括:
接受风险:
拒绝风险:
不承诺风险:R(ξi|y)=λiξp·Pβi(Y|[y])+(1-Pβi(Y|[y]));
根据所述风险估计,所述待识别图像采取进入所述三个区域中的某一个区域的决策包括:
当满足条件R(αi|y)≤R(ri|y)∧R(αi|y)≤R(ni|y)时,待识别图像采取对第i类样本数据集图像的接受的决策;
当满足条件R(ri|y)≤R(αi|y)∧R(ri|y)≤R(ni|y)时,待识别图像采取对第i类样本数据集图像的拒绝的决策;
当满足条件R(ni|y)≤R(αi|y)∧R(ni|y)≤R(ri|y)时,待识别图像采取对第i类样本数据集图像的不承诺的决策;
其中,评价函数定义为Pr(Y|[y]),风险函数为R(Δ|y),其中,Y表示对y决策动作,Δ表示对y的决策动作,y表示决定,R(αi|y)表示在对第i类样本数据集图像决策过程中接受状态的风险函数,R(βi|y)表示在对第i类样本数据集图像决策过程中拒绝状态的风险函数,R(ξi|y)表示在对第i类样本数据集图像决策过程中延迟决策状态的风险函数;表示在对第i类样本数据集图像决策过程中拒绝状态的评价函数;风险函数R(ri|y)表示第i类样本数据集图像决策动作ri的风险的数学期望,风险函数R(ni|y)表示第i类样本数据集图像中决策动作ni的风险的数学期望,∧表示同时满足。
5.根据权利要求4所述一种基于三支决策的图像识别方法,其特征在于:所述根据所述风险估计,所述待识别图像采取进入所述三个区域中的某一个区域的决策还包括:
确保
当待识别图像采取对第i类样本数据集图像的接受的决策;
当待识别图像采取对第i类样本数据集图像的拒绝的决策;
当待识别图像采取对第i类样本数据集图像的不承诺的决策;其中,表示表示在对第i类样本数据集图像决策过程中的决策动作ri的风险的评价函数,λiαp表示满足第i类决策条件下采取接受决策的代价,λiαn表示不满足第i类样本数据集图像的决策条件下采取接受决策的代价,λiβp表示满足第i类样本数据集图像的决策条件下采取拒绝决策的代价,λiβn表示不满足第i类样本数据集图像的决策条件下的采取拒绝决策的代价,λiξp表示满足第i类样本数据集图像的决策条件下采取不承诺决策的代价,λiξn表示不满足第i类样本数据集图像的决策条件下的采取不承诺决策的代价,i∈{1,2,...,N},N为样本数据集中图像总类数。
6.根据权利要求1所述一种基于三支决策的图像识别方法,其特征在于:所述根据三支决策分类器的分类条件,把所述待识别的图像分为三个区域还包括:引入一对阈值(αi,βi),则将样本数据集图像集合U分为以下三个区域:
正区域:POS(αi,βi)={u∈∪|v(u)≥αi};
负区域:NEG(αi,βi)={u∈∪|v(u)≤βi};
边界域:
通过上述三个区域可以构造三支决策规则:正区域对应接受,负区域对应拒绝,边界域对应延迟决策,边界域也为延迟决策区域,其中,{u∈∪|v(u)≥αi}表示满足v(u)≥αi且u∈∪时,样本图像u的取值;{u∈∪|v(u)≤βi}表示满足v(u)≤βi且u∈∪时,样本图像u的取值;表示满足且u∈∪时,样本图像u的取值;对应全序关系≤,表示严格的全序关系;即:当且仅当βi≤v(u)≤αi且βi≠v(u)≠αi;αi表示对第i类样本数据集图像的采取接受决策、βi表示对第i类样本数据集图像的采取拒绝决策、ξi表示对第i类样本数据集图像的采取不承诺决策;u表示样本图像,v(u)表示对样本图像u量化后的值。
7.根据权利要求1-6中任一所述的一种基于三支决策的图像识别方法,其特征在于:所述根据所述三支决策分类器的分类条件,把所述待识别的图像分为三个区域后,对所述延迟决策区域再次分类,包括:将已分类出的正区域作为新的正样本、已分类出的负区域作为新的负样本为训练条件,对所述三支决策分类器进行再次训练,直到所述延迟决策区域部分不可再分,达到临界值。
8.根据权利要求1所述的一种基于三支决策的图像识别方法,其特征在于,所述利用复合型支持向量机SVM对所述三支决策分类器分类出的正区域部分进行图像识别处理包括:利用复合型支持向量机SVM通过一对多分类方法,生成分类器,根据所述分类器将所述三支决策分类器分类出的正区域部分进行图像识别,实现最终的检测识别。
9.根据权利要求8所述的一种基于三支决策的图像识别方法,其特征在于,所述复合型支持向量机SVM具体包括:
在所述待识别图像的样本空间中,划分超平面,找到与所述超平面距离最近的待识别图像的样本数据点,得到和所述超平面平行且距离相等的第一超平面和第二超平面,根据所述第一超平面和所述第二超平面分隔所述待识别图像;所述超平面可通过如下线性方程来描述:
g(x)=wTx+b=0
所述第一超平面为:H1:g1(x)=wTx+b=+1
所述第二超平面为:H2:g2(x)=wTx+b=-1
当g(x)=0时,x是位于超平面上的点,向量w为垂直于超平面g(x)=0的向量,wT表示w向量的转置,b表示常数;在所述第一超平面和所述第二超平面上的待识别图像的样本数据点也就是离分隔超平面最近的点。
10.根据权利要求8所述的一种基于三支决策的图像识别方法,其特征在于,所述分类器包括:根据待识别图像的样本数据点得到的三类样本,制作分类器;其中,所述三类样本具体包括:将所述第一超平面上的待识别图像的样本数据点归为第一类,将所述第二超平面上的待识别图像的样本数据点归为第二类;将除去所述第一超平面和所述第二超平面上的待识别图像的样本数据点归为第三类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711390560.2A CN108154172B (zh) | 2017-12-21 | 2017-12-21 | 基于三支决策的图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711390560.2A CN108154172B (zh) | 2017-12-21 | 2017-12-21 | 基于三支决策的图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108154172A true CN108154172A (zh) | 2018-06-12 |
CN108154172B CN108154172B (zh) | 2018-10-26 |
Family
ID=62464051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711390560.2A Active CN108154172B (zh) | 2017-12-21 | 2017-12-21 | 基于三支决策的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108154172B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543707A (zh) * | 2018-09-29 | 2019-03-29 | 南京航空航天大学 | 基于三支决策的半监督变更级软件缺陷预测方法 |
CN109816022A (zh) * | 2019-01-29 | 2019-05-28 | 重庆市地理信息中心 | 一种基于三支决策与cnn的图像识别方法 |
CN111046926A (zh) * | 2019-11-26 | 2020-04-21 | 山东浪潮人工智能研究院有限公司 | 一种计算机视觉图像分类集成学习方法 |
CN114416948A (zh) * | 2022-01-18 | 2022-04-29 | 重庆邮电大学 | 一种基于语义感知的一对多对话生成方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956428A (en) * | 1997-05-19 | 1999-09-21 | Ausbeck, Jr.; Paul James | Stroke code for image partitions |
CN106530298A (zh) * | 2016-11-14 | 2017-03-22 | 同济大学 | 一种基于三支决策的肝脏肿瘤ct图像分类方法 |
CN106599935A (zh) * | 2016-12-29 | 2017-04-26 | 重庆邮电大学 | 基于Spark大数据平台的三支决策不平衡数据过采样方法 |
CN106599924A (zh) * | 2016-12-16 | 2017-04-26 | 北京灵众博通科技有限公司 | 一种基于三支决策的分类器构建方法 |
CN107316036A (zh) * | 2017-06-09 | 2017-11-03 | 广州大学 | 一种基于级联分类器的害虫识别方法 |
CN107341447A (zh) * | 2017-06-13 | 2017-11-10 | 华南理工大学 | 一种基于深度卷积神经网络和证据k近邻的人脸核实方法 |
-
2017
- 2017-12-21 CN CN201711390560.2A patent/CN108154172B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956428A (en) * | 1997-05-19 | 1999-09-21 | Ausbeck, Jr.; Paul James | Stroke code for image partitions |
CN106530298A (zh) * | 2016-11-14 | 2017-03-22 | 同济大学 | 一种基于三支决策的肝脏肿瘤ct图像分类方法 |
CN106599924A (zh) * | 2016-12-16 | 2017-04-26 | 北京灵众博通科技有限公司 | 一种基于三支决策的分类器构建方法 |
CN106599935A (zh) * | 2016-12-29 | 2017-04-26 | 重庆邮电大学 | 基于Spark大数据平台的三支决策不平衡数据过采样方法 |
CN107316036A (zh) * | 2017-06-09 | 2017-11-03 | 广州大学 | 一种基于级联分类器的害虫识别方法 |
CN107341447A (zh) * | 2017-06-13 | 2017-11-10 | 华南理工大学 | 一种基于深度卷积神经网络和证据k近邻的人脸核实方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543707A (zh) * | 2018-09-29 | 2019-03-29 | 南京航空航天大学 | 基于三支决策的半监督变更级软件缺陷预测方法 |
CN109543707B (zh) * | 2018-09-29 | 2020-09-25 | 南京航空航天大学 | 基于三支决策的半监督变更级软件缺陷预测方法 |
CN109816022A (zh) * | 2019-01-29 | 2019-05-28 | 重庆市地理信息中心 | 一种基于三支决策与cnn的图像识别方法 |
CN111046926A (zh) * | 2019-11-26 | 2020-04-21 | 山东浪潮人工智能研究院有限公司 | 一种计算机视觉图像分类集成学习方法 |
CN111046926B (zh) * | 2019-11-26 | 2023-09-19 | 山东浪潮科学研究院有限公司 | 一种计算机视觉图像分类集成学习方法 |
CN114416948A (zh) * | 2022-01-18 | 2022-04-29 | 重庆邮电大学 | 一种基于语义感知的一对多对话生成方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108154172B (zh) | 2018-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108154172B (zh) | 基于三支决策的图像识别方法 | |
CN108960266A (zh) | 图像目标检测方法及装置 | |
CN104063683A (zh) | 一种基于人脸识别的表情输入方法和装置 | |
Jose et al. | A novel traffic sign recognition system combining viola–jones framework and deep learning | |
Velastin et al. | People detection and pose classification inside a moving train using computer vision | |
Saleh et al. | Traffic signs recognition and distance estimation using a monocular camera | |
Ketcham et al. | Recognizing the Illegal Parking Patterns of Cars on the Road in Front of the Bus Stop Using the Support Vector Machine | |
Yingthawornsuk et al. | Automatic Thai Coin Calculation System by Using SIFT | |
CN104794432A (zh) | 快速级联式车标视觉检测与识别方法和系统 | |
CN109816022A (zh) | 一种基于三支决策与cnn的图像识别方法 | |
Emami et al. | Real time vehicle make and model recognition based on hierarchical classification | |
Luo et al. | Rare bioparticle detection via deep metric learning | |
Miao et al. | Driver behavior extraction from videos in naturalistic driving datasets with 3D ConvNets | |
Laika et al. | A review of different object recognition methods for the application in driver assistance systems | |
Xing et al. | Scalable misbehavior detection in online video chat services | |
Kaja et al. | Two stage intelligent automotive system to detect and classify a traffic light | |
Ghomsheh et al. | A new skin detection approach for adult image identification | |
Purwar et al. | A Comprehensive Study on Traffic Sign Detection in ITS | |
Gupta et al. | A robust system to detect and explain public mask wearing behavior | |
Brown et al. | Tree-based vehicle color classification using spatial features on publicly available continuous data | |
Harini et al. | The Traffic Violation Detection System using YoloV7 | |
Wilkowski et al. | City Bus Monitoring Supported by Computer Vision and Machine Learning Algorithms | |
Yelure et al. | Solving Multi-Class Classification Problem Using Support Vector Machine | |
Hirata et al. | Separating Particles from Plankton Images | |
Ashwini et al. | Application of machine learning approach in detection and classification of cars of an image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |