CN108830302A - 一种图像分类方法、训练方法、分类预测方法及相关装置 - Google Patents

一种图像分类方法、训练方法、分类预测方法及相关装置 Download PDF

Info

Publication number
CN108830302A
CN108830302A CN201810523533.6A CN201810523533A CN108830302A CN 108830302 A CN108830302 A CN 108830302A CN 201810523533 A CN201810523533 A CN 201810523533A CN 108830302 A CN108830302 A CN 108830302A
Authority
CN
China
Prior art keywords
classification
decision tree
node
twsvm
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810523533.6A
Other languages
English (en)
Other versions
CN108830302B (zh
Inventor
窦清昀
张莉
王邦军
凌兴宏
姚望舒
张召
李凡长
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201810523533.6A priority Critical patent/CN108830302B/zh
Publication of CN108830302A publication Critical patent/CN108830302A/zh
Application granted granted Critical
Publication of CN108830302B publication Critical patent/CN108830302B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像分类方法,包括:对标准TWSVM算法进行预处理,得到预处理TWSVM算法;根据获取的训练数据集执行二叉决策树构造操作,根据预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个非叶子结点的决策函数;通过二叉决策树和决策函数对待测样本进行分类预测处理,得到分类结果。通过二叉决策树为基础拓展TWSVM算法,提高TWSVM算法处理多分类问题的效率,并且通过核聚类构造的二叉决策树提高了面对非线性问题时的准确率本申请还公开了一种图像分类的训练方法、分类预测方法、图像分类系统、图像分类装置以及计算机可读存储介质,具有以上有益效果。

Description

一种图像分类方法、训练方法、分类预测方法及相关装置
技术领域
本申请涉及机器学习技术领域,特别涉及一种图像分类方法、训练方法、分类预测方法、图像分类系统、图像分类装置以及计算机可读存储介质。
背景技术
随着技术的发展,计算机智能化程度越来越高。其中,计算机视觉就是计算机智能研究的一个主要方向。在计算机视觉中的一个核心问题就是对于图像的分类。具体的,图像分类就是对输入的图片抽象的描述,判定该图像数据是否为给定分类中的某一类。图像分类在实际操作中有非常多的应用场景,其它的一些计算机视觉问题,如物体的定位、图像分割等,都是基于图像分类来完成。并且,在信息时代海量的图片如果通过人工来打标签是不现实的,因此通过计算机的图像分类去处理图片标签问题是很重要的。
一般的,在一种现有技术中使用孪生支持向量机对图像进行识别,虽然使用孪生支持向量机进行图像识别,实现较为简单,但是在图像数据类别较多时,识别效率不高。而另一种现有技术中,通过决策树来实现对图像数据的分类识别。具体的,通过类间最大距离来生成决策树,并在非叶子结点上进行两分类。但是由于计算类间最大距离时采用的方法比较简单,在面对一些问题时可能得不到最优的决策树,尤其是在处理一些非线性问题上时。
因此,如何提高图像分类中多类别问题的处理效率,是本领域技术人员所关注的重点问题。
发明内容
本申请的目的是提供一种图像分类方法、训练方法、分类预测方法、图像分类系统、图像分类装置以及计算机可读存储介质,通过以二叉决策树的形式将多分类问题分解为多个二分类问题,再对每个二分类问题通过TWSVM算法进行训练处理得到决策函数,即以二叉决策树为基础拓展TWSVM算法,提高TWSVM算法处理多分类问题的效率,并且通过核聚类构造的二叉决策树提高了面对非线性问题时的准确率。
为解决上述技术问题,本申请提供一种图像分类方法,包括:
对标准TWSVM算法进行预处理,得到预处理TWSVM算法;
根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数;
通过所述二叉决策树和所述决策函数对待测样本进行分类预测处理,得到分类结果。
可选的,根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数,包括:
根据获取的所述训练数据集构造所述二叉决策树的根结点,从所述根结点开始通过核聚类处理得到多个结点,根据所有所述结点进行构造得到所述二叉决策树;其中,所述结点包括叶子结点和非叶子结点;
当每次得到新的非叶子结点时,根据所述非叶子结点的核聚类处理结果和所述预处理TWSVM算法进行训练处理,得到每个所述非叶子结点的决策函数。
可选的,根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数,包括:
根据获取的所述训练数据集进行核聚类二叉决策树构造处理,得到二叉决策树;
根据所述预处理TWSVM算法对所述二叉决策树中的每个非叶子结点进行训练处理,得到决策函数。
可选的,通过所述二叉决策树和所述决策函数对待测样本进行分类预测处理,得到分类结果,包括:
根据所述决策函数对所述待测样本分配所述二叉决策树中的结点;
当所述结点为叶子结点时,将所述叶子结点对应的类别作为所述分类结果。
本申请还提供一种图像分类的训练方法,包括:
对标准TWSVM算法进行预处理,得到预处理TWSVM算法;
根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数。
本申请还提供一种图像分类的分类预测方法,包括:
根据所述决策函数对所述待测样本分配所述二叉决策树中的结点;
当所述结点为叶子节点时,将所述叶子节点对应的类别作为所述分类结果。
本申请还提供一种图像分类系统,包括:
预处理模块,用于对标准TWSVM算法进行预处理,得到预处理TWSVM算法;
训练模块,用于根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数;
分类预测模块,用于通过所述二叉决策树和所述决策函数对待测样本进行分类预测处理,得到分类结果。
可选的,所述分类预测模块,包括:
结点分配单元,用于根据所述决策函数对所述待测样本分配所述二叉决策树中的结点;
分类结果获取单元,用于当所述结点为叶子结点时,将所述叶子结点对应的类别作为所述分类结果。
本申请还提供一种图像分类装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述的图像分类方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的图像分类方法的步骤。
本申请所提供的一种图像分类方法,包括:对标准TWSVM算法进行预处理,得到预处理TWSVM算法;根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数;通过所述二叉决策树和所述决策函数对待测样本进行分类预测处理,得到分类结果。
通过以二叉决策树的形式将多分类问题分解为多个二分类问题,再对每个二分类问题通过TWSVM算法进行训练处理得到决策函数,即以二叉决策树为基础拓展TWSVM算法,因此在训练过程和分类过程中通过二叉决策树的树形结构是逐级进行判断,例如当判断为左叶子时,就可以不判断右叶子的所有数据,因此可以减少将该算法进行判断的次数,提高TWSVM算法处理多分类问题的效率,同时提高整体的分类效率。并且通过核聚类构造的二叉决策树提高了面对非线性问题时的准确率,使效率和正确率之间形成了良好的平衡。
并且由于计算效率的提高,提高了计算机性能的利用率,也就是以更短的处理时间提高了计算机的性能。
本申请还提供一种图像分类的训练方法、分类预测方法、图像分类系统、图像分类装置以及计算机可读存储介质,具有以上有益效果,在此不做赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种图像分类方法的流程图;
图2为本申请实施例所提供的一种图像分类方法的训练过程的流程图;
图3为本申请实施例所提供的一种图像分类方法的另一种训练过程的流程图;
图4为本申请实施例所提供的一种图像分类系统的结构示意图。
具体实施方式
本申请的核心是提供一种图像分类方法、训练方法、分类预测方法、图像分类系统、图像分类装置以及计算机可读存储介质,通过以二叉决策树的形式将多分类问题分解为多个二分类问题,再对每个二分类问题通过TWSVM算法进行训练处理得到决策函数,即以二叉决策树为基础拓展TWSVM算法,提高TWSVM算法处理多分类问题的效率,并且通过核聚类构造的二叉决策树提高了面对非线性问题时的准确率。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种图像分类方法的流程图。
本实施例提供一种图像分类方法,可以提高多分类问题的处理效率,该方法可以包括:
S101,对标准TWSVM算法进行预处理,得到预处理TWSVM算法;
本实施例主要是对TWSVM算法进行拓展,其中TWSVM又叫做孪生支持向量机,是支持向量机的一种,是一种具有较高分类准确率的两分类算法。但是由于图像分类大多是多分类问题,因此本实施例的目的就是将TWSVM算法拓展到处理多分类问题。
具体的,本步骤旨在对标准的普通TWSVM算法进行预处理,得到预处理后的TWSVM,即预处理TWSVM算法。
具体的,所进行的预处理可以是设定正则参数,也可以是设定核参数,还可以将正则参数和核参数同时设定。当然,对TWSVM算法进行的预处理根据使用环境的不同是多种多样的,均是为了适应应用的环境,因此可以视具体的使用环境选择具体的预处理方式,在此不做具体限定。
S102,根据获取的训练数据集执行二叉决策树构造操作,根据预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个非叶子结点的决策函数;
在机器学习领域,一般是根据训练数据集进行训练得到相应的识别模型,再根据识别模型对测试数据或待测数据进行分类预测。因此在步骤S101的基础上,本步骤旨在根据训练数据集进行训练操作。
具体的,本步骤中是通过二叉决策树将具有多个分类的训练数据集拆分为多个二分类问题,也就是说,构造得到的二叉决策树中的每个非叶子结点代表了一个二分类问题。此时再利用TWSVM算法对二分类问题进行处理,就可以使TWSVM算法处理多分类问题,并且很好的利用了TWSVM算法在处理二分类问题时的优良特性,同时可以通过TWSVM算法对非线性问题进行最优解的处理。
进一步的,一般的在对TWSVM算法进行多分类问题拓展,训练出的决策算法需要判断多分类问题中的所有分类,甚至需要判断多个分类的组合形式,虽然可以使TWSVM算法处理多分类问题,但是由于判断需要全部遍历,因此判断次数会随着分类数量的增加而成倍的增加。例如,该数据一共有7个分类,而现有技术中就需要将这7个分类分类与剩余所有类的组合都进行判断,降低分类的效率。而本实施例中通过构造的二叉决策树可以有效的减少训练过程和分类过程中判断的次数,因为在训练过程和分类过程中是逐级进行判断,例如当判断为左叶子时,就可以不判断右叶子的所有数据,由此降低了判断次数。当所处理数据的分类不断增多,判断次数减少的就更加明显,因此提高了处理时的效率。
其中,二叉决策树与TWSVM算法的结合方式可以是先生成二叉决策树,再对二叉决策树中的每个节点通过TWSVM算法进行训练处理得到最后的决策函数。还可以是将构造二叉决策树的同时将每个结点通过TWSVM算法进行训练处理,也就是每构造出一个结点就通过TWSVM算法对其进行训练处理。进一步的,构造二叉决策树可以是深度优先也可以是广度优先,TWSVM算法的训练顺序也会随之而变,具体的应视实际情况而定,再次不做限定。
可选的,本步骤中的二叉决策树的构造方法可以是核聚类二叉决策树构造方法。
通过核聚类二叉决策树可以提高构造二叉决策树的聚类精度,并且决策函数的精度也会随着聚类精度的提高而提高,总的来说可以本实施例所提供的图像分类方法最后的分类精度。
需要说明的是,本实施例中由于二叉决策树构造后的分类情况是不含有标签的,通过TWSVM算法的决策函数就可以将标签显示出来,实现对数据的分类。
S103,通过二叉决策树和决策函数对待测样本进行分类预测处理,得到分类结果。
在步骤S102的基础上,本步骤旨在通过得到二叉决策树和决策函数对待测样本进行分类预测处理。
其中,待测样本由于本实施例方式的使用目的不同——直接进行分类还是进行测试判断其分类精度。据此,待测样本可以是实际的未分类的数据,也可以是已标记的测试数据集,具体的根据使用目的再做选择,在此不做限定。
在进行分类预测时,主要是通过决策函数和二叉决策树逐级进行判断,通过树形结构判断,就可以有效减少判断次数,提高整体的分类效率。
可选的,步骤S103可以包括:
步骤一、根据决策函数对待测样本分配二叉决策树中的结点;
步骤二、当结点为叶子结点时,将叶子结点对应的类别作为分类结果。
该可选方案具体可以如下:
对待测样本从根结点开始搜索构造好的二叉决策树。在当前结点上计算该结点上的决策函数,并根据决策函数的值决定样本被分配到哪个内部子结点上;重复这个过程,一直到样本被分配叶子结点上为止。叶子结点上的类别代表就为该样本的分类预测。
综上,本实施例通过将二叉决策树和TWSVM算法相结合,提高了算法处理多分类问题的效率,同时保证了面对不同分类问题时的准确率,也就是在效率和正确率之间形成了良好的平衡。
请参考图2,图2为本申请实施例所提供的一种图像分类方法的训练过程的流程图。
基于上一实施例,本实施例主要是针对上一实施例中如何进行训练过程的做的一个实施例,其他部分与上一实施例大体相同,相同部分可以参考上一实施例,在此不做赘述。
本实施例主要是介绍二叉决策树的构造过程和TWSVM算法的训练过程同时进行的技术方案。
具体的,本实施例可以包括:
S201,根据获取的训练数据集构造二叉决策树的根结点,从根结点开始通过核聚类处理得到多个结点,根据所有结点进行构造得到二叉决策树;其中,结点包括叶子结点和非叶子结点;
本步骤中主要旨在通过核聚类处理得到多个结点,并且根据得到的所有结点构造得到二叉决策树。本步骤实现了对二叉决策树的构造,并且使用核聚类处理方法,提高了分类结果的精度。
由于本步骤中所构造的是树形结构的,因此可以清楚的是核聚类处理的过程是逐级进行的,也就是从根结点核聚类处理得到两个结点,对每个结点进行核聚类处理得到更多的结点,以此类推直到所处理的结点所包含的类别数只有两类。结束后,就可以通过所有的结点构造得到二叉决策树。
S202,当每次得到新的非叶子结点时,根据非叶子结点的核聚类处理结果和预处理TWSVM算法进行训练处理,得到每个非叶子结点的决策函数。
因此在步骤S201逐级处理的基础上,本步骤旨在当每次核聚类处理得到新的非叶子结点时,对该非叶子结点进行训练处理得到对应的决策函数。也就是在步骤S201中对每个结点进行核聚类处理的同时进行TWSVM算法的训练处理,实现了二叉决策树和TWSVM算法的同时进行,也就是在本实施例执行的阶段(训练阶段)只需要对二叉决策树进行一遍遍历,缩短训练阶段的时间,提高整体的训练效率。
具体的,本实施例可以包括如下步骤:
S211,构造一个具有c-1个内部结点和c个叶子结点的二叉决策树,令t为当前内部结点的索引,t=1;
S212,如果t≤c-1,则执行S213;
S213,在当前内部结点t上,统计训练数据集的类别数c';
S214,如果c'>2,执行如下步骤:
I、运用核聚类算法把c'类数据集的类中心进行聚类,聚为2类,从而把该结点上的训练数据集的数据划分为2类;
II、训练TWSVM算法,获得并保存该结点的决策函数;
III、令t=t+1并返回S212;
S215,如果c'=2,训练TWSVM算法,获得并保存该结点的决策函数,令t=t+1返回S212。
其中,t为二叉决策树中的内部结点的序号。
通过以上具体步骤就可以实现将二叉决策树的构造和训练处理同时进行的技术方案,因此只需要进行一次遍历就可以完成训练,缩短了训练阶段的用时,提高了整体的效率。
请参考图3,图3为本申请实施例所提供的一种图像分类方法的另一种训练过程的流程图。
基于上一实施例,本实施例主要是针对上一实施例中如何进行训练过程的做的另一个实施例,其他部分与上一实施例大体相同,相同部分可以参考上一实施例,在此不做赘述。
本实施例主要是介绍二叉决策树的构造过程和TWSVM算法的训练过程分别进行的技术方案。
具体的,本实施例可以包括:
S301,根据获取的训练数据集进行核聚类二叉决策树构造处理,得到二叉决策树;
S302,根据预处理TWSVM算法对二叉决策树中的每个非叶子结点进行训练处理,得到决策函数。
本实施例所提供的方法通过核聚类二叉决策树进行构造处理,得到二叉决策树。其中所使用的核聚类方法与上一实施例中提到的核聚类处理相同,只是应用情况不同。再根据预处理TWSVM算法对每个非叶子结点进行训练处理,得到决策函数。
本申请实施例提供了一种图像分类方法,可以通过以二叉决策树的形式将多分类问题分解为多个二分类问题,再对每个二分类问题通过TWSVM算法进行训练处理得到决策函数,即以二叉决策树为基础拓展TWSVM算法,可以减少将该算法进行判断的次数,提高TWSVM算法处理多分类问题的效率,同时提高整体的分类效率。并且通过核聚类构造的二叉决策树提高了面对非线性问题时的准确率,使效率和正确率之间形成了良好的平衡。
本申请实施例还提供了一种图像分类的训练方法,可以包括:
对标准TWSVM算法进行预处理,得到预处理TWSVM算法;
根据获取的训练数据集执行二叉决策树构造操作,根据预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个非叶子结点的决策函数。
具体的内容说明与上述实施例大体相同,在此不做赘述。通过本实施例训练到的决策函数可以使处理多分类问题中的效率和准确率更加均衡。
本申请实施例还提供了一种图像分类的分类预测方法,可以包括:
根据决策函数对待测样本分配二叉决策树中的结点;
当结点为叶子节点时,将叶子节点对应的类别作为分类结果。
具体的内容说明与上述实施例大体相同,在此不做赘述。通过本实施例的分类预测方法可以使处理多分类问题中的效率和准确率更加均衡。
下面对本申请实施例提供的一种图像分类系统进行介绍,下文描述的一种图像分类系统与上文描述的一种图像分类方法可相互对应参照。
请参考图4,图4为本申请实施例所提供的一种图像分类系统的结构示意图。
本实施例提供一种图像分类系统,可以包括:
预处理模块100,用于对标准TWSVM算法进行预处理,得到预处理TWSVM算法;
训练模块200,用于根据获取的训练数据集执行二叉决策树构造操作,根据预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个非叶子结点的决策函数;
分类预测模块300,用于通过二叉决策树和决策函数对待测样本进行分类预测处理,得到分类结果。
该分类预测模块300,可以包括:
结点分配单元,用于根据决策函数对待测样本分配二叉决策树中的结点;
分类结果获取单元,用于当结点为叶子结点时,将叶子结点对应的类别作为分类结果。
本申请实施例还提供一种图像分类装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述实施例的图像分类方法的步骤。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述实施例的图像分类方法的步骤。
基于以上实施例还可以如下具体实施例方式和过程:
可以使用下载的数据集,该数据集有2310个样本,每个样本有19个特征,是从一个包含7种户外数据的数据集里随机选取的,共7类:砖面、天空、叶子、水泥、窗户、路和草,每种330个样本。其中,210个样本用于训练,每类各30个,其余2100个样本用于测试,每类各300个。
具体实施步骤如下:
1、训练模块:
(1)输入多类数据集{(x1,v1),...,(xm,vm)},其中m代表样本总数,若(xi,vi)指代第i个样本,则其中xi∈Rn,n表示图像数据的特征数量,vi代表该样本所属类别,设该数据集有c个类,则vi∈{1,2,…,c}。在本实施例中,m=210,n=19,c=7。
(2)设定TWSVM的正则参数和核参数;
(3)构造一个具有c-1个内部节点和c个叶节点的二叉决策树:
令t为当前内部结点的索引,t=1;从根结点开始,重复下述流程直至所有的内部节点都被遍历过;
a)如果t≤c-1,执行下面的操作
b)在当前内部结点t上,统计样本集的类别数c';
c)如果c'>2,执行如下操作:
i.运用核聚类算法把c'类数据集的类中心进行聚类,聚为2类,从而把该结点上的数据划分为2类;
ii.训练标准的TWSVM算法,获得并保存该结点的决策函数;
iii.令t=t+1并返回a);
(4)如果c'=2,训练标准的TWSVM,获得并保存该结点的决策函数;令t=t+1并返回a);
在本实例中,训练样本有210个,核函数采用高斯核函数:
k(xi,xj)=exp(-||xi-xj||2/2σ2)
TWSVM的正则化参数运用交叉验证的方法选取自2-5到24
2、分类模块
对待测样本x∈Rn,从根结点开始搜索构造好的二叉决策树。在当前结点上计算该结点上的决策函数,并根据决策函数的值决定样本被分配到哪个内部子结点上;重复这个过程,一直到样本被分配叶子结点上为止。叶子结点上的类别代表就为该样本的分类预测。在本实施例中,待测样本有2100个,要重复分类模块2100次。
表1对比了几种多分类TWSVM在本实施例中的分类准确率,对比方法为:多类孪生支持向量机(Multi-TWSVM)、类间距离最大化决策树孪生支持向量机(DTTSVM)以及本发明。由表格可知,本发明取得了较高的分类准确率,也证明本发明生成了更优的二叉决策树。
表1算法准确率比较表
算法 准确率(%)
Multi-TWSVM 86.81
DTTSVM 85.95
本申请实施例的算法 88.86
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种图像分类方法、训练方法、分类预测方法、图像分类系统、图像分类装置以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (10)

1.一种图像分类方法,其特征在于,包括:
对标准TWSVM算法进行预处理,得到预处理TWSVM算法;
根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数;
通过所述二叉决策树和所述决策函数对待测样本进行分类预测处理,得到分类结果。
2.根据权利要求1所述的图像分类方法,其特征在于,根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数,包括:
根据获取的所述训练数据集构造所述二叉决策树的根结点,从所述根结点开始通过核聚类处理得到多个结点,根据所有所述结点进行构造得到所述二叉决策树;其中,所述结点包括叶子结点和非叶子结点;
当每次得到新的非叶子结点时,根据所述非叶子结点的核聚类处理结果和所述预处理TWSVM算法进行训练处理,得到每个所述非叶子结点的决策函数。
3.根据权利要求1所述的图像分类方法,其特征在于,根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数,包括:
根据获取的所述训练数据集进行核聚类二叉决策树构造处理,得到二叉决策树;
根据所述预处理TWSVM算法对所述二叉决策树中的每个非叶子结点进行训练处理,得到决策函数。
4.根据权利要求1至3任一项所述的图像分类方法,其特征在于,通过所述二叉决策树和所述决策函数对待测样本进行分类预测处理,得到分类结果,包括:
根据所述决策函数对所述待测样本分配所述二叉决策树中的结点;
当所述结点为叶子结点时,将所述叶子结点对应的类别作为所述分类结果。
5.一种图像分类的训练方法,其特征在于,包括:
对标准TWSVM算法进行预处理,得到预处理TWSVM算法;
根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数。
6.一种图像分类的分类预测方法,其特征在于,包括:
根据所述决策函数对所述待测样本分配所述二叉决策树中的结点;
当所述结点为叶子节点时,将所述叶子节点对应的类别作为所述分类结果。
7.一种图像分类系统,其特征在于,包括:
预处理模块,用于对标准TWSVM算法进行预处理,得到预处理TWSVM算法;
训练模块,用于根据获取的训练数据集执行二叉决策树构造操作,根据所述预处理TWSVM算法和构造得到的二叉决策树中的非叶子结点进行训练处理,得到每个所述非叶子结点的决策函数;
分类预测模块,用于通过所述二叉决策树和所述决策函数对待测样本进行分类预测处理,得到分类结果。
8.根据权利要求7所述的图像分类系统,其特征在于,所述分类预测模块,包括:
结点分配单元,用于根据所述决策函数对所述待测样本分配所述二叉决策树中的结点;
分类结果获取单元,用于当所述结点为叶子结点时,将所述叶子结点对应的类别作为所述分类结果。
9.一种图像分类装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述的图像分类方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的图像分类方法的步骤。
CN201810523533.6A 2018-05-28 2018-05-28 一种图像分类方法、训练方法、分类预测方法及相关装置 Active CN108830302B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810523533.6A CN108830302B (zh) 2018-05-28 2018-05-28 一种图像分类方法、训练方法、分类预测方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810523533.6A CN108830302B (zh) 2018-05-28 2018-05-28 一种图像分类方法、训练方法、分类预测方法及相关装置

Publications (2)

Publication Number Publication Date
CN108830302A true CN108830302A (zh) 2018-11-16
CN108830302B CN108830302B (zh) 2022-06-07

Family

ID=64146215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810523533.6A Active CN108830302B (zh) 2018-05-28 2018-05-28 一种图像分类方法、训练方法、分类预测方法及相关装置

Country Status (1)

Country Link
CN (1) CN108830302B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991551A (zh) * 2019-12-13 2020-04-10 北京百度网讯科技有限公司 样本处理方法、装置、电子设备和存储介质
CN111080524A (zh) * 2019-12-19 2020-04-28 吉林农业大学 基于深度学习的植物病虫害识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090222389A1 (en) * 2008-02-29 2009-09-03 International Business Machines Corporation Change analysis system, method and program
CN102722726A (zh) * 2012-06-05 2012-10-10 江苏省电力公司南京供电公司 一种基于动态二叉树的svm多分类方法
CN107729876A (zh) * 2017-11-09 2018-02-23 重庆医科大学 基于计算机视觉的老人室内跌倒检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090222389A1 (en) * 2008-02-29 2009-09-03 International Business Machines Corporation Change analysis system, method and program
CN102722726A (zh) * 2012-06-05 2012-10-10 江苏省电力公司南京供电公司 一种基于动态二叉树的svm多分类方法
CN107729876A (zh) * 2017-11-09 2018-02-23 重庆医科大学 基于计算机视觉的老人室内跌倒检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUAN-HAI SHAO ET AL.: "The best separating decision tree twin support vector machine formulti-class classification", 《PROCEDIA COMPUTER SCIENCE 17(2013)》 *
李桂林 等.: "基于二次特征选择和支持向量机的面部表情识别", 《电脑知识与技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991551A (zh) * 2019-12-13 2020-04-10 北京百度网讯科技有限公司 样本处理方法、装置、电子设备和存储介质
CN110991551B (zh) * 2019-12-13 2023-09-15 北京百度网讯科技有限公司 样本处理方法、装置、电子设备和存储介质
CN111080524A (zh) * 2019-12-19 2020-04-28 吉林农业大学 基于深度学习的植物病虫害识别方法

Also Published As

Publication number Publication date
CN108830302B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
CN110046249A (zh) 胶囊网络的训练方法、分类方法、系统、设备及存储介质
CN109948160B (zh) 短文本分类方法及装置
CN106897262A (zh) 一种文本分类方法和装置以及处理方法和装置
CN111460250A (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN113435998B (zh) 贷款逾期预测方法、装置、电子设备及存储介质
CN112215696A (zh) 基于时序归因分析的个人信用评估与解释方法、装置、设备及存储介质
US20180314984A1 (en) Retraining a machine classifier based on audited issue data
CN112100377A (zh) 文本分类方法、装置、计算机设备和存储介质
CN103389995B (zh) 一种垃圾内容识别方法及装置
Taesiri et al. Visual correspondence-based explanations improve AI robustness and human-AI team accuracy
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
Mittal et al. A COMPARATIVE STUDY OF ASSOCIATION RULE MINING TECHNIQUES AND PREDICTIVE MINING APPROACHES FOR ASSOCIATION CLASSIFICATION.
CN108830302A (zh) 一种图像分类方法、训练方法、分类预测方法及相关装置
CN114529351A (zh) 一种商品类目预测方法、装置、设备及存储介质
CN113705215A (zh) 一种基于元学习的大规模多标签文本分类方法
KR20200082490A (ko) 기계 학습 데이터 선택 방법 및 장치
CN111666748B (zh) 一种自动化分类器的构造方法以及识别决策的方法
CN113095511A (zh) 一种在自动化主站实现操作到位的判断方法及装置
CN113704389A (zh) 一种数据评估方法、装置、计算机设备及存储介质
CN116226747A (zh) 数据分类模型的训练方法、数据分类方法和电子设备
CN111046934B (zh) 一种swift报文软条款识别方法及装置
US10510013B2 (en) Mixed proposal based model training system
CN110968685B (zh) 商品名称的归集方法和装置
Guo et al. A novel margin-based measure for directed hill climbing ensemble pruning
CN114091595A (zh) 样本处理方法、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant