CN105718937B - 多类别对象分类方法及系统 - Google Patents

多类别对象分类方法及系统 Download PDF

Info

Publication number
CN105718937B
CN105718937B CN201410724928.4A CN201410724928A CN105718937B CN 105718937 B CN105718937 B CN 105718937B CN 201410724928 A CN201410724928 A CN 201410724928A CN 105718937 B CN105718937 B CN 105718937B
Authority
CN
China
Prior art keywords
image
classification
classifier
parameter area
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410724928.4A
Other languages
English (en)
Other versions
CN105718937A (zh
Inventor
陈彦霖
江川彦
余兆伟
蔡岳廷
李孟灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute for Information Industry
Original Assignee
Institute for Information Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute for Information Industry filed Critical Institute for Information Industry
Priority to CN201410724928.4A priority Critical patent/CN105718937B/zh
Priority to US14/562,787 priority patent/US9361544B1/en
Priority to TW104101625A priority patent/TWI567660B/zh
Publication of CN105718937A publication Critical patent/CN105718937A/zh
Application granted granted Critical
Publication of CN105718937B publication Critical patent/CN105718937B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2451Classification techniques relating to the decision surface linear, e.g. hyperplane
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/20Linear translation of a whole image or part thereof, e.g. panning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种多类别对象分类方法及系统在此揭露,其中多类别对象分类方法包含以下步骤:接收并储存类别、第一训练影像与第二训练影像,并从对应类别的第一、第二训练影像中分别撷取第一、第二特征影像;利用第一特征影像,透过线性映射分类方法,产生对应类别的分类器;利用分类器与第二特征影像,决定对应所述多个类别的参数范围与对应该分类器的门槛值。当二参数范围重叠时,记录除了二参数范围以外的余留参数范围;由分类器当中选取除了已选取过的分类器以外的另一分类器后,重复执行前一步骤直到参数范围彼此无重叠并记录参数范围。本发明得以透过记录不同类别的参数范围,以较少的步骤达到分类效果,进而提升多类别对象分类效率。

Description

多类别对象分类方法及系统
技术领域
本发明是一种分类技术,且特别是有关于一种多类别对象分类方法及系统。
背景技术
已知的人工智能或计算机视觉在图形识别的应用领域中,欲进行多类别对象(Multi-class object)分类常采用直接进行多类别分类,或者利用二元分类法,将多类别分类拆解成数个二分类问题以进行解决。直接进行多类别分类例如提升(Boosting)演算法,透过分析所有的输入影像的代表点,以多阶段投票的方式逐步进行目标对象的分类,所涉及的计算复杂度较高、花费时间较长,而且准确率亦较低,并非良好的解决方法;然而,二元分类法则是时常面临到的问题则是待处理的影像特征点过多,以及当影像当中的不同对象之间距离较为接近时,对于多类别分类的计算时间过长,尚有改进空间。另外,传统二元分类法在最佳情况下透过单次分类过程仅可区分出一个单一类别;如果类别数量庞大,分类过程的次数也必须增加以区分出每个不同类别,导致较低的分类效率。
发明内容
为了提升二元分类法对于多类别对象的分类效率,本发明的一方面是提供一种多类别对象分类方法,其包含以下步骤:(a)接收并储存多个类别、多个第一训练影像与多个第二训练影像,并从所述多个第一训练影像中撷取多个第一特征影像;利用所述多个第一特征影像,透过一线性映射分类方法,产生对应所述多个类别的多个分类器,其中所述多个第一训练影像与所述多个第二训练影像分别对应所述多个类别;(b)从所述多个第二训练影像中撷取多个第二特征影像,并从所述多个分类器中选取一分类器;(c)利用该分类器与所述多个第二特征影像,决定对应所述多个类别的多个参数范围与对应该分类器的一门槛值;(d)当所述多个参数范围当中的二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由所述多个分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠;(e)当所述多个参数范围彼此无重叠时,记录所述多个参数范围;(f)接收并储存一待决影像,并从该待决影像中撷取一待决特征影像;利用一分类器与该待决特征影像,决定一待决参数;(g)当该待决参数大于对应该分类器的该门槛值时,将该待决影像分类至对应该分类器的该类别;(h)当该待决参数位于所述多个参数范围中的某个参数范围之内时,将该待决影像分类至该某个参数范围对应的类别。
本发明的一实施例中,其中步骤(a)包含:将所述多个第一特征影像分割为多个特征区块,并计算所述多个特征区块的多个变异数;依递减顺序,由所述多个变异数的最大值开始选取多个特征变异数与对应于所述多个特征变异数的多个特征区块;利用所述多个特征区块,透过该线性映射分类方法,产生对应所述多个类别的多个分类器。
本发明的一实施例中,其中该线性映射分类方法为支持向量机(Support VectorMachine,SVM)演算法,所述多个参数范围与该门槛值均介于-1至1之间。
本发明的一实施例中,其中步骤(a)、(b)、(f)包含:透过方向梯度直方图(Histogram of Oriented Gradients,HOG)从所述多个第一训练影像中撷取所述多个第一特征影像;透过方向梯度直方图从所述多个第二训练影像中撷取所述多个第二特征影像;透过方向梯度直方图从该待决影像中撷取该待决特征影像。
本发明的一实施例中,其中步骤(d)包含:当该二参数范围重叠时,记录除了该二参数范围以外的该余留参数范围,并且自对应该二参数范围的二分类器中选取一者作为该另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠。
本发明的一实施例中,所述多个第一训练影像包含多个正样本影像与多个负样本影像;所述多个正样本影像当中具有分别对应所述多个类别的一对象,所述多个负样本影像当中缺少分别对应所述多个类别的该对象。
本发明的另一方面是提供一种多类别对象分类系统,其包含输入装置、数据库与处理器,其中该数据库耦接该输入单元,而且该处理器耦接该数据库。输入单元接收多个类别、多个第一训练影像、多个第二训练影像与一待决影像,其中所述多个第一训练影像与所述多个第二训练影像分别对应所述多个类别。数据库储存所述多个类别、所述多个第一训练影像、所述多个第二训练影像与该待决影像。处理器执行下列步骤:(a)从所述多个第一训练影像中撷取多个第一特征影像;利用所述多个第一特征影像,透过一线性映射分类方法,产生对应所述多个类别的多个分类器;(b)从所述多个第二训练影像中撷取多个第二特征影像,并从所述多个分类器中选取一分类器;(c)利用该分类器与所述多个第二特征影像,决定对应所述多个类别的多个参数范围与对应该分类器的一门槛值;(d)当所述多个参数范围当中的二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由所述多个分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠;(e)当所述多个参数范围彼此无重叠时,记录所述多个参数范围;(f)从该待决影像中撷取一待决特征影像;利用一分类器与该待决特征影像,决定一待决参数;(g)当该待决参数大于对应该分类器的该门槛值时,将该待决影像分类至对应该分类器的该类别;以及(h)当该待决参数位于所述多个参数范围中的某个参数范围之内时,将该待决影像分类至该某个参数范围对应的类别。
本发明的一实施例中,其中该处理器将所述多个第一特征影像分割为多个特征区块,并计算所述多个特征区块的多个变异数;依递减顺序,由所述多个变异数的最大值开始选取多个特征变异数与对应于所述多个特征变异数的多个特征区块;利用所述多个特征区块,透过该线性映射分类方法,产生对应所述多个类别的多个分类器。
本发明的一实施例中,其中该线性映射分类方法为支持向量机演算法,所述多个参数范围与该门槛值均介于-1至1之间。
本发明的一实施例中,其中该处理器透过方向梯度直方图从所述多个第一训练影像中撷取所述多个第一特征影像;透过方向梯度直方图从所述多个第二训练影像中撷取所述多个第二特征影像;透过方向梯度直方图从该待决影像中撷取该待决特征影像。
本发明的一实施例中,其中该处理器当该二参数范围重叠时,记录除了该二参数范围以外的该余留参数范围,并且自对应该二参数范围的二分类器中选取一者作为该另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠。
本发明的一实施例中,其中所述多个第一训练影像包含多个正样本影像与多个负样本影像;所述多个正样本影像当中具有分别对应所述多个类别的一对象,所述多个负样本影像当中缺少分别对应所述多个类别的该对象。
综上所述,本发明是以提升二元分类法对于多类别对象分类的效率为出发点,利用记录不同类别的训练影像与其中一类别的分类器透过线性映射方法所产生的参数范围,得以较少的分类步骤达到多类别对象的分类效果;此外,利用划分特征影像为影像区块并选取变异数较大的影像区块作为代表,透过线性映射分类方法以产生分类器可大幅降低待处理的样本数量,节省运算时间,明显提升多类别对象分类的效率。
以下将以实施方式对上述的说明作详细的描述,并对本发明的技术方案提供更进一步的解释。
附图说明
为让本发明的上述和其他目的、特征、优点与实施例能更明显易懂,所附附图的说明如下:
图1A~1B是说明本发明第一实施例的多类别对象分类方法流程图;
图2是说明分别对应类别A~D的第二训练影像与分类器A的参数所决定的参数范围示意图;
图3是说明分别对应类别A~D的第二训练影像与分类器B的参数所决定的参数范围示意图;以及
图4是说明本发明第二实施例的多类别对象分类系统示意图。
具体实施方式
为了使本发明的叙述更加详尽与完备,可参照附图及以下所述的各种实施例。但所提供的实施例并非用以限制本发明所涵盖的范围;步骤的描述亦非用以限制其执行的顺序,任何由重新组合,所产生具有均等功效的装置,皆为本发明所涵盖的范围。
如图1A~1B所示,其是绘示本发明的第一实施例的多类别对象分类方法100,图1A与图1B以A点作为步骤之间的连接点。多类别对象分类方法100可应用于如图4所示的多类别对象分类系统400中。然熟悉本案的技艺者应了解到,在本实施方式中所提及的步骤,除特别叙明其顺序者外,均可依实际需要调整其前后顺序,甚至可同时或部分同时执行。
首先,于步骤S102,接收并储存使用者定义的多个类别、多个第一训练影像与多个第二训练影像;其中这些第一训练影像与这些第二训练影像均分别对应这些类别。举例而言,使用者可定义类别A、B、C、D,每个类别分别具有对应的多个第一训练影像与多个第二训练影像。从这些第一训练影像中撷取多个第一特征影像以进行第一训练阶段并产生多个分类器;其中第一训练过程使用线性映射分类方法,而且分类器数目与类别数目相等。本实施例中,产生的分类器为对应于类别A~D的分类器A~D,分类器具有分类出对应类别以及非对应类别的功能。举例而言,分类器A可用以分出类别A与非类别A,以此类推。具体而言,线性映射分类方法可为支持向量机演算法、费雪线性判别分析(Fisher's LinearDiscriminant)、单纯贝氏分类器(Naive Bayes classifier)。
接着,于步骤S104中,从这些第二训练影像中撷取多个第二特征影像,并从这些分类器中选取一分类器以进行第二训练阶段。于步骤S106中,利用该分类器与这些第二特征影像,决定对应这些类别的多个参数范围与对应该分类器的一门槛值;举例而言,这些参数范围与该门槛值均介于-1至1之间。可依需求定义门槛值作为分类为该类别的标准;举例而言,分类器A的门槛值定义为0.8,当一参数大于0.8时判断为类别A;当一参数小于0.8时判断为非类别A。
上述的参数范围乃透过一类别的多个第二特征影像的特征值与该分类器的参数值所计算出的多个参数所决定。计算公式如下:
上述的公式中:Si为第二特征影像的特征值,Vi、αi、ρ均为所选取分类器的参数值,Sum即为计算出的参数。因此,多个第二特征影像将计算出多个参数,形成一个参数范围。透过上述公式,利用对应多个类别的多个第二特征影像的特征值与一分类器内的参数值产生多个对应这些类别的参数范围。如图2所示,这些参数范围与这些类别具有对应关系,其中与该分类器对应同一类别的参数范围最接近1。
步骤S108中,检查这些参数范围是否重叠;当这些参数范围当中的二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由这些分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行步骤S106直到这些参数范围彼此无重叠(步骤S110);当这些参数范围彼此无重叠时,记录这些参数范围(步骤S112)。举例而言,图2为分别对应类别A~D的第二训练影像与分类器A的参数所决定的参数范围示意图。对应类别A的参数范围202位于门槛值与1之间,对应类别B~D的参数范围204~208则位于-1与门槛值之间。对应类别B的参数范围204与对应类别C的参数范围206重叠,表示分类器A无法适当分辨出类别B与类别C;因此,记录可辨别的对应类别A的参数范围202与对应类别D的参数范围208,并且重新选取除了分类器A以外的分类器B~D其中一者,重复步骤S106直到所有对应类别的参数范围均不重叠,并记录下无重叠的参数范围。举例而言,图3为分别对应类别A~D的第二训练影像与分类器B的参数所决定的参数范围示意图,所有参数范围302~308均未重叠;因此,记录参数范围的后的分类器B具有分类出类别A~D的功能。由此可知,经过记录参数范围的后的分类器A~D其中任一者均具有分类出类别A~D的潜力,相较于第一训练阶段产生的分类器,具有显著提升的分类功能。
步骤S114开始为侦测阶段,接收并储存待决影像,并从待决影像中撷取待决特征影像;利用分类器与待决特征影像,决定待决参数;步骤S116中,检查该待决参数是否大于对应分类器的门槛值;当该待决参数大于对应分类器的门槛值时,将待决影像分类至对应分类器的该类别(步骤S118);当该待决参数小于对应分类器的门槛值时,于步骤S120中,检查待决参数是否位于对应类别的参数范围之内;当待决参数位于这些参数范围之内时,将该待决影像分类至对应这些参数范围的这些类别。举例而言,利用分类器A的参数值与待决特征影像,透过上述公式决定待决参数。当待决参数大于分类器A的门槛值时,将待决影像分类至类别A;或者,当待决参数小于分类器A的门槛值,并且位于类别B的参数范围内时,将待决影像分类至类别B;或者,当待决参数小于分类器A的门槛值,并且位于类别C的参数范围内时,则将待决影像分类至类别C。综上所述,经过记录对应类别A~D的参数范围后的分类器A~D,除了可分辨出分类器所对应类别之外,同时具有分辨其他类别的功能,因此可达成步骤较少、效率较高的多类别对象分类。
为减少产生分类器的影像样本数目,于一实施例中,将上述的第一训练影像分割为多个特征区块,并计算这些特征区块的多个变异数。依递减顺序,由这些变异数的最大值开始选取多个特征变异数与对应于这些特征变异数的多个特征区块。选取变异数大的数个特征区块以代表该张影像,接者利用这些特征区块,透过该线性映射分类方法,产生对应这些类别的多个分类器。所选取特征区块的数目可依需求弹性调整,可显著减少产生分类器所需的样本数目,进而提升运行效率。
再者,于一实施例中,线性映射分类方法为支持向量机演算法。将对应类别的第一训练影像输入支持向量机演算法以决定可分类出对应类别以及非对应类别功能的超平面(hyperplane),进而产生对应类别的分类器。
或者,于一实施例中,透过方向梯度直方图以撷取特征影像;亦即,透过方向梯度直方图分别从这些第一训练影像、这些第二训练影像与待决影像中分别撷取出这些第一特征影像、这些第二特征影像与该待决特征影像。
再者,于一实施例中,当该二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由对应该二参数范围的这些分类器当中选取一分类器后,重复执行步骤S106直到这些参数范围彼此无重叠。举例而言,如图2所示,对应类别A的参数范围202位于门槛值与1之间,对应类别B~D的参数范围则位于-1与门槛值之间。当对应类别B的参数范围204与对应类别C的参数范围206重叠时,表示分类器A无法适当分辨出类别B与类别C;因此,记录可辨别的对应类别A的参数范围202与对应类别D的参数范围208,并且重新选取分类器B、C其中一者,重复步骤S106直到所有对应类别的参数范围均不重叠,并记录下无重叠的参数范围。直接从参数范围重叠的分类器B、C当中选取,以较快找出可分辨类别B、C的分类器。
再者,于一实施例中,这些第一训练影像包含多个正样本影像与多个负样本影像;这些正样本影像当中具有分别对应这些类别的一对象,这些负样本影像当中缺少分别对应这些类别的该对象。举例而言,产生分类器A的流程中,将具有类别A的对象的影像作为正样本影像,将缺少类别A的对象的影像作为负样本影像;因此,仅具有类别B~D的影像亦可作为负样本影像以产生分类器A。透过输入正样本影像与负样本影像至线性映射分类法,以提升所产生的分类器的识别功能。
请参考图4,其是绘示本发明的第二实施例的多类别对象分类系统400。多类别对象分类系统400包含输入装置410、数据库420与处理器430。实作上,输入装置410可为传输端口(USB、GPIB或其他接口)。数据库420可为硬盘、快闪记忆体或其他储存媒介;处理器430可为中央处理器、微控制器或其他电路。
首先,输入装置410接收并储存使用者定义的多个类别442、多个第一训练影像444与多个第二训练影像446于数据库420内;其中这些第一训练影像444与这些第二训练影像446均分别对应这些类别442。举例而言,使用者可定义类别A、B、C、D,每个类别分别具有对应的多个第一训练影像444与多个第二训练影像446。从这些第一训练影像444中撷取多个第一特征影像以进行第一训练阶段并产生多个分类器;其中第一训练过程使用线性映射分类方法,而且分类器数目与类别442数目相等。本实施例中,产生的分类器为对应于类别A~D的分类器A~D,分类器具有分类出对应类别以及非对应类别的功能。举例而言,分类器A可用以分出类别A与非类别A,以此类推。具体而言,线性映射分类方法可为支持向量机演算法、费雪线性判别分析、单纯贝氏分类器。
接着,处理器430从这些第二训练影像446中撷取多个第二特征影像,并从这些分类器中选取一分类器以进行第二训练阶段。处理器430利用该分类器与这些第二特征影像,决定对应这些类别442的多个参数范围与对应该分类器的一门槛值;举例而言,这些参数范围与该门槛值均介于-1至1之间。可依需求定义门槛值作为分类为该类别的标准;举例而言,分类器A的门槛值定义为0.8,当一参数大于0.8时判断为类别A;当一参数小于0.8时判断为非类别A。
上述的参数范围乃处理器430透过一类别的多个第二特征影像的特征值与该分类器的参数值所计算出的多个参数所决定。计算公式如下:
上述的公式中:Si为第二特征影像的特征值,Vi、αi、ρ均为所选取分类器的参数值,Sum即为计算出的参数。因此,多个第二特征影像将计算出多个参数,形成一个参数范围。透过上述公式,处理器430利用对应多个类别442的多个第二特征影像的特征值与一分类器内的参数值产生多个对应这些类别442的参数范围。如图2所示,这些参数范围与这些类别442具有对应关系,其中与该分类器对应同一类别的参数范围最接近1。
接着,处理器430检查这些参数范围是否重叠;当这些参数范围当中的二参数范围重叠时,处理器430记录除了该二参数范围以外的余留参数范围,并且由这些分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行直到这些参数范围彼此无重叠;当这些参数范围彼此无重叠时,处理器430记录这些参数范围。举例而言,图2为分别对应类别A~D的第二训练影像与分类器A的参数所决定的参数范围示意图。对应类别A的参数范围202位于门槛值与1之间,对应类别B~D的参数范围204~208则位于-1与门槛值之间。对应类别B的参数范围204与对应类别C的参数范围206重叠,表示分类器A无法适当分辨出类别B与类别C;因此,处理器430记录可辨别的对应类别A的参数范围202与对应类别D的参数范围208,并且重新选取除了分类器A以外的分类器B~D其中一者,重复执行直到所有对应类别442的参数范围均不重叠,并记录无重叠的参数范围。举例而言,图3为分别对应类别A~D的第二训练影像与分类器B的参数所决定的参数范围示意图,所有参数范围302~308均未重叠;因此,处理器430记录参数范围的后的分类器B具有分类出类别A~D的功能。由此可知,经过记录参数范围的后的分类器A~D其中任一者均具有分类出类别A~D的潜力,相较于第一训练阶段产生的分类器,具有显著提升的分类功能。
处理器430接收并储存待决影像448于数据库420内,并从待决影像448中撷取待决特征影像;利用分类器与待决特征影像,决定待决参数。处理器430检查该待决参数是否大于对应分类器的门槛值;当该待决参数大于对应分类器的门槛值时,处理器430将待决影像448分类至对应分类器的该类别;当该待决参数小于对应分类器的门槛值时,处理器430检查待决参数是否位于对应类别442的参数范围之内;当待决参数位于这些参数范围之内时,处理器430将该待决影像448分类至对应这些参数范围的这些类别442。举例而言,处理器430利用分类器A的参数值与待决特征影像,透过上述公式决定待决参数。当待决参数大于分类器A的门槛值时,处理器430将待决影像448分类至类别A;或者,当待决参数小于分类器A的门槛值,并且位于类别B的参数范围内时,处理器430将待决影像448分类至类别B;或者,当待决参数小于分类器A的门槛值,并且位于类别C的参数范围内时,处理器430则将待决影像448分类至类别C。综上所述,经过记录对应类别A~D的参数范围后的分类器A~D,除了可分辨出分类器所对应类别之外,同时具有分辨其他类别的功能,因此可达成步骤较少、效率较高的多类别对象分类。
为减少产生分类器的影像样本数目,于一实施例中,处理器430将上述的第一训练影像444分割为多个特征区块,并计算这些特征区块的多个变异数。依递减顺序,处理器430由这些变异数的最大值开始选取多个特征变异数与对应于这些特征变异数的多个特征区块。处理器430选取变异数大的数个特征区块以代表该张影像,接者利用这些特征区块,透过该线性映射分类方法,产生对应这些类别442的多个分类器。所选取特征区块的数目可依需求弹性调整,可显著减少产生分类器所需的样本数目,进而提升运行效率。
再者,于一实施例中,线性映射分类方法为支持向量机演算法。将对应类别的第一训练影像输入支持向量机演算法以决定可分类出对应类别以及非对应类别功能的超平面,处理器430进而产生对应类别的分类器。
或者,于一实施例中,处理器430透过方向梯度直方图以撷取特征影像;亦即,处理器430透过方向梯度直方图分别从这些第一训练影像444、这些第二训练影像446与待决影像448中分别撷取出这些第一特征影像、这些第二特征影像与该待决特征影像。
再者,于一实施例中,当该二参数范围重叠时,处理器430记录除了该二参数范围以外的余留参数范围,并且由对应该二参数范围的这些分类器当中选取一分类器后,重复执行直到这些参数范围彼此无重叠。举例而言,如图2所示,对应类别A的参数范围202位于门槛值与1之间,对应类别B~D的参数范围则位于-1与门槛值之间。当对应类别B的参数范围204与对应类别C的参数范围206重叠时,表示分类器A无法适当分辨出类别B与类别C;因此,处理器430记录可辨别的对应类别A的参数范围202与对应类别D的参数范围208,并且重新选取分类器B、C其中一者,重复执行直到所有对应类别442的参数范围均不重叠,并记录下无重叠的参数范围。直接从参数范围重叠的分类器B、C当中选取,以较快找出可分辨类别B、C的分类器。
再者,于一实施例中,这些第一训练影像444包含多个正样本影像与多个负样本影像;这些正样本影像当中具有分别对应这些类别的一对象,这些负样本影像当中缺少分别对应这些类别的该对象。举例而言,产生分类器A的流程中,处理器430将具有类别A的对象的影像作为正样本影像,将缺少类别A的对象的影像作为负样本影像;因此,仅具有类别B~D的影像亦可作为负样本影像以产生分类器A。透过输入正样本影像与负样本影像至线性映射分类法,以提升处理器430产生的分类器的识别功能。
综上所述,本发明得以经由上述实施例,利用记录不同类别的训练影像与其中一类别的分类器透过线性映射方法所产生的参数范围,得以较少的分类步骤达到多类别对象的分类效果;此外,利用划分特征影像为影像区块并选取变异数较大的影像区块作为代表,透过线性映射分类方法以产生分类器可大幅降低待处理的样本数量,节省运算时间,明显提升多类别对象分类的效率。
虽然本发明已以实施方式揭露如上,然其并非用以限定本发明,任何熟悉此技艺者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰,因此本发明的保护范围当视权利要求书所界定的范围为准。

Claims (12)

1.一种多类别对象分类方法,其特征在于,包含下列步骤:
(a)接收并储存多个类别、多个第一训练影像与多个第二训练影像,并从所述多个第一训练影像中撷取多个第一特征影像;利用所述多个第一特征影像,透过一线性映射分类方法,产生对应所述多个类别的多个分类器,其中所述多个第一训练影像与所述多个第二训练影像分别对应所述多个类别;
(b)从所述多个第二训练影像中撷取多个第二特征影像,并从所述多个分类器中选取一分类器;
(c)利用该分类器与所述多个第二特征影像,决定对应所述多个类别的多个参数范围与对应该分类器的一门槛值;
(d)当所述多个参数范围当中的二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由所述多个分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠;
(e)当所述多个参数范围彼此无重叠时,记录所述多个参数范围;
(f)接收并储存一待决影像,并从该待决影像中撷取一待决特征影像;利用一分类器与该待决特征影像,决定一待决参数;
(g)当该待决参数大于对应该分类器的该门槛值时,将该待决影像分类至对应该分类器的该类别;以及
(h)当该待决参数位于所述多个参数范围中的某个参数范围之内时,将该待决影像分类至该某个参数范围对应的类别。
2.根据权利要求1所述的多类别对象分类方法,其特征在于,步骤(a)包含:
将所述多个第一特征影像分割为多个特征区块,并计算所述多个特征区块的多个变异数;依递减顺序,由所述多个变异数的最大值开始选取多个特征变异数与对应于所述多个特征变异数的多个特征区块;利用所述多个特征区块,透过该线性映射分类方法,产生对应所述多个类别的多个分类器。
3.根据权利要求2所述的多类别对象分类方法,其特征在于,该线性映射分类方法为支持向量机演算法;所述多个参数范围与该门槛值均介于-1至1之间。
4.根据权利要求2所述的多类别对象分类方法,其特征在于,步骤(a)、(b)、(f)包含:
透过方向梯度直方图从所述多个第一训练影像中撷取所述多个第一特征影像;
透过方向梯度直方图从所述多个第二训练影像中撷取所述多个第二特征影像;
透过方向梯度直方图从该待决影像中撷取该待决特征影像。
5.根据权利要求2所述的多类别对象分类方法,其特征在于,步骤(d)包含:
当该二参数范围重叠时,记录除了该二参数范围以外的该余留参数范围,并且自对应该二参数范围的二分类器中选取一者作为该另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠。
6.根据权利要求2所述的多类别对象分类方法,其特征在于,所述多个第一训练影像包含多个正样本影像与多个负样本影像;所述多个正样本影像当中具有分别对应所述多个类别的一对象,所述多个负样本影像当中缺少分别对应所述多个类别的该对象。
7.一种多类别对象分类系统,其特征在于,包含:
一输入装置,接收多个类别、多个第一训练影像、多个第二训练影像与一待决影像,其中所述多个第一训练影像与所述多个第二训练影像分别对应所述多个类别;
一数据库,耦接该输入装置,储存所述多个类别、所述多个第一训练影像、所述多个第二训练影像与该待决影像;以及
一处理器,耦接该数据库,执行下列步骤:
(a)从所述多个第一训练影像中撷取多个第一特征影像;利用所述多个第一特征影像,透过一线性映射分类方法,产生对应所述多个类别的多个分类器;
(b)从所述多个第二训练影像中撷取多个第二特征影像,并从所述多个分类器中选取一分类器;
(c)利用该分类器与所述多个第二特征影像,决定对应所述多个类别的多个参数范围与对应该分类器的一门槛值;
(d)当所述多个参数范围当中的二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由所述多个分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠;
(e)当所述多个参数范围彼此无重叠时,记录所述多个参数范围;
(f)从该待决影像中撷取一待决特征影像;利用一分类器与该待决特征影像,决定一待决参数;
(g)当该待决参数大于对应该分类器的该门槛值时,将该待决影像分类至对应该分类器的该类别;以及
(h)当该待决参数位于所述多个参数范围中的某个参数范围之内时,将该待决影像分类至该某个参数范围对应的类别。
8.根据权利要求7所述的多类别对象分类系统,其特征在于,该处理器将所述多个第一特征影像分割为多个特征区块,并计算所述多个特征区块的多个变异数;依递减顺序,由所述多个变异数的最大值开始选取多个特征变异数与对应于所述多个特征变异数的多个特征区块;利用所述多个特征区块,透过该线性映射分类方法,产生对应所述多个类别的多个分类器。
9.根据权利要求8所述的多类别对象分类系统,其特征在于,该线性映射分类方法为支持向量机演算法;所述多个参数范围与该门槛值均介于-1至1之间。
10.根据权利要求8所述的多类别对象分类系统,其特征在于,该处理器透过方向梯度直方图从所述多个第一训练影像中撷取所述多个第一特征影像;透过方向梯度直方图从所述多个第二训练影像中撷取所述多个第二特征影像;透过方向梯度直方图从该待决影像中撷取该待决特征影像。
11.根据权利要求8所述的多类别对象分类系统,其特征在于,该处理器当该二参数范围重叠时,记录除了该二参数范围以外的该余留参数范围,并且自对应该二参数范围的二分类器中选取一者作为该另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠。
12.根据权利要求8所述的多类别对象分类系统,其特征在于,所述多个第一训练影像包含多个正样本影像与多个负样本影像;所述多个正样本影像当中具有分别对应所述多个类别的一对象,所述多个负样本影像当中缺少分别对应所述多个类别的该对象。
CN201410724928.4A 2014-12-03 2014-12-03 多类别对象分类方法及系统 Active CN105718937B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201410724928.4A CN105718937B (zh) 2014-12-03 2014-12-03 多类别对象分类方法及系统
US14/562,787 US9361544B1 (en) 2014-12-03 2014-12-08 Multi-class object classifying method and system
TW104101625A TWI567660B (zh) 2014-12-03 2015-01-19 多類別物件分類方法及系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410724928.4A CN105718937B (zh) 2014-12-03 2014-12-03 多类别对象分类方法及系统

Publications (2)

Publication Number Publication Date
CN105718937A CN105718937A (zh) 2016-06-29
CN105718937B true CN105718937B (zh) 2019-04-05

Family

ID=56083156

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410724928.4A Active CN105718937B (zh) 2014-12-03 2014-12-03 多类别对象分类方法及系统

Country Status (3)

Country Link
US (1) US9361544B1 (zh)
CN (1) CN105718937B (zh)
TW (1) TWI567660B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295666B (zh) * 2015-05-14 2020-03-03 佳能株式会社 获取分类器、检测对象的方法和装置及图像处理设备
CN106778801A (zh) * 2016-11-16 2017-05-31 卡尔蔡司(上海)管理有限公司 用于分析观测对象的类别的方法和装置
TWI649659B (zh) * 2017-10-27 2019-02-01 財團法人工業技術研究院 自動光學檢測影像分類方法、系統及含有該方法之電腦可讀取媒體
WO2019218334A1 (en) * 2018-05-18 2019-11-21 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for user analysis
US11315231B2 (en) 2018-06-08 2022-04-26 Industrial Technology Research Institute Industrial image inspection method and system and computer readable recording medium
CN110751617A (zh) * 2018-07-06 2020-02-04 台达电子工业股份有限公司 口腔影像分析系统和方法
CN110348484A (zh) * 2019-06-10 2019-10-18 天津大学 一种用于极性电子器件分类的方法
CN110599451B (zh) * 2019-08-05 2023-01-20 平安科技(深圳)有限公司 医学图像病灶检测定位方法、装置、设备及存储介质
CN111723856B (zh) * 2020-06-11 2023-06-09 广东浪潮大数据研究有限公司 一种图像数据处理方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853389A (zh) * 2009-04-01 2010-10-06 索尼株式会社 多类目标的检测装置及检测方法
CN101901354A (zh) * 2010-07-09 2010-12-01 浙江大学 基于特征点分类的监控录像中实时多目标检测与跟踪方法
CN102667859A (zh) * 2010-09-10 2012-09-12 松下电器产业株式会社 由排他性分类器进行的一般物体的图像识别装置及方法
CN102831447A (zh) * 2012-08-30 2012-12-19 北京理工大学 多类别面部表情高精度识别方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7769228B2 (en) * 2004-05-10 2010-08-03 Siemens Corporation Method for combining boosted classifiers for efficient multi-class object detection
US7899253B2 (en) * 2006-09-08 2011-03-01 Mitsubishi Electric Research Laboratories, Inc. Detecting moving objects in video by classifying on riemannian manifolds
US8244044B2 (en) * 2008-04-25 2012-08-14 Microsoft Corporation Feature selection and extraction
US8725660B2 (en) * 2009-07-30 2014-05-13 Hewlett-Packard Development Company, L.P. Applying non-linear transformation of feature values for training a classifier
TWI415032B (zh) * 2009-10-30 2013-11-11 Univ Nat Chiao Tung Object tracking method
US8509526B2 (en) * 2010-04-13 2013-08-13 International Business Machines Corporation Detection of objects in digital images
KR20120064581A (ko) * 2010-12-09 2012-06-19 한국전자통신연구원 영상 분류 방법 및 이를 위한 장치
US8781218B2 (en) * 2011-11-02 2014-07-15 Nec Laboratories America, Inc. Receptive field learning for pooled image features
US8761498B1 (en) * 2012-01-26 2014-06-24 Google Inc. Face and license plate detection in street level images with 3-D road width features estimated from laser data
US9213892B2 (en) * 2012-12-21 2015-12-15 Honda Motor Co., Ltd. Real-time bicyclist detection with synthetic training data
TWI497449B (zh) * 2012-12-26 2015-08-21 Ind Tech Res Inst 非監督式調適方法與應用其之影像自動分類方法
US9112984B2 (en) * 2013-03-12 2015-08-18 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
TW201441849A (zh) * 2013-04-30 2014-11-01 Ibm 自動決定圖像樣本群以進行分析之方法、系統及電腦程式產品
CN103996017B (zh) * 2014-02-24 2018-08-31 航天恒星科技有限公司 一种基于Hu不变矩和支持向量机的舰船检测方法
CN103942564B (zh) * 2014-04-08 2017-02-15 武汉大学 基于非监督特征学习的高分辨率遥感影像场景分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853389A (zh) * 2009-04-01 2010-10-06 索尼株式会社 多类目标的检测装置及检测方法
CN101901354A (zh) * 2010-07-09 2010-12-01 浙江大学 基于特征点分类的监控录像中实时多目标检测与跟踪方法
CN102667859A (zh) * 2010-09-10 2012-09-12 松下电器产业株式会社 由排他性分类器进行的一般物体的图像识别装置及方法
CN102831447A (zh) * 2012-08-30 2012-12-19 北京理工大学 多类别面部表情高精度识别方法

Also Published As

Publication number Publication date
TW201621754A (zh) 2016-06-16
CN105718937A (zh) 2016-06-29
TWI567660B (zh) 2017-01-21
US20160162757A1 (en) 2016-06-09
US9361544B1 (en) 2016-06-07

Similar Documents

Publication Publication Date Title
CN105718937B (zh) 多类别对象分类方法及系统
CN105224951B (zh) 一种车型分类方法及分类装置
CN109583483B (zh) 一种基于卷积神经网络的目标检测方法和系统
CN105404886B (zh) 特征模型生成方法和特征模型生成装置
CN106295502B (zh) 一种人脸检测方法及装置
CA2435290A1 (en) Computer-aided image analysis
CN108235770A (zh) 图像识别方法及云端系统
CN108780507A (zh) 用于提供图像分类器的系统和方法
CN106156777B (zh) 文本图片检测方法及装置
CN106951899A (zh) 基于图像识别的异常检测方法
CN105654066A (zh) 一种车辆识别方法及装置
CN109064504A (zh) 图像处理方法、装置和计算机存储介质
CN105930794A (zh) 一种基于云计算的室内场景识别方法
CN109376580A (zh) 一种基于深度学习的电力塔架部件识别方法
CN107194437B (zh) 基于Gist特征提取与概念机递归神经网络的图像分类方法
CN115062186B (zh) 一种视频内容检索方法、装置、设备以及存储介质
CN112149524A (zh) 一种雷达信号分选识别方法、装置、探测器及存储介质
Nanni et al. Improving the descriptors extracted from the co-occurrence matrix using preprocessing approaches
CN112836756A (zh) 图像识别模型训练方法、系统和计算机设备
CN105354547A (zh) 一种结合纹理和彩色特征的行人检测方法
CN103268494A (zh) 基于稀疏表示的寄生虫虫卵识别方法
Popescu et al. Efficient fractal method for texture classification
CN108876776A (zh) 一种分类模型生成方法、眼底图像分类方法及装置
KR101584091B1 (ko) 공유 지역 특징을 이용한 다시점 객체 검출 방법
CN106682604A (zh) 一种基于深度学习的模糊图像检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant