CN105718937A - 多类别对象分类方法及系统 - Google Patents
多类别对象分类方法及系统 Download PDFInfo
- Publication number
- CN105718937A CN105718937A CN201410724928.4A CN201410724928A CN105718937A CN 105718937 A CN105718937 A CN 105718937A CN 201410724928 A CN201410724928 A CN 201410724928A CN 105718937 A CN105718937 A CN 105718937A
- Authority
- CN
- China
- Prior art keywords
- image
- classification
- grader
- parameter
- pending
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/245—Classification techniques relating to the decision surface
- G06F18/2451—Classification techniques relating to the decision surface linear, e.g. hyperplane
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformation in the plane of the image
- G06T3/20—Linear translation of a whole image or part thereof, e.g. panning
Abstract
一种多类别对象分类方法及系统在此揭露,其中多类别对象分类方法包含以下步骤:接收并储存类别、第一训练影像与第二训练影像,并从对应类别的第一、第二训练影像中分别撷取第一、第二特征影像;利用第一特征影像,透过线性映射分类方法,产生对应类别的分类器;利用分类器与第二特征影像,决定对应所述多个类别的参数范围与对应该分类器的门槛值。当二参数范围重叠时,记录除了二参数范围以外的余留参数范围;由分类器当中选取除了已选取过的分类器以外的另一分类器后,重复执行前一步骤直到参数范围彼此无重叠并记录参数范围。本发明得以透过记录不同类别的参数范围,以较少的步骤达到分类效果,进而提升多类别对象分类效率。
Description
技术领域
本发明是一种分类技术,且特别是有关于一种多类别对象分类方法及系统。
背景技术
已知的人工智能或计算机视觉在图形识别的应用领域中,欲进行多类别对象(Multi-classobject)分类常采用直接进行多类别分类,或者利用二元分类法,将多类别分类拆解成数个二分类问题以进行解决。直接进行多类别分类例如提升(Boosting)演算法,透过分析所有的输入影像的代表点,以多阶段投票的方式逐步进行目标对象的分类,所涉及的计算复杂度较高、花费时间较长,而且准确率亦较低,并非良好的解决方法;然而,二元分类法则是时常面临到的问题则是待处理的影像特征点过多,以及当影像当中的不同对象之间距离较为接近时,对于多类别分类的计算时间过长,尚有改进空间。另外,传统二元分类法在最佳情况下透过单次分类过程仅可区分出一个单一类别;如果类别数量庞大,分类过程的次数也必须增加以区分出每个不同类别,导致较低的分类效率。
发明内容
为了提升二元分类法对于多类别对象的分类效率,本发明的一方面是提供一种多类别对象分类方法,其包含以下步骤:(a)接收并储存多个类别、多个第一训练影像与多个第二训练影像,并从所述多个第一训练影像中撷取多个第一特征影像;利用所述多个第一特征影像,透过一线性映射分类方法,产生对应所述多个类别的多个分类器,其中所述多个第一训练影像与所述多个第二训练影像分别对应所述多个类别;(b)从所述多个第二训练影像中撷取多个第二特征影像,并从所述多个分类器中选取一分类器;(c)利用该分类器与所述多个第二特征影像,决定对应所述多个类别的多个参数范围与对应该分类器的一门槛值;(d)当所述多个参数范围当中的二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由所述多个分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠;(e)当所述多个参数范围彼此无重叠时,记录所述多个参数范围;(f)接收并储存一待决影像,并从该待决影像中撷取一待决特征影像;利用一分类器与该待决特征影像,决定一待决参数;(g)当该待决参数大于对应该分类器的该门槛值时,将该待决影像分类至对应该分类器的该类别;(h)当该待决参数位于所述多个参数范围之内时,将该待决影像分类至对应所述多个参数范围的所述多个类别。
本发明的一实施例中,其中步骤(a)包含:将所述多个第一特征影像分割为多个特征区块,并计算所述多个特征区块的多个变异数;依递减顺序,由所述多个变异数的最大值开始选取多个特征变异数与对应于所述多个特征变异数的多个特征区块;利用所述多个特征区块,透过该线性映射分类方法,产生对应所述多个类别的多个分类器。
本发明的一实施例中,其中该线性映射分类方法为支持向量机(SupportVectorMachine,SVM)演算法,所述多个参数范围与该门槛值均介于-1至1之间。
本发明的一实施例中,其中步骤(a)、(b)、(f)包含:透过方向梯度直方图(HistogramofOrientedGradients,HOG)从所述多个第一训练影像中撷取所述多个第一特征影像;透过方向梯度直方图从所述多个第二训练影像中撷取所述多个第二特征影像;透过方向梯度直方图从该待决影像中撷取该待决特征影像。
本发明的一实施例中,其中步骤(d)包含:当该二参数范围重叠时,记录除了该二参数范围以外的该余留参数范围,并且自对应该二参数范围的二分类器中选取一者作为该另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠。
本发明的一实施例中,所述多个第一训练影像包含多个正样本影像与多个负样本影像;所述多个正样本影像当中具有分别对应所述多个类别的一对象,所述多个负样本影像当中缺少分别对应所述多个类别的该对象。
本发明的另一方面是提供一种多类别对象分类系统,其包含输入装置、数据库与处理器,其中该数据库耦接该输入单元,而且该处理器耦接该数据库。输入单元接收多个类别、多个第一训练影像、多个第二训练影像与一待决影像,其中所述多个第一训练影像与所述多个第二训练影像分别对应所述多个类别。数据库储存所述多个类别、所述多个第一训练影像、所述多个第二训练影像与该待决影像。处理器执行下列步骤:(a)从所述多个第一训练影像中撷取多个第一特征影像;利用所述多个第一特征影像,透过一线性映射分类方法,产生对应所述多个类别的多个分类器;(b)从所述多个第二训练影像中撷取多个第二特征影像,并从所述多个分类器中选取一分类器;(c)利用该分类器与所述多个第二特征影像,决定对应所述多个类别的多个参数范围与对应该分类器的一门槛值;(d)当所述多个参数范围当中的二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由所述多个分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠;(e)当所述多个参数范围彼此无重叠时,记录所述多个参数范围;(f)从该待决影像中撷取一待决特征影像;利用一分类器与该待决特征影像,决定一待决参数;(g)当该待决参数大于对应该分类器的该门槛值时,将该待决影像分类至对应该分类器的该类别;以及(h)当该待决参数位于所述多个参数范围之内时,将该待决影像分类至对应所述多个参数范围的所述多个类别。
本发明的一实施例中,其中该处理器将所述多个第一特征影像分割为多个特征区块,并计算所述多个特征区块的多个变异数;依递减顺序,由所述多个变异数的最大值开始选取多个特征变异数与对应于所述多个特征变异数的多个特征区块;利用所述多个特征区块,透过该线性映射分类方法,产生对应所述多个类别的多个分类器。
本发明的一实施例中,其中该线性映射分类方法为支持向量机演算法,所述多个参数范围与该门槛值均介于-1至1之间。
本发明的一实施例中,其中该处理器透过方向梯度直方图从所述多个第一训练影像中撷取所述多个第一特征影像;透过方向梯度直方图从所述多个第二训练影像中撷取所述多个第二特征影像;透过方向梯度直方图从该待决影像中撷取该待决特征影像。
本发明的一实施例中,其中该处理器当该二参数范围重叠时,记录除了该二参数范围以外的该余留参数范围,并且自对应该二参数范围的二分类器中选取一者作为该另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠。
本发明的一实施例中,其中所述多个第一训练影像包含多个正样本影像与多个负样本影像;所述多个正样本影像当中具有分别对应所述多个类别的一对象,所述多个负样本影像当中缺少分别对应所述多个类别的该对象。
综上所述,本发明是以提升二元分类法对于多类别对象分类的效率为出发点,利用记录不同类别的训练影像与其中一类别的分类器透过线性映射方法所产生的参数范围,得以较少的分类步骤达到多类别对象的分类效果;此外,利用划分特征影像为影像区块并选取变异数较大的影像区块作为代表,透过线性映射分类方法以产生分类器可大幅降低待处理的样本数量,节省运算时间,明显提升多类别对象分类的效率。
以下将以实施方式对上述的说明作详细的描述,并对本发明的技术方案提供更进一步的解释。
附图说明
为让本发明的上述和其他目的、特征、优点与实施例能更明显易懂,所附附图的说明如下:
图1A~1B是说明本发明第一实施例的多类别对象分类方法流程图;
图2是说明分别对应类别A~D的第二训练影像与分类器A的参数所决定的参数范围示意图;
图3是说明分别对应类别A~D的第二训练影像与分类器B的参数所决定的参数范围示意图;以及
图4是说明本发明第二实施例的多类别对象分类系统示意图。
具体实施方式
为了使本发明的叙述更加详尽与完备,可参照附图及以下所述的各种实施例。但所提供的实施例并非用以限制本发明所涵盖的范围;步骤的描述亦非用以限制其执行的顺序,任何由重新组合,所产生具有均等功效的装置,皆为本发明所涵盖的范围。
如图1A~1B所示,其是绘示本发明的第一实施例的多类别对象分类方法100,图1A与图1B以A点作为步骤之间的连接点。多类别对象分类方法100可应用于如图4所示的多类别对象分类系统400中。然熟悉本案的技艺者应了解到,在本实施方式中所提及的步骤,除特别叙明其顺序者外,均可依实际需要调整其前后顺序,甚至可同时或部分同时执行。
首先,于步骤S102,接收并储存使用者定义的多个类别、多个第一训练影像与多个第二训练影像;其中这些第一训练影像与这些第二训练影像均分别对应这些类别。举例而言,使用者可定义类别A、B、C、D,每个类别分别具有对应的多个第一训练影像与多个第二训练影像。从这些第一训练影像中撷取多个第一特征影像以进行第一训练阶段并产生多个分类器;其中第一训练过程使用线性映射分类方法,而且分类器数目与类别数目相等。本实施例中,产生的分类器为对应于类别A~D的分类器A~D,分类器具有分类出对应类别以及非对应类别的功能。举例而言,分类器A可用以分出类别A与非类别A,以此类推。具体而言,线性映射分类方法可为支持向量机演算法、费雪线性判别分析(Fisher'sLinearDiscriminant)、单纯贝氏分类器(NaiveBayesclassifier)。
接着,于步骤S104中,从这些第二训练影像中撷取多个第二特征影像,并从这些分类器中选取一分类器以进行第二训练阶段。于步骤S106中,利用该分类器与这些第二特征影像,决定对应这些类别的多个参数范围与对应该分类器的一门槛值;举例而言,这些参数范围与该门槛值均介于-1至1之间。可依需求定义门槛值作为分类为该类别的标准;举例而言,分类器A的门槛值定义为0.8,当一参数大于0.8时判断为类别A;当一参数小于0.8时判断为非类别A。
上述的参数范围乃透过一类别的多个第二特征影像的特征值与该分类器的参数值所计算出的多个参数所决定。计算公式如下:
上述的公式中:Si为第二特征影像的特征值,Vi、αi、ρ均为所选取分类器的参数值,Sum即为计算出的参数。因此,多个第二特征影像将计算出多个参数,形成一个参数范围。透过上述公式,利用对应多个类别的多个第二特征影像的特征值与一分类器内的参数值产生多个对应这些类别的参数范围。如图2所示,这些参数范围与这些类别具有对应关系,其中与该分类器对应同一类别的参数范围最接近1。
步骤S108中,检查这些参数范围是否重叠;当这些参数范围当中的二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由这些分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行步骤S106直到这些参数范围彼此无重叠(步骤S110);当这些参数范围彼此无重叠时,记录这些参数范围(步骤S112)。举例而言,图2为分别对应类别A~D的第二训练影像与分类器A的参数所决定的参数范围示意图。对应类别A的参数范围202位于门槛值与1之间,对应类别B~D的参数范围204~208则位于-1与门槛值之间。对应类别B的参数范围204与对应类别C的参数范围206重叠,表示分类器A无法适当分辨出类别B与类别C;因此,记录可辨别的对应类别A的参数范围202与对应类别D的参数范围208,并且重新选取除了分类器A以外的分类器B~D其中一者,重复步骤S106直到所有对应类别的参数范围均不重叠,并记录下无重叠的参数范围。举例而言,图3为分别对应类别A~D的第二训练影像与分类器B的参数所决定的参数范围示意图,所有参数范围302~308均未重叠;因此,记录参数范围的后的分类器B具有分类出类别A~D的功能。由此可知,经过记录参数范围的后的分类器A~D其中任一者均具有分类出类别A~D的潜力,相较于第一训练阶段产生的分类器,具有显着提升的分类功能。
步骤S114开始为侦测阶段,接收并储存待决影像,并从待决影像中撷取待决特征影像;利用分类器与待决特征影像,决定待决参数;步骤S116中,检查该待决参数是否大于对应分类器的门槛值;当该待决参数大于对应分类器的门槛值时,将待决影像分类至对应分类器的该类别(步骤S118);当该待决参数小于对应分类器的门槛值时,于步骤S120中,检查待决参数是否位于对应类别的参数范围之内;当待决参数位于这些参数范围之内时,将该待决影像分类至对应这些参数范围的这些类别。举例而言,利用分类器A的参数值与待决特征影像,透过上述公式决定待决参数。当待决参数大于分类器A的门槛值时,将待决影像分类至类别A;或者,当待决参数小于分类器A的门槛值,并且位于类别B的参数范围内时,将待决影像分类至类别B;或者,当待决参数小于分类器A的门槛值,并且位于类别C的参数范围内时,则将待决影像分类至类别C。综上所述,经过记录对应类别A~D的参数范围后的分类器A~D,除了可分辨出分类器所对应类别之外,同时具有分辨其他类别的功能,因此可达成步骤较少、效率较高的多类别对象分类。
为减少产生分类器的影像样本数目,于一实施例中,将上述的第一训练影像分割为多个特征区块,并计算这些特征区块的多个变异数。依递减顺序,由这些变异数的最大值开始选取多个特征变异数与对应于这些特征变异数的多个特征区块。选取变异数大的数个特征区块以代表该张影像,接者利用这些特征区块,透过该线性映射分类方法,产生对应这些类别的多个分类器。所选取特征区块的数目可依需求弹性调整,可显着减少产生分类器所需的样本数目,进而提升运行效率。
再者,于一实施例中,线性映射分类方法为支持向量机演算法。将对应类别的第一训练影像输入支持向量机演算法以决定可分类出对应类别以及非对应类别功能的超平面(hyperplane),进而产生对应类别的分类器。
或者,于一实施例中,透过方向梯度直方图以撷取特征影像;亦即,透过方向梯度直方图分别从这些第一训练影像、这些第二训练影像与待决影像中分别撷取出这些第一特征影像、这些第二特征影像与该待决特征影像。
再者,于一实施例中,当该二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由对应该二参数范围的这些分类器当中选取一分类器后,重复执行步骤S106直到这些参数范围彼此无重叠。举例而言,如图2所示,对应类别A的参数范围202位于门槛值与1之间,对应类别B~D的参数范围则位于-1与门槛值之间。当对应类别B的参数范围204与对应类别C的参数范围206重叠时,表示分类器A无法适当分辨出类别B与类别C;因此,记录可辨别的对应类别A的参数范围202与对应类别D的参数范围208,并且重新选取分类器B、C其中一者,重复步骤S106直到所有对应类别的参数范围均不重叠,并记录下无重叠的参数范围。直接从参数范围重叠的分类器B、C当中选取,以较快找出可分辨类别B、C的分类器。
再者,于一实施例中,这些第一训练影像包含多个正样本影像与多个负样本影像;这些正样本影像当中具有分别对应这些类别的一对象,这些负样本影像当中缺少分别对应这些类别的该对象。举例而言,产生分类器A的流程中,将具有类别A的对象的影像作为正样本影像,将缺少类别A的对象的影像作为负样本影像;因此,仅具有类别B~D的影像亦可作为负样本影像以产生分类器A。透过输入正样本影像与负样本影像至线性映射分类法,以提升所产生的分类器的识别功能。
请参考图4,其是绘示本发明的第二实施例的多类别对象分类系统400。多类别对象分类系统400包含输入装置410、数据库420与处理器430。实作上,输入装置410可为传输端口(USB、GPIB或其他接口)。数据库420可为硬盘、快闪记忆体或其他储存媒介;处理器430可为中央处理器、微控制器或其他电路。
首先,输入装置410接收并储存使用者定义的多个类别442、多个第一训练影像444与多个第二训练影像446于数据库420内;其中这些第一训练影像444与这些第二训练影像446均分别对应这些类别442。举例而言,使用者可定义类别A、B、C、D,每个类别分别具有对应的多个第一训练影像444与多个第二训练影像446。从这些第一训练影像444中撷取多个第一特征影像以进行第一训练阶段并产生多个分类器;其中第一训练过程使用线性映射分类方法,而且分类器数目与类别442数目相等。本实施例中,产生的分类器为对应于类别A~D的分类器A~D,分类器具有分类出对应类别以及非对应类别的功能。举例而言,分类器A可用以分出类别A与非类别A,以此类推。具体而言,线性映射分类方法可为支持向量机演算法、费雪线性判别分析、单纯贝氏分类器。
接着,处理器430从这些第二训练影像446中撷取多个第二特征影像,并从这些分类器中选取一分类器以进行第二训练阶段。处理器430利用该分类器与这些第二特征影像,决定对应这些类别442的多个参数范围与对应该分类器的一门槛值;举例而言,这些参数范围与该门槛值均介于-1至1之间。可依需求定义门槛值作为分类为该类别的标准;举例而言,分类器A的门槛值定义为0.8,当一参数大于0.8时判断为类别A;当一参数小于0.8时判断为非类别A。
上述的参数范围乃处理器430透过一类别的多个第二特征影像的特征值与该分类器的参数值所计算出的多个参数所决定。计算公式如下:
上述的公式中:Si为第二特征影像的特征值,Vi、αi、ρ均为所选取分类器的参数值,Sum即为计算出的参数。因此,多个第二特征影像将计算出多个参数,形成一个参数范围。透过上述公式,处理器430利用对应多个类别442的多个第二特征影像的特征值与一分类器内的参数值产生多个对应这些类别442的参数范围。如图2所示,这些参数范围与这些类别442具有对应关系,其中与该分类器对应同一类别的参数范围最接近1。
接着,处理器430检查这些参数范围是否重叠;当这些参数范围当中的二参数范围重叠时,处理器430记录除了该二参数范围以外的余留参数范围,并且由这些分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行直到这些参数范围彼此无重叠;当这些参数范围彼此无重叠时,处理器430记录这些参数范围。举例而言,图2为分别对应类别A~D的第二训练影像与分类器A的参数所决定的参数范围示意图。对应类别A的参数范围202位于门槛值与1之间,对应类别B~D的参数范围204~208则位于-1与门槛值之间。对应类别B的参数范围204与对应类别C的参数范围206重叠,表示分类器A无法适当分辨出类别B与类别C;因此,处理器430记录可辨别的对应类别A的参数范围202与对应类别D的参数范围208,并且重新选取除了分类器A以外的分类器B~D其中一者,重复执行直到所有对应类别442的参数范围均不重叠,并记录无重叠的参数范围。举例而言,图3为分别对应类别A~D的第二训练影像与分类器B的参数所决定的参数范围示意图,所有参数范围302~308均未重叠;因此,处理器430记录参数范围的后的分类器B具有分类出类别A~D的功能。由此可知,经过记录参数范围的后的分类器A~D其中任一者均具有分类出类别A~D的潜力,相较于第一训练阶段产生的分类器,具有显着提升的分类功能。
处理器430接收并储存待决影像448于数据库420内,并从待决影像448中撷取待决特征影像;利用分类器与待决特征影像,决定待决参数。处理器430检查该待决参数是否大于对应分类器的门槛值;当该待决参数大于对应分类器的门槛值时,处理器430将待决影像448分类至对应分类器的该类别;当该待决参数小于对应分类器的门槛值时,处理器430检查待决参数是否位于对应类别442的参数范围之内;当待决参数位于这些参数范围之内时,处理器430将该待决影像448分类至对应这些参数范围的这些类别442。举例而言,处理器430利用分类器A的参数值与待决特征影像,透过上述公式决定待决参数。当待决参数大于分类器A的门槛值时,处理器430将待决影像448分类至类别A;或者,当待决参数小于分类器A的门槛值,并且位于类别B的参数范围内时,处理器430将待决影像448分类至类别B;或者,当待决参数小于分类器A的门槛值,并且位于类别C的参数范围内时,处理器430则将待决影像448分类至类别C。综上所述,经过记录对应类别A~D的参数范围后的分类器A~D,除了可分辨出分类器所对应类别之外,同时具有分辨其他类别的功能,因此可达成步骤较少、效率较高的多类别对象分类。
为减少产生分类器的影像样本数目,于一实施例中,处理器430将上述的第一训练影像444分割为多个特征区块,并计算这些特征区块的多个变异数。依递减顺序,处理器430由这些变异数的最大值开始选取多个特征变异数与对应于这些特征变异数的多个特征区块。处理器430选取变异数大的数个特征区块以代表该张影像,接者利用这些特征区块,透过该线性映射分类方法,产生对应这些类别442的多个分类器。所选取特征区块的数目可依需求弹性调整,可显着减少产生分类器所需的样本数目,进而提升运行效率。
再者,于一实施例中,线性映射分类方法为支持向量机演算法。将对应类别的第一训练影像输入支持向量机演算法以决定可分类出对应类别以及非对应类别功能的超平面,处理器430进而产生对应类别的分类器。
或者,于一实施例中,处理器430透过方向梯度直方图以撷取特征影像;亦即,处理器430透过方向梯度直方图分别从这些第一训练影像444、这些第二训练影像446与待决影像448中分别撷取出这些第一特征影像、这些第二特征影像与该待决特征影像。
再者,于一实施例中,当该二参数范围重叠时,处理器430记录除了该二参数范围以外的余留参数范围,并且由对应该二参数范围的这些分类器当中选取一分类器后,重复执行直到这些参数范围彼此无重叠。举例而言,如图2所示,对应类别A的参数范围202位于门槛值与1之间,对应类别B~D的参数范围则位于-1与门槛值之间。当对应类别B的参数范围204与对应类别C的参数范围206重叠时,表示分类器A无法适当分辨出类别B与类别C;因此,处理器430记录可辨别的对应类别A的参数范围202与对应类别D的参数范围208,并且重新选取分类器B、C其中一者,重复执行直到所有对应类别442的参数范围均不重叠,并记录下无重叠的参数范围。直接从参数范围重叠的分类器B、C当中选取,以较快找出可分辨类别B、C的分类器。
再者,于一实施例中,这些第一训练影像444包含多个正样本影像与多个负样本影像;这些正样本影像当中具有分别对应这些类别的一对象,这些负样本影像当中缺少分别对应这些类别的该对象。举例而言,产生分类器A的流程中,处理器430将具有类别A的对象的影像作为正样本影像,将缺少类别A的对象的影像作为负样本影像;因此,仅具有类别B~D的影像亦可作为负样本影像以产生分类器A。透过输入正样本影像与负样本影像至线性映射分类法,以提升处理器430产生的分类器的识别功能。
综上所述,本发明得以经由上述实施例,利用记录不同类别的训练影像与其中一类别的分类器透过线性映射方法所产生的参数范围,得以较少的分类步骤达到多类别对象的分类效果;此外,利用划分特征影像为影像区块并选取变异数较大的影像区块作为代表,透过线性映射分类方法以产生分类器可大幅降低待处理的样本数量,节省运算时间,明显提升多类别对象分类的效率。
虽然本发明已以实施方式揭露如上,然其并非用以限定本发明,任何熟悉此技艺者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰,因此本发明的保护范围当视权利要求书所界定的范围为准。
Claims (12)
1.一种多类别对象分类方法,其特征在于,包含下列步骤:
(a)接收并储存多个类别、多个第一训练影像与多个第二训练影像,并从所述多个第一训练影像中撷取多个第一特征影像;利用所述多个第一特征影像,透过一线性映射分类方法,产生对应所述多个类别的多个分类器,其中所述多个第一训练影像与所述多个第二训练影像分别对应所述多个类别;
(b)从所述多个第二训练影像中撷取多个第二特征影像,并从所述多个分类器中选取一分类器;
(c)利用该分类器与所述多个第二特征影像,决定对应所述多个类别的多个参数范围与对应该分类器的一门槛值;
(d)当所述多个参数范围当中的二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由所述多个分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠;
(e)当所述多个参数范围彼此无重叠时,记录所述多个参数范围;
(f)接收并储存一待决影像,并从该待决影像中撷取一待决特征影像;利用一分类器与该待决特征影像,决定一待决参数;
(g)当该待决参数大于对应该分类器的该门槛值时,将该待决影像分类至对应该分类器的该类别;以及
(h)当该待决参数位于所述多个参数范围之内时,将该待决影像分类至对应所述多个参数范围的所述多个类别。
2.根据权利要求1所述的多类别对象分类方法,其特征在于,步骤(a)包含:
将所述多个第一特征影像分割为多个特征区块,并计算所述多个特征区块的多个变异数;依递减顺序,由所述多个变异数的最大值开始选取多个特征变异数与对应于所述多个特征变异数的多个特征区块;利用所述多个特征区块,透过该线性映射分类方法,产生对应所述多个类别的多个分类器。
3.根据权利要求2所述的多类别对象分类方法,其特征在于,该线性映射分类方法为支持向量机演算法;所述多个参数范围与该门槛值均介于-1至1之间。
4.根据权利要求2所述的多类别对象分类方法,其特征在于,步骤(a)、(b)、(f)包含:
透过方向梯度直方图从所述多个第一训练影像中撷取所述多个第一特征影像;
透过方向梯度直方图从所述多个第二训练影像中撷取所述多个第二特征影像;
透过方向梯度直方图从该待决影像中撷取该待决特征影像。
5.根据权利要求2所述的多类别对象分类方法,其特征在于,步骤(d)包含:
当该二参数范围重叠时,记录除了该二参数范围以外的该余留参数范围,并且自对应该二参数范围的二分类器中选取一者作为该另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠。
6.根据权利要求2所述的多类别对象分类方法,其特征在于,所述多个第一训练影像包含多个正样本影像与多个负样本影像;所述多个正样本影像当中具有分别对应所述多个类别的一对象,所述多个负样本影像当中缺少分别对应所述多个类别的该对象。
7.一种多类别对象分类系统,其特征在于,包含:
一输入装置,接收多个类别、多个第一训练影像、多个第二训练影像与一待决影像,其中所述多个第一训练影像与所述多个第二训练影像分别对应所述多个类别;
一数据库,耦接该输入装置,储存所述多个类别、所述多个第一训练影像、所述多个第二训练影像与该待决影像;以及
一处理器,耦接该数据库,执行下列步骤:
(a)从所述多个第一训练影像中撷取多个第一特征影像;利用所述多个第一特征影像,透过一线性映射分类方法,产生对应所述多个类别的多个分类器;
(b)从所述多个第二训练影像中撷取多个第二特征影像,并从所述多个分类器中选取一分类器;
(c)利用该分类器与所述多个第二特征影像,决定对应所述多个类别的多个参数范围与对应该分类器的一门槛值;
(d)当所述多个参数范围当中的二参数范围重叠时,记录除了该二参数范围以外的余留参数范围,并且由所述多个分类器当中选取除了已选取过的该分类器以外的另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠;
(e)当所述多个参数范围彼此无重叠时,记录所述多个参数范围;
(f)从该待决影像中撷取一待决特征影像;利用一分类器与该待决特征影像,决定一待决参数;
(g)当该待决参数大于对应该分类器的该门槛值时,将该待决影像分类至对应该分类器的该类别;以及
(h)当该待决参数位于所述多个参数范围之内时,将该待决影像分类至对应所述多个参数范围的所述多个类别。
8.根据权利要求7所述的多类别对象分类系统,其特征在于,该处理器将所述多个第一特征影像分割为多个特征区块,并计算所述多个特征区块的多个变异数;依递减顺序,由所述多个变异数的最大值开始选取多个特征变异数与对应于所述多个特征变异数的多个特征区块;利用所述多个特征区块,透过该线性映射分类方法,产生对应所述多个类别的多个分类器。
9.根据权利要求8所述的多类别对象分类系统,其特征在于,该线性映射分类方法为支持向量机演算法;所述多个参数范围与该门槛值均介于-1至1之间。
10.根据权利要求8所述的多类别对象分类系统,其特征在于,该处理器透过方向梯度直方图从所述多个第一训练影像中撷取所述多个第一特征影像;透过方向梯度直方图从所述多个第二训练影像中撷取所述多个第二特征影像;透过方向梯度直方图从该待决影像中撷取该待决特征影像。
11.根据权利要求8所述的多类别对象分类系统,其特征在于,该处理器当该二参数范围重叠时,记录除了该二参数范围以外的该余留参数范围,并且自对应该二参数范围的二分类器中选取一者作为该另一分类器后,重复执行步骤(c)直到所述多个参数范围彼此无重叠。
12.根据权利要求8所述的多类别对象分类系统,其特征在于,所述多个第一训练影像包含多个正样本影像与多个负样本影像;所述多个正样本影像当中具有分别对应所述多个类别的一对象,所述多个负样本影像当中缺少分别对应所述多个类别的该对象。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410724928.4A CN105718937B (zh) | 2014-12-03 | 2014-12-03 | 多类别对象分类方法及系统 |
US14/562,787 US9361544B1 (en) | 2014-12-03 | 2014-12-08 | Multi-class object classifying method and system |
TW104101625A TWI567660B (zh) | 2014-12-03 | 2015-01-19 | 多類別物件分類方法及系統 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410724928.4A CN105718937B (zh) | 2014-12-03 | 2014-12-03 | 多类别对象分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105718937A true CN105718937A (zh) | 2016-06-29 |
CN105718937B CN105718937B (zh) | 2019-04-05 |
Family
ID=56083156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410724928.4A Active CN105718937B (zh) | 2014-12-03 | 2014-12-03 | 多类别对象分类方法及系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9361544B1 (zh) |
CN (1) | CN105718937B (zh) |
TW (1) | TWI567660B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778801A (zh) * | 2016-11-16 | 2017-05-31 | 卡尔蔡司(上海)管理有限公司 | 用于分析观测对象的类别的方法和装置 |
CN110751617A (zh) * | 2018-07-06 | 2020-02-04 | 台达电子工业股份有限公司 | 口腔影像分析系统和方法 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295666B (zh) * | 2015-05-14 | 2020-03-03 | 佳能株式会社 | 获取分类器、检测对象的方法和装置及图像处理设备 |
TWI649659B (zh) | 2017-10-27 | 2019-02-01 | 財團法人工業技術研究院 | 自動光學檢測影像分類方法、系統及含有該方法之電腦可讀取媒體 |
WO2019218334A1 (en) | 2018-05-18 | 2019-11-21 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for user analysis |
US11315231B2 (en) | 2018-06-08 | 2022-04-26 | Industrial Technology Research Institute | Industrial image inspection method and system and computer readable recording medium |
CN110348484A (zh) * | 2019-06-10 | 2019-10-18 | 天津大学 | 一种用于极性电子器件分类的方法 |
CN110599451B (zh) | 2019-08-05 | 2023-01-20 | 平安科技(深圳)有限公司 | 医学图像病灶检测定位方法、装置、设备及存储介质 |
CN111723856B (zh) * | 2020-06-11 | 2023-06-09 | 广东浪潮大数据研究有限公司 | 一种图像数据处理方法、装置、设备及可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050249401A1 (en) * | 2004-05-10 | 2005-11-10 | Claus Bahlmann | Method for combining boosted classifiers for efficient multi-class object detection |
CN101853389A (zh) * | 2009-04-01 | 2010-10-06 | 索尼株式会社 | 多类目标的检测装置及检测方法 |
CN101901354A (zh) * | 2010-07-09 | 2010-12-01 | 浙江大学 | 基于特征点分类的监控录像中实时多目标检测与跟踪方法 |
CN102667859A (zh) * | 2010-09-10 | 2012-09-12 | 松下电器产业株式会社 | 由排他性分类器进行的一般物体的图像识别装置及方法 |
CN102831447A (zh) * | 2012-08-30 | 2012-12-19 | 北京理工大学 | 多类别面部表情高精度识别方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7899253B2 (en) * | 2006-09-08 | 2011-03-01 | Mitsubishi Electric Research Laboratories, Inc. | Detecting moving objects in video by classifying on riemannian manifolds |
US8244044B2 (en) * | 2008-04-25 | 2012-08-14 | Microsoft Corporation | Feature selection and extraction |
US8725660B2 (en) * | 2009-07-30 | 2014-05-13 | Hewlett-Packard Development Company, L.P. | Applying non-linear transformation of feature values for training a classifier |
TWI415032B (zh) * | 2009-10-30 | 2013-11-11 | Univ Nat Chiao Tung | Object tracking method |
US8509526B2 (en) * | 2010-04-13 | 2013-08-13 | International Business Machines Corporation | Detection of objects in digital images |
KR20120064581A (ko) * | 2010-12-09 | 2012-06-19 | 한국전자통신연구원 | 영상 분류 방법 및 이를 위한 장치 |
US8781218B2 (en) * | 2011-11-02 | 2014-07-15 | Nec Laboratories America, Inc. | Receptive field learning for pooled image features |
US8761498B1 (en) * | 2012-01-26 | 2014-06-24 | Google Inc. | Face and license plate detection in street level images with 3-D road width features estimated from laser data |
US9213892B2 (en) * | 2012-12-21 | 2015-12-15 | Honda Motor Co., Ltd. | Real-time bicyclist detection with synthetic training data |
TWI497449B (zh) * | 2012-12-26 | 2015-08-21 | Ind Tech Res Inst | 非監督式調適方法與應用其之影像自動分類方法 |
US9112984B2 (en) * | 2013-03-12 | 2015-08-18 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
TW201441849A (zh) * | 2013-04-30 | 2014-11-01 | Ibm | 自動決定圖像樣本群以進行分析之方法、系統及電腦程式產品 |
CN103996017B (zh) * | 2014-02-24 | 2018-08-31 | 航天恒星科技有限公司 | 一种基于Hu不变矩和支持向量机的舰船检测方法 |
CN103942564B (zh) * | 2014-04-08 | 2017-02-15 | 武汉大学 | 基于非监督特征学习的高分辨率遥感影像场景分类方法 |
-
2014
- 2014-12-03 CN CN201410724928.4A patent/CN105718937B/zh active Active
- 2014-12-08 US US14/562,787 patent/US9361544B1/en active Active
-
2015
- 2015-01-19 TW TW104101625A patent/TWI567660B/zh active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050249401A1 (en) * | 2004-05-10 | 2005-11-10 | Claus Bahlmann | Method for combining boosted classifiers for efficient multi-class object detection |
CN101853389A (zh) * | 2009-04-01 | 2010-10-06 | 索尼株式会社 | 多类目标的检测装置及检测方法 |
CN101901354A (zh) * | 2010-07-09 | 2010-12-01 | 浙江大学 | 基于特征点分类的监控录像中实时多目标检测与跟踪方法 |
CN102667859A (zh) * | 2010-09-10 | 2012-09-12 | 松下电器产业株式会社 | 由排他性分类器进行的一般物体的图像识别装置及方法 |
CN102831447A (zh) * | 2012-08-30 | 2012-12-19 | 北京理工大学 | 多类别面部表情高精度识别方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778801A (zh) * | 2016-11-16 | 2017-05-31 | 卡尔蔡司(上海)管理有限公司 | 用于分析观测对象的类别的方法和装置 |
CN110751617A (zh) * | 2018-07-06 | 2020-02-04 | 台达电子工业股份有限公司 | 口腔影像分析系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
TW201621754A (zh) | 2016-06-16 |
US20160162757A1 (en) | 2016-06-09 |
TWI567660B (zh) | 2017-01-21 |
CN105718937B (zh) | 2019-04-05 |
US9361544B1 (en) | 2016-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105718937A (zh) | 多类别对象分类方法及系统 | |
CN109934293B (zh) | 图像识别方法、装置、介质及混淆感知卷积神经网络 | |
Wu et al. | Harvesting discriminative meta objects with deep CNN features for scene classification | |
CN109952614B (zh) | 生物粒子的分类系统和方法 | |
US10796145B2 (en) | Method and apparatus for separating text and figures in document images | |
Kumar et al. | Text extraction and document image segmentation using matched wavelets and MRF model | |
CN105224951B (zh) | 一种车型分类方法及分类装置 | |
WO2019163985A1 (ja) | 特徴表現装置、特徴表現方法、およびプログラム | |
CN107368807B (zh) | 一种基于视觉词袋模型的监控视频车型分类方法 | |
US10867169B2 (en) | Character recognition using hierarchical classification | |
CN103927510B (zh) | 图像识别装置和图像识别方法 | |
Pramunendar et al. | A classification method of coconut wood quality based on Gray Level Co-occurrence matrices | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
WO2020164278A1 (zh) | 一种图像处理方法、装置、电子设备和可读存储介质 | |
CN104951791A (zh) | 数据分类方法和装置 | |
CN108241662B (zh) | 数据标注的优化方法及装置 | |
JP6713162B2 (ja) | 画像認識装置、画像認識方法、及び画像認識プログラム | |
CN103310235A (zh) | 一种基于参数识别与估计的隐写分析方法 | |
Wijnhoven et al. | Unsupervised sub-categorization for object detection: Finding cars from a driving vehicle | |
Popescu et al. | Efficient fractal method for texture classification | |
Elsayed et al. | Hand gesture recognition based on dimensionality reduction of histogram of oriented gradients | |
Jubair et al. | A simplified method for handwritten character recognition from document image | |
Singh et al. | A Concise Review Of MRI Feature Extraction And Classification With Kernel Functions | |
CN110532384A (zh) | 一种多任务字典单分类方法、系统、装置及存储介质 | |
Kim et al. | Mobile phone spam image detection based on graph partitioning with pyramid histogram of visual words image descriptor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |