TW201621754A - 多類別物件分類方法及系統 - Google Patents

多類別物件分類方法及系統 Download PDF

Info

Publication number
TW201621754A
TW201621754A TW104101625A TW104101625A TW201621754A TW 201621754 A TW201621754 A TW 201621754A TW 104101625 A TW104101625 A TW 104101625A TW 104101625 A TW104101625 A TW 104101625A TW 201621754 A TW201621754 A TW 201621754A
Authority
TW
Taiwan
Prior art keywords
feature
images
classifier
parameter
pending
Prior art date
Application number
TW104101625A
Other languages
English (en)
Other versions
TWI567660B (zh
Inventor
陳彥霖
江川彥
余兆偉
蔡岳廷
李孟燦
Original Assignee
財團法人資訊工業策進會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人資訊工業策進會 filed Critical 財團法人資訊工業策進會
Publication of TW201621754A publication Critical patent/TW201621754A/zh
Application granted granted Critical
Publication of TWI567660B publication Critical patent/TWI567660B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2451Classification techniques relating to the decision surface linear, e.g. hyperplane
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/20Linear translation of whole images or parts thereof, e.g. panning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一種多類別物件分類方法及系統在此揭露,其中多類別物件分類方法包含以下步驟:接收並儲存類別、第一訓練影像與第二訓練影像,並從對應類別之第一、第二訓練影像中分別擷取第一、第二特徵影像;利用第一特徵影像,透過線性映射分類方法,產生對應類別之分類器;利用分類器與第二特徵影像,決定對應該些類別之參數範圍與對應該分類器之門檻值。當二參數範圍重疊時,記錄除了二參數範圍以外之餘留參數範圍;由分類器當中選取除了已選取過之分類器以外之另一分類器後,重複執行前一步驟直到參數範圍彼此無重疊並記錄參數範圍。

Description

多類別物件分類方法及系統
本發明是一種分類技術,且特別是有關於一種多類別物件分類方法及系統。
習知的人工智慧或電腦視覺在圖形識別的應用領域中,欲進行多類別物件(Multi-class object)分類常採用直接進行多類別分類,或者利用二元分類法,將多類別分類拆解成數個二分類問題以進行解決。直接進行多類別分類例如提升(Boosting)演算法,透過分析所有的輸入影像的代表點,以多階段投票的方式逐步進行目標物件的分類,所涉及的計算複雜度較高、花費時間較長,而且準確率亦較低,並非良好的解決方法;然而,二元分類法則是時常面臨到的問題則是待處理的影像特徵點過多,以及當影像當中的不同物件之間距離較為接近時,對於多類別分類之計算時間過長,尚有改進空間。另外,傳統二元分類法在最佳情況下透過單次分類過程僅可區分出一個單一類別;如果類別數量龐大,分類過程的次數也必須增加以區分出每個不同類別,導致較低的分類效率。
為了提升二元分類法對於多類別物件之分類效率,本揭示內容之一態樣是提供一種多類別物件分類方法,其包含以下步驟:(a)接收並儲存複數個類別、複數個第一訓練影像與複數個第二訓練影像,並從該些第一訓練影像中擷取複數個第一特徵影像;利用該些第一特徵影像,透過一線性映射分類方法,產生對應該些類別之複數個分類器,其中該些第一訓練影像與該些第二訓練影像分別對應該些類別;(b)從該些第二訓練影像中擷取複數個第二特徵影像,並從該些分類器中選取一分類器;(c)利用該分類器與該些第二特徵影像,決定對應該些類別之複數個參數範圍與對應該分類器之一門檻值;(d)當該些參數範圍當中之二參數範圍重疊時,記錄除了該二參數範圍以外之餘留參數範圍,並且由該些分類器當中選取除了已選取過之該分類器以外之另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊;(e)當該些參數範圍彼此無重疊時,記錄該些參數範圍;(f)接收並儲存一待決影像,並從該待決影像中擷取一待決特徵影像;利用一分類器與該待決特徵影像,決定一待決參數;(g)當該待決參數大於對應該分類器之該門檻值時,將該待決影像分類至對應該分類器之該類別;(h)當該待決參數位於該些參數範圍之內時,將該待決影像分類至對應該些參數範圍之該些類別。
本揭示內容之一實施例中,其中步驟(a)包含:將該些第一特徵影像分割為複數個特徵區塊,並計算該些特徵區塊之複數個變異數;依遞減順序,由該些變異數之最大值開始選取複數個特徵變異數與對應於該些特徵變異數之複數個特徵區塊;利用該些特徵區塊,透過該線性映射分類方法,產生對應該些類別之複數個分類器。
本揭示內容之一實施例中,其中該線性映射分類方法為支持向量機(Support Vector Machine, SVM)演算法,該些參數範圍與該門檻值均介於-1至1之間。
本揭示內容之一實施例中,其中步驟(a)、(b)、(f)包含:透過方向梯度直方圖(Histogram of Oriented Gradients, HOG)從該些第一訓練影像中擷取該些第一特徵影像;透過方向梯度直方圖從該些第二訓練影像中擷取該些第二特徵影像;透過方向梯度直方圖從該待決影像中擷取該待決特徵影像。
本揭示內容之一實施例中,其中步驟(d)包含:當該二參數範圍重疊時,記錄除了該二參數範圍以外之該餘留參數範圍,並且自對應該二參數範圍之二分類器中選取一者作為該另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊。
本揭示內容之一實施例中,該些第一訓練影像包含複數個正樣本影像與複數個負樣本影像;該些正樣本影像當中具有分別對應該些類別之一物件,該些負樣本影像當中缺少分別對應該些類別之該物件。
本揭示內容之另一態樣是提供一種多類別物件分類系統,其包含輸入裝置、資料庫與處理器,其中該資料庫耦接該輸入單元,而且該處理器耦接該資料庫。輸入單元接收複數個類別、複數個第一訓練影像、複數個第二訓練影像與一待決影像,其中該些第一訓練影像與該些第二訓練影像分別對應該些類別。資料庫儲存該些類別、該些第一訓練影像、該些第二訓練影像與該待決影像。處理器執行下列步驟:(a)從該些第一訓練影像中擷取複數個第一特徵影像;利用該些第一特徵影像,透過一線性映射分類方法,產生對應該些類別之複數個分類器;(b)從該些第二訓練影像中擷取複數個第二特徵影像,並從該些分類器中選取一分類器;(c)利用該分類器與該些第二特徵影像,決定對應該些類別之複數個參數範圍與對應該分類器之一門檻值;(d)當該些參數範圍當中之二參數範圍重疊時,記錄除了該二參數範圍以外之餘留參數範圍,並且由該些分類器當中選取除了已選取過之該分類器以外之另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊;(e)當該些參數範圍彼此無重疊時,記錄該些參數範圍;(f)從該待決影像中擷取一待決特徵影像;利用一分類器與該待決特徵影像,決定一待決參數;(g)當該待決參數大於對應該分類器之該門檻值時,將該待決影像分類至對應該分類器之該類別;以及(h)當該待決參數位於該些參數範圍之內時,將該待決影像分類至對應該些參數範圍之該些類別。
本揭示內容之一實施例中,其中該處理器將該些第一特徵影像分割為複數個特徵區塊,並計算該些特徵區塊之複數個變異數;依遞減順序,由該些變異數之最大值開始選取複數個特徵變異數與對應於該些特徵變異數之複數個特徵區塊;利用該些特徵區塊,透過該線性映射分類方法,產生對應該些類別之複數個分類器。
本揭示內容之一實施例中,其中該線性映射分類方法為支持向量機演算法,該些參數範圍與該門檻值均介於-1至1之間。
本揭示內容之一實施例中,其中該處理器透過方向梯度直方圖從該些第一訓練影像中擷取該些第一特徵影像;透過方向梯度直方圖從該些第二訓練影像中擷取該些第二特徵影像;透過方向梯度直方圖從該待決影像中擷取該待決特徵影像。
本揭示內容之一實施例中,其中該處理器當該二參數範圍重疊時,記錄除了該二參數範圍以外之該餘留參數範圍,並且自對應該二參數範圍之二分類器中選取一者作為該另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊。
本揭示內容之一實施例中,其中該些第一訓練影像包含複數個正樣本影像與複數個負樣本影像;該些正樣本影像當中具有分別對應該些類別之一物件,該些負樣本影像當中缺少分別對應該些類別之該物件。
本揭示內容之又一態樣為一種內儲程式之電腦可讀取記錄媒體,當電腦載入該程式並執行後,可完成執行一種多類別物件分類方法,其包含以下步驟:(a)接收並儲存複數個類別、複數個第一訓練影像與複數個第二訓練影像,並從該些第一訓練影像中擷取複數個第一特徵影像;利用該些第一特徵影像,透過一線性映射分類方法,產生對應該些類別之複數個分類器,其中該些第一訓練影像與該些第二訓練影像分別對應該些類別;(b)從該些第二訓練影像中擷取複數個第二特徵影像,並從該些分類器中選取一分類器;(c)利用該分類器與該些第二特徵影像,決定對應該些類別之複數個參數範圍與對應該分類器之一門檻值;(d)當該些參數範圍當中之二參數範圍重疊時,記錄除了該二參數範圍以外之餘留參數範圍,並且由該些分類器當中選取除了已選取過之該分類器以外之另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊;(e)當該些參數範圍彼此無重疊時,記錄該些參數範圍;(f)接收並儲存一待決影像,並從該待決影像中擷取一待決特徵影像;利用一分類器與該待決特徵影像,決定一待決參數;(g)當該待決參數大於對應該分類器之該門檻值時,將該待決影像分類至對應該分類器之該類別;(h)當該待決參數位於該些參數範圍之內時,將該待決影像分類至對應該些參數範圍之該些類別。
本揭示內容之一實施例中,其中步驟(a)包含:將該些第一特徵影像分割為複數個特徵區塊,並計算該些特徵區塊之複數個變異數;依遞減順序,由該些變異數之最大值開始選取複數個特徵變異數與對應於該些特徵變異數之複數個特徵區塊;利用該些特徵區塊,透過該線性映射分類方法,產生對應該些類別之複數個分類器。
本揭示內容之一實施例中,其中該線性映射分類方法為支持向量機演算法,該些參數範圍與該門檻值均介於-1至1之間。
本揭示內容之一實施例中,其中步驟(a)、(b)、(f)包含:透過方向梯度直方圖從該些第一訓練影像中擷取該些第一特徵影像;透過方向梯度直方圖從該些第二訓練影像中擷取該些第二特徵影像;透過方向梯度直方圖從該待決影像中擷取該待決特徵影像。
本揭示內容之一實施例中,其中步驟(d)包含:當該二參數範圍重疊時,記錄除了該二參數範圍以外之該餘留參數範圍,並且自對應該二參數範圍之二分類器中選取一者作為該另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊。
本揭示內容之一實施例中,該些第一訓練影像包含複數個正樣本影像與複數個負樣本影像;該些正樣本影像當中具有分別對應該些類別之一物件,該些負樣本影像當中缺少分別對應該些類別之該物件。
綜上所述,本揭示內容係以提升二元分類法對於多類別物件分類之效率為出發點,利用記錄不同類別之訓練影像與其中一類別之分類器透過線性映射方法所產生的參數範圍,得以較少的分類步驟達到多類別物件的分類效果;此外,利用特徵影像劃分特徵影像為影像區塊並選取變異數較大的影像區塊作為代表,透過線性映射分類方法已產生分類器可大幅降低待處理之樣本數量,節省運算時間,明顯提升多類別物件分類之效率。
以下將以實施方式對上述之說明作詳細的描述,並對本揭示內容之技術方案提供更進一步的解釋。
為了使本揭示內容之敘述更加詳盡與完備,可參照附圖及以下所述之各種實施例。但所提供之實施例並非用以限制本發明所涵蓋的範圍;步驟的描述亦非用以限制其執行之順序,任何由重新組合,所產生具有均等功效的裝置,皆為本發明所涵蓋的範圍。
如圖1A~1B所示,其係繪示本發明之第一實施例之多類別物件分類方法100,圖1A與圖1B以A點作為步驟之間的連接點。多類別物件分類方法100可應用於如圖4所示的多類別物件分類系統400中。此多類別物件分類方法100可實作為一電腦程式,並儲存於一電腦可讀取記錄媒體中,而使電腦讀取此記錄媒體後執行多類別物件分類方法。電腦可讀取記錄媒體可為唯讀記憶體(Read Only Memory, ROM)、快閃記憶體(flash memory)、軟碟(soft disk)、硬碟(hard disk)、光碟、隨身碟(pen drive)、磁帶(magnetic tape)、可由網路存取之資料庫或熟悉此技藝者可輕易思及具有相同功能之電腦可讀取紀錄媒體。然熟習本案之技藝者應瞭解到,在本實施方式中所提及的步驟,除特別敘明其順序者外,均可依實際需要調整其前後順序,甚至可同時或部分同時執行。
首先,於步驟S102,接收並儲存使用者定義之複數個類別、複數個第一訓練影像與複數個第二訓練影像;其中該些第一訓練影像與該些第二訓練影像均分別對應該些類別。舉例而言,使用者可定義類別A、B、C、D,每個類別分別具有對應的複數個第一訓練影像與複數個第二訓練影像。從該些第一訓練影像中擷取複數個第一特徵影像以進行第一訓練階段並產生複數個分類器;其中第一訓練過程使用線性映射分類方法,而且分類器數目與類別數目相等。本實施例中,產生之分類器為對應於類別A~D之分類器A~D,分類器具有分類出對應類別以及非對應類別的功能。舉例而言,分類器A可用以分出類別A與非類別A,以此類推。具體而言,線性映射分類方法可為支持向量機演算法、費雪線性判別分析(Fisher's Linear Discriminant)、單純貝氏分類器(Naive Bayes classifier)。
接著,於步驟S104中,從該些第二訓練影像中擷取複數個第二特徵影像,並從該些分類器中選取一分類器以進行第二訓練階段。於步驟S106中,利用該分類器與該些第二特徵影像,決定對應該些類別之複數個參數範圍與對應該分類器之一門檻值;舉例而言,該些參數範圍與該門檻值均介於-1至1之間。可依需求定義門檻值作為分類為該類別之標準;舉例而言,分類器A之門檻值定義為0.8,當一參數大於0.8時判斷為類別A;當一參數小於0.8時判斷為非類別A。
上述之參數範圍乃透過一類別之複數個第二特徵影像之特徵值與該分類器的參數值所計算出的複數個參數所決定。計算公式如下:
上述的公式中:Si 為第二特徵影像之特徵值,Vi α i ρ 均為所選取分類器之參數值,Sum 即為計算出之參數。因此,複數個第二特徵影像將計算出複數個參數,形成一個參數範圍。透過上述公式,利用對應複數個類別之複數個第二特徵影像之特徵值與一分類器內的參數值產生複數個對應該些類別的參數範圍。如圖2所示,該些參數範圍與該些類別具有對應關係,其中與該分類器對應同一類別的參數範圍最接近1。
步驟S108中,檢查該些參數範圍是否重疊;當該些參數範圍當中之二參數範圍重疊時,記錄除了該二參數範圍以外之餘留參數範圍,並且由該些分類器當中選取除了已選取過之該分類器以外之另一分類器後,重複執行步驟S106直到該些參數範圍彼此無重疊(步驟S110);當該些參數範圍彼此無重疊時,記錄該些參數範圍(步驟S112)。舉例而言,圖2為分別對應類別A~D之第二訓練影像與分類器A之參數所決定的參數範圍示意圖。對應類別A之參數範圍202位於門檻值與1之間,對應類別B~D之參數範圍204~208則位於-1與門檻值之間。對應類別B之參數範圍204與對應類別C之參數範圍206重疊,表示分類器A無法適當分辨出類別B與類別C;因此,記錄可辨別之對應類別A之參數範圍202與對應類別D之參數範圍208,並且重新選取除了分類器A以外的分類器B~D其中一者,重複步驟S106直到所有對應類別之參數範圍均不重疊,並記錄下無重疊之參數範圍。舉例而言,圖3為分別對應類別A~D之第二訓練影像與分類器B之參數所決定的參數範圍示意圖,所有參數範圍302~308均未重疊;因此,記錄參數範圍之後的分類器B具有分類出類別A~D的功能。由此可知,經過記錄參數範圍之後的分類器A~D其中任一者均具有分類出類別A~D的潛力,相較於第一訓練階段產生之分類器,具有顯著提升的分類功能。
步驟S114開始為偵測階段,接收並儲存待決影像,並從待決影像中擷取待決特徵影像;利用分類器與待決特徵影像,決定待決參數;步驟S116中,檢查該待決參數是否大於對應分類器之門檻值;當該待決參數大於對應分類器之門檻值時,將待決影像分類至對應分類器之該類別(步驟S118);當該待決參數小於對應分類器之門檻值時,於步驟S120中,檢查待決參數是否位於對應類別之參數範圍之內;當待決參數位於該些參數範圍之內時,將該待決影像分類至對應該些參數範圍之該些類別。舉例而言,利用分類器A之參數值與待決特徵影像,透過上述公式決定待決參數。當待決參數大於分類器A之門檻值時,將待決影像分類至類別A;或者,當待決參數小於分類器A之門檻值,並且位於類別B之參數範圍內時,將待決影像分類至類別B;或者,當待決參數小於分類器A之門檻值,並且位於類別C之參數範圍內時,則將待決影像分類至類別C。綜上所述,經過記錄對應類別A~D之參數範圍後之分類器A~D,除了可分辨出分類器所對應類別之外,同時具有分辨其他類別的功能,因此可達成步驟較少、效率較高之多類別物件分類。
為減少產生分類器之影像樣本數目,於一實施例中,將上述之第一訓練影像分割為複數個特徵區塊,並計算該些特徵區塊之複數個變異數。依遞減順序,由該些變異數之最大值開始選取複數個特徵變異數與對應於該些特徵變異數之複數個特徵區塊。選取變異數大的數個特徵區塊以代表該張影像,接者利用該些特徵區塊,透過該線性映射分類方法,產生對應該些類別之複數個分類器。所選取特徵區塊之數目可依需求彈性調整,可顯著減少產生分類器所需的樣本數目,進而提升運行效率。
再者,於一實施例中,線性映射分類方法為支持向量機演算法。將對應類別之第一訓練影像輸入支持向量機演算法以決定可分類出對應類別以及非對應類別功能之超平面(hyperplane),進而產生對應類別之分類器。
或者,於一實施例中,透過方向梯度直方圖以擷取特徵影像;亦即,透過方向梯度直方圖分別從該些第一訓練影像、該些第二訓練影像與待決影像中分別擷取出該些第一特徵影像、該些第二特徵影像與該待決特徵影像。
再者,於一實施例中,當該二參數範圍重疊時,記錄除了該二參數範圍以外之餘留參數範圍,並且由對應該二參數範圍之該些分類器當中選取一分類器後,重複執行步驟S106直到該些參數範圍彼此無重疊。舉例而言,如圖2所示,對應類別A之參數範圍202位於門檻值與1之間,對應類別B~D之參數範圍則位於-1與門檻值之間。當對應類別B之參數範圍204與對應類別C之參數範圍206重疊時,表示分類器A無法適當分辨出類別B與類別C;因此,記錄可辨別之對應類別A之參數範圍202與對應類別D之參數範圍208,並且重新選取分類器B、C其中一者,重複步驟S106直到所有對應類別之參數範圍均不重疊,並記錄下無重疊之參數範圍。直接從參數範圍重疊之分類器B、C當中選取,以較快找出可分辨類別B、C之分類器。
再者,於一實施例中,該些第一訓練影像包含複數個正樣本影像與複數個負樣本影像;該些正樣本影像當中具有分別對應該些類別之一物件,該些負樣本影像當中缺少分別對應該些類別之該物件。舉例而言,產生分類器A的流程中,將具有類別A的物件之影像作為正樣本影像,將缺少類別A的物件之影像作為負樣本影像;因此,僅具有類別B~D之影像亦可作為負樣本影像以產生分類器A。透過輸入正樣本影像與負樣本影像至線性映射分類法,以提升所產生之分類器之識別功能。
請參考圖4,其係繪示本發明之第二實施例之多類別物件分類系統400。多類別物件分類系統400包含輸入裝置410、資料庫420與處理器430。實作上,輸入裝置410可為傳輸埠(USB、GPIB或其他介面)。資料庫420可為硬碟、快閃記憶體或其他儲存媒介;處理器430可為中央處理器、微控制器或其他電路。
首先,輸入裝置410接收並儲存使用者定義之複數個類別442、複數個第一訓練影像444與複數個第二訓練影像446於資料庫420內;其中該些第一訓練影像444與該些第二訓練影像446均分別對應該些類別442。舉例而言,使用者可定義類別A、B、C、D,每個類別分別具有對應的複數個第一訓練影像444與複數個第二訓練影像446。從該些第一訓練影像444中擷取複數個第一特徵影像以進行第一訓練階段並產生複數個分類器;其中第一訓練過程使用線性映射分類方法,而且分類器數目與類別442數目相等。本實施例中,產生之分類器為對應於類別A~D之分類器A~D,分類器具有分類出對應類別以及非對應類別的功能。舉例而言,分類器A可用以分出類別A與非類別A,以此類推。具體而言,線性映射分類方法可為支持向量機演算法、費雪線性判別分析、單純貝氏分類器。
接著,處理器430從該些第二訓練影像446中擷取複數個第二特徵影像,並從該些分類器中選取一分類器以進行第二訓練階段。處理器430利用該分類器與該些第二特徵影像,決定對應該些類別442之複數個參數範圍與對應該分類器之一門檻值;舉例而言,該些參數範圍與該門檻值均介於-1至1之間。可依需求定義門檻值作為分類為該類別之標準;舉例而言,分類器A之門檻值定義為0.8,當一參數大於0.8時判斷為類別A;當一參數小於0.8時判斷為非類別A。
上述之參數範圍乃處理器430透過一類別之複數個第二特徵影像之特徵值與該分類器的參數值所計算出的複數個參數所決定。計算公式如下:
上述的公式中:Si 為第二特徵影像之特徵值,Vi α i ρ 均為所選取分類器之參數值,Sum 即為計算出之參數。因此,複數個第二特徵影像將計算出複數個參數,形成一個參數範圍。透過上述公式,處理器430利用對應複數個類別442之複數個第二特徵影像之特徵值與一分類器內的參數值產生複數個對應該些類別442的參數範圍。如圖2所示,該些參數範圍與該些類別442具有對應關係,其中與該分類器對應同一類別的參數範圍最接近1。
接著,處理器430檢查該些參數範圍是否重疊;當該些參數範圍當中之二參數範圍重疊時,處理器430記錄除了該二參數範圍以外之餘留參數範圍,並且由該些分類器當中選取除了已選取過之該分類器以外之另一分類器後,重複執行直到該些參數範圍彼此無重疊;當該些參數範圍彼此無重疊時,處理器430記錄該些參數範圍。舉例而言,圖2為分別對應類別A~D之第二訓練影像與分類器A之參數所決定的參數範圍示意圖。對應類別A之參數範圍202位於門檻值與1之間,對應類別B~D之參數範圍204~208則位於-1與門檻值之間。對應類別B之參數範圍204與對應類別C之參數範圍206重疊,表示分類器A無法適當分辨出類別B與類別C;因此,處理器430記錄可辨別之對應類別A之參數範圍202與對應類別D之參數範圍208,並且重新選取除了分類器A以外的分類器B~D其中一者,重複執行直到所有對應類別442之參數範圍均不重疊,並記錄無重疊之參數範圍。舉例而言,圖3為分別對應類別A~D之第二訓練影像與分類器B之參數所決定的參數範圍示意圖,所有參數範圍302~308均未重疊;因此,處理器430記錄參數範圍之後的分類器B具有分類出類別A~D的功能。由此可知,經過記錄參數範圍之後的分類器A~D其中任一者均具有分類出類別A~D的潛力,相較於第一訓練階段產生之分類器,具有顯著提升的分類功能。
處理器430接收並儲存待決影像448於資料庫420內,並從待決影像448中擷取待決特徵影像;利用分類器與待決特徵影像,決定待決參數。處理器430檢查該待決參數是否大於對應分類器之門檻值;當該待決參數大於對應分類器之門檻值時,處理器430將待決影像448分類至對應分類器之該類別;當該待決參數小於對應分類器之門檻值時,處理器430檢查待決參數是否位於對應類別442之參數範圍之內;當待決參數位於該些參數範圍之內時,處理器430將該待決影像448分類至對應該些參數範圍之該些類別442。舉例而言,處理器430利用分類器A之參數值與待決特徵影像,透過上述公式決定待決參數。當待決參數大於分類器A之門檻值時,處理器430將待決影像448分類至類別A;或者,當待決參數小於分類器A之門檻值,並且位於類別B之參數範圍內時,處理器430將待決影像448分類至類別B;或者,當待決參數小於分類器A之門檻值,並且位於類別C之參數範圍內時,處理器430則將待決影像448分類至類別C。綜上所述,經過記錄對應類別A~D之參數範圍後之分類器A~D,除了可分辨出分類器所對應類別之外,同時具有分辨其他類別的功能,因此可達成步驟較少、效率較高之多類別物件分類。
為減少產生分類器之影像樣本數目,於一實施例中,處理器430將上述之第一訓練影像444分割為複數個特徵區塊,並計算該些特徵區塊之複數個變異數。依遞減順序,處理器430由該些變異數之最大值開始選取複數個特徵變異數與對應於該些特徵變異數之複數個特徵區塊。處理器430選取變異數大的數個特徵區塊以代表該張影像,接者利用該些特徵區塊,透過該線性映射分類方法,產生對應該些類別442之複數個分類器。所選取特徵區塊之數目可依需求彈性調整,可顯著減少產生分類器所需的樣本數目,進而提升運行效率。
再者,於一實施例中,線性映射分類方法為支持向量機演算法。將對應類別之第一訓練影像輸入支持向量機演算法以決定可分類出對應類別以及非對應類別功能之超平面,處理器430進而產生對應類別之分類器。
或者,於一實施例中,處理器430透過方向梯度直方圖以擷取特徵影像;亦即,處理器430透過方向梯度直方圖分別從該些第一訓練影像444、該些第二訓練影像446與待決影像448中分別擷取出該些第一特徵影像、該些第二特徵影像與該待決特徵影像。
再者,於一實施例中,當該二參數範圍重疊時,處理器430記錄除了該二參數範圍以外之餘留參數範圍,並且由對應該二參數範圍之該些分類器當中選取一分類器後,重複執行直到該些參數範圍彼此無重疊。舉例而言,如圖2所示,對應類別A之參數範圍202位於門檻值與1之間,對應類別B~D之參數範圍則位於-1與門檻值之間。當對應類別B之參數範圍204與對應類別C之參數範圍206重疊時,表示分類器A無法適當分辨出類別B與類別C;因此,處理器430記錄可辨別之對應類別A之參數範圍202與對應類別D之參數範圍208,並且重新選取分類器B、C其中一者,重複執行直到所有對應類別442之參數範圍均不重疊,並記錄下無重疊之參數範圍。直接從參數範圍重疊之分類器B、C當中選取,以較快找出可分辨類別B、C之分類器。
再者,於一實施例中,該些第一訓練影像444包含複數個正樣本影像與複數個負樣本影像;該些正樣本影像當中具有分別對應該些類別之一物件,該些負樣本影像當中缺少分別對應該些類別之該物件。舉例而言,產生分類器A的流程中,處理器430將具有類別A的物件之影像作為正樣本影像,將缺少類別A的物件之影像作為負樣本影像;因此,僅具有類別B~D之影像亦可作為負樣本影像以產生分類器A。透過輸入正樣本影像與負樣本影像至線性映射分類法,以提升處理器430產生之分類器之識別功能。
綜上所述,本揭示內容得以經由上述實施例,利用記錄不同類別之訓練影像與其中一類別之分類器透過線性映射方法所產生的參數範圍,得以較少的分類步驟達到多類別物件的分類效果;此外,利用特徵影像劃分特徵影像為影像區塊並選取變異數較大的影像區塊作為代表,透過線性映射分類方法已產生分類器可大幅降低待處理之樣本數量,節省運算時間,明顯提升多類別物件分類之效率。
雖然本揭示內容已以實施方式揭露如上,然其並非用以限定本發明,任何熟習此技藝者,在不脫離本揭示內容之精神和範圍內,當可作各種之更動與潤飾,因此本發明之保護範圍當視申請專利範圍所界定者為準。
為讓本揭示內容之上述和其他目的、特徵、優點與實施例能更明顯易懂,所附符號之說明如下:
100‧‧‧多類別物件分類方法
S102~S120‧‧‧步驟
202‧‧‧對應類別A之參數範圍
204‧‧‧對應類別B之參數範圍
206‧‧‧對應類別C之參數範圍
208‧‧‧對應類別D之參數範圍
302‧‧‧對應類別B之參數範圍
304‧‧‧對應類別A之參數範圍
306‧‧‧對應類別C之參數範圍
308‧‧‧對應類別D之參數範圍
400‧‧‧多類別物件分類系統
410‧‧‧輸入裝置
420‧‧‧資料庫
430‧‧‧處理器
442‧‧‧類別
444‧‧‧第一訓練影像
446‧‧‧第二訓練影像
448‧‧‧待決影像
為讓本揭示內容之上述和其他目的、特徵、優點與實施例能更明顯易懂,所附圖示之說明如下: 圖1A~1B係說明本揭示內容第一實施例之多類別物件分類方法流程圖; 圖2係說明分別對應類別A~D之第二訓練影像與分類器A之參數所決定的參數範圍示意圖; 圖3係說明分別對應類別A~D之第二訓練影像與分類器B之參數所決定的參數範圍示意圖;以及 圖4係說明本揭示內容第二實施例之多類別物件分類系統示意圖。
100‧‧‧多類別物件分類方法
S102~S112‧‧‧步驟

Claims (18)

  1. 一種多類別物件分類方法,包含下列步驟: (a)接收並儲存複數個類別、複數個第一訓練影像與複數個第二訓練影像,並從該些第一訓練影像中擷取複數個第一特徵影像;利用該些第一特徵影像,透過一線性映射分類方法,產生對應該些類別之複數個分類器,其中該些第一訓練影像與該些第二訓練影像分別對應該些類別; (b)從該些第二訓練影像中擷取複數個第二特徵影像,並從該些分類器中選取一分類器; (c)利用該分類器與該些第二特徵影像,決定對應該些類別之複數個參數範圍與對應該分類器之一門檻值; (d)當該些參數範圍當中之二參數範圍重疊時,記錄除了該二參數範圍以外之餘留參數範圍,並且由該些分類器當中選取除了已選取過之該分類器以外之另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊; (e)當該些參數範圍彼此無重疊時,記錄該些參數範圍; (f)接收並儲存一待決影像,並從該待決影像中擷取一待決特徵影像;利用一分類器與該待決特徵影像,決定一待決參數; (g)當該待決參數大於對應該分類器之該門檻值時,將該待決影像分類至對應該分類器之該類別;以及 (h)當該待決參數位於該些參數範圍之內時,將該待決影像分類至對應該些參數範圍之該些類別。
  2. 如請求項1所述之多類別物件分類方法,其中步驟(a)包含: 將該些第一特徵影像分割為複數個特徵區塊,並計算該些特徵區塊之複數個變異數;依遞減順序,由該些變異數之最大值開始選取複數個特徵變異數與對應於該些特徵變異數之複數個特徵區塊;利用該些特徵區塊,透過該線性映射分類方法,產生對應該些類別之複數個分類器。
  3. 如請求項2所述之多類別物件分類方法,其中該線性映射分類方法為支持向量機(Support Vector Machine)演算法;該些參數範圍與該門檻值均介於-1至1之間。
  4. 如請求項2所述之多類別物件分類方法,其中步驟(a)、(b)、(f)包含: 透過方向梯度直方圖(Histogram of Oriented Gradients)從該些第一訓練影像中擷取該些第一特徵影像; 透過方向梯度直方圖從該些第二訓練影像中擷取該些第二特徵影像; 透過方向梯度直方圖從該待決影像中擷取該待決特徵影像。
  5. 如請求項2所述之多類別物件分類方法,其中步驟(d)包含: 當該二參數範圍重疊時,記錄除了該二參數範圍以外之該餘留參數範圍,並且自對應該二參數範圍之二分類器中選取一者作為該另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊。
  6. 如請求項2所述之多類別物件分類方法,其中該些第一訓練影像包含複數個正樣本影像與複數個負樣本影像;該些正樣本影像當中具有分別對應該些類別之一物件,該些負樣本影像當中缺少分別對應該些類別之該物件。
  7. 一種多類別物件分類系統,包含: 一輸入裝置,接收複數個類別、複數個第一訓練影像、複數個第二訓練影像與一待決影像,其中該些第一訓練影像與該些第二訓練影像分別對應該些類別; 一資料庫,耦接該輸入裝置,儲存該些類別、該些第一訓練影像、該些第二訓練影像與該待決影像;以及 一處理器,耦接該資料庫,執行下列步驟: (a)從該些第一訓練影像中擷取複數個第一特徵影像;利用該些第一特徵影像,透過一線性映射分類方法,產生對應該些類別之複數個分類器; (b)從該些第二訓練影像中擷取複數個第二特徵影像,並從該些分類器中選取一分類器; (c)利用該分類器與該些第二特徵影像,決定對應該些類別之複數個參數範圍與對應該分類器之一門檻值; (d)當該些參數範圍當中之二參數範圍重疊時,記錄除了該二參數範圍以外之餘留參數範圍,並且由該些分類器當中選取除了已選取過之該分類器以外之另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊; (e)當該些參數範圍彼此無重疊時,記錄該些參數範圍; (f)從該待決影像中擷取一待決特徵影像;利用一分類器與該待決特徵影像,決定一待決參數; (g)當該待決參數大於對應該分類器之該門檻值時,將該待決影像分類至對應該分類器之該類別;以及 (h)當該待決參數位於該些參數範圍之內時,將該待決影像分類至對應該些參數範圍之該些類別。
  8. 如請求項7所述之多類別物件分類系統,其中該處理器將該些第一特徵影像分割為複數個特徵區塊,並計算該些特徵區塊之複數個變異數;依遞減順序,由該些變異數之最大值開始選取複數個特徵變異數與對應於該些特徵變異數之複數個特徵區塊;利用該些特徵區塊,透過該線性映射分類方法,產生對應該些類別之複數個分類器。
  9. 如請求項8所述之多類別物件分類系統,其中該線性映射分類方法為支持向量機演算法;該些參數範圍與該門檻值均介於-1至1之間。
  10. 如請求項8所述之多類別物件分類系統,其中該處理器透過方向梯度直方圖從該些第一訓練影像中擷取該些第一特徵影像;透過方向梯度直方圖從該些第二訓練影像中擷取該些第二特徵影像;透過方向梯度直方圖從該待決影像中擷取該待決特徵影像。
  11. 如請求項8所述之多類別物件分類系統,其中該處理器當該二參數範圍重疊時,記錄除了該二參數範圍以外之該餘留參數範圍,並且自對應該二參數範圍之二分類器中選取一者作為該另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊。
  12. 如請求項8所述之多類別物件分類系統,其中該些第一訓練影像包含複數個正樣本影像與複數個負樣本影像;該些正樣本影像當中具有分別對應該些類別之一物件,該些負樣本影像當中缺少分別對應該些類別之該物件。
  13. 一種內儲程式之電腦可讀取記錄媒體,當電腦載入該程式並執行後,可完成執行一種多類別物件分類方法,包含下列步驟: (a)接收並儲存複數個類別、複數個第一訓練影像與複數個第二訓練影像,並從該些第一訓練影像中擷取複數個第一特徵影像;利用該些第一特徵影像,透過一線性映射分類方法,產生對應該些類別之複數個分類器,其中該些第一訓練影像與該些第二訓練影像分別對應該些類別; (b)從該些第二訓練影像中擷取複數個第二特徵影像,並從該些分類器中選取一分類器; (c)利用該分類器與該些第二特徵影像,決定對應該些類別之複數個參數範圍與對應該分類器之一門檻值; (d)當該些參數範圍當中之二參數範圍重疊時,記錄除了該二參數範圍以外之餘留參數範圍,並且由該些分類器當中選取除了已選取過之該分類器以外之另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊; (e)當該些參數範圍彼此無重疊時,記錄該些參數範圍; (f)接收並儲存一待決影像,並從該待決影像中擷取一待決特徵影像;利用一分類器與該待決特徵影像,決定一待決參數; (g)當該待決參數大於對應該分類器之該門檻值時,將該待決影像分類至對應該分類器之該類別;以及 (h)當該待決參數位於該些參數範圍之內時,將該待決影像分類至對應該些參數範圍之該些類別。
  14. 如請求項13所述之電腦可讀取記錄媒體,其中步驟(a)包含: 將該些第一特徵影像分割為複數個特徵區塊,並計算該些特徵區塊之複數個變異數;依遞減順序,由該些變異數之最大值開始選取複數個特徵變異數與對應於該些特徵變異數之複數個特徵區塊;利用該些特徵區塊,透過該線性映射分類方法,產生對應該些類別之複數個分類器。
  15. 如請求項14所述之電腦可讀取記錄媒體,其中該線性映射分類方法為支持向量機演算法;該些參數範圍與該門檻值均介於-1至1之間。
  16. 如請求項14所述之電腦可讀取記錄媒體,其中步驟(a)、(b)、(f)包含: 透過方向梯度直方圖從該些第一訓練影像中擷取該些第一特徵影像; 透過方向梯度直方圖從該些第二訓練影像中擷取該些第二特徵影像; 透過方向梯度直方圖從該待決影像中擷取該待決特徵影像。
  17. 如請求項14所述之電腦可讀取記錄媒體,其中步驟(d)包含: 當該二參數範圍重疊時,記錄除了該二參數範圍以外之該餘留參數範圍,並且自對應該二參數範圍之二分類器中選取一者作為該另一分類器後,重複執行步驟(c)直到該些參數範圍彼此無重疊。
  18. 如請求項14所述之電腦可讀取記錄媒體,其中該些第一訓練影像包含複數個正樣本影像與複數個負樣本影像;該些正樣本影像當中具有分別對應該些類別之一物件,該些負樣本影像當中缺少分別對應該些類別之該物件。
TW104101625A 2014-12-03 2015-01-19 多類別物件分類方法及系統 TWI567660B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410724928.4A CN105718937B (zh) 2014-12-03 2014-12-03 多类别对象分类方法及系统

Publications (2)

Publication Number Publication Date
TW201621754A true TW201621754A (zh) 2016-06-16
TWI567660B TWI567660B (zh) 2017-01-21

Family

ID=56083156

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104101625A TWI567660B (zh) 2014-12-03 2015-01-19 多類別物件分類方法及系統

Country Status (3)

Country Link
US (1) US9361544B1 (zh)
CN (1) CN105718937B (zh)
TW (1) TWI567660B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI649659B (zh) * 2017-10-27 2019-02-01 財團法人工業技術研究院 自動光學檢測影像分類方法、系統及含有該方法之電腦可讀取媒體
US11315231B2 (en) 2018-06-08 2022-04-26 Industrial Technology Research Institute Industrial image inspection method and system and computer readable recording medium

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295666B (zh) * 2015-05-14 2020-03-03 佳能株式会社 获取分类器、检测对象的方法和装置及图像处理设备
CN106778801A (zh) * 2016-11-16 2017-05-31 卡尔蔡司(上海)管理有限公司 用于分析观测对象的类别的方法和装置
WO2019218334A1 (en) * 2018-05-18 2019-11-21 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for user analysis
CN110751617A (zh) * 2018-07-06 2020-02-04 台达电子工业股份有限公司 口腔影像分析系统和方法
CN110348484A (zh) * 2019-06-10 2019-10-18 天津大学 一种用于极性电子器件分类的方法
CN110599451B (zh) * 2019-08-05 2023-01-20 平安科技(深圳)有限公司 医学图像病灶检测定位方法、装置、设备及存储介质
CN111723856B (zh) * 2020-06-11 2023-06-09 广东浪潮大数据研究有限公司 一种图像数据处理方法、装置、设备及可读存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7769228B2 (en) * 2004-05-10 2010-08-03 Siemens Corporation Method for combining boosted classifiers for efficient multi-class object detection
US7899253B2 (en) * 2006-09-08 2011-03-01 Mitsubishi Electric Research Laboratories, Inc. Detecting moving objects in video by classifying on riemannian manifolds
US8244044B2 (en) * 2008-04-25 2012-08-14 Microsoft Corporation Feature selection and extraction
CN101853389A (zh) * 2009-04-01 2010-10-06 索尼株式会社 多类目标的检测装置及检测方法
US8725660B2 (en) * 2009-07-30 2014-05-13 Hewlett-Packard Development Company, L.P. Applying non-linear transformation of feature values for training a classifier
TWI415032B (zh) * 2009-10-30 2013-11-11 Univ Nat Chiao Tung Object tracking method
US8447139B2 (en) * 2010-04-13 2013-05-21 International Business Machines Corporation Object recognition using Haar features and histograms of oriented gradients
CN101901354B (zh) * 2010-07-09 2014-08-20 浙江大学 基于特征点分类的监控录像中实时多目标检测与跟踪方法
CN102667859B (zh) * 2010-09-10 2016-01-20 松下电器(美国)知识产权公司 由排他性分类器进行的一般物体的图像识别装置及方法
KR20120064581A (ko) * 2010-12-09 2012-06-19 한국전자통신연구원 영상 분류 방법 및 이를 위한 장치
US8781218B2 (en) * 2011-11-02 2014-07-15 Nec Laboratories America, Inc. Receptive field learning for pooled image features
US8761498B1 (en) * 2012-01-26 2014-06-24 Google Inc. Face and license plate detection in street level images with 3-D road width features estimated from laser data
CN102831447B (zh) * 2012-08-30 2015-01-21 北京理工大学 多类别面部表情高精度识别方法
US9213892B2 (en) * 2012-12-21 2015-12-15 Honda Motor Co., Ltd. Real-time bicyclist detection with synthetic training data
TWI497449B (zh) * 2012-12-26 2015-08-21 Ind Tech Res Inst 非監督式調適方法與應用其之影像自動分類方法
US9112984B2 (en) * 2013-03-12 2015-08-18 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
TW201441849A (zh) * 2013-04-30 2014-11-01 Ibm 自動決定圖像樣本群以進行分析之方法、系統及電腦程式產品
CN103996017B (zh) * 2014-02-24 2018-08-31 航天恒星科技有限公司 一种基于Hu不变矩和支持向量机的舰船检测方法
CN103942564B (zh) * 2014-04-08 2017-02-15 武汉大学 基于非监督特征学习的高分辨率遥感影像场景分类方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI649659B (zh) * 2017-10-27 2019-02-01 財團法人工業技術研究院 自動光學檢測影像分類方法、系統及含有該方法之電腦可讀取媒體
US10636133B2 (en) 2017-10-27 2020-04-28 Industrial Technology Research Institute Automated optical inspection (AOI) image classification method, system and computer-readable media
US11315231B2 (en) 2018-06-08 2022-04-26 Industrial Technology Research Institute Industrial image inspection method and system and computer readable recording medium

Also Published As

Publication number Publication date
US20160162757A1 (en) 2016-06-09
CN105718937A (zh) 2016-06-29
CN105718937B (zh) 2019-04-05
US9361544B1 (en) 2016-06-07
TWI567660B (zh) 2017-01-21

Similar Documents

Publication Publication Date Title
TWI567660B (zh) 多類別物件分類方法及系統
Seo et al. Training-free, generic object detection using locally adaptive regression kernels
US9292745B2 (en) Object detection apparatus and method therefor
US8675974B2 (en) Image processing apparatus and image processing method
WO2019163985A1 (ja) 特徴表現装置、特徴表現方法、およびプログラム
TW201926140A (zh) 影像標註方法、電子裝置及非暫態電腦可讀取儲存媒體
US9294665B2 (en) Feature extraction apparatus, feature extraction program, and image processing apparatus
Dubey et al. Fruit and vegetable recognition by fusing colour and texture features of the image using machine learning
Schwartz et al. A novel feature descriptor based on the shearlet transform
US8503768B2 (en) Shape description and modeling for image subscene recognition
Holzer et al. Learning to efficiently detect repeatable interest points in depth data
Dawar et al. Continuous detection and recognition of actions of interest among actions of non-interest using a depth camera
JP6713162B2 (ja) 画像認識装置、画像認識方法、及び画像認識プログラム
JP2013117861A (ja) 学習装置、学習方法およびプログラム
KR101584091B1 (ko) 공유 지역 특징을 이용한 다시점 객체 검출 방법
JP6338781B2 (ja) 学習装置および学習識別システム
KR101521136B1 (ko) 얼굴 인식 방법 및 얼굴 인식 장치
Sanin et al. K-tangent spaces on Riemannian manifolds for improved pedestrian detection
Choi et al. Determining the existence of objects in an image and its application to image thumbnailing
Loderer et al. Optimization of LBP parameters
Akbas et al. Low-level image segmentation based scene classification
Zweng et al. Performance evaluation of an improved relational feature model for pedestrian detection
Dhar et al. Fish image classification by XgBoost based on Gist and GLCM Features
Jensch et al. A comparative evaluation of three skin color detection approaches
Almomani et al. Object tracking via Dirichlet process-based appearance models