TWI706334B - 圖像分類方法、電子裝置和存儲介質 - Google Patents
圖像分類方法、電子裝置和存儲介質 Download PDFInfo
- Publication number
- TWI706334B TWI706334B TW107145069A TW107145069A TWI706334B TW I706334 B TWI706334 B TW I706334B TW 107145069 A TW107145069 A TW 107145069A TW 107145069 A TW107145069 A TW 107145069A TW I706334 B TWI706334 B TW I706334B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- classifier
- probability value
- image classifier
- classifiers
- Prior art date
Links
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一種圖像分類方法、電子裝置和存儲介質,該方法包括:若在第一層分類器集合中無法直接識別待識別圖像,可以從所述第一層分類器集合中選擇第一概率值靠前的分類器對應的圖像類型,並根據所述對應的圖像類型建立第二層分類器集合,再對所述待識別圖像進行識別,當所述待識別圖像通過所述第二層分類器集合中的分類器識別後,選取所述第二層分類器集合中第二概率值最大的圖像分類器輸出的結果作為分類結果。實施本發明,可以進行圖片識別,並輸出識別結果。
Description
本發明涉及影像處理技術領域,尤其涉及一種圖像分類方法、電子裝置和存儲介質。
鑒於以上內容,有必要提供一種圖像分類方法、電子裝置和存儲介質,可以將不夠確定的圖像進行識別,並輸出識別結果。
一種圖像分類方法,該方法包括:提取待識別圖像的CNN特徵;將所述待識別圖像輸入到預建的第一層圖像分類器集合中,根據所述待識別圖像的CNN特徵獲取所述第一層圖像分類器集合中每個圖像分類器輸出的第一概率值;比對所述每個圖像分類器輸出的第一概率值是否大於等於第一門檻值;
當所述每個圖像分類器輸出的第一概率值都小於所述第一門檻值時,將所述第一概率值降冪排列,選取預設個數排列靠前的所述第一概率值對應的圖像分類器,並確定選取的圖像分類器對應的圖像類別;根據所述對應的圖像類別建立第二層圖像分類器集合;將所述待識別圖像輸入到所述第二層圖像分類器集合中,根據所述待識別圖像的CNN特徵獲取所述第二層圖像分類器集合中每個圖像分類器輸出的第二概率值;判斷所述第二概率值是否大於等於第二門檻值;當所述第二層圖像分類器集合中存在圖像分類器輸出的第二概率值大於等於所述第二門檻值,選取所述第二概率值最大的圖像分類器輸出的結果作為分類結果。
進一步地,該方法還包括:當所述第二層圖像分類器集合中的圖像分類器輸出的第二概率值都小於所述第二門檻值時,選取所述第一層圖像分類器集合中第一概率值最大的圖像分類器輸出的結果作為分類結果。
進一步地,該方法還包括:當所述第一層圖像分類器集合中存在圖像分類器輸出的第一概率值大於等於所述第一門檻值時,選取所述第一概率值最大的圖像分類器輸出的結果作為分類結果。
進一步地,所述第二層圖像分類器集合中每個圖像分類器的訓練過程與所述第一層圖像分類器集合中的每個圖像分類器的訓練過程不相同。
進一步地,根據所述待識別圖像的CNN特徵獲取所述第一層圖像分類器集合中每個圖像分類器輸出的第一概率值與根據所述待識別圖像的CNN特徵獲取所述第二層圖像分類器集合中每個圖像分類器輸出的第二概率值不相同。
進一步地,所述第二層圖像分類器集合中的圖像分類器用於對從所述第一層圖像分類器中選取的圖像分類器對應的圖像類別進行進一步細分。
進一步地,當所述第二層圖像分類器集合中第二概率值最大的圖像分類器對應有多個時,隨機選擇多個所述第二概率值最大的圖像分類器中的一個輸出的結果作為分類結果。
進一步地,所述分類器包括Softmax分類器。
一種電子裝置,所述電子裝置包括:處理器;以及記憶體,所述記憶體中存儲有多個程式模組,所述多個程式模組由所述處理器載入並執行所述的圖像分類方法。
一種存儲介質,其上存儲有至少一條電腦指令,所述指令由處理器並載入執行所述的圖像分類方法。
相較於習知技術,本發明提供的圖像分類方法、電子裝置和存儲介質,若在第一層分類器集合中無法直接識別待識別圖像,可以從所述第一層分類器集合中選擇第一概率值靠前的分類器對應的圖像類型,並根據所述對應的圖像類型建立第二層分類器集合,再對所述待識別圖像進行識別,當所述待識別圖像通過所述第二層分類器集合中的分類器識別後,選取所述第二層分類器集合中第二概率值最大的圖像分類器輸出的結果作為分類結果。從而可以將不夠確定的圖像進行識別,並輸出結果。
1:電子裝置
11:記憶體
12:處理器
10:圖像分類系統
101:提取模組
102:獲取模組
103:比對模組
104:確定模組
105:建立模組
106:輸出模組
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據提供的附圖獲得其他的附圖。
圖1是本發明圖像分類系統的較佳實施方式的應用環境圖。
圖2是本發明圖像分類系統的較佳實施方式的功能模組圖。
圖3是本發明圖像分類方法的較佳實施方式的流程圖。
為了能夠更清楚地理解本發明的上述目的、特徵和優點,下面結合附圖和具體實施例對本發明進行詳細描述。需要說明的是,在不衝突的情況下,本申請的實施例及實施例中的特徵可以相互組合。
在下面的描述中闡述了很多具體細節以便於充分理解本發明,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
除非另有定義,本文所使用的所有的技術和科學術語與屬於本發明的技術領域的技術人員通常理解的含義相同。本文中在本發明的說明書中所使用的術語只是為了描述具體的實施例的目的,不是旨在於限制本發明。
請參考圖1,所示為本發明一實施方式中圖像分類系統10的應用環境圖。該圖像分類系統10應用於電子裝置1中。該電子裝置1包括,但不僅限於,記憶體11、至少一個處理器12、存儲在所述記憶體11中並可在所述至少一個處理器12上運行的電腦程式及至少一條通訊匯流排。
所述至少一個處理器12執行所述電腦程式時實現下文詳述的圖像分類方法實施例中的步驟。
示例性的,所述電腦程式可以被分割成一個或多個模組/單元,所述一個或者多個模組/單元被存儲在所述記憶體11中,並由所述至少一個處理器12執行,以完成本發明。所述一個或多個模組/單元可以是能夠完成特定功能的一系列電腦程式指令段,該指令段用於描述所述電腦程式在所述電子裝置1中的執行過程。
在本實施方式中,所述電子裝置1可以是,但並不限於,智慧手機、平板電腦、桌上型電腦或一體機等電子設備。本領域技術人員可以理解,所述示意圖1僅僅是電子裝置1的示例,並不構成對電子裝置1的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件,例如所述電子裝置1還可以包括電路系統、I/O介面、電池、作業系統等。
在本實施方式中,所述處理器12可以由積體電路組成,例如可以由單個封裝的積體電路所組成,也可以是由多個相同功能或不同功能封裝的積體電路所組成,包括一個或者多個中央處理器(Central Processing unit,CPU)、微處理器、數文書處理晶片、圖形處理器及各種控制晶片的組合等。所述至少一個處理器12是所述電子裝置1的控制核心(Control Unit),利用各種介面和線路連接整個電子裝置1的各個部件,通過運行或執行存儲在所述記憶體11內的程式或者模組,以及調用存儲在所述記憶體11內的資料,以執行電子裝置1的各種功能和處理資料,例如執行圖像分類的功能。
所述記憶體11可用於存儲所述電腦程式和/或模組/單元,所述處理器12通過運行或執行存儲在所述記憶體11內的電腦程式和/或模組/單元,以及調用存儲在記憶體11內的資料,實現所述電子裝置1的各種功能。所述記憶體11可主要包括存儲程式區和存儲資料區,其中,存儲程式區可存儲作業系統、至少一個功能所需的應用程式(比如聲音播放功能、圖像播放功能等)等;存儲資料區可存儲根據電子裝置1的使用所創建的資料(比如音訊資料等)等。在本實施方式中,該記憶體11可以為該電子裝置1的內部存儲單元,例如該電子裝置1的硬碟或記憶體。在其他實施方式中,所述記憶體11包括唯讀記憶體(Read-Only Memory,ROM)、隨機記憶體(Random Access Memory,RAM)、可程式設計唯讀記憶體(Programmable Read-Only Memory,PROM)、可抹除可程式設計唯讀記憶體(Erasable Programmable Read-Only Memory,EPROM)、一次可程式設計唯讀記憶體(One-time Programmable Read-Only Memory,OTPROM)、電子抹除式可複寫唯讀記憶體(Electrically-Erasable Programmable
Read-Only Memory,EEPROM)、唯讀光碟(Compact Disc Read-Only Memory,CD-ROM)或其他光碟記憶體、磁碟記憶體、磁帶記憶體、或者能夠用於攜帶或存儲資料的電腦可讀的任何其他介質。在本實施方式中,所述記憶體11內存儲有圖像分類系統10。
所述電子裝置1集成的模組/單元如果以軟體功能單元的形式實現並作為獨立的產品銷售或使用時,可以存儲在一個電腦可讀取存儲介質中。基於這樣的理解,本發明實現上述實施例方法中的全部或部分流程,也可以通過電腦程式來指令相關的硬體來完成,所述的電腦程式可存儲於一電腦可讀存儲介質中,該電腦程式在被處理器執行時,可實現上述各個方法實施例的步驟。其中,所述電腦程式包括電腦程式代碼,所述電腦程式代碼可以為原始程式碼形式、物件代碼形式、可執行檔或某些中間形式等。所述電腦可讀介質可以包括:能夠攜帶所述電腦程式代碼的任何實體或裝置、記錄介質、U盤、移動硬碟、磁碟、光碟、電腦記憶體、唯讀記憶體(ROM,Read-Only Memory)、隨機存取記憶體(RAM,Random Access Memory)、電載波信號、電信信號以及軟體分發介質等。需要說明的是,所述電腦可讀介質包含的內容可以根據司法管轄區內立法和專利實踐的要求進行適當的增減,例如在某些司法管轄區,根據立法和專利實踐,電腦可讀介質不包括電載波信號和電信信號。
參閱圖2所示,所述圖像分類系統10可以被分割成一個或多個模組,所述一個或多個模組存儲在所述記憶體11中,並被配置成一個或多個處理器(本實施例為一個處理器12)執行,以完成本發明。例如,所述圖像分類系統10被分割成提取模組101、獲取模組102、比對模組103、確定模組104、建立模組105及輸出模組106。本發明所稱的模組是能夠完成一特定功能的程式段,比程式更適合用於描述軟體在電子裝置1中的執行過程,關於各模組的詳細功能將在後文圖3的流程圖中作具體描述。
所述提取模組101用於提取待識別圖像的CNN(convolution neural network,卷積神經網路)特徵。
在本實施方式中,所述待識別圖像可以是包括貓或狗等動物的圖像,也可以是包括社區房或商場等建築物的圖像。
所述CNN是一種基本神經元局域連接的神經網路並行處理器,CNN的基本結構包括特徵提取層和特徵映射層。在特徵提取層,每個神經元的輸入與前一層的局部接收域相連,並提取該局部的特徵,一旦該局部特徵被提取後,它與其他特徵的位置關係也隨之確定下來;在特徵映射層,網路的每個計算層由多個特徵映射組成,每個特徵映射是一個平面,平面上所有神經元的權值相等,特徵映射結構使用影響函數核較小的啟動函數,使得特徵映射具有位移不變性。
所述獲取模組102用於將所述待識別圖像輸入到預建的第一層圖像分類器集合中,根據所述待識別圖像的CNN特徵獲取所述第一層圖像分類器集合中每個圖像分類器輸出的第一概率值。
在本實施方式中,獲取所述第一概率值的方法包括余弦相似度計算方法和利用Softmax分類器中的Softmax回歸函數計算方法。
具體地,所述余弦相似度計算所述第一概率值包括:所述第一層圖像分類器集合中每個圖像分類器對應一個特徵向量,可以將所述待識別圖像的CNN特徵轉化為所述待識別圖像的特徵向量;根據所述每個圖像分類器對應的特徵向量與所述待識別圖像的特徵向量,計算所述每個圖像分類器與所述待識別圖像的向量內積;根據所述向量內積獲取所述每個圖像分類器輸出的第一概率值。
所述Softmax分類器是二元邏輯回歸泛化到多元的情況,在輸入待識別圖像的CNN特徵後,所述Softmax分類器可輸出所述待識別圖像屬於各個圖像類別的概率值。所述第一層圖像分類器集合中每個圖像分類器可輸出所述待識別圖像屬於各個圖像類別的第一概率值。
在本實施方式中,所述第一層圖像分類器集合可以包括多個圖像分類器,每個圖像分類器對應一個圖像類別。例如,所述第一層圖像分類器集合
包括第一圖像分類器、第二圖像分類器、第三圖像分類器;所述第一圖像分類器用於識別狗,所述第二圖像分類器用於識別貓,所述第三圖像分類器用於識別兔子。
所述比對模組103用於比對所述每個圖像分類器輸出的第一概率值是否大於等於第一門檻值。例如,所述第一門檻值為0.5。
具體地,當存在某個圖像分類器輸出的第一概率值大於等於所述第一門檻值時,選取所述第一概率值最大的圖像分類器輸出的結果作為分類結果;當不存在圖像分類器輸出的第一概率值大於等於所述第一門檻值時,也就是說,所述第一層圖像分類器集合中的每個圖像分類器輸出的第一概率值都小於所述第一門檻值時,確定所述第一層圖像分類器無法直接識別所述待識別圖像。
所述確定模組104用於當所述圖像分類器輸出的第一概率值都小於所述第一門檻值時,將所述第一概率值降冪排列,選取預設個數排列靠前的所述第一概率值對應的圖像分類器,並確定選取的圖像分類器對應的圖像類別。
例如,所述待識別圖像經過所述第一圖像分類器、第二圖像分類器和第三圖像分類器處理後得到的第一概率值分別為0.47、0.46和0.07。上述三個圖像分類器得到的第一概率值都小於所述第一門檻值0.5,則選取兩個排列靠前的第一概率值對應的圖像分類器,即第一圖像分類器和第二圖像分類器;再確定選取的圖像分類器對應的圖像類別,即所述第一圖像分類器對應的圖像類別為狗和所述第二分類器對應的圖像類別為貓。
所述建立模組105用於根據所述對應的圖像類別建立第二層圖像分類器集合。
在本實施方式中,所述第二層圖像分類器集合中每個圖像分類器的訓練過程與所述第一層圖像分類器集合中的圖像分類器的訓練過程不相同。所述第二層圖像分類器集合中的圖像分類器用於將從所述第一層圖像分類器中選取的圖像分類器對應的圖像類別進行進一步細分。例如,選取的圖像分類器包括第一圖像分類器和第二圖像分類器,所述第一圖像分類器用於識別狗,所述
建立模組105根據所述類別狗來建立對狗進行進一步細分的第二層分類器集合,包括用於識別貴賓犬的分類器、用於識別鬥牛犬的分類器、用於識別牧羊犬的分類器和用於識別吉娃娃的分類器。
所述第二圖像分類器用於識別貓,所述建立模組105根據類別貓來建立對貓進行進一步細分的第二層圖像分類器集合,包括用於識別波斯貓的分類器、用於識別俄羅斯藍貓的分類器和用於識別英國短毛貓的分類器。
所述獲取模組102還用於將所述待識別圖像輸入到所述第二層圖像分類器集合中,根據所述待識別圖像的CNN特徵獲取所述第二層圖像分類器集合中每個圖像分類器輸出的第二概率值。
在本實施方式中,所述第二層圖像分類器集合中每個圖像分類器的訓練過程與所述第一層圖像分類器集合中的圖像分類器的訓練過程不相同。因此,將所述待識別圖像輸入到所述第二層圖像分類器集合中後,獲取的所述第二層圖像分類器集合中每個圖像分類器輸出的第二概率值與所述第一概率值也不相同。
可以理解的是,每一層圖像分類器集合中的每個圖像分類器都是獨立訓練產生的。在本實施方式中,將所述圖像分類器以不同階層的方式對所述待識別圖像進行處理,從而得到的概率值彼此之間並無關聯。所述圖像分類器的訓練過程為現有技術,在此不再贅述。
例如,所述待識別圖像經過所述用於識別貴賓犬的分類器處理後得到的第二概率值為0.5,所述待識別圖像經過所述用於識別鬥牛犬的分類器處理後得到的第二概率值為0.2,所述待識別圖像經過所述用於識別牧羊犬的分類器處理後得到的第二概率值為0.1,及所述待識別圖像經過所述用於識別吉娃娃的分類器處理後得到的第二概率值0.2;所述待識別圖像經過所述用於識別波斯貓的分類器處理後得到的第二概率值為0.3、所述待識別圖像經過所述用於識別俄羅斯藍貓的分類器處理後得到的第二概率值為0.4,所述待識別圖像經過所述用於識別英國短毛貓的分類器處理後得到的第二概率值為0.3。
所述輸出模組106選取所述第二概率值最大的圖像分類器輸出的結果作為分類結果。
在本實施方式中,選取所述用於識別貴賓犬的分類器輸出的結果作為分類結果,也就是說,確定所述待識別圖像為貴賓犬。
在一實施方式中,若所述第二概率值最大的圖像分類器有多個,則隨機選擇多個所述圖像分類器中的一個輸出的結果作為分類結果。例如,所述待識別圖像經過所述用於識別貴賓犬的分類器處理後得到的第二概率值為0.5,所述待識別圖像經過所述用於識別波斯貓的分類器處理後得到的第二概率值也為0.5,則隨機選擇輸出貴賓犬或者波斯貓作為分類結果。
在另一實施方式中,若所述第二概率值最大的圖像分類器有多個,則隨機選擇多個所述圖像分類器中的一個輸出的結果作為分類結果。
如圖3所示,本發明較佳實施方式的圖像分類方法流程圖。根據不同需求,該流程圖中步驟的順序可以改變,某些步驟可以省略或合併。
步驟S01,提取待識別圖像的特徵。
在本實施方式中,所述待識別圖像可以是包括貓或狗等動物的圖像,也可以是包括社區房或商場等建築物的圖像。
步驟S02,將所述待識別圖像輸入到預建的第一層圖像分類器集合中,根據所述待識別圖像的CNN特徵獲取所述第一層圖像分類器集合中每個圖像分類器輸出的第一概率值。
在本實施方式中,獲取所述第一概率值的方法包括余弦相似度計算方法和利用Softmax分類器中的Softmax回歸函數計算方法。
具體地,所述余弦相似度計算所述第一概率值包括:所述第一層圖像分類器集合中每個圖像分類器對應一個特徵向量,可以將所述待識別圖像的CNN特徵轉化為所述待識別圖像的特徵向量;根據所述每個圖像分類器對應的特徵向量與所述待識別圖像的特徵向量,計算所述每個圖像分類器與所述待識
別圖像的向量內積;根據所述向量內積獲取所述每個圖像分類器輸出的第一概率值。
所述Softmax分類器是二元邏輯回歸泛化到多元的情況,在輸入待識別圖像的CNN特徵後,所述Softmax分類器可輸出所述待識別圖像屬於各個圖像類別的概率值。所述第一層圖像分類器集合中每個圖像分類器可輸出所述待識別圖像屬於各個圖像類別的第一概率值。
在本實施方式中,所述第一層圖像分類器集合可以包括多個圖像分類器,每個圖像分類器對應一個類別。例如,所述第一層圖像分類器集合包括第一圖像分類器、第二圖像分類器、第三圖像分類器;所述第一圖像分類器用於識別狗,所述第二圖像分類器用於識別貓,所述第三圖像分類器用於識別兔子。
步驟S03,比對所述每個圖像分類器輸出的第一概率值是否大於等於第一門檻值。例如,所述第一門檻值為0.5。
當存在某個圖像分類器輸出的第一概率值大於等於所述第一門檻值時,流程進入步驟S04;當不存在圖像分類器輸出的第一概率值大於等於所述第一門檻值時,也就是說,所述第一層圖像分類器集合中的每個圖像分類器輸出的第一概率值都小於所述第一門檻值時,確定所述第一層圖像分類器無法直接識別所述待識別圖像,流程進入步驟S05。
步驟S04,選取所述第一概率值最大的圖像分類器輸出的結果作為分類結果。
步驟S05,將所述第一概率值降冪排列,選取預設個數排列靠前的所述第一概率值對應的圖像分類器,並確定選取的圖像分類器對應的圖像類別。
例如,所述待識別圖像經過所述第一圖像分類器、第二圖像分類器和第三圖像分類器處理後得到的第一概率值分別為0.47、0.46和0.07。上述三個圖像分類器得到的第一概率值都小於所述第一門檻值0.5,則選取兩個排列靠
前的第一概率值對應的圖像分類器,即第一圖像分類器和第二圖像分類器;再確定選取的圖像分類器對應的圖像類別,即所述第一圖像分類器對應的圖像類別為狗和所述第二分類器對應的圖像類別為貓。
步驟S06,根據所述對應的圖像類別建立第二層圖像分類器集合。
在本實施方式中,所述第二層圖像分類器集合中每個分類器的訓練過程與所述第一層圖像分類器集合中的分類器的訓練過程不相同。所述第二層圖像分類器集合中的分類器用於將從所述第一層圖像分類器中選取的圖像分類器對應的圖像類別進行進一步細分。例如,選取的圖像分類器包括第一圖像分類器和第二圖像分類器,所述第一圖像分類器用於識別狗,根據所述類別狗來建立對狗進行進一步細分的第二層分類器集合,包括用於識別貴賓犬的分類器、用於識別鬥牛犬的分類器、用於識別牧羊犬的分類器和用於識別吉娃娃的分類器。
所述第二圖像分類器用於識別貓,根據類別貓來建立對貓進行進一步細分的第二層圖像分類器集合,包括用於識別波斯貓的分類器、用於識別俄羅斯藍貓的分類器和用於識別英國短毛貓的分類器。
步驟S07,將所述待識別圖像輸入到所述第二層圖像分類器集合中,根據所述待識別圖像的CNN特徵獲取所述第二層圖像分類器集合中每個圖像分類器輸出的第二概率值。
在本實施方式中,所述第二層圖像分類器集合中每個分類器的訓練過程與所述第一層圖像分類器集合中的分類器的訓練過程不相同。因此,將所述待識別圖像輸入到所述第二層圖像分類器集合中後,獲取的所述第二層圖像分類器集合中每個圖像分類器輸出的第二概率值與所述第一概率值也不相同。
可以理解的是,每一層圖像分類器集合中的每個圖像分類器都是獨立訓練產生的,所述每個圖像分類器對應確定一種圖像類型。即,所述第一層圖像分類器集合和所述第二層圖像分類器集合中的每個圖像分類器對應確定一種圖像類型。在本實施方式中,將所述圖像分類器以不同階層的方式對所述待
識別圖像進行處理,從而得到的概率值彼此之間並無關聯。所述圖像分類器的訓練過程為現有技術,在此不再贅述。
例如,所述待識別圖像經過所述用於識別貴賓犬的分類器處理後得到的第二概率值為0.5,所述待識別圖像經過所述用於識別鬥牛犬的分類器處理後得到的第二概率值為0.2,所述待識別圖像經過所述用於識別牧羊犬的分類器處理後得到的第二概率值為0.1,及所述待識別圖像經過所述用於識別吉娃娃的分類器處理後得到的第二概率值0.2;所述待識別圖像經過所述用於識別波斯貓的分類器處理後得到的第二概率值為0.3、所述待識別圖像經過所述用於識別俄羅斯藍貓的分類器處理後得到的第二概率值為0.4,所述待識別圖像經過所述用於識別英國短毛貓的分類器處理後得到的第二概率值為0.3。
步驟S08,判斷所述第二概率值是否大於等於第二門檻值。
當所述第二層圖像分類器集合中存在圖像分類器輸出的第二概率值大於等於所述第二門檻值時,流程進入步驟S09;當所述第二層圖像分類器集合中不存在圖像分類器輸出的第二概率值大於等於所述第二門檻值時,也就是說,所述第二層圖像分類器集合中的每個圖像分類器輸出的第二概率值都小於所述第二門檻值時,確定所述第二層圖像分類器無法確定所述待識別圖像,流程進入步驟S10。
步驟S09,選取所述第二概率值最大的圖像分類器輸出的結果作為分類結果。
在本實施方式中,選取所述用於識別貴賓犬的分類器輸出的結果作為分類結果,也就是說,確定所述待識別圖像為貴賓犬。
步驟S10,選取所述第一層圖像分類器集合中第一概率值最大的圖像分類器輸出的結果作為分類結果。
當所述第二層圖像分類器集合中的分類器無法確定所述待識別圖像時,不需要強行將所述待識別圖像進行分類,返回至所述第一層圖像分類器集
合中,選取所述第一層圖像分類器集合中第一概率值最大的圖像分類器輸出的結果作為分類結果。
在本發明所提供的幾個實施例中,應該理解到,所揭露的電子裝置和方法,可以通過其它的方式實現。例如,以上所描述的電子裝置實施例僅僅是示意性的,例如,所述模組的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式。
另外,在本發明各個實施例中的各功能單元可以集成在相同處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在相同單元中。上述集成的單元既可以採用硬體的形式實現,也可以採用硬體加軟體功能模組的形式實現。
對於本領域技術人員而言,顯然本發明不限於上述示範性實施例的細節,而且在不背離本發明的精神或基本特徵的情況下,能夠以其他的具體形式實現本發明。因此,無論從哪一點來看,均應將實施例看作是示範性的,而且是非限制性的,本發明的範圍由所附權利要求而不是上述說明限定,因此旨在將落在權利要求的等同要件的含義和範圍內的所有變化涵括在本發明內。不應將權利要求中的任何附圖標記視為限制所涉及的權利要求。此外,顯然“包括”一詞不排除其他單元或,單數不排除複數。系統權利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟體或者硬體來實現。第一,第二等詞語用來表示名稱,而並不表示任何特定的順序。
以上實施例僅用以說明本發明的技術方案而非限制,儘管參照以上較佳實施例對本發明進行了詳細說明,本領域的普通技術人員應當理解,可以對本發明的技術方案進行修改或者等同替換都不應脫離本發明技術方案的精神和範圍。
S01~S10:步驟
Claims (9)
- 一種圖像分類方法,該方法包括:提取待識別圖像的CNN特徵;將所述待識別圖像輸入到預建的第一層圖像分類器集合中,根據所述待識別圖像的CNN特徵獲取所述第一層圖像分類器集合中每個圖像分類器輸出的第一概率值;比對所述每個圖像分類器輸出的第一概率值是否大於等於第一門檻值;當所述每個圖像分類器輸出的第一概率值都小於所述第一門檻值時,將所述第一概率值降冪排列,選取預設個數排列靠前的所述第一概率值對應的圖像分類器,並確定選取的圖像分類器對應的圖像類別;根據所述對應的圖像類別建立第二層圖像分類器集合;將所述待識別圖像輸入到所述第二層圖像分類器集合中,根據所述待識別圖像的CNN特徵獲取所述第二層圖像分類器集合中每個圖像分類器輸出的第二概率值,其中,所述第二層圖像分類器集合中的分類器用於將從所述第一層圖像分類器中選取的圖像分類器對應的圖像類別進行進一步細分;判斷所述第二概率值是否大於等於第二門檻值;當所述第二層圖像分類器集合中存在圖像分類器輸出的第二概率值大於等於所述第二門檻值,選取所述第二概率值最大的圖像分類器輸出的結果作為分類結果。
- 如請求項1所述的圖像分類方法,其中,該方法還包括:當所述第二層圖像分類器集合中的圖像分類器輸出的第二概率值都小於所述第二門檻值時,選取所述第一層圖像分類器集合中第一概率值最大的圖像分類器輸出的結果作為分類結果。
- 如請求項1所述的圖像分類方法,其中,該方法還包括: 當所述第一層圖像分類器集合中存在圖像分類器輸出的第一概率值大於等於所述第一門檻值時,選取所述第一概率值最大的圖像分類器輸出的結果作為分類結果。
- 如請求項1所述的圖像分類方法,其中,根據所述待識別圖像的CNN特徵獲取所述第一層圖像分類器集合中每個圖像分類器輸出的第一概率值與根據所述待識別圖像的CNN特徵獲取所述第二層圖像分類器集合中每個圖像分類器輸出的第二概率值不相同。
- 如請求項1所述的圖像分類方法,其中,所述第二層圖像分類器集合中的圖像分類器用於對從所述第一層圖像分類器中選取的圖像分類器對應的圖像類別進行進一步細分。
- 如請求項5所述的圖像分類方法,其中,當所述第二層圖像分類器集合中第二概率值最大的圖像分類器對應有多個時,隨機選擇多個所述第二概率值最大的圖像分類器中的一個輸出的結果作為分類結果。
- 如請求項1所述的圖像分類方法,其中,所述分類器包括Softmax分類器。
- 一種電子裝置,所述電子裝置包括:處理器;以及記憶體,所述記憶體中存儲有多個程式模組,所述多個程式模組由所述處理器載入並執行如請求項1-7中任意一項所述的圖像分類方法。
- 一種存儲介質,所述存儲介質上存儲有至少一條電腦指令,所述指令由處理器並載入執行如請求項1-7中任意一項所述的圖像分類方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107145069A TWI706334B (zh) | 2018-12-13 | 2018-12-13 | 圖像分類方法、電子裝置和存儲介質 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107145069A TWI706334B (zh) | 2018-12-13 | 2018-12-13 | 圖像分類方法、電子裝置和存儲介質 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202022696A TW202022696A (zh) | 2020-06-16 |
TWI706334B true TWI706334B (zh) | 2020-10-01 |
Family
ID=72175849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107145069A TWI706334B (zh) | 2018-12-13 | 2018-12-13 | 圖像分類方法、電子裝置和存儲介質 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI706334B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW541448B (en) * | 2000-06-19 | 2003-07-11 | Dow Chemical Co | Rotating equipment diagnostic system and adaptive controller |
US20140279773A1 (en) * | 2013-03-13 | 2014-09-18 | Google Inc. | Scoring Concept Terms Using a Deep Network |
CN106875007A (zh) * | 2017-01-25 | 2017-06-20 | 上海交通大学 | 用于语音欺骗检测的基于卷积长短期记忆端对端深度神经网络 |
CN107145893A (zh) * | 2017-03-13 | 2017-09-08 | 中国矿业大学 | 一种基于卷积深度网络的图像识别算法及系统 |
TW201839665A (zh) * | 2017-04-21 | 2018-11-01 | 潘品睿 | 物件辨識方法及物件辨識系統 |
-
2018
- 2018-12-13 TW TW107145069A patent/TWI706334B/zh active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW541448B (en) * | 2000-06-19 | 2003-07-11 | Dow Chemical Co | Rotating equipment diagnostic system and adaptive controller |
US20140279773A1 (en) * | 2013-03-13 | 2014-09-18 | Google Inc. | Scoring Concept Terms Using a Deep Network |
CN106875007A (zh) * | 2017-01-25 | 2017-06-20 | 上海交通大学 | 用于语音欺骗检测的基于卷积长短期记忆端对端深度神经网络 |
CN107145893A (zh) * | 2017-03-13 | 2017-09-08 | 中国矿业大学 | 一种基于卷积深度网络的图像识别算法及系统 |
TW201839665A (zh) * | 2017-04-21 | 2018-11-01 | 潘品睿 | 物件辨識方法及物件辨識系統 |
Also Published As
Publication number | Publication date |
---|---|
TW202022696A (zh) | 2020-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109189991B (zh) | 重复视频识别方法、装置、终端及计算机可读存储介质 | |
WO2020007138A1 (zh) | 一种事件识别的方法、模型训练的方法、设备及存储介质 | |
EP3248143B1 (en) | Reducing computational resources utilized for training an image-based classifier | |
WO2022042123A1 (zh) | 图像识别模型生成方法、装置、计算机设备和存储介质 | |
US20200342255A1 (en) | Custom Auto Tagging of Multiple Objects | |
WO2023272852A1 (zh) | 通过决策树模型对用户进行分类的方法、装置、设备和存储介质 | |
CN110399487B (zh) | 一种文本分类方法、装置、电子设备及存储介质 | |
US11663642B2 (en) | Systems and methods of multicolor search of images | |
CN111340097B (zh) | 图像细粒度分类方法、装置、存储介质及设备 | |
WO2021042763A1 (en) | Image searches based on word vectors and image vectors | |
US20210049416A1 (en) | Artificial intelligence system for inspecting image reliability | |
CN110245714B (zh) | 图像识别方法、装置及电子设备 | |
US20200097673A1 (en) | Data privilage control method and system | |
CN111209929A (zh) | 访问数据处理方法、装置、计算机设备及存储介质 | |
CN114416998A (zh) | 文本标签的识别方法、装置、电子设备及存储介质 | |
CN111222032B (zh) | 舆情分析方法及相关设备 | |
TWI706334B (zh) | 圖像分類方法、電子裝置和存儲介質 | |
CN111325225B (zh) | 图像分类方法、电子装置和存储介质 | |
CN111382760A (zh) | 图片类别的识别方法、装置及计算机可读存储介质 | |
US20170293660A1 (en) | Intent based clustering | |
CN112784893B (zh) | 图像数据的聚类方法、装置、电子设备及存储介质 | |
CN115146103A (zh) | 图像检索方法、装置、计算机设备、存储介质和程序产品 | |
CN111091198B (zh) | 一种数据处理方法及装置 | |
CN112927004A (zh) | 用于大数据画像的信息云计算分析方法及信息推送服务器 | |
US20200167312A1 (en) | Hash suppression |