TW202343304A - 圖像識別方法、圖像識別裝置及資訊處理裝置 - Google Patents
圖像識別方法、圖像識別裝置及資訊處理裝置 Download PDFInfo
- Publication number
- TW202343304A TW202343304A TW111114735A TW111114735A TW202343304A TW 202343304 A TW202343304 A TW 202343304A TW 111114735 A TW111114735 A TW 111114735A TW 111114735 A TW111114735 A TW 111114735A TW 202343304 A TW202343304 A TW 202343304A
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- frame
- image recognition
- generate
- template
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013136 deep learning model Methods 0.000 title claims abstract description 20
- 230000010365 information processing Effects 0.000 title claims description 13
- 238000004364 calculation method Methods 0.000 title description 4
- 230000009466 transformation Effects 0.000 claims abstract description 25
- 239000011159 matrix material Substances 0.000 claims abstract description 15
- 238000013473 artificial intelligence Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 4
- 210000001747 pupil Anatomy 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
一種圖像識別方法,係由一控制電路執行一程式實現,其包括:對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣; 依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像;對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域,依該幀第一圖像中之該共同區域內的圖像產生一第二圖像,及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像;以及利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。
Description
本發明係有關於圖像識別方法,特別是關於一種可兼顧圖像識別裝置之計算負擔和識別精準度的圖像識別方法。
現有的圖像識別技術大致分為兩種:
(一)通過圖像特徵提取演算法(例如Minutiae匹配、SIFT或 ORB等演算法)提取圖像特徵,再比對範本圖像和待辨識圖像間的特徵相似度;以及
(二)利用深度學習模型,對比範本圖像和待辨識圖像間的相似度。
就上述兩種模式的優、缺點比較而言,圖像特徵提取演算法的計算量相對較小,對硬體要求較低,因此其模組的體積較小,處理速度較快,然而,其損失的圖像資訊也較多,致使其辨識準確率較低;相對地,深度學習模型的辨識準確率高,然其對硬體要求較高,因此其模型體積較大,不適用於無圖形處理器(graphics processing unit)或其他並行運算處理器之產品中。
為解決上述的問題,本領域亟需一新穎的圖像識別方法。
本發明之主要目的在於揭露一種圖像識別方法,其可兼顧一圖像識別裝置之計算負擔和識別精準度,從而優化該圖像識別裝置之圖像識別性能。
本發明之另一目的在於揭露一種圖像識別裝置,其可藉由上述的圖像識別方法優化其圖像識別性能。
本發明之又一目的在於揭露一種資訊處理裝置,其可藉由上述的圖像識別裝置優化其圖像識別性能。
為達前述目的,一種圖像識別方法乃被提出,其係由一控制電路執行一程式實現,且其包括:
對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣;
依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像;
對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域,依該幀第一圖像中之該共同區域內的圖像產生一第二圖像,及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像;以及
利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。
在一實施例中,該幀待辨識圖像係一幀指紋圖像。
在可能的實施例中,該圖像特徵對齊操作採用尺度不變特徵轉換(Scale-invariant feature transform ; SIFT)運算、ORB(Oriented FAST and Rotated BRIEF;經定位的FAST (Features from Accelerated Segment Test;加速片段測試之特徵)及經旋轉的BRIEF(Binary Robust Independent Elementary Features;二進制強固獨立元素特徵))運算、或Minutiae(細節點)匹配運算。
在一實施例中,該人工智慧判決運算包括對該第二圖像和該第三圖像進行一二值化運算。
為達前述目的,本發明進一步提出一種圖像識別裝置,其具有一控制電路以藉由執行一程式實現一圖像識別方法,該方法包括:
對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣;
依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像;
對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域,依該幀第一圖像中之該共同區域內的圖像產生一第二圖像,及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像;以及
利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。
在一實施例中,該幀待辨識圖像係一幀指紋圖像。
在可能的實施例中,該圖像特徵對齊操作採用尺度不變特徵轉換(Scale-invariant feature transform ; SIFT)運算、ORB(Oriented FAST and Rotated BRIEF;經定位的FAST (Features from Accelerated Segment Test;加速片段測試之特徵)及經旋轉的BRIEF(Binary Robust Independent Elementary Features;二進制強固獨立元素特徵))運算、或Minutiae(細節點)匹配運算。
在一實施例中,該人工智慧判決運算包括對該第二圖像和該第三圖像進行一二值化運算。
為達前述目的,本發明進一步提出一種資訊處理裝置,其具有一中央處理單元及如前述之圖像識別裝置,其中,該中央處理單元係用以與該圖像識別裝置通信以依該圖像識別裝置之比對結果決定是否執行一解鎖操作。
在可能的實施例中,所述之資訊處理裝置可為一智慧型手機、一可攜式電腦、一車載電腦、一穿戴式電子裝置或一門禁裝置。
為使 貴審查委員能進一步瞭解本發明之結構、特徵及其目的,茲附以圖式及較佳具體實施例之詳細說明如後。
本發明的圖像識別方法的原理在於:
(一)先對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以在同一座標平面上界定出一共同區域;以及
(二)利用一深度學習模型對該幀待辨識圖像和該幀模版圖像中分別與該共同區域對應之兩個圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。
依此,本發明即可在有效降低深度學習模型的複雜度和計算量的情況下仍然提供準確的圖像辨識結果。
請參照圖1,其繪示本發明之圖像識別方法之一實施例的流程圖,其係由一控制電路執行一程式實現。如圖1所示,該圖像識別方法包括:對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣(步驟a); 依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像(步驟b);對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域,依該幀第一圖像中之該共同區域內的圖像產生一第二圖像,及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像(步驟c);以及利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果(步驟d)。
在步驟a中,該幀待辨識圖像和該幀模版圖像可分別為一幀待辨識指紋圖像和一幀模版指紋圖像;且該圖像特徵對齊操作可採用尺度不變特徵轉換(Scale-invariant feature transform ; SIFT)運算、ORB(Oriented FAST and Rotated BRIEF;經定位的FAST (Features from Accelerated Segment Test;加速片段測試之特徵)及經旋轉的BRIEF(Binary Robust Independent Elementary Features;二進制強固獨立元素特徵))運算、或Minutiae(細節點)匹配運算。由於該些運算皆為習知技術,故在此不擬贅述。
在步驟b中,該方位變換運算包括一位移操作和一旋轉操作,用以使該幀第一圖像的圖像特徵和該幀模版圖像的圖像特徵對齊。
在步驟c中,可對該第二圖像和該第三圖像進行一二值化運算以大幅降低在步驟d中之該深度學習模型之計算量。另外,如果圖像仍然較大,可進一步對該第二圖像和該第三圖像進行降採樣。
在步驟d中,該深度學習模型之各層中的複數個節點的加權係數係利用一張所述第三圖像和多張所述第二圖像對該深度學習模型進行訓練而得,亦即,可用多張已知為真的和多張已知為假的所述第二圖像搭配所述第三圖像對該深度學習模型進行訓練以產生該些加權係數。由於該深度學習模型為習知技術,故在此不擬贅述。
另外,在可能的應用中,該幀待辨識圖像和該幀模版圖像亦可分別為一幀待辨識掌紋圖像和一幀模版掌紋圖像,或分別為一幀待辨識瞳孔圖像和一幀模版瞳孔圖像。
另外,在進行該人工智慧判決運算時,可先將該第二圖像和該第三圖像拼接以產生一張輸入圖像,而該人工智慧判決運算對該張輸入圖像的處理方式可為:
(一)利用不同的通道分離: I(x,y,1)= I1(x,y), I(x,y,2) = I2(x,y),其中, I(x,y,1)為該張輸入圖像中代表該第二圖像的資料,I(x,y,2) 為該張輸入圖像中代表該第二圖像的資料,I1(x,y)代表輸入該深度學習模型之第一輸入通道的資料,I2(x,y)代表輸入該深度學習模型之第二輸入通道的資料;
(二)對於二值化的圖像,可將所述第一輸入通道的資料和所述第二輸入通道的資料用不同加權值合併成單一輸入通道的資料:I(x,y)=I1(x,y) * 2 + I2(x,y),其中,I(x,y)為該單一輸入通道的資料。
(三)可用所述第一輸入通道的資料和所述第二輸入通道的差值做為單一輸入通道的資料:I(x,y) = abs(I1(x,y) – I2(x,y)),其中abs()代表一絕對值運算子。
依上述的說明,本發明進一步提出一種圖像識別裝置。請參照圖2,其繪示本發明之圖像識別裝置之一實施例之方塊圖。如圖2所示,一圖像識別裝置100具有一圖像擷取單元110及一控制電路120,圖像擷取單元110係用以擷取一幀待辨識圖像,控制電路120具有一處理器121及一記憶體122,記憶體122儲存有一程式,處理器121係用以執行該程式以實現圖1所示之圖像識別方法。
另外,該幀待辨識圖像可為一幀指紋圖像、一幀掌紋圖像或一幀瞳孔圖像。
另外,依上述的說明,本發明進一步提出一種資訊處理裝置。請參照圖3,其繪示本發明之資訊處理裝置之一實施例的方塊圖。如圖3所示,一資訊處理裝置200具有一中央處理單元210及一圖像識別裝置220,其中,圖像識別裝置220係由圖2所示之圖像識別裝置100實現,且中央處理單元210係用以與圖像識別裝置通信以依圖像識別裝置220之比對結果決定是否執行一解鎖操作。
另外,資訊處理裝置200可為一智慧型手機、一可攜式電腦、一車載電腦、一穿戴式電子裝置或一門禁裝置。
藉由前述所揭露的設計,本發明乃具有以下的優點:
一、本發明之圖像識別方法可兼顧一圖像識別裝置之計算負擔和識別精準度,從而優化該圖像識別裝置之圖像識別性能。
二、本發明之圖像識別裝置可藉由上述的圖像識別方法優化其圖像識別性能。
三、本發明之資訊處理裝置可藉由上述的圖像識別裝置優化其圖像識別性能。
本案所揭示者,乃較佳實施例,舉凡局部之變更或修飾而源於本案之技術思想而為熟習該項技藝之人所易於推知者,俱不脫本案之專利權範疇。
綜上所陳,本案無論目的、手段與功效,皆顯示其迥異於習知技術,且其首先發明合於實用,確實符合發明之專利要件,懇請 貴審查委員明察,並早日賜予專利俾嘉惠社會,是為至禱。
100:圖像識別裝置
110:圖像擷取單元
120:控制電路
121:處理器
122:記憶體
200:資訊處理裝置
210:中央處理單元
220:圖像識別裝置
步驟a:對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣。
步驟b:依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像。
步驟c:對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域,依該幀第一圖像中之該共同區域內的圖像產生一第二圖像,及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像。
步驟d :利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。
圖1繪示本發明之顯示裝置之一實施例的方塊圖。
圖2繪示本發明之自發光顯示器的環境光補償方法之一實施例之流程圖。圖3繪示本發明之資訊處理裝置之一實施例的方塊圖。
步驟a:對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣
步驟b:依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像
步驟c:對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域,依該幀第一圖像中之該共同區域內的圖像產生一第二圖像,及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像
步驟d:利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果
Claims (10)
- 一種圖像識別方法,係由一控制電路執行一程式實現,其包括: 對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣; 依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像; 對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域,依該幀第一圖像中之該共同區域內的圖像產生一第二圖像,及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像;以及 利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。
- 如申請專利範圍第1項所述之圖像識別方法,其中,該幀待辨識圖像係一幀指紋圖像。
- 如申請專利範圍第1項所述之圖像識別方法,其中,該圖像特徵對齊操作採用尺度不變特徵轉換(Scale-invariant feature transform ; SIFT)運算、ORB(Oriented FAST and Rotated BRIEF;經定位的FAST (Features from Accelerated Segment Test;加速片段測試之特徵)及經旋轉的BRIEF(Binary Robust Independent Elementary Features;二進制強固獨立元素特徵))運算、或Minutiae(細節點)匹配運算。
- 如申請專利範圍第1項所述之圖像識別方法,其中,該人工智慧判決運算包括對該第二圖像和該第三圖像進行一二值化運算。
- 一種圖像識別裝置,其具有一控制電路以藉由執行一程式實現一圖像識別方法,該方法包括: 對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣; 依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像; 對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域,依該幀第一圖像中之該共同區域內的圖像產生一第二圖像,及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像;以及 利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。
- 如申請專利範圍第5項所述之圖像識別裝置,其中,該幀待辨識圖像係一幀指紋圖像。
- 如申請專利範圍第5項所述之圖像識別裝置,其中,該圖像特徵對齊操作採用尺度不變特徵轉換(Scale-invariant feature transform ; SIFT)運算、ORB(Oriented FAST and Rotated BRIEF;經定位的FAST (Features from Accelerated Segment Test;加速片段測試之特徵)及經旋轉的BRIEF(Binary Robust Independent Elementary Features;二進制強固獨立元素特徵))運算、或Minutiae匹配運算。
- 如申請專利範圍第5項所述之圖像識別裝置,其中,該人工智慧判決運算包括對該第二圖像和該第三圖像進行一二值化運算。
- 一種資訊處理裝置,其具有一中央處理單元及如申請專利範圍第5至8項中任一項所述之圖像識別裝置,其中,該中央處理單元係用以與該圖像識別裝置通信以依該圖像識別裝置之所述比對結果決定是否執行一解鎖操作。
- 如申請專利範圍第9項所述之資訊處理裝置,其係由一智慧型手機、一可攜式電腦、一車載電腦、一穿戴式電子裝置和一門禁裝置所組成群組中所選擇的一種裝置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW111114735A TW202343304A (zh) | 2022-04-18 | 2022-04-18 | 圖像識別方法、圖像識別裝置及資訊處理裝置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW111114735A TW202343304A (zh) | 2022-04-18 | 2022-04-18 | 圖像識別方法、圖像識別裝置及資訊處理裝置 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202343304A true TW202343304A (zh) | 2023-11-01 |
Family
ID=89720605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111114735A TW202343304A (zh) | 2022-04-18 | 2022-04-18 | 圖像識別方法、圖像識別裝置及資訊處理裝置 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TW202343304A (zh) |
-
2022
- 2022-04-18 TW TW111114735A patent/TW202343304A/zh unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220027603A1 (en) | Fast, embedded, hybrid video face recognition system | |
Parvathy et al. | Development of hand gesture recognition system using machine learning | |
Sun et al. | Deep learning face representation by joint identification-verification | |
Sarfraz et al. | Head Pose Estimation in Face Recognition Across Pose Scenarios. | |
Li et al. | Skeleton-based gesture recognition using several fully connected layers with path signature features and temporal transformer module | |
CN105210115B (zh) | 使用2d图像数据来执行手势识别 | |
Fard et al. | ASMNet: A lightweight deep neural network for face alignment and pose estimation | |
JP2016006679A (ja) | 顔認識方法、装置、および該方法を実行するためのコンピュータ可読記録媒体 | |
Triantafyllidou et al. | Face detection based on deep convolutional neural networks exploiting incremental facial part learning | |
JP6997369B2 (ja) | プログラム、測距方法、及び測距装置 | |
Ding et al. | Recognition of hand-gestures using improved local binary pattern | |
Cheraghi et al. | SP-Net: A novel framework to identify composite sketch | |
CN116051873A (zh) | 关键点匹配方法、装置及电子设备 | |
Deng et al. | Attention-aware dual-stream network for multimodal face anti-spoofing | |
Prihasto et al. | A survey of deep face recognition in the wild | |
TW202343304A (zh) | 圖像識別方法、圖像識別裝置及資訊處理裝置 | |
US20230029163A1 (en) | Wafer map analysis system using neural network and method of analyzing wafer map using the same | |
Yallamandaiah et al. | Convolutional neural network-based face recognition using non-subsampled shearlet transform and histogram of local feature descriptors | |
Premk et al. | Automatic latent fingerprint segmentation using convolutional neural networks | |
Li et al. | A pre-training strategy for convolutional neural network applied to Chinese digital gesture recognition | |
Verma et al. | Recent advancement of LBP techniques: A survey | |
CN112434712A (zh) | 一种基于尺度和角度自适应选取的局部二值模式纹理图像特征提取方法及系统 | |
Shahid et al. | Large scale face recognition in the wild: technical challenges and research directions | |
Khryashchev et al. | Enhancement of Fast Face Detection Algorithm Based on A Cascade of Decision Trees | |
Jyothi et al. | Study of Image Forgery Detection using Scale Invariant Feature Transform |