TW202343304A

TW202343304A - 圖像識別方法、圖像識別裝置及資訊處理裝置

Info

Publication number: TW202343304A
Application number: TW111114735A
Authority: TW
Inventors: 陳世林; 田志民; 王長海; 馮繼雄; 李保梁; 宋子明; 劉奇; 柯岩; 朱琳
Original assignee: 大陸商北京集創北方科技股份有限公司
Priority date: 2022-04-18
Filing date: 2022-04-18
Publication date: 2023-11-01

Abstract

一種圖像識別方法，係由一控制電路執行一程式實現，其包括：對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣；依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像；對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域，依該幀第一圖像中之該共同區域內的圖像產生一第二圖像，及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像；以及利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。

Description

圖像識別方法、圖像識別裝置及資訊處理裝置

本發明係有關於圖像識別方法，特別是關於一種可兼顧圖像識別裝置之計算負擔和識別精準度的圖像識別方法。

現有的圖像識別技術大致分為兩種： (一)通過圖像特徵提取演算法(例如Minutiae匹配、SIFT或 ORB等演算法）提取圖像特徵，再比對範本圖像和待辨識圖像間的特徵相似度；以及 (二)利用深度學習模型，對比範本圖像和待辨識圖像間的相似度。

就上述兩種模式的優、缺點比較而言，圖像特徵提取演算法的計算量相對較小，對硬體要求較低，因此其模組的體積較小，處理速度較快，然而，其損失的圖像資訊也較多，致使其辨識準確率較低；相對地，深度學習模型的辨識準確率高，然其對硬體要求較高，因此其模型體積較大，不適用於無圖形處理器(graphics processing unit)或其他並行運算處理器之產品中。

為解決上述的問題，本領域亟需一新穎的圖像識別方法。

本發明之主要目的在於揭露一種圖像識別方法，其可兼顧一圖像識別裝置之計算負擔和識別精準度，從而優化該圖像識別裝置之圖像識別性能。

本發明之另一目的在於揭露一種圖像識別裝置，其可藉由上述的圖像識別方法優化其圖像識別性能。本發明之又一目的在於揭露一種資訊處理裝置，其可藉由上述的圖像識別裝置優化其圖像識別性能。為達前述目的，一種圖像識別方法乃被提出，其係由一控制電路執行一程式實現，且其包括：對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣；依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像；對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域，依該幀第一圖像中之該共同區域內的圖像產生一第二圖像，及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像；以及利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。

在一實施例中，該幀待辨識圖像係一幀指紋圖像。

在可能的實施例中，該圖像特徵對齊操作採用尺度不變特徵轉換(Scale-invariant feature transform ； SIFT)運算、ORB(Oriented FAST and Rotated BRIEF；經定位的FAST (Features from Accelerated Segment Test；加速片段測試之特徵)及經旋轉的BRIEF(Binary Robust Independent Elementary Features；二進制強固獨立元素特徵))運算、或Minutiae(細節點)匹配運算。

在一實施例中，該人工智慧判決運算包括對該第二圖像和該第三圖像進行一二值化運算。為達前述目的，本發明進一步提出一種圖像識別裝置，其具有一控制電路以藉由執行一程式實現一圖像識別方法，該方法包括：對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣；依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像；對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域，依該幀第一圖像中之該共同區域內的圖像產生一第二圖像，及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像；以及利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。

在一實施例中，該幀待辨識圖像係一幀指紋圖像。

在一實施例中，該人工智慧判決運算包括對該第二圖像和該第三圖像進行一二值化運算。

為達前述目的，本發明進一步提出一種資訊處理裝置，其具有一中央處理單元及如前述之圖像識別裝置，其中，該中央處理單元係用以與該圖像識別裝置通信以依該圖像識別裝置之比對結果決定是否執行一解鎖操作。

在可能的實施例中，所述之資訊處理裝置可為一智慧型手機、一可攜式電腦、一車載電腦、一穿戴式電子裝置或一門禁裝置。

為使　貴審查委員能進一步瞭解本發明之結構、特徵及其目的，茲附以圖式及較佳具體實施例之詳細說明如後。

本發明的圖像識別方法的原理在於： (一)先對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以在同一座標平面上界定出一共同區域；以及 (二)利用一深度學習模型對該幀待辨識圖像和該幀模版圖像中分別與該共同區域對應之兩個圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。

依此，本發明即可在有效降低深度學習模型的複雜度和計算量的情況下仍然提供準確的圖像辨識結果。

請參照圖1，其繪示本發明之圖像識別方法之一實施例的流程圖，其係由一控制電路執行一程式實現。如圖1所示，該圖像識別方法包括：對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣(步驟a)；依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像(步驟b)；對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域，依該幀第一圖像中之該共同區域內的圖像產生一第二圖像，及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像(步驟c)；以及利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果(步驟d)。

在步驟a中，該幀待辨識圖像和該幀模版圖像可分別為一幀待辨識指紋圖像和一幀模版指紋圖像；且該圖像特徵對齊操作可採用尺度不變特徵轉換(Scale-invariant feature transform ； SIFT)運算、ORB(Oriented FAST and Rotated BRIEF；經定位的FAST (Features from Accelerated Segment Test；加速片段測試之特徵)及經旋轉的BRIEF(Binary Robust Independent Elementary Features；二進制強固獨立元素特徵))運算、或Minutiae(細節點)匹配運算。由於該些運算皆為習知技術，故在此不擬贅述。

在步驟b中，該方位變換運算包括一位移操作和一旋轉操作，用以使該幀第一圖像的圖像特徵和該幀模版圖像的圖像特徵對齊。

在步驟c中，可對該第二圖像和該第三圖像進行一二值化運算以大幅降低在步驟d中之該深度學習模型之計算量。另外，如果圖像仍然較大，可進一步對該第二圖像和該第三圖像進行降採樣。

在步驟d中，該深度學習模型之各層中的複數個節點的加權係數係利用一張所述第三圖像和多張所述第二圖像對該深度學習模型進行訓練而得，亦即，可用多張已知為真的和多張已知為假的所述第二圖像搭配所述第三圖像對該深度學習模型進行訓練以產生該些加權係數。由於該深度學習模型為習知技術，故在此不擬贅述。

另外，在可能的應用中，該幀待辨識圖像和該幀模版圖像亦可分別為一幀待辨識掌紋圖像和一幀模版掌紋圖像，或分別為一幀待辨識瞳孔圖像和一幀模版瞳孔圖像。

另外，在進行該人工智慧判決運算時，可先將該第二圖像和該第三圖像拼接以產生一張輸入圖像，而該人工智慧判決運算對該張輸入圖像的處理方式可為： (一)利用不同的通道分離: I(x,y,1)= I1(x,y), I(x,y,2) = I2(x,y)，其中， I(x,y,1)為該張輸入圖像中代表該第二圖像的資料，I(x,y,2) 為該張輸入圖像中代表該第二圖像的資料，I1(x,y)代表輸入該深度學習模型之第一輸入通道的資料，I2(x,y)代表輸入該深度學習模型之第二輸入通道的資料； (二)對於二值化的圖像，可將所述第一輸入通道的資料和所述第二輸入通道的資料用不同加權值合併成單一輸入通道的資料：I(x,y)=I1(x,y) * 2 + I2(x,y)，其中，I(x,y)為該單一輸入通道的資料。 (三)可用所述第一輸入通道的資料和所述第二輸入通道的差值做為單一輸入通道的資料：I(x,y) = abs(I1(x,y) – I2(x,y))，其中abs()代表一絕對值運算子。

依上述的說明，本發明進一步提出一種圖像識別裝置。請參照圖2，其繪示本發明之圖像識別裝置之一實施例之方塊圖。如圖2所示，一圖像識別裝置100具有一圖像擷取單元110及一控制電路120，圖像擷取單元110係用以擷取一幀待辨識圖像，控制電路120具有一處理器121及一記憶體122，記憶體122儲存有一程式，處理器121係用以執行該程式以實現圖1所示之圖像識別方法。

另外，該幀待辨識圖像可為一幀指紋圖像、一幀掌紋圖像或一幀瞳孔圖像。

另外，依上述的說明，本發明進一步提出一種資訊處理裝置。請參照圖3，其繪示本發明之資訊處理裝置之一實施例的方塊圖。如圖3所示，一資訊處理裝置200具有一中央處理單元210及一圖像識別裝置220，其中，圖像識別裝置220係由圖2所示之圖像識別裝置100實現，且中央處理單元210係用以與圖像識別裝置通信以依圖像識別裝置220之比對結果決定是否執行一解鎖操作。

另外，資訊處理裝置200可為一智慧型手機、一可攜式電腦、一車載電腦、一穿戴式電子裝置或一門禁裝置。

藉由前述所揭露的設計，本發明乃具有以下的優點：一、本發明之圖像識別方法可兼顧一圖像識別裝置之計算負擔和識別精準度，從而優化該圖像識別裝置之圖像識別性能。二、本發明之圖像識別裝置可藉由上述的圖像識別方法優化其圖像識別性能。三、本發明之資訊處理裝置可藉由上述的圖像識別裝置優化其圖像識別性能。

本案所揭示者，乃較佳實施例，舉凡局部之變更或修飾而源於本案之技術思想而為熟習該項技藝之人所易於推知者，俱不脫本案之專利權範疇。

綜上所陳，本案無論目的、手段與功效，皆顯示其迥異於習知技術，且其首先發明合於實用，確實符合發明之專利要件，懇請　貴審查委員明察，並早日賜予專利俾嘉惠社會，是為至禱。

100:圖像識別裝置 110:圖像擷取單元 120:控制電路 121:處理器 122:記憶體 200:資訊處理裝置 210:中央處理單元 220:圖像識別裝置

步驟a:對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣。

步驟b:依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像。

步驟c:對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域，依該幀第一圖像中之該共同區域內的圖像產生一第二圖像，及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像。

步驟d :利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。

圖1繪示本發明之顯示裝置之一實施例的方塊圖。圖2繪示本發明之自發光顯示器的環境光補償方法之一實施例之流程圖。圖3繪示本發明之資訊處理裝置之一實施例的方塊圖。

步驟a:對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣

步驟b:依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像

步驟c:對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域，依該幀第一圖像中之該共同區域內的圖像產生一第二圖像，及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像

步驟d:利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果

Claims

一種圖像識別方法，係由一控制電路執行一程式實現，其包括：對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣；依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像；對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域，依該幀第一圖像中之該共同區域內的圖像產生一第二圖像，及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像；以及利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。
如申請專利範圍第1項所述之圖像識別方法，其中，該幀待辨識圖像係一幀指紋圖像。
如申請專利範圍第1項所述之圖像識別方法，其中，該圖像特徵對齊操作採用尺度不變特徵轉換(Scale-invariant feature transform ； SIFT)運算、ORB(Oriented FAST and Rotated BRIEF；經定位的FAST (Features from Accelerated Segment Test；加速片段測試之特徵)及經旋轉的BRIEF(Binary Robust Independent Elementary Features；二進制強固獨立元素特徵))運算、或Minutiae(細節點)匹配運算。
如申請專利範圍第1項所述之圖像識別方法，其中，該人工智慧判決運算包括對該第二圖像和該第三圖像進行一二值化運算。
一種圖像識別裝置，其具有一控制電路以藉由執行一程式實現一圖像識別方法，該方法包括：對一幀待辨識圖像和一幀模版圖像執行一圖像特徵對齊操作以產生一方位變換矩陣；依該方位變換矩陣對該幀待辨識圖像進行一方位變換運算以產生一幀第一圖像；對該幀第一圖像和該幀模版圖像進行一共同區域界定運算以產生一共同區域，依該幀第一圖像中之該共同區域內的圖像產生一第二圖像，及依該幀模版圖像中之該共同區域內的圖像產生一第三圖像；以及利用一深度學習模型對該第二圖像和該第三圖像進行一人工智慧判決運算以產生該幀待辨識圖像與該幀模版圖像之一比對結果。
如申請專利範圍第5項所述之圖像識別裝置，其中，該幀待辨識圖像係一幀指紋圖像。
如申請專利範圍第5項所述之圖像識別裝置，其中，該圖像特徵對齊操作採用尺度不變特徵轉換(Scale-invariant feature transform ； SIFT)運算、ORB(Oriented FAST and Rotated BRIEF；經定位的FAST (Features from Accelerated Segment Test；加速片段測試之特徵)及經旋轉的BRIEF(Binary Robust Independent Elementary Features；二進制強固獨立元素特徵))運算、或Minutiae匹配運算。
如申請專利範圍第5項所述之圖像識別裝置，其中，該人工智慧判決運算包括對該第二圖像和該第三圖像進行一二值化運算。
一種資訊處理裝置，其具有一中央處理單元及如申請專利範圍第5至8項中任一項所述之圖像識別裝置，其中，該中央處理單元係用以與該圖像識別裝置通信以依該圖像識別裝置之所述比對結果決定是否執行一解鎖操作。
如申請專利範圍第9項所述之資訊處理裝置，其係由一智慧型手機、一可攜式電腦、一車載電腦、一穿戴式電子裝置和一門禁裝置所組成群組中所選擇的一種裝置。