TWI740613B

TWI740613B - 使用類神經網路的辨識方法、電子裝置與電腦程式產品

Info

Publication number: TWI740613B
Application number: TW109128115A
Authority: TW
Inventors: 陳松琳; 何書安; 陳俊吉; 高郁雯; 林喬彬
Original assignee: 中國鋼鐵股份有限公司
Priority date: 2020-08-18
Filing date: 2020-08-18
Publication date: 2021-09-21
Also published as: TW202209191A

Abstract

本發明提出一種使用類神經網路的辨識方法，包括：設定類神經網路的輸出層僅包括兩個神經元，這兩個神經元的其中一者輸出長度，另一者輸出角度；以及將所有類別分別配置在一座標系統中的多個區域，並判斷長度與角度所組成的位置落在哪一個區域以辨識出對應的類別。

Description

使用類神經網路的辨識方法、電子裝置與電腦程式產品

本揭露是關於使用類神經網路的辨識方法，可以降低輸出層中神經元的數量。

在各種行業中，物品身分識別是製程、庫儲與物流作業中最關鍵的工作之一，物品的身分代碼可以用噴漆或印刷等方式形成在物品上，接著透過字元辨識的演算法來辨識出身分代碼。現行市售的識別方案一般都是以類神經網路來實作，因此當所需辨識的僅有數字時神經網路的輸出層便需要輸出10個類別，如果再增加英文字母的類別，則神經網路的輸出層便需要輸出36個類別。如何降低輸出層輸出的類別，或者讓輸出層輸出的類別數目固定，為此領域技術人員所關心的議題。

本發明的實施例提出一種使用類神經網路的辨識方法，適用於一電子裝置，此類神經網路用以辨識多個類別。此辨識方法包括：設定類神經網路的一輸出層僅包括兩個神經元，這兩個神經元的其中一者輸出長度，另一者輸出角度；以及將類別分別配置在一座標系統中的多個區域，並判斷長度與角度所組成的位置落在哪一個區域以辨識出對應的類別。

在一些實施例中，上述的辨識方法更包括：當增加類別的數目時，增加區域的數目而不改變輸出層；或者當減少類別的數目時，減少區域的數目而不改變輸出層。

在一些實施例中，上述的類別包括多個數字或者多個字母。

在一些實施例中，上述的辨識方法更包括：將類別所對應的真實輸出排列為一環並具有相同的長度。

在一些實施例中，上述的辨識方法更包括：將類別所對應的真實輸出排列為多個環，部分的類別配置在內環且具有第一長度，其他部分的類別配置在外環而具有第二長度，其中第一長度小於第二長度。

以另一個角度來說，本發明的實施例提出一種電子裝置，包括記憶體與處理器。記憶體儲存有多個指令，處理器用以執行這些指令以完成多個步驟：設定類神經網路的一輸出層僅包括兩個神經元，這兩個神經元的其中一者輸出長度，另一者輸出角度；以及將類別分別配置在一座標系統中的多個區域，並判斷長度與角度所組成的位置落在哪一個區域以辨識出對應的類別。

以另一個角度來說，本發明的實施例提出一種電腦程式產品，用以載入電腦系統執行以完成多個步驟：設定類神經網路的一輸出層僅包括兩個神經元，這兩個神經元的其中一者輸出長度，另一者輸出角度；以及將類別分別配置在一座標系統中的多個區域，並判斷長度與角度所組成的位置落在哪一個區域以辨識出對應的類別。

在上述的揭示中，不管是增加或減少類別的數目都不需要增加輸出層中神經元的數量，換言之輸出層中神經元的數量為固定。

為讓本發明的上述特徵和優點能更明顯易懂，下文特舉實施例，並配合所附圖式作詳細說明如下。

關於本文中所使用之「第一」、「第二」等，並非特別指次序或順位的意思，其僅為了區別以相同技術用語描述的元件或操作。

圖1是根據一實施例繪示電子裝置的示意圖。請參照圖1，電子裝置100可以是智慧型手機、平板電腦、個人電腦、筆記型電腦、伺服器、工業電腦或具有計算能力的各種電子裝置等，本發明並不在此限。電子裝置100包括了處理器110與記憶體120，處理器110通訊連接至記憶體120，其中處理器110可為中央處理器、微處理器、微控制器、影像處理晶片、特殊應用積體電路等，記憶體120可為隨機存取記憶體、唯讀記憶體、快閃記憶體、軟碟、硬碟、光碟、隨身碟、磁帶或是可透過網際網路存取之資料庫，其中儲存有多個指令，處理器110會執行這些指令來完成用於使用類神經網路的辨識方法，以下將詳細說明此辨識方法。

圖2是根據一實施例繪示類神經網路的示意圖。請參照圖2，類神經網路210的輸入例如是影像。類神經網路210可以是卷積神經網路或者多層感知機(multilayer perception，MLP)或其他任意類型的神經網路，本發明並不在此限。類神經網路210包括一輸出層220，此輸出層220僅包括兩個神經元，其中一個神經元輸出長度A，另一個神經元輸出角度θ，本發明並不限制類神經網路210內除了輸出層220以外的架構。長度A與角度θ可用來決定一座標系統230(例如極座標系統)中的一個位置240。更具體來說，長度A指的是位置240與原點之間的距離，角度θ是指位置240與X軸形成的夾角角度。

此外，類神經網路210是用來辨識輸入的影像屬於多個類別的其中之一，這些類別可包括0~9的數字以及/或者A~Z的英文字母。這些類別可以配置在座標系統230中的多個區域，如圖3所示，在圖3的實施例中座標系統230被分為多個區域300~309，分別對應至數字“0”至數字“9”。在此實施例中共有10個區域，因此每個區域300~309的角度為36度。接下來可判斷長度A與角度θ所組成的位置240落在哪一個區域便可以辨識出對應的類別。舉例來說，當位置240落在區域301內便可以辨識出數字“1”，以此類推。在一些實施例中，由於靠近原點時各類別之間的距離太小容易辨識錯誤，因此可以設定長度必須大於等於一最小值才會判斷落在對應的區域，此最小值可以是10或其他任意合適的數值，本發明並不在此限。在一些實施例中也可以設定長度必須小於等於一最大值才會判斷落在對應的區域，此最大值例如為50，但本發明並不在此限。

在訓練類神經網路時，每筆訓練樣本都需要給予一個真實輸出(ground truth)，也就是給予特定的長度與角度，不能用區域來做為真實輸出，在此可以用各區域的中心位置做為真實輸出。在一些實施例中可以用單環的方式給定真實輸出，也就是說所有類別的真實輸出排列為一個環並具有相同的長度。請參照圖4所示的表格，“中心角度”與“中心長度”是表示真實輸出的座標。舉例來說，數字“0”對應的真實輸出是(A=30,θ=18)，數字“1”對應的真實輸出是(A=30,θ=54)，以此類推。這些真實輸出的座標如圖5所示，可以看出從數字“0”到數字“9”的座標是排列為一個環。請參照回圖4，如上所述，在測試時長度與角度都必須落在預設的範圍才會判斷屬於對應的區域，例如，長度必須在範圍10~50內，角度必須在0~36度的範圍內才會辨識為數字“0”；長度必須在範圍10~50內，角度必須在36~72度的範圍才會辨識為數字“1”，以此類推。

在一些實施例中，也可以用多環的方式給定真實輸出，也就是說所有類別的真實輸出排列為多個環，部分的類別配置在內環，其他部分的類別可以配置在外環。請參照圖6所示的表格，此表格的繪製方式相同於圖4的表格。舉例來說，數字“0”對應的真實輸出是(A=20,θ=36)，數字“1”對應的真實輸出是(A=20,θ=108)，以此類推。如圖7所示，可以看出數字“0”到數字“4”的座標是排列在內環且長度(亦稱第一長度)彼此相同，而數字“5”到數字“9”的座標是排列在外環且長度(亦稱第二長度)彼此相同，其中第一長度小於第二長度。在圖7的實施例中因為每個類別分配的面積比較大，因此可以提升正確率。

圖5與圖7分別繪示了單環與雙環的排列，但本發明並不在此限，在其他實施例中也可以將所有類別的真實輸出排列更多環。

在上述的實施例是要辨識數字，當要辨識更多類別，例如辨識英文字母或是數字加上英文字母時，則只需要增加區域的數目，對應地調整真實輸出的長度與角度即可，並不需要改變輸出層220。舉例來說，數字加上英文字母共有36個類別，如果排列為4個環，則每個環上有9個類別，因此每個區域的角度為40度，這4個環的長度可分別為20、40、60、80。類似地，當要減少類別的數目時，只需要減少區域的數目而不需要改變輸出層220。如此一來，即使再多的類別也不需要增加輸出層中神經元的數量，換言之輸出層中神經元的數量為固定。

圖8是根據一實施例繪示使用類神經網路的辨識方法。請參照圖8，在步驟801，設定類神經網路的輸出層僅包括兩個神經元，這兩個神經元的其中一者輸出長度，另一者輸出角度。在步驟802，將多個類別分別配置在一座標系統中的多個區域，並判斷上述長度與角度所組成的位置落在哪一個區域以辨識出對應的類別。然而，圖8中各步驟已詳細說明如上，在此便不再贅述。值得注意的是，圖8中各步驟可以實作為多個程式碼或是電路，本發明並不在此限。此外，圖8的方法可以搭配以上實施例使用，也可以單獨使用。換言之，圖8的各步驟之間也可以加入其他的步驟。

以另外一個角度來說，本發明也提出了一電腦程式產品，此產品可由任意的程式語言及/或平台所撰寫，當此電腦程式產品被載入至電腦系統並執行時，可執行上述的辨識方法。

雖然本發明已以實施例揭露如上，然其並非用以限定本發明，任何所屬技術領域中具有通常知識者，在不脫離本發明的精神和範圍內，當可作些許的更動與潤飾，故本發明的保護範圍當視後附的申請專利範圍所界定者為準。

100:電子裝置 110:處理器 120:記憶體 210:類神經網路 220:輸出層 230:座標系統 240:位置 A:長度 θ:角度 300~309:區域 801,802:步驟

[圖1]是根據一實施例繪示電子裝置的示意圖。 [圖2]是根據一實施例繪示類神經網路的示意圖。 [圖3]是根據一實施例繪示在座標系統設置多個區域的示意圖。 [圖4]是根據一實施例繪示單環設置時各類別的配置表格。 [圖5]是根據一實施例繪示單環設置的座標示意圖。 [圖6]是根據一實施例繪示雙環設置時各類別的配置表格。 [圖7]是根據一實施例繪示雙環設置的座標示意圖。 [圖8]是根據一實施例繪示使用類神經網路的辨識方法的流程圖。

801,802:步驟

Claims

一種使用類神經網路的辨識方法，適用於一電子裝置，該類神經網路用以辨識多個類別，該辨識方法包括：設定該類神經網路的一輸出層僅包括兩個神經元，該兩個神經元的其中一者輸出長度，另一者輸出角度；以及將該些類別以一對一映射方式配置在一座標系統中的多個區域，並判斷該長度與該角度所組成的一位置落在該些區域的其中一者以辨識出對應的該類別。
如請求項1所述之辨識方法，更包括：當增加該些類別的數目時，相應增加該些區域的數目而不改變該輸出層；或者當減少該些類別的數目時，相應減少該些區域的數目而不改變該輸出層。
如請求項1所述之辨識方法，其中該些類別包括多個單一數字字元或者多個單一英文字母。
如請求項1所述之辨識方法，更包括：將該些類別所對應的真實輸出的座標於該座標系統中排列為一環並具有相同的該長度。
如請求項1所述之辨識方法，更包括：將該些類別所對應的真實輸出的座標在該座標系統中排列為多個環，部分的該些類別的該真實輸出的該座標是配置在該些環中的內環且距離一原點第一長度，其他部分的該些類別的該真實輸出的該座標是配置在該些環中的外環且距離該原點第二長度，其中該第一長度小於該第二長度。
一種電子裝置，包括：一記憶體，儲存有多個指令；以及一處理器，用以執行該些指令以完成多個步驟：設定一類神經網路的一輸出層僅包括兩個神經元，該兩個神經元的其中一者輸出長度，另一者輸出角度，該類神經網路用以辨識多個類別；以及將該些類別以一對一映射方式配置在一座標系統中的多個區域，並判斷該長度與該角度所組成的一座標落在該些區域的其中一者以辨識出對應的該類別。
一種電腦程式產品，用以載入一電腦系統執行以完成多個步驟：設定一類神經網路的一輸出層僅包括兩個神經元，該兩個神經元的其中一者輸出長度，另一者輸出角度，該類神經網路用以辨識多個類別；以及將該些類別以一對一映射方式配置在一座標系統中的多個區域，並判斷該長度與該角度所組成的一座標落在該些區域的其中一者以辨識出對應的該類別。