TWI775084B - 圖像識別方法、裝置、電腦裝置及存儲介質 - Google Patents
圖像識別方法、裝置、電腦裝置及存儲介質 Download PDFInfo
- Publication number
- TWI775084B TWI775084B TW109117736A TW109117736A TWI775084B TW I775084 B TWI775084 B TW I775084B TW 109117736 A TW109117736 A TW 109117736A TW 109117736 A TW109117736 A TW 109117736A TW I775084 B TWI775084 B TW I775084B
- Authority
- TW
- Taiwan
- Prior art keywords
- nodes
- image recognition
- layer
- fully connected
- neural network
- Prior art date
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Abstract
本發明提供一種圖像識別方法、圖像識別裝置、電腦裝置及存儲介質,所述方法包括:獲取訓練資料,利用訓練資料訓練神經網路模型全連接層的參數,將訓練後的神經網路模型作為圖像識別模型,所述參數的訓練包括:獲取神經網路模型中全連接層的運算程式;查找運算程式中至少一層的結點;將同一層內的結點按照第一預設規則分成多個小組;按照第二預設規則確定多個小組內的特徵結點,將多個特徵結點作為全連接層的參數資訊;響應於圖像識別指令,從圖像識別指令中獲取待處理圖像;將待處理圖像輸入至圖像識別模型中,輸出圖像識別結果。
Description
本發明涉及電腦技術領域,具體涉及一種圖像識別方法、圖像識別裝置、電腦裝置及存儲介質。
在人工智慧高速發展的時代,圖像識別技術已經運用到生產、生活的各個方面,例如藉由圖像識別技術確認產線上不良產品的不良類型,識別生物特徵資訊,識別違章車輛車牌資訊等。現有圖像識別方法大多基於神經網路模型,但是這種基於神經網路模型的圖像識別方法的運算量大,導致圖像識別的速度非常慢。
鑒於以上內容,有必要提出一種圖像識別方法及裝置、電腦裝置和存儲介質,加快圖像識別的運行速度,提高圖像識別的效率。
本申請的第一方面提供一種圖像識別方法,所述圖像識別方法包括:獲取訓練資料,利用所述訓練資料訓練神經網路模型的全連接層的參數,並將訓練後的神經網路模型作為圖像識別模型,其中,對所述神經網路模型的全連接層的參數的訓練包括:獲取所述神經網路模型中全連接層的運算程式;
查找所述全連接層的運算程式中至少一層的結點;將同一層內的結點按照第一預設規則分成多個小組;按照第二預設規則確定多個所述小組內的特徵結點,並將多個所述特徵結點作為所述全連接層的參數資訊,完成對所述全連接層的參數的訓練;響應於接收到的圖像識別指令,從所述圖像識別指令中獲取待處理圖像;將所述待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果。
優選地,所述獲取訓練資料,利用所述訓練資料訓練神經網路模型還包括:構建驗證資料集;利用所述驗證資料集對訓練後的神經網路模型進行驗證,並根據驗證結果統計所述神經網路模型預測的準確率;判斷所述預測的準確率是否小於預設閾值;若所述預測的準確率不小於所述預設閾值,將訓練完成的所述神經網路模型作為所述圖像識別模型。
優選地,所述將同一層內的結點按照第一預設規則分成多個小組的方法包括:根據所述同一層中結點的位置以及結點的個數,及按照預設比例對所述同一層中的結點進行平均分組。
優選地,所述將同一層內的結點按照第一預設規則分成多個小組的方法還包括:根據所述同一層中結點的位置,按照差分法選擇預設位置的結點,將位於預設位置的結點分為第一組,將非預設位置的結點分為第二組,其中所述差分法包括等距離差分、非等距離差分。
優選地,所述按照第二預設規則確定多個所述小組內的特徵結點的方法包括:獲取所述小組內各個結點對應的數值,對所述數值進行排序;
選擇最大數值對應的結點作為所述小組內的特徵結點。
優選地,所述按照第二預設規則確定多個所述小組內的特徵結點的方法還包括:獲取所述小組內各個結點對應的數值,將所述數值與預設閾值進行比對;若所述數值大於所述預設閾值,則將所述數值對應的結點作為小組內的特徵結點。
優選地,所述將所述待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果包括:獲取待處理圖像中畫素的畫素值和圖像識別模型中全連接層的參數資訊,其中所述全連接層的參數資訊包括全連接層的輸入層、全連接層的輸出層、特徵結點的位置;查找所述全連接層的輸入層中特徵結點的位置,藉由第一預設函數關係將所述待處理圖像中畫素的畫素值轉換為全連接層的輸入層中特徵結點的特徵畫素值;查找所述全連接層的輸出層中特徵結點的位置,藉由第二預設函數關係將所述全連接層的輸入層中特徵結點的特徵畫素值轉換為所述全連接層的輸出層中特徵結點的特徵畫素值;獲取全連接層的輸出層中特徵結點的特徵畫素值,並利用所述輸出層中特徵結點的特徵畫素值輸出圖像識別結果。
本申請的第二方面提供一種圖像識別裝置,所述裝置包括:訓練模組,用於利用所述訓練資料訓練神經網路模型的全連接層的參數,並將訓練後的神經網路模型作為所述圖像識別模型,其中,對所述神經網路模型的全連接層的參數的訓練包括:獲取所述神經網路模型中全連接層的運算程式;查找所述全連接層的運算程式中至少一層的結點;將同一層內的結點按照第一預設規則分成多個小組;及
按照第二預設規則確定多個所述小組內的特徵結點,並將多個所述特徵結點作為所述全連接層的參數資訊,完成對所述全連接層的參數的訓練;獲取模組,用於響應於接收到的圖像識別指令,從所述圖像識別指令中獲取待處理圖像;輸出模組,用於將所述待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果。
本申請的第三方面提供一種電腦裝置,所述電腦裝置包括處理器,所述處理器用於執行記憶體中存儲的電腦程式時實現如前所述圖像識別方法。
本申請的第四方面提供一種存儲介質,其上存儲有電腦程式,所述電腦程式被處理器執行時實現如前所述圖像識別方法。
本發明圖像識別方法、圖像識別裝置、電腦裝置及存儲介質,所述方法藉由訓練圖像識別模型,將待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果。藉由所述方法可以簡化圖像識別模型的運算結構,加快圖像識別的運算速度。
1:電腦裝置
10:圖像識別裝置
20:記憶體
30:處理器
40:電腦程式
101:訓練模組
102:獲取模組
103:輸出模組
圖1是本發明一實施例提供的圖像識別方法流程圖。
圖2是本發明一實施例提供的基於AlexNet演算法的神經網路模型示意圖。
圖3是本發明一實施例提供的圖像識別裝置的結構示意圖。
圖4是本發明一實施例提供的電腦裝置示意圖。
為了能夠更清楚地理解本發明的上述目的、特徵和優點,下面結合附圖和具體實施例對本發明進行詳細描述。需要說明的是,在不衝突的情況
下,本申請的實施例及實施例中的特徵可以相互組合。
在下面的描述中闡述了很多具體細節以便於充分理解本發明,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
除非另有定義,本文所使用的所有的技術和科學術語與屬於本發明的技術領域的技術人員通常理解的含義相同。本文中在本發明的說明書中所使用的術語只是為了描述具體的實施例的目的,不是旨在於限制本發明。
本發明中的圖像識別方法應用在電腦裝置中。所述電腦裝置可以為安裝有圖像識別軟體的電子設備,例如個人電腦、伺服器等,其中,所述伺服器可以是單一的伺服器、伺服器集群或雲伺服器等。
在本發明又一實施方式中,所述電腦裝置還可以和至少一個使用者終端進行網路連接,所述使用者終端用於獲取待處理資料,並將所述待處理資料發送至電腦裝置,電腦裝置對所述資料進行分析處理之後,將處理之後的結果發送至使用者終端。所述網路可以是有線網路,也可以是無線網路,例如無線電、無線保真(Wireless Fidelity,WIFI)、蜂窩、衛星、廣播等。
請參閱圖1所示,是本發明一實施例提供的圖像識別方法的流程圖。根據不同的需求,所述流程圖中步驟的順序可以改變,某些步驟可以省略。
步驟S1、獲取訓練資料,利用所述訓練資料訓練神經網路模型的全連接層的參數,並將訓練後的神經網路模型作為所述圖像識別模型。
所述訓練資料可以是已知圖像特徵資訊的圖片或視頻。例如是已知產品瑕疵類型的圖片,已知物體名稱的物體照片、視頻等。
對所述神經網路模型的全連接層的參數的訓練步驟包括:
(1)獲取所述神經網路模型中全連接層的運算程式。所述神經網路模型包
括基於AlexNet演算法的神經網路模型、基於VGG16演算法的神經網路模型中的任意一種。
在本發明一實施方式中,所述神經網路模型是基於AlexNet演算法的神經網路模型,包括5個卷積層,以及2個全連接層。獲取所述基於AlexNet演算法的神經網路模型中全連接層的運算程式。在其他實施方式中,所述全連接層的層數可以根據圖像識別的精度進行調整,圖像識別的精度要求越高,所述全連接層的層數越多。
(2)查找所述全連接層的運算程式中至少一層的結點。
例如分別查找基於AlexNet演算法的神經網路模型中全連接層的第一層和全連接層的第二層中的結點。如圖2所示,是本發明一實施例提供的基於AlexNet演算法的神經網路模型示意圖。圖中的A層作為全連接層中的第一層,所述第一層的結點數位2048個。所述圖像經過卷積層的運算後需要和全連接層中的第一層結點藉由ReLU函數運算進行連接。
(3)將同一層內的結點按照第一預設規則分成多個小組。
在本發明一實施方式中,所述將同一層內的結點按照第一預設規則分成多個小組的方法可以包括:根據所述同一層中結點的位置以及結點的個數,及按照預設比例對所述同一層中的結點進行平均分組。例如,將全連接層中的第一層中相鄰的兩個結點分為一組,或將全連接層中的第一層中相鄰的三個結點分為一組。同一小組內結點的數量可以根據神經網路模型所要達到的運算速度進行選擇,其中神經網路模型的運算速度越快,則在同一小組內的結點數量越多。
在本發明又一實施方式中,所述將同一層內的結點按照第一預設規則分成多個小組的方法還可以包括:根據所述同一層中結點的位置,按照差分法選擇預設位置的結點,將位於
預設位置的結點分為第一組,將非預設位置的結點分為第二組,其中所述差分法包括等距離差分、非等距離差分。例如,按照神經網路模型中全連接層結點的特性,將特徵資訊區域的結點按照兩個結點一組進行劃分,在非特徵資訊區域的結點按照五個結點為一組進行劃分。這種非等距離差分法可以最大化的保存特徵區域的運算量,減少非特徵區域的運算量,從而加快整個神經網路模型的運算速度。
(4)按照第二預設規則確定多個所述小組內的特徵結點,並將多個所述特徵結點作為所述全連接層的參數資訊,完成對所述全連接層的參數的訓練。
在本發明一實施方式中,所述按照第二預設規則確定多個所述小組內的特徵結點的方法可以包括:獲取所述小組內各個結點對應的數值,對所述數值進行排序;選擇最大數值對應的結點作為所述小組內的特徵結點。例如,所述結點對應的數值為圖像中畫素的灰度值,對應的灰度範圍為0到255。獲取同一小組內每個結點對應灰度值,並對所述灰度值進行排序,選擇同一小組內灰度值最大的結點最為所述小組內的特徵結點。
在本發明又一實施方式中,所述按照第二預設規則確定多個所述小組內的特徵結點的方法還可以包括:獲取所述小組內各個結點對應的數值,將所述數值與預設閾值進行比對;若所述數值大於所述預設閾值,則將所述數值對應的結點作為小組內的特徵結點。例如,獲取同一小組內每個結點對應灰度值,將同一小組內的灰度值與一設定的閾值進行比較,若所述灰度值在所述閾值範圍內,則所述灰度值對應的結點為所述小組內的特徵結點。
在其他實施方式中,所述獲取訓練資料,利用所述訓練資料訓練
神經網路模型的步驟還包括:構建驗證資料集;利用所述驗證資料集對訓練後的神經網路模型進行驗證,並根據驗證結果統計所述神經網路模型預測的準確率;判斷所述預測的準確率是否小於預設閾值;若所述預測的準確率不小於所述預設閾值,將訓練完成的所述神經網路模型作為所述圖像識別模型。
步驟S2、響應於接收到的圖像識別指令,從所述圖像識別指令中獲取待處理圖像。
其中,所述待處理圖像可以由工作人員上傳,也可以藉由網路爬蟲技術進行獲取。
步驟S3、將所述待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果。
在本發明一實施方式中,將所述待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果的步驟可以包括:獲取待處理圖像中畫素的畫素值和圖像識別模型中全連接層的參數資訊,其中所述全連接層的參數資訊包括全連接層的輸入層、全連接層的輸出層、特徵結點的位置;查找所述全連接層的輸入層中特徵結點的位置,藉由第一預設函數關係將所述待處理圖像中畫素的畫素值轉換為全連接層的輸入層中特徵結點的特徵畫素值;查找所述全連接層的輸出層中特徵結點的位置,藉由第二預設函數關係將所述全連接層的輸入層中特徵結點的特徵畫素值轉換為所述全連接層的輸出層中特徵結點的特徵畫素值;
獲取全連接層的輸出層中特徵結點的特徵畫素值,並利用所述輸出層中特徵結點的特徵畫素值輸出圖像識別結果。
在其他實施方式中,可以獲取待處理圖像中畫素的RGB值、灰度值,將所述RGB值、灰度值導入到所述圖像識別模型中,輸出圖像識別的結果。
上述圖1、圖2詳細介紹了本發明的圖像識別方法,下面結合第3-4圖,對實現所述圖像識別方法的軟體裝置的功能模組以及實現所述圖像識別方法的硬體裝置架構進行介紹。
應所述瞭解,所述實施例僅為說明之用,在專利申請範圍上並不受此結構的限制。
圖3為本發明圖像識別裝置較佳實施例的結構圖。
在一些實施例中,圖像識別裝置10運行於電腦裝置中。所述電腦裝置藉由網路連接了多個使用者終端。所述圖像識別裝置10可以包括多個由程式碼段所組成的功能模組。所述圖像識別裝置10中的各個程式段的程式碼可以存儲於電腦裝置的記憶體中,並由所述至少一個處理器所執行,以實現圖像識別功能。
本實施例中,所述圖像識別裝置10根據其所執行的功能,可以被劃分為多個功能模組。參閱圖3所示,所述功能模組可以包括:訓練模組101、獲取模組102、輸出模組103。本發明所稱的模組是指一種能夠被至少一個處理器所執行並且能夠完成固定功能的一系列電腦程式段,其存儲在記憶體中。在本實施例中,關於各模組的功能將在後續的實施例中詳述。
所述訓練模組101,用於利用所述訓練資料訓練神經網路模型的全連接層的參數,並將訓練後的神經網路模型作為所述圖像識別模型。
所述訓練資料可以是已知圖像特徵資訊的圖片或視頻。例如是已知產品瑕疵類型的圖片,已知物體名稱的物體照片、視頻等。
對所述神經網路模型的全連接層的參數的訓練步驟包括:
(1)獲取所述神經網路模型中全連接層的運算程式。所述神經網路模型包括基於AlexNet演算法的神經網路模型、基於VGG16演算法的神經網路模型中的任意一種。
在本發明一實施方式中,所述神經網路模型是基於AlexNet演算法的神經網路模型,包括5個卷積層,以及2個全連接層。獲取所述基於AlexNet演算法的神經網路模型中全連接層的運算程式。在其他實施方式中,所述全連接層的層數可以根據圖像識別的精度進行調整,圖像識別的精度要求越高,所述全連接層的層數越多。
(2)查找所述全連接層的運算程式中至少一層的結點。
例如分別查找基於AlexNet演算法的神經網路模型中全連接層的第一層和全連接層的第二層中的結點。如圖2所示,是本發明一實施例提供的基於AlexNet演算法的神經網路模型示意圖。圖中的A層作為全連接層中的第一層,所述第一層的結點數位2048個。所述圖像經過卷積層的運算後需要和全連接層中的第一層結點藉由ReLU函數運算進行連接。
(3)將同一層內的結點按照第一預設規則分成多個小組。
在本發明一實施方式中,所述將同一層內的結點按照第一預設規則分成多個小組的方法可以包括:根據所述同一層中結點的位置以及結點的個數,及按照預設比例對所述同一層中的結點進行平均分組。例如,將全連接層中的第一層中相鄰的兩個結點分為一組,或將全連接層中的第一層中相鄰的三個結點分為一組。同一小組內結點的數量可以根據神經網路模型所要達到的運算速度進行選擇,其中神經網路模型的運算速度越快,則在同一小組內的結點數量越多。
在本發明又一實施方式中,所述將同一層內的結點按照第一預設
規則分成多個小組的方法還可以包括:根據所述同一層中結點的位置,按照差分法選擇預設位置的結點,將位於預設位置的結點分為第一組,將非預設位置的結點分為第二組,其中所述差分法包括等距離差分、非等距離差分。例如,按照神經網路模型中全連接層結點的特性,將特徵資訊區域的結點按照兩個結點一組進行劃分,在非特徵資訊區域的結點按照五個結點為一組進行劃分。這種非等距離差分法可以最大化的保存特徵區域的運算量,減少非特徵區域的運算量,從而加快整個神經網路模型的運算速度。
(4)按照第二預設規則確定多個所述小組內的特徵結點,並將多個所述特徵結點作為所述全連接層的參數資訊,完成對所述全連接層的參數的訓練。
在本發明一實施方式中,所述按照第二預設規則確定多個所述小組內的特徵結點的方法可以包括:獲取所述小組內各個結點對應的數值,對所述數值進行排序;選擇最大數值對應的結點作為所述小組內的特徵結點。例如,所述結點對應的數值為圖像中畫素的灰度值,對應的灰度範圍為0到255。獲取同一小組內每個結點對應灰度值,並對所述灰度值進行排序,選擇同一小組內灰度值最大的結點最為所述小組內的特徵結點。
在本發明又一實施方式中,所述按照第二預設規則確定多個所述小組內的特徵結點的方法還可以包括:獲取所述小組內各個結點對應的數值,將所述數值與預設閾值進行比對;若所述數值大於所述預設閾值,則將所述數值對應的結點作為小組內的特徵結點。例如,獲取同一小組內每個結點對應灰度值,將同一小組內的灰度值與一設定的閾值進行比較,若所述灰度值在所述閾值範圍內,則所述灰度值對
應的結點為所述小組內的特徵結點。
在其他實施方式中,所述獲取訓練資料,利用所述訓練資料訓練神經網路模型的步驟還包括:構建驗證資料集;利用所述驗證資料集對訓練後的神經網路模型進行驗證,並根據驗證結果統計所述神經網路模型預測的準確率;判斷所述預測的準確率是否小於預設閾值;若所述預測的準確率不小於所述預設閾值,將訓練完成的所述神經網路模型作為所述圖像識別模型。
所述獲取模組102,用於響應於接收到的圖像識別指令,從所述圖像識別指令中獲取待處理圖像。
其中,所述待處理圖像可以由工作人員上傳,也可以藉由網路爬蟲技術進行獲取。
所述輸出模組103,用於將所述待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果。
在本發明一實施方式中,將所述待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果的步驟可以包括:獲取待處理圖像中畫素的畫素值和圖像識別模型中全連接層的參數資訊,其中所述全連接層的參數資訊包括全連接層的輸入層、全連接層的輸出層、特徵結點的位置;查找所述全連接層的輸入層中特徵結點的位置,藉由第一預設函數關係將所述待處理圖像中畫素的畫素值轉換為全連接層的輸入層中特徵結點的特徵畫素值;查找所述全連接層的輸出層中特徵結點的位置,藉由第二預設函數關係將
所述全連接層的輸入層中特徵結點的特徵畫素值轉換為所述全連接層的輸出層中特徵結點的特徵畫素值;獲取全連接層的輸出層中特徵結點的特徵畫素值,並利用所述輸出層中特徵結點的特徵畫素值輸出圖像識別結果。
在其他實施方式中,可以獲取待處理圖像中畫素的RGB值、灰度值,將所述RGB值、灰度值導入到所述圖像識別模型中,輸出圖像識別的結果。
圖4為本發明電腦裝置較佳實施例的示意圖。
電腦裝置1包括記憶體20、處理器30以及存儲在所述記憶體20中並可在所述處理器30上運行的電腦程式40,例如圖像識別程式。所述處理器30執行所述電腦程式40時實現上述圖像識別方法實施例中的步驟,例如圖1所示的步驟S1~S3。或者,所述處理器30執行所述電腦程式40時實現上述圖像識別裝置實施例中各模組/單元的功能,例如圖3中的單元101-103。
示例性的,所述電腦程式40可以被分割成一個或多個模組/單元,所述一個或者多個模組/單元被存儲在所述記憶體20中,並由所述處理器30執行,以完成本發明。所述一個或多個模組/單元可以是能夠完成特定功能的一系列電腦程式指令段,所述指令段用於描述所述電腦程式40在所述電腦裝置1中的執行過程。例如,所述電腦程式40可以被分割成圖3中的訓練模組101、獲取模組102、輸出模組103。
所述電腦裝置1可以是桌上型電腦、筆記本、掌上型電腦及雲端伺服器等計算設備。本領域技術人員可以理解,所述示意圖僅僅是電腦裝置1的示例,並不構成對電腦裝置1的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件,例如所述電腦裝置1還可以包括輸入輸出設備、網路接入設備、匯流排等。
所稱處理器30可以是中央處理單元(Central Processing Unit,CPU),
還可以是其他通用處理器、數位訊號處理器(Digital Signal Processor,DSP)、專用積體電路(Application Specific Integrated Circuit,ASIC)、現成可程式設計閘陣列(Field-Programmable Gate Array,FPGA)或者其他可程式設計邏輯器件、分立門或者電晶體邏輯器件、分立硬體元件等。通用處理器可以是微處理器或者所述處理器30也可以是任何常規的處理器等,所述處理器30是所述電腦裝置1的控制中心,利用各種介面和線路連接整個電腦裝置1的各個部分。
所述記憶體20可用於存儲所述電腦程式40和/或模組/單元,所述處理器30藉由運行或執行存儲在所述記憶體20內的電腦程式和/或模組/單元,以及調用存儲在記憶體20內的資料,實現所述電腦裝置1的各種功能。所述記憶體20可主要包括存儲程式區和存儲資料區,其中,存儲程式區可存儲作業系統、至少一個功能所需的應用程式(比如聲音播放功能、圖像播放功能等)等;存儲資料區可存儲根據電腦裝置1的使用所創建的資料(比如音訊資料、電話本等)等。此外,記憶體20可以包括高速隨機存取記憶體,還可以包括非易失性記憶體,例如硬碟、記憶體、插接式硬碟,智慧存儲卡(Smart Media Card,SMC),安全數位(Secure Digital,SD)卡,快閃記憶體卡(Flash Card)、至少一個磁碟記憶體件、快閃記憶體器件、或其他易失性固態記憶體件。
所述電腦裝置1集成的模組/單元如果以軟體功能單元的形式實現並作為獨立的產品銷售或使用時,可以存儲在一個電腦可讀取存儲介質中。基於這樣的理解,本發明實現上述實施例方法中的全部或部分流程,也可以藉由電腦程式來指令相關的硬體來完成,所述的電腦程式可存儲於一電腦可讀存儲介質中,所述電腦程式在被處理器執行時,可實現上述各個方法實施例的步驟。其中,所述電腦程式包括電腦程式代碼,所述電腦程式代碼可以為原始程式碼形式、物件代碼形式、可執行檔或某些中間形式等。所述電腦可讀介質可以包括:能夠攜帶所述電腦程式代碼的任何實體或裝置、記錄介質、U盤、移動硬碟、
磁碟、光碟、電腦記憶體、唯讀記憶體(ROM,Read-Only Memory)、隨機存取記憶體(RAM,Random Access Memory)、電載波信號、電信信號以及軟體分發介質等。需要說明的是,所述電腦可讀介質包含的內容可以根據司法管轄區內立法和專利實踐的要求進行適當的增減,例如在某些司法管轄區,根據立法和專利實踐,電腦可讀介質不包括電載波信號和電信信號。
在本發明所提供的幾個實施例中,應所述理解到,所揭露的電腦裝置和方法,可以藉由其它的方式實現。例如,以上所描述的電腦裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式。
另外,在本發明各個實施例中的各功能單元可以集成在相同處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在相同單元中。上述集成的單元既可以採用硬體的形式實現,也可以採用硬體加軟體功能模組的形式實現。
對於本領域技術人員而言,顯然本發明不限於上述示範性實施例的細節,而且在不背離本發明的精神或基本特徵的情況下,能夠以其他的具體形式實現本發明。因此,無論從哪一點來看,均應將實施例看作是示範性的,而且是非限制性的,本發明的範圍由所附請求項而不是上述說明限定,因此旨在將落在請求項的等同要件的含義和範圍內的所有變化涵括在本發明內。不應將請求項中的任何附圖標記視為限制所涉及的請求項。此外,顯然“包括”一詞不排除其他單元或步驟,單數不排除複數。電腦裝置請求項中陳述的多個單元或電腦裝置也可以由同一個單元或電腦裝置藉由軟體或者硬體來實現。第一,第二等詞語用來表示名稱,而並不表示任何特定的順序。
最後應說明的是,以上實施例僅用以說明本發明的技術方案而非限制,儘管參照較佳實施例對本發明進行了詳細說明,本領域的普通技術人員
應當理解,可以對本發明的技術方案進行修改或等同替換,而不脫離本發明技術方案的精神和範圍。
Claims (9)
- 一種圖像識別方法,其改良在於,所述方法包括:獲取訓練資料,利用所述訓練資料訓練神經網路模型的全連接層的參數,並將訓練後的神經網路模型作為圖像識別模型,其中,對所述神經網路模型的全連接層的參數的訓練包括:獲取所述神經網路模型中全連接層的運算程式;查找所述全連接層的運算程式中至少一層的結點,其中所述全連接層的層數根據圖像識別的精度進行調整,其中圖像識別的精度要求越高,所述全連接層的層數越多;將同一層內的結點按照第一預設規則分成多個小組,包括:根據所述同一層中結點的位置以及結點的個數,按照預設比例對所述同一層中的結點進行平均分組,其中所述同一小組內結點的數量根據所述神經網路模型的運算速度進行選擇,其中所述神經網路模型的運算速度越快,則在所述同一小組內的結點數量越多;按照第二預設規則確定多個所述小組內的特徵結點,並將多個所述特徵結點作為所述全連接層的參數資訊,完成對所述全連接層的參數的訓練,其中,所述按照第二預設規則確定多個所述小組內的特徵結點的方法包括:獲取所述小組內各個結點對應的數值,對所述數值進行排序;選擇最大數值對應的結點作為所述小組內的特徵結點;響應於接收到的圖像識別指令,從所述圖像識別指令中獲取待處理圖像;將所述待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果。
- 如請求項1所述之圖像識別方法,其中,所述獲取訓練資料,利用所述訓練資料訓練神經網路模型還包括:構建驗證資料集; 利用所述驗證資料集對訓練後的神經網路模型進行驗證,並根據驗證結果統計所述神經網路模型預測的準確率;判斷所述預測的準確率是否小於預設閾值;若所述預測的準確率不小於所述預設閾值,將訓練完成的所述神經網路模型作為所述圖像識別模型。
- 如請求項1所述之圖像識別方法,其中,所述將同一層內的結點按照第一預設規則分成多個小組的方法包括:根據所述同一層中結點的位置以及結點的個數,及按照預設比例對所述同一層中的結點進行平均分組。
- 如請求項1所述之圖像識別方法,其中,所述將同一層內的結點按照第一預設規則分成多個小組的方法還包括:根據所述同一層中結點的位置,按照差分法選擇預設位置的結點,將位於預設位置的結點分為第一組,將非預設位置的結點分為第二組,其中所述差分法包括等距離差分、非等距離差分。
- 如請求項1所述之圖像識別方法,其中,所述按照第二預設規則確定多個所述小組內的特徵結點的方法還包括:獲取所述小組內各個結點對應的數值,將所述數值與預設閾值進行比對;若所述數值大於所述預設閾值,則將所述數值對應的結點作為小組內的特徵結點。
- 如請求項1所述之圖像識別方法,其中,所述將所述待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果包括:獲取待處理圖像中畫素的畫素值和圖像識別模型中全連接層的參數資訊,其中所述全連接層的參數資訊包括全連接層的輸入層、全連接層的輸出層、特徵結點的位置; 查找所述全連接層的輸入層中特徵結點的位置,藉由第一預設函數關係將所述待處理圖像中畫素的畫素值轉換為全連接層的輸入層中特徵結點的特徵畫素值;查找所述全連接層的輸出層中特徵結點的位置,藉由第二預設函數關係將所述全連接層的輸入層中特徵結點的特徵畫素值轉換為所述全連接層的輸出層中特徵結點的特徵畫素值;獲取全連接層的輸出層中特徵結點的特徵畫素值,並利用所述輸出層中特徵結點的特徵畫素值輸出圖像識別結果。
- 一種圖像識別裝置,其改良在於,所述裝置包括:訓練模組,用於利用所述訓練資料訓練神經網路模型的全連接層的參數,並將訓練後的神經網路模型作為所述圖像識別模型,其中,對所述神經網路模型的全連接層的參數的訓練包括:獲取所述神經網路模型中全連接層的運算程式;查找所述全連接層的運算程式中至少一層的結點,其中所述全連接層的層數根據圖像識別的精度進行調整,其中圖像識別的精度要求越高,所述全連接層的層數越多;將同一層內的結點按照第一預設規則分成多個小組,包括:根據所述同一層中結點的位置以及結點的個數,按照預設比例對所述同一層中的結點進行平均分組,其中所述同一小組內結點的數量根據所述神經網路模型的運算速度進行選擇,其中所述神經網路模型的運算速度越快,則在所述同一小組內的結點數量越多;及按照第二預設規則確定多個所述小組內的特徵結點,並將多個所述特徵結點作為所述全連接層的參數資訊,完成對所述全連接層的參數的訓練;獲取模組,用於響應於接收到的圖像識別指令,從所述圖像識別指令中獲 取待處理圖像;輸出模組,用於將所述待處理圖像輸入至所述圖像識別模型中,輸出圖像識別結果。
- 一種電腦裝置,其中所述電腦裝置包括處理器和記憶體,所述處理器用於執行所述記憶體中存儲之電腦程式時實現如請求項1至請求項6中任一項所述之圖像識別方法。
- 一種存儲介質,其上存儲有電腦程式,其中所述電腦程式被處理器執行時實現如請求項1至請求項6中任一項所述之圖像識別方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109117736A TWI775084B (zh) | 2020-05-27 | 2020-05-27 | 圖像識別方法、裝置、電腦裝置及存儲介質 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109117736A TWI775084B (zh) | 2020-05-27 | 2020-05-27 | 圖像識別方法、裝置、電腦裝置及存儲介質 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202145062A TW202145062A (zh) | 2021-12-01 |
TWI775084B true TWI775084B (zh) | 2022-08-21 |
Family
ID=80783876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109117736A TWI775084B (zh) | 2020-05-27 | 2020-05-27 | 圖像識別方法、裝置、電腦裝置及存儲介質 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI775084B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201832138A (zh) * | 2017-02-22 | 2018-09-01 | 香港商阿里巴巴集團服務有限公司 | 圖像識別方法及裝置 |
-
2020
- 2020-05-27 TW TW109117736A patent/TWI775084B/zh active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201832138A (zh) * | 2017-02-22 | 2018-09-01 | 香港商阿里巴巴集團服務有限公司 | 圖像識別方法及裝置 |
Also Published As
Publication number | Publication date |
---|---|
TW202145062A (zh) | 2021-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110399487B (zh) | 一种文本分类方法、装置、电子设备及存储介质 | |
TW202046107A (zh) | 使用者終端硬體檢測方法、裝置、電腦裝置及存儲介質 | |
CN114764768A (zh) | 缺陷检测分类方法、装置、电子设备及存储介质 | |
CN111784699B (zh) | 一种对三维点云数据进行目标分割方法、装置及终端设备 | |
US11544568B2 (en) | Method for optimizing a data model and device using the same | |
CN109697083B (zh) | 数据的定点化加速方法、装置、电子设备及存储介质 | |
CN111222558A (zh) | 图像处理方法及存储介质 | |
TW202117540A (zh) | 使用者終端故障檢測方法、裝置、電腦裝置及存儲介質 | |
CN113283351B (zh) | 一种使用cnn优化相似度矩阵的视频抄袭检测方法 | |
TWI775084B (zh) | 圖像識別方法、裝置、電腦裝置及存儲介質 | |
US20210241068A1 (en) | Convolutional neural network | |
CN115035017A (zh) | 细胞密度分群方法、装置、电子设备及存储介质 | |
US12002272B2 (en) | Method and device for classifing densities of cells, electronic device using method, and storage medium | |
CN113743427B (zh) | 图像识别方法、装置、计算机装置及存储介质 | |
CN111667046A (zh) | 深度学习加速方法及用户终端 | |
TWI754241B (zh) | 指紋圖像的特徵提取方法、裝置及電腦可讀存儲介質 | |
CN113160942A (zh) | 影像数据质量评估方法、装置、终端设备及可读存储介质 | |
TWI772040B (zh) | 物體深度資訊獲取方法、裝置、電腦裝置及儲存介質 | |
CN113093967A (zh) | 数据生成方法、装置、计算机装置及存储介质 | |
TWI755176B (zh) | 細胞密度分類方法及裝置、電子裝置及存儲介質 | |
TW202127327A (zh) | 資料生成方法、裝置、電腦裝置及存儲介質 | |
TW202101307A (zh) | 數據模型選擇優化方法、裝置、電腦裝置及存儲介質 | |
TWI712033B (zh) | 聲音識別方法、裝置、電腦裝置及存儲介質 | |
CN115294108B (zh) | 目标检测方法、目标检测模型的量化方法、装置和介质 | |
US20220178814A1 (en) | Method for calculating a density of stem cells in a cell image, electronic device, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent |