TWI816511B - 運用平衡格雷碼之影像辨識方法 - Google Patents
運用平衡格雷碼之影像辨識方法 Download PDFInfo
- Publication number
- TWI816511B TWI816511B TW111130629A TW111130629A TWI816511B TW I816511 B TWI816511 B TW I816511B TW 111130629 A TW111130629 A TW 111130629A TW 111130629 A TW111130629 A TW 111130629A TW I816511 B TWI816511 B TW I816511B
- Authority
- TW
- Taiwan
- Prior art keywords
- data
- gray code
- image recognition
- recognition model
- training
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000011176 pooling Methods 0.000 claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 50
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 11
- 238000000605 extraction Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 2
- 230000009467 reduction Effects 0.000 abstract description 20
- 238000012545 processing Methods 0.000 abstract description 8
- 230000001131 transforming effect Effects 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 7
- 230000000717 retained effect Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Facsimile Scanning Arrangements (AREA)
- Image Analysis (AREA)
Abstract
一種運用平衡格雷碼之影像辨識方法,用以解決習知影像辨識法無法在資料降維後有效保留紋理特徵的問題。係包含:一影像資料處理程序,將用於訓練的影像資料轉換為局部二質化特徵直方圖;運用平衡格雷碼編排,以形成對應的平衡格雷碼資訊;運用一加總池化進行維度縮減,以形成對應的經維度縮減的平衡格雷碼資訊;及一影像辨識模型訓練程序,基於卷積神經網路所建立的一影像辨識模型,運用所述影像資料處理程序將用於訓練的影像資料轉換為對應的經維度縮減的平衡格雷碼資訊來訓練該影像辨識模型,以獲取經訓練的影像辨識模型。
Description
本發明係關於一種影像辨識方法,尤其是一種運用平衡格雷法之影像辨識方法。
在習知影像辨識技術中,通常以影像的紋理特徵(Texture Pattern)搭配卷積神經網路(CNN,Convolutional Neural Networks)所構成的深度學習架構,進行影像辨識模型的訓練與建立。特別是,運用局部二元化特徵(LBP,Local Binary Pattern)的方式行成訓練影像資料來進行訓練;所述局部二元化特徵的方式可分成經局部二元化特徵編碼的影像與局部二元化特徵的直方圖。其中,雖然局部二元化特徵的直方圖的訓練效果理論上是較好的,但局部二元化特徵的直方圖具有維度龐大的情形,且現有降低維度的方法無法有效保留局部二元化特徵中具有重要紋理特徵的問題。
有鑑於此,習知的影像辨識方法確實仍有加以改善之必要。
為解決上述問題,本發明的目的是提供一種運用平衡格雷法之影像辨識方法,係可達成提升影像辨識準確率的效果者。
本發明全文所記載的元件及構件使用「一」或「一個」之量詞,僅是為了方便使用且提供本發明範圍的通常意義;於本發明中應被解讀為包
括一個或至少一個,且單一的概念也包括複數的情況,除非其明顯意指其他意思。
本發明全文所述之「電腦(Computer)」,係指具備特定功能且以硬體或硬體與軟體實現的各式資料處理裝置,特別是一處理器或具有一處理器的電腦以處理分析資訊及/或產生對應控制資訊,例如:電子控制器、伺服器、雲端平台、虛擬機器、桌上型電腦、筆記型電腦、平板電腦或智慧型手機等,係本發明所屬技術領域中具有通常知識者可以理解。另,可包含對應的資料接收或傳輸單元,以進行所需資料的接收或傳輸。另,可包含對應的資料庫/儲存單元,以儲存所需資料。特別是,除非另外特別排除或矛盾,所述「一電腦」可以分別是基於分散式系統架構中的「多個電腦的集合」,係包含或代表多個電腦間之資訊串流處理的過程、機制及結果。
本發明的運用平衡格雷碼之影像辨識方法,係透過一電腦執行,包含:一影像資料處理程序,將用於訓練的影像資料轉換為局部二質化特徵直方圖;運用平衡格雷碼將局部二質化特徵直方圖進行編排,以形成對應的平衡格雷碼資訊;運用一加總池化對前述平衡格雷碼資訊進行維度縮減,以形成對應的經維度縮減的平衡格雷碼資訊;及一影像辨識模型訓練程序,基於卷積神經網路所建立的一影像辨識模型,運用所述影像資料處理程序將用於訓練的影像資料轉換為對應的經維度縮減的平衡格雷碼資訊,並運用該經維度縮減的平衡格雷碼資訊訓練該影像辨識模型,以獲取經訓練的影像辨識模型。
據此,本發明的運用平衡格雷碼之影像辨識方法,藉由運用經平衡格雷碼編排且經池化進行維度縮減的局部二質化特徵直方圖作為訓練用的影像資料(即為經維度縮減的平衡格雷碼資訊),進行一影像辨識模型的訓練,以獲得具有更準確辨識率的影像辨識模型。
其中,該影像辨識模型具有一訓練網路架構,該訓練網路架構具有一特徵擷取網路與一分類網路;該特徵擷取網路具有9層卷積層,且初始層為一第一卷積層;該分類網路具有3層全連接層。如此,透過該訓練網路架構,能達成有效訓練該影像辨識模型的功效。
其中,用於訓練的影像資料包含一第一輸入資料與一第二輸入資料;所述第一輸入資料包含一第一子資料、一第二子資料及一第三子資料;該第一子資料是RGB影像資料,用於輸入該辨識模型的該訓練網路架構;該第二子資料是該第一子資料輸入該辨識模型的該特徵擷取網路的第一卷積層後,對應個別R、G、B通道所形成的第一局部二質化特徵直方圖;該第三子資料是該第一子資料輸入該辨識模型的該特徵擷取網路的第一卷積層後,對應個別R、G、B通道所形成的第二局部二質化特徵直方圖,並經平衡格雷碼編排且經加總池化進行維度縮減,以形成對應的經維度縮減的平衡格雷碼資訊;該第二輸入資料是該第一子資料對應個別R、G、B通道所形成的第三局部二質化特徵直方圖。如此,透過該第一輸入資料與該第二輸入資料(包含該第一至第三子資料)的資料態樣與配置,可達成提升影像辨識模型的辨識準確率。
其中,該第一局部二質化特徵直方圖與該第三局部二質化特徵直方圖各分別具有一第一半徑R及一第一取樣點P,該第二局部二質化特徵直方圖)具有一第二半徑R’及一第二取樣點P’;該第二半徑R’大於該第一半徑R,該地二取樣點P’多於該第一取樣點P。如此,透過該第一至該第三局部二質化特徵直方圖之半徑與取樣點差異的組合,可達成提升影像辨識模型的辨識準確率。
其中,該第一局部二質化特徵直方圖、該第二局部二質化特徵直方圖及該第三局部二質化特徵直方圖各可經批量歸一化後,再輸入至該訓
練網路中的分類網路。如此,透過該第一至該第三局部二質化特徵直方圖資料態樣之差異與應用,可達成提升影像辨識模型的辨識準確率。
In1:第一輸入資料
In2:第二輸入資料
HLBP-1(R,P):第一局部二質化特徵直方圖
HLBP-2(R’,P’):第二局部二質化特徵直方圖
HLBP-3(R,P):第三局部二質化特徵直方圖
SD1:第一子資料
SD2:第二子資料
SD3:第三子資料
PIP:影像資料處理程序
PMT:影像辨識模型訓練程序
S1,S2,S3:步驟
〔第1圖〕本發明一較佳實施例的方法流程示意圖。
〔第2圖〕本發明一較佳實施例的模型架構與資料串流示意圖。
〔第3圖〕本發明一比較範例的模型架構與資料串流示意圖。
〔第4圖〕本發明另一比較範例的模型架構與資料串流示意圖。
為讓本發明之上述及其他目的、特徵及優點能更明顯易懂,下文特舉本發明之較佳實施例,並配合所附圖式作詳細說明。
請參照第1圖所示,其係本發明運用平衡格雷法之影像辨識方法的一較佳實施例,係運作於一電腦內,包含一影像資料處理程序PIP(Procedure for Image Processing)與一影像辨識模型訓練程序PMT(Procedure for Model Training)。
所述影像資料處理程序PIP包含以下步驟S1至S3,以將用於訓練的影像資料轉化成經平衡格雷碼(Balanced Gray Code)編排且經池化(Pooling)進行維度縮減的局部二質化特徵直方圖(HLBP,Histogram of the Local Binary Pattern)。
步驟S1:將用於訓練的影像資料轉換為局部二質化特徵直方圖(HLBP,Histogram of the Local Binary Pattern)。該影像資料的格式可為一RGB影像資料、一L影像資料、一LLL影像資料、一RGBL影像資料及
一RGBLLL影像資料中之一者或多者。所述RGB影像資料表示原始彩色影像(可計量為一個影像通道);所述L影像資料表示原始彩色影像所形成的格雷影像(可計量為一個影像通道);所述LLL影像資料表示對應各別R、G、B通道所形成的三個格雷影像(可計量為三個影像通道);所述RGBL表示各別R、G、B通道的影像與該L影像資料(可計量為四個影像通道);所述RGBLLL表示各別R、G、B通道的影像與該LLL影像資料(可計量為六個影像通道)。較佳地,該待訓練影像資料的格式為該RGBLLL影像資料。其中,將影像資料轉換為二質化特徵直方圖的技術,是本發明領域中具有通常知識者可理解,故不再贅述。
步驟S2:運用平衡格雷碼(BGC,Balanced Gray Code)將局部二質化特徵直方圖進行編排,以形成對應的平衡格雷碼資訊。由以下表一至表三所呈現局部二質化特徵直方圖的未經處理、經一般格雷碼(BRGC,Binary Reflect Gray Code)編排、經平衡格雷碼編排的結果,可說明所述平衡格雷碼的意義。其中,表一至表三於位元1與0之間使用區別色塊,以利觀察各位元的跳變/轉換次數。
在訊號處理領域中,有一種編碼方式為格雷碼(Gray Code),其特點為使相鄰兩個數字的漢明距離(Hamming Distance)為1,即相鄰兩個數字僅相差1個位元。表二所示即是一般格雷碼用於局部二質化特徵直方圖的編排結果,相對表一可解決空間上相鄰特徵不相似的問題。
表三所示即為所述平衡格雷碼用於局部二質化特徵直方圖的編排結果,除了相鄰數字之漢明距離為1,每一個位元的跳變次數也維持平衡(每一位元總跳變次數近似);如此,在後續步驟S3中,進行池化縮減維度時,可使位元特徵較均勻且平等的簡化,而可提升盡可能保留重要特徵的效果。相對表二所使用的一般格雷碼,由於每個位元的跳變次數不同(對應二元碼為1、2、4、8的跳變次數分別為8、4、2、1),因此在進行池化縮減維度時,將造成位元特徵不平等的犧牲,而較易造成重要特徵的丟失。
步驟S3:運用一加總池化(Sum Pooling)對前述平衡格雷碼資訊進行維度縮減,以形成對應的經維度縮減的平衡格雷碼資訊。值得注意的是,本發明是在運用平衡格雷碼編排局部二質化特徵直方圖後,再運用該加總池化法使經編排後局部二質化特徵直方圖維度縮減。如此,使相鄰且近
似的特徵彼此加總,且特徵總和仍然為輸入影像之像素個數,因此可反應近似特徵的屬性,而可避免特徵被犧牲的問題。相較原始未經處理的局部二質化特徵直方圖,其相鄰特徵間的位元差異較大,如特徵3與特徵4之間有3個位元不同,若直接套用加總池化,反而會干擾特徵匯總的正確性。
為詳細說明本發明方法之特性,以下針對未經處理、經一般格雷碼編排及經平衡格雷碼編排的局部二質化特徵直方圖(HLBP),再經池化合併的結果,分別呈現如下列表四至表六。
詳言之,一局部二質化特徵直方圖(HLBP)是依序地表示由0~(2P-1)的所有局部二質化特徵(LBP)的編碼(Number)的有序向量(Ordered Vector);其中,2P中的「2」表示位元的2進位制,2P中的「P」表示影像特徵像素的位元數量,且對應表四至表六,P等於4。
在表四中,於局部二質化特徵直方圖中,兩連續局部二質化特徵(LBP)的代碼(Code)可能無法表示局部二質化特徵的紋理特徵(Textures)。舉例而言,在所述二進位制的局部二質化特徵的代碼(Binary LBP Code)中,表示數字10的代碼1010與鄰近數字9的代碼1001的代碼之間具有2個位元的差異,但表示數字10的代碼1010與鄰近數字11的代碼1011之間具有1個位元的差異;表示數字10的代碼1010與鄰近數字9的代碼1001的代碼之間具有2個位元的差異,但表示數字3的代碼0011與鄰近數字4的代碼0100之間具有3個位元的差異。因此,直接對未經處理的局部二質化特徵直方圖池化,可能會刪除重要的紋理特徵,或合併兩個不相關的紋理特徵而破壞特徵的多元性。
在表四至表六中,分別對應其局部二質化特徵直方圖而呈現池化結果,並以合併鄰近二特徵的池化結果(pool(2))及合併鄰近四特徵的池化結果(pool(4))呈現,特別是在合併鄰近四特徵的池化結果中,表四(未經處理)所保留的特徵是00xx、00xx、01xx、10xx、11xx,表五(經一般格雷碼編排)所保留的特徵是00xx、01xx、11xx、10xx,表六(經平衡格雷碼編排)所保留的特徵是0xxx、1xxx、x10x、xx10。其中,「x」表示有差異的部分,且越多x代表保留越多訓練特徵。換言之,由表四至表六的比較可理解,經平衡格雷碼編排的局部二質化特徵直方圖(即為前述平衡格雷碼資訊),在維度縮減/池化作用後(即為前述經維度縮減的平衡格雷碼資訊)可保留最大程度的樣本多樣性。
在一第一範例中,假設有兩筆影像資料A1、B1分別具有對應的局部二質化特徵,針對未經處理、經一般格雷碼編排及經平衡格雷碼編排再經池化合併的結果,分別呈現如下列表七至表九。其中,以數字1表示具有特徵,以數字0標示不具特徵;以灰底色顯示可區別影像資料A1、B1的
特徵欄位。
由表七可知,影像資料A1、B1在未經處理狀態下,在池化/維度縮減前及在合併鄰近二特徵的池化結果中,可辨識欄位皆有4欄,使影像資料A1、B1為可區辨的。惟,在合併鄰近四特徵的池化結果中,不具有可區辨欄位,亦即,維度縮減後已無合適類別屬性可進行分類,而無法區辨影像資料A1、B1間的差異。
由表八可知,影像資料A1、B1在經一般格雷碼編排狀態下,在池化/維度縮減前及在合併鄰近二特徵的池化結果中,可辨識欄位皆有4欄,使影像資料A1、B1為可區辨的。惟,在合併鄰近四特徵的池化結果中,不具有可區辨欄位,亦即,維度縮減後已無合適類別屬性可進行分類,而無
法區辨影像資料A1、B1間的差異。
由表九可知,影像資料A1、B1在經平衡格雷碼編排狀態下,在池化/維度縮減前、在合併鄰近二特徵的池化結果中及在合併鄰近四特徵的池化結果中,可辨識欄位分別有4欄、2欄、2欄,使影像資料A1、B1皆為可區辨的。
在一第二範例中,類似前述表七至表九,假設有兩筆影像資料A2、B2分別具有對應的局部二質化特徵,針對未經處理、經一般格雷碼編排及經平衡格雷碼編排再經池化合併的結果,分別呈現如下列表十至表十二。
由表十、表十一可知,影像資料A2、B2在未經處理狀態下及在經一般格雷碼編排狀態下,且在池化/維度縮減前及在合併鄰近二特徵的池化結果中,可辨識欄位皆有7欄,使影像資料A2、B2為可區辨的。惟,在合併鄰近四特徵的池化結果中,皆不具有可區辨欄位,而無法區辨影像資料A2、B2間的差異。
由表十二可知,影像資料A2、B2在經平衡格雷碼編排狀態下,在池化/維度縮減前、在合併鄰近二特徵的池化結果中及在合併鄰近四特徵的池化結果中,可辨識欄位分別有7欄、4欄、3欄,使影像資料A2、B2皆為可區辨的。
在一第三範例中,類似前述表七至表九,假設有兩筆影像資料A3、B3分別具有對應的局部二質化特徵,針對未經處理、經一般格雷碼編排及經平衡格雷碼編排再經池化合併的結果,分別呈現如下列表十三至表十五。
由表十三、表十四可知,影像資料A3、B3在未經處理狀態下及在經一般格雷碼編排狀態下,在池化/維度縮減前的可辨識欄位有11欄,在合併鄰近二特徵的池化結果中的可辨識欄位有4欄,使影像資料A3、B3為可區辨的。惟,在合併鄰近四特徵的池化結果中,皆不具有可區辨欄位,而無法區辨影像資料A3、B3間的差異。
由表十五可知,影像資料A3、B3在經平衡格雷碼編排狀態下,在池化/維度縮減前、在合併鄰近二特徵的池化結果中及在合併鄰近四特徵的池化結果中,可辨識欄位分別有11欄、3欄、2欄,使影像資料A2、B2皆為可區辨的。
在一第四範例中,類似前述表七至表九,假設有兩筆影像資料A4、B4分別具有對應的局部二質化特徵,針對未經處理、經一般格雷碼編排及經平衡格雷碼編排再經池化合併的結果,分別呈現如下列表十六至表十八。
由表十六至表十八可知,影像資料A4、B4在未經處理狀態下、在經一般格雷碼編排狀態下及在經平衡格雷碼編排狀態下,在池化/維度縮減前的可辨識欄位有3欄,在合併鄰近二特徵的池化結果中的可辨識欄位有1欄,使影像資料A4、B4為可區辨的。惟,在合併鄰近四特徵的池化結果中,皆不具有可區辨欄位,而無法區辨影像資料A4、B4間的差異。
由前述第一範例至第四範例(對應表七至表十八)可知,經平衡格雷碼編排的影像資料雖然也會發生維度縮減以後無法進行分類的現象,但其特徵相同的機率是最小的。詳言之,由表六可知,在4位元的資料型態中,經平衡格雷碼編排的資料所保留的特徵是00xx、00xx、01xx、10xx、11xx,而具有10個可變特徵x及對應的210的特徵組合;因此,其在合併鄰近四特徵的池化結果中,特徵相同機率為。基於同樣條件,對照一般格雷碼編排的資料型態,由表四、五可知,未經處理的資料及經一般格雷碼編排的資料具有8個可辨特徵x及對應的28的特徵組合;因此,其在合併鄰近四特徵的池
化結果中,特徵相同機率為。換言之,在4位元的資料型態且在合併鄰近四特徵的池化結果的情形中,平衡格雷碼能產生維度縮減的多樣性是未經處理的資料及經一般格雷碼編排的資料的4倍。換言之,平衡格雷碼能保留更多特徵多樣性,而可達成保留影像辨識用的重要紋理特徵之功效。特別是,基於上述平衡格雷碼的機制,可理解的是,在更多位元下進行維度縮減,具有能夠保
留更多的樣本多樣性的效果。
基於卷積神經網路所建立的一影像辨識模型,運用所述影像資料處理程序將用於訓練的影像資料轉換為對應的經維度縮減的平衡格雷碼資訊(即是經平衡格雷碼編排且經池化進行維度縮減的局部二質化特徵直方圖作為訓練用的影像資料),並運用該經維度縮減的平衡格雷碼資訊訓練該影像辨識模型,以獲取經訓練的影像辨識模型。
詳言之,所述影像辨識模型具有對應的一訓練網路架構,該訓練網路架構係基於ResNet網路架構方塊所組成。在一範例中,所述訓練網路架構具有一特徵擷取網路與一分類網路;較佳地,該特徵擷取網路具有9層卷積層,且初始層為一第一卷積層;該分類網路具有3層全連接層;對應的訓練網路架構可呈現如下列表十九。
如第2圖所示本發明之模型架構與資料串流示意圖,搭配前述
影像辨識模型的訓練網路架構,用於訓練的影像資料包含:一第一輸入資料In1與一第二輸入資料In2。所述第一輸入資料In1包含多一第一子資料SD1、一第二子資料SD2及一第三子資料SD3。該第一子資料SD1是RGB影像資料,用於輸入該辨識模型的該訓練網路架構。該第二子資料SD2是該第一子資料SD1輸入該辨識模型的該特徵擷取網路的第一卷積層後,對應個別R、G、B通道所形成的第一局部二質化特徵直方圖HLBP-1(R,P)。該第三子資料SD3是該第一子資料SD1輸入該辨識模型的該特徵擷取網路的第一卷積層後,對應個別R、G、B通道所形成的第二局部二質化特徵直方圖HLBP-2(R’,P’),並經平衡格雷碼編排且經加總池化(SumPool)進行維度縮減,以形成對應的經維度縮減的平衡格雷碼資訊。該第一局部二質化特徵直方圖HLBP-1(R,P)及該第二局部二質化特徵直方圖HLBP-2(R’,P’)係可經批量歸一化(Batch Normalization)後,再輸入至該訓練網路中的分類網路。該第二輸入資料In2是該第一子資料SD1對應個別R、G、B通道所形成的第三局部二質化特徵直方圖HLBP-3(R,P),該第三局部二質化特徵直方圖HLBP-3(R,P)係可經批量歸一化後,再輸入至該訓練網路中的分類網路,以獲取經訓練的影像辨識模型,並命名為NetHLBP2。其中,該第一局部二質化特徵直方圖HLBP-1(R,P)與第三局部二質化特徵直方圖HLBP-3(R,P)各分別具有一第一半徑R及一第一取樣點P,該第二局部二質化特徵直方圖HLBP-2(R’,P’)具有一第二半徑R’及一第二取樣點P’;該第二半徑R’大於該第一半徑R,該地二取樣點P’多於該第一取樣點P。
如第3圖所示,基於前述影像辨識模型的訓練網路架構,若搭配該第一輸入資料In1中的該第一子資料SD1與該第二輸入資料In2,所對應獲取的影像辨識模型命名為NetHLBP0。
如第4圖所示,基於前述影像辨識模型的訓練網路架構,若搭
配該第一輸入資料In1中的該第一子資料SD1、該第二子資料SD2及該第二輸入資料In2,所對應獲取的影像辨識模型命名為NetHLBP1。
針對本發明所提出影像辨識模型運用平衡格雷碼編排且經池化進行維度縮減的局部二質化特徵直方圖的訓練成效,與其他CNN(卷積神經網路)模型的訓練成效比較係呈現如下列表二十。其中,本發明的模型的訓練、驗證,以及與其他CNN模型成效之比較,係使用STL10資料集(為像素尺寸96×96的彩色影像資料集)之各類別中500張訓練影像與800張測試影像,且不使用資料擴增提昇樣本變異性的方式進行。
綜上所述,本發明的運用平衡格雷碼之影像辨識方法,藉由運用經平衡格雷碼編排且經池化進行維度縮減的局部二質化特徵直方圖作為訓練用的影像資料(即為經維度縮減的平衡格雷碼資訊),進行一影像辨識模型的訓練,以獲得具有更準確辨識率的影像辨識模型。另,透過用於訓練的
影像資料的資料態樣(第一輸入資料與第二輸入資料,且第二輸入資料包含第一至第三子資料)輸入對應辨識模型進行訓練,有助於提升影像辨識模型的辨識準確率。
應注意的是,本發明的精神主要在於平衡格雷碼與維度縮減的運用,因此,本發明之影像辨識模型的訓練網路架構雖是運用ResNet的相關技術,惟本發明技術領域中具有通常知識者可理解,本發明可包含運用其他CNN網路架構實現之影像辨識模型。
雖然本發明已利用上述較佳實施例揭示,然其並非用以限定本發明,任何熟習此技藝者在不脫離本發明之精神和範圍之內,相對上述實施例進行各種更動與修改仍屬本發明所保護之技術範疇,因此本發明之保護範圍當包含後附之申請專利範圍所記載的文義及均等範圍內之所有變更。又,上述之數個實施例或範例能夠組合時,則本發明包含任意組合的實施態樣。
PIP:影像資料處理程序
PMT:影像辨識模型訓練程序
S1,S2,S3:步驟
Claims (5)
- 一種運用平衡格雷碼之影像辨識方法,係透過一電腦執行,包含:一影像資料處理程序,將用於訓練的影像資料轉換為局部二質化特徵直方圖;運用平衡格雷碼將局部二質化特徵直方圖進行編排,以形成對應的平衡格雷碼資訊;運用一加總池化對前述平衡格雷碼資訊進行維度縮減,以形成對應的經維度縮減的平衡格雷碼資訊;及一影像辨識模型訓練程序,基於卷積神經網路所建立的一影像辨識模型,運用所述影像資料處理程序將用於訓練的影像資料轉換為對應的經維度縮減的平衡格雷碼資訊,並運用該經維度縮減的平衡格雷碼資訊訓練該影像辨識模型,以獲取經訓練的影像辨識模型。
- 如請求項1之運用平衡格雷碼之影像辨識方法,其中,該影像辨識模型具有一訓練網路架構,該訓練網路架構具有一特徵擷取網路與一分類網路;該特徵擷取網路具有9層卷積層,且初始層為一第一卷積層;該分類網路具有3層全連接層。
- 如請求項2之運用平衡格雷碼之影像辨識方法,其中,用於訓練的影像資料包含一第一輸入資料與一第二輸入資料;所述第一輸入資料包含一第一子資料、一第二子資料及一第三子資料;該第一子資料是RGB影像資料,用於輸入該辨識模型的該訓練網路架構;該第二子資料是該第一子資料輸入該辨識模型的該特徵擷取網路的第一卷積層後,對應個別R、G、B通道所形成的第一局部二質化特徵直方圖;該第三子資料是該第一子資料輸入該辨識模型的該特徵擷取網路的第一卷積層後,對應個別R、G、B通道所形成的第二局部二質化特徵直方圖,並經平衡格雷碼編排且經加總池化進行維度縮減,以形成對應的經維度縮減的平衡格雷碼資訊;該第二輸入資料是 該第一子資料對應個別R、G、B通道所形成的第三局部二質化特徵直方圖。
- 如請求項3之運用平衡格雷碼之影像辨識方法,其中,該第一局部二質化特徵直方圖與該第三局部二質化特徵直方圖各分別具有一第一半徑R及一第一取樣點P,該第二局部二質化特徵直方圖具有一第二半徑R’及一第二取樣點P’;該第二半徑R’大於該第一半徑R,該地二取樣點P’多於該第一取樣點P。
- 如請求項3之運用平衡格雷碼之影像辨識方法,其中,該第一局部二質化特徵直方圖、該第二局部二質化特徵直方圖及該第三局部二質化特徵直方圖各可經批量歸一化後,再輸入至該訓練網路中的分類網路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW111130629A TWI816511B (zh) | 2022-08-15 | 2022-08-15 | 運用平衡格雷碼之影像辨識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW111130629A TWI816511B (zh) | 2022-08-15 | 2022-08-15 | 運用平衡格雷碼之影像辨識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI816511B true TWI816511B (zh) | 2023-09-21 |
TW202409900A TW202409900A (zh) | 2024-03-01 |
Family
ID=88966248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111130629A TWI816511B (zh) | 2022-08-15 | 2022-08-15 | 運用平衡格雷碼之影像辨識方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI816511B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6987474B2 (en) * | 1997-10-06 | 2006-01-17 | Q-Dot, Inc. | Beamformed ultrasonic imager with delta-sigma feedback control |
CN102282818B (zh) * | 2009-01-22 | 2014-06-18 | Lg电子株式会社 | 用于发送和接收信号的装置以及用于发送和接收信号的方法 |
CN104835158A (zh) * | 2015-05-05 | 2015-08-12 | 中国人民解放军国防科学技术大学 | 基于格雷码结构光与极线约束的三维点云获取方法 |
TW201639310A (zh) * | 2015-03-27 | 2016-11-01 | Idac控股公司 | 實數m元信號編碼方法及用此之編碼裝置 |
WO2016197979A1 (en) * | 2015-06-12 | 2016-12-15 | Huawei Technologies Co., Ltd. | Trellis shaping on ldpc-coded modulation dmt systems |
TWI705413B (zh) * | 2018-05-18 | 2020-09-21 | 廣達電腦股份有限公司 | 改善重建三維模型效率的方法及裝置 |
WO2021184707A1 (zh) * | 2020-03-19 | 2021-09-23 | 南京理工大学 | 基于深度学习的单帧彩色条纹投影的三维面型测量方法 |
-
2022
- 2022-08-15 TW TW111130629A patent/TWI816511B/zh active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6987474B2 (en) * | 1997-10-06 | 2006-01-17 | Q-Dot, Inc. | Beamformed ultrasonic imager with delta-sigma feedback control |
CN102282818B (zh) * | 2009-01-22 | 2014-06-18 | Lg电子株式会社 | 用于发送和接收信号的装置以及用于发送和接收信号的方法 |
TW201639310A (zh) * | 2015-03-27 | 2016-11-01 | Idac控股公司 | 實數m元信號編碼方法及用此之編碼裝置 |
CN104835158A (zh) * | 2015-05-05 | 2015-08-12 | 中国人民解放军国防科学技术大学 | 基于格雷码结构光与极线约束的三维点云获取方法 |
WO2016197979A1 (en) * | 2015-06-12 | 2016-12-15 | Huawei Technologies Co., Ltd. | Trellis shaping on ldpc-coded modulation dmt systems |
TWI705413B (zh) * | 2018-05-18 | 2020-09-21 | 廣達電腦股份有限公司 | 改善重建三維模型效率的方法及裝置 |
WO2021184707A1 (zh) * | 2020-03-19 | 2021-09-23 | 南京理工大学 | 基于深度学习的单帧彩色条纹投影的三维面型测量方法 |
Also Published As
Publication number | Publication date |
---|---|
TW202409900A (zh) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110189334B (zh) | 基于注意力机制的残差型全卷积神经网络的医学图像分割方法 | |
US7860308B2 (en) | Approach for near duplicate image detection | |
CN108280480B (zh) | 一种基于残差共生概率的隐写图像载体安全性评价方法 | |
Hou et al. | Reversible data hiding based on multiple histograms modification and deep neural networks | |
CN112150450B (zh) | 一种基于双通道U-Net模型的图像篡改检测方法及装置 | |
CN111832650B (zh) | 基于生成对抗网络局部聚合编码半监督的图像分类方法 | |
CN107491729B (zh) | 基于余弦相似度激活的卷积神经网络的手写数字识别方法 | |
Yang et al. | A clustering-based framework for improving the performance of JPEG quantization step estimation | |
US11961267B2 (en) | Color conversion between color spaces using reduced dimension embeddings | |
Xie et al. | Bag-of-words feature representation for blind image quality assessment with local quantized pattern | |
WO2022217711A1 (zh) | 基于多层关联知识图谱的信息预测方法、装置、设备及介质 | |
WO2021139351A1 (zh) | 图像分割方法、装置、介质及电子设备 | |
WO2023082641A1 (zh) | 电子档案生成方法、装置、终端设备及存储介质 | |
WO2016110125A1 (zh) | 高维向量的哈希方法、向量量化方法及装置 | |
TWI816511B (zh) | 運用平衡格雷碼之影像辨識方法 | |
CN101414352B (zh) | 信息处理设备和信息处理方法 | |
CN116935292A (zh) | 一种基于自注意力模型的短视频场景分类方法及系统 | |
Arham et al. | Reversible data hiding using hybrid method of difference expansion on medical image | |
JP4382744B2 (ja) | 画像情報抽出方法及び画像情報検索方法及びプログラム | |
CN105844296B (zh) | 基于cdcp局部描述子的遥感图像场景分类方法 | |
Aljarf et al. | Steganalysis system for colour steganographic images using three different techniques | |
JP7046239B2 (ja) | 画像内のオブジェクト認識のためにニューラルネットワークを生成するための方法及びシステム | |
CN117857713B (zh) | 一种用于保护教学视频知识版权的隐藏式数字水印方法 | |
CN115510461B (zh) | 一种基于双层格雷码的量子图像隐写方法 | |
Aljarf et al. | The Development of an Images Detection System Based on Extracting the Colour Gradient Co-occurrence Matrix Features |