TW201514865A

TW201514865A - 用於基於一梯度統計圖編碼一影像描述符之方法及相關影像處理裝置

Info

Publication number: TW201514865A
Application number: TW103124152A
Authority: TW
Inventors: 史塔羅斯帕斯查拉基司
Original assignee: 西斯維爾科技公司
Priority date: 2013-07-24
Filing date: 2014-07-14
Publication date: 2015-04-16
Also published as: RU2698765C2; DK3025274T3; CN105493106A; CN110365979A; RU2678668C2; BR112016001479A2; ES2776196T3; JP6745939B2; JP6514200B2; EP3025274B1; US9779320B2; PT3025274T; TWI576770B; RU2019125322A; ITTO20130629A1; EP3025274A1; RU2019101654A; RU2016105699A; EP3633547A1; US20160162749A1

Abstract

本發明描述一種用於基於梯度統計圖(hp)將一影像描述符(H)編碼成一經變換描述符(V)之方法，該經變換描述符包括經變換之子描述符(vp)，其中各梯度統計圖(hp)包括複數個統計圖區間(hi)且各子描述符(vp)包括一組值(vj)，其特徵為：該等子描述符(vp)根據指定該組子描述符(vp)之一子描述符指數(p)及該組值(vj)之一元件指數(j)之一元件利用順序列表而產生。

Description

用於基於一梯度統計圖編碼一影像描述符之方法及相關影像處理裝置

本發明係關於一種用於有效編碼、轉碼、解碼及處理在圍繞影像興趣關鍵點之局部區域經計算之影像描述符之方法，且係關於包括用於編碼、轉碼、解碼及處理此等描述符之構件之一影像處理器件。

已發現，此等影像描述符廣泛適用於諸多電腦視覺應用，包含(僅舉一些例子)：物件辨識、基於內容之影像檢索及影像對準。

針對編碼此等描述符之既有方法展現某些缺點。

例如，既有編碼方法導致需要剖析全部描述符之描述符以執行轉碼，藉此具有一給定描述符長度之一描述符經轉換為具有一不同描述符長度之一描述符，或執行解碼及比較具有不同長度之描述符。

如另一實例，既有編碼方法在編碼複雜性方面係低效的，此係因為其等忽略操作中被要求產生可變長度影像描述符之通用性及冗餘。

由申請人自行申請之尚未發表之意大利專利申請案第TO2012A000602號描述局部影像描述符之編碼，藉此自基於梯度統計圖之變換而採用該等梯度統計圖之影像描述符計算穩固、區別性的、可縮放及緊密影像描述符，其中該變換擷取依分佈形狀及其等區間值之中之關係之形式包含於其中之顯著及穩固資訊。

在該尚未發表之意大利專利申請案中揭示該等描述符之編碼方法，在容易產生可縮放位元流方面，該等方法比先前技術方法更有效。

在上文所提及之尚未發表之意大利專利申請案第TO2012A000602號中揭示此等描述符，該申請案揭示自基於梯度統計圖之變換而採用該等梯度統計圖之影像描述符計算穩固、區別性的、可縮放及緊密影像描述符，其中該變換擷取依分佈形狀及其等區間值之中之關係之形式包含於其中之顯著及穩固資訊。

根據尚未發表之意大利專利申請案第TO2012A000602號而在下文描述自採用梯度統計圖計算影像描述符之穩固、區別性的、可縮放及緊密影像描述符之重要態樣(特定言之係一SIFT影像描述符)。

簡單地說，使用SIFT方法，局部影像描述符經形成如下：首先，執行跨多個影像比例尺影像及位置之一搜尋以識別及局部化針對比例尺及定向不變之穩定影像關鍵點，接著，針對各關鍵點，基於局部影像梯度而判定一或多個顯性定向，允許相對於各關鍵點之指派定向、比例尺及位置而執行隨後局部描述符計算，因此達成針對此等變換之不變性。接著，圍繞關鍵點之局部影像描述符經形成如下：首先，在圍繞關鍵點之一區域中之影像樣本點處計算梯度量值及定向資訊；接著，將此等樣本累積成概括n×n子區域上之內容之定向統計圖。

僅經由繪示，在圖1a及圖1b中展示一SIFT關鍵點描述符之一實例，其中圖1a展示將一局部區域R再劃分成4×4個子區域SR，且圖1b展示將360°範圍之定向再劃分成針對各定向統計圖之八個區間，其中各箭頭之長度對應於該統計圖項目之量值。因此，如圖1中所繪示之一局部影像描述符具有4x4x8=128個元件。可在David G.Lowe之「Distinctive image features from scale-invariant keypoints」(國際電腦視覺期刊60,2(2004),91頁至110頁)中找到SIFT技術之更多細節。

根據尚未發表之意大利專利申請案第TO2012A000602號，可自一SIFT描述符計算一穩固、區別性的、可縮放及緊密影像描述符，如下文。

在以下描述中，在一整體SIFT描述符中之H包括各具有八個區間h之16個梯度統計圖h，而V係根據本發明之包括16個子描述符v(其等各具有八個元件v)之一整體局部描述符。

用H表示包括16個梯度統計圖h₀-h₁₅之一SIFT局部影像描述符，如圖2a中所示，各統計圖包括八個區間值h ₀-h ₇，如圖2b中所示。可藉由變換H之h₀至h₁₅之各者且接著在最終變換值上執行純量量化而計算一更穩固、區別性的、可縮放及緊密影像描述符。更具體而言，根據變換式A或變換式B而變換h₀至h₁₅之各者，如下文所示，根據圖3之變換利用資訊，即變換式A被應用於h₀、h₂、h₅、h₇、h₈、h₁₀、h₁₃、h₁₅且變換式B被應用於h₁、h₃、h₄、h₆、h₉、h₁₁、h₁₂、h₁₄，給出具有子描述符v₀至v₁₅之經變換之描述符V，分別對應於h₀至h₁₅，且各包括元件v ₀至v ₇，給出全部128個元件。

變換式A (1)

v ₀=h ₂-h ₆

v ₁=h ₃-h ₇

v ₂=h ₀-h ₁

v ₃=h ₂-h ₃

v ₄=h ₄-h ₅

v ₅=h ₆-h ₇

v ₆=(h ₀+h ₄)-(h ₂+h ₆)

v ₇=(h ₀+h ₂+h ₄+h ₆)-(h ₁+h ₃+h ₅+h ₇)

變換式B (2)

v ₀=h ₀-h ₄

v ₁=h ₁-h ₅

v ₂=h ₇-h ₀

v ₃=h ₁-h ₂

v ₄=h ₃-h ₄

v ₅=h ₅-h ₆

v ₆=(h ₁+h ₅)-(h ₃+h ₇)

v ₇=(h ₀+h ₁+h ₂+h ₃)-(h ₄+h ₅+h ₆+h ₇)

接著，各元件經歷粗略的純量量化(例如三進制(3階)量化)，其中量化臨限值經選擇以在針對各元件之量化區間之中達成一特定發生概率分佈。此純量量化產生具有各包括元件至之子描述符至且再次具有全部128個元件之經量化之描述符。此緊密描述符擷取包含於原始梯度統計圖中依分佈形狀及其等區間值之中之關係之形式之最具區別性的及穩固的資訊。

描述符V以及其之經量化之版本之一關鍵優點係：其可高度縮放，且若一應用之儲存要求或一傳輸通道之特性需要，則可藉由僅消除其之元件之一或多者而容易減小其之維度。為了簡單起見，在隨後的描述中，將在使用子描述符v₀至v₁₅(各包括元件v ₀至v ₇)來編碼經預先量化之描述符V方面描述本發明之重要態樣，且除非另外說明，應瞭解依一類似方式繼續進行經量化之描述符之編碼。

圖4a至4e展示已被發現產生針對五個目標描述符長度(自最短描述符長度僅利用20個描述符元件之描述符長度0(DL0)至最長描述符長度利用全部128個元件之描述符長度4(DL4))之極佳的辨別力及穩固性之例示性組之元件。更具體言之，圖4a展示包括20個元件之描述符長度DL0之一例示性組之元件，圖4b展示包括40個元件之描述符長度DL1之一例示性組之元件，圖4c展示包括64個元件之描述符長度DL2之一例示性組之元件，圖4d展示包括80個元件之描述符長度DL3之一例示性組之元件及圖4e展示包括全部128個元件之描述符長度DL4之一例示性組之元件。因此，針對各描述符長度，將(或將不)根據圖4a至圖4e之元件利用組而編碼各子描述符之各元件。

此可縮放性性質之關鍵係用於各描述符長度之該組所利用之元件必須與用於全部更高描述符長度之該組所利用之元件相同或為其等之一子集，如圖4a至圖4e中所繪示。此允許藉由僅消除具有更高描述符長度之描述符之過多元件而轉碼及比較不同長度之描述符，使得其減少至與具有更低描述符長度之描述符相同之元件組。

此描述符之一簡單編碼方法包括依一「按子描述符」順序計算及編碼元件，即依如v _0,0、v _0,1、...、v _0,7、v _1,0、v _1,1、...、v _1,7、...、v _15,0、v _15,1、...、v _15,7之一般情況，其中v _i,j表示子描述符v _i之元件v _j。此意指使用適當變換式(例如如圖3中所繪示)，且亦使用針對所要描述符長度之適當元件利用組(例如如圖4中所繪示)，以決定應編碼哪些元件，編碼經變換之統計圖v₀之元件v ₀,v ₁,...,v ₇，接著編碼經變換之統計圖v₁之元件v ₀,v ₁,...,v ₇等等。

此編碼(例如)針對一描述符長度DL0的描述符形成v _0,0、v _1,0、v _2,0、v _3,0、v _4,0、v _5,0、v _5,6、v _6,0、v _6,6、v _7,0、v _8,0、v _9,0、v _9,6、v _10,0、v _10,6、v _11,0,v _12,0,v _13,0、v _14,0、v _15,0且針對一描述符長度DL1的描述符形成v _0,0、v _0,1、v _1,0、v _1,1、v _2,0、v _2,1、v _3,0、v _3,1、v _4,0、v _4,1、v _5,0、v _5,1、v _5,2、v _5,6、v _6,0、v _6,1、v _6,2、v _6,6、v _7,0、v _7,1、v _8,0、v _8,1、v _9,0、v _9,1、v _9,2、v _9,6、v _10,0、v _10,1、v _10,2、v _10,6、v _11,0、v _11,1、v _12,0、v _12,1、v _13,0、v _13,1、v _14,0、v _14,1、v _15,0、v _15,1。

圖5將此一簡單編碼器之操作繪示為一序列步驟。在以下描述中，以及在一編碼器之操作之隨後描述中，除非另外指定，此一序列步驟對應於概念上的且不對應於軟體實施、組件及指令之特定硬體而是代表編碼器之總操作之步驟。更具體而言，圖5繪示針對一描述符長度DLk(例如對應於圖4中所繪示之描述符長度之描述符長度)之一編碼器之操作。在圖5之步驟S100中，在第一子描述符(即v₀)處開始編碼描述符。在步驟S110中，(例如)根據圖3之變換式利用，針對經處理之子描述符而選擇適當變換式。應注意，根據此處所描述之兩個不同變換式而自描述符H計算描述符V僅係一實例。亦可根據一單一變換式(例如僅變換式A或僅變換式B)(使步驟S110變得不必要)或根據兩個以上變換式而執行自描述符H計算描述符V。在步驟S120中，在第一子描述符元件(即v ₀)處開始編碼經處理之子描述符。接著，在步驟S130中，(例如)使用圖4之使用組之一者對照描述符長度DLk之元件利用資訊來核對是否使用特定子描述符之特定元件(即v _0,0)。若未使用該元件，則處理移至步驟S150。若該元件用於描述符長度DLk，則在步驟S140中發生其之編碼。此處，以及在一編碼器之操作之隨後描述中，除非另外指定，詞語「編碼」意指使得元件v _0,0成為局部影像描述符之部分之一或多個動作或其之組合，該等動作包含(舉例而言且非限制)：根據先前所見之適當變換函數(1)或(2)而計算、在全部元件經預先計算之情況下(不知哪些元件最終將用於描述符中)用於包含於局部影像描述符中之元件之選擇、元件值之量化、在揮發性或非揮發性記憶體中之元件之儲存及沿一傳輸通道之元件之傳輸。在步驟S140之後，或若在步驟S130中決定元件未用於描述符長度DLk，則處理移至步驟S150。在步驟S150中，若當前元件不是子描述符之最後元件，則處理移至子描述符之下一個元件，否則處理移至步驟S160。在步驟S160中，若當前子描述符不是局部影像描述符之最後子描述符，則處理移至局部影像描述符之下一個子描述符，否則處理結束。因此，顯然步驟S100、S120、S150及S160係關於執行處理之順序，而步驟S110、S130及S140係關於局部影像描述符之實際編碼。

此描述符之另一簡單編碼方法包括依一「按元件」順序(即依如v _0,0、v _1,0、...、v _15,0、v _0,1、v _1,1、...、v _15,1、...、v _0,7、v _1,7、...、v _15,7之一般情況)計算及編碼元件，即再次使用適當變換式(例如如圖3中所繪示)，且亦使用針對所要描述符長度之適當元件利用組(例如如圖4中所繪示)，以決定應編碼哪一個元件，編碼用於子描述符v₀、v₁、...、v₁₅之元件v ₀，接著編碼用於子描述符v₀、v₁、...、v₁₅之元件v ₁等等。此一編碼器可依圖5之編碼器之一類似方式使用適當重排序步驟來操作。一般而言，兩種上述方法皆提供優於另一方法的優點。出於轉碼、解碼及處理之目的，解碼器必須亦瞭解編碼程序及元件排序及利用組以能夠處理及比較可能具有不同長度之描述符(出於相關電腦視覺應用之目的)。因此，元件利用組必須永久固定或與描述符共同儲存/傳輸。在此背景下，簡單編碼程序係不利的。

更具體而言，此一編碼忽略依編碼順序之不同元件之間之相對重要性。因此，在轉碼方面，藉此具有一所給描述符長度之一描述符被轉換成具有一不同描述符長度之一描述符，或在解碼及藉由比較兩個描述符之間之對應元件而比較具有不同長度之描述符方面，此一編碼需要剖析描述符以達成所要結果。

此外，此一編碼忽略不同元件之間之相對重要性中之冗餘型樣，且關於決定是否應編碼特定元件係不必要地複雜。

因此，本發明之一目標係揭示一種用於基於一梯度統計圖而編碼一影像描述符之方法及相關影像處理裝置，該方法相對於先前技術方法更有效。

本發明之一進一步目標係揭示一種用於基於一梯度統計圖而編碼一影像描述符之方法及相關影像處理裝置，該方法更靈活。

本發明之一進一步目標係揭示一種用於基於一梯度統計圖而編碼一影像描述符之方法及相關影像處理裝置，該方法允許達成一最佳化編碼器實施方案。

本發明之一進一步目標係揭示一種用於基於一梯度統計圖而編碼一影像描述符之方法及相關影像處理裝置，該方法允許獲得具有任何長度之影像描述符。

透過用於基於一梯度描述符而編碼一影像描述符之一方法及相關影像處理裝置(如係本描述之一整體部分之隨附申請專利範圍中所主張)而達成本發明之此等及其他目標。

簡單地說，揭示一種方法，其用於藉由根據一元件利用順序而編碼影像描述符而有效編碼影像描述符(諸如上文所描述之影像描述符)，導致可藉由簡單描述符截斷而不是剖析而被轉換成更低描述符長度之可縮放描述符。

編碼係根據子描述符群組而執行，根據該等子描述符群組之對應元件之間之相對重要性中之冗餘型樣而形成。

更特定而言，藉由分組子描述符而執行該分組，該等子描述符之對應元件在達成高辨識效能方面根據其等之相對重要性在描述符之全部元件之一排序中具有一類似重要性，更具體而言，藉由根據子描述符與描述符中心之距離而分組子描述符及另外藉由根據子描述符之間之距離而分組子描述符及/或另外藉由根據對應編碼特性而排序一群組之子描述符及/或另外藉由根據子描述符之間之距離而排序一群組之子描述符而執行該分組。

根據本發明之編碼方法在效率、計算複雜性及/或產生可縮放位元流所需之資訊量方面有利地比先前技術方法更有效。

在隨附申請專利範圍(意欲作為本描述之一整體部分)中陳述本發明之進一步特徵。

S100‧‧‧步驟

S110‧‧‧步驟

S120‧‧‧步驟

S130‧‧‧步驟

S140‧‧‧步驟

S150‧‧‧步驟

S160‧‧‧步驟

S200‧‧‧步驟

S210‧‧‧步驟

S220‧‧‧步驟

S300‧‧‧步驟

S310‧‧‧步驟

S320‧‧‧步驟

S330‧‧‧步驟

S340‧‧‧步驟

S400‧‧‧步驟

S410‧‧‧步驟

S420‧‧‧步驟

S430‧‧‧步驟

S500‧‧‧步驟

S510‧‧‧步驟

S520‧‧‧步驟

S530‧‧‧步驟

S540‧‧‧步驟

S600‧‧‧步驟

S610‧‧‧步驟

S620‧‧‧步驟

S630‧‧‧步驟

S640‧‧‧步驟

S650‧‧‧步驟

S660‧‧‧步驟

S670‧‧‧步驟

S680‧‧‧步驟

S690‧‧‧步驟

S695‧‧‧步驟

1000‧‧‧輸入裝置

1100‧‧‧處理裝置

1110‧‧‧中央處理單元

1120‧‧‧揮發性記憶體

1130‧‧‧非揮發性記憶體

1140‧‧‧描述符萃取器區塊

1150‧‧‧緊密描述符編碼器區塊

1160‧‧‧緊密描述符處理器區塊

1900‧‧‧輸出裝置

g₀‧‧‧群組

g₁‧‧‧群組

g₂‧‧‧群組

g₃‧‧‧群組

h‧‧‧梯度統計圖

h₀‧‧‧梯度統計圖

h₁‧‧‧梯度統計圖

h₂‧‧‧梯度統計圖

h₃‧‧‧梯度統計圖

h₄‧‧‧梯度統計圖

h₅‧‧‧梯度統計圖

h₆‧‧‧梯度統計圖

h₇‧‧‧梯度統計圖

h₈‧‧‧梯度統計圖

h₉‧‧‧梯度統計圖

h₁₀‧‧‧梯度統計圖

h₁₁‧‧‧梯度統計圖

h₁₂‧‧‧梯度統計圖

h₁₃‧‧‧梯度統計圖

h₁₄‧‧‧梯度統計圖

h₁₅‧‧‧梯度統計圖

h‧‧‧區間

h ₀‧‧‧區間值

h ₁‧‧‧區間值

h ₂‧‧‧區間值

h ₃‧‧‧區間值

h ₄‧‧‧區間值

h ₅‧‧‧區間值

h ₆‧‧‧區間值

h ₇‧‧‧區間值

l‧‧‧元件子描述符

v₀‧‧‧子描述符

v₁‧‧‧子描述符

v₂‧‧‧子描述符

v₃‧‧‧子描述符

v₄‧‧‧子描述符

v₅‧‧‧子描述符

v₆‧‧‧子描述符

v₇‧‧‧子描述符

v₈‧‧‧子描述符

v₉‧‧‧子描述符

v₁₀‧‧‧子描述符

v₁₁‧‧‧子描述符

v₁₂‧‧‧子描述符

v₁₃‧‧‧子描述符

v₁₄‧‧‧子描述符

v₁₅‧‧‧子描述符

v ₀‧‧‧元件

v ₁‧‧‧元件

v ₂‧‧‧元件

v ₃‧‧‧元件

v ₄‧‧‧元件

v ₅‧‧‧元件

v ₆‧‧‧元件

v ₇‧‧‧元件

v _5,0‧‧‧元件

A‧‧‧變換式

B‧‧‧變換式

H‧‧‧影像描述符/SIFT局部影像描述符

R‧‧‧局部區域

SR‧‧‧子區域

V‧‧‧經變換描述符/整體局部描述符

將自以下用於基於一梯度統計圖而編碼一影像描述符之方法及相關影像處理裝置之特定參考附圖之詳細描述更加明白以上目標，其中：圖1a及圖1b展示先前技術關鍵點描述符之一實例；圖2a及圖2b分別展示圖1之關鍵點描述符之梯度統計圖及與梯度之該統計圖有關之區間值；圖3展示待被應用於圖2之梯度統計圖之示意性變換式；圖4a至圖4e展示針對五個各自目標描述符長度之示意性組之元件；圖5表示繪示使用圖4之元件組之一編碼器之操作之一流程圖；圖6展示由根據本發明之一方法使用之一元件利用順序；圖7繪示使用圖6之元件利用順序之一編碼器之操作；圖8展示一局部影像描述符之一區域及一子區域之中心；圖9展示根據本發明之一方法之一第一實施例或一第四實施例之一局部影像描述符之子描述符之一第一分組；圖12及圖14分別展示根據本發明之一方法之第一實施例之一局部影像描述符之子描述符之第二示意性分組及第三示意性分組；圖10、圖13及圖15分別展示與圖9、圖12、圖14及圖17之分組有關之第一群組元件利用順序、第二群組元件利用順序及第三群組元件利用順序；圖11繪示根據本發明之一方法之一第一實施例、第二實施例、或第四實施例之一編碼器之操作；圖16展示根據本發明之一方法之一第一實施例之一第四示意性分組；圖17展示根據本發明之一方法之第二實施例及第三實施例之一局部影像描述符之子描述符之一第五示意性分組；圖18繪示根據本發明之一方法之第三實施例之使用圖17之元件利用順序之一編碼器之操作；圖19繪示根據本發明之一方法之一第四實施例之一編碼器之操作；圖20展示根據本發明之一方法之一第五實施例之一局部影像描述符之子描述符之一示意性分組；圖21a至圖21e展示根據圖20之分組之示意性組之元件；圖22a至圖22e分別展示當轉換成群組元件利用組時之圖21a至21e之元件組；圖23繪示用於編碼一描述符用以提供圖22a至22e之經轉換之組之元件之一編碼器之操作；圖24繪示適於執行根據本發明之方法之一影像處理器件。

根據本發明，一更有效編碼器並非根據具有不同描述符長度之元件利用組進行編碼，而是可根據一元件利用順序操作，從而產生一描述符，其根據元件利用順序而排序其之元件且其可藉由簡單描述符截斷而被轉換成更低描述符長度。此一元件利用順序可採用可依112位元組編碼之一128元件排序列表之形式，各列表項目指定一子描述符指數及一元件指數，如圖6中所繪示。所以，例如，圖6展示一元件優先權列表，藉此給予元件v _5,0最高優先權，給予元件v _9,0第二最高優先權等等。因此，此一元件利用順序編碼器可藉由編碼列表中之前l個元件而產生具有長度l之一描述符。

圖7繪示使用圖6之元件利用順序之此一編碼器之操作。在圖7之編碼器之情況下，描述符之編碼以在元件利用順序中具有最高優先權 (優先權1)之元件(即子描述符v ₅之元件v ₀)開始。在步驟S200中，根據此元件所屬之子描述符(例如根據圖3之變換式利用)而選擇適當變換式。應注意，根據如此處所描述之兩個不同變換式而自描述符H計算描述符V僅係一實例。在不同實施例中，亦可根據一單一變換式(例如僅變換式A或僅變換式B)(使步驟S200變得不必要)或根據兩個以上變換式而執行自描述符H計算描述符V。接著，在步驟S210中發生元件(即v _5,0)之編碼。接著，在步驟S220中，若描述符之一所要數目個l元件尚未被編碼，則處理移至在元件利用順序中具有第二高優先權之元件，否則處理結束。

因此，步驟S220係關於控制編碼多少元件，而步驟S200及步驟S210係關於局部影像描述符之實際編碼。因此，圖7之編碼器使用如圖6中之一元件利用順序來產生其之元件根據元件利用順序排序且其可藉由簡單描述符截斷(即消除描述符之最後元件)而被轉換為更低描述符長度之描述符，且比使用如圖4中之元件利用組之圖5之編碼器更靈活。

描述符中之元件l之數目可(可能)在影像級處與描述符共同被儲存/傳輸。出於轉碼、解碼及處理之目的，解碼器亦必須瞭解元件排序以能夠出於相關電腦視覺應用之目的而處理。因此，元件利用順序必須永久固定或與描述符共同儲存/傳輸。

然而，實際上，可改良圖7之編碼器之效率。此係因為圖6中所繪示之元件利用順序含有顯著量之冗餘且在一定程度上對產生及使用係不切實際的。

此原因係V之整組128個元件不對應於其之元件可根據一單一優先權列表而排序之一單一描述符，但對應於16個不同8元件子描述符，各子描述符根據一特定變換式而自一不同梯度統計圖提取，且使得全部子描述符之間之對應元件擷取具有相同角距之區間之間之關係。

因此，已發現，在使用一有限組之元件達成一高辨識效能方面，一描述符需要在一均勻元件分佈(即自儘可能多的子描述符選擇元件)與自描述符中心之距離(即給予更接近描述符中心之子描述符更高優先權)之間取得一平衡。同時，亦發現，當子描述符至描述符中心之距離相同時，自不同子描述符之對應元件之重要性近似相同，而自不同子描述符之對應元件之重要性隨著子描述符至描述符中心之距離減少而增大。

在此背景下，一子描述符v至描述符中心之距離係指對應於梯度統計圖h(其導致子描述符v)之子區域之中心與包括子區域之區域之中心之間之距離，如圖8中所繪示。儘管可回頭參考影像區域及子區域之尺寸以計算該距離，然其係不必要的，此係由於其僅關注比較該等距離。因此可藉由假定各子區域之各側具有(例如)一單位長度而計算該等距離。此外，在此描述中，儘管亦可使用其他適合距離量測，然該等距離係歐幾里德距離。

因此，可以看出，出於有效編碼一影像描述符之目的，其之子描述符可被分組，使得將利用順序中之一共同重要性指派給針對各組之子描述符之對應描述符元件，且共同編碼該等對應描述符元件。

第一實施例

在本發明之一第一實施例中，根據子描述符自描述符中心之距離而分組子描述符。

例如，在圖9中繪示一此分組，其中存在三種群組，即g₀={v₀,v₃,v₁₂,v₁₅}，含有具有至描述符中心之最大距離之子描述符；g₁={v₁,v₂,v₄,v₇,v₈,v₁₁,v₁₃,v₁₄}，含有具有至描述符中心之第二大距離之子描述符；及g₂={v₅,v₆,v₉,v₁₀}，含有具有至描述符中心之最小距離之子描述符。在各群組內，儘管此係非限制性的且可使用其他順序(諸如順時針方向，自群組中之最頂層最左邊子描述符開始)，然依遞升子描述符指數順序排序子描述符。在各群組內，將相同編碼優先權指派給群組之子描述符之對應元件全部。

基於此分組，可產生一群組元件利用順序，其可採用可依15個位元組而編碼之一24元件排序列表之形式，各列表項目指定一子描述符群組及一元件指數，如圖10中所繪示。應注意，圖10之群組元件利用順序僅係一實例，且可藉由改變列表中之項目之優先權而產生不同群組元件利用順序。因此，在長度及編碼大小方面，圖10之群組元件利用順序比圖6之元件利用順序更經濟。所以，例如，圖10展示一群組元件優先權列表，藉此給予群組g₂之元件v₀最高優先權，指示編碼器首先編碼之四個元件係v _5,0、v _6,0、v _9,0及v _10,0，給予群組g₁之元件v ₀第二高優先權，指示編碼器接著編碼之八個元件係v _1,0、v _2,0、v _4,0、v _7,0、v _8,0、v _11,0、v _13,0及v _14,0等等。

圖11繪示使用圖10之群組元件利用順序且經組態以依該群組元件利用順序而編碼前m個群組之元件之此一編碼器之操作。在圖11之編碼器之情況下，描述符之編碼以在群組元件利用順序中具有最高優先權(優先權1)之元件之群組(即包括子描述符v₅、v₆、v₉及v₁₀之群組g₂之元件v ₀)開始。在步驟S300中，描述符之編碼在群組之第一子描述符(v₅)處開始。在步驟S310中，(例如)根據圖3之變換式利用而選擇適當變換式用於子描述符。應注意，根據如此處所描述之兩個不同變換式而自描述符H計算描述符V僅係一實例。在不同實施例中，亦可根據一單一變換式(例如僅變換式A或僅變換式B，使步驟S310變得不必要)或根據兩個以上變換式而執行自描述符H計算描述符V。接著，在步驟S320中發生元件(即v _5,0)之編碼。在步驟S330中，若當前子描述符不是群組中之最後的子描述符，則處理移至下一個子描述符，否則處理移至步驟S340。接著，在步驟S340中，若所要數目個m個群組之元件尚未被編碼，則處理移至在群組元件利用順序中具有第二高優先權之元件之群組，否則處理結束。因此，步驟S300、330及340係關於執行處理之順序且係關於控制編碼多少群組之元件，而步驟S310及320係關於局部影像描述符之實際編碼。

描述符中之群組m之數目或對應數目個元件l可(可能)在影像級處與描述符共同儲存/傳輸。

圖10之群組元件利用順序比圖6之元件利用順序更經濟之事實導致一更有效及經濟之編碼器。此外，如先前所見，出於轉碼、解碼及處理之目的，解碼器亦必須瞭解編碼程序及元件利用順序以能夠出於相關電腦視覺應用之目的而處理及比較描述符，此意指元件利用順序必須固定或與描述符共同傳輸。不同應用可需要(例如)藉由給予最接近描述符中心之子描述符更高優先權、或藉由給予一特定類別之元件(例如相對於v ₂之v ₇)更高優先權而在影像或子影像級處改變元件利用順序，以便使用一有限組之元件達成高辨識效能。在此情況下，元件利用順序必須與描述符共同儲存或傳輸。考慮到，低位元率描述符通常在大小上係幾百位元組，圖10之群組元件利用順序表示比圖6之元件利用順序之一更低額外負擔。此外，子描述符分組可固定且為編碼器及解碼器兩者所熟知，或可與描述符共同傳輸。例如，針對至目前為止所考慮之分組，可依小於10個位元組而編碼群組之數目及各群組之組成之大小。

如根據本發明之一第一實施例之另一實例，在圖12中繪示一不同分組，其中存在兩個群組，即，g₀={v₀,v₁,v₂,v₃,v₄,v₇,v₈,v₁₁,v₁₂,v₁₃,v₁₄,v₁₅}，含有全部周邊子描述符；及g₁={v₅,v₆,v₉,v₁₀}，含有具有至描述符中心之最小距離之子描述符(即全部中心子描述符)。因此，在此實例之情況下，群組g₀含有具有至描述符中心之變動距離之子描述符，但始終比群組g₀之子描述符進一步遠離中心。在各群組內，將相同編碼優先權指派給群組之子描述符之對應元件全部。基於此分組，可產生一群組元件利用順序，其可採用可依8個位元組而編碼之一16元件排序列表之形式，各列表項目指定一子描述符群組及一元件指數，如圖13中所繪示。接著，圖11之編碼器可根據圖13之群組元件利用順序再次用於編碼一描述符。應注意，圖13之群組元件利用順序僅係一實例，且可藉由改變列表中之項目之優先權而產生不同群組元件利用順序。

如根據本發明之一第一實施例之另一實例，在圖14中繪示一不同分組，其中存在四個群組，即g₀={v₀,v₃,v₁₂,v₁₅}，含有具有至描述符中心之最大距離之子描述符；g₁={v₁,v₂,v₄,v₇}，含有一組具有至描述符中心之第二大距離之四個子描述符；g₂={v₈,v₁₁,v₁₃,v₁₄}，含有一組再次具有至描述符中心之第二大距離之四個不同子描述符；及g₃={v₅,v₆,v₉,v₁₀}，含有具有至描述符中心之最小距離之子描述符。因此，在此實例之情況下，群組g₁及g₂之子描述符係具有自描述符之中心之相同距離。藉由將原始群組g₁再分成新群組g₁及g₂而自圖9之分組獲得此分組。此優點係其導致具有相同數目個子描述符之群組，此在最佳化編碼器實施方案中為所要的。在各群組內，將相同編碼優先權指派給群組之子描述符之對應元件全部。基於此分組，可產生一群組元件利用順序，其可採用依20個位元組而編碼之一32元件排序列表之形式，各列表項目指定一子描述符群組及一元件指數，如圖15中所繪示。接著，圖11之編碼器可根據圖15之群組元件利用順序再次用於編碼一描述符。應注意，圖15之群組元件利用順序僅係一實例，且可藉由改變列表中之項目之優先權而產生不同群組元件利用順序。

明顯地，圖14之分組成四個群組並非唯一的。例如，在圖16中展示一替代分組，含有群組g₀={v₀,v₃,v₁₂,v₁₅}、g₁={v₁,v₂,v₁₃, v₁₄}、g₂={v₄,v₇,v₈,v₁₁}及g₃={v₅,v₆,v₉,v₁₀}。因此，在圖16中，群組g₀及g₃與圖14之該等群組相同，但與圖14相比，已交換g₁及g₂之子描述符，使得該等兩個群組之各者含有自子描述符格之左上方、右上方、左下方及右下方部分之一子描述符。

圖7之編碼器與圖11之編碼器之間之一差異在於：與產生具有任何長度之描述符之前者不同，後者允許編碼其之長度具有由子描述符群組決定之一粒度之描述符。實際上，後者可經組態以產生具有任何長度之描述符，如將稍後證實。

第二實施例

在本發明之一第二實施例中，首先根據子描述符自中心之距離(第一條件)及其次根據子描述符之相互距離(第二條件)而分組子描述符。

在此背景下，子描述符之間之距離可再次採用一歐幾里德距離之形式或另一適合距離量測，如曼哈坦距離。

第二條件可為(例如)一群組不應含有其彼此間之距離低於一預定臨限值之子描述符。因此，可設定預定臨限值以防止(例如)將鄰近子描述符分成一組。

第二條件之目的係確保(只要可能)自子描述符格之相對較遠位置獲取不同群組之子描述符，藉此增大具有極低數目個特徵之描述符之資訊內容。應注意，可能無法始終滿足第二條件，例如針對含有全部中心子描述符v₅、v₆、v₉及v₁₀之一群組係不可能滿足第二條件。

例如，在圖17中繪示一此分組，其中存在四個群組，即g₀={v₀,v₃,v₁₂,v₁₅}，含有具有至描述符中心之最大距離之子描述符；g₁={v₁,v₇,v₈,v₁₄}，含有一組具有至描述符中心之第二大距離之四個子描述符；g₂={v₂,v₄,v₁₁,v₁₃}，含有一組再次具有至描述符中心之第二大距離之四個不同子描述符；及g₃={v₅,v₆,v₉,v₁₀}，含有具有至描述符中心之最小距離之子描述符。因此，在此實例之情況下，群組g₀、g₁及g₂之子描述符滿足其等不含有鄰近子描述符之條件。在各群組內，將相同編碼優先權指派給群組之子描述符之對應元件全部。基於此分組，可產生一群組元件利用順序(諸如圖15中所繪示之群組元件利用順序)，且一編碼器(諸如圖11中所繪示之編碼器)可再次根據圖15之群組元件利用順序用於編碼一描述符。

明顯地，亦可採用基於一群組內之子描述符之距離之替代條件，諸如最大化子描述符之間之總距離等等。

第三實施例

在本發明之一第三實施例中，根據子描述符自中心之距離而分組子描述符，且依根據其等之對應編碼特性(諸如其等之對應變換式)而界定之一序列編碼各群組之子描述符。

例如，考慮到本發明之第二實施例之圖17之分組與圖3之變換式部署型樣結合，可看見在各群組內，根據變換式A而變換兩個子描述符且根據變換式B而變換兩個子描述符。因此，設定一共同編碼序列條件係可能的，針對各群組，變換式利用序列必須為「A A B B」，即一編碼序列，藉此針對各子描述符群組，群組中之第一子描述符之變換式係變換式A，群組中之第二子描述符之變換式亦係變換式A，群組中之第三子描述符之變換式係變換式B，且群組中之第四子描述符之變換式亦係變換式B。因此，存在四個群組：g₀={v₀,v₁₅,v₃,v₁₂}，含有具有至描述符中心之最大距離之子描述符；g₁={v₇,v₈,v₁,v₁₄}，含有一組具有至描述符中心之第二大距離之四個子描述符；g₂={v₂,v₁₃,v₄,v₁₁}，含有一組再次具有至描述符中心之第二大距離之四個不同子描述符；及g₃={v₅,v₁₀,v₆,v₉}，含有具有至描述符中心之最小距離之子描述符。在各群組內，將相同編碼優先權指派給群組之子描述符之對應元件全部。此外，在各群組內，針對群組中之四個子描述符之變換式利用資訊始終係「A A B B」，此意指一有效編碼器實施方案無需識別各子描述符之可應用的變換式。

圖18繪示使用圖15之群組元件利用順序且經組態以依該群組元件利用順序而編碼前m個群組之元件之此一編碼器之操作。使用圖18之編碼器，描述符之編碼依群組元件利用順序以具有最高優先權利(優先權1)之群組之元件(即包括子描述符v ₅、v ₁₀、v ₆及v ₉之群組g ₃之元件v ₀)開始。在步驟S400中，描述符之編碼在群組之第一子描述符(即v ₅)處開始。已知全部群組具有一共同及固定變換式利用順序，處理移至在其中發生元件(即v _5,0)之編碼之步驟S410。在步驟S420中，若當前子描述符不是群組中之最後一個子描述符，則處理移至下一個子描述符，否則處理移至步驟S430。接著，在步驟S430中，若所要數目個m群組之元件尚未被編碼，則處理移至在群組元件利用順序中具有第二高優先權之群組之元件，否則處理結束。因此，步驟S400、420及430係關於執行處理之順序且係關於控制編碼多少群組之元件，而僅步驟S410係關於局部影像描述符之實際編碼。

在以上描述中，在各群組內所利用之變換式上界定共同編碼序列條件，但亦可在其他編碼特性(諸如量化之類型及位準或其之組合)上界定此條件。

明顯地，若需要，則可將不同編碼序列條件應用於子描述符之不同群組。例如，在本發明之第一實施例中，根據圖9之分組導致三個群組，即g₀，含有具有至描述符中心之最大距離之四個子描述符；g₁，含有具有至描述符中心之第二大距離之八個子描述符；及g₂，含有具有至描述符中心之最小距離之四個子描述符。在此情況下，由於不同群組大小，所以可將變換式利用序列必須為「A A B B」之一編碼序列條件應用於群組g₀及g₂，且可將變換式利用序列必須為「A A A A B B B B」之一不同編碼序列條件應用於群組g₁。

第四實施例

在本發明之一第四實施例中，根據子描述符自中心之距離而分組子描述符且根據其等之間之其等距離而排序各群組之子描述符。

排序條件可為(例如)一群組內之連續子描述符之間之距離不應低於一預定臨限值。因此，可設定預定臨限值以防止(例如)一群組內之連續鄰近子描述符。一不同排序條件可為(例如)最大化一群組內之連續子描述符之間之距離。

當採用較大子描述符群組時，此排序尤其有益於減小群組元件利用順序之大小及部分群組編碼，如下文所解釋。應注意，此類型之排序可能無法始終可行，例如含有全部中心子描述符v ₅、v ₆、v ₉及v ₁₀之一群組不可能不具有連續鄰近描述符。

例如，考慮到圖9中所繪示之分組，可看見各群組內之子描述符可經排序以最大化連續子描述符之間之距離，自群組內具有最低指數之子描述符開始，導致群組g₀={v₀,v₁₅,v₃,v₁₂}、g₁={v₁,v₁₄,v₂,v₁₃,v₇,v₈,v₁₁,v₄}及g₂={v₅,v₁₀,v₆,v₉}。在各群組內，將相同編碼優先權指派給群組之子描述符之對應元件全部。

基於各群組內之子描述符之此分組及排序，可產生一群組元件利用順序(諸如圖10中所繪示之群組元件利用順序)，接著，一編碼器(諸如圖11中所繪示之編碼器)可再次根據圖10之群組元件利用順序用於編碼一描述符。替代地，可採用一編碼器(諸如圖19中所繪示之編碼器)。

更特定而言，圖7之編碼器與圖11及圖18之編碼器之間之一差異在於：與產生具有任何長度之描述符之前者不同，後者允許編碼其之長度具有由子描述符群組決定之一粒度之描述符。然而，實際上，圖11及圖18之編碼器之各者可容易經組態以藉由當已達到所要描述符長度時部分編碼最後一群組之元件而編碼具有任何長度之描述符。在此背景下，圖19展示圖11之編碼器之此一修改。本質上，藉由僅交換圖11之編碼器之步驟S330與340而獲得圖19之編碼器，允許所要數目個元件一經編碼，圖19之編碼器就終止一群組之編碼。明顯地，亦可將一類似修改應用於圖18之編碼器。

在此背景下，一群組內之子描述符根據子描述符之間之距離之排序係非常有利的，此係由於其導致自子描述符格(在一群組之部分編碼的情況下，增大具有較低數目個特徵之描述符之資訊內容)之相對較遠之位置獲取連續元件。

第五實施例

本發明之先前實施例證實根據一群組元件利用順序之影像描述符之有效編碼，群組元件利用順序基於子描述自描述符中心之距離及/或其等彼此間之距離由將子描述符分組成子描述符群組而引起。

在本發明之一替代實施例中，可分組子描述符使得一群組內之各子描述符具有與一群組內之全部其他子描述符相同之一元件利用組。

例如，考慮圖20之分組，其中存在四個群組，即g₀={v₅,v₆,v₉,v₁₀}、g₁={v₁,v₇,v₈,v₁₄}、g₂={v₂,v₄,v₁₁,v₁₃}及g₃={v₀,v₃,v₁₂,v₁₅}。此係如圖17中相同之分組，但其中重新指派群組指數(即已交換g₀與g₃)，使得具有更低指數之群組含有更接近描述符中心之子描述符。組合此分組與圖4a至圖4e之元件利用組導致圖21a至21e之群組元件利用組。

由於針對各描述符長度之所利用之元件組必須與針對全部更高描述符長度之所利用之元件組相同或成為該元件組之一子集，圖21a至圖21e之群組元件利用組可轉換成遞增群組元件利用組，如圖22a至圖22e中所繪示，其中針對各描述符長度(例如圖22c之DL2)，對應元件利用組僅展示(比較緊接更低描述符長度(例如圖22b之DL1))組成具有該描述符長度之描述符之額外元件。

基於圖22a至圖22e之遞增群組元件利用組，一編碼器可產生可藉由簡單描述符截斷而被轉換為更低描述符長度之描述符。

圖23繪示用於編碼具有長度DLk之一描述符之此一編碼器之操作。更具體而言，在步驟S600中，處理藉由編碼具有最低描述符長度之描述符(即DL0)開始。在步驟S610中，DL0描述符之編碼以編碼第一子描述符群組(即g₀)開始，且在步驟S620中，編碼第一子描述符群組以編碼第一元件(即v ₀)開始。在步驟S630中，若元件v ₀根據圖22之遞增群組元件利用組而不用於在描述符長度DL0處之g₀，則處理移至步驟S680，否則處理移至步驟S640。在步驟S640中，選擇群組g₀之第一子描述符(即v₅)，且在步驟S650中，例如根據圖3選擇適當的變換式函數。應注意，根據如此處所描述之兩個不同變換式自描述符H計算描述符V僅係一實例。在不同實施例中，亦可根據一單一變換式(例如僅變換式A或僅變換式B)(使步驟S650變得不必要)或根據兩個以上變換式而執行自描述符H計算描述符V。接著在步驟660中，發生元件v _5,0之編碼。在步驟670中，若當前子描述符不是群組中之最後一個描述符，則處理移至群組中下一個子描述符，否則處理移至步驟S680。在步驟S680中，若當前元件不是最後一個元件(即v ₇)，則處理移至下一個元件，否則處理移至步驟S690。在步驟S690中，若當前子描述符群組不是最後一個子描述符群組，則處理移至下一個子描述符群組，否則處理移至步驟S695。在步驟S695中，若當前子描述符長度不是目標子描述符長度，則處理移至下一個子描述符長度，編碼由遞增群組元件利用組指定之額外元件。否則，處理結束。

儘管詳細呈現本發明之態樣及實施例用於自一SIFT影像描述符計算穩固、區別性的、可縮放及緊密影像描述符，然可基於梯度統計圖而將本發明應用於其他影像描述符，如在尚未發表之意大利專利申請案第TO2012A000602號中所概述。

僅舉例而言，圖24繪示用於執行根據本發明之方法之一概念上的影像處理裝置。更具體而言，處理裝置1100自輸入裝置1000(其可採用一使用者輸入裝置、一媒體讀取器或經傳輸之信號之一接收器之形式)接收輸入，其可包括視覺資料(諸如影像或視訊資料)、基於梯度統計圖之經預先計算之描述符、根據本發明之方法之經預先計算之緊密描述符、程式化指令或使用者輸入。處理裝置1100包括一中央處理單元1110之主處理區塊，中央處理單元1110控制其他處理區塊、揮發性記憶體1120、非揮發性記憶體1130、(視情況)經組態以基於梯度統計圖而產生描述符之一描述符萃取器區塊1140、經組態以執行根據本發明之方法之一緊密描述符編碼器區塊1150及(視情況)經組態以處理該等緊密描述符之一緊密描述符處理器區塊1160以(例如)建立或確認視覺對應性。處理裝置1100經連接至輸出裝置1900，該輸出裝置可採用一視覺顯示單元、一媒體寫入器或一信號發射器之形式，其提供可包括經註解之視覺資料(諸如影像或視訊資料)、處理資訊(諸如經建立或確認之視覺對應性)或根據本發明之方法之緊密描述符之輸出。應瞭解，圖24中所示之處理區塊及架構僅係概念上的，且可能無法精確對應於實施根據本發明之方法之每一裝置。

文中所描述之用於基於一梯度統計圖而編碼一影像描述符之方法及一相關影像處理裝置(舉例而言)在不背離發明理念之新穎精神之情況下可經受諸多可能變動；亦明確指出，在本發明之實際實施方案中，所繪示之細節可具有不同形狀或由其他技術等效元件替代。

因此，可容易瞭解，本發明不限於用於基於一梯度統計圖而編碼一影像描述符之方法及一相關影像處理裝置，但在不背離發明理念之情況下可經受諸多修改、改良或等效部件及元件之替代，如以下申請專利範圍中所清楚指定。