TWI590197B - 影像物體特徵描述方法及影像處理裝置 - Google Patents
影像物體特徵描述方法及影像處理裝置 Download PDFInfo
- Publication number
- TWI590197B TWI590197B TW105122791A TW105122791A TWI590197B TW I590197 B TWI590197 B TW I590197B TW 105122791 A TW105122791 A TW 105122791A TW 105122791 A TW105122791 A TW 105122791A TW I590197 B TWI590197 B TW I590197B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- interest
- pixels
- feature
- contour
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/435—Computation of moments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/582—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
- G06T2207/30256—Lane; Road marking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Description
本發明是有關於一種影像處理方法及裝置,且特別是有關於一種影像物體特徵描述方法及影像處理裝置。
現今的影像物體特徵描述方法可區分為三類:第一類是以物體的特徵點為中心,使用區域的鄰近梯度方向資訊來生成具有幾何不變的特徵描述向量,例如尺度不變特徵轉換(Scale-invariant feature transform,SIFT)、加速穩健特徵(Speeded Up Robust Features,SURF)等特徵點描述方法。第二類是以物體的紋理特徵資訊進行區域梯度資訊的統計並生成強健型特徵描述子(descriptor),例如方向梯度直方圖(Histogram of Oriented Gradient,HOG)特徵描述方法。第三類則是使用物體的輸廓資訊生成物體的形狀特徵描述子,例如傅利葉描述子、距離中心(Distance-to-Centre,DtC)描述子等。
然而,現有的方法共同的特性為均使用高維度的特徵向量進行特徵描述,例如SIFT使用128維度的特徵向量來描述每個特徵點,SURF則使用64維度的特徵向量,HOG特徵描述子使用至少400維度以上的特徵向量進行梯度直方圖的統計,而DtC描述子則使用160維度的特徵向量描述物體形狀特徵。使用高維度的特徵向量不僅會提高系統的運算量,也會提高系統的記憶體需求,因此不易在資源有限的系統中實現。
另一方面,現有的特徵描述方法並非完全具備幾何不變性,例如HOG特徵描述子,必須搭配額外的演算法來決定物體的主方向,之後才能進行梯度直方圖的統計。DtC描述子則必須事先將物體的方位角轉至與參考影像的相同方向,之後才能產生相對應的特徵描述子。這些需求也提升了物體辨識演算法的複雜度,進而提高系統成本並降低實用性。
本發明提供一種低維度的影像物體特徵描述方法及裝置,可在有限的角度範圍內,提供可達到平移不變、尺度不變、旋轉不變的特徵描述子。
本發明的影像物體特徵描述方法適於由電子裝置描述一輸入影像中的物體特徵。此方法係偵測輸入影像中的感興趣物體,並計算此感興趣物體的質心位置及方向角。接著,辨識此感興趣物體的輪廓,並計算輪廓上各個像素與質心位置之間的距離及相對角度。然後,使用方向角校正所計算的各個像素的相對角度,而將以質心位置為中心的360度範圍區別為多等份的角度區間,並依各個角度區間涵蓋的範圍將輪廓上的像素分為多個群組。之後,取各個群組的像素的距離中的最大值作為該群組的特徵值,將這些群組的特徵值正規化並集合生成特徵向量,以作為感興趣物體的特徵描述子。
在本發明的一實施例中,上述計算感興趣物體的質心位置及方向角的步驟包括將感興趣物體的影像二值化以產生二值化影像,並計算此二值化影像的多個影像低階矩,從而利用影像低階矩計算感興趣物體的質心位置,然後利用此質心位置,計算相對於感興趣物體的質心的多個影像中心矩,從而利用影像中心矩計算感興趣物體的方向角。
在本發明的一實施例中,上述辨識感興趣物體的輪廓的步驟包括針對二值化影像中的多個像素,搜尋各個像素周圍的多個相鄰像素,並判斷這些相鄰像素的像素值是否為零,其中若有其中一個相鄰像素的像素值為零,則判斷此像素為感興趣物體的輪廓上的像素。
在本發明的一實施例中,上述使用方向角校正所計算的各個像素的相對角度的步驟包括將各個像素的相對角度減去方向角。
在本發明的一實施例中,上述正規化所述群組的特徵值的步驟包括將各個特徵值除以這些特徵值中的最大值
在本發明的一實施例中,上述的輸入影像為道路影像,而所述偵測輸入影像中的感興趣物體的步驟包括偵測道路影像中的交通標誌以作為感興趣物體,其中包括將道路影像的色彩空間轉換至色度(Hue)、飽和度(Saturation)、亮度(Value)色彩空間,並執行顏色分類(color thresholding)演算法於此HSV色彩空間的道路影像,以產生道路影像的二值化遮罩,其中此二值化遮罩指示道路影像中顏色屬於一特定顏色的區域,然後對此二值化遮罩執行輪廓偵測(contour detection)演算法,以取得特定顏色的區域的輪廓,最後則偵測此輪廓內滿足預設尺寸(及預設長寬比)的區域作為感興趣物體。
在本發明的一實施例中,上述偵測道路影像中的交通標誌作為感興趣物體的步驟更包括將感興趣物體的影像二值化以產生二值化影像,並利用連通元件分析(connected component analysis)抽取二值化影像中的連通元件作為感興趣物體的內容,並用以計算感興趣物體的質心位置及方向角。
本發明的影像處理裝置包括儲存裝置及處理器。其中,儲存裝置是用以儲存多個模組。處理器則耦接儲存裝置,用以載入並執行儲存裝置中的模組。所述模組包括物體偵測模組、輪廓辨識模組、方向校正模組及特徵描述模組。其中,物體偵測模組是用以偵測一輸入影像中的感興趣物體,並計算此感興趣物體的質心位置及方向角。輪廓辨識模組是用以辨識感興趣物體的輪廓,並計算此輪廓上的各個像素與質心位置之間的距離及相對角度。方向校正模組是使用方向角校正所計算的各個像素的相對角度。特徵描述模組是用以將以質心位置為中心的360度範圍區分為多等份的角度區間,並依各個角度區間涵蓋的範圍將輪廓上的像素分為多個群組,取各個群組中的像素的距離中的最大值作為該群組的特徵值,而將這些群組的特徵值正規化並集合生成特徵向量,以作為感興趣物體的特徵描述子。
在本發明的一實施例中,上述的影像處理裝置更包括 影像擷取裝置,其係耦接處理器,而用以擷取輸入影像。
在本發明的一實施例中,上述的物體偵測模組包括將感興趣物體的影像二值化以產生二值化影像,計算二值化影像的多個影像低階矩並用以計算感興趣物體的質心位置,以及利用質心位置,計算相對於感興趣物體的質心的多個影像中心矩並用以計算感興趣物體的方向角。
在本發明的一實施例中,上述的輪廓辨識模組包括針對二值化影像中的多個像素,搜尋各個像素周圍的多個相鄰像素,並判斷這些相鄰像素的像素值是否為零,並在其中一個相鄰像素的像素值為零時,判斷此像素為感興趣物體的輪廓上的像素。
在本發明的一實施例中,上述的方向校正模組包括將各個像素的相對角度減去方向角,以校正相對角度。
在本發明的一實施例中,上述的特徵描述模組包括將各個特徵值除以這些特徵值中的最大值,以將這些群組的特徵值正規化。
在本發明的一實施例中,上述的輸入影像為道路影像,而上述的物體偵測模組包括偵測道路影像中的交通標誌以作為感興趣物體。
在本發明的一實施例中,上述的物體偵測模組包括將道路影像的色彩空間轉換至HSV色彩空間,並執行顏色分類演算法於HSV色彩空間的道路影像,以產生道路影像的二值化遮罩,其中二值化遮罩指示道路影像中顏色屬於一特定顏色的區域,並執行輪廓偵測演算法於二值化遮罩,以取得此特定顏色區域的輪廓,以及偵測此輪廓內滿足預設尺寸的區域作為感興趣物體。
在本發明的一實施例中,上述的物體偵測模組更將感興趣物體的影像二值化以產生二值化影像,以及利用連通元件分析抽取此二值化影像中的連通元件以作為感興趣物體的內容,並用以計算感興趣物體的質心位置及方向角。
本發明的車輛周圍影像處理裝置包括連接裝置、儲存裝置及處理器。其中,連接裝置是用以連接配置於車輛上的多個相機。儲存裝置是用以儲存多個模組。處理器耦接連接裝置及儲存裝置,用以載入並執行儲存裝置中的模組,這些模組包括影像拍攝模組、視野轉換模組、影像切割模組及影像拼接模組。影像拍攝模組利用相機拍攝車輛周圍多個透視視野的影像;視野轉換模組分別將這些透視視野的影像轉換為俯視視野的影像;影像切割模組是在轉換後的俯視視野的各個影像的其中一行像素中,找出由至少一個預設數目的連續多個空洞像素構成的區間,而根據此區間在影像中的高度,將透視視野及俯視視野的影像切割為地面側影像及牆面側影像;影像拼接模組會將切割後的地面側影像及牆面側影像拼接,以產生車輛周圍的合成影像。
基於上述,本發明的影像物體特徵描述方法及影像處理裝置係針對影像中的感興趣物體,利用物理學中的矩來表示其形狀,並用以計算其質心及方向角。藉由辨識感興趣物體的輪廓,並計算輪廓像素與質心之間的距離及相對角度,做出角度與距離的直方圖,並將角度範圍區分為多個區間以提取特徵值,最終將語由所提取特徵值生成的特徵向量正規化,以作為感興趣物體的特徵描述子。此特徵描述子在有限的角度範圍內,可具有平移不變、尺度不變及旋轉不變的特徵。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
本發明提出一種特徵描述的方法流程,其結合影像質心和輪廓距離角度的特徵計算方法,能在有限的角度範圍內,提供平移不變、尺度不變、旋轉不變的特徵描述子,用以作為支持向量機(Support Vector Machine,SVM)的分類器的訓練資料。而透過大量資料庫的建立,可讓支持向量機的分類能力提高,訓練好的分類器則可移植至嵌入式平台上。藉由本發明所提出的低維度的特徵描述方法,可提供嵌入式平台在有限效能內,仍可達到即時偵測與辨識影像中物體的目的。
本發明利用物理學中的矩來表示物體形狀,對於實數域上的二維函數
,可定義(
p+
q)階的矩
用來表示其密度,如下列公式(1):
(1)
假設在一影像的平面上有著非零的數值存在,則可計算出唯一性的矩集合{
},也就是說,唯一性的矩集合對應著唯一的影像,而經過離散化後,可應用在影像物件的描述。其中,影像低階矩的計算公式如下列公式(2):
(2)
其中
為二值化或灰階的影像物件,
p、
q則為影像矩的階數,在計算出零階矩
和一階矩
和
後,可通過下列公式(3)找到影像的質心位置
:
(3)
在取得影像的質心位置
之後,可用以推導出相對於影像質心
的中心矩
,其定義如下列公式(4):
(4)
此影像中心矩
具有平移不變性的特性,而在計算一階中心矩
和二階中心矩
和
之後,其可用來計算影像物體的方向角
,如下列公式(5):
,
,
,
,
(5)
其中,影像方向角
的範圍限制為
。
本發明的部份實施例接下來將會配合附圖來詳細描述,以下的描述所引用的元件符號,當不同附圖出現相同的元件符號將視為相同或相似的元件。這些實施例只是本發明的一部份,並未揭示所有本發明的可實施方式。更確切的說,這些實施例只是本發明的專利申請範圍中的裝置與方法的範例。
圖1是依照本發明一實施例所繪示之影像處理裝置的方塊圖。本實施例的影像處理裝置10例如是具備運算功能的桌上型電腦、筆記型電腦、工作站或伺服器等計算裝置,或是手機、平板電腦、數位相機、數位攝影機、網路攝影機、行車紀錄器、導航裝置、車用電腦等固定式或可攜式電子裝置,本發明不以此為限。影像處理裝置10中至少包括影像擷取裝置12、儲存裝置14及處理器16,其功能分述如下:
影像擷取裝置12例如是包含光學鏡頭以及電荷耦合元件(Charge Coupled Device,CCD)或互補金氧半導體(Complementary Metal-Oxide Semiconductor,CMOS)元件等感光元件的相機,其可用以拍攝影像。在其他實施例中,影像擷取裝置12也可以是用以從記憶卡擷取影像的讀卡機,或是用以從網路設備上擷取影像的有線或無線網路卡或其他通訊設備,本發明不以此為限。
儲存裝置14例如是任何型態的固定式或可移動式隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)或類似元件或上述元件的組合。在本實施例中,儲存裝置14係用以記錄物體偵測模組142、輪廓辨識模組144、方向校正模組146及特徵描述模組148。
處理器16例如是中央處理單元(Central Processing Unit,CPU),或是其他可程式化之一般用途或特殊用途的微處理器(Microprocessor)、數位訊號處理器(Digital Signal Processor,DSP)、可程式化控制器、特殊應用積體電路(Application Specific Integrated Circuits,ASIC)、可程式化邏輯裝置(Programmable Logic Device,PLD)或其他類似裝置或這些裝置的組合,其係與影像擷取裝置12及儲存裝置14連接。
在本實施例中,儲存裝置14中記錄的模組例如是電腦程式,其可由處理器16載入而據以執行本實施例的影像物體特徵描述方法。以下即舉實施例說明此方法的詳細步驟。
圖2是依照本發明一實施例所繪示之影像物體特徵描述方法的流程圖。請同時參照圖1及圖2,本實施例的方法適用於上述圖1的影像處理裝置10,以下即搭配圖1中影像處理裝置10的各項裝置,說明本實施例影像物體特徵描述方法的詳細步驟:
首先,由處理器16執行物體偵測模組142,以偵測輸入影像中的感興趣物體,並計算此感興趣物體的質心位置及方向角(步驟S202)。其中,所述的輸入影像例如是由影像擷取裝置12拍攝的影像,或是從其他裝置或網路設備擷取的影像,本發明不以此為限。
需說明的是,對於影像中的感興趣物體或感興趣區域(Region of Interest,ROI),本實施例是利用影像低階矩的公式來計算其質心位置,並利用影像中心矩的公式來計算其方向角。
詳言之,處理器16例如會執行物體偵測模組142,先對感興趣物體的影像進行二值化處理以產生二值化影像,接著計算此二值化影像的影像低階矩而用以計算感興趣物體的質心位置,然後再利用此質心位置,計算相對於感興趣物體的質心的多個影像中心矩並用以計算感興趣物體的方向角。
舉例來說,假設
為二值化感興趣區域的影像,
p、
q為影像低階矩的階數,本實施例可利用上述公式(2)計算出零階矩
和一階矩
和
,再利用上述公式(3)計算感興趣區域的質心P
c 的位置
,其具有平移不變的特性。
在取得二值化感興趣區域的質心座標
後,後續進行特徵提取時,即可利用此質心座標
計算物體輪廓與質心P
c 之間的距離。另一方面,本實施例亦利用上述公式(4)計算感興趣區域影像的一階中心矩
和二階中心矩
和
,再利用上述公式(5)計算感興趣區域的方向角
,用以表示感興趣區域的傾斜狀況。
需說明的是,藉由所計算的感興趣區域 的質心位置
與方向角
,雖然可以直接利用仿射運算對感興趣區域做平移、縮放、旋轉等正規化的調整,但為求處理效率,本實施例於此時並不對感興趣區域做正規化的動作,而是等到後續特徵提取時,再對特徵值進行補償,藉此可加快運算速度。
舉例來說,圖3A至圖3C是依照本發明一實施例所繪示之偵測影像中感興趣物體並計算其質心位置及方向角的範例。請參照圖3A,在本實施例中,影像處理裝置例如是車用電腦,其係連接行車記錄器,而用以對行車記錄器所拍攝的道路影像30進行處理,以偵測此道路影像30中的交通標誌(例如速限標誌32),而用以作為感興趣物體。
其中,影像處理裝置例如是將道路影像30的色彩空間轉換為色度(Hue)、飽和度(Saturation)、亮度(Value)色彩空間,並對此HSV色彩空間的道路影像執行顏色分類(color thresholding)演算法,以產生道路影像的二值化遮罩,此二值化遮罩可指示道路影像中顏色屬於一特定顏色的區域(例如速限標誌32中的紅色區域)。然後,影像處理裝置會再針對此二值化遮罩執行輪廓偵測(contour detection)演算法,以取得此特定顏色區域的輪廓。之後,影像處理裝置會偵測此輪廓內滿足預設尺寸(例如100像素)及/或預設長寬比(例如0.8~1.25)的區域作為感興趣物體。藉此,影像處理裝置即可辨識出道路影像30中的速限標誌32。
為了辨識速限標誌32的內容(即速限90),在偵測出速限標誌32後,影像處理器裝置會進一步對此速限標誌32的影像執行二值化處理以產生二值化影像,然後再利用連通元件分析法(connected component analysis)抽取此二值化影像中的連通元件,而用以作為感興趣物體的內容,最終得到如圖3B所示的速限影像36。
最後,針對速限影像36,影像擷取裝置會再利用上述的影像低階矩的公式來計算其質心位置(如圖3C所示的質心P
c ),並利用影像中心矩的公式來計算其方向角。
回到圖2的流程,在決定感興趣區域影像的質心位置與方向角之後,接著將繼續由處理器16執行輪廓辨識模組144,以辨識感興趣物體的輪廓,並計算此輪廓上多個像素中各個像素與質心位置之間的距離及相對角度(步驟S204)。其中,本實施例係採用四方向檢測判斷法,搜尋感興趣區域的二值化影像中數值為1的像素,而使用其周圍四個方向上的相鄰像素的數值來做判斷。
詳言之,輪廓辨識模組144例如是針對上述感興趣區域影像的二值化影像中的多個像素,搜尋各個像素周圍的多個相鄰像素(例如上、下、左、右四個相鄰像素),並判斷這些相鄰像素的像素值是否為零。其中,若這些相鄰像素其中之一的像素值為零時,輪廓辨識模組144即可判斷此像素為感興趣物體的輪廓上的像素。藉由重複執行上述判斷步驟,最終輪廓辨識模組144即可辨識出感興趣物體的輪廓。
舉例來說,圖4A至圖4C是依照本發明一實施例所繪示之偵測影像中感興趣物體輪廓的範例。請參照圖4A,本實施例係接續在圖3A至圖3C的實施例之後,而針對速限影像36進行輪廓辨識。請參照圖4B,針對速限影像36中數值為1的任一像素(例如像素P
1),像素P
1周圍的編號1、2、3、4即為像素P
1的四個方向。本實施例即藉由判斷這四個方向上的相鄰像素的數值來決定像素P
1是否位於輪廓上。其中,只要這四個方向上的相鄰像素中有一個像素的數值為零,即可判斷像素P
1屬於輪廓上的像素。而藉由對二值化感興趣區域中所有數值為1的像素逐一進行上述的判斷,最後即可找出感興趣區域輪廓上的所有像素,而獲得如圖4C所示的速限輪廓影像38。
在找出感興趣區域輪廓上的像素之後,本實施例即會計算該輪廓像素與質心之間的距離
及相對角度
。舉例來說,圖5A至圖5C是依照本發明一實施例所繪示之描述影像物體特徵的範例。如圖5A所示,假設質心P
c 的位置為
,輪廓上像素P
1的位置為
,則根據三角函數公式,可計算出像素P
1與質心P
c之間的距離
及相對角度
,其計算公式如下:
(7)
(8)
在搜尋完感興趣區域的輪廓上的所有像素之後,若感興趣區域的輪廓上有n個像素,則可求得一個輪廓像素與質心的距離的集合
和一個輪廓像素與質心的相對角度的集合
,而用以做為感興趣區域影像的特徵集合。
回到圖2的流程,在取得輪廓上各個像素與質心位置之間的距離及相對角度之後,接著則由處理器16執行方向校正模組146,從而使用先前計算的方向角來校正所計算的各個像素的相對角度(步驟S206)。
詳言之,承前述圖5A至圖5C的範例,針對感興趣區域影像可能存在的傾鈄情況,本實施例係針對輪廓像素與質心的相對角度的集合
進行補償或校正。其中,本實施例例如是將輪廓像素與質心的相對角度的集合
中的每一個角度,減去先前計算的輪廓像素影像的方向角
,從而得到新的相對角度集合
。這樣的計算相當於將輪廓像素與質心的相對角度皆校正為以輪廓像素影像的方向角
為基準。這樣的計算也比先對感興趣區域影像進行仿射旋轉來的有效率。
之後,由處理器16執行特徵描述模組148,而將以質心位置為中心的360度範圍區分為多等份的角度區間,並依各個角度區間涵蓋的範圍將輪廓上的像素分為多個群組(步驟S208),然後再取各個群組的像素的距離中的最大值作為該群組的特徵值,並集合各個群組的特徵值生成特徵向量(步驟S210),最後則將此特徵向量正規化,以作為感興趣物體的特徵描述子(步驟S212)。
詳言之,承前述圖5A至圖5C的範例,依據前述輪廓像素與質心距離的集合及新的相對角度的集合,本實施例例如是將針對圖5A的速限輪廓影像38所計算的相對角度集合中的每一個角度,按照
的順序排列,而繪示出如圖5B所示的相對角度與質心距離的直方圖40。其中,
x軸為相對角度,
y軸則為相對應的距離。其中,由於感興趣區域在各方向上的輪廓像素的數目不一致,故本實施例係將
x軸上的角度
等分成36份角度區間,並在每一份的角度區間內,決定出一個特徵值,共有36維。其中,本實施例是在每一個角度區間內,取其中質心距離的最大值作為特徵值。而集合36份角度區間的特徵值,即可得到36維的特徵值,而生成特徵向量。最後,將特徵向量中的36維特徵值,統一除去36維特徵值中的最大值,即可獲得正規化後的特徵向量。此結果如同是將不同尺度的感興趣區域正規化至半徑
的圓內,如圖5C的速限輪廓影像42所示。經過上述正規化的步驟,最終即可得到尺度不變的特徵描述子。
綜上所述,本發明的影像物體特徵描述方法及影像處理裝置藉由結合影像質心和輪廓距離角度的特徵描述方法,能夠在有限的角度範圍內,提供可達到平移不變、尺度不變、旋轉不變的特徵描述子。透過將大量的特徵資料用於訓練支持向量機的分類器,可將支持向量機的分類辨識能力提高。特別是,基於本發明的特徵描述方式可提高系統分類辨識率上的表現,其不僅可應用於上述交通標誌的分類及辨識,亦可延伸至其他物體特徵的描述及辨識。且基於本發明的特徵描述方式僅使用低維度的特徵值進行物體形狀特徵的描述,其可移植至嵌入式平台上,從而提供嵌入式平台在有限效能內,仍可達到即時偵測與辨識影像中物體的功效。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
10‧‧‧影像處理裝置
12‧‧‧影像擷取裝置
14‧‧‧儲存裝置
142‧‧‧物體偵測模組
144‧‧‧輪廓辨識模組
146‧‧‧方向校正模組
148‧‧‧特徵描述模組
16‧‧‧處理器
30‧‧‧道路影像
32‧‧‧速限標誌
36‧‧‧速限影像
38、42‧‧‧速限輪廓影像
PC‧‧‧質心
P1~P9‧‧‧像素
40‧‧‧相對角度與質心距離的直方圖
S202~S212‧‧‧本發明一實施例之影像物體特徵描述方法的步驟
圖1是依照本發明一實施例所繪示之影像處理裝置的方塊圖。 圖2是依照本發明一實施例所繪示之影像物體特徵描述方法的流程圖。 圖3A至圖3C是依照本發明一實施例所繪示之偵測影像中感興趣物體並計算其質心位置及方向角的範例。 圖4A至圖4C是依照本發明一實施例所繪示之偵測影像中感興趣物體輪廓的範例。 圖5A至圖5C是依照本發明一實施例所繪示之描述影像物體特徵的範例。
S202~S212‧‧‧本發明一實施例之影像物體特徵描述方法的步驟
Claims (15)
- 一種影像物體特徵描述方法,適於由電子裝置描述一輸入影像中的物體特徵,該方法包括下列步驟: 偵測該輸入影像中的感興趣物體,並計算該感興趣物體的質心位置及方向角; 辨識該感興趣物體的輪廓,並計算該輪廓上的多個像素中各所述像素與該質心位置之間的距離及相對角度; 使用該方向角校正所計算的各所述像素的該相對角度; 區分以該質心位置為中心的360度範圍為多等份的角度區間,並依各所述角度區間涵蓋的範圍將該輪廓上的所述像素分為多個群組; 取各所述群組的所述像素的所述距離中的最大值作為該群組的特徵值;以及 正規化所述群組的所述特徵值並集合生成特徵向量,以作為該感興趣物體的特徵描述子。
- 如申請專利範圍第1項所述的方法,其中計算該感興趣物體的該質心位置及該方向角的步驟包括: 二值化該感興趣物體的影像以產生二值化影像; 計算該二值化影像的多個影像低階矩,包括零階矩及一階矩; 利用所述影像低階矩,計算該感興趣物體的該質心位置; 利用該質心位置,計算相對於該感興趣物體的質心的多個影像中心矩,包括一階中心矩及二階中心矩;以及 利用所述影像中心矩,計算該感興趣物體的該方向角。
- 如申請專利範圍第2項所述的方法,其中辨識該感興趣物體的輪廓的步驟包括: 針對該二值化影像中的多個像素,搜尋各所述像素周圍的多個相鄰像素,並判斷所述相鄰像素的像素值是否為零;以及 若所述相鄰像素其中之一的該像素值為零,則判斷該像素為該感興趣物體的該輪廓上的像素。
- 如申請專利範圍第1項所述的方法,其中使用該方向角校正所計算的各所述像素的該相對角度的步驟包括: 將各所述像素的該相對角度減去該方向角。
- 如申請專利範圍第1項所述的方法,其中正規化所述群組的所述特徵值的步驟包括: 將各所述特徵值除以所述特徵值中的最大值。
- 如申請專利範圍第1項所述的方法,其中該輸入影像為道路影像,而所述偵測該輸入影像中的該感興趣物體的步驟包括: 偵測該道路影像中的交通標誌以作為該感興趣物體,其中包括: 轉換該道路影像的色彩空間至色度(Hue)、飽和度(Saturation)、亮度(Value)色彩空間; 執行顏色分類(color thresholding)演算法於該HSV色彩空間的該道路影像,以產生該道路影像的二值化遮罩,其中該二值化遮罩指示該道路影像中顏色屬於一特定顏色的區域; 執行輪廓偵測(contour detection)演算法於該二值化遮罩,以取得該特定顏色的區域的輪廓;以及 偵測該輪廓內滿足預設尺寸的區域作為該感興趣物體。
- 如申請專利範圍第6項所述的方法,其中偵測該道路影像中的所述交通標誌作為該感興趣物體的步驟更包括: 二值化該感興趣物體的影像以產生二值化影像;以及 利用連通元件分析(connected component analysis)抽取該二值化影像中的連通元件作為該感興趣物體的內容,並用以計算該感興趣物體的質心位置及方向角。
- 一種影像處理裝置,包括: 儲存裝置,儲存多個模組;以及 處理器,耦接該儲存裝置,載入並執行該儲存裝置中的所述模組,所述模組包括: 物體偵測模組,偵測一輸入影像中的感興趣物體,並計算該感興趣物體的質心位置及方向角; 輪廓辨識模組,辨識該感興趣物體的輪廓,並計算該輪廓上的多個像素中各所述像素與該質心位置之間的距離及相對角度; 方向校正模組,使用該方向角校正所計算的各所述像素的該相對角度;以及 特徵描述模組,區分以該質心位置為中心的360度範圍為多等份的角度區間,並依各所述角度區間涵蓋的範圍將該輪廓上的所述像素分為多個群組,取各所述群組中的所述像素的所述距離中的最大值作為該群組的特徵值,將所述群組的特徵值正規化並集合生成特徵向量,以作為該感興趣物體的特徵描述子。
- 如申請專利範圍第8項所述的影像處理裝置,更包括: 影像擷取裝置,耦接該處理器,擷取該輸入影像。
- 如申請專利範圍第8項所述的影像處理裝置,其中該物體偵測模組包括二值化該感興趣物體的影像以產生二值化影像,計算該二值化影像的多個影像低階矩並用以計算該感興趣物體的該質心位置,以及利用該質心位置,計算相對於該感興趣物體的質心的多個影像中心矩,並用以計算該感興趣物體的該方向角。
- 如申請專利範圍第10項所述的影像處理裝置,其中該輪廓辨識模組包括針對該二值化影像中的多個像素,搜尋各所述像素周圍的多個相鄰像素,並判斷所述相鄰像素的像素值是否為零,並在所述相鄰像素其中之一的該像素值為零時,判斷該像素為該感興趣物體的該輪廓上的像素。
- 如申請專利範圍第8項所述的影像處理裝置,其中該方向校正模組包括將各所述像素的該相對角度減去該方向角,以校正該相對角度。
- 如申請專利範圍第8項所述的影像處理裝置,其中該特徵描述模組包括將各所述特徵值除以所述特徵值中的最大值,以將所述群組的所述特徵值正規化。
- 如申請專利範圍第8項所述的影像處理裝置,其中該輸入影像為道路影像,而該物體偵測模組包括偵測該道路影像中的交通標誌以作為該感興趣物體,其中包括轉換該道路影像的色彩空間至HSV色彩空間,並執行顏色分類演算法於該HSV色彩空間的該道路影像,以產生該道路影像的二值化遮罩,其中該二值化遮罩指示該道路影像中顏色屬於一特定顏色的區域,並執行輪廓偵測演算法於該二值化遮罩,以取得該特定顏色的區域的輪廓,以及偵測該輪廓內滿足預設尺寸的區域作為該感興趣物體。
- 如申請專利範圍第14項所述的影像處理裝置,其中該物體偵測模組更將該感興趣物體的影像二值化以產生二值化影像,以及利用連通元件分析抽取該二值化影像中的連通元件以作為該感興趣物體的內容,並用以計算該感興趣物體的質心位置及方向角。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW105122791A TWI590197B (zh) | 2016-07-19 | 2016-07-19 | 影像物體特徵描述方法及影像處理裝置 |
US15/390,751 US9996755B2 (en) | 2016-07-19 | 2016-12-27 | Method and image processing apparatus for image-based object feature description |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW105122791A TWI590197B (zh) | 2016-07-19 | 2016-07-19 | 影像物體特徵描述方法及影像處理裝置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI590197B true TWI590197B (zh) | 2017-07-01 |
TW201804437A TW201804437A (zh) | 2018-02-01 |
Family
ID=60048549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105122791A TWI590197B (zh) | 2016-07-19 | 2016-07-19 | 影像物體特徵描述方法及影像處理裝置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9996755B2 (zh) |
TW (1) | TWI590197B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI844462B (zh) * | 2023-08-29 | 2024-06-01 | 宏碁股份有限公司 | 物件定位模型的效能評估方法及裝置 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3399463A1 (en) * | 2017-05-05 | 2018-11-07 | Ares Trading S.A. | Method and apparatus for determining information about a drug-containing vessel |
CN109858502A (zh) * | 2019-03-07 | 2019-06-07 | 无锡众创未来科技应用有限公司 | 一种基于图像目标特征描述的方法 |
CN110349260B (zh) * | 2019-07-11 | 2022-06-17 | 武汉中海庭数据技术有限公司 | 一种路面标线自动提取方法及装置 |
CN112571409B (zh) * | 2019-09-27 | 2022-05-10 | 珠海一微半导体股份有限公司 | 基于视觉slam的机器人控制方法、机器人及介质 |
CN110859622B (zh) * | 2019-11-18 | 2023-07-04 | 东软医疗系统股份有限公司 | 成像方法、装置及核磁系统 |
CN111754536B (zh) * | 2020-06-29 | 2024-04-16 | 上海商汤智能科技有限公司 | 图像标注方法、装置、电子设备及存储介质 |
EP4022534A4 (en) | 2020-11-06 | 2022-11-30 | Visenze Pte Ltd | SYSTEM AND METHOD FOR GENERATING AN IMAGE RECOGNITION MODEL AND CLASSIFYING AN INPUT IMAGE |
CN112784832B (zh) * | 2021-02-09 | 2022-09-09 | 西南科技大学 | 一种物体标记点识别方法及装置 |
CN114265499A (zh) * | 2021-12-17 | 2022-04-01 | 交控科技股份有限公司 | 应用于客服终端的交互方法和系统 |
CN117115275B (zh) * | 2023-10-25 | 2024-03-12 | 深圳明锐理想科技股份有限公司 | 畸变参数的确定方法、装置和计算机设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1768339A (zh) * | 2003-04-03 | 2006-05-03 | 都柏林城市大学 | 用于索引和检索多媒体数据的形状匹配方法 |
CN101052991A (zh) * | 2004-09-02 | 2007-10-10 | 皇家飞利浦电子股份有限公司 | 使用距离坐标的特征加权的医学对象轮廓确定 |
US8494310B2 (en) * | 2006-11-10 | 2013-07-23 | National University Corporation Toyohashi University Of Technology | Three-dimensional model search method, computer program, and three-dimensional model search system |
KR101491461B1 (ko) * | 2013-08-02 | 2015-02-23 | 포항공과대학교 산학협력단 | 공분산 기술자를 이용하는 물체 인식 방법 및 장치 |
-
2016
- 2016-07-19 TW TW105122791A patent/TWI590197B/zh active
- 2016-12-27 US US15/390,751 patent/US9996755B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI844462B (zh) * | 2023-08-29 | 2024-06-01 | 宏碁股份有限公司 | 物件定位模型的效能評估方法及裝置 |
Also Published As
Publication number | Publication date |
---|---|
US20180025239A1 (en) | 2018-01-25 |
TW201804437A (zh) | 2018-02-01 |
US9996755B2 (en) | 2018-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI590197B (zh) | 影像物體特徵描述方法及影像處理裝置 | |
US11210550B2 (en) | Image-based feature detection using edge vectors | |
Bouchiha et al. | Automatic remote-sensing image registration using SURF | |
EP2534612B1 (en) | Efficient scale-space extraction and description of interest points | |
CN106650580B (zh) | 基于图像处理的货架快速清点方法 | |
CN102799859A (zh) | 一种交通标志识别方法 | |
CN111160169A (zh) | 人脸检测方法、装置、设备及计算机可读存储介质 | |
CN104574401A (zh) | 一种基于平行线匹配的图像配准方法 | |
Sugiharto et al. | Traffic sign detection based on HOG and PHOG using binary SVM and k-NN | |
Yuan et al. | Combining maps and street level images for building height and facade estimation | |
WO2011099072A1 (ja) | パターン識別装置 | |
Lee et al. | Vehicle model recognition in video | |
CN109858502A (zh) | 一种基于图像目标特征描述的方法 | |
CN103186899B (zh) | 一种仿射尺度不变的特征点提取方法 | |
KR101733288B1 (ko) | 방향정보를 이용한 객체 검출기 생성 방법, 이를 이용한 객체 검출 장치 및 방법 | |
KR101741761B1 (ko) | 멀티 프레임 기반 건물 인식을 위한 특징점 분류 방법 | |
CN109685084A (zh) | 一种基于图像目标特征描述的图像处理装置 | |
Jiao et al. | A hybrid method for multi-sensor remote sensing image registration based on salience region | |
Kim et al. | Geo-registration of wide-baseline panoramic image sequences using a digital map reference | |
Mathew et al. | Tracking small targets in wide area motion imagery data | |
George et al. | Real-time logo detection and tracking in video | |
Shaiek et al. | 3D keypoints detection for objects recognition | |
Zhang et al. | An improved method for object instance detection based on object center estimation and convex quadrilateral verification | |
Trinh et al. | HOG and geometrical model based moving vehicle detection | |
Haar et al. | A Method of US Traffic Sign Detection and Recognition |