TW201701190A - 街景影像之文字區域偵測系統及裝置 - Google Patents

街景影像之文字區域偵測系統及裝置 Download PDF

Info

Publication number
TW201701190A
TW201701190A TW104119547A TW104119547A TW201701190A TW 201701190 A TW201701190 A TW 201701190A TW 104119547 A TW104119547 A TW 104119547A TW 104119547 A TW104119547 A TW 104119547A TW 201701190 A TW201701190 A TW 201701190A
Authority
TW
Taiwan
Prior art keywords
corner
view image
street view
color
unit
Prior art date
Application number
TW104119547A
Other languages
English (en)
Other versions
TWI536280B (zh
Inventor
李建誠
沈尚霏
Original Assignee
元智大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 元智大學 filed Critical 元智大學
Priority to TW104119547A priority Critical patent/TWI536280B/zh
Application granted granted Critical
Publication of TWI536280B publication Critical patent/TWI536280B/zh
Publication of TW201701190A publication Critical patent/TW201701190A/zh

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

一種街景影像之文字區域偵測系統及裝置,所述系統包括攝影機、視訊捕捉單元以及文字區域偵測裝置。文字區域偵測裝置包括影像讀取單元、角點特徵運算單元、區域性色彩分布計算單元、色彩通道梯度峰值搜尋單元、峰值特徵分群單元以及特徵點空間分布分析單元。區域性色彩分布計算單元對角點特徵運算單元獲得的角點所在的局部區域做區域色彩分布分析。色彩通道梯度峰值搜尋單元得到各個通道的角點的區域色彩峰值特徵。峰值特徵分群單元將區域色彩峰值特徵進行分群後,特徵點空間分布分析單元依照預設空間群聚條件劃分出文字區塊。

Description

街景影像之文字區域偵測系統及裝置
本發明有關於一種電腦視覺辨識技術,且特別是一種街景影像之文字區域偵測系統及裝置。
市面上現有的文字區域偵測系統大多包含在文字識別系統內,而多數的文字區塊偵測系統所用的分析要素大致上可歸為三大類型:邊緣、連結區域及紋理組織,以上三種類型各有其先天不足之處,在基於邊緣偵測的文字區塊偵測技術中,對於影像中光影變化與顏色對比相當敏感,所以在光影變化劇烈的場合,往往難見成效;而基於連結區域的文字區塊偵測技術中,字體大小的變化直接影響辨識的成功率,若事前沒有針對欲偵測的字體大小做設定,則成效亦難彰顯;而以紋理組織作為分析要素的文字區塊偵測技術中,直接面臨的最大問題在於運算成本,由於紋理組織分析運算牽涉大規模的卷積運算(convolution),所以往往落入效能與辨識率之兩利相權取其重的窘境,例如先前技術中,中華民國專利公告號第279217號,一種文字辨識方法及裝置,係一EDLC(Edge Direction Length Contribution)辨識方法,該方法對於欲處理影像的基本需求為擁有良好的對比度與無光影變化的影響,若影像中有部分字體被陰影遮蔽,則辨識效果將大打折扣。
因此,有必要提供一種可以克服傳統類型文字區塊定位所 面臨問題的街景招牌影像之文字區域偵測系統,可以不受光影變化的影響、不限字體大小的變化、亦不會有大量計算的需求,並且可以達到良好的辨識結果。
本發明實施例提供一種街景影像之文字區域偵測系統及裝置,可應用於街景影像中的文字區塊的切取(或劃分)。
本發明實施例提供一種街景影像之文字區域偵測系統,包括攝影機、視訊捕捉單元以及文字區域偵測裝置。攝影機紀錄街景影像。視訊捕捉單元耦接攝影機,擷取攝影機記錄之街景影像。文字區域偵測裝置包括影像讀取單元、角點特徵運算單元、區域性色彩分布計算單元、色彩通道梯度峰值搜尋單元、峰值特徵分群單元以及特徵點空間分布分析單元。影像讀取單元接收街景影像。角點特徵運算單元耦接影像讀取單元,用以獲得街景影像中的複數個角點的位置。區域性色彩分布計算單元耦接角點特徵運算單元,對街景影像進行色彩通道分離,並對每一角點所在的局部區域做區域色彩分布分析。色彩通道梯度峰值搜尋單元耦接區域性色彩分布計算單元,針對各個通道的所述角點所在的局部區域進行梯度峰值搜尋後得到所述角點之區域色彩峰值特徵。峰值特徵分群單元耦接色彩通道梯度峰值搜尋單元,將所述角點之所述區域色彩峰值特徵進行分群,以獲得複數個角點群。特徵點空間分布分析單元耦接峰值特徵分群單元,基於分群後的該些角點群依照預設空間群聚條件劃分出複數個文字區塊。
本發明實施例提供一種街景影像之文字區域偵測裝置,包括影像讀取單元、角點特徵運算單元、區域性色彩分布計算單元、色彩通道梯度峰值搜尋單元、峰值特徵分群單元以及特徵點空間分布分析單元。影像讀取單元接收街景影像。角點特徵運算單元耦接影像讀取單元,用以獲得街景影像中的複數個角點的位置。區域性色彩分布計算單元耦接角點特徵運算單元,對街景影像進 行色彩通道分離,並對每一角點所在的局部區域做區域色彩分布分析。色彩通道梯度峰值搜尋單元耦接區域性色彩分布計算單元,針對各個通道的所述角點所在的局部區域進行梯度峰值搜尋後得到所述角點之區域色彩峰值特徵。峰值特徵分群單元耦接色彩通道梯度峰值搜尋單元,將所述角點之所述區域色彩峰值特徵進行分群,以獲得複數個角點群。特徵點空間分布分析單元耦接峰值特徵分群單元,基於分群後的該些角點群依照預設空間群聚條件劃分出複數個文字區塊。
綜上所述,本發明實施例提供一種,街景影像之文字區域偵測系統及裝置,以角點特徵作為文字特徵,此舉可以克服傳統基於邊緣偵測的文字區塊偵測技術當中的光影瓶頸。藉此,影像多通道解析更可以加強適應光影變化,並且角點特徵本身不受文字大小的限制,運算速度亦為傳統紋理組織分析運算的數十倍之多。
為使能更進一步瞭解本發明之特徵及技術內容,請參閱以下有關本發明之詳細說明與附圖,但是此等說明與所附圖式僅係用來說明本發明,而非對本發明的權利範圍作任何的限制。
1‧‧‧街景影像之文字區域偵測系統
11‧‧‧攝影機
12‧‧‧視訊捕捉單元
IM‧‧‧街景影像
13‧‧‧文字區域偵測裝置
131‧‧‧影像讀取單元
132‧‧‧角點特徵運算單元
133‧‧‧區域性色彩分布計算單元
134‧‧‧色彩通道梯度峰值搜尋單元
135‧‧‧峰值特徵分群單元
136‧‧‧特徵點空間分布分析單元
ZS‧‧‧文字區塊
30、101a、101b‧‧‧看板
CC‧‧‧角點
RG1、RG2、RG3‧‧‧局部區域
S1、S3、S6‧‧‧直方圖
S2、S4、S5‧‧‧曲線
P1、P2、P3、P4、P5、P6‧‧‧峰值
G1、102a、102b‧‧‧範圍
91、92、93、94、95、96、97、98‧‧‧文字區塊
圖1是本發明實施例提供的街景影像之文字區域偵測系統的功能方塊圖。
圖2是本發明實施例提供的街景影像的示意圖。
圖3是本發明實施例提供的街景影像的角點分布的示意圖。
圖4A是圖2的街景影像的其中一個角點的局部區域的示意圖。
圖4B是圖4A的角點的局部區域的區域色彩分布的示意圖。
圖5A是圖2的街景影像的其中一個角點的局部區域的示意圖。
圖5B是圖5A的角點的局部區域的區域色彩分布的示意圖。
圖6A是圖2的街景影像的其中一個角點的局部區域的示意圖。
圖6B是圖6A的角點的局部區域的區域色彩分布的示意圖。
圖7是本發明實施例提供的特徵點空間的示意圖。
圖8A是本發明實施例提供的特徵點空間中的點以群組G1分群的示意圖。
圖8B是本發明實施例提供的經過圖8A的分群後的角點分布的示意圖。
圖9A是本發明實施例提供的將特徵點空間中的特徵點進行分群的示意圖。
圖9B是本發明實施例提供的街景影像的經過分群後的角點分布的示意圖。
圖9C是本發明實施例提供的街景影像的文字區域偵測系統及裝置獲得的街景影像中的文字區塊的示意圖。
圖10A是本發明另一實施例提供的街景影像的角點分布的示意圖。
圖10B是將圖10A的角點對應的特徵點空間中的特徵點進行分群的示意圖。
〔街景影像之文字區域偵測系統及裝置之實施例〕
請同時參照圖1和圖2,圖1是本發明實施例提供的街景影像之文字區域偵測系統的功能方塊圖,圖2是街景影像的示意圖。本實施例提供一種街景影像之文字區域偵測系統1,其包括攝影機11、視訊捕捉單元12以及文字區域偵測裝置13。街景影像之文字區域偵測系統1可以是行動裝置,例如智慧眼鏡、手機、行車紀錄器等,但本發明並不因此限定。而攝影機11例如是裝設在 智慧眼鏡上,或是手機或行車紀錄器的鏡頭。攝影機11紀錄街景影像IM。視訊捕捉單元12耦接攝影機11,擷取攝影機11記錄之街景影像IM。視訊捕捉單元12可以硬體電路、韌體或軟體實現,本發明也並不因此限定。
文字區域偵測裝置13用以劃分出街景影像IM中的文字區塊ZS(如圖9C所示的文字區塊91、92、93、94、95、96、97、98),將於後續逐步描述獲得文字區塊ZS的過程。文字區域偵測裝置13包括影像讀取單元131、角點特徵運算單元132、區域性色彩分布計算單元133、色彩通道梯度峰值搜尋單元134、峰值特徵分群單元135以及特徵點空間分布分析單元136。文字區域偵測裝置13可以例如利用微處理器實現,但本發明並不因此限定。文字區域偵測裝置13的各個單元也可以各自以獨立的微處理器晶片實現,或者是各自以硬體電路、韌體或軟體的其中之一或其組合實現,本發明並不因此限定。
復參照圖1,影像讀取單元131接收街景影像IM。角點特徵運算單元132耦接影像讀取單元131,區域性色彩分布計算單元133耦接角點特徵運算單元132,色彩通道梯度峰值搜尋單元134耦接區域性色彩分布計算單元133,峰值特徵分群單元135耦接色彩通道梯度峰值搜尋單元134,特徵點空間分布分析單元136耦接峰值特徵分群單元135,特徵點空間分布分析單元136則輸出文字區塊ZS的資訊。
請同時參照圖2與圖3,圖3是本發明實施例提供的街景影像的角點分布的示意圖。角點特徵運算單元132用以獲得街景影像IM中的複數個角點CC的位置,在圖3中各個角點CC以黃點表示。所謂的角點,用以區別影像中的文字部分。例如,文字通常其字體具有邊角,且文字的邊角多且密集所以具有辨識性,在影像中獲得的角點則相當有可能是文字的邊角。在本實施例中,圖3的各個角點CC,就是利用加速分段測試角點偵測法(Features from Accelerated Segment Test(FAST)Corner Detection)獲得,例如是文獻-「E.Rosten and T.Drummond,“Machine Learning for High-Speed Corner Detection,”in Computer Vision-ECCV 2006.Vol.3951,A.Leonardis,H.Bischof,and A.Pinz,Eds.,ed:Springer Berlin Heidelberg,2006,pp.430-443」所用的方法。然而,本發明並不限定獲得角點的演算法。由圖3可看出,影像中有一個看板30,看板30上有多個角點CC,但並非影像中的所有角點CC都是對應於文字的邊角,例如圖3可見看板30之後的窗戶也具有多個角點CC,因此需要進一步判斷出那些角點CC是對應於文字的邊角部份,以劃分文字區塊ZS(如圖9C所示的文字區塊91、92、93、94、95、96、97、98)。
請同時參照圖4A、圖4B與圖2,圖4A是圖2的街景影像的其中一個角點的局部區域的示意圖,圖4B是圖4A的角點的局部區域的區域色彩分布的示意圖。區域性色彩分布計算單元133對街景影像IM進行色彩通道分離,並對每一角點所在的局部區域做區域色彩分布分析。將影像進行色彩通道分離可依據所使用通道的類型而有不同,例如為RGB、CMYK等,但本發明並不因此限定。街景影像IM可分解為多個通道,在本實施例中將街景影像IM分解為五個通道,所述五個通道分別為色相(Hue)通道、明度(Value)通道、紅(Red)通道、綠(Green)通道與藍(Blue)通道。如圖4A表示對於影像的紅(Red)通道中的字母t之筆畫結尾處的角點(其在街景影像中的座標例如為(X:385,Y:236))所在的局部區域RG1做區域色彩分布分析。以該角點為中心所得其周圍局部區域RG1的大小為可變參數,也就是局部區域RG1的大小是可調整,本發明並不限定局部區域的定義方式,例如為以角點為中心的NxN的方形區域,N為所選擇的畫素數量。區域色彩分布分析的結果以圖4B表示,橫軸表示灰階0-255,縱軸為數量,直方圖S1的每一個直條代表該灰階在局部區域RG1中所統計的數量。然後,再經由核密 度估計(Kernel density estimation)方式,獲得的曲線S2代表將直方圖S1平滑後的結果。
接著,色彩通道梯度峰值搜尋單元134可針對各個通道(例如本實施例的紅通道)的所述角點所在的局部區域RG1進行梯度峰值搜尋後,得到所述角點之區域色彩峰值特徵。進行梯度峰值搜尋時,搜尋目標可為最大與次大的峰值。如圖4B所示,利用核密度估計(Kernel density estimation)方式表現該局部區域內的梯度特性,獲得的曲線S2可見有兩個峰值P1、P2。換句話說,透過區域色彩分布分析至少可以找到兩個峰值,如圖4B所示至少可以得到兩個峰值P1、P2。在實際的應用情況例如是,當街景影像中的看板的文字與背景分別有兩種不同的顏色,所述兩個峰值P1、P2的其中之一則可以分別代表文字本身的主要灰階顏色或是背景的主要灰階顏色,但本發明並不限定峰值P1、P2各自對應於文字或是背景。在上述的實施例中,區域色彩峰值特徵以最大與次大的兩個峰值表示,但本發明並不因此限定。區域色彩峰值特徵也可以以多個峰值表示,其基於運算的成本、運算的準確度等因素做為取捨,峰值的數目選擇並不限於兩個。
請再參照圖5A與圖5B,圖5A的局部區域RG2是對應於影像中的字母g之筆畫結尾處(在街景影像中的座標例如為(X:284,Y:244))。同樣對於影像的紅(Red)通道,與圖4A、圖4B的原理相同,曲線S4代表將直方圖S3平滑後的結果。且此局部區域RG2的區域色彩峰值特徵具有兩個峰值P3、P4。可見,圖4B的峰值P1與圖5B的峰值P3彼此類似,圖4B的峰值P2與圖5B的峰值P4彼此類似,也就是說,這兩個局部區域RG1、RG2具有類似的色彩特徵。
接著,請再參照圖6A與圖6B,圖6A的局部區域RG3是對應於影像中的窗戶的一個角點。同樣對於影像的紅(Red)通道,與圖4A、圖4B的原理相同,曲線S6代表將直方圖S5平滑後的結 果。且此局部區域RG3的區域色彩峰值特徵具有兩個峰值P5、P6。可見,圖6B的峰值P5、P6與圖4B、圖5B的各個峰值所對應的色彩灰階都明顯不相同,也就是說,這局部區域RG3相較於局部區域RG1、RG2具有不同的色彩特徵。
依據上述,對應於影像所分解出的所有通道,所有的角點特徵都可對應於各自的區域色彩峰值特徵。
接著,峰值特徵分群單元135將所述角點之所述區域色彩峰值特徵進行分群。由於相同一組文字,例如同一個單字的不同字母、或同一個看板中的所有文字,應該會具有相同(或相近)的文字顏色,且背景色也應該是相同(或類似)的。也就是說具有相同(或類似)的文字顏色與相同(或類似)的文字背景的文字,應該會顯現類似的區域色彩峰值特徵,也就是這些文字的角點所對應局部區域的色彩峰值應該會類似。例如前面所述的圖4A的文字t的角點和圖5A的文字g的角點具有類似的區域色彩峰值特徵,可由圖4B與圖5B的比較可得知。換句話說,基於同一個單字的不同字母應該劃分為一個文字區塊,或者是同一個看板中的所有文字也應該被劃分為同一個文字區塊的目的,具有類似的色彩峰值的局部區域所對應的多個角點應該被劃分為同一群。基於這個概念,峰值特徵分群單元135將所述角點之所述區域色彩峰值特徵進行分群。詳細的說,請參照圖7,將區域色彩分布的雙峰值轉換成二維平面圖,作法為取第一峰值(如圖4B、圖5B、圖6B的區域色彩分布得由左至右數來的第一個峰值P1、P3、P5)之灰階為x座標,第二峰值(如圖4B、圖5B、圖6B的峰值P2、P4、P6)之灰階為y座標,得到圖7。也就是說,每一個角點所對應的局部區域都是對應於在圖7中的一個特徵點,此特徵點的座標是區域色彩分布的雙峰值。圖7的x-y座標的空間可稱之為特徵點空間,此多個特徵點的表示方式可稱為雙峰分布圖。簡單的說,本實施例是將所角點之區域色彩峰值特徵的最大與次大的峰值作為二維平面上複 數個特徵點的座標。
詳細的說,當將圖7中的各個群聚的點進行分群,以獲得複數個角點群,則分群的結果可以使每一群組對應於具有類似區域色彩分布的角點群。如圖8A所示,預設空間群聚條件例如是特徵點空間的範圍G1(以圖8A的中的一個圓形區域),例如是由範圍G1在特徵點空間中的大小、長、寬決定。在圖8A中是一個圓形的範圍,但本發明並不因此限定。將此群組的角點表示為被選定的群組,如圖8A將範圍G1以內的特徵點以紅色點表示,而對應於影像中的角點則也以紅色點表示,見圖8B。將圖8B與圖3比較可知,以紅色表示的角點就是影像中的看板30上的文字的角點。簡單的說,利用同一看板(或招牌)本身的區域色彩分布峰值相近的特性,我們可以藉由雙峰分布圖看出群聚特性,並利用其群聚特性,分離出位於看板(或招牌)上的角點。這些被歸類為同一群組的角點可以做為劃分文字區塊的基礎或依據,文字區塊基本上涵蓋所述被歸類為同一群組的角點,而文字區塊的大小則是可變的,基本上隨著角點的數量、密度或分布狀況而決定。例如,因文字表示方式的差異,不同大小的字體、不同塊看板上的字體都會造成不同的群組分類結果,且角點分布狀態也不相同,而據此所劃分出的文字區域也會對應不相同的大小與形狀。
在一實施例中,例如利用重力分群法,將特徵點空間的特徵點分群,圖9A為分群結果圖(同樣顏色為一群)。所述重力分群法是所屬領域的習知技術,在此不多贅述。淡藍色的角點群是對應於影像中的看板的文字區塊。其他的角點或角點群則不是看板的文字,在此實施例中不討論。對於淡藍色表示的角點群,最後將特徵點空間分群結果映射回原本座標空間(對應於原本的街景影像,圖9B)。特徵點空間分布分析單元136基於分群後的角點群依照預設空間群聚條件劃分出複數個文字區塊,例如利用座標空間的點密度特性,推估出文字位置,而產生複數個文字區塊,例如 圖9C的文字區塊91、92、93、94、95、96、97、98。而所述的預設空間群聚條件也可以是可調的參數,其可依據實際應用情況而決定。值得注意的是,本實施例的所得的文字區塊是同一個看板上的不同文字(不同大小、不同單字或不同位置的文字)的文字區塊。
基於上述,街景影像之文字區域偵測系統及裝置所獲得的文字區塊(如圖9C的文字區塊91、92、93、94、95、96、97、98),可作為文字辨識裝置的資料來源,相較於整張街景影像中複雜混亂的資訊,經過文字區域偵測裝置13所獲得的文字區塊可提供具有高辨識率的資訊來源。
在另一實施例中,圖10A的影像的例子,對應於兩種明顯不同的看板部分,看板101a為黃底,看板101b為綠底,而在此例中,圖10B顯示了特徵點空間中不同群的角點群,範圍102a對應於看板101a的角點群(以紅色點表示),範圍102b對應於看板101b的角點群(以黃色點表示)。範圍102a、102b可由空間群聚條件決定其範圍大小,藉此得到所涵蓋的特徵點所對應的角點群。對應於圖10A,則可明顯得到看板101a的文字的角點群與看板101b的文字的角點群,這兩個(或兩組)角點群。每一個角點群則可對應設置一個文字區塊。據此,本實施例揭示了,本發明的文字區域偵測裝置(或系統)可以得到對應於不同看板的多個文字區塊(本實施例以兩個看板各自的文字區塊為例)。
〔實施例的可能功效〕
綜上所述,本發明實施例所提供的街景影像之文字區域偵測系統及裝置,以角點特徵作為文字特徵,此舉可以克服傳統基於邊緣偵測的文字區塊偵測技術當中的光影瓶頸。藉此,影像多通道解析更可以加強適應光影變化,並且角點特徵本身不受文字大小的限制,運算速度亦為傳統紋理組織分析運算的數十倍之多。
以上所述僅為本發明之實施例,其並非用以侷限本發明之專 利範圍。
1‧‧‧街景影像之文字區域偵測系統
11‧‧‧攝影機
12‧‧‧視訊捕捉單元
IM‧‧‧街景影像
13‧‧‧文字區域偵測裝置
131‧‧‧影像讀取單元
132‧‧‧角點特徵運算單元
133‧‧‧區域性色彩分布計算單元
134‧‧‧色彩通道梯度峰值搜尋單元
135‧‧‧峰值特徵分群單元
136‧‧‧特徵點空間分布分析單元
ZS‧‧‧文字區塊

Claims (16)

  1. 一種街景影像之文字區域偵測系統,包括:一攝影機,紀錄一街景影像;一視訊捕捉單元,耦接該攝影機,擷取該攝影機記錄之該街景影像;以及一文字區域偵測裝置,包括;一影像讀取單元,接收一街景影像;一角點特徵運算單元,耦接該影像讀取單元,用以獲得該街景影像中的複數個角點的位置;一區域性色彩分布計算單元,耦接該角點特徵運算單元,對該街景影像進行色彩通道分離,並對每個該角點所在的一局部區域做區域色彩分布分析;一色彩通道梯度峰值搜尋單元,耦接該區域性色彩分布計算單元,針對各個通道的該些角點所在的該些局部區域進行梯度峰值搜尋後得到每個該角點之一區域色彩峰值特徵;一峰值特徵分群單元,耦接該色彩通道梯度峰值搜尋單元,將該些角點之該些區域色彩峰值特徵進行分群,以獲得複數個角點群;以及一特徵點空間分布分析單元,耦接該峰值特徵分群單元,基於分群後的該些角點群依照一預設空間群聚條件劃分出複數個文字區塊。
  2. 根據請求項第1項之街景影像之文字區域偵測系統,其中該角點特徵運算單元利用加速分段測試角點偵測法(FAST Corner Detection)獲得該街景影像中的該些角點的位置。
  3. 根據請求項第1項之街景影像之文字區域偵測系統,其中該區域性色彩分布計算單元對每個該角點所在的該局部區域做區域色彩分布分析時,該局部區域的大小為可變參數。
  4. 根據請求項第1項之街景影像之文字區域偵測系統,其中該色 彩通道梯度峰值搜尋單元將該街景影像分解為多個通道,並針對每個通道以及每個該角點所在的局部區域進行梯度峰值搜尋。
  5. 根據請求項第4項之街景影像之文字區域偵測系統,其中所述多個通道分別為色相(Hue)通道、明度(Value)通道、紅(Red)通道、綠(Green)通道與藍(Blue)通道。
  6. 根據請求項第4項之街景影像之文字區域偵測系統,其中該色彩通道梯度峰值搜尋單元針對每個通道以及每個該角點所在的該局部區域進行梯度峰值搜尋時,搜尋目標為最大與次大的峰值。
  7. 根據請求項第1項之街景影像之文字區域偵測系統,其中該色彩通道梯度峰值搜尋單元針對每個通道以及每個該角點所在的該局部區域進行梯度峰值搜尋時,以核密度估計(Kernel density estimation)表現該局部區域內的梯度特性。
  8. 根據請求項第6項之街景影像之文字區域偵測系統,其中該色彩通道梯度峰值搜尋單元針對每個通道以及每個該角點所在的該局部區域進行梯度峰值搜尋時,將每個該角點之該區域色彩峰值特徵的最大與次大的峰值作為二維平面上複數個特徵點的座標。
  9. 一種街景影像之文字區域偵測裝置,包括:一影像讀取單元,接收一街景影像;一角點特徵運算單元,耦接該影像讀取單元,用以獲得該街景影像中的複數個角點的位置;一區域性色彩分布計算單元,耦接該角點特徵運算單元,對該街景影像進行色彩通道分離,並對每個該角點所在的一局部區域做區域色彩分布分析;一色彩通道梯度峰值搜尋單元,耦接該區域性色彩分布計算單元,針對各個通道的該些角點所在的該些局部區域進行梯度峰值搜尋後得到每個該角點之一區域色彩峰值特徵; 一峰值特徵分群單元,耦接該色彩通道梯度峰值搜尋單元,將該些角點之該些區域色彩峰值特徵進行分群,以獲得複數個角點群;以及一特徵點空間分布分析單元,耦接該峰值特徵分群單元,基於分群後的該些角點群依照一預設空間群聚條件劃分出複數個文字區塊。
  10. 根據請求項第9項之街景影像之文字區域偵測裝置,其中該角點特徵運算單元利用加速分段測試角點偵測法(FAST Corner Detection)獲得該街景影像中的該些角點的位置。
  11. 根據請求項第9項之街景影像之文字區域偵測裝置,其中該區域性色彩分布計算單元對每個該角點所在的該局部區域做區域色彩分布分析時,該局部區域的大小為可變參數。
  12. 根據請求項第9項之街景影像之文字區域偵測裝置,其中該色彩通道梯度峰值搜尋單元將該街景影像分解為多個通道,並針對每個通道以及每個該角點所在的局部區域進行梯度峰值搜尋。
  13. 根據請求項第12項之街景影像之文字區域偵測裝置,其中所述多個通道分別為色相(Hue)通道、明度(Value)通道、紅(Red)通道、綠(Green)通道與藍(Blue)通道。
  14. 根據請求項第12項之街景影像之文字區域偵測裝置,其中該色彩通道梯度峰值搜尋單元針對每個通道以及每個該角點所在的該局部區域進行梯度峰值搜尋時,搜尋目標為最大與次大的峰值。
  15. 根據請求項第9項之街景影像之文字區域偵測裝置,其中該色彩通道梯度峰值搜尋單元針對每個通道以及每個該角點所在的該局部區域進行梯度峰值搜尋時,以核密度估計(Kernel density estimation)表現該局部區域內的梯度特性。
  16. 根據請求項第14項之街景影像之文字區域偵測裝置,其中該色彩通道梯度峰值搜尋單元針對每個通道以及每個該角點所在的該局部區域進行梯度峰值搜尋時,將每個該角點之該區域色彩峰 值特徵的最大與次大的峰值作為二維平面上複數個特徵點的座標。
TW104119547A 2015-06-17 2015-06-17 街景影像之文字區域偵測系統及裝置 TWI536280B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW104119547A TWI536280B (zh) 2015-06-17 2015-06-17 街景影像之文字區域偵測系統及裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104119547A TWI536280B (zh) 2015-06-17 2015-06-17 街景影像之文字區域偵測系統及裝置

Publications (2)

Publication Number Publication Date
TWI536280B TWI536280B (zh) 2016-06-01
TW201701190A true TW201701190A (zh) 2017-01-01

Family

ID=56755779

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104119547A TWI536280B (zh) 2015-06-17 2015-06-17 街景影像之文字區域偵測系統及裝置

Country Status (1)

Country Link
TW (1) TWI536280B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472092A (zh) * 2019-07-15 2019-11-19 清华大学 一种街景图片的地理定位方法及系统
TWI764489B (zh) * 2020-12-30 2022-05-11 鴻海精密工業股份有限公司 人行通道環境評估方法、裝置及電子設備

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI814483B (zh) * 2022-07-12 2023-09-01 中國鋼鐵股份有限公司 金屬胚辨識系統與方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472092A (zh) * 2019-07-15 2019-11-19 清华大学 一种街景图片的地理定位方法及系统
CN110472092B (zh) * 2019-07-15 2021-11-16 清华大学 一种街景图片的地理定位方法及系统
TWI764489B (zh) * 2020-12-30 2022-05-11 鴻海精密工業股份有限公司 人行通道環境評估方法、裝置及電子設備

Also Published As

Publication number Publication date
TWI536280B (zh) 2016-06-01

Similar Documents

Publication Publication Date Title
KR102596897B1 (ko) 모션벡터 및 특징벡터 기반 위조 얼굴 검출 방법 및 장치
US9710109B2 (en) Image processing device and image processing method
CN104517102B (zh) 学生课堂注意力检测方法及系统
US9984286B2 (en) Method and apparatus for detecting persons, and non-transitory computer-readable recording medium
CN103996052B (zh) 基于三维点云的三维人脸性别分类方法
WO2019061658A1 (zh) 眼镜定位方法、装置及存储介质
CN102426649A (zh) 一种简单的高准确率的钢印数字自动识别方法
EP3563345B1 (en) Automatic detection, counting, and measurement of lumber boards using a handheld device
US20180253852A1 (en) Method and device for locating image edge in natural background
US11017260B2 (en) Text region positioning method and device, and computer readable storage medium
CN111160291B (zh) 基于深度信息与cnn的人眼检测方法
US20170249503A1 (en) Method for processing image with depth information and computer program product thereof
US11216905B2 (en) Automatic detection, counting, and measurement of lumber boards using a handheld device
TWI536280B (zh) 街景影像之文字區域偵測系統及裝置
CN110619336B (zh) 基于图像处理的货品识别算法
JP5027201B2 (ja) テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム
Mukhiddinov Scene text detection and localization using fully convolutional network
CN111435429A (zh) 一种基于双目立体数据动态认知的手势识别方法及系统
CN106446832B (zh) 一种基于视频的实时检测行人的方法
Tan et al. Gesture segmentation based on YCb'Cr'color space ellipse fitting skin color modeling
CN108230409B (zh) 基于颜色和内容多因素综合的图像相似性定量分析方法
US10140509B2 (en) Information processing for detection and distance calculation of a specific object in captured images
KR101484003B1 (ko) 얼굴 분석 평가 시스템
CN113840135B (zh) 色偏检测方法、装置、设备及存储介质
Boggavarapu et al. A robust multi color lane marking detection approach for Indian scenario

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees