TWI396139B - 使用改良式張量投票演算法的中文字骨架萃取方法 - Google Patents

使用改良式張量投票演算法的中文字骨架萃取方法 Download PDF

Info

Publication number
TWI396139B
TWI396139B TW98109721A TW98109721A TWI396139B TW I396139 B TWI396139 B TW I396139B TW 98109721 A TW98109721 A TW 98109721A TW 98109721 A TW98109721 A TW 98109721A TW I396139 B TWI396139 B TW I396139B
Authority
TW
Taiwan
Prior art keywords
point
tensor
pixel
skeleton
voting
Prior art date
Application number
TW98109721A
Other languages
English (en)
Other versions
TW201035878A (en
Inventor
Jiunn Lin Wu
shu ming Lin
Original Assignee
Nat Univ Chung Hsing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nat Univ Chung Hsing filed Critical Nat Univ Chung Hsing
Priority to TW98109721A priority Critical patent/TWI396139B/zh
Publication of TW201035878A publication Critical patent/TW201035878A/zh
Application granted granted Critical
Publication of TWI396139B publication Critical patent/TWI396139B/zh

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

使用改良式張量投票演算法的中文字骨架萃取方法
本發明是一種中文字骨架萃取方法,尤其是關於一種使用改良式張量投票演算法的中文字骨架萃取方法。
在數位化的今天,常遇到要將紙本資料建置為電腦檔案的情況,對於文字資料而言,通常我們不僅僅是希望把它轉成影像檔存入電腦,而是如果能轉成以ASCII或Unicode等編碼法編成的文字檔是最佳的,因為轉成文字檔後,不論是要做資料檢索、查詢、修改或其他的文字處理工作,皆可方便快速地藉由電腦中的文字編輯器來完成;除此之外,文字檔所需儲存空間要比影像檔小得多,以文字檔的形式儲存可大幅節省儲存空間。在計算機科學中,光學字元識別(OCR)即為一門研究如何從掃描器所獲取影像裡識別出文字,以方便存成文字檔的學問。
中文字的字元多、結構複雜以及相似的字多,這讓中文字的識別相較於其他文字困難許多。對於線上的中文手寫識別來說,其技術發展已相當成熟,識別率也相當令人滿意。然而,離線的光學中文字元識別(OCCR)則仍有待學者繼續發展相關技術。離線中文字元識別由於缺乏決定單一筆劃的下筆及提筆位置與筆劃書寫順序等動態資訊,導致離線字元識別相較於線上字元識別困難許多。同時,掃描的影像可能包含雜訊,或已經受到旋轉、位移、扭曲等幾何破壞,線上字元識別則幾乎沒有這方面的問題。
離線的中文字識別系統通常由三部份組成:預處理、筆劃萃取與識別。預處理對輸入影像做去雜訊與骨架化,而細化(thinning)是傳統最常用的骨架化方法。然而,細化所產生的骨架有幾個缺點:假分枝、一個交叉點分成兩個交叉點以及交叉點附近的失真。這會讓後續的筆劃萃取結果不可靠,並導致錯誤的識別結果。為了解決細化所造成的失真問題,很多的方法已被提出;然而,這些方法在避免細化的失真問題的同時,常常會產生其他類型的失真,例如筆劃段的遺失、筆劃弧線資訊的遺失與筆劃結構的錯誤等等,而這些問題都是原本細化所沒有的,另外,這些方法常常只對某幾種特定的字型才有較佳的骨架萃取結果,或是對輸入文字影像的筆劃寬度、筆劃書寫角度有所限制。
為了解決細化所造成的失真及對輸入文字的字型之使用限制,本發明以一改良式張量投票演算法以進行中文字骨架化之方法,達到取出中文字之骨架時避免失真及解除字型使用限制之目的。
配合前述之技術問題及發明目的,本發明提供一種使用改良式張量投票演算法的中文字骨架萃取方法,其步驟包含讀取一二元影像以及執行一改良式張量投票演算法,其中:
該二元影像包含複數個像素,該複數個像素包含複數個前景色像素及複數個背景色像素,各前景色像素點組成一中文字;以及
該改良式張量投票演算法之步驟包含:
張量表示:指派初始的張量值給該二元影像的每一前景色像素;
使用新的球投票場做稀疏投票:以一新的球投票場對該二元影像之每一前景色像素進行一稀疏投票,該二元影像之每一像素點之張量之二特徵值λ1 、λ2 ()由一可信度衰減函數F決定,其中:
λ1 =F ,λ2 =α×λ1 ,0<α<1;
,其中:
AB 為常數;
I為一圓心像素點O 與一像素點P間的距離;
σ為張量投票演算法之一投票範圍參數;
P點的一切線方向的單位特徵向量
P點的一法線方向的單位特徵向量
P點的張量T P 為:
張量分解:對該二元影像中每一像素點之張量進行特徵分解,而產生一球可信度結果;以及
使用球可信度結果做曲線萃取:以該球可信度結果,經公式:對該二元影像中的每一像素點之一曲線點判斷而形成一文字骨架,其中:curr_sal 代表處理中像素點的可信度值;nb1_sal 代表該像素點之其中一個法線方向鄰居點的可信度值;及nb2_sal 代表該像素點之另一個法線方向鄰居點的可信度值。
其中,該使用改良式張量投票演算法的中文字骨架萃取方法,於完成執行該改良式張量投票演算法之後,執行一移除雜點步驟以及一修補中斷骨架步驟,其中,該修補中斷骨架係對該文字骨架之一中斷點之一切線方向前進直至連接該文字骨架之其他之骨架點為止,並且於沿著該切線方向前進時已超出該二元影像之該中文字範圍而未能與其他之骨架點連接時,則停止前進。
本發明提出一新的中文字骨架萃取方法,其利用改良式張量投票法做文字主要骨架的萃取,接著,進行精細的改進把雜點移除並連接中斷的骨架。本發明可有效避免細化所產生的交叉點失真與假分枝,同時能保留原本細化的優點,不會有其他額外的人工失真或副作用產生,並且可適用於多種字型,包括手寫與機器列印文字。
為了說明本發明所提之一改良式張量投票演算法,先說明一般張量投票演算法(Tensor Voting algorithm)(C.K.Tang,“Tensor voting in computer vision,visualization,and higher dimensional inferences,”Ph.D. Thesis,University of Southern California,2000.;G. Guy,“Inference of multiple curves and surfaces from sparse data,”Ph.D. Thesis,University of Southern California,1995;G. Medioni,M.S. Lee,and C.K. Tang,A Computational Framework for Segmentation and Grouping. Elsevier,New York,2000;L. Lam,S.W. Lee,and C.Y. Suen,"Thinning Methodologies-A Comprehensive Survey,"IEEE Transactions on Pattern Analysis and Machine Intelligence ,Vol. 14(9),September 1992,pp 879;P. Mordohai,“A perceptual organization approach for figure Completion,binocular and multiple-view stereo and machine learning using tensor voting,”Ph.D. Thesis,University of Southern California,2005),其包含五個主要步驟(1)~(5):
(1).張量表示 :指派初始的張量值給輸入的二元影像(e.g.黑白影像)的前景色像素,舉例來說,若輸入的二元影像為白底黑字,則指派初始的張量值給每一個黑色像素(即該前景色像素),其中,形成白底之各像素則稱為背景色像素點。一般情況下初始的張量值皆設為單位矩陣I,因為像素點的方向資訊剛開始是未知的。
(2).利用球投票場做稀疏投票 :每一個前景色像素利用一球投票場來投出張量票給該前景色像素鄰近之前景色鄰居點;其中,各前景色鄰居點接受張量票的動作係經由張量相加來完成。此步驟可推估出每一個前景色像素點最有可能的方向為何。
(3).利用棒投票場做稠密投票 :經過步驟(2)所推得之每一個前景色像素點最有可能的方向後,再利用一棒投票場(stick voting field)將每一個前景色像素點的方向資訊傳送給它的附近前景色像素點與背景色像素點。此步驟可推算出該二元影像中每一個像素點最有可能的方向為何。
(4).張量分解 :對二元影像中每一個像素點之張量M 作特徵分解,如式(1):
其中:
λ i M 的特徵值,以遞減順序排列,即
為λ i 的對應特徵向量。因為張量是非負定矩陣,故所有的特徵值皆非負。
其所代表的幾何意義為:
為該像素點的法線方向的單位特徵向量;
為該像素點的切線方向的單位特徵向量;及
λ12 是棒可信度值,表示該像素點為曲線上的點的可能性大小;
集合即代表該像素點的曲線相關資訊,於此,令一參數S 為整張二元影像的一曲線相關資訊(即集合);及
λ2 是球可信度值,代表該像素點是否為一交叉點的可能性大小,於此,令一參數J 為整張二元影像的球可信度值(即λ2 )。
(5).特徵萃取 :對參數S 做一曲線萃取演算法以得到該二元影像中的一曲線特徵,找出參數J 中值大的點以得到影像中的交叉點特徵。
由於前述既有之張量投票演算法不全然適用於中文字之骨架萃取,本發明提出一改良式張量投票演算法說明如後列。
請參考第一圖,其為本發明之流程圖,其中,在輸入二元影像(40)步驟之後,即執行改良式張量投票演算法(50)而對該二元影像中的前景色像素所組成的中文字,進行骨架萃取,之後,執行一改進修補方法(60),讓萃取後的文字骨架更為精確。其中,該改良式張量投票演算法(50)之步驟包含:張量表示(51)、使用新的球投票場做稀疏投票(52)、張量分解(53)、產生球可信度結果(54)、使用球可信度結果做曲線萃取(55)及輸出曲線(56)。
其中,所提改良式張量投票演算法與既有之張量投票演算法(以下簡稱:原方法)之各步驟中,步驟(51)、(53)與原方法相同,而步驟(52)則提出新的演算方式,步驟(54)~(56)則依據原方法的架構下,配合步驟(52)所提的演算方式而做適應性修改,其中,本發明所提之改良式張量投票演算法(50)與原方法有三個主要不同點:
(i)原方法包含兩次的投票步驟,依序為稀疏投票(使用球投票場)與稠密投票(使用棒投票場);而改良式方法則只有一次的投票,為稀疏投票(使用球投票場)。
(ii)改良式方法與原方法產生球投票場的方式不同,得到的球投票場也不同;改良式方法所產生的球投票場較精確理想。
(iii)改良式方法使用球可信度或較大的特徵值做曲線萃取,原方法使用棒可信度做曲線萃取。
該改良式張量投票演算法(50)僅使用棒投票場的投票,目的主要是加強棒可信度(棒可信度為張量的較大特徵值減較小特徵值所得到的差);如第二a、b圖所示,棒可信度值之高點(11)的地方會出現在前景色像素之周圍邊界,而球可信度值之高點(12)的地方則出現在前景色像素之內部中心區域。由於本發明之目的是要找出前景色像素所組成的文字的骨架中心線,因此只做球投票場的投票。
請參考第三圖,其為該球投票場之張量示意圖,圖中之每一組垂直交叉線代表一個張量,較長的線為較大特徵值對應到的特徵向量,代表的是法線方向之單位特徵向量;較短的線為較小特徵值對應到的特徵向量,代表的是切線方向之單位特徵向量。
傳統產生球投票場的方法是把棒投票場旋轉一圈,並每個位置累加其所收到的張量票即得,這種方式所產生的球投票場會有誤差。舉例來說,觀察通過球投票場中心的水平線,下面是傳統之原方法所得到的切線角度結果:
1° 4° 6°中心6° 4° 1°
但是,在相同位置之理想的切線角度應該是:
0° 0° 0°中心0° 0° 0°
因此,除了方向會有誤差外,離中心距離相同的張量其可信度值也不一致,例如,若假設中心座標為(0,0),則位置(1,2)的張量的一較大特徵值可能為0.4618,位置(2,1)的張量的一較大特徵值可能為0.4620,其二者並不相同;而理想的球投票場,離中心距離相同的張量其可信度值應該是一致的。
因此,依據理想的球投票場特性,以下說明本發明採用之使用新的球投票場做稀疏投票(52)步驟:
定義一可信度衰減函數F
配合參考第四圖,其中AB 為兩常數,I 為圓心O 與像素點P 間的距離,σ為原方法之一投票範圍參數。每一像素點之張量的兩個特徵值即由所定義之可信度衰減函數F 決定:
λ1 =F ,λ2 =α×λ1 ,0<α<1。
由實驗得知本較佳實施例採用之常數A、B之建議值分別0.7及1.3;α為0.99。P 點的切線方向的單位特徵向量,法線方向的單位特徵向量,可得P 點的張量T P 為:
依據前述的方式產生的球投票場就是理想的了。由於原方法產生的球投票場有誤差,經實驗結果顯示,所萃取出的骨架線有時會偏離其應該所在的中心位置,可能導致萃取的骨架線有中斷的情況。而由所提之改良式張量投票演算法(50)產生的球投票場的實驗結果,顯示可大量減少中斷狀況而得到較佳的萃取結果。
另外,本發明所提之方法較容易實作且計算量相對較少。下表1列出原方法與改良式張量投票演算法(50)產生球投票場所需時間的比較,其中t ori 為原方法所需時間,t new 為改良式張量投票演算法(50)所需時間,表1中之時間單位為奈秒(nanosecond)。由於原方法需先產生棒投票場,才能藉由旋轉、累加棒投票場的張量值而得到球投票場,因此,本發明所提之的原方法的時間並沒有包括產生棒投票場的時間,節省了許多的處理時間。由表一可看出改良式張量投票演算法(50)的確大幅加快了產生球投票場的速度。
原方法在做曲線萃取演算法時,是判斷目前的點(處理中的點)與其法線方向之鄰居點相比,目前點的可信度值是否滿足一零交點(zero-crossing);若以一curr_sal 代表目前點的可信度值,nb1_sal 代表其中一個法線方向鄰居點的可信度值,nb2_sal 代表另一個法線方向鄰居點的可信度值,則如果下列式(4)成立者,目前這個點就是曲線點,反之就不是曲線點:
curr_sal >nb1_salcurr_sal >nb2_sal  (4)
請參考第五a~b圖,其為本發明所提的改良式張量投票演算法依據前述式(4)判斷後之實測試驗結果比較,其中,第五b圖為第五a圖之中文字「測」在使用所提方法投票完後,利用球可信度值與式(4)做曲線萃取的結果,其可明顯發現中文字「測」最右邊的兩個筆劃沒有被萃取出來。而經過觀察筆劃遺失處的球可信度值,如第五c圖的箭頭標示區域,發現有兩排像素點的球可信度值皆相同(如前述之說明,擷取鄰近區域之具有相對最大值之像素者),如下表2的「*」標示欄位內。
前述的問題,式(4)裡只有一個不等式會成立,另一個不等式不成立,致使該區域之前景像素點的部份筆劃無法被萃取出來。但若將式(4)中的大於(>)符號全都改成大於等於「」,則在剛才遺失筆劃的地方,會萃取出具有2個像素寬的骨架線。因此,若欲萃取具有1個像素寬度的骨架線,可將式(4)其中一個「>」符號改成「」即可,第五d圖圖即為將式(4)中其中之一的大於符號改為大於等於符號之後的萃取結果。
為了更進一步消除本發明所提之改良式張量投票演算法之中文字骨架萃取過程可能產生的雜點,本發明之使用改良式張量投票演算法的中文字骨架萃取方法於完成執行改良式張量投票演算法(50)步驟之後,可再進行該改進修補方法(60),該改進修補方法(60)之步驟包含移除雜點(61)及修補中斷骨架(62),以下分述兩個步驟之執行內容:
(61)移除雜點 :第六圖為在改良式張量投票演算法處理後之二元影像可能產生的五種形式之雜點(13a~e),本步驟係將該些形式的雜點予以移除,其移除方式可以利用比較判斷的方式篩選該些形式的雜點像素後予以刪除而變成背景像素點。第六圖中灰色點(標示:G)表示不需檢查之像素點的顏色是黑或白。
(62)修補中斷骨架 :係把原本應連接但卻產生中斷的骨架線連起來,其步驟包含:
A.找出第七圖所列的八種型一候選中斷點(15a~h),這些點有可能是骨架線中斷(第七圖中之黑色像素)的地方,但還需做進一步檢驗,檢驗方法為:
(A1).張量的單位特徵向量所指的方向為切線方向,沿著此候選中斷點的切線方向前進,直到與其它的骨架點連接為止,如第八a~c圖及第九a~c圖即為兩個骨架連接範例。
(A2).若步驟(A1)在前進時,超出了原輸入之二元影像之文字範圍(碰到了原輸入之二元影像中的背景像素區而非組成文字之前景像素區),但仍未與其它的骨架點連接,則此候選中斷點並不是真正骨架中斷的地方,略過此點不對它做處理,如第十a~d圖即為一例。
B.找出如第十一圖所列的八種型二候選中斷點(16a~h),這些點有可能是骨架線中斷(第八圖中之黑色像素)的地方,但還需做進一步檢驗,檢驗方法與A.中的方法相同。
更進一步說明上述的修補中斷骨架(62)步驟,其中,第七圖所示之八種型一候選中斷點(15a~h),黑色(深色)點是該型一候選中斷點(15a~h)之八種鄰居點,其他內有標示文字(NE、N、E、SE)之各點代表各種不同切線方位所要前進的點的位置,其中:水平方向(-)為E(東),垂直方向(∣)為N(北),45°方向(/)為NE(東北),135°方向(\)為SE(東南)。
第八a~c圖則是該候選中斷點進行連接的第一個例子。其中,第八a圖是尚未進行連接的原圖,該標示箭頭點是候選中斷點(於此一範例為15d之狀況),黑色(深色)點是其他的骨架點,已知該的切線方位是東。第八b圖是第一次前進的結果,M1點(是前進的點。前進之後,檢查此點是否已跟其他的骨架點連接在一起了,於此,即檢查此點右方(右上、右、右下)的三鄰居(C1,C2,C3)是否至少有一個為骨架點,由於都不是骨架點,因此繼續前進。第八c圖為第二次前進的結果,新增加的M2點是所前進的點,同樣在前進之後檢查此點是否已跟其他的骨架點連接,由於已連接到其他骨架點,連接程序結束。
第九a~c圖是候選中斷點進行連接的第二個例子。第九a圖為尚未進行連接的原圖,箭頭標示之點是候選中斷點,黑色點是其他的骨架點,已知箭頭標示點的切線方位是東北。第九b圖是第一次前進的結果,M11點是前進的點。前進之後,檢查此點是否已跟其他的骨架點連接在一起了,於此,即檢查此點右方與上方的五鄰居(C11~C15)是否至少有一個為骨架點,由於都不是骨架點,因此繼續前進。第九c圖是第二次前進的結果,新增加的M12點是所前進的點,同樣在前進之後檢查此點是否已跟其他的骨架點連接,由於已連接到其他骨架點,連接程序結束。
第十a~d圖則舉例說明沒有做連接的情況,即候選中斷點不是位在真正骨架中斷處,而只是筆劃的端點的狀況。第十a圖是尚未進行連接測試的原圖,(圖中箭頭標示點)是候選中斷點,黑色點是其他的骨架點,複數個灰色點(20)是原輸入的二元影像的粗筆劃(即前景像素區),已知箭頭標示點的切線方位是東南。第十b圖為第一次前進的結果,M21點是前進的點,此點仍在原始輸入影像的粗筆劃範圍內。接著檢查此點是否已跟其他的骨架點連在一起,於本例中,即檢查此點右方與下方的五鄰居(C21~C25)是否至少有一個為骨架點,由於都不是骨架點,因此繼續前進。第十c圖是第二次前進的結果,新增加的M22點是所前進的點,此點已超出了粗筆劃範圍(即該複數個灰色點(20)範圍),因此這個候選中斷點並不是真正骨架中斷的地方,維持影像為原第十a圖而不做更動,即第十d圖所示。
為了證實本發明所提的使用改良式張量投票演算法的中文字骨架萃取方法確實具有良好的骨架化萃取性能,請參考第十二~十五圖之比較實驗結果,以下分別說明之。
請比較第十二圖之(a)~(C)欄,其分別為原始文字、本發明之骨架化後之結果及一細化處理方法(C.K. Tang,“Tensor voting in computer vision,visualization,and higher dimensional inferences,”Ph.D. Thesis,University of Southern California,2000)之結果,其中,細化之主要的缺點是他在某些筆劃的地方會產生較嚴重的假分岔(e.g.「測」最左邊的圈、「字」圈起來的地方、「像」圈起來的地方、「處」最中間的圈、「理」圈起來的地方),且也會在一些原本沒有轉折的地方會產生錯誤的轉折(e.g.「處」最下面的圈);而且,細化會遺失一些小但是重要的筆劃特徵(e.g.「處」最上面的圈);細化在一些筆劃交叉點的地方會產生較顯著的失真(「測」最右邊的兩個圈)。
請比較第十三圖之(a)~(c)欄,其分別為原始文字、本發明之骨架化後之結果及Wang等人(Y.M. Su and J.F. Wang,“A ovel stroke extraction method for Chinese characters using Gabor filters,”Pattern Recognition ,Vol. 36,2003,pp 635-647.)提出之方法的實驗結果。可明顯分辨,Wang等人的方法主要的缺點在於所產生的筆劃只有某幾種特定的方向,也就是所萃取出的文字骨架是由某幾個固定方向的筆劃段組合而成的,因此,這方法在筆劃本身是平滑弧線時,其萃取結果會有失真的現象,除了遺失筆劃原本的弧線資訊外,比較大的問題是他會讓原本沒有轉折點的筆劃變成有轉折點,如圖中中欄(c)之「独」與「代」圈起來的地方即為此情況;另外,Wang的方法有時會遺失某些筆劃段(如「毒」與「庭」圈起來的地方),或是產生錯誤結構的筆劃(如「築」圈起來的地方)。
請比較第十四圖之(a)~(c)欄,其分別為原始文字、本發明之骨架化後之結果及Fan等人(K.C. Fan and W.H. Wu,“A run-length-coding-based method to stroke extraction of Chinese characters,”Pattern Recognition ,Vol. 33,2000,pp 1881-1895.)所提的方法處理後的實驗結果,其中Fan等人的方法主要的缺點是在某些筆劃交叉點的地方做得不是很好(e.g.「樹」、「然」圈起來的地方);另外,他的方法在某些筆劃轉折處也有較嚴重的假分岔(e.g.「優」圈起來的地方);Fan等人的方法會遺失某些的筆劃段,而這些筆劃段在識別文字時是特徵之一(e.g.「鴉」圈起來的地方,「皴」圈起來的地方)。
請比較第十五圖之(a)~(c)欄,其分別為原始文字、本發明之骨架化後之結果及Lin等人(J.R. Lin and C.F. Chen ,“Stroke extraction for Chinese characters using a trend-followed transcribing technique,”Pattern Recognition ,Vol. 29(11),1996,pp 1789-1805)的方法處理後的結果。Lin等人的方法主要的缺點是在某些筆劃交叉點的地方仍有較明顯的失真(所有圈起來的地方),另外,Lin等人的方法產生的筆劃較不平順。
(11)...棒可信度值之高點
(12)...球可信度值之高點
(13a~e)...雜點
(15a~h)...型一候選中斷點
(16a~h)...型二候選中斷點
(20)...灰色點
第一圖為本發明之流程圖。
第二a、b圖為一棒可信度值及一球可信度值較高的像素示意。
第三圖為一球投票場之張量示意圖。
第四圖為一可信度衰減函數之參數關係示意圖。
第五a-d圖為本發明實施前後之比較結果示意圖。
第六圖為五種可能的雜點形式示意圖。
第七圖為一骨架線中斷之八種型一候選中斷點示意圖。
第八a-c圖為一中斷骨架線之連接判斷示意圖。
第九a-c圖為另一中斷骨架線之連接判斷示意圖。
第十a-d圖為一非中斷骨架線之未連接判斷示意圖。
第十一圖為一骨架線中斷之八種型二候選中斷點示意圖。
第十二~十五圖為本發明之骨架化執行結果與各種其他骨架化方法之比較結果圖。

Claims (2)

  1. 一種使用改良式張量投票演算法的中文字骨架萃取方法,其步驟包含讀取一二元影像以及執行一改良式張量投票演算法,其中:該二元影像包含複數個像素,該複數個像素包含複數個前景色像素及複數個背景色像素,各前景色像素點組成一中文字;以及該改良式張量投票演算法之步驟包含:張量表示:指派初始的張量值給該二元影像的每一前景色像素;使用新的球投票場做稀疏投票:以一新的球投票場對該二元影像之每一前景色像素進行一稀疏投票,該二元影像之每一像素點之張量之二特徵值λ1 、λ2 ()由一可信度衰減函數F決定,其中:λ1 =F ,λ2 =α×λ1 ,0<α<1;,其中:AB 為常數;I為一圓心像素點O 與一像素點 P間的距離;σ為張量投票演算法之一投票範圍參數;P點的一切線方向的單位特徵向量;P點的一法線方向的單位特徵向量;P點的張量T P 為: 張量分解:對該二元影像中每一像素點之張量進行特徵分解,而產生一球可信度結果;以及使用球可信度結果做曲線萃取:以該球可信度結果,經公式:curr_sal nb1_salcurr_sal nb2_sal 對該二元影像中的每一像素點之一曲線點判斷而形成一文字骨架,其中:curr_sal 代表處理中像素點的可信度值;nb1_sal 代表該像素點之其中一個法線方向鄰居點的可信度值;及nb2_sal 代表該像素點之另一個法線方向鄰居點的可信度值。
  2. 如申請專利範圍第1項所述之使用改良式張量投票演算法的中文字骨架萃取方法,於完成執行該改良式張量投票演算法之後,執行一移除雜點步驟以及一修補中斷骨架步驟,其中,該修補中斷骨架係對該文字骨架之一中斷點之一切線方向前進直至連接該文字骨架之其他之骨架點為止,並且於沿著該切線方向前進時已超出該二元影像之該中文字範圍而未能與其他之骨架點連接時,則停止前進。
TW98109721A 2009-03-25 2009-03-25 使用改良式張量投票演算法的中文字骨架萃取方法 TWI396139B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW98109721A TWI396139B (zh) 2009-03-25 2009-03-25 使用改良式張量投票演算法的中文字骨架萃取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW98109721A TWI396139B (zh) 2009-03-25 2009-03-25 使用改良式張量投票演算法的中文字骨架萃取方法

Publications (2)

Publication Number Publication Date
TW201035878A TW201035878A (en) 2010-10-01
TWI396139B true TWI396139B (zh) 2013-05-11

Family

ID=44856029

Family Applications (1)

Application Number Title Priority Date Filing Date
TW98109721A TWI396139B (zh) 2009-03-25 2009-03-25 使用改良式張量投票演算法的中文字骨架萃取方法

Country Status (1)

Country Link
TW (1) TWI396139B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5933525A (en) * 1996-04-10 1999-08-03 Bbn Corporation Language-independent and segmentation-free optical character recognition system and method
TW434493B (en) * 1998-02-23 2001-05-16 Dynalab Inc Stroke-based glyph-outline font generation in low/high resolution space
TW200717363A (en) * 2005-10-27 2007-05-01 Dynacomware Taiwan Inc Silhouette oriented gray font generation
US20090060307A1 (en) * 2007-08-27 2009-03-05 Siemens Medical Solutions Usa, Inc. Tensor Voting System and Method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5933525A (en) * 1996-04-10 1999-08-03 Bbn Corporation Language-independent and segmentation-free optical character recognition system and method
TW434493B (en) * 1998-02-23 2001-05-16 Dynalab Inc Stroke-based glyph-outline font generation in low/high resolution space
TW200717363A (en) * 2005-10-27 2007-05-01 Dynacomware Taiwan Inc Silhouette oriented gray font generation
US20090060307A1 (en) * 2007-08-27 2009-03-05 Siemens Medical Solutions Usa, Inc. Tensor Voting System and Method

Also Published As

Publication number Publication date
TW201035878A (en) 2010-10-01

Similar Documents

Publication Publication Date Title
He et al. Beyond OCR: Multi-faceted understanding of handwritten document characteristics
CN101561866B (zh) 基于sift特征与灰度差值直方图特征的文字识别方法
TW201732651A (zh) 一種單詞的分割方法和裝置
CN111582294A (zh) 一种构建用于表面缺陷检测的卷积神经网络模型的方法及其利用
CN112712273B (zh) 一种基于骨架相似度的手写体汉字美观度评判方法
CN113516619B (zh) 一种基于图像处理技术的产品表面瑕疵识别方法
CN111965197A (zh) 一种基于多特征融合的缺陷分类方法
Ayesh et al. A robust line segmentation algorithm for Arabic printed text with diacritics
CN111241897B (zh) 通过推断视觉关系的工业检验单数字化的系统和实现方法
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
CN105069766B (zh) 一种基于汉字图像轮廓特征描述的碑文修复方法
Raj et al. Grantha script recognition from ancient palm leaves using histogram of orientation shape context
Bhuvaneswari et al. An efficient positional algorithm for recognition of ancient stone inscription characters
Ladwani et al. Novel approach to segmentation of handwritten Devnagari word
Zidouri et al. Adaptive dissection based subword segmentation of printed Arabic text
CN112200789A (zh) 一种图像识别的方法及装置、电子设备和存储介质
Al-shatnawi et al. The Thinning Problem in Arabic Text Recognition-A Comprehensive Review
TWI396139B (zh) 使用改良式張量投票演算法的中文字骨架萃取方法
Deshmukh et al. Analysis of directional features-stroke and contour for handwritten character recognition
Qi et al. Deeperase: Weakly supervised ink artifact removal in document text images
Dhandra et al. On Separation of English Numerals from Multilingual Document Images.
Fang et al. Raw material form recognition based on Tesseract-OCR
Bisht et al. Handwritten Devanagari Word Detection and Localization using Morphological Image Processing
Aravinda et al. South Indian character recognition using statistical feature extraction and distance classifier
CN113434491B (zh) 面向深度学习ocr识别的字模数据清洗方法、系统及介质

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees