TW402711B - Character recognizing device - Google Patents

Character recognizing device Download PDF

Info

Publication number
TW402711B
TW402711B TW087114223A TW87114223A TW402711B TW 402711 B TW402711 B TW 402711B TW 087114223 A TW087114223 A TW 087114223A TW 87114223 A TW87114223 A TW 87114223A TW 402711 B TW402711 B TW 402711B
Authority
TW
Taiwan
Prior art keywords
pattern
dictionary
text
distance
input
Prior art date
Application number
TW087114223A
Other languages
English (en)
Inventor
Toshimi Yokota
Soshino Kuzunuki
Masaki Miura
Keiko Gunji
Koyo Katsura
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Application granted granted Critical
Publication of TW402711B publication Critical patent/TW402711B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/373Matching; Classification using a special pattern or subpattern alphabet

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

部屮"七^^^消贽合竹^印4-^· ^02711 b7 __ 五、發明説明(1 ) ...... ... .. . .... 技術領域 本發明係關於聯機(ON-L INE)認識書寫文字 之手寫文字認識裝置》 背景技術 在特開平2 - 5 6 6 8 9號公報記載認識簡筆字或連 續書寫字之技術。詳細爲由構成文字之座標點抽出一個方 向之直線。就抽出之直線進行分類,將長直線做爲副行程 s I抽出。接著將此抽出以外之部分當成副行程S 2。而 且,依據此S 1、S 2之位置、形狀進行判斷在辭典上是 否有相當者以進行認識。 在上述習知之技術中,係依據以構成文字.圖案之座標 列所構成之行程的形狀或配置以進行認識。但是,依據全 部之座標列以進行認識之故,.存在下列問題。 一般無法認識連寫、簡筆字係由於被輸入之文字圖案 與儲存在辭典之文字圖案不同。在連寫之情形下,有多餘 之輸入,與被儲存於辭典之文字圖案形狀完全不同。因此 ,爲了認識連寫文字,在被輸入之文字當中,有必要分辨 哪個部.分爲認識所必要之部分,哪個部分爲認識所不必要 之部分,依據全部之座標進行認識會無法合適地認識被連 寫之文字。 本發明之目的在於提供:解決上述問題,由於潦草書 寫,即使連寫而且筆順亂包含變形之文字皆可以認識,而 且認識處理之負荷小之文字認識裝置。 本紙張尺反述巧中國國家標準(CNS ) A4規格(210X297公釐)~~ΤΣΙ"""" {誚先閱讀背面之注意事項再填艿本頁)
,1T ^02711 ab77 五、發明説明) (誚先閱讀背面之注意事項再功寫本頁) 爲了達成上述目的之本發明之特徵爲具有:輸入手寫 文字,輸出座標點列之輸入部,以及儲存複數之文字與對 應各各文字碼之文字圖案之辭典,以及由輸入部被輸出之 座標列,分解爲構成此文字之複數的要素之要素分解部, 以及關於儲存在辭典之各各文字圖案,求得被儲存於辭典 之文字圖案之要素與被輸入之文字圖案之要素之對應距離 値,依據未對應要素修正求得之距離値之匹配部,以及將 距離値小之文字圖案顯示於顯示部之處理部。 圖面之簡單說明 圖1係顯示本系統之構成圖。 圖2係顯示習知例之文字認識之槪要圖。 圖3係顯示本發明之文字認識之槪要圖。 圖4係顯示本系統之處理之全體圖。 圖5係顯示圖4之楔形近似之處理圖。 圖6 A以及圖6 B係顯示圖5之縱橫要素分解之處理 圖…。:. 〇 圖8Α以及圖8 Β係顯示採取圖7Α-7 C之特徵要 素之AND之距離値之計算處理圖。 圓9係顯示詳細識別之處理圖。 圖1 〇 A以及圖1 〇 B係顯示圖像不足檢査處理圖。 圖1 1係顯示連結檢査處理圖。 ... · ' .... . * . . 本纸乐尺度这家榡率< CNS ) A4規格(210X—297公釐) Α7 Β7 五、發明説明(3 ) 圖1 2係顯示筆方向檢査處理圖。 圖13 A_ 1 3 C係說明處理槪要用之圖。 圖14係說明處理槪要用之圖。 圖1 5A — 1 5 F係說明處理槪要用之圖。 主要元件對照 110 液晶手胃寫"i 120 筆管理者 130 應用部 140 前處理部 150 楔形近似部 151 要素分解部 152 要素重排部 160 勉曲 辭興 170 匹配部 171 匹配管理部 172 AND處理部 173 辭典距離値修正部 174 .輸入距離値修正部 175 認·識結果輸出部 180 詳細識別部 實施發明用之最好之型態 以下,依圖面說明本發明之聯機手寫文字輸入裝置" 本紙张尺度这扣中囤國家標隼(CNS ) A4規格(2]0Χ297公釐)_ g _ 1^1 mi -I I - Jn - I— — ^I- n {請尤閱讀背面之注意事項再填i:il本頁) 丁 ^方部中""^^.-^-1^^^11·^^^ ^02711 at .... B7. 五、發明説明谷) * * · . ... . , . 圖1係顯示本發明之聯機手寫文字輸入裝置。液晶手 寫板1 1 0係由輸入部與顯示.部構成,使用者如果在其上 以手寫輸入,將其檢測出,以時系列座標點列傳達於筆管 理者1 20 »筆管理者1 20由液晶手寫板1 10接收時 系列座標點列,循著應用部1 3 0定義之液晶手寫板 1 1 0上之領域屬性,假如座標點列位於文字認識之領域 屬性,將此座標點列傳達於前處理部1 4 0。應用部 1 3 0爲實行應用程式,將液晶手寫板1 1 0上之領域分 割成幾個以決定領域屬性者,例如將畫面之一部份定爲文 字輸入領域。前處理部1 4 0由筆管理者1 2 0接收時系 列之座標點列,將筆速快之部分成爲稀疏、慢之部分成爲 密之座標點列重新取樣處理以使座標點列之密度一定,再 者,正規化位置與尺寸。如此,位置以及尺寸被正規化、 密度一定之座標點列被輸入楔形近似部5。 楔形近似部1 5 0係由要素分解部1 5 1、要素重排 部1 5 2所構成。 要素分解部1 5 1由在前處理部1 4 0密度成爲一定 之座標點列,產生進行圖案匹配用之線份》被產生之線份 被傳達.於要素重排部1 5 2,此處即使筆順亂七八糟書寫 之文字,依據其位置,爲了使與辭典對應,將上或下方向 之線份要素依據其位置,由上依序排列,將右或左方向之 線份要素由左依序排列,以線份要素之長度順序排列。而 且,將其位置順序結果保持之同時,將線份要素列與線份 位置順序結果傳達於匹配部1 7 0。 .... "·· ,.: ..... ... 本紙乐尺度述;丨]中围國家標準(CNS ) A4規格(210 X 297公釐)一_ 7 - (誚先閱讀背面之注意事項再填寫本頁) 訂
五、發明説明(5 ) 匹配部170係依據由楔形近似部150送來之線份 要素列、線份位置順序結果,進行與辭典之匹配,由辭典 輸出與由液晶手寫板110被手寫輸入之文字圖案接近之 文字,以顯示於液晶手寫板Γ1 0之顯示部者。又,將文 字圖案之座標點列於前處理部1 4 0以及楔形近似部 1 5 0所獲得之線份要素列對應於文字碼以保持於辭典 16 0° 匹配部17 0係由:匹配管理部1 71,求取被輸入 文字圖案之線份要素列與被儲存於辭典之文字圖案之距離 値之AND處理部1 7 2,抽出只存在於辭典之線份要素 ,修正距離値之辭典距離値修正部1 7 3,抽出只存在於 輸入圖案之線份要素,修正距離値之輸入距離値修正部 1 7 4,依據AND處理部1 7 2、辭典距離値修正値 1 7 3、輸入距離値修正部1 7 4所獲得之距離値,抽出 認識結果,輸出於液晶手寫板1 1 0之顯示部之認識結果 輸出部1 7 5所形成。 匹配管理部1 7 1係由辭典1 6 0 —個一個地讀出被 儲存於辭典之文字圖案,以下經由AND處理部1 7 2、 辭典距離値修正部1 7 3、輸入距離値修正部1 7 4算出 與輸入之文字圖案之距離値。首先,由楔形近似部1 5 0 與辭典1 6 0接受輸入之文字圖案與辭典之文字圖案之線 份要素列,傳達於AND處理部1 7 2、辭典距離値修正 部1 7 3、輸入距離値修正部.17 4,—面修正算出輸入 之文字圖案與辭典之文字圖案之距離値.,最後將辭典圖案 本紙张尺度適州中囤國家標率(CNS ) A4規格(2丨0Χ297公釐).Q. 絮- (讀先閱讀背面之注意事項再填寫本頁)
A7 B7 0^7. 五、發明説明(6 ) 之ID或文字碼與其之距離値傳達於認識結果輸出部 17 5。 AND處理部1 7 2在縱的線份要素或橫的線份要素 ,於將辭典圖案之線份要素列及輸入圖案之線份要素列比 較時,個別地使位置(要素重排部1 7 1之重排後之順位 )接近之辭典之文字圖案之線份要素與輸入之文字圖案之 線份要素對應,將其分類爲:(1)對應於輸入之文字圖 案之線份要素存在於辭典之文字圖案,(2)對應於輸入 之文字圖案之線份要素不存在於辭典之文字圖案,(3) 對應於辭典之文字圖案之線份要素不存在於輸入之文字圖 案之3種情形,這些之間分別求其距離値,設此總和爲最 終之距離値。關於(2 )與(3 ),經由辭典距離値修正 部17 3、輸入距離値修正部1 7 4,因在之後詳細地求 得距離値之故,在此處設爲一定値之距離値。將處理結果 之線份要素賦予對應與線份要素間之距離値經由匹配管理 部1 7 1傳達於辭典距離値修正部1 7 3。此處距離値如 果過大,停止辭典圖案之處理,也可以將此意思傳達於匹 配管理部17 1。辭典距離値修正部1 7 3有考慮到被輸 入文字_圖案之變形。變形或連寫加劇而產生省略時,在辭 典之文字圖案即使被當成線份要素,但在輸入之文字圖案 卻沒有對應之線份要素。因此,AND處理部1 7 2之結 果,辭典之文字圖案之線份要素沒有對應之輸入圖案之線 份要素時,(1 )首先,探索有否與輸入之文字圖案之線 份以外之線份要素對應者,存在時,求得與其之距離値。 本紙張尺度迭用中1¾國家標率(CNS ) A4規格(210X297公釐).9. (誚先閲讀背面之注意事項再域巧本頁) • m * ί--* 策-----丨訂--------- I I .1—1 lllsms mljlsm: ^:才部中央^:^^::::: 了·消# 合竹、"印 n A7 ·+ _ B7_. . . .__.一 五、發明説明^ ) (2 )沒有時,設爲因應辭典之文字圖案之該線份要素之 大小之距離値。而且,將在AND處理部1 72給予一定 値之距離値置換爲此。設爲因應大小之距離値係由於大的‘ 線份要素不易被省略,小的線份要素容易被省略。而且, 將在AND處理部1 7 2給予一定値之距離値置換爲此。 將處理之結果之線份要素賦予對應與線份要素間之距離値 經由匹配管理部1 7 1傳達於.輸入距離値修正部1 7 4。 輸入距離値修正部1 7 4也考慮輸入文字之連寫。在 產生連寫之時·,以相當於該部分之線份要素,在輸入之文 字圖案即使被設爲線份要素,在辭典之文字圖案沒有線份 要素。因此,以筆順之線份要素列來看輸入之文字圖案時 ,在無法與辭典之文字圖案賦予對應之線份要素之前後, 要是有與辭典之文字圖案賦予對應之線份要素,於連結該 辭典之文字圖案之線份要素之位置,若是輸入之文字圖案 之該線份要素存在,該線份要素可以解釋爲連寫之部分》 若可以解釋爲連寫,給予小距離値,不可以的話,給予大 的距離値。而且,將在AND處理部1 7 2給予一定値之 距離値置換爲此。將處理之結果之線份要素之賦予對應與 線份要.素間之距離値傳達於匹配管理部1 7 1。 認識結果輸出部1 7 5由匹配管理部17 1得到辭典 之文字圖案之I D或文字碼與其之距離値,選出距離値小 者,依距離値之順序排列,設爲認識結果。而且,將該認 識結果一旦傳達於詳細識別部1 8 0,取得再度返回之認 識.結果,將其輸出於筆管理者2。 ...... · ... . ...... 本紙張尺度速;)]中囤國家標车(CNS ) A4規格(2丨0X297公瘦1 . -j〇 _ (誚先閱讀背面之注意事項再填寫本頁) 訂 402711 五、發明説明fe ) {誚1閱讀背面之注意事項再试寫本頁) 詳細識別部1 8 0係以經由要素分解部1 5 1分$ @ 份要素之線份要素列消失之文字之特徵以更替認識結#$ 順位。詳細識別部8由認識結果輸出部1 7 5取得距® 小之辭典圖案之I D或文字碼以做爲認識結果,就個裔 圖案之詳細特徵調査輸入圖案,必要時更替認識結果_& ,將結果傳達於認識結果輸出部1 7 5。 以下,顯示本實施例之動作順序。 圖4係顯示本發明之聯機手寫文字輸入裝置全體2胃 理流程者。’ 在處理40 1,依據液晶手寫板1 1 0、筆管理者 120、應用部130,將使用者手寫之輸入文字圖案取 入做爲時系列之座標點列。在處理4 0 2、4 0 3 ’經由 前處理部1 4 0,把筆速快之部分成爲稀疏/慢之部分成 爲密之座標點列做取樣處理,使座標點列密度一定。再者 ,正規化位置與尺寸。位置與尺寸之正規化例如由被輸入 之文字圖案之座標點列求得文字圖案之重心,將此重心與 原點重疊地平行移動圖案以正規化位置,由重心(原點) 至各座標點止之距離之平均値成爲一定地擴大或縮小以正 規化尺.寸。 接著,在處理4 0 4經由楔形近似部1 5 0進行楔形 近似處理。 楔形近似處理係如圖5所示般地,進行將輸入圖案分 解成縱橫之線份要素之縱橫要素分解處理5 0 1,進行將 被分解成縱橫之線份要素之線份重排之要素重排處理 .. · ..... .. . * ......... , . 本纸张尺度適用中國國家標丰(CNS ) A4規格(210X297公釐) 71 '~~ 402711 at ____一 __B7__ 五、發明説明6 ) 5 0 3。 圖6係顯示縱橫要素分解處理501之處理流程。 (誚先閲讀背面之注意事項再填巧本頁λ 在處理6 0 1中,由被輸入之文字圖案一面取得X軸 ,y軸方向之局部的MIN/MAX値以及抽出始終點, 一面決定線份》即如圖15A所示般地,由經使用者輸入 之起始點a沿著座標點列移動,於點b處,y軸成爲最小 。接著,以點b爲起始點點,沿著座標點列移動,在點c 處,y軸成爲最大(圖1 5 B )。如此,求取X軸,y軸 方向之局部的Μ I N/M A X値,則成爲如圖1 5 C所顯 示的。 但是,連結採取X軸,y軸方向之局部的 Μ I N /M A X値所求得之點,則成爲如圖1 5 D所顯示 者,很明顯地與使用者輸入之文字圖案不同。因此,將此 圖1 5 C所示之文字圖案經由處理6 0 2〜處理6 0 4進 行接近使用者輸入文字圖案之處理。 在處理6 0 2〜6 0 5中,以求得之點構成之每一個 線份中,線份與構成原先之行程之座標點列之長度之比, 比預先決定之臨界値a小之情形,判斷經由線份之近似不 充分,.將原先之行程之中點做爲近似點做補正。在圖 1 5 E中,顯示線份1由於與原先之行程2之長度比,比 預先決定之臨界値還小之故,近似點d被做補,正。如此經 補正者爲圖15F。 最後在處理6 0 6連接於處理6 0 1〜6 α 5所獲得 之點以求取線份列 本紙张尺度送用中®國家摞準(CNS ) Α4規格(210Χ297公釐) -12- 402711 B7 五、發明説明(10 ) · “ .... - . · ..... ..... . .. . ......... _ 又,補正近似點之處理也可以如圖6 B所示般地,求 得以線份要素與原先之行程所包圍之面積,此面積比預先 (誚尤閱讀背面之注意事項再頊矜本頁) 決定之臨界値大時,近似點爲補正完了。 經由如此求得之線份列,在圖5之處理5 0 2進行重 排,在圖4之處理4 0 5進行輸入與辭典之匹配》 圖7A顯示此輸入與辭典之匹配處理5 0 5之詳細。 在此處,求取線份列與全部之辭典圖案之距離値。在 處理7 Ο 1中,求取線份列與辭典圖案一致之要素的距離 値。例如,以圖7 A之輸入楔形所顯示之文字圖案與以辭 典楔形所顯示之文字圖案,圖7B之粗線部份爲2個圖案 —致之AND部分,算出此部分之距離値。 圖8A以及8 B係詳細顯示算出取得此特徵要素之 AND之距離値之處理701。 在處理8 0 1中,初期化d i s t — c p 1 , d i s t _ i _ s n g * d i s t _ d _ s ng.。此處 d i s t_c p 1係保持關於輸入圖案之線份要素與辭典 圖案之要素賦予對應者之距離値之變數。以圖7 B之例來 說時,爲以粗線顯示部分之距離値。d i s t 一 i _ s n g.係保持關於無法與辭典圖案之要素賦予對應之輸入 圖案之要素之距離値之變數。以圖7 B之例來說,係以輸 入圖案之細線所顯示之部分。d i st_d 一 s n g係保 持關於與輸入圖案之要素無法賦予對應之辭典圖案之要素 之距離値之變數。 「 接著,在處理8 0 2〜8 0 4中,以一 1初期化 • · . 本紙乐尺度述州中國國家樣牟(CNS )八4規格(210 X 2M公釐)-13 - Α7 Β7 五、發明説明(11 ) • *...... ' ·' · . - · .... ..... > .... ....... .... C p 1 — i ( i ) 9 c P 1 — i ( i )係保持與輸入圖案 之線份要素I可以賦予對應之辭典圖案之要素號碼j之變 數。而且,依要素之筆方向分類爲丨—丨—之4個方向。 此分類係由於在之後之處理8 1 0中,找尋與輸入圖案之 要素i賦予對應之辭典圖案之要素j之際,由相同分類中 找尋可以高速地尋找。又也可以不進行分類。 接著,在處理8 0 5中,每一被分類之要素以線份長 度做分類。此分類係由於在之後之處理8 10中,找尋與 輸入圖案之要素i賦予對應之辭典圖案之要素j之際,由 此處分類之順序中找尋可以高速地尋找。又也可以不進行 分類。 ‘. 接著,在處理806〜808中,辭典圖案與處理 802〜804相同地,以—1初期化cp 1—d ( j ) ,依要素之筆方向分類爲丨—t-之4個方向。 接著,在處理8 1 0〜8 1 4進行匹配。首先在處理 8 1 0中,爲了找尋與輸入圖案之要素i賦予對應之辭典 圖案要素j之故,找尋與輸入圖案之要素i被分類爲相同 筆方向之辭典圖案之要素j ,而且c p 1 _ d ( j )= — 1,即在還未與任何輸入要素賦予對應之要素中最短距離 値者。距離値例如在以輸入圖案要素i之起點(xi s, yis)終點(xie,yie) ,辭典圖案要素j之起 點(X j s ,y j s ) ’ 終點(X j e,y j e )所表示 之線份時,以下式算出》 距離値(i,j )= 本紙張尺度適扣中1¾國家標準(CNS ) A4規格(210X297公釐).^ *τ {誚七閱讀背面之注意事項再填寫本頁}
^〇27n A7 B7 五、發明説明(12 ) ( I xis-xjs I + | yis-yjs | + | xie-xje | + | yie-yje | + b* ( | (xie-xis)-(xje-xjs) | + | (yie-yis)-(yje-yjs) | 此處上述之第1項係爲了求得輸入之文字圖案之線份 i之位置與辭典之文字圖案之線份j之位置之差,不使用 筆順資訊而認識之情形下,此.爲必須者。不使用的話’無 法識別圖13A—13C所示之輸入圖案「三」。 在處理8 1 1中,將在處理8 1 0獲得之距離値(i ,j )與臨界値比較,判斷(i,j )之對應賦予是否正 確。此具有防止如圖14所示般地,因手晃動等被輸入之 雜訊部分之要素間被賦予對應,成爲大之距離値而被誤認 識之效果。在處理811賦予對應正確之情形,於處理 812將〇?1_1(1)與〇?1_<1(])設定爲互 相之要素號碼j與i,於d i s t _ c p 1加算(i ’ j )^又,在處理8 1 3賦予對應不正確之情形’在處理 8 1 4中,於d i s ng加算相當於輸入圖案 要素i無法賦予對應之距離値之要素i之長度。在長度以 外使用.常數,也可以使用以長度爲參數之函數。 若是使用以長度爲參數之函數,可以抑制如圖1 4之 類之雜訊要素之情形之距離値,在佔據文字之大部分線份 無法賦予對應之情形,爲了可以給予大之距離値上,很有 甲 〇 λΧ 接著,在處理8 1 5〜8 1 7中,關於辭典圖案之全 本纸张尺度这扣中國國家標率(CNS > Α4規格(210Χ 297公釐) _ _ (誚先閱讀背面之注意事項再功巧本頁) -n - I I n - 1-1^- n ΊΙ — l . n - I I— n m n n —1 n n ^ n n n I I n n n I n 五、發明説明(13 ) ·· ... ·.··- · · *....... ..... .·. - ...... 部之線份j = 〇〜J_,調査c p 1 _ d ( j )是否爲一 1 ’即無法與輸入之文字圖案之線份賦予對應之線份,與處 (誚先閱讀背面之注意事項再功寫本頁) 理814同樣地,在處理817中於di s t_d_ s n g加算距離値。 如此,算出輸入之文字圖案與辭典之文字圖案之對應 特徵之距離値。 接著,在圖7 A之處理7 0 2中,進行只有辭典之線 份之探索,重新算出距離値。在圖7 C之例中,以辭典之 文字圖案之線份並沒有留下與輸入之文字圖案之線份沒有 對應者,如果有的話,與接著說明之處理7 0 3之情形相 同地處理之。 在處理7 0 3中,只有進行輸入之特徵要素之探索, 重新算出距離値。例如爲圖7 C之輸入文字圖案與辭典之 文字圖案,以圖中之粗線部分顯示之輸入圖案之特徵要素 之粗線顯示之部分1 2、1 4等與辭典圖案之要素無對應 而留下。12係在與辭典圖案之要素對應之11與13之 間被輸入,可以將與1 1及13對應之辭典圖案之要素解 釋爲連寫部分之放,若給予較無法如此解釋之情形之1 2 之距離.値還小之値,連寫文字也變得容易認識。 如此,依據在輸入圖案與辭典圖案之間求得之距離値 以進行圖4之處理4 0 6之詳細識別。 即,在處理4 0 4中,爲了將文字分類爲上下左右之 縱線與橫線之故,曲線與四角之不同等圖案之彎曲狀祝之 特.徵變不見,因此,經由此處理4 0 6,準備不同於辭典 纸張尺度適/f]中國國家標準(CNS ) A4規格(210X297公釐)
4Q27U 五、發明説明(14 ) . ..... . .... -. - ·. - · * * · ·— * * 1 6 0之別的詳細識別辭典,經由楔形近似而近似於相同 形狀之文字被包含於認識結果之情形,經由此詳細識別辭 典,調査各辭典之文字圖案之詳細特徵之輸入之文字圖案 ,必要時進行更替認識結果順位之處理。 將此詳細識別處理406之處理流程顯示於圖9。 就依據輸入與辭典之匹配處理4 0 5所獲得之距離値 之小的順序至上位N位止之辭典之文字圖案進行此詳細識 別。首先,在處理9 0 1〜9 0 5中,就距離値小的順序 至上位N位止之辭典之文字圖案進行圖像不足檢査9 0 1 、連結檢査9 0 2、筆方向檢査9 0 3、四角/曲線之檢 査 9 0 4。 圖1 0A以及1 0 B係顯示圖像不足檢査9 0 1之處 理流程者》此處理即使如圖1 0A所示之「C」之濁點之 小的要素,不足之時在距離値.加上大的補償値。首先,在 處理1 0 0 1中以0初期化距離値dist。又,在處理 1 0 0 2中,以-1初期化連結資訊link〔〕 〔〕 〇 而且,在處理1003〜1008中,有關全部之要 素之折.線之組合,在1 0 0 3〜1 0 0 7端點間一致。即 有關連結之線份,將其連結資訊經由1 0 〇 4或1 0 0 6 設定於link〔 〕〔 〕。在link〔 i〕〔 〇〕設定線份 i之起始點連接終點之線份之號碼,或在link〔〕〔 〕設定於.要素i之終點連接起始點之線份之號碼.。如此一 來,相同圖像數被輸入之耍素·參考link〔 i〕〔 1〕,可 本紙悵尺度追/丨]中囤國家標準(CNS ) A4規格(210X297公釐) -17- (誚先閱讀背面之注意事項再填寫本頁)
朽:"部+^"-η,·而nf 合 0"卬*':?: A7 B7 五、發明説明(15 ) ....... . .... - .... ... . . 以找到~個之賸寫版,圖像之起始點採用link〔 i〕〔 0 〕=一 1之値》 此處經由處理1010〜1013,找尋link〔 i〕 〔〇〕= 一 1之値之線份,在圖像頭(k)設定其之線份 號碼。而且,經由處理1 0 1 5〜1 0 2 0,包含於圖像 (k )之線份全部沒有賦予對應之情形,將圖像(k )之 總長做爲補償値加入距離値。在處理1 0 1 7中,考慮濁 點非常小的被輸入之情形,比.臨界値還小之情形,非以圖 像(k )之總長而是將臨界値做爲補償値加入距離値。在 處理1015中,線份號碼i =由圖像頭(k )起參考 link〔 i〕〔1〕,一面找尋被包含於圖像之全部之線份 ’一面調査cp l_i ( i )或cp l_d ( j )是否爲 - 1,被包含於圖像(k )之線份全部是否沒有被賦予對 應。處理1 0 1 6 .也同樣地,參考link〔 i〕〔 1〕,一 面找尋一個之謄寫版一面加入全部之線份之長度以求得圖 像之總長。此處,雖然調査該連結資訊設定於link〔 〕 〔〕,但是也可以在圖5之處理503之要素重排前, 將包含於圖像中之線份號碼設定於link〔〕〔〕。此 種情形時,若在辭典圖案也保持link〔〕〔〕資訊, 辭典容量增加之故,也可以爲輸入圖案在要素重排前設定 link〔〕〔〕,只有辭典圖案經由圖1 0/之處理 1006 或 1008 而設定於 link〔〕〔 〕。 圖1 1係顯示欐9之連結檢査處理9 0 2之處理流程 圖。此處理係將相當於如圖1 1所示之「I/」或與此相似 本紙张尺度述丨丨]中國國家標车(CNS > A4規格(210X297公釐) .-ίο _ '~~ {誚先閲請背面之注意事項再in寫本頁) 裝. 訂 托?^'部 ψλ"'^^*,;-;-τ·'·1ηϊϊ-,Λρ ^Γ·"卬4,:心 ^〇27ιι 五、發明説明(16 ) 之圖案般地,要素之連結狀況不同之情形之補償値加於距 離値。如a )般地,辭典之文.字圖案/輸入之文字圖案之 在其中一方連接成爲1個之圖像,在另一方分爲2個之圖 像,而且與不同要素連接之情形給予最大之補償値。不與 不同要素連接之情形,1個之圖像部分可以認爲係連寫之 故,可以爲小的補償値。如b )般地,辭典之文字圖案/ 輸入之文字圖案之在其中一方雖然連接,但在另一方夾住 不同之要素而連接之情形,也給予補償値。此時,夾住之 不同要素之長度在一定値以下時,設爲一定値,在其之上 時,可以給予因應要素之長度之補償値。如c )般地,相 同連接之情形,不給予補償値。 本發明雖係即使筆順亂七八糟也可以認識之文字認識 技術,但在識別只有筆順不同,完全相同之圖案之情形, 以此連結狀況檢査之處理,筆順資訊是否爲一致,可就辭 典圖案與輸入圖案調査即可。 圖12係顯示圖9之筆方向檢査處理9 0 3之處理流 程圖。此處理即使筆方向被反向輸入之情形,也可以認識 . 1 . 文字。首先,在處理1 2 0 1·中,將全部之要素之筆方向 彙整爲―丨。如果全部之要素爲縱線/橫線,將t變換爲 i,將—變換爲―,記憶變換資訊。若具有斜方向之要素 ,分類爲縱線/橫線之其中之一,同樣地變換之。而且, 在處理1 2 0 2中,進行圖7A說明過之輸入與辭典之匹 配。可以與全部之辭典圖案進行,也可以只與候補之上位 之辭典福案進行。而且,在處理1203〜1206中, 本紙張尺度述抝中S國家標皁(CNS ) A4規格(210X297公釐〉 (誚先閱讀背面之注意事項再硪寫本頁)
-19- 鈐"部中呔"*?V'^JK η:7ί贤合 #"印 v?: A7-.02711 b7 _五、發明説明(17 ) 筆方向不一致者,即與原來之筆方向不同之要素’給予補 償値。 又,在處理903之前,是否實施此可以調査(1 ) 輸入圖案之要素之筆方向,t,—哪一個多?(2)候補 順位係上位之距離値大,是否非正解候補?此2點,只在 此情形下才實施則可以節省處理時間。 如此就佔上候補之辭典圖案,進行圖像不足檢査處理 ,連結檢査處理,筆方向檢査處理,四角/曲線之槔査處 理後,在處理9 0 6中,將候補順位重新安排爲距離値小 之順位。 如此,依據經由圖4之詳細識別處理4 0 6被處理之 結果,做爲認識結果由距離値小者起做爲認識結果輸出之 (處理4 0 7 )。 產業上之利用可能性 . 如以上說明般地,依據本發明,提供:潦草書寫之故 ,即使連寫而且筆順亂七八糟,包含變形之文字都可以認 識,而且認識處理之負荷小之文字認識裝置。 (請先閲讀背面之注意事項再功巧本頁) 訂 I.JJ-_U.=SUULJL:UI.U»·· 本紙张尺度送;國家標率(cNS ) A4規格(210X297公釐)-20·

Claims (1)

  1. 402711 A8 B8 C8 D8 六、申請專利範圍 1.一種文字認識裝欐,其特徵爲具有:輸入手寫文字 ,輸出座標點列之輸入部, (請先閲讀背面之注意事項再填寫本頁) 以及儲存複數之文字與對應各各文字碼之文字圖案之 辭典, 以及由上述輸入部被輸出之座標列,分解爲構成此文 字之複數的要素之要素分解部,以及關於儲存在上述辭典 之各各文字圖案,求得被儲存於辭典之文字圖案之要素與 上述被輸入之文字圖案之要素之對應距離値,依據未對應 要素修正上述·求得之距離値之匹配部,以及將距離値小之 文字圖案顯示於顯示部之處理部。 2 .如申請專利範圍第1項記載之文字認識裝置,其 中上述要素分解部由上述座標點列產生複數之線份,在上 述匹配部求取上述被產生之線份以長者之順序與被儲存在 上述辭典之文字圖案之線份之距離値。 .3 .如申請專利範圍第1.項記載之文字認識裝置,其 中上述要素分解部依序道尋上述座標點列,分解爲將X軸 ,Y軸之至少其中一方爲最大或最小之値設爲_端點之線份 〇 經濟部中央揉準局貝工消費合作社印製 4..如申請專利範圍第3項記載之文字認識裝置,其 中上述要素分解部比較以上述X軸,Y軸之至少其中一方 爲最大或最小之値爲端點之線份與連結上述座標點列所構 成之行程之長度,依據此比較結果,分解爲以上述線份之 中點爲端點之2條之韻份。 5 .如申請專利範圍第1項記載之文字認識裝置,其 本紙張尺度適用中國國家標準(CNS > A4规格(210X297公釐) A8 B8 C8 D8 經濟部中央標準局貝工消费合作社印製 4027 六、申請專利範圍 中上述匹配部將構成上述文字圖案之線份與構成被儲存於 上述辭典之文字圖案之線份,以方向別分類之,依此每條 被分類之線份求取距離値。 6 .如申請專利範圍第1項記載之文字認識裝置,其 中上述匹配部在獲得上述被輸入之文字圖案之要素與被儲 存於上述辭典之文字圖案之要素的對應後,在由輸入圖案 或辭典圖案之要素所形成之圖像中,其中包含之任一要素 都沒有對應要素之情形,與其中包含之要素中有對應要素 存在之情形相比,賦予大的距離値。 7 .如申請專利範圍第1項記載之文字認識裝置,其 中上述匹配部保持上述被輸入文字圖案或被儲存於上述辭 典之文字圖案之要素間之連接資訊,在獲得上述被輸入文 字圖案之要素與被儲存於上述辭典之文字圖案之要素之對 應後,比較要素間之連接資訊,不一致之情形下,賦予大 的距離値。 8 .如申請專利範圍第1項記載之文字認識裝置,其 中上述匹配部將上述被輸入文字圖案或被儲存於上述辭典 之文字圖案之要素變換爲一定方向後,進行上述被輸入文 字圖案.或被儲存於上述辭典之文字圖案之要素之匹配。 9 .如申請專利範圍第8項記載之文字認識裝置,其 中上述匹配部在將上述被輸入文字圖案或被儲存於上述辭 典之文字圖案之要素變換爲一定方向前,保持上述被輸入 文字圖案或被儲存於上述辭典之文.字圖案之要素之本來之 筆.方向,進行上述被輸入文字圖案或被儲存於上述辭典之 本紙張尺度逋用中國國家標準(CNS > A4規格(210X297公釐) (請先聞讀背面之注意事項再填寫本頁)
    402711 8 00 00 99 ABCD 六、申請專利範圍 文字圖案之要素之匹配賦予對應後,比較要素之本來之筆 方向,不一致之情形下,比一致之情形賦予大的距離値。 1 0 .如申請專利範圍第1項記載之文字認識裝置, 其中上述匹配部於上述被輸入之文字圖案或被儲存於上述 辭典之文字圖案之要素中,與距離値最小被儲存於上述辭 典之文字圖案或上述被輸入之文字圖案之要素之對應,在 上述距離値比一定値大之情形,設爲無對應。 (.請先M讀背面之注意事項再填寫本頁) : *,ι·- -IV ---------__—Li.___^------tr---ί .JJ--""··'-1'····1·-.:.!. 經濟部中央橾车局員工消費合作社印裝 llcI-,---------------- 本紙張尺度適用中國國家標準(CNS > A4规格(210X297公釐) -23-
TW087114223A 1997-09-22 1998-08-27 Character recognizing device TW402711B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9256433A JPH1196301A (ja) 1997-09-22 1997-09-22 文字認識装置

Publications (1)

Publication Number Publication Date
TW402711B true TW402711B (en) 2000-08-21

Family

ID=17292602

Family Applications (1)

Application Number Title Priority Date Filing Date
TW087114223A TW402711B (en) 1997-09-22 1998-08-27 Character recognizing device

Country Status (6)

Country Link
US (1) US6718060B1 (zh)
JP (1) JPH1196301A (zh)
KR (1) KR20010024208A (zh)
CN (1) CN1279796A (zh)
TW (1) TW402711B (zh)
WO (1) WO1999016013A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8041119B2 (en) 2007-01-05 2011-10-18 Compal Electronics, Inc. Method for determining orientation of chinese words

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000036530A1 (fr) * 1998-12-15 2000-06-22 Matsushita Electric Industrial Co., Ltd. Methode de recherche et dispositif correspondant, support enregistre
US7039255B2 (en) * 2000-07-21 2006-05-02 Lg Electronics Inc. Method for searching multimedia using progressive histogram
JP4665317B2 (ja) * 2001-02-08 2011-04-06 ソニー株式会社 座標列の特徴算出方法、ならびに映像特殊効果装置の制御方法および映像特殊効果装置の制御システム
KR100456620B1 (ko) * 2001-12-20 2004-11-10 한국전자통신연구원 한글문자 인식 방법
JP4301820B2 (ja) * 2003-01-16 2009-07-22 株式会社ルネサステクノロジ 情報認識装置
AU2003900865A0 (en) * 2003-02-26 2003-03-13 Silverbrook Research Pty Ltd Methods, systems and apparatus (NPW010)
CN1317664C (zh) * 2004-01-17 2007-05-23 中国科学院计算技术研究所 乱笔顺库建立方法及联机手写汉字识别评测系统
KR100598115B1 (ko) * 2004-08-31 2006-07-10 삼성전자주식회사 고속 문자인식방법 및 장치
US7899251B2 (en) * 2006-06-05 2011-03-01 Microsoft Corporation Balancing out-of-dictionary and in-dictionary recognition scores
TWI336854B (en) 2006-12-29 2011-02-01 Ibm Video-based biometric signature data collecting method and apparatus
US7814443B2 (en) * 2007-01-16 2010-10-12 International Business Machines Corporation Graph-based pattern matching in L3GO designs
US7895518B2 (en) * 2007-04-27 2011-02-22 Shapewriter Inc. System and method for preview and selection of words
US8111922B2 (en) * 2007-06-08 2012-02-07 Microsoft Corporation Bi-directional handwriting insertion and correction
US8918734B2 (en) 2010-07-28 2014-12-23 Nuance Communications, Inc. Reduced keyboard with prediction solutions when input is a partial sliding trajectory
JP6125333B2 (ja) * 2013-05-31 2017-05-10 株式会社東芝 検索装置、方法及びプログラム
JP6094400B2 (ja) * 2013-06-25 2017-03-15 ソニー株式会社 情報処理装置、情報処理方法、および情報処理プログラム
FR3057692A1 (fr) * 2016-10-13 2018-04-20 Parrot Drones Procede et systeme electronique de detection d'une cible, programme d'ordinateur associe
CN106557766B (zh) * 2016-11-22 2020-05-19 宇龙计算机通信科技(深圳)有限公司 模糊字符处理方法、系统及电子设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6113384A (ja) * 1984-06-28 1986-01-21 Fujitsu Ltd 手書文字認識装置
JP2635582B2 (ja) 1987-03-30 1997-07-30 株式会社東芝 パターン認識方式
JP3017740B2 (ja) 1988-08-23 2000-03-13 ソニー株式会社 オンライン文字認識装置およびオンライン文字認識方法
JP3155577B2 (ja) 1991-10-16 2001-04-09 キヤノン株式会社 文字認識方法及び装置
JPH06309506A (ja) 1993-04-20 1994-11-04 Oki Electric Ind Co Ltd オンライン文字認識装置
US5684892A (en) * 1995-08-22 1997-11-04 Taguchi; Genichi Method for pattern recognition
JPH0962788A (ja) * 1995-08-28 1997-03-07 Ricoh Co Ltd オンライン手書き文字認識方法
JPH09114927A (ja) * 1995-10-13 1997-05-02 Seiko Epson Corp オンライン文字認識における入力文字大分類方法および装置
JPH09179938A (ja) * 1995-12-25 1997-07-11 Oki Electric Ind Co Ltd オンライン手書き文字認識装置
US6104833A (en) * 1996-01-09 2000-08-15 Fujitsu Limited Pattern recognizing apparatus and method
JPH09223195A (ja) * 1996-02-06 1997-08-26 Hewlett Packard Co <Hp> 文字認識方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8041119B2 (en) 2007-01-05 2011-10-18 Compal Electronics, Inc. Method for determining orientation of chinese words

Also Published As

Publication number Publication date
KR20010024208A (ko) 2001-03-26
JPH1196301A (ja) 1999-04-09
CN1279796A (zh) 2001-01-10
WO1999016013A1 (fr) 1999-04-01
US6718060B1 (en) 2004-04-06

Similar Documents

Publication Publication Date Title
TW402711B (en) Character recognizing device
Roy et al. HMM-based Indic handwritten word recognition using zone segmentation
TW573280B (en) Method, device and computer program for recognition of a handwritten character
Namboodiri et al. Document structure and layout analysis
US5841902A (en) System and method for unconstrained on-line alpha-numerical handwriting recognition
US8175389B2 (en) Recognizing handwritten words
EP3535689A1 (en) Method and system for transforming handwritten text to digital ink
JP2001325564A (ja) 部首モデルに基づく草書体漢字の手書き注釈の検索
Kumar et al. Review on OCR for handwritten Indian scripts character recognition
Garg et al. An algorithm for text line segmentation in handwritten skewed and overlapped Devanagari script
CN116524527A (zh) 一种表格图像文本识别方法及系统
CN114005126A (zh) 表格重构方法、装置、计算机设备及可读存储介质
JP6587245B1 (ja) 申請書判定装置および申請書判定プログラム
US20040100454A1 (en) Pen input method and device for pen computing system
US20150139547A1 (en) Feature calculation device and method and computer program product
KR102509943B1 (ko) 문서 작성 보조 장치
Khoddami et al. Farsi and latin script identification using curvature scale space features
Thungamani A survey of methods and strategies in handwritten kannada character segmentation
Zhang et al. Extraction and segmentation of tables from Chinese ink documents based on a matrix model
JP3898645B2 (ja) 帳票書式編集装置および帳票書式編集プログラム
JP2019175037A (ja) 文字認識装置、方法およびプログラム
Naz et al. Challenges in baseline detection of cursive script languages
Duth et al. Recognition of hand written and printed text of cursive writing utilizing optical character recognition
Al-Salman et al. Arabic online handwriting recognition: a survey
Sneha et al. Deep learning based application in identifying originality of the hand written document using convolution neural network

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees