JP3188580B2 - 文字切り出し回路、及び文字切り出し方法 - Google Patents

文字切り出し回路、及び文字切り出し方法

Info

Publication number
JP3188580B2
JP3188580B2 JP02948594A JP2948594A JP3188580B2 JP 3188580 B2 JP3188580 B2 JP 3188580B2 JP 02948594 A JP02948594 A JP 02948594A JP 2948594 A JP2948594 A JP 2948594A JP 3188580 B2 JP3188580 B2 JP 3188580B2
Authority
JP
Japan
Prior art keywords
character
line
pattern
continuation
horizontal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02948594A
Other languages
English (en)
Other versions
JPH07192094A (ja
Inventor
敦子 浅川
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP02948594A priority Critical patent/JP3188580B2/ja
Publication of JPH07192094A publication Critical patent/JPH07192094A/ja
Application granted granted Critical
Publication of JP3188580B2 publication Critical patent/JP3188580B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、OCRの手書き文字認
識装置等に利用される文字切り出し回路、及び文字切り
出し方法に関する。
【0002】近年、手書き用の入力周辺機器として、手
書き文字認識装置を有するOCRの需要が急増してい
る。個々の文字の高い認識率を実現する為には、文字認
識の前段階である文字切り出し処理が、その正確さの点
で重要になる。
【0003】これまで、帳票等の文書に対して、一文字
ずつ分離されて書かれていれば、かなりの率で、文字の
自動認識ができたが、少しでも互いに接触している文
字、または続き文字が入ると、著しく認識率が低下す
る。このような事情から、前記続き文字を一文字ずつ正
確に認識する方法が、手書き文字認識装置において求め
られていた。
【0004】
【従来の技術】図22は従来例の説明図であり、A図は
文字切り出し回路のブロック図、B図は文字切り出し方
法説明図である。図22中、2は文字切り出し回路、3
は傾き補正処理部、4は谷部分・水平部分抽出部、5は
単語認識部、6は認識文字分離部を示す。以下、図22
に基づいて、従来例を説明する。
【0005】 §1:文字切り出し回路の説明・・・図22のA図参照 図示のように、従来の文字切り出し回路2には、傾き補
正処理部3、谷部分・水平部分抽出部4、単語認識部
5、認識文字分離部6等が設けてある。
【0006】前記傾き補正処理部3は、入力パターンの
傾き補正等の前処理を行うものであり、谷部分・水平部
分抽出部4は、傾き補正したパターンの谷部分、及び水
平部分を抽出してラベリングを行うものである。また、
単語認識部5は、辞書との照合を行うことにより単語の
認識を行うものであり、認識文字分離部6は、文字を分
離するものである。
【0007】 §2:文字切り出し方法の説明・・・図22のB図参照 以下、前記文字切り出し回路による文字切り出し方法を
説明する。通常、自由に書かれた文字列、例えば、数字
の文字列から、続き文字を抽出し、分離する際、文字に
関しては、単独の文字と、続き文字が混在しており、文
字の大きさとか、続けて書かれている文字数にも特に規
定はない。
【0008】そのため、入力された文字パターンに関し
て、極端な傾きの補正を行い、雑音を除去し、かすれの
穴埋め等の前処理を行った後、2値画像とし、この2値
画像を文字切り出しの対象とする。
【0009】先ず、傾き補正処理部3では、入力された
文字パターンについて、前記の傾き補正等の前処理を行
う。その後、谷部分・水平部分抽出部4において、谷部
分、及び水平部分の抽出を行うため、ラベリング処理を
行うことにより、連結パターンを抽出し、その輪郭探索
を行う。
【0010】前記輪郭探索の結果、輪郭が谷になってい
る部分を、該輪郭の上側から見て、局所的極小点を算出
する。そして、前記極小点の近くで極大点と比較して、
一定以上の深さのある点(B図のの○印部分参照)
で、文字列を縦方向に切る。
【0011】前記の処理で、谷になっていない部分で、
縦方向に線密度が1で、且つ、或る一定の長さ以下で、
極大点、極小点がなく、平坦な部分(B図のの●印部
分参照)で、文字列を縦方向に切る。
【0012】前記のようにして文字の分割処理の後、文
字パターンの塊毎に、B図のに示したように、矩形で
囲み、囲んだ矩形に番号を付ける。次に、単語認識部5
では、前記矩形に付けた番号順に、(1)、(1,
2)、(1,2,3)・・・と統合して、それらの統合
されたまとまりが、文字であるか否かを、辞書と照合し
て判断し、文字であるまとまりが存在すると一文字とし
て認識する。
【0013】その後、認識文字分離部6では、その文字
を除いて、次の矩形から同様の処理を繰り返して行い、
文字の切り出しを行う。B図の、、の例では、C
−−−alif−orn−i−aというように文字が切
り出された例を示している。
【0014】このような例としては、例えば、「郵便サ
ービスにおける手書き文字の認識、第15回先端技術コ
ンファレンス,ワシントンDC,1992,三重大学:
F.木村,S.鶴岡,ミシガン−ダーボン大学,M.シ
リンダー,Z.シエン」{“Context Directed Handwri
tten Word Recognition for Postal Service Applicati
ons ”,Proc.of Fifth Advanced Technology Conferen
ce,Wash.D.C.1992,F.Kimura,S.Tsuruoka:Mie Universi
ty,M.Shridhar,Z.Chen:University of Michigan-Dearbo
rn}がある。
【0015】
【発明が解決しようとする課題】前記のような従来のも
のにおいては、次のような課題があった。 (1) :前記のような従来の文字切り出し方法では、単語
認識を基にして文字の分離線を決定している。従って、
予め予定されている辞書に含まれている単語しか、文字
の切り出し処理ができない。
【0016】(2) :一般に使用されている帳票等に書か
れている文字の切り出し処理を行う場合、あらゆる可能
性を考慮した辞書を作成しておく必要がある。しかし、
このようなことは、現実的には不可能である。
【0017】(3) :前記のような従来の文字切り出し方
法では、適切な文字の分割線を見つけるまでに、矩形に
付けた番号順に、複数回の単語認識を行う必要があり、
処理時間がかかるため、実用化の妨げになっている。
【0018】本発明は、このような従来の課題を解決
し、文字の認識率の低下の要因の一つとなっている続き
文字を一文字ずつ分離するのに、単語認識を必要としな
い文字切り出し方法を実現することを目的としている。
【0019】また、本発明では、文字と文字との続き線
が、水平方向でも、斜め方向でも、確実に文字の分離が
できるようにすることを目的としている。
【0020】
【課題を解決するための手段】図1は本発明の原理説明
図であり、図1中、10は連結パターン抽出部、11は
横長パターン抽出部、12は水平続き線抽出部、13は
垂直分離線決定部、14はゼロ判定部、15は文字分離
部、46は続き線抽出部、47は文字分離線決定部を示
す。
【0021】本発明は上記の目的を達成するため、文字
切り出し回路1は、連結パターン抽出部10と、横長パ
ターン抽出部11と、水平続き線抽出部12と、垂直分
離線決定部13と、ゼロ判定部14と、文字分離部15
とで構成した。
【0022】また、文字切り出し回路2は、連結パター
ン抽出部10と、横長パターン抽出部11と、続き線抽
出部46と、文字分離線決定部47と、ゼロ判定部14
と、文字分離部15とで構成した。
【0023】
【作用】前記構成に基づく本発明の作用を、図1に基づ
いて説明する。 (1) :前記文字切り出し回路1では、先ず、連結パター
ン抽出部10が、入力パターンの連結情報に基づいて、
入力パターンから、画素と画素とが繋がっている連結パ
ターンを抽出する。
【0024】次に、横長パターン抽出部11では、前記
抽出された連結パターンの内、複数の文字が繋がってい
る続き文字の候補として、横に長い横長パターンだけを
抽出する。
【0025】そして、水平続き線抽出部12では、文字
と文字を繋いでいる続き線を見つけることによって、前
記抽出された連結パターンが続き文字であるか否かを判
断し、水平続き線を抽出する。
【0026】その後、垂直分離線決定部13では、前記
抽出された水平続き線を基に、輪郭探索を用いて、文字
数、及び一文字毎の文字の存在する領域を求め、文字と
文字の間に垂直分離線を引く。
【0027】前記垂直分離線が決定すると、ゼロ判定部
14では、前記垂直分離線で分けられた一文字毎の文字
領域について、一文字毎に、数字のゼロであるか否かを
判定する。
【0028】この処理が終了すると、文字分離部15で
は、前記数字のゼロと判定された文字については、左右
に出ている不必要な続き線を消去し、数字のゼロ以外の
文字は、前記垂直分離線で分離する。このようにして、
文字の切り出しを行う。
【0029】(2) :文字切り出し回路2では、連結パタ
ーン抽出部10が、先ず、入力パターンの連結情報に基
づいて、入力パターンから、画素と画素とが繋がってい
る連結パターンを抽出する。
【0030】次に、横長パターン抽出部11では、前記
抽出された連結パターンの内、複数の文字が繋がってい
る続き文字の候補として、横に長い横長パターンだけを
抽出する。
【0031】そして、続き線抽出部46では、水平、或
いは斜めの文字と文字の繋がっている部分の続き線を見
つけることによって、前記抽出された連結パターンが続
き文字であるか否かを判断し、水平続き線、或いは斜め
続き線を抽出する。
【0032】その後、文字分離線決定部47では、抽出
された続き線を基に、輪郭探索を用いて、文字数、及び
一文字毎の文字の存在する領域を求め、文字と文字の間
に垂直分離線、或いは斜め分離線(文字分離線)を引
く。
【0033】前記文字分離線が決定すると、ゼロ判定部
14では、前記文字分離線で分けられた一文字毎の文字
領域について、一文字毎に、数字のゼロであるか否かを
判定する。
【0034】この処理が終了すると、文字分離部15で
は、前記数字のゼロと判定された文字については、左右
に出ている不必要な続き線を消去し、数字のゼロ以外の
文字は、前記垂直分離線で分離する。このようにして、
文字の切り出しを行う。
【0035】以上のようにして、文字の認識率の低下の
要因の一つとなっている続き文字を一文字ずつ分離する
際、従来のように、単語認識を必要としないで実現する
ことができる。また、前記文字切り出し回路2を使用す
れば、文字と文字との続き線が、水平方向でも、斜め方
向でも、確実に文字の分離ができる。
【0036】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。 (実施例1の説明)図2〜図10は、本発明の実施例1
を示した図であり、図2〜図10中、10は連結パター
ン抽出部、11は横長パターン抽出部、12は水平続き
線抽出部、13は垂直分離線決定部、14はゼロ判定
部、15は文字分離部を示す。
【0037】また、20はラベリング部、21はパター
ン面積/外接矩形算出部、22は抽出直線長さ決定部、
23は隣接投影値算出部、24は直線抽出部、25は直
線統合部、26は水平続き線決定部、27は水平続き線
矩形近似部、31は輪郭探索開始点決定部、32は輪郭
探索部、33は接続文字数決定部、34は文字領域決定
部、35は垂直分離線決定部、41は垂直分離線文字分
離部、42は続き部分消去部、43は文字間強制分離
部、44は文字分離処理部を示す。
【0038】§1:文字切り出し回路の基本構成の説明
・・・図2参照 図2は実施例1の文字切り出し回路基本構成図である。
手書き文字認識装置における文字切り出し回路基本構成
は、図2に示した通り、入力パターンの連結情報に基づ
いて、入力パターンから連結パターンを抽出する連結パ
ターン抽出部10と、抽出された連結パターンの内、複
数の文字が繋がっている続き文字の候補として、横に長
い横長パターンだけを抽出する横長パターン抽出部11
と、前記文字と文字を繋いでいる続き線を見つけること
によって、抽出された連結パターンが続き文字であるか
否かを判断し、水平続き線を抽出する水平続き線抽出部
12と、前記水平続き線の内、文字と文字とを垂直に分
離するための垂直分離線を決定する垂直分離線決定部1
3と、前記垂直分離線で分離した一文字毎の文字領域に
ついて、一文字毎に、数字のゼロであるか否かを判定す
るゼロ判定部14と、前記数字のゼロと判定された文字
について、文字領域を残し、不必要な続き部分を消去す
る文字分離部15とで構成する。
【0039】§2:文字切り出し方法の基本的な説明・
・・図3〜図5参照 図3は、文字切り出し方法説明図1、図4は文字切り出
し方法説明図2、図5は文字切り出し方法説明図3であ
る。以下、図3〜図5に基づいて、図2の文字切り出し
回路における図文字切り出し方法を説明する。
【0040】(1) :通常、自由に書かれた文字列、たと
えば、数字の文字列から、続き文字を抽出、分離する
際、文字に関しては、単独の文字と続き文字が混在して
おり、文字の大きさとか、続けて書かれている文字数に
も、特に規定がない。
【0041】そのため、入力された文字パターンに関し
て極端な傾き補正を行い、雑音を除去し、かすれの穴埋
め等の前処理を行った後の2値画像を文字切り出しの対
象とする。
【0042】本実施例では、文字と文字が続けて書かれ
ていると、横線で文字同士が繋がっていることが多いこ
とに着目して、その横線(以下「水平続き線」と記す)
を抽出することにより、続き文字を判別し、文字の分離
を行うようにしている。
【0043】(2) :文字切り出しを行う場合、先ず、文
字が配置されている位置の相対的な関係に依存すること
なく、各文字パターンを安定にピックアップするため
に、連結パターン抽出部10では、例えば、8連結で繋
がっているパターンをラベリング処理により抽出する。
【0044】具体的には、8連結のウインドウパターン
で文字パターンを走査して、該ウインドウで走査できた
画素に、所定の論理に基づいて、同じラベルを与える。
以下、これらのラベルを判別して、続き文字の分離を行
う。また、該ラベリング処理で得られた連結パターンの
サイズが、後で必要となるので、連結パターンを矩形近
似して得られる矩形の角の座標を、該ラベリングの処理
で算出しておくようにする。
【0045】前記ラベリング処理については、例えば
「画像処理の基本技法(技法入門編)、(Image Proces
sing on Personal Computer )、第1部画像処理の基
礎、第3章、画像処理の基本アルゴリズム、2)連結成
分処理,ラベリング,長谷川純一,興水大和,中山
晶,横中茂樹著,技術評論社,昭和61年8月10日
刊」に詳しい。
【0046】(3) :次の横長パターン抽出部11では、
続き文字の候補として、前記ラベリング処理で得られた
連結パターン毎に、外接矩形の縦横の比率を算出し、或
る一定の値以上の横長の比率を持つパターンを抽出す
る。
【0047】また、この処理では、例えば、連結パター
ンを矩形近似して抽出した文字領域の平均サイズを算出
し、この算出した平均サイズと比較することにより、前
記続き文字の候補パターンを抽出する。
【0048】(4) :水平続き線抽出部12では、初め
に、(パターン面積)/(外接矩形の面積)を算出し、
その値に従って、抽出する直線の長さを決定する。前記
の値が、大きい時には、図3のA図に示したように、
長い直線を抽出し、前記値が小さい時には、図3のB図
に示したように、短い直線を抽出する。
【0049】抽出する直線の長さを一定としない理由を
以下に説明する。 (5) :図3のA図、B図に示したように、前記(パター
ン面積)/(外接矩形の面積)=大の場合、図3のA図
に示したように、短い直線を抽出すると文字部分にも
多数の直線が抽出されるため、続き部分に限って直線を
抽出するには、図3のA図で示したように、比較的長
い直線の抽出を行う必要がある。
【0050】これに対して、前記(パターン面積)/
(外接矩形の面積)=小の場合には、図3のB図に示
したように、長い直線を抽出しようとしても、直線が抽
出されない場合が存在するため、図3のB図に示した
ように、短い直線を抽出して、それらを統合することに
より、長い続き線を求める方法が必要となるためであ
る。
【0051】(6) :次に、横方向の投影を行って直線の
抽出を行う。この時、投影値に周囲の行の投影値を足し
合わせたものを、その行の投影値とする。所謂隣接投影
の方法を用いる。この隣接投影の方法を用いることによ
り、斜めに繋がっている続き線を検出することができ
る。
【0052】図3のC図は、前記隣接投影を行う際の投
影範囲を説明する図である。前記隣接投影を行う際の投
影範囲は、前記抽出する直線の長さに従って、文字パタ
ーンを縦方向に分割を行い、その分割された範囲内で隣
接投影の処理を行う。
【0053】そして、該投影値が或る一定値以上である
と、その部分に直線があると認識し、抽出された直線の
存在する範囲を図3のD図に示したように、矩形近似し
て、矩形直線を形成する。
【0054】その後、図3のD図に示したように、接
触、または近隣の矩形直線を統合して長い直線を抽出
し、その中で一番長い直線を水平続き線とする。この水
平続き線も、矩形近似を行った矩形直線を用いる。
【0055】(7) :次に、垂直分離線決定部13では、
図4のA図に示したように、前記矩形近似された水平続
き線の下辺を端(例えば、左端)から辿っていき、文字
パターンと交差したところを輪郭探索の開始点とし、こ
の開始点から文字パターンの輪郭探索(図の矢印方向)
を行う。
【0056】そして、再び水平続き線の下辺と交差した
ら、輪郭探索を終了し、再び文字パターンと交差するま
で、水平続き線の下辺を辿り、同様の処理を繰り返す。
最終的に輪郭探索を行った回数を文字数とし、輪郭探索
の開始点から終了点までを一文字が存在している領域と
する。
【0057】前記処理が終了すると、図4のB図に示し
たように、前記の輪郭探索の終了点と開始点の間で、且
つ縦方向の線密度が1である部分を、文字と文字を分離
する垂直分離線とする。
【0058】(8) :ゼロ判定部14では、図4のC図に
示したように、垂直分離線と水平続き線に囲まれた一文
字領域内において、該水平続き線と文字パターンに囲ま
れた空白部分から、例えば、5方向放射状に(図示矢印
参照)線密度を算出し、全ての方向について、該算出し
た線密度が1(1本の文字パターンしか無かった)であ
ると、ループ構造をしたゼロであると判定する。
【0059】(9) :文字分離部15では、前記ゼロ判定
部14でゼロであると判定した文字について、水平続き
線は、ゼロという文字では、文字パターンではなく不必
要な線であるため、消去を行う。
【0060】具体的には、垂直分離線から消去を行い、
続き線の太さが急激に変化する部分、或いは続き線の傾
き、またはその傾きの微分値が急激に変化する部分まで
を、消去の範囲とする。
【0061】図5のA図は、2つのゼロという文字が続
き線で繋がってきた場合を示しており、図示されている
ように、該続き線を消去することにより、2つのゼロ文
字に分離される。
【0062】ゼロでないと判断された文字に関しては、
前記垂直分離線の部分で、他の文字と分離を行うが、図
5のB図に示したように、続き線の消去は行わない。垂
直分離線が無い場合は、後述する処理により強制分離を
行う。
【0063】(10):前記の文字切り出し方法により、接
続文字数、または文字の大きさが未知である続き文字で
あっても、確実に文字分離を行うことが可能である。ま
た、隣接投影法を用いることにより、続き線が水平でな
い場合であっても、抽出することができる。
【0064】更に、前記(パターン面積)/(外接矩形
の面積)の値によって、抽出する直線の長さを変えるこ
とで、続き線が水平でない場合であっても、該続き線を
抽出することが可能である。
【0065】また、ゼロ判定部において、水平続き線よ
り下部だけの文字パターンを用いて判定することで、ゼ
ロの上部にループを持つようなゼロ文字であっても、ゼ
ロの上部に空白がある場合であっても、ゼロの文字を判
定することが可能である。
【0066】そして、前記ゼロ判定を行うことによっ
て、ゼロに接続している不必要な続き線を消去すること
ができる。 §3:文字切り出し回路の構成の説明・・・図6参照 図6は実施例1の文字切り出し回路構成図である。以
下、図6に基づいて、文字切り出し回路の構成を説明す
る。
【0067】図2に示したように、実施例1の文字切り
出し回路は、基本的には、連結パターン抽出部10、横
長パターン抽出部11、水平続き線抽出部12、垂直分
離線決定部13、ゼロ判定部14、文字分離部15で構
成するが、これら各部は更に、図6の通り構成する。
【0068】(1) :連結パターン抽出部10には、ラベ
リング処理を行うラベリング部20を設ける。 (2) :水平続き線抽出部12には、(パターン面積)/
(外接矩形の面積)を算出するパターン面積/外接矩形
算出部21と、抽出する直線の長さを決定する抽出直線
長さ決定部22と、隣接投影値を算出する隣接投影値算
出部23と、直線の抽出を行う直線抽出部24と、抽出
した直線を統合する直線統合部25と、水平続き線を決
定する水平続き線決定部26と、水平続き線の矩形近似
を行う水平続き線矩形近似部27を設ける。
【0069】(3) :垂直分離線決定部13には、輪郭探
索を行う場合の探索開始点を決定する輪郭探索開始点決
定部31と、決定した輪郭開始点から順次輪郭の探索を
行う輪郭探索部32と、接続している文字数を決定する
接続文字数決定部33と、文字領域を決定する文字領域
決定部34と、垂直分離線を決定する垂直分離線決定部
35を設ける。
【0070】(4) :文字分離部15には、垂直分離線で
文字を分離する(ゼロでない時)垂直分離線文字分離部
41と、続き部分の消去を行う(ゼロの時)続き部分消
去部42と、垂直分離線が無い場合に、文字間で強制的
に分離を行う文字間強制分離部43と、最後に、文字の
分離処理を行う文字分離処理部44を設ける。
【0071】§4:文字切り出し回路の各部の処理説明
・・・図7〜図10参照 図7は実施例1の処理フローチャート(その1)、図8
は実施例1の処理フローチャート(その2)、図9は実
施例1の処理フローチャート(その3)、図10は実施
例1の処理例を示した図である。
【0072】以下、前記文字切り出し回路の処理を説明
するが、連結パターン抽出部10と、横長パターン抽出
部11と、水平続き線抽出部12中のパターン面積/外
接矩形算出部21と、抽出直線長さ決定部22について
は、前記説明の通りであり、特に、パターン面積/外接
矩形算出部21と、抽出直線長さ決定部22について
は、図3にその処理を示してあるので、ここでは処理の
説明は省略する。従って、前記各部以外の処理を順次詳
細に説明する。
【0073】(1) :隣接投影値算出部23の処理説明・
・・図7のA図、B図参照 図7のA図は隣接投影値算出処理のフローチャート、B
図は処理説明図である。以下、図7のA図、B図に基づ
いて、隣接投影値算出部23の処理を説明する。なお、
S1〜S4は処理ステップを示す。
【0074】隣接投影値算出部23による隣接投影値算
出処理は、横方向の投影値にその周囲の行の値を加えた
ものを、その行の投影値とする投影方法を用いて行う処
理である。
【0075】図7のB図で説明すると次のようになる。
すなわち、斜め線の投影値(点線部分)では、意味のあ
るピーク値が得られず、多少傾きのある横線を抽出する
ことができないので、このような斜め線に対して、注目
している行iの上下の行i+1と、i−1の行(前記行
i+1と、i−1の1は、1でなくても良い)の投影値
を、行iの投影値に加算することで、実線で示したよう
に、直線と認識できる程度の投影値を得ることができ
る。
【0076】A図のフローチャートについて説明する
と、先ず、文字パターンを縦方向に、複数の部分に分割
し(S1)、それぞれの分割範囲内で、水平投影値を算
出し(S2)、それぞれの投影値に、周囲の投影値を加
算して(S3)、隣接投影値を算出する(S4)。
【0077】(2) :直線抽出部24と、直線統合部25
の処理説明・・・図7のC図参照 図7のC図は直線抽出処理のフローチャートである。以
下、図7のC図に基づいて、直線抽出処理を説明する。
なお、S11〜S17は、各処理ステップを示す。
【0078】前記隣接投影値算出部23で算出した投影
値に基づいて、直線抽出部24と直線統合部25で直線
を抽出している。C図のフローチャートについて説明す
ると、先ず、前記隣接投影値算出部23で算出した隣接
投影値を、一定の閾値と比較し(S11)、(隣接投影
値 >一定の閾値)の条件を満たした場合、該当する線
分が存在すると認識し(S12)、前記条件を満たして
いない場合は、線分が存在しないと認識する(S1
6)。
【0079】そして、前記処理で、線分が存在すると認
識した場合、認識した線分が、上下の線分と接している
か否かを判断し(S13)、上下の線分と接していなけ
れば、そのまま矩形直線を生成し(S17)、上下の線
分と接していれば、それらの線分を、図3のD図のよう
に統合して(S14)、矩形直線を生成する(S1
5)。
【0080】(3) :水平続き線決定部26、及び水平続
き線矩形近似部27の処理説明・・・図7のD図参照 図7のD図は直線統合処理のフローチャートである。以
下、図7のD図に基づいて、直線統合処理を説明する。
なお、S21〜S24は、各処理ステップを示す。
【0081】先ず、前記のようにして生成された矩形直
線同士の距離を、水平方向の行を単位として算出(2つ
の矩形直線が接している時には、距離0とし、一行ずれ
ている時には、距離1として算出する)する(S2
1)。
【0082】そして、算出された距離と隣接投影の際に
加える行数とを比較して(S22)、(算出距離 <
隣接投影の際加える行数)の条件を満たしていれば、隣
接している矩形直線として統合する(S23)が、前記
条件を満たしていない場合には、統合をしない(S2
4)ようにする。
【0083】このような処理により、図3のD図に示し
たような矩形直線を統合して、合理的に続き線を検出す
ることができる。 (4) :輪郭探索開始点決定部31と、輪郭探索部32の
処理説明・・・図8のA図参照 図8のA図は輪郭探索開始点決定と輪郭探索処理のフロ
ーチャートである。以下、図8のA図に基づいて、輪郭
探索開始点決定部31と、輪郭探索部32の処理を説明
する。なお、S31〜S37は各処理ステップを示す。
【0084】前記処理で、矩形近似した水平続き線の左
端を開始点(図4のA図、B図参照)とし(S31)、
この開始点から、矩形近似した水平続き線の下辺を右に
辿る(S32)。
【0085】この処理で、矩形近似された水平続き線の
右端に達した場合には(S33)、矩形近似された線分
が存在するのみで、続き文字が無いとして、処理を終了
する。前記処理で、矩形近似された水平続き線の右端に
達することなく、文字パターンと交差した場合(S3
4)には、その交差位置を輪郭探索の開始点とする(S
35)。
【0086】また、矩形近似した水平続き線の下辺より
下部の範囲で、文字パターンの輪郭探索(図4のA図参
照)を行い(S36)、再び矩形近似した水平続き線の
下辺に達したら(S37)、S32の処理に戻って水平
続き線の下辺を右に辿る処理に入る。
【0087】ここで、矩形近似した水平続き線の下辺の
右に達した時には、これ以上、輪郭探索するための続き
文字が無いとして、輪郭探索の処理を終了する。 (5) :垂直分離線決定処理説明・・・図8のB図参照 図8のB図は垂直分離線決定処理フローチャートであ
る。以下、図8のB図に基づいて、垂直分離線決定処理
を説明する。なお、S41、S42、S43は各処理ス
テップを示す。
【0088】この処理は、接続文字数決定部33と、文
字領域決定部34と、垂直分離線決定部35が行う処理
である。前記輪郭探索部32が輪郭探索を終了すると、
垂直分離線を決定する処理、すなわち、接続文字数決定
部33と、文字領域決定部34と、垂直分離線決定部3
5の処理に入る。
【0089】先ず、前記輪郭探索処理で得られた輪郭探
索の終了点と、次の輪郭探索の開始点との間で、線密度
が1の部分であるか否かを見て(S41)、もし、線密
度が1の部分がある場合には、その部分に垂直線を引い
て、該文字パターンの垂直分離線とし、続き文字の文字
に分離する(S42)。
【0090】しかし、輪郭探索の終了点と、次の輪郭探
索の開始点との間で、線密度が1の部分が無かった場合
には、矩形近似された水平続き線の内部(矩形直線の内
部)を、前記輪郭探索の終了点と、次の探索の開始点と
の中点で切断して、続き文字を分離する(S43)。
【0091】例えば、2つの続き文字であるゼロが傾い
ていて、輪郭探索の終了点と、次の輪郭探索の開始点と
の間で、線密度が1とならない場合が対応する。このよ
うにして、続き文字の数、及びそれぞれの分離された文
字の領域が決定される。すなわち、前記輪郭探索を行っ
た数が、続き文字の数に対応し、該輪郭探索を行った領
域が、各分離された文字の領域となる。
【0092】(6) :ゼロ判定処理の説明・・・図9参照 図9はゼロ判定処理のフローチャートである。以下、図
9に基づいて、ゼロ判定処理を説明する。
【0093】前記のようにして分離した文字パターンが
形成している文字がゼロであるか否かを判定する処理
は、次のようにして行う。先ず、前記処理で生成した左
右の垂直分離線に囲まれた一文字の領域内で、前記水平
続き線と、文字パターンに囲まれた空白部分を探索し
(S51)、該空白部分が無い時は、ゼロ以外の別の文
字として、他の処理へ移るが、該空白部分が見つかった
場合には、空白部分の主走査方向の位置で、且つ前記矩
形近似された水平続き線の下辺のわずかに下がった地点
を求める(S52)。
【0094】そして、求めた地点から、5方向の放射状
に、当該文字パターンの外接矩形の領域内において、線
密度を算出し(S53)、その時、左右の垂直分離線、
または外接矩形の下辺に達したかどうかを見る(S5
4)。
【0095】その結果、左右の垂直分離線、または外接
矩形の下辺に達した場合に、前記5方向の全ての線密度
が1であるか否かを判断し(S55)、線密度が1であ
れば、その文字は、ゼロ文字であると判定(S56)
し、該5方向の全ての線密度が1でない時には、その文
字はゼロでないと判定する(S57)。
【0096】前記ゼロ判定処理は、ゼロ判定部14で行
うが、この処理は既に図3、図4に基づいて説明してあ
るので、ここでは詳細な説明は省略する。 (7) :処理結果の説明・・・図10参照 図10は実施例1の処理例を示した図である。図10で
は、続き文字を切り出し処理した場合の例を示してお
り、A図はゼロの上にループを持っている場合の処理例
を示している。また、B図はゼロの上部に空白がある場
合の処理例を示している。
【0097】前記のように、実施例1では、或る入力パ
ターンに対して、連結パターン抽出部10が、画素と画
素とが繋がっているパターンを抽出した後、横長パター
ン抽出部11が、続き文字の候補として、横に長いパタ
ーンだけを抽出する。
【0098】その後、水平続き線抽出部12が、横方向
の投影値に、その周囲の行の投影値を加えて、その行の
投影値と隣接する隣接投影法を用いて、多少の傾きのあ
る横線も含めて、水平続き線の抽出を行い、垂直分離線
決定部13が、輪郭探索を行って、文字数、及び一文字
毎の文字の存在する領域を求め、文字間に、文字を分離
するための垂直分離線を引く。
【0099】次に、ゼロ判定部14が、一文字毎にゼロ
判定を行い、文字分離部15が、ゼロと判定された文字
に関して左右に出ている不必要な続き線を消去し、ゼロ
以外の文字では、前記水平分離線で分離を行う。
【0100】(実施例2の説明)図11〜図21は、本
発明の実施例2を示した図であり、図11〜図21中、
図1〜図10と同じものは、同一符号で示してある。ま
た、46は続き線抽出部、47は文字分離線決定部、5
0は水平方向隣接投影値算出部、51は水平方向直線抽
出部、52は水平続き線抽出部、53は斜め隣接投影値
算出部、54は斜め直線抽出部、55は斜め直線統合
部、56は斜め続き線抽出部、57は斜め続き線矩形近
似部、60はパターン傾き算出部、61は斜め分離線決
定部、62は傾き補正部、63は再傾き補正部を示す。
【0101】§1:実施例2の基本的な説明・・・図1
1参照 図11は実施例2のパターン説明図であり、A図は水平
続き線無しのパターン、B図は垂直分離線無しのパター
ン、C図は斜め続き線の説明図、D図は斜め分離線の説
明図である。
【0102】文字と文字が続けて書かれると、横線で文
字同士が繋がる場合が多い。前記実施例1では、その水
平続き線を検出することによって、続き文字を判別し、
文字の分離を行っている。
【0103】しかし、文字と文字の繋がった部分である
続き線は、横方向水平なものだけが検出可能であったた
め、例えば、A図に示したパターンのように、続き線が
斜めの場合、続き線の検出ができなかった。
【0104】また、文字と文字を分離する分離線に関し
ては、垂直な線を分離線としていたために、例えば、B
図に示したように、文字と文字が上下に重なっているパ
ターンの場合には、分離線を引くことができなかった。
【0105】そこで、実施例2では、文字と文字を繋い
でいる続き線の検出に関しては、水平続き線の抽出に加
えて、斜め方向に隣接投影を行うことにより、斜めの続
き線(以下、「斜め続き線」と記す)の検出を行うよう
にしたものである。
【0106】このようにして、例えば、C図に示したパ
ターンについても、斜め続き線の検出により、続き線の
検出ができるようになる。そして、続き線検出後の処理
は、前記実施例1と同様の処理を行う。
【0107】また、文字と文字を分離する分離線に関し
ては、文字と文字が上下に重なった場合のように、垂直
線密度1の部分が無ければ、斜めの直線を分離線(以下
「斜め分離線」と記す)とする。例えば、D図に示した
パターンでは、斜め分離線により、文字と文字を分離す
ることが可能である。
【0108】この場合、注目しているパターンの傾きを
算出し、その傾きに従って、分離線の傾きを決定する。
そして、前記の傾きに従って、斜め方向に線密度を算出
し、一文字領域間で、線密度1の直線を検出し、分離線
とする。
【0109】分離線が見つからなかった場合に限り、パ
ターンの傾きの補正を行い、再び続き線抽出から処理を
行う。 §2:文字切り出し回路の基本構成の説明・・・図12
参照 図12は実施例2の文字切り出し回路基本構成図であ
る。実施例2においては、手書き文字認識装置における
文字切り出し回路の基本構成を、連結パターン抽出部1
0と、横長パターン抽出部11と、続き線抽出部46
と、文字分離線決定部47と、ゼロ判定部14と、文字
分離部15とで構成する。
【0110】前記構成において、続き線抽出部46は、
水平方向と斜め方向に対し、文字と文字を繋いでいる続
き線(水平続き線、及び斜め続き線)を見つけることに
よって、前記抽出された連結パターンが続き文字である
か否かを判断するものである。
【0111】また、文字分離線決定部47は、垂直分離
線、或いは斜め分離線を見つけることにより、前記続き
線抽出部46で検出された続き線の内、文字と文字の分
離箇所を見つけるものである。なお、他の構成は、前記
実施例1と同じなので、説明は省略する。
【0112】§3:文字切り出し回路の構成の説明・・
・図13参照 図13は実施例2の文字切り出し回路構成図である。図
12に示したように、実施例2の文字切り出し回路は、
基本的には、連結パターン抽出部10、横長パターン抽
出部11、続き線抽出部46、文字分離線決定部47、
ゼロ判定部14、文字分離部15で構成するが、これら
各部は更に、図13の通り構成する。
【0113】(1) :連結パターン抽出部10には、ラベ
リング処理を行うラベリング部20を設ける。 (2) :続き線抽出部46には、(パターン面積)/(外
接矩形の面積)を算出するパターン面積/外接矩形算出
部21と、抽出する直線の長さを決定する抽出直線長さ
決定部22と、水平方向の隣接投影値を算出する水平方
向隣接投影値算出部50と、水平方向の直線の抽出を行
う水平方向直線抽出部51と、直線の統合を行う直線統
合部25と、水平続き線の抽出を行う水平続き線抽出部
52と、水平続き線の矩形近似を行う水平続き線矩形近
似部27と、斜め隣接投影値の算出を行う斜め隣接投影
値算出部53と、斜め直線の抽出を行う斜め直線抽出部
54と、斜め直線の統合を行う斜め直線統合部55と、
斜め続き線の抽出を行う斜め続き線抽出部56と、斜め
続き線の矩形近似を行う斜め続き線矩形近似部57とを
設ける。
【0114】(3) :文字分離線決定部47には、輪郭探
索を行う場合の探索開始点を決定する輪郭探索開始点決
定部31と、決定した輪郭開始点から順次輪郭の探索を
行う輪郭探索部32と、接続している文字数を決定する
接続文字数決定部33と、文字領域を決定する文字領域
決定部34と、垂直分離線を決定する垂直分離線決定部
35と、パターンの傾きを算出するパターン傾き算出部
60と、斜め分離線の決定を行う斜め分離線決定部61
を設ける。
【0115】(4) :文字分離部15には、垂直分離線で
文字を分離する(ゼロでない時)垂直分離線文字分離部
41と、続き部分の消去を行う(ゼロの時)続き部分消
去部42と、文字の分離処理を行う文字分離処理部44
を設ける。
【0116】(5) :前記の外に、斜め分離線が無い場合
に、傾き補正を行うための傾き補正部62と、再度傾き
の補正を行うための再傾き補正部63等を設ける。 §4:文字切り出し方法の説明・・・図14〜図19参
照 図14は続き線抽出部の処理説明図(その1)、図15
は続き線抽出部の処理説明図(その2)、図16は続き
線抽出部の処理説明図(その3)、図17は文字分離線
決定部の処理説明図、図18はゼロ判定部の処理説明
図、図19は文字分離部の処理説明図である。
【0117】以下、前記文字切り出し回路による文字切
り出し方法を説明する。実施例2では、自由に書かれた
文字列から、続き文字を抽出、分離する処理を行う。文
字に関しては、単独の文字と、続き文字とが混在してお
り、文字の大きさ、続けてかかれた文字数に規定はない
ものとする。
【0118】入力パターンに関しては、極端な傾きの補
正を行い、雑音を除去し、かすれの穴埋め等の前処理を
行った後の2値画像を用いる。 (1) :連結パターン抽出部10の処理説明 先ず、文字が配置される位置の相対的な関係に依存する
ことなく、各パターンを安定にピックアップするため
に、連結パターン抽出部10では、8連結で繋がってい
るパターンを、ラベリング部20によるラベリング処理
で抽出する。
【0119】以下、これらを判別して、続き文字の分離
を行う。また、ラベリングで得られた連結パターンのサ
イズが、後に必要となるので、連結パターンを矩形近似
して得られる矩形の角の座標をラベリングの処理中に算
出しておく。
【0120】(2) :横長パターン抽出部11の処理説明 横長パターン抽出部11では、続き文字の候補として、
前記ラベリングで得られた連結パターン毎に、外接矩形
の縦横比を算出し、或る一定の値以上の横長の比率を持
つパターンを抽出する。
【0121】(3) :続き線抽出部46の処理説明 続き線抽出部46では、前記横長パターン抽出部11で
抽出したパターンから続き線の抽出を行う。先ず、パタ
ーン面積/外接矩形算出部21により、(パターンの面
積)/(外接矩形の面積)を算出し、抽出直線長さ決定
部22が、前記算出した値に従って、抽出する直線の長
さを決定する。
【0122】値が大きい時には、長い直線を抽出し、値
が小さい時には短い直線を抽出する。そして、始めに、
水平方向隣接投影値算出部50では、横方向の隣接投影
(注目している行の投影値に、周囲の行の投影値を足し
合わせたものを、その行の投影値とする投影方法を用い
る)を行って投影値を算出し、水平方向直線抽出部51
が水平な直線の抽出を行う。
【0123】投影範囲は、パターンを前記の抽出する直
線の長さに従って、縦方向に分割を行い、その範囲内で
処理を行う。投影値が或る一定値以上であれば、その部
分に直線が存在すると判断する。
【0124】抽出された直線の存在する範囲を矩形近似
し、以下、これを「矩形直線」とする。直線統合部25
では、接触または近隣の矩形直線を統合することによ
り、水平続き線抽出部52では、長い直線を抽出し、そ
の中で一番長い直線を水平続き線とする。
【0125】前記抽出した水平続き線は、水平続き線矩
形近似部27により、矩形近似して、文字分離線決定部
47へ送る。前記水平続き線抽出部52の処理で、水平
続き線の抽出ができなかった場合には、斜め隣接投影値
算出部53が、斜め隣接投影値の算出を行い、斜め直線
抽出部54が斜め直線を抽出する。以下、これらの処理
を詳細に説明する。
【0126】(a):斜め方向の隣接投影法説明・・・
図14、図15参照 図14のA図は斜めの投影値算出方法説明図、図14の
B図は斜めの隣接投影法説明図、図15のA図は原画像
の説明図、図15のB図は直線抽出(傾き45度)の説
明図、図15のC図は斜め投影値の算出の説明図であ
る。
【0127】斜め方向の隣接投影法は、或る一定の斜め
方向に投影を行い、注目している斜め線の投影値に、そ
の周囲の投影値を足し合わせた結果を、斜め線の投影値
とする方法である。図14のA図は、n×nの領域を、
45度の角度で斜めに投影を行った場合の投影値の算出
方法を示している。
【0128】この例では、縦方向の投影値をP1(i)
(i=1〜n)、横方向の投影値をP2(j)(j=1
〜n)とし、P1(n)=P2(1)とする。また、以
下に説明する式で、I(x,y)を画素値としている。
この場合、前記投影値P1(i)、及びP2(j)の算
出式は、次の通りである。
【0129】
【数1】
【0130】斜め投影値の算出は、図14のB図に示し
たように、i番目の投影値をP(i)とすると、斜め隣
接投影値P(i)は、次の式で表現できる。なお、zは
足し合わせる周囲の投影値の数を示す。
【0131】先ず、図の左上の領域の場合は、P(i)
=p1(i−z)+p1(i−z+1)+・・・+p1
(i)+・・・+p1(i+z)となる。また、右上の
領域の場合は、P(j)=p2(j−z)+p2(j−
z+1)+・・・+p2(j)+・・・+p2(j+
z)となる。
【0132】ここで、i=zの場合は、P(i)=p1
(i−z)+p1(i−z+1)+・・・+p1(i)
・・・+p1(z)となる。なお、図14のB図の場
合、斜めの隣接投影値は、P(i)=p(i−1)+p
(i)+p(i+1)である。
【0133】具体例を図15について説明する。例え
ば、図15のA図に示したような原画像があるとする。
この図では、各画素を四角印で示してある。直線抽出を
行う場合、図15のB図に示したように、X−Y座標で
傾きが45度の場合は、X方向に1進んだら、Y方向に
1進む。同様に、45度以外の場合にも、XとYとの整
数比を算出し、その比に従って、投影値を算出する。
【0134】例えば、前記の式において、z=1、閾値
=10とすると、図15のA図の場合、10番目が直線
として抽出される。また、図15のC図では、X方向の
増加数と、Y方向の増加数の比は、1対2となってい
る。
【0135】(b):斜め隣接投影値算出から、斜め続
き線の検出までの具体例による処理説明・・・図16参
照 図16のA図はパターンの分割の説明図、図16のB図
は抽出された矩形直線の説明図、図16のC図は統合し
て抽出した長い直線の説明図である。
【0136】斜め隣接投影値算出部53では、図16の
A図のように、パターンを横複数に分割し、それぞれの
分割範囲内で、斜めの隣接投影を行う。この場合、隣接
投影値と分割長との比が、或る一定値以上になった行に
直線が存在するものとする。
【0137】斜め直線抽出部54では、図16のB図に
示したように、抽出された直線の存在する範囲を矩形近
似して、矩形直線を抽出する。その後、斜め直線統合部
55では、図16のC図に示したように、接触、または
近隣の矩形直線を統合することにより、長い直線を抽出
し、斜め続き線抽出部56は、統合された直線の中で、
最も長い直線を斜め続き線とする。そして、斜め続き線
矩形近似部57では、前記斜め続き線を矩形近似して出
力する。
【0138】(4) :文字分離線決定部47の処理説明・
・・図17参照 図17のA図、B図はパターンの傾き算出の説明図、図
17のC図は文字分離線決定の説明図である。
【0139】文字分離線決定部47では、輪郭探索開始
点決定部31、輪郭探索部32、接続文字数決定部3
3、文字領域決定部34、垂直分離線決定部35によ
り、実施例1と同様な処理を行う。
【0140】すなわち、矩形近似された水平続き線の下
辺を端から辿っていき、パターンと交差したところを輪
郭探索の開始点として輪郭探索を行う。そして、再び下
辺と交差したら、探索を終了し、再びパターンと交差す
るまで、下辺を辿り、同様の処理を繰り返す。最終的に
探索を行った回数を文字数とし、探索の開始点から終了
点までを、一文字が存在している領域とする。
【0141】探索終了点と開始点との間で、且つ縦方向
の線密度が1である部分を、文字と文字を分離する垂直
分離線とする。また、縦方向の線密度1の部分が無い場
合には、斜め線で文字分離を行う。この場合、分離線の
傾きは、パターンの傾きを用いる。パターンの傾きの算
出は、パターン傾き算出部60が、例えば、以下に説明
する式を用いて算出するが、この処理の詳細は、例え
ば、次の文献を参照されたい。
【0142】「F.Kimura, M.Shridhar and Z.Chen "Imp
rovement of Lexicon Directed Algorithm Recognition
of Unconstrained Handwritten Words" Proceeding of
Second International Conference on Document Analy
sis and Recognition,Tsukuba Science City, Japan 19
93,IEEE Computer Society Press, P.18〜P.22」。
【0143】前記のように、一文字領域間で、前記の傾
きに従って、線密度を求め、線密度1のところで前記の
傾きを持つ分離線(斜め分離線)を引く。この斜め分離
線を決定するのは、斜め分離線決定部61が処理を行
う。
【0144】前記パターンの傾きを算出する場合、例え
ば、図17のA図、B図に示したように、隣接画素n
1、n2、n3の方向が図示矢印方向にあるものとす
る。このような隣接画素n1、n2、n3に対し、n1
の総数をN1、n2の総数をN2、n3の総数をN3と
し、パターンの傾き角をθとすると、tanθ=(N1
+N2+N3)/(N3−N1)の式が成立する。
【0145】すなわち、図17のC図に示したように、
水平軸に対する斜め分離線の角度θは、tanθ=(N
1+N2+N3)/(N3−N1)の式で与えられる。 (5) :ゼロ判定部14の処理説明・・・図18参照 図18のA図、B図は線密度の算出処理を示した図であ
る。ゼロ判定部14は、続き線(水平続き線、及び斜め
続き線)と、分離線(垂直分離線、斜め分離線)に囲ま
れた一文字領域内において、図18に示したように、続
き線とパターンに囲まれた空白部分から、複数方向放射
状に線密度を算出し、全ての方向について線密度が1で
あれば、ループ構造をしたゼロであると判定する。
【0146】(6) :文字分離部15の処理説明・・・図
19参照 図19のA図、B図は文字分離部の処理説明図である。
文字分離部15では、ゼロ判定部14でゼロであると判
定された文字に関しては、続き文字ではなく、不必要な
線であるため、消去を行う。
【0147】この場合、分離線から線の傾きが急激に変
化する部分までを消去範囲とする。図19のA図に示し
たように、一定範囲内に傾きの変化が殆ど無い場合は、
続き線の消去は行わない。すなわち、a部分は、傾きに
急激な変化が無いため消去しない部分であり、b部分
は、傾きに急激な変化がある所まで消去する部分であ
る。
【0148】また、ゼロと判定されたパターンの内部
に、図19のB図に示したように、ループがあった場
合、後の認識処理において、誤認識等の悪影響を少なく
するために、内部の線の消去も行う。ゼロでないと判定
された文字に関しては、分離線で他の文字と分離を行
い、水平続き線の消去は行わない。前記のように、ゼロ
判定において、続き線の下部のみをゼロ判定の対象とす
るのではなく、上部に注目し、他のゼロ判定されたパタ
ーンと比較して、著しく上部のパターンの大きさが異な
るものはゼロと判定しないことにより、ゼロ判定の精度
を向上させることが可能である。 また、文字領域を残し
て不必要となった部分を消去する処理において、分離線
から或る一定領域のパターンの傾き、太さに変化の無い
場合は、ゼロ判定されても続き部分消去を行わないこと
で、消去のしすぎをなくすことが可能である。
【0149】(7) :その他の説明 (a):斜め分離線決定部61の処理で、斜め分離線無
しとなった場合、傾き補正部62では、傾きを補正し、
再び続き線抽出部46で続き線抽出処理を行う。そし
て、前記各部の処理を行った後、再傾き補正部63で再
び傾きの補正を行う。
【0150】この処理で分離線があれば、ゼロ判定部1
4でゼロ判定を行い、分離線が無ければ、分離線無しと
して処理を終了する。 (b):前記傾き補正を行う際に、補正前と補正後の画
像を用意し、補正後の画像における文字分離場所の補正
前の画像での位置を算出し、補正前の画像において、前
記の部分で文字分離を行う。
【0151】(c):前記続き線を抽出する処理で、続
き線がパターンの下部にある場合は、続き線の上部を探
索し、繋がっている文字数の算出を行うことにより、文
字の分離を行うことができる。
【0152】(d):文字と文字の分離線を見つける処
理において、一文字領域と一文字領域に挟まれた範囲内
で、空白部分の探索を行うことにより、分離線を見つけ
ることができる。
【0153】§5:フローチャートによる文字切り出し
方法の説明・・・図20、図21参照 図20は実施例2の処理フローチャート(その1)、図
21は実施例2の処理フローチャート(その2)であ
る。
【0154】(1) :斜め方向隣接投影値算出処理の説明
・・・図20のA図参照 図20のA図は斜め方向隣接投影値算出処理のフローチ
ャートである。以下、図20のA図に基づいて、斜め隣
接投影値算出部53が行う斜め方向隣接投影算出処理を
説明する。なお、S61〜S64は各処理ステップを示
す。
【0155】この処理は、水平続き線抽出部52の処理
で、水平続き線が抽出されず、水平方向の矩形直線が無
い場合(S61)に、先ず、斜め隣接投影値算出部53
が一定の傾きに沿って、投影値を算出する(S62)。
【0156】その後、算出したそれぞれの投影値に、周
囲の投影値を加え(S63)、斜め方向の隣接投影値を
算出する(S64)。 (2) :斜め直線抽出処理の説明・・・図20のB図参照 図20のB図は斜め直線抽出処理のフローチャートであ
る。以下、図20のB図に基づいて、斜め直線抽出部5
4が行う斜め直線抽出処理を説明する。なお、S71〜
S77は各処理ステップを示す。
【0157】斜め直線抽出部54は、前記(斜め隣接投
影値 > 一定閾値)の条件を満たしているか否かを判
断し(S71)、この条件を満たしていない場合は、線
分でないとする(S76)。
【0158】しかし、前記条件を満たしている場合は、
線分であるとして(S72)、次に、上下の線分と接し
ているか否かを判断する(S73)。その結果、上下の
線分と接していなければ、矩形直線と判断する(S7
7)が、上下の線分と接している場合には、それらを統
合し(S74)、矩形直線とする(S75)。
【0159】(3) :斜め直線統合処理の説明・・・図2
0のC図参照 図20のC図は斜め直線統合処理のフローチャートであ
る。以下、図20のC図に基づいて、斜め直線統合部5
5が行う斜め直線統合処理を説明する。なお、S81〜
S84は各処理ステップを示す。
【0160】斜め直線統合部55では、前記検出された
矩形直線同士の距離を算出し(S81)、算出距離<隣
接投影の際加える行数の条件を満たしているか否かを判
断する(S82)。
【0161】その結果、前記条件を満たしていない場合
には、矩形直線の統合は行わず(S84)、前記条件を
満たしている場合には、前記矩形直線の統合を行う(S
83)。
【0162】(4) :分離線決定部の行う分離線決定処理
の説明・・・図21参照 図21は分離線決定処理のフローチャートである。以
下、図21に基づいて、文字分離線決定部47が行う処
理を説明する。なお、S91〜S101は各処理ステッ
プを示す。
【0163】文字分離線決定部47では、輪郭探索の終
了点と、探索の開始点との間で縦線密度1の部分がある
か否かを判断し(S91)、縦線密度1の部分があれ
ば、その部分に垂直線を引き、垂直分離線とする(S9
2)。
【0164】しかし、縦線密度1の部分がなければ、パ
ターンの傾きを求め(S93)、傾きに沿って線密度を
算出する(S94)。そして、輪郭探索の終了点と、開
始点との間で線密度1の部分があるか否かを判断し(S
95)、線密度1の部分があれば、斜め分離線を引く
(S96)。
【0165】また、輪郭探索の終了点と、開始点との間
で線密度1の部分がなければ、パターンの傾きの補正を
行い(S97)、処理の始め(水平方向の隣接投影)か
ら再度処理を行う(S98)。
【0166】その後、水平分離線、或いは斜め分離線が
あるか否かを判断し(S99)、なければ処理を終了す
るが(S101)、有れば、水平分離線、或いは斜め分
離線を引く(S100)。
【0167】
【発明の効果】以上説明したように、本発明によれば次
のような効果がある。 (1) :従来のように、単語認識を必要とすることなく、
接続文字数、または文字の大きさが未知である続き文字
であっても、確実に文字分離を行うことが可能である。
【0168】(2) :隣接投影法を用いることにより、続
き線が水平でない場合(多少の傾きがある場合)であっ
ても、抽出することが可能である。 (3) :(パターンの面積)/(外接矩形の面積)の値に
よって、抽出する直線の長さを変えることにより、続き
線が水平でない場合であっても、続き線を抽出すること
ができる。
【0169】(4) :ゼロ判定において、水平続き線より
下辺だけの文字パターンを用いて判定することにより、
ゼロの上部にループを持つようなゼロ文字であっても、
また、ゼロの上部に空白がある場合であっても、ゼロの
文字を判別することができる。
【0170】(5) :ゼロ判定を行うことにより、ゼロに
接続してある不必要な続き線を消去することができる。 (6) :続き線が極端に斜めであっても、斜め方向の隣接
投影を用いることにより、斜め方向の続き線の検出が可
能となり、文字分離を行うことができる。
【0171】(7) :斜め隣接投影について、斜め線の傾
きを決めるX方向の増加量と、Y方向の増加量との比を
整数とすることにより、全ての画素について、処理を行
うことが可能となる。
【0172】(8) :接続している文字が、上下に重なっ
ている場合でも、斜めに分離線を引くことにより、確実
に文字分離を行うことが可能となる。 (9) :パターンの傾きに従った斜め方向の線密度が1で
ある部分が存在しない場合に、パターンの傾き補正を行
うことで、分離線を引くことが可能となる。
【0173】(10):傾き補正を行う際に、補正前と補正
後の画像を用意し、補正後の画像における文字分離場所
の補正前の画像での位置を算出し、補正前の画像におい
て、前記の部分で文字分離を行うことで、補正後の画像
を、再び傾き補正を行い、元の傾きに戻す処理を行わず
に済む。従って、処理時間の短縮ができる。
【0174】(11):ゼロと判定された文字の不必要な続
き部分を消去後、ゼロのループ内の余分な線を消去する
ことにより、続き文字分離処理後に行う認識処理への悪
影響を少なくすることが可能となる。
【0175】(12):ゼロ判定において、続き線の下部の
みをゼロ判定の対象とするのではなく、上部に注目し、
他のゼロ判定されたパターンと比較して、著しく上部の
パターンの大きさが異なるものはゼロと判定しないこと
により、ゼロ判定の精度を向上させることが可能であ
る。
【0176】(13):文字領域を残して不必要となった部
分を消去する処理において、分離線から或る一定領域の
パターンの傾き、太さに変化の無い場合は、ゼロ判定さ
れても続き部分消去を行わないことで、消去のしすぎを
なくすことが可能である。
【0177】(14):続き線の抽出に関して、続き線がパ
ターンの下部にある場合、続き線の上部を探索し、繋が
っている文字数の算出を行うことで、続き線がパターン
の下部に存在している場合であっても、文字の分離を行
うことが可能である。
【0178】(15):文字と文字の分離線を見つける処理
において、一文字領域と一文字領域に挟まれた範囲内
で、空白部分の探索を行い、分離線を決定することで、
直線で分離することが不可能な場合であっても、ブロッ
ク分離線を見つけることが可能である。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】実施例1の文字切り出し回路基本構成図であ
る。
【図3】文字切り出し方法説明図1である。
【図4】文字切り出し方法説明図2である。
【図5】文字切り出し方法説明図3である。
【図6】実施例1の文字切り出し回路構成図である。
【図7】実施例1の処理フローチャート(その1)であ
る。
【図8】実施例1の処理フローチャート(その2)であ
る。
【図9】実施例1の処理フローチャート(その3)であ
る。
【図10】実施例1の処理例を示した図である。
【図11】実施例2のパターン説明図である。
【図12】実施例2の文字切り出し回路基本構成図であ
る。
【図13】実施例2の文字切り出し回路構成図である。
【図14】続き線抽出部の処理説明図(その1)であ
る。
【図15】続き線抽出部の処理説明図(その2)であ
る。
【図16】続き線抽出部の処理説明図(その3)であ
る。
【図17】文字分離線決定部の処理説明図である。
【図18】ゼロ判定部の処理説明図である。
【図19】文字分離部の処理説明図である。
【図20】実施例2の処理フローチャート(その1)で
ある。
【図21】実施例2の処理フローチャート(その2)で
ある。
【図22】従来例の説明図である。
【符号の説明】
10 連結パターン抽出部 11 横長パターン抽出部 12 水平続き線抽出部 13 垂直分離線決定部 14 ゼロ判定部 15 文字分離部 46 続き線抽出部 47 文字分離線決定部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−333089(JP,A) 特開 平6−266893(JP,A) 特開 平2−217978(JP,A) 特開 平2−128293(JP,A) 特開 平1−271891(JP,A) 特開 昭54−49034(JP,A) 特開 平4−135290(JP,A) 特開 昭59−160274(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/34 JICSTファイル(JOIS)

Claims (24)

    (57)【特許請求の範囲】
  1. 【請求項1】 手書き文字の認識処理を行うための文字
    切り出し回路において、 入力パターンの連結情報に基づいて、入力パターンから
    連結パターンを抽出する連結パターン抽出部(10)
    と、 抽出された連結パターンの内、複数の文字が繋がってい
    る続き文字の候補として、横に長い横長パターンだけを
    抽出する横長パターン抽出部(11)と、 前記文字と文字を繋いでいる続き線を見つけることによ
    って、抽出された連結パターンが続き文字であるか否か
    を判断し、水平続き線を抽出する水平続き線抽出部(1
    2)と、 前記水平続き線の内、文字と文字とを垂直に分離するた
    めの垂直分離線を決定する垂直分離線決定部(13)
    と、 前記垂直分離線で分離した一文字毎の文字領域につい
    て、一文字毎に、数字のゼロであるか否かを判定するゼ
    ロ判定部(14)と、 前記数字のゼロと判定された文字について、左右に出て
    いる不必要な続き線を消去し、数字のゼロ以外の文字
    は、前記垂直分離線で分離する文字分離部(15)を有
    することを特徴とした文字切り出し回路。
  2. 【請求項2】 手書き文字の認識処理を行うための文字
    切り出し方法において、 入力パターンの連結情報に基づいて、入力パターンか
    ら、画素と画素とが繋がっている連結パターンを抽出す
    る第1の処理と、 前記抽出された連結パターンの内、複数の文字が繋がっ
    ている続き文字の候補として、横に長い横長パターンだ
    けを抽出する第2の処理と、 文字と文字を繋いでいる続き線を見つけることによっ
    て、前記抽出された連結パターンが続き文字であるか否
    かを判断し、水平続き線を抽出する第3の処理と、 前記抽出された水平続き線を基に、輪郭探索を用いて、
    文字数、及び一文字毎の文字の存在する領域を求め、文
    字と文字の間に垂直分離線を引く第4の処理と、 前記垂直分離線で分けられた一文字毎の文字領域につい
    て、一文字毎に、数字のゼロであるか否かを判定する第
    5の処理と、 前記数字のゼロと判定された文字については、左右に出
    ている不必要な続き線を消去し、数字のゼロ以外の文字
    は、前記垂直分離線で分離する第6の処理とを有するこ
    とを特徴とした文字切り出し方法。
  3. 【請求項3】 前記第2の処理において、 連結パターンを矩形近似して抽出した文字領域の平均サ
    イズを算出し、この算出した平均サイズと比較すること
    により、前記続き文字の候補パターンを抽出することを
    特徴とした請求項2記載の文字切り出し方法。
  4. 【請求項4】 前記第3の処理において、 水平続き線の抽出を行うのに、横方向の投影値に、その
    周囲の行の投影値を加えて、その行の投影値とする隣接
    投影法を用い、多少傾きのある横線も含めて、水平続き
    線の抽出を行うことを特徴とした請求項2記載の文字切
    り出し方法。
  5. 【請求項5】 前記隣接投影法を用いて、水平続き線の
    抽出を行う際、抽出された続き線の連結パターンの面積
    と、その外接矩形の面積の比率によって、抽出する直線
    の長さを変化させることを特徴とした請求項4記載の文
    字切り出し方法。
  6. 【請求項6】 前記処理で、短い直線を抽出した場合、
    それらの短い直線を所定の条件に基づいて統合し、矩形
    近似された直線を見つけることを特徴とした請求項5記
    載の文字切り出し方法。
  7. 【請求項7】 前記処理で抽出された複数個の直線の中
    で、一番長い矩形近似された部分を、水平続き線として
    抽出することを特徴とした請求項6記載の文字切り出し
    方法。
  8. 【請求項8】 前記第4の処理において、 水平続き線より下部の部分の文字領域を輪郭探索するこ
    とにより、文字数を求めることを特徴とした請求項2記
    載の文字切り出し方法。
  9. 【請求項9】 前記第4の処理において、 矩形近似された水平続き線の下辺を辿っていき、文字パ
    ターンと交差する場所を、輪郭探索の開始点とし、 前記輪郭探索を行った結果、再び矩形近似された水平続
    き線の下線に交差した場所を、該輪郭探索の終了点とす
    ることを特徴とした請求項2記載の文字切り出し方法。
  10. 【請求項10】 前記輪郭探索の開始点と終了点に囲ま
    れた領域を、一文字の存在領域とすることを特徴とした
    請求項9記載の文字切り出し方法。
  11. 【請求項11】 前記一文字領域と、一文字領域に挟ま
    れた領域で、垂直線密度が1である部分がある場合、 その部分に文字の垂直分離線を引くことを特徴とした請
    求項10記載の文字切り出し方法。
  12. 【請求項12】 前記第5の処理において、 ゼロ判定を行うのに、一文字領域の中に、文字パターン
    と、前記矩形近似された水平続き線によって囲まれた空
    白部分がある場合、 一文字領域内に限って、その空白部分から放射状に複数
    方向に向かって線密度を計算し、全ての方向の線密度が
    1であると、その領域にある文字を数字のゼロと判定す
    ることを特徴とした請求項2記載の文字切り出し方法。
  13. 【請求項13】 前記第6の処理において、 或る文字が数字のゼロと判定された場合、矩形近似され
    た水平続き線の範囲内で、且つ前記垂直分離線から、続
    き線の太さ、傾き、又は微分値が変化する部分までを対
    象として、文字の続き線を消去することを特徴とした請
    求項2記載の文字切り出し方法。
  14. 【請求項14】 前記第5、第6の処理において、 文字領域を残して不必要な続き部分を消去するのに、一
    文字ずつゼロの判定を行い、数字のゼロであれば、続き
    線を消去し、 数字のゼロでなければ、前記続き線をそのまま残して、
    該続き文字を分離することを特徴とした請求項2記載の
    文字切り出し方法。
  15. 【請求項15】 手書き文字の認識処理を行うための文
    字切り出し回路において、 入力パターンの連結情報に基づいて、入力パターンから
    連結パターンを抽出する連結パターン抽出部(10)
    と、 抽出された連結パターンの内、複数の文字が繋がってい
    る続き文字の候補として、横に長い横長パターンだけを
    抽出する横長パターン抽出部(11)と、 水平、或いは斜めの文字と文字の繋がっている部分の続
    き線を見つけることによって、抽出された連結パターン
    が続き文字であるか否かを判断し、水平続き線、或いは
    斜め続き線を抽出する続き線抽出部(46)と、 前記抽出された続き線の内、文字と文字を分離するため
    の垂直分離線、或いは斜め分離線を決定する文字分離線
    決定部(47)と、 前記分離線で分けられた一文字毎の文字領域について、
    一文字毎に、数字のゼロであるか否かを判定するゼロ判
    定部(14)と、 前記数字のゼロと判定された文字について、左右に出て
    いる不必要な続き線を消去し、数字のゼロ以外の文字
    は、前記垂直分離線で分離する文字分離部(15)を有
    することを特徴とした文字切り出し回路。
  16. 【請求項16】 手書き文字の認識処理を行うための文
    字切り出し方法において、 入力パターンの連結情報に基づいて、入力パターンか
    ら、画素と画素とが繋がっている連結パターンを抽出す
    る第1の処理と、 抽出された連結パターンの内、複数の文字が繋がってい
    る続き文字の候補として、横に長い横長パターンだけを
    抽出する第2の処理と、 水平、或いは斜めの文字と文字の繋がっている部分の続
    き線を見つけることによって、前記抽出された連結パタ
    ーンが続き文字であるか否かを判断し、水平続き線、或
    いは斜め続き線を抽出する第3の処理と、 抽出された続き線を基に、輪郭探索を用いて、文字数、
    及び一文字毎の文字の存在する領域を求め、文字と文字
    の間に垂直分離線、或いは斜め分離線を引く第4の処理
    と、 前記分離線で分けられた一文字毎の文字領域について、
    一文字毎に、数字のゼロであるか否かを判定する第5の
    処理と、 前記数字のゼロと判定された文字については、左右に出
    ている不必要な続き線を消去し、数字のゼロ以外の文字
    は、前記垂直分離線、或いは斜め分離線で分離する第6
    の処理とを有することを特徴とした文字切り出し方法。
  17. 【請求項17】 前記第3の処理において、 或る一定角度の斜め線に沿って投影を行い、算出された
    投影値にその周囲の投影値を加えたものを、その部分の
    投影値とする斜め隣接投影法を用いて処理を行うことを
    特徴とする請求項16記載の文字切り出し方法。
  18. 【請求項18】 前記斜め隣接投影法を用いて処理を行
    う場合、斜め線の傾きを決定する横(X)方向の増加量
    と、縦(Y)方向の増加量との比を整数として処理を行
    うことを特徴とする請求項17記載の文字切り出し方
    法。
  19. 【請求項19】 前記第4の処理において、 一文字の領域と、一文字の領域に挟まれた領域で、垂直
    方向に線密度1の部分が存在しない場合、注目している
    連結パターンの傾きを算出し、 一文字の領域と、一文字の領域に挟まれた領域で、線密
    度1の部分があれば、その部分にパターンの傾きと同じ
    傾きを持つ直線を引き、文字の分離線とすることを特徴
    とする請求項16記載の文字切り出し方法。
  20. 【請求項20】 パターンの傾きに従った斜め方向の線
    密度が1である部分が存在しない場合、 パターンの傾き補正を行い、その後、再び文字分離処理
    を行うことを特徴とする請求項19記載の文字切り出し
    方法。
  21. 【請求項21】 前記パターンの傾き補正を行う際、 補正前と補正後の画像を用意し、補正後の画像における
    文字分離場所の補正前の画像での位置を算出し、 補正前の画像において、前記の部分で文字分離を行うこ
    とを特徴とする請求項20記載の文字切り出し方法。
  22. 【請求項22】 前記第5の処理において、 或る文字がゼロと判定された場合、不必要な続き部分の
    消去に加えて、ゼロのループ内の余分な線を消去するこ
    とを特徴とする請求項16記載の文字切り出し方法。
  23. 【請求項23】 前記第5の処理において、 続き線の下部のみをゼロ判定の対象とするのではなく、
    上部に注目し、他のゼロと判定されたパターンと比較し
    て、上部のパターンの大きさが異なるものは、ゼロと判
    定しないことを特徴とする請求項16記載の文字切り出
    し方法。
  24. 【請求項24】 前記第6の処理において、 分離線から或る一定領域のパターンの傾き、太さに変化
    のない場合は、ゼロと判定されても、続き部分の消去を
    行わないことを特徴とする請求項16記載の文字切り出
    し方法。
JP02948594A 1993-11-17 1994-02-28 文字切り出し回路、及び文字切り出し方法 Expired - Fee Related JP3188580B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02948594A JP3188580B2 (ja) 1993-11-17 1994-02-28 文字切り出し回路、及び文字切り出し方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP5-287126 1993-11-17
JP28712693 1993-11-17
JP02948594A JP3188580B2 (ja) 1993-11-17 1994-02-28 文字切り出し回路、及び文字切り出し方法

Publications (2)

Publication Number Publication Date
JPH07192094A JPH07192094A (ja) 1995-07-28
JP3188580B2 true JP3188580B2 (ja) 2001-07-16

Family

ID=26367692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02948594A Expired - Fee Related JP3188580B2 (ja) 1993-11-17 1994-02-28 文字切り出し回路、及び文字切り出し方法

Country Status (1)

Country Link
JP (1) JP3188580B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3574584B2 (ja) 1998-12-16 2004-10-06 富士通株式会社 表画像処理装置及びそのプログラム記憶媒体
JP2000353215A (ja) 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体
JP6166532B2 (ja) * 2012-12-28 2017-07-19 グローリー株式会社 文字認識方法及び文字認識装置

Also Published As

Publication number Publication date
JPH07192094A (ja) 1995-07-28

Similar Documents

Publication Publication Date Title
US7039235B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JPH06309498A (ja) 画像抽出方式
JP3411472B2 (ja) パターン抽出装置
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
JP3837193B2 (ja) 文字行抽出方法および装置
JP3188580B2 (ja) 文字切り出し回路、及び文字切り出し方法
US6175664B1 (en) Optical character reader with tangent detection for detecting tilt of image data
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
Nguyen et al. Enhanced character segmentation for format-free Japanese text recognition
JP3343305B2 (ja) 文字切り出し装置、及び文字切り出し方法
CN113408532A (zh) 一种基于多特征提取的药品标签数字识别方法
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
JP2796561B2 (ja) 表形式文書認識方式
JP2006277149A (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3077929B2 (ja) 文字切出し方式
JPH09305707A (ja) 画像抽出方式
JP3710164B2 (ja) 画像処理装置及び方法
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2581809B2 (ja) 文字切出し装置
JPH07141465A (ja) 文書画像の傾き検出方法
JP3428504B2 (ja) 文字認識装置
JPS6361382A (ja) 線画像からの文字成分除去方法
JPH08339424A (ja) 画像処理装置及び方法
JP2000339404A (ja) 文書認識装置と文書認識方法
JPH08249420A (ja) ループ候補抽出装置、真のループ候補判定装置、及び文字補完装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010424

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080511

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090511

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090511

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees