JP3272776B2 - 文字パターン認識方法 - Google Patents

文字パターン認識方法

Info

Publication number
JP3272776B2
JP3272776B2 JP20145792A JP20145792A JP3272776B2 JP 3272776 B2 JP3272776 B2 JP 3272776B2 JP 20145792 A JP20145792 A JP 20145792A JP 20145792 A JP20145792 A JP 20145792A JP 3272776 B2 JP3272776 B2 JP 3272776B2
Authority
JP
Japan
Prior art keywords
character pattern
character
end point
points
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP20145792A
Other languages
English (en)
Other versions
JPH0652356A (ja
Inventor
和樹 中島
好博 嶋
勝美 丸川
昌史 古賀
和美 鈴木
康二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP20145792A priority Critical patent/JP3272776B2/ja
Publication of JPH0652356A publication Critical patent/JPH0652356A/ja
Application granted granted Critical
Publication of JP3272776B2 publication Critical patent/JP3272776B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像処理技術を用いて
文字パターン等のかすれを修復するパターン処理方法お
よび装置に関する。
【0002】
【従来の技術】従来、文字パターンの「かすれ」の修復
処理方法を記載した文献として、例えば、「IARP procee
dings of the fourth international joint conference
on pattern recognition(1978)」の第816頁から第8
20頁がある。上記文献においては、例えば、タイプラ
イタ等に使用するインクによる出力文字のかすれに対し
て、パターン・マッチング法を利用した処理を行なうこ
とにより文字認識を行なうものであった。したがって、
手書き文字等の定形を有しない個人差のある文字パター
ンに対しては、その認識が困難であった。もちろん、本
発明にかかる文字パターンを修復する処理は、全く行な
われていなかった。
【0003】
【発明が解決しようとする課題】例えば、スキャナ入
力、画像伝送等により文字パターンにかすれが生じた場
合には、言うまでもなく、文字の認識率の低下を招くこ
とになる。このような場合に、文字のかすれを修復し、
認識率を引き上げる必要があり、かかる方法の提供が期
待されていた。また、かすれを修復した文書画像は、修
復されていないものに比べて情報量が少ないため、少な
い情報で画像圧縮等を効率的に行なえ、文書画像の蓄
積、伝送等が効率よく行なえることになる。さらに、か
すれの検出により、かすれの発生が多いと判断した場合
には、例えば、文字パターンを読み取るスキャナの読取
り濃度を変更し、再度スキャナ入力するか、かすれに強
い文字認識法を用いるようにすることが可能な方法およ
び装置の提供が期待されていた。
【0004】
【課題を解決するための手段】上記目的を達成する手段
として、以下に示す手段が考えられる。文字パターンか
ら文字線の先端にある端点を検出し、かすれにより生じ
た2つの端点からなる端点対を選択し、該選択された端
点対を接続して文字パターンのかすれを修復する文字パ
ターン修復方法が考えられる。この場合、選択される端
点対は、予めしきい値を設定しておき、端点対の距離
が、該しきい値以下の端点対である文字パターン修復方
法も考えられる。また、文字パターンから文字線の先端
にある端点を検出し、かすれにより生じた2つの端点か
らなる端点対を選択し、該選択された端点対を接続して
文字パターンのかすれを修復し、該修復の成功を評価す
る文字パターン修復方法も考えられる。また、選択する
かすれにより生じた端点対は、与えられた文字パターン
から検出されたすべての端点対である文字パターン修復
方法も考えられ、またこの場合、文字パターンのかすれ
を修復した後、該修復の成功を評価する文字パターン修
復方法も考えられる。さらに、修復が成功するか否かの
パラメータである評価値を設け、該評価値の高い順に端
点対をソーティングし、当該評価値の高い順から1組毎
に端点対を選択する文字パターン修復方法も考えられ
る。さらに、修復が成功するか否かのパラメータである
評価値を設け、該評価値の高い順に端点対を、少なくと
も1組の端点対を含む少なくとも1以上の段階に分け、
評価値の高い段階に属する端点対から順次、修復対象と
して選択する文字パターン修復方法も考えられる。さら
に、端点対の接続は、直線の幅を決め、端点対を当該幅
を有する直線で接続する文字パターン修復方法でも良
く、この場合、接続に用いる直線の幅は、一定値である
文字パターン修復方法、あるいは、接続に用いる直線の
幅は、入力文字パターンの文字線の幅を求め、該求めた
文字線の幅により定めされた所定値である文字パターン
修復方法でもよい。文字線の幅を求める場合、文字線の
幅は、入力文字パターンの文字輪郭線の中心を通る中心
線上の各点に直交する直線と、文字輪郭線とが交わった
2点間の距離の平均値とする文字パターン修復方法、あ
るいは、文字線の幅は、注目する端点から輪郭線に沿っ
て、端点の両側に所定ドット数離れた2点を求め、該2
点間の距離の最小値とする文字パターン修復方法が考え
られる。さらに、選択された端点対を接続する際、文字
パターン輪郭上の少なくとも4つの点を頂点とする多角
形の頂点を求め、当該頂点を接続するために選択された
端点対とした文字パターン修復方法も考えられる。この
場合、多角形の頂点は、接続のために注目している2つ
の端点に対応する、それぞれの端点の端点区間開始点と
端点区間終了点の計4点である文字パターン修復方法、
あるいは、多角形の頂点は、接続のために注目している
2つの端点に対応する、それぞれの端点から輪郭線に沿
って、端点の両側に所定ドット数離れた2点の計4点で
ある文字パターン修復方法でもよい。さらには、多角形
の頂点は、かすれをなめらかに修復するために、かすれ
部にはめ込む4角形の4つの頂点を求めることを特徴と
する文字パターン修復方法も考えられる。さらに、修復
が成功するか否かを示すパラメータである評価値は、文
字線のかすれ部の連続性と端点間距離によって定まる文
字パターン修復方法も考えられる。 また、端点と端点
を一定幅を有する直線で接続する文字パターン修復法で
もよい。さらに、注目する2つの端点の端点区間開始点
と端点区間終了点を検出し、1方の端点の端点区間開始
点と、他方の端点の端点区間終了点を直線で結び得られ
た2直線と、2つの端点を含む文字輪郭線とに囲まれた
領域を塗りつぶす文字パターン修復方法も考えられる。
また、以下に示すような文字パターンの認識方法も考え
られる。文書画像を入力して文字パターンの認識を行な
う文字パターン認識方法において、当該文字パターンを
認識し、当該認識の結果不読となった文字パターンに対
し、かすれ修復を行ない、かすれ修復を行なった文字パ
ターンに対し、再度文字認識する文字パターンの認識方
法が考えられる。この場合、かすれ修復に、上述のいず
れかの文字パターン修復方法を用いた、文字パターンの
認識方法が考えられる。また、文書画像を入力して文字
認識を行なう文字パターン認識方法において、文字パタ
ーンのかすれを検出し、当該文字パターンのかすれを修
復する文字パタ−ンの認識法も考えられる。この場合、
上述のいずれか記載の文字パターン修復方法を用いた、
文字パターンの認識方法も考えられる。以下、上述の各
種文字パターン修復方法の応用例として、以下に示す手
段が考えられる。イメージスキャナを有し文字認識を行
なう文字認識装置において、文書画像内の文字のかすれ
を検出する手段と、かすれ量が所定値以上の場合に、イ
メージスキャナの読取り濃度を変更設定する手段を備え
る文字認識装置が考えられる。さらに、複数の文字認識
手法により文字認識を行なう文字認識装置において、文
書画像内の文字のかすれ量を検出する手段と、予め設定
したかすれの量以上の場合に、かすれに強い文字認識方
法による処理を行なう手段を選択する手段を有する文字
認識装置も考えられる。さらに、文書画像の蓄積を行な
う画像のファイリング方法において、文書画像内の文字
のかすれを検出し、文字のかすれを修復し、画像圧縮率
を高める画像のファイリング方法も考えられる。この場
合、かすれ修復に、上述のいずれかの文字パターン修復
方法を用いた画像のファイリング方法も考えられる。さ
らに、文書画像の伝送を行なう画像伝送装置において、
文書画像内の文字のかすれを検出する手段と、文字のか
すれを修復する手段と、画像圧縮率を高めることによっ
て画像伝送効率を高める手段を有する画像伝送装置も考
えられる。この場合、前記文字のかすれを修復する手段
は、上述のいずれかの文字パターン修復機能を有する画
像伝送装置も考えられる。さらに、文書の複写を行なう
文書複写装置において、複写する文書の画像を読込む手
段と、文書画像内の文字のかすれを検出する手段と、文
字のかすれを修復する手段を有する文書複写装置も考え
られる。この場合、前記文字のかすれを修復する手段
は、上述のいずれかの文字パターン修復機能を有する文
書複写装置も考えられる。なお、上記評価値は、少なく
とも端点間距離の情報、および、3つのベクトルの向き
の変化量の情報のいずれかに基づき定められ、前記3つ
のベクトルは、第一の端点の端点区間開始点および端点
区間終了点の中点を始点とし、第一の端点を終点とする
第一のベクトル、第一の端点を始点とし、第二の端点を
終点とする第二のベクトル、および、第二の端点を始点
とし、第二の端点の端点区間開始点および端点区間終了
点の中点を終点とする第3のベクトルである文字パター
ン修復方法も考えられる。
【0005】
【作用】以下、本発明の作用について説明する。まず、
文字パターンの端点を検出する。端点検出は、例えば文
字輪郭点からなるベクトルの向きが、急激に変化する点
を端点とする等の一般に知られている手法を用いれば良
い。次に、かかる端点が、かすれにより生じた端点か否
かを判断する。例えば、第一の端点の端点区間開始点お
よび端点区間終了点の中点を始点とし、端点を終点とす
る第一のベクトル、一方の端点を始点とし、他方の端点
を終点とする第二のベクトル、第二の端点を始点とし、
第二の端点の端点区間開始点および端点区間終了点の中
点を終点とする第3のベクトルの3つのベクトルの向き
の変化量、および、端点間距離の値から、かすれによっ
て生じた端点対か否かを評価できる。つまり、ベクトル
の向きの変化量が少なく、接近した端点対であれば、滑
らかな直線の一部である、すなわち、与えられた端点対
は、かすれにより生じた端点対と考えられる。
【0006】かすれにより生じた端点対であれば、端点
同士を、例えば直線にて接続し、かすれを修復すること
により、文字パターンにかすれのない文書画像が得られ
る。接続法としては、例えば、端点同士を直線にて接続
する方法が考えられる。この場合、直線の幅を予め決め
ておく方法、文字線の幅を直線の幅として採用する方法
等が考えられる。この際、文字線の幅は、入力文字パタ
ーンの文字輪郭線の中心を通る中心線上の各点に直交す
る直線と、文字輪郭線とが交わった2点間の距離の平均
値とすること、あるいは、注目する端点から輪郭線に沿
って、端点の両側に所定ドット数離れた2点を求め、該
2点間の距離の最小値とすることでよい。さらに、文字
パターンの輪郭線上の少なくとも4点を頂点とする多角
形を求め、、これらの頂点間を、例えば、直線にて結
び、直線にて囲まれた領域を塗り潰すことも考えられ
る。
【0007】この場合、例えば、端点区間開始点および
端点区間終了点を、各々の端点について求め、これらの
点を直線により結び、該直線で囲まれた所定領域を塗り
潰す手法も効果的である。あるいは、端点から文字パタ
ーンの輪郭線上に沿って、端点の両側に所定のドット数
離れた点を利用する方法もある。
【0008】ところで、本発明により修復された文字パ
ターンを、一旦、他の文字認識装置(OCR等)に入力
し、修復の成功率を最終的に評価する方法も考えられ
る。なお、修復が成功するか否かを示すパラメータであ
る評価値を設け、該評価値の高い、すなわち修復が成功
する可能性の高い端点対から順次、修復する方法も考え
られる。さらに、かかる評価値を基準にして端点対を数
段階に分け、段階ごとに文字パターン修復を行なってい
くことも考えられる。もちろん、与えられた全ての端点
対を一度に修復してもよい。なお、本発明にかかる文字
パターン修復方法を使用して、以下に示す文字パターン
の認識が可能となる。すなわち、文書画像を入力して文
字パターンの認識を行なう文字パターン認識方法におい
て、当該文字パターンを認識し、当該認識の結果不読と
なった文字パターンに対して、本発明にかかる、かすれ
修復を行ない、かすれ修復を行なった文字パターンに対
し、再度文字認識すること、あるいは、文書画像を入力
して文字認識を行なう文字パターン認識方法において、
文字パターンのかすれを検出し、本発明にかかるかすれ
修復を行なうことによって、文字パターンのかすれを修
復することも可能である。なお、本発明にかかる文字パ
ターン修復方法は、各種装置への応用例が考えられる。
例えば、文書画像の伝送を行なう画像伝送装置、文書の
複写を行なう文書複写装置(例えば、コピー機、ファク
シミリ装置等)、文字認識装置等への応用が考えられ
る。修復された文字は、修復されない文字と比較して、
伝送時の情報量が少なくてすみ、効率の良い画像伝送装
置等が実現できることになる。このように、比較的簡単
なアルゴリズムによって、文字のかすれ等を効率的に、
修復でき、その応用範囲も広いパターン処理の方法を提
供できることになる。
【0009】
【実施例】以下、本発明の実施例について説明する。一
般に、イメージスキャナ等により文書画像を読み取る際
には、書かれてた文字の濃さと背景色に応じて、スキャ
ナの読取り濃度の設定を行なう必要がある。例えば、読
取り濃度の設定が薄すぎる場合には、文字パターンがか
すれることになる。一方、文字認識の1手法として「構
造解析法」が知られている。この方法は、手書きなどの
変動のある文字パターンに対して高い認識能力がある
が、かすれ文字パターンを効果的に認識することはでき
ない。したがって、本実施例においては、文字認識によ
り「不読」(読み取り不可能な場合をこのように称す
る)となった文字パターンの、かすれを修復し、再度文
字認識を行なうことにより、かすれパターンを修復する
ことを特徴としている。
【0010】図1に、本発明の処理例の全体フローチャ
ートを示す。まず、ステップ100にて、文字パターン
を読み込む。ステップ101では、文字認識を行ない、
文字パターンを「不読パターン」と「正読・誤読パター
ン」に分ける。文字パターンが「不読パターン」であれ
ば、ステップ102へ、「正読・誤読パターン」であれ
ば、ステップ103へとブランチする。このうち不読パ
ターンを、ステップ104においてかすれ修復する。ス
テップ104においてかすれ修復されたものを、かすれ
修復パターンとする(ステップ105)。このかすれ修
復パターンを、ステップ106において再度、文字認識
させ、認識結果を得る(ステップ107)。認識結果の
中で、かすれ修復の成功したパターンは正読となる。か
すれ部分には、向かい合った、一対の端点が検出される
ことなる。かかる端点を検出し、接続することによりか
すれを修復する。以下、図を用いて詳細説明を行なって
いく。図7に、文字パターン700における端点検出の
一例を示すである。図7に示すように、端点701と端
点702が検出されている。文字パターン703は、文
字パターン700にかすれが生じた場合の一例である。
文字パターンにかすれが生じた場合、端点704と端点
707以外に、かすれ部分に、向かいあうようにして一
対の端点705と706が検出される。図24に、端点
を接続することにより、かすれを修復するための、各種
の端点接続法を示す。接続法2400は、端点どうしを
直線、あるいは、一定の幅を有する直線で結ぶ方法を示
している。
【0011】接続法2401は、文字パターンの線の平
均的な幅を検出し、その幅で端点同士を接続することを
示している。
【0012】幅の検出は、例えば、文字パターンの中心
線上の各点に直交する直線と、文字パターンの輪郭線と
が交わった2点間の距離の平均値とすることが考えられ
る。
【0013】接続法2402は、図9にて後述する、端
点区間開始点と端点区間終了点を直線で結び、直線にて
囲まれた領域内を塗りつぶして、端点同士を接続する方
法を示している。接続法2403は、端点からある文字
輪郭に沿って、一定のドット数だけ離れた点をもとに、
接続法2402と同様の方法で接続するものである。接
続法2404は、図12、図13、図14、図15を用
いて後に詳しく説明するが、最も自然にかすれを修復す
る方法である。
【0014】さて、図6を参照して、端点検出の説明を
行なう。図6では、文字パターン600に対して端点6
03と604が検出されているここで、端点604の検
出法を文字パターン600の部分領域を示した枠601
の拡大図612によって示す。ベクトル606とベクト
ル605は輪郭線611の接線ベクトルであり、輪郭線
上の任意の位置にあるあるものとする。ベクトル606
と605の間隔は、文字の線幅602によって定まる一
定間隔607によって決まる。この時、ベクトル605
と606の角度差が求まる。角度差は、ベクトル606
の始点上の点に位置的に対応した値とする。この角度差
を輪郭線上の全ての点について求めるために、間隔60
7を維持しつつ、接線ベクトル606と605を輪郭線
上の全ての点を対象として移動させると、ベクトル60
6と605の角度差を逐次求めることができ、この角度
差が、線幅602によって定まる、ある所定値以上の値
である点を求め、その点が連続する区間を端点区間60
8と称する。一般的には、端点の前後の連続した数個の
点が端点区間608に属することになる。接線ベクトル
606と605を輪郭線上の全ての点に対して移動させ
たとき、最初に現れる端点区間608上の点を端点区間
開始点609、最後に現れる点を端点区間終了点610
と称する。線幅602の求め方は、例えば、入力文字パ
ターンの中心線上の各点に直交する直線と文字輪郭線と
交わった2点間の距離を、入力パターンの数箇所で求
め、その平均値とする方法、あるいは、端点の両側から
輪郭線に沿って、予め定められたドット数だけ離れた2
点間の距離の最小値とする方法等が考えられる。図9は
かすれ検出を行なう際の説明図である。この図により、
3つのベクトル910、911、912を求めるための
説明を行なう。まず、ベクトル910は、一方の端点9
08の端点区間開始点902と端点区間終了点903の
中点906と、端点908を結んだベクトルである。こ
のベクトルの向きは、端点の方向となる。ベクトル91
2も同様の方法で求めることができるが、ベクトルは、
中点907の方向を向く。次に、ベクトル911は、端
点908を始点とし、端点909を終点としたベクトル
であり、向きは、端点909の方向となる。このよう
に、ベクトル910、911、912は2つの端点を介
して連続するベクトルであり、方向についてもお互いに
向き合うようなことはない。図10も、図9と同じくか
すれ検出を行なう際の説明図である。端点から所定ドッ
ト(nドット)離れた点である1001と1002の中
点を用いるところが異なる。ベクトル定義等は全く同様
である。nは、例えば、文字線の幅等で決まる、所定の
一定値である。図8は、図9または図10で説明した、
3つのベクトル910、911、912を、32方向に
量子化したときの方向を示す図である。例えば、計算機
内部では、このようにベクトルを有限の方向ベクトルと
して扱い処理する。図11に、ベクトル910、91
1、912を用いた、かすれパターンの表現例を示す。
ベクトル1101、1102、1103は、それぞれベ
クトル910、911、912に対応している。ベクト
ル1101、1102、1103は図8にて示したよう
に32方向のうちの、いずれかの向きを有している。
【0015】図11の左上の図において、ベクトル11
01は「16」、ベクトル1102は「14」、ベクト
ル1103は「6」から「16」のうちのいずれかの値
を有する。矢印1104は、ベクトル1103が「1
6」から「6」までの11種類の変化をしうることを表
し、1つの図で11通り(方向「16」から「6」ま
で)の変化パターンを表している。このように、かすれ
のパターンには様々な変化がある。また、もちろん図7
に示すように、かすれによって生じた端点と、これ以外
の端点も存在する。したがって、図2における処理によ
り、接続候補となる端点から得られるベクトル910、
911、912の変化パターンは、図11に示す以外に
も多数存在するため、図11に示すような、かすれによ
るパターンと、これ以外のパターンを区別する必要があ
る。図12、図13、図14、図15は、図24の24
04の接続方法を詳しく説明するための図である。
【0016】ドット1202、1203、1204、1
205は、端点区間開始点と終了点、もしくは、端点1
206、1207からそれぞれ輪郭1200、1201
に沿って所定ドット離れた点である(図12参照)。
【0017】図13は、3ドットの場合の具体例であ
り、輪郭1300、1301上の各ドットに対して、図
のように端点に達したら、他の輪郭に移るように反時計
周りに番号を振る。端点1302と1303はそれぞれ
行きと帰りの2回番号が振られる。この番号をドット番
号と呼ぶ。図14は、付加したドット番号1400を順
に並べて表にしたものである。輪郭番号フラグ1401
は、それぞれの属する輪郭の番号である。外接点フラグ
1402は、後述する図16に示す方法を用いて、それ
ぞれの点が外接点であれば「1」、外接点でなければ
「0」の値を有する。端点フラグ1403は、端点であ
るドット番号1400に対して「1」、端点でない場合
に対して「0」の値を有する。外接点フラグ1402が
「1」である点を、ドット番号1から順に調べる時に、
輪郭番号フラグが「1」から「2」、または、「2」か
ら「1」へ変わる点が存在する。この輪郭番号が変わる
前後の点は4点検出でき、図14に示す例では、ドット
番号3、6、9、16の4点である。図13において端
点は、行きと帰りで2回カウントされたが、外接点フラ
グ1402と、輪郭番号フラグ1401と、端点フラグ
1403の組み合わせかたによっては2回カウントされ
たうちの、どちらか一方を省く必要が生じる場合があ
る。図15に、かすれ修復の結果の一例を示す。図14
にて説明した方法にて、求めた4点を頂点とする四角形
1502の内部を塗りつぶし、元のイメージにはめ込
む。これによって、かすれを修復したことになる。図1
6を参照して、外接点の求め方を説明する。輪郭160
0と1601を「木製の型枠」であると考えると、これ
に「輪ゴム」をはめた場合、この輪ゴムは外接線160
2となる。この外接線1602は、輪郭1600、16
01上に存在する、ある1点で接し、それ以外の他の輪
郭上の点に接しない線である。この外接線上にある点は
すべて外接点である。図17は、接続候補であるベクト
ル1702が、かすれによるものか否かをを見分けるた
めの特徴を抽出するための説明図であり、いわゆる「湾
方向」(文字パターンにおける凹部を「湾」と称する)
を求めるための説明図である。ベクトル1701、17
02、1703は、各々ベクトル910、911、91
2に対応している。ベクトル1702の始点と終点の中
点と、ベクトル1701の終点とベクトル1703の始
点との中点とを結んだのが、湾方向ベクトル1704で
ある。該ベクトルの向きは、ベクトル1702の方を向
く。湾方向ベクトル1704は、図8に示す32方向に
量子化される場合、湾方向の向きが「0」または、これ
に近い値の場合、文字パターン「3」の上・下いずれか
の湾とみなして、接続しないようにすることができる。
あるいは、接続したとしても、文字認識の後処理である
検定処理等で、接続すべきでなかったものとして処理す
ることができる。 図18に、湾方向ベクトル180
0、1801の特徴を示す。ベクトル1802、180
3、1804は、各々ベクトル910、911、912
に対応しており、ベクトル1805、1806、180
7も同様に、各々ベクトル910、911、912に対
応している。この図で例示しているように、ベクトル1
804が、ベクトル1807のようにベクトルの大きさ
が大きくなっても、湾方向を示すベクトルの向きは、安
定している。図2に、かすれ修復処理の説明のためのフ
ロー図を示す。なお、図2に示す処理は、検出された端
点すべてについて、2端点ずを接続候補端点対とし、接
続候補端点対の数だけ処理を繰り返すものとする。ま
ず、ステップ200においては、接続候補端点対に挾ま
れる、図9に示す3つのベクトル910、911、91
2に対応するベクトルのパターンから、かすれを検出
し、ステップ201において、かすれ接続が成功するか
否かを示すパラメータである評価量(評価値とも称す
る)を算出する。かかる評価値の算出には、各種の方法
が考えられ、以下具体例について説明する。図9または
図10に記載の3つのベクトル910、911、912
の、各々が有する方向を示す値を、それぞれx,y,z
と置く(32方向のうちのいずれかの値を有する)。ま
た、端点間の距離をdとする。例えば、端点間距離の上
限値と下限値を設定し、dが下限値以下ならば、評価値
を大きくし、あるいは、評価値を求めずに端点接続を行
なう。また、dが上限値以上ならば、評価値を小さく
し、あるいは、評価値を求めずに端点接続を行なわない
ことが考えられる。dが上限値以上、下限値以下なら
ば、x,y,zから、下記の方程式、あるいは、これら
の組合せ、さらに、その組合せにおける各項に定数を乗
じた式を用いて、評価量を算出すれば良い。
【0018】 (1)|y−x|+|z−x|,(2)||y−x|−|z−x||,(3) |x−z|等の式である。(記号「||」は、絶対値を
表す) この評価値によって、ステップ202で、接続するか否
かを決定し、接続する場合には、ステップ203で、端
点の接続処理を行なう。図3、図4、図5に、1パター
ン中における複数の接続候補端点対をどのような順で接
続するかを示す。図3は、接続候補端点対すべての組み
合わせについて、接続処理を行ない再認識を試行するこ
とを示している。文字パターン300は、かすれの生じ
た文字パターンであり、文字パターン301、302、
303は、接続処理のすべての組み合わせを示してい
る。これらの組み合わせの1つ1つについて再認識を行
ない、その中で最も確信度の高いものを認識結果とす
る。図4は、1箇所接続するごとに再認識を試行するこ
とを示している。文字パターン400は、かすれが生じ
た、元の文字パターンであり、文字パターン401は、
1箇所接続したパターン、文字パターン402は、2箇
所接続したパターンである。図5は、接続の成功の可能
性を評価し、該評価値の高いものから低いものまで数段
階に分け、その段階毎に、その段階に属する接続候補端
点対を1度に接続していく処理の説明図である。すなわ
ち、例えば評価量が大きいため、かすれであると判断さ
れた複数個のかすれ部分に対して、評価量の最大値と最
小値の間を、n(nは整数)等分し、段階分けし、各段
階ごとに端点対を接続すること等が考えられる。文字パ
ターン500は、かすれの生じた元の文字パターンであ
り、文字パターン501は、1段階めの接続候補点を接
続した状態を示している。文字パターン502は、2段
階めの接続候補点を接続した結果、かすれを完全に修復
できたことを示している。図19、図20、図21、図
22、図25に、本発明の応用例を示す。図19に、電
子ファイル等への画像の格納の際への処理例をフローチ
ャートにて示す。まず、ステップ1900にて、文書を
スキャナで入力し、文字分離処理、すなわち、与えられ
た文書情報を1文字単位で分ける(ステップ190
1)。次に、スキャナから入力した文字が、かすれてい
る場合には、かすれ修復を行なう(ステップ190
2)。次に、かすれを修復した文字を元の文書画像にも
どし、画像圧縮ファイルとする(ステップ1903)。
この時、かすれを行なわないファイルよりサイズを小さ
くできる効果が得られる。最後に、ステップ1904に
て、電子ファイルへの格納処理を行なう。図20は、F
AX等で画像情報を伝送する際の、かすれ修復の応用例
である。ステップ2000のスキャナ入力処理、ステッ
プ2001の文字分離処理、ステップ2002のかすれ
修復処理は、図19におけるステップ1900、190
1、1902の処理と同様である。かすれが修復され
た、きれいで、かつ効率的に画像圧縮(ステップ200
3)された文書は、画像伝送される(ステップ200
4)。図21は、FAX等で送信されてきた通常の文書
画像のかすれを修復するための処理の説明図である。ま
ず、ステップ2101にて、文書画像を受信する。受信
された画像は、文字分離処理が行なわれ(ステップ21
02)、受信画像が1字毎に分離される。次に、ステッ
プ2103において、かすれの修復が行なわれる。最後
に、かすれ修復された文書画像は、画像出力手段により
画像出力される(ステップ2104)。
【0019】図22は、文字パターンのかすれをかすれ
検出部により検出し、例えば、かすれ量が所定値以上の
時には、イメージスキャナの読取り濃度を変化させる処
理を示した図である。まず、ステップ2200にてスキ
ャナ等により画像文書を読込み、ステップ2201によ
り文字分離処理を行なう。次に、ステップ2202によ
り、かすれを検出し、かすれが多く、ステップ2204
でのかすれ修復によっては、かすれが修復しきれない場
合には、スキャナの読取り濃度を変化させ(ステップ2
207)、ステップ2200へとブランチし、再度スキ
ャナ入力処理を行なう。かすれが少ない場合には、ステ
ップ2204における処理によって、通常どおりかすれ
を修復する。かすれを修復した文書画像は画像圧縮部に
よって画像圧縮し(ステップ2205)、最後に電子フ
ァイル等のメディアに格納する(ステップ2206)。
ところで、スキャナの読取り濃度を変化させるのは、例
えば、自動的(予め定められた読取り濃度変化へ変更す
る)、あるいは、手動で行なうことが考えられる。手動
でスキャナの読取り濃度を変化させる場合、ステップ2
203においてかすれが多いと判断されたときには、何
らかの方法によってユーザに警告を発し(例えばブザー
警報、LED発光等)スキャナの読取り濃度の変更を喚
起せしめる構成にしておけば良い。ステップ2203と
ステップ2207における処理は、図1、図19、図2
0、図21の処理に対しても用いることができる。図2
5は、かすれが多い時には、別の文字認識処理により文
字認識を行なう処理を説明する図である。ステップ25
00のスキャナ入力処理、ステップ2501の文字分離
処理、ステップ2502のかすれ検出処理は、図22に
おいて説明した処理と同じである。ステップ2502に
よって、かすれが多いと判断された場合、ステップ25
04にブランチし、文字認識2(パターンマッチング等
のかすれに強い文字認識法)で文字認識を行なう(ステ
ップ2504)。かすれが多くないと判断した場合に
は、ステップ2503にブランチし、文字認識1(手書
き等の変動に強い構造解析による文字認識法)で文字認
識を行なう(ステップ2503)。
【0020】なお、かすれが多いか少ないかの判断は、
例えば図2と、その説明における評価量を用いれば良
い。例えば、かすれであるか否か端点対を評価する際、
文字画像内の所定文字数、所定箇所、あるいは、文書画
像内すべての文字に対する、かすれ端点対の総和を調
べ、この値が予め設定された値以上であれば、かすれが
多く、予め設定された値以下であれば、かすれが少ない
と判断することが考えられる。図23に、これまでの説
明によりかすれを修復した文字パターンの実例を示す。
文字パターン2300は、かすれの生じた文字パター
ンの輪郭構造を示し、文字パターン2301は、かすれ
を修復した文字パターンである。かすれの生じた文字パ
ターン2300において、端点は計5箇所検出されてい
る。端点は、中抜きの四角形(□)で表示されている。
また、端点区間開始点は、「2」で表示されており、端
点区間終了点は、「E」で表示されている。かすれ検出
によって、端点2305と2306に関する部分がかす
れていると判断され、かすれ修復による文字パターン2
301を得る。
【0021】以上のように、文字パターンから文字線の
先端にある端点を検出し、かすれにより生じた2つの端
点からなる端点対を選択し、該選択された端点対を接続
して文字パターンのかすれを修復することにより、文書
画像等における文字パターンかすれを修復し、文字認識
の精度を向上させ、さらに各種システムにおける表示画
質をも向上させ文字認識処理の信頼性が向上でき、各種
システムの性能の向上も図れることになる。
【0022】
【発明の効果】かすれの生じた文字パターンのかすれを
修復し、かすれのない文書パターンを得ることができる
ため、文字認識の認識率を向上できる。また、かすれの
ない文字パターンを有する文書画像は、画像の情報量が
少なく、効率的に画像圧縮等ができるため文書画像の蓄
積、伝送に有効である。
【0023】さらに、かすれが所定値より多い場合等に
は、例えば、イメージスキャナ等の読取り濃度の変更、
かすれに強い文字認識方式の選択等を行なうシステムの
構築が可能となる。
【図面の簡単な説明】
【図1】本発明の処理例を示す全体フロー図である。
【図2】かすれ修復の処理例を示すフロー図である。
【図3】接続候補端点対すべての組み合わせについて接
続処理を行なう場合の説明図である。
【図4】接続候補端点対を1箇所接続するごとに再認識
を行なう場合の説明図である。
【図5】予想される成功度合いに応じて接続処理を行な
う場合の説明図である。
【図6】端点検出例の説明図である。
【図7】文字パターンにおける端点検出例の説明図であ
る。
【図8】ベクトルを32方向に量子化する際の方向コー
ドの説明図である。
【図9】かすれ検出のための説明図である。
【図10】かすれ検出のための説明図である。
【図11】かすれパターンの、ベクトル変化パターンに
よる説明図である。
【図12】接続する端点付近の輪郭を示した図である。
【図13】端点付近の文字輪郭上のドットの配置を示し
た図である。
【図14】端点接続のために必要な4つのドットを求め
るための説明図である。
【図15】本発明による端点接続の一実施例の説明図で
ある。
【図16】外接線の求め方の説明図である。
【図17】湾方向の求め方の説明図である。
【図18】湾方向の特徴抽出の説明図である。
【図19】電子ファイル等への画像の格納の際の処理の
説明図である。
【図20】画像伝送の際の処理の説明図である。
【図21】低品質の画像内のかすれ文字パターンの修復
処理の説明図である。
【図22】かすれの量を検出しスキャナの読取り濃度を
変化させる一連の処理の説明図である。
【図23】計算機によるかすれ修復の一実施例を示す図
である。
【図24】端点を接続するための方法を示した図であ
る。
【図25】かすれの量を検出し、多い場合には別の文字
認識処理に切替る一連の処理の説明図である。
【符号の説明】
100…入力となる文字パターン、102…不読となっ
た文字パターン、105…かすれ修復した文字パター
ン、107…認識結果、600…文字パターン、602
…線幅、603…端点、604…端点、605…接線ベ
クトル、606…接線ベクトル、607…間隔、608
…端点区間、609…端点区間開始点、610…端点区
間終了点、611…輪郭線、700…文字パターン、7
01…端点、702…端点、703…文字パターン、7
04…端点、705…端点、706…端点、707…端
点、902…端点区間開始点、903…端点区間終了
点、904…端点区間開始点、905…端点区間終了
点、906…中点、907…中点、908…端点、90
9…端点、910…ベクトル、911…ベクトル、91
2…ベクトル、913…端点間距離、1200…輪郭、
1201…輪郭、1202…ドット、1203…ドッ
ト、1204…ドット、1205…ドット、1206…
端点、1207…端点、1300…輪郭、1301…輪
郭、1400…ドット番号、1401…輪郭番号フラ
グ、1402…外接点フラグ、1403…端点フラグ、
1502…四角形、1600…輪郭、1601…輪郭、
1701…ベクトル、1702…ベクトル、1703…
ベクトル、1704…湾方向ベクトル、2300…文字
パターン、2301…修復後の文字パターン、2302
…端点区間開始点、2303…端点区間終了点、230
4…端点、2305…端点、2306…端点、
───────────────────────────────────────────────────── フロントページの続き (72)発明者 古賀 昌史 東京都国分寺市東恋ケ窪一丁目280番地 株式会社 日立製作所 中央研究所内 (72)発明者 鈴木 和美 神奈川県小田原市国府津2880番地 株式 会社 日立製作所 小田原工場内 (72)発明者 小林 康二 神奈川県小田原市国府津2880番地 株式 会社 日立製作所 小田原工場内 (56)参考文献 特開 昭59−58589(JP,A) 特開 平4−32983(JP,A) 特開 平5−120488(JP,A) 特開 平4−112284(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/20

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】文書画像を入力して文字パターンの認識を
    行なう文字パターン認識方法において、当該文字パター
    ンを認識し、当該認識の結果不読となった文字パターン
    に対し、かすれ修復を行ない、かすれ修復を行なった文
    字パターンに対し、再度文字認識することを特徴とする
    文字パターンの認識方法であって、 上記かすれ修復は、上記不読となった文字パターンに対
    して該文字パターンから文字線の先端にある端点を検出
    し、かすれにより生じた2つの端点からなる端点対を選
    択し、該選択された端点対を接続して文字パターンを修
    復することであって、該修復の成功の可能性を評価した
    評価値を設け、該評価値の高い順に端点対を、少なくと
    も1組の端点対を含む少なくとも1以上の段階に分け、
    前記評価値の高い段階に属する端点対から順次、修復対
    象として選択することを特徴とする文字パターンの認識
    方法。
  2. 【請求項2】請求項1に記載の文字パターン認識方法で
    あって、 上記かすれ修復は、さらに、上記不読となった文字パタ
    ーンの文字線の幅を求め、該求めた文字線の幅により定
    められた所定幅の直線で該選択された端点対を接続する
    ことを特徴とする文字パターンの認識方法。
  3. 【請求項3】請求項2に記載の文字パターン認識方法に
    おいて、 上記文字線の幅は、上記文字パターンの文字輪郭線の中
    心を通る中心線上の各点に直交する直線と、文字輪郭線
    とが交わった2点間の距離の平均値とすることを特徴と
    する文字パターンの認識方法。
  4. 【請求項4】請求項2に記載の文字パターン認識方法に
    おいて、 上記文字線の幅は、注目する端点から輪郭線に沿って、
    端点の両側に所定ドット数離れた2点を求め、該2点間
    の距離の最小値とすることを特徴とする文字パターンの
    認識方法。
  5. 【請求項5】文書画像を入力して文字パターンの認識を
    行なう文字パターン認識方法において、当該文字パター
    ンを認識し、当該認識の結果不読となった文字パターン
    に対し、かすれ修復を行ない、かすれ修復を行なった文
    字パターンに対し、再度文字認識することを特徴とする
    文字パターンの認識方法であって、 上記かすれ修復は、上記不読となった文字パターンに対
    して該文字パターンから文字線の先端にある端点を検出
    し、かすれにより生じた2つの端点からなる端点対を選
    択し、該選択された端点対を接続して文字パターンを修
    復することであって、該端点対を接続する際、文字パタ
    ーン輪郭上の少なくとも4つの点を頂点とする多角形の
    頂点を求め、当該頂点の対を接続するために選択された
    端点の対とすることを特徴とする文字パターンの認識方
    法。
JP20145792A 1992-07-28 1992-07-28 文字パターン認識方法 Expired - Lifetime JP3272776B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20145792A JP3272776B2 (ja) 1992-07-28 1992-07-28 文字パターン認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20145792A JP3272776B2 (ja) 1992-07-28 1992-07-28 文字パターン認識方法

Publications (2)

Publication Number Publication Date
JPH0652356A JPH0652356A (ja) 1994-02-25
JP3272776B2 true JP3272776B2 (ja) 2002-04-08

Family

ID=16441415

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20145792A Expired - Lifetime JP3272776B2 (ja) 1992-07-28 1992-07-28 文字パターン認識方法

Country Status (1)

Country Link
JP (1) JP3272776B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100943595B1 (ko) * 2003-01-30 2010-02-24 삼성전자주식회사 영상신호의 블러링 판단장치 및 방법
JP6244755B2 (ja) 2013-09-03 2017-12-13 日本電気株式会社 文字補正装置及び文字補正方法とプログラム
JP6855022B2 (ja) * 2017-05-15 2021-04-07 京セラドキュメントソリューションズ株式会社 画像形成装置、画像形成方法及び画像形成プログラム
JP6816828B2 (ja) 2017-07-24 2021-01-20 京セラドキュメントソリューションズ株式会社 画像処理装置

Also Published As

Publication number Publication date
JPH0652356A (ja) 1994-02-25

Similar Documents

Publication Publication Date Title
US5321770A (en) Method for determining boundaries of words in text
US5687253A (en) Method for comparing word shapes
US4992650A (en) Method and apparatus for barcode recognition in a digital image
CA2077970C (en) Optical word recognition by examination of word shape
Liu et al. Identification of fork points on the skeletons of handwritten Chinese characters
JP2001092919A (ja) 2次元バーコードのねじれ角決定法
RU2621601C1 (ru) Устранение искривлений изображения документа
Elms et al. The advantage of using an HMM-based approach for faxed word recognition
JP3272776B2 (ja) 文字パターン認識方法
JPH0792820B2 (ja) 文字認識方法
JP3798179B2 (ja) パターン抽出装置及び文字切り出し装置
RU2707320C1 (ru) Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот
EP0602955B1 (en) Text recognition
JP3710164B2 (ja) 画像処理装置及び方法
JPH0749926A (ja) 文字認識装置
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2006235817A (ja) 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体
JP3093397B2 (ja) 文字認識方法
JPH10177624A (ja) 文字切出し方法および文字切出し装置
JPH09282417A (ja) 文字認識装置
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置
JP2867382B2 (ja) 文字認識装置におけるフォント決定方法
JP3210224B2 (ja) 文字認識装置
JPH03224079A (ja) 文字認識装置
JP2001195544A (ja) 文字切出し装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080125

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080125

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090125

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090125

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100125

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110125

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110125

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120125

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130125

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130125

Year of fee payment: 11