JPH11203405A - 文字認識装置及び方法並びにプログラム記憶媒体 - Google Patents

文字認識装置及び方法並びにプログラム記憶媒体

Info

Publication number
JPH11203405A
JPH11203405A JP10002206A JP220698A JPH11203405A JP H11203405 A JPH11203405 A JP H11203405A JP 10002206 A JP10002206 A JP 10002206A JP 220698 A JP220698 A JP 220698A JP H11203405 A JPH11203405 A JP H11203405A
Authority
JP
Japan
Prior art keywords
character
recognition
characters
input image
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10002206A
Other languages
English (en)
Other versions
JP3466899B2 (ja
Inventor
Masanori Yabuki
眞紀 矢吹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP00220698A priority Critical patent/JP3466899B2/ja
Publication of JPH11203405A publication Critical patent/JPH11203405A/ja
Application granted granted Critical
Publication of JP3466899B2 publication Critical patent/JP3466899B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】本発明は、1文字入力欄を持つ文書に記入され
る文字を認識する文字認識装置に関し、文字認識精度の
向上を目的とする。 【解決手段】入力画像の持つ罫線を抽出する抽出手段1
1と、抽出手段11の抽出する罫線と入力画像の持つ文
字との接触文字部分を特定するとともに、その特定結果
に従って、文字のみを取り出す取出手段12と、文字サ
イズに従って接触文字部分を有効とするのか否かを決定
することで、入力画像から文字を1文字ずつ切り出して
認識する第1の認識手段13と、取出手段12の取り出
す文字の続き文字部分を検出し、それを削除すること
で、入力画像から文字を1文字ずつ切り出して認識する
第2の認識手段14と、第1及び第2の認識手段13,1
4の認識結果から、最終的な文字の認識結果を決定する
決定手段15とを備えるように構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、1文字入力欄を持
つ文書に記入される文字を認識する文字認識装置及び方
法と、その文字認識装置の実現に用いられるプログラム
が記憶されるプログラム記憶媒体とに関し、特に、文字
認識精度の向上を実現する文字認識装置及び方法と、そ
の文字認識装置の実現に用いられるプログラムが記憶さ
れるプログラム記憶媒体とに関する。
【0002】1文字入力欄を持つ文書に金額などの文字
を記入させることが多い。これから、1文字入力欄に記
入される文字を認識する文字認識装置が必要となる。こ
のような文字認識装置は、文字認識精度の向上を図るこ
とで実用的なものにしていく必要がある。
【0003】
【従来の技術】1文字入力欄を持つ文書に記入される手
書き文字は、図19に示すように、入力欄の指定する枠
を超えて記入されたり、文字と文字とが繋がる形態で記
入されることが多く、認識が非常に難しいという問題点
を抱えている。
【0004】更に説明するならば、この問題点は、ファ
ックスやコピーなどで活字文字の画質が劣化する場合に
も起こるし、精度の悪いプリンタで印刷を行う場合にも
起こる。
【0005】このようなことを背景にして、本出願人
は、一連の特許出願で開示してきたように、1文字入力
欄を構成する枠と、1文字入力欄に記入された文字とを
分離するという技術を開発して、そのように分離された
文字を文字同士が分離していることを前提とする切り出
しアルゴリズムを使って切り出して、その文字切り出し
技術により切り出された文字を認識するという技術を開
発してきた。
【0006】そして、そのように分離された文字を処理
対象として文字と文字との間の続き文字部分を検出し、
それを削除することで文字を切り出すという技術を開発
して、その文字切り出し技術により切り出された文字を
認識するという技術を開発してきた。
【0007】また、本出願人以外も、1文字入力欄に記
入される文字を認識する様々な技術が提案されている。
【0008】
【発明が解決しようとする課題】確かに、本出願人が開
発した文字認識技術は、1文字入力欄に記入された文字
を高精度に読み取れるという特徴がある。
【0009】しかしながら、手書き文字というものは実
に多様なものであり、また、活字文字の画質の劣化など
も実に多様なものである。これから、特定のアルゴリズ
ムに従っていたのでは、自ずと認識精度が限界が出るこ
とを避けられない。
【0010】これから、従来技術に従っていると、1文
字入力欄に記入された文字の認識精度が必ずしも十分で
ないことが起こるという問題点を抱えていた。本発明は
かかる事情に鑑みてなされたものであって、1文字入力
欄を持つ文書に記入される文字を認識する構成を採ると
きにあって、その文字認識精度の向上を実現する新たな
文字認識装置及び方法の提供と、その文字認識装置の実
現に用いられるプログラムが記憶される新たなプログラ
ム記憶媒体の提供とを目的とする。
【0011】
【課題を解決するための手段】図1に本発明の原理構成
を図示する。図中、1は本発明を具備する文字認識装置
であって、罫線で区切られる1文字入力欄に記入される
文字を認識するもの、2は文字認識装置1に接続される
イメージスキャナであって、文書画像を読み取って文字
認識装置1に入力するものである。
【0012】本発明の文字認識装置1は、イメージメモ
リ10と、抽出手段11と、取出手段12と、第1の認
識手段13と、第2の認識手段14と、決定手段15と
を備える。
【0013】イメージメモリ10は、罫線で区切られる
1文字入力欄に文字の記入される文書画像(2値化され
ている)を格納する。抽出手段11は、入力された文書
画像の持つ罫線を抽出する。取出手段12は、抽出手段
11の抽出する罫線と入力された文書画像の持つ文字と
の接触文字部分を特定するとともに、その特定結果に従
って、入力された文書画像から文字のみを取り出す。
【0014】第1の認識手段13は、文字サイズに従っ
て、取出手段12の特定する接触文字部分を有効とする
のか否かを決定することで、入力された文書画像から文
字を1文字ずつ切り出して認識処理を実行する。
【0015】第2の認識手段14は、取出手段12の取
り出す文字の続き文字部分を検出し、それを削除するこ
とで、入力画像から文字を1文字ずつ切り出して認識処
理を実行する。
【0016】決定手段15は、第1の認識手段13の認
識結果と、第2の認識手段14の認識結果とから、最終
的な文字の認識結果を決定する。ここで、本発明の文字
認識装置1の持つ機能は具体的にはプログラムで実現さ
れるものであり、このプログラムは、フロッピィディス
クなどに記憶されたり、サーバなどのディスクなどに記
憶され、それらから文字認識装置1にインストールされ
てメモリ上で動作することで、本発明を実現することに
なる。
【0017】このように構成される本発明の文字認識装
置1では、抽出手段11が入力された文書画像の持つ罫
線を抽出すると、取出手段12は、抽出された罫線と入
力された文書画像の持つ文字との接触文字部分を特定す
るとともに、その特定結果に従って、入力された文書画
像から文字のみを取り出す。
【0018】これを受けて、第1の認識手段13は、文
字同士が分離していることを前提する文字切り出しアル
ゴリズムに従い、文字サイズを使って、取出手段12の
特定する接触文字部分を有効とするのか否かを決定する
ことで、入力された文書画像から文字を1文字ずつ切り
出して認識処理を実行する。
【0019】一方、第2の認識手段14は、文字サイズ
を考慮せずに、取出手段12の取り出す文字の続き文字
部分を検出し、それを削除することで、入力画像から文
字を1文字ずつ切り出して認識処理を実行する。
【0020】このとき、第2の認識手段14は、文字の
続き文字部分が存在しないことを判断するときには、図
2に示すように、文字の認識処理を実行しないように処
理する。
【0021】そして、決定手段15は、この第1の認識
手段13の認識結果と、第2の認識手段14の認識結果
とを受けて、例えば、距離値の小さい方の認識結果を最
終的な認識結果として決定する。
【0022】このように、本発明の文字認識装置1で
は、1文字入力欄の罫線を削除しつつ文字を認識する構
成を採るときにあって、図3に示すように、文字同士が
分離していることを前提とする文字切り出しアルゴリズ
ムを使って切り出される文字を認識対象(図3の右側)
として、文字の認識処理を実行するとともに、文字の続
き文字部分を削除することで切り出される文字を認識対
象(図3の左側)として、文字の認識処理を実行する構
成を採って、その2つの認識結果から最終的な文字の認
識結果を得るようにすることから、文字認識精度を従来
よりも向上できるようになる。
【0023】
【発明の実施の形態】以下、金融文書に記入される手書
き数字(0〜9)を認識対象とする実施の形態に従って
本発明を詳細に説明する。
【0024】図4に、本発明を具備する文字認識装置1
の一実施例を図示する。この実施例に従う本発明の文字
認識装置1は、図1で説明したイメージスキャナ2と、
図1で説明したイメージメモリ10と、認識制御プログ
ラム20と、第1の認識プログラム21と、第2の認識
プログラム22と、枠抽出プログラム23と、接触文字
部分抽出プログラム24とを備えている。
【0025】ここで、文字認識装置1に展開されるプロ
グラムは、フロッピィディスクや回線などを介してイン
ストールされることになる。この認識制御プログラム2
0は、イメージメモリ10に格納される文書画像の持つ
手書き文字(罫線で区切られる1文字入力欄に記入され
ている)の認識要求が発行されると、図5の処理フロー
に示すように、先ず最初に、ステップ1で、枠抽出プロ
グラム23を起動する。
【0026】このようにして起動されると、枠抽出プロ
グラム23は、後述する構成に従って、文書画像の持つ
1文字入力欄の枠(罫線で区切られる文字の枠)を抽出
する。
【0027】続いて、ステップ2で、枠抽出プログラム
23による抽出処理が終了するのを待って、この抽出処
理が終了すると、ステップ3に進んで、接触文字部分抽
出プログラム24を起動する。
【0028】このようにして起動されると、接触文字部
分抽出プログラム24は、後述する構成に従って、枠抽
出プログラム23の抽出結果を参照しつつ、1文字入力
欄の枠部分と重なる手書き文字部分(枠に接触する文字
部分)を抽出するとともに、その抽出結果に従って、文
書画像の持つ手書き文字のみを抽出する。
【0029】続いて、ステップ4で、接触文字部分抽出
プログラム24による抽出処理が終了するのを待って、
この抽出処理が終了すると、ステップ5に進んで、第1
の認識プログラム21を起動する。
【0030】このようにして起動されると、第1の認識
プログラム21は、接触文字部分抽出プログラム24の
抽出結果を参照しつつ、後述する構成に従って、第2の
認識プログラム22とは別の文字切り出しアルゴリズム
に従って手書き文字を1文字ずつ切り出して認識する。
【0031】続いて、ステップ6で、第1の認識プログ
ラム21による手書き文字の認識処理が終了するのを待
って、この認識処理が終了すると、ステップ7に進ん
で、第2の認識プログラム22を起動する。
【0032】このようにして起動されると、第2の認識
プログラム22は、接触文字部分抽出プログラム24の
抽出結果を参照しつつ、後述する構成に従って、第1の
認識プログラム21とは別の文字切り出しアルゴリズム
に従って手書き文字を1文字ずつ切り出して認識する。
【0033】続いて、ステップ8で、第2の認識プログ
ラム22による手書き文字の認識処理が終了するのを待
って、この認識処理が終了すると、ステップ9に進ん
で、第1の認識プログラム21の認識結果と、第2の認
識プログラム22の認識結果とから、最終的な手書き文
字の認識結果を決定する。
【0034】次に、枠抽出プログラム23について説明
する。上述したように、枠抽出プログラム23は、文書
画像の持つ1文字入力欄の枠を抽出する処理を行う。
【0035】この枠抽出プログラム23は、文書画像の
持つ枠を抽出するものであればどのような構成に従うも
のでもよいが、例えば、本出願人が出願した特開平6-3
09498 号や、特開平7-28937号や、特開平8-305796 号
や、特開平9-50527号で開示した構成のものを用いるこ
とが可能である。
【0036】図6に、本出願人が特開平8-305796 号な
どで開示した枠抽出プログラム23の機能ブロック図を
図示する。図6の構成に従う枠抽出プログラム23は、
連結パターン抽出部230と、投影部231と、直線検
出部232と、第1の4辺検出部233と、追跡部23
4と、第2の4辺検出部235と、枠抽出部236とで
構成されている。
【0037】連結パターン抽出部230は、イメージメ
モリ10に格納される文書画像を入力して、縦、横、斜
めの8方向のいずれかで繋がっている8連結の連結パタ
ーンをラベリング処理により抽出する。このとき得られ
る連結パターンとしては、文字の接触していない枠、
枠に接触していない文字又はその一部、枠に接触し
ている文字又はその一部のいずれかである。
【0038】この抽出された連結パターンの中に、1文
字入力欄の文字枠を構成する直線が含まれている。投影
部231は、連結パターン抽出部230により抽出され
た連結パターンを水平方向と垂直方向に投影する。直線
検出部232は、投影部231により得られた水平方向
/垂直方向の投影情報から、水平線/垂直線を検出す
る。第1の4辺検出部233は、直線検出部232によ
り検出された水平線/垂直線から検出される矩形につい
て、その4辺を検出する。
【0039】追跡部234は、直線検出部232/第1
の4辺検出部233で検出できない線幅の細い直線を求
めるために、設定される数ライン(例えば2〜3ライ
ン)の幅内で8連結する水平線と垂直線を追跡する。第
2の4辺検出部235は、追跡部234で追跡された水
平線/垂直線から検出される矩形について、その4辺を
検出する。
【0040】枠抽出部236は、第1の4辺検出部23
3で検出された4辺から1文字入力欄の枠を抽出すると
ともに、第2の4辺検出部235で検出された4辺から
1文字入力欄の枠を抽出する。
【0041】この図6の構成に従って、枠抽出プログラ
ム23は、文書画像の持つ1文字入力欄の枠に関する予
備知識を持たなくても、文書画像の持つ1文字入力欄の
枠を抽出できるようになる。
【0042】次に、接触文字部分抽出プログラム24に
ついて説明する。上述したように、接触文字部分抽出プ
ログラム24は、1文字入力欄の枠部分と重なる手書き
文字部分(枠に接触する文字部分)を抽出するととも
に、その抽出結果に従って文書画像の持つ手書き文字の
みを抽出する処理を行う。
【0043】後述するように、第1及び第2の認識プロ
グラム21,22は、罫線の取り除かれた文書画像の持
つ手書き文字に対して認識処理を施すことになるが、こ
の手書き文字が枠と接触する場合には、枠を削除すると
手書き文字部分が欠落してしまうことになる。そこで、
この欠落部分を補間するために、接触文字部分抽出プロ
グラム24を使って、1文字入力欄の枠部分と重なる手
書き文字部分を抽出する処理を行うのである。
【0044】この接触文字部分抽出プログラム24は、
1文字入力欄の枠部分と重なる手書き文字部分を抽出す
るものであればどのような構成に従うものでもよいが、
例えば、本出願人が出願した特開平6-309498 号や、特
開平7-28937号や、特開平8-305796 号や、特開平9-5
0527号で開示した構成のものを用いることが可能であ
る。
【0045】図7に、本出願人が特開平8-305796 号な
どで開示した接触文字部分抽出プログラム24の機能ブ
ロック図を図示する。図7の構成に従う接触文字部分抽
出プログラム24は、連結パターン属性付加部240
と、枠分離部241と、交点算出部242と、交点対応
付け部243と、接触文字部分抽出部244とで構成さ
れている。
【0046】連結パターン属性付加部240は、枠抽出
プログラム23の連結パターン抽出部230により抽出
された連結パターンに対して、「枠」、「文字パターン
又はその一部」、「枠と文字パターン又はその一部との
接触パターン(接触文字パターン)」のいずれかの属性
を付加する。
【0047】枠分離部241は、連結パターン属性付加
部240で「枠」又は「文字と枠との接触文字パター
ン」という属性の付加された連結パターンから枠を分離
する。具体的には、枠部分の辺の幅を算出し、それに基
づいて枠を除去する。そして、枠を除去したパターンに
ついて再びラベリングを施して、面積の小さいパターン
を雑音として除去し、連結パターン属性付加部240で
属性の付加されなかったパターンの内、枠を除去しても
残るパターンについては「接触文字パターン」の属性を
付加し、枠を除去したら何も残らないパターンについて
は「枠」だけの属性を付加することで行う。
【0048】交点算出部242は、先ず最初に、接触文
字パターンについて、枠と文字との交点を算出し、続い
て、それらの全ての交点について、その位置から枠外方
向へ枠幅分程度まで文字線分を探索して枠外の交点を算
出するとともに、その探索した文字線分の面積を求め
る。続いて、この求めた文字線分の面積が閾値以下であ
るときには、その文字線分を雑音とみなして除去すると
ともに、その交点が文字と枠との交点でないと判断する
ことで行う。
【0049】交点対応付け部243は、交点算出部24
2で得られた交点情報に基づいて、枠と接触している文
字線分の方向性を求める。更に、枠の両側に接触してい
る2つの文字線分間の距離を求める。そして、この求め
た方向性及び距離と、この方向性に基づく文字線分の連
続性の条件とにより、文字と枠との各交点を対応付け
る。この対応付け処理により、図8(a)の例で説明す
るならば、交点Aと交点Cとが対応付けられ、交点Bと
交点Dとが対応付けられることになる。
【0050】接触文字部分抽出部244は、交点対応付
け部243により対応付けられた交点により規定される
枠部分の画像を文字成分と判断する。そして、その判断
結果に従って、枠に影響されない形で文字パターンのみ
を抽出する。
【0051】この図7の構成に従って、接触文字部分抽
出プログラム24は、図8(a)に示す接触文字パター
ンから、図8(b)に示すように、1文字入力欄の枠部
分と重なる手書き文字部分(図中のドット部分)を抽出
できるようになる。そして、この接触文字部分の抽出結
果に従って、図9に示すように、文書画像の持つ1文字
入力欄の枠を除去して、その1文字入力欄に記入される
手書き文字のみを抽出できるようになる。
【0052】次に、第1の認識プログラム21の実行す
る手書き文字認識処理について説明する。第1の認識プ
ログラム21は、認識制御プログラム20より起動され
ると、接触文字部分抽出プログラム24の抽出結果を参
照しつつ、文字と文字とが分離していることを前提とす
る文字切り出しアルゴリズムを使って、文書画像から手
書き文字を切り出し、それに対する認識処理を実行す
る。
【0053】この文字切り出しアルゴリズムとしては、
どのようなものを用いてもよいが、例えば、本出願人が
特開平8-305796 号で開示したものが使える。図10
に、第1の認識プログラム21の実行する処理フローの
一実施例を図示する。次に、この処理フローに従って、
第1の認識プログラム21の実行する認識処理について
説明する。
【0054】第1の認識プログラム21は、認識制御プ
ログラム20より起動されると、図10の処理フローに
示すように、先ず最初に、ステップ1で、接触文字部分
抽出プログラム24の抽出情報を入手する。
【0055】続いて、ステップ2で、文書画像に記入さ
れる手書き文字の平均文字サイズを算出する。この平均
文字サイズは、特開平8-305796 号では、接触文字部分
抽出プログラム24により抽出された各文字のサイズ
(外接矩形で近似して求める)から、文書画像に記入さ
れる手書き文字の平均文字サイズを算出する構成を採っ
たが、簡略的な方法として、枠抽出プログラム23で抽
出された1文字入力欄の大きさから算出するような構成
を採ることも可能である。
【0056】続いて、ステップ3で、接触文字部分抽出
プログラム24により抽出された各文字のサイズを、ス
テップ2で算出した平均サイズと比較することで、接触
文字部分抽出プログラム24で抽出した枠部分と重なる
手書き文字部分(接触文字部分)が本来の文字部分であ
るのか否かを判断して、本来の文字部分でないことを判
断するときには、それを削除していくことで文字を切り
出す。
【0057】1文字入力欄が設けられていることから、
金融文書に記入される「0」〜「9」の文字は、基本的
には、1文字入力欄の枠内に記入されることで他の文字
と切り離されているのであるが、文字の一部が枠を飛び
出して記入されたり、隣の文字と繋がって記入されるこ
とがある。そこで、接触文字部分抽出プログラム24で
抽出した接触文字部分を有効とした場合に、1つの文字
サイズに収まらなくなってしまうときには、その抽出さ
れた接触文字部分を無効として削除し、1つの文字サイ
ズに収まるときには、その抽出された接触文字部分を有
効としていくことで正確な文字を切り出すように処理す
る。
【0058】例えば、図11(a)に示すように、
「2」と「5」と「3」とが続けて記入されることで、
1文字入力欄の枠を横切るようなときには、文字サイズ
が平均文字サイズよりも大きくなることを考慮して、接
触文字部分抽出プログラム24で抽出した接触文字部分
を削除することで、「2」と「5」と「3」とを正確に
切り出すのである。
【0059】また、図11(b)に示すように、「1」
と「0」の一部が1文字入力欄の範囲を外れている場合
には、文字サイズが平均文字サイズに収まることを考慮
して、接触文字部分抽出プログラム24で抽出した接触
文字部分を本来の文字として扱うことで、「1」と
「0」とを正確に切り出すのである。
【0060】このようにして1文字入力欄に記入される
手書き文字を1文字ずつ切り出すと、続いて、ステップ
4に進んで、切り出した文字の中から未処理の文字を1
つ選択し、続くステップ5で、全ての文字を選び出した
のか否かを判断する。
【0061】このステップ5で、全ての文字を選び出し
ていないことを判断するとき、すなわち、ステップ4
で、切り出した文字の中から未処理の文字を1つ選択で
きたことを判断するときには、ステップ6に進んで、そ
の選択した文字の持つ文字認識に用いる特徴量を算出す
る。このとき算出する特徴量としては、従来技術の文字
認識処理で提案されているどのようなものを用いてもよ
い。
【0062】続いて、ステップ7で、その算出した特徴
量を使って、認識対象となる登録文字との間の距離を測
定する。金融文書では、「0」〜「9」の10個の文字
が登録文字となるので、これらの10個の登録文字との
間の距離を測定するのである。
【0063】続いて、ステップ8で、ステップ4で選択
した文字の認識結果として、ステップ7で測定した最も
距離の小さい登録文字を決定してから、次の文字の認識
に進むべくステップ4に戻っていく。
【0064】そして、ステップ4ないしステップ8の処
理を繰り返すことで、ステップ5で、全ての文字を選び
出したことを判断するとき、すなわち、ステップ3で切
り出した手書き文字の文字認識を終了することを判断す
ると、ステップ9に進んで、ステップ8で決定した認識
結果の登録文字との間の距離の合計値を算出して、全処
理を終了する。
【0065】このようにして、第1の認識プログラム2
1は、1文字入力欄の枠部分に重なる文字部分を有効な
ものとしたり無効なものとしながら、文字と文字とが分
離していることを前提とする文字切り出しアルゴリズム
を使って、文書画像から手書き文字を1文字ずつ切り出
して、その切り出した文字に対して認識処理を施すこと
で文字認識を実行するのである。
【0066】この第1の認識プログラム21の認識処理
により、例えば、図3の上段に示す続き文字の形態で記
入される「10000」という手書き文字は、図3の右
側のように切り出されて、「18886」と認識される
ことになる。そして、この認識結果に対して、各文字の
認識結果の距離の合計値として「500」が算出される
ことになる。
【0067】次に、第2の認識プログラム22の実行す
る認識処理について説明する。第2の認識プログラム2
2は、認識制御プログラム20より起動されると、接触
文字部分抽出プログラム24により1文字入力欄の枠の
取り外された手書き文字を認識対象として、文字と文字
とを繋ぐ続き文字部分を検出して、それを削除すること
で文書画像から手書き文字を切り出し、それに対する認
識処理を実行する。
【0068】この文字切り出しアルゴリズムとしては、
どのようなものを用いてもよいが、例えば、本出願人が
特開平7-192094 号で開示したものが使える。図12及
び図13に、第2の認識プログラム22の実行する処理
フローの一実施例を図示する。次に、この処理フローに
従って、第2の認識プログラム22の実行する認識処理
について説明する。
【0069】第2の認識プログラム21は、認識制御プ
ログラム20より起動されると、図12及び図13の処
理フローに示すように、先ず最初に、ステップ1で、接
触文字部分抽出プログラム24により抽出された手書き
文字のみの抽出情報を入手することで、手書き文字を構
成する連結パターンを入手する。
【0070】続いて、ステップ2で、複数の文字が繋が
っている続き文字の候補として、ステップ1で読み取っ
た連結パターンの中から横長の連結パターンを抽出す
る。この抽出処理は、連結パターン毎に外接矩形を求め
て、その外接矩形の縦横の比率を算出し、所定の閾値と
比較することで行う。
【0071】続いて、ステップ3で、ステップ2で抽出
した横長パターンの持つ水平続き線(続き文字部分を形
成する線)を抽出する処理を行う。このステップ3で
は、先ず最初に、「文字パターン面積/外接矩形の面
積」を算出し、その値に従って、抽出する直線の長さを
決定する。具体的には、「文字パターン面積/外接矩形
の面積」の値が大きいときには、長い水平線を抽出し、
この値が小さいときには、短い水平線を抽出する。
【0072】すなわち、「文字パターン面積/外接矩形
の面積」の値が大きいということは、文字パターンのパ
ターン幅が大きいことを意味する。このようなときに、
短い直線を抽出するようにすると、本来の文字部分にも
多数の直線が存在し、それらが抽出されてしまうことに
なるからてある。また、「文字パターン面積/外接矩形
の面積」の値が小さいということは、文字パターンのパ
ターン幅が小さいことを意味する。このようなときに、
長い直線を抽出するようにすると、本来の水平線が抽出
されなくなってしまうからである。
【0073】このステップ3では、続いて、図14
(a)に示すように、抽出する直線の長さに従って、文
字パターンを縦方向に分割し、その分割した範囲内で投
影の処理を行う。このとき、斜め線の存在を考慮して、
周囲の行の投影値を足し合わせる形で横方向に投影(い
わゆる隣接投影法)を行って、その投影値が所定の閾値
以上であるときには、その部分に直線が存在すると認識
して、その範囲を矩形近似して矩形の直線を形成する。
【0074】このステップ3では、続いて、図14
(b)に示すように、接触する矩形直線を統合すること
で長い直線を抽出し、その中で最も長い直線を水平続き
線とする処理を行う。
【0075】ステップ3で、水平続き線(続き文字部分
を形成する線)を抽出すると、続いて、ステップ4で、
水平続き線が検出されたのか否かを判断して、水平続き
線が検出されないことを判断するときには、ステップ5
に進んで、認識処理を実行しない旨を記録して処理を終
了する。
【0076】一方、ステップ4で、水平続き線が検出さ
れたことを判断するときには、ステップ6に進んで、垂
直分離線を決定する。この垂直分離線の決定処理は、図
15(a)に示すように、矩形近似された水平続き線の
下辺の一方の端点から水平続き線を辿ることで文字パタ
ーンとの交差点を見つけ、そこから文字パターンの輪郭
の探索を開始して、水平続き線に辿りついたら輪郭の探
索を一時終了する。続いて、水平続き線を辿ることで次
の文字パターンとの交差点を見つけ、そこから文字パタ
ーンの輪郭の探索を再び開始して、水平続き線に辿りつ
いたら輪郭の探索を一時終了する。これを矩形近似され
た水平続き線の下辺のもう一方の端点に辿りつくまで繰
り返し行う。
【0077】最終的に、輪郭探索を行った回数が文字数
となり、輪郭探索の開始点から終了点までが1文字の存
在する領域である。垂直分離線は、文字と文字とを分離
する垂直線であり、図15(b)に示すように、輪郭探
索の終了点と開始点との間で、かつ、矩形近似された水
平続き線の幅値を持つ位置で決定する。
【0078】ステップ6で垂直分離線を決定すると、続
いて、ステップ7で、ゼロ判定を行う。このゼロ判定処
理は、図16に示すように、垂直分離線と水平続き線に
囲まれた1文字領域内において、水平続き線と文字パタ
ーンとに囲まれた空白部分から、複数方向に放射状に探
索を行うことでループ構造を持つのか否かを調べること
で行う。
【0079】ステップ7でゼロ判定を行うと、続いて、
ステップ8で、文字を分離する処理を行う。この文字分
離処理は、不要な水平続き線を削除することで行う。す
なわち、ゼロと判定した文字では、水平続き線は不必要
な線であるので、これを削除するのである。この削除処
理は、図17(a)に示すように、垂直分離線を除去す
るとともに、続き線の太さが急激に変化する部分や、続
き線の傾きやその微分値が急激に変化する部分まで削除
することで行う。一方、ゼロでないと判定された文字に
ついては、図17(b)に示すように、垂直分離線の部
分で他の文字との分離を行うが続き線の削除は行わな
い。
【0080】このようにして、第2の認識プログラム2
2は、ステップ1ないしステップ8の処理に従って、文
字と文字とを繋げる不要な続き文字部分(金融文書の場
合、そのほとんどが「0」と「0」とを連続的に記入す
るときに発生する)を削除することで、文書画像から手
書き文字を切り出すのである。
【0081】なお、この処理フローでは詳細に説明しな
かったが、一部分の文字しか続き文字部分を持たないと
き(すでに分離されている文字がある)にも、ステップ
5には進まずに、ステップ6ないしステップ8の処理に
進んで、その続き文字部分を削除する処理を行うことに
なる。
【0082】ステップ8で文書画像から手書き文字を切
り出すと、続いて、ステップ9に進んで、切り出した文
字の中から未処理の文字を1つ選択し、続くステップ1
0で、全ての文字を選び出したのか否かを判断する。
【0083】このステップ10で、全ての文字を選び出
していないことを判断するとき、すなわち、ステップ9
で、未処理の文字を1つ選択できたことを判断するとき
には、ステップ11(図13の処理フロー)に進んで、
第1の認識プログラム21の用いた算出手法と同一の算
出手法を用いて、その選択した文字の持つ文字認識に用
いる特徴量を算出する。
【0084】続いて、ステップ12で、その算出した特
徴量を使って認識対象となる登録文字との間の距離を測
定する。金融文書では、「0」〜「9」の10個の文字
が認識対象の登録文字となるので、これらの10個の登
録文字との間の距離を測定するのである。
【0085】続いて、ステップ13で、ステップ9で選
択した文字の認識結果として、ステップ12で測定した
最も距離の小さい登録文字を決定してから、次の文字の
認識に進むべくステップ9に戻っていく。
【0086】そして、ステップ9ないしステップ13の
処理を繰り返すことで、ステップ10で、全ての文字を
選び出したことを判断するとき、すなわち、ステップ8
で切り出した手書き文字の文字認識を終了することを判
断すると、ステップ14に進んで、ステップ13で決定
した認識結果の登録文字との間の距離の合計値を算出し
て、全処理を終了する。
【0087】このようにして、第2の認識プログラム2
2は、接触文字部分抽出プログラム24により1文字入
力欄の枠の取り外された手書き文字を認識対象として、
文字と文字とを繋ぐ続き文字部分を検出して、それを削
除することで文書画像から手書き文字を切り出し、それ
に対する認識処理を実行するのである。
【0088】この第2の認識プログラム22の認識処理
により、例えば、図3の上段に示す続き文字の形態で記
入される「10000」という手書き文字は、図3の左
側のように切り出されて、「10000」と認識される
ことになる。そして、この認識結果に対して、認識結果
の距離の合計値として「20」が算出されることにな
る。
【0089】図5の処理フローで説明したように、認識
制御プログラム20は、第1及び第2の認識プログラム
21,22が認識処理を終了すると、最終的な認識結果
を決定する処理を行う。
【0090】図18に、この認識制御プログラム20の
実行する決定処理の一実施例を図示する。次に、この処
理フローについて説明する。認識制御プログラム20
は、第1及び第2の認識プログラム21,22が認識処
理を終了すると、図18の処理フローに示すように、先
ず最初に、ステップ1で、第2の認識プログラム22が
認識処理を実行したのか否かを判断する。上述したよう
に、第2の認識プログラム22は、続き文字部分が存在
しないときには、認識処理を実行せずにその旨を記録す
るだけの処理を行うので、この記録が残されているのか
否かを判断することで、第2の認識プログラム22が認
識処理を実行したのか否かを判断するのである。
【0091】この判断処理により、第2の認識プログラ
ム22が認識処理を実行しなかったことを判断するとき
には、ステップ2に進んで、第1の認識プログラム21
の認識結果を最終的な認識結果として出力して処理を終
了する。
【0092】一方、この判断処理により、第2の認識プ
ログラム22が認識処理を実行したことを判断するとき
には、ステップ3に進んで、第1の認識プログラム21
の出力する距離合計値と、第2の認識プログラム22の
出力する距離合計値との大小を比較する。
【0093】この比較処理により、第1の認識プログラ
ム21の出力する距離合計値の方が小さいと判断すると
きには、ステップ4に進んで、第1の認識プログラム2
1の認識結果を最終的な認識結果として出力する。一
方、第2の認識プログラム22の出力する距離合計値の
方が小さいと判断するときには、ステップ2に進んで、
第2の認識プログラム22の認識結果を最終的な認識結
果として出力する。
【0094】このようにして、認識制御プログラム20
は、第1の認識プログラム21の認識結果と、第2の認
識プログラム22の認識結果とを受け取ると、距離値の
合計値の小さい方、すなわち、より類似していると判断
した認識結果の方を最終的な認識結果として選択して出
力するのである。
【0095】この決定処理により、図3の例で説明する
ならば、第2の認識プログラム22の認識結果である
「10000」が最終的な認識結果として出力されるこ
とになる。
【0096】第1の認識プログラム21の用いる文字切
り出しアルゴリズムは、文字と文字とが分離しているこ
とを前提するものであり、これから、続き文字部分を除
去できないことが起こる。このようなときには、続き文
字部分を除去することで文字を切り出す第2の認識プロ
グラム22の認識結果の方が正解の可能性が高い。
【0097】一方、第2の認識プログラム22の用いる
文字切り出しアルゴリズムは、文字と文字とが分離して
いることを前提としていないものであり、これから、1
文字入力欄に記入されることで本来は文字と文字とが分
離しているにもかかわらず、続き文字部分を誤って検出
することが起こる。このようなときには、文字と文字と
が分離していることを前提として文字を切り出す第1の
認識プログラム21の認識結果の方が正解の可能性が高
い。
【0098】このような特性の違いを考慮して、本発明
では、認識制御プログラム20が、第1の認識プログラ
ム21の認識結果と第2の認識プログラム22の認識結
果とから、より正解き可能性の高い方の認識結果を最終
的な認識結果とする構成を採るのである。この構成を採
ることで、従来よりも文字認識精度を著しくる向上でき
るようになる。
【0099】図示実施例に従って本発明を説明したが、
本発明はこれに限定されるものではない。例えば、実施
例では、第1の認識プログラム21と第2の認識プログ
ラム22とが手書き文字を切り出した後、同一の認識ア
ルゴリズムを使って文字認識を実行する構成を採った
が、両者の認識結果を比較できるものであるならば、異
なる認識アルゴリズムを使ってもよい。
【0100】また、実施例では、金融文書を想定して、
「0」〜「9」を認識対象とすることを想定したが、本
発明は、その適用が「0」〜「9」に認識対象とするも
のに限られるものではない。
【0101】また、実施例では、手書き文字を認識対象
とすることを想定したが、画質の劣化した活字文字や、
精度の悪いプリンタにより印刷された文字などに対して
も、本発明はそのまま適用できるものである。
【0102】
【発明の効果】以上説明したように、本発明の文字認識
装置では、1文字入力欄の罫線を削除しつつ文字を認識
する構成を採るときにあって、文字同士が分離している
ことを前提とする文字切り出しアルゴリズムを使って切
り出される文字を認識対象として、文字の認識処理を実
行するとともに、文字の続き文字部分を削除することで
切り出される文字を認識対象として、文字の認識処理を
実行する構成を採って、その2つの認識結果から最終的
な文字の認識結果を得るようにすることから、文字認識
精度を従来よりも向上できるようになる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の説明図である。
【図3】本発明の説明図である。
【図4】本発明の一実施例である。
【図5】認識制御プログラムの実行する処理フローであ
る。
【図6】枠抽出プログラムの説明図である。
【図7】接触文字部分抽出プログラムの説明図である。
【図8】接触文字部分の抽出処理の説明図である。
【図9】文字抽出処理の説明図である。
【図10】第1の認識プログラムの実行する処理フロー
である。
【図11】文字切り出し処理の説明図である。
【図12】第2の認識プログラムの実行する処理フロー
である。
【図13】第2の認識プログラムの実行する処理フロー
である。
【図14】水平続き線の抽出処理の説明図である。
【図15】垂直分離線の決定処理の説明図である。
【図16】ゼロ判定処理の説明図である。
【図17】文字分離処理の説明図である。
【図18】認識制御プログラムの実行する処理フローで
ある。
【図19】1文字入力欄に記入される手書き文字の説明
図である。
【符号の説明】
1 文字認識装置 2 イメージスキャナ 10 イメージメモリ 11 抽出手段 12 取出手段 13 第1の認識手段 14 第2の認識手段 15 決定手段

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 罫線で区切られる1文字入力欄に記入さ
    れる文字を認識する文字認識装置において、 入力画像の持つ罫線を抽出する抽出手段と、 上記抽出手段の抽出する罫線と入力画像の持つ文字との
    接触文字部分を特定するとともに、その特定結果に従っ
    て、該文字のみを取り出す取出手段と、 文字サイズに従って上記接触文字部分を有効とするのか
    否かを決定することで、入力画像から文字を1文字ずつ
    切り出して認識する第1の認識手段と、 上記取出手段の取り出す文字の続き文字部分を検出し、
    それを削除することで、入力画像から文字を1文字ずつ
    切り出して認識する第2の認識手段と、 第1及び第2の認識手段の認識結果から、最終的な文字
    の認識結果を決定する決定手段とを備えることを、 特徴とする文字認識装置。
  2. 【請求項2】 請求項1記載の文字認識装置において、 第2の認識手段は、続き文字部分が存在しないことを判
    断するときには、文字の認識処理を実行しないように処
    理することを、 特徴とする文字認識装置。
  3. 【請求項3】 罫線で区切られる1文字入力欄に記入さ
    れる文字を認識する文字認識方法において、 入力画像の持つ罫線を抽出する第1の処理過程と、 文字サイズに従って、抽出される罫線と入力画像の持つ
    文字との接触文字部分を有効とするのか否かを決定する
    ことで、入力画像から文字を1文字ずつ切り出して認識
    する第2の処理過程と、 抽出される罫線と入力画像の持つ文字との接触文字部分
    を考慮しつつ、入力画像から文字のみを取り出し、該文
    字の続き文字部分を検出してそれを削除することで、入
    力画像から文字を1文字ずつ切り出して認識する第3の
    処理過程と、 第2及び第3の処理過程で得られる認識結果から、最終
    的な文字の認識結果を決定する第4の処理過程とを備え
    ることを、 特徴とする文字認識方法。
  4. 【請求項4】 罫線で区切られる1文字入力欄に記入さ
    れる文字を認識する文字認識装置の実現に用いられるプ
    ログラムが記憶されるプログラム記憶媒体であって、 入力画像の持つ罫線を抽出する抽出処理と、 上記抽出処理の抽出する罫線と入力画像の持つ文字との
    接触文字部分を特定するとともに、その特定結果に従っ
    て、該文字のみを取り出す取出処理と、 文字サイズに従って上記接触文字部分を有効とするのか
    否かを決定することで、入力画像から文字を1文字ずつ
    切り出して認識する第1の認識処理と、 上記取出処理の取り出す文字の続き文字部分を検出し、
    それを削除することで、入力画像から文字を1文字ずつ
    切り出して認識する第2の認識処理と、 第1及び第2の認識処理の認識結果から、最終的な文字
    の認識結果を決定する決定処理とをコンピュータに実行
    させるプログラムが記憶されることを、 特徴とするプログラム記憶媒体。
JP00220698A 1998-01-08 1998-01-08 文字認識装置及び方法並びにプログラム記憶媒体 Expired - Fee Related JP3466899B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00220698A JP3466899B2 (ja) 1998-01-08 1998-01-08 文字認識装置及び方法並びにプログラム記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00220698A JP3466899B2 (ja) 1998-01-08 1998-01-08 文字認識装置及び方法並びにプログラム記憶媒体

Publications (2)

Publication Number Publication Date
JPH11203405A true JPH11203405A (ja) 1999-07-30
JP3466899B2 JP3466899B2 (ja) 2003-11-17

Family

ID=11522890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00220698A Expired - Fee Related JP3466899B2 (ja) 1998-01-08 1998-01-08 文字認識装置及び方法並びにプログラム記憶媒体

Country Status (1)

Country Link
JP (1) JP3466899B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6544916B1 (en) 1999-10-05 2003-04-08 Tdk Corporation Manufacture method of dielectric ceramic composition
US6778712B1 (en) 1999-12-20 2004-08-17 Fujitsu Limited Data sheet identification device
JP2007241357A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 画像処理装置、画像処理プログラムおよび画像処理方法
JP2009199102A (ja) * 2008-02-19 2009-09-03 Fujitsu Ltd 文字認識プログラム、文字認識装置及び文字認識方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6544916B1 (en) 1999-10-05 2003-04-08 Tdk Corporation Manufacture method of dielectric ceramic composition
US6778712B1 (en) 1999-12-20 2004-08-17 Fujitsu Limited Data sheet identification device
JP2007241357A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 画像処理装置、画像処理プログラムおよび画像処理方法
JP2009199102A (ja) * 2008-02-19 2009-09-03 Fujitsu Ltd 文字認識プログラム、文字認識装置及び文字認識方法

Also Published As

Publication number Publication date
JP3466899B2 (ja) 2003-11-17

Similar Documents

Publication Publication Date Title
JP4704601B2 (ja) 文字認識方法,プログラム及び記録媒体
JP3615333B2 (ja) 罫線消去装置
JPH11203405A (ja) 文字認識装置及び方法並びにプログラム記憶媒体
JP4412762B2 (ja) 点線抽出方法、その装置及びその記録媒体
JP3798179B2 (ja) パターン抽出装置及び文字切り出し装置
JP2630261B2 (ja) 文字認識装置
JP2000137728A (ja) 文書解析装置及びプログラム記録媒体
JPH07220081A (ja) 画像認識装置の図形の切出し方法
JP3113217B2 (ja) 破線認識方法
JPH09185726A (ja) 罫線除去方式
JP3077929B2 (ja) 文字切出し方式
JP4159071B2 (ja) 画像処理方法,画像処理装置および該処理方法を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3190794B2 (ja) 文字切り出し装置
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JPS6111886A (ja) 文字認識方式
JP4209511B2 (ja) 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3039427B2 (ja) 文字切り出し方式及び方法
JP2925270B2 (ja) 文字読取装置
JPH0737032A (ja) 手書き記号記入用紙と手書き記号認識装置
JP2867382B2 (ja) 文字認識装置におけるフォント決定方法
JP2795222B2 (ja) 文字切り出し方法および文字切り出し装置
JPH10240863A (ja) タイミングマーク検出方法および記憶媒体
JPH1185904A (ja) 文字切り出し方法及びこれを用いた文字認識装置
JPH05114048A (ja) 文字認識方法及びその装置
JP2000306102A (ja) 罫線識別方法および記録媒体

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030812

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080829

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090829

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090829

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100829

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110829

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130829

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees