JP2001307022A

JP2001307022A - 文字認識装置および文字認識方法

Info

Publication number: JP2001307022A
Application number: JP2000126303A
Authority: JP
Inventors: Masahiro Sakurai; 雅寛櫻井
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2000-04-21
Filing date: 2000-04-21
Publication date: 2001-11-02

Abstract

(57)【要約】【課題】認識率および認識速度の低下を避けて文字認
識できる文字認識装置および文字認識方法の提供。【解決手段】光学式文字認識装置（OCR ）10は、画像
記憶部12に採り込んだ画像データ30における文字を含む
枠領域を切り出し、さらに読み出した画像データの枠領
域の文字の形状に応じて多角形の領域を枠座標抽出部14
で切り出し、この多角形の領域を矩形分解部22で矩形に
分解して矩形記憶部26に各矩形の頂点座標データ43を記
憶し、これら座標の位置関係から接触判定部28が矩形記
憶部26から読み出した矩形を基に文字同士の接触の有無
を判定し、この判定結果に応じて制御部20が辞書切替え
部24を切り替え、制御部20の制御に応じて認識部18が供
給される画像データ32に対して辞書からの認識基準の情
報38を用いて文字認識している。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文字認識装置およ
び文字認識方法に関し、特に光で紙等の文字記録媒体に
書かれている文字等の情報を読み出し、これらの情報か
ら文字を認識するOCR (Optical Character Recognitio
n）に適用して好適なものである。

【０００２】

【従来の技術】手書きした文字や図形を機械用にあらか
じめ規定したコードに認識する装置を文字認識装置とい
う。手書きの文字は、個人により個性にあふれている。
また、文字の書き方には、楷書、行書等々各種各様であ
る。帳簿や請求書等の書類に数字を手書きする際に、た
とえば、数字「0 」を連続して記入することがある。こ
のとき、数字「0 」の間は横方向の線でつながって書か
れていることが多い。したがって、文字を切出した場合
「0 」に横線の入った画像として装置に取り込まれる。
このような画像から文字認識の精度を挙げるには、一般
的にこのような続け字の辞書を本来の辞書に追加する方
法が採られている。

【０００３】

【発明が解決しようとする課題】ところで、続け字でな
い、通常の文字の認識を続け字辞書で行うと誤認識する
問題が発生する。この問題を回避するため、装置は文字
の輪郭を追跡して隣接する文字同士が接触しているかど
うか確認を行い、判断して対処している。すなわち、文
字同士が接触していない場合、通常の辞書を使用し、文
字同士が接触している場合、通常の辞書に加えて、続け
字辞書も使用して文字認識を行ってきた。これにより、
通常の認識をする処理の場合の認識率の低下を防いでい
る。

【０００４】ところが、前述した輪郭追跡を行うと、こ
の処理にともなって時間が多くかかる。ひいては認識速
度を低下させる原因にもなっている。

【０００５】本発明はこのような従来技術の欠点を解消
し、認識率および認識速度の低下を避けて文字認識でき
る文字認識装置および文字認識方法を提供することを目
的とする。

【０００６】

【課題を解決するための手段】本発明は上述の課題を解
決するために、媒体上に書かれた文字および／または図
形をサンプリングし、採り込んだ情報を画像データとし
て格納する画像記憶手段と、この画像記憶手段から読み
出した画像データのうち、文字を含む枠領域を切り出す
とともに、この枠領域の各頂点の座標を検出する座標検
出手段と、この検出した座標を格納する座標記憶手段
と、この座標記憶手段から読み出した座標に基づいて枠
領域の接触を判定する接触判定手段と、使用する辞書を
切り替えて選択した辞書から情報を出力する辞書切替え
手段と、辞書からの情報と画像記憶手段とを対応させ、
画像データの認識処理を行う認識手段と、座標記憶手段
からの座標および接触判定手段の判定結果に応じて辞書
切替え手段および前記認識手段を制御する制御手段と、
座標検出手段で読み出した画像データの枠領域の文字の
形状に応じて多角形の領域に切り出し、この多角形の領
域を矩形の集合に分解する矩形分解手段と、この分解し
た矩形を記憶する矩形記憶手段とを含むことを特徴とす
る。

【０００７】本発明の文字認識装置は、採り込んだ画像
データにおける文字を含む枠領域を切り出し、さらに座
標検出手段で読み出した画像データの枠領域の文字の形
状に応じて多角形の領域を切り出し、この多角形の領域
を矩形分解手段で矩形に分解して矩形記憶手段に各矩形
の頂点座標を記憶し、これら座標の位置関係から接触判
定手段が矩形記憶手段から読み出した矩形を基に文字同
士の接触（すなわち、重なりの）有無を判定することに
より、判定に要する時間の短縮化を図り、この判定結果
に応じて制御手段が辞書切替え手段を切り替え、認識手
段を制御することにより、辞書からの認識に用いる基準
と成る情報を常に適切に供給して画像データに含まれる
文字の認識を認識手段で行わせることができる。

【０００８】また、本発明は上述の課題を解決するため
に、媒体上に書かれた文字および／または図形をサンプ
リングし、採り込んだ情報を画像データとし、この画像
データに含まれる文字を含む枠領域を切り出すととも
に、この枠領域の各頂点の座標を検出する第１の工程
と、検出した座標を用いて枠領域の接触を判定する第２
の工程と、接触の判定に応じて使用する辞書を切り替え
る第３の工程と、辞書からの情報と画像データとを対比
させ、画像データの認識処理を行う第４の工程と、第１
の工程で読み出した画像データを用いて枠領域の文字の
形状に応じて多角形の領域に切り出し、この多角形の領
域を矩形の集合に分解する第５の工程と、この分解した
矩形の座標を記憶する第６の工程とを含み、第２の工程
は、第６の工程で記憶した矩形の座標を基に文字同士の
接触を判定することを特徴とする。

【０００９】本発明の文字認識方法は、読み出した画像
データを用いて枠領域の文字の形状に応じて多角形の領
域を切り出し、この多角形の領域を矩形の集合に分解し
て、分解した矩形の座標を記憶しておき、接触の判定に
おいて、記憶してある矩形の座標を基に文字同士の接触
を判定して、判定に要する時間の短縮を図る。また、判
定結果に応じて使用する辞書を切り替えて文字認識を行
うことにより、常に認識に用いる辞書を適切なものにす
ることができる。

【００１０】

【発明の実施の形態】次に添付図面を参照して本発明に
よる文字認識装置の一実施例を詳細に説明する。

【００１１】本発明の文字認識装置は、採り込んだ画像
データにおける文字を含む枠領域を切り出し、さらに座
標検出部で読み出した画像データの枠領域の文字の形状
に応じて多角形の領域を切り出し、この多角形の領域を
矩形分解部で矩形に分解して矩形記憶部に各矩形の頂点
座標を記憶し、これら座標の位置関係から接触判定部が
矩形記憶部から読み出した矩形（の座標）を基に文字同
士の接触（すなわち、重なりの）有無を判定することに
特徴がある。

【００１２】本実施例は、本発明の文字認識装置を適用
した光学式文字認識装置（以下、OCR という）10につい
て説明する。本発明と直接関係のない部分について図示
および説明を省略する。ここで、信号の参照符号はその
現れる接続線の参照番号で表す。OCR 10は、画像記憶部
12、枠座標抽出部14、枠座標記憶部16、認識部18、制御
部20、矩形分解部22、辞書切替え部24、矩形記憶部26、
および接触判定部28を含んでいる。

【００１３】画像記憶部12は、図示しない光学式文字読
取り部で読み込まれた媒体上の文字および図形を画像デ
ータ30として格納するメモリ機能を有する。画像記憶部
12はRAM (Random Access Memory ）を用い、所定の画像
サイズに応じたメモリ容量を持っている。画像記憶部12
は、読み出した画像データ32を枠座標抽出部14および認
識部18に出力している。

【００１４】枠座標抽出部14は、文字を切り出す枠の大
きさおよび画像のなかに基準点を設定するとともに、各
枠の位置（および各点の接続順）を示す座標データ34を
抽出する機能を有する信号処理部である。座標データ34
は座標を結ぶ順序も含めているので、座標データ34から
後段で多角形を形成することも可能である。枠座標記憶
部16は、メモリ機能を有し、枠座標抽出部14からの座標
データ34を書き込んで記憶する。枠座標記憶部16は、制
御部20の読出し制御により座標データ34を座標データ36
として読み出して制御部20を介して矩形分解部22に供給
している。

【００１５】認識部18は、画像データ30に含まれている
文字が何か辞書切替え部24から供給される辞書のデータ
38と付き合わせて該当する文字を認識する機能を有する
認識処理部である。認識部18は制御部20からの制御信号
40により制御されている。

【００１６】矩形分解部22は、座標データ36の接続順序
から多角形を形成し、この多角形を矩形に分解する機能
を有する信号処理部である。矩形分解部22は、制御部20
の制御により上述した機能を発揮させ、得られた矩形の
各点の座標データを制御部20を介して矩形記憶部26に供
給している。矩形分解部22と制御部20とを結ぶ線42は座
標データ36、制御信号および矩形の座標データを含んだ
信号線である。

【００１７】辞書切替え部24は、複数の種類の辞書を有
し、制御部20からの制御信号44により認識部18に供給さ
れる画像データ32の認識処理に用いる辞書を選択する機
能を有している。この選択により辞書切替え部24は、辞
書のデータ38を認識部18に出力する。

【００１８】矩形記憶部26には、矩形の座標データを格
納するメモリ機能がある。矩形記憶部26は、RAM で構成
され、制御部20の書込み／読出し制御に応じて動作す
る。矩形記憶部26と制御部20とは矩形の座標データおよ
び制御がまとめて信号線43で接続されている。同様に、
接触判定部28と制御部20とは矩形の座標データおよび制
御がまとめて信号線46で接続されている。

【００１９】接触判定部28は、矩形の座標データを基に
矩形同士の接触の有無を判定する機能を有している。接
触判定部28は制御部20の制御に応じて後述するように位
置関係の条件に基づいて判定を行う。この判定結果は、
信号線46を介して制御部20に供給される。

【００２０】制御部20は、たとえば、CPU (Central Pro
cessing Unit）や動作手順等の書込まれたROM (Read On
ly Memory ）等を有する。制御部20は、前述した各部に
対する各種のデータ入出力制御ならびに動作状態の設定
および動作タイミング等を制御する。

【００２１】このように構成して輪郭追跡を行って横線
の入った画像かどうかを判定していた場合よりも処理速
度を改善している。OCR 10の動作を説明する前にこの画
像および接触判定の原理について説明する。図２は、数
字「0 」が連続して書かれた媒体を光学的に読み込んだ
画像から文字の部分を切り出した状態を示している。各
文字枠50, 52内の文字がOCR 10でつながっているか判断
する際にこれまで輪郭を追跡して接続の有無を確認して
いた。

【００２２】本実施例のOCR 10の接触判定は、図３に示
すように、座標軸x, yの矢印方向をそれぞれ座標の増加
方向にする。読み込んだ画像の文字部分は文字枠54, 56
に切り出している。この文字枠の切出しを行う際にOCR
10は、基準点から各文字枠54, 56の２次元座標（x, y）
の位置をそれぞれ検出している。文字枠54の各点は左周
りにa 〜d の４点（x_a, y_a）, (x_b, y_b), (x_c, y_c), (x
_d, y_d)とし、文字枠56の各点も左周りにe 〜h の４点
（x_e, y_e),（x_f, y_f),（x_g, y_g）, (x_h, y_h)とする。図
３の文字枠54, 56の接触判定は、点a, c, e, gを用いて
行う。つまり接触判定は、対角に位置する点を用いて行
う。接触は文字枠54, 56の２点の距離が最短と最長の関
係にある点同士を比較して行う。すなわち、

【００２３】

【数１】｛（x_c≧x_e）∩（y_c≧y_e）｝∩｛（x_a≦x_g）∩（y_a≦y_g）｝・・・(1) という条件を満足する場合、重なり合っていると判定す
る。この条件により文字枠54, 56において右下隅と左上
隅の重複が判定できる。この各点の位置の大小関係によ
り条件を記さないがこの他３つの重複が判定できる。

【００２４】また、文字切出し枠を単なる矩形でなく、
図４の文字枠58, 60が示すように、文字の形状に応じて
水平および垂直方向のいずれか一方の枠線を組み合わせ
て細かい多角形に切り出すようにしてもよい。多角形に
切り出した場合、この多角形を矩形状に分解する（図５
を参照）。矩形状の分解は、この場合垂直方向の辺の長
さで各矩形の大きさが決まっている。図５の文字枠58は
矩形58a, 58b, 58c の３つに分解され、文字枠60は矩形
60a, 60b, 60c, 60dの４つに分解している。２つの文字
枠58, 60において分解した３つと４つの矩形による組合
せすべてについて接触判定を行う。接触判定は、前述し
たように文字枠の各点の位置関係から判定を行う。全組
合せのうち、１つでも接触があれば接触しているとの判
定を下し、全く接触がなければ接触していないという判
定を下す。

【００２５】矩形分解は、図６(a), (b)の文字枠62, 64
が示すように水平および垂直方向のいずれかの成分の枠
線を組み合わせることにより多角形が形成されている。
これに対して、図7(a)の文字枠66には斜線、すなわち水
平および出力直方向の両成分を有している。また、図7
(b)の文字枠68は、文字枠68自体が重なり合う部分68aが
ある。この２つの場合、文字枠66, 68は矩形分解部22で
は矩形に分解できない。矩形分解部22ではこのような多
角形を矩形分解して各点の座標データが抽出されてい
る。なお、後述するように多角形の各点のつなぐ順序を
左周り（または反時計周り）にしている。

【００２６】次にOCR 10の動作を説明する（図８を参
照）。画像記憶部12に媒体上の文字・図形の情報を光学
式に採り込んで画像データ30として格納する（ステップ
S10 ）。画像記憶部12から読み出した画像データが枠座
標抽出部14で２文字分の文字枠を切り出す。枠座標抽出
部14では切り出した２文字分の文字枠の座標データを抽
出する。抽出した座標データ34が枠座標記憶部16に記憶
される（ステップS12 ）。

【００２７】記憶された座標データ34のうち、制御部20
の制御により枠座標記憶部16から１文字分の文字枠が読
み出される。読み出された座標データ36が制御部20を介
して矩形分解部22に送られ、矩形の集合に分解される
（図５を参照：サブルーチンSUB1）。矩形分解した結果
の座標データ42が制御部20を介した座標データ43が矩形
記憶部26に記憶される（ステップS14 ）。あらわに図示
していないが、OCR 10はステップS14 からサブルーチン
SUB1に戻って２文字分の残る１文字分についても矩形分
解部22で矩形の集合に分解し、この分解結果を矩形記憶
部26に記憶する。

【００２８】ここで、記憶された座標データ43が制御部
20を介した座標データ46として接触判定部28に供給され
る。座標データ43は、選択した２文字分の文字枠であ
る。接触判定部28では供給された文字枠の座標データか
ら接触しているかどうか判定を行う。各種の組合せにつ
いて各条件を満足するか比較して接触の有無を判定す
る。条件を１つでも満足していれば、接触有りを示す判
定情報を制御部20に出力し、すべて条件を満足していな
ければ、接触なしを示す判定情報を制御部20に出力する
（ステップS16 ）。

【００２９】制御部20では、接触判定部28から供給され
る判定情報に応じて制御信号44を辞書切替え部24に出力
する。辞書切替え部24では、制御信号44に応じてあらか
じめ接触している場合に用いる辞書と接触していない場
合に用いる辞書が切り替えられて選択した辞書からの認
識における基準となる情報38が認識部18に供給される
（ステップS18 ）。

【００３０】認識部18では、制御部20の制御信号40によ
り画像データ32の切り出した文字枠を認識対象範囲と
し、この文字枠内の画像データと情報38とを比較し、か
つ認識することにより文字認識を行う（ステップS20
）。この結果が認識部18から文字情報48として出力さ
れる。

【００３１】格納する画像データ30に対して認識処理す
べてが完了したかどうかの判断が行われる（ステップS2
2 ）。すべて完了した場合（YES ）、終了する。また、
認識が完了していない場合（NO）、ステップS12 に戻っ
て、前述した処理を繰り返す。

【００３２】また、本実施例では、２つずつ読み込んだ
文字枠の接触に対して認識を行うようにしたが、２つず
つ読み込んだ文字枠の接触判定の結果をまとめておい
て、制御部20で文字枠の接触判定結果ごとの辞書切替え
制御を行わせ、さらに認識部18での認識処理をまとめて
行わせるようにしてもよい。

【００３３】次に矩形分解部22の動作手順について説明
する（図９を参照）。たとえば、供給される多角形70の
座標データ42のうち（図10(a) を参照）、最初の注目す
る頂点をどれにするか選択する（サブステップSS10）。
基準点（図示せず）に最も近い点を注目頂点としてもよ
い。この注目頂点A の座標を（x_a, y_a）とする。次に左
周りに連続した２点B, Cを選択する（サブステップSS1
2）。点B の座標を（x_b, y_b）とし、点C の座標を（x_c,
y_c）とする。

【００３４】次に条件１を満足するかどうか判定する
（サブステップSS14）。条件１は点Aと点B のx 座標の
値が同じかどうかを判定する（x_a＝x_b）。水平方向に同
じ座標データである場合（YES ）、点A と点B が垂直方
向の同一線上にあることがわかり、サブステップSS16に
進む。また、同じ座標データでなかった場合（NO：x_a≠
x_b）、サブステップSS18に進む。

【００３５】サブステップSS16では、条件２を満足する
かどうか判定する。条件２は、点Aに対する点B の位置
を垂直方向のどの方向にあるか判定するとともに、点C
の位置が点A-点B を結ぶ線上の右側か左側かを調べてい
る。そして、点B と点C のy座標の値が同じかも同時に
判定している。したがって、条件２は、

【００３６】

【数２】｛(y_a ≦y_b )∩(x_b ≦x_c) ∩ (y_b＝y_c) ｝∪ ｛(y_a ≧y_b )∩(x_b ≧x_c) ∩ (y_b＝y_c) ｝・・・(2) である。この判定により、第１象限と第３象限のような
形状が考えられる。この条件２を満足する場合（YES
）、矩形の４点のうち、３点が決まることになり、次
の処理としてサブステップSS20に進む。また、条件２を
満足しない場合（NO）、サブステップSS22に進む。

【００３７】サブステップSS20において、矩形70の残る
１点を決める。図10(a) の場合、矩形の点A, B, C が決
まっている条件から、矩形70の残る１点は、点G にな
る。この後、矩形70内の４点A, B, C, Gで囲む矩形70a
の内部に他の頂点がないかどうか判定する（サブステッ
プSS24）。図10(a) では、他に矩形70a の４点以外に頂
点は含まないから、処理をサブステップSS26に進める。
他に頂点を含む場合（NO）、サブステップSS22に進む。

【００３８】サブステップSS26では、頂点を削除し、新
たな頂点を設定して矩形に分ける。たとえば、図10(a)
の矩形70は本来頂点が６つあるが、矩形の頂点は４つで
表されるから、矩形70a の頂点A, Bを削除する。そし
て、頂点C の代わりに点G を新たな矩形70b の点として
置換する。図示していないが、この置換後に頂点D, E,
F, Gについても水平や垂直方向に同一成分を含んでいる
か検討するとよい。この検討を踏まえて残る点の数が４
かどうか判定する（サブステップSS28）。図10(a) で
は、新たな多角形が矩形かどうか判定する。判定した結
果、点D, E, F, Gで示される矩形70b に分解されること
がわかる。たとえば、頂点が５つ以上の場合（NO）、サ
ブステップSS22に進む。

【００３９】サブステップSS22では、新たな注目頂点と
して左周りに頂点を１個移動させる。この後、サブステ
ップSS12に戻って、前述した一連の処理を繰り返す。

【００４０】また、前述したサブステップSS14の条件１
を満足しなかった場合（NO）、サブステップSS18に移行
する。サブステップSS18では条件３を満足するかどうか
判定する。条件３は、点A に対する点B の位置を水平方
向のどの方向にあるか判定するとともに、点C の位置が
点A-点B を結ぶ線上の上側か下側かを調べている。そし
て、点B と点C のx 座標の値が同じかも同時に判定して
いる。したがって、条件３は、

【００４１】

【数３】｛(x_a ≦x_b )∩(y_b ≧y_c) ∩ (x_b＝x_c) ｝∪ ｛(x_a ≧x_b )∩(y_b ≦y_c) ∩ (x_b＝x_c) ｝・・・(3) である。この判定により、第２象限と第４象限のような
形状が考えられる。この条件３を満足する場合（YES
）、矩形の４点のうち、３点が決まることになり、次
の処理としてサブステップSS20に進む。また、条件３を
満足しない場合（NO）、サブステップSS22に進む。条件
３は点A と点B が同一の水平方向の線上にあって、点C
が点A-点B のどちらの垂直方向にあるかが判定される。

【００４２】また、図10(b) に示した矩形72の場合の矩
形分割を説明する。矩形72は８個の頂点A 〜H を有す
る。各頂点の座標は（x_a, y_a）, （x_b, y_b）, （x_c,
y_c）, （x_d, y_d）, （x_e, y_e）, （x_f, y_f）, （x_g,
y_g）, （x_h, y_h）とする。矩形72では各頂点が水平方向
と垂直方向のいずれか一方と共通な成分を有しているか
ら、点B の座標（x_b, y_b）＝（x_a, y_b），点C の座標（x_c, y_c）＝（x_c, y_b），点D の座標（x_d, y_d）＝（x_c, y_d），点E の座標（x_e, y_e）＝（x_e, y_d），点F の座標（x_f, y_f）＝（x_e, y_f），点G の座標（x_g, y_g）＝（x_g, y_f），点H の座標（x_h, y_h）＝（x_g, y_a），という関係にある。前述の例と同様に注目頂点を点A に
する（サブステップSS10）。点A に連続した２点を点B,
Cにする（サブステップSS12）。点A と点B は上述した
各成分に着目し条件１の比較判定を行うと（サブステッ
プSS14）、x 座標の値が同一にあるからサブステップSS
16に進む。点A, B, C の３点の位置関係が、条件２を満
足するかどうか判定する（サブステップSS16）。３点の
位置関係が第１象限を示して条件２を満足するので、サ
ブステップSS20に進む。

【００４３】ここで、３点A, B, C を矩形72a の各頂点
とすることから、残る頂点は、点Iの座標（x_i, y_i）＝
（x_c, y_a）になる（サブステップSS20）。この後、矩形
72aの内部に他の頂点が含まれていないか判定する。図1
0(b) の矩形72では、矩形72a の内部に点E, F, G が含
まれているので、サブステップSS22に移行する。サブス
テップSS22では、新たな注目頂点を左周りに移動させて
選択する。したがって、新たな注目頂点を点B にする。
この処理後、サブステップSS12に戻る。

【００４４】点B, Cは、水平方向に並ぶ点であるから、
条件１を満足しない（x_a≠x_c）。処理をサブステップSS
18に移行する。注目頂点B において点B, C, D を条件３
に当てはめて判定を行う（サブステップSS18）。これら
３点の関係は、第２象限に対応し、条件３を満足するか
ら、サブステップSS20に進む。３点B, C, D を含む矩形
72b とするため頂点J が選ばれる。矩形72b の内部に他
の頂点は存在しないので、サブステップSS26に進む。

【００４５】頂点B を除く連続した２点C, Dを削除し、
点D の代わりに点J を多角形の新たな頂点とする。これ
により、多角形AJEFGHが得られ矩形72b が多角形ABCDEF
GHから分離されたことになる。サブステップSS28におい
て、多角形AJEFGHが頂点６個で頂点４個よりも多い。す
なわち、まだ矩形分解できることを示しているから、サ
ブステップSS22で新たな注目頂点を選ぶ。このとき、頂
点B 以降、左周りで選択される頂点C, Dがすでに分離さ
れたため削除されている。したがって、次の注目頂点は
点E になる。

【００４６】サブステップSS12での連続した２点は点E,
Fになる。点E, Fはx 座標が同じ位置成分を有する（サ
ブステップSS14）。これにより、サブステップSS16で条
件２の判定に進む。点E, F, G は、第４象限に対応した
位置関係にあり、条件２を満足しない。この結果サブス
テップSS22に進む。注目頂点を点E から点F に移動させ
る。

【００４７】サブステップSS12での連続した２点は点G,
Hになる。x 座標の位置関係を条件１により判定する
（サブステップSS14）。点F, Gは、位置成分のx 座標が
異なっている（x_e＝x_f≠x_g）。これにより、サブステッ
プSS18に進んで条件３の判定を行う。この場合、点F,
G, H は第３象限に対応し、条件３を満足しているから
サブステップSS20に移行させる。そして点F, G, H に対
して残る１点を決定する。この場合、点K が対応してい
る。この後、多角形FGHK内に頂点を含まないと判定され
る（サブステップSS24）。この結果矩形72c が得られ
る。

【００４８】矩形72c を示す多角形FGHKを分離するた
め、直前の判定で用いていた注目頂点F と次の点G を削
除する。そして点H の代わりに点K を新たな頂点として
置換する（サブステップSS26）。このように分解して多
角形AJEKが得られる。多角形AJEKが４個の頂点に成って
いるから、すべて矩形分解が終了したものとしてリター
ンに移行する。リターンに際してこれまで多角形を矩形
に分解した頂点の座標データを制御部20を介して矩形記
憶部26に供給する。

【００４９】以上のように構成することにより、矩形分
解部22で文字枠の多角形を矩形に分解し、分解した各頂
点の位置（情報）を矩形記憶部26に記憶させ、接触判定
を行うことでこれまでの輪郭追跡方法により処理時間に
比べて処理時間を短縮化させることができるようにな
る。また、接触判定に応じて制御部20が辞書切替え部24
を切り替えて適切な辞書からの情報が認識部18に供給さ
れるようになることから、認識部18に供給される画像デ
ータに含まれる文字等の情報を正確に認識できるように
なる。この結果、文字の認識率を従来以上に向上させる
ことができる。

【００５０】

【発明の効果】このように本発明の文字認識装置によれ
ば、採り込んだ画像データにおける文字を含む枠領域を
切り出し、さらに座標検出手段で読み出した画像データ
の枠領域の文字の形状に応じて多角形の領域を切り出
し、この多角形の領域を矩形分解手段で矩形に分解して
矩形記憶手段に各矩形の頂点座標を記憶し、これら座標
の位置関係から接触判定手段が矩形記憶手段から読み出
した矩形を基に文字同士の接触（すなわち、重なりの）
有無を判定し、この判定結果に応じて制御手段が辞書切
替え手段を切り替え、認識手段を制御して、辞書からの
認識に用いる基準と成る情報を常に適切に供給して画像
データが含む文字の認識を認識手段で行わせることによ
り、判定に要する時間の短縮化および文字認識の認識精
度を向上させることができる。

【００５１】また、本発明の文字認識方法によれば、読
み出した画像データを用いて枠領域の文字の形状に応じ
て多角形の領域を切り出し、この多角形の領域を矩形の
集合に分解して、分解した矩形の座標を記憶しておき、
接触の判定において、記憶してある矩形の座標を基に文
字同士の接触を判定して、判定結果に応じて使用する辞
書を切り替えて文字認識を行って常に適切な辞書を使用
するとにより認識精度を高くするととともに、判定に要
する時間の短縮を図れるので、認識処理を従来よりも短
縮化することができる。

【図面の簡単な説明】

【図１】本発明の文字認識装置を適用した光学式文字認
識装置（OCR ）の概略的な構成を示すブロック図であ
る。

【図２】図１のOCR による矩形の文字切出し枠の一例の
模式図である。

【図３】図１のOCR において矩形同士の接触判定を説明
する模式図である。

【図４】図１のOCR による多角形の文字切出し枠の一例
の模式図である。

【図５】図１のOCR において多角形の文字切出し枠を矩
形に分解する例を示す図である。

【図６】図１の矩形分解部が矩形に分解できる形状と領
域の例を示した図である。

【図７】図１の矩形分解部が矩形に分解できない形状と
領域の例を示した図である。

【図８】図１のOCR の動作を説明するメインフローチャ
ートである。

【図９】図８に示した矩形分解の手順を説明するサブル
ーチンSUB1のフローチャートである。

【図１０】図９の手順に従って多角形を矩形に分解する
例を示した図である。

【符号の説明】

10 光学式文字認識装置（OCR ） 12 画像記憶部 14 枠座標抽出部 16 枠座標記憶部 18 認識部 20 制御部 22 矩形分解部 24 辞書切替え部 26 矩形記憶部 28 接触判定部

Claims

【特許請求の範囲】

【請求項１】媒体上に書かれた文字および／または図
形をサンプリングし、採り込んだ情報を画像データとし
て格納する画像記憶手段と、該画像記憶手段から読み出した画像データのうち、文字
を含む枠領域を切り出すとともに、該枠領域の各頂点の
座標を検出する座標検出手段と、該検出した座標を格納する座標記憶手段と、該座標記憶手段から読み出した座標に基づいて前記枠領
域の接触を判定する接触判定手段と、使用する辞書を切り替えて選択した辞書から情報を出力
する辞書切替え手段と、前記辞書からの情報と前記画像記憶手段とを対応させ、
前記画像データの認識処理を行う認識手段と、前記座標記憶手段からの座標および前記接触判定手段の
判定結果に応じて前記辞書切替え手段および前記認識手
段を制御する制御手段と、前記座標検出手段で読み出した画像データの前記枠領域
の文字の形状に応じて多角形の領域に切り出し、該多角
形の領域を矩形の集合に分解する矩形分解手段と、該分解した矩形を記憶する矩形記憶手段とを含むことを
特徴とする文字認識装置。
【請求項２】請求項１に記載の装置において、前記接
触判定手段は、前記矩形の組合せすべてに対して接触判
定を行い、接触が１箇所以上ある場合に接触ありと判定
することを特徴とする文字認識装置。
【請求項３】媒体上に書かれた文字および／または図
形をサンプリングし、採り込んだ情報を画像データと
し、該画像データに含まれる文字を含む枠領域を切り出
すとともに、該枠領域の各頂点の座標を検出する第１の
工程と、該検出した座標を用いて前記枠領域の接触を判定する第
２の工程と、前記接触の判定に応じて使用する辞書を切り替える第３
の工程と、前記辞書からの情報と前記画像データとを対比させ、前
記画像データの認識処理を行う第４の工程と、第１の工程で読み出した画像データを用いて前記枠領域
の文字の形状に応じて多角形の領域に切り出し、該多角
形の領域を矩形の集合に分解する第５の工程と、該分解した矩形の座標を記憶する第６の工程とを含み、第２の工程は、第６の工程で記憶した前記矩形の座標を
基に前記文字同士の接触を判定することを特徴とする文
字認識方法。
【請求項４】請求項３に記載の方法において、第２の
工程は、前記矩形の組合せすべてに対して接触判定を行
い、接触が１箇所以上ある場合に接触ありと判定するこ
とを特徴とする文字認識方法。
【請求項５】請求項３または４に記載の方法におい
て、第５の工程は、前記多角形の最初に選ぶ頂点を注目
頂点として選択する第１の注目頂点選択工程と、前記多角形の前記注目点に連続した２つの頂点を選択す
る連続選択工程と、前記注目頂点および連続した２つの頂点のうちの最初の
点の水平成分の値が同じかを判定する第１判定の工程
と、第１判定の結果が真のとき、３つの点が２次元座標の第
１または第３象限に対応する位置関係にあるか判定する
第２判定の工程と、第１判定の結果が偽のとき、３つの点が２次元座標の第
２または第４象限に対応する位置関係にあるか判定する
第３判定の工程と、第２判定または第３判定が真のとき、３点に残る１点を
第４の点として決定し、４点からなる矩形にする工程
と、第２判定または第３判定が偽のとき、注目頂点を１つ分
移動させて新たな注目頂点を選択する第２の注目頂点選
択工程と、得られた矩形内に前記多角形の頂点が含まれるか判定す
る第４の判定の工程と、第４判定が真のとき、前記選択した注目頂点および連続
した２つの頂点のうちの最初の点を削除するとともに、
連続した２つの頂点のうちの第２の点の代わりに、第４
の点を新たな多角形の頂点にして矩形分離と多角形の形
成を行う工程と、前記新たな多角形が矩形かどうか判定する第５判定の工
程とを含み、第５判定が真のとき、前記多角形を矩形に分解する処理
が完了したと判定し、第５判定が偽のとき、前記多角形
の矩形に分解する処理を継続して第２の注目頂点選択工
程に進んで第２の注目頂点を選択し、第２の注目頂点に
対する前記連続選択工程以降の処理を行うことを特徴と
する文字認識方法。