JP2001307022A - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法

Info

Publication number
JP2001307022A
JP2001307022A JP2000126303A JP2000126303A JP2001307022A JP 2001307022 A JP2001307022 A JP 2001307022A JP 2000126303 A JP2000126303 A JP 2000126303A JP 2000126303 A JP2000126303 A JP 2000126303A JP 2001307022 A JP2001307022 A JP 2001307022A
Authority
JP
Japan
Prior art keywords
determination
rectangle
unit
character
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000126303A
Other languages
English (en)
Inventor
Masahiro Sakurai
雅寛 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000126303A priority Critical patent/JP2001307022A/ja
Publication of JP2001307022A publication Critical patent/JP2001307022A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 認識率および認識速度の低下を避けて文字認
識できる文字認識装置および文字認識方法の提供。 【解決手段】 光学式文字認識装置(OCR )10は、画像
記憶部12に採り込んだ画像データ30における文字を含む
枠領域を切り出し、さらに読み出した画像データの枠領
域の文字の形状に応じて多角形の領域を枠座標抽出部14
で切り出し、この多角形の領域を矩形分解部22で矩形に
分解して矩形記憶部26に各矩形の頂点座標データ43を記
憶し、これら座標の位置関係から接触判定部28が矩形記
憶部26から読み出した矩形を基に文字同士の接触の有無
を判定し、この判定結果に応じて制御部20が辞書切替え
部24を切り替え、制御部20の制御に応じて認識部18が供
給される画像データ32に対して辞書からの認識基準の情
報38を用いて文字認識している。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置およ
び文字認識方法に関し、特に光で紙等の文字記録媒体に
書かれている文字等の情報を読み出し、これらの情報か
ら文字を認識するOCR (Optical Character Recognitio
n)に適用して好適なものである。
【0002】
【従来の技術】手書きした文字や図形を機械用にあらか
じめ規定したコードに認識する装置を文字認識装置とい
う。手書きの文字は、個人により個性にあふれている。
また、文字の書き方には、楷書、行書等々各種各様であ
る。帳簿や請求書等の書類に数字を手書きする際に、た
とえば、数字「0 」を連続して記入することがある。こ
のとき、数字「0 」の間は横方向の線でつながって書か
れていることが多い。したがって、文字を切出した場合
「0 」に横線の入った画像として装置に取り込まれる。
このような画像から文字認識の精度を挙げるには、一般
的にこのような続け字の辞書を本来の辞書に追加する方
法が採られている。
【0003】
【発明が解決しようとする課題】ところで、続け字でな
い、通常の文字の認識を続け字辞書で行うと誤認識する
問題が発生する。この問題を回避するため、装置は文字
の輪郭を追跡して隣接する文字同士が接触しているかど
うか確認を行い、判断して対処している。すなわち、文
字同士が接触していない場合、通常の辞書を使用し、文
字同士が接触している場合、通常の辞書に加えて、続け
字辞書も使用して文字認識を行ってきた。これにより、
通常の認識をする処理の場合の認識率の低下を防いでい
る。
【0004】ところが、前述した輪郭追跡を行うと、こ
の処理にともなって時間が多くかかる。ひいては認識速
度を低下させる原因にもなっている。
【0005】本発明はこのような従来技術の欠点を解消
し、認識率および認識速度の低下を避けて文字認識でき
る文字認識装置および文字認識方法を提供することを目
的とする。
【0006】
【課題を解決するための手段】本発明は上述の課題を解
決するために、媒体上に書かれた文字および/または図
形をサンプリングし、採り込んだ情報を画像データとし
て格納する画像記憶手段と、この画像記憶手段から読み
出した画像データのうち、文字を含む枠領域を切り出す
とともに、この枠領域の各頂点の座標を検出する座標検
出手段と、この検出した座標を格納する座標記憶手段
と、この座標記憶手段から読み出した座標に基づいて枠
領域の接触を判定する接触判定手段と、使用する辞書を
切り替えて選択した辞書から情報を出力する辞書切替え
手段と、辞書からの情報と画像記憶手段とを対応させ、
画像データの認識処理を行う認識手段と、座標記憶手段
からの座標および接触判定手段の判定結果に応じて辞書
切替え手段および前記認識手段を制御する制御手段と、
座標検出手段で読み出した画像データの枠領域の文字の
形状に応じて多角形の領域に切り出し、この多角形の領
域を矩形の集合に分解する矩形分解手段と、この分解し
た矩形を記憶する矩形記憶手段とを含むことを特徴とす
る。
【0007】本発明の文字認識装置は、採り込んだ画像
データにおける文字を含む枠領域を切り出し、さらに座
標検出手段で読み出した画像データの枠領域の文字の形
状に応じて多角形の領域を切り出し、この多角形の領域
を矩形分解手段で矩形に分解して矩形記憶手段に各矩形
の頂点座標を記憶し、これら座標の位置関係から接触判
定手段が矩形記憶手段から読み出した矩形を基に文字同
士の接触(すなわち、重なりの)有無を判定することに
より、判定に要する時間の短縮化を図り、この判定結果
に応じて制御手段が辞書切替え手段を切り替え、認識手
段を制御することにより、辞書からの認識に用いる基準
と成る情報を常に適切に供給して画像データに含まれる
文字の認識を認識手段で行わせることができる。
【0008】また、本発明は上述の課題を解決するため
に、媒体上に書かれた文字および/または図形をサンプ
リングし、採り込んだ情報を画像データとし、この画像
データに含まれる文字を含む枠領域を切り出すととも
に、この枠領域の各頂点の座標を検出する第1の工程
と、検出した座標を用いて枠領域の接触を判定する第2
の工程と、接触の判定に応じて使用する辞書を切り替え
る第3の工程と、辞書からの情報と画像データとを対比
させ、画像データの認識処理を行う第4の工程と、第1
の工程で読み出した画像データを用いて枠領域の文字の
形状に応じて多角形の領域に切り出し、この多角形の領
域を矩形の集合に分解する第5の工程と、この分解した
矩形の座標を記憶する第6の工程とを含み、第2の工程
は、第6の工程で記憶した矩形の座標を基に文字同士の
接触を判定することを特徴とする。
【0009】本発明の文字認識方法は、読み出した画像
データを用いて枠領域の文字の形状に応じて多角形の領
域を切り出し、この多角形の領域を矩形の集合に分解し
て、分解した矩形の座標を記憶しておき、接触の判定に
おいて、記憶してある矩形の座標を基に文字同士の接触
を判定して、判定に要する時間の短縮を図る。また、判
定結果に応じて使用する辞書を切り替えて文字認識を行
うことにより、常に認識に用いる辞書を適切なものにす
ることができる。
【0010】
【発明の実施の形態】次に添付図面を参照して本発明に
よる文字認識装置の一実施例を詳細に説明する。
【0011】本発明の文字認識装置は、採り込んだ画像
データにおける文字を含む枠領域を切り出し、さらに座
標検出部で読み出した画像データの枠領域の文字の形状
に応じて多角形の領域を切り出し、この多角形の領域を
矩形分解部で矩形に分解して矩形記憶部に各矩形の頂点
座標を記憶し、これら座標の位置関係から接触判定部が
矩形記憶部から読み出した矩形(の座標)を基に文字同
士の接触(すなわち、重なりの)有無を判定することに
特徴がある。
【0012】本実施例は、本発明の文字認識装置を適用
した光学式文字認識装置(以下、OCR という)10につい
て説明する。本発明と直接関係のない部分について図示
および説明を省略する。ここで、信号の参照符号はその
現れる接続線の参照番号で表す。OCR 10は、画像記憶部
12、枠座標抽出部14、枠座標記憶部16、認識部18、制御
部20、矩形分解部22、辞書切替え部24、矩形記憶部26、
および接触判定部28を含んでいる。
【0013】画像記憶部12は、図示しない光学式文字読
取り部で読み込まれた媒体上の文字および図形を画像デ
ータ30として格納するメモリ機能を有する。画像記憶部
12はRAM (Random Access Memory )を用い、所定の画像
サイズに応じたメモリ容量を持っている。画像記憶部12
は、読み出した画像データ32を枠座標抽出部14および認
識部18に出力している。
【0014】枠座標抽出部14は、文字を切り出す枠の大
きさおよび画像のなかに基準点を設定するとともに、各
枠の位置(および各点の接続順)を示す座標データ34を
抽出する機能を有する信号処理部である。座標データ34
は座標を結ぶ順序も含めているので、座標データ34から
後段で多角形を形成することも可能である。枠座標記憶
部16は、メモリ機能を有し、枠座標抽出部14からの座標
データ34を書き込んで記憶する。枠座標記憶部16は、制
御部20の読出し制御により座標データ34を座標データ36
として読み出して制御部20を介して矩形分解部22に供給
している。
【0015】認識部18は、画像データ30に含まれている
文字が何か辞書切替え部24から供給される辞書のデータ
38と付き合わせて該当する文字を認識する機能を有する
認識処理部である。認識部18は制御部20からの制御信号
40により制御されている。
【0016】矩形分解部22は、座標データ36の接続順序
から多角形を形成し、この多角形を矩形に分解する機能
を有する信号処理部である。矩形分解部22は、制御部20
の制御により上述した機能を発揮させ、得られた矩形の
各点の座標データを制御部20を介して矩形記憶部26に供
給している。矩形分解部22と制御部20とを結ぶ線42は座
標データ36、制御信号および矩形の座標データを含んだ
信号線である。
【0017】辞書切替え部24は、複数の種類の辞書を有
し、制御部20からの制御信号44により認識部18に供給さ
れる画像データ32の認識処理に用いる辞書を選択する機
能を有している。この選択により辞書切替え部24は、辞
書のデータ38を認識部18に出力する。
【0018】矩形記憶部26には、矩形の座標データを格
納するメモリ機能がある。矩形記憶部26は、RAM で構成
され、制御部20の書込み/読出し制御に応じて動作す
る。矩形記憶部26と制御部20とは矩形の座標データおよ
び制御がまとめて信号線43で接続されている。同様に、
接触判定部28と制御部20とは矩形の座標データおよび制
御がまとめて信号線46で接続されている。
【0019】接触判定部28は、矩形の座標データを基に
矩形同士の接触の有無を判定する機能を有している。接
触判定部28は制御部20の制御に応じて後述するように位
置関係の条件に基づいて判定を行う。この判定結果は、
信号線46を介して制御部20に供給される。
【0020】制御部20は、たとえば、CPU (Central Pro
cessing Unit)や動作手順等の書込まれたROM (Read On
ly Memory )等を有する。制御部20は、前述した各部に
対する各種のデータ入出力制御ならびに動作状態の設定
および動作タイミング等を制御する。
【0021】このように構成して輪郭追跡を行って横線
の入った画像かどうかを判定していた場合よりも処理速
度を改善している。OCR 10の動作を説明する前にこの画
像および接触判定の原理について説明する。図2は、数
字「0 」が連続して書かれた媒体を光学的に読み込んだ
画像から文字の部分を切り出した状態を示している。各
文字枠50, 52内の文字がOCR 10でつながっているか判断
する際にこれまで輪郭を追跡して接続の有無を確認して
いた。
【0022】本実施例のOCR 10の接触判定は、図3に示
すように、座標軸x, yの矢印方向をそれぞれ座標の増加
方向にする。読み込んだ画像の文字部分は文字枠54, 56
に切り出している。この文字枠の切出しを行う際にOCR
10は、基準点から各文字枠54, 56の2次元座標(x, y)
の位置をそれぞれ検出している。文字枠54の各点は左周
りにa 〜d の4点(xa, ya), (xb, yb), (xc, yc), (x
d, yd)とし、文字枠56の各点も左周りにe 〜h の4点
(xe, ye),(xf, yf),(xg, yg), (xh, yh)とする。図
3の文字枠54, 56の接触判定は、点a, c, e, gを用いて
行う。つまり接触判定は、対角に位置する点を用いて行
う。接触は文字枠54, 56の2点の距離が最短と最長の関
係にある点同士を比較して行う。すなわち、
【0023】
【数1】 {(xc≧xe)∩(yc≧ye)}∩{(xa≦xg)∩(ya≦yg)} ・・・(1) という条件を満足する場合、重なり合っていると判定す
る。この条件により文字枠54, 56において右下隅と左上
隅の重複が判定できる。この各点の位置の大小関係によ
り条件を記さないがこの他3つの重複が判定できる。
【0024】また、文字切出し枠を単なる矩形でなく、
図4の文字枠58, 60が示すように、文字の形状に応じて
水平および垂直方向のいずれか一方の枠線を組み合わせ
て細かい多角形に切り出すようにしてもよい。多角形に
切り出した場合、この多角形を矩形状に分解する(図5
を参照)。矩形状の分解は、この場合垂直方向の辺の長
さで各矩形の大きさが決まっている。図5の文字枠58は
矩形58a, 58b, 58c の3つに分解され、文字枠60は矩形
60a, 60b, 60c, 60dの4つに分解している。2つの文字
枠58, 60において分解した3つと4つの矩形による組合
せすべてについて接触判定を行う。接触判定は、前述し
たように文字枠の各点の位置関係から判定を行う。全組
合せのうち、1つでも接触があれば接触しているとの判
定を下し、全く接触がなければ接触していないという判
定を下す。
【0025】矩形分解は、図6(a), (b)の文字枠62, 64
が示すように水平および垂直方向のいずれかの成分の枠
線を組み合わせることにより多角形が形成されている。
これに対して、図7(a)の文字枠66には斜線、すなわち水
平および出力直方向の両成分を有している。また、図7
(b)の文字枠68は、文字枠68自体が重なり合う部分68aが
ある。この2つの場合、文字枠66, 68は矩形分解部22で
は矩形に分解できない。矩形分解部22ではこのような多
角形を矩形分解して各点の座標データが抽出されてい
る。なお、後述するように多角形の各点のつなぐ順序を
左周り(または反時計周り)にしている。
【0026】次にOCR 10の動作を説明する(図8を参
照)。画像記憶部12に媒体上の文字・図形の情報を光学
式に採り込んで画像データ30として格納する(ステップ
S10 )。画像記憶部12から読み出した画像データが枠座
標抽出部14で2文字分の文字枠を切り出す。枠座標抽出
部14では切り出した2文字分の文字枠の座標データを抽
出する。抽出した座標データ34が枠座標記憶部16に記憶
される(ステップS12 )。
【0027】記憶された座標データ34のうち、制御部20
の制御により枠座標記憶部16から1文字分の文字枠が読
み出される。読み出された座標データ36が制御部20を介
して矩形分解部22に送られ、矩形の集合に分解される
(図5を参照:サブルーチンSUB1)。矩形分解した結果
の座標データ42が制御部20を介した座標データ43が矩形
記憶部26に記憶される(ステップS14 )。あらわに図示
していないが、OCR 10はステップS14 からサブルーチン
SUB1に戻って2文字分の残る1文字分についても矩形分
解部22で矩形の集合に分解し、この分解結果を矩形記憶
部26に記憶する。
【0028】ここで、記憶された座標データ43が制御部
20を介した座標データ46として接触判定部28に供給され
る。座標データ43は、選択した2文字分の文字枠であ
る。接触判定部28では供給された文字枠の座標データか
ら接触しているかどうか判定を行う。各種の組合せにつ
いて各条件を満足するか比較して接触の有無を判定す
る。条件を1つでも満足していれば、接触有りを示す判
定情報を制御部20に出力し、すべて条件を満足していな
ければ、接触なしを示す判定情報を制御部20に出力する
(ステップS16 )。
【0029】制御部20では、接触判定部28から供給され
る判定情報に応じて制御信号44を辞書切替え部24に出力
する。辞書切替え部24では、制御信号44に応じてあらか
じめ接触している場合に用いる辞書と接触していない場
合に用いる辞書が切り替えられて選択した辞書からの認
識における基準となる情報38が認識部18に供給される
(ステップS18 )。
【0030】認識部18では、制御部20の制御信号40によ
り画像データ32の切り出した文字枠を認識対象範囲と
し、この文字枠内の画像データと情報38とを比較し、か
つ認識することにより文字認識を行う(ステップS20
)。この結果が認識部18から文字情報48として出力さ
れる。
【0031】格納する画像データ30に対して認識処理す
べてが完了したかどうかの判断が行われる(ステップS2
2 )。すべて完了した場合(YES )、終了する。また、
認識が完了していない場合(NO)、ステップS12 に戻っ
て、前述した処理を繰り返す。
【0032】また、本実施例では、2つずつ読み込んだ
文字枠の接触に対して認識を行うようにしたが、2つず
つ読み込んだ文字枠の接触判定の結果をまとめておい
て、制御部20で文字枠の接触判定結果ごとの辞書切替え
制御を行わせ、さらに認識部18での認識処理をまとめて
行わせるようにしてもよい。
【0033】次に矩形分解部22の動作手順について説明
する(図9を参照)。たとえば、供給される多角形70の
座標データ42のうち(図10(a) を参照)、最初の注目す
る頂点をどれにするか選択する(サブステップSS10)。
基準点(図示せず)に最も近い点を注目頂点としてもよ
い。この注目頂点A の座標を(xa, ya)とする。次に左
周りに連続した2点B, Cを選択する(サブステップSS1
2)。点B の座標を(xb, yb)とし、点C の座標を(xc,
yc)とする。
【0034】次に条件1を満足するかどうか判定する
(サブステップSS14)。条件1は点Aと点B のx 座標の
値が同じかどうかを判定する(xa=xb)。水平方向に同
じ座標データである場合(YES )、点A と点B が垂直方
向の同一線上にあることがわかり、サブステップSS16に
進む。また、同じ座標データでなかった場合(NO:xa
xb)、サブステップSS18に進む。
【0035】サブステップSS16では、条件2を満足する
かどうか判定する。条件2は、点Aに対する点B の位置
を垂直方向のどの方向にあるか判定するとともに、点C
の位置が点A-点B を結ぶ線上の右側か左側かを調べてい
る。そして、点B と点C のy座標の値が同じかも同時に
判定している。したがって、条件2は、
【0036】
【数2】 {(ya ≦yb )∩(xb ≦xc) ∩ (yb=yc) }∪ {(ya ≧yb )∩(xb ≧xc) ∩ (yb=yc) } ・・・(2) である。この判定により、第1象限と第3象限のような
形状が考えられる。この条件2を満足する場合(YES
)、矩形の4点のうち、3点が決まることになり、次
の処理としてサブステップSS20に進む。また、条件2を
満足しない場合(NO)、サブステップSS22に進む。
【0037】サブステップSS20において、矩形70の残る
1点を決める。図10(a) の場合、矩形の点A, B, C が決
まっている条件から、矩形70の残る1点は、点G にな
る。この後、矩形70内の4点A, B, C, Gで囲む矩形70a
の内部に他の頂点がないかどうか判定する(サブステッ
プSS24)。図10(a) では、他に矩形70a の4点以外に頂
点は含まないから、処理をサブステップSS26に進める。
他に頂点を含む場合(NO)、サブステップSS22に進む。
【0038】サブステップSS26では、頂点を削除し、新
たな頂点を設定して矩形に分ける。たとえば、図10(a)
の矩形70は本来頂点が6つあるが、矩形の頂点は4つで
表されるから、矩形70a の頂点A, Bを削除する。そし
て、頂点C の代わりに点G を新たな矩形70b の点として
置換する。図示していないが、この置換後に頂点D, E,
F, Gについても水平や垂直方向に同一成分を含んでいる
か検討するとよい。この検討を踏まえて残る点の数が4
かどうか判定する(サブステップSS28)。図10(a) で
は、新たな多角形が矩形かどうか判定する。判定した結
果、点D, E, F, Gで示される矩形70b に分解されること
がわかる。たとえば、頂点が5つ以上の場合(NO)、サ
ブステップSS22に進む。
【0039】サブステップSS22では、新たな注目頂点と
して左周りに頂点を1個移動させる。この後、サブステ
ップSS12に戻って、前述した一連の処理を繰り返す。
【0040】また、前述したサブステップSS14の条件1
を満足しなかった場合(NO)、サブステップSS18に移行
する。サブステップSS18では条件3を満足するかどうか
判定する。条件3は、点A に対する点B の位置を水平方
向のどの方向にあるか判定するとともに、点C の位置が
点A-点B を結ぶ線上の上側か下側かを調べている。そし
て、点B と点C のx 座標の値が同じかも同時に判定して
いる。したがって、条件3は、
【0041】
【数3】 {(xa ≦xb )∩(yb ≧yc) ∩ (xb=xc) }∪ {(xa ≧xb )∩(yb ≦yc) ∩ (xb=xc) } ・・・(3) である。この判定により、第2象限と第4象限のような
形状が考えられる。この条件3を満足する場合(YES
)、矩形の4点のうち、3点が決まることになり、次
の処理としてサブステップSS20に進む。また、条件3を
満足しない場合(NO)、サブステップSS22に進む。条件
3は点A と点B が同一の水平方向の線上にあって、点C
が点A-点B のどちらの垂直方向にあるかが判定される。
【0042】また、図10(b) に示した矩形72の場合の矩
形分割を説明する。矩形72は8個の頂点A 〜H を有す
る。各頂点の座標は(xa, ya), (xb, yb), (xc,
yc), (xd, yd), (xe, ye), (xf, yf), (xg,
yg), (xh, yh)とする。矩形72では各頂点が水平方向
と垂直方向のいずれか一方と共通な成分を有しているか
ら、 点B の座標(xb, yb)=(xa, yb), 点C の座標(xc, yc)=(xc, yb), 点D の座標(xd, yd)=(xc, yd), 点E の座標(xe, ye)=(xe, yd), 点F の座標(xf, yf)=(xe, yf), 点G の座標(xg, yg)=(xg, yf), 点H の座標(xh, yh)=(xg, ya), という関係にある。前述の例と同様に注目頂点を点A に
する(サブステップSS10)。点A に連続した2点を点B,
Cにする(サブステップSS12)。点A と点B は上述した
各成分に着目し条件1の比較判定を行うと(サブステッ
プSS14)、x 座標の値が同一にあるからサブステップSS
16に進む。点A, B, C の3点の位置関係が、条件2を満
足するかどうか判定する(サブステップSS16)。3点の
位置関係が第1象限を示して条件2を満足するので、サ
ブステップSS20に進む。
【0043】ここで、3点A, B, C を矩形72a の各頂点
とすることから、残る頂点は、点Iの座標(xi, yi)=
(xc, ya)になる(サブステップSS20)。この後、矩形
72aの内部に他の頂点が含まれていないか判定する。図1
0(b) の矩形72では、矩形72a の内部に点E, F, G が含
まれているので、サブステップSS22に移行する。サブス
テップSS22では、新たな注目頂点を左周りに移動させて
選択する。したがって、新たな注目頂点を点B にする。
この処理後、サブステップSS12に戻る。
【0044】点B, Cは、水平方向に並ぶ点であるから、
条件1を満足しない(xa≠xc)。処理をサブステップSS
18に移行する。注目頂点B において点B, C, D を条件3
に当てはめて判定を行う(サブステップSS18)。これら
3点の関係は、第2象限に対応し、条件3を満足するか
ら、サブステップSS20に進む。3点B, C, D を含む矩形
72b とするため頂点J が選ばれる。矩形72b の内部に他
の頂点は存在しないので、サブステップSS26に進む。
【0045】頂点B を除く連続した2点C, Dを削除し、
点D の代わりに点J を多角形の新たな頂点とする。これ
により、多角形AJEFGHが得られ矩形72b が多角形ABCDEF
GHから分離されたことになる。サブステップSS28におい
て、多角形AJEFGHが頂点6個で頂点4個よりも多い。す
なわち、まだ矩形分解できることを示しているから、サ
ブステップSS22で新たな注目頂点を選ぶ。このとき、頂
点B 以降、左周りで選択される頂点C, Dがすでに分離さ
れたため削除されている。したがって、次の注目頂点は
点E になる。
【0046】サブステップSS12での連続した2点は点E,
Fになる。点E, Fはx 座標が同じ位置成分を有する(サ
ブステップSS14)。これにより、サブステップSS16で条
件2の判定に進む。点E, F, G は、第4象限に対応した
位置関係にあり、条件2を満足しない。この結果サブス
テップSS22に進む。注目頂点を点E から点F に移動させ
る。
【0047】サブステップSS12での連続した2点は点G,
Hになる。x 座標の位置関係を条件1により判定する
(サブステップSS14)。点F, Gは、位置成分のx 座標が
異なっている(xe=xf≠xg)。これにより、サブステッ
プSS18に進んで条件3の判定を行う。この場合、点F,
G, H は第3象限に対応し、条件3を満足しているから
サブステップSS20に移行させる。そして点F, G, H に対
して残る1点を決定する。この場合、点K が対応してい
る。この後、多角形FGHK内に頂点を含まないと判定され
る(サブステップSS24)。この結果矩形72c が得られ
る。
【0048】矩形72c を示す多角形FGHKを分離するた
め、直前の判定で用いていた注目頂点F と次の点G を削
除する。そして点H の代わりに点K を新たな頂点として
置換する(サブステップSS26)。このように分解して多
角形AJEKが得られる。多角形AJEKが4個の頂点に成って
いるから、すべて矩形分解が終了したものとしてリター
ンに移行する。リターンに際してこれまで多角形を矩形
に分解した頂点の座標データを制御部20を介して矩形記
憶部26に供給する。
【0049】以上のように構成することにより、矩形分
解部22で文字枠の多角形を矩形に分解し、分解した各頂
点の位置(情報)を矩形記憶部26に記憶させ、接触判定
を行うことでこれまでの輪郭追跡方法により処理時間に
比べて処理時間を短縮化させることができるようにな
る。また、接触判定に応じて制御部20が辞書切替え部24
を切り替えて適切な辞書からの情報が認識部18に供給さ
れるようになることから、認識部18に供給される画像デ
ータに含まれる文字等の情報を正確に認識できるように
なる。この結果、文字の認識率を従来以上に向上させる
ことができる。
【0050】
【発明の効果】このように本発明の文字認識装置によれ
ば、採り込んだ画像データにおける文字を含む枠領域を
切り出し、さらに座標検出手段で読み出した画像データ
の枠領域の文字の形状に応じて多角形の領域を切り出
し、この多角形の領域を矩形分解手段で矩形に分解して
矩形記憶手段に各矩形の頂点座標を記憶し、これら座標
の位置関係から接触判定手段が矩形記憶手段から読み出
した矩形を基に文字同士の接触(すなわち、重なりの)
有無を判定し、この判定結果に応じて制御手段が辞書切
替え手段を切り替え、認識手段を制御して、辞書からの
認識に用いる基準と成る情報を常に適切に供給して画像
データが含む文字の認識を認識手段で行わせることによ
り、判定に要する時間の短縮化および文字認識の認識精
度を向上させることができる。
【0051】また、本発明の文字認識方法によれば、読
み出した画像データを用いて枠領域の文字の形状に応じ
て多角形の領域を切り出し、この多角形の領域を矩形の
集合に分解して、分解した矩形の座標を記憶しておき、
接触の判定において、記憶してある矩形の座標を基に文
字同士の接触を判定して、判定結果に応じて使用する辞
書を切り替えて文字認識を行って常に適切な辞書を使用
するとにより認識精度を高くするととともに、判定に要
する時間の短縮を図れるので、認識処理を従来よりも短
縮化することができる。
【図面の簡単な説明】
【図1】本発明の文字認識装置を適用した光学式文字認
識装置(OCR )の概略的な構成を示すブロック図であ
る。
【図2】図1のOCR による矩形の文字切出し枠の一例の
模式図である。
【図3】図1のOCR において矩形同士の接触判定を説明
する模式図である。
【図4】図1のOCR による多角形の文字切出し枠の一例
の模式図である。
【図5】図1のOCR において多角形の文字切出し枠を矩
形に分解する例を示す図である。
【図6】図1の矩形分解部が矩形に分解できる形状と領
域の例を示した図である。
【図7】図1の矩形分解部が矩形に分解できない形状と
領域の例を示した図である。
【図8】図1のOCR の動作を説明するメインフローチャ
ートである。
【図9】図8に示した矩形分解の手順を説明するサブル
ーチンSUB1のフローチャートである。
【図10】図9の手順に従って多角形を矩形に分解する
例を示した図である。
【符号の説明】
10 光学式文字認識装置(OCR ) 12 画像記憶部 14 枠座標抽出部 16 枠座標記憶部 18 認識部 20 制御部 22 矩形分解部 24 辞書切替え部 26 矩形記憶部 28 接触判定部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 媒体上に書かれた文字および/または図
    形をサンプリングし、採り込んだ情報を画像データとし
    て格納する画像記憶手段と、 該画像記憶手段から読み出した画像データのうち、文字
    を含む枠領域を切り出すとともに、該枠領域の各頂点の
    座標を検出する座標検出手段と、 該検出した座標を格納する座標記憶手段と、 該座標記憶手段から読み出した座標に基づいて前記枠領
    域の接触を判定する接触判定手段と、 使用する辞書を切り替えて選択した辞書から情報を出力
    する辞書切替え手段と、 前記辞書からの情報と前記画像記憶手段とを対応させ、
    前記画像データの認識処理を行う認識手段と、 前記座標記憶手段からの座標および前記接触判定手段の
    判定結果に応じて前記辞書切替え手段および前記認識手
    段を制御する制御手段と、 前記座標検出手段で読み出した画像データの前記枠領域
    の文字の形状に応じて多角形の領域に切り出し、該多角
    形の領域を矩形の集合に分解する矩形分解手段と、 該分解した矩形を記憶する矩形記憶手段とを含むことを
    特徴とする文字認識装置。
  2. 【請求項2】 請求項1に記載の装置において、前記接
    触判定手段は、前記矩形の組合せすべてに対して接触判
    定を行い、接触が1箇所以上ある場合に接触ありと判定
    することを特徴とする文字認識装置。
  3. 【請求項3】 媒体上に書かれた文字および/または図
    形をサンプリングし、採り込んだ情報を画像データと
    し、該画像データに含まれる文字を含む枠領域を切り出
    すとともに、該枠領域の各頂点の座標を検出する第1の
    工程と、 該検出した座標を用いて前記枠領域の接触を判定する第
    2の工程と、 前記接触の判定に応じて使用する辞書を切り替える第3
    の工程と、 前記辞書からの情報と前記画像データとを対比させ、前
    記画像データの認識処理を行う第4の工程と、 第1の工程で読み出した画像データを用いて前記枠領域
    の文字の形状に応じて多角形の領域に切り出し、該多角
    形の領域を矩形の集合に分解する第5の工程と、 該分解した矩形の座標を記憶する第6の工程とを含み、 第2の工程は、第6の工程で記憶した前記矩形の座標を
    基に前記文字同士の接触を判定することを特徴とする文
    字認識方法。
  4. 【請求項4】 請求項3に記載の方法において、第2の
    工程は、前記矩形の組合せすべてに対して接触判定を行
    い、接触が1箇所以上ある場合に接触ありと判定するこ
    とを特徴とする文字認識方法。
  5. 【請求項5】 請求項3または4に記載の方法におい
    て、第5の工程は、前記多角形の最初に選ぶ頂点を注目
    頂点として選択する第1の注目頂点選択工程と、 前記多角形の前記注目点に連続した2つの頂点を選択す
    る連続選択工程と、 前記注目頂点および連続した2つの頂点のうちの最初の
    点の水平成分の値が同じかを判定する第1判定の工程
    と、 第1判定の結果が真のとき、3つの点が2次元座標の第
    1または第3象限に対応する位置関係にあるか判定する
    第2判定の工程と、 第1判定の結果が偽のとき、3つの点が2次元座標の第
    2または第4象限に対応する位置関係にあるか判定する
    第3判定の工程と、 第2判定または第3判定が真のとき、3点に残る1点を
    第4の点として決定し、4点からなる矩形にする工程
    と、 第2判定または第3判定が偽のとき、注目頂点を1つ分
    移動させて新たな注目頂点を選択する第2の注目頂点選
    択工程と、 得られた矩形内に前記多角形の頂点が含まれるか判定す
    る第4の判定の工程と、 第4判定が真のとき、前記選択した注目頂点および連続
    した2つの頂点のうちの最初の点を削除するとともに、
    連続した2つの頂点のうちの第2の点の代わりに、第4
    の点を新たな多角形の頂点にして矩形分離と多角形の形
    成を行う工程と、 前記新たな多角形が矩形かどうか判定する第5判定の工
    程とを含み、 第5判定が真のとき、前記多角形を矩形に分解する処理
    が完了したと判定し、第5判定が偽のとき、前記多角形
    の矩形に分解する処理を継続して第2の注目頂点選択工
    程に進んで第2の注目頂点を選択し、第2の注目頂点に
    対する前記連続選択工程以降の処理を行うことを特徴と
    する文字認識方法。
JP2000126303A 2000-04-21 2000-04-21 文字認識装置および文字認識方法 Pending JP2001307022A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000126303A JP2001307022A (ja) 2000-04-21 2000-04-21 文字認識装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000126303A JP2001307022A (ja) 2000-04-21 2000-04-21 文字認識装置および文字認識方法

Publications (1)

Publication Number Publication Date
JP2001307022A true JP2001307022A (ja) 2001-11-02

Family

ID=18636109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000126303A Pending JP2001307022A (ja) 2000-04-21 2000-04-21 文字認識装置および文字認識方法

Country Status (1)

Country Link
JP (1) JP2001307022A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101725501B1 (ko) * 2016-07-13 2017-04-13 한동대학교 산학협력단 문자 인식 방법 및 장치
JP2021163231A (ja) * 2020-03-31 2021-10-11 ローレルバンクマシン株式会社 紙葉類識別装置および紙葉類識別方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101725501B1 (ko) * 2016-07-13 2017-04-13 한동대학교 산학협력단 문자 인식 방법 및 장치
JP2021163231A (ja) * 2020-03-31 2021-10-11 ローレルバンクマシン株式会社 紙葉類識別装置および紙葉類識別方法
JP7372633B2 (ja) 2020-03-31 2023-11-01 ローレルバンクマシン株式会社 紙葉類識別装置および紙葉類識別方法

Similar Documents

Publication Publication Date Title
US6212299B1 (en) Method and apparatus for recognizing a character
JPH04195692A (ja) 文書読取装置
JP2001307022A (ja) 文字認識装置および文字認識方法
JPH07168664A (ja) イメージ入力装置の入力制御方法
JP2020119291A (ja) 情報処理装置及びプログラム
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JP3133797B2 (ja) 文字認識方法及びその装置
JPH0728935A (ja) 文書画像処理装置
KR100332752B1 (ko) 문자인식방법
JP2956094B2 (ja) 手書き文字認識装置
JPH0388086A (ja) 文書読取装置
JPH09288714A (ja) 表認識方法および装置
JP2002366900A (ja) 光学式文字読取装置
JPH0830725A (ja) 画像処理装置及び方法
JPH03126188A (ja) 文字認識装置
JPH0644406A (ja) 画像処理方法及び装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JPH09114925A (ja) 光学式文字読取装置
JPS62281082A (ja) 文字認識装置
JP2925270B2 (ja) 文字読取装置
JPS6383888A (ja) 文字認識装置
JPH10134145A (ja) 文字切り出し方法およびそれを用いた文字認識装置と、その文字切り出し方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体
JPH0512489A (ja) 表認識装置
JPH05114047A (ja) 文字切り出し装置
JPH0443476A (ja) 文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080901

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081224

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090114

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090227