JP2001307022A - 文字認識装置および文字認識方法 - Google Patents
文字認識装置および文字認識方法Info
- Publication number
- JP2001307022A JP2001307022A JP2000126303A JP2000126303A JP2001307022A JP 2001307022 A JP2001307022 A JP 2001307022A JP 2000126303 A JP2000126303 A JP 2000126303A JP 2000126303 A JP2000126303 A JP 2000126303A JP 2001307022 A JP2001307022 A JP 2001307022A
- Authority
- JP
- Japan
- Prior art keywords
- determination
- rectangle
- unit
- character
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
識できる文字認識装置および文字認識方法の提供。 【解決手段】 光学式文字認識装置(OCR )10は、画像
記憶部12に採り込んだ画像データ30における文字を含む
枠領域を切り出し、さらに読み出した画像データの枠領
域の文字の形状に応じて多角形の領域を枠座標抽出部14
で切り出し、この多角形の領域を矩形分解部22で矩形に
分解して矩形記憶部26に各矩形の頂点座標データ43を記
憶し、これら座標の位置関係から接触判定部28が矩形記
憶部26から読み出した矩形を基に文字同士の接触の有無
を判定し、この判定結果に応じて制御部20が辞書切替え
部24を切り替え、制御部20の制御に応じて認識部18が供
給される画像データ32に対して辞書からの認識基準の情
報38を用いて文字認識している。
Description
び文字認識方法に関し、特に光で紙等の文字記録媒体に
書かれている文字等の情報を読み出し、これらの情報か
ら文字を認識するOCR (Optical Character Recognitio
n)に適用して好適なものである。
じめ規定したコードに認識する装置を文字認識装置とい
う。手書きの文字は、個人により個性にあふれている。
また、文字の書き方には、楷書、行書等々各種各様であ
る。帳簿や請求書等の書類に数字を手書きする際に、た
とえば、数字「0 」を連続して記入することがある。こ
のとき、数字「0 」の間は横方向の線でつながって書か
れていることが多い。したがって、文字を切出した場合
「0 」に横線の入った画像として装置に取り込まれる。
このような画像から文字認識の精度を挙げるには、一般
的にこのような続け字の辞書を本来の辞書に追加する方
法が採られている。
い、通常の文字の認識を続け字辞書で行うと誤認識する
問題が発生する。この問題を回避するため、装置は文字
の輪郭を追跡して隣接する文字同士が接触しているかど
うか確認を行い、判断して対処している。すなわち、文
字同士が接触していない場合、通常の辞書を使用し、文
字同士が接触している場合、通常の辞書に加えて、続け
字辞書も使用して文字認識を行ってきた。これにより、
通常の認識をする処理の場合の認識率の低下を防いでい
る。
の処理にともなって時間が多くかかる。ひいては認識速
度を低下させる原因にもなっている。
し、認識率および認識速度の低下を避けて文字認識でき
る文字認識装置および文字認識方法を提供することを目
的とする。
決するために、媒体上に書かれた文字および/または図
形をサンプリングし、採り込んだ情報を画像データとし
て格納する画像記憶手段と、この画像記憶手段から読み
出した画像データのうち、文字を含む枠領域を切り出す
とともに、この枠領域の各頂点の座標を検出する座標検
出手段と、この検出した座標を格納する座標記憶手段
と、この座標記憶手段から読み出した座標に基づいて枠
領域の接触を判定する接触判定手段と、使用する辞書を
切り替えて選択した辞書から情報を出力する辞書切替え
手段と、辞書からの情報と画像記憶手段とを対応させ、
画像データの認識処理を行う認識手段と、座標記憶手段
からの座標および接触判定手段の判定結果に応じて辞書
切替え手段および前記認識手段を制御する制御手段と、
座標検出手段で読み出した画像データの枠領域の文字の
形状に応じて多角形の領域に切り出し、この多角形の領
域を矩形の集合に分解する矩形分解手段と、この分解し
た矩形を記憶する矩形記憶手段とを含むことを特徴とす
る。
データにおける文字を含む枠領域を切り出し、さらに座
標検出手段で読み出した画像データの枠領域の文字の形
状に応じて多角形の領域を切り出し、この多角形の領域
を矩形分解手段で矩形に分解して矩形記憶手段に各矩形
の頂点座標を記憶し、これら座標の位置関係から接触判
定手段が矩形記憶手段から読み出した矩形を基に文字同
士の接触(すなわち、重なりの)有無を判定することに
より、判定に要する時間の短縮化を図り、この判定結果
に応じて制御手段が辞書切替え手段を切り替え、認識手
段を制御することにより、辞書からの認識に用いる基準
と成る情報を常に適切に供給して画像データに含まれる
文字の認識を認識手段で行わせることができる。
に、媒体上に書かれた文字および/または図形をサンプ
リングし、採り込んだ情報を画像データとし、この画像
データに含まれる文字を含む枠領域を切り出すととも
に、この枠領域の各頂点の座標を検出する第1の工程
と、検出した座標を用いて枠領域の接触を判定する第2
の工程と、接触の判定に応じて使用する辞書を切り替え
る第3の工程と、辞書からの情報と画像データとを対比
させ、画像データの認識処理を行う第4の工程と、第1
の工程で読み出した画像データを用いて枠領域の文字の
形状に応じて多角形の領域に切り出し、この多角形の領
域を矩形の集合に分解する第5の工程と、この分解した
矩形の座標を記憶する第6の工程とを含み、第2の工程
は、第6の工程で記憶した矩形の座標を基に文字同士の
接触を判定することを特徴とする。
データを用いて枠領域の文字の形状に応じて多角形の領
域を切り出し、この多角形の領域を矩形の集合に分解し
て、分解した矩形の座標を記憶しておき、接触の判定に
おいて、記憶してある矩形の座標を基に文字同士の接触
を判定して、判定に要する時間の短縮を図る。また、判
定結果に応じて使用する辞書を切り替えて文字認識を行
うことにより、常に認識に用いる辞書を適切なものにす
ることができる。
よる文字認識装置の一実施例を詳細に説明する。
データにおける文字を含む枠領域を切り出し、さらに座
標検出部で読み出した画像データの枠領域の文字の形状
に応じて多角形の領域を切り出し、この多角形の領域を
矩形分解部で矩形に分解して矩形記憶部に各矩形の頂点
座標を記憶し、これら座標の位置関係から接触判定部が
矩形記憶部から読み出した矩形(の座標)を基に文字同
士の接触(すなわち、重なりの)有無を判定することに
特徴がある。
した光学式文字認識装置(以下、OCR という)10につい
て説明する。本発明と直接関係のない部分について図示
および説明を省略する。ここで、信号の参照符号はその
現れる接続線の参照番号で表す。OCR 10は、画像記憶部
12、枠座標抽出部14、枠座標記憶部16、認識部18、制御
部20、矩形分解部22、辞書切替え部24、矩形記憶部26、
および接触判定部28を含んでいる。
取り部で読み込まれた媒体上の文字および図形を画像デ
ータ30として格納するメモリ機能を有する。画像記憶部
12はRAM (Random Access Memory )を用い、所定の画像
サイズに応じたメモリ容量を持っている。画像記憶部12
は、読み出した画像データ32を枠座標抽出部14および認
識部18に出力している。
きさおよび画像のなかに基準点を設定するとともに、各
枠の位置(および各点の接続順)を示す座標データ34を
抽出する機能を有する信号処理部である。座標データ34
は座標を結ぶ順序も含めているので、座標データ34から
後段で多角形を形成することも可能である。枠座標記憶
部16は、メモリ機能を有し、枠座標抽出部14からの座標
データ34を書き込んで記憶する。枠座標記憶部16は、制
御部20の読出し制御により座標データ34を座標データ36
として読み出して制御部20を介して矩形分解部22に供給
している。
文字が何か辞書切替え部24から供給される辞書のデータ
38と付き合わせて該当する文字を認識する機能を有する
認識処理部である。認識部18は制御部20からの制御信号
40により制御されている。
から多角形を形成し、この多角形を矩形に分解する機能
を有する信号処理部である。矩形分解部22は、制御部20
の制御により上述した機能を発揮させ、得られた矩形の
各点の座標データを制御部20を介して矩形記憶部26に供
給している。矩形分解部22と制御部20とを結ぶ線42は座
標データ36、制御信号および矩形の座標データを含んだ
信号線である。
し、制御部20からの制御信号44により認識部18に供給さ
れる画像データ32の認識処理に用いる辞書を選択する機
能を有している。この選択により辞書切替え部24は、辞
書のデータ38を認識部18に出力する。
納するメモリ機能がある。矩形記憶部26は、RAM で構成
され、制御部20の書込み/読出し制御に応じて動作す
る。矩形記憶部26と制御部20とは矩形の座標データおよ
び制御がまとめて信号線43で接続されている。同様に、
接触判定部28と制御部20とは矩形の座標データおよび制
御がまとめて信号線46で接続されている。
矩形同士の接触の有無を判定する機能を有している。接
触判定部28は制御部20の制御に応じて後述するように位
置関係の条件に基づいて判定を行う。この判定結果は、
信号線46を介して制御部20に供給される。
cessing Unit)や動作手順等の書込まれたROM (Read On
ly Memory )等を有する。制御部20は、前述した各部に
対する各種のデータ入出力制御ならびに動作状態の設定
および動作タイミング等を制御する。
の入った画像かどうかを判定していた場合よりも処理速
度を改善している。OCR 10の動作を説明する前にこの画
像および接触判定の原理について説明する。図2は、数
字「0 」が連続して書かれた媒体を光学的に読み込んだ
画像から文字の部分を切り出した状態を示している。各
文字枠50, 52内の文字がOCR 10でつながっているか判断
する際にこれまで輪郭を追跡して接続の有無を確認して
いた。
すように、座標軸x, yの矢印方向をそれぞれ座標の増加
方向にする。読み込んだ画像の文字部分は文字枠54, 56
に切り出している。この文字枠の切出しを行う際にOCR
10は、基準点から各文字枠54, 56の2次元座標(x, y)
の位置をそれぞれ検出している。文字枠54の各点は左周
りにa 〜d の4点(xa, ya), (xb, yb), (xc, yc), (x
d, yd)とし、文字枠56の各点も左周りにe 〜h の4点
(xe, ye),(xf, yf),(xg, yg), (xh, yh)とする。図
3の文字枠54, 56の接触判定は、点a, c, e, gを用いて
行う。つまり接触判定は、対角に位置する点を用いて行
う。接触は文字枠54, 56の2点の距離が最短と最長の関
係にある点同士を比較して行う。すなわち、
る。この条件により文字枠54, 56において右下隅と左上
隅の重複が判定できる。この各点の位置の大小関係によ
り条件を記さないがこの他3つの重複が判定できる。
図4の文字枠58, 60が示すように、文字の形状に応じて
水平および垂直方向のいずれか一方の枠線を組み合わせ
て細かい多角形に切り出すようにしてもよい。多角形に
切り出した場合、この多角形を矩形状に分解する(図5
を参照)。矩形状の分解は、この場合垂直方向の辺の長
さで各矩形の大きさが決まっている。図5の文字枠58は
矩形58a, 58b, 58c の3つに分解され、文字枠60は矩形
60a, 60b, 60c, 60dの4つに分解している。2つの文字
枠58, 60において分解した3つと4つの矩形による組合
せすべてについて接触判定を行う。接触判定は、前述し
たように文字枠の各点の位置関係から判定を行う。全組
合せのうち、1つでも接触があれば接触しているとの判
定を下し、全く接触がなければ接触していないという判
定を下す。
が示すように水平および垂直方向のいずれかの成分の枠
線を組み合わせることにより多角形が形成されている。
これに対して、図7(a)の文字枠66には斜線、すなわち水
平および出力直方向の両成分を有している。また、図7
(b)の文字枠68は、文字枠68自体が重なり合う部分68aが
ある。この2つの場合、文字枠66, 68は矩形分解部22で
は矩形に分解できない。矩形分解部22ではこのような多
角形を矩形分解して各点の座標データが抽出されてい
る。なお、後述するように多角形の各点のつなぐ順序を
左周り(または反時計周り)にしている。
照)。画像記憶部12に媒体上の文字・図形の情報を光学
式に採り込んで画像データ30として格納する(ステップ
S10 )。画像記憶部12から読み出した画像データが枠座
標抽出部14で2文字分の文字枠を切り出す。枠座標抽出
部14では切り出した2文字分の文字枠の座標データを抽
出する。抽出した座標データ34が枠座標記憶部16に記憶
される(ステップS12 )。
の制御により枠座標記憶部16から1文字分の文字枠が読
み出される。読み出された座標データ36が制御部20を介
して矩形分解部22に送られ、矩形の集合に分解される
(図5を参照:サブルーチンSUB1)。矩形分解した結果
の座標データ42が制御部20を介した座標データ43が矩形
記憶部26に記憶される(ステップS14 )。あらわに図示
していないが、OCR 10はステップS14 からサブルーチン
SUB1に戻って2文字分の残る1文字分についても矩形分
解部22で矩形の集合に分解し、この分解結果を矩形記憶
部26に記憶する。
20を介した座標データ46として接触判定部28に供給され
る。座標データ43は、選択した2文字分の文字枠であ
る。接触判定部28では供給された文字枠の座標データか
ら接触しているかどうか判定を行う。各種の組合せにつ
いて各条件を満足するか比較して接触の有無を判定す
る。条件を1つでも満足していれば、接触有りを示す判
定情報を制御部20に出力し、すべて条件を満足していな
ければ、接触なしを示す判定情報を制御部20に出力する
(ステップS16 )。
る判定情報に応じて制御信号44を辞書切替え部24に出力
する。辞書切替え部24では、制御信号44に応じてあらか
じめ接触している場合に用いる辞書と接触していない場
合に用いる辞書が切り替えられて選択した辞書からの認
識における基準となる情報38が認識部18に供給される
(ステップS18 )。
り画像データ32の切り出した文字枠を認識対象範囲と
し、この文字枠内の画像データと情報38とを比較し、か
つ認識することにより文字認識を行う(ステップS20
)。この結果が認識部18から文字情報48として出力さ
れる。
べてが完了したかどうかの判断が行われる(ステップS2
2 )。すべて完了した場合(YES )、終了する。また、
認識が完了していない場合(NO)、ステップS12 に戻っ
て、前述した処理を繰り返す。
文字枠の接触に対して認識を行うようにしたが、2つず
つ読み込んだ文字枠の接触判定の結果をまとめておい
て、制御部20で文字枠の接触判定結果ごとの辞書切替え
制御を行わせ、さらに認識部18での認識処理をまとめて
行わせるようにしてもよい。
する(図9を参照)。たとえば、供給される多角形70の
座標データ42のうち(図10(a) を参照)、最初の注目す
る頂点をどれにするか選択する(サブステップSS10)。
基準点(図示せず)に最も近い点を注目頂点としてもよ
い。この注目頂点A の座標を(xa, ya)とする。次に左
周りに連続した2点B, Cを選択する(サブステップSS1
2)。点B の座標を(xb, yb)とし、点C の座標を(xc,
yc)とする。
(サブステップSS14)。条件1は点Aと点B のx 座標の
値が同じかどうかを判定する(xa=xb)。水平方向に同
じ座標データである場合(YES )、点A と点B が垂直方
向の同一線上にあることがわかり、サブステップSS16に
進む。また、同じ座標データでなかった場合(NO:xa≠
xb)、サブステップSS18に進む。
かどうか判定する。条件2は、点Aに対する点B の位置
を垂直方向のどの方向にあるか判定するとともに、点C
の位置が点A-点B を結ぶ線上の右側か左側かを調べてい
る。そして、点B と点C のy座標の値が同じかも同時に
判定している。したがって、条件2は、
形状が考えられる。この条件2を満足する場合(YES
)、矩形の4点のうち、3点が決まることになり、次
の処理としてサブステップSS20に進む。また、条件2を
満足しない場合(NO)、サブステップSS22に進む。
1点を決める。図10(a) の場合、矩形の点A, B, C が決
まっている条件から、矩形70の残る1点は、点G にな
る。この後、矩形70内の4点A, B, C, Gで囲む矩形70a
の内部に他の頂点がないかどうか判定する(サブステッ
プSS24)。図10(a) では、他に矩形70a の4点以外に頂
点は含まないから、処理をサブステップSS26に進める。
他に頂点を含む場合(NO)、サブステップSS22に進む。
たな頂点を設定して矩形に分ける。たとえば、図10(a)
の矩形70は本来頂点が6つあるが、矩形の頂点は4つで
表されるから、矩形70a の頂点A, Bを削除する。そし
て、頂点C の代わりに点G を新たな矩形70b の点として
置換する。図示していないが、この置換後に頂点D, E,
F, Gについても水平や垂直方向に同一成分を含んでいる
か検討するとよい。この検討を踏まえて残る点の数が4
かどうか判定する(サブステップSS28)。図10(a) で
は、新たな多角形が矩形かどうか判定する。判定した結
果、点D, E, F, Gで示される矩形70b に分解されること
がわかる。たとえば、頂点が5つ以上の場合(NO)、サ
ブステップSS22に進む。
して左周りに頂点を1個移動させる。この後、サブステ
ップSS12に戻って、前述した一連の処理を繰り返す。
を満足しなかった場合(NO)、サブステップSS18に移行
する。サブステップSS18では条件3を満足するかどうか
判定する。条件3は、点A に対する点B の位置を水平方
向のどの方向にあるか判定するとともに、点C の位置が
点A-点B を結ぶ線上の上側か下側かを調べている。そし
て、点B と点C のx 座標の値が同じかも同時に判定して
いる。したがって、条件3は、
形状が考えられる。この条件3を満足する場合(YES
)、矩形の4点のうち、3点が決まることになり、次
の処理としてサブステップSS20に進む。また、条件3を
満足しない場合(NO)、サブステップSS22に進む。条件
3は点A と点B が同一の水平方向の線上にあって、点C
が点A-点B のどちらの垂直方向にあるかが判定される。
形分割を説明する。矩形72は8個の頂点A 〜H を有す
る。各頂点の座標は(xa, ya), (xb, yb), (xc,
yc), (xd, yd), (xe, ye), (xf, yf), (xg,
yg), (xh, yh)とする。矩形72では各頂点が水平方向
と垂直方向のいずれか一方と共通な成分を有しているか
ら、 点B の座標(xb, yb)=(xa, yb), 点C の座標(xc, yc)=(xc, yb), 点D の座標(xd, yd)=(xc, yd), 点E の座標(xe, ye)=(xe, yd), 点F の座標(xf, yf)=(xe, yf), 点G の座標(xg, yg)=(xg, yf), 点H の座標(xh, yh)=(xg, ya), という関係にある。前述の例と同様に注目頂点を点A に
する(サブステップSS10)。点A に連続した2点を点B,
Cにする(サブステップSS12)。点A と点B は上述した
各成分に着目し条件1の比較判定を行うと(サブステッ
プSS14)、x 座標の値が同一にあるからサブステップSS
16に進む。点A, B, C の3点の位置関係が、条件2を満
足するかどうか判定する(サブステップSS16)。3点の
位置関係が第1象限を示して条件2を満足するので、サ
ブステップSS20に進む。
とすることから、残る頂点は、点Iの座標(xi, yi)=
(xc, ya)になる(サブステップSS20)。この後、矩形
72aの内部に他の頂点が含まれていないか判定する。図1
0(b) の矩形72では、矩形72a の内部に点E, F, G が含
まれているので、サブステップSS22に移行する。サブス
テップSS22では、新たな注目頂点を左周りに移動させて
選択する。したがって、新たな注目頂点を点B にする。
この処理後、サブステップSS12に戻る。
条件1を満足しない(xa≠xc)。処理をサブステップSS
18に移行する。注目頂点B において点B, C, D を条件3
に当てはめて判定を行う(サブステップSS18)。これら
3点の関係は、第2象限に対応し、条件3を満足するか
ら、サブステップSS20に進む。3点B, C, D を含む矩形
72b とするため頂点J が選ばれる。矩形72b の内部に他
の頂点は存在しないので、サブステップSS26に進む。
点D の代わりに点J を多角形の新たな頂点とする。これ
により、多角形AJEFGHが得られ矩形72b が多角形ABCDEF
GHから分離されたことになる。サブステップSS28におい
て、多角形AJEFGHが頂点6個で頂点4個よりも多い。す
なわち、まだ矩形分解できることを示しているから、サ
ブステップSS22で新たな注目頂点を選ぶ。このとき、頂
点B 以降、左周りで選択される頂点C, Dがすでに分離さ
れたため削除されている。したがって、次の注目頂点は
点E になる。
Fになる。点E, Fはx 座標が同じ位置成分を有する(サ
ブステップSS14)。これにより、サブステップSS16で条
件2の判定に進む。点E, F, G は、第4象限に対応した
位置関係にあり、条件2を満足しない。この結果サブス
テップSS22に進む。注目頂点を点E から点F に移動させ
る。
Hになる。x 座標の位置関係を条件1により判定する
(サブステップSS14)。点F, Gは、位置成分のx 座標が
異なっている(xe=xf≠xg)。これにより、サブステッ
プSS18に進んで条件3の判定を行う。この場合、点F,
G, H は第3象限に対応し、条件3を満足しているから
サブステップSS20に移行させる。そして点F, G, H に対
して残る1点を決定する。この場合、点K が対応してい
る。この後、多角形FGHK内に頂点を含まないと判定され
る(サブステップSS24)。この結果矩形72c が得られ
る。
め、直前の判定で用いていた注目頂点F と次の点G を削
除する。そして点H の代わりに点K を新たな頂点として
置換する(サブステップSS26)。このように分解して多
角形AJEKが得られる。多角形AJEKが4個の頂点に成って
いるから、すべて矩形分解が終了したものとしてリター
ンに移行する。リターンに際してこれまで多角形を矩形
に分解した頂点の座標データを制御部20を介して矩形記
憶部26に供給する。
解部22で文字枠の多角形を矩形に分解し、分解した各頂
点の位置(情報)を矩形記憶部26に記憶させ、接触判定
を行うことでこれまでの輪郭追跡方法により処理時間に
比べて処理時間を短縮化させることができるようにな
る。また、接触判定に応じて制御部20が辞書切替え部24
を切り替えて適切な辞書からの情報が認識部18に供給さ
れるようになることから、認識部18に供給される画像デ
ータに含まれる文字等の情報を正確に認識できるように
なる。この結果、文字の認識率を従来以上に向上させる
ことができる。
ば、採り込んだ画像データにおける文字を含む枠領域を
切り出し、さらに座標検出手段で読み出した画像データ
の枠領域の文字の形状に応じて多角形の領域を切り出
し、この多角形の領域を矩形分解手段で矩形に分解して
矩形記憶手段に各矩形の頂点座標を記憶し、これら座標
の位置関係から接触判定手段が矩形記憶手段から読み出
した矩形を基に文字同士の接触(すなわち、重なりの)
有無を判定し、この判定結果に応じて制御手段が辞書切
替え手段を切り替え、認識手段を制御して、辞書からの
認識に用いる基準と成る情報を常に適切に供給して画像
データが含む文字の認識を認識手段で行わせることによ
り、判定に要する時間の短縮化および文字認識の認識精
度を向上させることができる。
み出した画像データを用いて枠領域の文字の形状に応じ
て多角形の領域を切り出し、この多角形の領域を矩形の
集合に分解して、分解した矩形の座標を記憶しておき、
接触の判定において、記憶してある矩形の座標を基に文
字同士の接触を判定して、判定結果に応じて使用する辞
書を切り替えて文字認識を行って常に適切な辞書を使用
するとにより認識精度を高くするととともに、判定に要
する時間の短縮を図れるので、認識処理を従来よりも短
縮化することができる。
識装置(OCR )の概略的な構成を示すブロック図であ
る。
模式図である。
する模式図である。
の模式図である。
形に分解する例を示す図である。
域の例を示した図である。
領域の例を示した図である。
ートである。
ーチンSUB1のフローチャートである。
例を示した図である。
Claims (5)
- 【請求項1】 媒体上に書かれた文字および/または図
形をサンプリングし、採り込んだ情報を画像データとし
て格納する画像記憶手段と、 該画像記憶手段から読み出した画像データのうち、文字
を含む枠領域を切り出すとともに、該枠領域の各頂点の
座標を検出する座標検出手段と、 該検出した座標を格納する座標記憶手段と、 該座標記憶手段から読み出した座標に基づいて前記枠領
域の接触を判定する接触判定手段と、 使用する辞書を切り替えて選択した辞書から情報を出力
する辞書切替え手段と、 前記辞書からの情報と前記画像記憶手段とを対応させ、
前記画像データの認識処理を行う認識手段と、 前記座標記憶手段からの座標および前記接触判定手段の
判定結果に応じて前記辞書切替え手段および前記認識手
段を制御する制御手段と、 前記座標検出手段で読み出した画像データの前記枠領域
の文字の形状に応じて多角形の領域に切り出し、該多角
形の領域を矩形の集合に分解する矩形分解手段と、 該分解した矩形を記憶する矩形記憶手段とを含むことを
特徴とする文字認識装置。 - 【請求項2】 請求項1に記載の装置において、前記接
触判定手段は、前記矩形の組合せすべてに対して接触判
定を行い、接触が1箇所以上ある場合に接触ありと判定
することを特徴とする文字認識装置。 - 【請求項3】 媒体上に書かれた文字および/または図
形をサンプリングし、採り込んだ情報を画像データと
し、該画像データに含まれる文字を含む枠領域を切り出
すとともに、該枠領域の各頂点の座標を検出する第1の
工程と、 該検出した座標を用いて前記枠領域の接触を判定する第
2の工程と、 前記接触の判定に応じて使用する辞書を切り替える第3
の工程と、 前記辞書からの情報と前記画像データとを対比させ、前
記画像データの認識処理を行う第4の工程と、 第1の工程で読み出した画像データを用いて前記枠領域
の文字の形状に応じて多角形の領域に切り出し、該多角
形の領域を矩形の集合に分解する第5の工程と、 該分解した矩形の座標を記憶する第6の工程とを含み、 第2の工程は、第6の工程で記憶した前記矩形の座標を
基に前記文字同士の接触を判定することを特徴とする文
字認識方法。 - 【請求項4】 請求項3に記載の方法において、第2の
工程は、前記矩形の組合せすべてに対して接触判定を行
い、接触が1箇所以上ある場合に接触ありと判定するこ
とを特徴とする文字認識方法。 - 【請求項5】 請求項3または4に記載の方法におい
て、第5の工程は、前記多角形の最初に選ぶ頂点を注目
頂点として選択する第1の注目頂点選択工程と、 前記多角形の前記注目点に連続した2つの頂点を選択す
る連続選択工程と、 前記注目頂点および連続した2つの頂点のうちの最初の
点の水平成分の値が同じかを判定する第1判定の工程
と、 第1判定の結果が真のとき、3つの点が2次元座標の第
1または第3象限に対応する位置関係にあるか判定する
第2判定の工程と、 第1判定の結果が偽のとき、3つの点が2次元座標の第
2または第4象限に対応する位置関係にあるか判定する
第3判定の工程と、 第2判定または第3判定が真のとき、3点に残る1点を
第4の点として決定し、4点からなる矩形にする工程
と、 第2判定または第3判定が偽のとき、注目頂点を1つ分
移動させて新たな注目頂点を選択する第2の注目頂点選
択工程と、 得られた矩形内に前記多角形の頂点が含まれるか判定す
る第4の判定の工程と、 第4判定が真のとき、前記選択した注目頂点および連続
した2つの頂点のうちの最初の点を削除するとともに、
連続した2つの頂点のうちの第2の点の代わりに、第4
の点を新たな多角形の頂点にして矩形分離と多角形の形
成を行う工程と、 前記新たな多角形が矩形かどうか判定する第5判定の工
程とを含み、 第5判定が真のとき、前記多角形を矩形に分解する処理
が完了したと判定し、第5判定が偽のとき、前記多角形
の矩形に分解する処理を継続して第2の注目頂点選択工
程に進んで第2の注目頂点を選択し、第2の注目頂点に
対する前記連続選択工程以降の処理を行うことを特徴と
する文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000126303A JP2001307022A (ja) | 2000-04-21 | 2000-04-21 | 文字認識装置および文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000126303A JP2001307022A (ja) | 2000-04-21 | 2000-04-21 | 文字認識装置および文字認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001307022A true JP2001307022A (ja) | 2001-11-02 |
Family
ID=18636109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000126303A Pending JP2001307022A (ja) | 2000-04-21 | 2000-04-21 | 文字認識装置および文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001307022A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101725501B1 (ko) * | 2016-07-13 | 2017-04-13 | 한동대학교 산학협력단 | 문자 인식 방법 및 장치 |
JP2021163231A (ja) * | 2020-03-31 | 2021-10-11 | ローレルバンクマシン株式会社 | 紙葉類識別装置および紙葉類識別方法 |
-
2000
- 2000-04-21 JP JP2000126303A patent/JP2001307022A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101725501B1 (ko) * | 2016-07-13 | 2017-04-13 | 한동대학교 산학협력단 | 문자 인식 방법 및 장치 |
JP2021163231A (ja) * | 2020-03-31 | 2021-10-11 | ローレルバンクマシン株式会社 | 紙葉類識別装置および紙葉類識別方法 |
JP7372633B2 (ja) | 2020-03-31 | 2023-11-01 | ローレルバンクマシン株式会社 | 紙葉類識別装置および紙葉類識別方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6212299B1 (en) | Method and apparatus for recognizing a character | |
JPH04195692A (ja) | 文書読取装置 | |
JP2001307022A (ja) | 文字認識装置および文字認識方法 | |
JPH07168664A (ja) | イメージ入力装置の入力制御方法 | |
JP2020119291A (ja) | 情報処理装置及びプログラム | |
JP2000322514A (ja) | パターン抽出装置及び文字切り出し装置 | |
JP3133797B2 (ja) | 文字認識方法及びその装置 | |
JPH0728935A (ja) | 文書画像処理装置 | |
KR100332752B1 (ko) | 문자인식방법 | |
JP2956094B2 (ja) | 手書き文字認識装置 | |
JPH0388086A (ja) | 文書読取装置 | |
JPH09288714A (ja) | 表認識方法および装置 | |
JP2002366900A (ja) | 光学式文字読取装置 | |
JPH0830725A (ja) | 画像処理装置及び方法 | |
JPH03126188A (ja) | 文字認識装置 | |
JPH0644406A (ja) | 画像処理方法及び装置 | |
JP4580520B2 (ja) | 文字認識方法および文字認識装置 | |
JPH09114925A (ja) | 光学式文字読取装置 | |
JPS62281082A (ja) | 文字認識装置 | |
JP2925270B2 (ja) | 文字読取装置 | |
JPS6383888A (ja) | 文字認識装置 | |
JPH10134145A (ja) | 文字切り出し方法およびそれを用いた文字認識装置と、その文字切り出し方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体 | |
JPH0512489A (ja) | 表認識装置 | |
JPH05114047A (ja) | 文字切り出し装置 | |
JPH0443476A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080901 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081028 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081224 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090114 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20090227 |