JP2002074269A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP2002074269A
JP2002074269A JP2000257415A JP2000257415A JP2002074269A JP 2002074269 A JP2002074269 A JP 2002074269A JP 2000257415 A JP2000257415 A JP 2000257415A JP 2000257415 A JP2000257415 A JP 2000257415A JP 2002074269 A JP2002074269 A JP 2002074269A
Authority
JP
Japan
Prior art keywords
character
ruled line
image
contact information
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000257415A
Other languages
English (en)
Other versions
JP4580520B2 (ja
Inventor
Jutaro Ishioka
寿太郎 石岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Digital Laboratory Co Ltd
Original Assignee
Japan Digital Laboratory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Digital Laboratory Co Ltd filed Critical Japan Digital Laboratory Co Ltd
Priority to JP2000257415A priority Critical patent/JP4580520B2/ja
Publication of JP2002074269A publication Critical patent/JP2002074269A/ja
Application granted granted Critical
Publication of JP4580520B2 publication Critical patent/JP4580520B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字が罫線等に接触している場合にも自動的
な学習処理を行うことのできる文字認識方法の提供。 【解決手段】 罫線除去部211で罫線等のイメージを
除去した文字イメージと罫線接触情報を取得する。文字
切り出し部212で罫線等が除去されたイメージから1
文字ずつ切り出した文字イメージCi1を罫線接触情報
格納部213に格納する。次に、文字イメージCi1が
罫線等に接触している場合は補完予測処理部221でオ
ペレータによって入力された文字コードと罫線接触情報
格納部213に格納された罫線接触情報を基に補完方法
を決定し、イメージ補完部222で補完予測処理部22
1によって決定された補完方法による補完処理を行い、
辞書登録判定部223で補完文字イメージの認識辞書へ
の登録の可否を判定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識方法に関
し、特に、非ドロップアウトカラーで印刷された罫線又
は枠線(以下、罫線等)を持つ帳票に記入された文字が
罫線等に接触している場合の文字認識技術に関する。
【0002】
【従来の技術】光学的文字読取装置(OCR)では帳票
や原稿上の文字を読み取って電気信号に変換し文字イメ
ージを出力するが、帳票には、通常、文字枠線が印刷さ
れており文字は文字枠線内に収まるように印刷或いは記
入されるので、読み取りの障害にならないように文字枠
線は記入者に認識できるが装置には検出できないドロッ
プアウトカラーで印刷されている場合が多い。
【0003】しかし、ドロップアウトカラーは特殊な色
のため帳票の印刷コストが高くなりがちな点や、ドロッ
プアウトカラーは通常OCRに対し1色に決まっている
ので帳票の種類によって色分けをすることができない
点、及びドロップアウトカラーは非常に色が淡いので見
づらい点、等の不都合がある。
【0004】上述したような不具合を解消するため、文
字枠線を非ドロップアウトカラーで印刷した帳票を光学
的に読み取って文字を認識する場合に、その前段処理と
して文字枠線を検出して消去する枠線消去(除去)処理
を行うように構成した文字認識装置がある。
【0005】
【発明が解決しようとする課題】しかしながら、単に、
罫線や枠線を除去するだけでは罫線又は枠線と接触して
いた文字の一部が除去されてしまうので文字認識装置の
認識性能を低下させる要因となっていた。従って、この
ような罫線又は枠線と接触したイメージに対し文字認識
時に辞書学習を行うと、信頼性の低い(つまり、上述し
たように認識性能の低い)イメージに対して辞書学習を
行うことになるために結果として信頼性の低い学習辞書
が作成され信頼性のある文字認識を行うことができない
ことから、自動的な学習処理を行うことができないとい
った問題点があった。
【0006】本発明は上記課題を解決するためになされ
たものであり、文字が罫線等に接触している場合にも自
動的な学習処理を行うことのできる文字認識方法の提供
を目的とする。
【0007】
【課題を解決するための手段】上記課題を解決するため
に、第1の発明の文字認識方法は、非ドロップアウトカ
ラーで印刷された罫線等を有する原稿の読み込みイメー
ジから1文字ずつ文字イメージを切り出して文字認識を
行う文字認識方法であって、読取った原稿の読み込みイ
メージから罫線等を検出し、検出された罫線等を該読み
込みイメージから取り除くと共に、除去した罫線等に接
触していた読み込みイメージに関する接触情報からなる
第1の罫線接触情報を取得する工程と、罫線等を取り除
いた読み込みイメージを一文字ずつ切り出すと共に、第
1の罫線取得情報を基にして、切り出された各文字イメ
ージと罫線等との接触情報からなる第2の罫線接触情報
を取得する工程と、工程で切り出された文字イメージの
うち罫線等と接触していた文字イメージについて、入力
された文字コードと第2の罫線接触情報のうちの該文字
イメージの罫線接触情報とを基に補完方法を決定する工
程と、上記工程により決定された補完方法によって上記
罫線等と接触していた文字イメージを補完する工程と、
上記工程により補完された文字イメージの特徴量を認識
辞書に登録するか否かの評価を行う工程と、を備えたこ
とを特徴とする。
【0008】また、第2の発明は上記第1の発明の文字
認識方法において、認識辞書に登録する補完された文字
イメージの特徴量には罫線接触情報が含まれていること
を特徴とする。
【0009】また、第3の発明は上記第1又は2の発明
の文字認識方法において、補完方法を決定する工程は切
り出された文字イメージのうち罫線等と接触していた文
字イメージについて、入力された文字コードと第2の罫
線接触情報のうちの該文字イメージの罫線接触情報とを
基に補完方法を1つに決定できない場合には複数の補完
方法を決定する工程を含み、文字イメージを補完する工
程は、この際、上記工程により決定された補完方法によ
って上記罫線等と接触していた文字イメージを補完して
複数の補完イメージを生成する工程を含むことを特徴と
する。
【0010】また、第4の発明の文字認識方法は、非ド
ロップアウトカラーで印刷された罫線等を有する原稿の
読み込みイメージから1文字ずつ文字イメージを切り出
して文字認識を行う文字認識方法であって、読取った原
稿の読み込みイメージから罫線等を検出し、検出された
罫線等を該読み込みイメージから取り除くと共に、除去
した罫線等に接触していた読み込みイメージに関する接
触情報からなる第1の罫線接触情報を取得する工程と、
罫線等を取り除いた読み込みイメージを一文字ずつ切り
出すと共に、第1の罫線取得情報を基にして、切り出さ
れた各文字イメージと罫線等との接触情報からなる第2
の罫線接触情報を取得する工程と、上記工程で切り出さ
れた文字イメージのうち罫線等と接触していた文字イメ
ージについて第2の罫線接触情報のうちの該文字イメー
ジの罫線接触情報とを基に該文字イメージを補完する工
程と、上記工程で補完された文字イメージの特徴量及び
第2の罫線接触情報のうちの該文字イメージの罫線接触
情報と認識辞書に登録されている特徴量及び該特徴量に
付加されている罫線接触情報を基に候補文字を出力する
工程と、上記工程で出力された候補文字を認識文字とし
て出力するか否かの評価を行う工程と、を備えたことを
特徴とする。
【0011】また、第5の発明の文字認識方法は、請求
項1乃至3の1ずれか1項の文字認識方法において、候
補文字を認識文字として出力するか否かの評価を行う工
程での評価により棄却判定がなされたとき、更に、工程
で切り出された文字イメージのうち罫線等と接触してい
た文字イメージについて入力された文字コードと前記工
程で切り出された文字イメージのうち罫線等と接触して
いた文字イメージについて入力された文字コードと第2
の罫線接触情報のうちの該文字イメージの罫線接触情報
とを基に補完方法を決定する工程と、上記工程により決
定された補完方法によって上記罫線等と接触していた文
字イメージを補完する工程と、上記工程により補完され
た文字イメージを認識辞書に登録するか否かの評価を行
う工程と、を備えたことを特徴とする。
【0012】また、第6の発明は上記第4又は第5の発
明の文字認識方法において、認識辞書は請求項1又は2
記載の文字認識方法によって補完された文字イメージの
特徴量を含むことを特徴とする。
【0013】
【発明の実施の形態】[文字認識装置の構成例]図1は本
発明の文字認識方法を適用可能な文字認識装置の一実施
例の構成を示すブロック図である。また、図2は認識処
理部の一実施例の構成を示すブロック図、図3は文字認
識部及び認識文字学習部の機能構成の一実施例を示すブ
ロック図である。
【0014】図1で、文字認識装置10は、原稿読取り
部1、認識処理部2、ハードディスク(HD)3、モニ
タ装置4及びキーボード5を備えている。原稿読取り部
1はOCR(光学的文字読取り装置)やスキャナー等の
イメージリーダからなり、原稿を読み取ってイメージデ
ータに変換し、認識処理部2に渡す。また、認識処理部
2は、図2に示すように文字認識部21、認識文字学習
部22及び制御部23と認識辞書31を備え、文字認識
部21は原稿読取り部1から受け取ったイメージデータ
から1文字分ずつ文字イメージを切り出して文字認識処
理を行い、認識結果(文字コード或いは棄却コード)を
出力すると共にモニタ装置4に表示する。
【0015】また、認識文字学習部22は罫線等と接触
している文字イメージが文字認識部21で認識されなか
った場合(つまり、棄却された場合)又は認識エラーの
場合に、オペレータによってキーボード5から文字コー
ド入力がされた場合には、それら棄却イメージ或いは誤
認識された文字について文字コード入力(キー入力によ
る修正及び自動修正)及び学習を行い、認識辞書31を
更新する。
【0016】なお、ハードディスク3には認識辞書31
及び認識結果を格納する領域が確保されている。なお、
認識辞書31はROM又は物理的に別のハードディスク
としてもよい。また、ハードディスク3には認識処理プ
ログラムのほか文字認識装置10の実行制御に必要な各
種プログラムを格納することもできる。
【0017】図3で、文字認識部21は罫線除去部21
1、文字切り出し部212、罫線接触情報格納部21
3、イメージ補完処理部214、特徴抽出部215、識
別部216及び棄却判定部217を有している。また、
認識文字学習部22は補完予測処理部221、イメージ
補完部222及び辞書登録判定部223を有している。
【0018】文字認識部21は後述するように特徴抽出
部215で抽出した文字イメージの特徴を基に識別部2
16で認識辞書31を用いて文字認識を行い、認識候補
文字を出力するが、認識できない文字のうち、罫線等と
接触していた文字については罫線接触情報格納部213
に格納されている罫線情報とキー入力される文字(修正
文字)を基に認識文字学習部22で補完予測等を行って
文字イメージを補完し認識辞書に登録する。これによ
り、罫線等と接触していて罫線除去により文字の一部を
欠き、従来方式では認識できなかった罫線接触文字につ
いても認識が可能となる。
【0019】[動作例]図4は上記図3に示した文字認識
部21及び認識文字学習部22の動作例を示すフローチ
ャートである。また、図5は入力した原稿文字イメージ
の一実施例を示す図、図6は罫線除去後の原稿文字イメ
ージの一実施例を示す図、図7及び図8は切り出された
文字イメージの一実施例を示す図である。
【0020】ステップS1:(罫線除去及び罫線接触情
報の取得) 罫線除去部211は、スキャナ等から読み込んだ読み込
みイメージ50(図5)から罫線等51を検出し、罫線
等のイメージを読み込みイメージから除去して図6に示
すようなイメージ60を取得し、除去した罫線等に接触
していたイメージ50に関する罫線接触情報(例えば、
文字の接触方向、接触個所数、接触部分の位置(座
標)、罫線等の太さ)If1を取得する。
【0021】ステップS2:(文字イメージの切り出し
及び各罫線接触情報の取得) 文字切り出し部212は、罫線除去部211によって罫
線等が除去されたイメージ50から1文字ずつ文字イメ
ージを切り出して、図7に示すような切り出し文字イメ
ージCi1(i=1〜n;nは文字数)を取得し、イメ
ージ50の罫線接触情報から文字イメージCi1の各イ
メージ単位の罫線接触情報If2を取得する。
【0022】ステップS3:(文字イメージ毎の罫線接
触情報の一時格納) 罫線接触情報格納部213はRAM等の一時格納メモリ
からなり、文字切り出し部212で得た罫線接触情報I
f2を格納する。ここで、罫線接触情報If2について
図7の切り出し文字イメージC11と図8(a)の切り
出し文字イメージC31を例として説明する。図7に示
した切り出し文字イメージC11では、接触方法=左、
接触数=3、接触位置=α(X1、Y1)、β(X2、
Y2)、γ(X3、Y3)、罫線の太さ=Wが格納され
る。また、図8(a)に示した切り出し文字イメージC
31では、接触方法=下、接触数=1、接触位置=
(X、Y)、罫線の太さ=W、記入線の太さ=w、罫線
への進行方向=左下方向、が格納される。
【0023】ステップS4:(イメージ補完処理) 次に、イメージ補完処理部214は上記ステップS3で
罫線接触情報格納部213に格納されている罫線接触情
報を基に切り出し文字イメージCi1のイメージ補完処
理を行う。なお、切り出し文字イメージCi1が罫線に
接触していなかった場合にはイメージ補完処理を行うこ
となくS5に遷移する。ここで、イメージ補完処理の方
法としては本発明の発明者によって発明され本願特許出
願人によって平成11年11月22日に出願された特願
平11−331163号に記載された方法やその他よく
知られたイメージ補完方法を用いることができる。
【0024】ステップS5:(特徴抽出及び特徴量の取
得) 特徴抽出部215は、上記ステップS4でイメージ補完
処理された切り出し文字イメージCi1に対し特徴抽出
を行い、未知入力文字の特徴量を取得する。
【0025】ステップS6:(認識候補文字の出力) 識別部216は、上記ステップS5で得られた特徴量と
認識辞書31に格納されている特徴量を比較し認識候補
文字を出力するが、罫線接触情報格納部213に格納さ
れている罫線接触情報から未知入力文字が罫線等に接触
していたという情報がある場合にはその情報を基に認識
候補文字を出力する。
【0026】例えば、図7の切り出し文字イメージC1
1に対し上記ステップS4でイメージ補完処理部214
でイメージ補完処理され、上記ステップS5の特徴抽出
部215による特徴抽出で抽出した特徴に基づいて識別
部216で認識辞書31の特徴量と比較した結果、認識
候補文字として「3」及び「8」の2つが得られた場合
を例とすると、切り出し文字イメージC11で特定され
る未知入力文字は、罫線接触情報格納部213に格納さ
れている罫線接触情報(ステップS2参照)から左側罫
線に3個所接続しているので、接触のしかたから判断し
て認識候補「3」でない可能性が高いことから識別部2
16は認識候補文字として「8」を出力する。別の例と
しては、認識辞書31に格納されている特徴量と罫線接
触情報(ステップS2参照)のうちの罫線接触方向に関
する情報(例えば、罫線への進行方向)からその方向の
特徴量の曖昧さを考慮し、罫線接触とは関係ない特徴を
優先的に採用する(例えば、図8(a)の切り出し文字
イメージC31で特定される未知入力文字の場合)。
【0027】ステップS7:(棄却判定) 次に、棄却判定部217は上記ステップS6で候補文字
として出力された文字の確からしさ(信頼度)を認識辞
書31に登録してある罫線接触情報及び罫線接触情報格
納部213に格納されている切り出し文字イメージCi
1の罫線接触情報等を基に判定し、信頼度が所定値より
高い場合はその文字コードを出力しS9に遷移する。ま
た、信頼度が所定値より低い場合は棄却コード(リジェ
クトコード)を出力し、S8に遷移する。
【0028】例えば、上記ステップS6で例とした切り
出し文字イメージC11の場合は、認識候補文字「8」
について上記判定の結果、信頼度が所定値より高いとし
て認識文字「8」を出力する。また、文字イメージC3
1に対して上記ステップS6で認識候補文字として
「2」及び「7」の2つが得られ、識別部216は認識
候補文字として「7」を出力した場合、上記判定の結
果、信頼度が所定値より低いとして棄却コードが出力さ
れる。
【0029】ステップS8:(棄却文字の罫線接触判
定) 上記ステップS7で棄却文字コードが出力された未知入
力文字が罫線等に接触していた文字か否か、つまり、切
り出し文字イメージCi1が罫線等が除去された文字イ
メージであったかどうかを罫線接触情報格納部213に
格納されている罫線接触情報から判定し、罫線等に接触
していた場合にはS9に遷移し、そうでない場合にはS
12に遷移する。
【0030】ステップS9:(補完方法の決定) 補完予測処理部221は、上記ステップS8で棄却文字
コードが出力された未知入力文字が罫線等に接触してい
た文字の場合に、オペレータによる文字コード入力(修
正文字入力)を待ち、オペレータによって入力された切
り出し文字イメージCi1に対する文字コードと罫線接
触情報格納部213に格納された罫線接触情報を基に補
完方法を決定する。例えば、上記ステップS7の例で、
文字イメージC31に対する認識文字候補「7」につい
て棄却コードが出されたが、文字イメージC31は罫線
に接触しているので文字イメージC31に対する文字コ
ード入力を入力指示メッセージを表示してオペレータに
促し、オペレータが文字イメージC31に対する文字コ
ードとして「2」を入力すると、補完予測処理部221
は入力された文字コード「2」と罫線接触情報格納部2
13に格納された罫線接触情報から、「2」の下の横棒
が罫線除去部211によって除去されたものと判定し、
文字イメージC31の下の横棒を補完する補完処理を決
定する。
【0031】ステップS10:(イメージ補完) イメージ補完部222は、補完予測処理部によって決定
された補完処理を行う。図8(a)の文字イメージC3
1について上記ステップS9の例で補完決定された補完
処理を行うと図8(b)に示すような文字イメージを得
ることができる。
【0032】ステップS11:(辞書登録の可否判定) 辞書登録判定部223は、上記ステップS10で得た補
完イメージについて認識辞書への登録の可否を判定し、
判定結果が「登録可」の場合にはその文字イメージ及び
罫線接触情報を認識辞書31に登録し、ステップS4に
遷移する。また、判定結果が「登録否」の場合にはS1
2に遷移する。辞書登録判定は上記ステップS10で得
た補完イメージを上記ステップS9でオペレータが入力
した文字コードの認識辞書として登録した場合に、入力
した文字コードの認識率に悪影響(例えば、認識率の低
下)を及ぼさないか否かを調べ、悪影響があるとされた
場合には「登録否」とする。ここで、辞書登録判定の方
法には本願特許出願人によって平成9年12月22日に
出願された特開平11−184976号公報に開示され
た方法を用いることができる。
【0033】ステップS12:(終了判定) 制御部23は全ての切り出し文字イメージCi1につい
て文字認識部21又は認識文字学習部22による処理が
終るまでS4に戻って次の切り出し文字イメージの認識
処理(または学習処理)を行う。
【0034】なお、上記図4のフローチャートのステッ
プS9で、補完予測処理部221が1文字に対し1種類
の補完文字イメージを出力するように構成した例を示し
たが、これに限定されない。例えば、図9に示すような
原稿イメージ『40』を読み込んだ場合、ステップS1
に示したように罫線除去部211で罫線除去を行い、ス
テップS2で文字切り出し部212で『4』を切り出す
と、図10に示すような切り出しイメージC12を得る
ことができる。ここで、ステップS9に遷移して、補完
予測処理部221でオペレータによって入力された文字
コードと罫線接触情報格納部213に格納された罫線接
触情報を基に補完方法を決定するが、図10の例に示す
ように補完方法を1種類に決定できない場合がある。
【0035】つまり、図10に示した切り出し文字イメ
ージC12の左側縦線の長さが罫線除去処理によって全
部除去されてしまっているので、予測不可能な状態にあ
る。このような場合には補完予測処理部221は補完方
法をいくつか決定しその全てについてイメージ補完部2
22でイメージ補完処理を行い、イメージ補完された各
イメージごとに辞書登録判定部223で辞書登録判定を
行なう。
【0036】図10の切り出し文字イメージC12の例
では、イメージ補完部222は、文字イメージの左側の
縦棒を補完するが、この場合、補完する棒の長さを文字
イメージC12のイメージに対しての矩形範囲最大、文
字イメージC12のイメージに対しての矩形範囲最大の
3分の2、文字イメージC12のイメージに対しての矩
形範囲最大の2分の3という3種類の補完処理を行う。
図11はこれにより補完された文字イメージを示す図で
あり、図11(a)は矩形範囲最大とした場合の補完文
字イメージ、図11(b)は矩形範囲最大の3分の2と
した場合の補完文字イメージ、図11(c)は矩形範囲
最大の2分の3とした場合の補完文字イメージである。
辞書登録判定部223は上記3種類の補完イメージの辞
書登録判定を行い、登録判定されたイメージを認識辞書
31に登録する。
【0037】このように補完方法を1種類に決定できな
い場合には補完方法をいくつか決定しその全てについて
イメージ補完処理を行い、イメージ補完された各イメー
ジごとに辞書登録判定を行なうように構成することによ
り、原稿記入者が罫線に接触しないが同じような文字を
記入しても認識辞書に登録されたいずれかの特徴に近い
文字イメージになり、認識辞書での認識が可能となる。
以上、本発明の一実施例について説明したが本発明は上
記実施例に限定されるものではなく、種々の変形実施が
可能であることはいうまでもない。
【0038】
【発明の効果】上記説明したように、第1乃至第3の発
明の文字認識方法によれば、切り出された文字イメージ
のうち罫線等と接触している文字コードについて、入力
された文字コードと切り出した文字の罫線接触情報を基
に補完方法を決定し、切り出した文字イメージを補完
し、辞書に登録することができるので、罫線等と接触し
ていて罫線除去により文字の一部を欠き、従来方式では
認識できなかった罫線接触文字についても認識辞書によ
るが可能となる。
【0039】また、第3の発明の文字認識方法によれ
ば、補完方法を1種類に決定できない場合には補完方法
をいくつか決定しその全てについてイメージ補完処理を
行い、イメージ補完された各イメージごとに辞書登録判
定を行なうことができるので、原稿記入者が罫線に接触
しないが同じような文字を記入しても認識辞書に登録さ
れたいずれかの特徴に近い文字イメージになり、認識辞
書での認識が可能となる。
【0040】第4乃至第6の発明の文字認識方法によれ
ば、罫線等と接触していて罫線除去により文字の一部を
欠いた文字イメージについて辞書に登録されているその
特徴量と罫線接触情報から認識処理を行うことができる
ので、従来方式では認識できなかった罫線接触文字につ
いても認識が可能となる。
【図面の簡単な説明】
【図1】本発明の文字認識方法を適用可能な文字認識装
置の一実施例の構成を示すブロック図である。
【図2】認識処理部の一実施例の構成を示すブロック図
である。
【図3】文字認識部及び認識文字学習部の機能構成の一
実施例を示すブロック図である。
【図4】文字認識部及び認識文字学習部の動作例を示す
フローチャートである。
【図5】図5は入力した原稿文字イメージの一実施例を
示す図である。
【図6】罫線除去後の原稿文字イメージの一実施例を示
す図である。
【図7】切り出された文字イメージの一実施例を示す図
である。
【図8】切り出された文字イメージの一実施例を示す図
である。
【図9】入力した原稿文字イメージの一実施例を示す図
である。
【図10】切り出された文字イメージの一実施例を示す
図である。
【図11】複数の補完イメージの一実施例を示す図であ
る。
【符号の説明】
1 原稿読取り部 2 認識処理部 3 ハードディスク(HD) 4 モニタ装置 5 キーボード 10 文字認識装置 21 文字認識部 22 認識文字学習部 23 制御部 31 認識辞書 50 読み込みイメージ 51 罫線等 211 罫線除去部 212 文字切り出し部 213 罫線接触情報格納部 214 イメージ補完処理部 215 特徴抽出部 216 識別部 217 棄却判定部 221 補完予測処理部 222 イメージ補完部 223 辞書登録判定部 C11、C31、C12 切り出し文字イメージ(切り
出された文字イメージ)

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 非ドロップアウトカラーで印刷された罫
    線等を有する原稿の読み込みイメージから1文字ずつ文
    字イメージを切り出して文字認識を行う文字認識方法で
    あって、 読取った原稿の読み込みイメージから罫線等を検出し、
    検出された罫線等を該読み込みイメージから取り除くと
    共に、除去した罫線等に接触していた読み込みイメージ
    に関する接触情報からなる第1の罫線接触情報を取得す
    る工程と、 前記罫線等を取り除いた読み込みイメージを一文字ずつ
    切り出すと共に、前記第1の罫線取得情報を基にして、
    切り出された各文字イメージと罫線等との接触情報から
    なる第2の罫線接触情報を取得する工程と、 上記工程で切り出された文字イメージのうち罫線等と接
    触していた文字イメージについて、入力された文字コー
    ドと前記第2の罫線接触情報のうちの該文字イメージの
    罫線接触情報とを基に補完方法を決定する工程と、 上記工程により決定された補完方法によって上記罫線等
    と接触していた文字イメージを補完する工程と、 上記工程により補完された文字イメージの特徴量を認識
    辞書に登録するか否かの評価を行う工程と、を備えたこ
    とを特徴とする文字認識方法。
  2. 【請求項2】 前記認識辞書に登録する補完された文字
    イメージの特徴量には罫線接触情報が含まれていること
    を特徴とする請求項1記載の文字認識方法。
  3. 【請求項3】 前記補完方法を決定する工程は切り出さ
    れた文字イメージのうち罫線等と接触していた文字イメ
    ージについて、入力された文字コードと前記第2の罫線
    接触情報のうちの該文字イメージの罫線接触情報とを基
    に補完方法を1つに決定できない場合には複数の補完方
    法を決定する工程を含み、 前記文字イメージを補完する工程は、この際、上記工程
    により決定された補完方法によって上記罫線等と接触し
    ていた文字イメージを補完して複数の補完イメージを生
    成する工程を含むことを特徴とする請求項1又は2記載
    の文字認識方法。
  4. 【請求項4】 非ドロップアウトカラーで印刷された罫
    線等を有する原稿の読み込みイメージから1文字ずつ文
    字イメージを切り出して文字認識を行う文字認識方法で
    あって、 読取った原稿の読み込みイメージから罫線等を検出し、
    検出された罫線等を該読み込みイメージから取り除くと
    共に、除去した罫線等に接触していた読み込みイメージ
    に関する接触情報からなる第1の罫線接触情報を取得す
    る工程と、 前記罫線等を取り除いた読み込みイメージを一文字ずつ
    切り出すと共に、前記第1の罫線取得情報を基にして、
    切り出された各文字イメージと罫線等との接触情報から
    なる第2の罫線接触情報を取得する工程と、 上記工程で切り出された文字イメージのうち罫線等と接
    触していた文字イメージについて前記第2の罫線接触情
    報のうちの該文字イメージの罫線接触情報とを基に該文
    字イメージを補完する工程と、 上記工程で補完された文字イメージの特徴量及び前記第
    2の罫線接触情報のうちの該文字イメージの罫線接触情
    報と認識辞書に登録されている特徴量及び該特徴量に付
    加されている罫線接触情報を基に候補文字を出力する工
    程と、 上記工程で出力された候補文字を認識文字として出力す
    るか否かの評価を行う工程と、を備えたことを特徴とす
    る文字認識方法。
  5. 【請求項5】 請求項1乃至3のいずれか1項の文字認
    識方法において、候補文字を認識文字として出力するか
    否かの評価を行う工程での評価により棄却判定がなされ
    たとき、更に、 前記工程で切り出された文字イメージのうち罫線等と接
    触していた文字イメージについて入力された文字コード
    と前記第2の罫線接触情報のうちの該文字イメージの罫
    線接触情報とを基に補完方法を決定する工程と、 上記工程により決定された補完方法によって上記罫線等
    と接触していた文字イメージを補完する工程と、 上記工程により補完された文字イメージを認識辞書に登
    録するか否かの評価を行う工程と、を備えたことを特徴
    とする文字認識方法。
  6. 【請求項6】 前記認識辞書は請求項1又は2記載の文
    字認識方法によって補完された文字イメージの特徴量を
    含むことを特徴とする請求項4又は5の文字認識方法。
JP2000257415A 2000-08-28 2000-08-28 文字認識方法および文字認識装置 Expired - Lifetime JP4580520B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000257415A JP4580520B2 (ja) 2000-08-28 2000-08-28 文字認識方法および文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000257415A JP4580520B2 (ja) 2000-08-28 2000-08-28 文字認識方法および文字認識装置

Publications (2)

Publication Number Publication Date
JP2002074269A true JP2002074269A (ja) 2002-03-15
JP4580520B2 JP4580520B2 (ja) 2010-11-17

Family

ID=18745876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000257415A Expired - Lifetime JP4580520B2 (ja) 2000-08-28 2000-08-28 文字認識方法および文字認識装置

Country Status (1)

Country Link
JP (1) JP4580520B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012185713A (ja) * 2011-03-07 2012-09-27 Mitsubishi Electric Corp 帳票文字認識装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62249294A (ja) * 1986-04-23 1987-10-30 Ricoh Co Ltd 個人辞書登録方法
JPS6366685A (ja) * 1986-09-08 1988-03-25 Matsushita Electric Ind Co Ltd 接触文字分離装置
JPH10154204A (ja) * 1996-09-27 1998-06-09 Fujitsu Ltd パターン認識装置及びパターン認識方法
JPH11232387A (ja) * 1998-02-10 1999-08-27 Glory Ltd 文字認識装置
JP2001143021A (ja) * 1999-11-10 2001-05-25 Nippon Digital Kenkyusho:Kk 文字認識方法及び文字認識装置
JP2001147988A (ja) * 1999-11-22 2001-05-29 Nippon Digital Kenkyusho:Kk 文字認識方法及び文字認識装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62249294A (ja) * 1986-04-23 1987-10-30 Ricoh Co Ltd 個人辞書登録方法
JPS6366685A (ja) * 1986-09-08 1988-03-25 Matsushita Electric Ind Co Ltd 接触文字分離装置
JPH10154204A (ja) * 1996-09-27 1998-06-09 Fujitsu Ltd パターン認識装置及びパターン認識方法
JPH11232387A (ja) * 1998-02-10 1999-08-27 Glory Ltd 文字認識装置
JP2001143021A (ja) * 1999-11-10 2001-05-25 Nippon Digital Kenkyusho:Kk 文字認識方法及び文字認識装置
JP2001147988A (ja) * 1999-11-22 2001-05-29 Nippon Digital Kenkyusho:Kk 文字認識方法及び文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012185713A (ja) * 2011-03-07 2012-09-27 Mitsubishi Electric Corp 帳票文字認識装置

Also Published As

Publication number Publication date
JP4580520B2 (ja) 2010-11-17

Similar Documents

Publication Publication Date Title
JP2000353215A (ja) 文字認識装置および文字認識プログラムを記録した記録媒体
JPH1139428A (ja) 文書映像の方向修正方法
JP2010102709A (ja) 文字列認識方法、文字列認識システム及び文字列認識プログラム用記録媒体
JP2002074269A (ja) 文字認識方法
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP3794285B2 (ja) 光学式文字読取装置
JP2877380B2 (ja) 光学的文字読取装置
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2630261B2 (ja) 文字認識装置
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JP2868392B2 (ja) 手書き記号認識装置
JP2001291058A (ja) 文字認識装置及び記録媒体
JP4270767B2 (ja) 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2925270B2 (ja) 文字読取装置
JP4304920B2 (ja) 文字列認識装置とそのプログラム
JP3045086B2 (ja) 光学式文字読取方法および装置
JP2002074262A (ja) 認識文字修正方法
JPH10124610A (ja) 光学式文字読取装置
JPS6160184A (ja) 光学的文字読取装置
JPH11175660A (ja) 文字認識方法及び装置及び文字認識プログラムを格納した記憶媒体
JPH08202830A (ja) 文字認識システム
JP2000099631A (ja) パターン認識装置及びパターン認識方法
JPS6383887A (ja) 文字認識装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040608

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040608

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100830

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130903

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4580520

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term