JP2001014428A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2001014428A
JP2001014428A JP11187042A JP18704299A JP2001014428A JP 2001014428 A JP2001014428 A JP 2001014428A JP 11187042 A JP11187042 A JP 11187042A JP 18704299 A JP18704299 A JP 18704299A JP 2001014428 A JP2001014428 A JP 2001014428A
Authority
JP
Japan
Prior art keywords
character
binary image
image
recognition result
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11187042A
Other languages
English (en)
Inventor
Masanori Terasaki
正則 寺崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP11187042A priority Critical patent/JP2001014428A/ja
Publication of JP2001014428A publication Critical patent/JP2001014428A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 カラ−読取りした画像デ−タを有効に活用
し、これを認識結果の確認・訂正の参照資源として容易
にかつ使い勝手よく用いてオペレ−タの訂正操作を向上
することができる文字認識装置を提供すること。 【解決手段】 原票をカラ−で画像読み取りする読取り
部と、前記読み取られたカラ−画像デ−タを2値画像デ
−タに変換する2値化処理部と、前記変換された2値画
像デ−タを文字認識する認識処理部と、前記認識処理部
の認識結果ならびに当該認識結果に対応する前記カラ−
画像と前記2値画像とのいずれか一方であって切替選択
されたものを表示する認識結果確認部とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、カラ−対応で原票
を読み取る文字認識装置に係り、特に、使い勝手のよい
操作により画面上で認識結果を確認・訂正することので
きる文字認識装置に関する。
【0002】
【従来の技術】単色光源によるスキャナ読取りにより原
票の有彩色文字を認識するには、光源色を認識すべき文
字がドロップアウトしない色に選び(例えば赤系の文字
であれば、光源色を青系にするなど)、2値読取りした
読取画像から認識エリアの切り出しを行い、これを認識
手段に供する方法がとられる。認識結果は、切り出され
たエリアの読取り2値画像とともに表示され、その確認
・訂正ができる。
【0003】この場合、装置で用意できる光源色が限ら
れるため、各有彩色文字に適切な読取りは実現できな
い。また、認識結果を確認するための参照できるデ−タ
は読取り2値画像以外にはないが、例え、読取りを多値
化しても光源色自体が適切でない場合においては参照と
して特に改善されたものとはならない。
【0004】また、次に、カラ−対応で原票を読取り文
字認識する装置の例として、特開平8−263593号
公報記載の発明がある。
【0005】この発明の技術においては、RGBに分光
してカラ−画像として読み込んだ原票のカラ−画像デ−
タに対し、個々の筆記具ごとに特定される色成分の有無
の判定のため、一定のRGB各成分の最適混合比率によ
り各画素についての混合値を求め、これをあるスレッシ
ョルド値で切ることにより2値画像を得る。これを読取
り用の2値画像とし、これに認識結果を合わせて筆記具
ごとに画面上で別の色に表示することにより、画面から
認識結果を確認・訂正することができる。
【0006】この手段によれば、文字の色相によらず読
取りできる。
【0007】ここで、読取り用の2値画像は、認識結果
を確認する操作者(以下、オペレータという。)にとっ
て基準として多くの場合適当なものであるが、必ずしも
最適と言える場合だけではない。これは、このような2
値化処理が多くの場合は認識過程に供するのに適切と言
えるものの原票の質等により適切とは言えない場合も考
えられるからである。
【0008】この場合には、適宜、多値で読み込んだカ
ラ−画像を参照するのが得策である場合もある。
【0009】
【発明が解決しようとする課題】本発明は、上記した状
況に鑑み、カラ−読取りした画像デ−タを有効に活用し
得るもので、これを認識結果の確認・訂正の参照資源と
して容易にかつ使い勝手よく用いてオペレ−タの訂正操
作を向上することができる文字認識装置を提供すること
を目的とする。
【0010】
【課題を解決するための手段】上記課題解決のため、本
発明は、原票をカラ−で画像読み取りする手段と、前記
読み取られたカラ−画像デ−タを2値画像デ−タに変換
する手段と、前記変換された2値画像デ−タを文字認識
する手段と、前記文字認識された結果ならびに前記結果
に対応する前記カラ−画像と前記2値画像とのいずれか
一方であって切替選択されたものを表示する認識結果確
認手段とを有することを特徴とする。
【0011】これにより、認識結果をその認識のもとと
なったカラ−画像あるいは2値画像と並べて表示しそれ
らを比較できるので、原票の状態に応じて適切な参照を
することができる。
【0012】また、さらに、前記2値画像デ−タを用い
て文字領域を抽出する文字抽出手段を有し、前記文字認
識された結果に対応する前記カラ−画像および前記2値
画像は、前記文字抽出手段の抽出結果を用いて特定され
るものであることを特徴とする。
【0013】これにより、認識結果に対応する画像の領
域特定が円滑・短時間に実行できる。 また、前記認識
結果確認手段は、認識された文字ごとの確認を受け付け
るものであり、前記文字認識された結果に対応する前記
カラ−画像および前記2値画像は、前記受け付けられた
確認の文字に対応する画像領域の部分が明示されるもの
であることを特徴とする。
【0014】これにより、オペレ−タは文字ごとに認識
結果と画像上での領域の対応がたやすくつけられ確認・
訂正を能率化できる。
【0015】また、前記認識結果確認手段は、認識され
た文字ごとの確認を受け付けるものであり、前記文字認
識された結果に対応する前記カラ−画像は、前記受け付
けられた確認の文字に対応する画像領域の部分が前記文
字認識された結果に対応する前記2値画像の当該部分に
置き換えられたものであることを特徴とする。
【0016】これにより、注目する領域の2値画像がカ
ラ−画像中に示され、オペレ−タは文字ごとに認識結果
と画像上での領域の対応がたやすくつけられ確認・訂正
を能率化できる。
【0017】
【発明の実施の形態】以下、本発明の実施形態を図面を
参照しながら説明する。
【0018】図1は、本発明の一実施形態である文字認
識装置を示す構成図である。同図に示すように、この文
字認識装置は、カラ−スキャナ部1、カラ−画像貯蔵部
2、2値化処理部3、2値画像貯蔵部4、文字抽出処理
部5、文字抽出画像貯蔵部6、文字認識処理部7、認識
結果貯蔵部8、訂正処理部9、訂正結果貯蔵部10とを
有する。
【0019】カラ−スキャナ部1は、文字認識すべき原
票を読取りカラ−画像信号を得るものである。カラ−画
像貯蔵部2は、得られたカラ−画像信号を貯蔵するもの
である。
【0020】2値化処理部3は、上記のカラ−画像信号
を用いて明度や種々の色相を基準とする複数の2値化画
像信号を得るものである。2値画像貯蔵部4は、得られ
た2値化画像信号を貯蔵するものである。
【0021】文字抽出処理部5は、上記の2値化画像信
号を用いてその中の文字部を抽出するものである。文字
抽出画像貯蔵部6は、抽出された文字部の位置情報を有
する文字抽出画像を貯蔵するものである。
【0022】文字認識処理部7は、上記の文字抽出画像
を用いて文字認識するものである。認識結果貯蔵部8
は、文字認識された結果を貯蔵するものである。
【0023】訂正処理部9は、上記の文字認識された結
果を表示しオペレータはこれに訂正を加えることができ
るものである。訂正結果貯蔵部10は、訂正された文字
認識結果を貯蔵するものである。
【0024】この実施形態の動作を説明する。
【0025】文字認識すべき原票に対しカラ−スキャナ
1が読取り走査する。読み取られ得られたカラ−画像信
号は、カラ−画像貯蔵部2、2値化処理部3に供給され
る。2値化処理部3は、読取り2値画像を生成する。こ
の2値画像は通常の筆記具の黒文字を認識するのに適切
な分光的成分値の重みにより2値化されたもの以外に、
種々の有彩色の文字を読み取るため特定の色相の有無を
基準として2値化された画像が含まれる。
【0026】ここで、カラ−スキャナ1の読取りは、通
常、RGBに分光して行われるが、この3次元に読み取
られた結果は、適宜、別の表色系(例えば、HSV)に
変換し上記の特定の色相または色の有無の判断に都合よ
い形式に変換することもできる。
【0027】これらの2値画像は、2値画像貯蔵部4、
文字抽出処理部5に供給される。文字抽出処理部5は、
認識すべき文字等が存する領域を抽出し、例えば座標情
報として2値画像情報に付加する。
【0028】文字部が抽出された2値画像は、文字抽出
画像貯蔵部6、文字認識処理部7に供給される。文字認
識処理部7は、文字等部分の認識を行い、例えばテキス
ト情報の形式に変換する。
【0029】文字等部分の認識された画像は、認識結果
貯蔵部8、訂正処理部9に供給される。訂正処理部9
は、その機能としてまず認識結果を画面表示する。表示
は、オペレ−タの操作により、文字等の単位、行単位、
帳票(原票)単位など必要に応じて領域を選択できる。
すなわち、この表示は認識結果貯蔵部8に存する情報の
生の表示である。
【0030】また、訂正処理部9は、この表示デ−タに
対し1対1で対応する文字抽出画像貯蔵部6の画像デ−
タが有する例えばその座標情報を用いて、対応する2値
画像貯蔵部4あるいはカラ−画像貯蔵部2の画像デ−タ
を呼び出し表示することができる。すなわち、これらの
表示は、認識のもととなった画像デ−タの表示である。
オペレ−タは、認識結果とこれらの認識のもととなっ
た画像デ−タとを表示上で比較することにより、文字認
識の確認・訂正ができる。2値画像貯蔵部4の対応する
画像デ−タについては、必要に応じて別の色相を基準と
して2値化された画像デ−タの表示と切替えることもで
きる。これは、文字認識の結果によっては原票のその部
分に存在する別の記述情報を確認したい場合もあり得る
からである。 認識されオペレ−タにより訂正入力され
た認識結果は訂正結果貯蔵部10に送られ貯蔵される。
【0031】このように、この実施形態の文字認識装置
においては、認識結果と、その認識のもととなった画像
デ−タである2値画像デ−タまたは読み取りイメージで
あるカラ−画像デ−タあるいは他の基準による2値画像
デ−タと選択的に比較して表示することを可能とし、そ
の場合に、文字抽出画像が有する例えばその座標情報を
用いて対応する部分の2値画像デ−タ等を呼び出し、オ
ペレ−タは、比較表示を活用して認識結果を容易にかつ
使い勝手よく訂正することができる。
【0032】ここで、認識すべき原票のカラ−画像デー
タと、これに対応する認識のもととなる2値画像データ
と赤系の色相の有無に基づく2値画像データの表示の例
を図2に示す。
【0033】同図Aは、原票のカラ−画像データの表示
であり、同図Bは、これに対応する認識のもととなる2
値画像データの表示、同図Cは、同じく対応する赤系の
色相の有無に基づく2値画像データの表示である。
【0034】この例に示されるような画像をオペレータ
が比較・活用することにより、認識結果に誤読やリジェ
クト(棄却)などが生じた場合にも、いかなる原因によ
りそのような結果を生じたかを比較的容易に解析するこ
とができる。また、これにより正しく修正することも容
易になる。
【0035】次に、訂正処理部9の表示画面とその訂正
のための表示操作の具体例について図3を参照して説明
する。同図は、行単位で訂正する場合を選択したときの
ある原票の認識結果表示21(以下、認識結果表示とい
う。)、入力したカラ−画像の表示22(以下、カラ−
画像表示という。)、読取られた2値画像の表示23
(以下、2値画像表示という。)、他の基準で2値化し
た2値画像の表示24(以下、色相2値画像表示とい
う。)を示す図である。
【0036】この場合、認識結果表示21は行単位すな
わち複数の文字等を示す領域で表示される。この例では
4つの文字等を示す領域である。これらの文字等の領域
それぞれにカ−ソル21Aでカ−ソル指定ができる。こ
のカ−ソル指定では、一文字ごとの指定になるが、連続
する文字領域の指定としてもよい。
【0037】認識結果表示21と組になり表示されるの
は、通常、カラ−画像表示22である。すなわち、文字
認識する上で最初のもととなった画像デ−タである。こ
こで、上記の認識結果表示21でカ−ソル指定された文
字等の領域に相当する部分は、同図に示すように枠22
Aが重畳されて示される。
【0038】これにより、入力カラ−画像と認識結果と
を文字等を示す領域単位で比較できるので訂正操作も容
易になる。
【0039】また、カラ−画像表示22については、訂
正処理部に設けられる特殊キ−を押下することにより2
値画像表示23に切替えることができる。これにより、
多値のカラ−画像表示22では、原票の条件により背景
との濃度差がなかったり鮮鋭さに欠ける記入文字のとき
には比較基準として適切でないものとなる場合があって
も、より比較基準として適切な画像デ−タと容易に切替
えることができる。また、上記の枠22Aと同様に枠2
3Aが表示される。
【0040】さらに、訂正処理部に設けられる別の特殊
キ−を押下することにより、2値画像表示23は、色相
2値画像表示24にも切替えることができる。これによ
り、例えば、原票のその部分に存在する別の記述情報を
明確に確認したい場合にも対応できる。また、上記の枠
22A、23Aと同様に枠24Aが表示されるので文字
等を示す領域単位で比較できる。
【0041】次に、訂正処理部9の表示画面とその訂正
のための表示操作の別の具体例について図4を参照して
説明する。同図は、行単位で訂正する場合を選択したと
きのある原票の認識結果表示21と、2値画像表示が一
部に埋め込まれたカラ−画像表示31を示す図である。
【0042】この例では、認識結果表示21と組になり
表示されるのは、2値画像表示が一部に埋め込まれたカ
ラ−画像表示31である。ここで、2値画像表示が埋め
込まれる部分は、上記の認識結果表示21でカ−ソル2
1Aでカ−ソル指定された文字等の領域に相当する部分
である。このカーソル指定は、上記の例で述べたように
領域の指定としてもよい。
【0043】これにより、オペレ−タが注目している部
分であるカ−ソル指定した領域が、逐次、2値画像表示
されるので、確認・訂正作業を能率的に進めることが可
能になる。
【0044】
【発明の効果】以上詳述したように、本発明のよれば、
認識処理部の認識結果ならびに当該認識結果に対応する
カラ−画像と2値画像とのいずれか一方であって切替選
択されたものを表示する認識結果確認手段を有するの
で、認識結果をその認識のもととなったカラ−画像、2
値画像と並べて表示してそれらを比較でき、原票の状態
に応じて適切な参照をすることができる。オペレ−タ
は、比較表示を活用して認識結果を容易にかつ使い勝手
よく訂正することができる。
【0045】また、特に請求項2記載の本発明によれ
ば、2値画像デ−タを用いて文字領域を抽出する文字抽
出処理部を有し、認識結果に対応するカラ−画像および
2値画像は、前記文字抽出処理部の抽出結果、例えば座
標情報を用いて特定されるので、認識結果に対応する画
像の領域特定が円滑・短時間に実行でき、オペレ−タ
は、比較表示を活用して認識結果を容易にかつ使い勝手
よく訂正することができる。 また、特に請求項3記載
の本発明によれば、認識結果に対応するカラ−画像およ
び2値画像は、受け付けられた確認の文字に対応する画
像領域の部分が明示されたものであるので、オペレ−タ
は文字ごとに認識結果と画像上での領域の対応がたやす
くつけられ確認・訂正を能率化できる。
【0046】また、特に請求項4記載の本発明によれ
ば、認識結果に対応するカラ−画像は、受け付けられた
確認の文字に対応する画像領域の部分が当該認識結果に
対応する2値画像の当該部分に置き換えられたものであ
るので、注目する領域の2値画像がカラ−画像中に示さ
れ、オペレ−タは文字ごとに認識結果と画像上での領域
の対応がたやすくつけられ確認・訂正を能率化できる。
【図面の簡単な説明】
【図1】本発明の一実施形態である文字認識装置を示す
構成図。
【図2】カラ−画像、2値画像、色相2値画像の一例を
示す図。
【図3】認識結果表示、カラ−画像表示、2値画像表
示、色相2値画像表示の一例を示す図。
【図4】認識結果表示、2値画像表示が一部に埋め込ま
れたカラ−画像表示の一例を示す図。
【符号の説明】
1 カラ−スキャナ部 2 カラ−画像貯蔵部 3 2値化処理部 4 2値画像貯蔵部 5 文字抽出処理部 6 文字抽出画像貯蔵部 7 文字認識処理部 8 認識結果貯蔵部 9 訂正処理部 10 訂正結果貯蔵部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 原票をカラ−で画像読み取りする手段
    と、 前記読み取られたカラ−画像デ−タを2値画像デ−タに
    変換する手段と、 前記変換された2値画像デ−タを文字認識する手段と、 前記文字認識された結果ならびに前記結果に対応する前
    記カラ−画像と前記2値画像とのいずれか一方であって
    切替選択されたものを表示する認識結果確認手段とを有
    することを特徴とする文字認識装置。
  2. 【請求項2】 請求項1記載の文字認識装置において、
    さらに、 前記2値画像デ−タを用いて文字領域を抽出する文字抽
    出手段を有し、 前記文字認識された結果に対応する前記カラ−画像およ
    び前記2値画像は、前記文字抽出手段の抽出結果を用い
    て特定されるものであることを特徴とする請求項1記載
    の文字認識装置。
  3. 【請求項3】 前記認識結果確認手段は、認識された文
    字ごとの確認を受け付けるものであり、 前記文字認識された結果に対応する前記カラ−画像およ
    び前記2値画像は、前記受け付けられた確認の文字に対
    応する画像領域の部分が明示されるものであることを特
    徴とする請求項1又は2記載の文字認識装置。
  4. 【請求項4】 前記認識結果確認手段は、認識された文
    字ごとの確認を受け付けるものであり、 前記文字認識された結果に対応する前記カラ−画像は、
    前記受け付けられた確認の文字に対応する画像領域の部
    分が前記文字認識された結果に対応する前記2値画像の
    当該部分に置き換えられたものであることを特徴とする
    請求項1又は2記載の文字認識装置。
JP11187042A 1999-06-30 1999-06-30 文字認識装置 Pending JP2001014428A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11187042A JP2001014428A (ja) 1999-06-30 1999-06-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11187042A JP2001014428A (ja) 1999-06-30 1999-06-30 文字認識装置

Publications (1)

Publication Number Publication Date
JP2001014428A true JP2001014428A (ja) 2001-01-19

Family

ID=16199167

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11187042A Pending JP2001014428A (ja) 1999-06-30 1999-06-30 文字認識装置

Country Status (1)

Country Link
JP (1) JP2001014428A (ja)

Similar Documents

Publication Publication Date Title
JP2720924B2 (ja) 画像信号の符号化装置
EP0564201B1 (en) Image processing apparatus and method
US20020006220A1 (en) Method and apparatus for recognizing document image by use of color information
JPH08289094A (ja) 文書イメージスキャン方法及びその装置
US20110085735A1 (en) Edge detection for mixed raster content (mrc) images for improved compression and image quality
WO2014045788A1 (ja) 画像処理装置、画像形成装置、および記録媒体
US6924909B2 (en) High-speed scanner having image processing for improving the color reproduction and visual appearance thereof
JP2004021765A (ja) 画像認識方法
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
WO2016052410A1 (ja) 画像読取装置及び方法、並びに読取領域表示装置及び方法、並びにプログラム
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2001014428A (ja) 文字認識装置
JPH06243210A (ja) 画像処理装置及び方法
JP4571758B2 (ja) 文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
JPH0851540A (ja) 画像処理装置及び方法
JP2003298853A (ja) 画像処理装置
JP2641924B2 (ja) 画像データ抽出装置
JP4228515B2 (ja) 画像処理装置
JPH1051655A (ja) 画像処理装置及び光学式文字読取装置
JP4578004B2 (ja) スキャナ及びスキャナの光源色制御による2値化方法
JP4650958B2 (ja) 画像処理装置、方法およびプログラム
JPH03213057A (ja) 画像領域識別装置
JPH0340078A (ja) 色識別装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040913

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070605

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071106