JP2001109842A - 光学文字読取装置 - Google Patents

光学文字読取装置

Info

Publication number
JP2001109842A
JP2001109842A JP28914999A JP28914999A JP2001109842A JP 2001109842 A JP2001109842 A JP 2001109842A JP 28914999 A JP28914999 A JP 28914999A JP 28914999 A JP28914999 A JP 28914999A JP 2001109842 A JP2001109842 A JP 2001109842A
Authority
JP
Japan
Prior art keywords
color
image
rectangular area
information
digital signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP28914999A
Other languages
English (en)
Inventor
Takahiro Uchida
恭広 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP28914999A priority Critical patent/JP2001109842A/ja
Publication of JP2001109842A publication Critical patent/JP2001109842A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 (修正有) 【課題】帳票の指定された領域に印刷された色を検出し
て、帳票の種類を識別する光学文字読取装置を提供す
る。 【解決手段】帳票1をカラー画像6aに変換し、カラー
ID領域より広めの矩形領域を間引いたカラー画像10
aと、変換した二値画像16aから抽出した帳票位置情
報25aからより正確なカラーID領域のカラー画像2
5bを抽出する。抽出した各画素の色情報のうち、彩度
Sおよび輝度Vがしきい値以下のものは無彩色として除
外し、残りの色情報から特徴量を抽出してカラーIDを
識別する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は光学文字読取装置に
関し、特に帳票上に設けられた帳票ID領域を読み取っ
て識別することで、当該帳票に適した処理を選択的に実
施する帳票ID識別機能を備えた光学文字読取装置に関
する。
【0002】
【従来の技術】従来、光学文字読取装置では帳票上に設
けられた特定の帳票ID領域に、帳票の種別を表す帳票
IDをあらかじめ印刷しておき、読み取り時に他処理に
先んじて帳票ID領域を読み取って識別し、識別結果の
帳票種に対応する帳票形式情報(一般に帳票フォーマッ
トと呼ばれる)を選択し、以後の文字認識処理やイメー
ジ処理、および帳票搬送処理等に適用することで、複数
の帳票種をまとめて読み取り処理できるID識別機能を
備えているものがある。
【0003】従来のID識別機能では帳票IDとして図
2の(a)に示すような英数字等の文字が使用されてい
る。光学文字読取装置の備える文字識別機能を利用して
文字で表現された帳票IDの識別を実現している。この
ような文字による帳票IDは、主に光学文字読取装置で
の処理、または帳票作成者による帳票の管理を容易にす
るものであるが、帳票への記入者にとっては一般に不要
な情報である。また、光学文字読取装置での処理を想定
されずに設計された帳票は、ほとんどの場合適切な文字
による帳票IDを備えていないため、従来のID識別機
能を利用するには、光学文字読取装置での処理を想定し
て帳票を再設計する必要があった。
【0004】一方、光学文字読取装置のカラー化、文字
認識技術の進歩などにより、光学文字読取装置の対象と
なる帳票種は増加し、光学文字読取装置での処理を想定
せずに設計された一般帳票なども読取対象とすることが
可能となってきた。例として図3に各種窓口での受け付
け業務などでよく利用されている帳票を示す。
【0005】このような帳票では、多くの場合、記入者
が複数の帳票種の中から目的の帳票を選ぶのが容易とな
るように色分けされており、ベタで塗りつぶされた領域
を持っている。また、塗りつぶされた領域に大きな白抜
き文字で帳票の種別を表す帳票名が記入されていること
も多い。これらの色分け領域は、記入者である人間にと
っては分かりやすい帳票IDとして機能している。しか
し、従来の光学文字読取装置のID識別機能では、これ
らの色分けによる帳票の識別はできないため、光学文字
読取装置でID識別機能を利用するには、これらの帳票
を再設計して文字によるID領域を設ける必要があっ
た。
【0006】現在の光学文字読取装置では、このような
一般帳票の帳票識別を実現する機能として、帳票の読み
取り画像から、罫線成分を抽出し、この罫線情報から帳
票種を識別する罫線による帳票識別機能を備えているも
のがある。しかし、罫線情報による帳票識別は大量の演
算処理を必要とし処理速度の低下が生じる。また、図3
に示す帳票のように、罫線構成が大部分同一で一部のみ
異なる場合などもあり、高精度の識別は困難である。
【0007】また、現在の光学文字読取装置では読取部
にカラーセンサを適用し、従来よりも広範囲なドロップ
アウトカラーを実現するものもある。しかし、光学文字
読取装置を使った多くの業務では高速に処理できる二値
画像が中心であり、カラー画像を取り扱うことは少な
い。従って、帳票の色分けによる帳票識別を実現するた
めに、単純にカラー画像を取り扱うと、従来処理に比べ
て非常に大きなデータが発生し、処理速度、容量の面で
大きなコストが発生してしまう。
【0008】
【発明が解決しようとする課題】本発明の目的は、色分
けされた帳票の色を識別することにより、帳票種に対応
した処理を選択的に実施する光学文字読取装置を提供す
ることにある。そのために、本発明による光学文字読取
装置では、複数の帳票種をまとめて読み取る処理におい
て帳票種を識別するために各帳票種毎に異なる識別色を
割り当てる。そして、複数の帳票種について同一領域を
前述の識別色で塗りつぶしたカラーID領域を設け、ま
たは、既に複数の帳票に設けられているカラーID領域
を読み取り、カラーID領域の色を識別することで帳票
種を識別し、帳票種に対応した処理を選択的に実施する
手段を備えている。
【0009】さらに本発明は、カラーID領域の識別処
理において、カラー画像を扱うことで生じる高速・大容
量データ処理による性能低下がほとんどなく、かつ、正
確にカラーIDを識別する手段を備えた光学文字読取装
置を提供するものである。
【0010】さらに本発明は、カラーID領域の識別処
理において、カラーID領域に白抜き文字や筆記具によ
る記入などがあった場合でも、高い精度でカラーIDを
識別する手段を備えた光学文字読取装置を提供するもの
である。
【0011】
【課題を解決するための手段】本発明の光学文字読取装
置は、スキャナ部と認識処理部から構成される。スキャ
ナ部は、帳票の搬送または光学センサ部を走査する帳票
搬送手段と、帳票を正規化されたカラーディジタル信号
に変換する画情報変換手段と、カラーディジタル信号と
画情報変換手段より得られるスキャン位置情報から、指
定された矩形領域のカラー信号を抽出する矩形領域選択
手段と、抽出された矩形領域のカラー信号から主走査お
よび副走査共にm画素に1画素の割合で間引きされた矩
形領域カラー信号を抽出する間引き転送手段と、カラー
ディジタル信号を二値化画像に変換する画像二値化手段
と、間引きされた矩形領域カラー信号および二値画像を
一時保管する画像メモリバッファと、画像メモリバッフ
ァに対する書込みおよび読み出しを処理する転送制御手
段と、認識処理部とのインタフェース手段から構成され
る。
【0012】認識処理部は、各帳票種に割り当てられた
カラーIDの色情報の特徴量および各帳票種に対応する
文字認識処理、イメージ処理および帳票搬送処理等の情
報を含む帳票形式情報と、二値画像から帳票位置情報を
抽出し、読み取り対象領域およびイメージ処理に対応す
る領域の画像を切出す画像切出し手段と、切出されたカ
ラーID領域の各画素の値から彩度および輝度を計算し
て無彩色を除外したうえで特徴量を計算し、帳票形式情
報の各帳票種毎のカラーIDの特徴量とのパターンマッ
チングを実施してカラーIDを識別するカラーID識別
手段と、切出された二値画像に対して文字認識を実施す
る文字認識手段から構成され、矩形領域選択手段およ間
引き転送手段によりカラーIDに対応する領域より広め
の矩形領域のカラー画像サンプルを採取し、さらに、画
像切出し手段により、二値画像から抽出した帳票位置情
報を利用して、正確に切出されたカラーID領域のカラ
ー画像サンプルを抽出し、さらに各画素サンプルより無
彩色を除外して、対象となるカラーID色のみを抽出し
特徴量求めてパターンマッチにより識別する手段を設け
ている。
【0013】
【発明の実施の形態】本発明の一実施例の機能ブロック
図を図4に示す。この実施例の光学文字読取装置は、ス
キャナ部3と認識処理部4から構成されている。
【0014】制御CPU22はスキャナ部3の各種機能
を制御する機能を備えている。帳票搬送手段17は、認
識処理部4から指示された搬送制御情報19に従って、
制御CPU22の制御により読み取り対象の帳票1を搬
送する。ここで搬送とは、センサを備えた光学ヘッドを
固定して、帳票1をモータ等の駆動力により一方向に移
動させること(搬送型スキャナ)、または、逆に帳票1
を固定して光学ヘッドまたは光路を移動させること(フ
ラットベッド型スキャナまたはスタンド型)、または、
二次元の光学センサより画情報を読み出す際の副走査に
相当する電気的な操作のいずれかを表す。以下、当該搬
送を副走査という。
【0015】さらに帳票搬送手段17では帳票1の副走
査方向に対しての先端を検出する機構を備え、帳票検出
情報18として出力する。
【0016】画情報変換手段5は、搬送中の帳票1の紙
面上を光学的に走査して、正規化されたカラーのディジ
タル情報6と、走査のタイミングを示すスキャン位置情
報7を出力する。以下、当該走査を主走査という。
【0017】矩形領域選択手段8は、カラーのディジタ
ル情報6、スキャン位置情報7、帳票検出情報18、及
び、認識処理部4より指示されるカラーID位置情報1
4を入力して、カラーID領域2に対応する矩形画像の
みを抽出する手段である。ただし、ここでは帳票の搬送
などの誤差を考慮して、実際に必要なカラーID領域2
よりも広めに画像を抽出する。
【0018】間引き転送手段9は、抽出された矩形画像
を主走査方向および副走査方向共にm画素に一画素の割
合で抜き出す操作と、矩形画像を元の解像度の1/mの
解像度に変換する処理を行う。以下、画素の抜き出し操
作と解像度変換とをまとめて間引き操作という。矩形領
域選択手段8と間引き転送手段9の組合せにより出力す
るカラー画像情報10は、カラーID領域2に対応する
広めの矩形領域のカラー画像のサンプリング情報とな
る。ここで、mを後述するカラーID識別処理の精度を
満たす適切な値に設定することで、カラー画像の転送量
を最小限に抑えることができる。例えば、間引き操作を
しない場合のカラー画像と比較して、m=4の場合は1
6分の1、m=8の場合は64分の1のデータ量に抑え
ることができる。さらに矩形領域転送との組合せによ
り、カラーID識別に必要なカラー画像は非常に小さい
ものに抑えることができる。
【0019】画像二値化手段11は、正規化されたカラ
ー情報6に対して二値化処理を施して、二値画像情報1
6を出力する。ここで画像二値化手段11には、ドロッ
プアウトカラーで印刷された記入枠などを除去するため
に、認識処理部4により指示されたカラードロップアウ
ト情報15に従って除去する色を選択するカラードロッ
プアウト手段12を備えている。
【0020】転送制御手段20は、画像バッファメモリ
21に対してカラー画像情報10を書込む第1の転送要
求と、二値画像情報16を書込む第2の転送要求と、画
像を読み出してスキャナ部−認識処理部インタフェース
23へ出力する第3の転送要求を生成する。そして、転
送制御手段20は、3種類の転送要求の競合を解決し画
像バッファメモリ21のアクセスを制御する手段と、ス
キャナ部−認識処理部インタフェース23を制御する手
段を備えている。
【0021】認識処理部4は、画像切出し手段25とカ
ラーID識別手段24と文字認識手段26から構成され
る。画像切出し手段25は、通常の文字認識処理装置が
備える二値画像情報16から帳票形式情報27に基づい
て文字認識領域の画像を切出す手段に加えて、文字認識
領域の切出しの位置情報を流用して、カラーID領域2
を広めに抽出したカラー画像情報10からカラーID領
域画像をより正確に切出す手段を備えている。
【0022】カラーID識別手段24は、画像切出し手
段25により正確に切出されたカラーID領域2に対応
するカラーサンプリング画像10の色情報の特徴量を計
算し、帳票形式情報27に含まれる各種帳票IDに対応
する色情報の特徴量とのパターンマッチを実施して、帳
票1のカラーIDを識別する手段を備える。
【0023】さらに画像切出し手段25は、カラーID
識別手段24のID識別結果に対応する帳票形式情報に
従って文字認識領域およびイメージ領域を切出し、この
うち文字認識領域は文字認識手段26によって文字認識
処理が施され、文字認識結果出力29に出力され、イメ
ージ領域はイメージ画像出力28に出力される。
【0024】図1は、本発明における処理の流れを示し
ている。帳票1は、帳票搬送手段17と画情報変換手段
5によって正規化されたカラー信号6aに変換される。
【0025】次に、矩形領域選択手段8および間引き転
送手段9によって、前記正規化カラー信号6aのうち、
帳票形式情報27に含まれるカラーID位置情報14に
よって指定された矩形領域の間引きサンプリングカラー
画像10aが抽出される。このときカラーID位置情報
14を、帳票搬送のスキューや先端検出などの誤差を考
慮して、適切なマージンを確保した広めの領域にしてお
くことで、確実にカラーID領域2を含んだサンプリン
グカラー画像10aを取得できる。
【0026】前記カラー画像サンプルの取得と平行し
て、画像二値化手段11によって、前記正規化カラー信
号6aは、ドロップアウトカラーが除去された二値画像
信号16aに変換される。
【0027】当該サンプリングカラー画像信号10aと
二値画像信号16aは、転送制御手段によって、スキャ
ナ部−認識処理部インタフェース23を経由して、画像
切出し手段25に転送される。
【0028】続いて画像切出し手段25は、二値画像信
号16aより黒の背景領域と白の帳票領域の境界を検出
して、画像切出し処理の基準となる帳票端の位置情報2
5aを求める。当該処理は通常の文字認識における読み
取り対象の画像領域を切出すための帳票基準位置を求め
る処理であり、前記黒背景画像における処理の他にも、
帳票中のエッジマークや罫線など、白背景画像であって
も利用できる情報を元に帳票基準位置を求めてもよい。
【0029】次に、サンプリングカラー画像10aか
ら、前記カラーID位置情報14と前記帳票端の位置情
報25aを用いて、正確なカラーID領域サンプリング
カラー画像25bを切出す。当該処理は、通常の文字認
識における読み取り対象の画像領域を切出すのと同等の
手法で実施できる。
【0030】このように、広めに抽出したカラーID領
域のサンプリングカラー画像10aから、二値画像信号
16aからの位置情報を利用して正確な切出しを実施す
ることで、少ない画像転送量で正確なカラーID領域を
転送することができる。
【0031】ここで、カラーID領域を正確に切出した
とは言え、帳票の搬送精度、帳票基準位置の抽出等の誤
差により、前記カラーID領域サンプリングカラー画像
25bには、カラーID周辺の黒背景色(または白背
景)や帳票の白領域が含まれることが考えられる。ま
た、カラーID領域の周辺以外にも、カラーID中の白
抜き文字、また筆記具による記入などの、カラーID識
別に不要なサンプルが含まれている場合も考えられる。
これらの不要なサンプルは、ほとんどの場合白または黒
等の無彩色であるため、カラーID領域サンプリングカ
ラー画像25bの各画素から無彩色の画素サンプルを除
去すれば、カラーID色を持つ画素のみを抽出すること
ができる。以下に当該無彩色の除去処理を記述する。
【0032】まず、カラーID識別手段24では前記カ
ラーID領域サンプリングカラー画像25bの各画素の
RGB値をHSV変換処理24aによりHSV表色系に
変換する。ここでHSV表色系は図9に示すように、色
相(H)、彩度(S)、輝度(V)により表され、数1
から数3に示す比較的単純な演算により変換が可能であ
る。次に、無彩色除外処理24bは、彩度Sがしきい値
Stより小さい場合は無彩色として除外する。また、輝
度Vがしきい値Vtより小さい場合は、黒に近い色とし
て除外する。尚、説明のため数1に色相Hの変換式を示
したが、前記無彩色除去処理24bでは色相は不要のた
め、数1の演算は省略することができる。
【0033】
【数1】
【0034】
【数2】
【0035】
【数3】
【0036】以上の処理で、カラーID領域サンプリン
グカラー画像25bから不要なサンプルが除外された
ら、続いてヒストグラム作成処理24cにより、各画素
のRGB値の図10aに示すようなヒストグラムを作成
し、R、G、B各値の平均値Mr、Mg、Mb、および
分散Vr、Vg、Vb等の特徴量を抽出する。
【0037】次に抽出された特徴量は、あらかじめ登録
された各カラーIDの特徴量情報27aに対してパター
ンマッチ24dを実施して、最も近いカラーIDのID
識別情報24eを出力する。
【0038】なお、この実施例では帳票のカラー画情報
はカラーID識別以外の目的では使用されないものとし
て、カラーID領域のカラー画像サンプルのみ転送する
構成としているが、帳票のカラー画情報をカラーID識
別以外の用途、例えばカラー画情報の保管やカラー画情
報をもとにソフトウェアで二値化処理を実施する場合な
どにおいては、前記矩形領域選択手段8でカラーID領
域のみを抽出する必要はなく、カラーID領域を含む帳
票全面または特定領域のカラー画情報を採取し、当該カ
ラー画情報から、前記画像切り出し手段25によってカ
ラーID領域の画像サンプルを切り出す構成としてもよ
い。同様に、間引き転送手段9に関してもより高い線密
度でのカラー画情報を別用途で使用する場合においては
不要となる。
【0039】また、この実施例では、帳票1を画情報変
換手段5で変換したカラー画情報をRGB表色系として
いるが、RGB表色系に限らず他の表色系、例えばYC
bCr表色系などを用いてもよい。同様にカラーID領
域の各画素から無彩色を除外するためにHSV表色系に
変換しているが、HSV表色系と同様に彩度と輝度また
は明度に相当する値を得られる他の表色系、例えばHS
L表色系を用いてもよい。
【0040】図5、図6、および図7は、前記本発明の
前記実施例のスキャナ部の機能ブロック図をさらに詳細
に具体化するものである。ここで示すのは、本発明の一
実装例であり、各部の詳細は同等の目的を達成する他の
実装形態と置き換えることができる。
【0041】まず、この実施例では、帳票搬送手段17
として帳票搬送型を適用し、ステッピングモータと連動
したローラ17aおよび、帳票検出手段として透過型の
フォトセンサ18aを備える。ローラ17aにより搬送
された帳票1の紙面は、ランプ5iによって照明され、
ミラー5jおよびレンズ5k、さらに必要に応じてシェ
ーデングプレート等から構成される縮小光学系を経由し
てカラーCCDセンサ5Lに射影される。
【0042】次に、発振回路5aは、1画素に対応する
ビデオクロック信号5bを生成し、当該ビデオクロック
信号5bをビデオ系および画像処理系の各部に分配す
る。
【0043】転送起動信号19aは制御CPU22によ
り生成される。ここで制御CPU22は、前記透過型フ
ォトセンサ18aにより検出された帳票検出情報と帳票
搬送速度より、CCDセンサの視位置を帳票先端が通過
するよりも一定時間前に転送起動信号19aのタイミン
グを合わせる。
【0044】水平カウンタ回路5cは、ビデオクロック
信号5bでカウントアップして、水平周期レジスタ5d
に達するとクリアされるカウンタ回路で、水平同期信号
7aおよびスキャン位置情報7の一情報であるHカウン
ト値7bを出力する。当該Hカウント値7bは、主走査
方向における現在の画素位置を表す。
【0045】垂直カウンタ回路5eは、前記転送起動信
号19aにより動作を開始し、前記水平同期信号7aで
カウントアップするカウンタ回路で、スキャン位置情報
7の一情報であるVカウント値7cを出力する。当該V
カウント値は副走査方向における現在の画素位置を表
す。
【0046】前記Hカウント値7bおよびVカウント値
7cは後述する矩形領域選択手段8でカラーID領域2
に対応する画像を抽出するために利用される。
【0047】センサクロック制御回路5fでは、前記水
平同期信号7aおよびビデオクロック信号5bより、C
CDセンサ5Lおよびビデオアンプ5nの駆動に必要
な、センサ開始信号5g(φTG)、各種センサクロッ
ク5h(φ1、φ2、φRB、φCLB、クランプ信号
等)を生成し、カラーCCDセンサ5Lに供給する。
【0048】カラーCCDセンサ5Lは、帳票1の紙面
をR(赤)、G(緑)、B(青)の3色に分解し電気信
号に変換したアナログ信号5mを出力する。当該アナロ
グ信号5mはビデオアンプ5nにより増幅され、A/D
変換器5oによりRGB3色に対応したディジタルの入
力カラー信号5pに変換される。
【0049】ここで入力カラー信号5pは一般に、CC
Dセンサおよびビデオアンプによるオフセット、すなわ
ち完全な暗状態でも出力される暗レベルや、主走査方向
の両端に近づくに従って出力レベルが低下するシェーデ
ィング特性などを含んでいるため、正規化処理を施す必
要がある。
【0050】この実施例では、ランプ5iを消灯した状
態で採取した入力カラー信号のレベルを保持する暗レベ
ル保持メモリ5rと、減算回路で構成される暗レベル補
正回路5qにより暗レベルの補正を実施し、さらに、基
準となる白を読み込ませて採取した入力カラー信号のレ
ベルを保持する白レベル保持メモリ5tと、除算回路で
構成されるシェーディング補正回路5sにより入力カラ
ー信号5pに対して正規化を施し、正規化されたカラー
信号6aを出力する。この後さらにガンマ補正処理を追
加してもよい。
【0051】次に、この実施例では、カラードロップア
ウト手段11として、正規化カラー信号6aからR値、
G値、B値、さらに各画素におけるR、G、Bの最大値
11aの4種類の中から、二値化処理の対象画像をドロ
ップアウト指定色選択信号14aに従って選択回路11
bにより選択する構成とする。
【0052】ここで、Rを選択すれば赤系色がドロップ
アウトカラー、Gを選択すれば緑系色がドロップアウト
カラー、Bを選択すれば青系色がドロップアウトカラー
となるが、本発明の読み取り対象となるカラーIDを含
む帳票では、ドロップアウトカラーはカラーIDと同
色、または複数の様々な色となることが予想できるた
め、文字認識対象の二値画像は特定色のみのドロップア
ウトではなく、何色であってもドロップアウトすること
が好ましい。
【0053】この実施例では、何系のドロップアウトカ
ラーであっても同時にドロップアウトできる手段とし
て、最大値11aを選択することができる。この時、赤
系色ではR値が最も大きくなるためR値が、緑系色、青
系色でも同様に対応するG、B値が選択される。背景色
の白および黒で記入された読み取り文字は、無彩色ゆえ
にRGB各値にはほとんど差がなく、R、G、B値いず
れが選択されても結果に差は現れない。従って、最大値
11aを二値化処理した画像では赤系、緑系、青系のい
ずれも同時にドロップアウトしたものとなる。
【0054】この他にも、別系色を同時にドロップアウ
トする手段として、特開平9−81673のようにカラ
ー処理により有彩色か無彩色かを識別して、無彩色以外
の色を全てドロップアウトする手段などがある。
【0055】次に、この実施例では、矩形領域選択手段
5をH開始レジスタ14cとH終了レジスタ14dと主
走査方向の比較回路8a、さらにV開始レジスタ14e
と副走査方向の比較回路8bから構成する。制御CPU
22は、カラーID位置情報14として前記3種類のレ
ジスタを設定する。このとき、帳票の搬送時に発生する
スキュー、速度変動、また、透過型フォトセンサ18a
による帳票先端の検出誤差などを考慮して、適切な定値
だけ広めの領域となるように設定する。H開始レジスタ
14cには、カラーID領域の主走査方向の取り込み開
始位置、H終了レジスタ14dには終了位置を、また、
V開始レジスタ14eには副走査方向の取り込み開始位
置を設定する。比較回路8aはHカウント値7bがH開
始レジスタ14c以上、H終了レジスタ14d未満の
間、転送範囲であることを表す信号を出力する。また、
比較回路8bはVカウント値7cがV開始レジスタ14
e以上のとき、転送範囲であることを表す信号を出力す
る。
【0056】さらに、この実施例では、間引き転送手段
9を、間引き設定レジスタ14bと主走査方向の間引き
回路9aおよび副走査方向の間引き回路9bから構成す
る。当該間引き回路9aおよび9bは、間引き設定レジ
スタ14bの設定内容に応じてHカウント値7bの下位
ビットをデコードした信号により、比較回路8aからの
転送範囲信号をマスクする回路によって構成する。例え
ば、目的とするm画素に1画素の1/m間引きにおい
て、mは2のn乗となる値、例えば2、4、8、16等
とし、nの値を間引き設定値レジスタ14bに設定す
る。そして、Hカウント値7bの下位nビットが全て”
1”のときのみ”1”になる信号と、前記比較回路8a
からの転送範囲信号の論理積を出力する。この出力信号
は、主走査方向の転送範囲で、かつm画素に1画素毎
に”1”となる間引き転送範囲信号となる。副走査方向
の間引き回路8bもVカウント値7cと比較回路8bか
らの転送範囲信号に対して同様に構成して、副走査方向
の間引き転送範囲信号を生成する。
【0057】次に、転送要求生成回路20aは、カラー
ID領域のカラー画像サンプルを転送する一般的なダイ
レクト・メモリ・アクセス・コントローラであり、転送
先の画像バッファメモリ21に対応するアドレスカウン
タ14fと、転送したワード数をカウントして一定量の
転送後停止するための転送量カウンタ14gを持つ。転
送要求生成回路20aは、前記間引き回路9aと間引き
回路9bからの間引き転送範囲信号が共に”1”のとき
のみ、正規化カラー信号6aを入力して、当該信号値と
転送先アドレスと共に転送要求を競合解決回路20dに
対して発行する。競合解決回路20dにより転送済みの
報告を受けた後に、アドレスカウンタ14fと転送量カ
ウンタ14gを一画素相当分進める。
【0058】転送要求生成回路20cは、二値画像信号
16aを転送するダイレクト・メモリ・アクセス・コン
トローラである。ただし、二値画像信号16aは1ビッ
トの信号のため、シリアル−パラレル変換回路20bに
よってワードデータを構成し、当該ワードデータを転送
対象とする。
【0059】競合解決回路20dは各転送要求生成回路
からの転送要求を設定された優先順位に応じて競合解決
し、メモリ制御回路20eに対してメモリアクセス要求
を発行する。メモリ制御回路20eは前記競合解決回路
20dからのメモリアクセス要求に応じてD−RAMま
たはSD−RAMで構成される画像バッファメモリ21
の書込み、読み出し、およびメモリリフレッシュの制御
を実施する。
【0060】この実施例では、スキャナ部−認識処理部
インタフェース23としてSCSIバスを適用する。イ
ンタフェースバス制御回路20gは一般的なSCSIバ
スコントローラであり、転送要求生成回路20fとの組
合せにより、コマンドの送受信および画像の転送を実施
する。また、認識処理部4が同一筐体内に構成される場
合においては、スキャナ部−認識処理部23として、P
CIなどの内部インタフェースバスまたは独自の内部イ
ンタフェースバスを適用することもできる。その場合
は、インタフェース制御回路20gは対象となる内部イ
ンタフェースバスに応じた制御回路で構成する。
【0061】図8は本実施例における矩形領域転送の動
作を示している。まず、主走査方向に関して、水平同期
信号7aによってHカウント値7bはリセットされ、そ
こからビデオクロック信号5bによってカウントアップ
することで、Hカウント値7bは主走査方向の画素位置
を示している。主走査方向の比較回路8aは、Hカウン
ト値7bがH開始レジスタ14cに一致後主走査方向の
転送範囲信号をセットし、H終了レジスタ14dに一致
後リセットする。これにより、当該主走査方向の転送範
囲信号は、転送対象のカラーID領域に対応する水平位
置で”1”となる。
【0062】次に、副走査方向に関して、透過型フォト
センサ18aによって搬送中の帳票1の副走査方向に対
する先端が検出されてから、カラーCCDセンサ5Lの
視位置に帳票1の先端が到達するよりも少し前に、制御
CPU22は転送起動信号19aを出力し、二値画像信
号16aの転送を開始する。さらに、転送起動信号19
aが出力された後、水平同期信号7a毎にVカウント値
7cを0からカウントアップすることで、Vカウント値
7cは副走査方向の画素位置を示している。副走査方向
の比較回路8bは、Vカウント値7cがV開始レジスタ
14eに一致後副走査方向の転送範囲信号をセットす
る。これにより、当該副走査方向の転送範囲信号は、転
送対象のカラーID領域に対応する垂直開始位置以降
で”1”となる。さらに、転送開始以前に転送要求生成
回路20aの転送量カウンタ14gを、前記間引き設定
レジスタ14bに設定した間引き設定と、主走査方向の
転送範囲と、必要な副走査方向の転送範囲から計算した
必要転送ワード数に設定しておくことで、必要な副走査
方向の転送範囲のみを転送することができる。
【0063】その上で、主走査方向の転送範囲信号と副
走査方向の転送範囲が共に”1”の場合にのみ、画像の
転送を実施することで、カラーID領域を切出して転送
することができる。さらに、前述した間引き転送手段9
により、カラーID領域の画像を間引いた画素サンプル
を転送することができる。
【0064】ここで、帳票の先端よりも少し前から二値
画像を転送を開始するのは、帳票先端より前の黒背景領
域も転送して、後に文字認識対象となる画像領域を正確
に切出す際の帳票先端位置の検出に使用するためであ
る。そのため、帳票搬送の誤差なども考慮して、帳票先
端前の黒背景領域の転送を保証する適切な距離を設け
る。
【0065】ただし、スキャナ部の背景が白背景である
場合などではこの限りではなく、帳票先端に合わせて二
値画像を転送すれば十分な場合もある。このような場合
には、比較回路8bによる副走査方向の転送開始位置の
制御と同等の機構を二値画像信号16aの転送要求生成
回路20cにも適用することで、二値画像の転送開始位
置を帳票先端または任意の領域に合わせ込むことができ
る。
【0066】図11は、パターンマッチ処理24dのフ
ローチャートを示している。パターンマッチ処理24d
では、まず、あらかじめ登録された各カラーIDの特徴
量情報27aの各々に対して、ヒストグラム作成処理2
4cにより、抽出された識別対象のカラーID特徴量M
r、Mg、Mb、および、Vr、Vg、Vbとの類似度
pを算出する。
【0067】
【数4】
【0068】ここで類似度pは数4に示すように、二つ
のカラーIDのR、G、B各色の平均値の差の合計とす
る。カラーIDのR、G、B値は正規化された値のた
め、同色のカラーIDであれば、R、G、Bの平均値は
近い値となるため、類似度pが小さいほど、二つのカラ
ーIDの色は類似していることになる。類似度pの算出
と同時に、類似度pのソート処理を行い、登録された各
カラーID27aの中から、最も小さい類似度p1を持
つカラーIDと、次に小さい類似度p2を持つカラーI
Dを抽出する。
【0069】そして、図12に示すように、1位の類似
度p1が十分に小さくて、2位の類似度p2との差が一
定以上である場合に一致と判定し、それ以外では判別不
可とする検定処理を実施する。
【0070】次に、特徴量のうち各画素のRGBのばら
つきを表す分散Vr、Vg、Vbの値をもって検定処理
を行う。まず、識別対象のカラーIDの分散Vr、V
g、Vbと、登録されたカラーIDの分散DVr、DV
g、DVbの差の比率、dr、dg、dbを数5により
算出する。そして、各色の分散比が適切に設定された閾
値THdよりも大きい場合には、判別不可として除外す
る。
【0071】
【数5】
【0072】これは、カラーIDはそれぞれの色の特性
により、各画素のRGB値のばらつきが異なるため、登
録されたカラーIDと比較して、明らかにばらつきが大
きい場合は、類似度pの信頼性が低いとみなして、判別
不可とするものである。
【0073】図13は、図11のフローに従って、パタ
ーンマッチ処理を行った例である。帳票の帳票形式情報
に対して1番から6番のIDの識別色が定義され、各識
別色の特徴量は図13に示すように決められている。図
13に入力色として示される帳票より読み取ったカラー
IDの色情報の特徴量に対して数4により類似度pを算
出した結果、最も類似しているのは1番の赤、次に類似
するのは2番の代々と判定される。そして、1番の赤に
対する類似度と2番の橙に対する類似度との組み合わせ
による判定、及び、数5により算出される分散比と閾値
との比較による判定の結果、入力色は1番の赤に相当す
ると識別される。
【0074】
【発明の効果】本発明の光学文字読取装置は、記入者に
とって無意味な文字による帳票IDではなく、帳票上の
識別色領域を帳票識別に利用することで、記入者に対し
て色分けされた見やすい帳票を提供し、一括して読み取
り処理を実施することが可能になる。また、既に利用さ
れている色分けされた帳票を再設計することなく取り扱
うことが可能になる。
【0075】さらに、カラーID領域より広めの間引き
カラー画像のみを転送し、二値画像の帳票位置情報と組
み合わせて再度正確に切出し処理を実施することで、カ
ラー画像を取り扱うことによる処理量の増加を最小限に
抑え、高速な帳票識別処理を可能としている。
【0076】また、HSV表色系への変換により無彩色
を除去することで、帳票の搬送精度やカラーID中の白
抜き文字、筆記具による記入などがあった場合でも、高
精度な帳票識別を提供することができる。
【図面の簡単な説明】
【図1】本発明における処理の流れを示す図である。
【図2】文字による帳票IDおよびカラーIDの例を示
す図である。
【図3】本発明の対象となる帳票の例を示す図である。
【図4】本発明の機能を示すブロック図である。
【図5】本発明の一実施例のうち、帳票搬送手段と画情
報変換手段の一部の詳細な機能を示すブロック図であ
る。
【図6】本発明の一実施例のうち、画情報変換手段の一
部と画像二値化手段の詳細な機能を示すブロック図であ
る。
【図7】本発明の一実施例のうち、カラーID領域のサ
ンプリング手段と転送手段の詳細な機能を示すブロック
図である。
【図8】本発明における矩形領域転送を説明する図であ
る。
【図9】HSV表色系および無彩色の除去手段を説明す
る図である。
【図10】カラーIDのヒストグラムの例を示す図であ
る。
【図11】パターンマッチ処理のフローチャートであ
る。
【図12】検定処理を表すグラフである。
【図13】パターンマッチ処理の例を示す図である。
【符号の説明】
1 帳票 2 カラーID領域 3 スキャナ部 4 認識処理部 5 画情報変換手段 6 カラー画像情報 7 スキャン位置情報 8 矩形領域選択手段 9 間引き転送手段 10 カラー画像情報 11 画像二値化手段 12 カラードロップアウト手段 13 画像二値化回路 14 カラーID位置情報 15 カラードロップアウト情報 16 二値画像情報 17 帳票搬送手段 18 帳票検出情報 19 搬送制御情報 20 転送制御手段 21 画像バッファメモリ 22 制御CPU 23 スキャナ部−認識処理部インタフェース 24 カラーID識別手段 25 画像切出し手段 26 文字認識手段 27 帳票形式情報 28 イメージ画像出力 29 文字認識結果出力

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】指定された矩形領域が着色された帳票のイ
    メージを読み取り、正規化されたカラーデジタル信号に
    変換する画情報変換手段と、前記矩形領域のカラーデジ
    タル信号を抽出する矩形領域選択手段と、矩形領域カラ
    ーデジタル信号を一時保存する画像メモリバッファと、
    前記画像メモリバッファに対する書込みおよび読み出し
    を処理する転送制御手段とを有するスキャナ部と、 前記転送制御手段に接続され、帳票の形式と該帳票の形
    式に対応する色情報とを有する帳票形式情報と、前記矩
    形領域のカラーデジタル信号と前記色情報とのパターン
    マッチングを行うカラーID識別手段と、帳票形式情報
    27に基づいて画像を切出す画像切出手段と、前記画像
    切出手段によって切り出された画像に対して文字認識を
    行う文字認識手段とを有する認識処理部とを備えたこと
    を特徴とする光学文字読取装置。
  2. 【請求項2】指定された矩形領域が着色された帳票を読
    み取る光学センサ部と、前記帳票を前記光学センサ部に
    対して搬送または前記光学センサ部を前記帳票に対して
    走査する帳票搬送手段と、読み取った前記帳票のイメー
    ジを正規化されたカラーデジタル信号に変換する画情報
    変換手段と、前記矩形領域のカラーデジタル信号を抽出
    する矩形領域選択手段と、前記カラーデジタル信号を2
    値化信号に変換する画像2値化手段と、前記2値化信号
    による2値画像と矩形領域カラーデジタル信号とを一時
    保存する画像メモリバッファと、前記画像メモリバッフ
    ァに対する書込みおよび読み出しを処理する転送制御手
    段とを有するスキャナ部と、 前記転送制御手段に接続され、帳票の形式と該帳票の形
    式に対応する色情報とを有する帳票形式情報と、前記矩
    形領域のカラーデジタル信号と前記色情報とのパターン
    マッチングを行うカラーID識別手段と、帳票形式情報
    に基づいて前記2値画像から画像を切出す画像切出手段
    と、前記画像切出手段によって切り出された画像に対し
    て文字認識を行う文字認識手段とを有する認識処理部と
    を備えたことを特徴とする光学文字読取装置。
  3. 【請求項3】前記矩形領域選択手段は、前記矩形領域の
    周囲を含んだ領域のカラーディジタル信号を抽出し、 前記画像切出手段は、前記2値画像を用いて帳票の位置
    を検出して前記矩形領域の周囲を含んだ領域のカラーデ
    ィジタル信号から前記矩形領域のカラーディジタル信号
    を抽出することを特徴とする請求項2記載の光学文字読
    取装置。
  4. 【請求項4】前記スキャナ部は、前記矩形領域の前記カ
    ラーデジタル信号から主走査および副走査共にm画素に
    1画素の割合で間引きされた矩形領域カラーデジタル信
    号を抽出する間引き転送手段を有し、前記画像メモリバ
    ッファには、前記間引きされた矩形領域カラーデジタル
    信号を保存することを特徴とする請求項2記載の光学文
    字読取装置。
  5. 【請求項5】前記カラーID識別手段は、前記カラーデ
    ィジタル信号の各画素の信号の彩度および輝度の値に基
    づいて無彩色の画素を除き、有彩色と判定された画素の
    信号と前記色情報とのパターンマッチングを行うことを
    特徴とする請求項1または請求項2記載の光学文字読取
    装置。
  6. 【請求項6】前記カラーID識別手段のパターンマッチ
    ングは、前記カラーディジタル信号の各画素の色成分の
    ヒストグラムを作成し、前記色情報の色成分と比較して
    行うことを特徴とする請求項1、請求項2または請求項
    5記載の光学文字読取装置。
JP28914999A 1999-10-12 1999-10-12 光学文字読取装置 Pending JP2001109842A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28914999A JP2001109842A (ja) 1999-10-12 1999-10-12 光学文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28914999A JP2001109842A (ja) 1999-10-12 1999-10-12 光学文字読取装置

Publications (1)

Publication Number Publication Date
JP2001109842A true JP2001109842A (ja) 2001-04-20

Family

ID=17739406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28914999A Pending JP2001109842A (ja) 1999-10-12 1999-10-12 光学文字読取装置

Country Status (1)

Country Link
JP (1) JP2001109842A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7483160B2 (en) 2002-09-30 2009-01-27 Brother Kogyo Kabushiki Kaisha Communication system, communication terminal, system control program product and terminal control program product
US7508986B2 (en) 2003-11-28 2009-03-24 Canon Kabushiki Kaisha Document recognition device, document recognition method and program, and storage medium
JP2009110472A (ja) * 2007-11-01 2009-05-21 Oki Electric Ind Co Ltd 帳票読取装置
JP2010003124A (ja) * 2008-06-20 2010-01-07 Hitachi Computer Peripherals Co Ltd ドロップアウトカラー処理装置およびこれを用いたドロップアウトカラー処理方法
US8045229B2 (en) 2007-08-21 2011-10-25 Canon Kabushiki Kaisha Image processing apparatus, image processing method and medium

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7483160B2 (en) 2002-09-30 2009-01-27 Brother Kogyo Kabushiki Kaisha Communication system, communication terminal, system control program product and terminal control program product
US7508986B2 (en) 2003-11-28 2009-03-24 Canon Kabushiki Kaisha Document recognition device, document recognition method and program, and storage medium
US8045229B2 (en) 2007-08-21 2011-10-25 Canon Kabushiki Kaisha Image processing apparatus, image processing method and medium
JP2009110472A (ja) * 2007-11-01 2009-05-21 Oki Electric Ind Co Ltd 帳票読取装置
JP2010003124A (ja) * 2008-06-20 2010-01-07 Hitachi Computer Peripherals Co Ltd ドロップアウトカラー処理装置およびこれを用いたドロップアウトカラー処理方法
JP4627787B2 (ja) * 2008-06-20 2011-02-09 日立コンピュータ機器株式会社 ドロップアウトカラー処理装置およびこれを用いたドロップアウトカラー処理方法

Similar Documents

Publication Publication Date Title
US8306325B2 (en) Text character identification system and method thereof
KR101461233B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
US9171224B2 (en) Method of improving contrast for text extraction and recognition applications
JP4574503B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP3018949B2 (ja) 文字読取装置およびその方法
JP4777024B2 (ja) 画像処理装置および画像処理装置の制御方法
JP5929282B2 (ja) 画像処理装置及び画像処理プログラム
JP2001109842A (ja) 光学文字読取装置
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
JP5887242B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2003087562A (ja) 画像処理装置および画像処理方法
JP4167680B2 (ja) 原稿読取装置および原稿読取方法
EP1531615A2 (en) Document processor
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
US20100165421A1 (en) Image processing apparatus, image processing method, and program
US20090273816A1 (en) Image processing method, apparatus and program
JPH06131495A (ja) 画像情報抽出方式
JP2001109887A (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
US8542931B2 (en) Ruled line extraction technique based on comparision results and indentifying noise based on line thickness
US20220343666A1 (en) Image processing apparatus, image processing method, and storage medium
JPH02137079A (ja) 色識別回路
JPH10254981A (ja) 画像処理装置
JPH06176193A (ja) 光学的文字読取装置
JP2001312695A (ja) ラベル領域検出装置、ラベル領域検出方法及び記録媒体
JPH0528314A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050621

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060411