JP3115075B2 - 読取装置 - Google Patents

読取装置

Info

Publication number
JP3115075B2
JP3115075B2 JP04013067A JP1306792A JP3115075B2 JP 3115075 B2 JP3115075 B2 JP 3115075B2 JP 04013067 A JP04013067 A JP 04013067A JP 1306792 A JP1306792 A JP 1306792A JP 3115075 B2 JP3115075 B2 JP 3115075B2
Authority
JP
Japan
Prior art keywords
color
data
information
read
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP04013067A
Other languages
English (en)
Other versions
JPH0567234A (ja
Inventor
俊雄 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP04013067A priority Critical patent/JP3115075B2/ja
Publication of JPH0567234A publication Critical patent/JPH0567234A/ja
Application granted granted Critical
Publication of JP3115075B2 publication Critical patent/JP3115075B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】
[発明の目的]
【0001】
【産業上の利用分野】この発明は、たとえば文字認識の
前処理として、被読取物より文字だけを読み取る文字読
取装置などの読取装置に関する。
【0002】
【従来の技術】周知のように、光学式文字読取装置で
は、読み取りの対象となる被読取物への記載が任意のフ
ォーマットとされている場合、高度な読取技術を必要と
する。したがって、従来の光学式文字読取装置には、被
読取物として、文字などの記載位置を制限するための記
入枠が設けられたものが用意されている。
【0003】通常、被読取物上の記入枠は、文字認識の
段階では不要なものである。このため、消去(ドロップ
アウト)し易いように独特な色で印刷されている。しか
し、その色の選択は狭い、つまり記入枠として用いるこ
とが可能な色には制限があった。
【0004】そこで、記入枠の配色の制限を拡げること
が可能なものとして、たとえば特開昭57−14368
3号公報や特願平2−254308号に示されるよう
に、各種の方式が提案されている。
【0005】しかしながら、これらは、単色からなる記
入枠を消去するものであり、いずれも2種類以上の配色
の記入枠をもつ被読取物については、それを消去するこ
とが困難なものとなっていた。特に、光学フィルタを用
いる方式の場合、着色されている被読取物の配色に対し
ての柔軟性が乏しいという欠点があった。
【0006】一方、銀行券などの有価証券類から絵柄部
の上に重ねて印刷されている記番号を抽出するための技
術として、たとえば特開平3−191482号公報また
は特開平2−73476号公報に示される方法が知られ
ている。前者の方法は、色彩情報を用いて特定色を抽出
するもので、2種類以上の配色の絵柄部を対象とするこ
とができるが、その抽出出力(カラー情報により分割し
た文字)は2値の画像である。これに対し、後者の方法
は、文字を濃淡情報をも含んで抽出することができる
が、1種類の配色(単色)の絵柄部を対象とするもので
あった。
【0007】また、たとえば記入枠と速達印または切手
代用印とが存在する郵便物から郵便番号を抽出するため
の技術としても、前記した前者(特開平3−19148
2号公報)の方法は有用であるが、抽出出力が2値の画
像であるため、かすれた郵便番号を抽出したり、濃淡の
変化をもった速達印などを完全に排除することができな
いという欠点があった。
【0008】
【発明が解決しようとする課題】上記したように、従来
においては、2種類以上の配色の消去すべき情報をもつ
被読取物については、それをうまく消去できないという
欠点があった。
【0009】そこで、この発明の第1は、複数の配色の
消去すべき情報をもつ被読取物からも抽出すべき情報
けを上手に読み取ることができるとともに、被読取物の
配色に対する柔軟性および被読取物における消去すべき
情報の配色の自由度を向上することが可能な読取装置
提供することを目的としている。また、この発明の第2
は、後段の処理における精度を向上させることが可能な
読取装置を提供することを目的としている。
【0010】
【課題を解決するための手段】上記の目的を達成するた
めに、この発明の読取装置にあっては、第1の色で表現
される地色を有し、この上に第2の色で表現される抽出
すべき情報と、この抽出すべき情報とは異なる少なくと
も第3および第4の色で表現される情報とが混在して形
成される被読取物を読取ることにより、複数の色成分か
らなる色彩データを収集する収集手段と、この収集手段
から収集され得る前記色成分空間において、予め設定さ
れている除去すべき前記第1、第3及び第4の色に対応
する色彩データがほぼ同じ値で表せる分布に前記収集手
段により収集された色彩データを変換する変換手段と、
この変換手段の結果から、前記第2の色で表現される抽
出すべき情報の色成分に関するデータのみを抽出する抽
出手段とから構成されている。
【0011】また、この発明の読取装置にあっては、
1の色で表現される地色を有し、この上に第2の色で表
現される抽出すべき情報と、この抽出すべき情報とは異
なる少なくとも第3および第4の色で表現される情報と
が混在して形成される被読取物を読取ることにより、複
数の色成分からなる色彩データを収集する収集手段と、
この収集手段から収集され得る前記色成分空間におい
て、予め設定されている除去すべき前記第1、第3及び
第4の色に対応する色彩データを含む第1の面を算出
し、前記収集手段で収集され得る前記色彩データで表現
される点から前記第1の面までの距離に関連する情報を
算出し、算出した距離に関する情報を前記点を表現する
色彩データに対応させて記憶する記憶手段と、前記収集
手段で収集された前記色彩データに基づいて前記記憶手
段にて記憶された算出結果を出力することにより前記第
2の色で表現される抽出すべき情報の色成分に関するデ
ータのみを抽出する抽出手段とから構成されている。
【0012】
【作用】この発明は、上記した手段により、消去すべき
情報の配色とその種類数とを無制限とすることができる
ようになるため、いかなる被読取物をも処理の対象とし
得るものである。また、上記した手段により、特定の色
の情報を濃淡情報を含んで抽出することが可能となるも
のである。
【0013】
【実施例】以下、この発明の一実施例について図面を参
照して説明する。図1は、この発明にかかる文字読取装
置の構成を示すものである。
【0014】同図において、11は本装置の全体を制御
するCPUであり、このCPU11には、アドレスバス
およびデータバスを介して、データ入力回路12、プロ
グラムメモリ13、ワークメモリ14、ルックアップテ
ーブル回路15が接続されている。
【0015】一方、図示矢印方向に搬送される、読取対
象としての被読取物(たとえば、カラー印刷物)P´に
は図示しない光源からの光が照射される。被読取物P´
の表面で反射された光は、カラーイメージセンサ21に
結像される。この場合、カラーイメージセンサ21は、
たとえば赤(R),緑(G),青(B)構成のCCDア
レイによって構成されている。したがって、反射光強度
の光電変換により、各色成分の色彩データ、つまりR,
G,Bのアナログ画像信号が生成される。
【0016】上記カラーイメージセンサ21の出力は、
CCD駆動回路22からの信号にしたがって読み出され
る。そして、カラー画像入力回路23によってR,G,
Bのディジタル画像信号に変換される。このカラー画像
入力回路23の各出力は、CCD駆動回路22からの信
号の出力に同期して、上記ルックアップテーブル回路1
5に供給される。
【0017】ルックアップテーブル回路15は、上記カ
ラー画像入力回路23からの出力を、被読取物P´にお
ける読み取るべき文字への影響が小さくなるように画像
変換するためのものであり、これにより最終的には文字
だけが抽出された濃淡画像が画像出力として得られる。
【0018】ここで、上記ルックアップテーブル回路1
5は、上記データ入力回路12より入力される、前記被
読取物P´の地色を代表するRGB値(Rp,Gp,B
p)および消去すべき情報としてのたとえば第1,第2
の模様を代表するRGB値(Rm,Gm,Bm)および
(Rn,Gn,Bn)をもとに算出される演算パラメー
タを記憶するものである。この演算パラメータは、前記
CPU11により前記プログラムメモリ13内に格納さ
れている処理プログラムにしたがって書き換えられる。
図2は、この文字読取装置で処理される被読取物P´の
一例を示すものである。
【0019】被読取物P´の表面には、読み取るべき第
1の色で表現される文字31と、この文字31とは異な
る少なくとも第2,第3の色で表現される消去すべき情
報としての第1,第2の模様32,33とが存在する。
【0020】この被読取物P´に対しては、前記データ
入力回路12への入力データとして、たとえばその地色
34および第1,第2の模様32,33を代表するRG
B値(Rp,Gp,Bp)、(Rm,Gm,Bm)、お
よび(Rn,Gn,Bn)があらかじめ求められる。次
に、ルックアップテーブル回路15を書き換えるための
演算パラメータの求め方について説明する。
【0021】被読取物P´における、地色34を代表す
るRGB値(Rp,Gp,Bp)、第1の模様32を代
表するRGB値(Rm,Gm,Bm)、および第2の模
様33を代表するRGB値(Rn,Gn,Bn)は、図
3に示すように、RGBの色空間において、3つの点
P,M,Nとしてそれぞれ配置される。この、3次元空
間における3つの点P,M,Nは、平面Aを張る。
【0022】RGB空間において、この平面Aから各点
P,M,Nまでの距離はいずれも「0」であり、逆に抽
出したい文字の点Cまでの距離は「≠0」の値をとる。
したがって、この平面Aからの距離を利用することによ
り、文字だけを容易に取り出すことが可能である。
【0023】上記した平面Aは、4つの定数c,d,
e,fを用いると、後掲する表1の式(1)の如く表わ
すことができる。この場合、平面Aが3つの点P,M,
Nを通るため、この3つの点P,M,Nの座標を上記式
(1)に代入すると、後掲する表1の式(2),式
(3),式(4)がそれぞれ成立する。
【0024】上記の式(1)〜式(4)では、定数c,
d,e,fについて、ともに「≠0」の値、つまりc=
0,d=0,e=0,f=0以外の解をもつはずであ
る。すなわち、上記した4つの式は、斉次一次連立方程
式の自明な解以外の解をもつ場合に相当する。ここで
は、係数行列の行列式が「0」になることから、後掲す
る表1の式(5)に示す行列式の関係が成り立つ。この
式(5)の行列式を第1次で展開すると、後掲する表1
の式(6)および後掲する表2の式(7),式(8),
式(9),式(10)が得られる。
【0025】上記した式(1)と式(6)とは、定数
c,d,e,fをそれぞれc=Q,d=S,e=T,f
=Uとすることにより、一致する。したがって、この式
(6)が、求めようとする平面Aの方程式となる。な
お、この平面Aにたてた法線の方向比がQ:S:Tであ
ることは、公知である。
【0026】一方、平面Aからの距離は、この平面Aに
垂直な直線Lへの写像より求めることができる。したが
って、図3に示した大きさ1のベクトルS→(以下、本
文では同様にしてベクトルを定義する)に、後掲する表
2の式(11)のような値を用いると、図4に示すよう
な任意の色座標空間の点C(Rc,Gc,Bc)に対し
て、ベクトルの内積により平面Aとの距離と関係のある
値(直線Lへの写像値)Yを求めることができる。
【0027】上記の写像値Yは、後掲する表2の式(1
2)により示される。この写像値Yは、色空間の0点で
「0」をとり、かつ平面Aで最大の値をとるような、平
面Aからの距離を反映したものとなる。
【0028】このように、入力される被読取物P´の地
色34および第1,第2の模様32,33を代表するR
GB値を上記式(6)に代入してQ、S、Tをそれぞれ
求めれば、上記式(7)により、ディジタル画像信号を
文字だけが抽出された濃淡画像に変化させることができ
る。すなわち、上記した方法によれば、図5に示すよう
に、被読取物P´の地色34および第1,第2の模様3
2,33の各点P,M,Nはほぼ同じ濃度値となり、文
字31の点Cと容易に区別することができる濃度分布の
画像への変換が可能となる。
【0029】本実施例では、上述の画像変換を高速に実
行するため、入力されるRGB値のすべての組み合わせ
についてあらかじめ計算によって求められた演算パラメ
ータが、ルックアップテーブル回路15内に書き込まれ
るようになっている。次に、上記した構成において、被
読取物P´より文字だけを読み取る際の動作について説
明する。
【0030】たとえば今、被読取物P´上の第1,第2
の模様32,33を消去する場合、被読取物P´から読
み取ったR,G,Bの各ディジタル画像信号がルックア
ップテーブル回路15に送られる。
【0031】このとき、被読取物P´の地色34および
第1,第2の模様32,33のRGB値がデータ入力回
路12より与えられおり、ルックアップテーブル回路1
5内の、上記したディジタル画像データを文字31だけ
が抽出された濃淡画像に変化させるための演算パラメー
タは、CPU11によってすでに書き換えられている。
【0032】したがって、ルックアップテーブル回路1
5に送られたR,G,Bの各ディジタル画像信号は、そ
こで文字31だけが抽出された濃淡画像に高速に変換さ
れて出力される。上記したように、消去すべき情報の配
色とその種類数とを無制限とすることができるようにし
ている。
【0033】すなわち、被読取物の地色および消去すべ
き模様のRGB値をもとに演算パラメータを算出し、こ
の演算パラメータを使って文字だけが抽出された濃淡画
像を得るようにしている。これにより、被読取物の種類
ごとに上記演算パラメータを書き換えることで、いかな
る被読取物をも処理の対象とし得る。したがって、異な
る配色の消去すべき模様を複数もつ被読取物からも文字
だけを容易に読み取ることができ、被読取物における消
去すべき模様の配色の自由度を向上することが可能とな
るものである。次に、この発明の他の実施例について説
明する。図6は、この発明にかかる文字抽出装置の構成
を示すものである。
【0034】同図において、110は本装置の全体を制
御するCPUであり、このCPU110には、アドレス
バスおよびデータバスを介して、プログラムメモリ12
0、作業用メモリ130、出力回路140、および第1
ないし第3のフレームメモリ240,241,242が
接続されている。
【0035】一方、図示矢印方向に搬送される、読取対
象としての被読取物(たとえば、有価証券などのカラー
印刷物)P''には図示しない光源からの光が照射され
る。被読取物P''の表面で反射された光は、カラーライ
ンセンサ210に結像される。この場合、カラーライン
センサ210は、たとえば赤(R),緑(G),青
(B)構成のCCDアレイによって構成されている。し
たがって、反射光強度の光電変換により、各色成分の色
彩データ、つまりR,G,Bのアナログ画像信号が生成
される。
【0036】上記カラーラインセンサ210の出力は、
カラー画像入力装置220によってR,G,Bのディジ
タル画像信号、つまり被読取物P''の全体に対するRG
B3成分の画像データに変換される。このカラー画像入
力装置220の各出力は、メモリ制御回路230の制御
にしたがって上記第1ないし第3のフレームメモリ24
0,241,242上に書き込まれる。
【0037】上記フレームメモリ240,241,24
2への書き込みが終了すると、その制御がメモリ制御回
路230からCPU110に切り換えられる。そして、
プログラムメモリ120に格納されている処理プログラ
ムにしたがって、被読取物P''に用いられている文字の
抽出(後述する)が行われる。図7は、この文字抽出装
置で処理される被読取物P''の一例を示すものである。
【0038】被読取物P''の表面(下地134上)に
は、たとえば第2,第3の色で表現される情報としての
第1,第2の模様132,133が個々に印刷され、そ
の上にまたがるようにして、これら第1,第2の模様1
32,133とは異なる第1の色で表現される情報とし
ての文字131が重ねて印刷されている。次に、上記し
た構成における動作について説明する。図8は、文字の
抽出にかかる処理の流れを示すものである。
【0039】ここでは、入力したカラー画像について、
まず、印刷に用いられている各色の配色の認識(ステッ
プST1)を行い、ついで、その結果を用いてカラー画
像変換(ステップST2)を行った後に、最終的に文字
131の抽出(ステップST3)を行うようになってい
る。図9は、上記した配色の認識にかかる処理の流れを
示すものである。
【0040】上記の如くして、RGB画像入力の処理が
完了すると、R,G,Bの各ディジタル画像信号につい
ての頻度を示す濃度ヒストグラムが作成される(ステッ
プST11)。これは、カラー画像の全画素について、
R,G,Bの3変量についての3次元出現頻度値として
のヒストグラムデータHt(R,G,B)を求めること
により、実現される。
【0041】このヒストグラムデータHt(R,G,
B)は、たとえば図10に示すように、R,G,Bの3
つの軸で張られる空間に存在する数量(球の直径)とし
て理解することができる。
【0042】RGB濃度ヒストグラム作成の処理が完了
すると、このヒストグラムデータHt(R,G,B)の
極大点の検出が行われる(ステップST12)。これ
は、図10に示した3次元空間における各値41,4
2,43,44のそれぞれについて、図11に二重枠で
示すような近傍点の頻度に対して極大であるかどうかを
調べることによって、実現される。
【0043】すなわち、後掲する表3の式(13)によ
り変換されるデータHp(i,j,k)について、後掲
する表3の式(14)の関係を満足するすべてのi,
j,kのヒストグラムデータHt(R,G,B)が極大
点51として求められる。なお、図11におけるi,
j,kは、図10に示したR,B,Gの各軸にそれぞれ
対応されている。
【0044】この極大点51は、図7に示した被読取物
P''の場合には、たとえば図12に示すように、被読取
物P''の下地134の色、および印刷に用いられている
文字131と模様132,133との3つの色の合計4
色が、点(球)もしくは線分(棒)として色空間上に配
置されることになる。なお、この図12は、R成分およ
びG成分についての頻度分布を示したものであり、0〜
9,a〜fは頻度数を示し、*印は極大点を示してい
る。
【0045】上記した頻度分布のうち、線分状に配置さ
れるのは、カラー画像入力装置220にて発生した誤差
で、本来、2つの色の分布であるものが重畳されたもの
である。したがって、図12の例では、被読取物P''の
下地134の色に対応すると思われる点61から印刷に
用いられている色への、極大点の線分状の分布が存在す
る。
【0046】この極大点の線分状と点状の分布とから、
印刷に用いられている3つの色を正確に分類するために
は、上記したカラー画像入力装置220の誤差による影
響を排除する必要がある。そこで、すべての極大点につ
いて、被読取物P''の下地134の色からの方向に注目
する。この場合、線分状の極大点をすべて同一の方向デ
ータに変換することにより、極大点の分類を容易なもの
とする。
【0047】この変換は、被読取物P''の下地134の
色をPa(Rp,Gp,Bp)、任意の極大点の色をK
i(Rki,Gki,Bki)とすると、後掲する表3
の式(15)によって求められる(ステップST1
4)。この結果、たとえば図13における、被読取物
P''の下地134の色Paを基準点74としたときの、
各点71,72,73に対する3つのデータ75,7
6,77は同じ値となる。
【0048】ここで、上述した式(15)を計算するた
めには、被読取物P''の下地134の色Paを求める必
要がある(ステップST13)。これは、最も明度の高
いRGBデータを持つ極大点として、後掲する表3の式
(16)より求めることができる。なお、この式(1
6)で選択された極大点は、上記した式(15)の変換
において無限大となるため、極大点の集合AAより排除
される。
【0049】こうして、ステップST13の基準色選択
の処理にて、上記した式(16)より被読取物P''の下
地134の色Paが求められ、続いてステップST14
において、上記した式(15)にしたがって極大点のベ
クトルデータへの変換が行われた後、この変換データを
3つのグループに分類するクラスタ分析が行われる(ス
テップST15)。ここで、図14を参照して、クラス
タ分析について説明する。
【0050】まず、nケのデータを1つずつ含むnケの
クラスタが作成される(ステップST21)。そして、
nケのクラスタの総数をDとおき(ステップST2
2)、このクラスタ総数Dをnから3まで統合する処理
が繰り返される(ステップST23〜43)。
【0051】すなわち、ステップST23〜41までの
処理を一通り行うことで、K個あるクラスタのうち、2
つの最も近いクラスタを1つに統合してK−1個のクラ
スタとすることができる。
【0052】この統合は、クラスタ間の距離をすべての
クラスタについて求め、最も小さい距離をとる2つのク
ラスタを同一クラスタとすることにより、実現される。
この場合、クラスタを構成するデータの間で最も短い距
離をクラスタ間の距離としている。
【0053】本実施例では、データ数n1 個をもつクラ
スタiのデータfi(K)(0≦K<n1 )と、データ
数n2 個をもつクラスタjのデータfj(E)(0≦E
<n2 )との距離Lを求めることを、全データ、さらに
全クラスタの組み合わせについて調べ、距離Lの最小値
Lminをとるクラスタxとクラスタyとを得るように
している。なお、データ間の距離Lは、後掲する表4の
式(17)にしたがって計算により求められる。
【0054】こうして求められた最短距離Lminをも
つ2つのクラスタx,yのデータは1つに統合され、1
クラスタとされる。そして、この統合は、最終的にクラ
スタ数Dが3になるまで行われる。
【0055】上記したクラスタ分析の結果として得られ
る3つのクラスタには、それぞれ近い値のデータが集め
られることになる。したがって、図12を上記式(1
6)により変換したデータは、図15に示す如く、3つ
のクラスタに応じて3つに分類される。この3つのクラ
スタ81,82,83は、それぞれ被読取物P''の印刷
に用いられている色に対応したものとなっている。な
お、式(15)にしたがったデータの変換を行わない場
合には、図16に示す如く、誤った3つのクラスタ9
1,92,93に分類されることになる。
【0056】さて、上記したクラスタ分析の処理が完了
すると、3つのクラスタ81,82,83における各デ
ータの、それぞれ式(15)で変換する前のRGBデー
タとの対応が取られる。そして、RGBデータの「0」
から最も近い3点が選択される、つまり図15において
は、極大点84,85,86がそれぞれ求められる(ス
テップST16)。これは、ある極大点におけるRGB
データをRi,Gi,Biとして、後掲する表4の式
(18)により、各クラスタデータの最小値を求めたも
のである。
【0057】この求められた3点84、85、86が印
刷に用いられている色を示すデータとなる。例えば、図
2、図7に示すように、被読取物P´´に印刷されてい
る文字は背景(模様)よりも濃く印刷されているので、
文字に対応するRGBデータは、図3におけるCのによ
うに、最も(0、0、0)に近い点であることが明らか
である。従って、図15において、極大点84、85、
86のうち最もRGBデータが(0、0、0)に近い点
が文字に対応するRGBデータであると容易に類推でき
る。このため、RGBデータが最も(0、0、0)に近
い極大点84が文字に対応するRGBデータと判断し、
残りの極大点85、86が背景に対応するRGBデータ
であると判断する。これにより、RGBデータが色判別
結果として出力回路140により出力されることにな
る。
【0058】このように、出現頻度の極大点と基準色か
らの方向性とから色を分類する、つまり読取対象のカラ
ー画像の各画素について、特徴的なRGB値を抽出する
とともに、その抽出した特徴的なRGB値を基準色から
の方向データに変換し、この方向データをグループに分
類することで印刷に用いられている色の判別(配色の認
識)が行われる。
【0059】この場合、カラー画像入力装置220の誤
差による影響を排除することが可能となる。このため、
たとえば収集される色彩データにカラー画像入力装置2
20の特性から不必要なデータが含まれてしまうような
場合においても、印刷に用いられている色を正確に判別
できるようになる。この結果、異なる色で印刷された2
つの模様132,133と、その上に重ねて印刷された
文字131とが存在するような被読取物P''からも、そ
の配色にかかわらず、印刷に用いられている3つの色を
容易に認識し得るものである。次に、上記したカラー画
像変換にかかる処理の流れについて説明する。
【0060】上記の如くして、色判別の結果が得られた
とすると、たとえばRGBデータ(点84)から文字1
31の色C、RGBデータ(点81)から被読取物P''
の下地134の色P、さらにRGBデータ(点85また
は点86)から第1,第2の模様132,133の色F
1,F2が認識される。
【0061】ここで、被読取物P''における、下地13
4の色Pを代表するRGBデータ(Rp,Gp,B
p)、第1,第2の模様132,133の色F1,F2
を代表するRGBデータ(Rf1,Gf1,Bf1),
(Rf2,Gf2,Bf2)は、図17に示すように、
RGBの色空間において、3つの点P,F1,F2とし
てそれぞれ配置され、この3次元空間において、平面A
´を張る。
【0062】RGB空間において、この平面A´から各
点P,F1,F2までの距離はいずれも「0」であり、
逆に抽出したい文字131の点Cまでの距離は「≠0」
の値をとる。したがって、この平面A´からの距離を利
用することにより、文字131だけを容易に取り出すこ
とが可能である。なお、文字131のかすれなどの濃淡
情報も、上記の平面A´と点Cとの間に位置するため、
この距離によりその濃淡情報も保存されることになる。
平面A´からの距離は、この平面A´に垂直なベクトル
S→への射影の大きさにより、相関のある値を得ること
ができる。
【0063】すなわち、図18に示すように、任意の色
座標空間上の点C(Rc,Gc,Bc)の平面A´から
の距離Lxに対して、原点Oから平面A´までの距離L
A が一定であることから、Lx´=LA −Lxは、平面
A´からの距離を反映した値となる。この値Lx´は、
平面A´に垂直なベクトルS→への、ベクトルC→の射
影の大きさとして求めることができる。
【0064】ここで、平面A´に垂直なベクトルS→
は、平面を構成する2つのベクトル、たとえば図19に
示す下地134の点Pから第1,第2の模様132,1
33の点F1,F2へのベクトルJ→,T→の両方に垂
直なベクトルである。このため、平面A´に垂直なベク
トルS→を求めるということは、2つのベクトルJ→,
T→にともに垂直なベクトルを求めることにほかなら
ず、これは2つのベクトルJ→,T→の外積により求め
ることができる。
【0065】この場合、ベクトルJ→は、(Rf1−R
p,Gf1−Gp,Bf1−Bp)、ベクトルT→は、
(Rf2−Rp,Gf2−Gp,Bf2−Bp)により
それぞれ求められる。したがって、平面A´に垂直なベ
クトルS→は、ベクトルJ→とベクトルT→との外積と
して、後掲する表5の式(19)により計算できる。
【0066】また、任意の点のRGBデータ(Ri,G
i,Bi)について、平面A´からの距離が反映された
値Lx´を求めるには、上記式(19)により得られる
ベクトルS→への射影の大きさを求めれば良いことか
ら、このときの変換(射影)値Yは、後掲する表5の式
(20)として計算できる。この変換値Yは、色空間上
の原点Oで「0」をとり、かつ平面A´で最大の値をと
るような、平面A´からの距離を反映したものとなる。
【0067】このように、入力される被読取物P''の下
地134の色P、および第1,第2の模様132,13
3の色F1,F2を代表するRGB値を上記式(19)
に代入して射影ベクトルS→を求めれば、上記式(2
0)により、R,G,Bのディジタル画像信号を文字1
31だけが抽出された濃淡画像に変換することができ
る。すなわち、上記した方法によれば、図20に示すよ
うに、被読取物P''の下地134の色Pおよび第1,第
2の模様132,133の色F1,F2はほぼ同じ濃度
値となり、文字131の点Cと容易に区別することが可
能な濃度分布の画像への変換が行える。なお、印刷のか
すれなど、文字131の濃淡情報は、たとえばC´部分
の値を取ることで、その情報を保存できる。
【0068】こうして、上記した式(20)にしたがっ
てカラー画像変換が施されることにより、抽出しようと
する文字131の背景、つまり第1,第2の模様13
2,133を排除できるのと同時に、濃淡情報を含んで
文字131を抽出することができるものである。上記し
たように、文字を濃淡情報を含んで抽出することができ
るようにしている。
【0069】すなわち、入力される被読取物の下地の色
および第1,第2の模様の色を代表するRGB値より射
影ベクトルを求め、これをもとにR,G,Bのディジタ
ル画像信号を文字だけが抽出された濃淡画像に変換する
ようにしている。これにより、濃淡情報を保存したまま
で、文字だけを忠実に読み取ることが可能となる。した
がって、異なる配色の消去すべき模様を複数もつ有価証
券などからも記番号だけを正確に読み取ることができ、
後の検査などにおける処理の精度を向上させることが可
能となるものである。また、本実施例においては、たと
えば郵便物からは郵便番号などを正確に読み取ることが
できるようになる。
【0070】すなわち、図21に示すように、被読取物
P''としての郵便物上に、たとえば郵便番号101とそ
の記入枠102、および速達印103がそれぞれ異なる
配色により存在する場合、上記した方法により、記入枠
102と速達印103とを下地104の色に影響される
ことなく排除し得ると同時に、郵便番号101だけをそ
の濃淡情報を含んで抽出することができるものである。
【0071】同様に、図22に示すように、被読取物P
´´としての郵便物上に、たとえば郵便番号101とそ
の記入枠102、および切手の代用となるスタンプ(切
手代用印)105がそれぞれ異なる配色により存在する
場合、図2に示す被読取物P´´の場合と同様に、一般
的に郵便番号101などの文字は、記入枠102および
スタンプ105などの背景(模様)よりも濃く記載され
ているので、郵便番号101などの文字に対応するRG
Bデータが最も(0、0、0)に近い点であることが容
易に類推できる。従って、郵便番号101とその記入枠
102、およびスタンプ105に対応する極大点のうち
最も(0、0、0)に近い点が文字に対応するRGBデ
ータであると判断する。これにより、上記した方法を用
いて、記入枠102とスタンプ105とを下地104の
色に影響されることなく排除し得ると同時に、郵便番号
101だけをその濃淡情報を含んで抽出することができ
るものである。
【0072】このように、郵便物からは郵便番号などを
正確に読み取ることができるようになるため、郵便番号
の読み取り後の認識などにおける処理の精度を向上させ
ることが可能となる。
【0073】さらに、上記した実施例によれば、たとえ
ば図23に示すような郵便番号101とその記入枠10
2とが存在する被読取物P''としての郵便物に対し、下
地104の色の変化、記入枠102の色の変化または郵
便番号101の記入色の変化に容易に対応できる。
【0074】この場合、図24に示すように、郵便物の
下地104の色Pと記入枠102の色Fおよび郵便番号
101の色Cとが、RGBの色空間中に存在するとする
と、郵便物の下地104の色Pと記入枠102の色Fと
を含む平面のうち、郵便番号101の色Cとの距離が最
も大きくなる平面A''を求める。そして、この平面A''
に垂直なベクトルS→への射影を、上記した方法により
同様に求めることで、明度情報だけでは十分な抽出が不
可能であった低コントラストの郵便番号101について
も、その濃淡情報を保存したままの形で抽出することが
可能となる。
【0075】すなわち、まず、各点P,F,Cに対応す
るRGBデータ(Rp,Gp,Bp),(Rf,Gf,
Bf),(Rc,Gc,Bc)を、上記したカラー画像
変換によって求める。ついで、図25に示すように、点
Pから点Fへの方向ベクトルをCV1→、点Pから点C
への方向ベクトルをCV2→とする。そして、この2つ
の方向ベクトルCV1→,CV2→をもとに、後掲する
表5の式(21)にしたがって上記の平面A''に垂直な
射影ベクトルS→を求め、さらに後掲する表5の式(2
2)にしたがって任意の点のRGBデータ(Ri,G
i,Bi)への変換を行うことで、郵便番号101だけ
を正確に抽出することができるようになるものである。
このように、速達印や切手代用印などの有無にかかわら
ず、郵便物から郵便番号だけを抽出でき、かつ下地の色
の変化にも柔軟に対応することが可能となる。
【0076】なお、いずれの場合においても、郵便番号
を抽出するものに限らず、たとえば住所や氏名などの郵
便物上に記載されている各種の情報を抽出するものに適
用できる。その他、この発明の要旨を変えない範囲にお
いて、種々変形実施可能なことは勿論である。
【0077】
【発明の効果】以上、詳述したようにこの発明によれ
ば、複数の配色の消去すべき情報をもつ被読取物からも
抽出すべき情報だけを上手に読み取ることができるとと
もに、被読取物の配色に対する柔軟性および被読取物に
おける消去すべき情報の配色の自由度を向上することが
可能な読取装置を提供できる。また、この発明によれ
ば、後段の処理における精度を向上させることが可能な
読取装置を提供することを目的としている。
【0078】
【表1】
【0079】
【表2】
【0080】
【表3】
【0081】
【表4】
【0082】
【表5】
【図面の簡単な説明】
【図1】この発明の一実施例にかかる文字読取装置の構
成の要部を示すブロック図。
【図2】同じく、文字読取装置で処理される被読取物の
一例を示す図。
【図3】同じく、演算パラメータの算出方法について説
明するために示す図。
【図4】同じく、演算パラメータの算出にかかる写像値
の求め方を説明するために示す図。
【図5】同じく、濃淡画像における濃度分布の一例を示
す図。
【図6】この発明の他の実施例にかかる文字抽出装置の
構成を示すブロック図。
【図7】同じく、文字抽出装置で処理される被読取物の
一例を示す図。
【図8】同じく、抽出動作にかかる処理の流れを説明す
るために示すフローチャート。
【図9】同じく、配色の認識にかかる処理の流れを説明
するために示すフローチャート。
【図10】同じく、印刷に用いられた3色の生起頻度の
様子を概念的に示す図。
【図11】同じく、極大点検出の処理に用いられる近傍
点の配置例を示す図。
【図12】同じく、極大点の分布の例を示す図。
【図13】同じく、極大点データの方向ベクトルへの変
換を概念的に示す図。
【図14】同じく、クラスタ分析にかかる処理の手順を
説明するために示すフローチャート。
【図15】同じく、方向ベクトルへの変換を行った後に
極大点データを分類した場合を例に示す図。
【図16】方向ベクトルへの変換を行わずに極大点デー
タを分類した場合を例に示す図。
【図17】同じく、演算パラメータの算出方法について
説明するために示す図。
【図18】同じく、演算パラメータの算出にかかる射影
の大きさの求め方について説明するために示す図。
【図19】同じく、演算パラメータの算出にかかる射影
ベクトルの求め方について説明するために示す図。
【図20】同じく、変換後の濃淡画像における濃度分布
の一例を示す図。
【図21】同じく、被読取物として速達印のある郵便物
を例に示す図。
【図22】同じく、被読取物として切手代用印のある郵
便物を例に示す図。
【図23】同じく、被読取物として速達印や切手代用印
のない郵便物を例に示す図。
【図24】同じく、演算パラメータの算出方法について
説明するために示す図。
【図25】同じく、演算パラメータの算出にかかる射影
ベクトルの求め方について説明するために示す図。
【符号の説明】
11,110…CPU、12…データ入力回路、13,
120…プログラムメモリ、15…ルックアップテーブ
ル回路、21…カラーイメージセンサ、22…CCD駆
動回路、23…カラー画像入力回路、31,131…文
字、32,132…第1の模様、33,133…第2の
模様、101…郵便番号、102…郵便番号記入枠、1
03…速達印、105…スタンプ、140…出力回路、
210…カラーラインセンサ、220…カラー画像入力
装置、230…メモリ制御回路、240,241,24
2…フレームメモリ、P,P´,P''…被読取物。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1の色で表現される地色を有し、この
    上に第2の色で表現される抽出すべき情報と、この抽出
    すべき情報とは異なる少なくとも第3および第4の色で
    表現される情報とが混在して形成される被読取物を読取
    ることにより、複数の色成分からなる色彩データを収集
    する収集手段と、 この収集手段から収集され得る前記色成分空間におい
    て、予め設定されている除去すべき前記第1、第3及び
    第4の色に対応する色彩データがほぼ同じ値で表せる分
    布に前記収集手段により収集された色彩データを変換す
    る変換手段と、 この変換手段の結果から、 前記第2の色で表現される
    出すべき情報の色成分に関するデータのみを抽出する抽
    出手段と、 を具備したことを特徴とする読取装置。
  2. 【請求項2】 第1の色で表現される地色を有し、この
    上に第2の色で表現される抽出すべき情報と、この抽出
    すべき情報とは異なる少なくとも第3および第4の色で
    表現される情報とが混在して形成される被読取物を読取
    ることにより、複数の色成分からなる色彩データを収集
    する収集手段と、 この収集手段から収集され得る前記色成分空間におい
    て、予め設定されている除去すべき前記第1、第3及び
    第4の色に対応する色彩データを含む第1の面を算出
    し、前記収集手段で収集され得る前記色彩データで表現
    される点から前記第1の面までの距離に関連する情報を
    算出し、算出した距離に関する情報を前記点を表現する
    色彩データに対応させて記憶する記憶手段と、 前記収集手段で収集された前記色彩データに基づいて前
    記記憶手段にて記憶された算出結果を出力することによ
    り前記第2の色で表現される抽出すべき情報の色成分に
    関するデータのみを抽出する抽出手段と、 を具備したことを特徴とする読取装置。
  3. 【請求項3】 前記抽出手段は、前記第2の色で表現さ
    れる抽出すべき情報の色成分に関するデータを濃淡画像
    で抽出することを特徴とする前記請求項1に記載の読取
    装置。
JP04013067A 1991-03-30 1992-01-28 読取装置 Expired - Lifetime JP3115075B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04013067A JP3115075B2 (ja) 1991-03-30 1992-01-28 読取装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP9365291 1991-03-30
JP3-93652 1991-03-30
JP04013067A JP3115075B2 (ja) 1991-03-30 1992-01-28 読取装置

Publications (2)

Publication Number Publication Date
JPH0567234A JPH0567234A (ja) 1993-03-19
JP3115075B2 true JP3115075B2 (ja) 2000-12-04

Family

ID=26348788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04013067A Expired - Lifetime JP3115075B2 (ja) 1991-03-30 1992-01-28 読取装置

Country Status (1)

Country Link
JP (1) JP3115075B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5337563B2 (ja) * 2009-04-08 2013-11-06 日立コンピュータ機器株式会社 帳票認識方法および装置
JP5976477B2 (ja) * 2012-09-21 2016-08-23 株式会社東芝 文字読取装置、及び紙葉類処理装置

Also Published As

Publication number Publication date
JPH0567234A (ja) 1993-03-19

Similar Documents

Publication Publication Date Title
EP0853293B1 (en) Subject image extraction method and apparatus
BE1001982A7 (nl) Beeldverwerkings- en kaart produktie systemen.
US6134565A (en) Apparatus and method for extracting operator selected articles from a plurality of articles within an image of a document
FR2601167A1 (fr) Procede et systeme de generation de donnees de modele.
US6731789B1 (en) Image processing apparatus and method, and storage medium
JP3018949B2 (ja) 文字読取装置およびその方法
US5459797A (en) Character reading system
JP3115075B2 (ja) 読取装置
JP4942623B2 (ja) 彩色処理装置、彩色処理方法およびプログラム
WO2009104325A1 (ja) 線画処理装置、プログラム及び線画処理方法
JP3115041B2 (ja) 読取装置
JPH11272864A (ja) 光学文字読取方法またはその装置
JP2983344B2 (ja) 色判別装置
CN114202731A (zh) 一种多状态旋钮开关识别方法
CN112419208A (zh) 一种基于施工图审查矢量图纸编译方法及系统
JP2613211B2 (ja) 画像入力装置
JP2908548B2 (ja) 認識方式
JPH07113969B2 (ja) 画像処理方法
JP2871570B2 (ja) 文字認識装置およびその方法
JPH03211966A (ja) 切抜きマスク作成方法
JP3061899B2 (ja) 印刷物の検査装置
CN113269198A (zh) 纹样处理方法、电子设备及可读存储介质
JPH0150948B2 (ja)
JPH0522598A (ja) 画像入力装置
JPH1063251A (ja) パターン生成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070929

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080929

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080929

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090929

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090929

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100929

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110929

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110929

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120929

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120929

Year of fee payment: 12