JP2000155833A - 画像認識装置 - Google Patents
画像認識装置Info
- Publication number
- JP2000155833A JP2000155833A JP10329046A JP32904698A JP2000155833A JP 2000155833 A JP2000155833 A JP 2000155833A JP 10329046 A JP10329046 A JP 10329046A JP 32904698 A JP32904698 A JP 32904698A JP 2000155833 A JP2000155833 A JP 2000155833A
- Authority
- JP
- Japan
- Prior art keywords
- resolution
- image
- image data
- specific
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 59
- 238000004891 communication Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 25
- 239000003086 colorant Substances 0.000 description 15
- 238000013528 artificial neural network Methods 0.000 description 13
- 238000000034 method Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 入力画像の解像度に依存することなく特定の
画像の有無を認識することができる画像認識装置を提供
することを目的とする。 【解決手段】 入力画像データを所定解像度の画像デー
タに変換して出力する解像度変換部5と、解像度変換部
5から出力される所定解像度の画像データに基づいて特
定画像を認識する認識用制御部12とを有する。
画像の有無を認識することができる画像認識装置を提供
することを目的とする。 【解決手段】 入力画像データを所定解像度の画像デー
タに変換して出力する解像度変換部5と、解像度変換部
5から出力される所定解像度の画像データに基づいて特
定画像を認識する認識用制御部12とを有する。
Description
【0001】
【発明の属する技術分野】本発明は、入力された画像中
に、画像の記録が禁止された特定画像が存在するか否か
を認識する画像認識装置に関する。
に、画像の記録が禁止された特定画像が存在するか否か
を認識する画像認識装置に関する。
【0002】
【従来の技術】近年、カラー複写機やパーソナルコンピ
ュータの入出力機器であるカラースキャナー、カラープ
リンタの飛躍的な性能向上に伴い、高精度のカラー原稿
複製物を手軽に得ることが可能になってきているが、こ
れらを悪用した紙幣や有価証券等の偽造に対して防止策
を講じる必要性が高まってきている。取り扱う画像より
これらの特定画像を検出し、特定画像である場合には読
み取りを停止あるいは正常な印刷を禁止し、偽造物の生
成を未然に防止したり、ネットワーク等の手段を用いて
偽造行為を管理者に通知するなどの措置をとることで偽
造行為を防止することが必要となっており、特に複写機
には特定画像を認識して複写を禁止または制限する画像
認識装置が搭載されている。
ュータの入出力機器であるカラースキャナー、カラープ
リンタの飛躍的な性能向上に伴い、高精度のカラー原稿
複製物を手軽に得ることが可能になってきているが、こ
れらを悪用した紙幣や有価証券等の偽造に対して防止策
を講じる必要性が高まってきている。取り扱う画像より
これらの特定画像を検出し、特定画像である場合には読
み取りを停止あるいは正常な印刷を禁止し、偽造物の生
成を未然に防止したり、ネットワーク等の手段を用いて
偽造行為を管理者に通知するなどの措置をとることで偽
造行為を防止することが必要となっており、特に複写機
には特定画像を認識して複写を禁止または制限する画像
認識装置が搭載されている。
【0003】さて、この種の装置に適用される手法の一
つにパターン認識がある。これは例えば入力された画像
と予め定めたパターンの画像(パターン画像)とを比較
し、その一致度を認識指標とするものである。
つにパターン認識がある。これは例えば入力された画像
と予め定めたパターンの画像(パターン画像)とを比較
し、その一致度を認識指標とするものである。
【0004】パターン認識で用いられるパターン画像
は、予め特定の入力手段で入力された画像に基づいて得
られるが、パターン画像が基本的に対象の構造情報を表
わす以上、パターンを予め規定する場合も、入力された
画像と予め定めたパターン画像とを比較する場合も、そ
れなりに高い解像度が要求される。入力画像とパターン
画像とは原則的に同一の解像度であることが望ましい。
またパターン画像はサイズ的な制約をうける構造情報で
ある。即ちパターン画像を規定する場合と、入力画像と
パターン画像とを比較する場合とで、同一サイズのパタ
ーン画像を想定しておく必要がある。
は、予め特定の入力手段で入力された画像に基づいて得
られるが、パターン画像が基本的に対象の構造情報を表
わす以上、パターンを予め規定する場合も、入力された
画像と予め定めたパターン画像とを比較する場合も、そ
れなりに高い解像度が要求される。入力画像とパターン
画像とは原則的に同一の解像度であることが望ましい。
またパターン画像はサイズ的な制約をうける構造情報で
ある。即ちパターン画像を規定する場合と、入力画像と
パターン画像とを比較する場合とで、同一サイズのパタ
ーン画像を想定しておく必要がある。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来の画像認識装置では、入力画像の解像度と予め規定さ
れたパターン画像の解像度とが異なる場合は、結果的に
画像のスケールが異なるため、パターン認識による特定
画像の認識は困難になるという問題点を有していた。
来の画像認識装置では、入力画像の解像度と予め規定さ
れたパターン画像の解像度とが異なる場合は、結果的に
画像のスケールが異なるため、パターン認識による特定
画像の認識は困難になるという問題点を有していた。
【0006】本発明は、入力画像の解像度に依存するこ
となく特定の画像の有無を認識することができる画像認
識装置を提供することを目的とする。
となく特定の画像の有無を認識することができる画像認
識装置を提供することを目的とする。
【0007】
【課題を解決するための手段】この課題を解決するため
に本発明の画像認識装置は、入力画像データを所定解像
度の画像データに変換して出力する解像度変換部と、解
像度変換部から出力される所定解像度の画像データに基
づいて特定画像を認識する認識用制御部とを有する構成
を備えている。
に本発明の画像認識装置は、入力画像データを所定解像
度の画像データに変換して出力する解像度変換部と、解
像度変換部から出力される所定解像度の画像データに基
づいて特定画像を認識する認識用制御部とを有する構成
を備えている。
【0008】これにより、入力画像の解像度に依存する
ことなく特定の画像の有無を認識することができる画像
認識装置が得られる。
ことなく特定の画像の有無を認識することができる画像
認識装置が得られる。
【0009】
【発明の実施の形態】本発明の請求項1に記載の画像認
識装置は、入力画像データを所定解像度の画像データに
変換して出力する解像度変換部と、解像度変換部から出
力される所定解像度の画像データに基づいて特定画像を
認識する認識用制御部とを有することとしたものであ
り、入力画像データの解像度は所定解像度に変換され、
この所定解像度に変換された画像データから特定画像の
有無を認識するという作用を有する。
識装置は、入力画像データを所定解像度の画像データに
変換して出力する解像度変換部と、解像度変換部から出
力される所定解像度の画像データに基づいて特定画像を
認識する認識用制御部とを有することとしたものであ
り、入力画像データの解像度は所定解像度に変換され、
この所定解像度に変換された画像データから特定画像の
有無を認識するという作用を有する。
【0010】請求項2に記載の画像認識装置は、請求項
1に記載の画像認識装置において、入力画像データの解
像度を指定する解像度指定部と、解像度指定部で指定さ
れた指定解像度に応じて解像度変換部の変換倍率を制御
する変化倍率制御手段とを備え、変換倍率制御手段は、
解像度変換部から出力される画像データの所定解像度
を、入力画像データの解像度に関わらず、常に、一定の
解像度に制御することとしたものであり、入力画像デー
タはその解像度に関わらず常に一定の解像度の所定解像
度に変換され、その所定解像度の画像データに基づいて
特定画像の有無が正確に認識されるという作用を有す
る。
1に記載の画像認識装置において、入力画像データの解
像度を指定する解像度指定部と、解像度指定部で指定さ
れた指定解像度に応じて解像度変換部の変換倍率を制御
する変化倍率制御手段とを備え、変換倍率制御手段は、
解像度変換部から出力される画像データの所定解像度
を、入力画像データの解像度に関わらず、常に、一定の
解像度に制御することとしたものであり、入力画像デー
タはその解像度に関わらず常に一定の解像度の所定解像
度に変換され、その所定解像度の画像データに基づいて
特定画像の有無が正確に認識されるという作用を有す
る。
【0011】請求項3に記載の画像認識装置は、請求項
2に記載の画像認識装置において、解像度変換部は、解
像度指定部で予め指定された解像度範囲のうち所定範囲
の解像度の画像データについて、より低い解像度に変換
して所定解像度を得ることとしたものであり、入力画像
データはその指定解像度に基づいて容易に所定解像度の
画像データに変換され、特定画像の有無が正確に認識さ
れるという作用を有する。
2に記載の画像認識装置において、解像度変換部は、解
像度指定部で予め指定された解像度範囲のうち所定範囲
の解像度の画像データについて、より低い解像度に変換
して所定解像度を得ることとしたものであり、入力画像
データはその指定解像度に基づいて容易に所定解像度の
画像データに変換され、特定画像の有無が正確に認識さ
れるという作用を有する。
【0012】以下、本発明の実施の形態について、図1
〜図12を用いて説明する。 (実施の形態1)図1は、本発明の実施の形態1による
画像認識装置を示すブロック図である。
〜図12を用いて説明する。 (実施の形態1)図1は、本発明の実施の形態1による
画像認識装置を示すブロック図である。
【0013】図1において、1はインタフェース部(I
/F部)、2はインタフェース部1により接続された他
の装置、100はインタフェース部1を介して他の装置
2から転送されてきた解像度情報に基づいて解像度を指
定する解像度指定部、3は解像度指定部100と接続さ
れたCPU、4は特定画像認識部、5は解像度変換部、
6はシリアル通信ライン、7はメモリ、8は特徴色カウ
ンタ、9はテンプレート選択部、10はテンプレート格
納メモリ、11はバッファ、12は認識用CPU(認識
用制御部)、13は主・副画素カウンタ、14はRO
M、15は制御信号aを伝送する制御信号線、16は割
込み信号bを伝送する割込み信号線、17は作業用RA
Mである。
/F部)、2はインタフェース部1により接続された他
の装置、100はインタフェース部1を介して他の装置
2から転送されてきた解像度情報に基づいて解像度を指
定する解像度指定部、3は解像度指定部100と接続さ
れたCPU、4は特定画像認識部、5は解像度変換部、
6はシリアル通信ライン、7はメモリ、8は特徴色カウ
ンタ、9はテンプレート選択部、10はテンプレート格
納メモリ、11はバッファ、12は認識用CPU(認識
用制御部)、13は主・副画素カウンタ、14はRO
M、15は制御信号aを伝送する制御信号線、16は割
込み信号bを伝送する割込み信号線、17は作業用RA
Mである。
【0014】このように構成された画像認識装置の機能
について説明する。認識用CPU12はシリアル通信ラ
イン6でCPU3と接続され、CPU3は解像度指定部
を有し、これにより指定した入力解像度(入力画像デー
タの解像度、指定解像度)をシリアル通信ライン6を介
して認識用CPU12に通知し、認識用CPU12は指
定解像度を知ることができる。認識用CPU12は、制
御信号aにより、解像度指定部で指定した指定解像度に
関わらず、常に一定の解像度になるよう、解像度変換部
5の変換倍率を制御する変換倍率制御手段(図示せず)
を有し、解像度変換部5に対して制御パラメータ等を通
知する。解像度変換部5は、認識用CPU12から制御
信号aを介して通知された解像度変換倍率制御パラメー
タにより、入力された画像データ(入力画像データ)を
所定の解像度に変換する。解像度変換部5で所定解像度
に変換された画像データは一旦メモリ7に格納される。
特徴色カウンタ8は、予め定められた複数色の範囲の画
像データ個数をカウントして特徴色ベクトルデータを生
成する。テンプレート選択部9は、特徴色カウンタ8で
生成された特徴色ベクトルデータを予め準備した複数の
テンプレートと比較し、最もユークリッド距離が近いテ
ンプレートを選択する。テンプレート格納メモリ10
は、テンプレート選択部9における特徴ベクトルとの比
較に用いる複数のテンプレートが格納されている。バッ
ファ11は、特徴色カウンタ8でカウントした特徴色の
カウント値、テンプレート選択部10で選択されたテン
プレートの番号および特徴ベクトルデータとテンプレー
トのユークリッド距離を格納する。そして、認識用CP
U12は、画像中に特定画像が含まれるか否かを認識す
る。主・副画素カウンタ13は、入力画像データの個数
を主走査方向と副走査方向にカウントし、所定のカウン
ト数となる毎に認識用CPU12に割込み信号bを出力
する。ROM14には、認識プログラムやテンプレート
格納メモリ10に格納するテンプレートデータ、特徴色
カウンタ8で使用する色範囲の情報などが格納されてい
る。
について説明する。認識用CPU12はシリアル通信ラ
イン6でCPU3と接続され、CPU3は解像度指定部
を有し、これにより指定した入力解像度(入力画像デー
タの解像度、指定解像度)をシリアル通信ライン6を介
して認識用CPU12に通知し、認識用CPU12は指
定解像度を知ることができる。認識用CPU12は、制
御信号aにより、解像度指定部で指定した指定解像度に
関わらず、常に一定の解像度になるよう、解像度変換部
5の変換倍率を制御する変換倍率制御手段(図示せず)
を有し、解像度変換部5に対して制御パラメータ等を通
知する。解像度変換部5は、認識用CPU12から制御
信号aを介して通知された解像度変換倍率制御パラメー
タにより、入力された画像データ(入力画像データ)を
所定の解像度に変換する。解像度変換部5で所定解像度
に変換された画像データは一旦メモリ7に格納される。
特徴色カウンタ8は、予め定められた複数色の範囲の画
像データ個数をカウントして特徴色ベクトルデータを生
成する。テンプレート選択部9は、特徴色カウンタ8で
生成された特徴色ベクトルデータを予め準備した複数の
テンプレートと比較し、最もユークリッド距離が近いテ
ンプレートを選択する。テンプレート格納メモリ10
は、テンプレート選択部9における特徴ベクトルとの比
較に用いる複数のテンプレートが格納されている。バッ
ファ11は、特徴色カウンタ8でカウントした特徴色の
カウント値、テンプレート選択部10で選択されたテン
プレートの番号および特徴ベクトルデータとテンプレー
トのユークリッド距離を格納する。そして、認識用CP
U12は、画像中に特定画像が含まれるか否かを認識す
る。主・副画素カウンタ13は、入力画像データの個数
を主走査方向と副走査方向にカウントし、所定のカウン
ト数となる毎に認識用CPU12に割込み信号bを出力
する。ROM14には、認識プログラムやテンプレート
格納メモリ10に格納するテンプレートデータ、特徴色
カウンタ8で使用する色範囲の情報などが格納されてい
る。
【0015】図12は、解像度変換部における解像度変
換アルゴリズムを示すアルゴリズム図である。
換アルゴリズムを示すアルゴリズム図である。
【0016】まず主走査方向に対する解像度変換アルゴ
リズムについて図12を用いて詳細に説明する。図12
において、30は600dpiの1画素を示す。ただし
説明を容易にするため、実際の画素サイズを無視し60
0dpiの1画素30の中心位置を示している。600
dpiの各画素には先頭画素から順に、P6000,P
6001,P6002・・・P6006の番号が付与さ
れており、これらは画素の位置を示す符号である。以下
便宜的に、これらの位置に対する画素の値、例えばP6
000の位置に対応する画素値を*P6000のように
表わす(C言語におけるポインタの概念を緩用した)。
リズムについて図12を用いて詳細に説明する。図12
において、30は600dpiの1画素を示す。ただし
説明を容易にするため、実際の画素サイズを無視し60
0dpiの1画素30の中心位置を示している。600
dpiの各画素には先頭画素から順に、P6000,P
6001,P6002・・・P6006の番号が付与さ
れており、これらは画素の位置を示す符号である。以下
便宜的に、これらの位置に対する画素の値、例えばP6
000の位置に対応する画素値を*P6000のように
表わす(C言語におけるポインタの概念を緩用した)。
【0017】最初に、600dpiの画像情報を200
dpiに変換する場合について説明する。変換後の先頭
画素の位置は常に600dpiの先頭画素、即ちP60
00の位置に揃えるものとする。従って200dpiの
先頭画素位置は、P6000と同じP2000となる。
場所が同じであるから、画素値もP6000と同じ値す
なわち*P6000を採用する。次の画素位置はP20
01であるが、この画素値を得るために、P2001の
場所を600dpiの画素位置で表わすことを考える。
単純な比例式を用いて(600/200)×1=3であ
るから、P2001=P6003である。従ってP20
01の位置の画素値は*P2001=*P6003とな
る。同様にして、*P2002=*P6006も求める
ことができる。
dpiに変換する場合について説明する。変換後の先頭
画素の位置は常に600dpiの先頭画素、即ちP60
00の位置に揃えるものとする。従って200dpiの
先頭画素位置は、P6000と同じP2000となる。
場所が同じであるから、画素値もP6000と同じ値す
なわち*P6000を採用する。次の画素位置はP20
01であるが、この画素値を得るために、P2001の
場所を600dpiの画素位置で表わすことを考える。
単純な比例式を用いて(600/200)×1=3であ
るから、P2001=P6003である。従ってP20
01の位置の画素値は*P2001=*P6003とな
る。同様にして、*P2002=*P6006も求める
ことができる。
【0018】次に、600dpiの画像情報を300d
piに変換する場合について説明する。変換後の先頭画
素の位置は常に600dpiの先頭画素、即ちP600
0の位置に揃えるものとする。300dpiの先頭画素
位置は、P6000と同じであるから、画素値もP60
00と同じ値すなわち*P6000を採用する。次の画
素位置はP3001であるが、この画素値を得るため
に、P3001の場所を600dpiの画素位置で表わ
すことを考える。単純な比例式を用いて(600/30
0)×1=2であるから、P3001=P6002であ
る。従ってP3001の位置の画素値は*P3001=
*P6002となる。同様にして、*P3002=*P
6004、更に*P3003=*P6006と求めるこ
とができる。
piに変換する場合について説明する。変換後の先頭画
素の位置は常に600dpiの先頭画素、即ちP600
0の位置に揃えるものとする。300dpiの先頭画素
位置は、P6000と同じであるから、画素値もP60
00と同じ値すなわち*P6000を採用する。次の画
素位置はP3001であるが、この画素値を得るため
に、P3001の場所を600dpiの画素位置で表わ
すことを考える。単純な比例式を用いて(600/30
0)×1=2であるから、P3001=P6002であ
る。従ってP3001の位置の画素値は*P3001=
*P6002となる。同様にして、*P3002=*P
6004、更に*P3003=*P6006と求めるこ
とができる。
【0019】次に、600dpiの画像情報を400d
piに変換する場合について説明する。変換後の先頭画
素の位置は常に600dpiの先頭画素、即ちP600
0の位置に揃えるものとする。400dpiの先頭画素
位置は、P6000と同じであるから、画素値もP60
00と同じ値すなわち*P6000を採用する。次の画
素位置はP4001であるが、この画素値を得るため
に、P4001の場所を600dpiの画素位置で表わ
すことを考える。単純な比例式を用いて計算すると、
(600/400)×1=1.5となり、P4001は
P6001とP6002の間に存在することが分かる。
そこで1.5という位置情報を用いてP4001の画素
値は(数1)のように計算される。
piに変換する場合について説明する。変換後の先頭画
素の位置は常に600dpiの先頭画素、即ちP600
0の位置に揃えるものとする。400dpiの先頭画素
位置は、P6000と同じであるから、画素値もP60
00と同じ値すなわち*P6000を採用する。次の画
素位置はP4001であるが、この画素値を得るため
に、P4001の場所を600dpiの画素位置で表わ
すことを考える。単純な比例式を用いて計算すると、
(600/400)×1=1.5となり、P4001は
P6001とP6002の間に存在することが分かる。
そこで1.5という位置情報を用いてP4001の画素
値は(数1)のように計算される。
【0020】 *P4001=(1.5−1)×(*P6001)+(2−1.5) ×(*P6002)・・・・・・(数1) これは解像度変換後の画素が存在する位置を600dp
iの画素位置を基準として求め、隣接する600dpi
の画素との距離に基づいて重み付け演算を行うことで、
解像度変換後の画素値を求めていることにほかならな
い。P4002について上記の考え方を適用すると、
(600/400)×2=3となり、P4002はP6
003の位置に存在することが分かる。従って*P40
02=*P6003である。更にP4003について上
記の考え方を適用すると、(600/400)×3=
4.5となり、P4003はP6004とP6005の
間に存在することが分かる。そこで4.5という位置情
報を用いてP4003の画素値は(数2)のように計算
される。
iの画素位置を基準として求め、隣接する600dpi
の画素との距離に基づいて重み付け演算を行うことで、
解像度変換後の画素値を求めていることにほかならな
い。P4002について上記の考え方を適用すると、
(600/400)×2=3となり、P4002はP6
003の位置に存在することが分かる。従って*P40
02=*P6003である。更にP4003について上
記の考え方を適用すると、(600/400)×3=
4.5となり、P4003はP6004とP6005の
間に存在することが分かる。そこで4.5という位置情
報を用いてP4003の画素値は(数2)のように計算
される。
【0021】 *P4003=(4.5−3)×(*P6004)+(5−4.5) ×(*P6005)・・・・・・・・(数2) 以降の画素についても同様にして画素値を求めることが
できる。また、500dpiへの解像度変換についても
全く同じ考え方で処理することができる。
できる。また、500dpiへの解像度変換についても
全く同じ考え方で処理することができる。
【0022】さて、上述のごとく主走査方向の解像度変
換処理として600dpiから他の解像度への変換を説
明してきたが、これは入力された画像データの解像度
(入力解像度)を600dpiに指定した場合に限って
適用される演算方法ではなく、入力解像度と変換後の解
像度が分かっていれば、あらゆる場合に適用可能な方法
である。例えば入力された画像データが225dpiの
解像度で指定された場合、副走査方向の画像データにつ
いても全く同様にして例えば150dpiに変換ができ
る。
換処理として600dpiから他の解像度への変換を説
明してきたが、これは入力された画像データの解像度
(入力解像度)を600dpiに指定した場合に限って
適用される演算方法ではなく、入力解像度と変換後の解
像度が分かっていれば、あらゆる場合に適用可能な方法
である。例えば入力された画像データが225dpiの
解像度で指定された場合、副走査方向の画像データにつ
いても全く同様にして例えば150dpiに変換ができ
る。
【0023】以上のようにして、主走査方向または副走
査方向の画像データの解像度をCPU3の解像度指定部
により指定すると、認識用CPU12の変換倍率制御手
段によって、入力された画像データの解像度に関わらず
常に一定の解像度に変換することができるので、主走査
・副走査方向とも、例えば150dpiの所定解像度の
画像データを取得することができる。さらに、解像度指
定部により主走査方向または副走査方向の予め定められ
た画像データの解像度範囲のうち所定範囲の解像度(例
えば500dpi)を指定すると、認識用CPU12の
変換倍率制御手段によって、指定された解像度の画像デ
ータについて解像度を低く変換して所定の解像度(例え
ば500dpiよりも低い解像度)に変換することも可
能であり、主走査・副走査方向とも、例えば75dpi
の所定解像度の画像データを取得することができる。
査方向の画像データの解像度をCPU3の解像度指定部
により指定すると、認識用CPU12の変換倍率制御手
段によって、入力された画像データの解像度に関わらず
常に一定の解像度に変換することができるので、主走査
・副走査方向とも、例えば150dpiの所定解像度の
画像データを取得することができる。さらに、解像度指
定部により主走査方向または副走査方向の予め定められ
た画像データの解像度範囲のうち所定範囲の解像度(例
えば500dpi)を指定すると、認識用CPU12の
変換倍率制御手段によって、指定された解像度の画像デ
ータについて解像度を低く変換して所定の解像度(例え
ば500dpiよりも低い解像度)に変換することも可
能であり、主走査・副走査方向とも、例えば75dpi
の所定解像度の画像データを取得することができる。
【0024】次に、本実施の形態による画像認識装置に
おける特定画像認識アルゴリズムについて図1を用い
て、まず概要を説明する。
おける特定画像認識アルゴリズムについて図1を用い
て、まず概要を説明する。
【0025】解像度変換部5によって所定の解像度に変
換されたRGB画像信号は、一旦メモリ7に格納され
る。メモリ7に格納されたRGB画像信号は予め定めら
れたサイズのブロック単位に切り出され、RGB点順次
信号として特徴色カウンタ8に送られる。上記ブロック
のサイズは例えば50×50画素(2500画素)に設
定されている。特徴色カウンタ8は入力されたRGB画
像信号に対して、予め特徴色として定めたRGB値の範
囲に入っている画素の数をカウントする。このカウント
範囲は予めROM14に格納されており、動作時に特徴
色カウンタ8にセットされる。本実施の形態では特定画
像に含まれる異なる3色を特徴色として定義しており、
各ブロックに対して、特徴色と判断された画素数をカウ
ントする。
換されたRGB画像信号は、一旦メモリ7に格納され
る。メモリ7に格納されたRGB画像信号は予め定めら
れたサイズのブロック単位に切り出され、RGB点順次
信号として特徴色カウンタ8に送られる。上記ブロック
のサイズは例えば50×50画素(2500画素)に設
定されている。特徴色カウンタ8は入力されたRGB画
像信号に対して、予め特徴色として定めたRGB値の範
囲に入っている画素の数をカウントする。このカウント
範囲は予めROM14に格納されており、動作時に特徴
色カウンタ8にセットされる。本実施の形態では特定画
像に含まれる異なる3色を特徴色として定義しており、
各ブロックに対して、特徴色と判断された画素数をカウ
ントする。
【0026】1ブロックの特徴色カウントが終了する
と、その結果はテンプレート選択部9に転送されると共
にバッファ11に書き込まれる。さて、この特徴色カウ
ンタ8から出力されるのは、50×50画素ブロック内
に存在する複数の特徴色の個数をそれぞれ計数したもの
である。特徴色の数が3であるから、これは3次元の特
徴ベクトルを出力していると見なすことができる。即ち
特徴色カウンタ8は特徴ベクトルの生成を行っているこ
とになる。テンプレート選択部9は、特徴色カウンタ8
で生成された特徴ベクトルと、テンプレート格納メモリ
10に予め格納されている複数のテンプレートとを3次
元ユークリッド距離に基づいて比較し、もっとも近いテ
ンプレートを選択するとともに、テンプレート番号と3
次元ユークリッド距離をバッファ11に格納する。最近
傍テンプレート番号と3次元ユークリッド距離は、入力
された画像データと特定画像の類似度を示す指標とな
る。
と、その結果はテンプレート選択部9に転送されると共
にバッファ11に書き込まれる。さて、この特徴色カウ
ンタ8から出力されるのは、50×50画素ブロック内
に存在する複数の特徴色の個数をそれぞれ計数したもの
である。特徴色の数が3であるから、これは3次元の特
徴ベクトルを出力していると見なすことができる。即ち
特徴色カウンタ8は特徴ベクトルの生成を行っているこ
とになる。テンプレート選択部9は、特徴色カウンタ8
で生成された特徴ベクトルと、テンプレート格納メモリ
10に予め格納されている複数のテンプレートとを3次
元ユークリッド距離に基づいて比較し、もっとも近いテ
ンプレートを選択するとともに、テンプレート番号と3
次元ユークリッド距離をバッファ11に格納する。最近
傍テンプレート番号と3次元ユークリッド距離は、入力
された画像データと特定画像の類似度を示す指標とな
る。
【0027】さて、特徴色カウンタ8で処理される全画
素数は、主・副画素カウンタ13で計数・管理されてお
り、ここで処理した画素数のカウント結果が所定量に達
すると、主・副画素カウンタ13は認識用CPU12に
対して割り込み信号bを発生する。割り込み信号bを受
けて認識用CPU12は、バッファ11を読み取り、こ
こに格納されている特徴色カウント結果、最近傍テンプ
レート番号、3次元ユークリッド距離を入手する。認識
用CPU12は、バッファ11から読み取った最近傍テ
ンプレート番号、3次元ユークリッド距離に基づく類似
度を一定のルールに従って複数のブロック分選択し、そ
れらの和を計算し、その和に応じて判定結果を出力す
る。判定結果は認識用CPU12からシリアル通信ライ
ン6を介してCPU3に伝えられる。CPU3は結果を
インタフェース部1に出力し、この判定結果はSCSI
によって、ホストコンピュータや画像記録装置などの他
の装置2に出力される。
素数は、主・副画素カウンタ13で計数・管理されてお
り、ここで処理した画素数のカウント結果が所定量に達
すると、主・副画素カウンタ13は認識用CPU12に
対して割り込み信号bを発生する。割り込み信号bを受
けて認識用CPU12は、バッファ11を読み取り、こ
こに格納されている特徴色カウント結果、最近傍テンプ
レート番号、3次元ユークリッド距離を入手する。認識
用CPU12は、バッファ11から読み取った最近傍テ
ンプレート番号、3次元ユークリッド距離に基づく類似
度を一定のルールに従って複数のブロック分選択し、そ
れらの和を計算し、その和に応じて判定結果を出力す
る。判定結果は認識用CPU12からシリアル通信ライ
ン6を介してCPU3に伝えられる。CPU3は結果を
インタフェース部1に出力し、この判定結果はSCSI
によって、ホストコンピュータや画像記録装置などの他
の装置2に出力される。
【0028】次に、特徴色カウンタ8について詳細に説
明する。図2は特徴色カウンタの構成を示すブロック図
である。図2において、18C0、18C1、18C2
はそれぞれ独立した特徴色を検出する特徴色検出部であ
る。本実施の形態では3つの特徴色を検出しているた
め、3つの特徴色検出部18C0、18C1、18C2
を有している。各特徴色検出部18C0、18C1、1
8C2はそれぞれ異なる色を検出する点を除けば構成上
の差異はないため、一色分のみ詳細に示している。19
は比較器であり、入力されたRGB画像データを予め定
められた値と比較し、画像データが所定の範囲に入るか
否かを検出する。20はANDゲートであり、比較器1
9の出力に対してAND処理を行い、結果を出力する。
21はカウンタで、ANDゲート20の出力が1となっ
た回数をカウントする。22はカウントバッファで、カ
ウンタ21のカウント結果を累積する。
明する。図2は特徴色カウンタの構成を示すブロック図
である。図2において、18C0、18C1、18C2
はそれぞれ独立した特徴色を検出する特徴色検出部であ
る。本実施の形態では3つの特徴色を検出しているた
め、3つの特徴色検出部18C0、18C1、18C2
を有している。各特徴色検出部18C0、18C1、1
8C2はそれぞれ異なる色を検出する点を除けば構成上
の差異はないため、一色分のみ詳細に示している。19
は比較器であり、入力されたRGB画像データを予め定
められた値と比較し、画像データが所定の範囲に入るか
否かを検出する。20はANDゲートであり、比較器1
9の出力に対してAND処理を行い、結果を出力する。
21はカウンタで、ANDゲート20の出力が1となっ
た回数をカウントする。22はカウントバッファで、カ
ウンタ21のカウント結果を累積する。
【0029】以上の構成を有する特徴色カウンタ8につ
いて詳細に説明する。特徴色カウンタ8は特定画像に含
まれる3つの特定色を検出してそれぞれの個数を検出す
る部分であるが、ここでは説明を簡単にするために、1
つの特徴色について特徴色検出部18C0の動作を詳細
に説明する。まず入力されたRGB信号とは比較器19
によって指定色信号と比較される。この指定色信号は認
識用CPU12によって比較器19のレジスタにセット
される。指定色信号は特定画像に含まれる色を指定する
ものであり、目的とする特定画像に含まれる色を統計処
理することによってあらかじめ求めておき、一般には特
定画像の地肌色や絵柄に使用され広い範囲に分布する
色、または、押印の朱色などを用いる。なお、色を指定
するにあたって、指定色に幅を持たせるためにRGBの
各上限、下限の値を例えば、r_ref1(R信号に対
する下限値)、r_ref2(R信号に対する上限値)
のように指定し、これらの範囲に入る画素を特定色画素
として扱う。比較器19の出力はANDゲート20によ
ってまとめられ、入力画像データが特定色の範囲である
場合、比較器19からの出力が全て「1」となるために
ANDゲート20の出力が「1」となる。このように検
出された特定色画素の画素数をカウンタ21によってカ
ウントする。
いて詳細に説明する。特徴色カウンタ8は特定画像に含
まれる3つの特定色を検出してそれぞれの個数を検出す
る部分であるが、ここでは説明を簡単にするために、1
つの特徴色について特徴色検出部18C0の動作を詳細
に説明する。まず入力されたRGB信号とは比較器19
によって指定色信号と比較される。この指定色信号は認
識用CPU12によって比較器19のレジスタにセット
される。指定色信号は特定画像に含まれる色を指定する
ものであり、目的とする特定画像に含まれる色を統計処
理することによってあらかじめ求めておき、一般には特
定画像の地肌色や絵柄に使用され広い範囲に分布する
色、または、押印の朱色などを用いる。なお、色を指定
するにあたって、指定色に幅を持たせるためにRGBの
各上限、下限の値を例えば、r_ref1(R信号に対
する下限値)、r_ref2(R信号に対する上限値)
のように指定し、これらの範囲に入る画素を特定色画素
として扱う。比較器19の出力はANDゲート20によ
ってまとめられ、入力画像データが特定色の範囲である
場合、比較器19からの出力が全て「1」となるために
ANDゲート20の出力が「1」となる。このように検
出された特定色画素の画素数をカウンタ21によってカ
ウントする。
【0030】さて、このカウントはブロック単位におこ
なっている。ここでブロックとは、読み取り画像を主走
査方向、副走査方向に複数画素単位で分けたもので、こ
こでは解像度変換部5によって変換された所定解像度の
画素に対し50画素を単位として、50×50画素の矩
形を1ブロックとする。したがって、カウンタ21は5
0画素の入力毎にカウント結果をカウントバッファ22
に保存しリセットされる。カウントバッファ22は主走
査方向のブロック数分存在し、副走査方向に1ブロック
分のデータが記録される。カウンタ21からカウントバ
ッファ22への記録に際しては、常にカウントバッファ
22上にすでに書き込まれているデータに対する加算結
果を書き込む、即ちリード・モディファイ・ライトの動
作を行うことで副走査方向1ブロックの特徴色画素数が
累積される。副走査方向に1ブロック分のデータ入力が
完結すると、カウントバッファ22の内容、即ちブロッ
ク毎に求められた特徴色の計数結果はバッファ11に格
納されると共にテンプレート選択部9に渡される。
なっている。ここでブロックとは、読み取り画像を主走
査方向、副走査方向に複数画素単位で分けたもので、こ
こでは解像度変換部5によって変換された所定解像度の
画素に対し50画素を単位として、50×50画素の矩
形を1ブロックとする。したがって、カウンタ21は5
0画素の入力毎にカウント結果をカウントバッファ22
に保存しリセットされる。カウントバッファ22は主走
査方向のブロック数分存在し、副走査方向に1ブロック
分のデータが記録される。カウンタ21からカウントバ
ッファ22への記録に際しては、常にカウントバッファ
22上にすでに書き込まれているデータに対する加算結
果を書き込む、即ちリード・モディファイ・ライトの動
作を行うことで副走査方向1ブロックの特徴色画素数が
累積される。副走査方向に1ブロック分のデータ入力が
完結すると、カウントバッファ22の内容、即ちブロッ
ク毎に求められた特徴色の計数結果はバッファ11に格
納されると共にテンプレート選択部9に渡される。
【0031】上記の動作は特徴色検出部18C1、特徴
色検出部18C2でも並列に行なわれており、予め定め
られた指定色信号に対して3つの特徴色がカウントさ
れ、それぞれのカウント結果は3次元ベクトル、即ち特
徴ベクトルとしてバッファ11に格納されると供にテン
プレート選択部9に渡される。
色検出部18C2でも並列に行なわれており、予め定め
られた指定色信号に対して3つの特徴色がカウントさ
れ、それぞれのカウント結果は3次元ベクトル、即ち特
徴ベクトルとしてバッファ11に格納されると供にテン
プレート選択部9に渡される。
【0032】図3はバッファに格納されるデータのデー
タ構造を示すデータ図である。図中、太実線が各ブロッ
クの区切れを示しており、C0(n)、C1(n)、C
2(n)はそれぞれで、第nブロックでカウントされた
特徴色画素カウントの結果を示し、1つのブロック特徴
データを3つの特定色画素数で構成していることを表し
ている。
タ構造を示すデータ図である。図中、太実線が各ブロッ
クの区切れを示しており、C0(n)、C1(n)、C
2(n)はそれぞれで、第nブロックでカウントされた
特徴色画素カウントの結果を示し、1つのブロック特徴
データを3つの特定色画素数で構成していることを表し
ている。
【0033】次に、テンプレート選択部9について詳細
に説明する。図4はテンプレート選択部の動作を示すフ
ローチャートである。以降の説明では図1と図4を併用
する。特徴色カウンタ8からテンプレート選択部9に、
3つの特徴色のカウント値で構成される特徴ベクトルが
ブロック毎に渡されると、特徴ベクトルとテンプレート
の比較が行なわれる。まずブロック毎の特徴ベクトルを
取得する(S1)。取得したデータは3次元のベクトル
データとして、Cn=(C0(n),C1(n),C2
(n))(但し、nはブロックの番号)として表す。こ
のCnの大きさ|Cn|が一定値以上か否かを判定する
(S2)。一定以上である場合には、テンプレート格納
メモリ10に記憶されているテンプレートから、Cnに
もっとも近いものを検索する。テンプレート格納メモリ
10のテンプレートはTm=(TC0(m),TC1
(m),TC2(m))(但し、mは参照データ番号;
m=1〜M)のデータ構造を有しており、距離Dnm=
|Cn−Tm|(3次元ベクトルのユークリッド距離)
が最も小さくなる時のDnmを検出し、テンプレート番
号mと距離データDminをバッファ11に格納する
(S3)。また、ステップ2において|Cn|が一定値
を超えない場合は、ステップ3のテンプレート検索を行
わず、テンプレートが定義されていないテンプレート番
号(例えばM+1)とDnmの取りうる最大値以上の値
Dmaxをバッファ11に格納する(S4)。
に説明する。図4はテンプレート選択部の動作を示すフ
ローチャートである。以降の説明では図1と図4を併用
する。特徴色カウンタ8からテンプレート選択部9に、
3つの特徴色のカウント値で構成される特徴ベクトルが
ブロック毎に渡されると、特徴ベクトルとテンプレート
の比較が行なわれる。まずブロック毎の特徴ベクトルを
取得する(S1)。取得したデータは3次元のベクトル
データとして、Cn=(C0(n),C1(n),C2
(n))(但し、nはブロックの番号)として表す。こ
のCnの大きさ|Cn|が一定値以上か否かを判定する
(S2)。一定以上である場合には、テンプレート格納
メモリ10に記憶されているテンプレートから、Cnに
もっとも近いものを検索する。テンプレート格納メモリ
10のテンプレートはTm=(TC0(m),TC1
(m),TC2(m))(但し、mは参照データ番号;
m=1〜M)のデータ構造を有しており、距離Dnm=
|Cn−Tm|(3次元ベクトルのユークリッド距離)
が最も小さくなる時のDnmを検出し、テンプレート番
号mと距離データDminをバッファ11に格納する
(S3)。また、ステップ2において|Cn|が一定値
を超えない場合は、ステップ3のテンプレート検索を行
わず、テンプレートが定義されていないテンプレート番
号(例えばM+1)とDnmの取りうる最大値以上の値
Dmaxをバッファ11に格納する(S4)。
【0034】ここで、テンプレート格納メモリ10に収
められているテンプレートについて詳細に説明する。テ
ンプレート格納メモリ10はRAMであり、ROM14
に予め格納された値を認識用CPU12によりコピーし
ている。テンプレートは、対象とする特定画像よりあら
かじめ求め、これらを格納しておく。
められているテンプレートについて詳細に説明する。テ
ンプレート格納メモリ10はRAMであり、ROM14
に予め格納された値を認識用CPU12によりコピーし
ている。テンプレートは、対象とする特定画像よりあら
かじめ求め、これらを格納しておく。
【0035】図5(a)、(b)、(c)、(d)はテ
ンプレートと特定画像の関係を示す説明図である。テン
プレートは、図5に示すように、対象とする特定画像を
水平位置に置いたときを基準(a)とし、対象とする特
定画像を水平位置から微少角度単位で回転させたとき
(図5(b)、(c))、また、ブロックと特定画像の
位置関係を、水平及び垂直方向に数画素単位にシフトさ
せたとき(図5(d))の各ブロックに対し、各特徴色
に値する画素数を求めたものをテンプレートとしてい
る。但し、以上のようにして求められるテンプレートは
膨大な数になるために、ベクトル量子化などのクラスタ
リング手法を用いて代表的なものを抽出し、ROM14
に格納しておく。
ンプレートと特定画像の関係を示す説明図である。テン
プレートは、図5に示すように、対象とする特定画像を
水平位置に置いたときを基準(a)とし、対象とする特
定画像を水平位置から微少角度単位で回転させたとき
(図5(b)、(c))、また、ブロックと特定画像の
位置関係を、水平及び垂直方向に数画素単位にシフトさ
せたとき(図5(d))の各ブロックに対し、各特徴色
に値する画素数を求めたものをテンプレートとしてい
る。但し、以上のようにして求められるテンプレートは
膨大な数になるために、ベクトル量子化などのクラスタ
リング手法を用いて代表的なものを抽出し、ROM14
に格納しておく。
【0036】特定画像の認識過程について、まず図1を
用いて説明する。テンプレート選択部9の出力はバッフ
ァ11に一旦格納される。これらの処理が所定量のブロ
ック分終了した段階で主・副画素カウンタ13は割り込
み信号bを発生させ、認識用CPU12にバッファ11
の内容を取得するよう要求する。認識用CPU12はバ
ッファ11の内容を読み込み、作業用RAM17に格納
する。
用いて説明する。テンプレート選択部9の出力はバッフ
ァ11に一旦格納される。これらの処理が所定量のブロ
ック分終了した段階で主・副画素カウンタ13は割り込
み信号bを発生させ、認識用CPU12にバッファ11
の内容を取得するよう要求する。認識用CPU12はバ
ッファ11の内容を読み込み、作業用RAM17に格納
する。
【0037】図6は作業用RAM内のデータ構成を示し
たデータ図である。図中、TN(n)はそれぞれ各ブロ
ックに対して求められた特徴ベクトルに最も近いテンプ
レート番号である。またD(n)はそれぞれ各ブロック
に対して求められた、特徴ベクトルに最も近いテンプレ
ートとの距離DminもしくはDmaxである。
たデータ図である。図中、TN(n)はそれぞれ各ブロ
ックに対して求められた特徴ベクトルに最も近いテンプ
レート番号である。またD(n)はそれぞれ各ブロック
に対して求められた、特徴ベクトルに最も近いテンプレ
ートとの距離DminもしくはDmaxである。
【0038】図7(a)、(b)、(c)は、実際の特
定画像の各ブロックに対して与えられるTN(n)とD
(n)のイメージを示すイメージ図である。図7(a)
は特定画像を含んだ画像であり、(b)は各ブロックに
対するTN(n)の値を示したもので、ここではテンプ
レートの番号は最大254としており、テンプレートと
して定義されてない番号は254+1=255とする。
図7(c)は各ブロックに対するD(n)の値を示した
ものであり、図中の「00」の部分はDmaxもしくは
それに近い値を示し、特定画像と色味が全く似ていない
画像だということを意味する。また図中の「02」はD
minであり、特徴ベクトルとテンプレート間の距離の
値が0またはそれに近い値、即ち特定画像に色味が非常
に類似した画像を意味している。また図中の「01」部
分はその中間の値、即ち曖昧な画像を意味している。
定画像の各ブロックに対して与えられるTN(n)とD
(n)のイメージを示すイメージ図である。図7(a)
は特定画像を含んだ画像であり、(b)は各ブロックに
対するTN(n)の値を示したもので、ここではテンプ
レートの番号は最大254としており、テンプレートと
して定義されてない番号は254+1=255とする。
図7(c)は各ブロックに対するD(n)の値を示した
ものであり、図中の「00」の部分はDmaxもしくは
それに近い値を示し、特定画像と色味が全く似ていない
画像だということを意味する。また図中の「02」はD
minであり、特徴ベクトルとテンプレート間の距離の
値が0またはそれに近い値、即ち特定画像に色味が非常
に類似した画像を意味している。また図中の「01」部
分はその中間の値、即ち曖昧な画像を意味している。
【0039】認識用CPU12は作業用RAM17上に
展開されたTN(n)とD(n)の分布状態と、後述す
るフレームマスクとに基づき特定画像の有無判定を行
う。まず最初にD(n)を用いて行うフレーム判定処理
について説明する。フレーム判定処理では、複数の隣接
ブロックの集まりを1つのフレームとし、フレームは、
その中心位置が入力画像の左上から水平、垂直方向に1
ブロック単位にシフトするようにしながら処理を行う。
展開されたTN(n)とD(n)の分布状態と、後述す
るフレームマスクとに基づき特定画像の有無判定を行
う。まず最初にD(n)を用いて行うフレーム判定処理
について説明する。フレーム判定処理では、複数の隣接
ブロックの集まりを1つのフレームとし、フレームは、
その中心位置が入力画像の左上から水平、垂直方向に1
ブロック単位にシフトするようにしながら処理を行う。
【0040】次に、フレームマスクについて図8を用い
て説明する。図8はフレームマスクの構造を示すマスク
構造図である。フレームマスクとはフレームを構成する
ブロックにマスクをかけるもので、図8に示すようにマ
スク角度の異なるものを複数用意する。図8において、
斜線付き四角がマスクブロック、白四角が非マスクブロ
ックを示し、前者を「0」、後者を「1」の2値で表し
たコードをプログラムの一部としてROM14に収めて
おく。
て説明する。図8はフレームマスクの構造を示すマスク
構造図である。フレームマスクとはフレームを構成する
ブロックにマスクをかけるもので、図8に示すようにマ
スク角度の異なるものを複数用意する。図8において、
斜線付き四角がマスクブロック、白四角が非マスクブロ
ックを示し、前者を「0」、後者を「1」の2値で表し
たコードをプログラムの一部としてROM14に収めて
おく。
【0041】図9は、フレーム処理において、1つのフ
レームに対する処理内容を示すフローチャートである。
まず、フレーム中央のブロックに対して、特徴ベクトル
と選択されたテンプレートとの距離D(n)を読み込
み、閾値Th1と比較し、閾値Th1より大きい(距離
が遠い)場合はこのフレームに対しては特定画像はなか
ったものとし、次のフレームに移動する。もし閾値Th
1以下(距離が近い)のときはROM14からフレーム
マスクの1つを取得する(S11、S12)。取得した
フレームマスクを1ブロック毎に順次見て行き、マスク
ブロックに対しては以下の処理を飛ばし、非マスクブロ
ックに対してはそれに対応するブロックのD(n)を作
業用RAM17から取得する(S13、S14)。取得
したD(n)はDsumに逐次加算し(S15)、ま
た、処理を行ったブロック数をカウントするカウンタ値
Bnumをインクリメントしていく(S16)。ステッ
プ13からステップ16までの処理を、フレームを構成
するブロックが終了するまで行う(S17)。ブロック
数カウンタ値Bnumと距離の総和Dsumより、平均
距離Dmeanを求め(S18)、これを閾値Th2と
比較する。Dmean≦Th2の場合には、画像中に特
定画像が含まれる可能性が高いと判定する(S19)。
また、Dmean>Th2の場合は特定画像はなかった
と判定し、フレームマスクを変えてステップ12〜19
を繰り返す(S20)。
レームに対する処理内容を示すフローチャートである。
まず、フレーム中央のブロックに対して、特徴ベクトル
と選択されたテンプレートとの距離D(n)を読み込
み、閾値Th1と比較し、閾値Th1より大きい(距離
が遠い)場合はこのフレームに対しては特定画像はなか
ったものとし、次のフレームに移動する。もし閾値Th
1以下(距離が近い)のときはROM14からフレーム
マスクの1つを取得する(S11、S12)。取得した
フレームマスクを1ブロック毎に順次見て行き、マスク
ブロックに対しては以下の処理を飛ばし、非マスクブロ
ックに対してはそれに対応するブロックのD(n)を作
業用RAM17から取得する(S13、S14)。取得
したD(n)はDsumに逐次加算し(S15)、ま
た、処理を行ったブロック数をカウントするカウンタ値
Bnumをインクリメントしていく(S16)。ステッ
プ13からステップ16までの処理を、フレームを構成
するブロックが終了するまで行う(S17)。ブロック
数カウンタ値Bnumと距離の総和Dsumより、平均
距離Dmeanを求め(S18)、これを閾値Th2と
比較する。Dmean≦Th2の場合には、画像中に特
定画像が含まれる可能性が高いと判定する(S19)。
また、Dmean>Th2の場合は特定画像はなかった
と判定し、フレームマスクを変えてステップ12〜19
を繰り返す(S20)。
【0042】上述したフレーム判定処理で処理している
画像中に特定画像が含まれる可能性が高いと判定された
場合は最終判定を行う。以降、最終判定処理について図
10と図11を用いて説明する。図10(a)、(b)
は最終判定における回転角補正を示す説明図である。最
終判定には、各画像ブロックの特徴ベクトルと最も距離
が近いテンプレート番号が記述されたTN(n)を用い
る。しかし、フレーム判定処理で切り出された画像には
正置配置ではない特定画像が含まれる可能性もある。上
述したフレーム判定処理のS19で、画像中に特定画像
が含まれる可能性が高いと判定された時点で用いられた
フレームマスクの種類によって、フレーム判定の段階で
特定画像の配置されている角度の見当をつけることがで
きる。この情報に基づいてTN(n)そのものを正置位
置に配置しなおす。図10はその状況を示すものであ
り、図中(a)は回転補正前、(b)は回転補正後の状
況を示している。各々の図で、○印、□印、△印の位置
が対応している。次に図11を用いて最終判定処理を説
明する。図11は最終判定におけるフレームとブロック
と認識処理の関係を示す説明図であり、前述した回転補
正が行なわれた後を想定している。図中にある○印、□
印、△印は図10のものと対応している。図10(b)
では正置配置後のブロックは一部階段状になっている
が、最終判定では図11に示すように特定原稿が正置配
置されたものとみなして処理を行う。
画像中に特定画像が含まれる可能性が高いと判定された
場合は最終判定を行う。以降、最終判定処理について図
10と図11を用いて説明する。図10(a)、(b)
は最終判定における回転角補正を示す説明図である。最
終判定には、各画像ブロックの特徴ベクトルと最も距離
が近いテンプレート番号が記述されたTN(n)を用い
る。しかし、フレーム判定処理で切り出された画像には
正置配置ではない特定画像が含まれる可能性もある。上
述したフレーム判定処理のS19で、画像中に特定画像
が含まれる可能性が高いと判定された時点で用いられた
フレームマスクの種類によって、フレーム判定の段階で
特定画像の配置されている角度の見当をつけることがで
きる。この情報に基づいてTN(n)そのものを正置位
置に配置しなおす。図10はその状況を示すものであ
り、図中(a)は回転補正前、(b)は回転補正後の状
況を示している。各々の図で、○印、□印、△印の位置
が対応している。次に図11を用いて最終判定処理を説
明する。図11は最終判定におけるフレームとブロック
と認識処理の関係を示す説明図であり、前述した回転補
正が行なわれた後を想定している。図中にある○印、□
印、△印は図10のものと対応している。図10(b)
では正置配置後のブロックは一部階段状になっている
が、最終判定では図11に示すように特定原稿が正置配
置されたものとみなして処理を行う。
【0043】図11において、23はフレーム判定で特
定画像の存在する可能性が高いと判定されたフレームに
ついて、更にTN(n)が255(=テンプレート未定
義)以外の値を持つブロックの集合である。24はブロ
ックの集合23に含まれるブロックであり、説明を容易
にするため各ブロック毎にテンプレートをブロックヒス
トグラムとして記載している。25は最終判定部であ
り、ニューラルネットワークにて構成されている。26
はニューラルネットワークの入力層を、27はニューラ
ルネットワークの中間層を、28はニューラルネットワ
ークの出力層をそれぞれ示す。29は比較部であり、ニ
ューラルネットワークの出力層28から出力される2つ
の出力を比較して大きい方を選択する。
定画像の存在する可能性が高いと判定されたフレームに
ついて、更にTN(n)が255(=テンプレート未定
義)以外の値を持つブロックの集合である。24はブロ
ックの集合23に含まれるブロックであり、説明を容易
にするため各ブロック毎にテンプレートをブロックヒス
トグラムとして記載している。25は最終判定部であ
り、ニューラルネットワークにて構成されている。26
はニューラルネットワークの入力層を、27はニューラ
ルネットワークの中間層を、28はニューラルネットワ
ークの出力層をそれぞれ示す。29は比較部であり、ニ
ューラルネットワークの出力層28から出力される2つ
の出力を比較して大きい方を選択する。
【0044】さて、回転補正により、正置配置位置に変
換されたブロックは、それぞれテンプレート番号TN
(n)を持っている。テンプレート番号とは実際は、特
定画像に含まれる特徴ベクトルそのものであるから、こ
れらは、図11のブロック24のようにヒストグラムで
示すことができる。このヒストグラムの度数を最終判定
部25のニューラルネットワークの入力層26に入力す
る。ニューラルネットワークの入力層26は一つの入力
ユニットについて、ヒストグララムが有する3次元情報
に対応するため3つのノードを有しており、ヒストグラ
ムの度数はそれぞれのノードに対して入力される。全て
のブロックについて対応したノードに度数入力を行う。
ニューラルネットワークは予め学習しておいた重み付け
演算によりニューラルネットワークの中間層27で演算
がなされ、ニューラルネットワークの出力層28では特
定画像らしい度合いと、特定画像らしくない度合いを出
力する。最後に比較部29で、より大きな度合いを出力
した方を選択して出力する。従って比較部29の出力
は、入力された画像が特定画像であるか否かの2値出力
となる。以上の動作により特定画像の検出が可能とな
る。
換されたブロックは、それぞれテンプレート番号TN
(n)を持っている。テンプレート番号とは実際は、特
定画像に含まれる特徴ベクトルそのものであるから、こ
れらは、図11のブロック24のようにヒストグラムで
示すことができる。このヒストグラムの度数を最終判定
部25のニューラルネットワークの入力層26に入力す
る。ニューラルネットワークの入力層26は一つの入力
ユニットについて、ヒストグララムが有する3次元情報
に対応するため3つのノードを有しており、ヒストグラ
ムの度数はそれぞれのノードに対して入力される。全て
のブロックについて対応したノードに度数入力を行う。
ニューラルネットワークは予め学習しておいた重み付け
演算によりニューラルネットワークの中間層27で演算
がなされ、ニューラルネットワークの出力層28では特
定画像らしい度合いと、特定画像らしくない度合いを出
力する。最後に比較部29で、より大きな度合いを出力
した方を選択して出力する。従って比較部29の出力
は、入力された画像が特定画像であるか否かの2値出力
となる。以上の動作により特定画像の検出が可能とな
る。
【0045】この装置は、入力された画像がスキャナに
より入力された画像であっても、プリンタに入力された
画像であっても、その他入力手段は一切問わず、CPU
3の解像度指定部により入力された画像の解像度を指定
することさえできれば、認識用CPU12による変換倍
率制御手段から受け取った制御パラメータを基に解像度
変換部5は、入力解像度を十分低い所定の解像度に変換
することにより、入力画像の解像度に依存せず、特定画
像を認識できる装置である。
より入力された画像であっても、プリンタに入力された
画像であっても、その他入力手段は一切問わず、CPU
3の解像度指定部により入力された画像の解像度を指定
することさえできれば、認識用CPU12による変換倍
率制御手段から受け取った制御パラメータを基に解像度
変換部5は、入力解像度を十分低い所定の解像度に変換
することにより、入力画像の解像度に依存せず、特定画
像を認識できる装置である。
【0046】さて、以上のようにして、入力された画像
中に特定画像が存在するか否かが判定されるが、この種
の認識には必ず誤判定の可能性がある。特に複写を禁止
されている特定画像を検出するような装置の場合、一般
画像を特定画像と認識してしまうと、本来複写が禁止さ
れてない画像に対して複写ができなくなるという問題が
ある。以降、図1を用いてこの解決方法について説明す
る。
中に特定画像が存在するか否かが判定されるが、この種
の認識には必ず誤判定の可能性がある。特に複写を禁止
されている特定画像を検出するような装置の場合、一般
画像を特定画像と認識してしまうと、本来複写が禁止さ
れてない画像に対して複写ができなくなるという問題が
ある。以降、図1を用いてこの解決方法について説明す
る。
【0047】図1に示すように特定画像認識部4はメモ
リ7を有し、解像度変換部5によって所定の解像度に変
換されたRGB画像信号は、一旦メモリ7に格納されて
いる。さて、フレーム判定処理のステップ19で、画像
中に特定画像が含まれる可能性が高いと判定された時点
で用いられたフレームマスクの種類によって、フレーム
判定の段階で特定画像の配置されている角度の見当をつ
けることができる。また画像に対してシフト等を行って
フレームマスクを当てはめる段階で、特定画像の座標情
報についても見当をつけることができる。認識用CPU
12はメモリ7にアクセスできるようにハードウェアが
構成されており、最終判定で特定画像と認識された場合
は、上記の位置および回転角度情報に基づき、認識用C
PU12によりメモリ7の該当するアドレスをアクセス
し、特定画像の特定の部分について、印刷網などに関す
る構造情報や、より詳細な色味情報などを入手すること
ができる。詳細判定の後に、これらの情報に基づき再判
定を実施することで、誤判定が発生する可能性を非常に
少なくすることができる。
リ7を有し、解像度変換部5によって所定の解像度に変
換されたRGB画像信号は、一旦メモリ7に格納されて
いる。さて、フレーム判定処理のステップ19で、画像
中に特定画像が含まれる可能性が高いと判定された時点
で用いられたフレームマスクの種類によって、フレーム
判定の段階で特定画像の配置されている角度の見当をつ
けることができる。また画像に対してシフト等を行って
フレームマスクを当てはめる段階で、特定画像の座標情
報についても見当をつけることができる。認識用CPU
12はメモリ7にアクセスできるようにハードウェアが
構成されており、最終判定で特定画像と認識された場合
は、上記の位置および回転角度情報に基づき、認識用C
PU12によりメモリ7の該当するアドレスをアクセス
し、特定画像の特定の部分について、印刷網などに関す
る構造情報や、より詳細な色味情報などを入手すること
ができる。詳細判定の後に、これらの情報に基づき再判
定を実施することで、誤判定が発生する可能性を非常に
少なくすることができる。
【0048】以上のように本実施の形態によれば、入力
画像データを所定解像度の画像データに変換して出力す
る解像度変換部5と、入力画像データの解像度を指定す
るCPU3の解像度指定部と、解像度指定部で指定され
た指定解像度に応じて解像度変換部5の変換倍率を制御
する変化倍率制御手段を備え、解像度変換部5から出力
される所定解像度の画像データに基づいて特定画像を認
識する認識用制御部12とを有し、認識用制御部12の
変換倍率制御手段は、解像度変換部5から出力される画
像データの所定解像度を、入力画像データの解像度に関
わらず、常に、一定の解像度に制御するようにしたこと
により、入力画像データの解像度(指定解像度)に関わ
らず、入力画像データを一定解像度(所定解像度)の画
像データに常に変換することができるので、その所定解
像度の画像データに基づいて特定画像の有無を正確に認
識することができる。
画像データを所定解像度の画像データに変換して出力す
る解像度変換部5と、入力画像データの解像度を指定す
るCPU3の解像度指定部と、解像度指定部で指定され
た指定解像度に応じて解像度変換部5の変換倍率を制御
する変化倍率制御手段を備え、解像度変換部5から出力
される所定解像度の画像データに基づいて特定画像を認
識する認識用制御部12とを有し、認識用制御部12の
変換倍率制御手段は、解像度変換部5から出力される画
像データの所定解像度を、入力画像データの解像度に関
わらず、常に、一定の解像度に制御するようにしたこと
により、入力画像データの解像度(指定解像度)に関わ
らず、入力画像データを一定解像度(所定解像度)の画
像データに常に変換することができるので、その所定解
像度の画像データに基づいて特定画像の有無を正確に認
識することができる。
【0049】また、解像度変換部5は、CPU3の解像
度指定部で予め指定された解像度範囲のうち所定範囲の
解像度の画像データについて、より低い解像度に変換し
て所定解像度を得るようにしたことにより、入力画像デ
ータの指定解像度に基づいて入力画像データを容易に所
定解像度の画像データに変換することができるので、特
定画像の有無を正確に認識することができる。
度指定部で予め指定された解像度範囲のうち所定範囲の
解像度の画像データについて、より低い解像度に変換し
て所定解像度を得るようにしたことにより、入力画像デ
ータの指定解像度に基づいて入力画像データを容易に所
定解像度の画像データに変換することができるので、特
定画像の有無を正確に認識することができる。
【0050】
【発明の効果】以上述べてきたように本発明の請求項1
に記載の画像認識装置によれば、入力画像データを所定
解像度の画像データに変換して出力する解像度変換部
と、解像度変換部から出力される所定解像度の画像デー
タに基づいて特定画像を認識する認識用制御部とを有す
ることにより、入力画像データの解像度を所定解像度に
変換することができるので、この所定解像度に変換され
た画像データから特定画像の有無を正確に認識すること
ができるという有利な効果が得られる。
に記載の画像認識装置によれば、入力画像データを所定
解像度の画像データに変換して出力する解像度変換部
と、解像度変換部から出力される所定解像度の画像デー
タに基づいて特定画像を認識する認識用制御部とを有す
ることにより、入力画像データの解像度を所定解像度に
変換することができるので、この所定解像度に変換され
た画像データから特定画像の有無を正確に認識すること
ができるという有利な効果が得られる。
【0051】請求項2に記載の画像認識装置によれば、
請求項1に記載の画像認識装置において、入力画像デー
タの解像度を指定する解像度指定部と、解像度指定部で
指定された指定解像度に応じて解像度変換部の変換倍率
を制御する変化倍率制御手段とを備え、変換倍率制御手
段は、解像度変換部から出力される画像データの所定解
像度を、入力画像データの解像度に関わらず、常に、一
定の解像度に制御することにより、入力画像データの解
像度(指定解像度)に関わらず、入力画像データを一定
解像度(所定解像度)の画像データに常に変換すること
ができるので、その所定解像度の画像データに基づいて
特定画像の有無を正確に認識することができるという有
利な効果が得られる。
請求項1に記載の画像認識装置において、入力画像デー
タの解像度を指定する解像度指定部と、解像度指定部で
指定された指定解像度に応じて解像度変換部の変換倍率
を制御する変化倍率制御手段とを備え、変換倍率制御手
段は、解像度変換部から出力される画像データの所定解
像度を、入力画像データの解像度に関わらず、常に、一
定の解像度に制御することにより、入力画像データの解
像度(指定解像度)に関わらず、入力画像データを一定
解像度(所定解像度)の画像データに常に変換すること
ができるので、その所定解像度の画像データに基づいて
特定画像の有無を正確に認識することができるという有
利な効果が得られる。
【0052】請求項3に記載の画像認識装置によれば、
請求項2に記載の画像認識装置において、解像度変換部
は、解像度指定部で予め指定された解像度範囲のうち所
定範囲の解像度の画像データについて、より低い解像度
に変換して所定解像度を得ることにより、入力画像デー
タの指定解像度に基づいて入力画像データを容易に所定
解像度の画像データに変換することができるので、特定
画像の有無を正確に認識することができるという有利な
効果が得られる。
請求項2に記載の画像認識装置において、解像度変換部
は、解像度指定部で予め指定された解像度範囲のうち所
定範囲の解像度の画像データについて、より低い解像度
に変換して所定解像度を得ることにより、入力画像デー
タの指定解像度に基づいて入力画像データを容易に所定
解像度の画像データに変換することができるので、特定
画像の有無を正確に認識することができるという有利な
効果が得られる。
【図1】本発明の実施の形態1による画像認識装置を示
すブロック図
すブロック図
【図2】特徴色カウンタの構成を示すブロック図
【図3】バッファに格納されるデータのデータ構造を示
すデータ図
すデータ図
【図4】テンプレート選択部の動作を示すフローチャー
ト
ト
【図5】(a)テンプレートと特定画像の関係を示す説
明図 (b)テンプレートと特定画像の関係を示す説明図 (c)テンプレートと特定画像の関係を示す説明図 (d)テンプレートと特定画像の関係を示す説明図
明図 (b)テンプレートと特定画像の関係を示す説明図 (c)テンプレートと特定画像の関係を示す説明図 (d)テンプレートと特定画像の関係を示す説明図
【図6】作業用RAM内のデータ構成を示したデータ図
【図7】(a)実際の特定画像の各ブロックに対して与
えられるTN(n)とD(n)のイメージを示すイメー
ジ図 (b)実際の特定画像の各ブロックに対して与えられる
TN(n)とD(n)のイメージを示すイメージ図 (c)実際の特定画像の各ブロックに対して与えられる
TN(n)とD(n)のイメージを示すイメージ図
えられるTN(n)とD(n)のイメージを示すイメー
ジ図 (b)実際の特定画像の各ブロックに対して与えられる
TN(n)とD(n)のイメージを示すイメージ図 (c)実際の特定画像の各ブロックに対して与えられる
TN(n)とD(n)のイメージを示すイメージ図
【図8】フレームマスクの構造を示すマスク構造図
【図9】フレーム処理において、1つのフレームに対す
る処理内容を示すフローチャート
る処理内容を示すフローチャート
【図10】(a)最終判定における回転角補正を示す説
明図 (b)最終判定における回転角補正を示す説明図
明図 (b)最終判定における回転角補正を示す説明図
【図11】最終判定におけるフレームとブロックと認識
処理の関係を示す説明図
処理の関係を示す説明図
【図12】解像度変換部における解像度変換アルゴリズ
ムを示すアルゴリズム図
ムを示すアルゴリズム図
1 インタフェース部(I/F部) 2 他の装置 3 CPU 4 特定画像認識部 5 解像度変換部 6 シリアル通信ライン 7 メモリ 8 特徴色カウンタ 9 テンプレート選択部 10 テンプレート格納メモリ 11 バッファ 12 認識用CPU(認識用制御部) 13 主・副画素カウンタ 14 ROM 15 制御信号線 16 割込み信号線 17 作業用RAM 18C0、18C1、18C2 特徴色検出部 19 比較器 20 ANDゲート 21 カウンタ 22 カウントバッファ 23 ブロックの集合 24 ブロックヒストグラム 25 最終判定部 26 ニューラルネットワークの入力層 27 ニューラルネットワークの中間層 28 ニューラルネットワークの出力層 29 比較部 30 600dpiの1画素
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 15/70 465A H04N 1/40 Z (72)発明者 山田 太一 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5B057 AA20 BA02 CA01 CA12 CA16 CB01 CB12 CB16 CC01 CD03 CD05 DA06 DB02 DB06 DC25 5B075 ND06 QM08 QS03 UU40 5C077 LL14 PP22 TT06 5L096 AA01 BA07 BA18 DA02 EA03 EA16 FA15 GA19 GA38 HA08 HA11 JA13
Claims (3)
- 【請求項1】入力画像データを所定解像度の画像データ
に変換して出力する解像度変換部と、前記解像度変換部
から出力される前記所定解像度の画像データに基づいて
特定画像を認識する認識用制御部とを有することを特徴
とする画像認識装置。 - 【請求項2】前記入力画像データの解像度を指定する解
像度指定部と、前記解像度指定部で指定された指定解像
度に応じて前記解像度変換部の変換倍率を制御する変換
倍率制御手段とを備え、前記変換倍率制御手段は、前記
解像度変換部から出力される画像データの所定解像度
を、入力画像データの解像度に関わらず、常に、一定の
解像度に制御することを特徴とする請求項1に記載の画
像認識装置。 - 【請求項3】前記解像度変換部は、前記解像度指定部で
予め指定された解像度範囲のうち所定範囲の解像度の画
像データについて、より低い解像度に変換して所定解像
度を得ることを特徴とする請求項2に記載の画像認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10329046A JP2000155833A (ja) | 1998-11-19 | 1998-11-19 | 画像認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10329046A JP2000155833A (ja) | 1998-11-19 | 1998-11-19 | 画像認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000155833A true JP2000155833A (ja) | 2000-06-06 |
Family
ID=18217014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10329046A Pending JP2000155833A (ja) | 1998-11-19 | 1998-11-19 | 画像認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000155833A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101581909B (zh) * | 2008-05-16 | 2012-06-20 | 佳能株式会社 | 处理防复印伪造图案图像数据的图像处理装置 |
WO2019230665A1 (ja) * | 2018-06-01 | 2019-12-05 | 日本電信電話株式会社 | 学習装置、検索装置、方法、及びプログラム |
WO2022065503A1 (ja) * | 2020-09-28 | 2022-03-31 | LeapMind株式会社 | 機械学習実行プログラム、オブジェクト認識プログラム、機械学習実行装置及びオブジェクト認識装置 |
-
1998
- 1998-11-19 JP JP10329046A patent/JP2000155833A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101581909B (zh) * | 2008-05-16 | 2012-06-20 | 佳能株式会社 | 处理防复印伪造图案图像数据的图像处理装置 |
WO2019230665A1 (ja) * | 2018-06-01 | 2019-12-05 | 日本電信電話株式会社 | 学習装置、検索装置、方法、及びプログラム |
WO2022065503A1 (ja) * | 2020-09-28 | 2022-03-31 | LeapMind株式会社 | 機械学習実行プログラム、オブジェクト認識プログラム、機械学習実行装置及びオブジェクト認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5077811A (en) | Character and picture image data processing system | |
US6370271B2 (en) | Image processing apparatus and methods for pattern recognition | |
CA2090581C (en) | Image processing method and apparatus | |
JP3060902B2 (ja) | 画像処理装置及び画像処理方法 | |
EP0751475A2 (en) | Image processing method and device and scanner and printer equipped with same | |
JPH11126259A (ja) | 画像検出方法、画像検出装置、画像処理方法、画像処理装置、及び媒体 | |
JPS62221785A (ja) | パタ−ン認識方式において使用する特徴抽出技術 | |
US20070292028A1 (en) | Activity detector | |
JPH08340443A (ja) | 偽造可能性情報生成方法及び装置、並びに、それらを利用した機器 | |
WO1991017519A1 (en) | Row-by-row segmentation and thresholding for optical character recognition | |
EP0899679B1 (en) | Line direction deciding device, image inclination detecting device and image inclination correction device | |
EP0248262A2 (en) | Apparatus and method for detecting character components on a printed document | |
US20020027671A1 (en) | Image discrimination apparatus, copier and image discrimination method | |
JP2864735B2 (ja) | 物体識別方法および装置ならびに物体識別のための画像処理方法および装置 | |
JP2000155833A (ja) | 画像認識装置 | |
US7072486B1 (en) | Method and apparatus for estimation of image magnification levels | |
JP2000149004A (ja) | 画像読み取り装置 | |
US6707954B1 (en) | Image processing apparatus, image processing method, and image forming apparatus | |
JP3090342B2 (ja) | 文字列方向判別装置 | |
JP2000341512A (ja) | 画像読み取り装置 | |
US8229223B2 (en) | Image processor, image forming apparatus, image processing method and computer readable medium | |
JP2000253242A (ja) | 画像読み取りシステム | |
JPH04207465A (ja) | 画像処理装置 | |
JP3151993B2 (ja) | 画像処理装置及びそれを搭載した複写機 | |
JP2000293691A (ja) | 画像処理方法、ドライバ、オペレーティングシステム、スキャナ、記憶媒体 |