本発明の実施の形態を図1ないし図28に基づいて説明する。
1.原稿画像
まず、本実施の形態における画像処理装置、画像処理方法等に用いられる原稿画像について図1ないし図12を参照しながら説明する。
図1は、原稿画像を例示する正面図である。図2は、原稿画像に埋め込まれたドットパターンが浮き上がって見えている原稿画像の複写物の一例を示す模式図である。図3は、原稿画像に埋め込まれたドットパターンが浮き上がって見えている原稿画像の複写物の別の一例を示す模式図である。図4は、図3に例示するドットパターンを拡大して示す模式図である。図5は、図2に例示するドットパターンを拡大して示す模式図である。
原稿画像101、図1に示す例では契約書である原稿画像101を作成する原稿用紙102として、その背景に、出力禁止判定用のドット配列、つまりドットパターン103が埋め込まれた原稿用紙102が用いられている。もっとも、別の実施の形態として、ドットパターン103が形成されていない原稿用紙102を用い、契約書である原稿画像101を作成するに際して同時にドットパターン103を形成するようにしても良い。つまり、ドットパターン103は、原稿用紙102に予め印刷形成されていても良く、原稿用紙102に文字や図形等を画像形成するに際して同時に画像形成するようにしても良い。
図1ないし図5を参照して説明するドットパターン103は、ベース領域104とメッセージ領域105とを含んでいる。ベース領域104は、原稿用紙102の大部分を占める地部分の領域である。メッセージ領域105は、そのようなベース領域104中に分散されたメッセージを表現する領域である。これらのベース領域104とメッセージ領域105とは、ドットパターン103それ自体の基本的な構成そのものを異にするわけではなく、ドットパターン103に対する人間の価値判断としてベース領域104とメッセージ領域105とに別れているに過ぎない。本実施の形態において、メッセージ領域105は「複写禁止」という文字から構成されている。このようなメッセージ領域105を構成する文字としては、「複写禁止」の他、いかなる文字や記号その他のものをも用い得る。
このような原稿用紙102を用いて作成された原稿画像101は、この原稿画像101が複写等されると、ドットパターン103の一部が浮かび上がる。この場合、図2に例示する原稿画像101では、「複写禁止」という文字で表現されたメッセージ領域105が浮かび上がり、図3に例示する原稿画像101では、ベース領域104が浮かび上がる。
このように、ドットパターン103が埋め込まれた原稿画像101が複写されると、ドットパターン103においてメッセージ領域105とベース領域104との何れか一方が浮かび上がるのは、他方の領域104又は105が複写(再現)されにくいからである。換言すると、浮かび上がらない方の領域104又は105が消えることによって、残った方の領域104又は105が浮かび上がって見えるわけである。
このような現象を生じさせるドットパターン103は、例えば、図4及び図5に例示するように、大きさが異なる二種類のドット106の集合によって構成されている。つまり、これらの二種類のドット106のうち、小さなドット106bは複写(再現)されにくく、大きなドット106aは複写(再現)される。そこで、複写後にメッセージ領域105が浮き上がる図2に例示するドットパターン103では、図5に示すように、ベース領域104を構成する方に小さなドット106bが用いられ、メッセージ領域105を構成する方に大きなドット106aが用いられている。反対に、複写後にベース領域104が浮き上がる図3に例示するドットパターン103では、図4に示すように、メッセージ領域105を構成する方に小さなドット106bが用いられ、ベース領域104を構成する方に大きなドット106aが用いられている。
ドットパターン103の他の構成例として、浮かび上がるメッセージ領域105又はベース領域104は、ドットに限らず、細線パターンや特定の模様パターン等によっても構成可能である。
ここで、本実施の形態では、メッセージ領域105又はベース領域104を特徴量として扱う。ここでいう特徴量は、例えば原稿画像101を画像読み取りして得た画像データに含まれているある特徴をなす。このようなある特徴は、画像データに画像表現で含まれている特定情報として機能させることが可能である。例えば、浮かび上がるメッセージ領域105又はベース領域104がドット106で構成されているとすると、そのサイズ、密度(単位面積当たりにおけるドット数)、ドット間距離を、浮かび上がるメッセージ領域105又はベース領域104が細線パターンで構成されているとすると、その線の幅を、浮かび上がるメッセージ領域105又はベース領域104が特定の模様パターンで構成されているとすると、その模様の特徴等を、それぞれ特徴量として用いることができる。
以上の例では、浮かび上がるメッセージ領域105又はベース領域104についての特徴量について限定したが、このような特徴量として、浮かび上がらないベース領域104又はメッセージ領域105、あるいは浮かび上がるメッセージ領域105又はベース領域104と浮かび上がらないベース領域104又はメッセージ領域105との双方について、それぞれの特徴量を求めても良い。要は、ドットパターン103が埋め込まれた画像データが記録された原稿画像101が読み取られた際にそのベース領域104又はメッセージ領域105の何れか一方又は両方がデータとして判読できるものであれば、それを特徴量として扱うことが可能である。又は、データの形態で存在するドットパターン103が埋め込まれた画像データにおいて、そのドットパターン103を構成するベース領域104又はメッセージ領域105の何れか一方又は両方がデータとして判読できるものであれば、それを特徴量として扱うことが可能である。
別の実施の形態としては、前述した通り、ドットパターンとして、図6及び図7に例示するように、ベース領域104及びメッセージ領域105を有するドットパターン103ではないパターンを持ち得る。図6は、図1ないし図5を参照して説明したものとは別の実施の形態として、原稿画像とそのドットパターンとを例示する正面図、図7は図6とは異なる原稿画像とそのドットパターンとを例示する正面図である。図6及び図7に例示するドットパターン103は、単一の大きさのドット106から構成されている。このような図6及び図7に例示するドットパターン103は、いわば、図2ないし図5に例示するドットパターン103におけるベース領域104のみに相当するパターン、メッセージ領域105のみに相当するパターンと同様のものとして把握することが可能である。つまり、ベース領域104に相当するドットパターン103又はメッセージ領域105に相当するドットパターン103であっても、そのようなドットパターン103を有する原稿画像101が読み取られた際にそのドットパターン103がデータとして判読できれば、それを特徴量として扱うことが可能である。
ここで、図6に例示するドットパターン103は、原稿用紙102に描画された原稿画像101の背景画像として構成されている。この意味で、図2ないし図5に例示するドットパターン103と同様に、背景ドットパターンとなる。これに対して、図7に例示するドットパターン103は、原稿用紙102に描画された原稿画像101の上に描画されている。したがって、図7に例示するドットパターン103は、背景ドットパターンではなく、いわば前面ドットパターンである。
ここで、図2ないし図5、図6、図7に示すドットパターン103は、いずれも、ドットパターン103を構成する単一のドット106同士の関係が特徴量を持つドットパターン103である。つまり、図2ないし図5、図6、図7に示すドットパターン103の特徴量としては、ドット密度(単位面積当たりにおけるドット数)とドット間距離とを挙げることができるが、これらの特徴量は、いずれも、ドットパターン103を構成する単一のドット106同士の関係に含まれている。そこで、ドット密度という特徴量とドット間距離という特徴量とを比較して考察する。
まず、ドット106の密度であるドット密度は、前述したように、単位面積当たりにおけるドット数である。この特徴量は、判定対象となるある単位面積中のドットの数を計数することで判定可能である。実際のドット数を計数する場合、ある程度の検出漏れや誤検出が生ずる。そこで、計数したドット数の多少に対してある程度の許容値(閾値)を設定することで、ドット106の密度を特徴量としてその特徴量の検出が可能となる。この場合、計数したドット数の多少に対して設定する閾値が厳しい値、つまり許容範囲が小さい値であれば、判定漏れが生じ易く、反対に、計数したドット数の多少に対して設定する閾値が緩い値、つまり許容範囲が大きい値であれば、判定漏れが生じにくくなる。
ところが、図6に例示するドットパターン103を参照すると、ドットパターン103が含むあるドット106は原稿用紙102に描画された原稿画像101によって検出不可能な状態となっている。これに対して、図7に例示するドットパターン103では、原稿用紙102に描画された原稿画像101の上にドットパターン103が描画されていることから、図6に例示するドットパターン103よりは各ドット106を検出し易い状態である。しかしながら、原稿用紙102に描画された原稿画像101と重なるドット106については、必ずしも正しく検出できるとは限らない。このため、ドット数を検出することができる程度は、原稿用紙102に描画された原稿画像101の態様に大きく影響される。したがって、ドット密度を特徴量とした場合には、計数したドット数の多少に対してある程度の許容値(閾値)を設定したとしても、その特徴量の判定に判定漏れが生じ易いと言える。
次いで、隣接するドット106の間の距離dであるドット間距離を特徴量とする場合について図8ないし図10を参照して説明する。図8はドット間距離をdとするドットパターン103を例示する模式図、図9はドット間距離を横軸に取りその出現頻度を縦軸に取って隣接するドット106の間の距離分布を表現するグラフである。図10はドットパターンを例示する模式図である。
図8に示すように、隣接する二つのドット106の間の距離dが一定であるドットパターン103(図10(a)参照)において、このドットパターン103を構成するドット106のうち、隣接する二つのドット106の間の距離dであるドット間距離は特徴量となる。この場合、ドットパターン103からドット106を検出し、隣接するドット106の間の距離dを複数判定した場合には、図9(a)のグラフに示すように、正しいドット106の間の距離dをピーク値とする尖った山形の分布を描く。そこで、距離dに対してある程度の許容値(閾値)を設定することで、ドット106の間の距離dを特徴量としてその検出が可能となる。この場合、図9(a)のグラフから明らかなように、距離dに対して設定する閾値が厳しい値、つまり許容範囲が小さい値であれば、判定漏れが生じ易く、反対に、距離dに対して設定する閾値が緩い値、つまり許容範囲が大きい値であれば、判定漏れが生じにくくなる。
しかしながら、隣接する二つのドット106の間の距離dが一定であるドットパターン103における二つのドット106の間の距離dを特徴量とする場合、図10(a)に例示するパターンと図10(b)に例示するパターンとの区別が付かなくなる。ここに、図10(a)は、注目ドット106から見て、距離dだけ離れた他のドット106が四つあるドットパターンを例示し、図10(b)は、注目ドット106から見て、距離dだけ離れた他のドット106が三つあるドットパターンを例示する。この場合、一例として、図10(a)が検出対象となっているドットパターン103であるとして、原稿用紙102に描画された原稿画像101に図10(b)に例示するようなドット106のパターンが含まれている場合、あるいはその逆の場合、ドット密度を特徴量とした場合には検出対象であるドットパターン103の検出を行なうことができるのに対して、ドット間距離を特徴量とした場合には検出対象であるドットパターン103の検出を行なうことができなくなってしまう。つまり、隣接する二つのドット106の間の距離dが一定であるドットパターン103を検出対象とする場合には、過検出が生じ易くなる。
そこで、図10(c)には、ドット間距離を特徴量とし、検出対象であるドットパターン103の検出を正しく行ない得るようなドットパターン103を例示する。図10(c)に例示するドットパターン103は、ドットの間の距離dが複数種類設定され、しかも、各種類のドット間距離dの頻度が異なるように設定されている。このため、図9(b)に示すように、隣接ドット間距離のピーク値分布が特徴量を持つ。そこで、このような隣接ドット間距離のピーク値分布という特徴量を検出することで、過検出なく検出対象となるドットパターン103を検出することができる。
以上説明したように、図2ないし図5、図6、図7に示すドットパターン103は、いずれも、ドットパターン103を構成する単一のドット106同士の関係が特徴量を持っている。これに対して、図11及び図12には、ドットパターン103それ自体、あるいはドットパターン103の集合が特徴量を持っている例を示す。つまり、図11に例示するように、ドット106αとドットβとの間の距離α−βと、ドットβとドットγとの間の距離β−γと、ドットαとドットγとの間の距離α−γとは、それぞれ異なるように設定されており、これらのドットα、β、γで一組のドットパターン103が構成されている。このようなドットパターン103は、一例として、パターンマッチングによって容易に判定可能である。そして、図11に例示するようなドットパターン103それ自体、あるいはそのようなドットパターン103の集合は、特徴量を持つ。ドットパターン103の集合に特徴量を持たせる手法としては、一例として、図11に例示するようなドットパターン103の単位面積当りの密度を採用し得る。
なお、本実施の形態におけるドットパターン103は、画像データに画像表現で含まれる特定情報、つまり画像データに含まれているある特徴の一態様であるドットの配列を例示しているに過ぎない。画像データに含まれる特定情報、つまり画像データに含まれているある特徴としては、ドット以外の線やその他の形状の表現でもよいし、形状以外の色やその他の画像特徴であってもよい。また、後述する抽出対象となる画像上の特徴として、画像データに含まれている原稿のID等の情報や、原稿の付属情報、例えば作成者等の情報であってもよい。また、画像上の特徴として、原稿種類であっても、複数種類の原稿を示す特徴であってもよい。さらに、該種類は階層的な種類構成を持つものであってもよい。
2.本実施の形態の概要
本実施の形態の画像処理装置は、原稿画像101の画像データに含まれる機密文書判定用又は出力禁止文書判定用のパターン、一例としてドットパターン103(例えば、図6に例示する背景ドットパターン103、図7に例示する前景ドットパターン103)が有する特徴量(ドット密度、ドット間距離、特定ドットパターン、特定ドットパターンの単位面積当り密度等)を画像データから検出し、検出した特徴量を出力禁止ドットパターンの特徴量として記憶領域に記憶されている基準特徴量と比較し、検出した特徴量と基準特徴量との間に同一性が認められるかどうかを判定する処理を実行する。この処理によって、原稿画像101の画像データに対して、その画像データに含まれる特定情報を抽出する情報抽出手段の機能、情報抽出工程、情報抽出機能が実行されることになる。そして、このような情報抽出処理に際して、同一性の判定は、一例として、検出した特徴量と基準特徴量との間の差がある閾値よりも小さいかどうかをもってなされる。つまり、そのような差がある閾値よりも小さければ同一であると判定する。
そして、本実施の形態の画像処理装置において特徴的な点は、画像データからの特定情報の抽出処理をDSPやSIMD型プロセッサ等のような特殊プロセッサである特定情報抽出用プロセッサによって実行し、この際、画像データの状態、例えば変倍率に依存して特定情報を表現するデータが変動する場合の変動要因を認識し、認識された変動要因に従い、変動後の特定情報を表現するデータの抽出処理に適した情報抽出用プログラム及び辞書データを選択し、選択した情報抽出用プログラム及び辞書データを特定情報抽出用プロセッサにロードする、という点である。これにより、DSPやSIMD型プロセッサ等のような特殊プロセッサを特定情報抽出用プロセッサとして用いた場合、そのような特殊プロセッサが有するプログラム領域についてもデータ領域についても、大きな記憶容量を必要とすることなく、画像処理装置の状態、例えば変倍率にとって最適な画像認識処理を行うことができる。
本明細書には、このような画像処理装置における画像処理方法、画像処理のためのコンピュータプログラム、このようなコンピュータプログラムを記憶する記憶媒体をも開示する。
3.画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータプログラムを記憶する記憶媒体
(1)ハードウェア構成
図13は、画像処理装置のハードウェア資源を示すブロック図である。図14は、画像入力手段としてのスキャナの縦断側面図である。図15は、図13中に示されているドットパターン検出部のブロック図である。
図13に示すように、本実施の形態の画像処理装置は、画像入力手段としてのスキャナ201、デジタル回路構成の画像処理部202、DSPやSIMD型プロセッサ等のような特殊プロセッサである特定情報抽出用プロセッサ241、及びプロッタ203をシステムコントローラ204で制御するデジタル複写機構成とされている。システムコントローラ204は、コンピュータ1001の一部を構成し、内蔵するCPU(Central Processing Unit)204a、ROM(Read Only Memory)204b、及びRAM(Random Access Memory)204cから構築されるコンピュータ機能を活用し、操作表示部205からの指示に応じてスキャナ201、画像処理部202、及びプロッタ203を制御し、必要な情報を操作表示部205に返して表示させる。
ここで、スキャナ201について図14を参照して詳しく説明する。図14に示すように、スキャナ201のスキャナ本体2上には、自動原稿送り装置であるADF(Automatic Document Feeder )3が支軸3aにより開閉回動自在に備えられており、原稿移動型読取動作モードとセンサ移動型読取動作モードとが選択自在とされている。スキャナ本体2には原稿用紙102(図14には図示せず)が載置される矩形状のコンタクトガラス4が備えられており、このコンタクトガラス4に対向するスキャナ本体2の内部には、光学ユニット5が備えられている。この光学ユニット5は一般的に密着型イメージセンサと呼ばれているものであって、光源(図示せず)と、多数の撮像素子(CCD:Charge Coupled Device)を原稿の読取幅に相当する長さ分をライン状に連設したラインセンサ(図示せず)とを有している。光学ユニット5は、これらの撮像素子の配列方向を主走査方向B(図14の紙面と直交方向)としている。この光学ユニット5にはステッピングモータである駆動モータ6がプーリやワイヤなどにより連結されており、光学ユニット5は副走査方向Aに移動自在とされている。この光学ユニット5は、通常、図14に示す副走査方向Aの上流側をホームポジションHPとして位置し、下流側に移動する過程で、光源がコンタクトガラス4上に載置される原稿用紙102の原稿画像101(図14には図示せず)を照射し、原稿用紙102からの反射光をラインセンサが受光することにより原稿画像101を読取走査する。
このような光学ユニット5による原稿画像101の読取走査は、センサ移動型読取動作モードであるブックモードの設定下で実行されるが、スキャナ201には、このようなブックモードの他に、原稿移動型読取動作モードであるADFモードも、動作モードとして、後述する操作表示部205(図13参照)において切替自在に設定されている。このADFモードの設定下では、光学ユニット5をホームポジションHPにセットした状態でADF3により原稿用紙102を順次搬送することにより、原稿画像101が読取走査される。
ADF3は、原稿トレイ7、ピックアップローラ8、一対のレジストローラ9、搬送ドラム10、一対の搬送ローラ11、一対の排紙ローラ12等を有しており、ホームポジションHPに位置する光学ユニット5上を順次通過するように原稿用紙102を副走査方向Aに順次搬送して排紙トレイ13に排紙させる。この排紙トレイ13は原稿カバー14の上面に設けられており、この原稿カバー14はコンタクトガラス4に対して開閉自在とされている。ADF3のピックアップローラ8とレジストローラ9と搬送ドラム10と搬送ローラ11と排紙ローラ12とには、ステッピングモータ(図示せず)がギヤ列などにより連結されている。
そして、スキャナ201は、ブックモードでの光学ユニット5の移動速度、ADFモードでの原稿用紙102の搬送速度を変動させることで、原稿画像101の読み取り倍率の変更が可能である。
次いで、画像処理部202について説明する。画像処理部202は、シェーディング補正部212、画像蓄積部213、フィルタ処理部206、変倍処理部207、γ処理部208、及び階調処理部209を含んでいる。これらのうち、フィルタ処理部206、変倍処理部207、γ処理部208、及び階調処理部209は、前処理部214を構成する。
前処理部214における変倍処理部207は、変倍処理に際して、MTF補正や平滑化処理を実行する変倍手段として機能する。つまり、変倍処理では、画像データの主走査方向及び副走査方向の画素数を増減して画像の拡大あるいは縮小を行う。このような変倍処理の手法として、最近傍法や線形補完法等が従来から良く知られている。最近傍法は、変倍画像を、変倍前に最も近い画素濃度に設定する手法である。簡単で高速処理が容易である反面、やや不自然な画像となり易い。つまり、平たく言うとノイズが含まれたような画像となる。そこで、最近傍法を採用する場合には、画像データに施すMTF補正は低めにすることが好適である。これに対して、線形補完法では、画像データを、変倍前の画像データに近い位置にある複数画素の濃度に基づいて算出した新しい別の濃度に設定する。複雑で時間がかかる反面、自然な画像が得られる。つまり、平たく言うと、滑らかな画像となる。そこで、線形補完法を採用する場合には、MTF補正を高めにすることが好適である。また、平滑化処理に関しては、最近傍法を採用する場合には平滑度を高くし、線形補完法では平滑度を低くすることが好適である。変倍率との関係では、拡大倍率が大きくなるほど平滑度を低くし、拡大倍率が小さいほど平滑度を高くすることが好適である。
なお、変倍処理部207以外の前記各部206、208、209、212、213は、一般的なデジタル複写機が備える同等の回路構成と異なる点はないため、その説明は省略する。
これに対して、本実施の形態の画像処理部202は、ドットパターン検出部210及び出力禁止文書判定部211を具備する。これらのドットパターン検出部210及び出力禁止文書判定部211は、前述したように、機密文書のような出力禁止文書を検出判定し、その複写を禁止するDSPやSIMD型プロセッサ等のような特殊プロセッサである特定情報抽出用プロセッサ241に搭載されている。
図15は、特定情報抽出用プロセッサ241のアーキテクチャを概略的に示す模式図である。図15中、PEはプロセッサエレメント242であり、このプロセッサエレメント242は、並列処理される基本単位を構成する。GPはグローバルプロセッサ243であり、このグローバルプロセッサ243は、全体の制御を司る。その他の領域はメモリ領域244であり、このメモリ領域244としては、プログラム領域244aとデータ領域244bとが用意されている。特定情報抽出用プロセッサ241は、プログラム領域244aに情報抽出用プログラムをロードし、データ領域244bに原稿画像101中に画像表現で含まれている特定情報を抽出するに際して参照が必要なデータ、例えば辞書データをロードする。そして、情報抽出用プログラムに従い、辞書データ等を参照しての画像データからの特定情報抽出処理を実行する。
図16は、ドットパターン検出部210の機能ブロック図である。ドットパターン検出部210は、原稿画像101の画像データに含まれる機密文書判定用又は出力禁止文書判定用のドットパターン103が有する特徴量、ここではドット密度を画像データから検出する処理と、検出した特徴量であるドット密度を出力禁止ドットパターンの特徴量としてデータ領域244bに記憶されている基準特徴量と比較する処理と、検出した特徴量であるドット密度と基準特徴量との間に同一性が認められるかどうかを判定する処理とを実行する。これらの処理によって、原稿画像101の画像データに対して、その画像データに含まれる特定情報を抽出する処理が実行されることになる。
このような各種の処理を実行するために、ドットパターン検出部210は、前述したデータ領域244bに、出力禁止ドットパターンの特徴量として基準特徴量を辞書データの一部として記憶保存し、更に、例えば図16(a)に例示する機能ブロック構成を有する。つまり、スキャナ201によって読み取られた原稿画像101に基づく画像データからドット検出部251によってドット106を検出する。この場合の検出手法としては、デジタル回路によって画像パターンを検出する従来の各種の手法、例えばパターンマッチングを用い得る。その一例として、入力された画像データの輝度信号又はRGBのうちの特定の信号、例えばG信号を2値化し、2値画像データに対してデータ領域244bに辞書データの一部として保存されているテンプレートデータとの一致を検出する。対象のドットが特定の色で構成されている場合は、輝度信号に対する2値化ではなく、特定色との一致度を計算し、一致度を閾値と比較することで2値化する。あるいは、RGB信号の中から特定色の感度が高い信号、例えば黄色ドットならB信号を使って、2値化結果を得る。次いで、ドット密度判断部252は、ドット検出部251で検出されたドット106におけるある面積内でのドット密度を計算する。このような計算処理は、デジタル回路構成のカウンタや加算器等によって実行される。
ここで、ドットパターン検出部210は、ドット密度判断部252の後段に、ベース領域ドット数判断部253とメッセージ領域ドット数判断部254とを有する。これらのベース領域ドット数判断部253とメッセージ領域ドット数判断部254とは、それぞれデータ領域244bを有する。ベース領域ドット数判断部253は、そのデータ領域244bに、ドット密度判断部252でのドット密度計算の基準となるある面積内における出力を禁止するドットパターン103のベース領域104のドット密度に対する同一性判断の許容値となる閾値(基準特徴量に対する閾値)と、一つの原稿用紙102が含んでいる出力を禁止するドットパターン103のベース領域104のドット数に対する同一性判断の許容値となる閾値(基準特徴量に対する閾値)とを辞書データの一部としてロードされ、記憶保存している。メッセージ領域ドット数判断部254は、そのデータ領域244bに、ドット密度判断部252でのドット密度計算の基準となるある面積内における出力を禁止するドットパターン103のメッセージ領域105のドット密度に対する同一性判断の許容値となる閾値(基準特徴量に対する閾値)と、一つの原稿用紙102が含んでいる出力を禁止するドットパターン103のメッセージ領域105のドット数に対する同一性判断の許容値となる閾値(基準特徴量に対する閾値)とを辞書データの一部としてロードされ、記憶保存している。
そこで、ベース領域ドット数判断部253は、ドット密度判断部252で計算されたドット106の密度が、データ領域244bに記憶保存されているドット密度に関する閾値(基準特徴量に対する閾値)内に含まれていると判定した場合、ドット検出部251で検出された同一サイズのドット106のドット数を例えばカウンタに累積する。そして、累積したドットの数が、データ領域244bに記憶保存されているドット数に関する閾値(基準特徴量に対する閾値)内に含まれている場合、出力が禁止されるドットパターン103のベース領域104が存在すると判断し、その判断結果を出力禁止文書判定部211へ出力する。
一方、メッセージ領域ドット数判断部254は、ドット密度判断部252で計算されたドット106の密度が、データ領域244bに記憶保存されているドット密度に関する閾値(基準特徴量に対する閾値)内に含まれていると判定した場合、ドット検出部251で検出された同一サイズのドット106のドット数を例えばカウンタに累積する。そして、累積したドットの数が、データ領域244bに記憶保存されているドット数に関する閾値(基準特徴量に対する閾値)内に含まれている場合、出力が禁止されるドットパターン103のメッセージ領域105が存在すると判断し、その判断結果を出力禁止文書判定部211へ出力する。
次いで、出力禁止文書判定部211は、ドットパターン検出部210の処理結果を受け、出力禁止文書の判断処理を、予め設定した判断基準によって実行する。この判断基準は、例えば、データ領域244bに辞書データの一部となるパラメータとして保存しても良く、操作表示部205からの入力によってそのようなデータ領域244bに設定されていても良い。例えば、出力禁止文書判定部211は、スキャナ201で読み取った原稿画像101中に、ドットパターン103のベース領域104とメッセージ領域105との一方が存在する場合に、機密文書のような出力禁止文書であると判断する。あるいは、出力禁止文書判定部211は、スキャナ201で読み取った原稿画像101中に、ドットパターン103のベース領域104とメッセージ領域105との双方が存在する場合に、機密文書のような出力禁止文書であると判断する。
なお、出力禁止文書判定部211での出力禁止文書判定の条件が、ドットパターン103のベース領域104とメッセージ領域105との一方が存在する場合には出力禁止文書があると判定するように設定されていれば、ドットパターン検出部210においてベース領域ドット数判断部253とメッセージ領域ドット数判断部254との両方を設ける必要がない。例えば、出力禁止文書判定の条件にベース領域104のみを使う場合には、ベース領域ドット数判断部253のみを含む図16(b)のような構成とすれば良く、出力禁止文書判定の条件にメッセージ領域105のみを使う場合にはメッセージ領域ドット数判断部254のみを含む図16(c)のような構成とすれば良い。
さらに、ドットパターン103が単一の大きさのドット106から構成されている図6及び図7に例示したようなドットパターン103を有する原稿画像101を出力禁止文書の判定対象とする場合には、ドット密度判断部252の後段に、ベース領域ドット数判断部253とメッセージ領域ドット数判断部254との両者を設ける必要はなく、ドット数判断部255のみ設けておけば良い。このドット数判断部255は、データ領域244bに、ドット密度判断部252でのドット密度計算の基準となるある面積内における出力を禁止するドットパターン103のドット密度に対する同一性判断の許容値となる閾値(基準特徴量に対する閾値)と、一つの原稿用紙102が含んでいる出力を禁止するドットパターン103のドット数に対する同一性判断の許容値となる閾値(基準特徴量に対する閾値)とをロードされ、記憶保存している。
そこで、ドット数判断部255は、ドット密度判断部252で計算されたドット106の密度が、データ領域244bに記憶保存されているドット密度に関する閾値(基準特徴量に対する閾値)内に含まれていると判定した場合、ドット検出部251で検出された同一サイズのドット106のドット数を例えばカウンタに累積する。そして、累積したドットの数が、データ領域244bに記憶保存されているドット数に関する閾値(基準特徴量に対する閾値)内に含まれている場合、出力が禁止されるドットパターン103が存在すると判断し、その判断結果を出力禁止文書判定部211へ出力する。
出力禁止文書判定部211は、前述したように、検出した特徴量であるドット密度と基準特徴量との間に同一性が認められるかどうかを判定する処理を実行する。つまり、出力禁止文書判定部211は、ドットパターン検出部210の処理結果を受け、出力禁止文書の判断処理を、予め設定した判断基準によって実行する。この場合の判断基準としては、例えば、ドット数判断部255から出力が禁止されるドットパターン103が存在するとの判断結果が送信された場合、機密文書のような出力禁止文書であると判断する、という基準が採用される。
以上、ドット数判断部253、254、255及び出力禁止文書判定部211について説明したように、本実施の形態におけるデジタル回路構成の画像処理部202は、原稿画像101の画像データに含まれる背景画像に埋め込まれたドットパターン103を画像データから検出し、検出したドットパターン103が有する特徴量であるドット密度を、データ領域244bに記憶されている出力を禁止するドットパターンの特徴量と比較し、その同一性を判定する、という処理を実行する。これにより、本実施の形態では、原稿画像の種類を問わず、検出したドットパターン103の特徴量とデータ領域244bに記憶されているドットパターンの特徴量との同一性を確認することで、原稿画像101の画像データの出力を禁止すべきかどうかを判定することが可能となる。
そして、出力禁止文書判定部211は、スキャナ201で読み取った原稿画像101が出力禁止文書であると判定した場合、システムコントローラ204へ出力禁止文書が検出されたことを送信する。これに応じて、システムコントローラ204は、出力禁止文書検知後の事後処理、つまり、プロッタ203での複写動作を禁止する。ここに、スキャナ201で読み取った原稿画像101が出力禁止文書であると判定した場合、つまり、検出したドットパターン103の特徴量とデータ領域244bに記憶されているドットパターンの特徴量との間に同一性が認められるとシステムコントローラ204が判定した場合、事後処理である画像データの出力処理を禁止する処理が実行される。これにより、スキャナ201で読み取った原稿画像101が機密文書のような出力禁止文書である場合には、その複写(再現)が防止される。
なお、出力禁止文書の出力を禁止する態様として、本実施の形態では複写の禁止を例示したが、これは単なる一例に過ぎず、例えば、スキャナ201で読み取った原稿画像101の画像データについてスキャナ配信を禁止するような出力禁止態様を採用しても良い。この場合、配信の手法としては、出力禁止文書を本文又は添付文書として電子メールで送信したり、ファクシミリ送信したり、データ送信したりすることが可能であり、スキャナ配信を禁止することで、そのような各種の配信態様が禁止される。
別の実施の形態として、システムコントローラ204は、出力禁止文書検知後の事後処理として、元の原稿画像101の複写結果が複写物としての利用に耐え得ない状態、あるいは判読不能な状態でプロッタ203から出力されるように、元の原稿画像101の画像信号を変更するようにしても良い。その一例として、画像信号を一定の画素値に変更し、塗りつぶしてしまうような処理を行なう。この場合において、グレー(256階調で128)、白、黒などで塗りつぶすことが可能である。また、別の一例としては、何らかのパターンを繰り返し発生させるように画像信号を変更しても良い。
あるいは、出力禁止文書の出力自体は禁止しないまでも、その出力を抑制する態様として、複写禁止文書が画像読み取りされたり画像出力されたりしたことを、例えばシステムコントローラ204に接続されている外部通信装置215を介して外部に通知するようにしても良い。この場合の通知先は、一例ではあるが、各種の管理者が使用する広義のコンピュータ、例えばパーソナルコンピュータ、モバイルコンピュータ、携帯電話等であることが好適である。
これに対して、スキャナ201で読み取った原稿画像101が機密文書のような出力禁止文書でない場合には、通常の複写動作を実行する。つまり、スキャナ201で読み取った原稿画像101の画像データを画像処理部202で処理し、その結果をプロッタ203で出力する。
(2)情報抽出用プログラム及び辞書データのロード
前述したように、本実施の形態の画像処理装置において特徴的な点は、画像データからの特定情報の抽出処理を特殊プロセッサである特定情報抽出用プロセッサ241によって実行し、この際、画像データの状態、例えば変倍率に依存して特定情報を表現するデータが変動する場合の変動要因を認識し、認識された変動要因に従い、変動後の特定情報を表現するデータの抽出処理に適した情報抽出用プログラム及び辞書データを選択し、選択した情報抽出用プログラム及び辞書データを特定情報抽出用プロセッサ241にロードする、という点である。このような処理を実行するために、本実施の形態の画像処理装置では、システムコントローラ204のRAM204cという包括概念で示すメモリ領域内に、一例として、変倍率に応じた除法抽出用プログラムと辞書データとが記憶保存されている。
図17ないし図19は、RAM204c内のメモリ領域におけるメモリマップを示す模式図である。RAM204c内のメモリ領域は、CPU204aを制御するためのCPU制御プログラムを格納するためのCPU制御プログラム格納領域231を備え、さらに、情報抽出用プログラムを格納するためのSIMD画像検知プログラム格納領域232(図17、図19)、及び、辞書データを格納するためのSIMD辞書データ格納領域233(図18)を備える。図17、図19に示すSIMD画像検知プログラム格納領域232には、情報抽出用プログラムが変倍率毎に格納されている。図18に示すSIMD辞書データ格納領域233には、辞書データが変倍率毎に格納されている。
ここで、SIMD画像検知プログラム格納領域232及びSIMD辞書データ格納領域233に格納する情報抽出用プログラム及び辞書データとしては、全ての変倍率について、最も適した情報抽出用プログラム及び辞書データを格納し用意するのが最良であるが、それではメモリ領域上の制限を無視する結果を招来する。そこで、本実施の形態では、情報抽出処理の結果に影響が少ない範囲で変倍率をグループ化(以下、変倍率バンド)して、その代表変倍率に対応した情報抽出用プログラム及び辞書データをそれぞれSIMD画像検知プログラム格納領域232及びSIMD辞書データ格納領域233に格納している。
図17及び図18に示す例は、スキャナ201による読み取り変倍に対応させた変倍率バンドを規定する。つまり、スキャナ201による読み取り変倍の場合、拡大変倍への対応策としては画素の間引き処理をすれば良いので、単一の情報抽出用プログラム及び辞書データによって十分に情報抽出処理を完遂することが可能である。このため、情報抽出用プログラム及び辞書データを変倍率毎又は変倍率バンド毎に特定情報抽出用プロセッサ241にロードする必要はない。これに対して、縮小変倍の場合には、単一の情報抽出用プログラム及び辞書データだけでは、情報抽出処理を実行することが困難である。そこで、この場合には、変倍率毎又は変倍率バンド毎に、情報抽出用プログラム及び辞書データを特定情報抽出用プロセッサ241にロードする必要が生ずる。このようなことから、図17及び図18に示す例では、SIMD画像検知プログラム格納領域232及びSIMD辞書データ格納領域233に格納する情報抽出用プログラム及び辞書データとして、変倍率バンド50%〜59%では変倍率55%にチューニングされたもの、変倍率バンド61%〜69%では変倍率65%にチューニングされたもの、といった具合に、縮小変倍にのみ対応させた変倍率バンドが設定されている。
これに対して、図19に示す例は、デジタル回路構成の前処理部214に設けられた変倍処理部207によって実行される変倍処理を想定した変倍率バンドを規定する。変倍処理部207によって実行される変倍処理は、画像データの主走査方向及び副走査方向の画素数を増減して画像の拡大あるいは縮小を行うものであり、その変倍処理に際してMTF補正や平滑化処理を実行する。このため、縮小変倍の場合のみならず、拡大変倍の場合にも、単一の情報抽出用プログラム及び辞書データだけでは、情報抽出処理を正しく実行することが困難である。そこで、図19に示す例では、SIMD画像検知プログラム格納領域232及びSIMD辞書データ格納領域233に格納する情報抽出用プログラム及び辞書データとして、変倍率バンド25%〜50%では変倍率37%にチューニングされたもの、変倍率バンド51%〜75%では変倍率63%にチューニングされたもの、…、変倍率バンド301%〜400%以上では変倍率350%にチューニングされたもの、といった具合に、縮小変倍及び拡大倍率の双方に対応させた変倍率バンドが設定されている。
図20は、RAM204cのCPU制御プログラム格納領域231に格納されたCPU204aを制御するためのCPU制御プログラムによって実行される処理の一例を示すフローチャートである。コピー開始が検知されると、ステップS5の処理として、CPU204aはシステムの状態、一例としてスキャナ201による読み取り変倍率又はデジタル回路構成の前処理部214に設けられた変倍処理部207による変倍率を認識する。ここに、画像データの状態に依存して特定情報を表現するデータが変動する場合の変動要因を認識する変動要因認識手段、変動要因認識工程、変動要因認識機能が実行される。そして、認識した変倍率に応じた画像検知プログラムを特定情報抽出用プロセッサ241にロードする。ここに、変動要因認識手段(工程、機能)によって認識された変動要因に従い、変動後の特定情報を表現するデータの抽出処理に適した情報抽出用プログラムを選択し、選択した情報抽出用プログラムを特定情報抽出用プロセッサ241にロードするプログラムロード手段、プログラムロード工程、プログラムロード機能が実行される。
続くステップS11では、スキャナ201による原稿画像101の読み取りが開始される。そして、ステップS12では、読み取られた原稿画像101の画像データに特定データが含まれているかどうか、つまり、その画像データが複写禁止原稿に基づくものであるかどうかの判定処理を特定情報抽出用プロセッサ241で実行させる処理が行われる。
そして、特定情報抽出用プロセッサ241から判定結果の提供を受け、画像データが複写禁止原稿に基づくものであったかどうかを判定する(ステップS13)。その結果、画像データが複写禁止原稿に基づくものであったと判定された場合には(ステップS13のY)、読み取られた画像データの破壊処理が実行される(ステップS14)。これに対して、画像データが複写禁止原稿に基づくものでないと判定された場合には(ステップS13のN)、正常な印刷が行われる(ステップS15)。
図21は、RAM204cのCPU制御プログラム格納領域231に格納されたCPU204aを制御するためのCPU制御プログラムによって実行される処理の別の一例を示すフローチャートである。コピー開始が検知されると、ステップS6の処理として、CPU204aはシステムの状態、一例としてスキャナ201による読み取り変倍率又はデジタル回路構成の前処理部214に設けられた変倍処理部207による変倍率を認識する。ここに、画像データの状態に依存して特定情報を表現するデータが変動する場合の変動要因を認識する変動要因認識手段、変動要因認識工程、変動要因認識機能が実行される。そして、認識した変倍率に応じた辞書データを特定情報抽出用プロセッサ241にロードする。ここに、変動要因認識手段(工程、機能)によって認識された変動要因に従い、変動後の特定情報を表現するデータの抽出処理に適した辞書データを選択し、選択した辞書データを特定情報抽出用プロセッサ241にロードするデータロード手段、データロード工程、データロード機能が実行される。
続くステップS11では、スキャナ201による原稿画像101の読み取りが開始される。そして、ステップS12では、読み取られた原稿画像101の画像データに特定データが含まれているかどうか、つまり、その画像データが複写禁止原稿に基づくものであるかどうかの判定処理を特定情報抽出用プロセッサ241で実行させる処理が行われる。
そして、特定情報抽出用プロセッサ241から判定結果の提供を受け、画像データが複写禁止原稿に基づくものであったかどうかを判定する(ステップS13)。その結果、画像データが複写禁止原稿に基づくものであったと判定された場合には(ステップS13のY)、読み取られた画像データの破壊処理が実行される(ステップS14)。これに対して、画像データが複写禁止原稿に基づくものでないと判定された場合には(ステップS13のN)、正常な印刷が行われる(ステップS15)。
以上、説明の便宜上、図20での処理ルーチンと図21での処理ルーチンとを別の処理として説明したが、実際には、それらの処理ルーチンのうちの共通ステップは共通の処理として実行される。つまり、図20での処理ルーチンは情報抽出用プログラムを特定情報抽出用プロセッサ241にロードする処理内容を示し、図21での処理ルーチンは辞書データを特定情報抽出用プロセッサ241にロードする処理を示している。そして、原稿画像101の画像データに含まれる特定情報を正しく検出するためには、それらの情報抽出用プログラム及び辞書データの双方が、変動要因認識手段(工程、機能)によって認識された変動要因に応じた最適の情報抽出用プログラム及び辞書データとして選択される必要がある。したがって、図20及び図21のステップS11〜15の処理に先立ち、図20に示すステップS5の処理と図21に示すステップS6の処理との双方が正しく実行されなければならない。
別の実施の形態として、RAM204c内のSIMD画像検知プログラム格納領域232に格納する情報抽出用プログラム及びRAM204c内のSIMD辞書データ格納領域233に格納する辞書データを圧縮して格納した場合を想定する。この場合、CPU204aは、システムの状態、つまり変倍率に応じた情報抽出用プログラムをSIMD画像検知プログラム格納領域232から選択してその選択した情報抽出用プログラムを伸張し(図22のステップS1)、しかる後に伸張した情報抽出用プログラムを特定情報抽出用プロセッサ241にロードする(図22のステップS2)。あるいは、CPU204aは、システムの状態、つまり変倍率に応じた辞書データをSIMD辞書データ格納領域233から選択してその選択した辞書データを伸張し(図23のステップS3)、しかる後に伸張した辞書データを特定情報抽出用プロセッサ241にロードする(図23のステップS4)。その後のステップS11〜15では、図20及び図21に示したステップS11〜15の処理と同一の処理が実行される。
ここで、図20中、コピー開始が検知された場合、CPU204aがシステムの状態としてデジタル回路構成の前処理部214に設けられた変倍処理部207による変倍率を認識した場合を想定する(変動要因認識手段、変動要因認識工程、変動要因認識機能)。この場合、プログラムロード手段、プログラムロード工程、プログラムロード機能により、認識された変動要因に従い選択される情報抽出用プログラムは、前処理部214における変倍処理部207に、変倍処理に際してMTF補正や平滑化処理を実行させる。
この際、変倍処理の手法として最近傍法が選択されるとすると、画像データに施すMTF補正は低めに設定される。これに対して、変倍処理の手法として線形補完法が選択されるとすると、MTF補正を高めに設定する。図24に、MTF補正の係数を変更する3×3フィルタの例を示す。
また、平滑化処理に関しては、最近傍法を採用する場合には平滑度を高く設定し、線形補完法では平滑度を低く設定する。さらに、変倍率との関係では、拡大倍率が大きくなるほど平滑度を低く設定し、拡大倍率が小さいほど平滑度を高く設定する。図25に、平滑度の係数を変更する3×3フィルタの例を示す。
ここで、前述したように、RAM204c内のメモリ領域には、情報抽出用プログラムを格納するためのSIMD画像検知プログラム格納領域232(図17、図19)、及び、辞書データを格納するためのSIMD辞書データ格納領域233(図18)が備えられている。このようなRAM204c内のSIMD画像検知プログラム格納領域232及びSIMD辞書データ格納領域233に記憶されている情報抽出用プログラム及び辞書データは、一例として、図示しないメモリカードに予め記憶保存されており、図13に示すメモリカードインターフェース216を介してRAM204c内に取り込むことが可能である。
図26は、情報抽出用プログラム入れ替え処理の流れを示すフローチャートである。この処理は、RAM204cのCPU制御プログラム格納領域231に格納されたCPU204aを制御するためのCPU制御プログラムによって実行される。
まず、コンピュータ1001に対するメモリカードの装着が検知されると、情報抽出用プログラムの入れ替えを行うか否かの確認と認証とが実行される(ステップS21、22)。そして、CPU204aは、メモリカード内の情報抽出用プログラムのデータを読み込み(ステップS23)、これを圧縮し(ステップS24)、RAM204c内のSIMD画像検知プログラム格納領域232へ書き込む(ステップS25)。ここに、プログラム取込手段、プログラム取込工程、プログラム取込機能が実行される。
図27は、辞書データ入れ替え処理の流れを示すフローチャートである。この処理は、RAM204cのCPU制御プログラム格納領域231に格納されたCPU204aを制御するためのCPU制御プログラムによって実行される。
まず、コンピュータ1001に対するメモリカードの装着が検知されると、辞書データの入れ替えを行うか否かの確認と認証とが実行される(ステップS31、32)。そして、CPU204aは、メモリカード内の辞書データを読み込み(ステップS33)、これを圧縮し(ステップS34)、RAM204c内のSIMD画像検知プログラム格納領域232へ書き込む(ステップS35)。ここに、データ取込手段、データ取込工程、データ取込機能が実行される。
図28は、プログラムロードの処理の流れを示すフローチャートである。この処理は、RAM204cのCPU制御プログラム格納領域231に格納されたCPU204aを制御するためのCPU制御プログラムによって実行される。
まず、変倍率の変更を監視している(ステップS41)。この処理において、変倍率の変更があると判定された場合には(ステップS41のY)、変倍率のバンドに変更があったか否かをチェックする(ステップS42)。変更があった場合(ステップS42のY)、RAM204c内のSIMD画像検知プログラム格納領域232から、変倍率バンドに対応した情報抽出用プログラムを特定情報抽出用プロセッサ241にロードする。この際、情報抽出用プログラムが圧縮してあれば、伸張してからロードする。そして、変倍率に応じた即値をロードする(ステップS44)。変倍率バンドに変更がなく、変倍率に変更があった場合には、即値のみロードする(ステップS42のN、ステップS44)。変倍率バンドに変更がない場合、情報抽出用プログラムを全て再ロードする必要はない。そこで、このような場合には、即値のうち変更のある部分のみをロードし、ロード時間の短縮を図っている。しかも、通常、システムの状態に応じて、処理部分をプログラム領域244a、処理に依存しないパラメータ部分をデータ領域244bにロードするのに対して、使用頻度の高いパラメータをプログラムの即値としておけば、データ領域244bからの読み込みサイクルが不要になるので、処理速度の高速化も可能となる。
以上説明したように、本実施の形態の画像処理装置、画像処理方法、コンピュータプログラムによれば、DSPやSIMD型プロセッサ等のような特殊プロセッサを特定情報抽出用プロセッサ241として用いた場合、そのような特殊プロセッサが有するプログラム領域244aやデータ領域244bについて大きな記憶容量を必要とすることなく、画像処理装置の状態、例えば変倍率に応じた最適な画像認識処理を行うことができる。