JP7358218B2 - 画像処理装置および画像処理方法、プログラム - Google Patents

画像処理装置および画像処理方法、プログラム Download PDF

Info

Publication number
JP7358218B2
JP7358218B2 JP2019217571A JP2019217571A JP7358218B2 JP 7358218 B2 JP7358218 B2 JP 7358218B2 JP 2019217571 A JP2019217571 A JP 2019217571A JP 2019217571 A JP2019217571 A JP 2019217571A JP 7358218 B2 JP7358218 B2 JP 7358218B2
Authority
JP
Japan
Prior art keywords
image
color
image data
input
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019217571A
Other languages
English (en)
Other versions
JP2021087202A (ja
Inventor
直諒 柏木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019217571A priority Critical patent/JP7358218B2/ja
Publication of JP2021087202A publication Critical patent/JP2021087202A/ja
Application granted granted Critical
Publication of JP7358218B2 publication Critical patent/JP7358218B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Color Image Communication Systems (AREA)

Description

画像処理装置および画像処理方法、プログラムに関する。
従来、読み取った画像がカラーかモノクロかを判定する際に、色ずれによる誤判定を抑制する技術が知られている。
特許文献1には、注目画素の周辺画素の副走査方向に隣接する画素値に係数を掛けて加算し、その画素値から色ずれが発生した画素かどうかを判定し、その判定結果に基づいて読み取った画像がカラーかモノクロかを判定する画像処理装置が開示されている。
特開2000-22964号公報
RGBの3ラインカラーセンサの位置ずれによって、広範囲に及ぶモアレのような色ずれは通常の色ずれに比べて広い領域で発生し、通常の色ずれと異なるパターンを持つため、特許文献1のように隣接画素を参照しても色ずれかどうかを判定することができない。そのため、読み取った画像がカラーかモノクロかを判定する際に、色ずれによる誤判定を抑制できない場合がある。
本発明は上記の課題に鑑みてなされたものであり、読み取った画像がカラーかモノクロかを判定する際に、広範囲に及ぶモアレのような色ずれによる誤判定を抑制することを目的とする。
本発明の画像処理装置は、画像データを入力する入力手段と、前記入力手段が入力した画像データが示す画像がカラー画像かモノクロ画像かを決定する決定手段とを有し、前記決定手段は、色ずれが発生している画像と正解データに基づいて生成された学習済みモデルを用いて前記入力手段が入力した画像データが示す画像がカラー画像かモノクロ画像かを決定することを特徴とする。
読み取った画像がカラーかモノクロかを判定する際に、広範囲に及ぶモアレのような色ずれによる誤判定を抑制することができる。
MFP101のハードウェア構成の一例を示す図 MFP101の断面図の一例を示す図 カラー/モノクロ判定処理の一例を示す図 学習済みモデルのニューラルネットワークの構成の一例を示す図 正解データを作成する処理の一例を示す図 読み取られる画像の色ずれモアレの一例を示す図 色ずれモアレおよび正解データのパターンの一例を示す図 領域制限部303によって制限される領域の一例を示す図 画像を複数のブロックに分割する処理の一例を示す図 カラーブロック判定部304の処理の一例を示すフローチャート
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施例において示す構成は一例であり本発明は図示された構成に限定されるものではない。
本実施例では、一つのニューラルネットワークを用いた判定部によって有彩色/無彩色の推定を行う画像処理装置について説明する。なお、本実施例では学習用カラー画像に対する正解データを記録媒体上に印刷された画像のスキャン画像から作成する。詳細については後述する。
<画像処理装置の構成>
図1は、MFP101のハードウェア構成の一例を示す図である。画像処理装置の一例であるMFP(Multi Function Peripheral)101はCPU111、ROM112、RAM113、ストレージ114、操作部I/F115、操作部116を備える。また、MFP101は読取部I/F117、読取部118、印刷部I/F119、印刷部120、無線通信部I/F121、無線通信部122、FAX部I/F123、FAX通信部124、通信部I/F125、通信部126を備える。また、MFP101はGPU127を備える。
CPU111を含む制御部110は、MFP101全体の動作を制御する。CPU111は、ROM112又はストレージ114に記憶された制御プログラムをRAM113に読み出して、読取制御や印刷制御などの各種制御を行う。ROM112は、CPU111で実行可能な制御プログラムを格納する。また、ROM112は、ブートプログラムやフォントデータなども格納する。RAM113は、主記憶メモリであり、ワークエリア、ROM112及びストレージ114に格納された各種制御プログラムを展開するための一時記憶領域として用いられる。ストレージ114は、画像データ、印刷データ、各種プログラム、及び各種設定情報を記憶する。本実施例ではストレージ114としてフラッシュメモリを想定しているが、SSD(Solid State Drive)やHDD(Hard Disc Drive)などの補助記憶装置を用いるようにしても良い。また、eMMC(embedded Multi Media Card)を用いるようにしても良い。
なお、本実施例のMFP101は、1つのCPU111が1つのメモリ(RAM113)を用いて後述するフローチャートに示す各処理を実行するものとするが、これに限るものではない。例えば複数のCPU、RAM、ROM、及びストレージを協働させて後述するフローチャートに示す各処理を実行することもできる。また、ASICやFPGA等のハードウェア回路を用いて一部の処理を実行するようにしてもよい。
操作部I/F115は、例えばタッチパネルのような表示部やハードキーを含む操作部116と制御部110を接続する。操作部116は、ユーザに対して情報を表示したり、ユーザからの入力を検出したりする。
読取部I/F117は、例えばスキャナのような読取部118と制御部110を接続する。読取部118は原稿の画像を読み取って、CPU111がその画像をバイナリーデータなどの画像データに変換する。読取部118によって読み取られた画像に基づき生成された画像データは、外部装置に送信されたり、記録紙上に印刷されたりする。
印刷部I/F119は、例えばプリンタのような印刷部120と制御部110を接続する。CPU111は、RAM113に記憶された画像データ(印刷データ)を印刷部I/F119を介して印刷部120に転送する。印刷部120は、転送された画像データに基づく画像を給紙カセットから給送された記録紙に印刷する。
無線通信部I/F121は、無線通信部122を制御する為のI/Fで制御部110と無線経由で外部の無線機器(ここではモバイル端末102)と接続する。
制御部110は、FAX部I/F123により、ファクシミリのようなFAX通信部124を制御する事で公衆回線網107に接続される。FAX部I/F123は、FAX通信部124を制御する為のI/Fで、ファクシミリ通信用のモデムやNCUを制御する事で公衆回線網への接続、ファクシミリ通信プロトコルの制御などを行う事が可能となる。
通信部I/F125は、制御部110とネットワーク100を接続する。通信部I/F125は、通信部126がネットワーク100上の外部装置に画像データや装置内部の各種情報を送信したり、ネットワーク100上の情報処理装置から印刷データやネットワーク100上の情報を受信したりする。ネットワーク100を介した送受信の方法としては、電子メールを用いての送受信や、その他のプロトコル(例えば、FTPやSMB、WEBDAV等)を用いたファイル送信を行うことができる。
GPU127はデータをより多く並列処理することで効率的な演算を行うことができるため、ディープラーニングのような機械学習のための学習モデルを用いて学習を行う場合にはGPU127で処理を行う。また、CPU111とGPU127とが協働して機械学習処理を実行してもよい。
図2はMFP101の断面図の一例を示す図である。MFP101は、読取部118、レーザ露光部202、作像部203、定着部204、給紙/搬送部205から構成される。
読取部118は、原稿台に置かれた原稿に対して、照明を当てて原稿画像を光学的に読み取り、その像を電気信号に変換して画像データを作成する工程である。なお、読取部118はADF(Auto Document Feeder)を用いて原稿を搬送することで、原稿の画像を読み取ってもよい。
レーザ露光部202は、前記画像データに応じて変調されたレーザ光などの光線を等角速度で回転する回転多面鏡(ポリゴンミラー)に入射させ、反射走査光として感光ドラムに照射する。
作像部203は、感光ドラムを回転駆動し、帯電器によって帯電させ、前記レーザ露光部によって感光ドラム上に形成された潜像に対し、トナーによって現像化し、そのトナー像をシートに転写する。その際に転写されずに感光ドラム上に残った微小トナーを回収する、一連の電子写真プロセスを実行する。
定着部204は、ローラやベルトの組み合わせによって構成され、ハロゲンヒータなどの熱源を内蔵し、前記作像部によってトナー像が転写されたシート上のトナーを、熱と圧力によって溶解、定着させる。
給紙/搬送部205は、シートカセットやペーパーデッキに代表されるシート収納庫を一つ以上持っており、前記プリンタ制御部の指示に応じてシート収納庫に収納された複数のシートの中から一枚分離し、作像部・定着部へ搬送する。シートの両面に画像形成する場合は、定着部を通過したシートを再度作像部へ搬送する搬送経路を通るように制御する。
印刷部120は、レーザ露光部202、作像部203、定着部204、給紙/搬送部205の各部の状態を管理しながら、全体が円滑に動作できるよう指示を行う。
CPU111は、画像データに対し、RGB画像データからCMYK画像データへの変換、出力画像の濃度補正を行う出力ガンマ補正、ハーフトーン画像への変換、その他スムージング処理等の補正処理を行う。また、本発明を適用した画像処理装置は、この画像処理部に含まれるとする。なお、画像処理部は必ずしもMFP本体内に存在しなくてもよく、ネットワークを介したクラウド上のサーバーや、接続されたPC上で同様の画像処理が行われてもよい。
<カラー/モノクロ判定処理>
図3はカラー/モノクロ判定処理の一例を示す図である。以下で説明する各処理はCPU111もしくはGPU127がROM112またはストレージ114などからプログラムをRAM113にロードし、そのプログラムコードに基づいて演算処理を行うことで実現する。読取部118で取得した画像データならびに各処理の中間生成データも適宜RAM113にリード/ライトを行いつつCPU111もしくはGPU127が画像処理演算を行うものである。
CPU111は、読取部118が原稿の画像をスキャンして生成したRGBで表現される画像データを受け付けることで以下の処理が実行される。なおここで入力される画像の向きの前提は画像読取部101において主走査方向がラインセンサ列の延びる方向、副走査方向がセンサ移動方向として説明を行う。各ラインセンサは副走査方向に並んで配置されている。従って、各ラインセンサの読み取り位置のずれに起因する色ずれによって発生しやすくなる偽色は主走査方向に細く発生する。
平滑化部301では、CPU111がRGBの画像データに対して平滑化処理を行い、読取部118がスキャンすることによって発生するノイズの影響を抑制する。ここで、ノイズとはR、G、Bの各ラインセンサの読み取り位置のずれに起因するものではなく、原稿自体に起因するものである。例えば、原稿が再生紙の場合には、カラーで印字されていないにも関わらず、色がついた紙片を含む用紙であった場合、部分的に原稿の表面に有彩色があると判定してしまう。生成した画像データの画素に基づいてカラー画素かモノクロ画素かを判定する場合には、上記ノイズの影響を受けやすい。そこで、平滑化部301では、これらの影響を抑制する。
学習済みモデルによる推定部302では、GPU127が、平滑化処理が行われた画像データを学習済みモデル(学習モデル)に入力し、注目画素がカラー画素かモノクロ画素かを推定する。この処理については、図4で詳細に説明する。
なお、学習済みモデルによる推定部302では、GPU127が、単純に注目画素がカラー画素かモノクロ画素かを判定するのではなく、注目画素が高彩度画素か低彩度画素か、あるいは無彩色画素かを推定してもよい。本実施例では、学習済みモデルによる推定部302において、GPU127が、注目画素が有彩色画素か、あるいは無彩色画素かを推定し、その推定結果を出力する例を説明する。
領域制限部303では、CPU111が読取部118内のミラーユニットの移動時の加速、減速に起因する第1の色ずれを抑制するために、生成した画像データにおいてカラー/モノクロ判定を行なう領域を制限する。読取部118で読み取った原稿の副走査方向の先端領域と後端領域では、ミラーユニットの加速、減速に起因する第1の色ずれが発生する可能性がある。よって、このような色ずれが原因で本来ならばモノクロと判定すべきところをカラーであると判定する誤判定を引き起こす可能性がある。よって領域制限部303にて、CPU111は原稿の副走査方向の先端領域と後端領域をカラー/モノクロ判定の対象領域から除外する。
カラーブロック判定部304では、CPU111はカラー/モノクロ判定の対象領域を複数に分割したブロック毎にカラーブロックであるか否かの判定を行う。具体的には、そのブロックに含まれる有彩色画素の数に基づいて判定する。詳細は後述する。
カラーブロックカウント部305では、CPU111はカラー/モノクロ判定の対象領域内のカラーブロックの数をカウントする。
カラー/モノクロ判定部306では、CPU111はカラーブロックの数を基に入力された画像がカラー画像であるか、モノクロ画像であるかを決定する。詳細は後述する。
<平滑化部301>
前述の通り、平滑化部301では、CPU111がノイズの影響を抑制する処理を行なう。なお、平滑化処理の実行において、十分に広い範囲で平滑化することでノイズの影響を抑制することが可能である。
平滑化部301では、RGBで構成される画像データが入力されると、CPU111が複数の画素で構成されるウィンドウに画像を切り出し、所定のサイズ(ここでは、横3画素、縦7画素)のウィンドウ内の画素に対して平滑化処理を行なう。平滑化処理はウィンドウ内の画素値の平均値を求める事で実施する。そして、求めた平均値を注目画素の画素値と置き換える。このような処理をスキャン画像内の各画素を注目画素として処理を行なうことでスキャン画像の平滑化処理が行なわれる。
またウィンドウ内の画素値の平均を求める事で平滑化処理を行う例を説明したが、フィルタ処理を用いて例えばライン中心に重みを置いた平滑化フィルタを用いてもよい。
<学習済みモデルによる有彩色/無彩色判定部の構成>
以下では学習済みモデルによる推定部302の構成について、説明する。図4は学習済みモデルのニューラルネットワークの構成の一例を示す図である。図4のニューラルネットワークは、より層の多いニューラルネットワークであっても、層の少ないニューラルネットワークであってもよい。また、以下の処理はMFP101のGPU127がROM112もしくはストレージ114に記憶されたプログラムを実行することにより、実行される。また、本実施例で説明する学習済みモデルはストレージ114に記憶されている。
まず、学習済みモデルによる推定部302に入力された画像データは、Convolution Layer401において畳み込み演算が行われる。入力画像データの(x、y)位置の画素値をI(x、y)とすると、Convolution Layer401の出力画像データIG1(x、y、p)は、以下の式で算出される。
Figure 0007358218000001
ここで、pは出力プレーン数であり、Convolution Layer401ではp1 = 56とした。また、
Figure 0007358218000002
はニューラルネットワークが保持しているConvolution Layer401における重みであり、s、t、p1の組み合わせごとに異なる値を有している。なお、上記式中のI(x+s、x+t)であるが、参照位置が入力画像データの有する画素位置外(例えば、I(-1、-1)など)の場合は、画素値を0として演算を行う。以上の演算により、Convolution Layer401の出力は、256x256x2の画像データとなる。
次に、Activation Layer402では、Convolution Layer401の出力画像データIG1(x、y、p1)に対して、非線形関数を適用する。具体的には、Activation Layer402の出力画像データIG2(x、y、p2)は、ランプ関数を用いて以下の式で計算される。
Figure 0007358218000003
なお、当該処理で適用される非線形関数は、これに限定されない。例えば、双曲線正接関数(hyperbolic tangent)などを用いてもよい。以上の演算により、Activation Layer402の出力画像データIG2(x、y、p)は、256×256×56の画像データ、すなわち256×256の画像データが56プレーンの画像データとなる。
次にConvolution Layer403においてもConvolution Layer401と同様に畳み込み演算が行われる。Activation Layer402の出力画像データIG2(x、y、p1)に対して、Convolution Layer403の出力画像データIG3(x、y、p3)は、以下の式で算出される。
Figure 0007358218000004
ここでは畳み込みにおけるフィルタサイズを1×1としたため、s、tの指定はない。また、Convolution Layer403ではp3 = 16とした。
Figure 0007358218000005
はConvolution Layer403における重みであり、p3の組み合わせごとに異なる値を有している。
次に、Activation Layer404では、Convolution Layer403の出力画像データIG3(x、y、p3)に対して、非線形関数を適用する。ランプ関数を用いて以下の式で計算される。
Figure 0007358218000006
以上の演算により、Activation Layer404の出力画像データIG4(x、y、p3)は、256×256×16の画像データとなる。
次にConvolution Layer405においても畳み込み演算が行われる。Activation Layer404の出力画像データIG5(x、y、p5)に対して、Convolution Layer404の出力画像データIG4(x、y、p3)は、以下の式で算出される。
Figure 0007358218000007
ここで、p5 = 12とした。
Figure 0007358218000008
はConvolution Layer405における重みであり、s、t、p5の組み合わせごとに異なる値を有している。
Activation Layer406では、Convolution Layer405の出力画像データIG5(x、y、p5)に対して、ランプ関数を用いて以下の式で計算される。
Figure 0007358218000009
Convolution Layer407においても畳み込み演算が行われる。Activation Layer406の出力画像データIG6(x、y、p5)に対して、Convolution Layer407の出力画像データIG7(x、y、p7)は、以下の式で算出される。
Figure 0007358218000010
ここで、p7 = 56とした。
Figure 0007358218000011
はp7ごとに異なる値を有している。
Activation Layer408では、Convolution Layer407の出力画像データIG7(x、y、p7)に対して、ランプ関数を用いて以下の式で計算される。
Figure 0007358218000012
Convolution Layer409においても畳み込み演算が行われる。Activation Layer408の出力画像データIG8(x、y、p7)に対して、Convolution Layer408の出力画像データIG8(x、y、p7)は、以下の式で算出される。
Figure 0007358218000013
Figure 0007358218000014
はs、tごとに異なる値を有している。
Activation Layer410では、Convolution Layer409の出力画像データIG9(x、y、p9)に対して、シグモイド関数を用いて以下の式で計算される。
Figure 0007358218000015
以上の演算より、出力画像データIG10(x、y)は、256×256の画像データとなる。それぞれの画素には0から1の値が格納されている。ここで、それぞれの画素に対して閾値Th_Sigmoidと比較することでそれぞれの画素が有彩色か無彩色かを判定する。Th_Sigmoid以上の値の際は有彩色、Th_Sigmoid未満の値の際は無彩色と判定する。Th_Sigmoidは0.5を用いることができるが、他の値でもよい。
ここで、Activation Layer410から出力された推定画像データは画素ごとに有彩色か無彩色を判定している2値画像データである。なお、この推定画像データは画像と同じサイズの2値の配列であってもよい。
<学習方法>
図5は正解データを作成する処理の一例を示す図である。なお、この処理はCPU111がROM112またはストレージ114などからプログラムをRAM113にロードし、実行することで実現する。
画像読み取り処理501において、CPU111は読取部118を制御し、原稿の画像を読み取り画像データを生成する。この時、読み取られる画像には色ずれモアレが発生している。色ずれモアレとはRGBの3ラインカラーセンサの位置ずれが複数重なって初めて発生する色ずれの干渉によって発生するモアレのような現象(色ずれ)である。この現象に対応するためには、隣接画素だけではなく周囲の画素を参照する必要がある。また、色ずれモアレとは、例えばあるMFPが原稿の画像をコピーする際、MFPのスキャナのRGBラインセンサがセンシングする位相のずれによる色ずれが周期的に起こることによって発生する。
図6は読み取られる画像の色ずれモアレの一例を示す図である。図6(a)は読み取られる画像の印刷前のデジタル画像を表し、薄い黒色(R:210、G:210、B:210)を示す。R、G、Bの値は8bit階調の際の信号値の例を示すが、他の値でもよい。
図6(b)は読み取られる画像の印刷後の画像を示す。色ずれモアレが発生すると本来なかった有彩色の色が周期的に現れ、モアレが出る。ここで現れた有彩色は例えば薄い赤(R:230、G:210、B:210)、濃い赤(R:230、G:180、B:180)、薄い黒(R:210、G:210、B:180)である。本実施例では濃い赤と薄い赤のモアレが発生する例を示したが、別の色によるモアレでもよい。例えば濃い緑と薄い緑のモアレでも構わないし、薄い緑と濃い赤によって発生するモアレでも構わない。
この図6(b)の色ずれモアレが発生している画像が印刷された原稿をスキャンして、生成したRGB画像データが学習データとなる。
閾値判定処理502では、CPU111は学習データに対して閾値処理を用いて、画素ごとに有彩色/無彩色の判定をする。彩度Sは、例えば以下の式を用いて算出することが可能である。
S=MAX(R、G、B)-MIN(R、G、B)
ここで、MAX(R、G、B)は、R、G、Bの各色の値の中の最大値を示し、MIN(R、G、B)は、R、G、Bの各色の値の中の最低値を示す。この彩度Sに対して以下に示す閾値処理を行うことで有彩色画素かあるいは無彩色画素かを判定する。
if(S<Th) Then 無彩色画素
else 有彩色画素
つまり、彩度Sが閾値Thより小さいときはその画素を無彩色画素と判定し、彩度Sが閾値Th以上であるときは、その画素を有彩色画素と判定する。
次に画像分割処理503では、CPU111は、色ずれモアレを修正した画像を示す画像データを入力する。なお、この色ずれモアレを修正した画像を示す画像データはユーザの操作によってMFP101が受け付ける。ここでいう修正とは、色ずれモアレが発生した箇所に対して、閾値処理では誤判定となる箇所の有彩色/無彩色の判定結果の書き換えのことである。修正方法については、例えば画像編集アプリケーションソフトウェアを用いて目視で確認し、書き換えてもよい。この正解データは色ずれが発生している画像を示す画像データにおける画素の有彩色もしくは無彩色を示す情報を修正したデータである。
図6(c)に図6(b)の画像を上記閾値で有彩色/無彩色を判定した結果を示す。図6(c)において、黒色が有彩色、白色が無彩色を表す。CPU111は、修正した画像を受け取ると、学習データの画像と正解データの画像を所定のサイズにカットする。所定のサイズは例えば256×256でもよいし、もっと大きくてもよい。ただし、図4の入力画像のサイズと一致したサイズである必要がある。
図7は色ずれモアレおよび正解データのパターンの一例を示す図である。図7(a1)は薄い赤と濃い赤によって発生した色ずれモアレの様子を示す。R、G、Bの値は8bit階調の際の信号値の例を示すが、他の値でもよい。本例では濃い赤と薄い赤のモアレが発生する例を示したが、別の色によるモアレでもよい。図7(a2)はその時に学習する正解データを表す。色ずれが発生した箇所に対しても無彩色であると学習する。図7(b1)、(c1)は別の色ずれモアレのパターンの例を示す。図7(b1)は濃い緑の中に班点状に薄い緑の点が見られ、モアレの形状となっている。図7(b1)は薄い緑(R:210、G:230、B:210)、濃い緑(R:180、G:230、B:180)から構成されている。図7(c1)は黒のエッジ部に対して発生する色ずれモアレの例である。本来ならば黒と白のみで構成される画像だが、色ずれが発生し、薄い赤(R:230、G:210、B:210)、濃い赤(R:230、G:180、B:180)、黒(R:5、G:5、B:5)から構成されている。図7(b1)、(c1)の正解データは図7(b2)、(c2)に示すように無彩色と判定したデータとなる。学習データと正解データがそろうと図4で示されるニューラルネットワークで学習させる。
<領域制限部>
次に、領域制限部303の処理について説明する。図8は領域制限部303によって制限される領域の一例を示す図である。原稿の長さをlengthとした時に、副走査方向の原点側からsp0、sp1、lengthを設定する。これらの座標指定により原稿領域は図示するカラー/モノクロ判定が有効な領域とカラー/モノクロ判定が無効な領域とに分割することができる。領域制限部303は、具体的には学習済みモデルによる推定部302の推定結果に対して、カラー/モノクロ判定が無効な領域の全ての画素については強制的に無彩色画素であると判定結果を置換える。これによりカラー/モノクロ判定が有効な領域の画素についてのみカラー/モノクロ判定処理を行うことができる。
なお、カラー/モノクロ判定が無効な領域は原稿の副走査方向の先端領域と後端領域に限るものではなく、左右端領域が設定されてもよいし、原稿中の複数個所に設定されてもよい。
<カラーブロック判定部>
次に、カラーブロック判定部304の処理について説明する。カラーブロック判定部304は原稿から得られるスキャン画像を図9に示すようなM×N(M、Nは整数)画素で構成されるブロック領域に分割する。図9は画像を複数のブロックに分割する処理の一例を示す図である。そして学習済みモデルによる推定部302の結果を基に各ブロックがカラーブロックであるか否かを判定する。
図10はカラーブロック判定部304の処理の一例を示すフローチャートである。CPU111がROM112に記憶されたプログラムをRAM113に読み出し、実行することで図10のフローチャートの処理は実行される。
S1001においてCPU111は、まず処理対象となる注目ブロックを決定する。本実施例では、最初の注目ブロックは主走査方向及び副走査方向の原点側にあるブロックであり、以降の処理を繰り返すたびに主走査方向へ移動し、それを副走査方向に繰り返す。そして最終ブロックは原稿右下のブロックとなる。
S1002においてCPU111は、S1001で決定した注目ブロック内の有彩色画素数と予め設定してある閾値Th2とを比較する。
S1003においてCPU111は、S1002で有彩色画素数がTh2より大きい場合はS1001で決定した注目ブロックをカラーブロックであると判定する。
S1004においてCPU111は、注目ブロックが最終ブロックではなかった場合、S1001に戻り、カラーブロック判定を繰り返す。以上の動作をすることで、スキャン画像の全ブロックについて、カラーブロックであるか否かの判定ができる。
<カラーブロックカウント部>
次に、カラーブロックカウント部305の処理について説明する。カラーブロックカウント部305はカラーブロック判定部304で判定したカラーブロックの数をカウントする。
<カラー/モノクロ判定部>
次に、カラー/モノクロ判定部306の処理を説明する。カラー/モノクロ判定部306ではカラーブロックカウント部305によってカウントされたカラーブロックカウンタBlockCntと閾値Th3とを比較する。そして、閾値Th3より多いカラーブロックがあった場合にその原稿をカラー原稿であると判定する。
<本画像処理の効果>
本実施例によれば、印刷に対して発生する色ずれモアレがあっても高精度にカラー/モノクロ判定することができる画像処理装置を提供する。本実施例では機械学習における正解データを印刷された画像データのスキャン画像から作成した。閾値有彩色/無彩色判定では誤判定する色ずれモアレを人が判断して判定する。そのため、スキャナが持つ特性のうち、色ずれモアレだけを対象として誤判定から抑制することが可能である。
実施例1では記憶媒体に印刷された画像に対して読み取り装置を用いてスキャンし、スキャンされた画像から正解画像を作成した。一方、実施例2では印刷された画像のもととなるデジタルデータから正解画像を作成する。以下では実施例1からの差分を主に説明する。
<学習方法>
本実施例における学習データは、記録媒体に印刷された画像データから作成される。しかし、正解データは印刷された画像データのもととなるデジタルデータから作成される。
本実施例においても実施例1と同様に、図5を用いて手順を説明する。なお、このフローチャートはCPU111がROM112またはストレージ114からプログラムをRAMにロードし、そのプログラムコードに基づいて演算処理を行うことで実現する。
画像読み取り処理501において、CPU111は読取部118から読み込まれたRGB画像データを受け取る。このとき読み込まれる画像データには、色ずれモアレが発生している。
閾値判定処理502では、CPU111は印刷した画像データのもととなる入力画像データに対して閾値処理を用いて、画素ごとに有彩色/無彩色判定する。閾値処理には実施例1同様、彩度Sを用いることができる。ここで、デジタルデータには色ずれモアレは発生しないため、本実施例では実施例1のように、ユーザが有彩色/無彩色の判定をした画像データを修正する必要はない。
続いて、画像分割処理503では、CPU111は学習データの画像と正解データの画像を所定のサイズにカットする。所定のサイズは例え256×256でもよいし、もっと大きくてもよい。ただし、図4の入力画像のサイズと一致したサイズである必要がある。
学習データと正解データがそろうと図4で示されるニューラルネットワークで学習させる。
本実施例では機械学習における正解データを印刷された画像データの元のデジタル画像から作成するため、デジタルデータを記録媒体上に再現するうえで本来起きるはずのなかった色ずれモアレの誤判定をなくすことができる。すなわち、スキャナによって発生するデジタル画像には見られない、色ずれモアレを主とする誤判定を総じて抑制することが可能となる。
<その他の実施の形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給する。そして、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
101 MFP
111 CPU
118 読取部
127 GPU

Claims (13)

  1. 画像データを入力する入力手段と、
    前記入力手段が入力した画像データが示す画像がカラー画像かモノクロ画像かを決定する決定手段と、
    前記決定手段は、色ずれが発生している画像と正解データに基づいて生成された学習済みモデルを用いて前記入力手段が入力した画像データが示す画像がカラー画像かモノクロ画像かを決定することを特徴とする画像処理装置。
  2. 前記学習済みモデルを用いて前記入力手段が入力した画像データの画素ごとに、有彩色の画素か無彩色の画素かを推定することを特徴とする推定手段をさらに有し、
    前記決定手段は、前記推定手段の推定結果に基づいて前記入力手段が入力した画像データが示す画像がカラー画像かモノクロ画像かを決定することを特徴とする請求項1に記載の画像処理装置。
  3. 前記入力手段が入力した画像データを複数のブロックに分割し、前記ブロックごとに有彩色のブロックか無彩色のブロックかを判定する判定手段をさらに有し、
    前記判定手段は、前記画像データの前記推定手段が有彩色の画素と判定した画素の数に基づいてカラーのブロックかモノクロのブロックかを判定し、
    前記決定手段は、前記画像データの前記判定手段がカラーのブロックと判定したブロックの数に基づいて前記入力手段が入力した画像データが示す画像がカラー画像かモノクロ画像かを決定することを特徴とする請求項2に記載の画像処理装置。
  4. 前記判定手段は前記画像データの所定の領域を判定しないことを特徴とする請求項3に記載の画像処理装置。
  5. 前記所定の領域は、原稿の副走査方向の先端領域と後端領域であることを特徴とする請求項4に記載の画像処理装置。
  6. 前記正解データは、前記入力手段が入力した前記色ずれが発生している画像を示す画像データを修正した画像データであるとこを特徴とする請求項1乃至5の何れか1項に記載の画像処理装置。
  7. 前記正解データは前記入力手段が入力した前記色ずれが発生している画像を示す画像データにおける画素の有彩色もしくは無彩色を示す情報を修正したデータであることを特徴とする請求項6に記載の画像処理装置。
  8. 前記入力手段が入力した画像データを平滑化する平滑化手段をさらに有することを特徴とする請求項1乃至7の何れか1項に記載の画像処理装置。
  9. 前記学習済みモデルはニューラルネットワークであることを特徴とする請求項1乃至8の何れか1項に記載の画像処理装置。
  10. 前記正解データは2値画像データであることを特徴とする請求項1乃至9の何れか1項に記載の画像処理装置。
  11. 前記入力手段は原稿の画像をスキャンし、画像データを入力するスキャナであることを特徴とする請求項1乃至10の何れか1項に記載の画像処理装置。
  12. 画像データを入力する入力工程と、
    前記入力工程で入力した画像データが示す画像がカラー画像かモノクロ画像かを決定する決定工程と、
    前記決定工程は、色ずれが発生している画像と正解データに基づいて生成された学習済みモデルを用いて前記入力工程で入力した画像データが示す画像がカラー画像かモノクロ画像かを決定することを特徴とする画像処理方法。
  13. 請求項12に記載の画像処理方法をコンピュータに実行させるためのプログラム。
JP2019217571A 2019-11-29 2019-11-29 画像処理装置および画像処理方法、プログラム Active JP7358218B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019217571A JP7358218B2 (ja) 2019-11-29 2019-11-29 画像処理装置および画像処理方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019217571A JP7358218B2 (ja) 2019-11-29 2019-11-29 画像処理装置および画像処理方法、プログラム

Publications (2)

Publication Number Publication Date
JP2021087202A JP2021087202A (ja) 2021-06-03
JP7358218B2 true JP7358218B2 (ja) 2023-10-10

Family

ID=76085906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019217571A Active JP7358218B2 (ja) 2019-11-29 2019-11-29 画像処理装置および画像処理方法、プログラム

Country Status (1)

Country Link
JP (1) JP7358218B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010041349A (ja) 2008-08-05 2010-02-18 Kyocera Mita Corp 画像処理装置及び当該画像処理装置を備えた画像形成装置
JP2019017099A (ja) 2018-09-27 2019-01-31 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2019155656A (ja) 2018-03-09 2019-09-19 コニカミノルタ株式会社 画像形成装置、画像検査装置およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2575215B2 (ja) * 1989-10-30 1997-01-22 富士写真フイルム株式会社 カラー画像形成装置
JPH0622125A (ja) * 1992-07-01 1994-01-28 Canon Inc 画像処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010041349A (ja) 2008-08-05 2010-02-18 Kyocera Mita Corp 画像処理装置及び当該画像処理装置を備えた画像形成装置
JP2019155656A (ja) 2018-03-09 2019-09-19 コニカミノルタ株式会社 画像形成装置、画像検査装置およびプログラム
JP2019017099A (ja) 2018-09-27 2019-01-31 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2021087202A (ja) 2021-06-03

Similar Documents

Publication Publication Date Title
JP4912270B2 (ja) 画像処理装置及びその制御方法
JP5217426B2 (ja) 画像処理装置、画像形成装置、画像処理プログラム、およびそのプログラムを記録した記録媒体
JP2007006392A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2002354259A (ja) 画像処理装置、画像処理方法およびプログラム
JP4079046B2 (ja) 画像処理装置及び画像処理方法
US9646367B2 (en) Image processing apparatus and image processing method each with a function of applying edge enhancement to input image data
JP3736535B2 (ja) 原稿種類判別装置
US11172096B2 (en) Image processing performing edge enhancement based on pixel isolation
JP4485430B2 (ja) 画像処理装置、画像処理方法、およびその方法をコンピュータに実行させるプログラム
JP7358218B2 (ja) 画像処理装置および画像処理方法、プログラム
JP4158345B2 (ja) 画像処理装置、画像形成装置及び画像処理方法
US8368952B2 (en) Image processing apparatus and control method the same
JP6391348B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2003189103A (ja) 画像形成装置
US6999632B2 (en) Image processing apparatus, image forming apparatus and image processing method
JP6306956B2 (ja) 画像処理装置及び画像形成装置
JPH1028225A (ja) Mtf補正装置
US20100158552A1 (en) Image forming apparatus and method of controlling same
JP4086045B2 (ja) 画像形成装置
JPH11317877A (ja) 画像処理方法
JP2011107546A (ja) 画像形成装置、画像形成方法及びプログラム
JP2007124503A (ja) 画像形成装置
JPH09214748A (ja) 画像処理装置及びその方法
JP2010161755A (ja) 画像処理装置及びその方法、並びに、コンピュータプログラムおよび記憶媒体
JP2001309156A (ja) 画像処理装置およびその方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230927

R151 Written notification of patent or utility model registration

Ref document number: 7358218

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151