JP2021125768A

JP2021125768A - 画像処理装置、その制御方法、及びプログラム

Info

Publication number: JP2021125768A
Application number: JP2020017233A
Authority: JP
Inventors: 智志池田; Satoshi Ikeda
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2020-02-04
Filing date: 2020-02-04
Publication date: 2021-08-30

Abstract

【課題】本発明は、機械学習を用いて正常印刷物の読取画像を生成して基準画像を自動で設定する仕組みを提供する。【解決手段】本実画像処理装置は、印刷物に印刷された画像を読み取り、読み取られた読取画像の画像データと、印刷物の印刷に利用された画像データとを用いて、印刷物の検査を行うための基準画像を推定するモデルを学習する。また、本画像処理装置は、学習済みのモデルを用いて、印刷対象の画像データを入力として印刷物の検査を行うための基準画像を推定する。さらに、本画像処理装置は、推定された基準画像と、対応する印刷物から読み取った被検査画像とを比較して、当該印刷物の異常を検査する。【選択図】図４

Description

本発明は、画像処理装置、その制御方法、及びプログラムに関する。

近年、デジタル印刷技術の性能向上に伴い、従来の有版式アナログ印刷機に迫る画質を実現した電子写真方式やインクジェット方式のデジタル印刷機が登場している。デジタル印刷では、従来の有版式アナログ印刷より低コストで印刷成果物を提供可能であるため、デジタルプロダクションの印刷物が一般化してきている。

しかし、電子写真方式やインクジェット方式のデジタル印刷機では、転写不良やノズル不良に起因して、白抜けやスジなどの異常画像を出力する場合がある。大量の枚数を連続で印刷するデジタルプロダクションプリンティングの分野では、排紙された印刷成果物に異常がないか一枚一枚人目でチェックしなければならず、多大な検査工数が掛かっていた。

このため、印刷物に異常がないかを自動で検知し除外する、画像処理装置が求められている。特許文献１には、印刷成果物の撮影画像と、予め登録した正常印刷物の撮影画像（基準画像）とを比較することで、自動で印刷異常を検知する技術が提案されている。

特開２０１０−６６５１６号公報

しかしながら、上記従来技術には以下に記載する少なくとも２つの課題がある。１つ目は、正常画像を検査装置に登録する作業のユーザ負荷が大きいという点である。上記従来技術では、まず印刷異常がない印刷物をユーザが選定し、基準画像として登録する作業が必要であった。正常印刷物の選定は人目で行わなければならず、上述したように多大な作業工数を要するものである。

２つ目は、ユーザによって基準画像の選定基準が異なるため、検査精度にばらつきが生じるという点である。上記従来技術は、基準画像と対象印刷物の読取画像の比較により異常を検知するため、基準画像の品質が検品精度に大きく影響する。しかし、基準画像は人目で選定されるため、ユーザが適切な画像を選定できるか否かによって、検品精度にばらつきが生じていた。

本発明は、上述の問題の少なくとも一つに鑑みて成されたものであり、機械学習を用いて正常印刷物の読取画像を生成して基準画像を自動で設定する仕組みを提供する。

本発明は、例えば、画像処理装置であって、印刷物に印刷された画像を読み取る読取手段と、前記読取手段によって読み取られた読取画像の画像データと、前記印刷物の印刷に利用された画像データとを用いて、印刷物の検査を行うための基準画像を推定するモデルを学習する学習手段と、前記学習手段による学習済みのモデルを用いて、印刷対象の画像データを入力として印刷物の検査を行うための基準画像を推定する推定手段とを備えることを特徴とする。

本発明によれば、機械学習を用いて正常印刷物の読取画像を生成して基準画像を自動で設定することができる。

一実施形態に係る画像処理装置の構成例を示す図。一実施形態に係る印刷品質の検査を行う検査装置の構成を示す模式図。一実施形態に係る検査装置に基準画像を設定する基準画像設定部の構成を示す模式図。一実施形態に係る画像推定部の動作を示す模式図。一実施形態に係るラスタデータ、スキャンデータ及び中間データを表す模式図。一実施形態に係る第１の推定部の構成を表す模式図。一実施形態に係る第１の学習部の動作を表す模式図。一実施形態に係る第１の判別部を表す模式図。一実施形態に係る第１の学習部による学習処理の動作を表すフローチャート。一実施形態に係る第２の学習部の動作を表す模式図。一実施形態に係る基準画像設定部の構成を表す模式図。一実施形態に係る基準画像選定部の動作を表すフローチャート。一実施形態に係る基準画像選定部の動作を表すフローチャート。

以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。

なお、実施形態に係る画像処理装置として複合機（デジタル複合機／ＭＦＰ／ＭｕｌｔｉＦｕｎｃｔｉｏｎＰｅｒｉｐｈｅｒａｌ）を例に説明する。しかしながら適用範囲は複合機に限定はせず、画像処理装置であればよい。

＜第１の実施形態＞
以下では、本発明の第１の実施形態について説明する。本実施形態では、機械学習を用いた画像推定部により生成した画像を基準画像に用いる検品装置について説明する。当該画像推定部は、ラスタ画像を入力とし、当該画像を印刷した印刷物の読取画像をシミュレーションした画像データを出力とする。なお、本開示においてラスタ画像とは、ＣＭＹＫ４プレーンの画像データであり、ユーザによって印刷指示された入力データに対してＲＩＰ処理及び中間処理等の画像処理を適用することで取得される。また、印刷物とは、ラスタ画像を記録媒体上に印刷した画像のことである。また、検品装置とは、被検査印刷物の撮影画像と基準画像を比較することで、印刷物の異常を検知する装置である。本実施形態によれば、機械学習により生成された画像を基準として用いるため、人目で正常印刷物を選定することなく、印刷物の検品が可能となる。

以下の実施形態では画像データが保持する各色空間に対応した色をＲ（レッド）、Ｇ（グリーン）、Ｂ（ブルー）又はＣ（シアン）、Ｍ（マゼンタ）、Ｙ（イエロー）、Ｋ（ブラック）などの英字で表すものとする。すなわち、ＲとはＲＧＢ色空間における赤色成分を示し、ＣとはＣＭＹＫ色空間におけるシアン成分を示す。画像データとは、色毎のプレーンを持つ、複数プレーンの二次元データである。例えばＲＧＢ色空間の画像データとはＲ、Ｇ、Ｂ毎の３つの二次元平面の層構造データを示す。

＜画像処理装置の構成＞
図１を参照して、本実施形態に係る画像処理装置１００のハードウェア構成を説明する。画像処理装置１００は、ＣＰＵ１０１、ＲＯＭ１０２、ＲＡＭ１０３、大容量記憶装置１０４、表示部１０５、操作部１０６、エンジンＩ／Ｆ１０７、ネットワークインタフェース（Ｉ／Ｆ）１０８、スキャナＩ／Ｆ１０９及び検査装置１１４を備える。これら各部はシステムバス１１０を介して相互に接続される。また、画像処理装置１００は、プリンタエンジン１１１及びスキャナユニット１１２を更に備える。プリンタエンジン１１１及びスキャナユニット１１２は、それぞれエンジンＩ／Ｆ１０７及びスキャナＩ／Ｆ１０９を介してシステムバス１１０に接続される。なお、スキャナＩ／Ｆ１０９、スキャナユニット１１２及び検査装置１１４は、画像処理装置１００とは独立した装置として構成されてもよい。

ＣＰＵ１０１は、画像処理装置１００全体の動作を制御する。ＣＰＵ１０１は、ＲＯＭ１０２に格納されたプログラムをＲＡＭ１０３に読み出して実行することによって、後述する各種の処理を実現する。ＲＯＭ１０２は、読み出し専用メモリであり、システム起動プログラムやプリンタエンジンの制御を行うためのプログラム、及び文字データや文字コード情報等が格納されている。ＲＡＭ１０３は、揮発性のランダムアクセスメモリであり、ＣＰＵ１０１のワークエリア、及び各種のデータの一時的な記憶領域として使用される。例えば、ＲＡＭ１０３には、ダウンロードによって追加的に登録されたフォントデータ、外部装置から受信した画像ファイル等を格納するための記憶領域として使用される。大容量記憶装置１０４は、例えばＨＤＤやＳＳＤであり、各種のデータがスプールされ、プログラム、情報ファイル及び画像データ等の格納、又は作業領域として使用される。

表示部１０５は、例えば液晶ディスプレイ（ＬＣＤ）で構成され、画像処理装置１００の設定状態、実行中の処理の状況、エラー状態等の表示を行う。操作部１０６は、ハードキー及び表示部１０５上に設けられたタッチパネル等の入力デバイスで構成され、ユーザの操作によって入力（指示）を受け付ける。操作部１０６は、画像処理装置１００の設定の変更、設定のリセット等を行うために使用され、また、色調整処理を実行する際の画像処理装置１００の色調整処理モードを実行するために使用される。

エンジンＩ／Ｆ１０７は、印刷を実行する際に、ＣＰＵ１０１からの指示に応じてプリンタエンジン１１１を制御するためのインタフェースとして機能する。エンジンＩ／Ｆ１０７を介して、ＣＰＵ１０１とプリンタエンジン１１１との間でエンジン制御コマンド等が送受信される。ネットワークＩ／Ｆ１０８は、画像処理装置１００を外部ネットワークに接続するためのインタフェースとして機能する。なお、外部ネットワークは、例えば、ＬＡＮであってもよいし、電話回線網（ＰＳＴＮ）であってもよいし、有線接続及び無線接続の何れであってもよい。プリンタエンジン１１１は、システムバス１１０側から受信した印刷画像データに基づいて、複数色（ここではＣＭＹＫの４色）の現像剤（トナー）を用いてマルチカラー画像を、紙等の記録媒体上に形成する。スキャナＩ／Ｆ１０９は、スキャナユニット１１２による原稿の読み取りを行う際に、ＣＰＵ１０１からの指示に応じてスキャナユニット１１２を制御するためのインタフェースとして機能する。スキャナＩ／Ｆ１０９を介して、ＣＰＵ１０１とスキャナユニット１１２との間でスキャナユニット制御コマンド等が送受信される。スキャナユニット１１２は、ＣＰＵ１０１による制御によって、原稿の画像を読み取って読取画像データを生成し、スキャナＩ／Ｆ１０９を介してＲＡＭ１０３又は大容量記憶装置１０４に画像データを送信する。検査装置１１４は、スキャナＩ／Ｆ１０９及びスキャナユニット１１２を介して、プリンタエンジン１１１にて形成された記録媒体の読取画像を取得し、当該記録媒体における異常画像の有無を検知する。

＜検査装置１１４の構成＞
次に、図２を参照して、本実施形態に係る検査装置１１４の機能構成について説明する。検査装置１１４は、機能構成として、基準画像設定部２０１、被検査画像取得部２０２、及び画像検査部２０３を備える。

基準画像設定部２０１は、画像検査部２０３で用いる被検査画像の検査を行うための基準画像の設定を行う。基準画像設定部２０１の処理の詳細については後述する。被検査画像取得部２０２は、スキャナユニット１１２及びスキャナＩ／Ｆ１０９を介して、被検査対象の印刷物の読取画像（被検査画像）を取得する。被検査画像は、例えばＲＧＢ３プレーンからなる画像データである。画像検査部２０３では、設定された基準画像及び被検査画像を比較して、当該印刷物に異常がないかを検知する。

＜基準画像設定部２０１の構成＞
次に、図３を参照して、本実施形態に係る基準画像設定部２０１の構成例を説明する。基準画像設定部２０１は、ラスタ画像取得部３０１と、画像推定部３０２とを備える。

ラスタ画像取得部３０１は、ＣＰＵ１０１を介して、印刷物のラスタ画像をＲＡＭ１０３から取得する。ラスタ画像は、前述のとおり、ＣＭＹＫ４プレーンの画像データである。画像推定部３０２は、ラスタ画像を入力とし、当該データを用いて画像処理装置１００で印刷した印刷物の読取画像をシミュレーションした（推定した）画像データを、検査装置１１４の基準画像データとして出力する。なお、画像推定部３０２は、画像処理装置１００そのもの、又は同機種の印刷物の読取画像を学習データとして使用することが望ましい。また、当該基準画像データはＲＧＢ３プレーンの画像データであり、画像検査部２０３の基準画像として設定される。当該画像推定部３０２の詳細な動作については図４を用いて後述する。

＜画像推定部３０２の動作＞
次に、図４を参照して、本実施形態における画像推定部３０２の動作を説明する。まず、画像入力部４０１にて、ラスタ画像取得部３０１からラスタ画像を取得する。続いて、画像推定処理部４０２において、画像入力部４０１によって入力されたラスタ画像データから、モデル化する特定のプリンタ及び記録媒体で印刷した印刷結果の読取画像を推定する。本実施形態では、ラスタ画像データは、ＣＭＹＫ１ビットの画像データである。また、画像推定処理部４０２から出力される推定結果としての推定画像データは、プリンタで印刷された印刷結果をスキャナで読み取って生成される読取画像データに相当する、８ビットのＲＧＢ画像データである。

画像推定処理部４０２は、内部に第１の推定部４０３及び第２の推定部４０４を有する。第１の推定部４０３は、１画素１ビットのラスタ画像データから１画素１ビットの中間データを出力する。ここで、第１の推定部４０３から出力される中間データは、ラスタ画像データと同じ１画素ＣＭＹＫ１ビットの画像データであり、プリンタで印刷した際の色材の飛び散り又は滲みの具合が再現された２値画像データである。中間データの詳細については後述する。また、第２の推定部４０４は、１画素１ビットの中間データから、１画素８ビットの推定画像データを出力する。これら第１の推定部４０３及び第２の推定部４０４の内部パラメータは、学習部４０５にて学習される。このように、本実施形態によれば、第１の推定部４０３と第２の推定部４０４とが直列に接続され、第１の推定部４０３おいて印刷した際の色材の飛び散りや滲みの具合が推定され、第２の推定部４０４においてボケが推定される。

なお、本実施形態では、ラスタ画像データの階調を１ビット、中間データの階調を１ビット、推定画像データの階調を８ビットとしたが、本発明を限定する意図はない。例えば、ラスタ画像データを２ビット、中間データの階調を２ビット、推定画像データの階調を１６ビットとしてもよい。

学習部４０５は、第１の学習部４０６、第２の学習部４０７、及び学習用中間データ取得部４０８を有する。第１の学習部４０６は、第１の推定部４０３に対して、その内部パラメータであるニューラルネットワークの各層の重みを学習させる。同様に第２の学習部４０７は、第２の推定部４０４に対して、その内部パラメータであるニューラルネットワークの各層の重みを学習させる。

学習用入力データ取得部４０９は、学習用ラスタ画像データ群をデータベース４１１から取得する。データベース４１１は、大容量記憶装置１０４に設けられてもよいし、外部記憶装置に設けられてもよい。正解データ取得部４１０は、学習用ラスタ画像データ群をモデル化するプリンタで印刷し、印刷結果をスキャナで読み取った読取画像データ群をデータベース４１１から取得する。なお、学習部４０５で用いる学習用ラスタ画像データ群及び読取画像データ群は、学習用ラスタ画像データと、それを用いて生成された読取画像データとを対応付けてデータベース４１１に予め格納されている。学習用ラスタ画像データとそれに対応する読取画像データとの対応付けは、例えば、それらのメタデータに共通の識別情報を書き込んでおき、その識別情報に基づいて行われる。なお、学習用ラスタ画像データ群は、複数の任意の多階調画像データをそれぞれハーフトーン処理した複数の２値画像データであり、複数の任意の画像データには、階調数の異なる画像データが含まれていることが望ましい。学習用ラスタ画像データとして、例えば自然画像データをハーフトーン処理したものを用いてもよい。

学習用中間データ取得部４０８は、正解データ取得部４１０で取得した読取画像データ群から、学習用中間データ群を生成する。第１の学習部４０６は、学習用入力データ取得部４０９で得られた学習用ラスタ画像データ群と、学習用中間データ取得部４０８で得られた学習用中間データ群とを用いてパラメータの学習を行う。第２の学習部４０７は、学習用中間データ取得部４０８で得られた学習用中間データ群と、正解データ取得部４１０で得られた読取画像データ群とを用いてパラメータの学習を行う。

なお、画像推定処理部４０２と学習部４０５とは、一体の装置として動作してもよいし、別々の装置として動作してもよい。例えば、学習部４０５で予め画像推定処理部４０２の内部パラメータを学習しておき、画像推定時には学習部４０５から内部パラメータを読み出して画像推定処理部４０２のみを動作させるというように、別々の装置とし構成してもよい。また、学習用入力データ取得部４０９の出力は、学習部４０５を通って第１の推定部４０３に入力されているが、学習部４０５を介さずに第１の推定部４０３に直接入力する構成としてもよい。

＜画像データ＞
図５を参照して、ラスタ画像データ、中間データ、及び読取画像データの関係について説明する。画像データ５０１は白及び黒のみから構成された２値画像データであるラスタ画像データを示す。画像データ５０２は画像データ５０１に示すラスタ画像データを印刷し、スキャナで読み取った読取画像データを示す。画像データ５０２では、プリンタの印刷プロセスにより色材が飛び散ったり滲んだりして、線のエッジががたついている様子が分かる。また、画像データ５０１のラスタ画像データは２値画像であるため白及び黒の画素のみから構成されているが、画像データ５０２の読取画像データは２５６階調の画像データであるためグレーの画素が存在し、線のエッジ周辺にボケが発生している。画像データ５０３は、画像データ５０２の読取画像データを２値化して作成した中間データである。画像データ５０２と画像データ５０３とでは、黒の画素領域の輪郭の形状は一致しており、画像データ５０３は、画像データ５０２の読取画像データから所定値以上の画素値を有する画素の位置情報のみを抽出し、色材の濃淡情報を省いたデータとなっている。

画像データ５０１のラスタ画像データから画像データ５０２の読取画像データを直接推定するモデルを構築すると、出力される推定画像データは実物の読取画像データよりもボケた画像データとなってしまう。これは、画像データ５０２のエッジのがたつきが、色材の飛び散りや滲みに起因し、ランダムに発生するからである。このようなランダムなエッジのがたつきの推定結果を多階調画像データとして出力するように学習させると、エッジのがたつきのランダム成分が平均化された値は、グレー値として画像データに書き出されることになる。そのため、エッジのがたつきの推定とボケの推定とを１つの推定部に学習させると、エッジのがたつきに由来するボケを含んだ、読取画像データよりもボケた画像データを出力するモデルが学習される。エッジのがたつきの推定とエッジのボケの推定とを２つの別々の推定部を直列に接続して読取画像データの推定を行うことで、高精度な基準画像を生成できる。

第１の推定部４０３は、画像データ５０１に示すようなラスタ画像データを入力とし、画像データ５０３に示すような中間データを出力とする第１モデルを学習している。画像データ５０１に示す１画素１ビットのラスタ画像データから画像データ５０３の１ビットの中間データには、色材の飛び散りや滲みに起因するエッジのランダムな変化が含まれている。一方、第１の推定部４０３の推定には、出力される中間データが２値画像データであり、色材の濃淡を表現する階調を有さないため、色材の濃淡に起因する画像のボケ推定は含まない。

第２の推定部４０４は、画像データ５０３に示すような中間データを入力とし、画像データ５０２に示すような１画素ＣＭＹＫ８ビットの階調を有する印刷結果の読取画像データを推定する第２モデルを学習している。画像データ５０２と画像データ５０３とでは、画素値が最小（黒）の画素群の輪郭は一致しており、エッジは変化していない。すなわち、第２の推定部４０４の推定には、色材の飛び散りや滲みに起因するエッジのランダムな変化の推定は含まない。これにより、実物と同等のボケを再現する、２値中間データから多値読取画像への画像変換が実現できる。

＜第１の推定部４０３の構成＞
以下では、第１の推定部４０３の構成について説明する。図６は、第１の推定部４０３におけるニューラルネットワークの構成例を示す。以下では、本実施形態の動作を図６に示すニューラルネットワークに基づき説明するが、本発明を限定する意図はない。例えば、より層の深いニューラルネットワークであってもよいし、Ｕ−ｎｅｔの形式であってもよい。また、本実施形態では、７０１６×４９６０×４（６００ｄｐｉ、Ａ４サイズ画像）のＣＭＹＫ画像データを入力とした場合の動作について説明するが、本発明を限定する意図はない。モノクロ複写機を想定し、Ｋ画像データを入力としてもよいし、異なるサイズの画像を用いてもよい。

まず、第１の推定部４０３に入力されたラスタ画像データは、Ｃｏｎｖｏｌｕｔｉｏｎ（畳み込み）レイヤ６０１において畳み込み演算が行われる。ラスタ画像データの（ｘ，ｙ）位置の画素値をＩ（ｘ，ｙ，ｐ１）とすると、Ｃｏｎｖｏｌｕｔｉｏｎレイヤ６０１の出力画像データＩＧ１（ｘ，ｙ，ｐ２）は、以下の式で計算できる。

ここで、ｐ１はラスタ画像のプレーン番号を表し、１≦ｐ１≦４である。また、ｐ２はＩＧ１のプレーン番号であり、本実施形態では１≦ｐ２≦８とした。また、

はニューラルネットワークが保持しているＣｏｎｖｏｌｕｔｉｏｎレイヤ６０１における重みであり、ｓ、ｔ、ｐ１、ｐ２の組み合わせごとに異なる値を有している。なお、上記式（数１）中のＩ（ｘ＋ｓ，ｘ＋ｔ）であるが、参照位置がラスタ画像データの有する画素位置外（例えば、Ｉ（−１，−１）など）の場合は、画素値を０として演算が行われる。以上の演算により、Ｃｏｎｖｏｌｕｔｉｏｎレイヤ６０１の出力は、７０１６×４９６０×８の画像データとなる。すなわち７０１６×４９６０の画像が８プレーン存在する画像データとなる。

次に、Ａｃｔｉｖａｔｉｏｎレイヤ６０２では、Ｃｏｎｖｏｌｕｔｉｏｎレイヤ６０１の出力画像データＩＧ１（ｘ，ｙ，ｐ）に対して、非線形関数を適用する。具体的には、Ａｃｔｉｖａｔｉｏｎレイヤ６０２の出力画像データＩＧ２（ｘ，ｙ，ｐ２）は、ランプ関数を用いて以下の数式３で計算される。
ＩＧ２（ｘ，y，ｐ２）＝ｍａｘ（０，ＩＧ１（ｘ，ｙ，ｐ２））・・・数式３
なお、当該処理で適用される非線形関数は、これに限定されない。例えば、双曲線正接関数（ｈｙｐｅｒｂｏｌｉｃｔａｎｇｅｎｔ）などを用いてもよい。以上の演算により、Ａｃｔｉｖａｔｉｏｎレイヤ６０２の出力画像データＩＧ２（ｘ，ｙ，ｐ２）は、３５０８×２４８０×８の画像データ、すなわち３５０８×２４８０の画像が８プレーン存在する画像データとなる。

次に、Ｐｏｏｌｉｎｇレイヤ６０３にて、情報の圧縮が行われる。ここでは、２×２のｍａｘｐｏｏｌｉｎｇを行うことで、出力画像データＩＧ２（ｘ，ｙ，ｐ）の縮小を行う。具体的には、Ｐｏｏｌｉｎｇレイヤ６０３の出力画像データＩＧ３（ｕ，ｖ，ｐ）は、以下の数式４で計算される。
ＩＧ３（ｕ，ｖ，ｐ）＝ｍａｘ（ＩＧ２（２ｕ，２ｖ，ｐ)，ＩＧ２（２ｕ，２ｖ＋１，ｐ），ＩＧ２（２ｕ＋１，２ｖ，ｐ），ＩＧ２（２ｕ＋１，２ｖ＋１，ｐ））・・・数式４
なお、ｕ及びｖの範囲は、０≦ｕ≦３５０７、０≦ｖ≦２４７９である。以上の演算により、Ｐｏｏｌｉｎｇレイヤ６０３の出力画像データＩＧ３（ｕ，ｖ，ｐ）は、３５０８×２４８０×８の画像データとなる。

次に、Ｄｅｃｏｎｖｏｌｕｔｉｏｎ（デコンボリューション）レイヤ６０４にて、出力画像データＩＧ３（ｕ，ｖ，ｐ）の拡大が行われる。当該処理では、Ｐｏｏｌｉｎｇレイヤ６０３の出力画像データＩＧ３（ｕ，ｖ，ｐ）を一度拡大したのち、プレーンを跨いだ畳み込み演算を実施する。まず、Ｐｏｏｌｉｎｇレイヤ６０３の出力画像データＩＧ３（ｕ，ｖ，ｐ）の拡大は、下記数式５の手順によって行われる。
ＩＴ（２ｕ，２ｖ，ｐ）＝ＩＧ３（ｕ，ｖ，ｐ）
ＩＴ（２ｕ，２ｖ＋１，ｐ）＝０
ＩＴ（２ｕ＋１，２ｖ，ｐ）＝０
ＩＴ（２ｕ＋１，２ｖ＋１，ｐ）＝０・・・数式５
次に、Ｄｅｃｏｎｖｏｌｕｔｉｏｎレイヤ６０４にて、当該拡大処理により得られたＩＴ（ｘ，ｙ，ｐ）を入力として、畳み込み演算を以下の式で実施する。

ここで、

は当該ニューラルネットワークが保持しているＤｅｃｏｎｖｏｌｕｔｉｏｎレイヤ６０４における重みであり、Ｃｏｎｖｏｌｕｔｉｏｎレイヤ６０１で用いた重みとは異なる。なお、上記式中のＩＴ（ｘ＋ｓ，ｙ＋ｔ，ｐ）であるが、参照位置が画像外（例えば、ＩＴ（−１，−１，１）など）の場合は、画素値を０として演算を行う。以上の演算により、Ｄｅｃｏｎｖｏｌｕｔｉｏｎレイヤ６０４の出力画像データＩＧ４（ｘ，ｙ）は、７０１６×４９６０×３の画像データとなる。すなわち７０１６×４９６０の画像が３プレーン存在する画像データとなる。

Ａｃｔｉｖａｔｉｏｎ（活性化）レイヤ６０５では、Ｄｅｃｏｎｖｏｌｕｔｉｏｎレイヤ６０４の出力に対して、非線形関数を適用する。当該処理における動作はＡｃｔｉｖａｔｉｏｎレイヤ６０２と同様であるが、非線形関数はＡｃｔｉｖａｔｉｏｎレイヤ６０２と同じでなくてもよい。

＜第２の推定部４０４の動作＞
以下では、第２の推定部４０４の動作について説明する。第２の推定部４０４は、ニューラルネットワークにて構成されており、その動作は第１の推定部４０３と同様である。ただし、そのニューラルネットワークのネットワーク構成や重みは第１の推定部４０３と必ずしも同じである必要はない。また、本実施形態では、計算量及びメモリ削減のため、学習データ及び正解データは、２５６×２５６サイズに切り出した画像を用いるが、本発明はこれに限定されない。１２８×１２８等のより小さい画像サイズを用いてもよいし、画像を切り出さずそのまま用いてもよい。

＜第１の学習部４０６の構成及び動作＞
本実施形態では、第１の学習部４０６は、第１の推定部４０３にＧＡＮ（ＧｅｎｅｒａｔｉｖｅＡｄｖｅｒｓａｒｉａｌＮｅｔｗｏｒｋ）のフレームワークを用いて学習させる。本実施形態では、学習用入力データ及び正解データの組を入力とし、第１の推定部４０３の出力画像誤差、すなわち学習用ラスタ画像データと正解データとの差が最小となるように、モデル（第１モデル）を学習する。ここで、学習用入力データとは、学習用に予めデータベース化しておいた、多階調画像データをハーフトーン処理して２値画像データに変換し、２５６×２５６サイズに切り出したデータ群である。また、正解データは、学習用ラスタ画像データ群をプリンタによって記録媒体へ印刷し、その印刷結果の読取画像を２５６ｘ２５６サイズに切り出したデータ群から作成した学習用中間データを用いる。学習用中間データは、読取画像データを２値化したものであり、色材の飛び散り又は滲みの具合に関する情報を含むボケの無い画像データである。学習用中間データの具体的な算出方法については後述する。

図７を参照して、本実施形態における第１の学習部４０６の構成例を説明する。学習対象である第１の推定部４０３は、ラスタ画像データを入力として中間データを取得する。

第１の判定部７０１は、第１の学習部４０６に入力された画像データが正解データであるか、第１の推定部４０３が出力した中間データであるかを判定する。第１の判定部７０１は、第１の推定部４０３のパラメータを学習するための判定器であり、ニューラルネットワークにて構成されている。第１の判定部７０１は、入力された画像データを正解データと判定した場合は１を、第１の推定部４０３が出力した中間データと判定した場合は０を返す。第１の判定部７０１の構成は後述する。

誤差算出部７０２は、第１の学習部４０６に入力された画像データに対する第１の判定部７０１の判定結果に基づき、第１の推定部４０３が出力した中間データと正解データとの誤差を算出する。

パラメータ更新部７０３は、誤差算出部７０２が算出した誤差に基づき、第１の推定部４０３及び第１の判定部７０１のパラメータを更新する。

＜第１の判定部７０１の構成＞
以下では、第１の判定部７０１の構成について説明する。図８に、第１の判定部７０１におけるニューラルネットワークの構成例を示す。以下では、本実施形態の動作を図８に示すニューラルネットワークに基づき説明するが、本開示の技術はこれに限定されない。例えば、より層の深いニューラルネットワークであってもよいし、Ｕ−ｎｅｔの形式をとっていてもよい。また、本実施形態では、２５６×２５６×３のＲＧＢ画像データを入力とするが、本開示の技術はこれに限定されない。

まず、入力された画像データに対して、Ｃｏｎｖｏｌｕｔｉｏｎレイヤ８０１で畳み込み演算が行われる。当該処理の動作はＣｏｎｖｏｌｕｔｉｏｎレイヤ６０１と同様であり、Ｃｏｎｖｏｌｕｔｉｏｎ（畳み込み）レイヤ８０１が出力する出力画像データＩＤ１（ｘ，ｙ，ｐ１）は、以下の式で算出される。

ここでｐ１はＩＤ１のプレーン番号であり、１≦ｐ１≦６である。同様に、ｐは画像Ｉのプレーン番号であり、１≦ｐ≦３である。

次に、Ａｃｔｉｖａｔｉｏｎ（活性化）レイヤ８０２が、Ｃｏｎｖｏｌｕｔｉｏｎレイヤ８０１の出力画像データＩＤ１（ｘ，ｙ，ｐ）に対して非線形関数を適用することで出力画像データＩＤ２（ｘ，ｙ，ｐ）を出力する。当該処理の動作は、Ａｃｔｉｖａｔｉｏｎ（活性化）レイヤ６０２と同様である。

次に、Ｐｏｏｌｉｎｇ（プーリング）レイヤ８０３が、情報の圧縮を行い、出力画像データＩＤ３（ｘ，ｙ，ｐ）を出力する。当該処理の動作はＰｏｏｌｉｎｇ（プーリング）レイヤ６０３と同様である。

次に、ＦｕｌｌＣｏｎｎｅｃｔｅｄ（全結合）レイヤ８０４が、Ｐｏｏｌｉｎｇレイヤ８０３の出力画像データＩＤ３（ｘ，ｙ，ｐ）から１つの数値であるｖ値を算出する。ＦｕｌｌＣｏｎｎｅｃｔｅｄレイヤ８０４が出力するｖ値は、以下の式で計算される。

ここで、

は当該ニューラルネットワークが保持している重みである。

最後に、Ａｃｔｉｖａｔｉｏｎ（活性化）レイヤ８０５が、ｖ値に非線形処理を施して判定結果として０値を出力する。ここでは、シグモイド関数を適用することで、ｖ値を値域［０，１］の０値に変換する。

＜第１の学習部４０６の動作＞
次に、図９を参照して、第１の学習部４０６の具体的な動作を説明する。なお、図９のフローチャートで示す処理は、ＣＰＵ１０１が、ＲＯＭ１０２に格納されているプログラムをＲＡＭ１０３に展開し、その展開プログラムを実行することにより実現される。

Ｓ９０１で、第１の判定部７０１は、当該第１の判定部７０１における処理で使用するパラメータを初期化する。本実施形態では、正規分布に従う乱数でパラメータの初期値を決定する。続いて、Ｓ９０２で、第１の推定部４０３は、当該第１の推定部４０３における処理で使用するパラメータを初期化する。本実施形態では、正規分布に従う乱数でパラメータの初期値を決定する。

Ｓ９０３で、学習用中間データ取得部４０８は、学習用ラスタ画像データ全てに対して、第１の推定部４０３で推定された中間データを取得する。ここで得られる中間データをＥｓｔm（１≦ｍ≦Ｍ）とする。ここで、Ｍは入力データの数を示す。続いて、Ｓ９０４で、第１の判定部７０１は、中間データＥｓｔm及び正解データＲｅｆm（１≦ｍ≦Ｍ）に対する判定を行う。中間データＥｓｔmに対する判定結果を

とし、正解データＲｅｆmに対する判定結果を

とする。

次に、Ｓ９０５で、誤差算出部７０２は、Ｓ９０４での判定結果と中間データ及び正解データとに基づき、誤差ｅを取得する。本実施形態では、誤差ｅを以下の式で定義する。

ここで、||Ｒｅｆm−Ｅｓｔm1||１は中間データと正解データとのＬ１ノルムを示す。また、λは正規化項の係数であり、本実施形態ではλ＝０．１としているが本発明を限定する意図はない。

Ｓ９０６で、パラメータ更新部７０３は、誤差が閾値以内であるかを判定する。閾値以内でなければＳ９０７に進み、閾値以内であれば本処理を終了する。Ｓ９０７で、パラメータ更新部７０３は、Ｓ９０５で取得した誤差に基づいて第１の判定部７０１のパラメータを更新する。更新は勾配法により行われる。第１の判定部７０１のパラメータ、即ちＣｏｎｖｏｌｕｔｉｏｎレイヤ８０１の重みと、ＦｕｌｌＣｏｎｎｅｃｔｅｄレイヤ８０４の重みとを
θｄ＝｛ｗ（Ｄ１），ｗ（Ｄ４）｝・・・数式１４
とすると、パラメータの更新は以下の式で行われる。

ここで、γは学習係数であり、本実施形態ではγ＝０．０１とした。また、

は誤差ｅの各パラメータにおける偏微分値であり、自動微分により計算してもよい。

次に、Ｓ９０８で、パラメータ更新部７０３は、Ｓ９０５で取得した誤差に基づいて第１の推定部４０３のパラメータを更新する。更新は勾配法により行われる。第１の推定部４０３のパラメータ、即ちＣｏｎｖｏｌｕｔｉｏｎレイヤ６０１の重みと、Ｄｅｃｏｎｖｏｌｕｔｉｏｎレイヤ６０４の重みとを
θｇ＝｛ｗ（Ｇ１），ｗ（Ｇ４）｝・・・数式１７
とすると、パラメータの更新は以下の式で行われる。

としてパラメータを更新する。ここで、δは学習係数であり、本実施形態ではδ＝０．０１とした。また、

は誤差ｅの各パラメータにおける偏微分値であり、自動微分により計算してもよい。Ｓ９０８で第１の推定部４０３のパラメータを更新した後は、ＣＰＵ１０１はＳ９０３に処理を戻す。Ｓ９０３に処理を戻すことにより、誤差ｅが所定の閾値以内に収まるまで、第１の判定部７０１及び第１の推定部４０３のパラメータの更新を繰り返すことになる。

＜学習用中間データ取得部４０８の動作＞
第１の学習部４０６では、正解データとして読取画像データから取得した学習用中間データを用いた。学習用中間データとは、読取画像データを２値化したものであり、色材の飛び散り又は滲みの具合を表すボケの無い画像データである。本実施形態では、読取画像データをＣＭＹＫ画像に変換した後、閾値ｔｈを用いて読取画像データを２値化する。具体的には、入力された読取画像データをＩ（ｘ，ｙ、ｐＲＧＢ）とすると、２値化画像データＢ（ｘ，ｙ、ｐＣＭＹＫ）は、以下の式で得られる。

ここで、ｃｏｎｖはＲＧＢからＣＭＹＫへの色変換を行う関数であり、例えば４×３の行列変換で実現してもよい。
なお、閾値ｔｈは、例えば大津法を用いて決定してもよいし、プレーンごとに異なる数値を用いてもよい。

＜第２の学習部４０７の構成及び動作＞
本実施形態では、第２の学習部４０７は、第２の推定部４０４にＧＡＮのフレームワークを用いて学習させる。ここでは、学習用ラスタ画像データ及び正解データの組を入力とし、第２の推定部４０４の出力画像誤差、即ち、学習用ラスタ画像データと正解データとの差が最小となるようにモデル（第２モデル）を学習する。ここで、学習用ラスタ画像データは、学習用中間データ取得部４０８で取得された学習用中間データである。また、正解データには、学習用ラスタ画像データ群をモデル化するプリンタにおいて記録媒体に印刷を行い、その印刷結果をスキャンした読取画像データ群を用いる。

図１０を参照して、本実施形態に係る第２の学習部４０７の構成例を説明する。第２の学習部４０７は、第２の判定部１００１、誤差算出部１００２、及びパラメータ更新部１００３を含む。学習対象である第２の推定部４０４は、入力された中間データに対して推定画像データを取得する。

第２の判定部１００１は、入力された画像が正解データである読取画像データであるか、第２の推定部４０４が出力した推定画像データであるかを判定する判定器である。第２の判定部１００１は、第２の推定部４０４のパラメータを学習するための判定器であり、ニューラルネットワークにて構成されている。第２の判定部１００１は、入力された画像データを正解データと判定した場合は１を、第２の推定部４０４が出力した推定画像データと判定された場合は０を返す。第２の判定部１００１の構成及び動作は、第１の判定部７０１と同様であるため詳細な説明は省略する。

誤差算出部７０２は、第２の推定部４０４が出力した推定画像データ及び正解データに対する第２の判定部１００１の判定結果に基づき、２つのデータ間の誤差を算出（取得）する。

パラメータ更新部１００３は、誤差算出部１００２が算出した誤差と所定の閾値とに基づき、第２の推定部４０４及び第２の判定部１００１のパラメータを更新する。なお、第２の学習部４０７の動作は、第１の学習部４０６と同様である。

以上説明したように、本実施形態に係る画像処理装置は、印刷物に印刷された画像を読み取り、読み取られた読取画像の画像データと、印刷物の印刷に利用された画像データとを用いて、印刷物の検査を行うための基準画像を推定するモデルを学習する。また、本画像処理装置は、学習済みのモデルを用いて、印刷対象の画像データを入力として印刷物の検査を行うための基準画像を推定する。さらに、本画像処理装置は、推定された基準画像と、対応する印刷物から読み取った被検査画像とを比較して、当該印刷物の異常を検査する。このように、本実施形態によれば、機械学習を用いた画像推定により、印刷品質の検査装置で使用する基準画像を自動で生成した。本実施形態によれば、人手による基準画像の選定なしで検品が可能であり、工数の削減及び検査品質の平準化が可能である。

＜第２の実施形態＞
以下では、本発明の第２の実施形態について説明する。第１の実施形態では、機械学習を用いた画像推定部の出力画像をそのまま基準画像に設定し、印刷品質の検査を実施する形態について説明した。しかしながら、画像推定部の出力画像は必ずしも実際の印刷物の読取画像と同様ではない。そこで本実施形態では、複数の印刷物の読取画像の中から、画像推定部の出力画像に最も類似した読取画像を検査装置の基準画像として設定する形態について説明する。なお、以下では、上記第１の実施形態と異なる構成及び制御について主に説明する。

＜基準画像設定部２０１の構成＞
図１１を参照して、本実施形態における基準画像設定部１１００の構成を説明する。基準画像設定部１１００は、デジタル画像取得部１１０１、画像推定部１１０２、基準候補画像取得部１１０３、及び基準画像選定部１１０４を含む。

デジタル画像取得部１１０１は、当該印刷物のデジタル画像を取得する。デジタル画像とは、ユーザによって、操作部１０６を介して印刷指示された入力データに対して、ＲＩＰ処理及び中間処理等の画像処理を適用した結果であり、ＣＭＹＫ４プレーンの画像データとして保持されている。画像推定部１１０２は、デジタルデータを入力とし、当該デジタルデータを画像処理装置１００で印刷した印刷物の読取画像に相当するシミュレーション画像データを出力する。画像推定部１１０２は、第１の実施形態の画像推定部３０２と同様の構成であるため詳細な説明は省略する。

基準候補画像取得部１１０３は、基準画像の候補となる複数の読取画像（基準候補画像群）を取得する。当該基準画像群は、検査予定の印刷物と同じ画像データ、かつ、同じ記録媒体で印刷した複数の印刷物をスキャナユニット１１２よりスキャンしたデータ群である。基準画像選定部１１０４は、当該基準候補画像群とシミュレーション画像データの類似度に基づき、基準候補画像群から一つの画像を選定し、検品装置の基準画像として設定する。

＜基準画像選定部１１０４の動作＞
次に、図１２を参照して、本実施形態における基準画像選定部１１０４の動作について説明する。なお、当該フローチャートで示す処理は、ＣＰＵ１０１が、ＲＯＭ１０２に格納されているプログラムをＲＡＭ１０３に展開し、その展開プログラムを実行することにより実現される。

Ｓ１２０１で、基準画像選定部１１０４は、画像推定部１１０２が出力した画像をシミュレーション画像Ｉｓ（ｘ、ｙ）として取得する。続いて、Ｓ１２０２で、基準画像選定部１１０４は、基準候補画像群を基準候補画像取得部１１０３により取得する。

次に、Ｓ１２０３で、基準画像選定部１１０４は、全基準候補画像に対してＳ１２０４の処理を実施したかを判断する。まだ実施していない基準候補画像があればＳ１２０４に進み、そうでなければＳ１２０５に処理を移す。Ｓ１２０４で、基準画像選定部１１０４は、当該基準候補画像Ｉｃ（ｘ、ｙ）と推定画像の類似度を計算する。本実施形態では、画素値の平均絶対誤差の逆数を類似度ｓとし、以下の数式２１で求めることができる。
ｓ＝１／（１／ＮΣ｜Ｉｓ（ｘ、ｙ）−Ｉｃ（ｘ、ｙ）｜）・・・数式２１
ここで、Ｎは画素数である。なお、類似度の算出方法は、例えばＳＳＩＭ（Structural SIMilarity）や平均二乗誤差など、他の方法を用いてもよい。

Ｓ１２０５で、基準画像選定部１１０４は、Ｓ１２０４で各読取画像に対して求めた類似度のうち、最大の類似度を有する読取画像を基準画像として設定する。つまり、ここでは、類似度が最大の基準候補画像を基準画像として選定する。

以上説明したように、本実施形態によれば、読み取られた複数の読取画像のうち、学習済みモデルから生成された生成画像との類似度が最も高い読取画像を、基準画像として推定する。これにより、上記第１の実施形態と同様に、自動で選定された実読取画像が基準画像となるため、人手による基準画像の選定を必要とせず、更には、高精度な検査が可能となる。

＜第３の実施形態＞
上記第２の実施形態では、画像推定部の出力画像に最も類似した読取画像を検査装置の基準画像として設定した。しかしながら、必ずしも画像推定部の出力画像に類似した画像が基準画像として最適であるとは限らない。例えば、印刷の欠陥として局所的な白抜けやスジなどがあった場合、画像の類似度は高く判定され、適切な基準画像を設定できない場合がある。そこで本実施形態では、画像推定部の出力画像を仮の基準画像として検査装置に設定し、複数の印刷物の読取画像に対して検査を実施する。そして検査装置により異常がないと判断された印刷物の読取画像を基準画像として設定（更新）する。つまり、本実施形態は、上記第１及び第２の実施形態と組み合わせて実施されるものであり、一旦上記第１及び第２の実施形態において推定された基準画像を用いて被検査画像を検査し、検査の結果、異常がないと判断された読取画像を基準画像として更新する。以下では、上記第２の実施形態との差分について主に説明する。

＜基準画像選定部１１０４の動作＞
図１３を参照して、本実施形態における基準画像選定部１１０４の動作について説明する。なお、当該フローチャートで示す処理は、ＣＰＵ１０１が、ＲＯＭ１０２に格納されているプログラムをＲＡＭ１０３に展開し、その展開プログラムを実行することにより実現される。

Ｓ１３０１で、基準画像選定部１１０４は、画像推定部１１０２が出力した画像をシミュレーション画像Ｉｓ（ｘ、ｙ）として取得する。続いて、Ｓ１３０２で、基準画像選定部１１０４は、生成したシミュレーション画像Ｉｓを検査部の仮の基準画像として登録する。さらに、Ｓ１３０３で、基準画像選定部１１０４は、基準候補画像群を基準候補画像取得部１１０３により取得する。

次に、Ｓ１３０４で、基準画像選定部１１０４は、全基準候補画像に対してＳ１３０５の処理を実施したかを判断する。まだ実施していない基準候補画像があればＳ１３０５に進み、そうでなければＳ１３０６に処理を移す。Ｓ１３０５で、画像検査部２０３は、当該基準候補画像Ｉｃに対して検査を実行する。さらに、Ｓ１３０６で、基準画像選定部１１０４は、画像検査部２０３で異常なしと判定された読取画像を基準画像として更新し、処理を終了する。なお、基準画像の更新は、検査が行われるたびに行われてもよいし、定期的に実施されるようにしてもよいし、ユーザ指示に応じて実施するようにしてもよい。また、これらの更新タイミングについてはユーザの設定に従って切り替えることができるようにしてもよい。

以上説明したように、本実施形態では、上記第１及び第２の少なくとも１つの実施形態に加えて、さらに、検査によって異常がないと判断された被検査画像を基準画像として更新する。このように、本実施形態では、機械学習により生成した画像を仮の基準画像として印刷物の検査を行い、正常画像と判定された読取画像を実検査時の基準画像として設定する。これにより、局所的な異常が印刷物にあった際も、適切に基準画像を選択することができる。

＜その他の実施形態＞
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。

１００：画像処理装置、１０１：ＣＰＵ、１０２：ＲＯＭ、１０３：ＲＡＭ、１０４：大容量記憶装置、１０５：表示部、１０６：操作部、１０７：エンジンＩ／Ｆ、１０８：ネットワークＩ／Ｆ、１０９：スキャナＩ／Ｆ、１１０：システムバス、１１１：プリンタエンジン、１１２：スキャナユニット、１１４：検査装置、２０１：基準画像設定部、２０２：被検査画像取得部、２０３：画像検査部

Claims

画像処理装置であって、
印刷物に印刷された画像を読み取る読取手段と、
前記読取手段によって読み取られた読取画像の画像データと、前記印刷物の印刷に利用された画像データとを用いて、印刷物の検査を行うための基準画像を推定するモデルを学習する学習手段と、
前記学習手段による学習済みのモデルを用いて、印刷対象の画像データを入力として印刷物の検査を行うための基準画像を推定する推定手段と
を備えることを特徴とする画像処理装置。
前記推定手段は、前記学習済みモデルから生成された生成画像を基準画像として推定することを特徴とする請求項１に記載の画像処理装置。
前記推定手段は、前記読取手段によって読み取られた複数の読取画像のうち、前記学習済みモデルから生成された生成画像との類似度が最も高い読取画像を、前記基準画像として推定することを特徴とする請求項１に記載の画像処理装置。
前記推定手段によって推定された前記基準画像と、対応する印刷物を前記読取手段によって読み取った被検査画像とを比較して、該印刷物の異常を検査する検査手段をさらに備えることを特徴とする請求項１乃至３の何れか１項に記載の画像処理装置。
前記推定手段は、さらに、前記検査手段によって異常がないと判断された被検査画像を前記基準画像として更新することを特徴とする請求項４に記載の画像処理装置。
前記推定手段は、
入力される画像データから、第１モデルを用いて１画素１ビットの中間データを出力する第１の推定手段と、
前記中間データを入力として、第２モデルを用いて１画素８ビットの生成画像を出力する第２の推定手段と
を備えることを特徴とする請求項１乃至５の何れか１項に記載の画像処理装置。
前記第１の推定手段は、印刷対象のデータを記録媒体に印刷した際の色材の飛び散り又は滲みの具合を再現し、かつ、ボケの無い前記中間データを出力し、
前記第２の推定手段は、ボケを再現した前記生成画像を出力することを特徴とする請求項６に記載の画像処理装置。
前記第１の推定手段と前記第２の推定手段とは直列に接続されることを特徴とする請求項６又は７に記載の画像処理装置。
前記学習手段は、
前記第１の推定手段で用いる前記第１モデルを学習させる第１の学習手段と、
前記第２の推定手段で用いる前記第２モデルを学習させる第２の学習手段と
を備えることを特徴とする請求項６乃至８の何れか１項に記載の画像処理装置。
前記第１の学習手段は、
前記第１の推定手段により出力された前記中間データと、正解データとの誤差が所定の閾値を超えると、前記第１モデルのパラメータを更新することを特徴とする請求項９に記載の画像処理装置。
前記第２の学習手段は、
前記第２の推定手段により出力された前記生成画像のデータと、正解データとの誤差が所定の閾値を超えると、前記第２モデルのパラメータを更新することを特徴とする請求項９又は１０に記載の画像処理装置。
画像処理装置の制御方法であって、
読取手段が、印刷物に印刷された画像を読み取る読取工程と、
学習手段が、前記読取工程で読み取られた読取画像の画像データと、前記印刷物の印刷に利用された画像データとを用いて、印刷物の検査を行うための基準画像を推定するモデルを学習する学習工程と、
推定手段が、前記学習工程で学習済みのモデルを用いて、印刷対象の画像データを入力として印刷物の検査を行うための基準画像を推定する推定工程と
を含むことを特徴とする画像処理装置の制御方法。
画像処理装置の制御方法における各工程をコンピュータに実行させるためのプログラムであって、前記制御方法は、
読取手段が、印刷物に印刷された画像を読み取る読取工程と、
学習手段が、前記読取工程で読み取られた読取画像の画像データと、前記印刷物の印刷に利用された画像データとを用いて、印刷物の検査を行うための基準画像を推定するモデルを学習する学習工程と、
推定手段が、前記学習工程で学習済みのモデルを用いて、印刷対象の画像データを入力として印刷物の検査を行うための基準画像を推定する推定工程と
を含むことを特徴とするプログラム。