JP2020123830A - 画像処理装置、画像読取装置、画像形成装置、画像処理方法及び画像処理プログラム - Google Patents

画像処理装置、画像読取装置、画像形成装置、画像処理方法及び画像処理プログラム Download PDF

Info

Publication number
JP2020123830A
JP2020123830A JP2019014539A JP2019014539A JP2020123830A JP 2020123830 A JP2020123830 A JP 2020123830A JP 2019014539 A JP2019014539 A JP 2019014539A JP 2019014539 A JP2019014539 A JP 2019014539A JP 2020123830 A JP2020123830 A JP 2020123830A
Authority
JP
Japan
Prior art keywords
image
data
neural network
color
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019014539A
Other languages
English (en)
Other versions
JP7198432B2 (ja
Inventor
篤志 西田
Atsushi Nishida
篤志 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2019014539A priority Critical patent/JP7198432B2/ja
Publication of JP2020123830A publication Critical patent/JP2020123830A/ja
Application granted granted Critical
Publication of JP7198432B2 publication Critical patent/JP7198432B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Color Image Communication Systems (AREA)
  • Image Analysis (AREA)

Abstract

【課題】推論の外れに起因する弊害を抑制しつつ人工知能を利用する。【解決手段】画像処理装置は、複数のカラーテーブルのいずれか1つを使用して画像データの色変換処理を実行する色変換処理部と、第1のニューラルネットワークで画像データを解析し、複数の画像の種類のいずれであるか識別する画像識別部とを備える。第1のニューラルネットワークは、カルバック・ライブラー・ダイバージェンスを使用する損失関数に基づいて、正規の訓練データを正規の訓練データと識別し、偽画像データを偽画像データと識別する確率を高くするように学習される。色変換処理部は、識別の信頼度が予め設定されている閾値以上の場合には、識別された画像の種類に対応するカラーテーブルを使用して色変換処理を実行し、識別の信頼度が閾値未満の場合には、識別された画像の種類に対応し、カラーテーブルの特徴が減殺されたカラーテーブルを使用して色変換処理を実行する。【選択図】図1

Description

本発明は、画像処理装置、画像処理方法及び画像処理プログラムに関し、特に機械学習を利用する技術に関する。
画像形成装置(たとえばプリンター、多機能プリンター、又は複合機(Multifunction Peripheral)における人工知能の採用が提案されている。具体的には、たとえば特許文献1は、ユーザー装置のディスプレイ能力などに関する情報に応じて、エンコーディングの正しいモード(例えばロスレスまたはロッシイ)を推論するAIコンポーネントを提案している。さらに、特許文献1は、AIコンポーネントが入力画像内のピクセルカラーの正しいカラーテーブルを推論することができるとしている。
特開2005−323370号公報
Dan Hendrycks他著 A BASELINE FOR DETECTING MISCLASSIFIED AND OUT−OF−DISTRIBUTION EXAMPLES IN NEURAL NETWORKS Kimin Lee他著 Training Confidence−calibrated Classifiers for Detecting Out−of−Distribution Samples
しかしながら、特許文献1は、推論が外れた場合についての検討が十分ではない。本願発明者は、推論が外れた場合には却って画質に弊害を生じさせることに着目した。一方、非特許文献1は、分布から外れた外れ値、すなわち学習モデルに対して想定外の画像の識別において91%という高い予測信頼度で誤認識する現象を例示している。
本発明は、このような状況に鑑みてなされたものであり、推論の外れに起因する弊害を抑制しつつ人工知能を利用する技術を提供することを目的とする。
本発明の画像処理装置は、複数の画像の種類に対して予め準備されている複数のカラーテーブルを有し、前記複数のカラーテーブルのいずれか1つを使用して画像データの色変換処理を実行する色変換処理部と、第1のニューラルネットワークを有し、前記第1のニューラルネットワークで前記画像データを解析し、前記複数の画像の種類のいずれであるか識別する画像識別部とを備え、前記第1のニューラルネットワークは、カルバック・ライブラー・ダイバージェンスを使用する損失関数に基づいて、第2のニューラルネットワークを使用して生成された偽画像データと、正規の訓練データとを使用し、前記正規の訓練データを正規の訓練データと識別し、前記偽画像データを偽画像データと識別する確率を高くするように学習され、前記第2のニューラルネットワークは、前記画像識別部によって正規の訓練データと識別される確率の高い偽画像データを生成するように学習され、前記色変換処理部は、前記識別の信頼度が予め設定されている閾値以上の場合には、前記識別された画像の種類に対応するカラーテーブルを使用して前記色変換処理を実行し、前記識別の信頼度が前記閾値未満の場合には、前記識別された画像の種類に対応し、前記カラーテーブルの特徴が減殺されたカラーテーブルを使用して色変換処理を実行する。
本発明の画像処理方法は、複数の画像の種類に対して予め準備されている複数のカラーテーブルを有し、前記複数のカラーテーブルのいずれか1つを使用して画像データの色変換処理を実行する色変換処理工程と、第1のニューラルネットワークを有し、前記第1のニューラルネットワークで前記画像データを解析し、前記複数の画像の種類のいずれであるか識別する画像識別工程とを備え、前記第1のニューラルネットワークは、カルバック・ライブラー・ダイバージェンスを使用する損失関数に基づいて、第2のニューラルネットワークを使用して生成された偽画像データと、正規の訓練データとを使用し、前記正規の訓練データを正規の訓練データと識別し、前記偽画像データを偽画像データと識別する確率を高くするように学習され、前記第2のニューラルネットワークは、前記画像識別工程によって正規の訓練データと識別される確率の高い偽画像データを生成するように学習され、前記色変換処理工程は、前記識別の信頼度が予め設定されている閾値以上の場合には、前記識別された画像の種類に対応するカラーテーブルを使用して前記色変換処理を実行する工程と、前記識別の信頼度が前記閾値未満の場合には、前記識別された画像の種類に対応し、前記カラーテーブルの特徴が減殺されたカラーテーブルを使用して色変換処理を実行する工程とを有する。
本発明の画像処理プログラムは、複数の画像の種類に対して予め準備されている複数のカラーテーブルを有し、前記複数のカラーテーブルのいずれか1つを使用して画像データの色変換処理を実行する色変換処理部、第1のニューラルネットワークを有し、前記第1のニューラルネットワークで前記画像データを解析し、前記複数の画像の種類のいずれであるか識別する画像識別部として前記画像処理装置を機能させ、前記第1のニューラルネットワークは、カルバック・ライブラー・ダイバージェンスを使用する損失関数に基づいて、第2のニューラルネットワークを使用して生成された偽画像データと、正規の訓練データとを使用し、前記正規の訓練データを正規の訓練データと識別し、前記偽画像データを偽画像データと識別する確率を高くするように学習され、前記第2のニューラルネットワークは、前記画像識別部によって正規の訓練データと識別される確率の高い偽画像データを生成するように学習され、前記色変換処理部は、前記識別の信頼度が予め設定されている閾値以上の場合には、前記識別された画像の種類に対応するカラーテーブルを使用して前記色変換処理を実行し、前記識別の信頼度が前記閾値未満の場合には、前記識別された画像の種類に対応し、前記カラーテーブルの特徴が減殺されたカラーテーブルを使用して色変換処理を実行する。
本発明によれば、推論の外れに起因する弊害を抑制しつつ人工知能を利用する技術を提供することができる。
本発明の一実施形態に係る画像形成装置100の機能構成を示すブロックダイアグラムである。 一実施形態に係るカラーテーブルの内容を示す説明図である。 一実施形態に係る拡張GAN学習処理の内容を示すフローチャートである。 一実施形態に係る拡張GAN学習処理における誤差逆伝播法の内容を示すブロックダイアグラムである。 一実施形態に係る拡張GAN学習処理の内容を示す数式である。 一実施形態に係る画像形成処理の内容を示す説明図である。
以下、本発明を実施するための形態(以下、「実施形態」という)を、図面を参照して説明する。
図1は、本発明の一実施形態に係る画像形成装置100の機能構成を示すブロックダイアグラムである。画像形成装置100は、制御部110と、画像形成部120と、記憶部140と、画像読取部150と、通信インターフェース部160(通信I/Fとも呼ばれる。)とを備えている。画像読取部150は、原稿から画像を読み取ってデジタルデータである画像データIDを生成する。画像形成装置100は、通信インターフェース部160とLANとを介して複数のパーソナルコンピュータ200に接続されている。
パーソナルコンピュータ200は、画像形成装置100に対して印刷ジョブを送信し、画像形成装置100に画像形成処理を実行させることができる。印刷ジョブは、たとえばページ記述言語(PDL)で記述することができる。制御部110は、ページ記述言語で記述された印刷ジョブを解析して、印刷ジョブに含まれるテキスト(文字)やイメージ、ベクターグラフィックスといったオブジェクトを抽出し、描画処理やフォント処理を実行する。印刷ジョブは、画像形成ジョブとも呼ばれる。
画像形成部120は、色変換処理部121と、ハーフトーン処理部122と、カラーテーブル(色変換テーブルとも呼ばれる。)CT1〜CT6と、露光部124と、アモルファスシリコン感光体である感光体ドラム(像担持体)123c〜123kと、現像部125c〜125kと、帯電部126c〜126kとを有している。色変換処理部121は、RGB画像データである画像データIDや印刷ジョブ内のRGB画像データをCMYKデータに色変換する。ハーフトーン処理部122は、CMYKデータにハーフトーン処理を実行してCMYKのハーフトーンデータとして印刷データPDを生成する。ハーフトーンデータは、CMYKの各トナーによって形成されるドットの形成状態を表し、ドットデータとも呼ばれる。
記憶部140は、非一時的な記録媒体であるハードディスクドライブやフラッシュメモリー等からなる記憶装置で、制御部110が実行する処理の制御プログラム(画像処理プログラムを含む。)やデータを記憶する。記憶部140は、本実施形態では、さらに訓練データ格納領域R1及び獲得データ格納領域R2を有している。
制御部110は、RAMやROM等の主記憶手段、及びMPU(Micro Processing Unit)やCPU(Central Processing Unit)等の制御手段を備えている。また、制御部110は、各種I/O、USB(ユニバーサル・シリアル・バス)、バス、その他ハードウェア等のインターフェースに関連するコントローラ機能を備え、画像形成装置100全体を制御する。
制御部110は、画像識別部111と偽データ生成部112と学習処理部113とを備えている。画像識別部111及び偽データ生成部112は、いずれもニューラルネットワークを有している。ニューラルネットワークは、誤差逆伝播法によって、パーセプトロンの重みやバイアスを調整し、隠れ層のニューロンを増やすことで学習することができる。ニューラルネットワークは、PythonやTensorflowといったツールを使用して実装することができる。画像識別部111は、第1のニューラルネットワークを有し、偽データ生成部112は、第2のニューラルネットワークを有している。画像識別部111、偽データ生成部112及び学習処理部113の機能については後述する。
図2は、一実施形態に係るカラーテーブルの内容を示す説明図である。カラーテーブルCT1〜CT6は、複数の画像の種類のいずれかに対応している。カラーテーブルCT1〜CT6は、「文書+図形」に対応する「文書+図形」用のカラーテーブル、「文書+写真」に対応する「文書+写真」用のカラーテーブル、DTPに対応するDTP用のカラーテーブル、線画に対応する線画用のカラーテーブル、人物写真に対応する人物写真用のカラーテーブル及び標準のカラーテーブルである。
「文書+図形」用のカラーテーブルCT1は、文字輪郭の明確化及び図形(たとえばグラフ)の再現用(たとえば図形の均一なトーン)に特化されているカラーテーブルである。「文書+写真」用のカラーテーブルCT2は、文字輪郭の明確化及び写真の再現(たとえば写真の正確なグラデーションの再現等)に特化されているカラーテーブルである。DTP用のカラーテーブルCT3は、文字輪郭の明確化及び図形や写真の再現に特化されているカラーテーブルである。線画用のカラーテーブルCT4は、線画の輪郭の明確化に特化されているカラーテーブルである。人物写真用のカラーテーブルCT5は、記憶色を利用した肌色の再現に特化されているカラーテーブルである。標準のカラーテーブルCT6は、特定の画像の種類に特化されていない再現を目的とするカラーテーブルである。複数のカラーテーブルCT1〜CT6は、色変換テーブルとも呼ばれる。
図3は、一実施形態に係る拡張GAN学習処理(ステップS100)の内容を示すフローチャートである。図4は、一実施形態に係る拡張GAN学習処理における誤差逆伝播法の内容を示すブロックダイアグラムである。GAN学習処理は、GAN(Generative Adversarial Network)の学習処理であり、GeneratorとDiscriminatorと呼ばれる競合する2つの学習モデルを用いる学習処理である。GANは、敵対的生成ネットワークとも呼ばれる。これにより、画像識別部111の第1のニューラルネットワークと偽データ生成部112の第2のニューラルネットワークとが学習されることになる。
本実施形態では、画像識別部111は、画像読取部150で読み取られた画像である読取画像が図2の表に示される複数の画像の種類のいずれであるか否かを識別するための学習を実行するものとする。偽データ生成部112は、上記複数の画像の種類のいずれかに似せた偽の画像を表す偽画像データを生成するものとする。この例では、GAN学習処理(ステップS100)は、一定の間隔、たとえば週に一度程度、金曜日のお昼休みの空き時間時に実行されるものとする。
ステップS110では、画像識別部111は、訓練データ取得処理を実行する。訓練データ取得処理は、画像識別部111及び偽データ生成部112の学習に使用される学習用のデータを取得する処理である。訓練データは、画像形成装置100が設置される際に記憶部140の訓練データ格納領域R1に予め初期データとして格納されているデータと、その後に蓄積されているデータとを含んでいる。この例では、訓練データは、正規のデータである旨のラベルに紐づけられ、画像の種類を表すデータも含んでいる。
ステップS120では、画像識別部111は、獲得データ取得処理を実行する。獲得データ取得処理では、画像識別部111は、パーソナルコンピュータ200から受信した印刷ジョブを利用して過去1週間に新たに獲得データ格納領域R2に格納された訓練データを取得する。訓練データは、学習処理部113によって獲得される。学習処理部113は、獲得データ格納領域R2に格納された訓練データを訓練データ格納領域R1に追加する。これにより、ユーザーによって高い頻度で使用される種類の画像の識別精度を高めることができる。
学習処理部113は、複数のパーソナルコンピュータ200から受信したページ記述言語(PDL)で記述された印刷ジョブを解析して、印刷ジョブに含まれるテキスト(文字)やイメージ(Jpeg)、ベクターグラフィックスといったオブジェクトに基づいて画像の種類を特定する。具体的には、画像識別部111は、たとえば印刷ジョブがテキストとベクターグラフィックスとを含んでいるときには、画像の種類が「文書+図形」であり、テキストとイメージ(Jpeg)とを含んでいるときには、画像の種類が「文書+写真」であり、テキストとベクターグラフィックスとイメージ(Jpeg)とを含んでいるときには、画像の種類が「DTP」であると判断することができる。学習処理部113は、印刷ジョブから取得されたRGB画像データと識別された画像の種類とを紐づけて獲得データとして獲得データ格納領域R2に格納する。
ステップS130では、画像識別部111は、識別処理を実行する(図4参照)。識別処理では、画像識別部111は、第1のニューラルネットワークを使用し、訓練データ格納領域R1から入力されたラベル付きの画像データを解析し、画像データの識別処理を実行し、画像の種類を識別する。
ステップS140では、学習処理部113は、識別正否判定を実行する。識別正否判定では、学習処理部113は、(1)正規データである場合に、ラベルに表された画像の種類と画像識別部111の識別結果(正規データ且つ画像種類)とが一致した場合と、(2)偽データである場合に、画像識別部111の識別結果(偽データ)とが一致した場合には、正解とする。
学習処理部113は、(1)正規データである場合に、ラベルに表された画像の種類と画像識別部111の識別結果(偽データ)との少なくとも一方が一致しなかった場合と、(2)偽データである場合に、画像識別部111の識別結果(正規データ)とが一致しなかった場合には、不正解とする。
ステップS150では、学習処理部113は、識別器学習処理を実行する。識別器学習処理では、識別正否判定に基づいて損失関数LF(図4参照)を使用して画像識別部111の学習処理を実行する。
図5は、一実施形態に係る拡張GAN学習処理の内容を示す数式である。数式F1は、比較例に係る一般的なGAN学習内容を数式で表したものである。数式F1において、Dは識別部(discriminator)で、Gはデータ生成部(generator)で、xは訓練データで、zは潜在変数(ノイズ)である。Gは、潜在変数zを入力として偽データを生成し、D(x)は、識別結果として各データが訓練データである確率を表している。
比較例に係るGAN学習は、識別部Dの学習として、数式F1の出力としての確率変数(T3:本物データを本物と識別する確率とT4:偽データを偽物と識別とする確率)を最大化(T1:識別能力の最大化)するように誤差逆伝播法で学習する(図4参照)。
一実施形態に係る拡張GAN学習処理は、損失関数LFを使用している点で一般的なGAN学習処理と相違している(非特許文献2)。数式F2は、一実施形態に係る拡張GAN学習内容を数式で表したものである。一実施形態に係る拡張GAN学習内容は、一般的なGAN学習処理で損失関数として使用される(b)項に加えて、(a)項を有している点で一般的なGAN学習処理と相違している。(a)項は、KL損失、すなわちカルバック・ライブラー・ダイバージェンス損失を表す項である。
ステップS160では、偽データ生成部112は、偽データ生成処理を実行する。偽データ生成処理では、偽データ生成部112は、たとえば正規分布や一様分布から取り出した潜在変数(ノイズ)を入力し、第2のニューラルネットワークを使用し、偽の画像データとして偽データを生成する。ステップS170では、画像識別部111は、偽データについて識別処理を実行する。
ステップS180では、学習処理部113は、識別正否判定を実行する。識別正否判定では、学習処理部113は、生成された偽データが正規データと識別された場合には、成功とし、生成された偽データが偽データと識別された場合には、失敗とする。
ステップS190では、学習処理部113は、偽データ生成部学習処理を実行する。偽データ生成部学習処理では、学習処理部113は、画像識別部111での識別の成否に基づいて偽データ生成部112の学習処理を実行する(図4参照)。
学習処理部113は、損失関数LFを使用し、すなわち数式F2の出力としての確率変数(T4:偽データを偽物と識別)等を最小化(T2:識別能力の最小化)するように偽データ生成部112の学習を実行する。
カルバック・ライブラー・ダイバージェンスは、カルバック・ライブラー情報量とも呼ばれ、2つの確率分布の差異(疑似的な距離)を表している。(a)項のKL(U(y)||Pθ(y|x))は、一様分布と偽データ生成部112によって生成される偽画像データの分布の差異を示している。(a)項は、一様分布に従って外れ値に相当する偽データを生成しようとさせる一方、(b)項は、訓練データの分布から離れた偽データの損失を大きくするので、外れ値に相当する偽データの生成を実現する一方、特に訓練データの分布の境界(端)(Boundary)の近傍領域での偽データの生成が促進されることになる(非特許文献2:第2.2章 ADVERSARIAL GENERATOR FOR OUT−OF−DISTRIBUTION参照)。偽画像データは、単に偽データとも呼ばれる。
これにより、一実施形態に係る拡張GAN学習処理は、分布から外れた外れ値、すなわち学習モデルに対して想定外の画像の識別において高い予測信頼度で誤認識する現象を顕著に抑制することができる。
図6は、一実施形態に係る画像形成処理(ステップS200)の内容を示す説明図である。本画像形成処理は、スキャン画像に適したカラーテーブルを自動的に選択して印刷媒体上に画像を形成することができる。
ステップS210では、画像形成装置100は、画像読取処理を実行する。画像読取処理では、画像読取部150は、スキャン画像として、原稿から画像を読み取ってデジタルデータである画像データIDを生成する。画像データIDは、0乃至255の256階調のRGB画像データである。
ステップS220では、画像識別部111は、画像分類処理を実行する。画像分類処理では、画像識別部111は、スキャン画像を解析し、カラーテーブルCT1〜CT5のいずれの使用に適しているか分類する。
ステップS230では、色変換処理部121は、高い信頼度で分類できたか否かを判断する。具体的には、色変換処理部121は、信頼度が閾値Th(たとえば80%)以上でカラーテーブルCT1〜CT5のいずれの使用に適していると分類できたか否かを判断する。
色変換処理部121は、閾値Th以上の信頼度で分類できた場合には、処理をステップS240に進め、閾値未満の信頼度であった場合には、処理をステップS250に進める。この例では、画像識別部111は、閾値Th以上の信頼度でスキャン画像が人物写真を表していると推定したものとする。
ステップS240では、色変換処理部121は、カラーテーブル切替処理を実行する。カラーテーブル切替処理では、色変換処理部121は、初期設定である標準のカラーテーブルCT6から人物写真用のカラーテーブルCT5に切り替える。カラーテーブルCT6は、特定の画像の種類に特化されていない再現を目的とするカラーテーブルである。
なお、信頼度が閾値Th未満の場合には、初期設定である標準のカラーテーブルCT6が使用されるので、推論の外れに起因して誤ったカラーテーブルを選択することに起因する弊害を抑制することができる。
ステップS250では、色変換処理部121は、人物写真用のカラーテーブルCT5を使用して色変換処理を実行する。色変換処理では、色変換処理部121は、RGB画像データを画像形成部120が使用する色材で再現可能なCMYK画像データに変換する。
ステップS260では、ハーフトーン処理部122は、CMYK画像データに対して組織的ディザや誤差拡散といった処理を実行して、画像形成部120がトナードットで再現可能な階調数に減色する。これにより、ハーフトーン処理部122は、ドットの形成状態を表すドットデータを生成する。
ステップS270では、画像形成部120は、露光部124、感光体ドラム123c〜123k、現像部125c〜125k及び帯電部126c〜126kを使用して電子写真プロセスでドットデータに基づいて印刷媒体上に画像を形成する。印刷媒体は、画像形成媒体とも呼ばれる。
このように、本実施形態に係る画像形成装置100は、ニューラルネットの推論に基づいてカラーテーブルを自動的に選択することができる一方、分布から外れた外れ値、すなわち学習モデルに対して想定外の画像の識別において高い予測信頼度で誤認識する現象を顕著に抑制することができる。これにより、画像形成装置100は、信頼度の低い推論結果に応じて標準のカラーテーブルを使用することができるので、推論の外れに起因する弊害を顕著に抑制することができる。
本発明は、上記各実施形態だけでなく、以下のような変形例でも実施することができる。
変形例1:上記実施形態では、5つの画像の種類に対してカラーテーブルCT1〜CT5が予め準備されているが、必ずしもこれらの画像の種類に限定されない。具体的には、カラーテーブルには、たとえば「鮮やか(花の写真等)」といった画像に高い彩度が望まれるといった意図や青空や海を記憶色で鮮やかに表したい画像、草原や野山を記憶色で鮮やかに表したい画像といった画像の意図の推測に基づくカラーテーブルであってもよい。
すなわち、複数の画像の種類は、画像データによって表される画像を所定の方法で再現することが意図されている特定の種類を含み、色変換処理部は、画像識別部による特定の種類の識別に応じて、所定の方法で再現するためのカラーテーブルを選択するように構成されていてもよい。
記憶色は、人間がイメージとして記憶した色であり、実際の正確な色とは異なる。人間は、視覚で認識した色よりも色鮮やかに記憶する傾向があるので、このイメージを再現するための色が記憶色である。
変形例2:上記実施形態や変形例では、推定の信頼度が閾値未満の場合には、標準のカラーテーブルが使用されているが、必ずしも標準のカラーテーブルの使用に限定されない。具体的には、たとえば最も近い分類のカラーテーブルの特徴であって、減殺(抑制)された特徴を有するカラーテーブル、すなわち特徴が抑制されたカラーテーブルを使用して色変換処理を実行してもよい。なお、標準のカラーテーブルは、任意の画像の再現に使用可能な共通なカラーテーブルであり、特徴が抑制されたカラーテーブルに含まれる。
変形例3:上記実施形態や変形例では、制御部は偽データ生成部と学習処理部とを有しているが、学習処理部は本発明に必須の要素ではない。本発明は、予め学習が行われた画像識別部を有するものであれば良い。具体的には、たとえば学習済みの画像識別部を有する組み込み機器を画像形成装置に実装しても良いし、学習済みのニューラルネットワークをダウンロードして画像形成装置に実装しても良い。
変形例4:上記実施形態や変形例では、本発明は、画像形成装置に適用されているが、画像読取装置や画像処理装置にも適用可能である。
100 画像形成装置
110 制御部
111 画像識別部
112 偽データ生成部
113 学習処理部
120 画像形成部
121 色変換処理部
122 ハーフトーン処理部
140 記憶部
150 画像読取部
160 通信インターフェース部
200 パーソナルコンピュータ

Claims (8)

  1. 複数の画像の種類に対して予め準備されている複数のカラーテーブルを有し、前記複数のカラーテーブルのいずれか1つを使用して画像データの色変換処理を実行する色変換処理部と、
    第1のニューラルネットワークを有し、前記第1のニューラルネットワークで前記画像データを解析し、前記複数の画像の種類のいずれであるか識別する画像識別部と、
    を備え、
    前記第1のニューラルネットワークは、カルバック・ライブラー・ダイバージェンスを使用する損失関数に基づいて、第2のニューラルネットワークを使用して生成された偽画像データと、正規の訓練データとを使用し、前記正規の訓練データを正規の訓練データと識別し、前記偽画像データを偽画像データと識別する確率を高くするように学習され、
    前記第2のニューラルネットワークは、前記画像識別部によって正規の訓練データと識別される確率の高い偽画像データを生成するように学習され、
    前記色変換処理部は、前記識別の信頼度が予め設定されている閾値以上の場合には、前記識別された画像の種類に対応するカラーテーブルを使用して前記色変換処理を実行し、前記識別の信頼度が前記閾値未満の場合には、前記識別された画像の種類に対応し、前記カラーテーブルの特徴が減殺されたカラーテーブルを使用して色変換処理を実行する画像処理装置。
  2. 請求項1記載の画像処理装置であって、さらに、
    前記第2のニューラルネットワークで偽画像データを生成する偽データ生成部と、
    カルバック・ライブラー・ダイバージェンスを使用する損失関数に基づいて、前記正規の訓練データと前記偽画像データを使用し、前記正規の訓練データを正規の訓練データと識別し、前記偽画像データを偽画像データと識別する確率を高くするように前記第1のニューラルネットワークを学習させ、前記画像識別部によって正規の訓練データと識別される確率の高い偽画像データを生成するように前記第2のニューラルネットワークを学習させる学習処理部と、
    を備える画像処理装置。
  3. 請求項1又は2記載の画像処理装置であって、
    前記複数の画像の種類は、前記画像データによって表される画像を所定の方法で再現することが意図されている特定の種類を含み、
    前記色変換処理部は、前記画像識別部による前記特定の種類の識別に応じて、前記所定の方法で再現するためのカラーテーブルを選択する画像処理装置。
  4. 請求項1乃至3のいずれか1項に記載の画像処理装置であって、
    前記カラーテーブルの特徴が減殺されたカラーテーブルは、任意の画像の再現に使用可能な共通なカラーテーブルである画像処理装置。
  5. 原稿上の画像を読み取って読取画像を表す画像データを生成する画像読取部と、
    前記画像データの色変換処理を実行する請求項1乃至4のいずれか1項に記載の画像処理装置と、
    を備える画像読取装置。
  6. 画像形成ジョブの受信に応じて画像形成媒体上に画像を形成することが可能な画像形成装置であって、
    請求項5記載の画像読取装置を備え、
    前記画像読取装置は、カルバック・ライブラー・ダイバージェンスを使用する損失関数に基づいて、前記正規の訓練データと前記偽画像データを使用し、前記正規の訓練データを正規の訓練データと識別し、前記偽画像データを偽画像データと識別する確率を高くするように前記第1のニューラルネットワークを学習させ、前記画像識別部によって正規の訓練データと識別される確率の高い偽画像データを生成するように前記第2のニューラルネットワークを学習させる学習処理部を有し、
    前記画像形成ジョブは、ページ記述言語で記述されており、
    前記学習処理部は、前記ページ記述言語で記述された画像形成ジョブを解析して、前記複数の画像の種類のいずれであるか識別し、
    前記学習処理部は、前記画像形成ジョブから取得されたRGB画像データと前記識別された画像の種類とを紐づけて前記正規の訓練データに追加する画像形成装置。
  7. 複数の画像の種類に対して予め準備されている複数のカラーテーブルを有し、前記複数のカラーテーブルのいずれか1つを使用して画像データの色変換処理を実行する色変換処理工程と、
    第1のニューラルネットワークを有し、前記第1のニューラルネットワークで前記画像データを解析し、前記複数の画像の種類のいずれであるか識別する画像識別工程と、
    を備え、
    前記第1のニューラルネットワークは、カルバック・ライブラー・ダイバージェンスを使用する損失関数に基づいて、第2のニューラルネットワークを使用して生成された偽画像データと正規の訓練データとを使用し、前記正規の訓練データを正規の訓練データと識別し、前記偽画像データを偽画像データと識別する確率を高くするように学習され、
    前記第2のニューラルネットワークは、前記画像識別工程によって正規の訓練データと識別される確率の高い偽画像データを生成するように学習され、
    前記色変換処理工程は、前記識別の信頼度が予め設定されている閾値以上の場合には、前記識別された画像の種類に対応するカラーテーブルを使用して前記色変換処理を実行する工程と、前記識別の信頼度が前記閾値未満の場合には、前記識別された画像の種類に対応し、前記カラーテーブルの特徴が減殺されたカラーテーブルを使用して色変換処理を実行する工程とを有する画像処理方法。
  8. 画像処理装置を制御する画像処理プログラムであって、
    複数の画像の種類に対して予め準備されている複数のカラーテーブルを有し、前記複数のカラーテーブルのいずれか1つを使用して画像データの色変換処理を実行する色変換処理部、
    第1のニューラルネットワークを有し、前記第1のニューラルネットワークで前記画像データを解析し、前記複数の画像の種類のいずれであるか識別する画像識別部として前記画像処理装置を機能させ、
    前記第1のニューラルネットワークは、カルバック・ライブラー・ダイバージェンスを使用する損失関数に基づいて、第2のニューラルネットワークを使用して生成された偽画像データと正規の訓練データとを使用し、前記正規の訓練データを正規の訓練データと識別し、前記偽画像データを偽画像データと識別する確率を高くするように学習され、
    前記第2のニューラルネットワークは、前記画像識別部によって正規の訓練データと識別される確率の高い偽画像データを生成するように学習され、
    前記色変換処理部は、前記識別の信頼度が予め設定されている閾値以上の場合には、前記識別された画像の種類に対応するカラーテーブルを使用して前記色変換処理を実行し、前記識別の信頼度が前記閾値未満の場合には、前記識別された画像の種類に対応し、前記カラーテーブルの特徴が減殺されたカラーテーブルを使用して色変換処理を実行する画像処理プログラム。

JP2019014539A 2019-01-30 2019-01-30 画像処理装置、画像読取装置、画像形成装置、画像処理方法及び画像処理プログラム Active JP7198432B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019014539A JP7198432B2 (ja) 2019-01-30 2019-01-30 画像処理装置、画像読取装置、画像形成装置、画像処理方法及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019014539A JP7198432B2 (ja) 2019-01-30 2019-01-30 画像処理装置、画像読取装置、画像形成装置、画像処理方法及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2020123830A true JP2020123830A (ja) 2020-08-13
JP7198432B2 JP7198432B2 (ja) 2023-01-04

Family

ID=71993677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019014539A Active JP7198432B2 (ja) 2019-01-30 2019-01-30 画像処理装置、画像読取装置、画像形成装置、画像処理方法及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP7198432B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516185A (zh) * 2021-07-09 2021-10-19 北京百度网讯科技有限公司 模型训练的方法、装置、电子设备及存储介质
KR20220060722A (ko) * 2020-11-05 2022-05-12 조창환 이미지 데이터 라벨링 학습 방법 및 그 장치
WO2022190801A1 (ja) 2021-03-10 2022-09-15 ソニーセミコンダクタソリューションズ株式会社 情報処理装置、情報処理システム、情報処理方法及び記録媒体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006163503A (ja) * 2004-12-02 2006-06-22 Fuji Photo Film Co Ltd 色変換装置および色変換プログラム
JP2015018312A (ja) * 2013-07-09 2015-01-29 Necプラットフォームズ株式会社 パターン認識及びその学習方法
JP2016057918A (ja) * 2014-09-10 2016-04-21 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
WO2018083668A1 (en) * 2016-11-04 2018-05-11 Deepmind Technologies Limited Scene understanding and generation using neural networks
WO2019004350A1 (ja) * 2017-06-29 2019-01-03 株式会社 Preferred Networks データ識別器訓練方法、データ識別器訓練装置、プログラム及び訓練方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006163503A (ja) * 2004-12-02 2006-06-22 Fuji Photo Film Co Ltd 色変換装置および色変換プログラム
JP2015018312A (ja) * 2013-07-09 2015-01-29 Necプラットフォームズ株式会社 パターン認識及びその学習方法
JP2016057918A (ja) * 2014-09-10 2016-04-21 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
WO2018083668A1 (en) * 2016-11-04 2018-05-11 Deepmind Technologies Limited Scene understanding and generation using neural networks
WO2019004350A1 (ja) * 2017-06-29 2019-01-03 株式会社 Preferred Networks データ識別器訓練方法、データ識別器訓練装置、プログラム及び訓練方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220060722A (ko) * 2020-11-05 2022-05-12 조창환 이미지 데이터 라벨링 학습 방법 및 그 장치
KR102537943B1 (ko) 2020-11-05 2023-05-30 조창환 이미지 데이터 라벨링 학습 방법 및 그 장치
WO2022190801A1 (ja) 2021-03-10 2022-09-15 ソニーセミコンダクタソリューションズ株式会社 情報処理装置、情報処理システム、情報処理方法及び記録媒体
CN113516185A (zh) * 2021-07-09 2021-10-19 北京百度网讯科技有限公司 模型训练的方法、装置、电子设备及存储介质
CN113516185B (zh) * 2021-07-09 2023-10-31 北京百度网讯科技有限公司 模型训练的方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
JP7198432B2 (ja) 2023-01-04

Similar Documents

Publication Publication Date Title
JP7198432B2 (ja) 画像処理装置、画像読取装置、画像形成装置、画像処理方法及び画像処理プログラム
JP4979357B2 (ja) 画像形成装置及びその制御方法
US8830526B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
US8520005B2 (en) Image processing system, image formation apparatus, computer readable medium and computer data signal
KR101810285B1 (ko) 화상 처리 장치, 화상 처리 방법 및 컴퓨터 프로그램
US7782484B2 (en) Image processing apparatus, image processing method, and recording medium storing program product for causing computer to function as image processing apparatus
JP4748800B2 (ja) 画像処理装置
US8824016B2 (en) Image processing device capable of suppressing deformation of printing medium
US11375081B2 (en) Apparatus, method, and storage medium for converting a color image to a monochrome image
JP2008147748A (ja) 画像処理装置および画像処理方法
US20230062113A1 (en) Information processing apparatus, information processing method and non-transitory storage medium
CN107920184B (zh) 图像处理装置以及图像处理方法
JP2007043394A (ja) 画像処理装置、画像処理方法、およびその方法をコンピュータに実行させるプログラム
US20220182497A1 (en) Image processing system, image processing apparatus, control method
US20220180114A1 (en) Image processing apparatus capable of restoring degraded image with high accuracy, image processing method, and storage medium
JP3778904B2 (ja) カラー画像処理装置
JP2003338930A (ja) 画像処理方法、画像処理装置、並びに画像形成装置
JP2010268359A (ja) 画像処理装置及び画像処理プログラム
US10026152B2 (en) Image processing apparatus for providing visibility of an image while maintaining color in a natural state
US8873109B2 (en) Printing apparatus and method for combining a document image with a copy-forgery-inhibited pattern image
JP2005059444A (ja) カラー画像形成装置
US11003114B2 (en) Image processing apparatus that controls fixing temperature based on the similarity of image data of the current page and the next page, image processing method, and recording medium
JP2010062837A (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2006279830A (ja) 画像処理装置及び画像形成装置
JPH10285412A (ja) 画像処理装置およびその方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221201

R150 Certificate of patent or registration of utility model

Ref document number: 7198432

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150