JP2020140563A - 画像処理システム、画像処理方法、および画像処理装置 - Google Patents

画像処理システム、画像処理方法、および画像処理装置 Download PDF

Info

Publication number
JP2020140563A
JP2020140563A JP2019036854A JP2019036854A JP2020140563A JP 2020140563 A JP2020140563 A JP 2020140563A JP 2019036854 A JP2019036854 A JP 2019036854A JP 2019036854 A JP2019036854 A JP 2019036854A JP 2020140563 A JP2020140563 A JP 2020140563A
Authority
JP
Japan
Prior art keywords
image
image data
data
resolution
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019036854A
Other languages
English (en)
Inventor
健 阿知波
Takeshi Achinami
健 阿知波
亮 小坂
Ryo Kosaka
亮 小坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019036854A priority Critical patent/JP2020140563A/ja
Priority to US16/793,860 priority patent/US11272074B2/en
Publication of JP2020140563A publication Critical patent/JP2020140563A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00482Output means outputting a plurality of job set-up options, e.g. number of copies, paper size or resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40068Modification of image resolution, i.e. determining the values of picture elements at new relative positions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • H04N1/4092Edge or detail enhancement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/401Compensating positionally unequal response of the pick-up or reproducing head

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Facsimiles In General (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】 ニューラルネットワークを用いて、低画質の画像データを高画質化できる画像処理システムを提供する。【解決手段】 画像処理システム(100)は、FAXデータを受信して(S501)、その受信解像度を取得し(S502)と、出力解像度を取得し(S508)、受信解像度と出力解像度によって決定されたニューラルネットワークを用いて画像を出力する(S510)。【選択図】 図1

Description

本発明は、ニューラルネットワークを用いて低解像度の画像データを高解像度の画像データに変換して出力する画像処理システム、画像処理方法および画像処理装置関する。この画像処理装置は、例えば、ファクシミリ装置や、ファクシミリ機能を備える複写機複合機として用いられる。
従来、FAX送信等の画像送信機能を持つ画像処理装置(MFP等)は、スキャンした画像データをネットワーク経由で送信する際に、通信コスト(通信時間、通信帯域)を抑えるべく、通信データ量の削減を行ってきた。この通信データ量は、例えば、画像データを低解像度化したり、画像データを多値データから2値データへの変換することで削減することができる。また、一方で、低画質な状態で送信されてきた画像データを、高画質化してから出力する技術が提案されている。特許文献1では、低解像度パッチと高解像度パッチのペアを辞書として用意し、低解像度の画像データの所定の参照領域に類似した低解像度パッチを探索し、対応する高解像度パッチを合成することで、高解像度化を実現する技術を開示している。
特開2016−127475号公報
特許文献1は、低解像度パッチと高解像度パッチの組をあらかじめ保持しておくことが前提となっている。そのため、予期しない構成の画像、すなわち、パッチが用意されていない画像については高画質化することが困難であった。そこで、高画質化する画像変換を学習したニューラルネットワークを用いることで、種々の画像に対して汎用的に高画質化処理を適用出来る画像処理システムが望まれる。
上述した課題を鑑み、本発明は、ニューラルネットワークを用いて、低画質の画像データを高画質化できる画像処理システムの提供を目的とする。特に、複数のニューラルネットワークを使い分けることで精度のよい画像変換結果を取得可能な画像処理システムの提供を目的とする。
本発明は、画像処理システムにおいて、画像データを受信する手段と、受信した画像データの解像度に関する第1の情報を取得する手段と、前記受信した画像データに基づく出力の解像度に関する第2の情報を取得する手段と、同一の元データに基づき生成された画像データ対であって解像度の異なる画像データ対に基づき学習した複数のニューラルネットワークのなかから、前記第1の情報をおよび前記第2の情報に基づいて一つのニューラルネットワークを決定し、前記決定されたニューラルネットワークと前記受信した画像データに少なくとも基づいて変換後画像データを取得する手段と、前記変換後画像データに基づく出力をおこなう手段と、を有することを特徴とする。
本発明によれば、ニューラルネットワークを用いて、低画質の画像データを高画質化できる画像処理システムの提供できる。特に、複数のニューラルネットワークを使い分けることで精度のよい画像変換結果を取得可能な画像処理システムの提供できる。
画像処理システム構成図である。 図2(a)は画像処理装置の構成を示す図である。図2(b)は学習装置の構成を示す図である。図2(c)は画像処理サーバの構成を示す図である。 学習データの成り立ちを示す図である。 画像処理システムの利用シーケンスを示す図である。 画像出力制御を説明するフローチャートである。 学習モデル更新を説明するフローチャートである。 画像変換処理を説明するフローチャートである。 図8(a)はFAXデータの受信機能の画面を示す図である。図8(b)はFAXデータの受信トレイ画面を示す図である。 第2の実施形態の画像処理システム構成図である。 第2の実施形態の画像処理システムの学習シーケンスを示す図である。 第2の実施形態の学習データ生成を説明するフローチャートである。 第2の実施形態の画像出力制御を説明するフローチャートである。 図13(a)〜(e)は学習に用いる正解画像と入力画像の具体例である。 図14(a)〜(f)は入力画像の画像劣化の説明するための図である。 図15(a)は第2の実施形態の入力画像を生成するフローチャートである。図15(b)〜(g)は画像変換の様子を説明するための図である。 図16(a)は第3の実施形態の入力画像を生成するフローチャートである。図16(b)〜(j)は画像変換の様子を説明するための図である。 図17(a)は第1の実施形態における解像度と学習モデルの関係を示す図である。図17(b)は変形例における解像度と学習モデルの関係を示す図である。図17(c)は第3の実施形態における解像度と学習モデルの関係を示す図である。 第4の実施形態の画像出力制御を説明するフローチャートである。 第4の実施形態の画像出力制御を説明するフローチャートである。 図20(a)はAI補正利用の設定画面を示す図である。図20(b)は自動学習の設定画面を示す図である。 図21(a)は補正の傾向の設定画面を示す図である。図21(b)は先行画像変化の設定画面を示す図である。
以下、本発明を実施するための形態について図面を用いて説明する。ただし、説明に記載された構成要素は例示であって、本発明の範囲を限定する趣旨のものではない。本発明の目的を達成できる範囲において、構成要素の置換・追加・削除をおこなってもよい。
[第1の実施形態]
<画像処理システム>
本実施形態では、予め学習が済ませたニューラルネットワークを用いて、低解像度のFAX画像を高解像度の画像に変換して出力する形態について説明する。
図1は、画像処理システムの構成を示した図である。図1に示すように、画像処理システム100は、画像処理装置101、学習装置102、画像処理サーバ103で構成され、ネットワーク104を介して互いに接続されている。なお、画像処理装置101、学習装置102、画像処理サーバ103のそれぞれは、ネットワーク104に対して単一接続ではなく複数接続された構成であっても良い。図1では、画像処理装置101として、画像処理装置A101a、画像処理装置B101bの2台がネットワーク104に接続された構成例を示している。画像処理装置A101aと画像処理装置B101bはネットワーク104を介して互いに通信可能であり、例えば、画像処理装置A101aから送信されたFAXデータを画像処理装置B101bで受信する。画像処理装置B101bは受信したFAXデータに基づく出力(印刷・送信)をおこなう。なお、以降の説明では、説明を単純にするために、送信側の説明をする際は、画像処理装置A101aと表記し、受信側の説明をする際は、画像処理装置B101bと表記し、送受信側の両方に共通する説明をする際は、画像処理装置101と表記するものとする。また、画像処理装置A101aと画像処理装置B101bはネットワーク104とは別のFAX回線を用いて通信してもよい。
画像処理装置101は、コピー、プリント、スキャン、FAX等の複数の機能を実現可能なMFP等で実現されるものであって、画像取得部111(111a,111b)として機能する。画像処理装置A101aは、文字画像が含まれる原稿をスキャンして取得したスキャン画像に対して、画像処理を行ってFAXデータを生成し、ネットワーク104を介して画像処理装置101bに送信する。画像処理装置B101bは、画像処理装置A101aから受信したFAXデータに対して、画像処理を行ってFAXデータに基づく変換前画像を生成し、ネットワーク104を介して画像処理サーバ103に送信する。
学習装置102は、画像変換モデルの学習を行い、学習結果(ニューラルネットワークのパラメータなど)を生成する学習部112として機能する。学習装置102は、例えば、エンジニアによって提供された入力画像と正解画像のペアである学習データ(教師データ、画像データ対)を用いて、学習を行うことで学習結果を生成する。学習装置102は、生成した学習結果を、ネットワーク104を介して画像処理サーバ103に送信する。
画像処理サーバ103は、画像処理装置101が取得した変換前画像に対して、画像変換を行う画像変換部113.として機能する。画像処理サーバ103は、変換前画像に対して、学習装置102が生成した学習結果を用いて、ニューラルネットワークによる変換を行い、変換後画像を取得する。ニューラルネットワークを用いる機械学習手法の一つとしては、多層ニューラルネットワークを用いるディープラーニングが挙げられる。そして、画像処理サーバ103は、変換によって取得した変換後画像を、再び画像処理装置101に送信する。画像処理装置101は、画像処理サーバ103から受信した変換後画像を用いて、印刷出力、ユーザ所望の送信先への送信、画像処理装置101内の記憶部への保存を行う。
ネットワーク104は、LANや公衆回線(WAN)等で実現されるものであって、画像処理装置101、学習装置102、画像処理サーバ103の間を互いに接続して、装置間でデータを送受信するための通信部である。
<装置構成>
前述した画像処理システムを実現するために、画像処理装置101、学習装置102、画像処理サーバ103は、以下に示す構成を備える。図2(a)は、画像処理装置101の構成を示す図である。図2(b)は、学習装置102の構成を示す図である。図2(c)は、画像処理サーバ103の構成を示す図である。
図2(a)に示すように画像処理装置101は、次を備える。CPU201、ROM202、RAM204、プリンタデバイス205、スキャナデバイス206、原稿搬送デバイス207、ストレージ208、入力デバイス209、表示デバイス210、及び外部インタフェース211を備える。各デバイスは、データバス203によって相互通信可能に接続されている。
CPU201は、画像処理装置101を統括的に制御するためのコントローラである。CPU201は、ROM202に格納されているブートプログラムによりOS(オペレーティングシステム)を起動する。このOS上で、ストレージ208に記憶されているコントローラプログラムが実行される。コントローラプログラムは、画像処理装置101を制御するためのプログラムである。CPU201は、データバス203によって接続されている各デバイスを統括的に制御する。RAM204は、CPU201の主メモリやワークエリア等の一時記憶領域として動作する。
プリンタデバイス205は、画像データを用紙(記録材、シート)上に印刷するデバイス(印刷デバイス、画像形成部、画像形成デバイス)ある。これには感光体ドラムや感光体ベルトなどを用いた電子写真印刷方式や、微小ノズルアレイからインクを吐出して用紙上に直接画像を印字するインクジェット方式などがあるが、どの方式でもかまわない。スキャナデバイス206は、CCDなどの光学読取装置を用いて紙などの原稿上の走査を行い、電気信号データを得てこれを変換し、スキャン画像データを生成するデバイス(画像読取デバイス)である。また、ADF(オート・ドキュメント・フィーダ)などの原稿搬送デバイス207は、原稿搬送デバイス207上の原稿台に載置された原稿を1枚ずつスキャナデバイス206に搬送する。
スキャナデバイス206は、原稿搬送デバイス207が搬送してきた原稿を読み取る機能の他に、画像処理装置101が持つ原稿台(不図示)上に載置された原稿を読み取る機能を備えていてもよい。
ストレージ208は、HDDなどの、読み出しと書き込みが可能な不揮発メモリであり、ここには、前述のコントローラプログラムなど、様々なデータが記録される。
入力デバイス209は、タッチパネルやハードキーなどから構成さるデバイス(入力装置)である。入力デバイス209は、ユーザの操作指示を受け付ける受付部である。そして、指示位置を含む指示情報をCPU201に伝達する。表示デバイス210は、LCDやCRTなどの表示装置である。
表示デバイス210は、CPU201が生成した表示データを表示する。CPU201は、入力デバイス209より受信した指示情報と、表示デバイス210に表示させている表示データとから、いずれの操作が成されたかを判定する。そしてこの判定結果に応じて、画像処理装置101を制御するとともに、新たな表示データを生成し表示デバイス210に表示させる。
外部インタフェース211は、LANや電話回線、赤外線といった近接無線などのネットワークを介して、外部機器と、画像データをはじめとする各種データの送受信を行う。外部インタフェース211は、学習装置102やPC(不図示)などの外部機器より、PDLデータ(ページ記述言語で描画内容を記述したデータ、PDL形式のデータ)を受信する。CPU201は、外部インタフェース211が受信したPDLデータを解釈し、画像を生成する。生成した画像は、プリンタデバイス205により印刷したり、ストレージ208に記憶したりする。また、外部インタフェース211は、画像処理サーバ103などの外部機器より画像データを受信する。受信した画像データは、プリンタデバイス205によって印刷されたり、ストレージ208に記憶されたり、外部インタフェース211により、他の外部機器に送信されたりする。
図2(b)の学習装置102は、CPU231、ROM232、RAM234、ストレージ235、入力デバイス236、表示デバイス237、外部インタフェース238、GPU239を備える。各部は、データバス233を介して相互にデータを送受信することができる。
CPU231は、学習装置102の全体を制御するためのコントローラである。CPU231は、不揮発メモリであるROM232に格納されているブートプログラムによりOSを起動する。このOSの上で、ストレージ235に記憶されている学習データ生成プログラムおよび学習プログラムを実行する。CPU231が学習データ生成プログラムを実行することより、学習データを生成する。また、CPU231が学習プログラムを実行することにより、画像変換を行うニューラルネットワークを学習する。CPU231は、データバス233などのバスを介して各部を制御する。
RAM234は、CPU231のメインメモリやワークエリア等の一時記憶領域として動作するものである。ストレージ235は、読み出しと書き込みが可能な不揮発メモリであり、前述の学習プログラムを記録する。
入力デバイス236は、マウスやキーボードなどから構成さる入力装置である。表示デバイス237は、図2(a)を用いて説明した表示デバイス210と同様である。
外部インタフェース238は、図2(a)を用いて説明した外部インタフェース211と同様である。
GPU239は、画像処理プロセッサであり、CPU231と協調してニューラルネットワークの学習を行う。
図2(c)の画像処理サーバ103は、CPU261、ROM262、RAM264、ストレージ265、入力デバイス266、表示デバイス267、外部インタフェース268を備える。各部は、データバス263を介して相互にデータを送受信することができる。
CPU261は、画像処理サーバ103の全体を制御するためのコントローラである。CPU261は、不揮発メモリであるROM262に格納されているブートプログラムによりOSを起動する。CPU261は、データバス263などのバスを介して各部を制御する。
RAM264は、CPU261のメインメモリやワークエリア等の一時記憶領域として動作するものである。ストレージ265は、読み出しと書き込みが可能な不揮発メモリであり、前述の画像処理サーバプログラムを記録する。
入力デバイス266は、図2(b)を用いて説明した入力デバイス236と同様である。表示デバイス267は、図2(a)を用いて説明した表示デバイス210と同様である。
外部インタフェース268は、図2(a)を用いて説明した外部インタフェース211と同様である。
<利用シーケンス>
図4は、画像処理システムの利用シーケンスを示す図である。ここでは、ユーザが画像処理装置B101bを用いて、受信したFAXデータに対して出力指示して印刷出力するケースについて説明する。本実施例では、FAXデータとして取得した低品位の変換前画像に対して画像変換を行うことで、高品位の変換後画像(変換後画像データ)を提供することができる。これにより、例えば、この高品位の変換後画像に対してOCRを実行することで、画像中に含まれるテキストを高精度に抽出することができる。
まず、画像処理システム100を提供するメーカのエンジニアは、学習装置102に画像変換AI用の学習を行わせるべく、学習データの入力を行う(S401)。学習装置102は、入力された学習データを用いて、ニューラルネットワークの学習処理を行う(S402)。学習装置102は、S402が終了すると、画像処理サーバ103に対して、学習結果を送信する(S403)。これらの工程は、以降に説明する工程よりも前に予め行われる工程である。
その後、画像処理装置A101aは、画像処理装置B101bに対して、FAXデータを送信する(S404)。画像処理装置B101bは、FAXデータを受信すると、受信したFAXデータに基づく受信画像情報を画像処理サーバ103に送信する(S405)。ユーザは、画像処理システム100の利用を開始すべく、画像処理装置B101bの入力デバイス109を用いて、受信したFAXデータに基づく受信画像の印刷出力を指示する(S406)。画像処理装置B101bは、ユーザから指示された出力画像情報を画像処理サーバ103に送信する(S407)。画像処理サーバ103は、S405とS407で受信した情報に基づいて、低品位の変換前画像を入力して高品位の変換後画像を出力する画像変換を行う(S408)。画像処理サーバ103は、S408で生成した高品位の変換後画像を画像処理装置B101bに対して送信する(S409)。画像処理装置B101bは、S409で受信した高品位の変換後画像を用いて、S406でユーザから指示された出力形態で印刷出力を行う(S411)。なお、ここでは、印刷出力を例に説明したが、出力形態は、ユーザ所望の送信先への送信、ストレージ(ネットワークストレージ)への保存であっても良い。
<学習データ>
S401においてエンジニアが学習装置102に入力した学習データについて説明する。学習データは、学習装置102が学習部でニューラルネットワークを学習するために用いるデータである。ニューラルネットワークを学習するためには、変換前のデータ(変換前画像)と変換後のデータ(変換後画像)の対が必要となる。本実施例では、FAX受信後の低品位の画像を変換前のデータ(変換前画像=入力画像)、FAX送信前の高品位の画像を変換後のデータ(変換後画像=正解画像)として用いる。
図3は、学習データの成り立ちを示す図である。図3に示すように、学習データ306は、正解画像と入力画像の対からなるデータである。正解画像305は、PDLデータ301(電子ドキュメント、元データ)をRIP(レンダリング)して直接的に取得される。入力画像304は、PDLデータ301を印刷することで得られる印刷原稿302をスキャンしてスキャン画像303にし、このスキャン画像303を変換したFAXデータに基づいて生成される。
ここでは、エンジニアの開発環境下にある印刷装置(不図示)で印刷原稿302が印刷される。次に、エンジニアの開発環境下にあるスキャナ(不図示)で印刷原稿302が読み取られる。そして、エンジニアの開発環境下にある情報処理装置(不図示)によりスキャン画像303に対してFAXデータに変換するための解像度変換や二値化などの画像処理が施される。これらの工程に用いる装置は、プリンタデバイス205、スキャナデバイス206と同機種であることが望ましい。
また、高品位の画像変換を行うには大量の学習データを用いてニューラルネットワークを学習する必要があるが、ここでは既に十分に学習されている前提で説明を行う。
<学習処理>
図6は、図4のS402における学習装置102による学習モデルの学習処理の流れを説明するためのフローチャートである。なお、図6で示す各ステップは、学習装+置102のROM232、RAM234、ストレージ235等に記憶され、学習装置102のCPU231及びGPU239によって実行される。
図6に示すように、CPU231は、GPU239を用いて、学習モデルとして用いられるニューラルネットワークを構成する重みパラメータの値を初期化する(S601)。すなわち、CPU231は、例えば、ニューラルネットワークを構成する重みパラメータをランダムな値に設定したり、前回学習済の値をロードして再設定したりする。次に、CPU231は、GPU239を用いて、図4のS401で入力された学習データのうち、解像度や階調の条件が合致する入力画像と正解画像のペアを学習データとして取得する(S602)。
次に、CPU231は、GPU239を用いて、S601で準備したニューラルネットワークに学習データ(入力画像と正解画像のペア)を入力し、入力画像と正解画像の間における画素値の誤差計算のための演算を実行する(S603)。次に、CPU231は、GPU239を用いて、学習モデルの重みパラメータの値を更新する演算を実行する(S604)。この処理は一般に誤差逆伝搬法(バックプロパゲーション)と呼ばれる。次に、CPU231は、GPU239を用いて、所定の学習データ数を用いて所定の学習回数だけ演算処理が終了したか否かを判断する(S605)。ここで、CPU231は、所定の学習データを用いた所定の学習回数が終了したならば(S605でYES)、S606に遷移し、終了していなければ、S602に遷移してS602〜S604の演算を繰り返す。次に、CPU231は、GPU239を用いて、学習済モデルのニューラルネットワークを構成する重みパラメータの値をストレージ235等の記憶部に保存する(S606)。S606で獲得した学習済モデルは、既知の低解像度画像を既知の高解像度画像に置きかえるのではなく、未知の画像も含めて低解像度画像を高解像度画像に変換できるような画像変換部として形成される。そのため、学習済モデルを用いることで、低解像度で送信された入力画像から元原稿の電子データ相当の高解像度画像を取得できる。例えば、学習済モデルは、スキャン時の読み取りノイズによって発生した画像中の孤立点を除去する画像変換機能を獲得する。また、例えば、学習済モデルは、低解像度化や二値化によって発生した画像中の描画オブジェクトにおけるエッジ部分のがたつきを抑制して平滑化する画像変換機能を獲得する。これらの画像変換機能は、S602〜S604を繰り返し実行して入力画像と正解画像の差分傾向を学習することで獲得される。次に、CPU231は、さきほど保存した学習モデルとは別の学習モデルについて更新を行うか否かを判断する(S607)。ここで、CPU231は、別の学習モデルを更新すると判断したならば(S607でYES)、S601に遷移してS601〜S606の処理を繰り返し、別の学習モデルを更新しないと判断したならば(S607でNO)、学習モデル更新の処理を終了する。
別の学習モデルとしては、正解画像の解像度と入力画像の解像度の組み合わせが異なる学習データを用いて学習する学習モデルが挙げられる。ところで、変換元のFAX画像の解像度としては、200×100dpi(ノーマル)、200×200dpi(ファイン)、200×400dpi(スーパー)、400×400dpi(ウルトラ)、が挙げられる。また、画像処理装置の出力解像度としては、1200×1200dpi、600×600dpi、400×400dpi、300×300dpi、200×200dpi、100×100dpiが挙げられる。これらの解像度の組み合わせを考慮すると、画像処理システム100は、24通りの画像変換に対応することが求められる。1通りの変換につき1つの学習モデルを用いる場合、24つの学習モデルA〜Xを用意することになる。S607では、必要な種類の学習モデルが更新されるまで、NOとなり、次の学習モデルの更新処理に進む。
なお、学習モデルの分別方法は解像度ではなく階調でおこなってもよい。例えば、異なる階調(16ビット階調=65536色、8ビット階調=256色、1ビット階調=2色)の条件下で生成した正解画像や入力画像をペアにして学習データを生成してもよい。
<操作画面>
図8は、図4のS406で、ユーザからの出力指示を受け付けるための入力デバイス209及び表示デバイス210を用いた画面表示例である。
図8(a)は、表示デバイス210において、画像処理装置B101bが備える。プリント、スキャン、FAX等の1つ以上の機能を組み合せて実現可能な機能メニューのうち、FAX受信等を行う受信トレイ801の機能メニューが選択された状態の画面表示例である。
図8(a)に示すように、受信トレイ801の機能メニューとして、例えば、システムボックス811があって、画像処理装置B101bを宛先としてメモリ受信したFAX画像データを印刷及び送信の出力指示を実行できる。あるいは、受信トレイ801の機能メニューとして、例えば、ファックスボックス812があって、画像処理装置B101bが所定の転送条件で受信したFAX画像データを印刷及び送信の出力指示を実行できる。なお、本体設定を変更することによって、FAX画像データを出力指示タイミングではなく、受信タイミングで出力(印刷・送信)することもできる。すなわち、本体設定が第1の設定であれば、FAXデータが内部ストレージに格納される。本体設定が第2の設定であればFAXデータが受信にともなって印刷される。本体設定が第3の設定であればFAXデータが受信にともなって、予め指定された宛先(Eメールアドレス、ネットワークストレージ、ドキュメント管理クラウドサービス)に送信される。
図8(b)は、表示デバイス210において、入力デバイス209で、図8(a)で示したシステムボックス811に対するユーザのタッチ操作を検知して、図8(a)から画面遷移した受信トレイ801のジョブ選択を行うための画面表示例である。
図8(b)に示すように、受信トレイ801のジョブ選択画面では、例えば、選択出力可能なジョブ一覧821に対して、出力設定ボタン822、ジョブ削除ボタン823、プリントボタン824、送信ボタン825の指示操作が可能な状態になっている。ここで、出力設定ボタン822に対するユーザのタッチ操作を検知すると、例えば、出力設定画面831が表示され、出力解像度(高画質化モード)を選択可能な状態になる。ここで、未選択のデフォルト状態では、例えば、プリントエンジン解像度(例:600×600dpi)が選択された状態にしても良いし、ユーザ固有のお気に入り設定を反映した状態にしても良い。例えば、ユーザが出力設定画面831内の出力解像度のいずれかを選択指示した上で、プリントボタン824による印刷指示、又は、送信ボタン825による送信指示を行う。すると、図4のS406で示すように、ユーザからの出力指示を受け付けたことになり、S407で出力画像情報を取得することができる。なお、詳細には、プリントボタン824が選択されると印刷設定を変更可能な印刷設定画面(不図示)が表示され、その画面において印刷実行ボタンが選択されると印刷が開始される。また、送信ボタン825が選択されると宛先を指定可能な指定画面(不図示)が表示され、その画面におい送信実行ボタンが選択されると送信が開始される。宛先としては、Eメールアドレスの他、FAX番号、ネットワークフォルダ、クラウドサービス等を指定することが出来る。
なお、図8は、解像度の選択例のみを示したが、他に、階調(例:1ビット階調、8ビット階調)やチャンネル数(例:K=1ch、RGB=3ch、CMYK=4ch)を選択可能な構成であっても良い。
<画像出力処理>
図5は、画像処理装置101による画像出力処理の流れを説明するためのフローチャートである。なお、図5で示す各ステップは、画像処理装置101のROM202、RAM204、ストレージ208等に記憶され、画像処理装置101のCPU201によって実行される。なお、フローチャートで示す各ステップの処理の一部は、画像処理サーバ103のROM232、RAM234、ストレージ235等に記憶され、CPU201の要求に基づいて画像処理サーバ103のCPU231によって実行される構成であっても良い。
図5に示すように、CPU201は、ネットワーク104を経由した外部インタフェース211で、FAXデータを受信したか否かを判断する(S501)。ここで、CPU201は、FAXデータを受信していれば(S501でYES)、S502に遷移し、受信していなければ(S501でNO)、S501に遷移してFAXデータを受信するまで待つ。次に、CPU201は、S501で受信したFAXデータに基づく受信画像情報を取得し、画像処理サーバ103に送信する(S502)。ここで、受信画像情報とは、例えば、受信画像が持つ解像度、階調(例:1ビット2値、8ビット256階調)、チャンネル数(例:モノクロ1ch、カラー3ch)等の属性情報を示したものである。特に、FAXデータにおいては、受信した低解像度の画像データに対して精度よく画像変換を行う必要があるため、FAXデータの制御情報に含まれる解像度情報(例:200×100dpi)を取得することが望ましい。
次に、CPU201は、FAXデータの受信時の応答設定を確認する(S503)。自動印刷設定あるいは自動転送設定であった場合(S503でYES)、CPU201は、S504へ処理を進める。S504では、自動印刷設定に紐付いた出力画像情報(例:600×600dpi=プリントエンジン解像度)、または、自動転送設定に紐付いた出力画像情報(例:300×300dpi=送信標準仕様)が読み出される。なお、これらの出力画像情報はユーザによって予め指定された指定値を保持し、これを読み出す形式の情報であってもよい。
自動印刷設定あるいは自動転送設定でなく、留め置き設定であった場合(S504でNO)、CPU201は、S505へ処理を進める。CPU201は、S505において、ストレージ208の記憶領域に、受信したFAXデータを格納する。次に、CPU201は、入力デバイス209を介してユーザによる出力指示を受信したか否かを判断する(S506)。ここで、CPU201は、出力指示を受信するまで(S506でNO)待機し、受信したならば(S506でYES)、S507に遷移する。S507において、CPU201は、S506の出力指示にともない指定された出力画像情報を取得する。
次に、CPU201は、S506で受信した出力指示、あるいは、出力指示された機能仕様に基づく属性情報を取得し、画像処理サーバ103に送信する(S508)。属性情報は、例えば、出力解像度、階調(例:1ビット階調、8ビット階調)、チャンネル数(例:モノクロ1ch、カラー3ch)等である。ここで、CPU201は、例えば、留め置きデータの出力指示がプリンタデバイス205を用いた印刷出力でありユーザによる指定が無ければ、デフォルトの設定値(600×600dpi)を取得する。留め置きデータの出力指示がプリンタデバイス205を用いた印刷出力であり、ユーザによる出力指示時に指定があれば指定された出力解像度(例:1200×1200dpi)を取得する。また、CPU201は、例えば、出力指示が外部インタフェース211を介した送信出力であり、ユーザによる指定がなければデフォルトの設定値(300×300dpi)を取得する。出力指示が外部インタフェース211を介した送信出力であり、ユーザによる出力指示時に指定があれば指定された出力解像度(例:600×600dpi)を取得する。このように、CPU201は、ユーザによって明示的な出力解像度の指定があれば、指定された出力解像度を取得し、ユーザによって明示的な指定が無ければ、予め定められた出力解像度を取得すれば良い。なお、ユーザによって指定された明示的な出力解像度は、出力指示する画像データの用途に応じて変更されうるものであってある。したがって、出力解像度をユーザが指定するのではなく、出力解像度を間接的に指定する項目の指定をユーザがおこなってもよい。例えば、画質優先(高品位、低速、ファイルサイズ大)と速度優先(低品位、高速、ファイルサイズ小)を含む複数のモードのなかから1つのモードを選択することで解像度を指定してもよい。次に、CPU201は、低解像度の画像データを高解像度の画像データに変換する画像変換を実行するように制御する(S509)。なお、S509の処理の流れは、図7のフローチャートを用いて別途詳細に説明する。最後に、CPU201は、S509で生成された変換後画像を用いて、S508で取得した出力形式に従って、印刷又は送信を実行する(S510)。
図7は、図4のS408および図5のS509における画像処理サーバ103による画像変換処理の流れを説明するためのフローチャートである。なお、図7で示す各ステップは、画像処理サーバ103のROM262、RAM264、ストレージ265等に記憶され、画像処理サーバ103のCPU261によって実行される。
図7に示すように、CPU261は、画像処理装置B101bから受信した低解像度の画像データ、及び、当該画像データの属性情報である解像度、階調、チャンネル数等を受信画像情報として取得する(S701)。次に、CPU261は、画像処理装置B101bから受信したユーザからの出力指示に含まれる出力解像度、階調、チャンネル数等を出力画像情報として取得する(S702)。なお、出力画像情報としては、出力解像度、階調、チャンネル数等の属性情報を直接的に示すものではなく、これらの属性情報を間接的に紐付いた機能情報(印刷機能・送信機能)であってもよい。次に、CPU201は、S701とS702で取得した受信画像情報と出力画像情報の解像度、階調、チャンネル数等の条件が合致した学習済モデルをストレージ265等の記憶部から取得する(S703)。なお、出力画像情報については、出力解像度、階調、チャンネル数等の属性情報ではなく、単純に、印刷や送信の機能情報に基づいて、条件が合致した学習済モデルを取得しても良い。ここで、入力解像度として200×100dpiの解像度情報、出力解像度として1200×1200dpiの解像度情報を取得した場合、図17(a)からわかるように学習済モデルDが採用される。
次に、CPU261は、S701で取得した画像データを入力画像として、S703で取得した学習済モデルに入力した際の出力画像を、学習済モデルを用いた画像変換結果として生成する(S704)。最後に、CPU201は、S704で生成した画像変換結果をストレージ265等の記憶部に一時保持すると共に、画像処理装置B101bに対してネットワーク104を介して画像変換結果を送信する(S705)。以上の図7で示した一連の処理によって、画像処理装置B101bは、低解像度の画像データから高解像度の画像データに画像変換した結果として、学習モデルを用いた画像変換結果を取得できる。
以上述べたように、第1の実施形態によれば、低解像度で受信した画像データを高解像度の画像データに変換して出力することができる。特に、画像出力時の出力解像度情報に基づいて利用する学習済みモデルを切り替えることで、用途にあった高品位の画像を出力することができる。また、画像入力時の入力解像度情報に基づいて利用する学習済みモデルを切り替えることで、解像度毎に微少に傾向の異なる画像劣化(孤立点、エッジ部分のがたつき)を精度よく補正することができる。また、学習モデルの決定要因となる出力解像度情報をユーザが指定することもできるためユーザビリティに優れる。一方で、学習モデルの決定要因となる出力解像度情報として予め指定された値を利用することで、自動印刷や自動転送といった機能にも応用することもできる。なお、学習モデルを用いた変化はユーザの意図せぬ変換結果をもたらす虞がある。そのため図20(a)において、AI補正利用の設定画面2001にONボタン・OFFボタンを設け、学習モデルを用いた画像変換が行われないように設定(OFF)に切り替えられることが望ましい。なお、AI補正利用の設定画面2001は、出力設定画面831の詳細画面ボタン832を選択し、詳細設定画面(不図示)から、AI補正利用の項目を選択することで呼び出すことができる。
[第2の実施形態]
第1の実施形態では、エンジニアが学習データを予め用意して画像処理装置に入力していた。これに対し、第2の実施形態では、画像処理装置が稼働中に受信したPDLジョブを用いて学習データを自動生成する。なお、上述した特徴部分およびその関連部分を除き、第2の実施形態の画像処理システムの構成は、第1の実施形態の画像処理システムと同様である。そのため同様の構成には同様の符号を付し、その詳細な説明を省略する。
<画像処理システム>
図9は、画像処理システムの構成を示した図である。図9に示すように、画像処理システム100は、画像処理装置101、学習装置102、画像処理サーバ103、端末装置105で構成され、ネットワーク104を介して互いに接続される。画像処理装置101、学習装置102、画像処理サーバ103、ネットワーク104については、図1を用いて説明した通りである。
端末装置105は、画像処理装置101に対して印刷ジョブを送信できるパーソナルコンピュータやタブレットなどである。端末装置105は、ユーザが、操作部(不図示)を介して印刷指示を実行すると、印刷ジョブ(PDLデータを含む)を画像処理装置101に送信する。画像処理装置101は、端末装置105からのジョブに従って印刷処理を行うと共に、学習装置102にPDLデータを送信する。学習装置102は、PDLデータ(元データ)から正解画像と入力画像を生成し、生成した画像のペアを学習データとして保持する。
本実施の形態において、学習装置102は、学習データ生成部122を備えている。学習データ生成部122は、取得したPDLデータに対するRIP(レンダリング)及びFAX画像処理シミュレーションによって、正解画像と入力画像のペアである学習データを疑似的に生成する。学習データ生成部122は、生成した学習データを、ストレージ235に保持する。学習データ生成部は、CPU231が学習データ生成プログラムをRAM234に展開して実行することによって実現される。学習部112は、ストレージ235に保持された学習データを用いて、ニューラルネットワークを学習する。学習部112は、CPU231が学習プログラムをRAM234に展開して実行することによって実現される。
<学習シーケンス>
学習シーケンスについて、図10を用いて説明する。図10は、第2の実施形態における画像処理システムの学習シーケンスを示す図である。
まず、ユーザは、画像処理装置B101bの操作部を介して、学習データ生成処理を実行するか否か(ON,OFF)の設定を「ON」に設定する(S1001)。なお、この設定は事前に画像処理装置B101bに初期値として登録しておくことも可能である。次に、ユーザは、端末装置105の操作部を用いて印刷指示を行うと(S1002)、端末装置105は、画像処理装置B101bに印刷ジョブ(PDLデータを含む)を送信する(S1003)。画像処理装置B101bは、端末装置105から印刷ジョブを受け取ると、学習装置102に対して学習データ生成指示および印刷ジョブに含まれるPDLデータを送信し(S1004)、印刷処理を実施する(S1009)。学習装置102は、PDLデータに対してRIP(レンダリング)を行い、正解画像としての第1の画像を生成する(S1005)。学習装置102は、PDLデータに対してFAX画像処理シミュレーションを行い、入力画像としての第2の画像を生成する(S1006)。そして、S1005とS1006で生成した入力画像と正解画像のペアを学習データとして、ストレージ235に保存する(S1007)。学習装置102は、学習データを用いて学習を行い、学習モデルを更新する(S1008)。更新された学習モデルは、学習が完了したタイミングまたは画像処理サーバ103から要求されたタイミングで画像処理サーバに送信される。なお、学習装置102での処理に並行して画像処理装置B101bでは、S1003で受信した印刷ジョブに基づく印刷処理が実行される(S1009)。
<学習データ生成処理>
図11は、学習データ生成処理のフローを示す図である。なお、図11で示す各ステップは、学習装置102のROM232、RAM234、ストレージ235等に記憶され、学習装置102のCPU231及びGPU239によって実行される。
図11に示すように、CPU231は、ネットワーク104を経由した外部インタフェース238で、画像処理装置B101bからPDLデータを受信したか否かを判断する(S1101)。ここで、CPU231は、PDLデータを受信していれば(S1101でYES)、S1102に遷移し、受信していなければ(S1101でNO)、S1101に遷移してPDLデータを受信するまで待つ。次に、CPU231は、PDLデータを解釈してディスプレイリストに変換し、ディスプレイリストをレンダリング(RIP)することでラスタ形式の画像データを生成する(S1102)。次に、CPU231は、S1102で生成したラスタ形式の画像データを元に、第1の画像を正解画像(例:1200×1200dpi、8ビット階調)として生成する(S1103)。次に、CPU231は、S1102で生成したラスタ形式の画像データを元に、第2の画像を入力画像(例:200×200dpi、1ビット階調)として生成する(S1104)。なお、S1104の処理の流れは、図15のフローチャートを用いて別途詳細に説明する。ここで、S1103及びS1104で生成する画像データは、例えば、同一の描画オブジェクトを含んだページ内の参照領域(主/副走査の位置座標)で、所定の矩形単位(例:512×512画素)毎に切り出した複数の画像データとして生成するものである。次に、CPU231は、S1102で生成した第1の画像を正解画像、第2の画像を入力画像とした、入力画像と正解画像のペアを学習データとしてストレージ235等の記憶部に保存する(S1105)。次に、CPU231は、別のモデル用の学習データを生成するか否かを判断する(S1106)。ここで、CPU231は、別の学習モデル用の学習データを続けて生成すると判断したならば(S1106でYES)、S1102に遷移してS1102〜S1105を繰り返す。別の学習モデル用の学習データをこれ以上生成しないと判断したならば(S1106でNO)、学習データ生成の処理を終了する。ここで、学習モデルA用の学習データは、図17(a)からわかるように、400×400dpiの入力画像と1200×1200dpiの正解画像のペアである。学習モデルG用の学習データは、図17(a)からわかるように、200×200dpiの入力画像と600×600dpiの正解画像のペアである。
なお、学習モデルの分別方法は解像度ではなく階調でおこなってもよい。そのため、異なる階調(16ビット階調=65536色、8ビット階調=256色、1ビット階調=2色)の画像データの組み合わせで学習データを生成し、これに基づく学習モデルを学習してもよい。
<画像出力処理>
図12は、画像処理装置101による画像出力処理の流れを説明するためのフローチャートである。なお、図12で示す各ステップは、画像処理装置101のROM202、RAM204、ストレージ208等に記憶され、画像処理装置101のCPU201によって実行される。なお、フローチャートで示す各ステップの処理の一部は、画像処理サーバ103のROM232、RAM234、ストレージ235等に記憶され、CPU201の要求に基づいて画像処理サーバ103のCPU231によって実行される構成であっても良い。
図12に示すように、CPU201は、画像処理装置101において、PDLジョブ又はFAXジョブを受信したか否かを判断する(S1201)。ここで、CPU201は、ユーザからのジョブを受信していれば(S1201でYES)、S1202に遷移し、ユーザからのジョブを受信していなければ(S1201でNO)、S1201に遷移してジョブを受信するまで待つ。次に、CPU201は、S1201で受信したジョブに含まれる文書データを元に、受信画像が持つ解像度、階調(例:1ビット2値、8ビット256階調)、チャンネル数(例:モノクロ1ch、カラー3ch)等の属性情報を取得する(S1202)。ここで、CPU201は、例えば、受信画像がPDLデータであれば、任意のラスタ形式の画像データを生成可能であるため、取り扱い可能な最大解像度(例:1200×1200dpi)を有するものとして解像度情報を取得する。また、CPU201は、例えば、受信画像がFAXデータであれば、受信した低解像度の画像データに対して画像処理を実行する必要があるため、FAXデータの制御情報に含まれる解像度情報(例:200×200dpi)を取得する。次に、CPU201は、入力デバイス209を介してユーザから出力指示を受信したか否かを判断する(S1203)。ここで、CPU201は、ユーザからの出力指示を受信していれば(S1203でYES)、S1204に遷移し、ユーザからの出力指示を受信していなければ(S1203でNO)、S1203に遷移して出力指示を受信するまで待つ。次に、CPU201は、S1203で受信した出力指示、あるいは、出力指示された機能仕様に基づく、出力解像度、階調(例:1ビット階調、8ビット階調)、チャンネル数(例:モノクロ1ch、カラー3ch)等の属性情報を取得する(S404)。ここで、CPU201は、例えば、出力指示がプリンタデバイス205を用いた印刷出力であれば、ユーザによって出力指示された出力解像度(例:1200×1200dpi)を取得する。あるいは、プリンタエンジン仕様の出力解像度(例:600×600dpi)を取得する。また、CPU201は、例えば、出力指示が外部インタフェース211を介した送信出力であれば、ユーザに出力指示された出力解像度(例:600×600dpi)、あるいは、送信ファイル標準仕様の出力解像度(例:300×300dpi)を取得する。ここで、CPU201は、ユーザによって明示的な出力解像度の指定があれば、この出力解像度を取得し、ユーザによって明示的な指定が無ければ、仕様として予め定めた出力解像度を取得すれば良い。なお、ユーザによって指定された明示的な出力解像度は、出力指示する画像データの用途に応じて変更されうるものである。したがって、画質優先(高品位、低速、ファイルサイズ大)と速度優先(低品位、高速、ファイルサイズ小)を選択することで解像度を間接的に指定しても良い。次に、CPU201は、S1201で受信したジョブに含まれる文書データが、PDLデータであるか、FAXデータであるかを判断する(S1205)。ここで、CPU201は、PDLデータを取得したならば(S1205でYES)、S1206に遷移し、FAXデータを取得したならば(S1205でNO)、S1210に遷移する。次に、CPU201は、PDL等のベクタ形式の画像データを解釈してディスプレイリストに変換し、ディスプレイリストをレンダリング(RIP)することでラスタ形式の画像データを生成する(S1206)。次に、CPU201は、PDLデータを用いて、本来のジョブ処理に加えて、学習モデルを学習させるための学習データを生成する(S1207)。この学習モデルは、低解像度の画像データを高解像度の画像データに変換する画像変換部として機能する。
なお、S1207の処理の流れは、図11のフローチャートを用いて説明した通りである。次に、CPU201は、S1207で生成した学習データを用いて、学習モデルを学習させるか否かを判断する(S1208)。ここで、CPU201は、学習させると判断したならば(S1208でYES)、S1209に遷移し、学習させないと判断したならば(S1208でNO)、S1211に遷移する。次に、CPU201は、S1207で生成した学習データを用いて、学習モデルを学習するための演算処理を実行するように制御する(S1209)。なお、S1209の処理の流れは、図6のフローチャートを用いて説明した通りである。一方で、CPU201は、FAXデータを取得したならば(S1205でNO)、学習モデルを用いた画像変換を実行するように制御する(S1210)。すなわち、低解像度の画像データを高解像度の画像データに変換する画像変換を実行するように制御する。なお、S1210の処理の流れは、図7のフローチャートを用いて説明した通りである。最後に、CPU201は、S1206又はS1210のいずれかで生成されたラスタ形式の画像データを用いて、S1204で出力指示された出力形式に従って、印刷又は送信を実行する(S1211)。すなわち、CPU201は、PDLジョブであれば、S1206のレンダリングによって生成したRIP後画像を出力し、FAXジョブであれば、S1210の画像変換によって生成した変換後画像を出力するように制御する。
<学習データ>
図14は、FAXデータにおける画質劣化の特徴を示す図である。図14(a)はFAX送信前の高品位の画像データ1401、図14(b)はFAX受信後の低品位の画像データ1402の一例である。以降では、印字の無い領域を背景領域、背景領域に対して印字された文字や罫線などの描画オブジェクトを前景オブジェクトと称して説明する。
図14(b)に示すように、高品位の画像データ1401を低解像度化(例:200×100dpi)する。これにより、画像位置1403に示すような前景オブジェクトのエッジ形状の段差(以下、ガタツキと呼ぶ)や、画像位置1404に示すような前景オブジェクトのつぶれ(以下、つぶれと呼ぶ)が生じる。さらに、高品位の画像データ1401には存在しなかったような、FAX特有の画像位置1405や画像位置1406に示す凸凹状のノイズや欠損(以下、総称して凸凹状ノイズと呼ぶ)が発生する。この凸凹状ノイズは2値化処理時に前景オブジェクトの周囲に発生した中間調画素が強調されることで形成される。なお、前景オブジェクト周囲に発生する中間調画素は、以下の要因が複合的に組み合わさって発生するものである。例えば、FAX送信に用いる原稿には、印字時のトナーの飛び散りやトナー載り量のムラが存在する。また、このような原稿をスキャンする際には、読み取り解像度によるエッジのぼけや、読み取りセンサのセンサ値のばらつきなどが要因として挙がられる。また、わずかな原稿の歪みによる読み取りセンサの焦点ボケ、照度光のばらつきによる画素値の変動、原稿自体の紙紋や下地色の読み取りなどが要因として挙げられる。さらには、解像度変換時などの画素値補間による要因などが挙げられる。図14(c)は高解像度画像における前景オブジェクトのエッジ部を拡大表記した図である。破線は600×600dpiの1画素であり、太線は200×200dpiの1画素を表している。図14(d)は、図14(c)を200×200dpi化した後の図である。一方、図14(e)は原稿をスキャンした場合の前景オブジェクトのエッジ部を拡大表記した例である。図14(e)に示すように、上述の要因により、前景オブジェクト境界部において画素値のばらつきが発生している。図14(f)は、図14(e)を200×200dpi化した後の図面である。画像位置1405の凸状ノイズは図14(d)に示す本来の前景オブジェクトのエッジを基準として外側に黒画素が形成されたものである。一方、画像位置1406の凹状ノイズは本来の前景オブジェクトのエッジを基準として内側に白画素が形成されたものであり、凹状ノイズが密集した部分が前景オブジェクトの欠損になる。
図13は、正解画像としての第1の画像、及び、入力画像としての第2の画像の具体例を示した画像サンプルである。図13(a)は、正解画像として1200×1200dpiの解像度で生成した画像である。図13(b)は、正解画像として600×600dpiの解像度で生成した画像である。図13(c)は、入力画像として、200×200dpiの解像度で生成した画像である。図13(d)は、入力画像として、200×100dpiの解像度で生成した画像である。図13(e)は、後述する処理S1501でノイズ付与を行わずに200×100dpiの解像度で生成した画像である。
図13(a)及び(b)に示すように、正解画像としての第1の画像は、解像度が高いほど、エッジ形状を滑らかに表現できるため、例えば、図13(b)よりも図13(a)を正解画像として学習した方が、より高品位の画像変換結果を得ることができる。また、図13(a)及び(b)に示すように、正解画像としての第1の画像は、例えば、エンジン解像度のように、ユーザによる画像出力時の出力解像度に対して必要十分な解像度を持たせることで、ユーザに対して高品位の出力画像を提供することができる。
図13(c)及び(d)に示すように、入力画像としての第2の画像は、解像度が低いほど、エッジ形状に生じる段差の数が増えるため、例えば、図13(c)と図13(d)を別々の入力画像として学習した方が、より高品位の画像変換結果を得ることができる。
例えば、入力画像として図13(c)、正解画像として図13(a)をペアにして学習データを生成し、当該学習データを用いて学習モデルを学習させる。この学習モデルは図17(a)における学習モデルCに対応する。また、これとは別のデータ形式として、例えば、入力画像として図13(d)、正解画像として図13(a)をペアにして学習データを生成し、当該学習データを用いて学習モデルを学習させる。この学習モデルは図17(a)における学習モデルDに対応する。
図13(c)は、例えば、200×200dpiで、縦横比が等しい解像度で表現された例であるのに対して、図13(d)は、例えば、200×100dpiで、縦横比が異なる解像度で表現された例である。ここにおいて、縦横比が異なる解像度で表現された図13(d)のような入力画像は、縦に細く伸びる特徴的な凸状ノイズを含む。例えば、このようなノイズを検出して除去するよう学習した学習モデルを用いて画像変換することで、効果的に高品位の画像変換結果を得ることができる。なお、図13(e)は、後述するノイズ付与処理を行わずに、低解像度化と2値化処理を行ったため、前述したようなFAX画像特有の凸凹状ノイズが発生していない。そのため、当該入力データを学習データとして学習させても精度の高い学習モデルを生成することは困難である。従って、図13(a)や図13(b)で例示した正解画像と、図13(c)や図13(d)で例示したFAX画像特有のノイズを含む入力画像をペアにして紐づけた学習データを生成することが望ましい。
<FAX画像処理シミュレーション>
図15は、高品位の正解画像を元に、FAX画像処理シミュレーション(低画質化処理)を行うことで、低品位のFAX受信画像を疑似的に生成する方法を説明する図である。図15(a)は、本発明における低品位のFAX画像を生成するフローチャートの一例であり、図15(b)〜(g)は、各処理ステップにおける生成画像の一例である。
CPU201は、図11のS1103で生成した正解画像(多値データ)に対して、前述の前景オブジェクト周囲に発生する中間調画素を再現するようなノイズ・ランダムノイズを付与する(S1501)。すなわち、図15(b)に示す高品位の画像データに対して図15(c)に示す全面ノイズ画像を付与することで、図15(d)に示すノイズ付与画像を生成する。ここでは、平均値μと標準偏差σ(例えば、μ=0、σ=75)によって定義される正規分布による符号付きノイズ(以下、ガウシアンノイズ)を生成し、高品位の画像データ中の画素値に符号付きノイズを加算することでノイズ画像を生成している。なお、生成するノイズの種類やその付与の仕方はこれに限るものではない。例えば標準偏差や平均値は別の値を用いてもよい。また、一様分布によるノイズを発生させてもよいし、発生したノイズ値で高品位の画像データ中の画素を置換しても構わない。
続いて、CPU201は、生成されたノイズ付与画像に対して縮小処理を行い、指定された解像度(例えば、200×100dpi)に変換する(S1502)。縮小処理の際の画素補間方法は任意の処理で構わないが、ここではバイキュービック法による補間処理を行うことで図15(e)に示す縮小画像を生成する。ここでは説明のため600×600dpiのサイズに単純拡大した画像を示している。
さらに、CPU201は、生成された縮小画像に対して2値化処理(二値化処理)を行う(S1503)。2値化処理時の閾値は所定値を使用しても構わないが、ここでは画像全体の画素値の分布から最適な閾値を求める判別分析法を用いることで、図15(f)に示す2値化画像(二値データ)を生成する。これにより、FAX画像特有の画質劣化である、前景オブジェクト(前景領域)のつぶれ1510やがたつき1511、凸凹状ノイズ1512が再現可能となる。なお、S1501で付与するノイズ値が大きい場合やS1503での2値化閾値が適切でない場合に、図15(g)に示すように2値化画像中にゴマ塩状ノイズ1513が発生することがある。そこで、これを除去するための孤立点除去の処理を行うことで、図15(f)のように補正することも可能である。
以上述べたように、本発明の第2の実施形態によれば、画像処理装置で受信したPDLジョブを元に、FAX画像処理シミュレーションを行って生成した学習データを生成することで、ユーザ固有のデータを用いて学習モデルを最適化するように更新できる。すなわち、ベクタ形式で受信したPDLデータのジョブ処理時に、FAX画像変換用の学習データ生成や学習モデル更新を実行しておくことで、低解像度のラスタ形式で受信したFAXデータのジョブ処理時に、学習済モデルを用いた画像変換を実現できる。これにより、ユーザ環境毎に異なるFAXデータに対しても、高品位な出力画像を生成できる。なお、図17(a)において、受信解像度と出力解像度の組み合わせごとに学習モデルを生成する例を説明したが、受信解像度と出力解像度の複数の組み合わせを1つの学習モデルで共有してもよい。例えば、図17(b)に示すように、受信解像度400×400に対し解像度を向上させる方向の出力解像度(1200x1200,600x600,400x400)は、共通の学習モデルAを用いてもよい。この際、学習モデルAは出力解像度を最高の解像度である1200x1200で学習していることが望ましい。そして、他の出力解像度が求められるケースでは、学習モデルAに基づき変換された1200x1200の画像に低解像度化処理を施す等して用いるとよい。同様に、他の受信解像度について解像度を向上させるケースについて共通の学習モデル(B、C,D)を用いてもよい。また、図17(b)に示すように、解像度を低下させる方向の変換をおこなう学習モデル(E,F、G、H)を作成してもよい。しかしながら、解像度を低下させる方向の変換は用途があまりないため、学習モデル(E,F、G、H)は作成しなくてもよい。そして、解像度を低下させる方向の指示がなされた場合、学習モデルを用いずに解像度変換をおこなって出力してもよい。なお、自動学習を行う場合、同じデータを基にしても過去の変換結果と未来の変換結果に差が出ることがある。したがって、こうした変換結果の差をこれ以上望まないユーザの要望に対応できることが望ましい。そこで、図20(b)示すように、自動学習の設定画面2002にONボタン・OFFボタンを設け、自動学習を行わない設定(OFF)に切り替えられることが望ましい。なお、自動学習の設定画面2002は、出力設定画面831の詳細画面ボタン832を選択し、詳細設定画面(不図示)から、自動学習の項目を選択することで呼び出すことができる。
[第3の実施形態]
第3の実施形態では、第2の実施形態で一様に付与していたガウシアンノイズを領域に応じて切り替えて付与するように制御する。
これは、FAX送受信を行う画像処理装置101のデバイス特性によって異なるFAX画像特有の凸凹状ノイズの現れ方を疑似再現するためである。例えば、凸状ノイズが多く前景オブジェクトが潰れやすくなっている原稿や、凹状ノイズが多く、前景オブジェクトが欠損しやすくなっている原稿などがある。これらの異なる特徴を持ったFAX画像を高画質化するためには、それぞれの特徴を再現した低画質画像データを含む学習データをもちいて学習モデルを学習することが望ましい。なお、上述した特徴部分およびその関連部分を除き、第3の実施形態の画像処理システムの構成は、第2の実施形態の画像処理システムと同様である。そのため同様の構成には同様の符号を付し、その詳細な説明を省略する。
<FAX画像処理シミュレーション>
図16は、第3の実施形態において、高品位の正解画像を元に、FAX画像処理シミュレーションを行うことで、低品位のFAX受信画像を疑似的に生成する方法を説明する図である。図16(a)は、本発明における低品位のFAX画像を生成するフローチャートの一例であり、図16(b)〜(j)は、各処理ステップにおける生成画像の一例である。なお、第2の実施形態と共通の処理に関しては説明を省略し、差分のみの説明を行う。
CPU201は、高品位の画像データに対して、ノイズ付与対象領域を検出する(S1601)。ここでは、図16(b)に示す高品位の画像データから、前景オブジェクトの周辺領域と内部領域をそれぞれ検出する。図16(d)に示す前景オブジェクトの周辺領域は、図16(c)に示すように前景オブジェクトである文字や罫線に当たる黒画素を所定幅だけ太らせる膨張処理を行い、図16(b)に示す膨張前の画像との差分を取ることで検出できる。一方、図16(h)に示す前景オブジェクトの周辺領域は、図16(g)に示すように、前景オブジェクトである文字や罫線に当たる黒画素を所定幅だけ細らせる収縮処理を行い、図16(b)に示す収縮前の画像との差分を取ることで検出できる。
次に、CPU201は、前景オブジェクト周辺および前景オブジェクト内部に対するノイズ付与画像を生成する(S1602)。すなわち、図15のS1501と同様の方法で生成した全面ノイズ画像とS1601で生成した周辺領域および内部領域との論理積を取ることで、前景オブジェクト周辺および前景オブジェクト内部に付与するガウシアンノイズを抽出する。そして、S1501と同様にしてノイズ付与画像を生成すればよい。なお、全面ノイズ画像は周辺領域と内部領域で独立して生成することができ、どちらか一方の領域のみにノイズ付与することも可能である。図16(e)および図16(i)は高品位の画像データの一部1611を拡大した図である。例えば、図16(e)に示すように、前景オブジェクトの周辺領域のみにノイズを付与することも、図16(i)に示すように、前景オブジェクトの内部領域のみにノイズを付与することも可能である。
CPU201は、第2の実施形態と同様にして、解像度変換処理(S1502)および2値化処理(S1503)を行うことで、低品位の画像データを生成する。図16(f)は、前景オブジェクト周辺領域にノイズを付与した図16(e)を処理した結果の例である。このように前景オブジェクトの周辺領域にノイズを付与することで、凸状のノイズが発生しやすくなるように制御することができる。一方、図16(j)は、前景オブジェクトの内部領域にノイズを付与した図16(i)を処理した結果の例である。このように、前景オブジェクトの内部領域にノイズを付与することで、凹状のノイズを発生しやすくなるように制御することができる。
そして、このように性質の異なるノイズ付与が施された画像を入力画像として用い、学習モデルを学習させることで、画像変換結果が異なる学習モデルを用意することができる。例えば、図17(C)に示すように、1200x1200(混合)の学習モデル(A、B,C,D)および、600x600(混合)の学習モデル(E、F,G,H)がある。これらの学習モデルは、凹状ノイズが付与された画像および凸状ノイズが付与された画像を入力画像とする学習データを用いて学習した学習モデルである。この学習モデルは、凹状ノイズと凸状ノイズをバランスよく除去することができる。
1200x1200(凹ノイズ)の学習モデル(I,J、K、L)および、600x600(凹ノイズ)の学習モデル(M、N、O、P)は、凹状ノイズが付与された画像を入力画像とする学習データを用いて学習した学習モデルである。この学習モデルは、凹状ノイズを効率的に除去することができる。そのため線を構成する画像がしっかりと埋められた変換画像を得ることが出来る。
1200x1200(凸ノイズ)の学習モデル(Q、R、S、T)および、600x600(凸ノイズ)の学習モデル(U,V,W、X)は凸状ノイズが付与された画像を入力画像とする学習データを用いて学習した学習モデルである。この学習モデルは、凸状ノイズを効率的に除去することができる。そのため線間の隙間がしっかりとあいた変換画像を得ることが出来る。
<設定画面>
上述したように、それぞれ異なる傾向を持つ学習モデルは、ユーザの指定で使い分けられることが望ましい。図21(a)は、補正傾向の設定画面2101を示す図ある。
補正傾向の設定画面2101は「線優先ボタン」「推奨ボタン」「線間優先ボタン」を備え、この中から1つのボタンを指定できる。「推奨ボタン」は学習モデル(A、B,C,D)および学習モデル(E、F,G,H)を利用するためのボタンである。「線優先ボタン」は、学習モデル(I,J、K、L)および学習モデル(M、N、O、P)を利用するためのボタンである。「線間優先ボタン」は学習モデル(Q、R、S、T)および(U,V,W、X)を利用するためのボタンである。なお、補正傾向の設定画面2101は、出力設定画面831の詳細画面ボタン832を選択し、詳細設定画面(不図示)から、補正傾向の項目を選択することで呼び出すことができる。
以上述べたように、第3の実施形態によれば、ガウシアンノイズを付与する領域を前景オブジェクトの周辺領域および内部領域で独立させる処理を施すことにより、FAX画像特有の画質劣化が再現された画像を生成することが可能となる。これにより、受信するFAX画像の画質劣化の仕方に応じて、凸状ノイズに強い学習モデルや、凹状ノイズに強い学習モデルなどの生成のすることが可能になる。
[第4の実施形態]
前述の実施形態は、受信画像に対する画像変換処理のタイミングを、ユーザによる出力指示後のタイミングにしていたのに対して、第4の実施形態は、受信画像に対する画像変換処理のタイミングを、ユーザによる出力指示前のタイミングにしたものである。なお、上述した特徴部分およびその関連部分を除き、第4の実施形態の画像処理システムの構成は、第1の実施形態の画像処理システムと同様である。そのため同様の構成には同様の符号を付し、その詳細な説明を省略する。
<画像出力処理>
図18は、第4の実施形態における画像処理装置101の画像出力処理の流れを説明するためのフローチャートである。なお、図19で示す各ステップは、画像処理装置101のROM202、RAM204、ストレージ208等に記憶され、画像処理装置101のCPU201によって実行される。なお、フローチャートで示す各ステップの処理の一部は、画像処理サーバ103のROM232、RAM234、ストレージ235等に記憶され、CPU201の要求に基づいて画像処理サーバ103のCPU231によって実行される構成であっても良い。なお、図18は、前述の実施形態における図5と共通する部分があるため、共通する部分の説明を省略し、差分の説明のみを行う。
図18のS1801及びS1802は、図5のS501及びS502と同様のため、説明を省略する。また、自動出力に関する処理(S503、S504)については、本実施の形態の特徴部分とは関係が少ないためその記載を省略する。本実施の形態では、ユーザによる出力指示前に画像変換をおこなう必要がある。ところが、この時点では、ユーザがどの様な出力解像度を指定するか不明である。そこで、CPU201は、予測の出力解像度を決定することで(S1803)、この予測の出力解像度をS702に用いて、図7で説明した画像変換処理を実行する(S1804)。なお、予測の出力解像度は、本体が製品出荷時に備える既定値、ユーザによって予め指定された設定値が挙げられる。また、予測の出力解像度は1つではなく複数であってもよい。例えば、図21(b)に示すように、ユーザは、先行画像変換機能(出力指示前に画像変換する機能)の設定画面2102を呼び出すことができる。先行画像変換機能の設定画面2102では、先行画像変換機能を利用するか否かをON・OFFボタンで切り替えることができる。また、この画面では先行画像変換機能を利用する設定(ON)の場合、予測の出力解像度を指定することができる。図21(b)は、予測の出力解像度として、1200x1200dpi,600x600dpi,300x300dpiが選択された様子を示している。なお、ここで、指定可能なすべての出力解像度を予測の出力解像度として設定してもよい。設定画面2102は、出力設定画面831の詳細画面ボタン832を選択し、詳細設定画面(不図示)から、先行画像変換の項目を選択することで呼び出すことができる。そして、予測の出力解像度が複数指定された場合、CPU201は、複数指定された予測の出力解像度に対応するすべての画像変換結果が得られるまでは他の形式でも変換すると決定し(S1805でYES)、繰り返し画像変換処理を実行する。すべての画像変換が完了すると(S1805でNO)、ユーザによる出力指示があるまで(S1806でYES)待機する(S1806でNO)。そして、CPU201は、出力指示内容に基づいて出力画像情報を取得し(S1807)、出力画像情報に対応する変換後画像(出力画像)を選択する(S1808)。そして、選択した画像の出力(印刷又は送信)を実行する(S1809)。
図19は、第4の実施形態における画像処理装置101の画像出力処理の流れを説明するためのフローチャートである。なお、図19で示す各ステップは、画像処理装置101のROM202、RAM204、ストレージ208等に記憶され、画像処理装置101のCPU201によって実行される。なお、フローチャートで示す各ステップの処理の一部は、画像処理サーバ103のROM232、RAM234、ストレージ235等に記憶され、CPU201の要求に基づいて画像処理サーバ103のCPU231によって実行される構成であっても良い。なお、図19は、前述の実施形態における図12と共通する部分があるため、共通する部分の説明を省略し、差分の説明のみを行う。
図19のS1901及びS1902は、図12のS1201及びS1202と同様のため、説明を省略する。また、図19のS1903〜S1907は、図12のS1205〜S1209と同様のため、説明を省略する。S1903において、PDLデータではないと判定すると(S1903でNO)、CPU201は、S1913へと処理を進める。
そこで、CPU201は、予測の出力解像度を決定することで(S1913)、この予測の出力解像度をS702に用いて、図7で説明した画像変換処理を実行する(S1908)。そして、予測の出力解像度が複数指定された場合、CPU201は、複数指定された予測の出力解像度に対応するすべての画像変換結果が得られるまでは他の形式でも変換すると決定し(S1909でYES)、繰り返し画像変換処理を実行する。すべての画像変換が完了すると(S1909でNO)、S1910に遷移する。図19のS1910及びS1911は、図12のS1203及びS1204と同様のため、説明を省略する。最後に、CPU201は、S1211と同様に、S1908で出力指示された出力形式に合致するラスタ形式の画像データを選択して、印刷又は送信を実行する(S1912)。すなわち、CPU201は、PDLジョブであれば、S1904のレンダリングによって生成したRIP後画像を出力する。CPU201は、FAXジョブであれば、S1908の画像変換によって生成した変換後画像のうち、出力指示された出力形式に合致する変換後画像を出力するように制御する。
以上に述べたように、本発明の第4の実施形態によれば、低解像度で受信した画像データに基づき画像変換結果を出力指示前に予め生成しておくことで、出力指示後の待ち時間を低減することができる。
<その他の実施形態>
本発明は、上述した実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。例えば、第2の実施形態では、学習データ生成部122と学習部112は、学習装置102において実現されるものとしたが、それぞれ別体の装置において実現されるようにしても良い。この場合、学習データ生成部122を実現する装置は、学習データ生成部122が生成した学習データを、学習部112を実現する装置に送信する。そして、学習部112は受信した学習データをもとにニューラルネットワークを学習する。また、画像処理装置101と画像処理サーバ103とを別体の装置として説明したが、画像処理装置101と画像処理サーバ103を一体の装置にしてもよい。
本発明は上記した実施の形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施例の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。即ち、上述した各実施例及びその変形例を組み合わせた構成も全て本発明に含まれるものである。
なお、各実施例中に登場する略称の定義は次の通りである。
ADFとはAuto Documennt Feederのことである。
AIとはArtificial Intelligenceのことである。
ASICとは、Application Specific Integrated Circuitのことである。
CCDとは、Charge−Coupled Deviceのことである。
CPUとは、Central Processing Unitのことである。
CRTとはCathode Ray Tubeのことである。
DPIとは、Dots per inchのことである。
FAXとは、facsimileのことである。
GPUとは、Graphics Processing Unitのことである。
HDDとはHard Disk Driveのことである。
SSDとはSolid State Driveのことである。
LANとは、Local Area Networkのことである。
LCDとはLiquid Crystal Displayのことである。
MFPとは、Multi Function Peripheralのことである。
OSとは、Operating Systemのことである。
PCとは、Personal Computerのことである。
PDLとは、Page Description Languageのことである。
RAMとは、Random‐Access Memoryのことである。
RIPとは、Raster Image Processorのことである。
ROMとは、Read Only Memoryのことである。
WANとは、Wide Area Network のことである。
100 画像処理システム
101 画像処理装置
102 学習装置
103 画像処理サーバ
104 ネットワーク
105 端末装置

Claims (14)

  1. 画像処理システムであって、
    画像データを受信する手段と、
    受信した画像データの解像度に関する第1の情報を取得する手段と、
    前記受信した画像データに基づき出力する画像の解像度に関する第2の情報を取得する手段と、
    同一の元データに基づき生成された画像データ対であって解像度の異なる画像データ対に基づき学習した複数のニューラルネットワークのなかから、前記第1の情報をおよび前記第2の情報に基づいて一つのニューラルネットワークを決定し、前記決定されたニューラルネットワークと前記受信した画像データに少なくとも基づいて変換後画像データを取得する手段と、
    前記変換後画像データに基づく出力をおこなう手段と、を有することを特徴とする画像処理システム。
  2. 前記画像データ対は、第1の画像データと前記第1の画像データよりも解像度の高い第2の画像データの組み合わせであることを特徴とする請求項1に記載の画像処理システム。
  3. 前記第1の画像データは二値データであり、前記第2の画像データは多値データであることを特徴とする請求項1または2に記載の画像処理システム。
  4. 前記元データはPDLデータであることを特徴とする請求項1乃至3のいずれか1項に記載の画像処理システム。
  5. シートに画像を形成する画像形成部を備え、
    前記出力をおこなう手段は、前記変換後画像データに基づく画像形成を前記画像形成部に実行させる手段であって、
    前記第2の情報は、前記画像形成部に対応づけられた解像度に関する情報であることを特徴とする請求項1乃至4のいずれか1項に記載の画像処理システム。
  6. ユーザの操作を受け付け可能な受付部を備え、前記第2の情報は、前記受付部を介してユーザに指定された解像度に関する情報であることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理システム。
  7. 前記第1の画像データは、前記第2の画像データにノイズ付与処理を施した後、低画質化処理を施すことで生成される画像データであることを特徴とする請求項1乃至6のいずれか1項に記載の画像処理システム。
  8. 前記ノイズ付与処理は、画像全体へのランダムノイズの付与処理を含むことを特徴とする請求項7に記載の画像処理システム。
  9. 前記低画質化処理は、低解像度化処理と二値化処理を含むことを特徴とする請求項7に記載の画像処理システム。
  10. 前記ノイズ付与処理は、前景領域の周辺領域および前景領域の内部領域に対して、それぞれ独立したランダムノイズを付与する処理を含むことを特徴とする請求項7乃至9のいずれか1項に記載の画像処理システム。
  11. PDLデータの受信にしたがって前記PDLデータに基づく画像データ対を生成し、前記複数のニューラルネットワークのうちの少なくとも1つのニューラルネットワークに対し、前記画像データ対に基づく学習を行わせる手段を有することを特徴とする請求項1乃至10のいずれか1項に記載の画像処理システム。
  12. 画像処理装置であって、
    画像データを受信する手段と、
    受信した画像データの解像度に関する第1の情報を取得する手段と、
    前記受信した画像データに基づき出力する画像の解像度に関する第2の情報を取得する手段と、
    同一の元データに基づき生成された画像データ対であって解像度の異なる画像データ対に基づき学習した複数のニューラルネットワークのなかから、前記第1の情報をおよび前記第2の情報に基づいて一つのニューラルネットワークを決定し、前記決定されたニューラルネットワークと前記受信した画像データに少なくとも基づいて変換後画像データを取得する手段と、
    前記変換後画像データに基づく出力をおこなう手段と、を有することを特徴とする画像処理装置。
  13. 画像処理方法であって、
    画像データを受信する工程と、
    受信した画像データの解像度に関する第1の情報を取得する工程と、
    前記受信した画像データに基づき出力する画像の解像度に関する第2の情報を取得する工程と、
    同一の元データに基づき生成された画像データ対であって解像度の異なる画像データ対に基づき学習した複数のニューラルネットワークのなかから、前記第1の情報をおよび前記第2の情報に基づいて一つのニューラルネットワークを決定し、前記決定されたニューラルネットワークと前記受信した画像データに少なくとも基づいて変換後画像データを取得する工程と、
    前記変換後画像データに基づく出力をおこなう工程と、を有することを特徴とする画像処理方法。
  14. コンピュータに、
    画像データを受信する工程と、
    受信した画像データの解像度に関する第1の情報を取得する工程と、
    前記受信した画像データに基づき出力する画像の解像度に関する第2の情報を取得する工程と、
    同一の元データに基づき生成された画像データ対であって解像度の異なる画像データ対に基づき学習した複数のニューラルネットワークのなかから、前記第1の情報をおよび前記第2の情報に基づいて一つのニューラルネットワークを決定し、前記決定されたニューラルネットワークと前記受信した画像データに少なくとも基づいて変換後画像データを取得する工程と、
    前記変換後画像データに基づく出力をおこなう工程と、を実行させることを特徴とするプログラム。
JP2019036854A 2019-02-28 2019-02-28 画像処理システム、画像処理方法、および画像処理装置 Pending JP2020140563A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019036854A JP2020140563A (ja) 2019-02-28 2019-02-28 画像処理システム、画像処理方法、および画像処理装置
US16/793,860 US11272074B2 (en) 2019-02-28 2020-02-18 System, method, and storage medium for converting low-resolution image data into high-resolution image data using neural network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019036854A JP2020140563A (ja) 2019-02-28 2019-02-28 画像処理システム、画像処理方法、および画像処理装置

Publications (1)

Publication Number Publication Date
JP2020140563A true JP2020140563A (ja) 2020-09-03

Family

ID=72237243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019036854A Pending JP2020140563A (ja) 2019-02-28 2019-02-28 画像処理システム、画像処理方法、および画像処理装置

Country Status (2)

Country Link
US (1) US11272074B2 (ja)
JP (1) JP2020140563A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021075491A1 (ja) 2019-10-16 2021-04-22 国立大学法人九州大学 経皮吸収型貼付剤

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7036082B2 (ja) * 2019-04-04 2022-03-15 セイコーエプソン株式会社 画像処理装置、機械学習装置、画像処理方法
US11172085B2 (en) * 2020-03-06 2021-11-09 Xerox Corporation MFD workflow template with multiple resolutions
US11245801B2 (en) * 2020-03-31 2022-02-08 Kyocera Document Solutions Inc. Image forming apparatus and image forming method capable of changing guidance screen from terminal
JP2022100566A (ja) * 2020-12-24 2022-07-06 ブラザー工業株式会社 サポートプログラム
KR20220132301A (ko) * 2021-03-23 2022-09-30 삼성전자주식회사 신경망 처리 장치를 포함하는 애플리케이션 프로세서, 및 이의 동작 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100225112B1 (ko) * 1992-09-28 1999-10-15 기시모토 마사도시 도트 코드 및 정보를 기록/재생하기 위한 도트 코드 및 정보의 기록/재생 시스템(dot code and information recording/reproducing system for recording/reproducing the same)
JP3063957B2 (ja) * 1995-03-01 2000-07-12 富士ゼロックス株式会社 画像処理装置
US8781243B2 (en) * 2011-01-07 2014-07-15 Wisconsin Alumni Research Foundation Method for constrained reconstruction of high signal-to-noise ratio images
US10074158B2 (en) * 2014-07-08 2018-09-11 Qualcomm Incorporated Systems and methods for stereo depth estimation using global minimization and depth interpolation
JP2016127475A (ja) 2015-01-06 2016-07-11 株式会社リコー 画像処理システム、画像処理方法、及びプログラム
WO2017206048A1 (en) * 2016-05-31 2017-12-07 Shanghai United Imaging Healthcare Co., Ltd. System and method for removing gibbs artifact in medical imaging system
US10621697B2 (en) * 2018-08-06 2020-04-14 Apple Inc. Blended neural network for super-resolution image processing

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021075491A1 (ja) 2019-10-16 2021-04-22 国立大学法人九州大学 経皮吸収型貼付剤

Also Published As

Publication number Publication date
US20200280654A1 (en) 2020-09-03
US11272074B2 (en) 2022-03-08

Similar Documents

Publication Publication Date Title
JP2020140563A (ja) 画像処理システム、画像処理方法、および画像処理装置
KR101052749B1 (ko) 화상 형성 시스템
JP5525548B2 (ja) デジタル画像を処理するための画像処理システム及びデジタル画像を処理する画像処理方法
US20100103435A1 (en) Image processing apparatus and image processing method for processing screen-processed image
KR20190013657A (ko) 화상 처리 장치, 화상 처리 방법, 및 기억 매체
JP2020162025A (ja) 画像処理システム、画像処理方法、および画像処理装置
JP2017130751A (ja) 画像処理装置及び画像処理方法、プログラム
JP5031668B2 (ja) 印刷装置、その制御方法、プログラム
US8441690B2 (en) Image processing apparatus and image processing method for processing screen-processed image
JP2009212841A (ja) 画像処理システム、画像処理装置、および画像処理方法
EP2429173B1 (en) Image forming apparatus, printing control terminal apparatus, and image forming method thereof
JP2021093719A (ja) 画像処理装置、画像処理方法、およびプログラム
US7809199B2 (en) Image processing apparatus
JP2012103994A (ja) 画像形成システム
JP2008118447A (ja) 画像形成装置及び画像形成方法ならびにそのプログラム
JP7077451B2 (ja) 画像形成装置および画像形成装置の制御方法、ならびにプログラム
JPH08195878A (ja) 画像処理装置
JP2018182464A (ja) 画像処理装置及びプログラム
JP4424718B2 (ja) 画像出力装置及びその制御方法、並びに、コンピュータプログラム及び画像出力システム
JP2015181215A (ja) 装置、印刷装置、印刷の制御方法及びプログラム
JP2011229074A (ja) 画像処理装置、画像処理方法及び画像処理システム
JP6985943B2 (ja) 画像処理装置及びその制御方法とプログラム
US8289574B2 (en) Method and system for controlling darkening of image data
JP2023037968A (ja) 画像処理装置及びその制御方法とプログラム
JP5004735B2 (ja) 画像形成装置、画像形成装置の制御方法、および画像形成装置の制御プログラム