JP6379664B2 - 画像処理装置、画像処理方法、および画像処理プログラム - Google Patents

画像処理装置、画像処理方法、および画像処理プログラム Download PDF

Info

Publication number
JP6379664B2
JP6379664B2 JP2014103840A JP2014103840A JP6379664B2 JP 6379664 B2 JP6379664 B2 JP 6379664B2 JP 2014103840 A JP2014103840 A JP 2014103840A JP 2014103840 A JP2014103840 A JP 2014103840A JP 6379664 B2 JP6379664 B2 JP 6379664B2
Authority
JP
Japan
Prior art keywords
image processing
image
input image
attribute information
current input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014103840A
Other languages
English (en)
Other versions
JP2015219790A (ja
Inventor
鈴木 剛
鈴木  剛
ライフ マシアス
ライフ マシアス
シュルツ クリスチャン
シュルツ クリスチャン
マウス ハイコ
マウス ハイコ
ファン エルスト ルドガー
ファン エルスト ルドガー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2014103840A priority Critical patent/JP6379664B2/ja
Priority to US14/714,713 priority patent/US20150334255A1/en
Publication of JP2015219790A publication Critical patent/JP2015219790A/ja
Application granted granted Critical
Publication of JP6379664B2 publication Critical patent/JP6379664B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00148Storage
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00167Processing or editing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00185Image output
    • H04N1/00188Printing, e.g. prints or reprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Description

本発明は、画像処理装置、画像処理方法、および画像処理プログラムに関する。
今日において、パーソナルコンピュータ装置を用いて印刷物を作成するDTP(Desktop Publishing)が知られている。DTPにおいては、イラストおよびパーツなどを作成する線画作成ソフトウェア、写真などのパーツを加工する画像処理ソフトウェア、および紙面上における各パーツの配置を調整するレイアウトソフトウェアを用いて印刷物の作成を行う。具体的には、例えばIllustrator(登録商標)、Photoshop(登録商標)、InDesign(登録商標)などのソフトウェアが用いられ、印刷物が作成される。
特許文献1(特許第3998834号公報)には、入力された印刷方式データを用いてレイアウトデータメモリ領域からレイアウトデータを選択し、選択手段で選択されたレイアウトデータを用いて製版出力を得るデジタル製版システムが開示されている。
また、特許文献2(特開2009−134580号公報)には、文書画像のラスタデータ(論理構造などを持たない画像データ)と文書データとを組み合わせて保持し、入力された文書画像のラスタデータから関連する文書データを特定する文書データベースシステムが開示されている。
ここで、DTPにおける作業効率および作業結果の品質は、熟練者と初心者との間で大きな差が生じ易い。初心者でも熟練者と同等の作業効率および品質を可能とするために、過去のDTP処理手順を記録し、次回の作業時に再利用することが考えられる。このような画像処理システムを実現する場合、入力画像、入力画像に所望の画像処理を施して得た出力画像、および画像処理の履歴をそれぞれ関連付けて記憶部に記憶する。そして、記憶部に記憶された全ての画像処理のうち、利用頻度の高い画像処理を、次回の作業時に再利用する。
しかし、このような画像処理システムにおいて、利用頻度の高い画像処理を提示するだけでなく、入力画像に対して最適な画像処理手順を提示できれば、使い勝手の良いシステムとなる。また、入力画像に対する複数の画像処理手順を提示できれば、提示された各画像処理手順を操作者が比較して所望の画像処理手順を選択でき、さらに使い勝手の良いシステムとなる。
特許文献1に開示されているデジタル製版システムの場合、レイアウトには論理構造に関する情報が必要であり、紙面のデザインに対しては適用可能であるが、画像の内部の構造を利用して同様の作業を行うことは困難となる。
また、特許文献2に開示されている文書データベースシステムの場合、入力された画像データが本来持つべき論理構造を、予め保持されたラスタ画像と論理構造の対を見つけることにより取得する手段となり得る。しかし、画像中の領域に与えられた論理構造の要素が、その要素に施すべき画像処理の内容を決めるものではない。また、この要素に施す画像処理を特定するには、ラスタ画像と文書データの関連付けだけでは不十分となる。このため、特許文献2に開示されている文書データベースシステムは、入力画像に施す画像処理を特定困難となる。
本発明は、上述の課題に鑑みてなされたものであり、過去の画像処理手順を有効に利用して使い勝手の良い画像処理機能を提供可能な画像処理装置、画像処理方法、および画像処理プログラムの提供を目的とする。
上述した課題を解決し、目的を達成するために、本発明は、過去の入力画像である過去入力画像、過去入力画像の属性を示す第1属性情報、および処理手順情報を含む画像処理事例を記憶する記憶部と、新たに入力された入力画像である現在入力画像および現在入力画像の属性を示す第2属性情報に対して類似する過去入力画像および第1属性情報を含む画像処理事例を、画像特徴及び画像処理手順から抽出された特徴を含む特徴ベクトルを用いて、記憶部から検索する検索処理部と、検索された画像処理事例のうち、操作者により選択された画像処理事例に含まれる処理手順情報に従った画像処理を、現在入力画像に施して出力画像を生成する画像処理部とを有する。
本発明によれば、過去の画像処理手順を有効に利用して使い勝手の良い画像処理機能を提供できるという効果を奏する。
図1は、実施の形態の画像処理装置の概要を説明するための図である。 図2は、実施の形態の画像処理装置の概要を説明するための他の図である。 図3は、実施の形態の画像処理装置のハードウェア構成図である。 図4は、実施の形態の画像処理装置のソフトウェア構成図である。 図5は、実施の形態の画像処理装置のDTPアプリケーションにおける、操作者による画像処理と操作の手順(ログ)をログファイルに記録する動作の流れを示すフローチャートである。 図6は、DTP事例に対するアノテーションを入力するためのユーザインタフェースの一例を示す図である。 図7は、実施の形態の画像処理装置の画像解析処理の流れを示すフローチャートである。 図8は、コントラスト問題抽出処理における、学習段階の動作の流れを示すフローチャートである。 図9は、コントラスト問題抽出処理における、認識段階の動作の流れを示すフローチャートである。 図10は、DTP事例を特徴付ける特徴ベクトルの列構造を示す図である。 図11は、画像処理要素、画像処理要素に対して付された画像処理要素番号、および画像処理要素の正規化出現頻度の一例を示す図である。 図12は、操作者がDTP事例データを選択するためのユーザインタフェースの一例を示す図である。 図13は、入力画像、入力画像を用いて検索したDTP事例、および検索したDTP事例の画像処理手順で処理された出力画像を示す図である。
以下、図面を参照して、本発明を適用した実施の形態となる画像処理装置を詳細に説明する。
(概要)
実施の形態の画像処理装置は、操作者が利用する画像処理プログラムに従って動作し、操作者の画像処理手順の記録と、再利用を行う。画像処理手順は、画像依存性が強いため、現在の入力画像の種類、および補正の目的に応じて再利用するべき手順を持った画像処理事例(DTP事例)の検索方法を変える。これにより、画像および操作者の処理の目的に沿った画像処理手順の再利用が可能となる。
具体的には、実施の形態の画像処理装置は、例えば熟練のDTPオペレータが画像に対して施す画像処理を記録し、図1に示すように現在の入力画像である現在入力画像1、過去の入力画像である過去入力画像2〜4、および画像処理手順5〜7の3つを1つのまとまり(DTP事例8〜10)としてリポジトリ11に記憶する。現在入力画像1が新たに与えられたとき、現在入力画像1の画像情報、またはユーザが付与する付帯情報を用いてリポジトリ11を検索し、関連するDTP事例8〜10を検索してリストアップする。リストアップされたDTP事例8〜10にそれぞれ含まれる画像処理手順5〜7を、現在入力画像1に適用することで、処理結果画像12〜14を得る。DTPは、「Desktop Publishing」の略記である。
このように実施の形態の画像処理装置は、現在入力画像1に対して施す画像処理手順5〜7を含むDTP事例8〜10を検索する。一例であるが、検索手法としては、図2に示す「事例ベース推論手法(case based reasoning)」を用いている。この場合、実施の形態の画像処理装置は、図2に示す画像の類似性(local low level image features)15を用いたDTP事例8〜10の検索を行う。また、これに加え、図2に示す被写体などの情報である画像コンテンツ情報(Image content Semantics)16、および領域特徴(image region segmentation)17を用いたDTP事例8〜10の検索を行う。さらに、操作者の補正意図(Enhancement intention)18などを用いたDTP事例8〜10の検索を行う。これにより、実施の形態の画像処理装置は、DTP事例を高精度且つ拡張性高く検索可能となっている。
(ハードウェア構成)
図3に示すように、実施の形態の画像処理装置19は、一般的なパーソナルコンピュータ装置(PC)を用いることができる。図3に示すPCは、ネットワーク20を介して、例えばスキャナ機能を備えた画像取得装置21、プリンタ機能を備えた画像出力装置22、ハードディスクドライブ(HDD)、または半導体メモリなどの記憶装置23と接続される。また、PCは、内部のハードウェア構成として、情報処理を行うためのCPU24、情報処理の入出力情報、または途中情報などを保持するためのメモリ25、永続的記憶装置としての記憶部26、および他の機器との通信を行う通信インタフェース27(通信I/F)を備える。CPU24〜通信I/F27は、内部のバスライン28を介して相互に接続されている。
画像処理装置19が実行する画像処理プログラム(DTPアプリケーション)は、PC内部の記憶部26またはネットワーク上の記憶装置23に記録され、必要に応じて実行形式でメモリ25に展開される。次に、記憶装置23または画像取得装置21を駆動することで現在入力画像を取得し、画像情報をメモリ25に展開する。CPU24は、予め定められた手法で、メモリ25に展開された画像情報を操作し、操作結果をメモリ25に書き込む。最終的に制御点情報(後述するログ)を出力する場合には、内部の記憶部26または外部の記憶装置23に記憶させる。
なお、画像処理プログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)などのコンピュータ装置で読み取り可能な記録媒体に記録して提供してもよい。また、CD−R、DVD、ブルーレイディスク(登録商標)、半導体メモリなどのコンピュータ装置で読み取り可能な記録媒体に記録して提供してもよい。また、インターネットなどのネットワーク経由でインストールするかたちで提供してもよい。また、機器内のROM等に予め組み込んで提供してもよい。DVDは、「Digital Versatile Disk」の略記である。
(ソフトウェア構成)
図4に、CPU24により画像処理プログラムが実行されることで実現されるDTPアプリケーションの各機能の機能ブロック図を示す。図4に示すように、CPU24は、画像処理プログラムを実行することで、ユーザインタフェース31、処理制御部32、距離尺度計算部33、画像処理構成部34、およびシーン認識部35を実現する。また、CPU24は、画像処理プログラムを実行することで、画像特徴抽出部36、プリファレンス記録部37、画像処理記録部38、画像処理部41、および表示制御部42を実現する。
なお、図4に図示している記憶部26は、DTP事例を蓄積するDTP事例データベース、後述する過去のログを記憶したログデータベース(ログDB)、および複数の画像が記憶された画像コレクションデータベース(画像コレクションDB)となっている。この例では、記憶部26をDTP事例データベース、ログDB、および画像コレクションDBとしているが、ネットワーク20を介して接続された記憶装置23に各DBを記憶してもよい。また、この例では、ユーザインタフェース31〜表示制御部42は、CPU24が画像処理プログラムを実行することでソフトウェア的に実現されることとして説明を進めるが、一部または全部をハードウェアで実現してもよい。
ユーザインタフェース31は、ユーザとのインタラクションを仲介し、ユーザから各処理の制御のための情報を取得する。処理制御部32は、画像処理を行う画像、画像処理手順、および付帯情報などの記録を行う記録処理部39を備える。処理制御部32は、一連の画像処理の流れ、およびメモリ25上での画像処理を制御する。また、処理制御部32は、距離尺度計算部33で計算されたDTP事例間の類似度を示す距離尺度を用いて、現在入力画像に類似するDTP事例などを検索する検索処理部40を備える。画像処理部41は、操作者により選択されたDTP事例の画像処理手順に対応する画像処理を、現在入力画像に施すことで出力画像を生成する。表示制御部42は、検索されたDTP事例などを、表示部に表示されたユーザインタフェース31を介して操作者に提示する。
距離尺度計算部33は、DTP事例間の類似度を示す距離を計算する。画像処理構成部34は、画像処理手順情報を用いて、使用する画像処理を構成する。シーン認識部35としては、例えば非特許文献1(Reconfigurable Models for Scene Recognition, S. N. Pariziet.al. インターネットURL:http://ieeexplore.ieee.org/xpl/login.jsp?reload=true&tp=&arnumber=6248001&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D6248001)に示される方法などを用いることができる。
画像特徴抽出部36は、DTP事例検索のクエリ(命令または問い合わせ)の一部を構成する画像特徴を抽出する。画像特徴抽出部36は、予め定められたいくつかの画像特徴を、現在入力画像およびDTP事例に付随した過去入力画像から抽出する。一例ではあるが、画像特徴抽出部36としては、例えばカラーヒストグラム、コレログラム、またはSIFT(Scale Invariant Feature Transform)などを用いて画像特徴を抽出する。利用する画像特徴は、様々な特徴量と構成があり得るが、例えば複数の特徴の識別器(弱識別器)を組み合わせた識別器を対象の画像種類毎に構成し、前段のシーン認識部35のシーン認識結果に合わせて特徴量の組み合わせを選択することで、より高精度なモデルを構成できる。
プリファレンス記録部37は、ユーザの選択結果を記録する。画像処理記録部38は、操作者がDTPアプリケーションで行った処理を記録する。
(実施の形態の動作)
図5のフローチャートに、操作者により用いられた画像処理と操作手順をログファイルに記録するDTPアプリケーションの動作の流れを示す。操作者に用いられた画像処理および操作の手順を示す情報(ログ)は、操作者を特定するユーザIDに関連付けされ、タイムスタンプと共に、記憶部26のログファイルに記録される。
図5のフローチャートにおいて、操作者が所望の画像に対する画像処理操作を開始すると、CPU24は、ステップS1において、記憶部26に記憶されているDTPアプリケーションを読み出す(ロガー起動)。そして、CPU24は、読み出したDTPアプリケーションをメモリ25に展開する。DTPアプリケーションが展開されると、処理制御部32の記録処理部39が、ステップS2において、記憶部26に記憶されているログデータベース(ログDB)を参照し、処理ログを生成する。
次に、ステップS3では、記録処理部39が、操作者による画像入力操作で指定された現在入力画像を、記憶部26に記憶されている画像コレクションDBから取得して、処理をステップS4に進める。ステップS4では、処理制御部32の記録処理部39が、画像コレクションDBから取得した現在入力画像の画像情報を記憶部26のログファイルに記録する。
ステップS5では、図7〜図9のフローチャートを用いて後述する画像解析処理により、現在入力画像を特徴付ける画像プロパティベクトルが生成される。ステップS6では、記録処理部39が、生成された画像プロパティベクトルを記憶部26のログファイルに記録する(画像プロパティ記録処理)。
ステップS7では、記録処理部39が、操作者によるアノテーション入力操作に対応するアノテーションを、記憶部26のログファイルに記録する。アノテーションは、テキスト情報の一例となっている。図6は、DTPアプリケーションにおけるアノテーション付与のためのユーザインタフェース31の一例である。DTPアプリケーションにおいては、画像を表示するだけでなく、画像操作に関するオプションなどをボタンまたはウィンドウで表示する。図6の例の場合、アノテーションを入力するためのサブウィンドウ50をDTPアプリケーションのユーザインタフェース31上に配置し、アノテーションの入力領域53に対するアノテーションの入力を促す。例えば、現在入力画像および現在入力画像に施す画像処理についての説明などのアノテーションを、自然言語などを用いて入力可能となっている。また、現在入力画像の解析結果から、現在入力画像に関連する可能性の高いアノテーション項目を、タグレコメンデーション(タグ)領域54に一覧表示する。操作者は、一覧表示されたアノテーション項目の中から、所望のアノテーション項目を選択操作することで、選択したアノテーションに関連付けられて記憶されている画像処理手順を指定可能となっている。
記録処理部39は、サブウィンドウ50上の登録ボタン(Register THIS Case)52が、操作者により操作されると、アノテーションの入力領域53に入力されたアノテーション、または、操作者により選択されたアノテーション項目を、記録部26のログファイルに記録する。
次に、ステップS8では、記録処理部39が、操作者が用いた画像処理を示す画像処理情報を、記憶部26のログファイルに記録する。また、ステップS9では、記録処理部39が、操作者によるアプリケーション操作の操作手順を示す操作手順情報を、記憶部26のログファイルに記録する。記録処理部39は、ステップS10において、操作者による処理の終了操作を検出するまでの間、操作者により、画像処理操作またはアプリケーション操作が行われる毎に、ステップS8における画像処理情報の記録動作、またはステップS9におけるアプリケーション操作の操作手順情報の記録動作を繰り返し実行する。これにより、記憶部26のログファイルには、現在入力画像、画像プロパティベクトル、アノテーション、画像処理情報、および操作手順情報がそれぞれ関連付けされてDTP事例データとして記憶される。
CPU24は、ステップS10において、操作者による処理の終了操作を検出すると、図5のフローチャートの処理を終了する。
次に、図5のフローチャートのステップS5における画像解析処理の説明をする。図7が、画像解析処理のフローチャートである。画像解析処理は、図7のフローチャートに示すように、ステップS21におけるコントラスト問題抽出処理、ステップS22における色問題抽出処理、ステップS23におけるシャープネス問題抽出処理、およびステップS24における画像プロパティベクトル生成処理を含んでいる。
すなわち、画像解析処理は、コントラスト問題抽出処理、色問題抽出処理、およびシャープネス問題抽出処理の3つの処理の各出力を統合し、ステップS24で現在入力画像を特徴づける画像プロパティベクトルを生成する。生成された画像プロパティベクトルは、ステップS6において、記録処理部39により、記憶部26のログファイルに記憶される。
次に、図8のフローチャートに、図7のフローチャートのステップS21におけるコントラスト問題抽出処理の、学習段階における動作の流れを示す。コントラスト問題抽出処理では、現在入力画像がコントラスト補正を必要とする画像であるか否かを判断し、補正すべき場合は、補正量も合わせて計算する。このようなコントラスト問題抽出処理を頑健なモデルとして構成するためには、多数の画像を用いて学習処理を行うことが有効である。しかし、学習処理のためには、入力される訓練画像に対して、それらの画像が高コントラストなのか、低コントラストなのかを教師データとして与える必要があり、これを人手で行うのは大きなリソースを必要とする。
画像処理装置19の場合、入力される訓練画像に対して自動的に上述の教師データを付与するために、操作者は、大規模な画像コレクションDBから、少数の画像データ(学習データ)をランダムに選択する。CPU24は、図8のフローチャートのステップS31およびステップS32において、ランダムに選択された学習データを、これから学習する画像データとして認識する。
次に、操作者は、選択した学習データに対して、高コントラストまたは低コントラストかを示す正解情報を入力操作する。CPU24は、ステップS33〜ステップS36において、低コントラストに分類された画像の平均コントラスト(低平均コントラスト)を検出する。また、CPU24は、ステップS37〜ステップS40において、高コントラストに分類された画像の平均コントラスト(高平均コントラスト)を検出する。そして、CPU24は、ステップS41において、低平均コントラストおよび高平均コントラストから、コントラスト閾値およびコントラスト補正量を計算する。具体的には、低コントラスト画像集合のコントラスト分布の低平均コントラストを「Tlow」、高コントラスト画像集合のコントラスト分布の高平均コントラストを「Thigh」とすると、新たな現在入力画像「I」が与えられたときのコントラスト補正量である「contrast correction(I)」は、以下の(1)の数式で算出される。
CPU24は、(1)の数式で算出したコントラスト閾値およびコントラスト補正量の計算式をコントラスト抽出モデルとし、ステップS42において、記憶部26(モデルリポジトリ)に記憶する。CPU24は、ステップS43において、画像コレクション中の全画像に対して、このようなコントラスト抽出モデルの算出処理を施したか否かを判別する。そして、CPU24は、全画像に対してコントラスト抽出モデルの算出処理を施していないものと判別した場合は(ステップS43:No)、処理をステップS31に戻し、再度、操作者により選択された画像に対してコントラスト抽出モデルの算出処理を施す。また、CPU24は、全画像に対してコントラスト抽出モデルの算出処理を施したものと判別した場合は(ステップS43:Yes)、そのまま図8の学習段階のフローチャートの処理を終了する。
次に、上述のコントラスト閾値およびコントラスト補正量の計算式であるコントラスト抽出モデルは、コントラスト問題抽出処理の認識段階で用いられる。図9のフローチャートに、図7のフローチャートのステップS21におけるコントラスト問題抽出処理の認識段階における動作の流れを示す。CPU24は、コントラスト問題抽出処理の認識段階となると、ステップS51およびステップS52において、モデルリポジトリである記憶部26からコントラスト抽出モデルの読み出しを行う。また、CPU24は、ステップS53〜ステップS55において、操作者により指定された現在入力画像Iの平均コントラストCを算出する。
次に、CPU24は、平均コントラストCが高平均コントラストThighよりも大きな値であるか否かを判別する。平均コントラストCが高平均コントラストThighよりも大きな値であると判別した場合(ステップS56:Yes)、CPU24は、ステップS58に処理を進め、現在入力画像Iを高コントラスト画像と認識する。そして、CPU24は、ステップS60において、高コントラスト画像として認識した現在入力画像Iのコントラスト補正量を、上述の(1)の数式を用いて算出し、図9の認識段階のフローチャートの処理を終了する。
一方、平均コントラストCが高平均コントラストThighよりも小さな値であると判別した場合(ステップS56:No)、CPU24は、処理をステップS57に進める。ステップS57では、CPU24が、平均コントラストCが低平均コントラストTlowよりも小さな値であるか否かを判別する。平均コントラストCが低平均コントラストTlowよりも大きな値であると判別した場合(ステップS57:No)、CPU24は、そのまま図9の認識段階のフローチャートの処理を終了する。
これに対して、平均コントラストCが低平均コントラストTlowよりも小さな値であると判別した場合(ステップS57:Yes)、CPU24は、ステップS59に処理を進め、現在入力画像Iを低コントラスト画像と認識する。そして、CPU24は、ステップS60において、低コントラスト画像として認識した現在入力画像Iのコントラスト補正量を、上述の(1)の数式を用いて算出し、図9の認識段階のフローチャートの処理を終了する。
次に、距離尺度計算部33における、DTP事例間の距離(距離尺度)の計算動作を説明する。DTP事例は、入力画像、出力画像、入出力画像間の画像処理手順、その他のメタデータ(属性情報)を含む。このため、各DTP事例の特徴量である特徴ベクトルVは、以下の(2)の数式で表すことができる。
この(2)の数式において、「Vinput_image」は、現在入力画像から抽出された画像特徴を示している。また、「Voutput_image」は、出力画像から抽出された画像特徴を示している。また、「Vprocess」は、画像処理手順から抽出された特徴を示している。また、「Vmetadata」は、その他の属性情報から抽出された特徴を示している。これらを単一の特徴ベクトルとして取り扱うために、(2)の数式の右辺の各項の項目は、それぞれに正規化されているものとする。現在入力画像の特徴次元数を「Dinput_image」、出力画像の特徴次元数を「Doutput_image」、画像処理手順の特徴次元数を「Dprocess」、そして属性情報(メタデータ)の特徴次元数を「Dmetadata」とし、これらの4つの特徴次元数の和をDとすると、各DTP事例を特徴付ける特徴ベクトルVは、図10に示す列構造で表すことができる。
第1のDTP事例の特徴ベクトルをV、第2のDTP事例の特徴ベクトルをVとすると、各事例間の距離Dは、VとVの内積により、以下の(3)の数式で定義することができる。
また、過去入力画像、出力画像、画像処理手順、および属性情報のいずれか、または、これらの組み合わせに対して特に重み付けをした重み付け距離DWは、以下の(4)の数式で定義することができる。
また、重み係数行列Wは、以下の(5)の数式で定義することができる。
ここで、「WDinput_image」は、「Dinput_image」個の対角要素であり、過去入力画像の特徴に対する重み付けを、それ以降のWについても対応する特徴に対する重みをあらわすものとする。現在入力画像の類似性のみを考慮したDTP事例間の距離を計算する場合には、「WDinput_imagew」を「1」に、それ以外のW項目を「0」にする。その他の場合も同様の方法で、DTP事例の特定の特徴のみを利用した距離を算出し、これに基づいた検索を行うことができる。
なお、特徴量は(2)の数式で表されるような特徴ベクトルに限られるものではなく、DTP事例の特徴を表す情報であればどのような情報であってもよい。また事例間の距離は、(3)の数式で表される距離尺度に限られるものではなく、事例間の類似度を示す情報であればどのような情報であってもよい。
次に、画像処理装置19においては、シーン認識部35において実行される画像のシーン識別処理を、DTPアプリケーションで合わせて用いている。すなわち、現在入力画像または出力画像のシーン識別結果を、属性情報として用いる。これにより、上述の属性情報を拡充し、シーンに基づいた距離尺度の定義、およびこれを利用したDTP事例の検索を可能とすることができる。
次に、画像処理装置19においては、画像処理手順の名称を属性情報として用いている。すなわち、DTPアプリケーションにおいては、現在入力画像に画像処理を施すことで出力画像を生成する。画像処理装置19においては、このときに用いる各画像処理要素である、例えばシャープネス、彩度補正、その他の画像処理要素に一意な番号を付している。これにより、DTP事例における該画像処理要素の正規化された出現頻度により、特徴ベクトル要素を構成できる。
例えば、図11は、各画像処理要素、各画像処理要素に対して付された画像処理要素番号、および各画像処理要素の正規化出現頻度の一例である。この図11に示す例は、アンシャープマスクの画像処理要素に対して「1」の画像処理要素番号が付され、正規化出現頻度は「0.001」であることを示している。また、彩度補正の画像処理要素に対して「2」の画像処理要素番号が付され、正規化出現頻度は「0.1」であることを示している。また、コントラスト強調の画像処理要素に対して「3」の画像処理要素番号が付され、正規化出現頻度は「0.2」であることを示している。さらに、エッジ強調の画像処理要素に対して「4」の画像処理要素番号が付され、正規化出現頻度は「0.0」であることを示している。すなわち、図11の例の場合、画像処理特徴ベクトル要素は、「0.001,0.1,0.2,0.0,…,0.0」となる。
なお、画像処理装置19においては、特定の画像処理要素が利用されたか否かでDTP事例を検索する場合、図4の検索処理部40は、画像処理特徴ベクトル要素の非ゼロ要素を検索する。
次に、画像処理装置19においては、検索されたDTP事例間の距離尺度(特徴量)を用いて、検索結果を順位付けして表示する。これは、表示制御部42が、上述のようにDTP事例間の距離を定義し、この距離指標に従ってDTP事例の検索結果を順位付けし、モニタ装置などの表示部に表示されたユーザインタフェース31を介して表示する。これにより、所望の画像処理手順を選択し易い画像処理装置を、操作者に対して提供することができる。図12は、検索されたDTP事例を操作者が選択するためのユーザインタフェース31の一例である。この図12に例示するように、CPU24は、上述のようにDTP事例間の距離を定義し、この距離指標に従ってDTP事例の検索結果を順位付けし、関連するDTP事例61をモニタ装置などの表示部に表示する。
操作者は、距離尺度順(特徴量順)に表示された各DTP事例のうち、現在入力画像に対して施すことを希望する画像処理に対応するDTP事例を選択操作する。操作者によりDTP事例が選択されると、プリファレンス記録部37は、選択されたDTP事例を示す情報を記憶部26に記憶する。また、画像処理部41は、操作者により選択されたDTP事例に含まれる画像処理手順に従った画像処理を、現在入力画像に施して出力画像を生成する。表示制御部は、生成された出力画像を表示部に表示する。これにより、操作者は、自分で選択した画像処理手順に従って画像処理された出力画像を得ることができる。
次に、画像処理装置19においては、操作者が現在実施している画像処理を検出し、画像処理に関連のあるDTP事例を、記憶部26に記憶されているDTP事例データベースから検索する。そして、ユーザインタフェースを介して、操作者に対して検索結果を提示するようになっている。
すなわち、画像処理装置19の場合、操作者がDTPアプリケーションで行っている画像処理をCPU24が監視している。そして、CPU24は、操作者が選択している画像処理要素を同定する。例えば、現在、操作者が選択している画像処理要素を画像処理要素Aとすると、検索処理部40が記憶部26から画像処理要素Aを含むDTP事例を検索する。これにより、画像処理要素Aを含むDTP事例を、操作者に対して提示することができる。
次に、画像処理装置19においては、操作者が画像処理を実行すると、画像処理記録部38が、現在入力画像、出力画像、処理手順情報、テキストで記述された属性情報を、実施されたDTP事例として記憶部26のDTP事例データベースに登録する。これにより、DTP事例データベースには、実際に操作者により実行された画像処理の履歴(DTP事例)が蓄積される。蓄積されたDTP事例は、DTP検索に用いられる。これにより、操作者が希望する確立の高い画像処理手順を、操作者に対して提示することができる。
次に、画像処理装置19の場合、DTPアプリケーションから独立した独自のインタフェースを持つシステムとしても実装が可能である。例えば、図13の左上の画像が、操作者に入力された現在入力画像65とする。検索処理部40が、現在入力画像65の類似性に基づいてDTP事例を検索し、事例間距離の順に検索結果を提示する。図13の3段目の各画像が事例の入力画像66、4段目の各画像が事例の出力画像67である。
そして、各DTP事例に付随する画像処理手順を、操作者により入力された現在入力画像65に対して施したプレビュー画像68を提示する。図13の2段目の各画像がプレビュー画像68である。これにより、操作者は、自分が入力した現在入力画像65に対して施される画像処理の視覚的効果を、各プレビュー画像68で確認したうえで、処理手順を選択できる。また、操作者は、検索結果のいずれかを選択することで、選択したDTP事例に付随する画像処理手順により処理された画像を得ることができる。
なお、検索結果に所望の画像がない場合、操作者は、図13の現在入力画像65に隣接して表示された相関曲線(Correlogram)、ヒストグラム(Histgram)、カラー記述子(Color Descriptor)の各検索条件、およびこれらの重み付け値69を変更して再度検索する。これにより、所望の画像を得易くすることができる。
以上の説明から明らかなように、実施の形態の画像処理装置は、例えば熟練のDTPオペレータが画像に対して施す画像処理を記録し、現在入力画像、出力画像、および画像処理手順の3つを1つのまとまり(DTP事例)としてリポジトリ(記憶部26)に記憶する。新たに現在入力画像が与えられたとき、現在入力画像の画像情報、または操作者が付与する付帯情報を用いてリポジトリを検索し、関連するDTP事例をリストアップする。リストアップされたDTP事例にそれぞれ含まれる画像処理手順を、現在入力画像に適用することで、処理結果画像を得る。
また、実施の形態の画像処理装置は、例えば事例ベース推論手法(case based reasoning)などの検索手法により、画像の類似性(local low level image features)を用いたDTP事例の検索を行う。また、これに加え、被写体などの情報である画像コンテンツ情報(Image content Semantics)、および領域特徴(image region segmentation)を用いたDTP事例の検索を行う。さらに、操作者の補正意図(Enhancement intention)などを用いたDTP事例の検索を行う。
これにより、実施の形態の画像処理装置は、過去の画像処理手順から、操作者が希望する可能性の高い画像処理手順を高精度且つ拡張性高く検索できる。このため、過去の画像処理手順を、有効に利用でき、画像処理装置の使い勝手の向上を図ることができる。
上述の実施の形態は、例として提示したものであり、本発明の範囲を限定することは意図していない。この新規な実施の形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことも可能である。実施の形態および実施の形態の変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 現在入力画像
2 過去入力画像
3 過去入力画像
4 過去入力画像
5 画像処理手順
6 画像処理手順
7 画像処理手順
8 DTP事例
9 DTP事例
10 DTP事例
11 リポジトリ
12 処理結果画像
13 処理結果画像
14 処理結果画像
19 画像処理装置
26 記憶部
31 ユーザインタフェース
32 処理制御部
33 距離尺度計算部
34 画像処理構成部
35 シーン認識部
36 画像特徴抽出部
37 プリファレンス記録部
38 画像処理記録部
39 記録処理部
40 検索処理部
特許第3998834号公報 特開2009−134580号公報
Reconfigurable Models for Scene Recognition, S. N. Parizi et.al. (インターネットURL:http://ieeexplore.ieee.org/xpl/login.jsp?reload=true&tp=&arnumber=6248001&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D6248001)

Claims (10)

  1. 過去の入力画像である過去入力画像、前記過去入力画像の属性を示す第1属性情報、および処理手順情報を含む画像処理事例を記憶する記憶部と、
    新たに入力された入力画像である現在入力画像および前記現在入力画像の属性を示す第2属性情報に対して類似する前記過去入力画像および前記第1属性情報を含む前記画像処理事例を、画像特徴及び画像処理手順から抽出された特徴を含む特徴ベクトルを用いて、前記記憶部から検索する検索処理部と、
    検索された前記画像処理事例のうち、操作者により選択された前記画像処理事例に含まれる前記処理手順情報に従った画像処理を、前記現在入力画像に施して出力画像を生成する画像処理部と
    を有する画像処理装置。
  2. 前記第1属性情報および前記第2属性情報は、テキストで記述されること
    を特徴とする請求項1に記載の画像処理装置。
  3. 前記第1属性情報は、前記過去入力画像のシーン識別結果であり、
    前記第2属性情報は、前記現在入力画像のシーン識別結果であること
    を特徴とする請求項1または請求項2に記載の画像処理装置。
  4. 前記第1属性情報は、前記処理手順情報が示す画像処理手順の名称であり、
    前記第2属性情報は、前記現在入力画像に対して指定された画像処理手順の名称であること
    を特徴とする請求項1から請求項3のうち、いずれか一項に記載の画像処理装置。
  5. 前記検索処理部は、操作者の指定により実施中の画像処理に関連のある前記画像処理事例を前記記憶部から検索すること
    を特徴とする請求項1から請求項4のうち、いずれか一項に記載の画像処理装置。
  6. 検索された前記画像処理事例の間の特徴量を用いて、検索された前記画像処理事例を順位付けして表示する表示制御部、をさらに備えたこと
    を特徴とする請求項1から請求項5のうち、いずれか一項に記載の画像処理装置。
  7. 操作者が実施を指定した画像処理に対応する前記現在入力画像、前記第2属性情報、および前記処理手順情報を含む画像処理事例を生成し、前記記憶部に記憶する画像処理記録部、をさらに備えたこと
    を特徴とする請求項1から請求項6のうち、いずれか一項に記載の画像処理装置。
  8. 検索された前記画像処理事例のうち、操作者により選択された前記画像処理事例を前記記憶部に記録するプリファレンス記録部を、さらに有すること
    を特徴とする請求項1から請求項7のうち、いずれか一項に記載の画像処理装置。
  9. 記憶制御部が、過去の入力画像である過去入力画像、前記過去入力画像の属性を示す第1属性情報、および処理手順情報を含む画像処理事例を記憶部に記憶する記憶ステップと、
    検索処理部が、新たに入力された入力画像である現在入力画像および前記現在入力画像の属性を示す第2属性情報に対して類似する前記過去入力画像および前記第1属性情報を含む前記画像処理事例を、画像特徴及び画像処理手順から抽出された特徴を含む特徴ベクトルを用いて、前記記憶部から検索する検索処理ステップと、
    画像処理部が、検索された前記画像処理事例のうち、操作者により選択された前記画像処理事例に含まれる前記処理手順情報に従った画像処理を、前記現在入力画像に施して出力画像を生成する画像処理ステップと
    を有する画像処理方法。
  10. コンピュータを、
    過去の入力画像である過去入力画像、前記過去入力画像の属性を示す第1属性情報、および処理手順情報を含む画像処理事例を記憶部に記憶する記憶制御部と、
    新たに入力された入力画像である現在入力画像および前記現在入力画像の属性を示す第2属性情報に対して類似する前記過去入力画像および前記第1属性情報を含む前記画像処理事例を、画像特徴及び画像処理手順から抽出された特徴を含む特徴ベクトルを用いて、前記記憶部から検索する検索処理部と、
    検索された前記画像処理事例のうち、操作者により選択された前記画像処理事例に含まれる前記処理手順情報に従った画像処理を、前記現在入力画像に施して出力画像を生成する画像処理部として機能させること
    を特徴とする画像処理プログラム。
JP2014103840A 2014-05-19 2014-05-19 画像処理装置、画像処理方法、および画像処理プログラム Active JP6379664B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014103840A JP6379664B2 (ja) 2014-05-19 2014-05-19 画像処理装置、画像処理方法、および画像処理プログラム
US14/714,713 US20150334255A1 (en) 2014-05-19 2015-05-18 Image processing apparatus, image processing method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014103840A JP6379664B2 (ja) 2014-05-19 2014-05-19 画像処理装置、画像処理方法、および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2015219790A JP2015219790A (ja) 2015-12-07
JP6379664B2 true JP6379664B2 (ja) 2018-08-29

Family

ID=54539523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014103840A Active JP6379664B2 (ja) 2014-05-19 2014-05-19 画像処理装置、画像処理方法、および画像処理プログラム

Country Status (2)

Country Link
US (1) US20150334255A1 (ja)
JP (1) JP6379664B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106155611A (zh) * 2015-04-17 2016-11-23 中强光电股份有限公司 影像显示系统及其影像呈现方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6345274B1 (en) * 1998-06-29 2002-02-05 Eastman Kodak Company Method and computer program product for subjective image content similarity-based retrieval
US7912291B2 (en) * 2003-11-10 2011-03-22 Ricoh Co., Ltd Features for retrieval and similarity matching of documents from the JPEG 2000-compressed domain
GB0524572D0 (en) * 2005-12-01 2006-01-11 Univ London Information retrieval
US8027549B2 (en) * 2006-06-12 2011-09-27 D&S Consultants, Inc. System and method for searching a multimedia database using a pictorial language
JP4712635B2 (ja) * 2006-07-27 2011-06-29 富士フイルム株式会社 データ補正方法および装置並びにプログラム
US7840076B2 (en) * 2006-11-22 2010-11-23 Intel Corporation Methods and apparatus for retrieving images from a large collection of images
CN101295305B (zh) * 2007-04-25 2012-10-31 富士通株式会社 图像检索装置
JP2009116691A (ja) * 2007-11-07 2009-05-28 Seiko Epson Corp 画像処理方法、画像処理装置、及びプログラム
CN102105901B (zh) * 2008-06-06 2013-03-06 谷歌公司 注释图像
US8520979B2 (en) * 2008-08-19 2013-08-27 Digimarc Corporation Methods and systems for content processing
JP5707947B2 (ja) * 2011-01-11 2015-04-30 株式会社リコー 画像処理装置
US9411824B2 (en) * 2012-10-26 2016-08-09 Lida Huang Method and apparatus for image retrieval
US9129192B2 (en) * 2013-12-16 2015-09-08 Adobe Systems Incorporated Semantic object proposal generation and validation

Also Published As

Publication number Publication date
JP2015219790A (ja) 2015-12-07
US20150334255A1 (en) 2015-11-19

Similar Documents

Publication Publication Date Title
US10706276B2 (en) Image processing apparatus, control method therefor, and storage medium
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
US20150278710A1 (en) Machine learning apparatus, machine learning method, and non-transitory computer-readable recording medium
US10055640B2 (en) Classification of feature information into groups based upon similarity, and apparatus, image processing method, and computer-readable storage medium thereof
US20040267734A1 (en) Document search method and apparatus
JP6833620B2 (ja) 画像解析装置、ニューラルネットワーク装置、学習装置、画像解析方法およびプログラム
JP7077265B2 (ja) 文書解析装置、学習装置、文書解析方法および学習方法
CN100511232C (zh) 文档检索装置及方法
JP6379664B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
US11694458B2 (en) Image processing apparatus that sets metadata of image data, method of controlling same, and storage medium
JP2019057311A (ja) 帳票情報認識装置および帳票情報認識方法
JP5357711B2 (ja) 文書処理装置
KR101336901B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
US20220207900A1 (en) Information processing apparatus, information processing method, and storage medium
JP6337430B2 (ja) 画像処理システム、画像処理方法およびプログラム
JP4518212B2 (ja) 画像処理装置及びプログラム
US11170211B2 (en) Information processing apparatus for extracting portions filled with characters from completed document without user intervention and non-transitory computer readable medium
JP7183623B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2006323580A (ja) 画像処理システム、画像処理方法、プログラム及び記憶媒体
JP2001043316A (ja) 文書画像処理方法、文書画像処理装置及び記録媒体
JP2006004157A (ja) 画像検索プログラム、画像検索方法、画像検索装置及び記録媒体
JP2020126328A5 (ja)
US20230186028A1 (en) Information processing apparatus, information processing method, and storage medium
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
US9367768B2 (en) Image processing device, image processing method, and storage medium computer-readably storing program therefor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180320

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180515

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180716

R151 Written notification of patent or utility model registration

Ref document number: 6379664

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151