JP2016162421A - 情報処理装置、情報処理方法、およびプログラム - Google Patents
情報処理装置、情報処理方法、およびプログラム Download PDFInfo
- Publication number
- JP2016162421A JP2016162421A JP2015043746A JP2015043746A JP2016162421A JP 2016162421 A JP2016162421 A JP 2016162421A JP 2015043746 A JP2015043746 A JP 2015043746A JP 2015043746 A JP2015043746 A JP 2015043746A JP 2016162421 A JP2016162421 A JP 2016162421A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- development
- information
- image
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【課題】 RAW画像を現像するために用いる現像パラメータを審美性に基づき探索する際、好適なパラメータを高速に探索できるようにする。【解決手段】 RAW画像データから算出される第1の特徴量と複数の現像パラメータとに基づいて複数の第2の特徴量を算出し、この複数の第2の特徴量それぞれに対応する審美スコアを推定する。そして、推定した審美スコアから好適な現像パラメータを選択する。【選択図】 図1
Description
本発明は、RAW画像に基づいて画像を現像する際の現像パラメータを決定する情報処理装置、情報処理方法、およびプログラムに関する。
デジタルカメラが撮影時に取得する画像センサのデータは、RAWデータ(生データ)と呼ばれ、これはデジタルカメラの画像センサの出力値をA/D変換した値をそのまま保持したデータのことである。そして、このRAWデータに対して現像処理を行うことによって、通常の画像である現像後画像が生成される。ここで、現像処理とは、ベイヤー配列された画素データをRGB3チャネルのピクセル値に変換するデモザイキング処理や、露出調整、ホワイトバランス調整、ノイズ除去処理などの各種画像処理から成る処理のことである。そして、現像処理のパラメータのことは現像パラメータとも呼ばれる。現像パラメータは画像処理それぞれの処理パラメータを総称するものである。撮影者は、RAWデータを保持しておけば、撮影後に現像パラメータを調整することで好みの現像後画像を生成することができる。
特許文献1には、さまざまな現像パラメータを使ってRAWデータを現像した現像後画像をユーザに提示して選ばせ、ユーザの好みの現像パラメータを画像種(シーン判別結果)ごとに記憶しておく方法が記載されている。この方法では、新たに撮影した入力画像に対して、この入力画像に類似する画像に対して事前にユーザが設定しておいた現像パラメータによって、現像処理がなされるようになる。
Ritendra Datta、他3名、「Studying Aesthetics in Photographic Images Using a Computational Approach」、9th European Conference on Computer Vision,Graz,Austria,May 7−13,2006,Proceedings,Part III,pp288−301
しかしながら、特許文献1の方法は、シーン判別結果ごとに現像パラメータが決められており、シーン種別の数以上に現像パラメータを設定することができないため、現像後画像のバリエーションが制限される。そのため、現像パラメータの細かい違いによる画像の美しさの違いをユーザに提示することができない。
ところで、上記の技術とは別に、画像の審美性を判定する技術が存在する(非特許文献1)。画像の審美性とは、人間が画像を見て感覚的に感じる美しさのことである。この技術では、人間が審美性のスコアを付与した訓練画像を用い、機械学習の技術によって学習処理を行い、未知の画像に対して審美性のスコアを推定できるようにしている。
そこで、特許文献1の方法に審美性判定の方法を適用して、審美性を基準として好適な現像パラメータを探索する方法が考えられる。しかし、この場合は現像パラメータ候補の数だけ現像処理と審美性判定処理を行うことになり、探索処理時間が長くなってしまう。
上記課題を解決するために、本発明は、RAW画像データに基づいて第1の特徴量を算出する第1の算出手段と、前記第1の特徴量と複数の現像パラメータの候補とに基づいて、複数の第2の特徴量を算出する第2の算出手段と、前記複数の第2の特徴量に対して審美性に関する情報を推定する推定手段と、前記推定した審美性に関する情報に基づいて、所定数の前記現像パラメータの候補を選択する選択手段と、を有することを特徴とする。
以上の構成によれば、本発明は、好適な現像パラメータを探索するための処理時間を短縮することが可能となる。
[第1の実施形態]
以下、図面を参照して本発明の実施形態を詳細に説明する。
以下、図面を参照して本発明の実施形態を詳細に説明する。
図1は、本実施形態に関わる情報処理装置の機能構成を説明するブロック図であり、後述する本実施形態の情報処理フローを実施するためのソフトウェアを実行する機能部を示している。図1に示す各機能部は、情報処理装置が有しているCPUがROMまたはRAM等の格納手段に格納されている制御プログラムを実行することにより実現される。
なお、本実施形態において、格納手段には、第1の学習データセットとして、複数の学習データが保持されている。1つの学習データは、RAW画像データ、現像パラメータ、審美スコアの組から成る。RAW画像データとは、デジタルカメラ等の撮像装置(図示せず)によって撮影され、何も処理されていない生のデータのことである。現像パラメータとは、RAW画像データを現像する際の現像処理のパラメータである。現像処理とは、例えば、色温度補正、暗部補正、シャープネス補正などの画像処理を含むものである。現像パラメータは、それぞれの画像処理に対するパラメータである複数のパラメータ値から構成されるものとする。審美スコアとは、現像パラメータを用いてRAW画像データを現像処理して生成された現像後画像が美しいかどうかを人間が評価し付与したスコアである。審美スコアは10点満点などの実数であってもよいし、良いか悪いかを0,1で表現した2値スコアであってもかまわない。
また、このようなデータセットを準備する労力を避けるために、プロが撮影して現像パラメータを調整した画像のRAW画像データと現像パラメータを入手し、これを良画像(審美性の高い画像)の学習セットとしてもよい。この場合、後述する学習部113においては、学習セットの良画像への近さによって審美性スコアを算出するような学習方法をとればよい。以上のような学習データを、さまざまな絵柄の画像について事前に収集しておき、第1の学習データセットとして格納手段に保持しておく。
図1に戻り、情報処理装置は、RAW画像データをRGB画像に変換するデモザイキング部110、RGB画像の特徴量を算出する第1の特徴量算出部111、第1の特徴量と現像パラメータとから第2の特徴量を算出する第2の特徴量算出部112を有する。以上の構成は、後述する情報処理装置の学習フェーズ、探索フェーズの両方の処理を実行するための機能部である。
また、学習フェーズの処理に関わる学習部113は、説明変数と目標変数の組からなる訓練データを用いて、未知のデータに対する出力値を推定する推定器を訓練する手段である。本実施形態において、説明変数は画像や現像パラメータ等の情報から抽出した特徴量にあたり、目標変数は審美スコアにあたる。学習部113の学習手法は特定の構成に限定されるものではなく、適用可能な学習手法としては、例えば、線形回帰、サポートベクトル回帰(SVR)、回帰木などが挙げられる。また、審美スコアが画像の良否を表す2値スコアである場合には、サポートベクトルマシン(SVM)などの2クラス判定的な学習手法でもよい。また、訓練データが追加されるごとに逐一学習の更新を行うオンライン学習と呼ばれる学習手法を用いることも可能であり、例えば確率的勾配法などが知られている。
また、情報処理装置は、探索フェーズの処理に関わる構成として、現像パラメータ候補セットを生成する現像パラメータ候補生成部114、第1の審美スコア推定用辞書121を用いて審美スコアを推定する第1の審美スコア推定部115を有する。また、現像パラメータ候補セットから現像パラメータを選択する現像パラメータ選択部116、選択現像パラメータセットに含まれる現像パラメータ間の類似度を算出する類似度算出部117を有する。また、RAW画像データから現像後画像を生成する現像部118、生成した現像後画像を表示装置に表示する表示部119、ユーザが選択した現像後画像に対応するRAW画像データをユーザ選択情報として取得するユーザ選択情報取得部120を有する。
情報処理装置の格納手段には、上述の第1の学習データセット120、未知の画像に対して審美スコアを推定するために用いられる第1の審美スコア推定用辞書121を記憶する領域が割り当てられている。また、探索する現像パラメータの全組合せを保持する現像パラメータ候補セット122、現像パラメータ候補に対応する審美スコアから成る審美スコア推定値セット123の領域も割り当てられている。上記と同様に、審美スコアに基づき選択された現像パラメータを保持する選択現像パラメータセット124、生成された現像後画像を保持する現像後画像セット125も格納手段に保存される。
なお、以上の説明では、学習フェーズの処理と探索フェーズの処理とを一体の情報処理装置により行うための構成について述べたが、各フェーズの処理をそれぞれ別体の情報処理装置により行うようにしてもよい。以下、本実施形態の各機能部の詳細な処理について説明する。図2は、本実施形態の情報処理装置における学習フェーズの処理を示すフローチャートである。
まず、ステップS201では、デモザイキング部110が、第1の学習データ記録部120から1つの学習データを読み出す。1つの学習データは、RAW画像データ、現像パラメータ、審美スコアの3つのデータの組からなっている。ステップS202では、デモザイキング部110が、RAW画像データをRGB画像に変換する。RGB画像とは1つの画素がR,G,Bの3つのチャネルの値からなっている画像のことである。デモザイキング部110が行う処理は、ベイヤー配列で保持されているRAW画像データをRGB画像に変換する処理であり、一般的に知られている処理であるので、詳細説明は省略する。
ステップS203では、第1の特徴量算出部111が、ステップS202で得たRGB画像の特徴量を算出する。第1の特徴量算出部111は、非特許文献1に記載されるように、例えば色の統計量や空間周波数成分を特徴量として算出する。非特許文献1に記載の特徴量算出方法は、RGB画像に対しても適用することが可能である。ただし、本実施形態は、この例に限定されるものではなく、画像の審美性に相関する特徴量をRGB画像から算出する特徴量算出方法であれば、他の方法であってもかまわない。なお、本実施形態において、第1の特徴量はD1次元の特徴ベクトルとして表現されるものとする。
ステップS204では、第2の特徴量算出部112が、ステップS203で得た第1の特徴量と現像パラメータとに基づき第2の特徴量を算出する。現像パラメータに含まれるパラメータ値の数がD2個であるとすると、第2の特徴量算出部112は、D2個のパラメータ値をD2次元の特徴ベクトルとみなして、第1の特徴量(D1次元の特徴ベクトル)に連結した特徴ベクトルを第2の特徴量として算出する。この場合、第2の特徴量は(D1+D2)次元の特徴ベクトルとなる。
ステップS205では、学習部113に訓練データを追加する。訓練データとは、前ステップで得られた第2の特徴量を説明変数とし、また、審美スコアを目標変数としたものである。なお、学習手法がオンライン学習に類する手法である場合には、訓練データを追加した時点で学習結果を更新し、第1の審美スコア推定用辞書121を更新する。
ステップS206では、第1の学習データ記録部120に未処理の学習データが残っていないかどうかを判定する。未処理の学習データが残っていればステップS201に戻り、未処理の学習データがなければステップS207に進む。
ステップS207では、学習部113が学習処理を行う。学習部113は、先に述べたような既存の学習手法によって、説明変数から目標変数への推定を行う推定器を訓練し、これを第1の審美スコア推定用辞書121として保存する。一般的に、学習処理の結果として生成される、学習モデルのパラメータが記載されたデータのことを辞書と呼ぶ。第1の審美スコア推定用辞書121も、未知の画像に対して審美スコアを推定する審美スコア推定部のためのデータであり、学習処理の結果生成されたものである。なお、学習手法がオンライン学習の手法である場合には、ステップS205にて訓練データを追加した時点で第1の審美スコア推定辞書121が更新されており、本ステップでは何の処理も行わない。
次に、本実施形態における探索フェーズの処理について説明する。図3は、本実施形態における探索フェーズの処理を説明するフローチャートである。探索フェーズの処理は、与えられたRAW画像データに対してそれに適する現像パラメータを探索する処理にあたる。
まず、ステップS301では、デモザイキング部110が、入力データとして与えられたRAW画像データを取得する。そして、ステップS302では、デモザイキング部110が、RAW画像データからRGB画像を生成する。続くステップS303では、第1の特徴量算出部111が、RGB画像から第1の特徴量を算出する。このステップS303の処理は、前述した、学習フェーズにおけるステップS203の処理と同様である。
ステップS304では、現像パラメータ候補生成部114が、現像パラメータ候補セット122を生成する。現像パラメータ候補セット122は、探索フェーズの処理で探索する現像パラメータの全組合せを保持するものである。例えば、ひとつの現像パラメータはNp個のパラメータ値からなるとし、i番目(1≦i≦Np)のパラメータ値の探索下限値をDPLi、探索上限値DPHiとする。またi番目のパラメータ値の探索ステップ数をMiとする。現像パラメータ候補生成部114は、探索候補として、DPLiからDPHiまでの値をMiステップで設定する。DPLiとDPHi設定値は、最初は各パラメータ値の最小値、最大値に設定しておけばよい。
例えば、露出補正処理のパラメータ値の探索範囲がDPLi=−3.0、DPHi=+3.0、探索ステップ数Mi=5と設定されている場合は、そのパラメータ値の探索候補は{−3.0,−1.5,0.0,+1.5,+3.0}と設定すればよい。現像パラメータ候補セット122に格納される現像パラメータ候補の数Ndpは、以下の数1式で表わされる。
Miの設定値は固定的に設定しておいてもよいし、以下で述べるステップS315にてループごとに設定を変えてもかまわない。
ステップS305では、第2の特徴量算出部112が、現像パラメータ候補セット122から現像パラメータを1つ取り出す。前述のように、1つの現像パラメータには複数のパラメータ値が設定されている。ステップS306では、第2の特徴量算出部112が、ステップS305で取得した現像パラメータと、第1の特徴量とに基づいて第2の特徴量を算出する。この処理は、前述した、学習フェーズのステップS204の処理と同様である。
ステップS307では、第1の審美スコア推定部115が、第1の審美スコア推定用辞書121を用いて第2の特徴量から審美スコアを推定し、審美スコア推定値セット123に追加する。審美スコア推定値セット123は、Ndp個の現像パラメータ候補に対応するNdp個の審美スコアから成るデータである。ステップS308では、CPUが、現像パラメータ候補セット122の全ての現像パラメータに対して処理を完了したかどうかを判定する。全ての現像パラメータについて処理が完了していればステップS309へ進み、全ての現像パラメータについて処理が完了していなければステップS305に進む。
ステップS309では、現像パラメータ選択部116が、現像パラメータ候補セット122から好適な現像パラメータを1つ以上選択して、選択現像パラメータセット124に格納する。現像パラメータ選択部116は、審美スコア推定値セット123の中から審美スコアが高いものを1つ以上選択し(その数をNselectとする)、それに対応する現像パラメータ候補を現像パラメータ候補セット122から1つ以上選択する。現像パラメータの選択にあたっては、Nselectの数を事前に設定しておいて、その数になるまでスコアの高い順に選んでもよいし、審美スコアが所定の閾値以上のものを全て選んで、その数をNselectとしてもよい。
ステップS310では、類似度算出部117が、選択現像パラメータセット124にあるNselect個の現像パラメータ間の類似度を算出する。現像パラメータ間の類似度の算出方法については、現像パラメータを多次元ベクトルとみなし、各次元を正規化したうえで、ベクトル間のL2距離を類似度とみなすなどすればよい。
ステップS311において、現像パラメータ選択部116が、算出した類似度に応じて選択現像パラメータセット124中の現像パラメータを再選択し、選択現像パラメータセット124中の現像パラメータが所定数Ndisp個になるようにする。ここで所定数Ndispとは、最終的にユーザに提示する候補画像の枚数であり、事前に設定しておくか、ユーザの指示に応じて設定するものである。ここでは、選択現像パラメータセット124に保持される現像パラメータ数がNdispより多かった場合、最も類似する現像パラメータの組のうち審美スコアが低い現像パラメータを選択現像パラメータセット124から削除する。以上の処理を、所定数Ndispになるまで繰り返す。
ステップS312では、現像部118が、選択現像パラメータセット124とRAW画像データを用いて、Ndisp個の現像後画像を生成し、現像後画像セット125に格納する。現像部118が行う処理は、RAW現像処理と呼ばれている処理であり、RAW画像データと現像パラメータの組から1つのRGB画像を生成する処理である。これはデモザイキング部110による処理とは異なり、現像パラメータに応じて色温度補正やシャープネス補正など様々な画像処理を行うものである。そして、ステップS313では、表示部119が、ステップS312で生成したNdisp個の現像後画像を、情報装置に接続された表示装置(不図示)に表示させる。
ステップS314では、ユーザ選択情報取得部120が、ユーザ選択情報を取得する。ユーザは、表示装置に表示されたNdisp個の現像後画像の中から好みの現像画像を選択し、マウス、キーボード等の入力装置によりその情報を入力する。ユーザ選択情報取得部120は、ユーザが選択した現像後画像に関するRAW画像データと現像パラメータの組から成る情報をユーザ選択情報として取得、保持する。
ステップS315では、CPUが、ユーザから追加探索の指示があるかを確認し、追加探索の指示がある場合はステップS316に進む。一方、追加探索の指示がない場合は、ユーザが選択した現像後画像、またはこの現像後画像に関連するRAW画像データと現像パラメータの組のデータであるユーザ選択情報等を出力して、処理を終了する。
ステップS316では、現像パラメータ選択部116が、ユーザにより選択された現像後画像に付随する現像パラメータを用いて探索の範囲を再設定する。すなわち、現像パラメータのi番目のパラメータ値の探索下限値DPLi、探索上限値DPHiを変更する。具体的には、現像パラメータ選択部116は、ユーザが選択した現像後画像を現像した際のパラメータ値を中心とし、前回探索の候補となっていない範囲の値を下限、上限となるように再設定する。例えば、前回探索で露出補正処理のパラメータ候補が{−3.0,−1.5,0.0,1.5,3.0}で、ユーザが0.0を選択した場合、0.0の近傍の候補パラメータによりDPLi=−1.4,DPHi=1.4などと設定するなどすればよい。この場合、このパラメータ値の次回の探索候補は{−1.4,−0.7,0.0,0.7,1.4}となる。また、i番目のパラメータ値の探索ステップ数Miをここで変更してもよい。ステップS316で現像パラメータの探索範囲が再設定された後、処理はステップS304へと進み、前述したステップS304以降の処理を再度行う。
以上、本実施形態における探索フェーズの処理について説明した。ここで、ステップS310〜S311、および、ステップS314〜S315の処理を行わなくても、好適な現像パラメータの探索は可能である。例えば、ユーザを介在させずに自動的に最適な現像パラメータを決定する場合は、ステップS309で最も審美スコアの高い現像パラメータを1つ出力するようにすればよい。
または、ステップS314において、ユーザが明示的に選択するのではなく、最も審美スコアが高い現像パラメータ候補の現像後画像を自動的に選択し、さらにステップS315で追加探索に進むようにしてもよい。このようにすれば、初期に設定していたDPLi,DPHiの値の探索範囲から粗い探索を始め、徐々に審美性の高い現像パラメータにむけて探索範囲を絞り込みつつ詳細探索するようなCoarse to Fineの探索が可能になる。この場合、ステップS315では、既に十分に詳細な探索を完了したかどうかを、繰返し回数、またはDPLiとDPHiとの差分等によって判定すればよい。探索を完了した後で、自動で選択した現像後画像をユーザに提示し、確認させるようにしてもよい。
また、ステップS314で取得するユーザ選択情報を用いて、第1の審美スコア推定用辞書121を更新する学習更新部を更に有するようにしてもよい。これにより、ユーザが好む現像後画像を生成するような現像パラメータが学習されるようになる。学習更新部の構成例としては、学習部113の学習手法がオンライン学習的手法であれば、選択した現像後画像に関連するRAW画像データと現像パラメータの組のデータであるユーザ選択情報等を学習部113に追加すればよい。オンライン学習でない場合は、第1の学習データセット120にユーザ選択情報を加えて学習処理のやり直しをすればよい。その際、ユーザ選択情報の学習重み(学習時にそのデータを重要視させる重み係数)を、第1の学習データセットに含まれるデータよりも所定割合だけ増して学習してもよい。これにより、ユーザが好適であると直接判断したデータがより重み付けられて辞書が更新されるようになる。辞書の更新は、本フローチャートのループごとに行ってもよいが、ユーザ選択情報を追加学習データセットとして保存しておいて、適当な時期に学習更新処理を行うようにしてもかまわない。
以上、本実施形態では、第1の審美スコア推定部115は、現像後のRGB画像から算出する画像特徴を用いるのではなく、現像前のRAW画像データから算出する第1の特徴量と現像パラメータとから算出する第2の特徴量に基づいて、審美スコアを推定する。第1の特徴量は画像特徴であるため算出処理には比較的時間がかかるが、第2の特徴算出処理の処理は画像のような大量のデータの処理ではなく、また、複雑な処理でもないために高速に処理可能である。本実施形態では、処理時間がかかる第1の特徴量の算出はRAW画像につき1回だけ算出しておけばよいため、第2の特徴量算出の処理は探索候補の数だけ繰り返す必要があっても、高速な審美性スコア推定処理が可能となる。
このように、本実施形態の構成によれば、審美性を基準とした好適な現像パラメータの探索が可能になり、しかも、探索の際に探索候補の数だけの現像処理を行う必要がなく、高速な探索処理が可能になる。
また、本実施形態のステップS310,S311では、現像パラメータ間の類似度を求めて、類似する現像パラメータを削除するようにしている。この構成により、審美スコアが高くなるだけでなくバラエティに富むような現像パラメータをユーザに提示できるようになる。
[第2の実施形態]
次に、本発明の第2の実施形態について説明する。なお、第1の実施形態において既に説明をした構成については、同一の符号を付し、その説明を省略する。また、本実施形態の探索フェーズの処理は、第1の実施形態の探索フェーズの処理と同一であるため、ここでは、学習フェーズの処理について説明する。
次に、本発明の第2の実施形態について説明する。なお、第1の実施形態において既に説明をした構成については、同一の符号を付し、その説明を省略する。また、本実施形態の探索フェーズの処理は、第1の実施形態の探索フェーズの処理と同一であるため、ここでは、学習フェーズの処理について説明する。
図4は、本実施形態に関わる情報処理装置の機能構成を説明するブロック図である。本実施形態の情報処理装置は、第2の審美スコア推定部130および学習データ生成部131を有する。第2の審美スコア推定部130は、従来から知られている手法により審美スコアを推定するもので、インターネット上にある多数の審美スコア付きの画像データなどを用いて、多様な画像の審美スコアが推定できるように事前に訓練されている。第2の審美スコア推定部130に未知のRGB画像を与えれば、その未知画像の審美スコアを推定することができる。
また、情報処理装置の格納手段には、学習用RAW画像データセット126、および第2の学習データセット127を記憶するための領域が用意されている。学習用RAW画像データセット126は、RAW画像データを複数含むだけのものであり、現像パラメータや審美スコアなどは含まないという点で、第1の学習データセット120とは異なる内容のものである。
図5は、本実施形態における学習フェーズの処理を説明する図であり、図5(A)は学習フェーズの処理の流れを示すフローチャートである。ステップS501では、学習データセット生成処理が実行され、学習データ生成部131が、第2の学習データセット127を生成し、格納手段に保存する。学習データセット生成処理の詳細については後述するが、ユーザが画像の審美スコアを付与することなく学習データセットを生成することができる。
ステップS502では、学習部113が、第2の学習データセット127を用いて学習処理を行う。このステップS502の処理内容は、第1の実施形態で説明した学習フェーズ全体の処理と同様のものである。ただし、第1の学習データセット120に代えて第2の学習データセット127を学習に使う点が異なる。それ以外の処理の内容に違いはない。
本実施形態の学習部113は、第2の学習データセット127からRAW画像データを取り出して第1の特徴量を算出し、さらに現像パラメータを用いて第2の特徴量を算出する。また、学習部113は、第2の特徴量を説明変数として、審美スコアを目標変数として、第1の審美スコア推定器を訓練する。学習の結果、第1の審美スコア推定用辞書121が情報装置の格納手段に保存される。
なお、ステップS502では、第2の学習データセット127に加えて、第1の学習データセット120に含まれる学習データも併せて学習に使用してもよい。その場合、さらに第1の学習データセット120に含まれる学習データの重みを第2の学習データセットの重みより所定割合だけ増して学習してもよい。これは、第2の学習データセット127に含まれる学習データは、第2の審美スコア推定器によって推定された審美スコアを目標変数とする学習データであり、幾分かの誤差を含む可能性があるためである。このように異なる重みを与えることで、データの信頼度に応じた学習を行うことが可能になる。
次に、学習データセット生成処理について説明する。図5(B)は、学習データセット生成処理の流れを説明するフローチャートである。ステップS511では、現像パラメータ候補生成部114が、現像パラメータ候補セットを生成し、格納手段に現像パラメータ候補セット122を格納する。この処理は、図3のステップS304の処理内容と同様である。なお、現像パラメータの候補数はNdpとする。
ステップS512では、学習データ生成部131が、学習用RAW画像データセット126から、まだ処理していない1つの学習用RAW画像データを選び出す。次に、ステップS513では、現像パラメータ候補生成部114が、ステップS511で生成したNdp個の現像パラメータ候補から、まだ処理していない1つの現像パラメータを選び出す。
ステップS514では、現像部118が、RAW画像データと現像パラメータとを用いて現像処理を行い、ひとつの現像後画像を生成する。次に、ステップS515では、第2の審美スコア推定部130が、現像後画像の審美スコアを推定する。第2の審美スコア推定部130は、現像後画像のような現像済みのRGB画像の審美スコアを推定するように事前に訓練されているものであり、これは従来の技術である。
ステップS516では、学習データ生成部131が、RAW画像データ、現像パラメータ、及び審美スコアの組を、第2の学習データセット127に追加する。続くステップS517では、CPUが、現像パラメータ候補セット122に含まれる全てのデータに対して、以上の処理が完了したかどうかを判定する。全てのデータに対する処理が完了していればステップS518へ進み、完了していなければステップS513に戻る。
ステップS518では、CPUが、学習用RAW画像データセット126に含まれる全てのデータに対して、以上の処理が完了したかどうかを判定する。全てのデータに対する処理が完了していれば学習データセット処理は完了し、完了していなければステップS512に戻る。
以上、本実施形態の構成によれば、第1の学習データセット120として多数のデータをユーザが準備することなく、第1の審美スコア推定用辞書を生成することが可能になる。また、ユーザが通常設定することがないような広範な現像パラメータによって現像された画像を学習データセットに加えることができ、学習データセットの多様性が増える。そのため、探索フェーズでユーザが予期しない画像を提示できるようになる。さらには、第1の学習データセットの学習重みを第2の学習データセットより増すことにより、人間が審美スコアを付けたデータをより強く学習することが可能になる。
[第3の実施形態]
次に、本発明の第3の実施形態について説明する。本実施形態は、学習フェーズにおいて、画像種別ごとに分けた学習データセットを用いて学習を行い、画像種別ごとに第1の審美スコア推定用辞書を生成する。そして、探索フェーズにおいては、入力したRAW画像データに対して画像種別判定を行い、判定結果に基づいて第1の審美スコア推定用辞書を切替えて探索処理を行う。以下、第1、第2の実施形態において既に説明をした構成については、同一の符号を付し、その説明を省略する。
次に、本発明の第3の実施形態について説明する。本実施形態は、学習フェーズにおいて、画像種別ごとに分けた学習データセットを用いて学習を行い、画像種別ごとに第1の審美スコア推定用辞書を生成する。そして、探索フェーズにおいては、入力したRAW画像データに対して画像種別判定を行い、判定結果に基づいて第1の審美スコア推定用辞書を切替えて探索処理を行う。以下、第1、第2の実施形態において既に説明をした構成については、同一の符号を付し、その説明を省略する。
図6は、本実施形態の情報処理装置の機能構成を示すブロック図である。第1の実施形態と比較すると、本実施形態の情報処理装置は、画像の種別を判別する画像種別判別部132を有している点で異なっている。また、本実施形態では、第1の学習データセットを画像種別ごとに分割して生成した画像種別学習データセット128を格納する領域を格納手段に備える。また、第1の実施形態で用いた第1の審美スコア推定用辞書121に代えて、本実施形態では画像種別第1の審美スコア推定用辞書129を用いる。
次に、本実施形態の学習フェーズの処理について説明する。図7は、本実施形態における学習フェーズの全体の処理を示すフローチャートである。第1の学習データセット120が事前に用意されている点は第1の実施形態と同様である。
まず、ステップS701では、画像種別判別部132が、第1の学習データセット120を画像種別ごとに分割する。具体的には、デモザイキング手段110がRAW画像データをRGB画像に変換した後、画像種別判別部132が、画像分類用の画像特徴を用いてクラスタリングし、学習データセット120をNs個の学習データセットに分割する。分割したデータセットは、画像種別学習データセット128として格納手段に格納される。なお、Nsは事前に定められた所定数であり、画像分類用の画像特徴とは、例えば色ヒストグラムやエッジ方向ヒストグラムを使った局所特徴量のヒストグラム(Bag of Visual Wordsと呼ばれるもの)等の画像特徴である。
また、画像種別判別部132は、クラスタのクラスタ中心を記憶手段に記録しておく。これにより、探索フェーズにおいて未知のRAW画像データを処理する際には、それをデモザイキングしたRGB画像がNs個のデータクラスタ中心のどれに一番近いかを判定することによって未知画像の画像種別を判別する。
ステップS702では、ステップS701で画像種別ごとに分けられた画像種別学習データセット128に含まれるデータセットを用いて、画像種別ごとに第1の実施形態における学習フェーズと同様の処理を行う。その結果、Ns個の辞書が生成され、画像種別第1の審美スコア推定用辞書129として格納手段に格納される。
次に、本実施形態の探索フェーズの処理について説明する。本実施形態の探索フェーズにおける処理は、図3に示す第1の実施形態の探索フェーズの処理に対して、ステップS402とS403との間に画像種別判別によって辞書を切り替える画像種別判別処理の工程を追加したものとなっている。以下、図8を用いて、第1の実施形態の探索フェーズとの差異にあたる、画像種別判別処理の工程について説明する。
図8において、ステップS801では、画像種別判別部132が、RAW画像データの画像種別を判定する。その判定手法は、学習フェーズでの判定と同様であり、対象としているRGB画像が、学習フェーズでクラスタリングした際のどのクラスタ中心に近いかを判別するものである。
次に、ステップS802では、画像種別判別部132が、ステップS801で判別された画像種別138に応じて、画像種別第1の審美スコア推定用辞書129から画像種別に対応する辞書をひとつ取り出し、第1の審美スコア推定部115にセットする。
以上が、本実施形態の画像種別判別処理である。本実施形態では、このような処理が第1の実施形態の探索フェーズのステップS402とS403の間に追加されることで、第1の審美スコア推定部115は、ステップS407において画像種別ごとに学習された辞書を用いて審美スコア推定処理を行うことができる。
本実施形態の構成では、画像の種別に応じて第1の審美スコア推定器を訓練しておくことにより、画像の種別に応じて適切な現像パラメータを探索することができるようになる。画像の審美性の判断基準は画像の種別に応じて異なることが予想され、画像の種別ごとに学習を行うことが有効である。本実施形態においては、現像後の画像に対して画像種別を判別するのではなく、RAW画像データに対して(撮像パラメータを使わずに)画像種別判別を一度だけ行い、その判別結果に応じて多数の探索処理を高速に行うことが可能になる。
[第4の実施形態]
次に、本発明の第4の実施形態について説明する。第1の実施形態では、審美スコアを推定する際に用いる説明変数として、RAW画像及び現像パラメータから抽出した特徴量を用いるようにしていたが、本実施形態では、さらに撮影時情報及び画像種別から抽出する特徴量を加える。撮影時情報とは、RAW画像が撮影された時の種々の付帯情報であり、例えば撮影時刻、GPS情報などが挙げられる。また、撮影装置(カメラ)が高度計、照度計、コンパス、加速度計などの機能を有する場合は、撮影時のそれらデータを撮影時情報としてもよい。これらの情報は、撮影時にRAW画像データと関連付けられており、RAW画像が情報処理装置に格納される際、併せて記録される。また、本実施形態の第1の学習データセット120中の学習データには、RAW画像データ、現像パラメータ、審美スコアとともに撮影時情報も記録されている。
次に、本発明の第4の実施形態について説明する。第1の実施形態では、審美スコアを推定する際に用いる説明変数として、RAW画像及び現像パラメータから抽出した特徴量を用いるようにしていたが、本実施形態では、さらに撮影時情報及び画像種別から抽出する特徴量を加える。撮影時情報とは、RAW画像が撮影された時の種々の付帯情報であり、例えば撮影時刻、GPS情報などが挙げられる。また、撮影装置(カメラ)が高度計、照度計、コンパス、加速度計などの機能を有する場合は、撮影時のそれらデータを撮影時情報としてもよい。これらの情報は、撮影時にRAW画像データと関連付けられており、RAW画像が情報処理装置に格納される際、併せて記録される。また、本実施形態の第1の学習データセット120中の学習データには、RAW画像データ、現像パラメータ、審美スコアとともに撮影時情報も記録されている。
本実施形態は、第3の実施形態で示した情報処理装置の構成により実施可能であるため、その説明は省略する。次に、本実施形態における学習フェーズの処理について説明する。本実施形態の学習フェーズは、第1の実施形態における学習フェーズの処理とほぼ同じであるが、以下の2つの点が異なる。
まず、第1点として、第1の実施形態では、ステップS201において、第1の学習データセット120より1つの学習データを取得する際は、RAW画像データ、現像パラメータ、審美スコアから成る組を1つ取り出していた。本実施形態では、さらに撮影時情報も取得する。
第2点として、本実施形態と第1の実施形態とでは、第2の特徴量を算出する処理が異なる。第1の実施形態では、ステップS204において、第2の特徴量算出部112は、第1の特徴量と、現像パラメータから算出した特徴量とを結合した特徴量を算出していた。本実施形態では、さらに、撮影時情報から算出する特徴量、及び画像種別判別部132がRAW画像データにから判別した画像種別から算出する特徴量を加えて、第2の特徴量を算出する。本実施形態の学習フェーズでは、以下に説明する第2の特徴量の算出処理を、第1の実施形態のステップS204に代えて行えばよい。
以下に、本実施形態における第2の特徴量の算出処理の詳細について説明する。図9は、本実施形態における第2の特徴量の算出の処理を示すフローチャートである。
ステップS901では、第2の特徴量算出部112が、現像パラメータの情報を特徴ベクトル化する。これは、第1の実施形態のステップS204の処理と同じように、現像パラメータのパラメータ値の列をそのまま多次元ベクトルとして扱えばよい。次に、ステップS902では、第2の特徴量算出部112が、撮影時情報を特徴ベクトル化する。撮影時情報は複数の数値の集まりとして表現されるため、例えば、それを多次元ベクトルとして扱えばよい。
ステップS903では、画像種別判別部132が、RAW画像データの画像種別を判別し、その判別した画像種別を1からNsまでの数値(クラスタ番号)の情報として保持する。
なお、画像種別判別部132は、事前に第1の学習データセット120に対してクラスタリング処理を行い、そのクラスタ中心を記憶しておき、未知画像に対しては再近傍となるクラスタを判定するものである。ただし、これは一例であり、画像種別判別部132は未知の画像に対して画像種別判別ができるように事前に学習されていれば、どのような方法で実現されてもかまわない。本実施形態の画像種別判別部132は、第3の実施形態とは異なり、第1の学習データセット120を分割する必要はない。
ステップS904では、第2の特徴量算出部112が、ステップS903で得た画像種別を特徴ベクトル化する。画像種別の値をそのまま1次元のベクトル値としてもよいし、Nsビットのバイナリ値(該当する画像種別の番号のビットが1)としてもよい。
ステップS905では、第2の特徴量算出部112が、第1の特徴量と、現像パラメータの特徴ベクトルと、ステップS902で得た撮影時情報の特徴ベクトルと、ステップS904で得た画像種別の特徴ベクトルとを結合し、第2の特徴量を生成する。
以上が、本実施形態における第2の特徴量の算出処理である。上述の説明では、撮影時情報および画像種別に基づく2種類の特徴量を用いるようにしているが、どちらか一方の特徴量だけを用いるようにしてもよい。
また、本実施形態の探索フェーズの処理も基本的に第1の実施形態と同じである。ただし、処理対象のRAW画像データに対して撮影時情報も関連付けて与えられ、前述した第2の特徴量の算出処理(図9)により第2の特徴量を算出する。
以上、本実施形態の構成によれば、画像自体の情報に加えて、撮影時の情報を説明変数として用いることにより、撮影時間、場所などの条件も加味した審美スコア推定を行うことができ、好適な現像パラメータを探索することが可能になる。また、画像種別の情報を説明変数として用いることにより、使用する辞書は1つでありながら、画像種別の条件も加味して審美スコア推定を行うことができ、好適な現像パラメータを探索することが可能になる。いずれの場合も、現像処理を行わずに審美スコアを推定して探索を行うので、処理時間を要する第1の特徴量算出は1回のみ行えばよく、好適な現像パラメータを高速に探索することが可能になる。
[その他の実施形態]
なお、本発明は、以下の種々の形態に適用可能である。例えば、上記実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読出して実行する処理である。また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明の趣旨は、種々の変形(各実施例の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。即ち、上述した各実施例及びその変形例を組み合わせた構成も全て本発明に含まれる。
なお、本発明は、以下の種々の形態に適用可能である。例えば、上記実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読出して実行する処理である。また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明の趣旨は、種々の変形(各実施例の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。即ち、上述した各実施例及びその変形例を組み合わせた構成も全て本発明に含まれる。
111 第1の特徴量算出部
112 第2の特徴量算出部
114 現像パラメータ候補生成部
115 第1の審美スコア推定部
116 現像パラメータ選択部
112 第2の特徴量算出部
114 現像パラメータ候補生成部
115 第1の審美スコア推定部
116 現像パラメータ選択部
Claims (15)
- RAW画像データに基づいて第1の特徴量を算出する第1の算出手段と、
前記第1の特徴量と複数の現像パラメータの候補とに基づいて、複数の第2の特徴量を算出する第2の算出手段と、
前記複数の第2の特徴量に対して審美性に関する情報を推定する第1の推定手段と、
前記推定した審美性に関する情報に基づいて、所定数の前記現像パラメータの候補を選択する選択手段と、を有することを特徴とする情報処理装置。 - 前記RAW画像データに基づいてRGB画像を生成するするデモザイキング手段を更に有し、
前記第1の算出手段は、前記生成されたRGB画像に基づいて、前記第1の特徴量を算出することを特徴とする請求項1に記載の情報処理装置。 - 前記選択手段により選択された所定数の現像パラメータの候補の類似度を算出する類似度算出手段を更に有し、
前記選択手段は、前記算出された類似度に基づいて、現像パラメータの候補を再び選択することを特徴とする請求項1または2に記載の情報処理装置。 - 前記選択手段により選択された現像パラメータの候補に基づいて、前記RAW画像データから画像を現像する現像手段と、
前記現像された画像を表示装置に表示する表示手段と、を更に有することを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。 - 前記表示装置に表示された画像からユーザが選択した画像に関する情報を取得する取得手段を更に有し、
前記第2の算出手段は、前記取得した情報に基づき複数の現像パラメータの候補を変更して、前記複数の第2の特徴量を再び算出することを特徴とする請求項4に記載の情報処理装置。 - 前記RAW画像データに対して画像種別の判別を行う画像種別判別手段を更に有し、
前記第1の推定手段は、前記判別された画像種別に応じて推定用辞書を切り替えて、前記複数の第2の特徴量に対して審美性に関する情報を推定することを特徴とする請求項1から5のいずれか1項に記載の情報処理装置。 - 前記第2の算出手段は、前記第1の特徴量と、前記複数の現像パラメータの候補と、前記RAW画像データの画像種別または撮影時情報のいずれかに一方とに基づいて、前記第2の特徴量を算出することを特徴とする請求項1から6のいずれか1項に記載の情報処理装置。
- 前記第1の推定手段は、学習用RAW画像データと複数の現像パラメータと審美性に関する情報とを含む第1の学習データに基づいて学習された推定用辞書を用いて、前記複数の第2の特徴量に対して審美性に関する情報を推定することを特徴とする請求項1から7のいずれか1項に記載の情報処理装置。
- 学習用RAW画像データと複数の現像パラメータと審美性に関する情報とを含む第1の学習データに基づいて、前記推定用辞書を学習する学習手段を更に有することを特徴とする請求項8に記載の情報処理装置。
- 前記第1の算出手段が、前記学習用RAW画像データに基づいて第1の特徴量を算出し、
前記第2の算出手段が、前記算出した第1の特徴量と前記学習データに含まれる現像パラメータとに基づいて、第2の特徴量を算出し、
前記学習手段が、前記算出した第2の特徴量と前記学習データに含まれる審美性に関する情報とに基づいて、前記推定用辞書を学習することを特徴とする請求項9に記載の情報処理装置。 - 学習用RAW画像データを所定の現像パラメータにより現像した画像に基づいて、審美性に関する情報を推定する第2の推定手段と、
前記第2の推定手段に供された学習用RAW画像データおよび現像パラメータと、前記第2の推定手段により推定された審美性に関する情報とを含む第2の学習データを生成する学習データ生成手段と、を更に有し、
前記学習手段は、前記第1の学習データと前記第2の学習データとに基づいて、前記推定用辞書を学習することを特徴とする請求項9または10に記載の情報処理装置。 - 前記学習手段は、前記第1の学習データと前記第2の学習データとに対して異なる重み付けを行って、前記推定用辞書を学習することを特徴とする請求項11に記載の情報処理装置。
- 前記学習手段は、前記学習用RAW画像の画像種別ごとに推定用辞書を学習することを特徴とする請求項9から12のいずれか1項に記載の情報処理装置。
- RAW画像データに基づいて第1の特徴量を算出する第1の算出ステップと、
前記第1の特徴量と複数の現像パラメータの候補とに基づいて、複数の第2の特徴量を算出する第2の算出ステップと、
前記複数の第2の特徴量に対して審美性に関する情報を推定する推定ステップと、
前記推定した審美性に関する情報に基づいて、所定数の前記現像パラメータの候補を選択する選択ステップと、を有することを特徴とする情報処理方法。 - コンピュータを、請求項1から13のいずれか1項に記載の情報処理装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015043746A JP2016162421A (ja) | 2015-03-05 | 2015-03-05 | 情報処理装置、情報処理方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015043746A JP2016162421A (ja) | 2015-03-05 | 2015-03-05 | 情報処理装置、情報処理方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016162421A true JP2016162421A (ja) | 2016-09-05 |
Family
ID=56845412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015043746A Pending JP2016162421A (ja) | 2015-03-05 | 2015-03-05 | 情報処理装置、情報処理方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016162421A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7407604B2 (ja) | 2020-01-21 | 2024-01-04 | キヤノン株式会社 | 推論装置、学習装置、推論方法、学習方法、及びプログラム |
US11941853B2 (en) | 2020-11-09 | 2024-03-26 | Canon Kabushiki Kaisha | Apparatus and method |
-
2015
- 2015-03-05 JP JP2015043746A patent/JP2016162421A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7407604B2 (ja) | 2020-01-21 | 2024-01-04 | キヤノン株式会社 | 推論装置、学習装置、推論方法、学習方法、及びプログラム |
US11941853B2 (en) | 2020-11-09 | 2024-03-26 | Canon Kabushiki Kaisha | Apparatus and method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5968098B2 (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
JP6324155B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
EP3755204A1 (en) | Eye tracking method and system | |
JP5127067B2 (ja) | 画像検索装置及び画像検索方法 | |
US9436981B2 (en) | Dictionary creation device, image processing device, image processing system, dictionary creation method, image processing method, and program | |
US9747675B2 (en) | Image processing system | |
KR20090087670A (ko) | 촬영 정보 자동 추출 시스템 및 방법 | |
JP2019016114A (ja) | 画像処理装置、学習装置、フォーカス制御装置、露出制御装置、画像処理方法、学習方法、及びプログラム | |
JP7032913B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP2012174273A (ja) | 画像処理装置及び画像処理方法 | |
JP2012058940A (ja) | 類似画像検索装置、類似画像検索方法およびコンピュータープログラム | |
JP2019096222A5 (ja) | ||
JP6511950B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2016162421A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2015094973A (ja) | 画像処理装置、画像処理方法、画像処理プログラム、及び記録媒体 | |
JP6202938B2 (ja) | 画像認識装置および画像認識方法 | |
JP2018045366A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN110766631A (zh) | 人脸图像的修饰方法、装置、电子设备和计算机可读介质 | |
JP2005332382A (ja) | 画像処理方法および装置並びにプログラム | |
JP2019032654A (ja) | 画像処理装置、及び、画像処理方法、コンピュータプログラム | |
JP2015219756A (ja) | 画像比較方法、装置並びにプログラム | |
TWI730467B (zh) | 影像轉換方法及影像轉換網路 | |
CN112188075B (zh) | 抓拍机、图像处理设备及图像处理方法 | |
JP6950376B2 (ja) | 画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム | |
JP2005352727A (ja) | 人物画像検索装置 |