JP2015507807A - 画像構図変更の品質評価 - Google Patents

画像構図変更の品質評価 Download PDF

Info

Publication number
JP2015507807A
JP2015507807A JP2014551525A JP2014551525A JP2015507807A JP 2015507807 A JP2015507807 A JP 2015507807A JP 2014551525 A JP2014551525 A JP 2014551525A JP 2014551525 A JP2014551525 A JP 2014551525A JP 2015507807 A JP2015507807 A JP 2015507807A
Authority
JP
Japan
Prior art keywords
image
composition
original image
change
comparing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014551525A
Other languages
English (en)
Other versions
JP5846517B2 (ja
Inventor
アンミン・リウ
ウェイシ・リン
ハイ・チェン
チェン−シオン・チャン
Original Assignee
ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ホアウェイ・テクノロジーズ・カンパニー・リミテッド filed Critical ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Publication of JP2015507807A publication Critical patent/JP2015507807A/ja
Application granted granted Critical
Publication of JP5846517B2 publication Critical patent/JP5846517B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/23Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

画像構図変更の品質評価を実施する方法が、原画像と構図変更画像を周波数領域で比較するステップを含む。当該構図変更画像は、原画像で構図変更アルゴリズムを実施することによって取得される。本開示はまた、画像構図変更の品質評価を実施し、原画像と構図変更画像を空間領域で比較するように構成されたプロセッサを備えた装置を含む。当該構図変更画像は、原画像で構図変更アルゴリズムを実施することによって取得され、原画像と構図変更画像を空間領域で比較するステップは、原画像と構図変更画像を比較して、画像間の形状歪みの量を決定するステップを含む。

Description

関連出願の記載
本願は、発明の名称を「画像構図変更の品質評価」とした2012年12月13日出願の米国非仮特許出願第13/713,110号の利益を主張し、引用によりその全体が再掲されたかのように本明細書に組み込む。
多種多様なスクリーン・サイズと解像度を含む多種多様なモバイルの存在により、画像構図変更の必要性が増している。画像構図変更は、画像をリサイズするためのアルゴリズムを含むことがある。単一の画像は、様々なユーザ装置(UE)のスクリーンで使用するための複数の解像度に構図変更されうる。画像構図変更により、画像データの欠落、形状歪み、またはその両方が生ずるおそれがあり、好ましくない画像が生じうる。
画像データの紛失および/または破壊を最小限にしようとして様々な画像構図変更アルゴリズムが開発されてきたが、どの画像構図変更アルゴリズムも全ての場合において他の画像構図変更アルゴリズムより優れているわけではない。
1実施形態では、本発明は、原画像と構図変更画像を周波数領域で比較するステップであって、当該構図変更画像は前記原画像に対して構図変更アルゴリズムを実施することによって取得されるステップを含む、画像構図変更の品質評価を実施する方法を含む。
別の実施形態では、本発明は、画像構図変更の品質評価を実施し、原画像と原画像に対して構図変更アルゴリズムを実施することによって取得される構図変更画像とを空間領域で比較するように構成されたプロセッサであって、原画像と構図変更画像を空間領域で比較することは、原画像と構図変更画像を比較して、画像間の形状歪みの量を決定するステップを含むプロセッサを備えた装置を含む。
別の実施形態では、本発明はまた、複数の構図変更画像に対して複数の画像構図変更の品質評価スコア・ベクトルを計算し、実験データを用いて適応的に画像構図変更の品質評価スコア融合モデルを学習するように構成されたプロセッサを備えた装置を含む。
これらおよび他の特徴は、添付図面と特許請求の範囲と関連して下記の詳細な説明を検討すればより明らかに理解される。
本発明をより完全に理解するために、以下で簡単な説明を添付図面および詳細な説明と関連して行う。添付図面と詳細な説明では同じ参照番号は同じ部分を表す。
画像構図変更の品質評価のためのシステムの略図である。 例示的な画像の1実施形態の図である。 周波数領域品質スコアを決定するための方法の流れ図である。 周波数領域係数分布の1実施形態のグラフを示す図である。 形状歪み品質スコアを決定するための方法の流れ図である。 例示的な画素変位ベクトルのグラフを示す図である。 局所内容品質スコアを決定するための方法の流れ図である。 グローバル内容品質スコアを決定するための方法の流れ図である。 品質スコア融合モデルを適応的に学習するための方法の流れ図である。 ネットワーク要素(NE)の1実施形態の略図である。 UEの1実施形態の略図である。
先ず、1つまたは複数の実施形態の例示的な実装を以下で提供するが、開示したシステムおよび/または方法を、現在公知であるかまたは現存するかに関わらず、任意数の技術を用いて実装してもよいことは理解される。本開示は決して、本明細書で図示し説明した例示的な設計と実装形態を含む、後述する例示的な実装形態、図面、および技術には限定されず、添付の特許請求の範囲においてその全範囲の均等物に沿って修正してもよい。
本明細書では、画像構図変更の品質評価を行って、どの構図変更アルゴリズムが、ユーザに最も魅力的である構図変更画像をもたらす可能性が最も高いかを判定する方法を開示する。画像の品質を評価する方法は、原画像と構図変更画像を周波数領域と空間領域の両方で比較するステップを含む。両方の画像を周波数領域に変換し、係数の観点から記述してもよい。係数の差分を、周波数領域品質スコア(Qfsc)として量子化してもよい。空間領域では、スケール不変特徴変換(SIFT)アルゴリズムおよび/またはSIFTフロー・アルゴリズムを用いて形状歪みを測定して、原画像と構図変更画像の間の画素の変位度合を決定してもよい。結果の形状歪みを形状歪み品質スコア(Qss)として量子化してもよい。空間領域において、視覚内容変化を局所内容品質スコア(Qslc)として局所的に量子化し、グローバル内容品質スコア(Qsgc)としてグローバルに量子化してもよい。Qfsc、Qss、Qslc、およびQsgcを共に使用して構図変更画像の品質を評価してもよい。品質スコアを重み付けして、全体品質スコア(Q)を実現してもよい。全体品質の式における各品質スコアに与えられる正確な重みを、機械学習を用いて決定してもよい。全体のQを使用して、構図変更アルゴリズムを自動的に評価し、複数の構図変更画像から最高品質の構図変更画像を自動的に選択してもよい。
図1は、画像構図変更の品質評価のためのシステム100の略図である。システム100を、ユーザ装置(UE)、ネットワーク要素(NE)、サーバ、および/または他のコンピュータのようなネットワーク装置で実装してもよい。システム100は、原画像110と複数の関連する構図変更画像112を入力として受信してもよい。これらについては、図2と関連して説明され、メモリ115に格納してもよい。システム100は、画像110と画像112を空間領域130と周波数領域120で比較してもよい。空間領域130は、2次元(2D)および/または3次元(3D)の視覚画像空間において画像を分析するための領域であってもよい。例えば、空間領域で分析した2D画像を、視覚2D空間における画素および/または他の視覚オブジェクトの座標および/または位置の点で分析してもよい。周波数領域120は、時間変動の点で画像を分析するための領域であってもよい。例えば、画像が、強度が変換する複数の色を含んでもよい。空間領域130にわたって繰り返し読み出すと、画像の色強度は時間とともに変化しうる。時間に伴うかかる変化を、周波数領域120で表現してもよい。
システム100は、形状歪みと視覚内容変化を周波数領域120で比較してQfscを決定するように構成された形状歪み及び視覚内容変化測定ユニット140を備えてもよい。これについては、図3に関連して説明する。システム100はまた、形状歪み測定ユニット150、局所視覚内容変化測定ユニット160、および、形状歪みと視覚内容変化を空間領域130で測定するように構成できるグローバル視覚内容変化測定ユニット170を備えてもよい。具体的には、形状歪み測定ユニット150を、形状歪みを測定してQssを決定するように構成してもよい。これについては、図5と関連して説明する。局所視覚内容変化測定ユニット160を、局所視覚内容変化を測定してQslcを測定するように構成してもよい。これについては、図7と関連して説明する。グローバル視覚内容変化測定ユニット170を、グローバル視覚内容変化を測定してQsgcを決定するように構成してもよい。これについては、図8と関連して説明する。システム100はまた、ユニット140、150、160、および170からの品質スコアを統合して構図変更画像のQを決定するように構成された品質因子統合ユニット180を備えてもよい。これについては、図9と関連して説明する。当該システムはまた、画像選択ユニット190を備えてもよい。画像選択ユニット190を、Qを使用して好適な構図変更画像を複数の構図変更画像から自動的に選択するように構成してもよい。
図2は、例示的な画像200の1実施形態である。例示的な画像200は、原画像210(原画像110であってもよい)、構図変更画像221および222(構図変更画像112であってもよい)、ならびに再構築画像230を備えてもよい。上述のように、様々なスクリーン・サイズ、解像度等を有するディスプレイを備える様々なUEおよび/または他の装置と関連して使用するための原画像を自動的に構図変更するのが有利であろう。例えば、システム100が構図変更画像221と222の両方、および/または他の構図変更アルゴリズムから生じた他の画像を原画像210と比較して、どの画像をユーザが最も好む可能性が高いかを自動的に判定してもよい。
原画像210はユーザに表示できる原画像の1例である。システム、例えばシステム100は、原画像210を表示のために構図変更してもよい。画像を小型のサイズに構図変更するために、システムは画素を除去し、画素を変位させ、またはそれらの組合せを行ってもよい。画素の除去はトリミングとも呼ばれ、データ紛失を生じさせうる。画素の変位は、画像の形状歪みを生じさせうる。構図変更画像221が、原画像210のトリミングの結果であってもよい。構図変更画像221は右側221aと左側221bを比較してもよい。図2に示すように、構図変更画像221は、原画像210と比較すると、視覚形状歪みは最小であるかまたは全く存在しない。しかし、構図変更画像221では、原画像210と比較すると、右側221aと左側221bの両側で視覚データが紛失するおそれがある。構図変更画像222は、シーム・カービング・アルゴリズムを用いて原画像210を構図変更した結果であってもよい。図2に示すように、構図変更画像222は原画像210と実質的に同一の視覚データを備えてもよい。しかし、構図変更画像222では、原画像210の画素が水平軸にシフトして画像222を圧縮し、視覚形状歪みをもたらすおそれがある。再構築画像230は、パッチ照合アルゴリズムまたは他の画像構築アルゴリズムを用いて原画像210を構図変更画像221から再構築し、画像パッチを構図変更画像221から再構築し、他の視覚データを原画像210から再構築した結果であってもよい。パッチ照合アルゴリズムが、構造編集のためのランダム一致アルゴリズム(randomized correspondance algorithm)であってもよい。パッチが画像の一部であってもよい。
図3は、例えば、形状歪み及び視覚内容変化測定ユニット140によりQfscを決定するための方法300の流れ図である。ブロック310で、方法300は、原画像110および/または210のような原画像、および構図変更画像112、221、および/または222のような構図変更画像を取得してもよい。ブロック320で、原画像を周波数領域に変換してもよく、ブロック330で、構図変更画像を周波数領域に変換してもよい。原画像と構図変更画像を、空間領域内の各画素を指定の距離にわたる強度値の変化として表現することによって、周波数領域に変換してもよい。変換を、フーリエ変換、離散ウェーブレット変換、または他の変換のような変換によって実現してもよい。画像を周波数領域に変換した結果、複数の係数、例えばhaarウェーブレット、対角サブバンド等を用いて画像を記述することができる。
ブロック340で、原画像と構図変更画像の周波数係数を比較して、空間形状歪みや視覚内容変化のような空間領域内の画像間の差分を決定してもよい。例えば、原画像の周波数係数(f)のヒストグラムを複数の均等に離間したビン(f(i))に分割してもよい。構図変更画像の周波数係数(f)のヒストグラムを、f(i)に対応する複数の均等に離間したビン(f(i))に分割してもよい。当該周波数係数を、各f(i)のそれぞれの対応するf(i)に対する比率の対数を合計し、ビンの数(N)によって当該合計を除すことによって比較してもよい。1実施形態では、100個のビンが存在しうる(例えば、Nを100の値に設定してもよい)。その結果が、周波数領域Qfscにおける品質スコアであってもよい。Qfscは、次式を用いて表現してもよい。
fscを求める式が、2つの分布の差分を測定するために使用できるKullback−Leibler発散に漸近的に接近してもよい。Qfscの式は、3階、4方位の可変ピラミッド・ウェーブレット変換を適用して、画像を複数のサブバンドに配置してもよい。次いで、周波数領域の推定品質を、各サブバンド(Qfsc_sub)からのスコアを集約することによって導出してもよい。自然画像統計を使用して、使用する画像の種類に基づく空間領域内の原画像の画素分布を推定してもよい。自然画像推定は周波数領域では必要でなくともよい。なぜならば、その分布を原画像から直接計算できるからである。Qfscを、人、自然景観、および/または建物や漫画などの人工物の画像のような画像に対して使用してもよい。Qfscは、画像マッチングや画像再構築のようなプロセスに依存しなくともよく、したがって、関連する測定誤差を回避することができる。Qfscを使用して、空間領域の品質スコアに固有な誤差を補償してもよい。
図4は、周波数領域係数分布の1実施形態のグラフ400である。グラフ400は、原画像周波数分布401(例えば、図2の210)、原画像のサイズを半分にするためのトリミングに基づく構図変更画像周波数分布402(例えば、図2の221)、原画像のサイズを半分にするためのシーム・カービングに基づく構図変更画像周波数分布403(例えば、図2の221)、および原画像のサイズを0.75倍にするシーム・カービングに基づく構図変更画像周波数分布404(画像は図示せず)を含んでもよい。グラフ400は係数軸および分布軸を含んでもよい。係数軸は、画像ウェーブレット変換係数の無単位値を表し、分布軸は、かかる係数のパーセント分布(例えば、ヒストグラム)を表してもよい。例えば、原画像周波数分布401においては、画像ウェーブレット変換係数の約14パーセントがほぼゼロである。グラフ400に示すように、原画像周波数分布401は、構図変更画像周波数分布402乃至404よりも高いパーセント頻度のほぼゼロの係数を含んでもよく、その差分は、周波数分布404で表した原画像と周波数分布402乃至404で表した構図変更画像の間の視覚データの変形をそれぞれ示してもよい。401と402乃至404の間の各差分を、各々の関連する構図変更画像のQfscとして測定してもよい。構図変更画像周波数分布が原画像周波数分布401に接近すると、関連するQfscはゼロに接近し、ますます高品質な構図変更画像を示す。
図5は、例えば形状歪み測定ユニット150により形状歪み品質スコアQssを決定するための方法500の流れ図である。ブロック510で、方法500は原画像110および/または210のような原画像、構図変更画像112、221、および/または222のような構図変更画像を取得してもよい。ブロック520で、方法500は原画像と構図変更画像の間の全ての不均一な画像変位を決定してもよい。具体的には、画像を別のサイズに構図変更するとき、画素を変位させて、課されたサイズ要件に対応してもよい。画像部を表示する1群の画素が構図変更の最中に均一に変位するときは、結果の構図変更画像は、原画像の部分と実質的に同一な視覚形状の画像部分を含むことができる。構図変更の最中に不均一な画素変位を受けた画像部分は、視覚形状歪みを生じさせるおそれがある。例えば、線が曲線になることがあり、円が楕円になる可能性がある、等である。ブロック520で、原画像からの画像パッチを空間領域において構図変更画像からの対応する画像パッチと比較して、各パッチにおける不均一な画素変位の量を決定することによって画像間の形状歪みの量を判定してもよい。対応関係を、SIFTフロー・アルゴリズムを用いて決定してもよい。画素の変位を、各画素の垂直変位の二乗と各画素の水平変位の二乗の和の平方根をとることによって決定してもよい。
ブロック530で、方法500は全ての不均一な画素変位を合計してQssを決定してもよい。原画像からの各パッチの変位を合計し、原画像の画素数で除してQssを決定してもよい。Qssを、次式を用いて表してもよい。
(p)−V(q)とV(p)−V(q)は、それぞれ、原画像の位置pにある画素であってもよい。ここで、qは画素pの空間近傍εである。11×11の空間近傍を使用してもよい。なぜならば、近傍が狭すぎる場合には画素数が形状を形成するのに十分でないかもしれないし、近傍が広すぎる場合には画素が同一の視覚オブジェクトに属さないかもしれないからである。Nは原画像の画素数であってもよい。Qssは構図変更画像の形状歪みを表してもよく、大きな値のQssは、より凝集した形状歪みを表す。
図6は、例示的な画素変位ベクトルのグラフ600を示す図である。グラフ610は、構図変更画像パッチの不均一な画素変位の1例をベクトル形式で示してもよい。グラフ610では、単一の画像パッチにおける画素を構図変更の最中に同一方向にシフトさせてあってもよいが、当該シフトの強度が画素から画素へと変化してもよい。グラフ610は、画像歪みを生じ構図変更画像の大きな総Qssに寄与しうる不均一な画素変位を示してもよい。対照的に、グラフ620は、構図変更画像パッチの均一な画素変位の1例をベクトル形式で示してもよい。グラフ620に示すように、パッチ内の全画素が、あまり画像歪みを生じさせない構図変更の最中に同一方向に同程度だけシフトしてもよい。グラフ620は、構図変更画像に対する総Qss値を実質的に増加させなくともよい。
図7は、例えば局所視覚内容変化測定ユニット160により局所内容品質スコアQslcを決定するための方法700の流れ図である。ブロック710で、方法700は、原画像110および/または210のような原画像、構図変更画像112、221、および/または222のような構図変更画像を取得してもよい。ブロック720で、方法700は構図変更画像と原画像の両方に基づいて再構築画像を生成してもよい。視覚内容変化を、双方向類似度を用いてモデル化して、構図変更画像において新たに生成された視覚データ(例えば、追加された視覚アーチファクト)と構図変更プロセスで失しなわれた視覚データの存在を判定してもよい。新たに生成された視覚データと視覚データの紛失の両方を判定するために、再構築画像を、ブロック720で原画像と構図変更画像の両方から生成してもよい。再構築画像を、パッチ照合アルゴリズムを用いて構図変更画像および/または原画像からのパッチおよび/または情報から生成してもよい。例えば、以下のパッチ照合アルゴリズムを使用して、構図変更画像から再構築画像を生成してもよい。
(p)は、位置pにある原画像からの画像パッチであってもよい。P(q)は、位置qにある構図変更画像からの画像パッチであってもよい。原画像からの再構築画像を、同様な手続きを用いて生成してもよい。
ブロック730で、原画像と再構築画像の間の画素値の二乗誤差和(SSD)を、構図変更画像からのパッチを用いて決定してもよく、その結果を原画像の画素数で除してもよい。ブロック730で、画素値の平均SSDを原画像と構図変更画像からの画像パッチを用いて生成した再構築画像の間の国際照明委員会(CIE)L*a*b*(CIELAB)色空間において決定することによって、局所的な内容変化を決定してもよい。ブロック740で、構図変更画像と再構築画像の間の画素値のSSDを、原画像からのパッチを用いて決定してもよく、その結果を、関連する構図変更画像の画素数で除してもよい。ブロック740で、構図変更画像と原画像からの画像パッチを用いて生成した再構築画像との間のCIELAB色空間における画素値の平均SSDを判定してもよい。ブロック750で、ブロック730と740の結果を加算してQslcを決定してもよい。原画像と再構築画像の間の画素値の平均SSDを、ブロック750の構図変更画像と再構築画像の間の画素値の平均SSDに加算してQslcを決定してもよい。Qslcを、次式を用いて表してもよい。
は構図変更画像の画素数であってもよく、Nは原画像の画素数であってもよい。Oは、構図変更画像からの画像パッチを用いて生成した再構築画像であってもよく、原画像と同じサイズであってもよい。Rは、原画像からの画像パッチを用いて生成した再構築画像であってもよく、再構築画像と同じサイズであってもよい。Dは、距離測定値であってもよく、CIELAB色空間内の画素値のSSDであってもよい。Qslc式の第1の部分により、構図変更の最中に失われた視覚内容の量を測定してもよい。Qslc式の第2の部分により、構図変更プロセスの最中に追加された視覚内容の量を測定してもよい。Qslcの値が大きければ、より多くの局所視覚内容変化を表すことができる。
図8は、例えばグローバル視覚内容変化測定ユニット170により、グローバル内容品質スコアQsgcを決定するための方法800の流れ図である。ブロック810で、方法800は、原画像110および/または210のような原画像、構図変更画像112、221、および/または222のような構図変更画像を取得してもよい。ブロック820で、方法800は、構図変更画像に関連するエッジ・ヒストグラム(EH)記述子を、原画像からの対応するEH記述子から差し引いて、画像EH記述子における差分を決定してもよい。画像をEH記述子の観点から記述してもよい。EH記述子を、画像テキスチャを記述するために使用し、画像抽出やシーン変化検出動作において使用してもよい。構図変更を通じた視覚データの紛失の結果、原画像と構図変更画像の間でEH記述子が変化しうる。EH記述子は画像をグローバルに記述してもよい。例えば、所与の画像を4×4の部分画像に細分割してもよい。EHは、垂直、水平、45度、135度、および部分画像ごとの等方図に対応して、部分画像ごとに5つのビンを含んでもよく、このようなEHを計算することができる。EH記述子の長さが80個のビンであってもよく、画像解像度と独立であってもよい。EH記述子は、グローバル内容変化を測定するのに有用でありうる。なぜならば、グローバル視覚内容変化はシーン変化の最中に発生する可能性があり、他の多数のシーン変化検出器が画像解像度に独立でありうるからである。EH記述子を使用してQsgcを決定してもよい。Qsgcを、次式を用いて表してもよい。
は原画像のEH記述子を表してもよく、Hは構図変更画像のEH記述子を表してもよく、EH記述子の差分の絶対値を合計してQsgcを決定してもよい。Qsgcの値が増加することが、グローバル視覚内容変化の量が増大することを示してもよい。ブロック830で、EH記述子の差分の絶対値を合計してQsgcを決定してもよい。
図9は、品質スコア融合モデルを適応的に学習するための方法900の流れ図である。当該モデルを、品質因子統合ユニット180により使用して、Qfsc、Qss、Qslc、およびQsgcから全体スコア品質スコアQを決定してもよい。Qの値を、Qfsc、Qss、Qslc、およびQsgcを線形および/または非線形に加算および/または乗算することによって決定してもよい。しかし、単純な融合方法では、ユーザ応答を予測するアルゴリズムを十分に表現できないこともある。マシン学習を使用して、実験データに基づいてQに対する融合モデルを決定してもよい。例えば、実験データが、ユーザにより構図変更画像に与えられた主観的なスコアを含んでもよい。方法900は、ブロック910で、計算によりまたは別のユニットから受信することによって、所与の構図変更画像に対する品質スコア・ベクトル(例えば、Qfsc、Qss、Qslc、およびQsgc)を取得してもよい。ユーザは、様々な視覚コンテキストにおいて構図変更画像に対して様々に応答してもよい。例えば、ユーザは、形状歪みを有する人間の顔を含む画像に対して、形状歪みを有する地理的特徴を含む画像よりも否定的に応答してもよい。ブロック920で、構図変更画像のコンテキストを決定することにより、適切な実験データを使用することができる。例えば、画像認識ソフトウェアおよび/またはアルゴリズムを使用して、画像のコンテキストが、人の画像、風景の画像、構造の画像等を含むかどうかを判定してもよい。
ブロック930で、システムは、構図変更画像と同じコンテキストの画像からの実験データに基づいて品質因子融合モデルを適応的に学習してもよい。様々なシステムを使用して、品質因子融合モデル、例えばサポート・ベクトル縮退(SVR)アルゴリズムおよび/またはエクストリーム学習マシン(ELM)アルゴリズムを適応的に学習してもよい。
例えば、SVRが、トレーニング・データ集合Q_=(Qss_i、Qslc_i、Qsgc_i、Qfsc_i)を用いて品質因子融合モデルを適応的に学習してもよい。ここで、i=1,2,3,・・・は、i番目の構図変更画像から取得した4個の品質スコアから成る複数のベクトルを示し、MOSl_iはi番目の構図変更画像に対する主観で与えられた評価スコアの平均を表す。トレーニング・プロセスを、最適化問題を重みベクトルWとバイアス定数bで解くように表現してもよい。即ち、
f(x)=Wφ(x)+b
ここで、
である。ξ1_iは上位トレーニング誤差であり、ξ2_iは、閾値であるεで定義したε無反応チューブを受ける下位トレーニング誤差であってもよい。1/2WWは、関数f(.)を平滑化して過度な適合を回避するために使用される正規化項であってもよい。Ce<0は、誤差項のペナルティ・パラメータであってもよい。データ点がMOSl_i式を満たす場合には、当該データ点はε無反応チューブ内部にあることができ、当該点をSVRによりサポート・ベクトル(SV)として選択することができる。したがって、
f(x)=Wφ(x)+b
と書き換えることができる。ここで、nsvはSVの数であり、K(Qsv_i、x)=φ(Qsv_iφ(x)はカーネル関数であってもよい。ブロック940で、品質因子融合モデルを使用して、品質スコア・ベクトルに基づいて構図変更画像に対するQを計算してもよい。
図10は、NE1000の1実施形態の略図である。NE1000は、ネットワーク内のノード、例えば、サーバとして機能してもよい。NEという用語が広範囲の装置を包含し、NE1000はその1例にすぎないことは当業者には理解される。NE1000は、議論を明確にするために含めたものであり、本開示の適用を特定のNEの実施形態またはNEの実施形態のクラスに限定しようとするものでは決してない。本開示で説明した機能/方法の少なくとも一部、例えばシステム100、ユニット140、150、160、170、および/もしくは180、ならびに/または方法300、500、700、800、および/または900の全体または一部を、ネットワーク装置またはNE1000のような構成要素で実装してもよい。例えば、本開示における機能/方法を、ハードウェア、ファームウェア、および/またはハードウェア上で実行するためにインストールされたソフトウェアを用いて実装してもよい。NE1000は、ネットワークを介してフレームを転送する任意の装置、例えば、スイッチ、ルータ、ブリッジ、サーバ等であってもよい。図10に示すように、NE1000は送受信器(Tx/Rx)1010を備えてもよい。送受信器(Tx/Rx)1010は、送信器、受信器、またはその両方であってもよい。Tx/Rx1010を、他のノードからフレームを送受信するための複数の下流ポート1020に接続し、他のノードからフレームを送受信するための上流ポート1050に接続してもよく、プロセッサ1030をTx/Rx1010に接続してフレームを処理し、かつ/または、どのノードにフレームを送信するかを判定してもよい。プロセッサ1030が、1つまたは複数のマルチコア・プロセッサおよび/またはメモリ装置1032を備えてもよい。メモリ装置1032はデータ記憶部として機能してもよい。プロセッサ1030を汎用プロセッサとして実装してもよく、プロセッサ1030が、1つまたは複数の特定用途向け集積回路(ASIC)および/またはデジタル信号プロセッサ(DSP)の一部であってもよい。下流ポート1020および/または上流ポート1050が、電気送受信コンポーネントおよび/または光送受信コンポーネントを含んでもよい。NE1000が、経路判定を行うルーティング・コンポーネントであってもなくてもよい。
図11は、UE1100の1実施形態の略図である。UE1100は、音声機能とデータ通信機能を有する双方向無線通信装置を備えてもよい。幾つかの態様では、音声通信機能は任意である。UE1100は一般に、他のコンピュータ・システムとインターネット上で通信する機能を有する。提供される厳密な機能に応じて、UE1100を、例えば、データ・メッセージング装置、双方向ページャ、無線電子メール装置、データ・メッセージング機能を備えた携帯電話、無線インターネット機器、無線装置、スマート・フォン、モバイル装置、および/またはデータ通信装置と称してもよい。
UE1100は、二次記憶部1121、ROM(read only memory)1122、RAM(random access memory)1123を含むメモリ装置と通信するプロセッサ1120(中央演算装置またはCPUとも呼ばれる)を備えてもよい。プロセッサ1120を、1つまたは複数のCPUチップ、1つまたは複数のコア(例えば、マルチコア・プロセッサ)を有する汎用プロセッサとして実装してもよく、または、プロセッサ1120が1つまたは複数のASICおよび/またはDSPの一部であってよい。プロセッサ1120を、本明細書で説明した機構、例えばシステム100、ユニット140、150、160、170、および/もしくは180、ならびに/または方法300、500、700、800、および/もしくは900の全部または一部を実装するように構成してもよく、ハードウェア、ソフトウェア、ファームウェア、またはそれらの組合せを用いて実装してもよい。
二次記憶部1121を、1つまたは複数の固体装置、ディスク・ドライブ、および/または他のメモリ・タイプから構成してもよく、データの不揮発性記憶に使用し、RAM1123が全ての作業データを保持するのに十分大きくない場合にはオーバ・データ記憶装置として使用される。二次記憶部1121を使用して、RAM1123にロードされたプログラムを、かかるプログラムが実行のために選択されたときに格納してもよい。ROM1122を使用して、プログラム実行の最中に読み取られる命令とデータを格納してもよい。ROM1122が、不揮発性メモリ装置であってもよく、二次記憶部1121の大きなメモリ容量と比べて小さなメモリ容量を有してもよい。RAM1123を使用して、揮発性データを格納し、場合によっては命令を格納してもよい。ROM1122とRAM1123の両方へのアクセスは、二次記憶部1121より高速であってもよい。
UE1100は、ネットワーク・アクセス・ポイント1150を介してデータ(例えば、パケット)をネットワークと無線で通信してもよい。ネットワーク・アクセス・ポイント1150をNE1000として実装してもよい。したがって、UE1100が受信器(Rx)1112を備えてもよい。受信器(Rx)1112を、データ(例えば、無線パケットまたはフレーム)を他のコンポーネントから受信するように構成してもよい。受信器1112をプロセッサ1120に接続してもよい。プロセッサ1120を、データを処理し、当該データをどのコンポーネントに送信すべきかを判定するように構成してもよい。UE1100はまた、プロセッサ1120に接続され、例えば、IEEE(Institute of Electrical and Electronics Engineers)802.11、IEEE802.16、3GPP(3rd Generation Partnership Project)、GSM(登録商標)(Global System for Mobile Communications)、または同様な無線プロトコルのようなプロトコルを使用することによって、データを他のコンポーネントに送信するように構成された送信器(Tx)1132を備えてもよい。受信器1112と送信器1132を複数のアンテナ1130に接続してもよい。複数のアンテナ1130を、無線周波数(RF)信号を送受信するように構成してもよい。幾つかの実施形態では、Tx1132とRx1112を、Tx1132とRx1112の両方の機能を備える送受信器により置き換えてもよい。
UE1100はまた、プロセッサ1120に接続された装置ディスプレイ1140を備えてもよい。装置ディスプレイ1140は、その出力をユーザに表示する。UE1100と装置ディスプレイ1140を、データ表現をユーザに表示するように構成してもよい。装置ディスプレイ1120が、CSTN(Color Super Twisted Nematic)ディスプレイ、TFT(thin film transistor)ディスプレイ、TFD(thin film diode)ディスプレイ、OLED(organic light−emitting diode)ディスプレイ、アクティブ・マトリックスOLEDディスプレイ、または他の任意のディスプレイ・スクリーンを備えてもよい。装置ディスプレイ1140が、カラーまたはモノクロで表示してもよく、抵抗膜技術および/または静電容量技術に基づくタッチ・センサを具備してもよい。
UE1100がさらに、プロセッサ1120に接続された入力装置1141を備えてもよい。入力装置1141により、ユーザはコマンドをUE1100に入力することができる。ディスプレイ装置1140がタッチ・センサを備える場合には、ディスプレイ装置1140を入力装置1141と考えてもよい。追加および/または代替として、入力装置1141が、マウス、トラックボール、組込みキーボード、外部キーボード、および/または、UE1100と対話するためにユーザが使用できる他の任意の装置を備えてもよい。
実行可能命令をNE1000にプログラミングおよび/またはロードすることによって、NE1000を部分的に特定のマシンまたは装置、例えば、マルチコア転送アーキテクチャに変換し、本開示で教示した新規な機能をもたせるように、プロセッサ1030、メモリ1032、Tx/Rx1010の少なくとも1つが修正されることは理解される。同様に、実行可能命令をUE1100にプログラミングおよび/またはロードすることによって、UE1100を部分的に特定のマシンまたは装置、例えば、マルチコア転送アーキテクチャに変換し、本開示で教示した新規な機能をもたせるように、プロセッサ1102、ROM1122、RAM1123、二次記憶部1121、送信器1132、および/または受信器1112の少なくとも1つが修正されることは理解される。実行可能ソフトウェアをコンピュータにロードすることで実装できる機能を公知の設計規則によりハードウェア実装に変換できることは、電気工学とソフトウェア工学の分野では基本的である。コンセプトをソフトウェアとハードウェアのどちらで実装するかの決定は、一般に、ソフトウェア領域からハードウェア領域への変換で関与する問題よりも、設計の安定性と製造すべきユニットの数の考慮に左右される。一般に、依然として頻繁な変更を受ける設計はソフトウェアで実装するのが好適であろう。なぜならば、ハードウェア実装をリスピンするのはソフトウェア設計をリスピンするよりコストがかかるからである。一般に、大量に生産される安定的な設計はハードウェア、例えばASICで実装するのが好適でありうる。なぜならば、大量生産では、ハードウェア実装の方がソフトウェア実装よりコストがかからないからである。しばしば、設計はソフトウェアの形で開発され試験され、公知な設計規則により、ソフトウェアの命令を配線した特定用途向け集積回路での等価なハードウェア実装に後に変換される。新たなASICにより制御されるマシンが特定のマシンまたは装置であるのと同様に、実行可能命令でプログラムおよび/またはロードされたコンピュータを特定のマシンまたは装置とみなしてもよい。
少なくとも1つの実施形態を開示した。当業者が行う実施形態(複数可)および/または実施形態(複数可)の機能の変形、組合せ、および/または修正は本開示の範囲内にある。実施形態(複数可)の機能を組み合わせ、統合し、かつ/または省略することから生ずる代替的な実施形態も本開示の範囲内にある。数値範囲または数値限定を明示した場合には、かかる明示的な範囲または限定は、明示的に述べた範囲または限定に入る同様な大きさの反復的な範囲または限定を含む(例えば、約1から約10は2、3、4等を含み、0.10より大きいとは、0.11、0.12、0.13等を含む)と理解すべきである。例えば、下限Rと上限Rを有する数値範囲を開示したときは常に、当該範囲に入る任意の数が具体的に開示される。特に、当該範囲に入る以下の数値が具体的に開示される。即ち、R=R+k*(R−R)である。ここで、kは、1パーセントの増分で1パーセントから100パーセントの範囲の変数である。即ち、kは、1パーセント、2パーセント、3パーセント、4パーセント、7パーセント、・・・、70パーセント、71パーセント、72パーセント、・・・、97パーセント、96パーセント、97パーセント、98パーセント、99パーセント、または100パーセントである。さらに、上で定義した2つのRの数値により定義される任意の数値範囲も具体的に開示される。「約」という用語を使用することは、特に明記しない限り、それに続く数値の±10%を意味する。請求項の任意の要素に関して「場合によっては」という用語を使用することは、当該要素が必要であること、あるいは、当該要素が必要でないことを意味し、両方の代替物が特許請求の範囲に入る。備える、含む、および有するといった広い用語を使用することは、〜から構成される、本質的に〜から構成される、および実質的に〜から構成されるといった狭い用語をサポートすると理解すべきである。したがって、保護範囲は上述の説明によっては限定されず、添付の特許請求の範囲により定義され、当該範囲は特許請求の範囲の発明特定事項の全ての均等物を含む。夫々の請求項および全ての請求項は、さらなる開示として本明細書に組み込まれ、諸請求項は本開示の実施形態(複数可)である。本開示における引例の議論は、それが先行技術、特に、本出願の優先日より後の公開日を有する任意の引例であることを認めたものではない。本開示で引用した全ての特許、特許出願、および刊行物の開示は、それらが本開示を補完する例示的な詳細、手続き的な詳細、または他の詳細を提供する範囲で、引用により本明細書に組み込まれる。
本開示では幾つかの実施形態を提供したが、開示したシステムおよび方法を、本開示の趣旨または範囲から逸脱しない他の多数の具体的な形態で具体化してもよいことは理解される。本例は、例示的であって限定的ではないと考えるべきであり、その意図は本明細書で与えた詳細には限定されない。例えば、様々な要素または組合せを別のシステムと組み合わせるかまたは統合してもよく、特定の機能を省略するかまたは実装しなくともよい。
さらに、様々な実施形態で離散的または独立なものとして説明し例示した技術、システム、および方法を、本開示の範囲から逸脱しない他のシステム、モジュール、技術、または方法と組み合わせるかまたは統合してもよい。互いと接続もしくは直接接続または通信するとして図示または説明した他の項目を、電気的、機械的、またはその他の方法で、幾つかのインタフェース、装置、または中間要素を介して間接的に接続または通信してもよい。変形、置換、および代替の他の例は当業者により解明可能であり、本明細書で開示した趣旨と範囲から逸脱せずに実施することができる。
110 原画像
112 構図変更画像
115 メモリ
120 周波数領域
130 空間領域
140 形状歪み及び視覚内容変化測定ユニット
150 形状歪み測定ユニット
160 局所視覚内容変化測定ユニット
170 グローバル視覚内容変化測定ユニット
180 品質因子統合ユニット
190 画像選択ユニット

Claims (26)

  1. プロセッサと、
    命令を含むメモリであって、前記命令は、
    原画像および構図変更画像を取得するステップであって、前記構図変更画像は、前記原画像で構図変更アルゴリズムを実施することによって生成されるステップと、
    前記原画像と前記構図変更画像を周波数領域で比較するステップと、
    を含む、画像構図変更の品質評価を前記プロセッサに実施させるメモリと、
    を備える装置。
  2. 前記原画像と前記構図変更画像を周波数領域で比較するステップは、原画像の周波数係数と構図変更画像の周波数係数を比較するステップを含む、請求項1に記載の装置。
  3. 原画像の周波数係数と構図変更画像の周波数係数を比較するステップは、
    前記原画像の周波数係数を複数の均等に離間したビンf(i)に分割するステップと、
    前記構図変更画像の周波数係数をf(i)に対応する複数の均等に離間したビンf(i)に分割するステップと、
    各f(i)の対応するf(i)に対する比率の対数を合計するステップと、
    前記合計をビンの数で分割するステップと、
    を含む、請求項2に記載の装置。
  4. 原画像の周波数係数と構図変更画像の周波数係数を比較するステップは、整数i=1,2,...,Nに対して、
    を計算するステップであって、Qfsc_subは周波数領域サブバンド品質スコアを示し、Nはビンの数を示すステップを含む、請求項3に記載の装置。
  5. 前記画像構図変更の品質評価は、前記原画像と前記構図変更画像を空間領域で比較するステップをさらに含む、請求項1に記載の装置。
  6. 前記原画像と前記構図変更画像を空間領域で比較するステップは、前記原画像と前記構図変更画像を比較して、前記原画像と前記構図変更画像の間の形状歪みの量を決定するステップを含む、請求項5に記載の装置。
  7. 前記原画像はオブジェクトを表す一群の画素を含み、前記構図変更画像は前記一群の画素を含み、形状歪みは前記原画像と前記構図変更画像の間の画素の不均一変位を含む、請求項6に記載の装置。
  8. 前記原画像と前記構図変更画像の間の形状歪みの量は、
    前記原画像における各画素の変位を、各画素の垂直変位の二乗と各画素の水平変位の二乗の和の平方根をとることによって決定するステップと、
    前記原画像における各画素の変位を合計するステップと、
    前記合計を前記原画像の画素数で除するステップと、
    によって決まる、請求項7に記載の装置。
  9. 前記原画像と前記構図変更画像の間の形状歪みの量は、空間近傍qにある位置pの画素に対して、
    を計算することによって計算され、Qssは形状歪み品質スコアを示し、εは全ての空間近傍を示し、(v(p)−v(q))は水平変位を示し、(v(p)−v(q))は垂直変位を示す、請求項8に記載の装置。
  10. 前記原画像と前記構図変更画像を空間領域で比較するステップはさらに、前記原画像と前記構図変更画像を比較して前記原画像と前記構図変更画像の間の局所的な内容変化を決定するステップを含む、請求項6に記載の装置。
  11. 前記原画像と前記構図変更画像の間の局所的な内容変化は、
    前記原画像と前記構図変更画像からの画像パッチを用いて作成した再構築画像との間の国際照明委員会(CIE)L*a*b*(CIELAB)色空間における画素値の平均二乗誤差和(SSD)を決定するステップと、
    前記構図変更画像と前記原画像からの画像パッチを用いて生成した再構築画像との間のCIELAB色空間における画素値の平均SSDを決定するステップと、
    前記原画像と再構築画像の間の画素値の前記平均SSDを、前記構図変更画像と再構築画像の間の画素値の前記平均SSDに追加するステップと、
    により決まる、請求項10に記載の装置。
  12. 前記原画像と前記構図変更画像の間の局所的な内容変化は、
    を計算することによって決まり、Qslcは局所視覚内容変化品質スコアを示し、Nは前記原画像の画素数を示し、Nは前記構図変更画像の画素数を示し、Oは前記原画像を示し、Rは前記構図変更画像を示し、OはOのサイズのRからの画像パッチを用いて生成した再構築画像を示し、RはRのサイズのOからの画像パッチを用いて生成した再構築画像を示し、D()は画素値の前記SSDを決定する関数を示す、
    請求項11に記載の装置。
  13. 前記原画像と前記構図変更画像を空間領域で比較するステップは、前記原画像と前記構図変更画像を比較して前記原画像と前記構図変更画像の間のグローバル内容変化を決定するステップをさらに含む、請求項10に記載の装置。
  14. 前記原画像は複数のエッジ・ヒストグラム(EH)記述子により記述され、前記構図変更画像は前記原画像の前記EH記述子に対応する複数のEH記述子により記述され、前記原画像と前記構図変更画像の間のグローバル内容変化は、
    夫々の原画像のEH記述子の絶対値から夫々の対応する構図変更画像EH記述子を差し引いたものを決定するステップと、
    前記絶対値を合計するステップと、
    により決まる、請求項13に記載の装置。
  15. 前記原画像と前記構図変更画像の間のグローバル内容変化は、整数i=1,2,...,80に対して、
    を計算することによって決まり、Hは前記原画像に対するEH記述子を示し、Hは前記構図変更画像のEH記述子を示す、請求項14に記載の装置。
  16. プロセッサと、
    命令を含むメモリであって、前記命令は前記プロセッサに、
    原画像と、前記原画像で構図変更アルゴリズムを実施することによって生成される構図変更画像とを取得させ、
    前記原画像と前記構図変更画像を空間領域で比較することにより画像構図変更の品質評価を実施させる、
    メモリと、
    を備え、
    前記原画像と前記構図変更画像を空間領域で比較することは、前記原画像と前記構図変更画像を比較して、前記原画像と前記構図変更画像の間の形状歪みの量を決定することを含む、
    装置。
  17. 前記原画像はオブジェクトを表す一群の画素を含み、前記構図変更画像は前記一群の画素を含み、形状歪みは前記原画像と前記構図変更画像の間の画素の不均一変位を含む、請求項16に記載の装置。
  18. 前記原画像と前記構図変更画像の間の形状歪みの量は、
    前記原画像における各画素の変位を、各画素の垂直変位の二乗と各画素の水平変位の二乗の和の平方根をとることによって決定するステップと、
    前記原画像における各画素の変位を合計するステップと、
    前記合計を前記原画像の画素数で除するステップと、
    により決まる、請求項17に記載の装置。
  19. 前記プロセッサは、前記原画像と前記構図変更画像を周波数領域で比較するようにさらに構成される、請求項16に記載の装置。
  20. 前記原画像と前記構図変更画像を空間領域で比較することは、前記原画像と前記構図変更画像を比較して前記原画像と前記構図変更画像の間の局所的な内容変化を決定することをさらに含む、請求項16に記載の装置。
  21. 前記原画像と前記構図変更画像を空間領域で比較することは、前記原画像と前記構図変更画像を比較して前記原画像と前記構図変更画像の間のグローバル内容変化を決定することをさらに含む、請求項20に記載の装置。
  22. 複数の構図変更画像に対して、複数の画像構図変更の品質評価スコア・ベクトルを計算するステップと、
    実験データを用いて適応的に画像構図変更の品質評価スコア融合モデルを学習するステップと、
    を含む、方法。
  23. 前記画像構図変更の品質評価スコア・ベクトルはそれぞれ、周波数領域サブバンド品質スコア(Qfsc_sub)、形状歪み品質スコア(Qss)、局所視覚内容変化品質スコア(Qslc)、およびグローバル視覚内容変化品質スコア(Qsgc)を含む、請求項22に記載の方法。
  24. 適応的に画像構図変更の品質評価スコア融合モデルを学習する前に各構図変更画像のコンテキストを決定するステップをさらに含む、請求項23に記載の方法。
  25. 適応的に画像構図変更の品質評価スコア融合モデルを学習するステップは、サポート・ベクトル縮退(SVR)アルゴリズムを使用するステップを含む、請求項24に記載の方法。
  26. 適応的に画像構図変更の品質評価スコア融合モデルを学習するステップは、エクストリーム学習マシン(ELM)アルゴリズムを使用するステップを含む、請求項24に記載の方法。
JP2014551525A 2012-12-13 2013-12-11 画像構図変更の品質評価 Active JP5846517B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/713,110 2012-12-13
US13/713,110 US9025910B2 (en) 2012-12-13 2012-12-13 Image retargeting quality assessment
PCT/CN2013/089148 WO2014090166A1 (en) 2012-12-13 2013-12-11 Image retargeting quality assessment

Publications (2)

Publication Number Publication Date
JP2015507807A true JP2015507807A (ja) 2015-03-12
JP5846517B2 JP5846517B2 (ja) 2016-01-20

Family

ID=50930936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014551525A Active JP5846517B2 (ja) 2012-12-13 2013-12-11 画像構図変更の品質評価

Country Status (5)

Country Link
US (1) US9025910B2 (ja)
EP (1) EP2839389B1 (ja)
JP (1) JP5846517B2 (ja)
CN (1) CN105009107B (ja)
WO (1) WO2014090166A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015164724A1 (en) * 2014-04-24 2015-10-29 Arizona Board Of Regents On Behalf Of Arizona State University System and method for quality assessment of optical colonoscopy images
CN104700078B (zh) * 2015-02-13 2018-06-08 武汉工程大学 一种基于尺度不变特征极限学习机的机器人场景识别方法
US10503999B2 (en) 2015-03-24 2019-12-10 Hrl Laboratories, Llc System for detecting salient objects in images
CN106447654B (zh) * 2016-09-12 2019-03-01 中国科学技术大学 基于统计相似性和双向显著性保真度的图像重定向质量评价方法
US10834406B2 (en) * 2016-12-12 2020-11-10 Netflix, Inc. Device-consistent techniques for predicting absolute perceptual video quality
US11151472B2 (en) 2017-03-31 2021-10-19 At&T Intellectual Property I, L.P. Dynamic updating of machine learning models
WO2018186991A1 (en) * 2017-04-04 2018-10-11 Board Of Regents, The University Of Texas System Assessing quality of images or videos using a two-stage quality assessment
EP3635631A4 (en) * 2017-06-07 2021-03-03 HRL Laboratories, LLC SYSTEM FOR THE DETECTION OF HIGHLIGHTS IN IMAGES
US11902369B2 (en) * 2018-02-09 2024-02-13 Preferred Networks, Inc. Autoencoder, data processing system, data processing method and non-transitory computer readable medium
CN110458792B (zh) * 2018-05-04 2022-02-08 北京眼神科技有限公司 人脸图像质量的评价方法及装置
US11128869B1 (en) * 2018-10-22 2021-09-21 Bitmovin, Inc. Video encoding based on customized bitrate table
CN111311486A (zh) * 2018-12-12 2020-06-19 北京沃东天骏信息技术有限公司 用于处理图像的方法和装置
CN109978858B (zh) * 2019-03-27 2021-02-19 华南理工大学 一种基于前景检测的双框架缩略图像质量评价方法
US10904174B1 (en) 2019-07-03 2021-01-26 International Business Machines Corporation Screen size-based pictorial message translation
CN111340758B (zh) * 2020-02-17 2023-08-11 天津中科智能识别产业技术研究院有限公司 一种基于深度神经网络的高效虹膜图像质量评价新方法
CN111524123B (zh) * 2020-04-23 2023-08-08 北京百度网讯科技有限公司 用于处理图像的方法和装置
CN112766178B (zh) * 2021-01-22 2023-06-23 广州大学 基于智能除虫系统的病虫定位方法、装置、设备及介质
CN113962855B (zh) * 2021-06-07 2024-09-13 长春理工大学 一种组合式卷积网络的卫星图像超分辨率重建方法、装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11266469A (ja) * 1998-03-18 1999-09-28 Toshiba Corp 画像評価装置
JP2012521708A (ja) * 2009-03-26 2012-09-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 色周波数に基づく顕著性マップを用いて画像を修正する方法及び装置
US8280187B1 (en) * 2008-07-31 2012-10-02 Adobe Systems Incorporated Seam carving and expansion of images with color frequency priority

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101055560B (zh) 2006-04-12 2010-05-12 株式会社理光 一种打印质量评估方法和评估系统
US8180177B1 (en) 2008-10-13 2012-05-15 Adobe Systems Incorporated Seam-based reduction and expansion of images using parallel processing of retargeting matrix strips
US9082203B2 (en) 2009-12-10 2015-07-14 Harris Corporation Image processing system for image resizing based upon operational feedback parameters and related methods

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11266469A (ja) * 1998-03-18 1999-09-28 Toshiba Corp 画像評価装置
US8280187B1 (en) * 2008-07-31 2012-10-02 Adobe Systems Incorporated Seam carving and expansion of images with color frequency priority
JP2012521708A (ja) * 2009-03-26 2012-09-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 色周波数に基づく顕著性マップを用いて画像を修正する方法及び装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JPN6015025377; 三柴 数、池原 雅章: '"画素の接続関係を考慮した非線形画像リサイズ"' 電子情報通信学会論文誌 Vol.J94-D, No.1, 20110101, pp.356-364, 社団法人電子情報通信学会 *
JPN6015025379; 三柴 数、池原 雅章: '"ブロックベースシームカービングを用いた画像のリサイズ"' 電子情報通信学会論文誌 Vol.J93-A, No.9, 20100901, pp.605-612, 社団法人電子情報通信学会 *
JPN6015025384; Lin Ma et al.: '"Image Retargeting Quality Assessment: A Study of Subjective Scores and Objective Metrics"' IEEE Journal of Selected Topics in Signal Processing Vol.6, No.6, 20120807, pp.626-639, IEEE *
JPN6015042815; 斉藤 文彦、佐藤 雅大: '"山岳写真の視覚的構図に与える画像特徴量の解析と構図設定法"' 画像電子学会誌 Vol.36, No.4, 20070725, pp.492-499, 画像電子学会 *
JPN7015001741; Zhou Wang, Eero P. Simoncelli: '"Reduced-Reference Image Quality Assessment Using A Wavelet-Domain Natural Image Statistic Model"' Proceedings of SPIE Vol.5666, 20050117, pp.149-159, SPIE *

Also Published As

Publication number Publication date
EP2839389B1 (en) 2016-10-26
US9025910B2 (en) 2015-05-05
EP2839389A4 (en) 2015-06-10
US20140169662A1 (en) 2014-06-19
CN105009107B (zh) 2018-10-09
CN105009107A (zh) 2015-10-28
WO2014090166A1 (en) 2014-06-19
JP5846517B2 (ja) 2016-01-20
EP2839389A1 (en) 2015-02-25

Similar Documents

Publication Publication Date Title
JP5846517B2 (ja) 画像構図変更の品質評価
CN110136056B (zh) 图像超分辨率重建的方法和装置
US9342870B2 (en) Tree-based linear regression for denoising
Zhang et al. No-reference image quality assessment based on log-derivative statistics of natural scenes
US9852353B2 (en) Structure aware image denoising and noise variance estimation
WO2018090937A1 (zh) 图像处理方法、终端及存储介质
US20140126808A1 (en) Recursive conditional means image denoising
US20140355899A1 (en) Video enhancement using related content
WO2018082308A1 (zh) 一种图像处理方法及终端
CN110956131A (zh) 单目标追踪方法、装置及系统
CN105225222A (zh) 对不同图像集的感知视觉质量的自动评估
de Jesus et al. Super-resolution via particle swarm optimization variants
WO2022206729A1 (zh) 视频封面选择方法、装置、计算机设备和存储介质
Tian et al. Joint image registration and super-resolution from low-resolution images with zooming motion
TW201222477A (en) Method for adjusting parameters for video object detection algorithm of a camera and the apparatus using the same
Lin et al. Recent advances and challenges of visual signal quality assessment
CN113822871A (zh) 基于动态检测头的目标检测方法、装置、存储介质及设备
CN113486939A (zh) 一种处理图片的方法、装置、终端及存储介质
Jain et al. Iterative solvers for image denoising with diffusion models: A comparative study
CN111932466A (zh) 一种图像去雾方法、电子设备及存储介质
Najim et al. FSPE: Visualization of hyperspectral imagery using faithful stochastic proximity embedding
CN112763030B (zh) 一种称重方法、装置、设备及存储介质
Gao et al. Automated parameter tuning for tone mapping using visual saliency
CN115272428A (zh) 图像对齐方法、装置、计算机设备和存储介质
KR101454692B1 (ko) 객체 추적장치 및 그 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151027

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151112

R150 Certificate of patent or registration of utility model

Ref document number: 5846517

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250