JP5044518B2 - 画像処理装置及びコンピュータ端末 - Google Patents

画像処理装置及びコンピュータ端末 Download PDF

Info

Publication number
JP5044518B2
JP5044518B2 JP2008238333A JP2008238333A JP5044518B2 JP 5044518 B2 JP5044518 B2 JP 5044518B2 JP 2008238333 A JP2008238333 A JP 2008238333A JP 2008238333 A JP2008238333 A JP 2008238333A JP 5044518 B2 JP5044518 B2 JP 5044518B2
Authority
JP
Japan
Prior art keywords
frame
signal
unit
value
image signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008238333A
Other languages
English (en)
Other versions
JP2010074408A (ja
Inventor
弘史 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008238333A priority Critical patent/JP5044518B2/ja
Priority to US12/478,093 priority patent/US8102912B2/en
Publication of JP2010074408A publication Critical patent/JP2010074408A/ja
Application granted granted Critical
Publication of JP5044518B2 publication Critical patent/JP5044518B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/533Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

本発明は、TV(Total Variation)法に基づき、動画像を構成する各フレームの分離演算に関する。
従来、動画像を構成するフレームの分離手法として、TV法が知られている。フレームに対してTV法に基づく信号分離演算を実行すると、当該フレームは骨格信号成分とテクスチャ(変動)信号成分とに分離される。
例えば、特許文献1記載には、TV法を用いて原画像をカートゥーン画像uとテクスチャ画像vに分解し、カートゥーン画像uを用いて動きベクトルを求める技術が開示されている。
特開2008−27221号公報
TV法は、繰り返し処理を利用した非線形最適化手法の1つであって、繰り返し回数には経験的/実験的に求められた値が設定されることが多い。しかしながら、動画像を構成するフレームに対してTV法に基づく処理を行う際、適切な初期値を定めなければ、繰り返し回数(演算量)を削減したとしても信号分離の精度を維持するのが難しく、特許文献1では、TV法を利用する画像処理装置は記載されているものの、どのような初期値が適切であるかという点は検討されていない。
従って、本発明は動画像を構成するフレームにTV法を用いる場合、適切な初期値を定めることにより、信号の分離精度を維持しつつ信号分離演算の演算量を削減可能な画像処理装置を提供することを目的とする。
本発明の一態様に係る画像処理装置は、符号化された複数のフレームが多重化された符号化ストリームを復号し、フレームを得るデコーダと、前記フレームを参照フレームとして記憶する記憶部と、前記フレームに動き探索処理を行って、当該フレームと前記記憶部に記憶されている参照フレームとの間の動きベクトルを決定する動き探索部と、前記動き探索処理の結果に基づき、前記フレームと参照フレームとの間の相関値、及び前記フレームに対しTV法に従う信号分離演算を繰り返し実行する回数を示す繰り返し回数を決定する決定部と、前記相関値に応じて、0ベクトル又は前記動き探索部で決定された動きベクトルに基づいて得られたテクスチャ画像の勾配信号値を初期勾配信号値として生成する生成部と、前記初期勾配信号値を初期値として、前記フレームに対して前記繰り返し回数だけ前記信号分離演算を繰り返し実行し、当該フレームを第1の骨格画像信号及び第1のテクスチャ画像信号に分離する分離部と、前記第1の骨格画像信号に対する輪郭強調処理及び前記第1のテクスチャ画像信号に対するノイズ除去処理の少なくとも一方を行って、第2の骨格画像信号及び第2のテクスチャ画像信号を得る画像処理部と、前記第2の骨格画像信号及び前記第2のテクスチャ画像信号を合成し、出力するためのフレームを生成する合成部とを具備する。
本発明の他の態様に係るコンピュータ端末は、記憶部と;符号化された複数のフレームが多重化された符号化ストリームを復号し、フレームを得る手段、前記フレームを参照フレームとして前記記憶部に記憶させる手段、前記フレームに動き探索処理を行って、当該フレームと前記記憶部に記憶された参照フレームとの間の動きベクトルを決定する手段、前記動き探索処理の結果に基づき、前記フレームと前記参照フレームとの間の相関の強弱を示す相関値、及び前記フレームに対しTV法に従う信号分離演算を繰り返し実行する回数を示す繰り返し回数を決定する手段、前記相関値に応じて、0ベクトル又は前記動き探索部で決定された動きベクトルに基づいて得られた勾配信号値を初期勾配信号値として生成する手段、前記初期勾配信号値を初期値として、前記フレームに対して前記繰り返し回数だけ前記信号分離演算を繰り返し実行し、当該フレームを第1の骨格画像信号及び第1のテクスチャ画像信号に分離する手段、前記第1の骨格画像信号に対する輪郭強調処理及び前記第1のテクスチャ画像信号に対するノイズ除去処理の少なくとも一方を行って、第2の骨格画像信号及び第2のテクスチャ画像信号を得る手段、前記第2の骨格画像信号及び前記第2のテクスチャ画像信号を合成し、出力するためのフレームを生成する手段として機能するプロセッサと;前記出力するためのフレームを表示する表示部と;を具備する。
本発明によれば、動画像を構成するフレームにTV法を用いる場合、適切な初期値を定めることにより、信号の分離精度を維持しつつ信号分離演算の演算量を削減可能な画像処理装置を提供できる。
以下、図面を参照して、本発明の実施形態について説明する。
(第1の実施形態)
図2に示すように、本発明の第1の実施形態に係る画像処理装置は、デコーダ101、動き探索部102、参照フレームメモリ103、演算パラメータ決定部104、初期勾配信号生成部105、信号分離部106、勾配信号保存部107、輪郭強調処理部108、ノイズ除去部109及び信号合成部110を有する。
デコーダ101には、図示しないチューナまたはファイルシステムから符号化ストリームが入力される。この符号化ストリームは、例えばMPEG−2、MPEG−4、H.264/AVC等の動画像符号化方式に従って符号化されたフレーム(以下、単にフレームと呼ぶ。)が多重化されている。デコーダ101は、上記動画像を構成するフレームの符号化に用いられた符号化方式に対応する復号処理を行って、複数のフレームを得、各フレームを動き探索部102及び信号分離部106に入力する。なお、復号処理によって得たフレームは、例えばYUV形式またはRGB形式で表現される。
また、上記動画像符号化方式において、動きベクトルを利用したフレーム間動き補償予測処理が行われている場合には、通常、当該動きベクトルも符号化されて符号化ストリームに格納されている。従って、デコーダ101は符号化ストリームに多重化されている符号化された動きベクトルを復号することで得た動きベクトル(MVc)を前記フレームと併せて動き探索部102に入力してもよい。
動き探索部102は、デコーダ101からのフレームに対して動き探索処理を行う。このとき、動き探索処理の処理単位は、例えばフレームを所定のブロックサイズ(例えば矩形状)で分割したブロックである。なお、動き探索部102は、デコーダ101から動きベクトルMVcが入力されていればこの動きベクトルMVcによって指定されるブロックを探索中心とすることができる。
動き探索部102は、参照フレームメモリ103から読み出した参照フレームから上記動きベクトルMVcによって特定されるブロックを中心とする所定の動き探索範囲内に含まれる参照ブロックと、上記復号して得たフレームから分割したブロックとのブロックマッチングに基づいて最適な動きベクトルMVtを選択する。なお、このブロックマッチングでは所定のコスト関数に基づいてSAD(差分絶対値和)等のコスト値を順次算出し、このコスト値の最も小さくなる動きベクトルMVtを選択する。このようにして動きベクトルMVtおよびコスト値が求まると、動き探索部102は、動きベクトルMVtを初期勾配信号生成部105に、そして、コスト値を演算パラメータ決定部104に、それぞれ入力する。なお、参照フレームは、時間的に過去のフレームであってもよいし、未来のフレームであってもよい。また、上記参照フレームは、1枚であってもよいし、複数枚であってもよい。
なお、動き探索部102は、デコーダ101から動きベクトルMVcを取得できない場合は、処理対象となるブロックの同一位置を探索中心として動きベクトルMVtを探索すればよい。
参照フレームメモリ103には、動き探索部102からフレームが入力され、動き探索部102の探索で参照される参照フレームとして記憶される。
演算パラメータ決定部104は、動き探索部102から入力されるコスト値に応じ、信号分離部106が行う信号分離演算における繰り返し回数Iterationを決定し、信号分離部106に入力する。また、演算パラメータ決定部104は、動き探索部102から入力されるコスト値に応じ、フレームと参照フレームとの間の相関の強弱を示す相関指標を決定し、初期勾配信号生成部105に通知する。なお、上記繰り返し回数Iteration及び相関指標の詳細は後述する。
初期勾配信号生成部105は、信号分離部106が行う信号分離演算における初期値として使用される勾配信号値(振動母関数と呼ばれることもある。)を生成し、信号分離部106に入力する。具体的には、初期勾配信号生成部105が生成し得る勾配信号値は、動き探索部102から入力される動きベクトルMVtに基づく勾配信号値、または、0(0ベクトル)である。なお、勾配信号の詳細は後述する。初期勾配信号生成部105は、演算パラメータ決定部104から通知される相関指標に基づき、動きベクトルMVtに基づく勾配信号値及び0のいずれか一方を信号分離部106に入力する。なお、動きベクトルMVtに基づく勾配値とは、例えば、勾配信号保存部107に保存されている時間的に1つ前の勾配信号値において当該動きベクトルMVtによって指定されるブロックに対応する勾配信号値である。
信号分離部106は、初期勾配信号生成部105からの勾配信号値と、演算パラメータ決定部104からの繰り返し回数Iterationとに基づき、デコーダ101から入力したフレームに対してTV法に基づく信号分離演算を実行して信号成分を分離して骨格信号とテクスチャ信号を得、骨格信号を輪郭強調処理部108に、そしてテクスチャ信号をノイズ除去部109に入力する。また、信号分離部106は、繰り返し回数Iterationに基づき算出された勾配信号値を勾配信号保存部107に入力する。なお、信号分離部106は、復号画像信号がYUV形式であれば、人間の視覚特性として識別感度の高いY信号(輝度信号)のみを分離演算の対象とし、演算量を削減してもよい。
以下、TV法に基づく信号分離演算を簡単に述べる。TV法に基づく信号分離演算の詳細は文献「"Journal of Mathematical Imaging and Vision 20:pp89-97, 2004", A. Chmbolle」を参照されたい。
任意のフレーム内の座標(x,y)における復号画像信号の画素値f(x,y)と、当該復号画像信号の骨格成分u(x,y)と、当該復号画像信号のテクスチャ成分v(x,y)とは、以下の数式(1)を満たす。
Figure 0005044518
数式(1)において、u(x,y)が一様な輝度領域と、エッジ領域とで構成される信号であると仮定すれば、f(x,y)からのu(x,y)の復元問題は、有界変動空間BVにおけるエネルギー汎関数の最小化問題として定式化される。即ち、テクスチャ信号v(x,y)は、数式(2)によって導出される。
Figure 0005044518
数式(2)においてベクトルp(pの上に→を表示した記号を指す)は勾配信号である。p1 x,yは勾配信号値のx成分、p2 x,yは勾配信号値のy成分を夫々示す。width及びheightは、フレームの幅サイズ及び高さサイズを夫々示す。λは分離演算に関する定数である。
初期勾配信号生成部105からの勾配信号値が0である場合には、信号分離部106は数式(3)に示すように勾配信号値の初期値に0ベクトルを代入する。
Figure 0005044518
一方、初期勾配信号生成部105からの勾配信号値が動きベクトルMVtに基づいて勾配信号保存部107から選択された勾配信号値の場合は、信号分離部106はこの勾配信号値を初期値として代入する。
また、信号分離演算をi+1回(iは0以上の任意の整数)繰り返して得られる勾配信号値p(i+1)は、信号分離演算をi回繰り返して得られる勾配信号値p(i)に基づき、次の数式(4)を用いて導出できる。
Figure 0005044518
数式(4)において、τは収束性に関する定数である。信号分離部106は、演算パラメータ決定部104からの繰り返し回数Iterationに従って、上記数式(4)に示す演算を繰り返し実行し、勾配信号値p(Iteration)を算出し、この勾配信号値p(Iteration)を数式(2)に代入してテクスチャ信号v(x,y)を、更にこのテクスチャ信号v(x,y)を数式(1)に代入して骨格信号u(x,y)を算出する。
勾配信号保存部107には、信号分離部106で求めた勾配信号値が、例えばフレーム単位で記憶され、前述したように初期勾配信号生成部105によって適宜読み出される。なお、勾配信号保存部107に記憶される勾配信号値には、前述の通り勾配信号値のX成分とY成分があり、それぞれの成分についてフレームを構成する各画素の位置に対応させた配置で管理されている。つまり、勾配信号値のX成分で構成されるフレームとY成分で構成されるフレームとして管理される。
ノイズ除去部109は、信号分離部106からのテクスチャ信号に対して例えばガウシアンフィルタ処理、メディアンフィルタ処理、平均値フィルタ処理、軟判定閾値処理等の画像処理において一般的に用いられるノイズ除去処理を行い、ノイズ除去処理したテクスチャ信号を信号合成部110に入力する。なお、本実施形態に係る画像処理装置を実施するにあたり、ノイズ除去部109によるノイズ除去処理を選択的に実行/省略したり、実行するノイズ除去処理を切り替えたり、ノイズ除去部109を取り除いてもよい。
輪郭強調処理部108は、信号分離部106からの骨格信号に対して例えばラプラシアンフィルタ処理、Sobelフィルタ処理等の画像処理において一般的に用いられる輪郭強調処理を行い、輪郭強調処理した骨格信号を信号合成部110に入力する。なお、本実施形態に係る画像処理装置を実施するにあたり、輪郭強調処理部108による輪郭強調処理を選択的に実行/省略したり、実行する輪郭強調処理を切り替えたり、輪郭強調部108を取り除いてもよい。
信号合成部110は、輪郭強調処理部108からの骨格信号と、ノイズ除去部109からのテクスチャ信号とを合成し、出力用のフレームを生成する。この出力用のフレームは、図示しない表示制御部によって制御される表示部に表示される。
以下、図3を用いて図2の画像処理装置の動作を説明する。
まず、デコーダ101は、入力された符号化ストリームを復号し、フレームおよび動きベクトルMVcを生成し(ステップS201)、フレームを動き探索部102および信号分離部106へ、そして動きベクトルMVcを動き探索部102へそれぞれ入力する。なお、デコーダ101で生成されたフレームの各画素値は、f(t,x,y)で表現され、tはフレームの時間的位置(例えば、フレーム番号)、x及びyは画素の空間的位置(例えばtに対応するフレーム内の幅方向及び高さ方向の座標)を示している。
次に、動き探索部102は、所定のブロックサイズでフレームを分割することでブロックB(m,n)を生成し、このブロックB(m,n)に基づいて動き探索処理を行い、ブロックB(m,n)に対する最適な動きベクトルMVt及びコスト値を求める(S202)。なお、ブロックB(m,n)の、m及びnは、フレーム中の当該ブロックの位置を示す値であり、それぞれ幅方向及び高さ方向の位置である。
なお、ステップS202における動き探索処理の具体的態様の一例として、例えば文献「H.264/AVC教科書(インプレス)」に開示されている手法が利用可能である。即ち、動き探索部102は、参照フレームから切り出した参照ブロックと、フレームから抽出したブロックB(m,n)に基づいて所定のコスト関数を最小とする参照ブロックを探索し、両ブロックの間の空間的シフト量を最適な動きベクトルMVtとして求めることができる。そして、動き探索部102は、上記コスト関数の最小値、即ち、最適な動きベクトルMVtに対応するコスト値を演算パラメータ決定部104に入力する。
なお、動き探索部102は、ブロックB(m,n)と参照ブロックの差分値と、ブロックB(m,n)の動きベクトルと、このブロックB(m,n)に隣接するブロックのそれぞれの動きベクトルとの差分値との加重和をコスト関数として用いることができる。
なお、ブロックB(m,n)と参照ブロックとの差分値は、処理対象のブロックB(m,n)と、参照フレームから動きベクトルMVtから求まる動きベクトル候補MVによって特定される参照ブロックとの間の差分絶対値和(SAD;Sum of Absolute Difference)または差分二乗和(SSD;Sum of Square Difference)であり、また、ブロックB(m,n)の動きベクトルと、このブロックB(m,n)に隣接するブロックの動きベクトルとの差分値は、例えば、動きベクトル候補MVと、処理対象ブロック画像信号B(m,n)の左側に隣接するブロック及び上側に隣接するブロックの動きベクトルの各々との差分和である。上記コスト関数として、例えば次の数式(5)が利用可能である。
Figure 0005044518
数式(5)において、SAD(MV)は、ブロックB(m,n)と、参照フレームから動きベクトル候補MVによって特定される参照ブロックとの間のSADを表す。また、Diff(MV)は、動きベクトル候補MVと、ブロックB(m,n)の左側に隣接するブロック及び上側に隣接するブロックの動きベクトルの各々との差分和を表す。また、λは重み係数である。動き探索部102は、最適な動きベクトルMVtに対応するコスト値Cost(m,n)を演算パラメータ決定部104に入力する。
演算量の観点から、通常、動きベクトル候補MVは、参照フレームにおいて探索中心を基準とする探索範囲内に包含されるブロックを特定するものに限られる。なお、上記探索中心は、ブロックB(m,n)と同一位置のブロックであってもよいし、ステップS201においてブロックB(m,n)に関する動きベクトルMVcが得られていれば、この動きベクトルMVcによって特定されるブロックであってもよい。
上記例において、動き探索部102は、処理単位を矩形ブロックとしていたが、Warping予測等の手法を用いて任意形状の画像信号に対する動き探索処理を行ってもよい。
一方、動き探索部102は、上記探索処理と平行してデコーダ101から受信したフレームを参照フレームメモリ103に記憶させる(ステップS203)。
次に、演算パラメータ決定部104は、ステップS202において算出されたコスト値Cost(m,n)に応じ、繰り返し回数Iteration及び相関指標を決定する(ステップS204)。なお、ステップS204における具体的処理は後述する。
次に、初期勾配信号生成部105は、ステップS204において決定された相関指標に基づいて勾配信号値を生成する(ステップS205)。なお、ステップS205における具体的処理は後述する。
次に、信号分離部106は、ステップS205において生成された勾配信号値と、ステップS204において決定された繰り返し回数Iterationとに基づき、デコーダ101からのフレームに対してTV法に基づく信号分離演算を実行して信号成分を分離する(ステップS206)。
次に、輪郭強調処理部108は、ステップS206において分離された骨格信号に対して輪郭強調処理を行う(ステップS207)。また、ノイズ除去部109は、ステップS206において分離されたテクスチャ信号に対してノイズ除去処理を行う(ステップS208)。なお、一方が省略されてもよい。
次に、信号合成部109は、ステップS207において輪郭強調処理が行われた骨格信号と、ステップS208においてノイズ除去処理が行われたテクスチャ信号とを合成し、出力画像信号を生成し(ステップS209)、処理は終了する。
以下、図4を用いて本実施形態に係る演算パラメータ104で求められる繰り返し回数iterationの決定処理を説明する。
まず、処理対象のフレームを分割して得た各ブロックB(m,n)に対応するCost(m,n)の累積値(総和)sumCostを算出する(ステップS301)。ここで、sumCostは、フレームと参照フレームとの間の残差に相関のある値である。従って、sumCostの大小に基づいて、フレームと参照フレームとの間におけるシーンチェンジの有無を判定できる。
次に、ステップS301において算出したsumCostと、シーンチェンジの有無を判定するための閾値TH_scとを比較する(ステップS302)。なお、閾値TH_scは経験的/実験的に求められた値が設定される。そして、ステップS302において、sumCostがTH_scよりも大きければ処理はステップS303に進み、そうでなければ処理はステップS305に進む。
ステップS302でsumCostが閾値TH_scより大きいことが検出されると、ステップS303において、シーンチェンジの判定結果を示すフラグScFlagにTRUE(真)が代入される。なお、後述するように、ScFlagは相関指標であり、勾配信号値の生成に利用される。
次に、演算パラメータ決定部104は、繰り返し回数IterationにMを代入し(ステップS304)、処理は終了する。ここで、Mは任意の自然数でよいが、勾配信号値の初期値を0とした場合にTV法に基づく信号分離演算を所望の精度で実行できるように、経験的/実験的に求められた値が設定されることが望ましい。
一方、ステップS302でsumCostが閾値TH_scより小さいことが検出された場合は、ステップS305において、フラグScFlagにFALSEが代入され、そして、繰り返し回数IterationとしてNが代入され(ステップS306)、処理は終了する。ここで、Nは、Mよりも小さい任意の自然数である。即ち、テクスチャ信号は、時間的な相関が強いことが知られており、シーンチェンジが無い場合には、処理済みのテクスチャにおける勾配信号値を初期値として利用することにより、繰り返し回数を削減したとしても高い分離精度を得ることができる。更に、Nには、勾配信号値の初期値をブロックB(m,n)に関する最適な動きベクトルMVt(m,n)を用いて生成した場合にTV法に基づく信号分離演算を所望の精度で実行できるように、経験的/実験的に求められた値が設定されることが望ましい。
次に、図5を用いて本実施形態に係る初期勾配信号生成部105で求められる勾配信号値の生成処理を説明する。
まず、演算パラメータ決定部104から受け取った処理対象のフレームに対応するScFlagの値がTRUEかFALSEであるかを判定する(ステップS401)。ScFlagがTRUEであれば、初期勾配信号として0を設定し(ステップS402)、処理は終了する。一方、ScFlagがFALSEであれば、フレームを分割したブロック画像信号B(m,n)毎に最適な動きベクトルMVt(m,n)を用いて、時間的に1フレーム前で最終的に生成された勾配信号値から、動きベクトルMVt(m,n)によって特定されるブロックに対応する勾配信号値を初期勾配信号として設定し(ステップS403)、処理は終了する。
以上説明したように、本実施形態に係る画像処理装置は、処理対象のフレームと参照フレームとの間の相関の強弱を示す相関指標としてシーンチェンジの有無を示すフラグScFlagを求め、この相関指標に応じてTV法に基づく信号分離演算の初期値の生成方式を切り替えている。従って、本実施形態に係る画像処理装置によれば、上記相関が強ければ(シーンチェンジ無し、と判定されていれば)、過去に存在する相関の強い画像領域で算出された勾配信号値を上記初期値として利用できるので、信号分離演算の精度を維持しつつ繰り返し回数を削減できる。
また、本実施形態に係る画像処理装置は、携帯電話機、パーソナルコンピュータ、データ通信端末等の画像再生機能を有するコンピュータ端末と一体に、例えば図1に示すハードウエア構成によって実現可能である。
無線部42は、制御部10からの指示に従って動作し、信号処理部43から出力される送信信号を無線周波数帯にアップコンバートし、アンテナ41を介して図示しない移動通信網に収容される基地局装置に無線送信したり、上記基地局装置から送信された無線信号をアンテナ41を介して受信してベースバンド信号にダウンコンバートしたりする。
信号処理部43は、制御部10からの指示に従って動作し、マイクロホン44から入力された送話音声信号を送信データに変換し、当該送信データに基づいて搬送波を変調した上記送信信号を生成したり、無線部42から入力される上記ベースバンド信号を復調して受信データを得て、当該受信データを復号して得た受話音声信号をスピーカ45より拡声出力したりする。
表示制御部31は、制御部10からの指示に従って、LCD(Liquid Crystal Display)や有機EL(Electro Luminescence)ディスプレイなどの表示デバイスを用いた表示部30を駆動制御し、制御部10から与えられる表示データに基づく画像信号を表示部30に表示する。例えば、前述した出力画像信号は、上記表示データの一例として表示部30に表示される。
入力部60は、複数のキースイッチ(例えば、いわゆるテンキー)やタッチパネルなどの入力デバイスを用いて、ユーザからの要求を受理するユーザインタフェースである。
インタフェース(I/F)51は、リムーバブルメディア52を物理的及び電気的に接続して、データ交換を行うためのインタフェースであって、制御部10によって制御される。リムーバブルメディア52には、制御部10の画像処理機能100の処理対象となる画像信号が符号化され多重化された符号化ストリームが記憶されてもよい。
チューナ72は、アンテナ71を介して図示しない放送局から送信されるテレビジョン放送信号を受信し、当該放送信号に格納されている符号化ストリームを得る。当該符号化ストリームにおいて、制御部10の画像処理機能100の処理対象となる画像信号が符号化され多重化されている。
記憶部20は、RAM(Random Access Memory)やROM(Read Only Memory)、ハードディスクなどの記憶媒体であって、制御部10の制御プログラムや制御データ、ユーザが作成した種々のデータ、そしてリムーバブルメディア52に関わる制御データを記憶する。また、記憶部20には、制御部10の画像処理機能100の処理対象となる画像信号が符号化され多重化された符号化ストリームが記憶されてもよい。記憶部20には、制御部10を画像処理機能100として動作させるためのプログラムが記憶され、制御部10は当該プログラムを実行することにより画像処理機能100を実現する。また、記憶部20は、制御部10が画像処理機能100として動作している際に、前述した参照フレームメモリ103及び勾配信号保存部107として利用されてもよい。
制御部10は、CPU(Central Processing Unit)等のプロセッサを備え、図1の各部を統括して制御するものであって、例えば音声通信等の種々の通信を実現する通信制御機能を有する。また、制御部10は、画像処理機能100を有し、当該画像処理機能100によって本実施形態に係る画像処理装置の各部に対応する各種処理を実現する。
(第2の実施形態)
本発明の第2の実施形態に係る画像処理装置は、前述した第1の実施形態に係る画像処理装置と比べ、演算パラメータ決定処理が異なる。以下の説明では、上記第1の実施形態に関する説明と同一部分には同一符号を付して示し、異なる部分を中心に述べる。
以下、図6を用いて本実施形態に係る演算パラメータの決定処理を説明する。
まず、演算パラメータ決定部104は、前述したステップS301と同様に、デコーダ101で得たフレームを分割した各ブロックB(m,n)に対応するCost(m,n)の累積値(総和)sumCostを算出する(ステップS501)。
次に、演算パラメータ決定部104は、ステップS501において算出したsumCostと、閾値TH_sc1とを比較する(ステップS502)。閾値TH_sc1はシーンチェンジの有無を判定するための閾値であり、経験的/実験的に求められた値が設定される。ステップS502において、sumCostがTH_sc1よりも大きければ処理はステップS503に進み、そうでなければ処理はステップS505に進む。
ステップS502でsumCostが閾値TH_sc1より大きいことが検出されると、演算パラメータ決定部104は、フラグScFlagにTRUEを代入し(ステップS503)。次いて、繰り返し回数IterationにN1を代入し(ステップS504)、処理は終了する。ここで、N1は任意の自然数でよいが、勾配信号値の初期値を0とした場合にTV法に基づく信号分離演算を所望の精度で実行できるように、経験的/実験的に求められた値が設定されることが望ましい。
一方、ステップS502でsumCostが閾値TH_sc1より小さいことが検出されると、演算パラメータ決定部104は、フラグScFlagにFALSEを代入し(ステップS505)。次いて、ステップS501において算出したsumCostと、閾値TH_sc2とを比較する(ステップS506)。ここで、閾値TH_sc2には、上記閾値TH_sc1よりも小さく、経験的/実験的に求められた値が設定される。ステップS506において、sumCostがTH_sc2よりも大きければ処理はステップS507に進み、そうでなければ処理はステップS508に進む。
ステップS506でsumCostが閾値TH_sc2より大きいことが検出されると、演算パラメータ決定部104は、繰り返し回数IterationにN2を代入し(ステップS507)、処理は終了する。ここで、N2は、N1よりも小さい任意の自然数である。更に、N2には、勾配信号値の初期値をブロックB(m,n)に関する最適な動きベクトルMVt(m,n)を用いて生成した場合にTV法に基づく信号分離演算を所望の精度で実行できるように、経験的/実験的に求められた値が設定されることが望ましい。
一方、ステップS506でsumCostが閾値TH_sc2より小さいことが検出されると、演算パラメータ決定部104は、ステップS501において算出したsumCostと、閾値TH_sc3とを比較する(ステップS508)。ここで、閾値TH_sc3には、上記閾値TH_sc2よりも小さく、経験的/実験的に求められた値が設定される。ステップS508において、sumCostがTH_sc3より大きければ処理はステップS509に進み、そうでなければ処理はステップS510に進む。
ステップS508でsumCostが閾値TH_sc3より大きいことが検出されると、演算パラメータ決定部104は、繰り返し回数IterationにN3を代入し(ステップS509)、処理は終了する。ここで、N3は、N2よりも小さい任意の自然数であり、経験的/実験的に求められた値が設定される。一方、ステップS508でsumCostが閾値TH_sc1より小さいことが検出されると、演算パラメータ決定部104は、繰り返し回数IterationにN4を代入し(ステップS510)、処理は終了する。ここで、N4は、N3よりも小さい任意の自然数であり、経験的/実験的に求められた値が設定される。
以上説明したように、本実施形態に係る画像処理装置は、sumCostとの比較対象となる閾値を複数設け、繰り返し回数Iterationを4値の間で切り替えている。従って、本実施形態に係る画像処理装置によれば、処理対象のフレームと参照フレームとの間の相関の強弱に応じて適切な繰り返し回数Iterationを設定できるので、TV法に基づく信号分離演算の演算量をより効率的に削減できる。尚、上記説明において、繰り返し回数Iterationを4値の間で切り替え可能としているが、任意の値とすることは当然可能である。
(第3の実施形態)
本発明の第3の実施形態に係る画像処理装置は、前述した第1及び第2の実施形態に係る画像処理装置と比べ、演算パラメータの決定処理及び信号分離演算が異なる。以下の説明では、上記第1及び第2の実施形態に関する説明と同一部分には同一符号を付して示し、異なる部分を中心に述べる。
本実施形態に係る演算パラメータ決定部104による演算パラメータの決定処理では、フレーム単位ではなく、マクロブロック等のブロック単位で繰り返し回数Iterationが決定される。なお、ブロック単位での繰り返し回数Iterationの決定処理は、当業者であれば前述したフレーム単位での繰り返し回数Iterationの決定処理の説明に基づき適宜実施可能であるから、具体的説明を省略する。
以下、図7を用いて本実施形態に係る信号分離演算を説明する。
まず、信号分離部106は、デコーダ101から得たフレームを分割したブロックB(m,n)の各々に設定されている繰り返し回数Iteration(m,n)の最大値を変数IterationNumに代入し(ステップS601)、処理はステップS602に進む。なお、ステップS602以降の処理において、処理対象は各ブロックB(m,n)である。処理順序は特に問わないが、信号分離部106は例えばラスタ順序に従ってブロックB(m,n)を遷移させる。
信号分離部106は、現在の処理対象のブロックB(m,n)に設定されている繰り返し回数Iteration(m,n)が、変数IterationNumの値に一致するか否かを判定し(ステップS602)、繰り返し回数Iteration(m,n)が、変数IterationNumの値に一致すれば処理はステップS603に進み、そうでなければ処理はステップS605に進む。
ステップS602で一致との判定の場合、信号分離部106は、現在処理対象としているブロックB(m,n)に対して、TV法に基づく信号分離演算を1回分だけ行う(ステップS603)。そして、信号分離部106はk現在おのブロックB(m,n)に割り当てられている繰り返し回数Iterationを1デクリメントし(ステップS604)、処理はステップS605に進む。
一方、ステップS602で不一致との判定の場合、信号分離部106は、現在の処理対象としているブロックB(m,n)が、終端ブロックであるか否かを判定する(ステップS605)。終端ブロックは、信号分離部106が従う処理順序によって異なる。上記処理順序がラスタ順序であれば、処理対象フレーム内の右下隅ブロックが終端ブロックである。このブロックB(m,n)が、終端ブロックであれば処理はステップS608に進み、そうでなければ処理はステップS607に進む。なお、ステップS607では、信号分離部106は、所定の処理順序に従って処理対象を次のブロックに遷移させて、処理はステップS602に戻る。
ステップS605で終端ブロックであることが検出されると、信号分離部106は変数IterationNumを1デクリメントする(ステップS608)。次に、信号分離部106は、変数IterationNumが0に一致するか否かを判定する(ステップS609)。変数IterationNumが0に一致すれば処理は終了し、そうでなければ処理はステップS610に進む。ステップS609で一致と判定されると、信号分離部106は、所定の処理順序に従って処理対象を先頭のブロックに遷移させて、処理はステップS602に戻る。上記処理順序がラスタ順序であれば、処理対象フレーム内の左上隅ブロックが先頭のブロックである。
以上説明したように、本実施形態に係る画像処理装置は、フレーム単位でなくブロック単位で繰り返し回数Iterationを決定し、各ブロックに割り当てられている繰り返し回数の残余を平滑化するようにブロック単位の信号分離演算を1回ずつ行っている。従って、本実施形態に係る画像処理装置によれば、繰り返し回数の割り当てを更に効率化してTV法に基づく信号分離演算の演算量を削減できると共に、ブロック単位の信号分離演算によって発生し得るブロック歪みを低減させることができる。
なお、本発明は上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また上記各実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、各実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。
その一例として例えば、上記各実施形態では、演算パラメータの決定処理において、Cost(m,n)の総和sumCostを評価値として利用して構成したが、ブロックB(m,n)の離散コサイン変換(DCT;Discrete Cosine Transform)係数の絶対値和を評価値してもよい。また、ブロックB(m,n)がIntraMB等のフレーム間予測処理に基づかないブロックである場合には、最大の繰り返し回数(例えば、前述したMまたはN1)を与えるようにしてもよい。
その他、本発明の要旨を逸脱しない範囲で種々の変形を施しても同様に実施可能であることはいうまでもない。
第1の実施形態に係る画像処理装置のハードウエア構成例を示すブロック図。 第1の実施形態に係る画像処理装置を示すブロック図。 図2の画像処理装置の行う処理を示すフローチャート。 第1の実施形態に係る演算パラメータの決定処理を示すフローチャート。 第1の実施形態に係る勾配信号値の生成処理を示すフローチャート。 第2の実施形態に係る演算パラメータの決定処理を示すフローチャート。 第3の実施形態に係る信号分離演算を示すフローチャート。
符号の説明
10・・・制御部
20・・・記憶部
30・・・表示部
31・・・表示制御部
41・・・アンテナ
42・・・無線部
43・・・信号処理部
44・・・マイクロホン
45・・・スピーカ
51・・・I/F
52・・・リムーバブルメディア
60・・・入力部
71・・・アンテナ
72・・・チューナ
100・・・制御部
101・・・デコーダ
102・・・動き探索部
103・・・参照フレームメモリ
104・・・演算パラメータ決定部
105・・・初期勾配信号生成部
106・・・信号分離部
107・・・勾配信号保存部
108・・・輪郭強調処理部
109・・・ノイズ除去部
110・・・信号合成部

Claims (5)

  1. 符号化された複数のフレームが多重化された符号化ストリームを復号し、フレームを得るデコーダと、
    前記フレームを参照フレームとして記憶する記憶部と、
    前記フレームに動き探索処理を行って、当該フレームと前記記憶部に記憶されている参照フレームとの間の動きベクトルを決定する動き探索部と、
    前記動き探索処理の結果に基づき、前記フレームと参照フレームとの間の相関値、及び前記フレームに対しTV法に従う信号分離演算を繰り返し実行する回数を示す繰り返し回数を決定する決定部と、
    前記相関値に応じて、0ベクトル又は前記動き探索部で決定された動きベクトルに基づいて得られたテクスチャ画像の勾配信号値を初期勾配信号値として生成する生成部と、
    前記初期勾配信号値を初期値として、前記フレームに対して前記繰り返し回数だけ前記信号分離演算を繰り返し実行し、当該フレームを第1の骨格画像信号及び第1のテクスチャ画像信号に分離する分離部と、
    前記第1の骨格画像信号に対する輪郭強調処理及び前記第1のテクスチャ画像信号に対するノイズ除去処理の少なくとも一方を行って、第2の骨格画像信号及び第2のテクスチャ画像信号を得る画像処理部と、
    前記第2の骨格画像信号及び前記第2のテクスチャ画像信号を合成し、出力するためのフレームを生成する合成部と
    を具備することを特徴とする画像処理装置。
  2. 前記決定部は、前記フレームと前記参照フレームとの間の差分に基づく評価値と、閾値との比較結果に応じて前記相関値及び前記繰り返し回数を決定することを特徴とする請求項1記載の画像処理装置。
  3. 前記決定部は、前記相関値に基づいて相関が強いほど少なくなるように前記繰り返し回数を決定することを特徴とする請求項1記載の画像処理装置。
  4. 前記決定部は、前記フレームを分割したブロック単位に前記相関値及び前記繰り返し回数を決定し、
    前記分離部は、前記ブロックの各々に割り当てられた繰り返し回数の残余を平滑化するように前記ブロックに対して前記信号分離演算を逐次実行することを特徴とする請求項1記載の画像処理装置。
  5. 記憶部と;
    符号化された複数のフレームが多重化された符号化ストリームを復号し、フレームを得る手段、
    前記フレームを参照フレームとして前記記憶部に記憶させる手段、
    前記フレームに動き探索処理を行って、当該フレームと前記記憶部に記憶された参照フレームとの間の動きベクトルを決定する手段、
    前記動き探索処理の結果に基づき、前記フレームと前記参照フレームとの間の相関の強弱を示す相関値、及び前記フレームに対しTV法に従う信号分離演算を繰り返し実行する回数を示す繰り返し回数を決定する手段、
    前記相関値に応じて、0ベクトル又は前記動き探索部で決定された動きベクトルに基づいて得られた勾配信号値を初期勾配信号値として生成する手段、
    前記初期勾配信号値を初期値として、前記フレームに対して前記繰り返し回数だけ前記信号分離演算を繰り返し実行し、当該フレームを第1の骨格画像信号及び第1のテクスチャ画像信号に分離する手段、
    前記第1の骨格画像信号に対する輪郭強調処理及び前記第1のテクスチャ画像信号に対するノイズ除去処理の少なくとも一方を行って、第2の骨格画像信号及び第2のテクスチャ画像信号を得る手段、
    前記第2の骨格画像信号及び前記第2のテクスチャ画像信号を合成し、出力するためのフレームを生成する手段
    として機能するプロセッサと;
    前記出力するためのフレームを表示する表示部と;
    を具備することを特徴とするコンピュータ端末。
JP2008238333A 2008-09-17 2008-09-17 画像処理装置及びコンピュータ端末 Expired - Fee Related JP5044518B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008238333A JP5044518B2 (ja) 2008-09-17 2008-09-17 画像処理装置及びコンピュータ端末
US12/478,093 US8102912B2 (en) 2008-09-17 2009-06-04 Image processing device and computer terminal, and signal separation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008238333A JP5044518B2 (ja) 2008-09-17 2008-09-17 画像処理装置及びコンピュータ端末

Publications (2)

Publication Number Publication Date
JP2010074408A JP2010074408A (ja) 2010-04-02
JP5044518B2 true JP5044518B2 (ja) 2012-10-10

Family

ID=42007180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008238333A Expired - Fee Related JP5044518B2 (ja) 2008-09-17 2008-09-17 画像処理装置及びコンピュータ端末

Country Status (2)

Country Link
US (1) US8102912B2 (ja)
JP (1) JP5044518B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101377660B1 (ko) * 2008-09-30 2014-03-26 에스케이텔레콤 주식회사 복수 개의 움직임 벡터 추정을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
JP5085762B2 (ja) * 2011-04-25 2012-11-28 株式会社東芝 画像処理装置および画像処理方法
JP5284446B2 (ja) * 2011-11-14 2013-09-11 株式会社東芝 画像処理装置、及び画像処理方法
JP5488621B2 (ja) 2012-01-11 2014-05-14 株式会社デンソー 画像処理装置、画像処理方法、及びプログラム
JP6222481B2 (ja) * 2012-04-27 2017-11-01 日本電気株式会社 画像処理方法、画像処理システム、画像処理装置および画像処理プログラム
EP3410715A1 (en) * 2013-04-05 2018-12-05 Vid Scale, Inc. Inter-layer reference picture enhancement for multiple layer video coding
US9942731B2 (en) * 2015-05-27 2018-04-10 Otto Engineering, Inc. Radio alert system and method
CN110582022B (zh) * 2019-09-27 2022-12-30 腾讯科技(深圳)有限公司 视频编解码方法和装置及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7558318B2 (en) * 2002-06-11 2009-07-07 Sanyo Electric Co., Ltd. Method and apparatus for processing images, method and apparatus for recording and reproducing images, and television receiver utilizing the same
JP2005012293A (ja) * 2003-06-17 2005-01-13 Victor Co Of Japan Ltd 復号装置
JP4658875B2 (ja) 2006-07-21 2011-03-23 日本放送協会 画像処理装置

Also Published As

Publication number Publication date
JP2010074408A (ja) 2010-04-02
US8102912B2 (en) 2012-01-24
US20100067572A1 (en) 2010-03-18

Similar Documents

Publication Publication Date Title
JP5044518B2 (ja) 画像処理装置及びコンピュータ端末
JP6559309B2 (ja) 画像予測復号方法
JP6334006B2 (ja) ビデオ符号化用の高コンテンツ適応型品質回復フィルタ処理のためのシステムおよび方法
TWI651965B (zh) 圖像處理裝置及方法、電腦程式產品以及記錄媒體
TWI463878B (zh) Image processing apparatus and method
WO2010035733A1 (ja) 画像処理装置および方法
US11871024B2 (en) Methods and apparatus of motion vector rounding, clipping and storage for
WO2010095559A1 (ja) 画像処理装置および方法
KR20120058521A (ko) 화상 처리 장치 및 방법
JP2011077761A (ja) 画像処理装置および方法
WO2010035730A1 (ja) 画像処理装置および方法
JP2010016453A (ja) 画像符号化装置および方法、画像復号装置および方法、並びにプログラム
JPWO2010035731A1 (ja) 画像処理装置および方法
KR20120118463A (ko) 화상 처리 장치 및 방법, 및 프로그램
KR20210062055A (ko) 양방향 예측을 사용하는 비디오 인코딩 및 디코딩을 위한 방법 및 장치
JP2011146980A (ja) 画像処理装置および方法
JPWO2010035735A1 (ja) 画像処理装置および方法
Lucas et al. Image coding using generalized predictors based on sparsity and geometric transformations
JP2014143716A (ja) 画像処理装置および方法、プログラム、並びに記録媒体
US20240089489A1 (en) Methods and apparatus of motion vector rounding, clipping and storage for inter prediction
US20230171421A1 (en) Motion refinement using a deep neural network
WO2011125625A1 (ja) 画像処理装置および方法
JP2014131294A (ja) 画像符号化方法及び画像復号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120619

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120713

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150720

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees