JP3792623B2 - 映像データ圧縮装置、その方法及びそのプログラム - Google Patents
映像データ圧縮装置、その方法及びそのプログラム Download PDFInfo
- Publication number
- JP3792623B2 JP3792623B2 JP2002224068A JP2002224068A JP3792623B2 JP 3792623 B2 JP3792623 B2 JP 3792623B2 JP 2002224068 A JP2002224068 A JP 2002224068A JP 2002224068 A JP2002224068 A JP 2002224068A JP 3792623 B2 JP3792623 B2 JP 3792623B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- video data
- gradation
- background
- color difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Color Television Systems (AREA)
Description
【発明の属する技術分野】
本発明は、映像データの圧縮技術に関し、より詳細には、映像データ内の注目領域の画質劣化を軽減して映像データを圧縮する映像データ圧縮装置、その方法及びそのプログラムに関する。
【0002】
【従来の技術】
現在、携帯端末やPDA(Personal Digital Assistant)のような情報端末に対して、映像データを配信するサービスが普及し始めている。この場合、高精細な映像データを配信しようとしても、映像データを配信するための伝送路の帯域に制限があるため、映像データは、MPEG−4(Moving Picture Experts Group 4)等により帯域を圧縮して配信されている。
【0003】
従来、この映像データの圧縮技術に関しては、例えば、MPEG−2(Moving Picture Experts Group 2)にように、動き補償フレーム間予測(MC:Motion Compensation)と、離散コサイン変換(DCT:Discrete Cosine Transform)とを組み合わせた技術が一般的に用いられている。
【0004】
すなわち、MPEG−2等による映像データの圧縮は、まず、動き補償フレーム間予測によって、映像データの映像フレーム間の予測誤差を16×16画素(マクロブロック)単位に生成し、その予測誤差を離散コサイン変換することで、周波数成分の振幅を示すDCT係数を生成する。そして、高周波成分に対する人の視覚感度が弱いことを利用して、高周波成分のDCT係数の桁数を多く削減することで、映像データの圧縮を行っている。
【0005】
【発明が解決しようとする課題】
しかし、前記従来の技術において、MPEG−2等の映像データの圧縮は、動き補償フレーム間予測における動きベクトルの大きさや、マクロブロックの周波数成分に依存して情報量の削減を行っており、映像データの内容を考慮したものではなかった。
【0006】
このため、携帯端末やPDAのような小型の携帯端末に高精細な映像データを配信しようとすると、帯域圧縮によって多くの情報量が削減され、その映像データを配信された携帯端末で表示する表示映像は、画面全体に画質が劣化した映像となってしまう。すなわち、携帯端末で表示される表示映像は、その映像内における注目すべき被写体等が映された注目領域が、それ以外の領域である背景領域と同程度に画質劣化してしまうという問題があった。
【0007】
本発明は、以上のような問題点に鑑みてなされたものであり、映像データを圧縮したときに、その映像データにおける注目すべき被写体等が映された注目領域の画質劣化を、それ以外の領域である背景領域よりも軽減させるとともに、映像データの圧縮率を高めることを可能にした映像データ圧縮装置、その方法及びそのプログラムを提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明は、前記目的を達成するために創案されたものであり、まず、請求項1に記載の映像データ圧縮装置は、入力された映像データについて、各画素の階調を色差成分及び輝度成分毎に個別に削減することで、前記映像データの圧縮を行う映像データ圧縮装置であって、動きベクトルに基づいて、前記映像データを、映像フレーム毎に被写体が存在する注目領域とそれ以外の背景領域とに分割する領域分割制御手段と、この領域分割制御手段によって分割された前記注目領域及び前記背景領域において、各画素の階調を色差成分及び輝度成分毎に個別に削減する階調削減制御手段と、を備え、前記階調削減制御手段が、前記背景領域の色差成分、前記背景領域の輝度成分、前記注目領域の色差成分、前記注目領域の輝度成分の順に優先的に階調を削減する構成とした。
【0009】
かかる構成によれば、映像データ圧縮装置は、領域分割制御手段によって、映像データを映像フレーム毎に注目領域とその注目領域以外の背景領域とに分割する。このとき、注目領域が動きのある領域である場合は、その注目領域の動きベクトルを求めることで、注目領域と背景領域とを識別して、領域の分割を行う。また、注目領域が背景領域と比較して、色等の特徴によって識別が可能な場合は、その色等の特徴によって閾値処理を行うことで領域を分割することとしてもよい。
【0010】
そして、映像データ圧縮装置は、階調削減制御手段によって、領域分割制御手段で分割された領域において、各画素の階調を色差成分及び輝度成分毎に個別に削減する。例えば、映像データを削減することで映像データの圧縮を行う場合、背景領域の階調を注目領域の階調よりも多く削減することで、注目領域の画質の劣化を背景領域の画質の劣化に比べて抑えるように作用する。このとき、注目領域及び背景領域毎に色差成分に割り当てられている階調を、輝度成分に割り当てられている階調よりも多く削減することで、映像データの画質の劣化を抑えたままで圧縮効率を高めることが可能になる。
【0011】
また、請求項2に記載の映像データ圧縮装置は、請求項1に記載の映像データ圧縮装置において、前記領域分割制御手段は、前記映像データの連続した映像フレーム間で特定の大きさのブロック毎に動きベクトルを算出する動きベクトル算出手段と、この動きベクトル算出手段によって算出された動きベクトルに基づいて、前記映像フレーム内における前記ブロックが、前記注目領域に含まれるブロックか、それ以外の前記背景領域に含まれるブロックかを識別する領域識別手段と、を備える構成とした。
【0012】
かかる構成によれば、映像データ圧縮装置は、動きベクトル算出手段によって、映像データの連続した映像フレーム間で特定の大きさのブロック毎に動きベクトルを算出する。例えば、このブロックは、MPEG−2等の動き補償予測に使用されるマクロブロックとする。そして、領域識別手段によって、動きベクトル算出手段で算出した動きベクトルの大きさに基づいて、映像フレーム内におけるブロック(マクロブロック)が、動きのある注目領域に含まれるブロックか、それ以外の背景領域に含まれるブロックかを識別する。これによって、映像フレームをブロック(マクロブロック)単位で注目領域と背景領域とに分割し、注目領域と背景領域との映像データを独立して加工(削減)することが可能になる。
【0013】
さらに、請求項3に記載の映像データ圧縮装置は、請求項2に記載に映像データ圧縮装置において、前記領域分割制御手段が、前記領域識別手段で識別された前記注目領域と前記背景領域とが隣接する領域において、前記注目領域のブロックと前記背景領域のブロックとの相関に基づいて、前記背景領域のブロックを前記注目領域のブロックとして拡張させる領域拡張手段を備える構成とした。
【0014】
かかる構成によれば、映像データ圧縮装置は、領域拡張手段によって、注目領域と背景領域とが隣接する領域において、隣接するブロック(マクロブロック)の相関、例えば、輝度や色等の特徴量で類似性のある背景領域のブロックを注目領域のブロックとする。これによって、動きベクトルの検出では注目領域と認識されない動きの少ない領域を注目領域として拡張することが可能になる。
【0019】
また、請求項4に記載の映像データ圧縮方法は、入力された映像データについて、各画素の階調を色差成分及び輝度成分毎に個別に削減することで、前記映像データの圧縮を行う映像データ圧縮方法であって、動きベクトルに基づいて、前記映像データを、映像フレーム毎に被写体が存在する注目領域とそれ以外の背景領域とに分割する領域分割ステップと、この領域分割ステップで分割された前記注目領域及び前記背景領域において、各画素の階調を色差成分及び輝度成分毎に個別に削減する階調削減ステップとを含み、前記階調削減ステップが、前記背景領域の色差成分、前記背景領域の輝度成分、前記注目領域の色差成分、前記注目領域の輝度成分の順に優先的に階調を削減することを特徴とする。
【0020】
この方法によれば、映像データ圧縮方法は、領域分割ステップによって、映像データを映像フレーム毎に注目領域とその注目領域以外の背景領域とに分割する。このとき、注目領域が動きのある領域である場合は、その注目領域の動きベクトルを求めることで、注目領域と背景領域とを識別して、領域の分割を行う。また、注目領域が背景領域と比較して、色等の特徴によって識別が可能な場合は、その色等の特徴によって閾値処理を行うことで領域を分割することとしてもよい。
【0021】
そして、映像データ圧縮方法は、階調削減ステップによって、領域分割ステップで分割された領域毎において、各画素の階調を色差成分及び輝度成分毎に個別に削減する。このとき、背景領域の階調を注目領域の階調よりも多く削減することで、注目領域の画質劣化を背景領域の画質の劣化に比べて抑えるように作用する。
【0022】
さらに、請求項5に記載の映像データ圧縮プログラムは、入力された映像データについて、各画素の階調を色差成分及び輝度成分毎に個別に削減して、前記映像データの圧縮を行うために、コンピュータを、動きベクトルに基づいて、前記映像データを、映像フレーム毎に被写体が存在する注目領域とそれ以外の背景領域とに分割する領域分割制御手段、この領域分割制御手段によって分割された前記注目領域及び前記背景領域において、各画素の階調を色差成分及び輝度成分毎に個別に削減する階調削減制御手段として機能させ、前記階調削減制御手段が、前記背景領域の色差成分、前記背景領域の輝度成分、前記注目領域の色差成分、前記注目領域の輝度成分の順に優先的に階調を削減することを特徴とする。
【0023】
かかる構成によれば、映像データ圧縮プログラムは、領域分割制御手段によって、映像データを映像フレーム毎に注目領域とその注目領域以外の背景領域とに分割し、階調削減制御手段によって、領域分割制御手段で分割された領域において、各画素の階調を色差成分及び輝度成分毎に個別に削減する。このとき、背景領域の階調を注目領域の階調よりも多く削減することで、注目領域の画質の劣化を背景領域の画質の劣化に比べて抑えるように作用する。
【0024】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。
(映像データ圧縮装置の構成:第一の実施の形態)
図1は、本発明における第一の実施の形態である映像データ圧縮装置1の構成を示したブロック図である。図1に示した映像データ圧縮装置1は、入力された映像データを、動きのある注目領域とそれ以外の領域である背景領域とに分割し、その分割された領域毎に画素値を表現するための階調を削減することで、映像データを圧縮して出力するものであり、領域分割制御手段10と階調削減制御手段20とを備える構成とした。
【0025】
なお、ここで注目領域とは、図7に示したような映像フレームF上に登場する人物等の動きのある領域(注目領域FG)を指し、背景領域は注目領域FG以外の領域(背景領域BG)を指す。なお、注目領域FGは図7に示すように映像フレームF上に複数存在していてもよい。
【0026】
領域分割制御手段10は、入力された映像データを、映像フレーム単位で動きのある注目領域か、あるいは、それ以外の背景領域かを、特定の大きさのブロック毎に判定することで領域の分割を行うものである。ここでは、この領域分割制御手段10は、動きベクトル算出部11と、グローバルベクトル算出部12と、領域識別部13とを備えるものとした。
【0027】
また、階調削減制御手段20は、入力された映像データの注目領域及び背景領域の画素値を表現するための階調を、個別に削減するものである。この階調削減制御手段20は、階調設定部21と、階調削減部22とを備えるものとした。
なお、ここで特定の大きさのブロックは、MPEG−2等の動き補償予測に使用されるマクロブロック(16×16画素)とする。
【0028】
動きベクトル算出部(動きベクトル算出手段)11は、連続して入力される映像データの映像フレームから、動きベクトルを算出するものである。ここでは、動きベクトル算出部11を映像遅延部11aと動きベクトル検出部11bとで構成した。
【0029】
映像遅延部11aは、入力された映像データ(入力映像データ)を映像フレーム単位で遅延させるものである。この映像遅延部11aで1映像フレーム分遅延された映像データ(遅延映像データ)は、動きベクトル検出部11bへ出力される。
【0030】
動きベクトル検出部11bは、入力された映像データ(入力映像データ)と、映像遅延部11aで遅延された遅延映像データとに基づいて、映像フレームのマクロブロック単位で動きベクトルを検出するものである。この動きベクトル検出部11bで検出した動きベクトルは、グローバルベクトル算出部12及び領域識別部13へ出力される。なお、この動きベクトルは、入力映像データの映像フレームと、遅延映像データの映像フレームとの間、すなわち隣接映像フレーム間で、マクロブロック毎にブロックマッチング法によって求められる。
【0031】
グローバルベクトル算出部12は、動きベクトル検出部11bから入力されたマクロブロック毎の動きベクトルに基づいて、その複数の動きベクトルの中で、最も多く検出された動きベクトルをグローバルベクトルとして算出するものである。このグローバルベクトル算出部12で算出されたグローバルベクトルは、領域識別部13へ出力される。なお、ここで算出されたグローバルベクトルは、入力された映像データの中で、最も領域の大きい背景領域の動きベクトルとみなすことができる。
【0032】
領域識別部(領域識別手段)13は、動きベクトル検出部11bで検出されたマクロブロック毎の動きベクトルと、グローバルベクトル算出部12で算出されたグローバルベクトルとに基づいて、マクロブロックが動きのある注目領域に含まれるものか、それ以外の領域である背景領域に含まれるものかを識別するものである。この領域識別部13で識別されたマクロブロック毎の領域(注目領域又は背景領域)は、マクロブロックの座標とともに領域情報として階調削減制御手段20の階調設定部21へ出力される。
【0033】
ここでは、グローバルベクトルとは異なる動きをする映像(マクロブロック)を注目領域とみなす。例えば、各マクロブロックの動きベクトルとグローバルベクトルとを比較して、両ベクトルの差が予め設定した値(例えば、映像フレーム当たり4画素)以上の場合に、そのマクロブロックが注目領域に含まれるものと判断する。
【0034】
階調設定部21は、領域分割制御手段10の領域識別部13で識別された注目領域及び背景領域の各マクロブロック毎に階調の削減量を設定し、マクロブロックの座標とともに削減情報として階調削減部22へ出力するものである。ここでは、映像(映像データ)を伝送するための伝送路のC/N(Carrier to Noise Ratio)情報や映像を蓄積するネットワークサーバのバッファ占有情報等に基づいて、予め映像データの削減量(映像削減量)を求めておき、キーボード等の入力手段(図示せず)から、その映像削減量を階調設定部21に入力するものとする。そして、階調設定部21では、その映像削減量に基づいて、背景領域の階調が注目領域の階調よりも低くなるように各領域の階調削減量を設定する。
【0035】
ここで、図3及び図4を参照して、階調設定部21における注目領域及び背景領域の階調削減量の設定方法について説明する。ここでは、映像データをYC(輝度/色差)映像信号とし、その階調が8ビットで表現されているものとする。図3は、YC(輝度/色差)映像信号の例として、MPEG−2におけるマクロブロックの構成を示したものである。図4は、階調を削減する削除内容の優先順位を示したものである。
【0036】
図3に示したように、MPEG−2では、マクロブロックは16×16画素のY(輝度)映像信号と、8×8画素のC(色差)映像信号(Cr映像信号及びCb映像信号)で構成されている。ここで階調を削減するとは、各画素を示すビット数そのものを削減して、その画素が表現できるレベルを少なくすることである。例えば、8ビットで256階調の映像を表現可能な元の画素B1から3ビット削減することで、削減後の画素B2は5ビットで32階調までしか表現することができない。
【0037】
そして、図4に示したように、階調設定部21(図1)は優先順位(1)〜(8)の順番で、階調削減量を各マクロブロックに設定する。
優先順位(1)では、背景領域のC(色差)映像信号の階調を削減するように設定し、優先順位(2)では、背景領域のY(輝度)映像信号の階調を削減するように設定する。そして、優先順位(3)では、注目領域のC(色差)映像信号の階調を削減するように設定し、優先順位(4)では、注目領域のY(輝度)映像信号の階調を削減するように設定する。なお、ここまでの削減では、階調が最小で5ビットになるまで削減できるものとする。
【0038】
ここで、C(色差)映像信号の削減をY(輝度)映像信号の削減よりも優先したのは、人間の視覚が輝度成分に比べて色差成分の感度が低いという特徴を有しているからである。また、ここで最小階調を5ビットとしたのは、階調8ビットの原画映像に対して階調を4ビット以下に削減すると画質が著しく劣化することが報告されていることによる(参考文献:大塚 他,“時間・空間・階調解像度とTV画質”,電子情報通信学会画像工学研究会,IE87−114,pp.17−24,1987)。
【0039】
そして、さらに階調の削減を要する場合は、優先順位(5)として、背景領域のC(色差)映像信号の階調を5ビット未満(最小0ビットまで)に削減し、優先順位(6)として、注目領域のC(色差)映像信号の階調を5ビット未満(最小0ビットまで)に削減する。また、優先順位(7)では、背景領域のY(輝度)映像信号の階調を5ビット未満(最小0ビットまで)に削減し、優先順位(8)では、注目領域のY(輝度)映像信号の階調を5ビット未満(最小0ビットまで)に削減する。
なお、優先順位(6)及び優先順位(7)はその優先順位を逆にすることとしてもよい。また、映像フレーム内に注目領域が存在しない場合は、優先順位(3)、(4)、(6)及び(8)は、考慮しないものとする
【0040】
また、優先順位(1)〜(4)において、最小階調を5ビットとしたが、処理対象映像の解像度に依存して変更することとしてもよい。例えば、ハイビジョン方式やNTSC方式の放送映像の場合は最小階調を6ビットとし、SIF(水平352×垂直240画素)やQSIF(水平176×垂直120画素)の場合は最小階調を5ビットとする。
図1に戻って説明を続ける。
【0041】
階調削減部22は、階調設定部21で設定されたマクロブロック毎の階調の削除量(削減情報)に基づいて、各マクロブロックの階調を削減するものである。この階調削減部22で階調を削減された映像データは、圧縮を行った映像データとして出力される(出力映像データ)。例えば、映像データの画素が8ビットで構成されており、階調設定部21から通知される削減情報において、あるマクロブロックの階調の削減量が2ビットであった場合、階調削減部22は、そのマクロブロックの階調を6(8マイナス2)ビットとする。これによって、映像データの情報量を圧縮することができる。
【0042】
以上、一実施形態に基づいて、映像データ圧縮装置1の構成について説明したが、本発明はこれに限定されるものではない。例えば、領域分割制御手段10で行う注目領域の抽出は、動きベクトルを用いる以外にも、注目領域と背景領域の色の特徴量が異なる場合は、特定の階調値を閾値として注目領域を抽出することも可能である。この閾値による注目領域の抽出では、注目領域の被写体は動いている必要はない。
【0043】
また、映像データ圧縮装置1は、コンピュータにおいて各手段を各機能プログラムとして実現することも可能であり、各機能プログラムを結合して映像データ圧縮プログラムとして動作させることも可能である。
【0044】
(映像データ圧縮装置1の動作)
次に、図1及び図5を参照して、映像データ圧縮装置1の動作について説明する。図5は、映像データ圧縮装置1の動作を示すフローチャートである。
[領域分割ステップ]
まず、映像データ圧縮装置1は、映像遅延部11aによって、入力された映像データ(入力映像データ)を1映像フレーム分遅延させる(ステップS1)。そして、動きベクトル検出部11bによって、入力映像データの映像フレームと映像遅延部11aで遅延された1映像フレーム前の映像フレームとの間(隣接映像フレーム間)で、マクロブロック毎にブロックマッチングを行うことで動きベクトルを検出する(ステップS2)。
【0045】
この動きベクトル検出部11bで検出された動きベクトルに基づいて、グローバルベクトル算出部12が、複数の動きベクトルの中で、最も多く検出された動きベクトルをグローバルベクトルとして算出する(ステップS3)。このグローバルベクトルは背景領域の動きベクトルとみなすことができる。
【0046】
そして、映像データ圧縮装置1は、領域識別部13によって、ステップS2で検出したマクロブロックの動きベクトルと、ステップS3で算出したグローバルベクトルとを比較して、両ベクトルの差が予め設定した値(例えば、映像フレーム当たり4画素)以上であるマクロブロックを注目領域に含まれるものとして識別する。これによって、映像フレームを注目領域と背景領域とに分割する(ステップS4)。
【0047】
[階調削減ステップ]
そして、映像データ圧縮装置1は、階調設定部21によって、キーボード等の入力手段(図示せず)から入力された映像データの削減量(映像削減量)に基づいて、背景領域の階調が注目領域の階調よりも低くなるように各領域のマクロブロックの階調削減量を設定する(ステップS5)。このとき、階調削減量は特定の優先順位(図3参照)に基づいて、設定するものとする。
【0048】
そして、映像データ圧縮装置1は、ステップS5で階調削減量を設定されたマクロブロックは、階調削減部22によって、その設定された階調削減量分の階調を削減し(ステップS6)、そのマクロブロック毎に階調を削減した映像フレームを時系列に圧縮映像データ(出力映像データ)として出力する(ステップS7)。そして、映像データ(入力映像データ)の入力が終了したかどうかを判定し(ステップS8)、終了した場合(Yes)は、動作を終了する。一方、まだ映像データが入力される場合(ステップS8でNo)は、ステップS1へ戻って動作を継続する。
【0049】
以上の各ステップによって、映像データ圧縮装置1は、入力映像データ内の注目領域と背景領域とを識別して、各々の領域の階調を独立して削減することが可能になる。そして、映像データ圧縮装置1で削減し圧縮された映像データは、注目領域の画質の劣化を背景領域よりも軽減した映像データとなる。
【0050】
(映像データ圧縮装置の構成:第二の実施の形態)
次に、図2を参照して、本発明における第二の実施の形態である映像データ圧縮装置1Bについて説明する。図2は、映像データ圧縮装置1Bの構成を示したブロック図である。図2に示した映像データ圧縮装置1Bは、入力された映像データを、動きのある注目領域とそれ以外の領域である背景領域とに分割し、その分割された領域毎に画素値を表現するための階調を削減することで、映像データを圧縮して出力するものである。
【0051】
映像データ圧縮装置1Bは、映像データ圧縮装置1(図1)のグローバルベクトル算出部12の代わりにカメラデータベクトル算出部14を付加し、さらに領域拡張部15を追加して構成した。この追加したカメラデータベクトル算出部14及び領域拡張部15の構成、並びに領域識別部13Bの機能以外は、図1に示した映像データ圧縮装置1と同一のものであるので、同一の符号を付し、説明は省略する。
【0052】
カメラデータベクトル算出部14は、映像データ(入力映像データ)を撮影したときの撮影カメラ(図示せず)のパン、チルト、ズーム等のカメラデータに基づいて、入力映像データの映像フレームに動きのある注目領域が存在しないと仮定したときのマクロブロックの動きベクトル(背景動きベクトル)を算出するものである。なお、このカメラデータは、入力映像データに連動して時系列に入力されるデータである。このカメラデータベクトル算出部14で算出された背景動きベクトルは、領域識別部13Bに出力される。
【0053】
このカメラデータベクトル算出部14におけるカメラデータを用いた動きベクトルの算出は、例えば、「鄭文濤等,“A High-Pricision Camera Operation Parameter Measurement System and Its Application to Image Motion Inferring”,IEEE Transactions on Broadcasting,Vol.47,No.1,p.46-55,March 2001」で開示されている技術を用いることができる。
【0054】
すなわち、カメラデータベクトル算出部14では、カメラの動き(パン、チルト、ズーム等)によって、映像フレーム内のあるマクロブロックが当該映像フレームのどこに移動するかを算出し、そのマクロブロックの移動方向及び移動量を背景動きベクトルとする。例えば、カメラを画面の右方向にパンすると、背景として映っている領域は左方向に移動したように見える。この移動した領域は映像フレーム内では動きを持っているが、実際には背景領域となるものである。このように、カメラデータベクトル算出部14は、カメラの動きによる背景の動きベクトルを算出する。
【0055】
領域識別部13Bは、動きベクトル検出部11bで検出されたマクロブロック毎の動きベクトルと、カメラデータベクトル算出部14で算出された背景動きベクトルとに基づいて、マクロブロックが動きのある注目領域に含まれるものか、それ以外の領域である背景領域に含まれるものかを識別するものである。この領域識別部13Bで識別されたマクロブロック毎の領域(注目領域又は背景領域)は、マクロブロックの座標とともに領域情報として領域拡張部15へ出力される。
【0056】
この領域識別部13Bでは、動きベクトル検出部11bで検出されたマクロブロック毎の動きベクトルとカメラデータベクトル算出部14で算出された背景動きベクトルとを比較することで、背景動きベクトル以外の動きをするマクロブロックを注目領域に含まれるマクロブロックであると判断する。
【0057】
領域拡張部(領域拡張手段)15は、領域識別部13Bから出力される領域情報に基づいて、注目領域と背景領域とが隣接する領域で、その両領域のマクロブロックの相関を調べ、予め設定した相関値よりも高い場合に、その背景領域のマクロブロックを注目領域のマクロブロックとみなして、注目領域の拡張を行うものである。例えば、各マクロブロックの輝度、色等の特徴量を比較することで相関を調べる。この領域拡張部15で注目領域の拡張を行った領域情報は、階調削減制御手段20の階調設定部21へ出力される。
【0058】
以上、映像データ圧縮装置1Bの構成について説明したが、映像データ圧縮装置1Bは、コンピュータにおいて各手段を各機能プログラムとして実現することも可能であり、各機能プログラムを結合して映像データ圧縮プログラムとして動作させることも可能である。
【0059】
(映像データ圧縮装置1Bの動作)
次に、図2及び図6を参照して、映像データ圧縮装置1Bの動作について説明する。図6は、映像データ圧縮装置1Bの動作を示すフローチャートである。
まず、映像データ圧縮装置1Bは、映像遅延部11aによって、入力された映像データ(入力映像データ)を1映像フレーム分遅延させる(ステップS10)。そして、動きベクトル検出部11bによって、入力映像データの映像フレームと映像遅延部11aで遅延された1映像フレーム前の映像フレームとの間(隣接映像フレーム間)で、マクロブロック毎にブロックマッチングを行うことで動きベクトルを検出する(ステップS11)。
【0060】
そして、映像データ圧縮装置1Bは、カメラデータベクトル算出部14によって、映像データ(入力映像データ)を撮影したときの撮影カメラ(図示せず)のパン、チルト、ズーム等のカメラデータに基づいて、背景領域が映像フレーム内で移動する動きベクトル(背景動きベクトル)を算出する(ステップS12)。
【0061】
次に、映像データ圧縮装置1Bは、領域識別部13Bによって、ステップS11で検出したマクロブロックの動きベクトルと、ステップS12で算出した背景動きベクトルとを比較して、背景動きベクトルとは異なる動きベクトルを持つマクロブロックを注目領域に含まれるマクロブロックとして識別する。これによって、映像フレームを注目領域と背景領域とに分割する(ステップS13)。
【0062】
さらに、映像データ圧縮装置1Bは、領域拡張部15によって、注目領域と背景領域とが隣接する領域で、その両領域のマクロブロックの相関を調べ、予め設定した相関値よりも高い場合に、その背景領域のマクロブロックを注目領域のマクロブロックとみなして、注目領域の拡張を行う(ステップS14)。
なお、これ以降の動作は、図5の階調削除ステップ(ステップS5以降)と同様であるので説明は省略する。
【0063】
以上の各ステップによって、映像データ圧縮装置1Bは、移動カメラ等のようなカメラを動作させて被写体を撮影した映像データに対して、その入力映像データ内の注目領域と背景領域とを識別して、各々の領域の階調を独立して削減することが可能になる。そして、映像データ圧縮装置1Bで階調を削減し圧縮された映像データは、注目領域の画質の劣化を背景領域よりも軽減した映像データとなる。
【0064】
【発明の効果】
以上説明したとおり、本発明に係る映像データ圧縮装置、その方法及びそのプログラムでは、以下に示す優れた効果を奏する。
【0065】
【発明の効果】
請求項1、請求項4又は請求項5に記載の発明によれば、入力映像データから注目領域を抽出して、注目領域とそれ以外の領域である背景領域とを識別して、各々の領域の階調を個別に削減することが可能になる。これによって、注目領域の階調よりも背景領域の階調を低くすることで、注目領域の画質の劣化を軽減し、映像データの圧縮率を高めることができる。
また、本発明によれば、注目領域の階調よりも背景領域の階調を低くし、圧縮データに占める注目領域の比率を高めることで、注目領域の画質の劣化が軽減することができる。
さらに、本発明によれば、人間の視覚が輝度成分に比べて色差成分の感度が低いため、注目領域及び背景領域毎に、輝度成分に割り当てる階調よりも色差成分に割り当てる階調を低くすることで、画質の劣化を抑えることができる。
【0066】
例えば、携帯端末等の小さい画面では、映像全体を鑑賞することよりも映像データに含まれる情報を得ることが重要であるため、その情報を含んだ注目領域の画質の劣化を軽減することは、映像データを配信するサービスにおいて有効である。
【0067】
請求項2に記載の発明によれば、動きのある領域をブロック単位で注目領域として認識することが可能になる。これによって、注目領域とそれ以外の領域である背景領域との階調を個別にブロック単位で容易に削減することができる。
【0068】
請求項3に記載の発明によれば、動きベクトルによって、背景領域であると認識された領域であっても、色等の特徴量によって注目領域として判定することが可能になる。これによって、例えば、人間が動いているにも関わらず、洋服の端等で動きが少ない領域を注目領域として認識することが可能になる。
【図面の簡単な説明】
【図1】本発明の第一の実施の形態に係る映像データ圧縮装置の全体構成を示すブロック図である。
【図2】本発明の第二の実施の形態に係る映像データ圧縮装置の全体構成を示すブロック図である。
【図3】マクロブロックの構成例を説明するための説明図である。
【図4】階調設定部において階調を削減する階調削減内容とその優先順位を説明するための説明図である。
【図5】本発明の第一の実施の形態に係る映像データ圧縮装置の動作を示すフローチャートである。
【図6】本発明の第二の実施の形態に係る映像データ圧縮装置の動作を示すフローチャートである。
【図7】注目領域及び背景領域の一例を説明するための説明図である。
【符号の説明】
1、1B……映像データ圧縮装置
10、10B……領域分割制御手段
11……動きベクトル算出部(動きベクトル算出手段)
11a……映像遅延部
11b……動きベクトル検出部
12……グローバルベクトル算出部
13、13B……領域識別部(領域識別手段)
14……カメラデータベクトル算出部
15……領域拡張部(領域拡張手段)
20……階調削減制御手段
21……階調設定部
22……階調削減部
Claims (5)
- 入力された映像データについて、各画素の階調を色差成分及び輝度成分毎に個別に削減することで、前記映像データの圧縮を行う映像データ圧縮装置であって、
動きベクトルに基づいて、前記映像データを、映像フレーム毎に被写体が存在する注目領域とそれ以外の背景領域とに分割する領域分割制御手段と、
この領域分割制御手段によって分割された前記注目領域及び前記背景領域において、各画素の階調を色差成分及び輝度成分毎に個別に削減する階調削減制御手段と、を備え、
前記階調削減制御手段が、前記背景領域の色差成分、前記背景領域の輝度成分、前記注目領域の色差成分、前記注目領域の輝度成分の順に優先的に階調を削減することを特徴とする映像データ圧縮装置。 - 前記領域分割制御手段は、
前記映像データの連続した映像フレーム間で特定の大きさのブロック毎に動きベクトルを算出する動きベクトル算出手段と、
この動きベクトル算出手段によって算出された動きベクトルに基づいて、前記映像フレーム内における前記ブロックが、前記注目領域に含まれるブロックか、それ以外の前記背景領域に含まれるブロックかを識別する領域識別手段と、
を備えていることを特徴とする請求項1に記載の映像データ圧縮装置。 - 前記領域分割制御手段は、
前記領域識別手段で識別された前記注目領域と前記背景領域とが隣接する領域において、前記注目領域のブロックと前記背景領域のブロックとの相関に基づいて、前記背景領域のブロックを前記注目領域のブロックとして拡張させる領域拡張手段、
を備えていることを特徴とする請求項2に記載の映像データ圧縮装置。 - 入力された映像データについて、各画素の階調を色差成分及び輝度成分毎に個別に削減することで、前記映像データの圧縮を行う映像データ圧縮方法であって、
動きベクトルに基づいて、前記映像データを、映像フレーム毎に被写体が存在する注目領域とそれ以外の背景領域とに分割する領域分割ステップと、
この領域分割ステップで分割された前記注目領域及び前記背景領域において、各画素の階調を色差成分及び輝度成分毎に個別に削減する階調削減ステップとを含み、
前記階調削減ステップが、前記背景領域の色差成分、前記背景領域の輝度成分、前記注目領域の色差成分、前記注目領域の輝度成分の順に優先的に階調を削減することを特徴とする映像データ圧縮方法。 - 入力された映像データについて、各画素の階調を色差成分及び輝度成分毎に個別に削減して、前記映像データの圧縮を行うために、コンピュータを、
動きベクトルに基づいて、前記映像データを、映像フレーム毎に被写体が存在する注目領域とそれ以外の背景領域とに分割する領域分割制御手段、
この領域分割制御手段によって分割された前記注目領域及び前記背景領域において、前記各画素の階調を色差成分及び輝度成分毎に個別に削減する階調削減制御手段として機能させ、
前記階調削減制御手段が、前記背景領域の色差成分、前記背景領域の輝度成分、前記注目領域の色差成分、前記注目領域の輝度成分の順に優先的に階調を削減することを特徴とする映像データ圧縮プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002224068A JP3792623B2 (ja) | 2002-07-31 | 2002-07-31 | 映像データ圧縮装置、その方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002224068A JP3792623B2 (ja) | 2002-07-31 | 2002-07-31 | 映像データ圧縮装置、その方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004064702A JP2004064702A (ja) | 2004-02-26 |
JP3792623B2 true JP3792623B2 (ja) | 2006-07-05 |
Family
ID=31943662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002224068A Expired - Fee Related JP3792623B2 (ja) | 2002-07-31 | 2002-07-31 | 映像データ圧縮装置、その方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3792623B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006319643A (ja) * | 2005-05-12 | 2006-11-24 | Fuji Photo Film Co Ltd | 動画通信システム |
-
2002
- 2002-07-31 JP JP2002224068A patent/JP3792623B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004064702A (ja) | 2004-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8718143B2 (en) | Optical flow based motion vector estimation systems and methods | |
US9247250B2 (en) | Method and system for motion compensated picture rate up-conversion of digital video using picture boundary processing | |
US8750372B2 (en) | Treating video information | |
JP4369090B2 (ja) | ビデオ情報を符号化し復号化する方法、動き補償ビデオ符号器及び対応する復号器 | |
KR100960742B1 (ko) | 이전에 생성된 움직임 벡터 및 적응 공간적 필터링을 이용한 디지털 비디오용 노이즈 감소 프리-프로세서 | |
EP1241893A2 (en) | Reference frame prediction and block mode prediction for fast motion searching in advanced video coding | |
US20060171457A1 (en) | Rate control for digital video compression processing | |
JP6729170B2 (ja) | 画像処理システム及び画像復号装置 | |
JPH08512189A (ja) | ビデオシーケンスにおける移動を予測する方法 | |
US20030123747A1 (en) | System for and method of sharpness enhancement using coding information and local spatial features | |
JP2006197557A (ja) | 画像符号化装置、画像符号化方法及びそのプログラム | |
US9241095B2 (en) | Method and system for adaptive temporal interpolation filtering for motion compensation | |
US20120008685A1 (en) | Image coding device and image coding method | |
US20110129012A1 (en) | Video Data Compression | |
US20100322313A1 (en) | System and method for estimating sum of absolute differences | |
JP2011528825A (ja) | フレーム全体を平滑化し、保存ディテールをオーバーレイすることによって圧縮映像信号の品質を向上させるシステムおよび方法 | |
JP3792623B2 (ja) | 映像データ圧縮装置、その方法及びそのプログラム | |
US8767831B2 (en) | Method and system for motion compensated picture rate up-conversion using information extracted from a compressed video stream | |
JPH1141609A (ja) | 信号処理装置 | |
US6040875A (en) | Method to compensate for a fade in a digital video input sequence | |
EP3754983A1 (en) | Early intra coding decision | |
CN100531397C (zh) | 用于设置数字视频的运动矢量的方法 | |
US8848793B2 (en) | Method and system for video compression with integrated picture rate up-conversion | |
JP3478836B2 (ja) | デジタル画像シーケンスの符号化方法および符号化装置 | |
Zhu et al. | Optimal Mode Decision Method for Interframe Prediction in H. 264/AVC. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060405 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100414 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110414 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |