本願第一の発明は、デジタル映像信号のカラーコンポーネント信号形式を変換する映像信号変換装置であって、デジタル映像信号を入力する入力手段と、入力された映像信号の輝度信号を格納する輝度信号フレームメモリと、入力された映像信号の色差信号を格納する入力色差信号フレームメモリと、入力された映像信号の色差信号を変換する色差信号変換手段と、色差信号変換手段により変換された色差信号を格納する出力色差信号フレームメモリと、輝度信号フレームメモリに格納された輝度信号と出力色差信号フレームメモリに格納された色差信号とを組み合わせてデジタル映像信号を出力する出力手段とを設けたものであり、カラーコンポーネント信号の形式を直接変換することができる。
また、本願第2の発明は、前記色差信号変換手段が、入力された映像信号の色差信号を4:1:1コンポーネント信号形式から4:2:0コンポーネント信号形式の色差信号に変換するようにしたものであり、DVCフォーマットの映像信号をMPEGフォーマットの映像信号に変換する場合のコンポーネント信号の形式を変換することができる。
また、本願第3の発明は、前記色差信号変換手段が、入力色差信号フレームメモリに格納された色差信号から縦方向に1画素おきに間引いた画素を取り出して縦方向の画素数を2分の1にし、取り出した画素を横方向に複写して横方向の画素数を2倍にするようにしたものであり、色差信号の変換に特別の演算が不要であるため、処理負担が少なくて済む。
また、本願第4の発明は、前記色差信号変換手段が、入力色差信号フレームメモリに格納された色差信号の縦方向に隣り合う2つの画素値の平均値を求め、これを1つの画素値とすることにより縦方向の画素数を2分の1にし、この平均値である1つの画素値を横方向に複写して横方向の画素数を2倍にするようにしたものであり、変換の際の演算量が少なく、変換に要する処理負担が小さい。
また、本願第5の発明は、前記色差信号変換手段が、入力色差信号フレームメモリに格納された色差信号の縦方向に隣り合う2つの画素値の平均値を求め、これを1つの画素値とすることにより縦方向の画素数を2分の1にし、この平均値である1つの画素値と、横方向に隣り合う前記平均値である1つの画素値との平均値を画素値として横方向に補間することにより横方向の画素数を2倍にするようにしたものであり、画素間の画素値の変化が滑らかとなり、データ圧縮のためにDCTを施した場合に、圧縮効率が向上する。
また、本願第6の発明は、前記色差信号変換手段が、入力色差信号フレームメモリに格納された色差信号の縦方向に隣り合う2つの画素値の平均値を求め、横方向に隣り合う2つの前記平均値を用いて横方向の線形補間を行なうことにより、横方向の画素数を2倍にし、縦方向の画素数を2分の1にするようにしたものであり、画素間の画素値の変化がより滑らかとなり、DCTを施した場合の圧縮効率が一層向上する。
また、本願第7の発明は、入力色差信号フレームメモリ内の指定された色差信号の画素に対応する輝度信号の画素値を輝度信号フレームメモリから参照する輝度信号参照手段を設け、色差信号変換手段が、輝度信号参照手段を介して参照した輝度信号の値を利用して、色差信号の変換を行なうようにしたものであり、自然画像では色の変化と輝度の変化とが関係しているため、輝度を加味して色差信号の変換を行なうことにより、自然な色の変化を示す映像への変換が可能となる。
また、本願第8の発明は、色差信号変換手段が、入力色差信号フレームメモリの横方向に隣り合う2つの画素の間に、この2つの画素に対応する輝度信号の画素値の比に基づいて色差信号の画素値を線形補間し、横方向の画素数を2倍にするようにしたものであり、補間する画素の色差信号が隣り合う画素の輝度を参考にして決められる。
また、本願第9の発明は、色差信号変換手段が、入力色差信号フレームメモリに格納された色差信号の縦方向に隣り合う2つの画素値の平均値を求め、これを1つの画素値とすることにより縦方向の画素数を2分の1にし、横方向に隣り合う2つの平均値の画素の間に、この2つの平均値の算出に用いた画素に対応する輝度信号の画素値の比に基づいて色差信号の画素値を線形補間し、横方向の画素数を2倍にするようにしたものであり、横方向の画素数を増やすために内挿する画素の画素値を輝度信号の変化と関連付けることができる。
また、本願第10の発明は、色差信号変換手段が、入力色差信号フレームメモリに格納された色差信号の横方向に隣り合う2つの画素に対して、この2つの画素に対応する輝度信号の画素値の比に比例した線形補間を行なうことにより、横方向の色差信号の画素数を2倍にするようにしたものであり、横方向のすべての画素の画素値を、輝度信号を利用した線形補間で求めることにより、輝度と関連付けることができる。
また、本願第11の発明は、色差信号変換手段が、入力色差信号フレームメモリに格納された色差信号の縦、横2つずつから成る4つの画素を、横方向には1画素分ずつずらしながら、縦方向には2画素分ずつずらしながら順次選択し、選択した4つの画素に対応する輝度信号の画素値の比に比例した線形補間を行なうことにより、横方向の色差信号の画素数を2倍にし、縦方向の色差信号の画素数を2分の1にするようにしたものであり、縦方向及び横方向の色差信号の画素値を、輝度信号の変化と関連付けることができる。
また、本願第12の発明は、デジタル映像信号の4:1:1形式のカラーコンポーネント信号を4:2:0形式のカラーコンポーネント信号に変換する映像信号変換方法であって、4:1:1形式のカラーコンポーネント信号の色差信号に対して、この色差信号の2n行または2n+1行(但し、nは整数)のいずれか一方の画素値を用いることによって、縦方向の解像度を2分の1にし、前記画素値を左または右隣りの列に複写することによって、横方向の解像度を2倍にするようにしたものであり、特別の演算を行なうことなく、コンポーネント信号形式の変換が可能である。
また、本願第13の発明は、同様の映像信号変換方法において、4:1:1形式のカラーコンポーネント信号の色差信号に対して、この色差信号の2n行と2n+1行、または2n+1行と2(n+1)行の縦方向に隣り合う2つの画素値の平均値を求めることによって、縦方向の解像度を2分の1にし、この平均値を左または右隣りの列に複写することによって、横方向の解像度を2倍にするようにしたものであり、少ない演算量でコンポーネント信号の形式を変換することができる。
また、本願第14の発明は、同様の映像信号変換方法において、4:1:1形式のカラーコンポーネント信号の色差信号に対して、この色差信号の2n行と2n+1行、または2n+1行と2(n+1)行の縦方向に隣り合う2つの画素値の平均値を求めることによって、縦方向の解像度を2分の1にし、横方法に隣り合う2つの平均値の平均値を求め、これを画素値として隣り合う2つの平均値の間に補間することによって、横方向の解像度を2倍にするようにしたものであり、画素間の画素値の変化を滑らかにすることができる。
また、本願第15の発明は、同様の映像信号変換方法において、4:1:1形式のカラーコンポーネント信号の色差信号に対して、この色差信号の2n行と2n+1行、または2n+1行と2(n+1)行の縦方向に隣り合う2つの画素値の平均値を求め、横方向に隣り合うこの2つの平均値を用いて線形補間を行なうことによって、横方向の解像度を2倍にし、縦方向の解像度を2分の1にするようにしたものであり、画素間の画素値の変化をより滑らかにすることができる。
また、本願第16の発明は、同様の映像信号変換方法において、4:1:1形式のカラーコンポーネント信号の色差信号に対して、この色差信号の2n行と2n+1行、または2n+1行と2(n+1)行の縦方向に隣り合う2つの画素値の平均値を求めることによって、縦方向の解像度を2分の1にし、横方向に隣り合う2つのこの平均値の算出に用いた画素に対応する輝度信号の画素値の比に基づいて色差信号を線形補間し、得られた画素値を2つの平均値の間に内挿することによって、横方向の解像度を2倍にするようにしたものであり、横方向に内挿する画素の画素値を、輝度信号の変化に関連付けているため、自然で精細な映像への変換が可能となる。
また、本願第17の発明は、同様の映像信号変換方法において、4:1:1形式のカラーコンポーネント信号の色差信号に対して、この色差信号の2n行と2n+1行、または2n+1行と2(n+1)行の上及び隣接する列の上で互いに隣り合う合計4つの画素を順次選択し、この4つの画素に対応する輝度信号の画素値の比に比例した線形補間を行なうことにより、色差信号の横方向の解像度を2倍にし、縦方向の解像度を2分の1にするようにしたものであり、縦方向及び横方向の色差信号の画素値を、輝度信号の変化に関連付けることができるため、より自然で精細な映像への変換が可能となる。
また、本願第18の発明は、圧縮フォーマットが異なるデジタル映像信号間の変換を行なう映像信号変換装置であって、映像信号を入出力する入出力手段と、入力した圧縮されている映像信号を復号する映像復号化手段と、復号された映像信号のコンポーネント信号形式を変換するコンポーネント信号変換手段と、コンポーネント信号変換手段により変換された映像信号を圧縮し符号化する映像符号化手段とを設け、コンポーネント信号変換手段を、請求項1乃至11に記載の映像信号変換装置で構成したものであり、入力した圧縮フォーマットの映像信号が復号され、次いでコンポーネント信号形式が変換され、その後、所定の圧縮フォーマットに変換される。
また、本願第19の発明は、前記映像復号化手段に、入力された映像信号に対して情報の並べ替えを行なう前処理手段と、前処理手段により並び替えられた情報を可変長復号する可変長復号化手段と、可変長復号化手段により可変長復号された情報を逆量子化する逆量子化手段と、逆量子化手段により逆量子化された情報に対して逆DCT処理を施す逆DCT処理手段とを設け、前記映像符号化手段に、コンポーネント信号変換手段の出力を格納する入力バッファと、入力バッファに格納された情報に対してDCT処理や量子化を行なうDCT圧縮手段と、DCT圧縮手段の出力を非圧縮情報に伸張する逆DCT伸長手段と、逆DCT伸長手段の出力を格納するフレームメモリと、動きベクトルを求めフレーム間差分を求める動き予測手段と、符号化の種類を選択する符号選択手段と、符号選択手段の出力に対して可変長符号化処理を施す可変長符号化手段と、最終的な圧縮フォーマットの信号を生成する構造符号化手段と、映像符号化手段の各手段の動作を制御する符号化制御手段とを設けたものであり、DVCフォーマットなどの直交変換圧縮されたデジタル映像信号をMPEGフォーマットなどの動き補償付き直交変換圧縮されたデジタル映像信号に直接変換することができる。
また、本願第20の発明は、圧縮フォーマットが異なるデジタル映像信号間の変換を行なう映像信号変換装置であって、映像信号を入出力する入出力手段と、入力した圧縮されている映像信号を復号するとともに、復号の過程で映像信号のコンポーネント信号形式を変換する映像復号化手段と、コンポーネント信号形式が変換された映像信号を圧縮し符号化する映像符号化手段とを設けたものであり、入力した圧縮フォーマットの映像信号が復号と同時にコンポーネント信号形式が変換され、次いで、所定の圧縮フォーマットに変換される。
また、本願第21の発明は、映像復号化手段に、入力された映像信号に対して情報の並べ替えを行なう前処理手段と、前処理手段により並び替えられた情報を可変長復号する可変長復号化手段と、可変長復号化手段により可変長復号された情報を逆量子化して輝度信号及び色差信号のDCT係数を再生する逆量子化手段と、再生された色差信号のDCT係数を間引き、または補間してDCT係数の解像度を変更するDCT係数変換手段と、逆量子化手段から出力された輝度信号のDCT係数とDCT係数変換手段から出力された色差信号のDCT係数とに対して逆DCT処理を施す逆DCT処理手段とを設け、映像符号化手段に、映像復号化手段の出力を格納する入力バッファと、入力バッファに格納された情報に対してDCT処理や量子化を行なうDCT圧縮手段と、DCT圧縮手段の出力を非圧縮情報に伸張する逆DCT伸長手段と、逆DCT伸長手段の出力を格納するフレームメモリと、動きベクトルを求めフレーム間差分を求める動き予測手段と、符号化の種類を選択する符号選択手段と、符号選択手段の出力に対して可変長符号化処理を施す可変長符号化手段と、最終的な圧縮フォーマットの信号を生成する構造符号化手段と、映像符号化手段の各手段の動作を制御する符号化制御手段とを設けたものであり、映像復号化手段において、コンポーネント形式の変換が復号処理の中間情報であるDCT係数の段階で行なわれる。この映像復号化手段で復号化された非圧縮コンポーネント信号を映像符号化手段が圧縮符号化することにより、DVCフォーマットなどのデジタル映像信号からMPEGフォーマットなどのデジタル映像信号への直接変換が可能になる。
また、本願第22の発明は、DCT係数変換手段が、色差信号のDCT係数で構成されるDCTブロックから、低周波部分を含む縦方向の半分のDCT係数を抜き出し、抜き出したDCT係数の横方向に値が0のDCT係数を同数だけ付け足して、元のDCTブロックに比べて、縦方向のDCT係数の数が半分で、横方向のDCT係数の数が2倍のDCTブロックを生成するようにしたものであり、このように色差信号のDCT係数における解像度を変換することにより、4:1:1形式の映像信号を4:2:0形式の非圧縮映像信号に変換することが可能になる。
また、本願第23の発明は、映像復号化手段が、入力したDCT処理が施された圧縮映像信号の輝度信号のDCT係数を映像符号化手段に送るように構成し、映像符号化手段に、映像復号化手段から送られたDCT係数を格納するDCT係数バッファと、DCT係数バッファに格納されたDCT係数に対して低周波成分から段階的に逆DCTを施し、解像度の異なる複数の画像である階層画像を生成する階層的逆DCT処理手段とを設け、動き予測手段が、階層的逆DCT処理手段で生成された階層画像を用いて動きベクトルを求めるようにしたものであり、入力映像信号の復号過程で得られる輝度信号のDCT係数を、映像符号化手段における階層画像の生成に利用することによって、処理量及び処理時間の短縮を図ることができる。
また、本願第24の発明は、映像復号化手段が、入力したDCT処理が施された圧縮映像信号の輝度信号のDCT係数を映像符号化手段に送るように構成し、映像符号化手段に、映像復号化手段から送られたDCT係数を格納するDCT係数バッファと、DCT係数バッファに格納されたDCT係数の一部に対して一次元の逆DCT処理を施し、2方向の一次元情報を生成する1次元逆DCT処理手段とを設け、動き予測手段が、1次元逆DCT処理手段で生成された2方向の一次元情報を用いて動きベクトルを求めるようにしたものであり、動きベクトルの検出に要する演算量を削減することができる。
また、本願第25の発明は、この映像信号変換装置が、DVCフォーマットの映像信号を入力し、MPEGフォーマットの映像信号に変換して出力するようにしたものであり、高画質なDVCフォーマットの映像信号を、通信に適したMPEGフォーマットの映像信号に変換することができる。
また、本願第26の発明は、DVCフォーマットの映像信号をMPEGフォーマットの映像信号に変換する映像信号変換方法であって、DVCフォーマットの映像信号の復号処理中に再生する色差信号のDCT係数を間引き、または補間してDCT係数の解像度を変換し、解像度を変換した色差信号のDCT係数と輝度信号のDCT係数とに逆DCT処理を施して4:2:0形式の非圧縮コンポーネント信号を復号し、この非圧縮コンポーネント信号をMPEGフォーマットの映像信号に符号化するようにしたものであり、DVCフォーマットの復号と併せて、信号形式が4:2:0形式に変換されるため、少ない処理工程でDVCフォーマットからMPEGフォーマットへの変換が可能になる。
また、本願第27の発明は、DCT係数の解像度の変換に際して、色差信号のDCT係数で構成されるDCTブロックから、低周波部分を含む縦方向の半分のDCT係数を抜き出し、抜き出したDCT係数の横方向に値が0のDCT係数を同数だけ付け足して、元のDCTブロックに比べて、縦方向のDCT係数の数が半分で、横方向のDCT係数の数が2倍のDCTブロックを生成するようにしたものであり、色の変化が滑らかな画質に変換することができる。
また、本願第28の発明は、デジタル映像をユーザの要求するフォーマットの映像信号で提供する映像提供システムであって、デジタル信号を伝送するネットワークと、ネットワークを介してデジタル映像を取得し、取得したデジタル映像を再生する映像再生端末と、デジタル映像を蓄積して映像再生端末に提供する映像提供部と、映像提供部にネットワークを介してデジタル映像を入力する映像入力部とを設け、映像提供部に、ネットワークに接続してデジタル映像の入出力を行なう通信手段と、デジタル映像を蓄積する映像蓄積手段と、デジタル映像の圧縮フォーマットを変換する映像信号変換手段と、通信手段、映像蓄積手段及び映像信号変換手段を制御する制御手段とを設け、映像信号変換手段を、請求項18乃至25の映像信号変換装置によって構成したものであり、映像再生端末に対して、その要求するフォーマットのデジタル映像を提供することができる。
また、本願第29の発明は、映像信号変換手段が、入力したデジタル映像のフォーマットを変換し、映像蓄積手段に、1つのデジタル映像に関して各種のフォーマットの映像信号が蓄積されるようにしたものであり、映像再生端末が要求するフォーマットのデジタル映像を、映像蓄積手段に蓄積されている中から選んで提供することができる。
また、本願第30の発明は、映像信号変換手段が、映像蓄積手段から読出されて映像再生端末に出力されるデジタル映像のフォーマットを、ユーザの要求に応じて変換するようにしたものであり、蓄積されているデジタル映像のフォーマットが、そのデジタル映像を映像再生端末に送出する際に、リアルタイムで変換される。
以下、本発明の実施の形態について図面を用いて説明する。
(第1の実施の形態)
第1の実施形態では、4:1:1コンポーネント信号を4:2:0コンポーネント信号に直接変換する映像信号変換装置とその映像信号変換方法について説明する。
この装置は、機能ブロックとして、図1に示すように、4:1:1コンポーネント映像信号が入力する入力手段201と、入力したコンポーネント信号のY信号を格納するYフレームメモリ301と、入力したコンポーネント信号のCr信号を格納する入力Crフレームメモリ302と、入力したコンポーネント信号のCb信号を格納する入力Cbフレームメモリ303と、出力する映像信号の形式に合わせて色差信号を変換する色差信号変換手段401と、変換されたCr信号を格納する出力Crフレームメモリ304と、変換されたCb信号を格納する出力Cbフレームメモリ305と、4:2:0コンポーネント信号を出力する出力手段202とを備えている。
次に、この装置の動作を説明する。全体の処理の流れを図2に示す。この装置は、この図2の流れで映像信号の変換を行なう。
ステップ101:最初に、入力手段201が、1フレーム分の4:1:1コンポーネント映像信号を入力し、Y信号をYフレームメモリ301に、Cr信号、Cb信号を、それぞれ入力Crフレームメモリ302、入力Cbフレームメモリ303に格納する。
ステップ102:次に色差信号変換手段401が、入力Crフレームメモリ302と入力Cbフレームメモリ303とに格納された色差信号を4:2:0の色差信号に変換し、変換結果を出力Crフレームメモリ304と出力Cbフレームメモリ305とに格納する。
ステップ103:次に出力手段102が、Yフレームメモリ301に格納されたY信号と出力Crフレームメモリ304に格納されたCr信号と出力Cbフレームメモリ305に格納されたCb信号とを組み合わせて4:2:0コンポーネント信号として出力する。
ステップ104:そして、処理したフレームが、動画の最終フレームであれば処理を終了し、そうでなければ、次のフレームに対して同様の処理を行なう(ステップ101に戻る)。
上記の処理における色差信号変換処理(ステップ102)について、次に説明する。
図3は、(A)コンポーネント信号のY信号の一部、(B)そのY信号に対応する4:1:1のCr、Cb信号、(C)そのY信号に対応する4:2:0のCr、Cb信号を示す図である。図3(A)において、Yx,yは、フレームの左上を始点としたときの画素単位のX座標、Y座標がそれぞれx,yの画素における輝度値を表す。即ち、図3(A)に示したY信号は、フレームの左上から縦4画素、横8画素の部分を取り出して示したものである。また、図3(B)、(C)において、Ui x,y、はCrフレーム中のX座標、Y座標がそれぞれx,yの画素における色差Crの値を示し、Vi x,yはCbフレーム中のX座標、Y座標がそれぞれx,yの画素における色差Cbの値を示す。また、Ui x,y、Vi x,yのうち、iが1のものは入力フレームの値、即ち4:1:1の色差信号を表し、iが2のものは出力フレームの値、即ち4:2:0の色差信号を表す。
ここで説明する色差信号変換処理(ステップ102)は、図3におけるU1、V1からU2、V2を求める処理に他ならない。この処理は複数の方法によって行なうことができる。以下にその方法をそれぞれ説明する。
以下の説明では、図3を用いて、フレームの一部の色差信号の変換を例として示すが、同様の処理をフレームの他の部分に施すことにより、フレーム全体について色差信号の変換が可能であることは明らかである。
(色差信号変換の方法1)
第1の方法は、入力の色差信号に対して、縦方向の解像度を、入力の色差信号の中の奇数、あるいは偶数番目の色差信号の値を用いることで半減させ、横方向の解像度を、左側の色差信号の値をそのまま用いることで2倍にするものである。即ち、この変換方法によれば、図3のU2、V2は次の式(数式1)による計算で求めることができる。
U2 2x,y = U2 2x+1,y = U1 x,2y
V2 2x,y = V2 2x+1,y = V1 x,2y (数式1)
ここで、xとyは正の整数値である。
ところで、一般に、DVフォーマットで記録される4:1:1の色差信号は、DVフォーマットで記録するデジタルビデオ機器に入力される4:2:2の色差信号の隣り合う2つの色差信号値の右側を取り除いて生成される。この例を図4に示す。図4(A)は、このデジタルビデオ機器に入力されるY信号を示し、図4(B)は、それに対応する4:2:2の色差信号を示している。このとき、DVフォーマットとして記録される4:1:1の色差信号は、図4(C)に示すように、図4(B)の色差信号を横方向に1つおきに間引いたものとなる。
この実施形態の色差信号変換の第1の方法は、DVフォーマットの映像信号の元となる4:2:2信号から考えた場合に、その情報を加工せず用いていると見ることができる(図3(C)のU2 0,0、U2 2,0は、それぞれ図4(B)のU1 0,0、U1 2,0をそのまま用いることになる)から、4:2:2信号に忠実な色情報を変換後の信号に残すことができるという有効な性質を有する。
また、この変換方法では、色差信号の変換に演算が不要であるため、処理の負担を最も軽減できるという有効な性質も有する。
(色差信号変換の方法2)
第2の方法は、入力の色差信号に対して、縦方向の解像度を、縦に隣り合う2つの色差信号の平均を求めることで半減させ、横方向の解像度を、左側の色差信号の値をそのまま用いることで2倍にするものである。即ち、この変換方法によれば、図3のU2、V2は次の式(数式2)による計算で求めることができる。
U2 2x,y = U2 2x+1,y = (U1 x,2y + U1 x,2y+1)/2
V2 2x,y = V2 2x+1,y = (V1 x,2y + V1 x,2y+1)/2 (数式2)
ここで、xとyは正の整数値である。
この変換方法は、第1の変換方法と比較すると、全ての入力された色差信号を用いて変換を行なっており、入力の色差信号にノイズが加わっている場合、変換後の色差信号に対するノイズの影響を軽減するという有効な性質を有する。また、この変換方法は、入力の色差信号の情報を全て用いた中では、本来の情報をできる限り保存しており、画質的に本来の画像に忠実な高い画質が得られるという有効な性質を有する。また、計算が簡単なため、変換に要する処理負担を軽減するという有効な性質を有する。
(色差信号変換の方法3)
第3の方法は、入力の色差信号に対して、縦方向の解像度を第2の方法と同様にして半減させ、また、横方向の解像度を、横に隣り合う2つの色差信号の平均値をその中間に内挿する色差信号の値とすることで2倍にする方法である。即ち、この変換方法によれば、図3のU2、V2は次の式(数式3)による計算で求めることができる。
U2 2x,y = (U1 x,2y + U1 x,2y+1)/2
U2 2x+1,y = (αU2 2x,y + (1-α)U2 2(x+1),y)/2
V2 2x,y = (V1 x,2y + V1 x,2y+1)/2
V2 2x+1,y = (αV2 2x,y + (1-α)V2 2(x+1),y)/2 (数式3)
ここで、xとyは正の整数値である。
また、αは0から1までの間の任意の値を持つ定数である。例えばαに0.5を用いた場合、内挿される色差信号は、その両隣の色差信号のちょうど平均となる。なお、この変換方法において、色差信号をフレームの右端において補間する場合には、(数式3)による内挿が適用できない。このよう部分は、左側の色差信号の値をそのまま用いるなどの方法により外挿を行なう。
この変換手法は、例えば図3のU2 0,0 とU2 2,0の値が大きく異なる場合でも、U2 1,0にその間の値が内挿されるため、変化が滑らかになり、DCTを施した場合に、低周波部分に情報がより集中するため、圧縮効率が向上するという有効な性質を有する。
(色差信号変換の方法4)
第4の方法は、入力する色差信号の縦方向及び横方向の値を合成して求めた中間値を色差信号の出力とし、その合成における色差信号の配合比率を違えた中間値を横方向に補間する方法である。即ち、この変換方法によれば、図3のU2、V2は次の式(数式4)による計算で求めることができる。
U2 2x,y =(3A + B)/4
U2 2x+1,y =(A + 3B)/4
A = (U1 x,2y + U1 x,2y+1)/2
B = (U1 x+1,2y + U1 x+1,2y+1)/2
V2 2x,y = (C + 3D)/4
V2 2x+1,y = (3C + D)/4
C = (V1 x,2y + V1 x,2y+1)/2
D = (V1 x+1,2y + V1 x+1,2y+1)/2 (数式4)
ここで、xとyは正の整数値である。
この変換方法は、出力する全ての色差信号を線形補間により求めているため、特に色差信号の変化が滑らかであり、DCTを用いた圧縮を行なう際に、圧縮効率が向上するという有効な性質を有する。
次に、上記の4種類の変換方法により色差信号を変換する具体例を示す。これら4種類の変換方法のいずれを用いた場合でも、2種類の色差信号Cr、Cbは同様に変換することができるため、以下に示す具体例ではCr信号の変換のみについて説明する。Cb信号について変換を行なった場合でも、以下に示す具体例と同様の結果を得ることができることは明らかである。
図5、図6及び図7は、異なる4:1:1のCr信号が入力したとき、それぞれの変換方法で、その変換結果がどのように変わるかを示している。図5、図6及び図7において、(A)は入力された4:1:1のCr信号であり、(B)は第1の変換方法により変換した4:2:0のCr信号、(C)は第2の変換方法により変換した4:2:0のCr信号、(D)は第3の変換方法により変換した4:2:0のCr信号、また、(E)は第4の変換方法により変換した4:2:0のCr信号を示している。それぞれの例において、個々の升目が1つのCr信号の画素を示し、升目の中の数値が画素値を表す。また、これらのCr信号は、全て、Cr信号のフレームの左上端から一部を抜き出したものとする。即ち、全ての例において、左上の升目がCr信号のフレームの左上端の画素を表す。これらの例の変換結果は、それぞれの変換方法の式により求めた値であるが、小数点以下は四捨五入して整数値で表している。なお、画素値として「−」の記号が記入されている画素は、画素値がこの例にない他の部分の画素の値により変化するため、この例では確定しないことを表している。
上記3種類の例における、各変換方法による変換結果の特徴を次に述べる。
第1の変換方法及び第2の変換方法による変換結果では、横に隣り合う2つの画素値が全て等しくなる。
さらに、第1の変換方法による変換結果では、入力のCr信号の中で参照しないライン(水平方向の画素の並び)、即ち、この具体例では2番目及び4番目のラインの画素値は、出力されるCr信号の画素値に影響を与えない。例えば、図5の入力Cr信号(A)の1ライン目と図6の入力Cr信号(A)の1ライン目と図7の入力信号(A)の1ライン目の画素値は全て同じであり、それぞれ2ライン目の画素値は異なる。このような3種類の入力に対して、第1の変換方法では、その変換結果がすべて同じになる。即ち、図5、図6及び図7の第1の変換方法による変換結果(B)において、1ライン目の画素値は全て同じになっている。
また、第3の変換方法による変換結果では、横方向に偶数番目の画素値が、左右の画素値の間の値で、かつ左右の画素値から常に一定の比率(この具体例では左右とも0.5)の値が内挿されている。また、その左右の画素値、即ち横方向に奇数番目の画素値は、入力信号の縦に隣り合う2つの画素値の平均値となっている。この2点が第3の変換方法の特徴である。
また、第4の変換方法では、入力の画素値がそのまま反映されない点に特徴がある。これを、図6を用いて説明する。入力信号(A)において、上半分に注目した場合、左側の縦2画素の平均値は0と200の平均で100、右側の縦2画素の平均値は100と0の平均で50となり、左側の平均値と右側の平均値との差は50となる。
一方、下半分に注目した場合、左側の縦2画素の平均値は100と0の平均で50、右側の縦2画素の平均値は0と0の平均で0となり、左側の平均値と右側の平均値との差は、上半分と同様50となる。
このように差が等しい入力に対して、例えば第3の変換方法による変換では2つの変換結果は同じ差となる。具体的には図6(D)において、左上端の画素値は100、その右隣の画素値は75でその差は25である。そして、その下側のラインにおいても、左端が50、その右隣が25で、その差は25となる。
一方、第4の変換方法による変換結果においては、上側が88と63でその差が25であるのに対し、下側が44と31でその差が13となる。
以上説明したように、この実施形態に示した装置と変換の方法とを用いれば、4:1:1コンポーネント信号を直接4:2:0信号に変換することが可能である。
(第2の実施の形態)
第2の実施形態では、4:1:1コンポーネント信号を4:2:0コンポーネント信号に変換する場合に、対応する画素の輝度信号(Y信号)の値を利用して色差信号の変換を行なう映像信号変換装置とその映像信号変換方法について説明する。
この装置は、図8に示すように、Yフレームメモリ301からY信号を読み出して色差信号変換手段401に提供するY信号参照手段402を備えている。その他の構成は第1の実施形態(図1)と変わりがない。
次に、この装置の動作を説明する。全体の処理の流れは、図2に示す、第1の実施形態の処理の流れと同一である。全体の処理の中で、色差信号変換処理(ステップ102)が第1の実施形態と異なる。この装置では、色差信号変換処理(ステップ102)において、色差信号変換手段402が、Y信号参照手段402を介して、変換すべき色差信号に対応する輝度信号の画素値を参照し、それを色差信号の変換に用いる。
次に、この装置における上記色差信号変換処理(ステップ102)の2種類の変換方法を、図3に示すコンポーネント信号の一部を用いて具体的に説明する。
(色差信号変換の方法5)
第1の方法は、入力の色差信号に対して、縦方向の解像度を、入力の色差信号の中の奇数、あるいは偶数番目の色差信号の値を用いることで半減させ、横方向の解像度を、入力の各画素の右側に値を内挿することにより2倍にするものである。そして、この方法においては、右側に内挿する画素の値を求める際に、参照する左右の色差信号の画素に対応する輝度信号を用いて、参照する比を決定する。即ち、この変換方法によれば、図3のU2、V2は次の式(数式5)による計算で求めることができる。
U2 2x,y = (U1 x,2y + U1 x,2y+1)/2
U2 2x+1,y = (U1 x,2y×B)/2(A+B) + (U1 x+1,2y×A)/2(A+B)
+ (U1 x,2y+1×D)/2(C+D) + (U1 x+1,2y+1×C)/2(C+D)
V2 2x,y = (V1 x,2y + V1 x,2y+1)/2
V2 2x+1,y = (V1 x,2y×B)/2(A+B) + (V1 x+1,2y×A)/2(A+B)
+ (V1 x,2y+1×D)/2(C+D) + (V1 x+1,2y+1×C)/2(C+D)
A = ((Y4x,2y + Y4x+1,2y) - Y4x+3,2y))2
B = ((Y4(x+1),2y + Y4(x+1),2y) - (Y4(x+1)+2,2y + Y4(x+1)+3,2y))2
C = ((Y4x,2y+1 + Y4x+1,2y+1) - (Y4x+2,2y+1 + Y4x+3,2y+1))2
D = ((Y4(x+1),2y+1 + Y4(x+1),2y+1)
- (Y4(x+1)+2,2y+1 + Y4(x+1)+3,2y+1))2 (数式5)
ここで、xとyは正の整数値である。
自然画像においては、一般に、輝度情報と色情報との間に相関がある場合が多い。即ち、色が変化する場合には、輝度も変化する場合が多い。このような自然画像の特徴を考慮した場合、この変換方法は、変換結果として自然で、より精細な色差信号が得られるという有効な性質を有する。
(色差信号変換の方法6)
第2の方法は、第1の実施形態の第4の変換方法(色差信号変換の方法4)と同様に、縦方向及び横方向の色差信号を合成して求めた中間値を色差信号の出力とし、その合成における色差信号の配合比率を違えた中間値を横方向に補間する方法である。色差信号変換の方法4と異なる点は、合成における配合比率を輝度信号と関連付けて決めている点である。即ち、この変換方法によれば、図3のU2、V2は次の式(数式6)による計算で求めることができる。
U2 2x,y = (U1 x,2y×B)/2(A+B) + (U1 x+1,2y×A)/2(A+B)
+ (U1 x,2y+1×F)/2(E+F) + (U1 x+1,2y+1×E)/2(E+F)
U2 2x+1,y = (U1 x,2y×D)/2(C+D) + (U1 x+1,2y×C)/2(C+D)
+ (U1 x,2y+1×H)/2(G+H) + (U1 x+1,2y+1×G)/2(G+H)
V2 2x,y = (V1 x,2y×B)/2(A+B) + (V1 x+1,2y×A)/2(A+B)
+ (V1 x,2y+1×F)/2(E+F) + (V1 x+1,2y+1×E)/2(E+F)
V2 2x+1,y = (V1 x,2y×D)/2(C+D) + (V1 x+1,2y×C)/2(C+D)
+ (V1 x,2y+1×H)/2(G+H) + (V1 x+1,2y+1×G)/2(G+H)
A = ((Y4x,2y + Y4x+1,2y + Y4x+2,2y + Y4x+3,2y)
- 2(Y4x,2y + Y4x+1,2y))2
B = ((Y4(x+1),2y + Y4(x+1)+1,2y + Y4(x+1)+2,2y + Y4(x+1)+3,2y)
- 2(Y4x,2y + Y4x+1,2y))2
C = ((Y4x,2y + Y4x+1,2y + Y4x+2,2y + Y4x+3,2y)
- 2(Y4x+2,2y + Y4x+3,3y))2
D = ((Y4(x+1),2y + Y4(x+1)+1,2y + Y4(x+1)+2,2y + Y4(x+1)+3,2y)
- 2(Y4x+2,2y + Y4x+3,2y))2
E = ((Y4x,2y+1 + Y4x+1,2y+1 + Y4x+2,2y+1 + Y4x+3,2y+1)
- 2(Y4x,2y+1 + Y4x+1,2y+1))2
F = ((Y4(x+1),2y+1 + Y4(x+1)+1,2y+1 + Y4(x+1)+2,2y+1
+ Y4(x+1)+3,2y+1) - 2(Y4x,2y+1 + Y4x+1,2y+1))2
G = ((Y4x,2y+1 + Y4x+1,2y+1 + Y4x+2,2y+1 + Y4x+3,2y+1)
- 2(Y4x+2,2y+1 + Y4x+3,2y+1))2
H = ((Y4(x+1),2y+1 + Y4(x+1)+1,2y+1 + Y4(x+1)+2,2y+1
+ Y4(x+1)+3,2y+1) - 2(Y4x+2,2y+1 + Y4x+3,2y+1))2
(数式6)
ここで、xとyは正の整数値である。また、A〜Hの値としてそれぞれ上記の式の平方根を用いることも可能である。
この変換方法は、この実施形態の第1の変換方法(色差信号変換の方法5)と同様に、輝度の変化を利用しているため、自然で精細な色差信号が得られる。さらに加えて、より滑らかな色差信号を得ることができるため、DCTなどの直交変換による圧縮において圧縮効率の向上が可能になる。
次に、この実施形態の装置によるコンポーネント信号の変換処理の具体例を図9に示す。この具体例では、第1の実施形態の具体例と同様にCr信号の変換についてのみ説明するが、Cb信号の変換も同様に可能である。図9(A)は入力された4:1:1のY信号であり、図9(B)はそのY信号に対応する4:1:1のCr信号を示している。図9(C)は、この入力信号に対して、この実施形態の第1の変換方法により変換した4:2:0のCr信号を示し、図9(D)は、この実施形態の第2の変換方法により変換した4:2:0のCr信号を示している。また、図9(E)は、参考として第1の実施形態の第1の変換方法により変換した4:2:0のCr信号を示している。
この例では、第1の実施形態の具体例と同様に、個々の升目が1つのCr信号もしくはY信号の画素を示し、升目の中の数値が画素値を表す。また、これらのCr信号もしくはY信号は全て、フレームの左上端から一部を抜き出したものとする。これらの例の変換結果は、それぞれの変換方法の式により求めた値であるが、小数点以下は四捨五入して整数値で表している。また画素値として「−」の記号が記入されている画素は、画素値がこの例にない他の部分の画素の値により変化するため、この例では確定しないことを表す。
まず、この実施形態の第1の方法による変換結果を説明する。第1の実施形態による変換結果(E)が、右2画素同士と左2画素同士の値が同じで、値は中央(2画素目と3画素目との間)で分かれているのに対し、この実施形態の第1の変換方法によれば、1画素目と2画素目との間で値が分かれている。DVフォーマットが生成される前の4:2:2の入力において、輝度に対応した色変化をしていた場合(図9(A)の輝度200に対応するCr画素値が0、輝度100に対応するCr画素値が200)を考えると、1画素目と2画素目との間で値が分かれている方が、本来の入力に忠実な値であることが分かる。
次に、この実施形態の第2の方法による変換結果を説明する。この変換結果も、第1の変換結果(C)と同様、1画素目と2画素目で値が変化している。ただし、第1の変換結果(C)と比較して、変化の度合い(2つの画素値の差)は、この変換結果の方が小さい。このことにより、色差信号について低周波成分が増し、DCTなどの直交変換の圧縮効率を向上させることが可能となる。
以上説明したとおり、この実施形態に示した装置と変換方法を用いれば、4:1:1のコンポーネント信号を4:2:0のコンポーネント信号に直接変換することが可能となり、さらに、輝度信号の変化と色差信号の変化との間に相関がある自然画像を入力した場合、自然で精細な色差信号を得ることが可能となる。
(第3の実施の形態)
第3の実施形態では、DVCフォーマットなどの直交変換圧縮されたデジタル圧縮映像信号を、MPEG2フォーマットなどの動き補償付き直交変換圧縮されたデジタル圧縮映像信号に変換する映像信号変換装置について説明する。
この映像信号変換装置は、図10に示すように、デジタル圧縮映像信号が入力し、変換されたデジタル圧縮映像信号が出力される入出力部1000と、入力した圧縮映像信号を非圧縮コンポーネント信号に復号する映像復号部2000と、形式の異なるコンポーネント信号間の直接変換を行なうコンポーネント信号変換部3000と、変換されたコンポーネント信号を圧縮映像信号に変換する映像符号部4000とから構成されている。
そして、入出力部1000は、DVCフォーマットのデジタル圧縮映像信号が入力する入力手段1001と、MPEGフォーマットのデジタル圧縮映像信号を出力する出力手段1002とを備え、映像復号部2000は、シャフリングされている圧縮映像信号をデシャフリングする前処理手段2001と、圧縮映像信号を可変長復号してDCT係数の量子化値を得る可変長復号手段2002と、この量子化値を逆量子化してDCT係数を得る逆量子化手段2003と、DCT係数を基に非圧縮映像信号を生成する逆DCT処理手段2004とを備え、映像符号部4000は、符号化するフレームの種類を指定する符号化制御手段4001と、入力する非圧縮映像信号を格納する入力バッファ4002と、非圧縮映像信号にDCT処理を施し、DCT係数を量子化テーブルの値で除算して量子化値を得るDCT圧縮手段4003と、DCT圧縮手段4003の出力を非圧縮信号に戻す逆DCT伸張手段4004と、非圧縮信号に戻された映像信号を格納するフレームメモリ4005と、フレームメモリ4005に格納された映像信号と入力バッファ4002に格納された映像信号とから画像の動きを予測し、動きベクトルと画素値の差分とを求める動き予測部4100と、動き予測を用いた符号化を行なうかどうかを選択する符号選択手段4006と、符号選択手段4006から渡された情報を可変長符号化する可変長符号手段4007と、可変長符号手段4007から出力される可変長符号化データを用いてMPEGフォーマットを生成する構造符号化手段4008とを備えている。また、コンポーネント信号変換部3000には、第1または第2の実施形態に示した映像信号変換装置を用いる。
次に、この装置の動作を説明する。この装置の全体の処理は、図11に示す流れに沿って行なわれる。
ステップ1100:最初に、入力手段1001より入力されたDVCフォーマットの映像信号を映像復号部2000が復号して非圧縮の映像信号とし、 ステップ1200:復号された非圧縮映像信号の形式を、コンポーネント信号変換部3000が4:1:1から4:2:0に変換し、 ステップ1300:4:2:0に変換されたコンポーネント信号を、映像符号部4000がMPEGフォーマットに圧縮符号化し、出力手段1002を介して出力する。
また、上記の処理は、それぞれの処理(ステップ1100〜ステップ1300)を並行して行なうことも可能である。即ち、映像復号部2000が入力映像信号の全てを完全に復号する前に、復号が済んだ一部のデータを先にコンポーネント信号変換部3000が変換し、映像符号部4000がMPEGフォーマットに圧縮符号化することが可能である。
次に、上記の処理のうち、映像の復号処理(ステップ1100)と映像の符号処理(ステップ1300)とについて詳しく説明する。
まず、映像の復号処理(ステップ1100)について詳しく説明する。最初に、DVCフォーマットについて簡単に説明する。DVCフォーマットは、4:1:1コンポーネント信号に対して8画素×8画素のブロックごとにDCTを施し、DCT係数を量子化し、これを可変長符号化した符号が記録されているフォーマットである。
また、DVCフォーマットの1フレームは、4つの輝度信号のDCTブロックとそれに対応する2つの色差信号のDCTブロックとを組とするマクロブロック、さらに複数のマクロブロックの集合であるスーパーブロックの集合によって構成されている。そして、1フレーム内でマクロブロックやスーパーブロックの記録位置を本来のフレームの位置と変えるシャフリング処理が施されている。
図12は、この装置の映像の復号処理の流れを示すフローチャートである。この装置の映像復号部2000は、次の様に復号を行なう。
ステップ1101:シャフリングされた圧縮信号を、前処理手段2001がデシャッフリングし、フレームごとに、全てのマクロブロックの情報を本来の映像の位置に配置し、ステップ1102:可変長復号手段2002が、可変長復号してDCT係数の量子化値の情報に変換し、ステップ1103:逆量子化手段2003が、可変長復号された情報を逆量子化してDCT係数を求める。
ステップ1104:逆DCT処理手段2004が、DCT係数より各画素の画素値を求めて、非圧縮映像信号を生成する。
次に、映像の符号処理(ステップ1300)について説明する。図13は、この装置の映像の符号処理の流れを示すフローチャートである。この装置の映像符号部4000は、次の様にMPEGフォーマットの映像信号を生成する。
ステップ1301:最初に、DCT圧縮手段4003が、入力バッファ4002より入力した非圧縮映像信号にDCT処理を施し、DCT係数を量子化する。
ステップ1302:符号化制御手段4001が、DCT圧縮手段4003で処理された信号のエンコードされるべきフレームの種類、即ちIピクチャ、Pピクチャ、Bピクチャのいずれかのタイプを選択し、選択されたタイプがIピクチャであれば、符号選択手段4006は、DCT圧縮手段4003が入力バッファ4002のデータについて処理した出力を可変長符号手段4006に渡す。(ステップ1306から処理を続ける)
ステップ1303:選択されたタイプがPピクチャまたはBピクチャであれば、動き予測部4100は、フレームメモリ4004に格納された前フレームの映像信号と入力バッファ4002に格納された現フレームの映像信号とから動き予測を行ない、動きベクトルと画素値の差分情報とを求める。そして、動きベクトルと、DCT圧縮手段4003でDCT・量子化処理した(またはDCT・量子化処理しない)差分情報とを符号選択手段4006に渡す。
ステップ1304:次に、逆DCT伸張手段4004が、DCT圧縮手段4003の出力を逆量子化・逆DCT処理し、フレームメモリ4005に、このフレームの再現した非圧縮映像信号を格納する。
ステップ1305:符号選択手段4005は、マクロブロック毎に動き予測を用いた符号化をするか否かを選択し、動き予測を用いる場合は、動き予測部4100から渡された該当マクロブロックの情報を可変長符号手段4007に渡し、動き予測を用いない場合は、入力バッファ4002のデータについて処理したDCT圧縮手段4002の出力における該当マクロブロックの情報を可変長符号手段4007に渡す。
ステップ1306:そして、可変長符号手段4007は、符号選択手段4005から渡された情報を可変長符号化する。
ステップ1307:最後に、可変長符号手段4007が符号化した可変長符号に対し、構造符号化手段4008が、MPEGデータとして必要なヘッダを付加するなどしてMPEGフォーマットを生成する。
この処理の流れによって、MPEG1及びMPEG2のMPEGフォーマットを生成することが可能である。
次に、上記映像圧縮処理(ステップ1300)の内、動き予測処理(ステップ1303)における動きベクトル計算処理について詳しく説明する。
動きベクトルの計算には、該当するマクロブロックの画素値を探索範囲の全ての箇所の画素値と比較して、それぞれの箇所における画素値の平均誤差を求め、そのマクロブロックの元の位置と最も誤差の少ない箇所の位置との差を動きベクトルとする方法(全探索)を始めとして、種々の方法を用いることができる。この実施形態では、階層画像を用いた段階的な動き情報の探索による計算方法を説明する。
この計算方法は、対象画像フレームと参照する画像のフレームとの両方に対して、解像度を落とした(画素数を減らした)複数の画像を生成し、低い解像度の画像から粗い動きベクトルの情報を計算し、計算に用いる画像を順次解像度の高いものにして動きベクトルの精度を高める方法である。この実施形態では上記の解像度を落とした複数の画像を階層画像と呼ぶ。この計算方法は、自然画像において、大きい物体の動きに当たる粗い動きベクトルを最初に求め、それを基に段階的に精度の高い動きベクトルの計算を行なうため、精度の高い動きベクトルを得ることができ、MPEG符号化時に圧縮効率を上げることができ、結果として画質を向上させることができる方法である。
ここで、階層画像とその生成方法について簡単に説明する。図14は、階層画像の例を示す図である。図14において、最初に、入力される原画像10000から、間引き処理(ダウンサンプリング)により解像度を2分の1に下げた1/2画像が生成され、さらに1/2画像に対して同様のダウンサンプリングを行なう、という手順を繰り返すことで、階層画像が生成される。このとき、ダウンサンプリングとしては、低周波通過フィルタ(LPF)で縦方向、横方向共に空間周波数帯域を2分の1にした後、1つおきに画素を間引く、という処理を用いることができる。
この装置において、この計算方法を実現するための、動き予測部4100について詳しく説明する。
最初に、動き予測部4100の構成を図15を用いて説明する。図15に示すように、動き予測部4100は、階層画像を生成する階層画像生成手段4101と、生成された階層画像を格納する階層画像メモリ4102と、階層画像を用いて低い解像度から段階的に動きベクトルを検出する動き検出手段4103と、動き検出手段4103が検出した段階的な動きベクトルを格納する動き情報一時格納手段4104と、画像圧縮に用いる最終的な動きベクトルを生成する動きベクトル生成手段4105と、この動きベクトルを基に圧縮すべき画像信号のフレーム間差分を求める差分情報生成手段4106とを備えている。
次に、動き予測部4100の処理について、図16のフローチャートを基に説明する。
ステップ2000:階層画像生成手段4101は、入力バッファ4002及びフレームメモリ4005から得た画像データを用いて、対象画像及び参照画像の階層画像を生成し、階層画像メモリ4102に格納する。
ステップ2100:動き検出手段4103は、先ず、対象画像における1/8画像の画素を縦16画素×横16画素の256画素ずつに分割して検索対象ブロックとし、検索対象ブロック毎に、参照画像における1/8画像とのマッチングを取り、動きベクトルを求める。求めた動きベクトルは動き情報一時格納手段4104に格納する。
次に、動き検出手段4103は、対象の1/4画像を縦16画素×横16画素ずつに分割して検索対象ブロックとし、参照画像の1/4画像とのマッチングを取り、動きベクトルを求める。このとき、先に求めた1/8画像の対応するブロックの動きベクトルを動きベクトル候補として用い、動きベクトル候補周辺からマッチングを行なうことで、探索範囲を狭める。
動き検出手段4103は、このような階層的な動き予測を順次より大きい階層画像に対して行ない、最後に原画像に対する動きベクトルを求める。
ステップ2200:動きベクトル生成手段4105は、原画像に対して検出された動きベクトルを最終的な動きベクトルの値として設定する。
ステップ2300:差分情報生成手段4106は、入力バッファ4002及びフレームメモリ4005から入力した画像データを基に、対象画像の各マクロブロックの画素値と、動きベクトルで示された対応する参照画像のブロックの画素値との差分を計算する。
この階層画像を用いた動き予測によれば、動きベクトル導出に必要な計算量を効果的に削減することができる。また、粗い画像から順次動きベクトルの精度を上げているため、画像の大きな動きに忠実な、自然な動きを表現する動きベクトルを求めることができ、動きベクトルの精度を高めることができる。
なお、動き予測部4100の動きベクトル導出処理としては、上記の例の他、既存の階層的な動きベクトル検出方法を用いることも可能である。
こうした処理により、精度の高い動きベクトルを検出することができ、結果として、生成するMPEGフォーマットの圧縮画像の画質を高めることができる。
以上説明したように、この装置によれば、DVCフォーマットの圧縮映像を、高画質なMPEG1、あるいはMPEG2のフォーマットに直接変換することができる。
(第4の実施の形態)
第4の実施形態では、DVCフォーマットなどの直交変換圧縮されたデジタル圧縮映像信号を、MPEG2フォーマットなどの動き補償付き直交変換圧縮されたデジタル圧縮映像信号に変換する映像信号変換装置であって、DVCフォーマットの輝度信号のDCT係数を、MPEGフォーマットの生成に利用する装置について説明する。
この装置は、図17に示すように、映像符号部4000が、映像復号部2000の逆量子化手段2003から送られた輝度信号のDCT係数を格納するDCT係数バッファ4009と、DCT係数バッファ4009に格納されたDCT係数を処理して階層画像を生成する階層的逆DCT手段4010とを備えている。また、映像符号部4000の動き予測部4100は、図18に示すように、第3の実施形態の動き予測部(図15)が有していた階層画像生成手段4101を備えていない。その他の構成は第3の実施形態(図10)と変わりがない。
次に、この装置の動作を説明する。この装置の動作の特徴は、輝度信号を、映像復号部2000がDCT係数のまま直接映像符号部4000に出力し、映像符号部4000の階層的逆DCT手段4010が、そのDCT係数から階層画像を直接生成する点である。そのため、この装置では、第3の実施形態の装置で必要であったダウンサンプリングによる階層画像生成処理が不要になるため、処理時間の短縮を実現することができる。
この装置における全体の処理の流れは、第3の実施形態の全体の処理の流れと同じである。即ち、この装置における全体の処理の流れは図11のフローチャートの通りである。
この装置の処理が、第3の実施形態に示した処理と異なる点は、DVCフォーマットの復号処理(ステップ1100)とMPEGフォーマットの圧縮処理(ステップ1300)とである。
図19に、この装置における映像信号復号処理(ステップ1100)の処理の流れを示す。この装置の映像復号部2000は、図19に示す流れでDVCフォーマットの復号(伸長)を行なう。
ステップ1111:シャフリングされた圧縮信号を、前処理手段2001がデシャッフリングし、フレームごとに、全てのマクロブロックの情報を本来の映像の位置に配置し、ステップ1112:可変長復号手段2002が、可変長復号してDCT係数の量子化値の情報に変換し、ステップ1113:逆量子化手段2003が、可変長復号された情報を逆量子化してDCT係数を求め、ステップ1114:処理中のDCTブロックが輝度信号ならば、ステップ1115:逆量子化手段2003が、求めたDCT係数をDCT係数バッファ4009に格納する。
ステップ1116:また、処理中のDCTブロックが色差信号ならば、逆DCT処理手段2004は、逆DCTによりDCT係数から各画素の画素値を求めて、非圧縮映像信号を生成する。
この非圧縮の色差信号は、コンポーネント信号変換部3000で形式が変換された後、映像符号部4000の入力バッファ4002に格納される。
図20に、この装置における映像信号圧縮処理(ステップ1300)の流れを示す。この装置の映像符号部4000は、図20の流れに沿ってMPEGフォーマットの生成を行なう。
ステップ1311:DCT圧縮手段4003は、処理するDCTブロックが、入力バッファ4002から入力した色差信号であれば、
ステップ1312:そのブロックのデータをDCT変換する。
ステップ1313:次に、符号化制御手段4001が、エンコードするフレームの種類、即ちIピクチャ、Pピクチャ、Bピクチャのいずれかのタイプを選択し、ステップ1314:選択されたタイプがIピクチャであれば、DCT圧縮手段4003は、変換した色差信号のDCT係数及びDCT係数バッファ4009から読み出した輝度信号のDCT係数を量子化し、量子化された信号を符号選択手段4005が、可変長符号手段4006に渡す。(ステップ1319から処理を続ける)
ステップ1315:選択されたタイプがPピクチャまたはBピクチャであれば、DCT係数バッファ4009に格納されたDCT係数に対して、階層的逆DCT処理手段4010が後で説明する階層的逆DCT処理を行ない、階層画像を生成して動き予測部4100に渡す。
ステップ1316:動き予測部4100は、フレームメモリ4004に格納された映像信号と階層的逆DCT処理手段4010から渡された階層画像とから動き予測を行ない、動きベクトルと画素値の差分情報とを求める。そして、動きベクトルと、DCT圧縮手段4003でDCT・量子化処理した差分情報とを符号選択手段4006に渡す。
ステップ1317:次に、逆DCT伸張手段4004が、DCT圧縮手段4003の出力を逆量子化・逆DCT処理し、フレームメモリ4005に、このフレームの再現した非圧縮映像信号を格納する。
ステップ1318:符号選択手段4006は、マクロブロック毎に動き予測を用いた符号化をするか否かを選択し、動き予測を用いる場合は、動き予測部4100から渡された該当マクロブロックの情報を可変長符号手段4007に渡し、動き補償を用いない場合は、入力バッファ4002及びDCT係数バッファ4009のデータについて処理したDCT圧縮手段4002の出力における該当マクロブロックの情報を可変長符号手段4007に渡す。
ステップ1319:可変長符号手段4007は、符号選択手段4006から渡された情報を可変長符号化する。
ステップ1320:最後に、構造符号化手段4008が、可変長符号手段4007が符号化した可変長符号に対し、MPEGデータとして必要なヘッダを付加するなどしてMPEGフォーマットを生成する。
ここで、階層的逆DCT処理(ステップ1315)について説明する。
階層的逆DCT処理とは、DVCフォーマットの信号に含まれるDCT係数に対して、低周波部分から段階的に逆DCTを施し、複数の解像度の画像を生成する処理である。これを図21を用いて説明する。
図21は、左側に、DVCフォーマットの信号に含まれるDCT係数の一部を抜き出したものを示し、右側に、復号された画像を示している。各DCTブロックの黒色部分が、その段階で逆DCTされるべき係数である。即ち、第1段階としてDCT係数の直流(0,0)成分のみを抜き出し、画像を復号する。DCTの直流成分はそのまま1/8画像10030を構成する。次に、左上、つまり低周波部分4画素を逆DCTして1/4画像10020を生成する。同様に、1/2画像10010、原画像10000を生成する。
また、図22に示すように、解像度の高い画像を生成する場合に、その一段階前の復号された画像を用い、その画像との差分、即ち図22のDCT係数の黒色部分のみを逆DCTし、加えることで、さらに演算量を削減することも可能である。
動き予測部4100が、生成された階層画像を用いて、動きベクトルと画素値の差分情報とを求める動作は、第3の実施形態と変わりがない。
以上説明したように、この実施形態の装置では、DVCフォーマットの輝度信号のDCT係数をMPEGフォーマットの作成に利用しているため、処理量の削減が可能となる。また、階層的逆DCT処理では、DVCフォーマットの復号における逆DCTとほぼ同じ演算量で、MPEG符号時に必要となる階層画像を生成することができ、効果的に処理を削減することができる。
(第5の実施の形態)
第5の実施形態では、DVCフォーマットなどの直交変換圧縮されたデジタル圧縮映像信号を、MPEG2フォーマットなどの動き補償付き直交変換圧縮されたデジタル圧縮映像信号に変換する映像信号変換装置であって、動きベクトルの検出処理を少ない演算量で行なうことができる装置について説明する。
この装置は、図23に示すように、第4の実施形態の装置(図17)と異なり、映像符号部4000が、階層的逆DCT手段4010に代わり、1次元の逆DCT処理を行なう1次元逆DCT手段4011を備えている。また、映像符号部4000の動き予測部4100は、図24に示すように、第4の実施形態(図18)において具備していた階層画像メモリ4102を備えていない。その他の構成は第4の実施形態と変わりがない。
次に、この装置の動作について説明する。この装置では、動きベクトル検出処理の動作が、第4の実施形態と異なる。この装置では、DVCフォーマットに含まれる輝度信号のDCT係数に対して、縦方向、横方向それぞれに一次元の逆DCT処理を施し、それぞれ一次元の画素のデータによる動きベクトルを検出し、それを組み合わせて2次元の動きベクトルを導出することにより、動きベクトルを検出している。
具体的な処理の流れを説明する。全体の処理の流れは、第3ないしは第4の実施形態と同様である。即ち、全体の処理の流れは、図11に示すとおりである。また、映像復号処理(ステップ1100)は、第4の実施形態(図19)と同じであり、映像符号処理(ステップ1300)のみが第4の実施形態と異なっている。この装置における映像符号処理(ステップ1300)の流れを図25に示す。この装置の映像符号部4000は、図25の流れに沿って映像符号処理を行なう。
ステップ1321:DCT圧縮手段4003は、処理するDCTブロックが、入力バッファ4002から入力した色差信号であれば、ステップ1322:そのブロックのデータをDCT変換する。
ステップ1323:次に、符号化制御手段4001が、エンコードするフレームの種類、即ちIピクチャ、Pピクチャ、Bピクチャのいずれかのタイプを選択し、ステップ1324:選択されたタイプがIピクチャであれば、DCT圧縮手段4003は、変換した色差信号のDCT係数及びDCT係数バッファ4009から読み出した輝度信号のDCT係数を量子化し、符号選択手段4005が、量子化された信号を可変長符号手段4006に渡す。(ステップ1329から処理を続ける)ステップ1325:選択されたタイプがPピクチャまたはBピクチャであれば、DCT係数バッファ4009に格納されたDCT係数に対して、1次元逆DCT処理手段4011が後で説明する一次元逆DCT処理を行ない、生成した一次元情報を動き予測部4100に渡す。
ステップ1326:動き予測部4100は、フレームメモリ4005に格納された映像信号と1次元逆DCT処理手段4011から渡された一次元情報とから動き予測を行ない、動きベクトルと画素値の差分情報とを求める。そして、動きベクトルと、DCT圧縮手段4003でDCT・量子化処理した差分情報とを符号選択手段4006に渡す。
ステップ1327:次に、逆DCT伸張手段4004が、DCT圧縮手段4003の出力を逆量子化・逆DCT処理し、フレームメモリ4005に、このフレームの再現した非圧縮映像信号を格納する。
ステップ1328:符号選択手段4006は、マクロブロック毎に動き予測を用いた符号化をするか否かを選択し、動き予測を用いる場合は、動き予測部4100から渡された該当マクロブロックの情報を可変長符号手段4007に渡し、動き予測を用いない場合は、入力バッファ4002及びDCT係数バッファ4009のデータについて処理したDCT圧縮手段4002の出力における該当マクロブロックの情報を可変長符号手段4007に渡す。
ステップ1329:可変長符号手段4007は、符号選択手段4006から渡された情報を可変長符号化する。
ステップ1330:最後に可変長符号手段4007が符号化した可変長符号に対し、構造符号化手段4008が、MPEGデータとして必要なヘッダを付加するなどしてMPEGフォーマットを生成する。
ここで、一次元逆DCT処理(ステップ1325)と、一次元情報による動き予測(ステップ1326)について説明する。この処理は、従来2次元の画像そのままで動き予測をしていたものを、2方向の1次元の情報を2次元画像を代表する情報として、動き予測に用いるものである。
図26は、1次元逆DCTと、この処理で得られた1次元情報を用いて行なう動き予測の方法について、概念的に簡単に示した図である。1次元逆DCTでは、個々のDCTブロックに対して、x方向のみの周波数成分とy方向のみの周波数成分とのそれぞれに、1次元の逆DCTを施し、1つのDCTブロックのx方向及びy方向に対して、それぞれ1×8個の1次元の画素値を生成する。ここでは、これを1次元情報と呼ぶ。これをマクロブロック単位で組み合わせると、1マクロブロックは2×2個のブロックで構成されているから、x方向及びy方向のそれぞれに対して、2×16個の1次元の画素値が組み合わされた1マクロブロック分の1次元情報ができる。
同じように、1フレームを構成するブロックの1次元情報を組み合わせて、x方向及びy方向の1フレーム分の1次元情報を作成する。
次いで、x方向y方向のそれぞれにおいて、1マクロブロック分の1次元情報と1フレーム分の1次元情報とのパターンマッチングを行ない、1次元の動きベクトルを検出する。即ち、x方向の1次元情報による動きベクトルは、x方向の値のみを利用し、y方向の1次元情報による動きベクトルは、y方向の値のみを利用して、1マクロブロック分の一次元情報との平均誤差が最小となるフレーム位置を求め、そのマクロブロックの元の位置との差を検出する。
そして、こうして求めたそれぞれの方向の動きベクトルを、動きベクトル候補とし、双方の動きベクトル候補における予測誤差(平均誤差)を比較して、予測誤差の少ない動きベクトルを選択する。
次いで、選択されなかった方向については、選択された方向の動きベクトルに対応した箇所に範囲を限定して、パターンマッチングを行ない、再度動きベクトルを検出する。こうして検出した2方向の動きベクトルを合成して、実際の動きベクトルとする。
この処理を用いると、パターンマッチングの際に必要な差分の絶対値を求める計算の回数を大幅に削減することが可能となる。例えば、1つのマクロブロックの1回のパターンマッチングにおいて、従来は16画素×16画素、即ち256画素について差分の絶対値を求める必要があったが、この処理によれば、各方向の動きベクトル候補の検出として、2画素×16画素、即ち32画素について差分の絶対値を求めるだけでよい。
また、最終的な、選択されなかった方向についてのパターンマッチングは、範囲を限定した、一方向のみのパターンマッチングであるため、計算量は少ない。そのため、結果として、動きベクトル検出のパターンマッチングに要する計算量を1/8近くにまで削減することができる。
なお、この処理におけるパターンマッチングとして、全探索のほか、第3の実施形態のように階層的な処理など、2次元の動きベクトル検出で用いられている処理を用いることもできる。
以上説明したように、この実施形態によれば、DVCフォーマットに含まれるDCT係数を利用することにより、動きベクトル検出に要する計算量を大幅に削減することが可能となる。
(第6の実施の形態)
第6の実施形態では、クライアントが要求するフォーマットの映像信号を提供する多フォーマット映像提供システムについて説明する。
このシステムは、コンピュータのクライアントサーバシステムであり、図27に示すように、クライアントのコンピュータから成る映像再生端末5000と、映像提供用のサーバから成る映像提供部7000と、映像提供部7000に蓄積される映像を入力する映像入力部8000と、各部を結ぶネットワーク6000とを備えており、映像提供部7000は、映像を通信する通信手段7100と、映像を蓄積する映像蓄積手段7300と、映像信号のフォーマットを変換する映像信号変換手段7200と、各手段の動作を制御する制御手段7400とを備えている。映像提供部7000の映像信号変換手段7200には、第3乃至第5の実施形態の映像信号変換装置が使われる。
映像入力部8000は、DVCフォーマットの映像信号を入力し、映像提供部7000は、DVC、MPEG1またはMPEG2のいずれかのフォーマットの映像信号を出力する。
次に、このシステムの動作を説明する。図28は、このシステムの映像提供部7000の処理動作手順を示しており、図28(A)は映像入力処理、図28(B)は映像出力処理の流れを示すフローチャートである。
映像の入力は、次に示す流れで行なわれる。
ステップ3000:制御手段7400は、通信手段7100を介して、映像入力部8000からの映像入力要求を受け付けると、入力許可信号を映像入力部8000に対して送り、ステップ3100:映像入力部8000から、通信手段7100を介して入力されたDVCフォーマットの映像信号を映像蓄積手段7300に蓄積する。
ステップ3200:制御手段7400は、映像信号変換手段7200に対して、映像信号のフォーマットの変換を指示し、映像信号変換手段7200は、映像蓄積手段7300に蓄積された映像信号を読み出して、MPEG1及びMPEG2のフォーマットに変換する。変換されたMPEG1及びMPEG2フォーマットの映像信号は、DVCフォーマットの映像信号とともに、映像蓄積手段7300に蓄積される。
また、映像提供部7000は、次の流れで映像を出力する。
ステップ4000:制御手段7400は、通信手段7100を介して、映像再生端末5000からの映像出力要求を受け付けると、出力許可信号を映像再生端末5000に送り、ステップ4100:映像蓄積手段7300に蓄積されている、要求されたフォーマットの映像信号を、通信手段7100を介して、映像再生端末5000に出力する。
このシステムでは、DVCフォーマットなど、単一のフォーマットで入力された映像を、再生する端末に応じて、他のフォーマットで提供することが可能である。
また、映像信号変換処理が実時間以上の速度で行なえる場合は、図29に示す手順で映像入力処理及び映像出力処理を行なう。映像入力処理は、図29(A)に示すように、ステップ5000:制御手段7400は、通信手段7100を介して、映像入力部8000からの映像入力要求を受け付けると、入力許可信号を映像入力部8000に対して送り、ステップ5100:映像入力部8000から、通信手段7100を介して入力されたDVCフォーマットの映像信号を映像蓄積手段7300に蓄積する。
また、映像出力処理は、図29(B)に示すように、
ステップ6000:制御手段7400は、通信手段7100を介して、映像再生端末5000からの映像出力要求を受け付けると、出力許可信号を映像再生端末5000に送り、ステップ6100:要求された映像信号のフォーマットがDVCフォーマットであれば、ステップ6300:映像蓄積手段7300に蓄積されている映像信号を、通信手段7100を介して、映像再生端末5000に出力する。
また、ステップ6100において、要求された映像信号のフォーマットがDVCフォーマット以外であれば、ステップ6200:制御手段7400は、映像信号変換手段7200に対して、フォーマットの変換を指示し、映像信号変換手段7200は、映像蓄積手段7300に蓄積された映像信号を読み出して、要求されたMPEG1またはMPEG2のフォーマットに変換する。
ステップ6300:制御手段7400は、変換された映像信号を、通信手段7100を介して、映像再生端末5000に出力する。
このように、この場合には、映像出力時に、映像再生端末5000が要求したフォーマットの映像信号にリアルタイムで変換しながら出力する。この場合、映像信号変換手段7200は、通信手段7100とも直接接続されていることが望ましい。
(第7の実施の形態)
第7の実施形態では、復号処理の中間情報であるDCT係数を変換することにより、カラーコンポーネント形式の変換を行なう映像信号変換装置と、その映像信号変換方法について説明する。
この映像信号変換装置は、映像信号を非圧縮コンポーネント信号に復号してからカラーコンポーネント形式を変換する第3の実施形態の装置(図10)と異なり、映像信号の復号化の過程で得られるDCT係数を用いてカラーコンポーネント形式を変換する。そのため、この装置では、図35に示すように、コンポーネント信号変換部3000に代わるものとして、映像復号部2000に、コンポーネント形式の変換に合わせてDCT係数の配列を変更するDCT係数変換手段2005が設けられており、映像復号部2000からは、カラーコンポーネント形式が変換された非圧縮コンポーネント信号が出力される。その他の構成は第3の実施形態と変わりがない。
次に、この装置の動作について説明する。この装置では、DVCフォーマットに含まれる色差信号のDCT係数を間引くことによって縦方向のDCT係数の解像度を半分にし、横方向に0を補間することによって横方向のDCT係数の解像度を2倍にし、こうして解像度を変えたDCT係数に逆DCT処理を施して、MPEG2などのカラーコンポーネント形式に変換している。
具体的な処理の流れを説明する。図36は、本装置の全体の処理の流れを示すフローチャートである。この内、映像符号処理(ステップ1300)は、第3の実施形態の動作(図11のステップ1300)と同じであり、映像復号処理(ステップ1100)のみが第3の実施形態と異なっている。
この装置における映像復号処理(ステップ1100)は、図37に示す手順で行なわれる。この映像復号処理手順のうち、デシャッフル(ステップ1101)、可変長復号(ステップ1102)、逆量子化処理(ステップ1103)は、第3の実施形態の動作(図12のステップ1101、1102、1103)と同じであり、DCT係数変換処理(ステップ1105)及び逆DCT処理(ステップ1106)のみが第3の実施形態と異なっている。この装置の映像復号部2000は、図37の流れに沿って映像復号処理を行なう。
ステップ1101:シャフリングされた圧縮信号を、前処理手段2001がデシャッフリングし、フレームごとに、全てのマクロブロックの情報を本来の映像の位置に配置し、ステップ1102:可変長復号手段2002が、可変長復号してDCT係数の量子化値の情報に変換し、ステップ1103:逆量子化手段2003が、可変長復号された情報を逆量子化してDCT係数を求める。逆量子化手段2003は、求めた輝度信号のDCT係数を逆DCT処理手段2004に出力し、求めた色差信号のDCT係数をDCT係数変換手段2005に出力する。
ステップ1105:DCT係数変換手段2005は、色差信号のDCT係数に対してDCT係数変換処理を施し、色差信号のDCTブロックの縦の解像度を半分にし、横の解像度を2倍にする。
ステップ1106:逆DCT処理手段2004は、逆量子化手段2003から出力されたDCT係数により輝度信号に関する各画素の画素値を求め、また、DCT係数変換手段2005から出力されたDCT係数により色差信号に関する各画素の画素値を求めて、非圧縮映像信号を生成する。
ここで、DCT係数変換処理(ステップ1105)及び逆DCT処理(ステップ1106)について説明する。この処理は、第3の実施形態の装置で非圧縮映像信号に対して行なっていたコンポーネント形式変換を、復号処理の中間情報であるDCT係数の段階で行なう処理である。
図38は、DCT係数変換処理及び逆DCT処理による、4:1:1形式から4:2:0形式へのコンポーネント形式変換について、概念的に簡単に示した図である。
DCT係数変換処理では、4:1:1形式の色差信号の横8×縦8のDCTブロックから、縦方向に低周波部分の半分(横8×縦4)のDCT係数を抜き出すことで縦方向の解像度を半分にする。そして、横方向のDCT係数を2倍にし、新しく増やした横8×縦4のDCT係数の値を0にすることで、横方向の解像度を2倍にする。
逆DCT処理では、DCT係数変換処理により生成された横16×縦4のDCT係数の集まりを1つの新たなDCTブロックとして、縦16×横4の2次元逆DCT処理を行なう。この逆DCT処理により生成された縦16×横4の信号が、4:2:0形式の非圧縮色差信号となる。
このように、このDCT係数変換処理では、4:1:1形式のDCTブロックから、主要な色差情報の全てを含む低周波部分の横8×縦4のDCT係数をそのまま抜き出しているため、変換後の色の変化が滑らかであり、自然な画質の画像が得られる。また、横方向に増やした横8×縦4のDCT係数は、高周波部分に付け足しているため、その値を0にしても人の目にはそれ程目立たない。従って、このDCT係数変換処理により、違和感の無い変換後の画質が得られる。
なお、輝度信号に対する逆DCT処理は、第3の実施形態と同様に行なわれ、逆量子化手段2003から出力されたDCT係数に対して、縦8×横8のDCTブロック単位で2次元逆DCT処理が施され、縦8×横8の単位で非圧縮輝度信号が算出される。
以上説明したように、この実施形態の映像信号変換では、DVCフォーマットに含まれるDCT係数を利用することにより、簡単な構成でカラーコンポーネント形式を変換することができ、また、自然な画質への変換が可能である。
なお、この実施の形態で説明した、DCT係数変換処理と逆DCT処理とは、第4あるいは第5の実施の形態の装置に適用することもできる。