WO2013002144A1

WO2013002144A1 - 映像符号化方法，装置，映像復号方法，装置およびそれらのプログラム

Info

Publication number: WO2013002144A1
Application number: PCT/JP2012/066010
Authority: WO
Inventors: 翔平松尾; 幸浩坂東; 誠之高村; 裕尚如澤
Original assignee: 日本電信電話株式会社
Priority date: 2011-06-27
Filing date: 2012-06-22
Publication date: 2013-01-03
Also published as: BR112013031744A2; RU2573747C2; EP2704434A4; CA2837063A1; EP2704434B1; CN103583043B; US20140112391A1; RU2013154584A; TW201309029A; CN103583043A; TWI502966B; JP2013009240A; JP5649523B2; KR20140011482A; EP2704434A1; ES2673958T3; KR101579106B1

Abstract

　動き補償画面間予測における予測誤差エネルギーを低減させ，符号化効率の改善を図る。小数精度の動き補償を用いる映像符号化方法は，動き探索を行って動きベクトルを取得するステップと，取得した動きベクトルが指し示す小数画素位置の参照確率を算出するステップと，算出された参照確率から小数画素位置である補間位置を複数のグループに分けるステップと，前記補間位置のグループごとに，複数の補間フィルタ係数の候補の中から補間予測画像の生成に用いる補間フィルタ係数を選出するステップと，前記補間位置のグループごとに，選出された補間フィルタ係数を用いて前記補間予測画像を生成し，前記補間予測画像から前記小数精度の動き補償による符号化を実施するステップと，前記補間位置のグループ分けを示す情報および各補間位置のグループにおいてどの補間フィルタ係数を用いるかを示す情報を符号化するステップとを有する。

Description

映像符号化方法，装置，映像復号方法，装置およびそれらのプログラム

　本発明は，映像符号化における補間フィルタの性能改善を図り，符号化効率を改善する技術に関するものである。
　本願は，２０１１年６月２７日に日本へ出願された特願２０１１－１４１７２４号に基づき優先権を主張し，その内容をここに援用する。

　映像符号化において，異なる画面間で予測を実行する画面間予測（動き補償）符号化では，すでに復号されたフレームを参照して，予測誤差エネルギーを最小にする動きベクトルが求められ，その予測誤差信号（残差信号とも呼ばれる）が直交変換される。その後，量子化が施され，エントロピー符号化を経て，最終的にバイナリーデータ，すなわちビットストリームとなる。符号化効率を高めるためには予測誤差エネルギーの低減が不可欠であり，予測精度の高い予測方式が求められる。

　映像符号化標準方式には，数多くの画面間予測の精度を高めるためのツールが導入されている。例えばＨ．２６４／ＡＶＣでは，直近のフレームにオクルージョンが存在する場合は，時間的に少し離れたフレームを参照したほうが予測誤差エネルギーを低減できるため，複数のフレームを参照可能としている。本ツールを複数参照フレーム予測と呼ぶ。

　また，複雑な形状の動きにも対応可能とするために，１６×１６および８×８に加えて，１６×８，８×１６，８×４，４×８，４×４のように，ブロックサイズを細かく分割可能としている。本ツールを可変ブロックサイズ予測と呼ぶ。

　これらと同様に，参照フレームの整数精度画素から６タップのフィルタを用いて１／２精度の画素を補間し，さらにその画素を利用して１／４精度の画素を線形補間で生成する。これにより，小数精度の動きに対して予測が当たるようになる。本ツールを１／４画素精度予測と呼ぶ。

　Ｈ．２６４／ＡＶＣよりも符号化効率の高い次世代映像符号化標準方式の策定に向け，国際標準化組織ＩＳＯ／ＩＥＣ“ＭＰＥＧ”（International Organization for Standardization/International Electrotechnical Commission "Moving Picture Experts Group"）およびＩＴＵ－Ｔ“ＶＣＥＧ”（International Telecommunication Union-Telecommunication Standardization Sector "Video Coding Experts Group"）が共同で検討チーム（Joint Collaborative Team for Video Coding:ＪＣＴ－ＶＣ）を設立した。次世代標準方式は，高能率映像符号化方式（High Efficiency Video Coding: ＨＥＶＣ）と呼ばれ，現在世界各国から様々な新規符号化技術が集められ，ＪＣＴ－ＶＣ会合にて審議されている。

　その中で，特に画面間予測（動き補償）に関連する提案は多くなされており，ＨＥＶＣ用参照ソフトウェア（HEVC test Model:ＨＭ）には，動きベクトルの予測効率を改善するツールや，ブロックサイズを１６×１６以上に拡張するツールが採用されている。

　また，小数精度画素の補間精度を高めるツールも提案されており，補間フィルタ係数をＤＣＴ（Discrete Cosine Transform）係数の基底から導出したＤＣＴベース補間フィルタ（DCT-based Interpolation Filter: ＤＣＴ－ＩＦ）は効果が高く，ＨＭに採用されている。さらに補間精度を上げるため，補間フィルタ係数をフレーム単位で適応的に変化させる補間フィルタも提案されており，適応補間フィルタ（Adaptive Interpolation Filter:ＡＩＦ）と呼ばれる。適応補間フィルタは符号化効率改善の効果が高く，ＶＣＥＧ主導で作成された次世代映像符号化向け参照ソフトウェア（Key Technical Area: ＫＴＡ）にも採用されている。符号化効率向上への寄与が高いため，補間フィルタの性能改善は非常に期待される領域である。

　従来の補間フィルタについて，さらに詳しく説明する。

　〔固定的補間〕
　図１０は，Ｈ．２６４／ＡＶＣにおける小数精度の画素補間方法を示す図である。Ｈ．２６４／ＡＶＣにおいては，図１０に示すように１／２画素位置の補間時は，対象となる補間画素の左右３点ずつ計６整数画素を用いて補間を行う。垂直方向については，上下３点ずつ計６整数画素を用いて補間する。フィルタ係数は，それぞれ［（１，－５，２０，２０，－５，１）／３２］となっている。１／２画素位置が補間された後，１／４画素位置は［１／２，１／２］の平均値フィルタを用いて補間を行う。一度，１／２画素位置をすべて補間して求める必要があるため，計算複雑度は高いものの，性能の高い補間が可能となり，符号化効率向上を導いている。以上の固定フィルタによる補間の技術は，非特許文献１等に示されている。

　Ｈ．２６４／ＡＶＣの１次元６タップフィルタのように，係数値が全入力画像および全フレームに対して同じ値を用いるフィルタは，固定補間フィルタ（Fixed Interpolation Filter）と呼ばれる。

　Ｈ．２６４／ＡＶＣに採用されている補間フィルタの性能をさらに改善する方式として，ＨＥＶＣ用参照ソフトウェアＨＭでは，ＤＣＴベース補間フィルタ（ＤＣＴ－ＩＦ）が採用されている。このＤＣＴベース補間フィルタの小数精度の画素補間方法を，図１１に示す。図１１のように，小数精度位置における補間対象画素をｐ，整数位置画素をｐ_x，ｐの位置を示す整数位置画素間パラメータをα（０≦α≦１）とする。このとき，補間に使用する整数位置の画素数，すなわちタップ長を２Ｍ（Ｍは１以上の整数値）とする。ＤＣＴ変換の定義式より，式(1) が成立する。

また，逆ＤＣＴ変換の定義式より，式(2) が成立する。

ｘを位置とみなすことにより，小数位置αにおける画素補間式は以下の式(3) となる。

　式(3) より，補間に用いるタップ長２Ｍおよび補間対象位置αが定まれば，一意に係数を導出することができる。以上の議論から得られる補間フィルタの事例を表１および表２にまとめる。以上の詳細については，非特許文献２に示されている。

　このＤＣＴベース補間フィルタは，任意のフィルタ長および補間精度に対応でき，性能の高い補間フィルタであるため，ＨＥＶＣ用テストモデルＨＭに採用されている。

　〔適応的補間〕
　Ｈ．２６４／ＡＶＣでは，入力画像条件（シーケンス種類／画像サイズ／フレームレート）や符号化条件（ブロックサイズ／ＧＯＰ（Group of Pictures）構造／ＱＰ（Quantization Parameter））に関わらず，フィルタ係数値は一定である。フィルタ係数値が固定である場合，例えば，エイリアシング，量子化誤差，動き推定による誤差，カメラノイズといった時間的に変化する効果が考慮されていない。したがって，符号化効率の点で性能向上に限界があると考えられる。そこで，補間フィルタ係数を適応的に変化させる方式が非特許文献３では提案されており，非分離型の適応補間フィルタと呼ばれている。

　非特許文献３では，２次元の補間フィルタ（６×６の計３６フィルタ係数）を考えており，予測誤差エネルギーを最小にするようにフィルタ係数が決定される。Ｈ．２６４／ＡＶＣに用いられている１次元６タップの固定補間フィルタを用いるよりも高い符号化効率が実現できたが，フィルタ係数を求める上での計算複雑度が非常に高いため，その計算複雑度を低減するための提案が非特許文献４で紹介されている。

　非特許文献４で紹介されている手法は分離型適応補間フィルタ（ＳＡＩＦ：Separable Adaptive Interpolation Filter ）と呼ばれ，２次元の補間フィルタを用いるのではなく，１次元の６タップ補間フィルタを用いる。

　図１２Ａ～図１２Ｃは，分離型適応補間フィルタ（ＳＡＩＦ）における小数精度の画素補間方法を示す図である。手順としては，図１２ＢのＳｔｅｐ１に示すように，まず水平方向の画素（ａ，ｂ，ｃ）を補間する。フィルタ係数の決定には整数精度画素Ｃ１からＣ６が用いられる。式(4) の予測誤差エネルギー関数Ｅ_h ²を最小化するような水平方向フィルタ係数が，一般に知られた最小二乗法（非特許文献３参照）により，解析的に決定される。

　ここで，Ｓは原画像，Ｐは復号済参照画像，ｘおよびｙはそれぞれ画像中の水平および垂直方向の位置を示す。また，～ｘ（～はｘの上に付く記号；他も同様）は，
　　～ｘ＝ｘ＋ＭＶ_x－FilterOffset
であり，ＭＶ_xは事前に得られた動きベクトルの水平成分， FilterOffset は調整のためのオフセット（水平方向フィルタ長を２で割った値）を示している。垂直方向については，～ｙ＝ｙ＋ＭＶ_yとなり，ＭＶ_yは動きベクトルの垂直成分を示す。ｗ_ciは求めるべき水平方向フィルタ係数群ｃ_i（０≦ｃ_i＜６）を示す。

　式(4) で求めるフィルタ係数と同じ数の一次方程式が得られることになり，最小化処理は，水平方向の小数画素位置ごとに独立に実施される。この最小化処理を経て，３種類の６タップフィルタ係数群が求まり，そのフィルタ係数群を用いて小数精度画素ａ，ｂ，ｃが補間される。

　水平方向の画素補間が完了した後，図１２ＣのＳｔｅｐ２に示すように，垂直方向の補間処理を実施する。水平方向と同様の線形問題を解くことで垂直方向のフィルタ係数を決定する。具体的には，式(5) の予測誤差エネルギー関数Ｅ_V ²を最小化するような垂直方向フィルタ係数が，解析的に決定される。

　ここで，Ｓは原画像，＾Ｐ（＾はＰの上に付く記号）は復号後に水平方向に補間処理された画像，ｘおよびｙはそれぞれ画像中の水平および垂直方向の位置を示す。また，～ｘ＝４・（ｘ＋ＭＶ_x）で表現され，ＭＶ_xは丸められた動きベクトルの水平成分を示す。垂直方向については，～ｙ＝ｙ＋ＭＶ_y－FilterOffset　で表現され，ＭＶ_yは動きベクトルの垂直成分， FilterOffset は調整のためのオフセット（フィルタ長を２で割った値）を示す。ｗ_cjは求めるべき垂直方向フィルタ係数群ｃ_j（０≦ｃ_j＜６）を示す。

　最小化処理は小数精度画素ごとに独立に実施され，１２種類の６タップフィルタ係数が得られる。このフィルタ係数を用いて，残りの小数精度画素が補間される。

　以上より，合計９０（＝６×１５）のフィルタ係数を符号化して復号側に伝送する必要がある。特に低解像度の符号化については，このオーバーヘッドが大きくなるため，フィルタの対称性を用いて，伝送すべきフィルタ係数を削減している。例えば，図１２Ａでは，ｂ，ｈ，ｉ，ｊ，ｋの位置は，補間方向に関して各整数精度画素から見て中心に位置しており，水平方向であれば，左３点に用いる係数を反転させて右３点に適用できる。同様に，垂直方向であれば，上３点に用いる係数を反転させて下３点に適用できる（ｃ₁＝ｃ₆，ｃ₂＝ｃ₅，ｃ₃＝ｃ₄）。

　他にもｄとｌの関係はｈを挟んで対称となっているため，フィルタ係数もそれぞれ反転して利用できる。すなわち，ｄの６係数を伝送すれば，その値をｌにも適用できる。ｃ（ｄ）₁＝ｃ（ｌ）₆，ｃ（ｄ）₂＝ｃ（ｌ）₅，ｃ（ｄ）₃＝ｃ（ｌ）₄，ｃ（ｄ）₄＝ｃ（ｌ）₃，ｃ（ｄ）₅＝ｃ（ｌ）₂，ｃ（ｄ）₆＝ｃ（ｌ）₁となる。この対称性は，ｅとｍ，ｆとｎ，そしてｇとｏにも利用可能となる。ａとｃについても同様の理論が成立するが，水平方向は垂直方向の補間にも結果が影響を及ぼすため，対称性は用いずに，ａとｃはそれぞれ別々に伝送を行う。以上の対称性を利用した結果，フレームごとに伝送すべきフィルタ係数は５１（水平方向が１５，垂直方向が３６）となる。

　以上，非特許文献４の適応補間フィルタは，予測誤差エネルギーの最小化処理の単位がフレームで固定されていた。１枚のフレームに対して，５１のフィルタ係数が決定される。符号化対象フレームが仮に大きな２種類（もしくは複数種類の）テクスチャ領域Ａ，Ｂに分けられる場合，最適なフィルタ係数はその両者（すべてのテクスチャ）を考慮した係数群になる。Ａの領域では本来垂直方向のみ特徴的なフィルタ係数が出ていたとして，Ｂの領域で水平方向のみフィルタ係数が得られるような状況では，その両方が平均化された形でフィルタ係数が導出される。

　１枚のフレームにつき１つのフィルタ係数群（５１係数）に限定されずに，画像の局所的性質に応じて，領域分割を行い，分割された領域ごとに補間フィルタ係数を生成して，予測誤差エネルギーの低減を達成し，符号化効率の改善を実現する方法が，非特許文献５にて提案されている。

　また，非特許文献４の適応補間フィルタの性能改善を目的として，補間位置ごとにグルーピングを行い，予測誤差エネルギーを低減できるように，そのグループ単位で固定補間フィルタと適応補間フィルタの選択をして補間画像を生成する技術が提案されている（非特許文献６参照）。

日本特開２０１１－８２７２５号公報

大久保榮, 角野眞也, 菊池義浩, 鈴木輝彦："Ｈ．２６４／ＡＶＣ教科書改訂三版"，インプレス, pp. 119-123，2009 Ken McCann, Woo-Jin Han, Il-Koo Kim, Jung-Hye Min, Elena Alshina, Alexander Alshin, Tammy Lee, Jianle Chen, Vadim Seregin, Sunil Lee, Yoon-Mi Hong, Min-Su Cheon, Nikolay Shlyakhov, "Samsung's Response to the Call for Proposals on Video Compression Technology", JCTVC-A124 r2, pp. 12-14, 1st JCT-VC Meeting, Dresden, Apr. 2010 Y. Vatis, B. Edler, D. T. Nguyen , J. Ostermann: "Motion-and aliasing-compensated prediction using a two-dimensional non-separable adaptive Wiener interpolation filter", Proc. ICIP2005, IEEE International Conference on Image Processing, pp. II 894-897, Genova, Italy, Sep. 2005 S. Wittmann, T. Wedi: "Separable adaptive interpolation filter for video coding", Proc. ICIP2008, IEEE International Conference on Image Processing, pp. 2500-2503, San Diego, California, USA, Oct. 2008 Shohei Matsuo, Yukihiro Bandoh, Seishi Takamura, Hirohisa Jozawa: "Enhanced region-based adaptive interpolation filter" , Proc. PCS2010, IEEE Picture Coding Symposium, pp. 526-529, Nagoya, Japan, Dec. 2010 Faouzi Kossentini, Nader Mahdi, Hsan Guermazi, Mohammed Ali Ben Ayed: "An Adaptive Interpolation Filtering Technique", JCTVC-E284, 5th JCT-VC Meeting, Geneva, Mar. 2011

　非特許文献４や非特許文献５に記載の補間フィルタでは，補間位置ごとに補間フィルタを切り替える機能がなく，動き補償の性能向上に改善の余地がある。

　非特許文献６に記載の補間位置適応性を有する補間フィルタは，補間する位置ごとに事前に定義された固定補間フィルタを用いるか，フレーム単位で導出した適応補間フィルタを用いるかを判断する。フィルタ選択は予測誤差エネルギー最小化の観点で選択され，どちらかを必ず選択する方式となっている。

　補間位置に応じて，複数の補間フィルタから適応的に選択することで符号化効率向上を狙う場合，補間位置の設定が符号化効率改善性能に影響を与えると考えられる。非特許文献６に記載の方法は，１／４画素精度位置までの補間を想定しており，補間対象画素の位置に応じて４グループに分けて，そのグループ単位で補間フィルタを切り替えている。そのグループの設定は符号化処理中で固定となっており，入力画像に応じた適応性は考慮されていない。グループの設定を入力画像の性質に応じて変更できれば，より予測誤差エネルギーを低減させ，符号化効率の改善が実現可能である。

　本発明は，上記課題の解決を図り，動き補償画面間予測における予測誤差エネルギーを従来技術よりも低減させ，符号化効率を改善させる新しい方式を提供することを目的とする。

　上記目的を達成するための方法として，動きベクトルが指す補間位置の割合が高いほど補間フィルタの与える性能改善割合が高いという想定に基づき，動きベクトルの参照確率を算出し，その統計情報から補間フィルタ切り替えのためのグループ分けを実施する。本手段を用いることで，入力画像の性質に応じて補間位置適応性に幅を持たせて，予測誤差エネルギーの低減，すなわち符号化効率の改善を実現する。

　以上のように，本発明の最も特徴とするところは，動きベクトルが指し示す小数画素位置の参照確率を求め，参照確率によって補間位置のグルーピングを行い，補間位置のグループごとに最適な補間フィルタとなるフィルタ係数を選出して，補間位置のグループごとに補間フィルタを切り替える点である。補間位置グループ情報と補間フィルタ係数情報は，フレーム単位もしくはスライスなどの領域単位で符号化し，復号装置に伝送する。補間フィルタ係数情報の符号化は，各補間位置グループでどの補間フィルタ係数を用いるかが復号装置側で認識できる情報であれば十分である。例えば複数組の補間フィルタ係数のセットと補間位置グループごとにどの補間フィルタを用いるかを示す補間フィルタインデックスを符号化の対象としてもよい。

　復号装置では，符号化ビットストリームを復号して得られた補間位置グループ情報と各補間位置で用いる補間フィルタ係数とから，補間位置グループごとに補間フィルタ係数を切り替えて補間画像を生成し，小数精度の動き補償による復号処理を行う。

　詳しくは，映像符号化では，例えば以下の処理を行う。
・予測ブロック単位で動き探索を行い，動きベクトルを取得する。
・取得した動きベクトルが指し示す参照先の小数画素位置の参照確率（確率分布）を算出する。
・算出された参照確率から，補間位置である小数画素位置を複数のグループに分ける。
・補間位置のグループごとに，補間フィルタを決定して補間処理を行い，予測信号を生成する。
・補間位置グループ情報を符号化し，また，どの補間フィルタ係数を用いるかを示す補間フィルタインデックスと，各補間フィルタ係数とを符号化する。
・他の符号化情報をすべて符号化する。

　映像復号では，例えば以下の処理を行う。
・通常の符号化情報を復号するとともに，補間位置グループ情報，補間フィルタインデックスおよび補間フィルタ係数を復号する。
・補間位置グループ情報と補間フィルタインデックスとから，補間位置のグループごとに使用する補間フィルタを確定し，補間処理を行って予測信号を生成し，復号信号を生成する。

　本発明の作用は以下のとおりである。従来の補間位置適応性を有する補間フィルタでは，補間フィルタを切り替える単位として，固定されたグループ設定を行っており，性能改善には限界があった。一方，本発明では，補間フィルタを切り替える画素位置を，動きベクトルの指し示す確率に応じて複数のグループに分ける。例えば，動きベクトルの指し示す確率が高い位置を１つのグループとして，そのグループに高精度の補間フィルタを用いる。このようにすることによって，より柔軟に補間フィルタの切り替えを設定でき，符号化効率を改善できる。

　本発明によれば，従来の補間位置適応性を有する補間フィルタでは考慮できなかった，補間フィルタ適用位置を可変にでき，かつ補間フィルタの形状やフィルタ長を補間位置ごとに変更可能となり，参照確率が高い部分により高精度な補間処理をすることができる。したがって，予測誤差エネルギーの低減による符号化効率改善が達成できる。

本発明の一実施形態である映像符号化装置の構成例を示す図である。補間フィルタ係数判定部の構成例１を示す図である。補間位置ごとの動きベクトルが指し示す参照確率の例を示す図である。補間フィルタ係数判定部の構成例２を示す図である。補間フィルタ係数判定部の構成例３を示す図である。本発明の一実施形態である符号化処理のフローチャートである。本発明の一実施形態である映像復号装置の構成例を示す図である。本発明の一実施形態である復号処理のフローチャートである。本発明の実施形態をコンピュータとソフトウェアプログラムとを用いて実施する場合のシステムの構成例を示す図である。映像符号化標準方式（Ｈ．２６４／ＡＶＣ）の小数精度の画素補間方法を示す図である。ＤＣＴベース補間フィルタ（ＤＣＴ－ＩＦ）の小数精度の画素補間方法を示す図である。分離型適応補間フィルタ（ＳＡＩＦ）における小数精度の画素補間方法を示す図である。分離型適応補間フィルタ（ＳＡＩＦ）における小数精度の画素補間方法を示す図である。分離型適応補間フィルタ（ＳＡＩＦ）における小数精度の画素補間方法を示す図である。

　以下，図面を用いながら，本発明の一実施形態について説明する。

　〔映像符号化装置の構成例〕
　図１は，本発明の一実施形態である映像符号化装置の構成例を示す図である。

　映像符号化装置１０において，補間フィルタ係数算出部１１は，予測符号化における参照画像に対して用いる小数精度画素の補間フィルタ係数を算出する。補間フィルタ係数判定部１２は，動き検出部１３２が検出した動きベクトルＭＶを用いて小数画素位置の参照確率を算出し，算出された参照確率から補間フィルタの重要度を指定し，さらに得られた重要度から補間フィルタの形状，フィルタ長，ビット深度の情報を指定する。

　予測信号生成部１３は，参照画像補間部１３１と動き検出部１３２とを備える。参照画像補間部１３１は，参照画像メモリ１７に格納された復号済み参照画像に，補間フィルタ係数判定部１２が選択した補間フィルタ係数による補間フィルタを適用する。動き検出部１３２は，補間後の参照画像に対して動き探索を行うことにより，動きベクトルを算出する。予測信号生成部１３は，動き検出部１３２によって算出された小数精度の動きベクトルによる動き補償により予測信号を生成する。

　予測符号化部１４は，入力映像信号と予測信号との残差信号を算出し，それを直交変換し，変換係数の量子化などによって予測符号化を行う。また，復号部１６は，予測符号化の結果を復号し，復号画像を後の予測符号化のために参照画像メモリ１７に格納する。このとき，デブロッキングフィルタやＡＬＦ（Adaptive Loop Filter）などの符号化ノイズ除去のためのインループフィルタを施してから，格納してもよい。

　可変長符号化部１５は，量子化された変換係数，動きベクトルを可変長符号化するとともに，補間フィルタ係数判定部１２の出力である補間位置グループ情報，補間フィルタインデックス，補間フィルタ係数を可変長符号化し，これらを符号化ビットストリームとして出力する。

　〔補間フィルタ係数判定部の構成例１〕
　図２は，補間フィルタ係数判定部の構成例１を示す図である。補間フィルタ係数判定部１２－１における補間位置参照確率計算部１２２および補間対象位置グルーピング部１２３の部分が，特に従来技術と顕著に異なる。

　補間フィルタ係数判定部１２－１において，補間フィルタ情報取得部１２１は，符号化時に予め用意されている固定補間フィルタ係数値をＭＳＥ算出部１２４に出力する。例えば，Ｈ．２６４／ＡＶＣに定義されている６タップの係数や，ＤＣＴ－ＩＦの８タップもしくは１２タップの係数を用いてもよい。

　補間位置参照確率計算部１２２は，符号化対象ブロックの動きベクトル（ＭＶ）を用いて小数画素位置の参照確率を算出する。この補間位置参照確率計算部１２２では，入力を動き予測から求まる動きベクトルとし，フレーム全体ないしは画像における一部の領域に対して，補間位置ごとに動きベクトルが指し示す確率を求める。

　図３に，補間位置ごとの動きベクトルが指し示す参照確率の例を示す。例えば，１／２画素精度まで補間する場合，図３（Ａ）に示すような確率分布が得られる。１／ｎ画素精度でも同様に計算できる。図３（Ｂ）は，１／４画素精度のときの確率分布の例を示している。補間位置参照確率計算部１２２は，図３に示されるような補間位置ごとの確率分布情報（％で表記される情報）を出力する。

　補間対象位置グルーピング部１２３は，補間位置参照確率計算部１２２が算出した補間位置参照確率情報を入力とし，あらかじめ定められた方法により補間位置を参照確率の高い順番に従って複数のグループに分ける。例えば，１／２画素精度まで用いる動き補償の場合，整数画素位置を除いた３点のうち，上位１点を第一グループ，下位２点を第二グループとする。図３（Ａ）の例の場合，第一グループが｛２５％｝の位置，第二グループが｛２０％，１５％｝の位置となる。また，１／４画素精度まで用いる動き補償の場合，整数画素位置を除いた１５点のうち，上位３点を第一グループ，続く４～７位を第二グループ，続く８～１１位までを第三グループ，残る下位４点を第四グループなどとしてよい。図３（Ｂ）の例の場合，第一グループが｛１３％，１１％，１０％｝の位置，第二グループが｛９％，８％，７％，６％｝の位置，第三グループが｛５％，４％，３％，２％｝の位置，第四グループが｛１％，１％，１％，１％｝の位置というように分けられる。補間対象位置グルーピング部１２３は，以上のような補間位置グループ情報を出力する。

　ＭＳＥ算出部１２４は，動き予測で求まる動きベクトルＭＶ，復号信号（ローカルデコード画像），フレーム単位ないしは領域単位などで，符号化中に生成される補間フィルタ係数値，補間フィルタ情報取得部１２１から出力される固定補間フィルタ係数値，補間対象位置グルーピング部１２３から出力される補間位置グループ情報を入力とし，動きベクトルＭＶが指し示す位置における補間画像を，復号画像の整数位置画素と補間位置グループ情報から判断されるフィルタ係数を用いて生成し，原画像とのＭＳＥ（Mean Square Error:平均二乗誤差) ，すなわち，予測残差エネルギーを計算する。

　ＭＳＥの計算には，例として，以下のような式を用いることができる。

　　ＭＳＥ＝｛（原信号－予測信号）²の総和｝／画素数
計算されたＭＳＥは，最小ＭＳＥ記憶部１２５に出力される。

　最小ＭＳＥ記憶部１２５は，入力をＭＳＥ算出部１２４で得られるＭＳＥとし，その値を保存する。最小ＭＳＥ記憶部１２５は，事前に保存もしくはあらかじめ定義されている最小値と，入力されるＭＳＥとを比較し，
(a) 保存済みの最小値よりも入力ＭＳＥ値が小さい場合：入力ＭＳＥ値，
(b) 保存済みの最小値の方が入力ＭＳＥ値よりも小さい場合：保存済みの最小値，
というように，最小となるＭＳＥを判定して，最小値の保存と更新を行う。また，最小ＭＳＥ記憶部１２５は，その最小値を保存する際には，そのＭＳＥ値を実現する補間位置グループ情報，補間フィルタインデックスを保存する。

　補間フィルタインデックスは，補間フィルタを示す識別番号であり，
(a) 事前定義された固定補間フィルタ，
(b) 符号化処理中に得られる適応補間フィルタ，
のどちらを用いるかを示す。

　補間フィルタ係数判定部１２－１は，以上のように補間フィルタに関わる補間位置とフィルタ係数の取り得る組み合わせについて，補間位置ごとにＭＳＥを算出した後，最小ＭＳＥを実現する組み合わせ，すなわち，
(1) 補間位置グループ情報，
(2) 補間フィルタインデックス，
(3) 補間フィルタ係数，
の情報を出力する。

　〔補間フィルタ係数判定部の構成例２〕
　図４は，補間フィルタ係数判定部の他の構成例２を示す図である。補間フィルタ係数判定部１２－２が，前述した構成例１の補間フィルタ係数判定部１２－１と異なるのは，次の点である。すなわち，構成例１では，補間対象位置グルーピング部１２３がグルーピングした補間位置のグループごとに，適応補間フィルタや固定補間フィルタなどの複数の補間フィルタの補間フィルタ係数の中からＭＳＥ算出部１２４によって予測誤差エネルギーが最小となる補間フィルタ係数を選出していた。これに対し，構成例２では，補間位置グループに応じて，重要度判定部１２６が補間位置グループの重要度を判定し，判定結果の重要度から補間フィルタとして用いる補間フィルタ係数を選出する。

　補間フィルタ係数判定部１２－２において，補間フィルタ情報取得部１２１，補間位置参照確率計算部１２２，補間対象位置グルーピング部１２３の処理内容は，前述した構成例１の場合と同様である。

　重要度判定部１２６は，各補間位置グループについて，動きベクトルが指し示す小数画素位置の参照確率が高いほど重要度が高いものとし，重要度が高いほど，補間フィルタの形状，フィルタ長またはビット深度について，高精度となるものを割り当てる。すなわち，重要度判定部１２６は，重要度が高いほど，補間フィルタの形状が大きいもの，またはフィルタ長が長いもの，またはビット深度が大きいものを，その補間位置グループに用いる補間フィルタ係数として割り当てる。

　構成例２における補間フィルタ係数判定部１２－２の出力は，小数精度の補間位置がどのグループに所属するか示す補間位置グループ情報と，どの補間フィルタ係数を用いるかを示す補間フィルタインデックスと，補間フィルタ係数であり，これが符号化の対象となる。なお，補間フィルタインデックスは省略することも可能である。

　〔補間フィルタ係数判定部の構成例３〕
　図５は，補間フィルタ係数判定部の他の構成例３を示す図である。構成例３の補間フィルタ係数判定部１２－３は，前述した構成例１の補間フィルタ係数判定部１２－１と，構成例２の補間フィルタ係数判定部１２－２とを組み合わせた構成となっている。

　補間フィルタ係数判定部１２－３において，補間フィルタ情報取得部１２１，補間位置参照確率計算部１２２，補間対象位置グルーピング部１２３の処理内容は，前述した構成例１，２の場合と同様である。

　重要度判定部１２６には，符号化処理中に得られる適応補間フィルタの補間フィルタ係数や，補間フィルタ情報取得部１２１が取得した事前に定義されている固定補間フィルタのフィルタ係数が入力される。また，重要度判定部１２６には，補間対象位置グルーピング部１２３が求めた補間位置グループ情報が入力される。

　重要度判定部１２６は，これらの入力から，各補間位置グループについて，動きベクトルが指し示す小数画素位置の参照確率が高いほど重要度が高いものとし，重要度が高いほど，補間フィルタの形状，フィルタ長またはビット深度について，高精度となる補間フィルタ係数をいくつか選出する。すなわち，重要度判定部１２６は，重要度が高いほど，補間フィルタの形状が大きく，またはフィルタ長が長く，またはビット深度が大きい補間フィルタ係数のセットを，入力した補間フィルタ係数の中から複数組選出する。

ＭＳＥ算出部１２４は，動き予測で求まる動きベクトルＭＶ，復号信号（ローカルデコード画像），重要度判定部１２６で選出された補間フィルタ係数を入力し，補間位置グループごとに，動きベクトルＭＶが指し示す位置における補間画像を，復号画像の整数位置画素と補間フィルタ係数とを用いて生成し，原画像とのＭＳＥ（Mean Square Error:平均二乗誤差) を計算する。このＭＳＥの計算は，構成例１で説明した計算と同様である。

　最小ＭＳＥ記憶部１２５は，入力をＭＳＥ算出部１２４で得られるＭＳＥとし，その値の中で最小となるものを保存する。

　補間フィルタ係数判定部１２－３は，以上のように補間フィルタに関わる補間位置と重要度判定部１２６で選出された補間フィルタ係数の取り得る組み合わせについて，補間位置ごとにＭＳＥを算出した後，最小ＭＳＥを実現する組み合わせ，すなわち，小数精度の補間位置がどのグループに所属するか示す補間位置グループ情報と，どの補間フィルタ係数を用いるかを示す補間フィルタインデックスと，補間フィルタ係数を出力する。

〔符号化の処理フロー〕
　図６は，図１に示す映像符号化装置の処理フローチャートである。以下，図６に従って，映像符号化装置が１枚のフレームを符号化する場合の処理の流れを説明する。以下では，特に断りがない限り，輝度信号での処理を仮定する。

　まず，ステップＳ１０１にて，符号化処理に必要となる原画像のフレームを入力する。続いて，ステップＳ１０２にて，例えば，Ｈ．２６４／ＡＶＣに採用されている１次元６タップフィルタやＤＣＴベース補間フィルタの１次元８タップ／１２タップフィルタなど，符号化器に備わっている固定補間フィルタを事前定義補間フィルタとして，その補間フィルタを用いてフレーム全体の動きベクトル（ＭＶ）を導出する。ここで，固定補間フィルタに限らず，前フレームなどで算出された適応補間フィルタのフィルタを採用してもよい。

　続いて，ステップＳ１０３にて，ステップＳ１０２にて得られた動きベクトルを用いて，符号化対象フレームにおける適応補間フィルタの係数値を算出する。本ステップにおける補間フィルタの係数算出には，一般に知られている予測誤差エネルギー最小化方法（線形回帰）を用いる。

　続いて，ステップＳ１０４にて，ステップＳ１０２で求まった動きベクトルから補間対象位置ごとの参照確率を計算する。具体的には動きベクトルの指し示す回数を求め，その回数から全体の動きベクトルのうち，各補間対象位置が何個の動きベクトルから参照されたかを計算する。

　続いて，ステップＳ１０５にて，ステップＳ１０４で求まった参照確率結果から，補間位置のグループ分けを決定する。例えば，１／４画素精度まで求める場合，全部で１５点の補間対象位置が存在する。このとき，上位３位までをグループ１，上位４位から７位までをグループ２，上位８位から１１位までをグループ３，それ以外をグループ４というようにグループ分けを行う。

　続いて，ステップＳ１０６にて，ステップＳ１０５で求まったグルーピング結果から，図２，図４，図５で説明した補間フィルタ係数判定部１２－１～１２－３の処理を実行する。例えば，補間位置グループの重要度を設定し，使用する補間フィルタを決定する。グループ１は参照確率が高いため，フィルタの影響が大きいので重要度が高いと設定される。この場合，例えばタップ長の長い補間フィルタを用いたり，フィルタ係数値の量子化ビット深度を高く設定したりすることで，性能の高いフィルタを割り当てる。逆にグループ４は参照確率が低いため，使用する補間フィルタは性能が低くても影響は少ない。タップ長の短い補間フィルタを用いたり，量子化ビット深度を低く設定したりする。また，使用する補間フィルタ係数の候補が複数ある場合に，補間フィルタ係数の各候補を用いた場合のＭＳＥを算出し，予測誤差エネルギーが最も小さくなる補間フィルタ係数を決定する。

　続いて，ステップＳ１０７にて，ステップＳ１０６で決定された補間フィルタ係数を用いて補間処理を行う。

　続いて，ステップＳ１０８にて，ステップＳ１０５で求まった補間位置グループ情報を符号化する。続いて，ステップＳ１０９にて，ステップＳ１０３で求まった補間フィルタ係数情報および補間フィルタインデックスなどの復号に必要な情報を符号化する。

　続いて，ステップＳ１１０にて，残りの符号化すべき情報，例えば，予測誤差信号（テクスチャ成分情報）や動きベクトルなどをすべて符号化する。

　続いて，ステップＳ１１１にて，符号化フレームが最終フレームに到達しているかどうかの判定を行う。もし処理フレームが最終フレームでなければ，次のフレームを処理するためにステップＳ１０１に戻る。もし処理フレームが最終フレームであった場合，符号化処理を終了する。

　なお，本実施形態で述べている動きベクトルの参照確率から補間位置のグループを変更し，グループごとに使用する補間フィルタを調整して符号化する機能は，輝度信号だけでなく，色差信号にも同様に適用可能である。

　〔映像復号装置の構成例〕
　図７は，本発明の一実施形態である映像復号装置の構成例を示す図である。

　映像復号装置２０において，可変長復号部２１は，符号化されたビットストリームを入力して，量子化変換係数，動きベクトル，補間位置グループ情報，補間フィルタインデックス，補間フィルタ係数などの復号を行う。補間フィルタ係数判定部２２は，補間位置グループ情報と補間フィルタインデックスとから各補間位置に用いる補間フィルタ係数を決定する。

　予測信号生成部２３における参照画像補間部２３１は，参照画像メモリ２５に格納された復号済み参照画像に，補間フィルタ係数判定部２２から受け取った補間フィルタ係数による補間フィルタを適用し，参照画像の小数精度画素の復元を行う。予測信号生成部２３は，小数精度画素の復元が行われた参照画像から，復号対象ブロックの予測信号を生成する。

　予測復号部２４は，可変長復号部２１で復号した量子化係数の逆量子化，逆直交変換などを行い，それにより算出された予測誤差信号と，予測信号生成部２３が生成した予測信号とを足し合わせて復号画像を生成し，出力画像として出力する。また，予測復号部２４が復号した復号画像は，後の予測復号のために，参照画像メモリ２５に格納する。このとき，デブロッキングフィルタやＡＬＦ（Adaptive Loop Filter）などの符号化ノイズ除去のためのインループフィルタを施してから，格納してもよい。

〔復号の処理フロー〕
　図８は，図７に示す映像復号装置の処理フローチャートである。以下，図８に従って，映像復号装置が１枚のフレームを復号する場合の処理の流れを説明する。以下では，特に断りがない限り，輝度信号での処理を仮定する。

　ステップＳ２０１にて，フレームヘッダ（ないしはスライスヘッダ）の情報を取得する。続いて，ステップＳ２０２にて，補間位置グループ情報を復号する。続いて，ステップＳ２０３にて，補間フィルタインデックス，補間フィルタ係数の復号を行う。

　続いて，ステップＳ２０４にて，復号に必要なその他の情報（例えば動きベクトルや予測誤差信号など）をすべて復号する。

　続いて，ステップＳ２０５にて，ステップＳ２０２で得られた補間位置グループ情報から，各補間位置に用いるための補間フィルタの判定を行い，補間位置グループごとに適用する補間フィルタを決定する。

　続いて，ステップＳ２０６にて，ステップＳ２０５にて求まった補間フィルタを用いて補間処理を行い，予測信号を生成する。続いて，ステップＳ２０７にて，ステップＳ２０４で得られた予測誤差信号と，ステップＳ２０６で得られた予測信号を足し合わせて，復号信号を生成する。

　続いて，ステップＳ２０８にて，復号すべきフレームがすべて復号されたかの判定を行い，すべて復号されていない場合には，ステップＳ２０１へ戻って次のフレームの復号に移り，すべて復号されている場合は復号処理を終了する。

　以上，輝度信号での説明を行ったが，本フローは色差信号にも同様に適用することができる。

　〔ソフトウェアプログラムを用いた場合の構成例〕
　以上の映像符号化，復号の処理は，コンピュータとソフトウェアプログラムとによっても実現することができ，そのプログラムをコンピュータ読み取り可能な記録媒体に記録することも，ネットワークを通して提供することも可能である。

図９は，本発明の実施形態をコンピュータとソフトウェアプログラムとを用いて実施する場合のシステムの構成例を示している。

　本システムは，プログラムを実行するＣＰＵ（Central Processing Unit）５０と，ＣＰＵ５０がアクセスするプログラムやデータが格納されるＲＡＭ（Random Access Memory）等のメモリ５１と，符号化対象の映像信号，または復号画像の映像信号を記憶する映像信号記憶部５２と，本発明の実施形態で説明した処理をＣＰＵ５０に実行させるためのプログラムが格納されたプログラム記憶装置５３と，符号化結果のビットストリームまたは復号対象のビットストリームを記憶する符号化ストリーム記憶部５４とがバスで接続された構成になっている。

　プログラム記憶装置５３は，本発明の実施形態を用いて映像信号を符号化するための映像符号化プログラム５３１，本発明の実施形態を用いて符号化ビットストリームを復号するための映像復号プログラム５３２のいずれかを格納している。プログラム記憶装置５３は，これらのプログラムの双方を格納していてもよい。

　また，本システムが映像符号化装置として用いられる場合，映像符号化プログラム５３１がメモリ５１にロードされ，ＣＰＵ５０は，メモリ５１にロードされた映像符号化プログラム５３１の命令を逐次フェッチして実行し，映像信号記憶部５２に格納されている映像信号を，本発明の実施形態で説明した手法により符号化して，符号化結果のビットストリームを符号化ストリーム記憶部５４に格納する。または，ネットワークアダプタ等のインタフェースを介して，ビットストリームを外部装置に出力してもよい。

　また，本システムが映像復号装置として用いられる場合，映像復号プログラム５３２がメモリ５１にロードされ，ＣＰＵ５０は，メモリ５１にロードされた映像復号プログラム５３２の命令を逐次フェッチして実行し，符号化ストリーム記憶部５４に格納されているビットストリームを，本発明の実施形態で説明した手法により復号して，復号結果の映像信号を映像信号記憶部５２に格納する。または，外部の再生装置に復号結果の映像信号を出力する。

　以上，本発明の実施形態を図面を参照して説明してきたが，これら実施形態は本発明の例示に過ぎず，本発明がこれら実施形態に限定されるものでないことは明らかである。したがって，本発明の要旨を逸脱しない範囲で構成要素の追加，省略，置換，その他の変更を行うようにしても良い。すなわち，本発明は上述した説明に限定されるものではなく，以下に述べる請求の範囲の範囲のみに限定される。

　本発明は，例えば，動き補償画面間予測を用いた映像符号化および映像復号に利用可能である。本発明によれば，予測誤差エネルギーの低減による符号化効率改善が達成できる。

　１０　映像符号化装置
　１１　補間フィルタ係数算出部
　１２，２２　補間フィルタ係数判定部
　１２１　補間フィルタ情報取得部
　１２２　補間位置参照確率計算部
　１２３　補間対象位置グルーピング部
　１２４　ＭＳＥ算出部
　１２５　最小ＭＳＥ記憶部
　１２６　重要度判定部
　１３，２３　予測信号生成部
　１３１，２３１　参照画像補間部
　１３２　動き検出部
　１４　予測符号化部
　１５　可変長符号化部
　１６　復号部
　１７，２５　参照画像メモリ
　２０　映像復号装置
　２１　可変長復号部
　２４　予測復号部

Claims

　小数精度の動き補償を用いる映像符号化方法であって，
　動き探索を行って動きベクトルを取得するステップと，
　取得した動きベクトルが指し示す小数画素位置の参照確率を算出するステップと，
　算出された参照確率から小数画素位置である補間位置を複数のグループに分けるステップと，
　前記補間位置のグループごとに，複数の補間フィルタ係数の候補の中から補間予測画像の生成に用いる補間フィルタ係数を選出するステップと，
　前記補間位置のグループごとに，選出された補間フィルタ係数を用いて前記補間予測画像を生成し，前記補間予測画像から前記小数精度の動き補償による符号化を実施するステップと，
　前記補間位置のグループ分けを示す情報および各補間位置のグループにおいてどの補間フィルタ係数を用いるかを示す情報を符号化するステップと
　を有する映像符号化方法。
　請求項１に記載の映像符号化方法において，
　前記補間フィルタ係数の選出では，前記複数の補間フィルタ係数の候補の中から予測誤差エネルギーが最小となる補間フィルタ係数を選出する
　映像符号化方法。
　請求項１または請求項２に記載の映像符号化方法において，
　前記補間フィルタ係数の選出では，前記参照確率から，参照確率が大きいほど補間位置のグループの重要度が高いものとして重要度を設定し，設定された重要度から，重要度が高いほど補間フィルタの形状が大きい，またはフィルタ長が長い，またはビット深度が深い補間フィルタ係数またはその候補を選出する
　映像符号化方法。
　小数精度の動き補償を用いる映像符号化装置であって，
　動き探索を行って動きベクトルを取得する動きベクトル取得部と，
　取得した動きベクトルが指し示す小数画素位置の参照確率を算出する参照確率算出部と，
　算出された参照確率から小数画素位置である補間位置を複数のグループに分けるグルーピング部と，
　前記補間位置のグループごとに，複数の補間フィルタ係数の候補の中から補間予測画像の生成に用いる補間フィルタ係数を選出する補間フィルタ係数選出部と，
　前記補間位置のグループごとに，選出された補間フィルタ係数を用いて前記補間予測画像を生成し，前記補間予測画像から前記小数精度の動き補償による符号化を実施する第１の符号化部と，
　前記補間位置のグループ分けを示す情報および各補間位置のグループにおいてどの補間フィルタ係数を用いるかを示す情報を符号化する第２の符号化部と
　を備える映像符号化装置。
　小数精度の動き補償を用いる映像復号方法であって，
　小数画素位置である補間位置のグループ分けを示す情報および各補間位置のグループにおいてどの補間フィルタ係数を用いるかを示す情報を復号するステップと，
　前記復号された情報から，補間位置のグループごとに補間予測画像の生成に用いる補間フィルタ係数を決定するステップと，
　動きベクトルおよび予測残差信号を復号するステップと，
　前記決定された補間フィルタ係数により定まる補間フィルタを用いて前記補間予測画像を生成し，動き補償における予測信号を生成するステップと，
　復号した予測残差信号および生成された予測信号を用いて復号画像を生成するステップと
　を有する映像復号方法。
　小数精度の動き補償を用いる映像復号装置であって，
　小数画素位置である補間位置のグループ分けを示す情報および各補間位置のグループにおいてどの補間フィルタ係数を用いるかを示す情報を復号する第１の復号部と，
　前記復号された情報から，補間位置のグループごとに補間予測画像の生成に用いる補間フィルタ係数を決定する補間フィルタ係数決定部と，
　動きベクトルおよび予測残差信号を復号する第２の復号部と，
　前記決定された補間フィルタ係数により定まる補間フィルタを用いて前記補間予測画像を生成し，動き補償における予測信号を生成する予測信号生成部と，
　復号した予測残差信号および生成された予測信号を用いて復号画像を生成する復号画像生成部と
　を備える映像復号装置。
　請求項１，請求項２または請求項３に記載の映像符号化方法を，コンピュータに実行させるための映像符号化プログラム。
　請求項５に記載の映像復号方法を，コンピュータに実行させるための映像復号プログラム。