JP2013183345A - 映像符号化装置及び映像符号化方法 - Google Patents

映像符号化装置及び映像符号化方法 Download PDF

Info

Publication number
JP2013183345A
JP2013183345A JP2012046725A JP2012046725A JP2013183345A JP 2013183345 A JP2013183345 A JP 2013183345A JP 2012046725 A JP2012046725 A JP 2012046725A JP 2012046725 A JP2012046725 A JP 2012046725A JP 2013183345 A JP2013183345 A JP 2013183345A
Authority
JP
Japan
Prior art keywords
prediction
screen
intra
template matching
screen prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012046725A
Other languages
English (en)
Inventor
Jun Otsuki
純 大槻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012046725A priority Critical patent/JP2013183345A/ja
Publication of JP2013183345A publication Critical patent/JP2013183345A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】映像信号の符号化処理における予測方法決定処理における演算量を削減できるようにする。
【解決手段】符号化対象ブロックに対して画面間予測により予測画像を生成し、予測画像と符号化対象ブロックのコスト値を、コスト関数を用いて求める画面間予測手段と、テンプレートマッチング予測と、前記テンプレートマッチング予測以外の一つ以上の方法による画面内予測とを行う画面内予測手段と、前記テンプレートマッチング予測と他の方法による画面内予測との結果を比較して予測方法を選択する予測方法選択手段とを設け、前記テンプレートマッチング予測による差分絶対値和、および前記他の方法による画面内予測によるコスト値と、前記画面間予測手段から得られる画面間予測によるコスト値とから予測方法を決定する。
【選択図】図1

Description

本発明は、映像符号化装置及び映像符号化方法に関し、特に、テンプレートマッチング予測と他の予測モードとの結果を比較して最適な予測方法を選択するために用いて好適な技術に関する。
近年、映像信号の符号化方式として、H.264/MPEG−4 part10(以下、H.264と称す)が普及している。H.264では、画面内の相関性を利用して、同一画面内の隣接ブロックの画素値から、符号化対象ブロックの画素値を予測する画面内予測が採用されている。H.264では、符号化対象ブロックに隣接する符号化済みの隣接ブロックの画素値を用いて、複数の方向から予測する複数のモード(画面内予測モード)を有し、その中から最適な画面内予測モードを選択する。
画面内予測方法として、H.264の規格で定められた符号化対象ブロックの隣接画素を用いる予測方式以外にも、同一画面内の符号化済み領域に対するパターンマッチングにより、相関性の高い領域を探索して予測画像を生成する画面内予測方法が知られている。例えば、特許文献1に記載の画像符号化装置にて開示されているテンプレートマッチング予測が知られている。
テンプレートマッチング予測について図5を用いて説明する。
図5において、CはX1×Y1画素からなる符号化対象ブロックである。符号化対象ブロックC内の符号化対象画素Aと、X2×Y2画素からなる領域のうち、すでに符号化済みの画素のみで構成される所定の探索範囲Sを示す。符号化対象画素Aには、すでに符号化済みの画素で構成されるテンプレート領域Bが隣接する。探索領域S内において、テンプレート領域Bとの相関性の最も高い領域B'を探索する。探索されたB'領域に対応する画素A'を、画素Aに対応する予測画素とする。テンプレートマッチング予測では、上記処理を符号化対象ブロック内の画素毎に順次処理することで、符号化対象ブロックの予測画像を生成する画面内予測方法である。
特開2010−16454号公報
従来技術に比べて、テンプレートマッチングは予測精度が高いので、更なる画質の向上の観点で重要な技術と考えられる。しかしながら、前述したテンプレートマッチング予測では、画素毎にパターンマッチング処理が発生するために、H.264で採用されている符号化対象ブロックの隣接画素を用いる従来の画面内予測に比べて演算量が増大する。
さらに、複数の予測方法の中から適切な予測方法を選択する映像符号化装置では、上記テンプレートマッチング予測だけでなく、例えばH.264で採用されている従来の画面内予測に演算も必要となる。さらには、映像信号の時間的な冗長性を利用した画面間予測などの予測方法に掛かる演算も必要となる。また、これら複数の予測方法の中から、最も好適な予測方法を選択するための演算も必要となり、予測方法の決定に掛かる全体の演算量が増大するという新たな課題が生じる。
例えば、映像符号化装置を有するデジタルビデオカメラなどの撮像装置では、符号化処理における予測方法決定に掛かる演算量が莫大に増加する。これにより、映像信号の符号化処理に掛かる処理時間の増大につながるので、映像符号化装置に入力される映像信号をリアルタイムに符号化処理することができない場合が生じる恐れがある。
本発明は前述の問題点に鑑み、映像信号の符号化処理における予測方法決定処理における演算量を削減できるようにすることを目的とする。
本発明の映像符号化装置は、符号化対象ブロックに対して画面間予測により予測画像を生成し、予測画像と符号化対象ブロックのコスト値を、コスト関数を用いて求める画面間予測手段と、前記符号化対象ブロックの符号化対象画素と、前記符号化対象画素に隣接する符号化済みの隣接画素で構成されるテンプレート領域との相関が最も高い領域を、探索領域内から検出して予測画像を生成するテンプレートマッチング予測と、前記テンプレートマッチング予測以外の一つ以上の方法による画面内予測とを行う画面内予測手段と、前記テンプレートマッチング予測と他の方法による画面内予測との結果を比較して予測方法を選択する予測方法選択手段とを有し、前記予測方法選択手段は、前記画面内予測手段から得られるテンプレートマッチング予測による差分絶対値和、および前記他の方法による画面内予測によるコスト値と、前記画面間予測手段から得られる画面間予測によるコスト値とから予測方法を決定することを特徴とする。
本発明によれば、複数の予測方法の中から好適な予測方法を選択するための予測方法の決定に掛かる演算量を削減することができる。
第1の実施形態を示し、映像符号化装置の構成例を示すブロック図である。 テンプレートマッチング予測方法の説明図である。 第2の実施形態を示し、映像符号化装置の構成例を示すブロック図である。 予測方法選択に関わる処理手順を説明するフローチャートである。 テンプレートマッチング予測方法の説明図である。
以下に、本発明の好ましい実施形態を、図面を用いて説明する。
「第1の実施形態」
図1は、本発明の実施形態を示し、映像符号化装置の構成例を示すブロック図である。
映像信号入力部101は撮像部や外部映像取得部等から成り、映像信号を入力して、メモリ102へ格納する。差分計算部103は、メモリ102内の符号化対象となる画像と、予測画像生成部117で生成された予測画像との差分値を求め、求めた差分値を直交変換部104へ送る。予測画像生成部117についての詳細説明は後述する。
直交変換部104において、差分計算部103より送られる差分値に対して直交変換を行い、さらに量子化部105では、所定の量子化パラメータで量子化したデータを、エントロピー符号化部106および逆量子化部107へ送る。エントロピー符号化部106では、量子化部105から送られた量子化済みのデータをCABACやCAVLCなどのエントロピー符号化方式にて符号化し、符号化データを出力する。
逆量子化部107は、量子化部105から送られた量子化済みのデータを逆量子化し、さらに逆直交変換部108にて逆直交変換される。逆直交変換部108から出力された差分値と予測画像生成部117で生成された予測画像を、加算器109で加算した画像データをメモリ110へ送る。また、フィルタ処理部111でフィルタ処理済みのデータをメモリ112へ送る。メモリ102、メモリ110、メモリ112内のデータは予測方法決定部113に送られる。
予測方法決定部113では、メモリ102、メモリ110、メモリ112のデータより予測方法を決定し、予測方法情報を、予測画像生成部117へ送る。予測画像生成部117では、予測方法決定部113で決められた予測方法に基づき予測画像を生成し、差分計算部103へ予測画像データを送る。
次に、予測方法決定部113の処理について詳細に説明する。
予測方法決定部113は、画面間予測部114、画面内予測部115、予測方法選択部116から構成される。本実施形態の映像符号化装置では、画面内予測部115にて、テンプレートマッチング予測と、テンプレートマッチング予測以外の一つ以上の方法による画面内予測として画面内予測方法1と画面内予測方法2を行う。本実施形態では、他の方法として画面内予測方法1と画面内予測方法2の2つの例で説明するが、画面内予測方法1又は画面内予測方法2の何れか一つであっても良いし、更に別の方法を加えて3つ以上の他の方法を行っても良い。
次に、予測方法決定部113で行なわれる本実施形態のテンプレートマッチング予測について、図2を用いて説明する。
図2において、4×4画素からなる符号化対象ブロックEの符号化対象画素Aと、6×6画素の領域のうち、すでに符号化済みの画素のみで構成される探索領域Sを示す。符号化対象画素Aには、すでに符号化済みの隣接画素B0、B1、B2で構成されるテンプレート領域が隣接する。このテンプレート領域との相関が最も高い領域を、探索領域内(探索領域Sの内部)から検出する。このテンプレート領域との相関については、下記(1)式で示すSAD(Sum of Abusolute Difference)を用い、SAD(差分絶対値和)の値が小さいものを相関が高いと判断する。
SAD=|(D0−B0)|+|(D1−B1)|+|(D2−B2)|・・・式(1)
式(1)では、符号化対象画素Aのテンプレート領域と符号化済みの画素であるD0、D1、D2との差分を求める場合の式である。
探索領域S全体を探索し、SADが最も小さくなる画素がR0、R1、R2である場合、対応する画素Rを符号化対象画素Aの予測画素とする。同様に符号化対象ブロック内の画素A1〜A15についても同様のパターンマッチング処理を行い、各画素のSADが最小となる領域に対するSADを求めることで予測画素を探索し、符号化対象ブロックに対する予測画像を生成する。ここで、符号化対象画像と、生成した予測画像との差分を求めることなく、前述した予測画像生成の演算途中に求める各画素の最小SADを、図1で示した予測方法選択部116へ送る。
更に、テンプレートマッチング予測以外の画面内予測方法として、画面内予測方法1により生成した予測画像と符号化対象ブロックのコスト値、及び画面内予測方法2により生成した予測画像と符号化対象ブロックのコスト値についても予測方法選択部116へ送る。ここで、コスト値とは、発生符号量を推定するための評価値であって、一般的にコスト関数より求める。本実施形態の映像符号化装置におけるコスト関数は前述したSADを用いる。
次に、図1の画面間予測部114では、符号化対象ブロックに対して画面間予測により予測画像を生成し、予測画像と符号化対象ブロックのコスト値を、コスト関数を用いて求めて、予測方法選択部116へ送る。
本実施形態の映像符号化装置では、コスト関数としてSADを用いるが、例えばSATD(Sum of Abusolute Transform Difference)等、他の式から求めてもよく、その形式は問わないものとする。
次に、図1の予測方法選択部116について説明する。
予測方法選択部116では、テンプレートマッチング予測と他の予測モードとの結果を比較して最適な予測方法を選択する。すなわち、画面内予測部115から得るテンプレートマッチング予測によるSAD、および画面内予測方法1によるコスト値、および画面内予測方法2によるコスト値と、画面間予測部114から得る画面間予測によるコスト値から最小となる予測モード情報を、予測画像生成部117へ送る。これにより、予測モード選択処理における演算量を削減することができる。
本実施形態では、テンプレートマッチング予測における符号化対象ブロックを4×4画素としているが、サイズは問わないものとする。また、探索領域についても6×6画素としているが、こちらも同様にサイズは問わないものとする。
「第2の実施形態」
次に、本発明の第2の実施形態を説明する。
図3は、本実施形態の映像符号化装置の構成例を示すブロック図である。図3において、映像信号入力部101からメモリ112は、図1で説明した映像信号入力部101からメモリ112と同等であるため同一符号を付して説明を省略する。
以下に、予測方法決定部313の処理について詳細に説明する。
予測方法決定部313は、画面間予測部314、画面内予測部315、予測方法選択部316、閾値判定部318から構成される。
画面内予測部315にて、テンプレートマッチング予測と、テンプレートマッチング予測以外の画面内予測として画面内予測方法1と画面内予測方法2を行う。
以下、本実施形態の映像符号化装置のテンプレートマッチング予測について、第1の実施形態で説明した内容との差分のみ説明する。
第1の実施形態で説明したように、図2に示す符号化対象画素Aのテンプレート領域と、符号化済みの画素であるD0、D1、D2との差分を求める。探索領域S内を順次探索し、前述した式(1)で示すSADが最も小さくなる画素R0、R1、R2を求める。
ここで、図3の画面内予測部315および閾値判定部318の処理を、図4のフローチャートを用いて説明する。
図3の画面内予測部315において、S401に示すように符号化対象画素のテンプレート領域に対するパターンマッチング処理を行う。
次に、S402では、同様に画面内予測部315において、S401で算出した最小SADを元に、符号化対象ブロック内のテンプレートマッチング処理済み画素に対するS401で算出した最小SADの総和であるSAD(TOTAL)を求める。
次に、図3の閾値判定部318において、S403で示すように、S402で求めたSAD(TOTAL)が閾値以上か否かを判定する。S403において、閾値以上と判定された場合は、S404に進んで、閾値判定部318から画面内予測部315および予測方法選択部316へ、本テンプレートマッチング処理の打ち切りを示す信号を出力する。
次に、S405では、閾値判定部318から受けた打ち切り信号により、画面内予測部315で処理中のテンプレートマッチング処理の打ち切りを行い、本フローチャートの処理を終了する。
一方、S403において、SAD(TOTAL)が閾値より小さいと判定された場合には、S406に進み、符号化対象ブロック内の全ての対象画素の処理が終了したか否かを判定し、全ての画素の処理を終えた場合には、本フローチャートを終了する。また、未処理の画素が存在する場合には、本フローチャートのS401へ戻り、未処理画素のテンプレートマッチング処理を行い、全ての画素の処理を終えるまで同様の処理を繰り返す。
さらに、画面内予測部315では、前述した画面内予測方法1において生成した予測画像と符号化対象ブロックのコスト値、および前述した画面内予測方法2において生成した予測画像と符号化対象ブロックのコスト値についても予測方法選択部316へ送る。ここで、コスト値については前述したSADより求めるものとする。
次に、図3の画面間予測部314では、符号化対象ブロックに対して画面間予測により予測画像を生成し、予測画像と符号化対象ブロックのコスト値を、コスト関数を用いて求めて、予測方法選択部316へ送る。
次に、図3の予測方法選択部316について説明する。
予測方法選択部316では、画面内予測部315から得るテンプレートマッチング予測によるSAD、及び画面内予測方法1によるコスト値。画面内予測方法2によるコスト値と、画面間予測部314から得る画面間予測によるコスト値から最小となる予測モード情報を、予測画像生成部117へ送る。ただし、閾値判定部318よりテンプレートマッチング予測の打ち切り信号が出力された場合には、テンプレートマッチング予測は選択せずに、他の予測モードの中からコスト値が最小となる予測モード情報を、予測画像生成部117へ送る。
本実施形態の映像符号化装置では、コスト関数としてSADを用いるが、例えばSATD等、他の式から求めてもよく、その形式は問わないものとする。
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、前述した実施形態の機能を実現するソフトウェア(コンピュータプログラム)を、ネットワーク又は各種のコンピュータ読み取り可能な記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
101 映像信号入力部、102 メモリ、103 差分計算部、104 直交変換部、105 量子化部、106 エントロピー符号化部、107 逆量子化部、108 逆直交変換部、109 加算器、110 メモリ、111 フィルタ処理部、112 メモリ、113 予測方法決定部、114 画面間予測部、115 画面内予測部、116 予測方法選択部、117 予測画像生成部、313 予測方法決定部、314 画面間予測部、315 画面内予測部、316 予測方法選択部、318 閾値判定部

Claims (9)

  1. 符号化対象ブロックに対して画面間予測により予測画像を生成し、予測画像と符号化対象ブロックのコスト値を、コスト関数を用いて求める画面間予測手段と、
    前記符号化対象ブロックの符号化対象画素と、前記符号化対象画素に隣接する符号化済みの隣接画素で構成されるテンプレート領域との相関が最も高い領域を、探索領域内から検出して予測画像を生成するテンプレートマッチング予測と、前記テンプレートマッチング予測以外の一つ以上の方法による画面内予測とを行う画面内予測手段と、
    前記テンプレートマッチング予測と他の方法による画面内予測との結果を比較して予測方法を選択する予測方法選択手段とを有し、
    前記予測方法選択手段は、前記画面内予測手段から得られる前記テンプレートマッチング予測による差分絶対値和、および前記他の方法による画面内予測によるコスト値と、前記画面間予測手段から得られる画面間予測によるコスト値とから予測方法を決定することを特徴とする映像符号化装置。
  2. 前記差分絶対値和は、前記テンプレート領域の各画素と、前記探索領域の各画素との差分を示す値であることを特徴とする請求項1に記載の映像符号化装置。
  3. 前記差分絶対値和がSADであることを特徴とする請求項1または2に記載の映像符号化装置。
  4. 前記テンプレートマッチング予測において、前記予測画像を生成する演算途中に求める各画素の差分絶対値和の総和が閾値以上か否かを判定する閾値判定手段を有し、
    前記閾値判定手段は、前記各画素の差分絶対値和の総和が閾値以上の場合に、前記画面内予測手段および予測方法選択手段へ、前記テンプレートマッチング予測の打ち切りを示す信号を出力することを特徴とする請求項1〜3の何れか1項に記載の映像符号化装置。
  5. 前記画面内予測手段は、前記閾値判定手段からテンプレートマッチング予測の打ち切りを示す信号を受けると、処理中のテンプレートマッチング処理を終了することを特徴とする請求項4に記載の映像符号化装置。
  6. 前記予測方法選択手段は、前記閾値判定手段よりテンプレートマッチング予測の打ち切り信号を受けると、テンプレートマッチング予測は選択せずに、予測方法の中からコスト値が最小となる予測モード情報を選択することを特徴とする請求項4に記載の映像符号化装置。
  7. 符号化対象ブロックに対して画面間予測により予測画像を生成し、予測画像と符号化対象ブロックのコスト値を、コスト関数を用いて求める画面間予測工程と、
    前記符号化対象ブロックの符号化対象画素と、前記符号化対象画素に隣接する符号化済みの隣接画素で構成されるテンプレート領域との相関が最も高い領域を、探索領域内から検出して予測画像を生成するテンプレートマッチング予測と、前記テンプレートマッチング予測以外の一つ以上の方法による画面内予測とを行う画面内予測工程と、
    前記テンプレートマッチング予測と他の方法による画面内予測との結果を比較して予測方法を選択する予測方法選択工程とを有し、
    前記予測方法選択工程は、前記画面内予測工程から得られる前記テンプレートマッチング予測による差分絶対値和、および前記他の方法による画面内予測によるコスト値と、前記画面間予測工程から得られる画面間予測によるコスト値とから予測方法を決定することを特徴とする映像符号化方法。
  8. 符号化対象ブロックに対して画面間予測により予測画像を生成し、予測画像と符号化対象ブロックのコスト値を、コスト関数を用いて求める画面間予測工程と、
    前記符号化対象ブロックの符号化対象画素と、前記符号化対象画素に隣接する符号化済みの隣接画素で構成されるテンプレート領域との相関が最も高い領域を、探索領域内から検出して予測画像を生成するテンプレートマッチング予測と、前記テンプレートマッチング予測以外の一つ以上の方法による画面内予測とを行う画面内予測工程と、
    前記テンプレートマッチング予測と他の方法による画面内予測との結果を比較して予測方法を選択する予測方法選択工程とを有し、
    前記予測方法選択工程は、前記画面内予測工程から得られる前記テンプレートマッチング予測による差分絶対値和、および前記他の方法による画面内予測によるコスト値と、前記画面間予測工程から得られる画面間予測によるコスト値とから予測方法を決定することをコンピュータに実行させることを特徴とするプログラム。
  9. 請求項8に記載のプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。
JP2012046725A 2012-03-02 2012-03-02 映像符号化装置及び映像符号化方法 Pending JP2013183345A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012046725A JP2013183345A (ja) 2012-03-02 2012-03-02 映像符号化装置及び映像符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012046725A JP2013183345A (ja) 2012-03-02 2012-03-02 映像符号化装置及び映像符号化方法

Publications (1)

Publication Number Publication Date
JP2013183345A true JP2013183345A (ja) 2013-09-12

Family

ID=49273708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012046725A Pending JP2013183345A (ja) 2012-03-02 2012-03-02 映像符号化装置及び映像符号化方法

Country Status (1)

Country Link
JP (1) JP2013183345A (ja)

Similar Documents

Publication Publication Date Title
US11546627B2 (en) Moving picture decoding method and moving picture encoding method
JP4999854B2 (ja) 画像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
CN110741640B (zh) 用于视频代码化中的运动补偿预测的光流估计
US20150049804A1 (en) Video decoder, video encoder, video decoding method, and video encoding method
JP6636615B2 (ja) 動きベクトル場の符号化方法、復号方法、符号化装置、および復号装置
EP3697093A1 (en) Inter-frame prediction method, device and storage medium
JP5441803B2 (ja) 動きベクトル決定装置及び動きベクトル決定方法、コンピュータプログラム
JP6039178B2 (ja) 画像符号化装置、画像復号装置、並びにそれらの方法及びプログラム
JP2018533273A5 (ja)
JP2017126829A (ja) 動画像符号化装置、動画像符号化方法、及びプログラム
US11528485B2 (en) Encoding apparatus and program
JP5706291B2 (ja) 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置およびそれらのプログラム
JP2007110409A (ja) 画像処理装置及び画像処理方法をコンピュータに実行させるためのプログラム
JP5043849B2 (ja) ビデオシーケンスにおける可変形状動き推定
JP6386466B2 (ja) 映像符号化装置及び方法、及び、映像復号装置及び方法
JP2013183345A (ja) 映像符号化装置及び映像符号化方法
JP5281597B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
WO2012172634A1 (ja) 画像符号化装置、画像復号化装置、方法およびプログラム
JP2013247653A (ja) 画像処理装置および画像処理方法
US20170019683A1 (en) Video encoding apparatus and method and video decoding apparatus and method
JP6232117B2 (ja) 画像符号化方法、画像復号方法、及び記録媒体
CN117768647A (zh) 图像处理方法、装置、设备及可读存储介质
JP2014011631A (ja) 予測画像生成装置、復号装置、符号化装置、予測画像生成方法、復号方法、符号化方法、予測画像生成プログラム、復号プログラム及び符号化プログラム
JP2005318106A (ja) 動画像符号化装置及びプログラム
JP2013179554A (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム