JP2014146988A - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP2014146988A
JP2014146988A JP2013014721A JP2013014721A JP2014146988A JP 2014146988 A JP2014146988 A JP 2014146988A JP 2013014721 A JP2013014721 A JP 2013014721A JP 2013014721 A JP2013014721 A JP 2013014721A JP 2014146988 A JP2014146988 A JP 2014146988A
Authority
JP
Japan
Prior art keywords
block
image
filter coefficient
prediction mode
intra prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013014721A
Other languages
English (en)
Other versions
JP6065613B2 (ja
Inventor
Xu Ying Lei
旭穎 雷
Hidemasa Miyoshi
秀誠 三好
Tomohito Shimada
智史 島田
Tomonori Kubota
智規 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013014721A priority Critical patent/JP6065613B2/ja
Priority to US14/156,078 priority patent/US9319688B2/en
Publication of JP2014146988A publication Critical patent/JP2014146988A/ja
Application granted granted Critical
Publication of JP6065613B2 publication Critical patent/JP6065613B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】より少ない演算量で、イントラ予測モード判定の精度をよくして、画質を向上させる動画像符号化装置を提供する。
【解決手段】符号化対象画像の1フレーム前の画像を用いて、復号画像のイントラ予測モード毎に、復号画像と原画像とからフィルタ係数を算出し、符号化対象ブロックの周辺ブロックのイントラ予測モード判定用参照画素に、当該周辺ブロックのイントラ予測モードに基づいて、フィルタ係数を抽出してフィルタ処理をしてイントラ予測モード判定用参照画像を生成し、イントラ予測モード判定用参照画像を用いて符号化対象ブロックのイントラ予測モードを選択し、符号化対象ブロックのイントラ予測画像を生成する動画像符号化装置とする。
【選択図】図7

Description

本発明は、動画像符号化装置に関する。
動画像は、時間的に連続した複数の静止画像である。動画像データは、一般的に、静止画像データ等と比べて情報量が大きいため、動画像データの伝送にはデータ圧縮が求められる。動画像データは、例えば、動画像符号化処理により、圧縮され得る。ここで、「動画像符号化処理」とは、動画像データのデータ列を他のデータ列に変換する符号化処理である。動画像符号化処理では、データ量が大きい動画像データを圧縮することができる。そのため、動画像符号化処理を含む動画像符号化技術は、地上デジタル放送、Blu-Ray(
登録商標)、デジタルビデオカメラなどで、動画像を、伝送、記録する際に、利用されている。動画像符号化方式の1つとして、H.264/AVCが挙げられる。また、H.264/AVCの2倍以上の符号化効率を有する次世代動画像符号化技術であるHEVCが、今後、規格化される予定である。
図1は、H.264/AVCやHEVCを含む一般的な動画像符号化方式による動画像符号化装置の構成例を示す図である。動画像の一般的な性質として、画面内や画面間の相関が強いことが挙げられる。画面内の相関性を利用して符号化対象画素の予測画素を生成する方式は、イントラ予測方式と呼ばれる。画面間の相関性を利用する方式は、インター予測方式と呼ばれる。エンコーダは、イントラ予測方式またはインター予測方式による予測誤差に直交変換、量子化処理、可変長符号化を行うことでビットストリームを生成する。直交変換は、画像の空間周波数変換であり、予測誤差を周波数ごとの振幅成分に分解する。量子化処理は、直交変換により得られた係数に対して、量子化ステップで除算した結果を整数に丸める処理である。直交変換、量子化処理により情報量が大幅に削減される。
図2は、一般的な動画像符号化方式による動画像符号化装置の構成例を示す図である。デコーダは、エンコーダと逆の手順で画像を復元(復号化)する。
エンコーダには、デコーダが含まれる。エンコーダに含まれるデコーダは、ローカルデコーダと呼ばれる。ローカルデコーダは、符号化済みの画像を次に符号化する画像の予測値として用いて、符号化を行う。
〈イントラ予測〉
ここで、イントラ予測について説明する。イントラ予測とは、1画面(フレーム)中の画素を複数のブロックに分け、隣り合ったブロック同士の画素値(色、輝度など)が類似しているという性質を利用して、あるブロックの画素から周辺のブロックの画素を予測することでデータ量を減らす予測方法である。例えば、H.264規格(デコーダ)では、復号化対象ブロックの周辺ブロックのうち、既に復号されている周辺ブロックの画素を参照し、予測画像が生成される。
イントラ予測では、1画面中の画素が複数の小ブロックに分割され、ブロック単位で符号化が行われる。イントラ予測では、符号化対象ブロックの周辺にある、既に符号化されたブロックの画素(画素値)から、符号化対象ブロックの画素を予測し、予測残差を符号化することで、情報量が削減される。
イントラ予測において、エンコーダは、エンコーダにおける予測画像とデコーダにおける予測画像とを一致させるため、エンコーダ内でデコーダと同じ復号画像を生成して参照
する。そのため、エンコーダ内に、逆量子化/逆直交変換手段を含むローカルデコーダが配置される。エンコーダは、エンコーダ内で生成された復号画像を参照画像として、予測画像を生成する。
〈イントラ予測モード判定〉
エンコーダでは、イントラ予測の性能を十分に発揮するために、イントラ予測モード判定が行われる。エンコーダのイントラ予測モード判定部は、複数のイントラ予測モード(例えば、予測方向)から、1つのイントラ予測モードを選択する。選択方法として、例えば、イントラ予測モード判定部は、各イントラ予測モードにおけるSAD(Sum of Absolute Difference:入力画像と予測画像との予測誤差の絶対値和)を計算し、計算結果を符号化コストとして用い、符号化コストを最小化する1モードを選択する。
図3は、HEVCのイントラ予測の予測方向の例を示す図である。HEVCのイントラ予測では、35種類の予測方向が使用される。予測方向は、イントラ予測モードの一例である。イントラ予測モードは、予測モードともいう。
イントラ予測モード判定が行われる際に、周辺ブロックの参照画素からモード判定用参照画像が生成される。周辺ブロックは、符号化対象ブロックに隣接するブロックである。参照画素は、周辺ブロック内の画素であって、符号化対象ブロックに隣接する画素である。
図4は、HEVCの符号化対象ブロックの周辺ブロックの位置の例を示す図である。図4のように、HEVCでは、例えば、符号化対象ブロックを符号化する際に、A、B、C、D、Eのブロックが参照される。符号化に用いる予測画像を生成する際に、周辺ブロック(参照ブロック)の復号画素が参照される。そのため、一般的に、イントラ予測モード判定においても復号画素が参照されることで、イントラ予測モード判定の精度が上がる。
特開2010−183162号公報 国際公開第2007/111292号 国際公開第2008/069073号
図5及び図6は、それぞれ、従来のエンコーダ及びデコーダの例を示す図である。図5のエンコーダでは、入力画像(原画像)をすべてイントラ予測で符号化し、イントラ予測判定を、エンコーダにおける復号画素を参照することで行う。
イントラ予測モード判定において復号画像を参照する際に、イントラ予測モード判定に使用する参照画素を含む周辺の符号化済ブロック(図4のA、B、C、D、Eブロックに相当)の画素値が使用される。そのため、周辺の符号化済ブロック(周辺ブロック)を、最良として選択した予測モードで復号することが求められる。すなわち、同一画面内の、周辺ブロックと符号化対象ブロックとに依存関係が生じ、ハードウェア実装時には並列化が困難である。さらに、復号画素を参照するために、直交変換・量子化処理、及び、逆量子化・逆直交変換処理を行うので、復号画素を得るための演算量が莫大になる。
また、イントラ予測の前段階のイントラ予測モード判定部分で周辺ブロックの原画素を参照することにより、イントラ予測モード判定用参照画像作成の並列処理を可能とし、処理時間を短縮する技術がある。しかし、この技術では、原画像と復号画像との間に量子化
誤差が存在するので、復号画像の代わりに原画素を参照するとイントラ予測モード判定の精度が低くなる。
さらに、イントラ予測モード判定で参照する周辺ブロックの原画像に対し擬似離散コサイン変換・量子化変換処理を行い、近似的な局部復号画像を求めることにより、予測モード判定精度の劣化を抑制する技術がある。しかし、この技術では、擬似離散コサイン変換・量子化変換処理の演算量が多い。
本件開示の技術は、より少ない演算量で、イントラ予測モード判定の精度をよくして、画質を向上させる動画像符号化を実現することを課題とする。
開示の技術は、上記課題を解決するために、以下の手段を採用する。
即ち、第1の態様は、
1フレーム毎に入力される原画像を、イントラ予測を用いて、前記原画像のブロック単位に符号化を行う動画像符号化装置であって、
前記原画像の符号化対象のブロックである符号化対象ブロックを含む画像の1フレーム前の画像の復号画像を格納する復号画像メモリと、
前記復号画像に対応する原画像を格納する原画像メモリと、
前記復号画像のブロック毎のイントラ予測モードを格納する復号画像周辺情報格納部と、
前記復号画像のイントラ予測モード毎に、前記復号画像と前記原画像とからフィルタ係数を算出するフィルタ係数分類部と、
前記符号化対象ブロックの周辺ブロックのイントラ予測モードを読み出す符号化対象ブロック周辺情報読出部と、
前記周辺ブロックのイントラ予測モードに基づいて、前記周辺ブロック毎に、フィルタ係数を選択するフィルタ係数選択部と、
前記フィルタ係数選択部によって選択されたフィルタ係数を用いて、前記周辺ブロックのイントラ予測モード判定用参照画素にフィルタ処理をし、前記周辺ブロックのイントラ予測モード判定用参照画素の復号画像としての画素値を算出する原画像補正部と、
前記原画像補正部から得られた復号画像としての画素値からイントラ予測モード判定用参照画像を生成する参照画像生成部と、
参照画像生成部が生成した前記参照画像を用いて、前記符号化対象ブロックのイントラ予測モードを選択するイントラ予測モード判定部と、
前記イントラ予測モード判定部で選択されたイントラ予測モードを使用して符号化対象ブロックのイントラ予測画像を生成するイントラ予測画像生成部、
を有する動画像符号化装置である。
開示の態様は、プログラムが情報処理装置によって実行されることによって実現されてもよい。即ち、開示の構成は、上記した態様における各手段が実行する処理を、情報処理装置に対して実行させるためのプログラム、或いは当該プログラムを記録したコンピュータ読み取り可能な記録媒体として特定することができる。また、開示の構成は、上記した各手段が実行する処理を情報処理装置が実行する方法をもって特定されてもよい。
開示の技術によれば、より少ない演算量で、イントラ予測モード判定の精度をよくして、画質を向上させる動画像符号化を実現することができる。
図1は、H.264/AVCやHEVCを含む一般的な動画像符号化方式による動画像符号化装置の構成例を示す図である。 図2は、一般的な動画像符号化方式による動画像符号化装置の構成例を示す図である。 図3は、HEVCのイントラ予測の予測方向の例を示す図である。 図4は、HEVCの符号化対象ブロックの周辺ブロックの位置の例を示す図である。 図5は、従来のエンコーダの例を示す図である。 図6は、従来のデコーダの例を示す図である。 図7は、実施形態における動画像符号化装置の例を示す図である。 図8は、コンピュータの構成例を示す図である。 図9は、動画像符号化装置における符号化対象ブロックの符号化の動作フローの例を示す図である。 図10は、フィルタ処理対象画素の位置の例を示す図である。 図11は、フィルタ係数算出方法の動作フローの例を示す図である。 図12は、4×4の処理対象ブロックの周辺の参照画素(上)の例を示す図である。 図13は、4×4の処理対象ブロックの周辺の参照画素(左)の例を示す図である。 図14は、フィルタ係数分類部における、参照画素の位置に対応する復号画素及び原画素の分類の例を示す図である。 図15は、処理対象ブロックのサイズと周辺ブロックサイズが同じ場合の例を示す図である。 図16は、処理対象ブロックのサイズが周辺ブロックのサイズより大きい場合の例を示す図である。 図17は、符号化対象ブロックのサイズが周辺ブロックのサイズより小さい場合の例を示す図である。 図18は、符号化対象ブロックのサイズが周辺ブロックのサイズより小さい場合の例を示す図である。 図19は、フィルタ係数選択方法の動作フローの例を示す図である。 図20は、変形例1における動画像符号化装置の例を示す図である。 図21は、フィルタ係数分類部における、参照画素の位置に対応する復号画素及び原画素の分類の例を示す図である。 図22は、変形例2における動画像符号化装置の例を示す図である。 図23は、エッジ方向の算出の際に使用する符号化対象ブロックの周辺ブロック内の参照画素を含む2×2のブロックの例を示す図である。 図24は、補正対象画素を含む2×2のブロックの例を示す図である。
以下、図面を参照して実施形態について説明する。実施形態の構成は例示であり、開示の構成は、開示の実施形態の具体的構成に限定されない。開示の構成の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。
〔実施形態〕
(構成例)
図7は、本実施形態における動画像符号化装置の例を示す図である。動画像符号化装置100は、イントラ予測画像生成部102、差分画像生成部104、直交変換量子化部106、エントロピー(Entropy)符号化部108、逆量子化逆直交変換部110、復号画
像生成部112、復号画像メモリ114を有する。また、動画像符号化装置100は、復号画像周辺情報格納部116、原画像メモリ118、符号化対象ブロック周辺情報読出部120、フィルタ係数分類部130、フィルタ係数選択部140を有する。さらに、動画
像符号化装置100は、原画素補正部142、参照画像生成部144、イントラ予測モード判定部146を有する。
イントラ予測画像生成部102は、イントラ予測モード判定部146で決定された符号化対象ブロックのイントラ予測モード(予測モード)を用いて、復号画像メモリ114から符号化対象ブロックの周辺ブロックの復号画素を取得する。イントラ予測画像生成部102は、取得した復号画素を参照して、符号化対象ブロックの予測画像を生成し、差分画像生成部104に出力する。
差分画像生成部104は、イントラ予測画像生成部102で生成した符号化対象ブロックの予測画像と入力画像(原画像)との差分画像を求めて、直交変換量子化部106に出力する。
直交変換量子化部106は、差分画像生成部104から入力された差分画像を直交変換処理する。さらに、直交変換量子化部106は、直交変換処理で得られた周波数信号の量子化を行い、エントロピー符号化部108及び逆量子化逆直交変換部110に出力する。直交変換量子化部106は、直交変換部と量子化部とに分かれていてもよい。
エントロピー符号化部108は、入力された量子化信号をエントロピー符号化(可変長符号化)してストリーム出力する。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てることである。
逆量子化逆直交変換部110は、入力された量子化信号に対し、逆量子化処理、及び、逆直交変換処理をする。逆量子化逆直交変換部110は、処理した信号を、復号画像生成部112に出力する。逆量子化逆直交変換部110によって復号化処理が行われることにより、符号化前の差分画像と同程度の信号が得られる。逆量子化逆直交変換部110は、逆量子化部と逆直交変換部とに分かれていてもよい。
復号画像生成部112は、イントラ予測画像生成部102が出力した予測画像と、逆量子化逆直交変換部110により復号処理された差分画像とを加算することにより、現在の符号化対象ブロック(現符号化対象ブロック)の画像データを生成する。復号画像生成部112は、生成した画像データを、復号画像メモリ114に出力(格納)する。
復号画像メモリ114は、復号画像生成部112によって生成された復号画像を、新たな復号画像のデータとして格納する。復号画像メモリ114は、フィルタ係数分類部130及びイントラ予測画像生成部102によって、保存された復号画像を、取り出される。
復号画像周辺情報格納部116は、符号化対象画像の1フレーム前の画像の復号画像に対して、ブロック毎にイントラ予測モード(予測方向)を格納する。復号画像周辺情報格納部116は、フィルタ係数分類部130の求めに応じて、イントラ予測モードを出力する。
原画像メモリ118は、入力画像(原画像)データを保存して、フィルタ係数分類部130に出力する。
符号化対象ブロック周辺情報読出部120は、符号化対象ブロックの周辺ブロックの予測方向を格納する。
フィルタ係数分類部130は、N個のフィルタ係数分類部(第1フィルタ係数分類部130−1、・・・、第Nフィルタ係数分類部130−N)を含む。Nは、予測モード(例
えば、予測方向)の種類の数である。予測モードの種類の数は、例えば、予測方向の種類の数である。複数の予測モード(例えば、予測方向が似ているもの)を1つのグループの予測モードにして、予測モードの種類の数を減らしてもよい。フィルタ係数分類部130は、復号画像周辺情報格納部116から、処理対象ブロックのイントラ予測モード判定用参照画素が含まれている周辺ブロックの予測方向を読み出す。フィルタ係数分類部130は、読み出した予測モード(予測方向)毎にイントラ予測モード判定用参照画素の復号画素と原画素とを読み出し、予測モード毎に復号画素と原画素とからフィルタ係数を算出する。フィルタ係数分類部130は、動画像の時間的な相関性を利用して、復号画像メモリ114から取得した現在符号化しているピクチャの1フレーム前のピクチャの復号画像データと、原画像メモリ118から取得した原画像データを用いてフィルタ係数を算出する。
フィルタ係数選択部140は、符号化対象ブロック周辺情報読出部120から周辺ブロックの予測モード(予測方向)を読み出す。フィルタ係数選択部140は、読み出した予測モード(予測方向)の種類に従い、フィルタ係数分類部130から出力したフィルタ係数の中から同様の特徴をもつカテゴリー(予測モード)のフィルタ係数を選択する。
原画像補正部142は、符号化対象ブロックの周辺ブロックのイントラ予測モード判定用参照画素にフィルタ係数選択部140で選択されたフィルタ係数をかけて、原画像の復号画像相当の画素値を推定し補正し、参照画像生成部144に出力する。
参照画像生成部144は、イントラ予測モード判定用参照原画素を補正した後の画素を用いて、イントラ予測モード判定用の参照画像を生成し、イントラ予測モード判定部146に出力する。
イントラ予測モード判定部146は、符号化対象ブロックにおいて、参照画像生成部144が出力した参照画像を用いて、複数のイントラ予測モードから1つの予測モードを選択して、イントラ予測画像生成部102に出力する。イントラ予測モード判定部146は、符号化対象ブロックの予測モードを、符号化対象ブロック周辺情報読出部120に通知する。
動画像符号化装置100は、パーソナルコンピュータ(PC、Personal Computer)の
ような汎用のコンピュータまたはサーバマシンのような専用のコンピュータを使用して実現可能である。また、動画像符号化装置100は、ワークステーション(WS、Work Station)、PDA(Personal Digital Assistant)のような専用または汎用のコンピュータ、あるいは、コンピュータを搭載した電子機器を使用して実現可能である。また、動画像符号化装置100は、スマートフォン、携帯電話、カーナビゲーション装置のような専用または汎用のコンピュータ、あるいは、コンピュータを搭載した電子機器を使用して実現可能である。
図8は、コンピュータの構成例を示す図である。コンピュータ、すなわち、情報処理装置は、プロセッサ、主記憶装置、及び、二次記憶装置や、通信インタフェース装置のような周辺装置とのインタフェース装置を含む。主記憶装置及び二次記憶装置は、コンピュータ読み取り可能な記録媒体である。
コンピュータは、プロセッサが記録媒体に記憶されたプログラムを主記憶装置の作業領域にロードして実行し、プログラムの実行を通じて周辺機器が制御されることによって、所定の目的に合致した機能を実現することができる。
プロセッサは、例えば、CPU(Central Processing Unit)やDSP(Digital Signa
l Processor)である。主記憶装置は、例えば、RAM(Random Access Memory)やRO
M(Read Only Memory)を含む。
二次記憶装置は、例えば、EPROM(Erasable Programmable ROM)、ハードディス
クドライブ(HDD、Hard Disk Drive)である。また、二次記憶装置は、リムーバブル
メディア、即ち可搬記録媒体を含むことができる。リムーバブルメディアは、例えば、USB(Universal Serial Bus)メモリ、あるいは、CD(Compact Disc)やDVD(Digital Versatile Disc)のようなディスク記録媒体である。
通信インタフェース装置は、例えば、LAN(Local Area Network)インタフェースボードや、無線通信のための無線通信回路である。
周辺装置は、上記の二次記憶装置や通信インタフェース装置の他、キーボードやポインティングデバイスのような入力装置や、ディスプレイ装置やプリンタのような出力装置を含む。また、入力装置は、カメラのような映像や画像の入力装置や、マイクロフォンのような音声の入力装置を含むことができる。また、出力装置は、スピーカのような音声の出力装置を含むことができる。インタフェース装置には、複数の周辺装置が接続されうる。
動画像符号化装置100を実現するコンピュータは、プロセッサが二次記憶装置に記憶されているプログラムを主記憶装置にロードして実行することによって、各処理部としての機能を実現する。一方、復号画像メモリ114、原画像メモリ118は、主記憶装置または二次記憶装置の記憶領域に設けられる。
動画像符号化装置100の各ユニットは、ハードウェアの構成要素、ソフトウェアの構成要素、又は、これらの組み合わせとして、それぞれ実現され得る。
ハードウェアの構成要素は、ハードウェア回路であり、例えば、FPGA(Field Programmable Gate Array)、特定用途向け集積回路(ASIC)、ゲートアレイ、論理ゲー
トの組み合わせ、アナログ回路等がある。
ソフトウェアの構成要素は、ソフトウェアとして所定の処理を実現する部品である。ソフトウェアの構成要素は、ソフトウェアを実現する言語、開発環境等を限定する概念ではない。
プログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくても、並列的または個別に実行される処理を含む。
(動作例)
動画像符号化装置100の動作について説明する。動画像符号化装置100で符号化された画像データは、動画像復号化装置で復号されて、復号画像となる。動画像符号化装置100は、入力される動画像を、1フレームずつ、ブロック毎に符号化する。ここでは、符号化の対象となる1フレームの画像を符号化対象画像という。符号化対象画像は、複数のブロックに分割される。符号化対象画像のうち、符号化しようとするブロックを符号化対象ブロックという。ここでは、符号化対象画像内の1つの符号化対象ブロックの符号化について説明する。
図9は、動画像符号化装置における符号化対象ブロックの符号化の動作フローの例を示す図である。
ステップS101において、フィルタ係数分類部130は、符号化対象画像の1フレーム前の画像のブロック毎に、復号画像メモリ114から、符号化対象画像の1フレーム前の符号化済の復号画像を抽出する。符号化対象画像の1フレーム前の画像は、既に、複数のブロックに分割されて、符号化されている。フィルタ係数分類部130は、符号化対象画像の1フレーム前の画像のブロック毎に、復号画像周辺情報格納部116から、復号画像メモリ114から抽出された復号画像に対応する予測モード(予測方向)を抽出する。フィルタ係数分類部130は、符号化対象画像の1フレーム前の画像のブロック毎に、原画像メモリ118から、復号画像メモリ114から抽出された復号画像に対応する原画像を抽出する。フィルタ係数分類部130は、符号化対象画像の1フレーム前の画像のブロック毎に、復号画像メモリ114から抽出した復号画像と、復号画像周辺情報格納部116から抽出した予測モードと、原画像メモリ118から抽出した原画像とを、対応づける。フィルタ係数分類部130は、予測モード毎に、復号画像と原画像とから、フィルタ係数を算出する。フィルタ係数分類部130は、1つの予測モードに対して複数のブロックの復号画像及び原画像が存在する場合、復号画像の平均値と原画像の平均値とから、フィルタ係数を算出する。具体的なフィルタ係数の算出方法については、後述する。ステップS101のフィルタ係数の算出はフレーム毎に行われる。
ステップS102において、フィルタ係数選択部140は、符号化対象ブロック周辺情報読出部120から、符号化対象ブロックの周辺ブロックの予測モード(予測方向)を読み出す。符号化対象ブロックの周辺ブロックは既に符号化されている。フィルタ係数選択部140は、フィルタ係数分類部130で求めたフィルタ係数の中から、読み出した予測モード(予測方向)と、同じ予測モード(予測方向)のフィルタ係数を選択し、原画素補正部142に出力する。具体的なフィルタ係数の選択方法については、後述する。
ステップS103において、原画像補正部142は、符号化対象画像の符号化対象ブロックの周辺のフィルタ処理対象画素に、フィルタ係数選択部140で選択されたフィルタ係数を用いて、フィルタをかける。フィルタ処理対象画素は、符号化対象画像の符号化対象ブロックの周辺ブロックの符号化対象ブロックに隣接する画素である。
原画像補正部142は、フィルタをかけられたフィルタ処理対象画素を、参照画素として、参照画像生成部144に、出力する。参照画像生成部144は、原画像補正部142から出力される参照画素に基づいて、イントラ予測モード判定用参照画像を生成し、イントラ予測モード判定部146に出力する。イントラ予測モード判定用参照画像は、フィルタ処理対象画素が原画像補正部142で生成された参照画素である画像である。
図10はフィルタ処理対象画素の位置の例を示す図である。例えば、図10のように、HEVCでは、フィルタ処理対象画素は、8×8(8画素×8画素)の符号化対象ブロックに対して、符号化対象ブロックと隣接する、左下ブロックA内の8画素、左ブロックB内の8画素、左上ブロックC内の1画素、上ブロックD内の8画素、及び、右上ブロックE内の8画素の計33画素である。フィルタ処理対象画素は、符号化対象ブロックの参照画素である。
符号化対象ブロックのサイズが8×8以外であっても、同様に、フィルタ処理対象画素が選択される。フィルタ処理対象画素の画素数は、符号化対象ブロックのサイズに依存する。符号化対象ブロックのサイズがn×nである場合、フィルタ処理対象画素の画素数は、4×n+1画素である。例えば、符号化対象ブロックのサイズが4×4である場合、フィルタ処理対象画素の画素数は、17(=4×4+1)画素である。
図9に戻って、ステップS104において、イントラ予測モード判定部146は、参照画像生成部144が出力するイントラ予測モード判定用参照画像を用いて、各予測モード
に対する符号化対象ブロックの予測画像を生成し、最適な予測モードを決定する。
最適な予測モードの決定に際して、イントラ予測モード判定部146は、最初に、ブロックサイズを固定し、最適な予測モード(予測方向)を求める。イントラ予測モード判定部146は、イントラ予測モード判定用参照画像及び各々の予測モード(予測方向)で得られた符号化対象ブロックの予測画像と符号化対象ブロックの原画像との差分絶対値和SADを計算し、SADの値が最小となる予測方向を選択する。Nは、所定の予測モード(予測方向)の数である。
ここで、予測モード(予測方向)j(j=1、...、N)のSAD値を、SADjとする。SAD1からSADNまでのうち最小のものをSADkとすると、イントラ予測モード判定部146は、予測モード(予測方向)kを最適な予測モード(予測方向)として選択する。
次に、イントラ予測モード判定部146は、符号化対象ブロックを所定のブロックサイズで分割する。例えば、HEVCでは、所定のブロックサイズは、4×4、8×8、16×16、32×32、64×64である。イントラ予測モード判定部146は、各ブロックサイズのブロックで、イントラ予測モード判定用参照画像及び選択された最適な予測モード(予測方向)を用いて符号化対象ブロックの予測画像を生成し、予測画像と原画像との差分絶対値和SADを計算する。イントラ予測モード判定部146は、SADが最小となるブロックサイズを選択する。
また、イントラ予測モード判定部146は、選択された最適な予測モード(予測方向)を、符号化対象ブロックと対応づけて、符号化対象ブロック周辺情報読出部120、復号画像周辺情報格納部116に出力する。符号化対象ブロックの情報として、画面における符号化対象ブロックの位置やブロックサイズ等が含まれる。
ステップS105において、イントラ予測画像生成部102は、イントラ予測モード判定用参照画像、及び、イントラ予測モード判定部146が出力した予測モードを用いて、符号化対象ブロックの予測画像を生成する。差分画像生成部104は、符号化対象ブロックの原画像とイントラ予測画像生成部102で生成された予測画像との差分画像を生成し、直交変換量子化部106に出力する。
ステップS106において、直交変換量子化部106は、差分画像生成部104が出力した差分画像に対して、直交変換を行い、周波数信号を生成する。直交変換量子化部106は、生成した周波数信号に対して、量子化処理を行う。
ステップS107において、エントロピー符号化部108は、直交変換量子化部106が出力した量子化信号を、エントロピー符号化(可変長符号化)してストリーム出力する。エントロピー符号化は、シンボルの出現頻度に応じて可変長の符号を割り当てることである。
ステップS108において、逆量子化逆直交変換部110は、直交変換量子化部106が出力した信号に対し、逆量子化を行い周波数信号に変換し、直交変換の逆変換を行うことで復号処理された差分画像信号を生成する。逆量子化逆直交変換部110は、生成した差分画像信号を、復号画像生成部112に出力する。復号画像生成部112は、イントラ予測画像生成部102が出力した予測画像のブロックデータと、逆量子化逆直交変換部110が出力した差分画像信号とを加算することにより、復号後のブロックデータの画素データ(復号画像のデータ)を生成する。復号画像生成部112は、生成した画素データを、復号画像メモリ114に出力する。復号画像メモリ114では、復号画像生成部112
が出力した画素データを、新たな参照ピクチャのデータとして記憶し、イントラ予測画像生成部102及びフィルタ係数分類部130に供給する。
〈フィルタ係数の算出方法〉
フィルタ係数の算出方法について説明する。符号化対象画像の1フレーム前の画像は、既に、ブロック毎に、符号化されている。ここでは、符号化対象画像の1フレーム前の画像の1つのブロックを、処理対象ブロックとする。
図11は、フィルタ係数算出方法の動作フローの例を示す図である。
ステップS201において、フィルタ係数分類部130は、処理対象ブロック毎に、符号化対象画像の1フレーム前の画像における処理対象ブロックの上の参照画素を含むブロックの予測モード(予測方向)を、復号画像周辺情報格納部116から読み出す。フィルタ係数分類部130は、復号画像メモリ114から、符号化対象画像の1フレーム前の画像における処理対象ブロックの上の参照画素を含むブロックの復号化画像を、抽出する。フィルタ係数分類部130は、原画像メモリ118から、符号化対象画像の1フレーム前の画像における処理対象ブロックの上の参照画素を含むブロックの原画像を、抽出する。
さらに、フィルタ係数分類部130は、符号化対象画像の1フレーム前の画像における処理対象ブロックの左の参照画素を含むブロックの予測モード(予測方向)を、復号画像周辺情報格納部116から読み出す。フィルタ係数分類部130は、復号画像メモリ114から、符号化対象画像の1フレーム前の画像における処理対象ブロックの左の参照画素を含むブロックの復号化画像を、抽出する。フィルタ係数分類部130は、原画像メモリ118から、符号化対象画像の1フレーム前の画像における処理対象ブロックの左の参照画素を含むブロックの原画像を、抽出する。
即ち、ステップS201では、符号化対象画像の1フレーム前の処理対象ブロックの参照画素を含むブロックの、復号化画像と、原画像と、予測モード(予測方向)とが抽出される。
ステップS202において、フィルタ係数分類部130は、参照画素を含むブロックの復号化画像と原画像とを、参照画素を含むブロックの予測モードで分類して、格納する。即ち、フィルタ係数分類部130は、当該予測モードと、当該復号化画像と、当該原画像とを対応づけて、予測モードで分類して、格納する。例えば、フィルタ係数分類部130は、当該予測モードが予測モードi(予測方向が予測方向i)である場合、第iフィルタ係数分類部130−iに、当該復号化画像と当該原画像とを格納する。第iフィルタ係数分類部130−iは、予測モードiに対応する。予測モードは、イントラ予測モードともいう。
予測モードとして予測方向を使用する場合、符号化対象ブロックの上1行の画素(参照画素)、及び、符号化対象ブロックの左1列の画素(参照画素)に分けられて、フィルタ処理が行われてもよい。
図12は、4×4の処理対象ブロックの周辺の参照画素(上)の例を示す図である。図12の「a」、「b」、「c」、「d」は、処理対象ブロックの上1行の参照画素である。図12の例では、処理対象ブロックの上のブロック(参照画素(上)を含むブロック)は、4×4のブロックである。
処理対象ブロックの周辺ブロックサイズが4×4である場合、参照画素の位置(図12のa、b、c、d)に対応する復号画素Reconi[4]と、参照画素の位置(図12のa、b
、c、d)に対応する原画素Orgi[4]とを、予測方向iに対応づけて、分類する。復号画
素Reconi[4]は、予測方向がiである4×4のブロックの復号画素の平均値である。[4]は、4×4のブロックを示す。原画素Orgi[4]は、予測方向がiである4×4のブロックの
原画素の平均値である。
復号画素Reconi[4]は、次のように表される。
Figure 2014146988
reconi,k[4]は、予測方向がiのブロック(4×4)のうち、k番目のブロック(4x
4)の復号画素の画素値である。Niは、予測方向がiである4×4のブロック数である。Ari, Bri, Cri, Driは、それぞれ、図12のa、b、c、dの位置の復号画素の平均値である。ari,k, bri,k, cri,k, dri,kは、それぞれ、k番目のブロックの図12のa、b、c、dの位置の復号画素の画素値である。
原画素Orgi[4]は、次のように表される。
Figure 2014146988
orgi,k[4]は、予測方向がiのブロック(4×4)のうち、k番目のブロックの原画素
の画素値である。Njは、予測方向がiであるブロック数である。Aoi, Boi, Coi, Doiは、図12のa、b、c、dの位置の原画素の平均値である。aoi,k, boi,k, coi,k, doi,kは、図12のa、b、c、dの位置の原画素の画素値である。
図13は、4×4の処理対象ブロックの周辺の参照画素(左)の例を示す図である。図13の「a」、「b」、「c」、「d」は、処理対象ブロックの左1列の参照画素である。図13の例では、処理対象ブロックの左のブロック(参照画素(左)を含むブロック)は、4×4のブロックである。
処理対象ブロックの上1行の参照画素と同様に、処理対象ブロックの左1列の参照画素についても、予測方向毎に、原画素の平均値、復号画素の平均値が求められる。
参照画素(上)の平均値と参照画素(左)の平均値とは、別々に求められてもよいし、合わせて1つの平均値として求められてもよい。
図14は、フィルタ係数分類部130における、参照画素の位置に対応する復号画素及び原画素の分類の例を示す図である。図14の例では、参照画素が4×4のブロックに含
まれる場合の例である。図14の例では、イントラ予測モード毎に、参照画素の位置に対応する復号画素及び原画素が分類されている。参照画素が4×4のブロックに以外のブロックに含まれる場合についても、同様に、イントラ予測モード毎に、復号画素及び原画素が分類される。参照画素の位置が、処理対象ブロックの上に存在する場合と、処理対象ブロックの左に存在する場合とで、復号画素及び原画素が、別々に分類されてもよい。横に並ぶ参照画素と縦に並ぶ参照画素とで、画素の特徴が異なることがあるからである。
図15は、処理対象ブロックのサイズと周辺ブロックサイズが同じ場合の例を示す図である。
フィルタ係数分類部130は、復号画像周辺情報格納部116から処理対象ブロックの上の周辺ブロックの予測方向を読み出す。フィルタ係数分類部130は、処理対象ブロックの上の周辺ブロック内の処理対象ブロックに隣接する1行の画素(参照画素)に対応する復号画素を、復号画像メモリ114から読み出す。フィルタ係数分類部130は、処理対象ブロックの上の周辺ブロック内の処理対象ブロックに隣接する1行の画素(参照画素)に対応する原画素を、原画像メモリ118から読み出す。フィルタ係数分類部130は、周辺ブロックの予測方向及び周辺ブロックのサイズ毎に、読み出した復号画素と読み出した原画素とを分類する。
フィルタ係数分類部130は、処理対象ブロックの左の周辺ブロックに対しても同様にする。
図16は、処理対象ブロックのサイズが周辺ブロックのサイズより大きい場合の例を示す図である。
フィルタ係数分類部130は、復号画像周辺情報格納部116から処理対象ブロックの上の周辺ブロックの予測方向を、周辺ブロック毎に、読み出す。フィルタ係数分類部130は、処理対象ブロックの上の周辺ブロック内の処理対象ブロックに隣接する1行の画素(参照画素)に対応する復号画素を、周辺ブロック毎に、復号画像メモリ114から読み出す。フィルタ係数分類部130は、処理対象ブロックの上の周辺ブロック内の処理対象ブロックに隣接する1行の画素(参照画素)に対応する原画素を、周辺ブロック毎に、原画像メモリ118から読み出す。フィルタ係数分類部130は、周辺ブロックの予測方向、周辺ブロックのサイズ毎に、読み出した復号画素と読み出した原画素とを分類する。
フィルタ係数分類部130は、処理対象ブロックの左の周辺ブロックに対しても同様にする。
図17及び図18は、符号化対象ブロックのサイズが周辺ブロックのサイズより小さい場合の例を示す図である。
フィルタ係数分類部130は、復号画像周辺情報格納部116から処理対象ブロックの上の周辺ブロックの予測方向を読み出す。フィルタ係数分類部130は、処理対象ブロックの上の周辺ブロック内の処理対象ブロックに隣接する1行の画素(参照画素)に対応する復号画素を、復号画像メモリ114から読み出す。フィルタ係数分類部130は、処理対象ブロックの上の周辺ブロック内の処理対象ブロックに隣接する1行の画素(参照画素)に対応する原画素を、原画像メモリ118から読み出す。フィルタ係数分類部130は、周辺ブロックの予測方向及び周辺ブロックのサイズ毎に、読み出した復号画素と読み出した原画素とを分類する。
フィルタ係数分類部130は、処理対象ブロックの左の周辺ブロックに対しても同様に
する。
符号化対象画像の1フレーム前の画像のすべてのブロックについて、ステップS201及びステップS202が行われる。符号化対象画像の1フレーム前の画像のすべてのブロックについて、ステップS201及びステップS202が行われると、処理がステップS203に進む。
ステップS203において、フィルタ係数分類部130は、第1フィルタ係数分類部130−1から第Nフィルタ係数分類部130−Nまでのそれぞれにおいて、フィルタ係数を算出する。例えば、第iフィルタ係数分類部130−iでは、予測モードi(予測方向
i)のブロックの復号画像と原画像とが格納されている。フィルタ係数は、ブロックサイズ毎に算出される。
フィルタ係数の一例として、ウィーナフィルタ(Wiener Filter)の係数が挙げられる
。ウィーナフィルタの係数は、次の式で求められる。フィルタ係数は、ウィーナフィルタの係数に限定されない。
Figure 2014146988
ここで、Hは求めるウィーナフィルタの係数、Rは原画像の参照画素の自己相関行列、Pは復号画像の参照画素と原画像の参照画素との相互相関行列を表す。R−1は、Rの逆行列である。
例えば、参照画素が4画素である(参照画素が含まれるブロックが4×4である)とき、行列Pは、次のように表される。
Figure 2014146988
例えば、参照画素が4画素であるとき、行列Rは、次のように表される。
Figure 2014146988
参照画素が4画素ではなく、8画素などの場合であっても、同様に、フィルタ係数が求められる。
(フィルタ係数の選択方法)
フィルタ係数の選択方法について説明する。
図19は、フィルタ係数選択方法の動作フローの例を示す図である。
ステップS301において、フィルタ係数選択部140は、符号化対象ブロックの周辺ブロックの予測モード及び周辺ブロックのブロックサイズを、符号化対象ブロック周辺情報読出部120から読み出す。符号化対象ブロックの周辺ブロックは既に符号化されている。よって、符号化対象ブロックの周辺ブロックの予測モードは、既に、イントラ予測モード判定部146によって、判定されている。ここで、符号化対象ブロックの周辺ブロックは、フィルタ処理対象画素を含むブロックである(図10)。
ステップS302において、フィルタ係数選択部140は、符号化対象ブロック周辺情報読出部120から読み出した予測モード及びブロックサイズに基づいて、周辺ブロック毎に、フィルタ係数分類部130から、フィルタ係数を選択する。
フィルタ係数選択部140は、符号化対象ブロックの参照画素が含まれる周辺ブロックの予測方向とブロックサイズに基づいて、ブロック毎に、フィルタ係数分類部130で求めたフィルタ係数を抽出する。原画像補正部142は、周辺ブロックのフィルタ処理対象画素に、フィルタ係数選択部140が抽出したフィルタ係数を用いてフィルタ処理することで、参照画素を生成する。
(実施形態の作用、効果)
動画像符号化装置100は、符号化対象画像の1フレーム前の画像の復号画像を使用して、フィルタ係数を算出する。符号化対象画像の1フレーム前の画像の復号画像は、符号化対象画像の1フレーム前の画像の符号化データを復号化することで得られる。フィルタ係数は、ブロックの予測モード及びブロックサイズ毎に算出される。動画像符号化装置100は、原画像補正部142でイントラ予測モード判定に用いる原画素に算出したフィルタ係数をかけることで、符号化対象画像の復号画素に似せた参照画素を生成する。動画像符号化装置100は、生成した参照画素を使用して、符号化対象ブロックの予測モードを選択する。符号化対象画像の復号画素に似せた参照画素を用いて符号化対象ブロックを選択することで、イントラ予測モード判定の精度がよくなり、符号化された画像の画質が向上する。
動画像符号化装置100は、符号化対象画像の復号画像を擬似した画素(イントラ予測モード判定用参照画素)を用いて、符号化対象画像のイントラ予測モード判定を行う。動画像符号化装置100は、符号化対象画像の符号化データの復号画像を得ることなく、イントラ予測モード判定を行うことができる。よって、動画像符号化装置100は、符号化対象画像の符号化データの復号画像を得るための逆量子化、逆直交変換(復号化)等を行うことなく、符号化対象画像のイントラ予測モード判定を行うことができる。動画像符号化装置100は、符号化対象画像の復号画像を擬似した画素を得ることで、符号化対象画像の符号化データの復号画像を得るための逆量子化、逆直交変換等を待つことなく、符号化対象画像のイントラ予測モード判定を行うことができる。したがって、動画像符号化装置100によれば、符号化対象画像の符号化データの復号画像を得るための逆量子化、逆直交変換等を待たないため、符号化処理の高速化を図れる。動画像符号化装置100によれば、符号化対象画像の復号画像を擬似した画素をイントラ予測モード判定に使用することで、原画像の画素を使用するよりも、より精度の高い符号化を行うことができる。動画像符号化装置100は、符号化対象画像のイントラ予測モード判定と、符号化対象画像の逆量子化、逆直交変換とを並列処理することができる。
符号化対象ブロックの周辺ブロックのイントラ予測モードは、当該周辺ブロックが符号化されるときに得られる。動画像符号化装置100は、符号化対象ブロックの周辺ブロックのイントラ予測モード、符号化対象画像の1フレーム前の画像から得られるフィルタ係数等を用いて、イントラ予測画像を生成する。
〈変形例1〉
次に変形例1について説明する。変形例1は、実施形態との共通点を有する。従って、主として相違点について説明し、共通点については、説明を省略する。
図20は、変形例1における動画像符号化装置の例を示す図である。動画像符号化装置200は、イントラ予測画像生成部202、差分画像生成部204、直交変換量子化部206、エントロピー(Entropy)符号化部208、逆量子化逆直交変換部210、復号画
像生成部212、復号画像メモリ214を有する。また、動画像符号化装置200は、復号画像周辺情報格納部216、原画像メモリ218、符号化対象ブロック周辺情報読出部220、フィルタ係数分類部230、フィルタ係数選択部240を有する。さらに、動画像符号化装置200は、原画素補正部242、参照画像生成部244、イントラ予測モード判定部246を有する。
上記の実施形態の動画像符号化装置100では、フィルタ係数を求める際の分類項目として、イントラ予測モード(予測方向)が使用された。変形例1の動画像符号化装置200では、フィルタ係数を求める際の分類項目として、参照画素の分散値が使用される。
復号画像周辺情報格納部216は、符号化対象画像の1フレーム前の画像の復号画像に対して、ブロック毎に当該ブロックの参照画素の分散値を格納する。復号画像周辺情報格納部216は、フィルタ係数分類部230の求めに応じて、参照画素の分散値を出力する。ブロック毎の参照画素の分散値は、イントラ予測モード判定部246で算出され、復号画像周辺情報格納部216に格納される。
図21は、フィルタ係数分類部における、参照画素の位置に対応する復号画素及び原画素の分類の例を示す図である。図21の例では、参照画素が4×4のブロックに含まれる場合の例である。ここでは、例えば、参照画素の分散値が閾値Th以上の場合にグループ1とし、参照画素の分散値が閾値Th未満の場合にグループ0とする。参照画素の分散値が、2以上の閾値を用いて、3以上のグループに分けられてもよい。図21の例では、グループ毎に対応する復号画素及び原画素が分類されている。参照画素が4×4のブロックに以外のブロックに含まれる場合についても、同様に、分散値のグループ毎に、復号画素及び原画素が分類される。参照画素の位置が、処理対象ブロックの上に存在する場合と、処理対象ブロックの左に存在する場合とで、復号画素及び原画素が、別々に分類されてもよい。横に並ぶ参照画素と縦に並ぶ参照画素とで、画素の特徴が異なることがあるからである。
フィルタ係数分類部230は、分散値のグループ毎に、フィルタ係数を算出する。
符号化対象ブロック周辺情報読出部220は、各ブロックの周辺の参照画素の分散値を算出し、格納する。
フィルタ係数分類部230は、N個のフィルタ係数分類部(第1フィルタ係数分類部230−1、・・・、第Nフィルタ係数分類部230−N)を含む。Nは、参照画素の分散値のグループの数である。フィルタ係数分類部230は、復号画像周辺情報格納部216から、処理対象ブロックのイントラ予測モード判定用参照画素が含まれている周辺ブロックの参照画素の分散値を読み出す。フィルタ係数分類部230は、読み出した参照画素の分散値毎にイントラ予測モード判定用参照画素の復号画素と原画素とを読み出し、分散値のグループ毎に復号画素と原画素とからフィルタ係数を算出する。フィルタ係数分類部230は、動画像の時間的な相関性を利用して、復号画像メモリ214から取得した現在符号化しているピクチャの1フレーム前のピクチャの復号画像データと、原画像メモリ218から取得した原画像データを用いてフィルタ係数を算出する。
(変形例1の作用、効果)
参照画素の分散値が大きい場合、参照画素が互いに大きく異なり、周波数変換すると低周波領域から高周波領域までほぼ均一に分布することになる。従って、参照画素の分散値が大きい場合、強めのフィルタをかける。また、参照画素の分散値が小さい場合、参照画素同士の差異が小さく、周波数変換すると低周波領域に集中する。従って、参照画素の分散値が小さい場合、弱めのフィルタをかける。参照画素の分散値に応じて、フィルタ係数を変更することで、より精度の高い符号化が可能となる。
〈変形例2〉
次に変形例2について説明する。変形例2は、実施形態、変形例1との共通点を有する。従って、主として相違点について説明し、共通点については、説明を省略する。
図22は、変形例2における動画像符号化装置の例を示す図である。動画像符号化装置300は、イントラ予測画像生成部302、差分画像生成部304、直交変換量子化部306、エントロピー(Entropy)符号化部308、逆量子化逆直交変換部310、復号画
像生成部312、復号画像メモリ314を有する。また、動画像符号化装置300は、復号画像周辺情報格納部316、原画像メモリ318、符号化対象ブロック周辺情報読出部320、フィルタ係数分類部330、フィルタ係数選択部340を有する。さらに、動画像符号化装置300は、原画素補正部342、参照画像生成部344、イントラ予測モード判定部346を有する。
上記の実施形態の動画像符号化装置100では、フィルタ係数を求める際の分類項目として、イントラ予測モード(予測方向)が使用された。変形例2の動画像符号化装置300では、フィルタ係数を求める際の分類項目として、参照画素のエッジ方向が使用される。
復号画像周辺情報格納部316は、符号化対象画像の1フレーム前の画像の復号画像に対して、ブロック毎に当該ブロックの参照画素のエッジ方向を格納する。復号画像周辺情報格納部316は、フィルタ係数分類部330の求めに応じて、参照画素のエッジ方向を出力する。ブロック毎の参照画素のエッジ方向は、イントラ予測モード判定部346で算出され、復号画像周辺情報格納部316に格納される。
(エッジ方向の算出方法)
エッジ方向の算出方法について説明する。エッジ方向は、イントラ予測モード判定部346によって算出される。エッジ方向は、イントラ予測モード判定部346以外の処理部で算出されてもよい。
図23は、エッジ方向の算出の際に使用する符号化対象ブロックの周辺ブロック内の参照画素を含む2×2のブロックの例を示す図である。図23において、符号化対象ブロックに隣接する参照画素を含む2×2のブロック(例えば、点線の四角で囲まれた部分)が、エッジ方向を算出する際に使用されるブロックである。この2×2のブロックには、符号化対象ブロック内の画素は含まれない。
イントラ予測モード判定部346は、符号化対象ブロックの周辺の2×2のブロックのそれぞれのエッジ強度∇fを求める。エッジ強度∇fは、次のように表される。
Figure 2014146988
ここで、dx、dyは、それぞれ、X軸方向の勾配、Y軸方向の勾配である。dx、dyは、次のように表される。
Figure 2014146988
a0、a1、a2、a3は、図23のように、2×2のブロック内の画素を表す。
エッジ方向θ(x,y)は、次のように表される。
Figure 2014146988
エッジ方向は、図23のように、5種類のタイプに分類される。エッジ強度∇fが所定の閾値より小さい場合、エッジなし(タイプ0)とする。エッジ強度∇fが所定の閾値以上である場合、エッジ方向θにより4タイプに分ける。例えば、X軸方向に変化がなく、Y軸方向に変化があるブロックの場合、当該ブロックのエッジ方向のタイプは、タイプ2になる。また、X軸方向に変化があり、Y軸方向に変化がないブロックの場合、当該ブロックのエッジ方向のタイプは、タイプ1になる。
イントラ予測モード判定部346は、参照画素を含む周辺2列の画素を用いて2×2のブロック単位で、1画素ずつずらしながら、順次、エッジ強度及びエッジ方向を算出する。算出されたエッジ方向は、2×2のブロック毎に、復号画像周辺情報格納部316に格納される。1つの画像のすべてのブロック周辺の参照画素を含むすべての2×2のブロックについて、エッジ方向が算出される。
(フィルタ係数の算出方法)
フィルタ係数の算出方法について説明する。符号化対象画像の1フレーム前の画像は、既に、ブロック毎に、符号化されている。符号化対象画像の1フレーム前の画像についての算出されたエッジ方向は、2×2のブロック毎に、復号画像周辺情報格納部316に格納されている。ここでは、参照画素を、補正対象画素とする。
図24は、補正対象画素を含む2×2のブロックの例を示す図である。図24のように、補正対象画素(例えば、図24のa4)は、左ブロック(例えば、図24のa0、a1、a3、a4)及び右ブロック(例えば、図24のa1、a2、a4、a5)に含まれる。上記のように、各ブロックのエッジ方向は5通りに分類されると、1つの補正対象画素に対して、5×5=25通りのエッジ方向の組み合わせが存在する。即ち、補正対象画素は、左ブロックのエッジ方向及び右ブロックのエッジ方向により25通り(25種類)に分類され得る。
フィルタ係数分類部330は、補正対象画素毎に、符号化対象画像の1フレーム前の画像における補正対象画素のエッジ方向の組み合わせを、復号画像周辺情報格納部316から読み出す。フィルタ係数分類部330は、符号化対象画像の1フレーム前の画像の復号画像における、補正対象画素(例えば、図24のa4)及び補正対象画素の周辺画素(例えば、図24のa0、a1、a2、a3、a5)を、復号画像メモリ314から、抽出する。フィルタ係数分類部330は、符号化対象画像の1フレーム前の画像の原画像における、補正対象画素及び補正対象画素の周辺画素を、原画像メモリ318から、抽出する。
フィルタ係数分類部330は、抽出した、補正対象画素及び補正対象画素の周辺画素の復号画像と原画像とを、補正対象がそのエッジ方向の組み合わせで分類して、格納する。即ち、フィルタ係数分類部330は、当該組み合わせと、当該復号画像と、当該原画像とを対応づけて、エッジ方向の組み合わせ(予測モード)で分類して、格納する。さらに、フィルタ係数分類部330は、符号化対象ブロックのブロックサイズで、分類してもよい。例えば、HEVCでは、ブロックサイズは4×4、8×8、16×16、32×32、64×64の5種類であるので、フィルタ係数分類部330は、エッジ方向の組み合わせと合わせて125種類のグループに分類する。
符号化対象ブロックが4×4である場合、補正対象画素及び補正対象画素の周辺画素の位置に対応する復号画素Reconi_4[6]と、補正対象画素及び補正対象画素の周辺画素の位
置に対応する原画素Orgi_4[6]とを、エッジ方向の組み合わせiに対応づけて、分類する
。iは、エッジ方向の組み合わせに割り当てられる番号である。iは、1から25までのいずれかの値をとる。復号画素Reconi_4[6]は、エッジ方向の組み合わせがiである4×
4のブロックの復号画素の平均値である。[6]は、補正対象画素及び補正対象画素の周辺
画素の数である。原画素Orgi_4[6]は、エッジ方向の組み合わせがiである4×4のブロ
ックの原画素の平均値である。
復号画素Reconi_4[6]は、次のように表される。
Figure 2014146988
reconi,k_4[6]は、エッジ方向の組み合わせがiの補正対象画素のうち、k番目の補正
対象画素の復号画素の画素値である。Niは、エッジ方向の組み合わせがiである補正対象画素の数である。A0i, A1i, A2i, A3i, A4i, A5iは、それぞれ、図24のa0、a1、a2、a3、a4、a5の位置の復号画素の平均値である。a0i,k, a1i,k, a2i,k, a3i,k, a4i,k, a5i,kは、それぞれ、k番目の補正対象画素の図24のa0、a1、a2、a3、a4、a5の位置の復号画素の画素値である。
原画素Orgi_4[6]も、復号画素Reconi_4[6]と同様に表わされる。
フィルタ係数分類部330は、復号画素Reconi_4[6]及び原画素Orgi_4[6]を用いて、上記の実施形態と同様に、エッジ方向の組み合わせ(及びブロックサイズ)毎に、フィルタ係数を算出する。
(フィルタ係数の選択方法)
フィルタ係数の選択方法について説明する。
フィルタ係数選択部340は、符号化対象ブロックの周辺の各補正対象画素に対して、上記と同様にして、エッジ方向の組み合わせを求める。
フィルタ係数選択部340は、算出した補正対象画素のエッジ方向の組み合わせ(及び符号化対象ブロックのブロックサイズ)に基づいて、補正対象画素毎に、フィルタ係数を
抽出する。原画像補正部342は、周辺ブロックの補正対象画素に、抽出したフィルタ係数を用いてフィルタ処理することで、参照画素を生成する。
(変形例2の作用、効果)
動画像符号化装置300は、補正対象画素のエッジ方向の組み合わせ毎に、フィルタ係数を算出する。補正対象画素のエッジ方向の組み合わせに応じて、フィルタ係数を変更することで、より精度の高い符号化が可能となる。
〈変形例3〉
次に変形例3について説明する。変形例3は、上記の実施形態との共通点を有する。従って、主として相違点について説明し、共通点については、説明を省略する。
上記の実施形態の動画像符号化装置100では、フィルタ係数を求める際の分類項目として、イントラ予測モード(予測方向)が使用された。上記の実施形態において、予測方向を35種類として分類したが、変形例3では予測方向では分類しない。即ち、変形例3では、上記の実施形態において、予測方向を1つとする。このとき、変形例3では、符号化対象ブロックの周辺ブロックのブロックサイズがフィルタ係数を求める際の分類項目となる。
変形例3では、参照画素が符号化対象ブロックの上にある場合と左にある場合とで、場合分けをしなくてもよい。
(変形例3の作用、効果)
参照画素を含む周辺ブロックのブロックサイズが大きい場合、当該周辺ブロックの画像が平坦でモード判定用参照画素の高周波成分が少ないと考えられる。また、参照画素を含む周辺ブロックのブロックサイズが小さい場合、当該周辺ブロックの画像が複雑でモード判定用参照画素の高周波成分が多いと考えられる。そこで、参照画素を含む周辺ブロックのブロックサイズに応じて、フィルタ係数を変更することで、より精度の高い符号化が可能となる。
〔その他〕
以上の実施形態、各変形例は、可能な限りこれらが組み合わされて実施され得る。
100 動画像符号化装置
102 イントラ予測画像生成部
104 差分画像生成部
106 直交変換量子化部
108 Entropy符号化部
110 逆量子化逆直交変換部
112 復号画像生成部
114 復号画像メモリ
116 復号画像周辺情報格納部
118 原画像メモリ
120 符号化対象ブロック周辺情報読出部
130 フィルタ係数分類部
140 フィルタ係数選択部
142 原画像補正部
144 参照画像生成部
146 イントラ予測モード判定部
200 動画像符号化装置
300 動画像符号化装置

Claims (5)

  1. 1フレーム毎に入力される原画像を、イントラ予測を用いて、前記原画像のブロック単位に符号化を行う動画像符号化装置であって、
    前記原画像の符号化対象のブロックである符号化対象ブロックを含む画像の1フレーム前の画像の復号画像を格納する復号画像メモリと、
    前記復号画像に対応する原画像を格納する原画像メモリと、
    前記復号画像のブロック毎のイントラ予測モードを格納する復号画像周辺情報格納部と、
    前記復号画像のイントラ予測モード毎に、前記復号画像と前記原画像とからフィルタ係数を算出するフィルタ係数分類部と、
    前記符号化対象ブロックの周辺ブロックのイントラ予測モードを読み出す符号化対象ブロック周辺情報読出部と、
    前記周辺ブロックのイントラ予測モードに基づいて、前記周辺ブロック毎に、フィルタ係数を選択するフィルタ係数選択部と、
    前記フィルタ係数選択部によって選択されたフィルタ係数を用いて、前記周辺ブロックのイントラ予測モード判定用参照画素にフィルタ処理をし、前記周辺ブロックのイントラ予測モード判定用参照画素の復号画像としての画素値を算出する原画像補正部と、
    前記原画像補正部から得られた復号画像としての画素値からイントラ予測モード判定用参照画像を生成する参照画像生成部と、
    参照画像生成部が生成した前記参照画像を用いて、前記符号化対象ブロックのイントラ予測モードを選択するイントラ予測モード判定部と、
    前記イントラ予測モード判定部で選択されたイントラ予測モードを使用して符号化対象ブロックのイントラ予測画像を生成するイントラ予測画像生成部、
    を有する動画像符号化装置。
  2. 前記復号画像周辺情報格納部は、前記復号画像のブロック毎のイントラ予測方向を格納し、
    前記フィルタ係数分類部は、イントラ予測方向毎に、前記復号画像と前記原画像とからフィルタ係数を算出し、
    前記符号化対象ブロック周辺情報読出部は、前記符号化対象ブロックの周辺ブロックのイントラ予測方向を読み出し、
    前記フィルタ係数選択部は、前記周辺ブロックのイントラ予測方向に基づいて、前記周辺ブロック毎に、フィルタ係数を選択する
    請求項1に記載の動画像符号化装置。
  3. 前記復号画像周辺情報格納部は、前記復号画像のブロック毎に当該ブロックのイントラ予測モード判定用参照画素の分散値を格納し、
    前記フィルタ係数分類部は、イントラ予測モード判定用参照画素の分散値を複数の所定の閾値を境界とする複数のグループに分類し、前記グループ毎に、前記復号画像と前記原画像とからフィルタ係数を算出し、
    前記符号化対象ブロック周辺情報読出部は、前記符号化対象ブロックの周辺ブロックのイントラ予測モード判定用参照画素の分散値を読み出し、
    前記フィルタ係数選択部は、前記周辺ブロックのイントラ予測モード判定用参照画素の分散値に基づいて、前記周辺ブロック毎に、フィルタ係数を選択する
    請求項1に記載の動画像符号化装置。
  4. 前記復号画像周辺情報格納部は、前記復号画像のブロック毎に当該ブロックのイントラ予測モード判定用参照画素のエッジ方向を格納し、
    前記フィルタ係数分類部は、イントラ予測モード判定用参照画素のエッジ方向毎に、前
    記復号画像と前記原画像とからフィルタ係数を算出する、
    前記符号化対象ブロック周辺情報読出部は、前記符号化対象ブロックの周辺ブロックのイントラ予測モード判定用参照画素のエッジ方向を読み出し、
    前記フィルタ係数選択部は、前記周辺ブロックのイントラ予測モード判定用参照画素のエッジ方向に基づいて、前記周辺ブロックのイントラ予測モード判定用参照画素毎に、フィルタ係数を選択する
    請求項1に記載の動画像符号化装置。
  5. 前記復号画像周辺情報格納部は、前記復号画像のブロック毎に当該ブロックのブロックサイズを格納し、
    前記フィルタ係数分類部は、前記ブロックのブロックサイズ毎に、前記復号画像と前記原画像とからフィルタ係数を算出する、
    前記符号化対象ブロック周辺情報読出部は、前記符号化対象ブロックの周辺ブロックのブロックサイズを読み出し、
    前記フィルタ係数選択部は、前記周辺ブロックのブロックサイズに基づいて、前記周辺ブロック毎に、フィルタ係数を選択する、
    請求項1に記載の動画像符号化装置。
JP2013014721A 2013-01-29 2013-01-29 動画像符号化装置 Expired - Fee Related JP6065613B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013014721A JP6065613B2 (ja) 2013-01-29 2013-01-29 動画像符号化装置
US14/156,078 US9319688B2 (en) 2013-01-29 2014-01-15 Moving image encoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013014721A JP6065613B2 (ja) 2013-01-29 2013-01-29 動画像符号化装置

Publications (2)

Publication Number Publication Date
JP2014146988A true JP2014146988A (ja) 2014-08-14
JP6065613B2 JP6065613B2 (ja) 2017-01-25

Family

ID=51222918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013014721A Expired - Fee Related JP6065613B2 (ja) 2013-01-29 2013-01-29 動画像符号化装置

Country Status (2)

Country Link
US (1) US9319688B2 (ja)
JP (1) JP6065613B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016182266A1 (ko) * 2015-05-12 2016-11-17 삼성전자 주식회사 영상의 부호화, 복호화 방법 및 장치
WO2017082670A1 (ko) * 2015-11-12 2017-05-18 엘지전자 주식회사 영상 코딩 시스템에서 계수 유도 인트라 예측 방법 및 장치
CN107896330B (zh) * 2017-11-29 2019-08-13 北京大学深圳研究生院 一种用于帧内和帧间预测的滤波方法
KR102358760B1 (ko) * 2017-11-30 2022-02-08 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
CN111083474A (zh) * 2019-12-03 2020-04-28 咪咕文化科技有限公司 帧间预测的滤波方法、电子设备及计算机可读存储介质
US11856204B2 (en) * 2020-05-04 2023-12-26 Ssimwave Inc. Macroblocking artifact detection

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11196419A (ja) * 1997-12-26 1999-07-21 Sony Corp 画像信号処理装置及び画像信号処理方法
JP2006060335A (ja) * 2004-08-18 2006-03-02 Sharp Corp 画像処理装置
JP2006304102A (ja) * 2005-04-22 2006-11-02 Renesas Technology Corp 画像符号化ユニットと画像符号化方法
JP2007150913A (ja) * 2005-11-29 2007-06-14 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2009290498A (ja) * 2008-05-29 2009-12-10 Renesas Technology Corp 画像符号化装置及び画像符号化方法
JP2013005272A (ja) * 2011-06-17 2013-01-07 Jvc Kenwood Corp 画像復号装置、画像復号方法及び画像復号プログラム
JP2013009418A (ja) * 2009-07-01 2013-01-10 Sony Corp 画像処理装置および方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1871117B1 (en) * 2005-04-01 2011-03-09 Panasonic Corporation Image decoding apparatus and image decoding method
US8189934B2 (en) 2006-03-27 2012-05-29 Panasonic Corporation Image coding apparatus and image decoding apparatus
AU2007330109A1 (en) 2006-11-30 2008-06-12 Ntt Docomo, Inc. Dynamic image encoding device, dynamic image encoding method, dynamic image encoding program, dynamic image decoding device, dynamic image decoding method, and dynamic image decoding program
EP2048886A1 (en) * 2007-10-11 2009-04-15 Panasonic Corporation Coding of adaptive interpolation filter coefficients
JP2010183162A (ja) 2009-02-03 2010-08-19 Mitsubishi Electric Corp 動画像符号化装置
US9113169B2 (en) * 2009-05-07 2015-08-18 Qualcomm Incorporated Video encoding with temporally constrained spatial dependency for localized decoding
JP5597968B2 (ja) * 2009-07-01 2014-10-01 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
JP5604825B2 (ja) * 2009-08-19 2014-10-15 ソニー株式会社 画像処理装置および方法
JP5464435B2 (ja) * 2010-04-09 2014-04-09 ソニー株式会社 画像復号装置および方法
MX338055B (es) * 2012-01-19 2016-04-01 Vid Scale Inc Metodo y aparato para señalizacion y construccion de listas de imagenes de referencia de codificacion de video.

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11196419A (ja) * 1997-12-26 1999-07-21 Sony Corp 画像信号処理装置及び画像信号処理方法
JP2006060335A (ja) * 2004-08-18 2006-03-02 Sharp Corp 画像処理装置
JP2006304102A (ja) * 2005-04-22 2006-11-02 Renesas Technology Corp 画像符号化ユニットと画像符号化方法
JP2007150913A (ja) * 2005-11-29 2007-06-14 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2009290498A (ja) * 2008-05-29 2009-12-10 Renesas Technology Corp 画像符号化装置及び画像符号化方法
JP2013009418A (ja) * 2009-07-01 2013-01-10 Sony Corp 画像処理装置および方法
JP2013005272A (ja) * 2011-06-17 2013-01-07 Jvc Kenwood Corp 画像復号装置、画像復号方法及び画像復号プログラム

Also Published As

Publication number Publication date
US20140211845A1 (en) 2014-07-31
US9319688B2 (en) 2016-04-19
JP6065613B2 (ja) 2017-01-25

Similar Documents

Publication Publication Date Title
CN111066326B (zh) 机器学习视频处理系统和方法
CN110024392B (zh) 用于视频译码的低复杂度符号预测
JP5957561B2 (ja) 大きいサイズの変換単位を用いた映像符号化、復号化方法及び装置
US11438591B2 (en) Video coding method and apparatus
RU2514777C1 (ru) Способ и устройство для кодирования и декодирования изображения с использованием крупной единицы преобразования
JP6065613B2 (ja) 動画像符号化装置
CN103947206B (zh) 基于区域的图像压缩的方法和装置
JP2010171729A (ja) 画像予測符号化装置、方法及びプログラム、画像予測復号装置、方法及びプログラム、並びに、符号化・復号システム及び方法
TWI833073B (zh) 使用內預測之寫碼技術
RU2518932C2 (ru) Уменьшенное рассогласование коэффициентов усиления постоянной состовляющей (dc) и dc-утечки при обработке преобразования с перекрытием
KR20210024624A (ko) 이미지 인코딩 방법, 디코딩방법, 인코더 및 디코더
CN108353175A (zh) 使用系数引起的预测处理视频信号的方法和装置
JP2023543985A (ja) 多用途ビデオコーディングのためのテンプレートマッチング予測
CN105745929B (zh) 加速逆变换的方法和装置以及解码视频流的方法和装置
JP6289055B2 (ja) 動画像符号化装置及び動画像復号装置
JP2015076765A (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム
JP6557483B2 (ja) 符号化装置、符号化システム、及びプログラム
JP2010010768A (ja) 画像符号化装置及び画像符号化方法
JP2014112748A (ja) 画像符号化装置および画像復号装置
CN105049846A (zh) 图像和视频编解码的方法和设备
JP2024510433A (ja) ビデオ圧縮のための時間的構造ベースの条件付き畳み込みニューラルネットワーク
JP6311141B2 (ja) フィルタ選択装置、フィルタ装置およびこれらのプログラム
JP5181059B2 (ja) 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法
CN116934647A (zh) 基于空间角度可变形卷积网络的压缩光场质量增强方法
JP5846838B2 (ja) 動画像符号化方法,動画像符号化装置,動画像復号方法,動画像復号装置およびそれらのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160524

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161212

R150 Certificate of patent or registration of utility model

Ref document number: 6065613

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees