JP5222870B2 - イントラ予測装置、符号化器、復号器及びプログラム - Google Patents

イントラ予測装置、符号化器、復号器及びプログラム Download PDF

Info

Publication number
JP5222870B2
JP5222870B2 JP2010049704A JP2010049704A JP5222870B2 JP 5222870 B2 JP5222870 B2 JP 5222870B2 JP 2010049704 A JP2010049704 A JP 2010049704A JP 2010049704 A JP2010049704 A JP 2010049704A JP 5222870 B2 JP5222870 B2 JP 5222870B2
Authority
JP
Japan
Prior art keywords
prediction
unit
pixel value
intra prediction
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010049704A
Other languages
English (en)
Other versions
JP2011188129A (ja
Inventor
和久 井口
慎一 境田
善明 鹿喰
敦郎 市ヶ谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2010049704A priority Critical patent/JP5222870B2/ja
Publication of JP2011188129A publication Critical patent/JP2011188129A/ja
Application granted granted Critical
Publication of JP5222870B2 publication Critical patent/JP5222870B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、曲面を用いてイントラ予測を行うイントラ予測装置、符号化器、復号器及びプログラムに関する。
MPEG−4 AVC/H.264方式では、インター予測(画面間予測)を用いずに符号化される画素ブロックに対して、符号化済み隣接ブロックの画素値から予測画像を生成し、その予測画像との差分を符号化するイントラ予測符号化(画面内予測符号化)が採用されている。
図14に、従来のMPEG−4 AVC/H.264方式における符号化器4のブロック図を示す。符号化器4は、並べ替え部21と、減算部22と、直交変換部23と、量子化部24と、可変長符号化部25と、逆量子化部26と、逆直交変換部27と、切替えスイッチ28と、イントラ予測部29と、フレームメモリ30と、動き補償予測部31と、加算部32とを備える。
並べ替え部21は、入力された映像信号を一時的に蓄積し、フレーム画像の順番を並べ替え、符号化処理に必要なフレーム画像を減算部22及び動き補償予測部31に出力する。
動き補償予測部31は、並べ替え部21から供給される入力画像に対して、フレームメモリ30から取得する参照画像を用いて動きベクトル検出を行い、得られた動きベクトルを用いて動き補償を行い、その結果得られた予測画像を、切替えスイッチ28を介して減算部22及び加算部32に出力する。動きベクトルの情報は、可変長符号化部25に出力する。
減算部22は、並べ替え部21からの入力画像と、動き補償予測部31又はイントラ予測部29からの予測画像との差分画像を生成して直交変換部23に出力する。
直交変換部23は、減算部22から供給される差分画像に対して小領域の画素ブロックごとに直交変換(例えば、DCT;Discrete Cosine Transform)を施し、直交変換係数を量子化部24に出力する。
量子化部24は、直交変換部23から入力される直交変換係数に対して量子化テーブルを選択して量子化処理を行い、可変長符号化部25及び逆量子化部26に出力する。
可変長符号化部25は、量子化部24から入力される量子化された直交変換係数についてスキャンを行って可変長符号化処理を施しビットストリームを生成するとともに、動き補償予測部31から入力される動きベクトルの情報も可変長符号化を施して出力する。
逆量子化部26は、量子化部24から入力される量子化された直交変換係数について逆量子化処理を行って逆直交変換部27に出力する。
逆直交変換部27は、逆量子化部26から入力される直交変換係数に対して逆直交変換(例えば、IDCT;Inverse Discrete Cosine Transform)を施し、加算部32に出力する。
加算部32は、逆直交変換部27から得られる逆直交変換した画像と、動き補償予測部31又はイントラ予測部29から得られる予測画像とを加算処理して復号画像を生成し、イントラ予測部29及びフレームメモリ30に出力する。
切替えスイッチ28は、動き補償予測とイントラ予測とを切替える。
イントラ予測部29は、既符号化ブロックを復号した画像(加算部32の出力画像)からイントラ予測した予測画像を生成して減算部22及び加算部32に出力する。ここで、減算部22では、この予測画像と原画像との差分画像を直交変換部23に出力し、量子化部24及び可変長符号化部25を経て符号化する。
イントラ予測は、4画素×4ライン単位、8画素×8ライン単位、又は16画素×16ライン単位で行われ、複数種類の予測モード(予測方向)(例えば、4画素×4ライン単位の予測については9種類)の中から最適な予測方向を選択する。図15は、4画素×4ライン単位で予測する場合の予測モードを示す図である。図中の斜線付の丸は復号済みの画素を示し、白丸は予測対象の画素を示し、矢印は予測方向を示している。(a)の予測モード0では垂直方向予測、(b)の予測モード1では水平方向予測、(c)の予測モード2ではDC予測、(d)の予測モード3では対角左下方向予測、(e)の予測モード4では対角右下方向予測、(f)の予測モード5では垂直右方向予測、(g)の予測モード6では水平下方向予測、(h)の予測モード7では垂直左方向予測、(i)の予測モード8では水平上方向予測を行う。以上が、MPEG−4 AVC/H.264方式におけるイントラ予測の技法である。
また、イントラ予測の精度を上げるために、空間的に離れた画素を参照するのではなく、常に隣接する画素を参照して隣接画素間の差分値を符号化する技法や(例えば、特許文献1参照)、予測ブロックに隣接する画素の値と該ブロックから1画素以上間をおいた画素の値とに基づいてイントラ予測を行う技法が知られている(例えば、特許文献2参照)。また、画素値が一定の変化傾向を持つ絵柄の映像に対する予測性能を向上させるために、イントラ符号化における予測値として、隣接する復号画像の周波数特性を考慮した値を生成する技法が知られている(例えば、特許文献3参照)。更に、動き補償予測でイントラ予測を行い、動きベクトルは伝送せずに、復号器側でも動きベクトル検出を行う技法が知られている(例えば、特許文献4参照)。
特開2009―049969号公報 特開2008−271371号公報 特開2008−245088号公報 特開2007−043651号公報
しかし、従来の方向性を持ったイントラ予測方法は、あらかじめ定められたパターンの中から選択していたため、対象とする画像によっては適切なイントラ予測方向が選択できないという問題があった。また、イントラ予測の方向を伝送する必要があるため、伝送情報量が増大するという問題があった。更に、動き補償予測によりイントラ予測を行うと、復号器に膨大な演算を必要とするという問題があった。
本発明の目的は、上記問題を解決するため、イントラ予測の方向をあらかじめ定められたパターンに限定せず、任意の方向のイントラ予測を可能とし、イントラ予測の方向を伝送しないことでビットレートを削減し、更に、膨大な演算を必要としないイントラ予測装置、符号化器、復号器及びプログラムを提供することにある。
上記課題を解決するため、本発明は、イントラ予測を行うブロックの画素値を曲面で表現する。この曲面を復号済みの画素から求める。
すなわち、本発明に係るイントラ予測装置は、予測の対象である予測ブロックに隣接する復号済みの参照ブロックの画像から、該予測ブロックの画像を予測画像として生成するイントラ予測装置であって、参照ブロックに含まれる画素を選定し、該画素の画素値を近似する予測画素値曲面を生成する予測画素値曲面生成手段と、前記予測画素値曲面に基づいて予測ブロックの予測画像を生成する無方向予測手段とを備え、前記予測画素値曲面生成手段は、前記参照ブロックの画素値との差を示す指標が最小となる曲面を前記予測画素値曲面とし、該予測画素値曲面の係数を求める係数最適化手段を有するとともに、前記係数最適化手段は、前記差を示す指標を求める際に、参照ブロック内の画素と予測ブロックとの距離に応じて重み付けすることを特徴とする。
また、本発明に係るイントラ予測装置において、前記係数最適化手段は、前記差を示す指標を、前記予測画素値曲面の値と前記参照ブロックの画素値との差の二乗和を最小とすることを特徴とする。
また、本発明に係るイントラ予測装置において、前記重みは、前記参照ブロック内の画素と予測ブロックとの距離が大きくなるほど、小さな値とすることを特徴とする。
更に、本発明に係る符号化器は、上述したイントラ予測装置を備えることを特徴とする。
更に、本発明に係る復号器は、上述したイントラ予測装置を備えることを特徴とする。
更に、本発明はコンピュータを上記復号器として機能させるためのプログラムとしても特徴付けられる。
本発明によれば、イントラ予測の方向が限定されないため、様々な画像に対して適したイントラ予測が可能となる。また、予測画素値を計算により求めるため、イントラ予測の方向を伝送しなくて済むようになる。また、少ない演算量で予測画素値を求めることができる。
本発明によるイントラ予測を行う画像ブロックを例示する図である。 本発明による予測画素値曲面を例示する図である。 本発明による実施例1のイントラ予測装置の構成図である。 本発明による実施例1のイントラ予測装置の構成図である。 本発明による予測画素値曲面を求める際に参照する画像ブロックを例示する図である。 本発明による実施例1のイントラ予測装置の動作を示すフローチャートである。 本発明による実施例1のイントラ予測装置を備える符号化器の構成図である。 本発明による実施例1のイントラ予測装置を備える復号器の構成図である。 本発明による実施例2のイントラ予測装置の構成図である。 本発明による実施例2のイントラ予測装置の第1の変形例の構成図である。 本発明による実施例2のイントラ予測装置の第2の変形例の構成図である。 本発明による実施例2のイントラ予測装置の動作を示すフローチャートである。 本発明による実施例3のイントラ予測装置の構成図である。 従来のMPEG−4 AVC/H.264方式における符号化器のブロック図を示す図である。 従来のMPEG−4 AVC/H.264方式における4画素×4ライン単位で予測する場合の予測モードを示す図である。
本発明による実施例1のイントラ予測装置について、図面を参照して説明する。
図1は、本発明によるイントラ予測を行う画像ブロックを例示する図である。画像ブロックMは、イントラ予測の対象となる画像ブロック(以下、「予測ブロック」という)である。画像ブロックA,B,C,Dは、符号化された後に復号された画像ブロックであり、予測ブロックの画素値を予測するために参照される画像ブロック(以下、「参照ブロック」という)である。各画像ブロックのサイズは、例えば、4画素×4ライン単位、8画素×8ライン単位、又は16画素×16ラインとする。
図2は、本発明による実施例1の予測画素値曲面を示す図である。X軸とY軸は画素の原点からの距離を示し、Z軸は画素値(例えば、8ビットの場合は0〜255の値)を示す。予測画素値曲面Wは、参照ブロックの画素値を近似する曲面である。予測画素値曲面W上の曲面wは予測ブロックMの予測画素値からなる曲面である。予測画素値曲面Wにより、座標(x,y)の位置にある予測ブロックの画素値を予測することができる。本発明では、従来の技法のように予測方向を選択してイントラ予測を行うのではなく、予測画素値曲面Wを用いてイントラ予測を行う。予測画素値曲面Wは、参照ブロックの画素値との差を示す指標が小さくなるように生成される。ここで、差を示す指標とは、分散、差の絶対値和、差の絶対値の最小値、差の二乗和、又は差の絶対値の積や、更にこれらの画素あたりの平均値など、種々の方法によって定まる差の値の総称である。また、以下の説明における「差」という用語は、差の指標を意味するものとする。なお、予測画素値曲面Wは、平面である場合も含むものとする。
以下の説明では、予測画素値曲面Wの一例として、z=ax+by+cで表される平面を用いる。予測画素値曲面W=ax+by+cの各係数a,b,cは、参照ブロックA〜Dに含まれる全画素又は一部の画素を選定し、該画素を用いて推定(導出)する。この推定には、例えば、最小二乗法、線型計画法、ニューラルネットワークを用いた学習法等の最適化手段を利用することができる。以下に、最小二乗法により係数を導出する例を示す。
参照ブロックA〜Dに含まれる画素の座標(x,y)における画素値をzとする。ここで、i=1〜Nであり、Nは参照ブロックのうち、A〜Dに含まれる全画素数である。zが予測画素値曲面W=ax+by+cに対して誤差pを含むとすると、p=z−(ax+by+c)と表される。このとき、誤差の二乗和を最小化する係数a,b,cの値を導出することで、予測画素値曲面Wが求まる。誤差の二乗和は式(1)で表される。
Figure 0005222870
式(1)は、係数a,b,cの二次式なので、係数a,b,cそれぞれで偏微分した結果を0とする式(2)の連立一次方程式を解けば、誤差の二乗和を最小とする係数a,b,cが求まる。
Figure 0005222870
このようにして求めた係数a,b,cを代入した予測画素値曲面Wにより、予測ブロックM内の各画素位置における予測画素値を求め、四捨五入等の整数化処理、及び画素値のクリップ(例えば、対象とする画素が8ビットの場合は画素値を0〜255の値に制限すること)を行い、予測ブロックMのイントラ予測値とする。
図3は、本発明による実施例1のイントラ予測装置1の構成図である。実施例1のイントラ予測装置1は、参照画素値積算部12と、係数最適化部13と、無方向予測部14とを備える。
参照画素値積算部12は、入力される参照ブロックA〜Dの復号画像のうち、予測画素値曲面Wを生成するために必要となる画素を選定し、式(2)における積算処理、すなわち、ΣzやΣzなどの計算を行い、積算値を係数最適化部13に出力する。
係数最適化部13は、参照画素値積算部12から入力される積算値を用いて式(2)を解き、係数a,b,cを導出し、無方向予測部14に出力する。
無方向予測部14は、係数最適化部13から入力される係数を用いて予測画素値曲面W=ax+by+cを規定し、これに予測ブロックMの画素の座標(x,y)を代入して予測画素値zの値を求める。その後、整数化やクリップなどの処理を行い、処理後の予測画像を出力する。
なお、予測ブロックの位置によっては、予測画素値曲面Wが求まらない場合がある。例えば、参照画素数が3未満の場合や、参照画素が同一直線上に存在する場合では、予測画素値曲面W=ax+by+cを決定することができない。そのような場合は、あらかじめ定めておいた曲面を利用して予測画素値を求めたり、あらかじめ定めておいた値を予測画素値とするなど、あらかじめ動作を規定しておけばよい。
また、イントラ予測装置1は、更にノイズ低減手段を設けることも可能である。ノイズ低減手段としては、例えば、LPF(Low Pass Filter)やメディアンフィルタを用いることができる。図4は、ノイズ低減手段としてLPF11を備えるイントラ予測装置1の構成図である。LPF11は、入力される参照ブロックの復号画像をフィルタ処理して高周波成分(ノイズ)を除去し、参照画素値積算部12に出力する。LPF11を備えることで、参照ブロックの復号画像を平滑化してノイズの影響を減らせるので、予測画素値曲面Wをより適した曲面とすることができる。
予測画素値曲面Wは局所的には原画素値に適合するが、広い範囲では原画素値との誤差が大きくなると考えられる。つまり、参照する画素が予測ブロックMから離れるほど、予測画素値曲面との誤差が大きくなることが予想される。そこで、予測の際に、参照ブロックA〜Dに含まれる画素と、予測ブロックMとの距離に応じた重みkを誤差に導入して、重み付き誤差p´=k{z−(ax+by+c)}とし、重み付き誤差p´の二乗和を最小化する係数a,b,cの値を導出することで予測画素値曲面Wを求めてもよい。この場合、重みkは、予測ブロックMとの距離が大きいほど小さな値とする。
なお、上記説明では、参照ブロックA〜Dに含まれる全画素を用いて予測画素値曲面Wを求めたが、復号済みの画像であれば、参照する画素は参照ブロックA〜Dの画像には限定されない。例えば、参照ブロックA〜D以外の画素をさらに参照することや、参照ブロックA〜Dのうちの1つのブロックのみ、あるいは2つ又は3つのブロックのみを参照することも可能である。また、図5(a)〜(d)の斜線部で示すように、参照ブロックA〜Dのうちの一部の画素のみを参照することも可能である。一部の画素のみを参照する場合には、予測ブロックMより少ない画素数であっても良いし、従来のMPEG−4 AVC/H.264方式のイントラ予測と同じ参照画素でも良い。なお、図5(b)〜(d)に示すように、参照ブロックの左側と上側で参照する画素数は非対称であっても良い。さらに、予測ブロックを更に複数の小ブロックに区切り、小ブロック単位で符号化を行うことも考えられる。例えば、図5(e)に示すように、予測ブロックM内の小ブロックEが既に復号済みである場合には、予測ブロックM中の小ブロックE以外の領域を予測する際に、小ブロックEの画素値を参照することもできる。このように、予測画素値曲面Wを求める際に参照する画素は、復号済みの画素であれば、その位置や画素数にはさまざまな組合せが可能である。本明細書では説明を容易にするため、参照ブロックA〜Dを参照画素の例として用いる。
次に、実施例1のイントラ予測装置1の動作について、図6を参照して説明する。
[実施例1のイントラ予測装置1の動作]
図6は、実施例1のイントラ予測装置1の動作を示すフローチャートである。まず、ステップS101にて、LPF11により、参照ブロックの復号画像をフィルタ処理する。なお、ステップS101は高周波成分(ノイズ)を多く含む画像に対して本発明のイントラ予測性能をより向上する効果があるが、必須のステップではない。
ステップS102にて、参照画素値積算部12及び係数最適化部13により、参照ブロックを用いて予測画素値曲面Wの係数を導出する。なお、予測画素値曲面Wをどのような曲面又は平面とするかにより、係数を導出するための計算式は異なる。
ステップS103にて、無方向予測部14により、予測ブロックMの予測画像を生成する。
次に、本発明による符号化器及び復号器について、図7及び図8を参照して説明する。
[符号化器及び復号器]
図7は、本発明による実施例1のイントラ予測装置1を備える符号化器の構成図である。符号器2は、従来のMPEG−4 AVC/H.264方式の符号器(図14参照)におけるイントラ予測部に代えて、本発明による実施例1のイントラ予測装置1を備える。イントラ予測装置1は、逆量子化部26及び逆直交変換部27を経て既符号化ブロックを復号した画像を入力し、上述したようにLPF11、参照画素値積算部12、係数最適化部13、無方向予測部14を経て生成した予測画像を、切替えスイッチ28を介して減算部22及び加算部32に出力する。なお、前記のようにLPF11は必須ではない。
図8は、本発明による実施例1のイントラ予測装置1を備える復号器の構成図である。復号器3は、可変長復号部41と、逆量子化部42と、逆直交変換部43と、加算部44と、イントラ予測装置1と、フレームメモリ45と、動き補償予測部46と、切替えスイッチ47と、並べ替え部48とを備える。復号器3は、従来のMPEG−4 AVC/H.264方式の復号器のイントラ予測部に代えて、本発明によるイントラ予測装置1を備える。
可変長復号部41は、フレーム間予測で符号化されたビットストリームを入力して、可変長復号処理を施し逆量子化部42に出力するとともに、動きベクトルの情報を復号して動き補償予測部46に出力する。
逆量子化部42は、可変長復号部41から入力される量子化された直交変換係数に対して逆量子化処理を施して、動き補償した差分画像の直交変換係数を取得し、逆直交変換部43に出力する。
逆直交変換部43は、逆量子化部42から入力される差分画像の直交変換係数に対して、逆直交変換(例えば、IDCT)を施し、得られる当該差分画像を加算部44に出力する。
加算部44は、逆直交変換部43から得られる当該差分画像と、動き補償予測部46から入力される予測画像又はイントラ予測装置1から入力される予測画像とを加算して画像を復元し、並べ替え部48、イントラ予測装置1、及びフレームメモリ45に出力する。
動き補償予測部46は、フレームメモリ45から得られる参照画像と可変長復号部41から得られる動きベクトルとを用いて予測画像を生成し、切替えスイッチ47を介して加算部44に出力する。
並べ替え部48は、加算部44から入力される復元された復号画像の各フレームを表示フレーム順に並べ替えて出力する。
イントラ予測装置1は、逆量子化部42及び逆直交変換部43を経て復号した画像を入力し、上述したようにLPF11、参照画素値積算部12、係数最適化部13、無方向予測部14を経て生成した予測画像を切替えスイッチ47を介して加算部44に出力する。なお、式(2)におけるx,yは既知の座標なので、ΣxやΣyなどの計算は復号時に参照画素値積算部12で行う必要はなく、復号器3にあらかじめ設定しておくことができる。したがって、復号器で本発明によるイントラ予測装置1を用いる場合、予測画素値曲面Wは非常に少ない演算量で求めることが可能である。なお、前記のようにLPF11は必須ではない。
なお、図7に示した本発明による符号化器のイントラ予測装置1及び図8に示した復号器の本発明による符号化器のイントラ予測装置1を、後述する実施例2又は3のイントラ予測装置1に置き換えることができることは勿論である。
次に、本発明による実施例2のイントラ予測装置について、図面を参照して説明する。なお、実施例1と同様な構成要素には同一の参照番号を付して説明を省略する。
エッジを含む画像のような変化が急峻な画像などでは、予測画素値曲面Wと、参照ブロックA〜D内の画素との誤差又は重み付き誤差が大きくなり、予測画素値曲面Wを用いたイントラ予測値は適切でない可能性がある。そのため、実施例2のイントラ予測装置1は、予測画素値曲面Wを用いたイントラ予測値が適切でない場合には、従来(例えば、MPEG−4 AVC/H.264方式)の予測方法により、参照ブロックの画素値を用いたイントラ予測値に切替える。この場合、符号化器と復号器の双方で同じ誤差又は重み付き誤差を計算可能なため、本発明によるイントラ予測値と従来のイントラ予測値とを切替えるためのフラグを復号器に対して送信する必要がない。
図9は、本発明による実施例2のイントラ予測装置1の構成図である。実施例2のイントラ予測装置1は、LPF11と、参照画素値積算部12と、係数最適化部13と、無方向予測部14と、画面内予測部15と、判定部16と、切替え部17とを備える。実施例2のイントラ予測装置1は、実施例1のイントラ予測装置1(図4参照)と比較して、更に、画面内予測部15と、判定部16と、切替え部17とを備える点で相違する。
画面内予測部15は、復号画素値を入力し、予測画素値曲面Wを用いないで予測する方式(例えば、従来のMPEG−4 AVC/H.264方式)により、予測ブロックMの予測画像を求める。
判定部16は、予測画素値曲面Wを求める際に参照した画素の全部又は一部の画素と、該画素に対応する、無方向予測部14から入力される予測画素値曲面Wの値との差を求め、差が閾値を超えるか否かを判定する。一部の画素のみ利用する場合には、予測ブロックMに近い画素を利用するのが好適である。また、差を求める際に、予測ブロックMとの距離に応じた重み付けを行ってもよい。この場合、予測ブロックMとの距離が遠い画素ほど重みを小さくする(差に与える影響を小さくする)のが好適である。ここで求める「差」として、上述したように、差の二乗和などの様々な指標を用いることができる。また、係数最適化部13で予測画画素値曲面Wを求めるときに使用する指標と、判定部16で使用する指標とは同一の指標である必要はない。
切替え部17は、判定部16の判定結果により、差が閾値以下である場合には無方向予測部14で求めた予測画素値を出力し、閾値より大きい場合には画面内予測部15で求めた予測画素値を出力するように切替える。この閾値は、固定値でも良いし、可変値でも良い。可変値とする場合は、例えば予測ブロックの量子化特性値(量子化ステップ)など、符号化側と復号側で共通に得られる情報の関数として閾値を定義すると、閾値のための情報を復号側に送信する必要がないので好適である。
図10に、実施例2のイントラ予測装置1の第1の変形例を示す。この変形例では、判定部16に予測ブロックMの原画像及び無方向予測部14で求めた予測画像を入力し、原画像の画素値と予測画像の画素値との差が閾値より大きいか否かを判定し、閾値より大きい場合には、切替え部17により画面内予測部15で求めた予測画像を出力する。この場合は、判定部16は判定結果を示すフラグを復号器に送信する機能も有する。また、復号器の判定部16では差の計算は必要なく、受信した判定結果にしたがって切り替え部17を動作させる機能だけを有する。
図11に、実施例2のイントラ予測装置1の第2の変形例を示す。この変形例では、判定部16に予測ブロックMの原画像、無方向予測部14で求めた予測画像、及び画面内予測部15で求めた予測画像を入力し、無方向予測部14で求めた予測画像の画素値と画面内予測部15で求めた予測画像の画素値のどちらが原画像の画素値との差が小さいかを判定し、切替え部17により、原画像の画素値との差が小さいほうの予測画像を出力する。この場合も、判定部16は判定結果を示すフラグを復号器に送信する機能も有する。また、復号器の判定部16では差の計算は必要なく、受信した判定結果にしたがって切り替え部17を動作させる機能だけを有する。
次に、実施例2のイントラ予測装置1の動作について、図12を参照して説明する。
[実施例2のイントラ予測装置1の動作]
図12は、実施例2のイントラ予測装置1の動作を示すフローチャートである。実施例1のイントラ予測装置1の動作(図6参照)と同様に、ステップS201にて、LPF11により、復号画像をフィルタ処理し、ステップS202にて、参照画素値積算部12及び係数最適化部13により、参照ブロックを用いて予測画素値曲面Wの係数を導出し、ステップS203にて、無方向予測部14により、予測ブロックMの予測画像を生成する。なお、ステップS201は、高周波成分(ノイズ)を多く含む画像に対して、本発明のイントラ予測性能を向上する効果があるが、必須のステップではない。
ステップS204にて、判定部16により、ステップS203にて生成した予測画像の画素値と、参照ブロックA〜Dの画素値との差を求め、差が閾値を超えるか否かを判定する。
ステップS205にて、差が閾値以下であると判定した場合には処理をステップS206に進め、差が閾値よりも大きいと判定した場合には処理をステップS207に進める。
ステップS206にて、切替え部17により、ステップS203にて生成した予測画像を出力する。
ステップS207にて、切替え部17により、他方式(例えば、従来のMPEG−4 AVC/H.264方式)により生成した予測画像を出力する。なお、他方式による予測画像は、予測画素値曲面Wを用いた予測画像の生成と並行して、画面内予測部15により生成される。
実施例2のイントラ予測装置1によれば、予測画素値曲面Wを用いて生成した予測画像と、従来の方向を選択して生成した予測画像とを切替えることができるので、エッジを含むような画像に対しても適切な予測画像を生成することができるようになる。
次に、本発明による実施例3のイントラ予測装置について、図13を参照して説明する。なお、実施例1と同様な構成要素には同一の参照番号を付して説明を省略する。
実施例3のイントラ予測装置1は、参照する画素の位置をどこにするか、予測画素値曲面Wの式としてどのような式を用いるか、及び予測画素値曲面の最適化手段(最小二乗法、線型計画法、ニューラルネットワークを用いた学習法等)としていずれを採用するかについて、複数の処理モードを用意し、予測ブロックごとにどの処理モードを選択するかを切替えるようにする。図13は、本発明による実施例3のイントラ予測装置1を示す構成図である。ここでは、複数(n個)の実施例1のイントラ予測装置1と、処理モード判定部18とを備える例を示すが、イントラ予測装置1として、実施例2のイントラ予測装置1を備える構成とすることができることは勿論である。
LPF11及び無方向予測部14の構成は各処理モードで同一であるが、参照画素値積算部12及び/又は係数最適化部13の構成又は演算方法は処理モードごとに異なる。参照画素値積算部12の処理モードとしては、例えば、参照ブロックとしてA〜Dのすべてを用いるモード、Aだけを用いるモード、Bだけを用いるモード、Cだけを用いるモード、Dだけを用いるモード、A・B・Dだけを用いるモードなどが考えられる。さらに、参照画素は、必ずしも予測ブロックに隣接している必要はない。また、この実施例ではLPF11及び無方向予測部14の構成は各処理モードで同一としたが、フィルタの種類や有無、予測画素値曲面の式などは処理モード毎に異なるものとして良いことは勿論である。すなわち、各処理モード毎に、参照する画素の位置が符号化器と復号器で共通でありさえすれば良い。
処理モード判定部18は、複数の処理モードにより生成された予測画像の中から最適な予測画像を選択して出力する。例えば、符号化効率が最大となる予測画像、又は予測画素値曲面Wを求める際に参照した画素の全部又は一部の画素と、該画素に対応する、無方向予測部14から入力される予測画素値曲面Wの値との差が最小である予測画像、又は予測ブロックMの予測画像の画素値と予測ブロックMの原画像の画素値との差が最小である予測画像を選択する。
また、処理モード判定部18は、処理モード1〜nのうちのいずれの処理モードを選択したかを示すフラグを出力する。ただし、符号化器及び復号器に本実施例のイントラ予測装置1を用いた場合、符号化器と復号器との間で処理モードを決定する規則を定めておけば、フラグを伝送する必要はない。例えば、参照ブロックA〜Dの分散値が大きい場合には、分散値の影響の小さな最適化手段を用いる処理モードを選択するなど、処理モードを復号画像から推定することも可能である。また、予測画素値曲面Wの式や、参照画素の位置については、あらかじめ定めておいたものから選択する以外に、フレーム毎などのタイミングで別途伝送しても良い。処理モードを送信する符号化器に対応する復号器においては、処理モード判定部18は受信した前記フラグにもとづき、1〜nの処理モードを選択する機能を有する。
実施例3のイントラ予測装置1によれば、複数の処理モードの中から所望の予測画像を選択できるので、さまざまな画像に対して、画像ごとに最適な予測画像を生成することができるようになる。
ここで、イントラ予測装置1として機能させるために、コンピュータを好適に用いることができる。実施例1のイントラ予測装置1を機能させるコンピュータは、LPF11と、参照画素値積算部12と、係数最適化部13と、無方向予測部14とを機能させるための制御部を、CPU(中央演算処理装置)と記憶部とで実現でき、そのようなコンピュータに、CPUによって所定のプログラムを実行させることにより、LPF11と、参照画素値積算部12と、係数最適化部13と、無方向予測部14の有する機能を実現させることができる。
同様に実施例2のイントラ予測装置1として機能させるコンピュータは、LPF11と、参照画素値積算部12と、係数最適化部13と、無方向予測部14と、画面内予測部15と、判定部16と、切替え部17とを機能させるための制御部を、CPUと記憶部とで実現でき、そのようなコンピュータに、CPUによって所定のプログラムを実行させることにより、LPF11と、参照画素値積算部12と、係数最適化部13と、無方向予測部14と、画面内予測部15と、判定部16と、切替え部17の有する機能を実現させることができる。
同様に実施例3のイントラ予測装置1として機能させるコンピュータは、複数のLPF11、参照画素値積算部12、係数最適化部13、及び無方向予測部14と、処理モード判定部18とを機能させるための制御部を、CPUと記憶部とで実現でき、そのようなコンピュータに、CPUによって所定のプログラムを実行させることにより、複数のLPF11、参照画素値積算部12、係数最適化部13、及び無方向予測部14と、処理モード判定部18の有する機能を実現させることができる。
また、符号器2として機能させるために、コンピュータを好適に用いることができる。そのようなコンピュータは、イントラ予測装置1と、並べ替え部21と、減算部22と、直交変換部23と、量子化部24と、可変長符号化部25と、逆量子化部26と、逆直交変換部27と、切替えスイッチ28と、フレームメモリ30と、動き補償予測部31と、加算部32とを機能させるための制御部を、CPUと記憶部とで実現でき、そのようなコンピュータに、CPUによって所定のプログラムを実行させることにより、イントラ予測装置1と、並べ替え部21と、減算部22と、直交変換部23と、量子化部24と、可変長符号化部25と、逆量子化部26と、逆直交変換部27と、切替えスイッチ28と、フレームメモリ30と、動き補償予測部31と、加算部32の有する機能を実現させることができる。
さらに、復号器3として機能させるために、コンピュータを好適に用いることができる。そのようなコンピュータは、イントラ予測装置1と、可変長復号部41と、逆量子化部42と、逆直交変換部43と、加算部44と、フレームメモリ45と、動き補償予測部46と、切替えスイッチ47と、並べ替え部48とを機能させるための制御部を、CPUと記憶部とで実現でき、そのようなコンピュータに、CPUによって所定のプログラムを実行させることにより、イントラ予測装置1と、可変長復号部41と、逆量子化部42と、逆直交変換部43と、加算部44と、フレームメモリ45と、動き補償予測部46と、切替えスイッチ47と、並べ替え部48の有する機能を実現させることができる。
上述の実施例は、代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。従って、本発明は、上述の実施例によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、各画像ブロックのサイズ及び予測画素値曲面は、上述の値及び式に限定されるものではなく、本発明を適用する画像サイズ等に合わせて好適な値及び式を用いることができる。
このように、本発明によれば、様々な画像に対して適したイントラ予測が可能となるので、画像を符号化又は復号する任意の用途に有用である。
1 イントラ予測装置
11 LPF
12 参照画素値積算部
13 係数最適化部
14 無方向予測部
15 画面内予測部
16 判定部
17 切替え部
18 処理モード判定部
2 符号化器
3 復号器

Claims (6)

  1. 予測の対象である予測ブロックに隣接する復号済みの参照ブロックの画像から、該予測ブロックの画像を予測画像として生成するイントラ予測装置であって、
    参照ブロックに含まれる画素を選定し、該画素の画素値を近似する予測画素値曲面を生成する予測画素値曲面生成手段と、
    前記予測画素値曲面に基づいて予測ブロックの予測画像を生成する無方向予測手段と、を備え
    前記予測画素値曲面生成手段は、前記参照ブロックの画素値との差を示す指標が最小となる曲面を前記予測画素値曲面とし、該予測画素値曲面の係数を求める係数最適化手段を有するとともに、
    前記係数最適化手段は、前記差を示す指標を求める際に、参照ブロック内の画素と予測ブロックとの距離に応じて重み付けすることを特徴とするイントラ予測装置。
  2. 前記係数最適化手段は、前記差を示す指標を、前記予測画素値曲面の値と前記参照ブロックの画素値との差の二乗和とすることを特徴とする、請求項に記載のイントラ予測装置。
  3. 前記重みは、前記参照ブロック内の画素と予測ブロックとの距離が大きくなるほど、小さな値とすることを特徴とする、請求項1または2に記載のイントラ予測装置。
  4. 請求項1〜3のいずれか一項に記載のイントラ予測装置を備えることを特徴とする符号化器。
  5. 請求項1〜3のいずれか一項に記載のイントラ予測装置を備えることを特徴とする復号器。
  6. コンピュータを、請求項5に記載の復号器として機能させるためのプログラム。
JP2010049704A 2010-03-05 2010-03-05 イントラ予測装置、符号化器、復号器及びプログラム Expired - Fee Related JP5222870B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010049704A JP5222870B2 (ja) 2010-03-05 2010-03-05 イントラ予測装置、符号化器、復号器及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010049704A JP5222870B2 (ja) 2010-03-05 2010-03-05 イントラ予測装置、符号化器、復号器及びプログラム

Publications (2)

Publication Number Publication Date
JP2011188129A JP2011188129A (ja) 2011-09-22
JP5222870B2 true JP5222870B2 (ja) 2013-06-26

Family

ID=44793909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010049704A Expired - Fee Related JP5222870B2 (ja) 2010-03-05 2010-03-05 イントラ予測装置、符号化器、復号器及びプログラム

Country Status (1)

Country Link
JP (1) JP5222870B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2653270C2 (ru) * 2013-12-10 2018-05-07 Кэнон Кабусики Кайся Улучшенный палитровый режим в hevc
US10834412B2 (en) 2013-12-10 2020-11-10 Canon Kabushiki Kaisha Method and apparatus for encoding or decoding blocks of pixel

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2015005025A1 (ja) * 2013-07-12 2017-03-02 ソニー株式会社 画像処理装置及び画像処理方法
WO2018199051A1 (ja) * 2017-04-25 2018-11-01 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法および復号方法
WO2018218249A1 (en) * 2017-05-26 2018-11-29 Google Llc Tiled image compression using neural networks
CN117768643A (zh) * 2017-10-13 2024-03-26 弗劳恩霍夫应用研究促进协会 用于逐块图片编码的帧内预测模式概念

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3689454B2 (ja) * 1995-06-22 2005-08-31 キヤノン株式会社 画像符号化装置及び方法
JP2841314B2 (ja) * 1996-11-08 1998-12-24 ソニー株式会社 データ伝送方法および伝送装置
KR100750128B1 (ko) * 2005-09-06 2007-08-21 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
JP2009033604A (ja) * 2007-07-30 2009-02-12 Victor Co Of Japan Ltd 映像信号符号化装置および方法
CN101965733B (zh) * 2008-03-09 2013-08-07 Lg电子株式会社 用于编码或解码视频信号的方法和设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2653270C2 (ru) * 2013-12-10 2018-05-07 Кэнон Кабусики Кайся Улучшенный палитровый режим в hevc
RU2679566C1 (ru) * 2013-12-10 2019-02-11 Кэнон Кабусики Кайся Улучшенный палитровый режим в hevc
US10419774B2 (en) 2013-12-10 2019-09-17 Canon Kabushiki Kaisha Palette mode in HEVC
US10834412B2 (en) 2013-12-10 2020-11-10 Canon Kabushiki Kaisha Method and apparatus for encoding or decoding blocks of pixel

Also Published As

Publication number Publication date
JP2011188129A (ja) 2011-09-22

Similar Documents

Publication Publication Date Title
US9053544B2 (en) Methods and apparatuses for encoding/decoding high resolution images
RU2559738C2 (ru) Способ и устройство для кодирования/декодирования вектора движения
KR102046521B1 (ko) 스킵 모드를 이용한 영상 복호화 방법 및 이러한 방법을 사용하는 장치
CN107959856B (zh) 通过帧内预测来对图像进行编码和解码的方法和设备
US11277615B2 (en) Intra-prediction method for reducing intra-prediction errors and device for same
JP2017011731A (ja) 映像符号化装置
US9894363B2 (en) Moving picture coding device, moving picture coding method, and moving picture coding program, and moving picture decoding device, moving picture decoding method, and moving picture decoding program
JP5222870B2 (ja) イントラ予測装置、符号化器、復号器及びプログラム
US20170366807A1 (en) Coding of intra modes
TW202017369A (zh) 擴充參考圖像內預測技術
KR20110045950A (ko) 복수의 프레임을 참조하여 영상을 부호화, 복호화하는 방법 및 장치
CN102595130B (zh) 图像编码装置和图像解码装置
JP6698053B2 (ja) 符号化及び復号化のための方法及び装置
JP5222878B2 (ja) イントラ予測装置、符号化器、復号器及びプログラム
JP5174062B2 (ja) イントラ予測装置、符号化器、復号器、及びプログラム
WO2014084674A2 (ko) 잔차 변환을 이용한 인트라 예측 방법 및 장치
JP2023528609A (ja) 符号化・復号方法、装置及びそのデバイス
JP2013121044A (ja) 画像符号化装置及び画像符号化方法
JP5202558B2 (ja) イントラ予測装置、符号化器、復号器及びプログラム
JP2013138502A (ja) 符号化装置及びその制御方法、コンピュータプログラム
JP5509048B2 (ja) イントラ予測装置、符号化器、復号器、及びプログラム
JP2012175155A (ja) 動画像符号化装置
JP2007027805A (ja) 映像符号化装置、映像符号化方法、映像符号化プログラム及びそのプログラムを記録したコンピュータ読取可能な記録媒体
WO2013098937A1 (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置及び動画像復号装置
WO2012141500A2 (ko) 스킵 모드를 이용한 영상 복호화 방법 및 이러한 방법을 사용하는 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120321

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130311

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5222870

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees