JP6174966B2 - 画像符号化装置、画像符号化方法、及びプログラム - Google Patents

画像符号化装置、画像符号化方法、及びプログラム Download PDF

Info

Publication number
JP6174966B2
JP6174966B2 JP2013216756A JP2013216756A JP6174966B2 JP 6174966 B2 JP6174966 B2 JP 6174966B2 JP 2013216756 A JP2013216756 A JP 2013216756A JP 2013216756 A JP2013216756 A JP 2013216756A JP 6174966 B2 JP6174966 B2 JP 6174966B2
Authority
JP
Japan
Prior art keywords
image
pixel
value
difference
sao
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013216756A
Other languages
English (en)
Other versions
JP2015080115A (ja
JP2015080115A5 (ja
Inventor
大輔 坂本
大輔 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2013216756A priority Critical patent/JP6174966B2/ja
Priority to US14/516,288 priority patent/US9438914B2/en
Publication of JP2015080115A publication Critical patent/JP2015080115A/ja
Publication of JP2015080115A5 publication Critical patent/JP2015080115A5/ja
Application granted granted Critical
Publication of JP6174966B2 publication Critical patent/JP6174966B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Description

本発明は、画像符号化装置、画像符号化方法、及びプログラムに関する。
近年、音声信号、映像信号など所謂マルチメディアに関連する情報のデジタル化が急進しており、これに対応して、映像信号の圧縮符号化/復号技術が注目されている。圧縮符号化/復号技術により、映像信号の格納に必要な記憶容量や伝送に必要な帯域を減少させることができる。
一般的な圧縮符号化/復号技術では、多くの映像信号が有する自己相関性の高さ(即ち、冗長性)を利用して情報量(データ量)を圧縮している。映像信号が有する冗長性には、時間冗長性及び二次元の空間冗長性がある。時間冗長性は、ブロック単位の動き検出及び動き補償を用いて低減することができる。一方、空間冗長性は、離散コサイン変換(DCT)を用いて低減させることができる。
このような技術を用いた最も高能率な符号化方式として現状普及しているものに、H.264/MPEG−4 PART10(AVC)(以下、H.264と呼ぶ)がある。しかしながら、昨今、ハイビジョン画像の16倍のSHV(Super High Vision)の画像を圧縮したい、或いは、限られた伝送帯域において、より解像度の高い映像を送受信したいといった、更なる高圧縮率符号化に対するニーズが高まっている。このため、ITU−TとISO/IECの共同の標準化団体であるJCTVC(Joint Collaboration Team − Video Coding)により、符号化効率の改善に関する検討が行われた。その結果、HEVC(High Efficiency Video Coding)と呼ばれる符号化方式が2013年1月にITU−Tにて正式に承認されている。
HEVCでは、H.264の2倍の圧縮効率を有すると想定されている。この圧縮効率を実現するためにHEVCでは様々な新技術が導入されている。その中の1つに、SAO(Sample Adaptive Offset)と呼ばれる適応ループフィルタが存在する。SAOの基本的な方式については特許文献1に記載されている。以下、HEVCにおけるSAOについて、より具体に説明する。
SAOは、デブロッキングフィルタ後の画素に対してSAOで設定する条件に該当するか否かの判定を行い、適切なオフセット値を画素に付加することで、符号化後の画像を原画に近づけ、画質を向上させることを狙った技術である。また、SAOのモードとして、2種類のモードが規定されている。いずれのモードにおいても、各画素は5つのカテゴリに分類され、カテゴリ毎にオフセット値が設定される。オフセット値を付加するあるいは付加しないといった処理は、CTU(Coding Tree Unit)単位で実施される。
SAOのモードの1つであるBand Offsetモード(以下、BOと呼ぶ)について、図3を用いて説明する。BOでは、画素値の最小値(図3では0)から最大値(図3では255)までを32のバンドに等分し、各画素に対し、画素が属するバンドに応じてオフセット値を切り替えてオフセット処理を実施する。
BOでは、32のバンドのうち、4つの連続したバンドに属する画素に対してオフセット値が付加される。BOを実施するCTUでは、オフセット適用バンドを示すsao_band_position(図3では、画素値32)が指定され、そこから連続した4つのバンド(図3では、画素値32から画素値63)が、オフセットオンの4カテゴリとして指定される。一方、それ以外のバンドは、オフセットオフのカテゴリとなる。BOは、特定の範囲の値をもつ画素を補正するため、CTUに含まれる画素値にばらつきが少ない場合に特に有効に補正が働くモードである。
続いて、SAOのもう1つのモードであるEdge Offsetモード(以下、EOと呼ぶ)について、図4を用いて説明する。EOでは、図4の下側に示すようにCTU内の画素を、隣接画素との画素値の大小関係に基づいてカテゴリ分けを行う。大小関係の比較に用いられる隣接画素の位置としては、図4の上側に示すように4パターンが定義されており、符号化装置は、この4種のうちどのパターンを用いるかを決定する。EOでは、局所的な画素値の山、谷を平坦になるよう補正する効果がある。そのため、EOは、原画像の急峻なエッジ付近で発生するモスキートノイズの補正に有効に働くモードである。
特開2012−005113号公報
SAOは、符号化時に適切なオフセット値を設定することにより、復号画像を原画像に近づけ画質を向上することができる。しかしながら、オフセット値が適切に設定できないと、逆に画質を劣化させてしまう恐れがある。
特許文献1では、オフセット値を決定する方法として、符号化前の画素値の平均値と符号化後(ローカルデコード後)の画素値の平均値の差を用いる方式を提案している。この方式では、平均的な画素値の補正を行えるためPSNRが向上し、基本的な画質の向上を図ることができる。しかし、符号化後の画素値の状態によっては充分な画質向上が行えない場合がある。充分な画質向上が行えない例について、図5を用いて説明する。
図5(a)は、一例としてCTUサイズが4×4とした場合の、符号化対象CTUの各画素値と、符号化後であってSAO処理を実施する前のローカルデコードCTUの各画素値とを表している。ここでは、SAOモードとしてBOを適用した例を示す。また、図3と同様、sao_band_positionを画素値32からに設定し、すべてのローカルデコードCTUの画素値がVal1のカテゴリに属す場合を例として用いる。図5(a)において、符号化前の画素値の平均値と符号化後の画素値の平均値の差を算出すると、値は2になる。従って、特許文献1に従うと、オフセット値は2である。
図5(b)は、オフセット値を2に設定した場合のSAO処理後CTUと符号化対象CTUの各画素の差分値と、SAO処理前CTUと符号化対象CTUの各画素の差分値とを、左上からラスタ順にグラフ化し比較したものである。図5(b)においては、差分値が0に近づくほど符号化対象CTUとの差が小さくなるため、画質が向上することを示している。SAO処理後の差分値を見ると、オフセット値を付加したことで、一部の画素を除き多くの画素において差分値が0に近づき、多少の画質改善が行えていることが分かる。しかしながら、ほとんどの画素で3の差分値が残っており、依然として符号化対象CTUの画素値との差を解消しきれていない。
本発明はこのような状況に鑑みてなされたものであり、復号画像の画質をより向上させる補正技術を提供することを目的とする。
上記課題を解決するために、本発明は、符号化対象画像を圧縮符号化して復号することによりローカルデコード画像を生成する生成手段と、前記ローカルデコード画像の所定の画素群の各画素について、前記符号化対象画像の対応する画素の画素値との差分値を算出する差分演算手段と、前記差分値の最頻出値を検出する検出手段と、前記最頻出値を用いて前記ローカルデコード画像の前記所定の画素群の各画素を補正する補正手段と、を備えることを特徴とする画像符号化装置を提供する。
なお、その他の本発明の特徴は、添付図面及び以下の発明を実施するための形態における記載によって更に明らかになるものである。
本発明によれば、復号画像の画質をより向上させることが可能となる。
第1の実施形態に係るSAO設定部216の詳細なブロック図。 第1の実施形態に係る画像符号化装置200の構成を示すブロック図。 SAOのBand Offsetモードの説明図。 SAOのEdge Offsetモードの説明図。 従来のSAOにおける課題の説明図。 第1の実施形態に係るSAO設定部216が実行する処理を示すフローチャート。 SAOオフセット値の決定方法の具体例を示す図。 第1の実施形態に係るSAO処理により符号化対象CTUとローカルデコードCTUとの差分値が0に近づく様子を説明する図。 第2の実施形態に係るSAO設定部216の詳細なブロック図。 第2の実施形態に係るSAO設定部216が実行する処理を示すフローチャート。
以下、添付図面を参照して、本発明の実施形態を説明する。なお、本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって限定されるわけではない。また、実施形態の中で説明されている特徴の組み合わせすべてが、本発明に必須とは限らない。
[第1の実施形態]
図2は、第1の実施形態に係る画像符号化装置200の構成を示すブロック図である。図2に示すように、画像符号化装置200は、フレームメモリ201、フィルタ後参照フレームメモリ202、予測モード決定部203、予測画像生成部204、直交変換部206、量子化部207、及びエントロピー符号化部208を備える。画像符号化装置200はまた、逆量子化部209、逆直交変換部210、減算器212、加算器213、フィルタ前参照フレームメモリ214、ループフィルタ215、及びSAO設定部216も備える。
まず、画像符号化装置200が入力画像を符号化する手順について、図2を参照しながら説明する。フレームメモリ201には、表示順に入力画像(原画像)が保存される。そして、符号化順に符号化対象ブロックが予測モード決定部203、予測画像生成部204、減算器212へと順次送信される。符号化対象ブロックは、例えば、HEVC(High Efficiency Video Coding)規格に従うCTU(Coding Tree Unit)である。
フィルタ後参照フレームメモリ202には、フィルタ後にSAO処理された符号化済み画像が参照画像として保存される。そして、符号化順に符号化対象ブロックの参照画像が予測モード決定部203、予測画像生成部204へと順次送信される。
減算器212は、フレームメモリ201から送信されてくる符号化対象ブロックから、予測画像生成部204から送信されてくる予測画像ブロックを減算し、画像残差データを出力する。
直交変換部206は、減算器212から出力された画像残差データを直交変換処理して、変換係数を量子化部207に送信する。量子化部207は、直交変換部206からの変換係数を所定の量子化パラメータを用いて量子化し、エントロピー符号化部208及び逆量子化部209に送信する。
エントロピー符号化部208は、量子化部207で量子化された変換係数や後述するSAO設定部216から送信されるSAOパラメータなどが入力され、CABACなどのエントロピー符号化を施して、符号化データとして出力する。
続いて、量子化部207で量子化された変換係数を用いて参照画像データ(フィルタ前参照画像データ及びフィルタ後参照画像データ)を生成する手順について述べる。逆量子化部209は、量子化部207から送信されてくる量子化された変換係数を逆量子化する。逆直交変換部210は、逆量子化部209で逆量子化された変換係数を逆直交変換し、復号残差データを生成し加算器213に送信する。
加算器213は、復号残差データと後述する予測画像データとを加算して参照画像データ(フィルタ前参照画像データ)を生成し、フィルタ前参照フレームメモリ214に保存する。フィルタ前参照画像データは、ループフィルタ215へも送信される。ループフィルタ215は、フィルタ前参照画像データをフィルタリングしてノイズを除去し、フィルタ後参照画像データをSAO設定部216に送信する。これにより、符号化対象ブロックを圧縮符号化して復号することにより得られるローカルデコード画像がSAO設定部216に入力される。
SAO設定部216は、適応オフセット(SAO)処理を施し、SAO処理を施した後の参照画像データをフィルタ後参照フレームメモリ202に保存する。なお、SAO処理のためのオフセット値(SAOオフセット値)の決定方法については、後に詳細に説明する。
続いて、前述の入力画像データ、フィルタ前参照画像データ、及びフィルタ後参照画像データを用いて予測画像データを生成する手順について述べる。予測モード決定部203は、フレームメモリ201から送信される符号化対象ブロック、及びフィルタ後参照フレームメモリ202から送信されるフィルタ後参照画像データから、符号化対象ブロックの予測モードを決定する。そして、予測モード決定部203は、決定した予測モードを、フィルタ後参照画像データの番号と共に予測画像生成部204に送信する。
予測画像生成部204は、予測画像データを生成する。その際、予測モード決定部203からの予測モードに基づき、フィルタ後参照フレームメモリ202中の参照画像データを参照するか、或いはフィルタ前参照フレームメモリ214から送信される符号化対象ブロック周辺の復号化済み画素を用いるかを判断する。予測画像生成部204は、予測画像データを生成したら、予測画像データを減算器212に送信する。
続いて、SAO設定部216におけるSAOオフセット値の決定方法について、SAO設定部216の詳細なブロック図(図1)、BOの説明図(図3)、EO説明図(図4)、図6のフローチャート、図7、及び図8を参照して説明する。
図1に示すように、SAO設定部216は、SAOモード設定部100、カテゴリ分類部101、画素差分演算部102、画素差分平均値演算部103、画素差分最頻出値検出部104、及びSAOモード決定部105を含む。SAO設定部216はまた、SAOオフセット値決定部106、及びSAO実行部107も含む。
図6は、SAO設定部216が実行する処理を示すフローチャートである。S601で、SAOモード設定部100は、図3で示したBOか、又は、図4の上側に示したEOの4種類のエッジのいずれかのモードを設定し、カテゴリ分類部101に送信する。なお、処理が後述のS607からS601に戻ることにより、S601では全てのモードが順に設定される。
S602で、カテゴリ分類部101は、SAOモード設定部100で設定されたモードに従い、ループフィルタ215から入力されるフィルタ後参照画像データ(ローカルデコード画像)の各画素がいずれのカテゴリに該当するか分類する。即ち、BOの場合は図3で示したいずれのバンド(カテゴリ)に属するか、EOの場合は図4の下側に示したいずれのカテゴリに属するか(或いは属さないか)を分類する。なお、BOの場合、カテゴリ分類部101は、現時点ではsao_band_positionを設定せず、各画素が32バンド(図3だと0〜255の範囲の画素値)のいずれのバンド(部分範囲)に属するかを分類する。カテゴリ分類部101は、カテゴリの分類を行った後、ローカルデコード画像を画素差分演算部102に送信する。
S603で、画素差分演算部102は、カテゴリ分類部101から送信されるローカルデコード画像、及びフレームメモリ201から送信される符号化対象画像を用いて、カテゴリ別の画素差分値を演算する。カテゴリ別に演算された差分値は、画素差分平均値演算部103及び画素差分最頻出値検出部104に送信される。
S604で、画素差分平均値演算部103は、画素差分演算部102から送信される画素差分値を用いて、カテゴリ別に画素差分値の平均値を演算する。この演算は、例えば、カテゴリごとに、画素差分値の和を画素差分値の数で割ることにより行われる。演算した画素差分平均値は、SAOモード決定部105に送信される。
S605で、画素差分最頻出値検出部104は、カテゴリ別に画素差分値を確認し、画素差分値毎に発生した数をカウントする。そして、カテゴリ別の該当画素の数、最頻出の画素差分値、及び最頻出の画素差分値の数を検出し、SAOオフセット値決定部106に送信する。
S606で、SAOモード決定部105は、画素差分平均値演算部103から送信されるカテゴリ毎の画素差分平均値をSAOの各カテゴリのオフセット値として用いて、ループフィルタ215から入力されるローカルデコード画像に対し仮のSAO処理を行う。なお、SAOモード設定部100で設定されたモードがBOの場合は、SAOモード決定部105は、まず画素差分最頻出値検出部104でカウントしている画素差分値のカテゴリ別の数と各カテゴリの画素差分平均値を乗算した値を算出する。続いて、連続した4バンドで算出した値の和をとり、和が最も大きくなる連続した4バンドの始点をsao_band_positionとして設定し、SAOを適用する。SAOモード決定部105は、SAOを適応したローカルデコード画像を生成した後、フレームメモリ201から送信される符号化対象画像と各画素で差分をとり、差分絶対値和を算出し、SAOモード別に保持する。
S607では、全てのSAOモード(BOが1種類、EOが4種類)についてS601〜S606の処理が完了したか否かが判定され、完了していない場合、処理はS601に戻り、完了した場合、処理はS608に進む。
S608で、SAOモード決定部105は、S606で算出された各モードの差分絶対値和に基づき、最も差分絶対値和が小さいモードを最終的なSAOのモードとして決定し、決定したモードをSAOオフセット値決定部106に通知する。
S609で、SAOオフセット値決定部106は、決定されたSAOモードにおけるカテゴリ別該当画素の数から各カテゴリにおける閾値Thcatを設定し、最頻出値の数Cntfreと比較する。そして、Cntfreが閾値よりも大きければ(Cntfre>Thcatであれば)、S610においてSAOオフセット値決定部106は、最頻出値をそのカテゴリにおけるSAOのオフセット値として採用する。他方、Cntfreが閾値以下であれば(Cntfre≦Thcatであれば)、S611においてSAOオフセット値決定部106は、画素差分平均値をそのカテゴリにおけるSAOのオフセット値として採用する。採用されたオフセット値は、SAO実行部107に通知される。
S612で、SAO実行部107は、S608で決定されたSAOモード、及び、S610又はS611で決定されたオフセット値を用いて、SAO処理前のローカルデコード画像に対してSAO処理(各画素の補正)を適用する。そして、SAO実行部107は、SAO処理されたローカルデコード画像をフィルタ後参照フレームメモリ202に保存する。また、SAO実行部107は、SAO処理に用いたSAOパラメータ(SAOモード及びオフセット値)を符号化するために、SAOパラメータをエントロピー符号化部208に送信する。
なお、S609において、各カテゴリにおける閾値Thcatは各カテゴリに該当する画素の数Cntcatと、係数αとを用いて、以下の数式(1)のように求められる。
Thcat=Cntcat×α (αは0〜1の実数) ・・・ (1)
ここで、各カテゴリにおけるSAOオフセット値の決定方法を、図7の具体例を用いて説明する。この例では、SAOモードとしてBOが選択されており、SAOが適応されるバンドが画素値32〜63の4バンドに設定されているものとするが、他のSAOモードの場合も基本的な考え方は同様である。図7は、CTUのサイズが32×32の場合の、符号化対象CTUの画素値、ローカルデコードCTU(SAO前)の画素値、及び、カテゴリ別の符号化対象CTUとローカルデコードCTU(SAO前)の画素差分値を示している。
図7において、Val0(画素値32〜39)のカテゴリに該当する画素の数は14個となっている。また、Val1(画素値40〜47)のカテゴリに該当する画素の数は14個、Val2(画素値48〜55)のカテゴリに該当する画素の数は16個となっている。Val3(画素値56〜63)のカテゴリに該当する画素の数は13個となっている。また、いずれのカテゴリにも属さない画素は7個ある。このように、ローカルデコードCTUの各画素は、Val0〜Val3それぞれに対応する4つの画素群と、Val0〜Val3のいずれにも対応しない1つの画素群とに分類される。
ここで、閾値Thcatを、各カテゴリに該当する画素の数の70%に設定する。換言すると、各カテゴリに該当する画素の数に対する最頻出値の数の比率が70%を超えるか否かが基準となる。すると、係数αには0.7が設定され、各カテゴリに設定されるThcatは以下のように求められる。
Val0のThcat:14×0.7=9
Val1のThcat:14×0.7=9
Val2のThcat:16×0.7=11
Val3のThcat:13×0.7=9
また、Val0のカテゴリにおいては、最頻出値が5で10個あるので、最頻出値の数Cntfreは10である。同様に、Val1のカテゴリにおいては、最頻出値が7で9個あるので、最頻出値の数Cntfreは9であり、Val2のカテゴリにおいては、最頻出値が3で14個あるので、最頻出値の数Cntfreは14である。Val3のカテゴリにおいては、最頻出値が1で6個あるので、最頻出値の数Cntfreは6である。
従って各カテゴリにおけるThcatとCntfreを比較し、SAOのオフセット値を求めると、Val0のカテゴリにおいては、Thcatが9、Cntfreが10であり、Cntfreの方が大きいため、オフセット値は最頻出値である5に設定される。他方、Val1のカテゴリにおいては、Thcatが9、Cntfreが9であり、CntfreがThcatより大きくならないため、オフセット値は差分平均値である−5に設定される。同様に、Val2のカテゴリにおいては、Thcatが11、Cntfreが14であり、Cntfreの方が大きいため、オフセット値は最頻出値である3に設定される。Val3のカテゴリにおいては、Thcatが9、Cntfreが6であり、Cntfreの方が小さいため、オフセット値は差分平均値である−2に設定される。
以上のように、最頻出値の数が多い場合には最頻出値をSAOのオフセット値として用いることで、より多くの数の画素において符号化対象画像との差分が無くなるため、画質の向上が期待できる。一方、最頻出値の数が少ない場合には差分平均値を用いた方が、SAO処理後の画素値と符号化対象画像の画素値との差分が平均的に0に近づくため、画質の向上が期待できる。
図8を参照して、第1の実施形態に係るSAO処理により符号化対象CTUとローカルデコードCTUとの差分値が0に近づく様子を説明する。図8(a)は、図5(a)と同様、CTUサイズが4×4とした場合の、符号化対象CTUの各画素値と、SAO処理を実施する前のローカルデコードCTUの各画素値とを表している。また、SAOモードはBOであり、sao_band_positionは画素値32に設定されており、すべてのローカルデコードCTUの画素値がVal1のカテゴリに属するものとする。この場合、Val1のオフセット値は、差分最頻出値である5に設定される。
図8(b)は、オフセット値を5に設定した場合のSAO処理後CTUと符号化対象CTUの各画素の差分値と、SAO処理前CTUと符号化対象CTUの各画素の差分値とを、左上からラスタ順にグラフ化し比較したものである。図8(b)においては、図5(b)の場合と異なり、多くの画素において差分値が0である。
なお、本実施形態では、SAOモードを決定する方式として、仮のSAO処理を行った場合のローカルデコード画像と符号化対象画像の差分絶対値和が最も小さいモードをSAOモードとして決定する方式を一例として挙げたが、この方式に限定されない。別の方式としては、例えば、仮のSAO処理を行った場合のローカルデコード画像と符号化対象画像の差分絶対値和にSAOパラメータの符号量を考慮したコストを加え、コストが最小になるモードを選択する方式などが考えられる。
また、本実施形態では、SAO設定部216は、カテゴリ別に画素差分最頻出値を検出したが、カテゴリを分けずに、ローカルデコード画像の全ての画素の差分値から最頻出値を検出してもよい。カテゴリを分けずに最頻出値を検出する方式は、特に平坦な映像で、差分値の凹凸が大きくならない場合にBOを適用する際に、有効に働くことが期待できる。
また、本実施形態では、SAO設定部216は、最頻出値の数Cntfreをカウントする際に、カテゴリ毎の最頻出値のみをカウントしていたが、最頻出値周辺の値を複数用いて、幅を設けてカウントを行ってもよい。図7を用いて具体的に説明する。ここでは、例としてCntfreをカウントする際、最頻出値だけで無く最頻出値と前後の3つの値をカウントアップに用いるものとする。この場合、Val0に属する画素のCntfreをカウントアップする際の対象の画素値は、4〜6となる。同様に、Val1に属する画素のCntfreをカウントアップする際の対象の画素値は、6〜8となり、Val2に属する画素のCntfreをカウントアップする際の対象の画素値は、2〜4となる。Val3に属する画素のCntfreをカウントアップする際の対象の画素値は、0〜2となる。そのため、Val1、Val2におけるCntfreは変わらないがVal0においてはCntfreが12になる。また、Val3においてはCntfreが7になる。
以上説明したように、第1の実施形態によれば、画像符号化装置200は、一定条件下で、SAO処理のオフセット値を、SAO処理前CTUと符号化対象CTUの各画素の差分値の最頻出値に設定する。これにより、復号画像の画質を向上させることが可能となる。
[第2の実施形態]
続いて,図9及び図10を参照して、第2の実施形態について説明する。第2の実施形態では、画像符号化装置200の基本的な構成は第1の実施形態と同様であるが(図2参照)、SAO設定部216の構成及び動作が第1の実施形態と若干異なる。
図9は、第2の実施形態に係るSAO設定部216の詳細なブロック図である。図9において、図1と同一又は同様の機能を持つブロックには図1と同一の符号を付し、その説明を省略する。図9に示すように、SAO設定部216は、符号化対象画像平均値演算部908、及び、ローカルデコード画像平均値演算部909を含む。これらのブロックの機能については、図10を参照して説明する。
図10は、第2の実施形態に係るSAO設定部216が実行する処理を示すフローチャートである。図10において、図6と同一又は同様の処理が行われるステップには図6と同一の符号を付し、その説明を省略する。
S1001で、符号化対象画像平均値演算部908は、フレームメモリ201から送信される符号化対象画像とカテゴリ分類部101の分類結果とを用いて、カテゴリ別に画素の平均値を演算する。符号化対象画像平均値演算部908は、算出したカテゴリ別の平均値を画素差分演算部102に送信する。
S1002で、ローカルデコード画像平均値演算部909は、カテゴリ分類部101から送信されるSAO処理前のローカルデコード画像とカテゴリ分類結果とを用いて、カテゴリ別に画素の平均値を演算する。ローカルデコード画像平均値演算部909は、算出したカテゴリ別の平均値を画素差分演算部102に送信する。
S1003で、画素差分演算部102は、カテゴリ分類部101から送信されるローカルデコード画像、及びフレームメモリ201から送信される符号化対象画像を用いて、カテゴリ別の画素差分値を演算する。また、画素差分演算部102は、符号化対象画像平均値演算部908から送信される符号化対象画像のカテゴリ別画素平均値とローカルデコード画像平均値演算部909から送信されるローカルデコード画像のカテゴリ別画素平均値との差分値を演算する。カテゴリ別に演算された差分値は、画素差分最頻出値検出部104に送信される。また、カテゴリ別画素平均値の差分値は、SAOモード決定部105に送信される。
S1004で、画素差分最頻出値検出部104は、カテゴリ別に画素差分値を確認し、画素差分値毎に発生した数をカウントする。そして、カテゴリ別の該当画素の数、最頻出の画素差分値、及び最頻出の画素差分値の数を検出し、SAOオフセット値決定部106に送信する。
S1005の処理は、S606(図6)の処理とほぼ同じである。但し、S1005では、S1003において画素差分演算部102から送信されたカテゴリ別画素平均値の差分値が、SAOの各カテゴリのオフセット値として用いられる。
以上の通り、第2の実施形態では、演算の順序が第1の実施形態と異なるが、第1の実施形態と同様、画像符号化装置200は、一定条件下で、SAO処理のオフセット値を、SAO処理前CTUと符号化対象CTUの各画素の差分値の最頻出値に設定する。これにより、復号画像の画質を向上させることが可能となる。
[その他の実施形態]
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (11)

  1. 符号化対象画像を圧縮符号化して復号することによりローカルデコード画像を生成する生成手段と、
    前記ローカルデコード画像の所定の画素群の各画素について、前記符号化対象画像の対応する画素の画素値との差分値を算出する差分演算手段と、
    前記差分値の最頻出値を検出する検出手段と、
    前記最頻出値を用いて前記ローカルデコード画像の前記所定の画素群の各画素を補正する補正手段と、
    を備えることを特徴とする画像符号化装置。
  2. 前記差分値の平均値を算出する差分平均値演算手段と、
    前記差分値の数に対する前記最頻出値の数の比率が閾値以下であるか否かを判定する判定手段と、
    を更に備え、
    前記補正手段は、前記比率が前記閾値以下である場合、前記最頻出値の代わりに前記差分値の平均値を用いて前記ローカルデコード画像の各画素を補正する
    ことを特徴とする請求項1に記載の画像符号化装置。
  3. 前記判定手段は、前記差分値のうち、前記最頻出値を含む所定の範囲の値の数を前記最頻出値の数として、前記判定を行う
    ことを特徴とする請求項2に記載の画像符号化装置。
  4. 前記差分平均値演算手段は、前記差分値の和を前記差分値の数で割ることにより、前記差分値の平均値を算出する
    ことを特徴とする請求項2又は3に記載の画像符号化装置。
  5. 前記ローカルデコード画像の前記所定の画素群の画素値の平均値を算出するローカルデコード画像平均値演算手段と、
    前記ローカルデコード画像の前記所定の画素群に対応する前記符号化対象画像の画素群の画素値の平均値を算出する符号化対象画像平均値演算手段と、
    を更に備え、
    前記差分平均値演算手段は、前記ローカルデコード画像平均値演算手段により算出された平均値と前記符号化対象画像平均値演算手段により算出された平均値とを用いて、前記差分値の平均値を算出する
    ことを特徴とする請求項2又は3に記載の画像符号化装置。
  6. 前記ローカルデコード画像の前記所定の画素群は、前記ローカルデコード画像の全ての画素を含む
    ことを特徴とする請求項1乃至5のいずれか1項に記載の画像符号化装置。
  7. 前記ローカルデコード画像の各画素を前記所定の画素群を含む複数の画素群に分類する分類手段を更に備え、
    前記検出手段は、前記複数の画素群それぞれについて、前記差分値の最頻出値を検出する
    ことを特徴とする請求項1乃至5のいずれか1項に記載の画像符号化装置。
  8. 前記分類手段は、前記ローカルデコード画像の各画素が、前記ローカルデコード画像の画素が取り得る画素値の範囲に含まれる連続する複数の部分範囲のいずれに属するかに応じて、前記ローカルデコード画像の各画素を前記複数の画素群に分類する
    ことを特徴とする請求項7に記載の画像符号化装置。
  9. 前記符号化対象画像は、HEVC(High Efficiency Video Coding)規格に従うCTU(Coding Tree Unit)である
    ことを特徴とする請求項1乃至8のいずれか1項に記載の画像符号化装置。
  10. 画像符号化装置よる画像符号化方法であって、
    前記画像符号化装置の生成手段が、符号化対象画像を圧縮符号化して復号することによりローカルデコード画像を生成する生成工程と、
    前記画像符号化装置の差分演算手段が、前記ローカルデコード画像の所定の画素群の各画素について、前記符号化対象画像の対応する画素の画素値との差分値を算出する差分演算工程と、
    前記画像符号化装置の検出手段が、前記差分値の最頻出値を検出する検出工程と、
    前記画像符号化装置の補正手段が、前記最頻出値を用いて前記ローカルデコード画像の前記所定の画素群の各画素を補正する補正工程と、
    を備えることを特徴とする画像符号化方法。
  11. コンピュータを、請求項1乃至9のいずれか1項に記載の画像符号化装置の各手段として機能させるためのプログラム。
JP2013216756A 2013-10-17 2013-10-17 画像符号化装置、画像符号化方法、及びプログラム Expired - Fee Related JP6174966B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013216756A JP6174966B2 (ja) 2013-10-17 2013-10-17 画像符号化装置、画像符号化方法、及びプログラム
US14/516,288 US9438914B2 (en) 2013-10-17 2014-10-16 Encoding apparatus and encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013216756A JP6174966B2 (ja) 2013-10-17 2013-10-17 画像符号化装置、画像符号化方法、及びプログラム

Publications (3)

Publication Number Publication Date
JP2015080115A JP2015080115A (ja) 2015-04-23
JP2015080115A5 JP2015080115A5 (ja) 2016-11-24
JP6174966B2 true JP6174966B2 (ja) 2017-08-02

Family

ID=52826241

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013216756A Expired - Fee Related JP6174966B2 (ja) 2013-10-17 2013-10-17 画像符号化装置、画像符号化方法、及びプログラム

Country Status (2)

Country Link
US (1) US9438914B2 (ja)
JP (1) JP6174966B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6253406B2 (ja) * 2013-12-27 2017-12-27 キヤノン株式会社 画像符号化装置、撮像装置、画像符号化方法、及びプログラム
JP6939892B2 (ja) 2017-10-25 2021-09-22 株式会社ソシオネクスト 符号化方法、復号方法、符号化装置、復号装置、符号化プログラム及び復号プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69428979T2 (de) * 1993-08-30 2002-08-08 Sony Corp Einrichtung und verfahren zur kodierung von bilddaten
JP5165083B2 (ja) * 2010-06-15 2013-03-21 聯發科技股▲ふん▼有限公司 ビデオコーディングの適応オフセットに用いる装置および方法
CN106454356B (zh) * 2010-06-17 2019-11-08 夏普株式会社 解码装置及编码装置
GB201119206D0 (en) * 2011-11-07 2011-12-21 Canon Kk Method and device for providing compensation offsets for a set of reconstructed samples of an image

Also Published As

Publication number Publication date
US20150110410A1 (en) 2015-04-23
US9438914B2 (en) 2016-09-06
JP2015080115A (ja) 2015-04-23

Similar Documents

Publication Publication Date Title
JP6302577B2 (ja) エッジオフセットを適用する方法
EP1805994B1 (en) Deblocking filter
TWI709333B (zh) 一種解塊濾波的方法
KR20180119753A (ko) 압축 파라미터를 이용한 영상 복원용 머신러닝 알고리즘 및 이를 이용한 영상 복원방법
US20110069752A1 (en) Moving image encoding/decoding method and apparatus with filtering function considering edges
EP2141927A1 (en) Filters for video coding
EP2237557A1 (en) Coding for filter coefficients
US7822125B2 (en) Method for chroma deblocking
US20200244965A1 (en) Interpolation filter for an inter prediction apparatus and method for video coding
US20130070845A1 (en) Motion picture encoding apparatus and method thereof
US20130022099A1 (en) Adaptive filtering based on pattern information
KR20050084266A (ko) 디지털 비디오 처리용 통합 규준
Wennersten et al. Bilateral filtering for video coding
JP6174966B2 (ja) 画像符号化装置、画像符号化方法、及びプログラム
CN113068025B (zh) 解码预测方法、装置及计算机存储介质
WO2010013543A1 (ja) 圧縮画像ノイズ除去装置と再生装置
JP2005311512A (ja) エラーコンシールメント方法及び復号器
CN112313950B (zh) 视频图像分量的预测方法、装置及计算机存储介质
JP6270472B2 (ja) 画像符号化装置、画像符号化方法、及びプログラム
JP5814191B2 (ja) デブロッキング処理方法、デブロッキング処理装置、プログラム、及び記録媒体
JPH08191444A (ja) ビデオ信号復号化装置
Jánosi Two-Stage Overfitting of Neural Network-Based Video Coding In-Loop Filter
US20200329232A1 (en) Method and device for encoding or decoding video signal by using correlation of respective frequency components in original block and prediction block

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161011

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161011

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170707

R151 Written notification of patent or utility model registration

Ref document number: 6174966

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees