JP6865870B2 - 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体 - Google Patents

動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体 Download PDF

Info

Publication number
JP6865870B2
JP6865870B2 JP2020030864A JP2020030864A JP6865870B2 JP 6865870 B2 JP6865870 B2 JP 6865870B2 JP 2020030864 A JP2020030864 A JP 2020030864A JP 2020030864 A JP2020030864 A JP 2020030864A JP 6865870 B2 JP6865870 B2 JP 6865870B2
Authority
JP
Japan
Prior art keywords
block
prediction
intra
moving image
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020030864A
Other languages
English (en)
Other versions
JP2020102858A (ja
Inventor
強 要
強 要
圭 河村
圭 河村
内藤 整
整 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2020030864A priority Critical patent/JP6865870B2/ja
Publication of JP2020102858A publication Critical patent/JP2020102858A/ja
Application granted granted Critical
Publication of JP6865870B2 publication Critical patent/JP6865870B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体に関する。
イントラ予測またはインター予測と、残差変換と、エントロピー符号化とを用いた動画像符号化方式が提案されている(例えば、非特許文献1参照)。
イントラ予測を用いることにより、画像の空間的な冗長性を減少させることができる。イントラ予測の基本的なメカニズムは以下の通りである。まず、予測ブロック(の上および左)に隣接する参照ラインを生成し、予測ブロック中の原サンプルを選択された予測方向に沿って参照ラインに投影する。その後、参照ラインのサンプルとそこに投影された原サンプルとの差分(残差、誤差)は変換、量子化される。
したがって、参照ラインはイントラ予測の確度を決める重要な要素のひとつである。例えば非特許文献2では、複数の参照サンプルラインからコスト評価に基づきひとつの参照サンプルラインを選択する技術を提案している。
ITU-T H.265 High Efficiency Video Coding. J. Li, B. Li, J. Xu, R. Xiong, and G.-J. Sullivan, "Multiple line-based intra prediction," JVET-C0071, May 2016. Liang Zhao, Li Zhang, et al. "Fast Mode Decision Algorithm for Intra Prediction in HEVC", ResearchGate, November 2011. Siwei Ma, Shiqi Wang, Shanshe Wang, Liang Zhao, Qin Yu, Wen Gao, "Low Complexity Rate Distortion Optimization for HEVC", 2013 Data Compression Conference.
しかしながら、非特許文献2に記載の技術では、複数の参照サンプルラインのそれぞれについてコスト評価を行わなければならないので、符号化側の処理の負荷は参照サンプルラインの数に比例して増大する。また、複数の参照サンプルラインからひとつを選択するという方式では自由度が低く、適切な参照サンプルラインが見つからない可能性がある。
本発明はこうした課題に鑑みてなされたものであり、その目的は、イントラ予測の確度を高めつつ、それによる処理の負荷の増大を抑えることができる技術の提供にある。
本発明のある態様は、動画像復号装置に関する。この動画像復号装置は、イントラ予測を用いて符号化されたブロックを含む動画像を表すビットストリームを復号する復号手段と、復号の結果得られるブロックのレベル値を逆量子化および逆変換してブロックの画素の差分値を生成する逆処理手段と、ブロックの周りの再構成済みブロックの画素値に基づくイントラ予測によりブロックの画素の予測値を生成するイントラ予測手段と、生成された差分値および生成された予測値に基づいてブロックを再構成する再構成手段と、を備える。イントラ予測手段は、ブロックの周りの再構成済みブロックの複数のラインを合成することにより、イントラ予測で用いられる参照ラインを生成する。
本発明の別の態様は、動画像符号化装置である。この動画像符号化装置は、動画像のブロックの周りの符号化済みブロックの画素値に基づくイントラ予測によりブロックの画素の予測値を生成するイントラ予測手段と、生成された予測値に基づいてブロックの画素の差分値を生成する差分生成手段と、生成された差分値を変換および量子化し、レベル値を生成する処理手段と、生成されたレベル値を符号化してビットストリームを生成する符号化手段と、を備える。イントラ予測手段は、ブロックの周りの符号化済みブロックの複数のラインを合成することにより、イントラ予測で用いられる参照ラインを生成する。
なお、以上の構成要素の任意の組み合わせや、本発明の構成要素や表現を装置、方法、システム、コンピュータプログラム、コンピュータプログラムを格納した記録媒体などの間で相互に置換したものもまた、本発明の態様として有効である。
本発明によれば、イントラ予測の確度を高めつつ、それによる処理の負荷の増大を抑えることができる。
第1の実施の形態に係る配信システムの構成を示す模式図である。 図1の動画像符号化装置の機能および構成を示すブロック図である。 処理対象ブロックおよびその周りの複数の符号化済みブロックを示す模式図である。 図2のイントラ予測部における一連の処理の流れを示すフローチャートである。 図1の動画像復号装置の機能および構成を示すブロック図である。 図5に示される動画像復号装置のイントラ予測部における一連の処理の流れを示すフローチャートである。 第2の実施の形態に係るイントラ予測部の機能および構成を示すブロック図である。 図7のチェック結果保持部の一例を示すデータ構造図である。 図7のイントラ予測部における一連の処理の流れを示すフローチャートである。 ラインのオフセットを説明するための模式図である。 図11(a)、(b)は、オフセット値が整数の場合と小数の場合とを説明する模式図である。 第2の実施の形態に係る復号側のイントラ予測部における一連の処理の流れを示すフローチャートである。 適応的な線形結合の係数の決定を説明するための模式図である。 第3の実施の形態に係る符号化側のイントラ予測部における一連の処理の流れを示すフローチャートである。
以下、各図面に示される同一または同等の構成要素、部材、処理には、同一の符号を付するものとし、適宜重複した説明は省略する。また、各図面において説明上重要ではない部材の一部は省略して表示する。
実施の形態では、イントラ予測(intra-prediction、画面内予測)を採用する動画像符号化/復号(video encoding/decoding)において、符号化/復号対象のブロックの周りのブロックの複数のラインから新たな参照ラインを生成し、イントラ予測に使用する。したがって、より多くのラインの情報を反映させた参照ラインを用いることができるので、イントラ予測の確度を高めることができる。
また、符号化側で従来通りの最近接ラインを参照ラインとしたか、または新たな参照ラインを生成したかを示す識別子、例えば1bitのフラグ(1-bit flag)が生成され、ビットストリーム(bitstream)に加えられる。したがって、本実施の形態を採用することによる符号量の増大は限定的である。さらに、符号化側でのコスト評価は、生成された参照ラインと最近接ラインとの間で行われるので、生成元の複数のラインのそれぞれについてコスト評価を行う場合と比べて、符号化側の処理の負荷を軽減できる。
(第1の実施の形態)
図1は、第1の実施の形態に係る配信システム100の構成を示す模式図である。配信システム100は、動画像を配信する動画像配信サービスにおいて使用されるシステムである。動画像配信サービスは例えばVOD(Video On Demand)であってもよい。配信システム100はインターネットなどのネットワーク106を介して、ユーザサイトに設置されているセットトップボックスやパーソナルコンピュータなどの動画像復号装置102と接続される。動画像復号装置102は、テレビ受像機やモニタなどの表示装置104と接続される。動画像復号装置102および表示装置104は合わせてスマートフォンなどの携帯端末を構成してもよい。
なお、動画像配信サービスにおける配信システムは一例であり、動画像の符号化または復号を含む任意のシステムやサービスに、本実施の形態に係る技術的思想を適用できることは、本明細書に触れた当業者には明らかである。
配信システム100は、ネットワーク106を介してユーザから観たい動画コンテンツの指定を受ける。配信システム100は、指定された動画コンテンツのデータを符号化してビットストリームBSを生成する。配信システム100は、生成されたビットストリームBSをネットワーク106を介して要求元のユーザの動画像復号装置102に送信する。動画像復号装置102は受信したビットストリームBSを復号して動画像データを生成し、表示装置104に送信する。表示装置104は、受信した動画像データを処理し、指定された動画コンテンツを出力する。
配信システム100は、動画像DB(データベース)108と、動画像符号化装置110と、を備える。動画像DB108は、動画像のデータを保持する。動画像符号化装置110は、指定された動画コンテンツに対応する動画像データを動画像DB108から取得し、取得された動画像データを符号化し、ビットストリームBSを生成する。
図2は、図1の動画像符号化装置110の機能および構成を示すブロック図である。本明細書のブロック図に示す各ブロックは、ハードウエア的には、コンピュータのCPUをはじめとする素子や機械装置で実現でき、ソフトウエア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウエア、ソフトウエアの組合せによっていろいろなかたちで実現できることは、本明細書に触れた当業者には理解される。動画像符号化装置110を実現するコンピュータプログラムは、コンピュータが読み取り可能な記録媒体に記憶されて、又は、ネットワーク経由で配布が可能なものであってもよい。
動画像符号化装置110は、フレームバッファ202と、インループフィルタ204と、インター予測部206と、イントラ予測部208と、変換・量子化部210と、エントロピー符号化部212と、逆量子化・逆変換部214と、減算部218と、加算部220と、ブロック分割部222と、を備える。
ブロック分割部222は、動画像DB108からの動画像データ(video data)に含まれる符号化対象のピクチャ(picture)を複数のブロック(block)に分割する。ブロックのサイズは様々であり、複数のブロックは四分木構造を有する。ブロック分割部222におけるピクチャのブロックへの分割はHEVC(High Efficiency Video Coding、非特許文献1参照)におけるピクチャのブロックへの分割に準じる。ブロック分割部222は処理対象ブロックを減算部218とインター予測部206とイントラ予測部208とに出力する。
インター予測部206には、フレームバッファ202から処理対象ブロックに対応する参照ピクチャが入力される。インター予測部206は、入力された参照ピクチャに基づき、インター予測(inter-prediction、画面間予測)により処理対象ブロックの動き補償画像を出力する。
イントラ予測部208には、処理対象ブロックの周りの符号化済みブロック(既に符号化処理されたブロック)の画像データが加算部220から入力される。イントラ予測部208は、入力された符号化済みブロックの画素値に基づくイントラ予測により、処理対象ブロックの画素の予測値を生成し、出力する。ここで、画素値は輝度値および色差値のうちの少なくともひとつを含む。処理対象ブロックにインター予測を適用するか、イントラ予測を適用するかに応じて、インター予測部206の出力またはイントラ予測部208の出力のいずれか一方が減算部218に出力される。
減算部218は、処理対象ブロックの画素の実際の画素値と、インター予測またはイントラ予測で生成される対応する予測値と、の間で減算を行い、処理対象ブロックの画素の差分値(予測残差信号)を生成する。減算部218は、生成された差分値を変換・量子化部210に出力する。
変換・量子化部210は、減算部218から取得された処理対象ブロックの画素の差分値を変換(例えば、直交変換)および量子化し、レベル値を生成する。変換・量子化部210は、生成されたレベル値をエントロピー符号化部212および逆量子化・逆変換部214に出力する。
エントロピー符号化部212は、変換・量子化部210によって生成されたレベル値と、インター予測部206やイントラ予測部208から取得されるサイド情報と、をエントロピー符号化して、ビットストリームBSを生成する。
なお、サイド情報(side information)は、復号装置において使用される画素値の再構成に必要な情報であり、イントラ予測またはインター予測の何れを使用したかを示す予測モード、イントラ予測において参照ラインを生成したか否かを示す参照フラグ、インター予測における動き情報、量子化パラメータ、ブロックサイズ等の関連情報を含む。イントラ予測を示す予測モードとして、HEVCで規定される35種類のイントラ予測モード(intra prediction mode)を採用する。35種類のイントラ予測モードは、Planarモード、DCモードおよび33種類の方向性モード(directional mode)からなる。33種類の方向性モードはそれぞれ異なる予測方向(prediction direction)を有する。参照フラグは、「1」のとき参照ラインを生成したことを示し、「0」のとき参照ラインを生成していないことを示す。
逆量子化・逆変換部214は、変換・量子化部210における処理とは逆の処理を行って処理対象ブロックの画素の差分値を生成する。
加算部220は、逆量子化・逆変換部214が出力する差分値と、インター予測またはイントラ予測で生成される対応する予測値と、を加算して処理対象ブロックの画素の画素値を再構成する。加算部220は、再構成されたブロックを、イントラ予測部208とインループフィルタ204とに出力する。
インループフィルタ204は、処理対象のフレームに対応する局所復号画像を生成してフレームバッファ202に出力する。フレームバッファ202は、局所復号画像を保持する。この局所復号画像は、インター予測部206におけるインター予測に使用される。
イントラ予測部208についてより詳細に説明する。
イントラ予測部208は、処理対象ブロックの周りの符号化済みブロックの複数のラインを合成することにより、イントラ予測で用いられる参照ラインを生成する。ラインは、所定の方向に沿って並ぶ画素の列であり、1画素幅を有してもよいし、2画素以上の幅を有してもよい。ラインの長さは所定の方向に沿って並ぶ画素の数であってもよい。参照ラインは、イントラ予測において参照される画素すなわち参照画素の列である。生成される参照ラインは、基本的に生成の元となる複数のラインのいずれとも異なる新たなラインであるが、ラインの画素の画素値や合成の仕方によっては生成される参照ラインが複数のラインのいずれかと偶然同じになる可能性はある。
図3は、処理対象ブロック302およびその周りの複数の符号化済みブロック304、306、308、310、312を示す模式図である。ピクチャは左上のブロックから水平方向にジグザグに符号化されていく。したがって、処理対象ブロック302の周りには、処理対象ブロック302の上に接する第2符号化済みブロック306と、処理対象ブロック302の左に接する第5符号化済みブロック312と、第2符号化済みブロック306の左に接する第1符号化済みブロック304と、第2符号化済みブロック306の右に接する第3符号化済みブロック308と、第3符号化済みブロック308の右に接する第4符号化済みブロック310と、がある。
処理対象ブロック302の上の境界302aおよび左の境界302bに接するラインを第1/最近接ライン314と称す。第1/最近接ライン314の処理対象ブロック302とは反対側に規定されるラインを順に第2ライン316、第3ライン318、第4ライン320、…と称す。図3に示される例では第1/最近接ライン314の水平部分は符号化済みブロックに含まれているが、垂直部分の一部は符号化済みブロックからはみ出している。このはみ出している部分314aの画素の画素値は、はみ出す直前の画素の画素値を複製することにより構成される。他のライン316、318、320についても同様である。
図4は、図2のイントラ予測部208における一連の処理の流れを示すフローチャートである。イントラ予測部208は、ブロック分割部222から処理対象ブロックを取得する(S402)。イントラ予測部208は、取得された処理対象ブロックの周りに利用可能な符号化済みブロックがあるか否かを判定する(S404)。あると判定された場合(S404のY)、イントラ予測部208は利用可能な符号化済みブロックから複数、例えばK(Kは2以上の自然数)本のラインを選択する(S406)。図3の例では、第1/最近接ライン314から第4ライン320までの4本のラインが選択されてもよい。イントラ予測部208は、選択されたK本のラインを合成することにより、新たな参照ラインを生成する(S408)。K本のラインの合成は例えば以下の式1で定義されるK本のラインの線形結合であってもよい。
Figure 0006865870
…(式1)
ここで、Anewは新たな参照ラインを表し、A(1,:)、…、A(K,:)は第1/最近接ライン314、…、第Kラインを表す。a、…、aは線形結合の係数である。
なお、ステップS406におけるKの値およびどのラインを選択するかの規則、a、…、aの値は予め決定され、イントラ予測部208および対応する動画像復号装置102のイントラ予測部に与えられる。すなわち、基本的に、同じ処理対象ブロックに対して符号化側のイントラ予測および復号側のイントラ予測で同じ参照ラインが生成される。
イントラ予測部208は、生成された新たな参照ラインAnewと取得された処理対象ブロックの画素の画素値とに基づいて予測方向を決定する(S410)。イントラ予測部208は、可能な予測方向のそれぞれについてコストを算出し、算出されたコストが最小の予測方向を特定してもよい。イントラ予測部208は、生成された新たな参照ラインAnewと決定された予測方向とに基づいて、処理対象ブロックの画素の予測値を生成し、出力する(S412)。イントラ予測部208は、参照フラグ=「1」および予測モード=「決定された予測方向に対応するイントラ予測モード」を含むサイド情報を生成し、エントロピー符号化部212に出力する(S416)。
ステップS404において利用可能な符号化済みブロックがないと判定された場合(S404のN)、イントラ予測部208はイントラ予測モードを、全ての参照サンプルにDC値を採用する所定値モードに設定する(S414)。イントラ予測部208は、参照ラインの画素の画素値を全てDC値(DC_value)すなわち2N−1に置き換える。Nはサンプリングビット深度(sampling bit depth)であり、8であってもよいし、10以上であればより高解像度が実現されうる。イントラ予測部208は、所定値モードの参照ラインに基づいて、処理対象ブロックの画素の予測値を生成し、出力する(S412)。イントラ予測部208は、参照フラグ=「0」および予測モード=「所定値モード」を含むサイド情報を生成し、エントロピー符号化部212に出力する(S416)。ステップS404での判定結果によって新たな参照ラインが生成されるか、または所定値モードが用いられるかが決まるので、ステップS404では、イントラ予測で用いられる参照ラインを複数のラインから生成するか否かが決定されるといえる。
図5は、図1の動画像復号装置102の機能および構成を示すブロック図である。動画像復号装置102は、エントロピー復号部602と、逆量子化・逆変換部604と、加算部606と、インター予測部608と、イントラ予測部610と、フレームバッファ612と、インループフィルタ614と、を備える。動画像復号装置102は、基本的には動画像符号化装置110で行われる手順と逆の手順により、ビットストリームBSから出力動画像データを得る。
エントロピー復号部602は、ネットワーク106を介して配信システム100からビットストリームBSを受信する。エントロピー復号部602は、受信したビットストリームをエントロピー復号し、レベル値とサイド情報とを取り出す。なお、ビットストリームからサイド情報およびレベル値を得る処理はパース(parse)処理と称される。このようにして得られたサイド情報およびレベル値を用いて画素値を再構成することは、復号処理と称される。
逆量子化・逆変換部604は、処理対象ブロックのレベル値を逆量子化および逆変換して処理対象ブロックの画素の差分値を生成する。
加算部606は、処理対象ブロックがイントラ予測されたものであるかインター予測されたものであるかに応じて、インター予測部608またはイントラ予測部610で生成される予測値を取得する。加算部606は、逆量子化・逆変換部604によって生成された差分値と、取得された対応する予測値と、を加算して処理対象ブロックの画素の画素値を再構成する。加算部606は、再構成された処理対象ブロックをイントラ予測部610とインループフィルタ614とに出力する。
インター予測部608には、フレームバッファ612から処理対象ブロックに対応する参照ピクチャが入力される。インター予測部608は、入力された参照ピクチャに基づき、インター予測により処理対象ブロックの動き補償画像を出力する。
イントラ予測部610には、処理対象ブロックの周りの再構成済みブロック(既に復号処理されたブロック、または既に再構成されたブロック)の画像データが加算部606から入力される。イントラ予測部610は、入力された再構成済みブロックの画素値に基づくイントラ予測により、処理対象ブロックの画素の予測値を生成し、出力する。
インループフィルタ614は例えばデブロックフィルタである。インループフィルタ614は、処理対象のフレームに対応する局所復号画像を生成してフレームバッファ612に出力する。この局所復号画像は、インター予測部608におけるインター予測に使用されると同時に、出力動画像データとして表示装置104に出力される。
イントラ予測部610についてより詳細に説明する。
図6は、イントラ予測部610における一連の処理の流れを示すフローチャートである。イントラ予測部610は、エントロピー復号部602で取り出されたサイド情報のうち、処理対象ブロックについてのイントラ予測モードを取得する(S650)。イントラ予測部610は図4のステップS406、S408と同様に再構成済みブロックから複数のラインを選択し(S654)、選択された複数のラインから新たな参照ラインを生成する(S656)。イントラ予測部610は、生成された新たな参照ラインと、ステップS650で取得されたイントラ予測モードが示す予測方向と、に基づいて、処理対象ブロックの画素の予測値を生成し、出力する(S658)。
なお、ステップS654において利用可能な再構成済みブロックがない場合、イントラ予測部610は、参照ラインの画素の画素値を全てDC値(DC_value)すなわち2N−1に置き換える。
本実施の形態に係る配信システム100によると、符号化側、復号側それぞれのイントラ予測において、符号化済み/再構成済みブロックの複数のラインから参照ラインを生成することができる。したがって、処理対象ブロックの周りのブロックの情報をより多く含む参照ラインが実現されるので、イントラ予測の確度を高めることができる。
また、本実施の形態では、符号化側で参照ラインを生成したか否かを示す1bitの参照フラグを生成してビットストリームに含め、復号側は当該参照フラグに基づき参照ラインを生成するか否かを決定する。これに対して、処理対象ブロックの周りのブロックの複数のラインから参照ラインを選択する場合、選択されたラインのインデックス(通常2bit以上)をビットストリームに含める必要がある。したがって、本実施の形態の手法を採用することによる符号量の増大は、参照ラインを選択する場合よりも抑制される。
本実施の形態では、参照フラグを用いて新たな参照ラインを生成するか否かを示す場合を説明したが、これに限られない。例えば、参照フラグを用いる代わりにイントラ予測モードが所定値モードかそうでないかに基づいて新たな参照ラインを生成するか否かを決定してもよい。
本実施の形態において線形結合の係数a、…、aは符号化側および復号側の両方の複雑さを考慮して決定されてもよい。例えば、処理対象ブロックから離れるほど影響が小さくなるよう、a>a>…>aとなるよう決定されてもよい。あるいはまた、最近接ライン付近でオクルージョンが発生している場合、処理対象ブロックから離れたラインの方がより適切となりうる。この場合、ラインと処理対象ブロックとの距離に反比例するよう係数を決定してもよい。例えば、a、a、aをそれぞれ3/16、5/16、8/16に決定してもよい。
(第2の実施の形態)
第1の実施の形態ではイントラ予測における新たな参照ラインの生成の際、式1に示される線形結合を用いる場合を説明した。第2の実施の形態では、新たな参照ラインを生成するための複数のラインを、予測方向を用いて決める。これにより、生成される新たな参照ラインはより多くの有効な情報を含み、より正確なイントラ予測が可能となる。
本実施の形態に係る動画像符号化装置の構成は、イントラ予測部を除いて図2に示される動画像符号化装置110の構成に準じる。図7は、第2の実施の形態に係るイントラ予測部278の機能および構成を示すブロック図である。イントラ予測部278は、粗チェック部702と、候補決定部704と、フルチェック部706と、モード決定部708と、予測値生成部710と、チェック結果保持部712と、を含む。
粗チェック部702は、第1コスト算出方法にしたがい、処理対象ブロックに対する33種類の方向性モードのそれぞれの粗チェックコストを算出する。第1コスト算出方法は、後述の第2コスト算出方法よりもコストの精度は低いが処理の負荷は小さい方法である。第1コスト算出方法は、例えば非特許文献3に記載されるrough mode decision(RMD)であってもよい。粗チェック部702は、算出された粗チェックコストをチェック結果保持部712に登録する。
候補決定部704は、チェック結果保持部712を参照し、33種類の方向性モードのなかからL(Lは2以上32以下の自然数)個の候補方向性モードを決定する。候補決定部704は、粗チェックコストが低い方からL個の方向性モードを候補方向性モードとして決定してもよい。
フルチェック部706は、第2コスト算出方法にしたがい、候補決定部704で決定されたL個の候補方向性モードのそれぞれのフルチェックコストを算出する。第2コスト算出方法は、例えば非特許文献4に記載されるrate−distortion optimizationであってもよい。この場合、フルチェックコストはrate−distortion cost(R−Dコスト)である。フルチェック部706は、候補方向性モードのそれぞれについて、新たな参照ラインを用いる場合と最近接ラインを参照ラインとする場合とで別個にR−Dコストを算出する。フルチェック部706は、算出されたR−Dコストをチェック結果保持部712に登録する。
モード決定部708は、チェック結果保持部712を参照し、L個の候補方向性モードと参照ラインの生成有無との組み合わせのなかから、ひとつの組み合わせを決定する。モード決定部708は、R−Dコストが最小の組み合わせを決定してもよい。
予測値生成部710は、モード決定部708で決定された組み合わせに基づいて、処理対象ブロックの周りの符号化済みブロックから処理対象ブロックの画素の予測値を生成する。
図8は、チェック結果保持部712の一例を示すデータ構造図である。チェック結果保持部712は、参照ラインが最近接ラインか生成されたラインかを示す情報と、イントラ予測モードの種別と、粗チェックコストと、候補とされたか否かを示す情報と、R−Dコストと、を対応付けて保持する。
図9は、図7のイントラ予測部278における一連の処理の流れを示すフローチャートである。イントラ予測部278は、ブロック分割部から処理対象ブロックを取得する(S902)。粗チェック部702は、33の予測方向のなかから、まだ選択されていない予測方向を選択する(S904)。粗チェック部702は、選択された予測方向に対して、処理対象ブロックの周りの符号化済みブロックの最近接ラインを用いた粗チェックを実行する(S906)。チェックされていない予測方向がある場合(S908のN)、処理はステップS904に戻る。全ての予測方向がチェックされた場合(S908のY)、候補決定部704は粗チェックコストに基づいてL個の候補予測方向を決定する(S910)。
フルチェック部706は、L個の候補予測方向のなかから、まだ選択されていない候補予測方向を選択する(S912)。フルチェック部706は、選択された候補予測方向について、処理対象ブロックの周りの符号化済みブロックの最近接ラインを用いてR−Dコストを算出する(S914)。フルチェック部706は、符号化済みブロックからK本のラインを選択する(S916)。フルチェック部706は、選択されたラインのそれぞれについて、選択された候補予測方向に基づいてオフセット値β、…、βを算出する(S918)。 オフセット値β、…、βは正負いずれの値をも取り得る。
図10は、ラインのオフセットを説明するための模式図である。各ラインはそのラインが延びる方向に沿ってオフセットされる。そのオフセット値はステップS912で選択された候補予測方向350に応じた量となる。図10に示される例では、第1/最近接ライン354はオフセットされず、したがって、そのオフセット値βは0である。第2ライン356の水平部分は水平方向右向きにオフセット値βだけオフセットされ、垂直部分は上下方向下向きにオフセット値βだけオフセットされる。なお、候補予測方向によっては同じラインでも水平方向のオフセット値と上下方向のオフセット値とが異なりうる。第3ライン358、第4ライン360については第2ライン356と同様である。
図11(a)、(b)は、オフセット値が整数の場合と小数の場合とを説明する模式図である。オフセット値β、…、βの単位はインデックスであり、定数ではない。例えばβ=2βである。図11(a)は候補予測方向156に応じたオフセット値βが整数、例えば1である場合を示す。水平方向のインデックスidxにおける新たな参照ラインAnewの画素値は、第1/最近接ライン314(A(1,:))のインデックスidxにおける画素150の画素値と、第2ライン316(A(2,:))のインデックスidx+βにおける画素152の画素値と、第3ライン318(A(3,:))のインデックスidx+2βにおける画素154の画素値と、の重み付き線形和を含む。第kラインA(k,:)を図11(a)に示される通りにオフセットして得られるラインA’(k,:)は以下のように表される。
Figure 0006865870
ここで、β=βである。
オフセット値が小数の場合は2つの隣り合う画素の画素値の内挿が用いられる。図11(b)は候補予測方向158に応じたオフセット値βが小数である場合を示す。第kラインA(k,:)を図11(b)に示される通りにオフセットして得られるラインA’(k,:)は以下の様に表される。
Figure 0006865870
A’(2,idx)を表す式として上段のものを用いるか下段のものを用いるかは、候補予測方向の角度による。αはA’(k,idx)とA(k,idx)とが重なり合う部分の比率である。
図9に戻り、フルチェック部706は、算出されたオフセット値β、…、βによりそれぞれオフセットされたK本のラインを合成することにより、新たな参照ラインAnewを生成する(S920)。オフセットされたK本のラインの合成は例えば以下の式2で定義されるK本のラインの線形結合であってもよい。
Figure 0006865870
…(式2)
フルチェック部706は、ステップS912で選択された候補予測方向について、ステップS920で生成された新たな参照ラインを用いてR−Dコストを算出する(S922)。まだフルチェックされていない候補予測方向がある場合(S924のN)、処理はステップS912に戻る。全ての候補予測方向がフルチェックされた場合(S924のY)、モード決定部708はR−Dコストが最小となる候補予測方向と最近接ライン/生成ラインの別との組を特定する(S926)。予測値生成部710は、特定された参照ライン(最近接ラインまたは新たに生成される参照ライン)と予測方向とに基づいて、処理対象ブロックの画素の予測値を生成し、出力する(S928)。予測値生成部710は、ステップS926における決定の結果を示すサイド情報を生成し、エントロピー符号化部に出力する(S928)。
本実施の形態に係る動画像復号装置の構成は、イントラ予測部を除いて図5に示される動画像復号装置102の構成に準じる。本実施の形態に係る復号側のイントラ予測部における処理の流れと図6に示される処理の流れとの主な差異は、本実施の形態では参照フラグが「0」の場合に最近接ラインを参照ラインとすること、新たな参照ラインを生成する際に合成元の各ラインを予測方向に応じてオフセットさせること、である。
図12は、第2の実施の形態に係る復号側のイントラ予測部における一連の処理の流れを示すフローチャートである。ステップS650で取得された参照フラグの値が「1」である場合(S652の「1」)、イントラ予測部は図9のステップS916、S918、S920と同様に複数のラインを選択し(S670)、ステップS650で取得されたイントラ予測モードが示す予測方向に基づいて各ラインのオフセット値を算出し(S672)、オフセットされた複数のラインから新たな参照ラインを生成する(S674)。イントラ予測部は、生成された新たな参照ラインと、予測方向と、に基づいて、処理対象ブロックの画素の予測値を生成し、出力する(S676)。
ステップS652において取得された参照フラグの値が「0」である場合(S652の「0」)、イントラ予測部は処理対象ブロックの周りの再構成済みブロックの最近接ラインを参照ラインとする(S678)。イントラ予測部は最近接ラインと予測方向とに基づいて、処理対象ブロックの画素の予測値を生成し、出力する(S676)。ステップS652での判定結果によって新たな参照ラインが生成されるか、または最近接ラインが参照ラインとして用いられるかが決まるので、ステップS652では、イントラ予測で用いられる参照ラインを複数のラインから生成するか否かが決定されるといえる。
本実施の形態に係る動画像符号化装置、動画像復号装置によると、第1の実施の形態によって奏される作用効果と同様の作用効果が奏される。加えて、予測方向に合わせて合成元のラインをオフセットさせるので、合成により得られる新たな参照ラインを用いたイントラ予測はより正確な予測値を生成することができる。
本実施の形態では、粗チェックの際に最近接ラインを用いる場合を説明したが、これに限られず、粗チェックのために、オフセットされた複数のラインから新たな参照ラインを生成してもよい。
本実施の形態では、新たな参照ラインを生成しない場合は最近接ラインを参照ラインとする場合を説明したが、これに限られず、最近接ライン以外の所定のライン、例えば第2ラインや第3ラインを参照ラインとしてもよい。
(第3の実施の形態)
第1および第2の実施の形態では、a、…、aの値は予め決定され、符号化側、復号側それぞれのイントラ予測部に予め与えられる場合を説明した。第3の実施の形態では、この係数a、…、aを適応的に決定する。
図13は、適応的な線形結合の係数の決定を説明するための模式図である。符号化側のイントラ予測部は、所与の予測方向502に沿って処理対象ブロック504の画素の画素値を足し合わせて平均をとることで、理想的な参照ライン506を生成する。次に、イントラ予測部は、処理対象ブロックの周りの符号化済みブロックの第1ラインA(1,:)、第2ラインA(2,:)、第3ラインA(3,:)の線形結合と理想的な参照ライン506との差が小さくなるように、各ラインに掛け合わせる係数x、x、xを決定する。例えば、係数x、x、xは最小二乗法により決定されてもよい。
本実施の形態に係る動画像符号化装置の構成は、イントラ予測部を除いて図2に示される動画像符号化装置110の構成に準じる。図14は、第3の実施の形態に係る符号化側のイントラ予測部における一連の処理の流れを示すフローチャートである。イントラ予測部は、予測方向を選択する(S450)。イントラ予測部は例えば第2の実施の形態で説明した粗チェックを用いて予測方向を選択してもよい。イントラ予測部は、選択された予測方向における理想的な参照ラインを、処理対象ブロックの実際の画素値から算出する(S452)。イントラ予測部は、利用可能な符号化済みブロックから複数のラインを選択する(S454)。イントラ予測部は、最小二乗法により線形結合の係数を決定する(S456)。図13の例では、係数ベクトルX=(x、x、x)は、bを理想的な参照ライン、Aを選択された複数のラインA(1,:)、A(2,:)、A(3,:)からなる行列とするとき、以下の式3で表される。
Figure 0006865870
…(式3)
イントラ予測部は、決定された係数(x、x、x)に基づいて生成された新たな参照ラインと予測方向とに基づいて、処理対象ブロックの画素の予測値を生成し、出力する(S458)。イントラ予測部は、参照フラグ=「1」および予測モード=「決定された予測方向に対応するイントラ予測モード」および決定された係数(x、x、x)を含むサイド情報を生成し、エントロピー符号化部に出力する(S460)。
第3の実施の形態に係る動画像復号装置の構成は、第1または第2の実施の形態に係る動画像復号装置の構成に準じる。
本実施の形態に係る動画像符号化装置、動画像復号装置によると、第1の実施の形態によって奏される作用効果と同様の作用効果が奏される。加えて、複数のラインから生成される参照ラインは理想的な参照ラインに近いので、合成により得られる新たな参照ラインを用いたイントラ予測はより正確な予測値を生成することができる。
本実施の形態では、サイド情報に係数を入れる分符号量が増えるが、その係数は理想的な参照ラインに近い合成参照ラインを与えるので、予測残差信号の符号量は減る。したがって、予測残差信号の符号量低減効果が勝っていれば、全体の符号量を低減できる。
以上、実施の形態の構成と動作について説明した。これらの実施の形態は例示であり、各構成要素や各処理の組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解される。
100 配信システム、 102 動画像復号装置、 104 表示装置、 106 ネットワーク、 110 動画像符号化装置。

Claims (7)

  1. イントラ予測を用いて符号化されたブロックを含む動画像を表すビットストリームを復号する復号手段と、
    復号の結果得られる前記ブロックのレベル値を逆量子化および逆変換して前記ブロックの画素の差分値を生成する逆処理手段と、
    前記ブロックの周りの再構成済みブロックの画素値に基づくイントラ予測により前記ブロックの画素の予測値を生成するイントラ予測手段と、
    生成された前記差分値および生成された前記予測値に基づいて前記ブロックを再構成する再構成手段と、を備え、
    前記イントラ予測手段は、前記ブロックの周りの再構成済みブロックの複数のラインを線形結合により合成することにより、前記イントラ予測で用いられる参照ラインを生成する動画像復号装置であって、
    前記イントラ予測手段が前記複数のラインを線形結合により合成する際、前記複数のラインのそれぞれはそのラインが延びる方向に沿って前記イントラ予測における予測方向に応じた量だけオフセットされる、
    動画像復号装置。
  2. イントラ予測を用いて符号化されたブロックを含む動画像を表すビットストリームを復号する復号手段と、
    復号の結果得られる前記ブロックのレベル値を逆量子化および逆変換して前記ブロックの画素の差分値を生成する逆処理手段と、
    前記ブロックの周りの再構成済みブロックの画素値に基づくイントラ予測により前記ブロックの画素の予測値を生成するイントラ予測手段と、
    生成された前記差分値および生成された前記予測値に基づいて前記ブロックを再構成する再構成手段と、を備え、
    前記イントラ予測手段は、前記ブロックの周りの再構成済みブロックの複数のラインを線形結合により合成することにより、前記イントラ予測で用いられる参照ラインを生成する動画像復号装置であって、
    前記イントラ予測手段が前記複数のラインを線形結合により合成する際の規則は、前記ブロックの符号化において、予測方向と実際の画素値とから得られる理想的な参照ラインと前記複数のラインを線形結合により合成することにより生成される参照ラインとの差が小さくなるよう決定される、
    動画像復号装置。
  3. イントラ予測を用いて符号化されたブロックを含む動画像を表すビットストリームを復号する復号ステップと、
    復号の結果得られる前記ブロックのレベル値を逆量子化および逆変換して前記ブロックの画素の差分値を生成する逆処理ステップと、
    前記ブロックの周りの再構成済みブロックの画素値に基づくイントラ予測により前記ブロックの画素の予測値を生成するイントラ予測ステップと、
    生成された前記差分値および生成された前記予測値に基づいて前記ブロックを再構成する再構成ステップと、を含み、
    前記イントラ予測ステップは、前記ブロックの周りの再構成済みブロックの複数のラインを線形結合により合成することにより、前記イントラ予測で用いられる参照ラインを生成するステップを含む動画像復号方法であって、
    前記イントラ予測ステップが前記複数のラインを線形結合により合成する際、前記複数のラインのそれぞれはそのラインが延びる方向に沿って前記イントラ予測における予測方向に応じた量だけオフセットされる、
    動画像復号方法。
  4. イントラ予測を用いて符号化されたブロックを含む動画像を表すビットストリームを復号する復号ステップと、
    復号の結果得られる前記ブロックのレベル値を逆量子化および逆変換して前記ブロックの画素の差分値を生成する逆処理ステップと、
    前記ブロックの周りの再構成済みブロックの画素値に基づくイントラ予測により前記ブロックの画素の予測値を生成するイントラ予測ステップと、
    生成された前記差分値および生成された前記予測値に基づいて前記ブロックを再構成する再構成ステップと、を含み、
    前記イントラ予測ステップは、前記ブロックの周りの再構成済みブロックの複数のラインを線形結合により合成することにより、前記イントラ予測で用いられる参照ラインを生成するステップを含む動画像復号方法であって、
    前記イントラ予測ステップが前記複数のラインを線形結合により合成する際の規則は、前記ブロックの符号化において、予測方向と実際の画素値とから得られる理想的な参照ラインと前記複数のラインを線形結合により合成することにより生成される参照ラインとの差が小さくなるよう決定される、
    動画像復号方法。
  5. 動画像のブロックの周りの符号化済みブロックの画素値に基づくイントラ予測により前記ブロックの画素の予測値を生成するイントラ予測手段と、
    生成された前記予測値に基づいて前記ブロックの画素の差分値を生成する差分生成手段と、
    生成された前記差分値を変換および量子化し、レベル値を生成する処理手段と、
    生成されたレベル値を符号化してビットストリームを生成する符号化手段と、を備え、
    前記イントラ予測手段は、前記ブロックの周りの符号化済みブロックの複数のラインを線形結合により合成することにより、前記イントラ予測で用いられる参照ラインを生成する動画像符号化装置であって、
    前記イントラ予測手段が前記複数のラインを線形結合により合成する際の規則は、予測方向と実際の画素値とから得られる理想的な参照ラインと前記複数のラインを線形結合により合成することにより生成される参照ラインとの差が小さくなるよう決定される、
    動画像符号化装置。
  6. 動画像のブロックの周りの符号化済みブロックの画素値に基づくイントラ予測により前記ブロックの画素の予測値を生成するイントラ予測ステップと、
    生成された前記予測値と対応する画素値とに基づいて前記ブロックの画素の差分値を生成する差分生成ステップと、
    生成された前記差分値を変換および量子化し、レベル値を生成する処理ステップと、
    生成されたレベル値を符号化してビットストリームを生成する符号化ステップと、を含み、
    前記イントラ予測ステップは、前記ブロックの周りの符号化済みブロックの複数のラインを線形結合により合成することにより、前記イントラ予測で用いられる参照ラインを生成するステップを含む動画像符号化方法であって、
    前記イントラ予測ステップが前記複数のラインを線形結合により合成する際の規則は、予測方向と実際の画素値とから得られる理想的な参照ラインと前記複数のラインを線形結合により合成することにより生成される参照ラインとの差が小さくなるよう決定される、
    動画像符号化方法。
  7. 請求項1から2のいずれか1項に記載の動画像復号装置または請求項5に記載の動画像符号化装置としてコンピュータを機能させるプログラムを有することを特徴とするコンピュータ可読記録媒体。
JP2020030864A 2020-02-26 2020-02-26 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体 Active JP6865870B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020030864A JP6865870B2 (ja) 2020-02-26 2020-02-26 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020030864A JP6865870B2 (ja) 2020-02-26 2020-02-26 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016184653A Division JP6669622B2 (ja) 2016-09-21 2016-09-21 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体

Publications (2)

Publication Number Publication Date
JP2020102858A JP2020102858A (ja) 2020-07-02
JP6865870B2 true JP6865870B2 (ja) 2021-04-28

Family

ID=71140042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020030864A Active JP6865870B2 (ja) 2020-02-26 2020-02-26 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体

Country Status (1)

Country Link
JP (1) JP6865870B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007300380A (ja) * 2006-04-28 2007-11-15 Ntt Docomo Inc 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
CN101682774B (zh) * 2007-02-23 2013-07-24 日本电信电话株式会社 视频编码方法和解码方法、视频编码装置和解码装置
JP2013141187A (ja) * 2012-01-06 2013-07-18 Sony Corp 画像処理装置及び画像処理方法
WO2014171713A1 (ko) * 2013-04-15 2014-10-23 인텔렉추얼 디스커버리 주식회사 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치
CN116708774A (zh) * 2016-07-18 2023-09-05 韩国电子通信研究院 图像编码/解码方法和装置以及存储比特流的记录介质

Also Published As

Publication number Publication date
JP2020102858A (ja) 2020-07-02

Similar Documents

Publication Publication Date Title
KR101971077B1 (ko) 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR102046520B1 (ko) 스킵 모드를 이용한 영상 복호화 방법 및 이러한 방법을 사용하는 장치
JP5061179B2 (ja) 照明変化補償動き予測符号化および復号化方法とその装置
US20060012719A1 (en) System and method for motion prediction in scalable video coding
JP2008507190A (ja) 動き補償方法
KR20080088040A (ko) 영상의 부호화, 복호화 방법 및 장치
KR101442608B1 (ko) 영상을 효율적으로 부호화/복호화하는 방법 및 장치
KR20080064355A (ko) 영상의 예측 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP6669622B2 (ja) 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
KR102518627B1 (ko) 이미지 인코딩 방법, 디코딩방법, 인코더 및 디코더
WO2019069602A1 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、プログラムおよび映像システム
KR20180028428A (ko) 적응적 예측 블록 필터링을 이용한 영상 부호화/복호화 장치 및 방법
JP6865870B2 (ja) 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
JP6539580B2 (ja) インター予測装置、インター予測方法、動画像符号化装置、動画像復号装置及びコンピュータ可読記録媒体
JP2018107692A (ja) 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
KR20170122351A (ko) 화면 내 예측 방향성에 따른 적응적 부호화 순서를 사용하는 비디오 코딩 방법 및 장치
KR101802304B1 (ko) 하다마드 변환을 이용한 부호화 방법 및 이러한 방법을 사용하는 장치
JP2013187583A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
JP2019075678A (ja) 画像符号化装置、画像復号装置、画像符号化プログラム、及び画像復号プログラム
JP2018032913A (ja) 映像符号化装置、プログラム及び方法、並びに、映像復号装置、プログラム及び方法、並びに、映像伝送システム
WO2012141500A2 (ko) 스킵 모드를 이용한 영상 복호화 방법 및 이러한 방법을 사용하는 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200319

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210303

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210309

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210406

R150 Certificate of patent or registration of utility model

Ref document number: 6865870

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150