JP2020058068A - 画像符号化装置、画像符号化方法及びコンピュータプログラム - Google Patents

画像符号化装置、画像符号化方法及びコンピュータプログラム Download PDF

Info

Publication number
JP2020058068A
JP2020058068A JP2019230776A JP2019230776A JP2020058068A JP 2020058068 A JP2020058068 A JP 2020058068A JP 2019230776 A JP2019230776 A JP 2019230776A JP 2019230776 A JP2019230776 A JP 2019230776A JP 2020058068 A JP2020058068 A JP 2020058068A
Authority
JP
Japan
Prior art keywords
reliability
encoding
search
image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019230776A
Other languages
English (en)
Other versions
JP6849781B2 (ja
Inventor
忍 工藤
Shinobu Kudo
忍 工藤
淳 清水
Atsushi Shimizu
淳 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2019230776A priority Critical patent/JP6849781B2/ja
Publication of JP2020058068A publication Critical patent/JP2020058068A/ja
Application granted granted Critical
Publication of JP6849781B2 publication Critical patent/JP6849781B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】画像の符号化に係る演算量の削減を、予測精度の低下を抑制しつつ実現することができる画像符号化装置を提供する。【解決手段】画像符号化装置は、対象画像の符号化に関する符号化パラメータであって、符号化対象ブロックのMPM(Most Probable Mode)を取得する第一ステップの処理を実行する第一処理部と、対象画像の符号化方式は、対象画像を複数のブロックに分割して符号化する方式とし、符号化対象ブロックに隣接するブロックの符号化モードに基づいて符号化パラメータの信頼度を取得する信頼度取得部と、信頼度に基づいて、符号化対象ブロックの探索処理の処理レベルを決める制御部と、探索処理の処理レベルに基づき、符号化対象ブロックのイントラ予測モードを決定する第二ステップの処理を実行する第二処理部と、を備える。【選択図】図6

Description

本発明は、画像(映像を含む)を符号化する技術に関する。
映像符号化の標準規格としてH.264/AVCやH.265/HEVC等の映像符号化方式が策定されている。HEVCでは、符号化対象のピクチャがLCU(Largest Coding Unit)と呼ばれるブロックに分割され、分割されたLCUごとに符号化が行われる。LCUは、四分木で最大3回まで更に分割することができ、最大で64×64画素、最小で8×8画素からなるCU(Coding Unit)と呼ばれるブロックで構成される。以下、n×n画素(nは8の倍数)からなるブロックをn×nと略記する。
各CUの符号化には、イントラ予測モードや、インター予測モード、ベクトル予測モード、マージモード、スキップモード等の複数の予測モードを用いることができる。イントラ予測モードは、符号化対象のブロック(以下「対象ブロック」という。)に隣接する符号化済みの画素に基づいて対象ブロック内の画素値を予測する予測モードである。インター予測モードは、符号化済みのフレームに基づいて対象ブロック内の画素値を予測する予測モードである。更に、インター予測モードには、差分動きベクトルを符号化する適応動きベクトル予測モードや、差分動きベクトルを伝送しないマージモード、マージモードで更に残差符号化係数も符号化しないスキップモード等の予測モードが規定されている。
また、イントラ予測モードでは、予測方向を35パターンの中から選ぶことができ、適応動きベクトル予測モードでは予測方向を3パターンの中から選ぶことができる。更に、適応動きベクトル予測モードでは、動きベクトルを画面内の範囲から任意に決定することができる。このように、符号化に関する種々のパラメータ(以下「符号化パラメータ」という。)を膨大な選択肢の中から決定しなければならないことから、HEVCには符号化パラメータの決定に長い時間を要してしまうという問題があった。非特許文献1には、このような問題に対して様々な高速化が図られた基本参照ソフトウェアHM(以下「従来技術」という。)が記載されている。以下、従来技術を構成する2つの代表的なアルゴリズムである動き探索アルゴリズム及びイントラ予測モード決定アルゴリズムについて説明する。
(動き探索アルゴリズム)
動き探索アルゴリズムは、動きベクトルを探索するアルゴリズムである。動きベクトルは、水平成分及び垂直成分の値を持つ2次元ベクトルとして抽出される。従来技術の動き探索アルゴリズムは以下の手順で実施される。
ステップS1. 片方向予測(L0/L1)
ステップS1−1. 探索開始点の決定
ステップS1−2. 整数画素精度探索
ステップS1−3. 小数画素精度探索
ステップS2. 双方向予測(Bi)
ステップS2−1. 探索開始点の決定
ステップS2−2. 整数画素精度探索
ステップS2−3. 小数画素精度探索
ステップS3. コスト比較
動き探索では、まず片方向予測が実施される(ステップS1)。片方向予測では、予測動きベクトル(PMV:Predicted Motion Vector)、隣接ブロックの動きベクトル、ゼロベクトルを候補として、それぞれのSAD(Sum of Absolute Differences)ベースのコスト評価によって探索開始点となる動きベクトルが決定される。このとき、コスト最小の動きベクトルが探索開始点に決定される(ステップS1−1)。
次に、決定された探索開始点を起点として、SADベースのコストに基づくダイヤモンドサーチ(或いはラスターサーチ)が実施される。ここで探索されたコスト最小の動きベクトルを起点として、再度ダイヤモンドサーチが実施される。そして、再度のダイヤモンドサーチによって探索されたコスト最小の動きベクトルが整数画素精度での最適な動きベクトル(以下「最適ベクトル」という。)に決定される(ステップS1−2)。
次に、決定された整数画素精度の最適ベクトルを起点として、SATD(Sum of Absolute Transformed Differences)ベースのコスト評価に基づく小数画素精度での探索(1/2画素精度→1/4画素精度の順にステップサーチ)が実施される。そして、小数画素精度での探索においてコスト最小の動きベクトルが、片方向予測の最終的な予測結果を示す動きベクトルとして決定される(ステップS1−3)。片方向予測では、これらの一連の探索処理がL0方向とL1方向のそれぞれについて実施される。
次に、双方向予測が実施される(ステップS2)。双方向予測におけるL1方向の探索は、L0方向の動きベクトルが、片方向予測の(整数画素精度での)探索結果に固定された状態で実施される。このとき、整数画素精度での探索と小数画素精度での探索とは、片方向予測と同様に行われる(ステップS2−1〜S2−3)。一方、双方向予測におけるL0方向の探索は、L1方向の動きベクトルが片方向予測の探索結果に固定された状態で実施される。双方向予測では、L0方向及びL1方向の探索結果のうち、より低コストである方の探索結果が最終的な予測結果を示す動きベクトルとして決定される。
最後に、片方向予測及び双方向予測の予測結果のうち、より低コストである方の予測結果が、動き探索アルゴリズムによる最終的な予測方向として決定される。続いて、イントラ予測モード決定アルゴリズムについて説明する。
(イントラ予測モード決定アルゴリズム)
イントラ予測モード決定アルゴリズムは、イントラ予測に用いる予測モードを決定するアルゴリズムである。従来のイントラ予測モード決定アルゴリズムは以下の手順で実施される。
ステップS1. SATDベースの最適化による候補モードの絞込
ステップS2. MPM(Most Probable Mode)の算出
ステップS3. RD(Rate Distortion)最適化
まず、全てのイントラ予測モードについてのSATDベースのコスト評価によって、候補モードの絞り込みが実施される。次に、対象ブロックのMPMが算出される。MPMは3つの予測モードで構成され、下記の3パターンで算出される。ここで、対象ブロックの左隣のブロックのイントラ予測モードを“A”、上隣のブロックのイントラ予測モードを“B”とする。ただし、隣接ブロックが符号化されてない等の理由で参照できない場合は“0”とする。なお、以下の各パターンの説明において、「a%b」の記載はaをbで除した余り(剰余)を表す。
(パターン1)A=Bで且つ2未満の場合
MPM[0]=0
MPM[1]=1
MPM[2]=26
(パターン2)A=Bで且つ2以上の場合
MPM[0]=A(=B)
MPM[1]=2+(A+29)%32
MPM[2]=2+(A−2+1)%32
(パターン3)A≠Bの場合
MPM[0]=A
MPM[1]=B
MPM[2]=if(A≠B≠0)0,
else if(A≠B≠1)1,
else 26
以上がステップS1の処理である。最後にステップS1で絞り込まれた候補モードとMPMとについてRDベースのコスト評価を実施し(ステップS2)、コスト最小のモードを最終的な予測モードとして決定する(ステップS3)。
株式会社インプレスジャパン,"インプレス標準教科書シリーズ H.265/HEVC教科書," 2013年,P239,P245−248
このように、動き探索アルゴリズムでは、対象ブロックの周囲のブロックから得られる参照動きベクトルのうちコスト最小の動きベクトルを探索開始点とすることで探索点の削減が図られている。しかしながら、このような探索点開始点の決定方法では、参照動きベクトルのそれぞれについてコストを算出する必要があるため演算コストが大きい。また、コストが最小である動きベクトルが必ずしも最適な探索開始点であるとは限らず、参照動きベクトルの中にローカルミニマムとなるベクトルが存在する場合には最適な動きベクトルに到達できない可能性もある。
また、イントラ予測モード決定アルゴリズムでは、全ての予測モードに対してコストを算出する必要があるため演算コストが大きい。そこで、MPMが、選ばれやすい予測モードであることに着目してMPMとその周囲の予測モードについてのみコストを算出する方法が考えられる。しかしながら、MPMの算出時に追加されるモード(0、1、26)は一般的な映像の中で出現頻度が高いモードであるという理由で追加されているだけであり、MPM以外の予測モードの出現頻度が高い映像に対しては必ずしも相関があるとは言えない。そのため、この方法を適用すると著しく符号化効率が低下する可能性があった。
このように、従来の符号化技術は、画像の性質を前提として予め規定された動作に従って参照情報を得る処理や、プロトコルの仕様として予め定められた値を参照情報とする動作が存在する。そのような動作により得られた参照情報は符号化対象画像との相関が必ずしも高いとは限らず、符号化歪みや演算量の増大を引き起こす場合がある。
上記事情に鑑み、本発明は、画像の符号化に係る演算量の削減を、予測精度の低下を抑制しつつ実現することができる技術を提供することを目的としている。
本発明の一態様は、画像の符号化に関する複数ステップの処理を実行する画像符号化装置であって、前記複数ステップの処理のうち、対象画像の符号化に関する符号化パラメータを取得する第一ステップの処理を実行する第一処理部と、前記複数ステップの処理のうち、前記第一ステップの後段で実行されるステップであって、前記符号化パラメータに基づく第二ステップの処理を実行する第二処理部と、前記符号化パラメータの性質を示す情報であって、符号化方式の制約に基づいて定められる性質情報を取得する性質情報取得部と、前記符号化パラメータと前記性質情報とに基づいて前記符号化パラメータの信頼度を取得する信頼度取得部と、前記第二ステップの処理を前記信頼度に基づいて制御する制御部と、を備える。
本発明の一態様は、上記の画像符号化装置であって、前記第一ステップの処理は符号化対象ブロックの画像から動きベクトルを取得する処理であり、前記第二ステップの処理は最適な動きベクトルである最適ベクトルを探索する処理であり、前記制御部は、前記信頼度に基づいて前記最適ベクトルの探索に要する処理量を制御する。
本発明の一態様は、上記の画像符号化装置であって、前記信頼度取得部は、動き探索の有無、予測モードの種別又はスケーリングの有無に基づいて前記符号化パラメータの信頼度を取得し、前記制御部は、前記信頼度の高さに応じた符号化パラメータを選択することで、前記最適ベクトルの探索に係る処理量及び処理精度を制御する。
本発明の一態様は、上記の画像符号化装置であって、前記第一ステップの処理はMPM(Most Probable Mode)を取得する処理であり、前記第二ステップの処理は前記MPMに基づいてイントラ予測モードを決定する処理であり、前記制御部は、前記第二ステップの処理において決定される前記イントラ予測モードの精度を制御する。
本発明の一態様は、上記の画像符号化装置であって、前記第二ステップの処理における対象画像の符号化方式は、前記対象画像を複数のブロックに分割して符号化する方式であり、前記信頼度取得部は、符号化対象ブロックに隣接するブロックの符号化モードに基づいて前記符号化パラメータの信頼度を取得する。
本発明の一態様は、画像の符号化に関する複数ステップの処理を実行する画像符号化装置が行う画像符号化方法であって、前記複数ステップの処理のうち、対象画像の符号化に関する符号化パラメータを取得する第一ステップの処理を実行する第一処理ステップと、前記複数ステップの処理のうち、前記第一ステップの後段で実行されるステップであって、前記符号化パラメータに基づく第二ステップの処理を実行する第二処理ステップと、前記符号化パラメータの性質を示す情報であって、符号化方式の制約に基づいて定められる性質情報を取得する性質情報取得ステップと、前記符号化パラメータと前記性質情報とに基づいて前記符号化パラメータの信頼度を取得する信頼度取得ステップと、前記第二ステップの処理を前記信頼度に基づいて制御する制御ステップと、を有する。
本発明の一態様は、上記の画像符号化装置としてコンピュータを機能させるためのコンピュータプログラムである。
本発明の一態様は、画像の符号化に関する複数ステップの処理を実行する画像符号化装置であって、対象画像の符号化に関する符号化パラメータであって、符号化対象ブロックのMPM(Most Probable Mode)を取得する第一ステップの処理を実行する第一処理部と、対象画像の符号化方式は、前記対象画像を複数のブロックに分割して符号化する方式とし、前記符号化対象ブロックに隣接するブロックの符号化モードに基づいて前記符号化パラメータの信頼度を取得する信頼度取得部と、前記信頼度に基づいて、前記符号化対象ブロックの探索処理の処理レベルを決める制御部と、前記探索処理の処理レベルに基づき、前記符号化対象ブロックのイントラ予測モードを決定する第二ステップの処理を実行する第二処理部と、を備える画像符号化装置である。
本発明の一態様は、画像の符号化に関する複数ステップの処理を実行する画像符号化装置が行う画像符号化方法であって、対象画像の符号化に関する符号化パラメータであって、符号化対象ブロックのMPM(Most Probable Mode)を取得する第一ステップの処理を実行する第一処理ステップと、対象画像の符号化方式は、前記対象画像を複数のブロックに分割して符号化する方式とし、前記符号化対象ブロックに隣接するブロックの符号化モードに基づいて前記符号化パラメータの信頼度を取得する信頼度取得ステップと、前記信頼度に基づいて、前記符号化対象ブロックの探索処理の処理レベルを決める制御ステップと、前記探索処理の処理レベルに基づき、前記符号化対象ブロックのイントラ予測モードを決定する第二ステップの処理を実行する第二処理ステップと、を有する画像符号化方法である。
本発明の一態様は、上記の画像符号化装置としてコンピュータを機能させるためのコンピュータプログラムである。
本発明により、画像の符号化に係る演算量の削減を、予測精度の低下を抑制しつつ実現することが可能となる。
第1の実施形態における映像符号化装置1の構成例を示す図である。 第1の実施形態における動きベクトル検出部111の構成例を示す図である。 動きベクトルを決定する処理の流れを示すフローチャートである。 第1の実施形態における映像符号化装置1の動作例を示す図である。 第2の実施形態における映像符号化装置1aの構成例を示す図である。 第2の実施形態におけるイントラ予測モード決定部120の構成例を示す図である。 イントラ予測モードを決定する処理の流れを示すフローチャートである。 第2の実施形態における映像符号化装置1aの動作例を示す図である。
以下、本発明の実施形態について説明するが、実施形態の映像符号化装置が準拠する標準規格は特定の標準規格に限定されない。以下では、その一例として、H.265/HEVCに準拠する映像符号化装置の実施形態について説明する。
<第1の実施形態>
図1は、第1の実施形態における映像符号化装置1の構成例を示す図である。映像符号化装置1には、符号化対象として入力される映像をなす時系列の画像データ(以下「入力画像」という。)がCUブロックごとに入力される。映像符号化装置1は、入力画像をCUブロックごとに符号化する。このCUブロックごとの符号化処理がラスタスキャンの順に繰り返し実行されることで、入力画像全体が符号化される。
映像符号化装置1(画像符号化装置の一例)は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、プログラムを実行する。映像符号化装置1は、プログラムの実行によって減算器101、直交変換/量子化部102、可変長符号化部103、逆量子化/逆直交変換部104、加算器105、ループフィルタ部106、復号ピクチャメモリ107、イントラ予測部108、インター予測部109、イントラ/インター切り替えスイッチ110及び動きベクトル検出部111を備える装置として機能する。なお、映像符号化装置1の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。プログラムは、電気通信回線を介して送信されてもよい。
減算器101には、映像符号化装置1に入力された入力画像と、イントラ予測部108又はインター予測部109から出力される画像(以下「予測画像」という。)と、が入力される。減算器101は、入力画像と予測画像との差分によって表される差分画像を取得する。減算器101は、取得した差分画像を直交変換/量子化部102に出力する。
直交変換/量子化部102は、減算器101から出力された差分画像に対して直交変換及び量子化を施す。直交変換/量子化部102は、直交変換及び量子化を施した差分画像(以下「変換画像」という。)を、可変長符号化部103及び逆量子化/逆直交変換部104に出力する。
可変長符号化部103は、直交変換/量子化部102から出力された変換画像を可変長符号化する。この可変長符号化によって、入力画像の符号化データが生成される。可変長符号化部103は、生成した符号化データを出力する。
逆量子化/逆直交変換部104は、直交変換/量子化部102から出力された変換画像に対して逆量子化及び逆直交変換を施す。逆量子化/逆直交変換部104は、逆量子化及び逆直交変換を施した変換画像(以下「逆変換画像」という。)を加算器105に出力する。
加算器105は、逆量子化/逆直交変換部104から出力された逆変換画像と予測画像との和によって表される加算画像を、イントラ予測部108及びループフィルタ部106に出力する。
ループフィルタ部106は、加算器105から出力された加算画像にループフィルタを適用する。ループフィルタ部106は、ループフィルタが適用された加算画像(以下「復号画像」という。)を復号ピクチャメモリ107に出力する。
復号ピクチャメモリ107は、ループフィルタ部106の出力を格納する。復号ピクチャメモリ107に格納された復号画像は、インター予測部109及び動きベクトル検出部111に出力される。復号画像は、符号化対象ブロックのインター予測及び動きベクトルの検出時に参照画像として利用される。
イントラ予測部108は、加算器105から出力された加算画像を参照画像として、イントラ予測に基づく符号化対象ブロックの予測画像(以下「イントラ予測画像」という。)を生成する。
インター予測部109は、復号ピクチャメモリ107から出力される復号画像を参照画像として、インター予測に基づく符号化対象ブロックの予測画像(以下「インター予測画像」という。)を生成する。具体的には、インター予測部109は、動きベクトル検出部111から出力される動きベクトルと、参照画像である復号画像とに基づいてインター予測画像を生成する。
イントラ/インター切り替えスイッチ110は、符号化対象ブロックの予測モードに応じて、入力をイントラ予測部108又はインター予測部109に切り替えるスイッチである。イントラ/インター切り替えスイッチ110は、スイッチの切り替えによりイントラ予測部108又はインター予測部109から出力される予測画像を減算器101及び加算器105に出力する。
動きベクトル検出部111は、入力画像と復号ピクチャメモリから出力される参照画像(復号画像)とを用いて動きベクトルを検出する。動きベクトル検出部111は、検出した動きベクトルをインター予測部109に出力する。
図2は、第1の実施形態における動きベクトル検出部111の構成例を示す図である。動きベクトル検出部111は、動きベクトルメモリ112、信頼度情報メモリ113、探索制御部114及び動き探索部115を備える。
動きベクトルメモリ112は、動き探索部115から出力される動きベクトルを格納する。動きベクトルメモリ112に格納された動きベクトルは、探索制御部114によって参照される。
信頼度情報メモリ113は、動き探索部115から出力される信頼度情報を格納する。信頼度情報メモリ113に格納された信頼度情報は、探索制御部114によって参照される。信頼度情報は、画像の符号化に関するパラメータ(以下「符号化パラメータ」という。)の信頼性の高さ(以下「信頼度」という。)を表す情報である。信頼度は、符号化パラメータと、符号化パラメータの性質を示す性質情報とに基づいて決定される。性質情報は、符号化パラメータの取得方法や取得時に求まる値など、符号化方式の制約に基づいて定められる情報であればどのような情報であってもよい。以下、動きベクトルの信頼性の高さを信頼度と定義した場合の具体例について説明するが、その他、動きベクトル算出時の最小コストや、予測モードが選択された時の最適化方法、対象ブロックのRDコスト等が信頼度と定義されてもよい。本実施形態では、一例として下記2つの信頼度を定義する。
[第1の信頼度]
第1の信頼度は、動きベクトルの算出方法に基づいて定義される。この場合、動きベクトルが符号化パラメータであり、動きベクトルの算出方法が性質情報となる。このように定義された第1の信頼度は、次の二値のうちのいずれかの値を取り得る。
…動き探索により算出
…動き探索以外の方法により算出
[第2の信頼度]
第2の信頼度は、動きベクトルが用いられているブロックの予測モードに基づいて定義される。この場合、動きベクトルが符号化パラメータであり、動きベクトルが用いられているブロックの予測モードが性質情報となる。このように定義された第2の信頼度は、次の三値のうちのいずれかの値を取り得る。
…適応動きベクトル予測モード
…マージモード
…スキップモード
探索制御部114は、動きベクトルメモリ112に格納された動きベクトルと、信頼度情報メモリ113に格納された信頼度情報とに基づいて、動き探索部115の探索開始点の決定及び処理レベルを制御する。
動き探索部115は、入力画像及び参照画像と、探索制御部114の制御情報とに基づいて動き探索を実行する。動き探索部115は、動き探索の実行によって、対象ブロックの動きベクトルを決定する。動き探索部115は、決定した動きベクトルを動きベクトルメモリ112に出力する。また、動き探索部115は、決定した動きベクトルの信頼度を算出し、算出した信頼度を示す信頼度情報を信頼度情報メモリ113に出力する。
図3は、動きベクトルを決定する処理の流れを示すフローチャートである。動きベクトルの決定は動き探索部115によって実行される。まず、動き探索部115は、検出済み動きベクトルに基づき、対象ブロックの各予測方向(L0/L1)についての予測動きベクトル(以下「PMV」と記載する。)を算出する(ステップS101)。動き探索部115は、対象ブロックの各予測方向(L0/L1)のそれぞれについて2つずつのPMVを算出する。PMVの算出方法はHEVCの規格に準ずる。
次に、動き探索部115は、各PMVの信頼度を評価する(ステップS102)。動き探索部115は、上記の信頼度情報に基づいて各PMVの信頼度を評価する。例えば、上記の第1及び第2の信頼度に基づく場合、動き探索部115は次に示すような評価方法で信頼度を評価してもよい。
[信頼度の評価方法]
(ケース1)第1の信頼度が異なる場合
この場合、動き探索部115は、第1の信頼度Aを持つPMVの信頼度は、Aを持つPMVの信頼度よりも高いと判定する。
(ケース2)第1の信頼度が等しい場合
この場合、動き探索部115は、スケーリングしていないPMVの信頼度が、スケーリングしているPMVの信頼度よりも高いと判定する。ここでいうスケーリングとは、PMVの算出時において、参照画像間距離が異なる場合に実施される動きベクトルのスケーリング処理を表す。
(ケース3)ケース1及びケース2の両方で信頼度が同じ場合
この場合、動き探索部115は、第2の信頼度に基づいて信頼度を評価する。具体的には、動き探索部115は、第2の信頼度Bを持つPMV、Bを持つPMV、Bを持つPMVの順に信頼度が高いと判定する。
探索制御部114は、このような信頼度の評価に基づいて、動き探索部115の探索開始点及び処理レベルを決定する(ステップS103)。
具体的には、探索制御部114は、PMVのいずれかの第1の信頼度がAであれば、その中で最も信頼度の高いPMV(以下「BestPMV」という。)を探索開始点に決定する。なお、探索制御部114は、各PMVの信頼度が同じ場合にはインデックスの小さい方のPMVを探索開始点に決定してもよい。また、探索制御部114は、各PMVの信頼度がいずれもAである場合には各PMVのコスト評価に基づいて探索開始点を決定してもよい。この場合、探索制御部114はコスト最小のPMVを探索開始点に決定する。なお、ここでいうコストとは、対象ブロックと参照ブロックとの間の絶対誤差の和である。
また、探索制御部114は、BestPMVの信頼度に応じて処理レベルを決定する。本実施例では次のようにBestPMVの信頼度が高いほど処理量が少なくなるように処理レベルが制御される。
[片方向探索における処理レベルの定義]
(ケース1)BestPMVの信頼度がAである場合
この場合、探索制御部114は、探索処理の処理レベルを小数画素精度と決定する。この処理レベルの決定により、対象ブロックの片方向探索において小数画素精度の探索が実施される。
(ケース2)BestPMVの信頼度がAである場合
この場合、探索制御部114は、探索処理の処理レベルを整数画素精度と決定する。この処理レベルの決定により、対象ブロックの片方向探索において、整数画素精度の探索と小数画素精度の探索との両方が実施される。
[双方向探索における処理レベルの定義]
(ケース1)各予測方向のBestPMVの信頼度のうちの低い方がAである場合 この場合、探索制御部114は、信頼度が高い方を固定し、信頼度が低い方について小数画素精度の探索が実施されるように処理レベルを制御する。
(ケース2)各予測方向のBestPMVの信頼度のうちの低い方がAである場合 この場合、探索制御部114は、信頼度が高い方を固定し、信頼度の低い方について整数画素精度の探索と小数画素精度の探索との両方が実施されるように処理レベルを制御する。なお、双方向探索では、ケース1及びケース2のいずれにおいても、探索開始点は片方向探索の結果に基づいて決定される。
このように決定された探索開始点及び処理レベルに基づいて、動き探索部115は動き探索を実施する(ステップS104)。具体的には、動き探索部115は、各探索点のコストが最小となる点を対象ブロックの最適な動きベクトル(最適ベクトル)として決定する。ここでのコストは、動きベクトル残差の符号化コストと、絶対誤差の和との重み付け和である。
図4は、第1の実施形態における映像符号化装置1の動作例を示す図である。図4(A)はPMVの算出例を示す図である。また、図4(B)は、図4(A)に示すPMVに基づいて決定された探索開始点及び処理レベルの具体例を示す図である。ここで、PMVが図4(A)のように算出された場合の探索制御部114の動作として、まず信頼度の評価が行われる。図4(A)の場合、L0方向においてはインデックス0のPMVの信頼度(A)がインデックス1のPMVの信頼度(A)よりも高い。この場合、探索制御部114は、インデックス0のPMVを探索開始点に決定する。
一方、L1方向においては、インデックス0及びインデックス1の両方においてPMVの信頼度(A)が等しい。この場合、探索制御部114は、スケーリングの有無を識別し、スケーリングしていないインデックス1のPMVを探索開始点に決定する。
また、図4(A)の場合、L0方向の片方向探索におけるBestPMVの信頼度がAであるため、探索制御部114はL0方向の片方向探索の処理レベルを小数画素精度に決定する。一方、L1方向の片方向探索におけるBestPMVの信頼度がAであるため、探索制御部114はL1方向の片方向探索の処理レベルを整数画素精度及び小数画素精度の両方に決定する。
また、この場合、L0方向のBestPMVの信頼度(A)よりもL1方向のBestPMVの信頼度(A)の方が低いため、探索制御部114は、L0方向を固定し、L1方向について整数画素精度及び小数画素精度の両方の処理レベルでの探索が実施されるように制御する。
このように構成された第1の実施形態の映像符号化装置1は、動きベクトルに対する信頼度情報を記憶し、この信頼度情報を動きベクトルの検出時に利用する。このような構成を備えることにより、映像符号化装置1は、予測精度を向上させることができる。これは、動き探索の算出方法を信頼度情報として用いることで、同じPMV(予測動きベクトル)であっても動き探索によって算出されたPMVの方が物体の動きをより正確に捉えていると考えられるためである。従来技術では、探索開始点の決定にコスト算出が必要であったが、本実施形態では信頼度(動き探索の算出方法)の評価だけで決定することができる。また、信頼度情報に基づいて動き探索の処理レベルを制御することで動き探索の演算量を抑えつつも適切な動きベクトルを算出することができる。
なお、第1の実施形態における動き探索部115は、本発明における第一処理部、第二処理部、性質情報取得部及び信頼度取得部の一例であり、探索制御部114は本発明における制御部の一例である。具体的には、動き探索部115が符号化パラメータである動きベクトルを算出する機能が、本発明における第一処理部の機能に該当する。また、動き探索部115が動きベクトルの信頼度に基づいて最適ベクトルを探索する機能が、本発明における第二処理部の機能に該当する。また、動き探索部115が、動きベクトルの算出方法や、動きベクトルが用いられているブロックの予測モードを識別する機能が、本発明における性質情報取得部の機能に該当する。また、動き探索部115が、動きベクトルの算出方法や、動きベクトルが用いられているブロックの予測モードに基づいて信頼度を算出する機能が、本発明における信頼度取得部の機能に該当する。そして、動き探索部115が最適ベクトルを探索する処理の処理レベルを、算出された信頼度に基づいて制御する機能が、本発明における制御部の機能に該当する。
<第2の実施形態>
図5は、第2の実施形態における映像符号化装置1aの構成例を示す図である。映像符号化装置1aは、動きベクトル検出部111を備えない点、イントラ予測モード決定部120をさらに備える点で第1の実施形態における映像符号化装置1と異なる。図5において、映像符号化装置1と同様の機能部には図1と同じ符号を付すことにより、これらの同様の機能部についての説明を省略する。
イントラ予測モード決定部120は、入力画像と加算画像とに基づいて、対象ブロックのイントラ予測モードを決定する。イントラ予測モード決定部120は、決定したイントラ予測モードをイントラ予測部108に通知する。
図6は、第2の実施形態におけるイントラ予測モード決定部120の構成例を示す図である。イントラ予測モード決定部120は、イントラ予測モードメモリ121、信頼度情報メモリ122、探索制御部123及びモード探索部124を備える。
イントラ予測モードメモリ121は、モード探索部124によって決定されたイントラ予測モードを格納する。イントラ予測モードメモリ121に格納されたイントラ予測モードは、探索制御部123によって参照される。
信頼度情報メモリ122は、モード探索部124から出力される信頼度情報を格納する。信頼度情報メモリ122に格納された信頼度情報は、探索制御部123によって参照される。以下、イントラ予測モードの信頼性の高さを信頼度と定義した場合の具体例について説明するが、その他、対象ブロックについてのSATDコストやRDコスト等が信頼度と定義されてもよい。
本実施形態における信頼度は、イントラ予測モードの算出方法に基づいて定義される。この場合、イントラ予測モード(MPM)が符号化パラメータであり、MPMの算出方法が性質情報となる。このように定義された信頼度は、RD最適化によって決定されたことを示す値A、SATD最適化により決定されたことを示す値B、それ以外の方法によって算出されたことを示す値Cのいずれかの値を取り得る。
探索制御部123は、イントラ予測モードメモリ121から参照されるイントラ予測モードと、信頼度情報メモリ122から参照される信頼度情報とに基づいて、モード探索部124の処理レベルを制御する。
モード探索部124は、入力画像及び参照画像と、探索制御部123の制御情報とに基づいて対象ブロックのイントラ予測モードを決定する。
図7は、イントラ予測モードを決定する処理の流れを示すフローチャートである。イントラ予測モードの決定はモード探索部124によって実行される。まず、モード探索部124は、対象ブロックのMPMを算出する(ステップS201)。MPMの算出方法は、HEVCの規格に準ずる。
次に、モード探索部124は、MPMの各イントラ予測モードの信頼度を評価する(ステップS202)。モード探索部124は、上記の信頼度情報に基づいて各イントラ予測モードの信頼度を評価する。例えば、上記の信頼度に基づく場合、モード探索部124は、A、B、Cの順に信頼度が高いと判定する。
探索制御部123は、このような信頼度の評価に基づいて、モード探索部124の処理レベルを決定する。具体的には、探索制御部123は、信頼度が高いほど処理量が少なくなるようにイントラ予測モード探索の処理レベルを制御する。
[処理レベルの定義]
(ケース1)3つのMPMの信頼度のうち2つがAである場合
この場合、探索制御部123は、信頼度がAの予測モード及びその周囲の予測モードのMPMに基づいてSATDベースの最適化を実施する。
(ケース2)3つのMPMの信頼度のうち1つがAである場合
この場合、探索制御部123は、全ての予測モードに対してSATDベースの最適化を実施する。
(ケース3)ケース1及びケース2以外の場合
この場合、探索制御部123は、全ての予測モードに対してSATDベースの最適化を実施することで候補モードを絞り、MPMを追加してRDベースの最適化を実施する。ここで、SATDベースの最適化は、各イントラ予測モードに対してSATDベースのコストを算出し、最小コストのイントラ予測モードを決定する処理である。また、RDベースの最適化はRDベースのコストを算出し、最小コストのイントラ予測モードを決定する処理である。モード探索部124は、このように決定された処理レベルに基づいて対象ブロックのイントラ予測モードを決定する。
図8は、第2の実施形態における映像符号化装置1aの動作例を示す図である。図8(A)はMPMの第1の算出例を示す図である。この場合、0、1、2のインデックスで表される予測モードの信頼度がそれぞれA、A、Cであるため、探索制御部123は処理レベルを上記ケース1のとおりに制御する。すなわち、この場合、探索制御部123は、信頼度がAの予測モード及びその周囲の予測モードのMPMに基づいてSATDベースの最適化を実施する。
図8(B)はMPMの第2の算出例を示す図である。この場合、0、1、2のインデックスで表される予測モードの信頼度がそれぞれB、C、Cであるため、探索制御部123は処理レベルを上記ケース3のとおりに制御する。すなわち、この場合、探索制御部123は、全ての予測モードに対してSATDベースの最適化を実施することで候補モードを絞り、MPMを追加してRDベースの最適化を実施する。
図8(C)は、図8(A)及び図8(B)に示すMPMに基づいて決定された処理レベルの具体例を示す図である。なお、図8の例では、対象ブロックの周囲の予測モードを、対象ブロックの予測モード±1とした場合を示している。
このように構成された第2の実施形態における映像符号化装置1aは、イントラ予測モードに対する信頼度情報を記憶し、この信頼度情報をイントラ予測モードの決定時に利用する。このような構成を備えることにより、映像符号化装置1aは、信頼性の高い予測モードの周囲だけを探索することで符号化効率の低下を抑制することができる。これは、イントラ予測モードの算出方法を信頼度情報として用いた場合、同じMPMのイントラ予測モードであっても最適化レベルの高い方法で算出された予測モードの方が、信頼性が高いと考えられるためである。従来技術では、MPMがどのように導出されたかに関係なく予測モードが評価されるため、演算コストが高くなってしまうが、本実施形態ではMPMの信頼度(イントラ予測モードの算出方法)に基づいて処理レベルを制御することで演算コストを削減できる。
なお、第2の実施形態におけるモード探索部124は、本発明における第一処理部、第二処理部、性質情報取得部及び信頼度取得部の一例であり、探索制御部123は本発明における制御部の一例である。具体的には、モード探索部124が符号化パラメータであるイントラ予測モード(MPM)を取得する機能が、本発明における第一処理部の機能に該当する。また、モード探索部124がMPMの信頼度に基づいて最適なイントラ予測モードを探索する機能が、本発明における第二処理部の機能に該当する。また、モード探索部124がMPM動きベクトルの算出方法を識別する機能が、本発明における性質情報取得部の機能に該当する。また、モード探索部124がMPMの算出方法に基づいて信頼度を算出する機能が、本発明における信頼度取得部の機能に該当する。そして、モード探索部124が最適なイントラ予測モードを探索する処理の処理レベルを、算出された信頼度に基づいて制御する機能が、本発明における制御部の機能に該当する。
以上、動き探索及びMPMの算出に信頼度情報を用いることで処理精度を維持しつつ演算量を削減する映像符号化装置の実施形態について記載した。しかしながら、このように構成された映像符号化装置1及び1aは、参照情報の信頼度を符号化パラメータに関する性質情報に基づいて評価し、その評価に基づき、後段の処理精度を制御するという本発明の一適用例に過ぎない。すなわち本発明は、映像符号化を実現する複数ステップの処理のうち、符号化パラメータを取得する第一ステップと、取得された符号化パラメータに基づいて第一ステップの後段で実行される第二ステップとの関係性にある他の処理にも適用可能である。本発明の適用により、上記実施形態における動き探索及びMPMの算出と同様に、適用対象の処理について処理精度の低下を抑制しつつ、演算量を削減することができる。
上述した実施形態における映像符号化装置の一部又は全部をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA(Field Programmable Gate Array)等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
本発明は、画像(映像を含む)を符号化する装置に適用可能である。
1,1a…映像符号化装置、101…減算器、102…直行変換/量子化部、103…可変長符号化部、104…逆量子化/逆直交変換部、105…加算器、106…ループフィルタ部、107…復号ピクチャメモリ、108…イントラ予測部、109…インター予測部、110…イントラ/インター切り替えスイッチ、111…動きベクトル検出部、112…動きベクトルメモリ、113…信頼度情報メモリ、114…探索制御部、115…動き探索部、120…イントラ予測モード決定部、121…イントラ予測モードメモリ、122…信頼度情報メモリ、123…探索制御部、124…モード探索部

Claims (3)

  1. 画像の符号化に関する複数ステップの処理を実行する画像符号化装置であって、
    対象画像の符号化に関する符号化パラメータであって、符号化対象ブロックのMPM(Most Probable Mode)を取得する第一ステップの処理を実行する第一処理部と、
    対象画像の符号化方式は、前記対象画像を複数のブロックに分割して符号化する方式とし、前記符号化対象ブロックに隣接するブロックの符号化モードに基づいて前記符号化パラメータの信頼度を取得する信頼度取得部と、
    前記信頼度に基づいて、前記符号化対象ブロックの探索処理の処理レベルを決める制御部と、
    前記探索処理の処理レベルに基づき、前記符号化対象ブロックのイントラ予測モードを決定する第二ステップの処理を実行する第二処理部と、
    を備える画像符号化装置。
  2. 画像の符号化に関する複数ステップの処理を実行する画像符号化装置が行う画像符号化方法であって、
    対象画像の符号化に関する符号化パラメータであって、符号化対象ブロックのMPM(Most Probable Mode)を取得する第一ステップの処理を実行する第一処理ステップと、
    対象画像の符号化方式は、前記対象画像を複数のブロックに分割して符号化する方式とし、前記符号化対象ブロックに隣接するブロックの符号化モードに基づいて前記符号化パラメータの信頼度を取得する信頼度取得ステップと、
    前記信頼度に基づいて、前記符号化対象ブロックの探索処理の処理レベルを決める制御ステップと、
    前記探索処理の処理レベルに基づき、前記符号化対象ブロックのイントラ予測モードを決定する第二ステップの処理を実行する第二処理ステップと、
    を有する画像符号化方法。
  3. 請求項1に記載された画像符号化装置としてコンピュータを機能させるためのコンピュータプログラム。
JP2019230776A 2019-12-20 2019-12-20 画像符号化装置、画像符号化方法及びコンピュータプログラム Active JP6849781B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019230776A JP6849781B2 (ja) 2019-12-20 2019-12-20 画像符号化装置、画像符号化方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019230776A JP6849781B2 (ja) 2019-12-20 2019-12-20 画像符号化装置、画像符号化方法及びコンピュータプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016227193A Division JP6696889B2 (ja) 2016-11-22 2016-11-22 画像符号化装置、画像符号化方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2020058068A true JP2020058068A (ja) 2020-04-09
JP6849781B2 JP6849781B2 (ja) 2021-03-31

Family

ID=70107793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019230776A Active JP6849781B2 (ja) 2019-12-20 2019-12-20 画像符号化装置、画像符号化方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6849781B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016511975A (ja) * 2013-02-01 2016-04-21 クゥアルコム・インコーポレイテッドQualcomm Incorporated イントラ予測のためのモード決定の簡略化

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016511975A (ja) * 2013-02-01 2016-04-21 クゥアルコム・インコーポレイテッドQualcomm Incorporated イントラ予測のためのモード決定の簡略化

Also Published As

Publication number Publication date
JP6849781B2 (ja) 2021-03-31

Similar Documents

Publication Publication Date Title
WO2013042888A2 (ko) 머지 후보 블록 유도 방법 및 이러한 방법을 사용하는 장치
JP6495835B2 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、映像符号化プログラム及び映像復号プログラム
JP2005535228A (ja) 高品質の高速予測動き検索を実行する方法および装置
KR20050056956A (ko) 블록 매치 품질을 결정하기 위한 방법 및 장치
KR20140095607A (ko) 인터 예측 방법 및 그 장치
JP2017069866A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
KR20130126698A (ko) 영상 부호화 장치, 영상 부호화 방법 및 영상 부호화 프로그램
JP6652068B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
JP6259272B2 (ja) 映像符号化装置及び映像符号化プログラム
JP6696889B2 (ja) 画像符号化装置、画像符号化方法及びコンピュータプログラム
JP6019797B2 (ja) 動画像符号化装置、動画像符号化方法、及びプログラム
JP6849781B2 (ja) 画像符号化装置、画像符号化方法及びコンピュータプログラム
KR102281514B1 (ko) 인터 예측 방법 및 그 장치
JP2016187134A (ja) 予測モード判定方法及び予測モード判定プログラム
JP6694086B2 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
JP2017073602A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
KR102173576B1 (ko) 인터 예측 방법 및 그 장치
JP6438376B2 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、映像符号化プログラム及び映像復号プログラム
JP6491587B2 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、映像符号化プログラム及び映像復号プログラム
JP2019140630A (ja) 映像符号化装置、映像復号装置、及びこれらのプログラム
KR102380722B1 (ko) 인터 예측 방법 및 그 장치
JP6841709B2 (ja) 画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
JP6323185B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP5887020B1 (ja) 動画像復号化方法
JP5890933B1 (ja) 動画像復号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210302

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210304

R150 Certificate of patent or registration of utility model

Ref document number: 6849781

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150