JP2020127120A - 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム - Google Patents

動画像符号化装置、動画像符号化方法及び動画像符号化プログラム Download PDF

Info

Publication number
JP2020127120A
JP2020127120A JP2019018157A JP2019018157A JP2020127120A JP 2020127120 A JP2020127120 A JP 2020127120A JP 2019018157 A JP2019018157 A JP 2019018157A JP 2019018157 A JP2019018157 A JP 2019018157A JP 2020127120 A JP2020127120 A JP 2020127120A
Authority
JP
Japan
Prior art keywords
code amount
slice
frame
unit
target code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019018157A
Other languages
English (en)
Other versions
JP7238441B2 (ja
Inventor
旭穎 雷
Xu Ying Lei
旭穎 雷
三好 秀誠
Hidemasa Miyoshi
秀誠 三好
俊輔 小林
Toshisuke Kobayashi
俊輔 小林
山下 和博
Kazuhiro Yamashita
和博 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019018157A priority Critical patent/JP7238441B2/ja
Priority to US16/775,310 priority patent/US10958905B2/en
Publication of JP2020127120A publication Critical patent/JP2020127120A/ja
Application granted granted Critical
Publication of JP7238441B2 publication Critical patent/JP7238441B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】バッファにおいてアンダフローが発生しないように動画像の符号化処理を制御する。【解決手段】動画像符号化装置は、時間方向に分割されたSOP単位の動画像をダウンコンバートし、先行して符号化処理を行う先行符号化部と、前記先行して符号化処理を行った結果に基づいて、前記SOP単位の動画像に含まれる各処理単位の目標符号量を算出し、算出した目標符号量に基づいて各処理単位について符号化処理が行われた場合の仮のバッファ位置を算出する算出部と、前記SOP単位の動画像において、各処理単位について符号化処理が行われるごとに、実際の伝送バッファの位置と仮のバッファ位置との誤差を算出し、まだ符号化処理が行われていない各処理単位の目標符号量を補正する補正部とを有する。【選択図】図10

Description

本発明は、動画像符号化装置、動画像符号化方法及び動画像符号化プログラムに関する。
8K・120Hzの動画像を時間方向及び空間方向に分割し、複数のエンコーダを用いて並列処理することで、リアルタイムの符号化処理を行い、ビットストリームを伝送する動画像符号化装置の開発が進められている。
当該動画像符号化装置では、伝送するビットストリームを保持する伝送バッファにおいてアンダフローまたはオーバフローが発生しないよう、レートコントローラがSOP(Structure Of Picture)単位で各フレームの目標符号量を算出する。そして、各エンコーダが、算出された目標符号量のもとで発生符号量を制御しながら、各フレームの符号化処理を行う。
特開2008−085673号公報 特開2000−232644号公報 特開2002−232882号公報
"8K120Hz HEVC リアルタイムコーデック装置の開発"、2018 映像情報メディア学会年次大会、no.22C−1、Aug.2018 "8K120Hz HEVC エンコーダの高効率・高画質アーキテクチャの開発"、2018 映像情報メディア学会年次大会、no.22C−2、Aug.2018 "A Study on the Required Video Bit-rate for 8K 120-Hz HEVC/H.265 Temporal Scalable Coding,"2018 Picture Coding Symposium (PCS),San Francisco.CA,pp.106-110,2018
しかしながら、目標符号量と実際の発生符号量とが一致するとは限らず、例えば、目標符号量よりも実際の発生符号量が大きい状態が続き、誤差が累積すると、伝送バッファにおいてアンダフローが発生する。
一つの側面では、バッファにおいてアンダフローが発生しないように動画像の符号化処理を制御することを目的としている。
一態様によれば、動画像符号化装置は、
時間方向に分割されたSOP単位の動画像をダウンコンバートし、先行して符号化処理を行う先行符号化部と、
前記先行して符号化処理を行った結果に基づいて、前記SOP単位の動画像に含まれる各処理単位の目標符号量を算出し、算出した目標符号量に基づいて各処理単位について符号化処理が行われた場合の仮のバッファ位置を算出する算出部と、
前記SOP単位の動画像において、各処理単位について符号化処理が行われるごとに、実際の伝送バッファの位置と仮のバッファ位置との誤差を算出し、まだ符号化処理が行われていない各処理単位の目標符号量を補正する補正部とを有する。
バッファにおいてアンダフローが発生しないように動画像の符号化処理を制御することができる。
第1の実施形態に係る動画像符号化装置の適用例を示す図である。 第1の実施形態に係る動画像符号化装置のハードウェア構成の一例を示す図である。 比較例の動画像符号化装置の機能構成の一例を示す図である。 符号化処理時のSOP内の各フレームの関係を説明するための図である。 伝送バッファ位置を説明するための図である。 比較例の動画像符号化装置による符号化処理における、フィードバック制御を説明するための図である。 比較例の動画像符号化装置による符号化処理における、各フレームの仮の伝送バッファ位置及び実際の伝送バッファ位置を示す図である。 比較例の動画像符号化装置による符号化処理における、アンダフローの発生例を示す図である。 第1の実施形態に係る動画像符号化装置の符号化処理時の制御の概要を、伝送バッファ位置の観点から説明するための図である。 第1の実施形態に係る動画像符号化装置の機能構成の一例を示す図である。 第1の実施形態に係る動画像符号化装置の機能構成の詳細を示す図である。 各スライスの仮の伝送バッファ位置の算出方法を説明するための図である。 スライス[0]の実際の伝送バッファ位置の具体例及びスライス[0]の誤差の具体例を示す図である。 スライス単位の目標符号量の第2の補正方法を示す図である。 スライス単位の目標符号量の第2の補正方法による補正処理の具体例を示す第1の図である。 第1の実施形態に係る動画像符号化装置による符号化処理の流れを示すフローチャートである。 スライス[0]の仮の伝送バッファ位置の具体例及びスライス[0]の実際の伝送バッファ位置の具体例を示す図である。 第2の実施形態に係る動画像符号化装置による符号化処理の流れを示すフローチャートである。 第3の実施形態に係る動画像符号化装置の機能構成の詳細を示す図である。 第3の実施形態に係る動画像符号化装置による符号化処理の流れを示すフローチャートである。 スライス単位の目標符号量の第2の補正方法による補正処理の具体例を示す第2の図である。
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
[第1の実施形態]
<動画像符号化装置の適用例>
はじめに、第1の実施形態に係る動画像符号化装置の適用例について説明する。図1は、第1の実施形態に係る動画像符号化装置の適用例を示す図である。図1に示すように、第1の実施形態に係る動画像符号化装置120は、例えば、映像表示システム100に適用され、撮像装置110により生成された8K・120Hzの動画像をリアルタイムに符号化し、ビットストリームを動画像復号装置130に伝送する。動画像復号装置130では、動画像符号化装置120より伝送されたビットストリームを復号し、映像表示装置140に出力する。これにより、映像表示装置140では、8K・120Hzの映像を表示することができる。
<動画像符号化装置のハードウェア構成>
次に、動画像符号化装置120のハードウェア構成について説明する。図2は、第1の実施形態に係る動画像符号化装置のハードウェア構成の一例を示す図である。図2(a)に示すように、動画像符号化装置120は、制御装置210、信号変換装置220、符号化装置230、再構成装置240を有する。
このうち、信号変換装置220、符号化装置230、再構成装置240のハードウェア構成の詳細は割愛し、ここでは、制御装置210のハードウェア構成の詳細について説明する。図2(b)は、制御装置210のハードウェア構成の詳細を示す図である。
図2(b)に示すように、制御装置210は、CPU(Central Processing Unit)211、ROM(Read Only Memory)212、RAM(Random Access Memory)213を有する。CPU211、ROM212、RAM213は、いわゆるコンピュータを形成する。
また、制御装置210は、補助記憶装置214、表示装置215、操作装置216、I/F(Interface)装置217、ドライブ装置218を有する。なお、制御装置210の各ハードウェアは、バス219を介して相互に接続されている。
CPU211は、補助記憶装置214にインストールされている各種プログラム(例えば、後述する動画像符号化プログラム等)を実行する演算デバイスである。
ROM212は、不揮発性メモリである。ROM212は、補助記憶装置214にインストールされている各種プログラムをCPU211が実行するために必要な各種プログラム、データ等を格納する主記憶デバイスとして機能する。具体的には、ROM212はBIOS(Basic Input/Output System)やEFI(Extensible Firmware Interface)等のブートプログラム等を格納する、主記憶デバイスとして機能する。
RAM213は、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の揮発性メモリである。RAM213は、補助記憶装置214にインストールされている各種プログラムがCPU211によって実行される際に展開される作業領域を提供する、主記憶デバイスとして機能する。
補助記憶装置214は、各種プログラムを格納する補助記憶デバイスである。表示装置215は、制御装置210の内部状態を表示する表示デバイスである。操作装置216は、制御装置210に対して各種指示を入力するための入力デバイスである。I/F装置217は、信号変換装置220、符号化装置230との間で信号を送受信するための接続デバイスである。
ドライブ装置218は、コンピュータ読み取り可能な記録媒体をセットするためのデバイスである。ここでいう記録媒体には、CD−ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。あるいは、記録媒体には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
なお、補助記憶装置214にインストールされる各種プログラムは、例えば、配布された記録媒体がドライブ装置218にセットされ、該記録媒体に記録された各種プログラムがドライブ装置218により読み出されることでインストールされてもよい。
<動画像符号化装置の機能の詳細>
次に、動画像符号化装置120の機能の詳細について説明する。ただし、以下では、まず、比較例の動画像符号化装置の機能について説明し、比較例の動画像符号化装置を用いた場合の問題点について説明する(下記(1))。その後、当該問題点を解決するための機能を中心に、第1の実施形態に係る動画像符号化装置120の詳細について説明する(下記(2))。
(1)比較例の動画像符号化装置の機能の説明
(1−1)比較例の動画像符号化装置の機能構成
はじめに、比較例の動画像符号化装置の機能構成について説明する。図3は、比較例の動画像符号化装置の機能構成の一例を示す図である。図3に示すように、比較例の動画像符号化装置300は、受信部301、時空間分割部302、ダウンコンバータ303、先行符号化部304、レートコントローラ305、8K120Hzエンコーダ306、ストリーム結合部307を有する。なお、各機能ブロックを囲む点線は、各機能ブロックが実現されるハードウェア(図2参照)を示している。
受信部301は、撮像装置110により生成された8K・120Hzの動画像を受信する。
時空間分割部302は、8K・120Hzの動画像を時間方向及び空間方向に分割し(時分割及び空間分割し)、複数台の4K60Hzエンコーダに入力する。
図3の例は、時空間分割部302が、動画像内の連続する24フレームを、8フレームずつ3つのSOPに時分割し、各SOPを、8K60Hzエンコーダ306_1〜306_3に入力する様子を示している。
また、図3の例は、時空間分割部302が、各SOPに含まれる各フレームを、4つに空間分割し、8K60Hzエンコーダに含まれる4つの4K60Hzエンコーダそれぞれにわけて入力する様子を示している。
なお、時空間分割部302では、ARIB(Association of Radio Industries and Business)規格に基づく形状により、空間分割を行うものとする。時空間分割部302が空間分割することで得られる各領域を、以下では、“スライス”と称す。また、時空間分割部302が空間分割することで得られる4つのスライスを、本実施形態では、スライス[0]、スライス[1]、スライス[2]、スライス[3]と称す。図3の例は、スライス[0]〜スライス[2]については、縦方向の画素数が“1088”であり、スライス[3]については縦方向の画素数が“1056”であることを示している。
ダウンコンバータ303は、時空間分割部302により時分割及び空間分割された、8K・120Hzの動画像をダウンコンバートすることで4K・60Hzの動画像を生成する(これにより、各SOPに含まれるフレームは4フレームとなる)。
先行符号化部304は、各SOPにおいて、4フレームにそれぞれ含まれる4スライスについて符号化処理を行い、符号化結果から、スライス単位の符号化難易度(GCM:Global Complexity Measure)を算出する。なお、GCMは、量子化ステップ(Quant)と発生符号量(bits)との積により算出される。
先行符号化部304は、算出したGCM(4K・60Hzの動画像1SOPの各フレームの各スライスのGCM)に基づいて、8K・120Hzの動画像1SOPの各フレームの各スライスのGCMを推定する。更に、先行符号化部304は、推定したGCMを、レートコントローラ305に通知する。
なお、図3の例では、ダウンコンバータ303と先行符号化部304とを別々に設けているが、ダウンコンバータ303は、先行符号化部304の一部として設けられてもよい。
レートコントローラ305は、先行符号化部304より通知された8K・120Hzの動画像1SOPの各フレームの各スライスのGCMに基づいて、1SOPの各フレームの目標符号量と、1SOPの各フレームの仮の伝送バッファ位置(残量)とを算出する。
ここで、伝送バッファ位置とは、4K60Hzエンコーダにより符号化処理されたビットストリームを保持するバッファ(例えば、再構成装置内に設けられた伝送用のバッファ)の残量を指す。このうち、符号化処理前に予め算出した伝送バッファ位置を、“仮の伝送バッファ位置”と称し、符号化処理後に発生符号量に基づいて算出した伝送バッファ位置を、“実際の伝送バッファ位置”と称す。
なお、伝送バッファ位置(残量)の算出方法については、下記(1−3)において詳説し、各フレームの目標符号量の算出方法については、下記(1−4)において詳説する。
また、レートコントローラ305は、1SOPの各フレームに含まれる4スライスそれぞれのGCMの比率に基づいて、算出した1SOPの各フレームの目標符号量を、各スライスに分割し、1SOPの各フレームの各スライスの目標符号量を算出する。
また、レートコントローラ305は、1SOPの各フレームの各スライスの目標符号量を、対応する4K60Hzエンコーダに通知する。例えば、レートコントローラ305は、8K60Hzエンコーダ306_1に含まれる4つの4K60Hzエンコーダそれぞれに、1SOPの各フレームの各スライスの目標符号量を通知する。
また、レートコントローラ305は、対応する4つの4K60Hzエンコーダそれぞれから、1SOPの各フレームの各スライスについて符号化処理を行った際の発生符号量について、フィードバックを受け付ける。そして、レートコントローラ305は、受け付けた発生符号量をフレーム単位で合算し、各フレームの実際の伝送バッファ位置を算出する。
例えば、レートコントローラ305は、8K60Hzエンコーダ306_1に含まれる4つの4K60Hzエンコーダそれぞれから、各フレームの各スライスについて符号化処理を行った際の発生符号量について、フィードバックを受け付ける。そして、レートコントローラ305は、各フレームの実際の伝送バッファ位置を算出する。
8K120Hzエンコーダ306は、8K60Hzエンコーダ306_1〜306_3を有する。8K60Hzエンコーダ306_1〜306_3それぞれが並列に符号化処理を行うことで、8K120Hzエンコーダ306は、8K・120Hzの動画像をリアルタイムに符号化することができる。
また、8K60Hzエンコーダ306_1〜306_3は、それぞれ、4つの4K60Hzエンコーダを有する。4つの4K60Hzエンコーダそれぞれが並列に符号化処理を行うことで、8K60Hzエンコーダ306_1〜306_3は、それぞれ、8K・60Hzの動画像をリアルタイムに符号化することができる。
4K60Hzエンコーダでは、レートコントローラ305より通知された、1SOPの各フレームの各スライスの目標符号量のもとで発生符号量を制御しながら、1SOPの各フレームの各スライスについて符号化処理を行う。
ストリーム結合部307は、8K60Hzエンコーダ306_1〜306_3それぞれから出力されるビットストリームを結合することで、8K・120Hzビットストリームを生成し、伝送する。
(1−2)符号化処理時のSOP内の各フレームの関係
次に、8K60Hzエンコーダ306_1〜306_3それぞれに含まれる、4K60Hzエンコーダが符号化処理する際の、SOP内の各フレームの関係について説明する。図4は、符号化処理時のSOP内の各フレームの関係を説明するための図である。図4において、横軸は、1SOPに含まれる各フレーム(8フレーム)の表示順序を表しており、縦軸は、各フレームの階層を識別するTID(Temporal ID)を示している(上にいくほど階層が深く、下にいくほど階層が浅いことを示している)。また、“I”はI(Intra)ピクチャ、“P”はP(Predictive)ピクチャ、“B”はBピクチャをそれぞれ表す。
また、図4内に示す各矩形(“B”の文字を含む各矩形)は、1SOPに含まれる各フレームを表しており、“B”の右下の数字は、符号化(または復号)順序を示している。更に、各矩形からのびる矢印は、各矩形で表されるフレームが符号化処理の際に参照する参照先のフレームを示している。
例えば、“B”の文字を含む矩形で表されるフレームは、表示順序が0番目のフレームであり、符号化順序が1番目のフレームであることを示している。また、“B”の文字を含む矩形で表されるフレームは、符号化処理の際に、
・1つ前のSOPに含まれる、表示順序が7番目のフレーム(“I/P/B”の文字を含む矩形で表されるフレーム)、
・同一SOPに含まれる、表示順序が7番目のフレーム(“I/P/B”の文字を含む矩形で表されるフレーム)、
のいずれか一方または両方を参照することを示している。
(1−3)伝送バッファ位置の説明
次に、伝送バッファ位置(残量)について説明する。図5は、伝送バッファ位置を説明するための図である。図5において、横軸は、1SOPに含まれる各フレームの符号化順序を示しており、縦軸は、伝送バッファの位置(残量)を示している。
また、図5において、“R”はビットレート[ビット/秒]を、“P”はフレームレート[Hz]を、“B”は、伝送バッファの容量[ビット]を表している。更に、“D(n)”は、符号化順序がn番目のフレームの発生符号量[ビット]を表している。なお、ここでは、“R”が固定であるとする(CBR:Constant Bit Rate)。
図5に示すように、例えば、8K60Hzエンコーダ306_1が1SOPの各フレームについて符号化処理を行った場合、フレーム単位の実際の伝送バッファ位置は、矢印に沿って遷移する。
具体的には、符号化順序が0番目のフレームについて符号化処理が開始される前は、実際の伝送バッファ位置が符号501で示す位置にあったところ、符号化処理が行われると、発生符号量(D(0))の分だけ下がり、符号502で示す位置に遷移する。
その後、符号化順序が1番目のフレームについて符号化処理が開始される前までの間に、実際の伝送バッファ位置は、バッファ回復量(R/P)の分だけ上がり、符号503で示す位置に遷移する。以降、同様の処理が繰り返されることで、実際の伝送バッファ位置は上下に遷移し、1SOPの全フレームの符号化処理が行われることで、符号515に示す位置に遷移する。
ここで、図5の上記説明において、符号化順序がn番目のフレームの発生符号量D(n)を、符号化順序がn番目のフレームの目標符号量に読み替えることで、符号501、503、515で示す位置は、各フレームの仮の伝送バッファ位置を表すことになる。
なお、本実施形態においては、符号501で示す位置を、1SOPの先頭の実際の伝送バッファ位置(または1SOPの先頭の仮の伝送バッファ位置)と称する。また、符号515で示す位置を、1SOPの終端の実際の伝送バッファ位置(または1SOPの終端の仮の伝送バッファ位置)と称する。
レートコントローラ305では、実際の伝送バッファ位置(残量)が、オーバフロー領域及びアンダフロー領域に含まれることがないように、1SOPの各フレームの目標符号量を算出する。これにより、各フレームの発生符号量D(n)が各フレームの目標符号量と一致している限りにおいては、レートコントローラ305は、伝送バッファにおいてオーバフローまたはアンダフローが発生することなく、符号化処理を制御することができる。
一方で、各フレームの発生符号量D(n)が各フレームの目標符号量と一致せず、かつ発生符号量D(n)が伝送バッファの回復量R/Pよりも小さい状態が続くと、伝送バッファにおいてはオーバフローが発生する。なお、伝送バッファにおいてオーバフローが発生した場合、動画像復号装置130では、発生符号量の不足分としてダミーデータを挿入することで対処する。
また、各フレームの発生符号量D(n)が各フレームの目標符号量と一致せず、かつ発生符号量D(n)が伝送バッファの回復量R/Pよりも大きい状態が続くと、伝送バッファにおいてはアンダフローが発生する。なお、伝送バッファにおいてアンダフローが発生した場合、動画像復号装置130では、発生符号量の超過分を取り戻すことができない。このため、レートコントローラ305では、伝送バッファにおいてアンダフローが発生することがないように、各フレームの目標符号量を算出することが求められる。
(1−4)比較例の動画像符号化装置におけるフィードバック制御
しかしながら、各フレームの目標符号量と各フレームの発生符号量D(n)とは必ずしも一致せず、仮の伝送バッファ位置と実際の伝送バッファ位置との間には、誤差が発生する。このため、比較例の動画像符号化装置300では、上述したように発生符号量をフィードバックし、実際の伝送バッファ位置を算出することで誤差の累積を抑えている。
そこで、以下では、比較例の動画像符号化装置300による符号化処理における、フィードバック制御について説明する。図6は、比較例の動画像符号化装置による符号化処理における、フィードバック制御を説明するための図である。
上述したように、8K・120Hzの動画像1SOP分がダウンコンバートされることで得られた4K・60Hzの動画像(4フレーム)について、先行符号化部304では、先行符号化することで、4スライスの各GCMを算出する(図6の処理I)。図6の例では、算出した4スライスの各GCMを、GCM4K[0]〜GCM4K[3]としている。なお、図6の例では、1番手前のフレームについてのみ4スライスの各GCMを示しているが、残りの3フレームについても同様に、4スライスの各GCMが算出されているものとする。
続いて、先行符号化部304では、算出した4スライスの各GCMに基づいて、8K・120Hzの動画像のGCMを推定する(図6の処理II)。図6の例では、推定した4スライスの各GCMを、GCM8K[0]〜GCM8K[3]としている。なお、図6の例では、1番手前のフレームについてのみ4スライスの各GCMを示しているが、残りの7フレームについても同様に、4スライスの各GCMが推定されているものとする。
続いて、レートコントローラ305では、8K・120Hzの動画像の各GCMに基づいて、フレーム単位の目標符号量と、各フレームの仮の伝送バッファ位置とを算出する(図6の処理III)。なお、図6の例では、1番手前のフレームについてのみ目標符号量を示しているが、残りの7フレームについても同様に目標符号量が算出されているものとする。
続いて、レートコントローラ305では、フレーム単位の目標符号量と、スライス単位で推定した各GCMの比率とに基づいて、各スライスの目標符号量を算出する(図6の処理IV)。図6の例では、算出した4スライスの目標符号量を、SliceTarget[0]〜SliceTarget[3]としている。なお、図6の例では、1番手前のフレームについてのみ4スライスの目標符号量を示しているが、残りの7フレームについても同様に、4スライスの目標符号量が算出されているものとする。
続いて、レートコントローラ305では、4スライスの目標符号量1SOP分(8フレーム分)を、対応する各4K60Hzエンコーダに通知する。そして、各4K60Hzエンコーダでは、通知されたスライス単位の目標符号量のもとで各フレームの各スライスについて符号化処理を行う(図6の処理V)。そして、各4K60Hzエンコーダでは、符号化処理を行った際の各スライスの発生符号量を、レートコントローラ305にフィードバックする(図6の処理VI)。これにより、レートコントローラ305では、フィードバックされた発生符号量に基づいて、フレーム単位の実際の伝送バッファ位置を算出し、フレーム単位の目標符号量の算出に反映することで、誤差の累積を抑えている。
(1−5)比較例の動画像符号化装置におけるフィードバック制御の問題点
次に、比較例の動画像符号化装置300におけるフィードバック制御の問題点について説明する。図7は、比較例の動画像符号化装置による符号化処理における、各フレームの仮の伝送バッファ位置及び実際の伝送バッファ位置を示す図である。
図7において、グラフ701〜704は、レートコントローラ305において算出された、1SOPに含まれる各フレームの仮の伝送バッファ位置を表している。
このうち、グラフ701は、8K60Hzエンコーダ306_1において符号化処理されるSOPに含まれる各フレームの仮の伝送バッファ位置を表している。レートコントローラ305では、1SOPの各フレーム721について算出した目標符号量に基づいて、各フレームの仮の伝送バッファ位置を算出する。
8K60Hzエンコーダ306_1の各4K60Hzエンコーダでは、レートコントローラ305により算出されたスライス単位の目標符号量のもとで符号化処理を行い、各フレームのビットストリーム731を生成する。
グラフ711は、8K60Hzエンコーダ306_1により符号化処理が行われることで遷移する、各フレームの実際の伝送バッファ位置を示している。グラフ711の例は、各フレームの実際の伝送バッファ位置が仮の伝送バッファ位置と一致している場合を示している。なお、グラフ711において先頭の実際の伝送バッファ位置は、1SOP前のSOPの終端の仮の伝送バッファ位置によって更新される。
グラフ702は、8K60Hzエンコーダ306_2において符号化処理されるSOPに含まれる各フレームの仮の伝送バッファ位置を表している。レートコントローラ305では、1SOPの各フレーム722について算出した目標符号量に基づいて、各フレームの仮の伝送バッファ位置を算出する。
8K60Hzエンコーダ306_2の各4K60Hzエンコーダでは、レートコントローラ305により算出されたスライス単位の目標符号量のもとで符号化処理を行い、各フレームのビットストリーム732を生成する。
グラフ712は、8K60Hzエンコーダ306_2により符号化処理が行われることで遷移する、各フレームの実際の伝送バッファ位置を示している。グラフ712の例は、各フレームの実際の伝送バッファ位置が仮の伝送バッファ位置と一致している場合を示している。なお、グラフ712において先頭の実際の伝送バッファ位置は、1SOP前のSOPの終端の仮の伝送バッファ位置によって更新される。
グラフ703は、8K60Hzエンコーダ306_3において符号化処理されるSOPに含まれる各フレームの仮の伝送バッファ位置を表している。レートコントローラ305では、1SOPの各フレーム723について算出した目標符号量に基づいて、各フレームの仮の伝送バッファ位置を算出する。
8K60Hzエンコーダ306_3の各4K60Hzエンコーダでは、レートコントローラ305により算出されたスライス単位の目標符号量のもとで符号化処理を行い、各フレームのビットストリーム733を生成する。
グラフ713は、8K60Hzエンコーダ306_3により符号化処理が行われることで遷移する、各フレームの実際の伝送バッファ位置を示している。グラフ713の例は、各フレームの実際の伝送バッファ位置が仮の伝送バッファ位置と一致している場合を示している。なお、グラフ713において先頭の実際の伝送バッファ位置は、1SOP前のSOPの終端の仮の伝送バッファ位置によって更新される。
このように、レートコントローラ305では、グラフ701〜703に示す、3SOP分の各フレームの目標符号量及び仮の伝送バッファ位置を、並列して算出する。これにより、8K60Hzエンコーダ306_1〜306_3では、符号化処理を並列に実行することができる。
一方で、装置間の通信によって8K60Hzエンコーダで生成したストリームの発生符号量をレートコントローラ305にフィードバックするのは時間がかかる。例えば、ビットストリーム731を生成した際の発生符号量がレートコントローラ305にフィードバックされるのは、次の3SOP分の各フレームの目標符号量及び仮の伝送バッファ位置を算出するタイミングとなる。
図7の例は、符号化順序が0番目のフレームの発生符号量が、3SOP後の各フレーム724において、符号化順序が1番目(全体の通し番号では、25番目)のフレームの目標符号量の算出に反映されることを示している。
同様に、図7の例は、符号化順序が1番目のフレームの発生符号量が、3SOP後の各フレーム724において、符号化順序が2番目(全体の通し番号では、26番目)のフレームの目標符号量の算出に反映されることを示している。
同様に、図7の例は、符号化順序が2番目のフレームの発生符号量が、3SOP後の各フレーム724において、符号化順序が3番目(全体の通し番号では、27番目)のフレームの目標符号量の算出に反映されることを示している。
このように、比較例の動画像符号化装置300の場合、発生符号量が、現在符号化処理中のSOPから数えて、3SOP後の各フレームの目標符号量に反映されることになる。このため、現在符号化処理中のSOPの各フレームの発生符号量や、1SOP後または2SOP後の各フレームの発生符号量が、全て、フレーム単位の目標符号量と一致していれば、伝送バッファにおいてオーバフローまたはアンダフローが発生することはない。一方で、各フレームの発生符号量が、フレーム単位の目標符号量と一致しておらず、かつ、発生符号量がバッファ回復量よりも小さい(または大きい)状態が続くと、伝送バッファにおいてオーバフローまたはアンダフローが発生することになる。
図8は、比較例の動画像符号化装置による符号化処理における、アンダフローの発生例を示す図である。図8において、グラフ811〜813は、図7のグラフ711〜713に、各フレームの仮の伝送バッファ位置と一致しない実際の伝送バッファ位置を加筆したものである。
図8の例によれば、グラフ811に示すように、1SOP目において、符号化順序が0番目のフレームが符号化処理される前は、仮の伝送バッファ位置と実際の伝送バッファ位置とが一致していた。しかしながら、図8の例によれば、1SOP目の各フレームの符号化処理が進むことで両者の誤差が徐々に大きくなっている。
この結果、グラフ812に示すように、2SOP目においては、先頭の仮の伝送バッファ位置と先頭の実際の伝送バッファ位置とが一致せず、かつ、符号化処理が進むことで両者の誤差は更に大きくなっている。
この結果、グラフ813に示すように、3SOP目においては、先頭の仮の伝送バッファ位置と実際の伝送バッファ位置との誤差は更に広がり、符号化順序が0番目のフレームの符号化処理が行われた時点で、アンダフローが発生している。
このように、比較例の動画像符号化装置300の場合、発生符号量がフィードバックされるまでの間において、
・各フレームの発生符号量が、各フレームの目標符号量と一致せず、かつ、
・各フレームの発生符号量が伝送バッファの回復量よりも大きい状態または小さい状態、
が続くと、アンダフローまたはオーバフローが発生することになる。
(2)第1の実施形態に係る動画像符号化装置の機能の説明
比較例の動画像符号化装置300における上記問題を解決すべく、第1の実施形態に係る動画像符号化装置120では、各SOPの終端で仮の伝送バッファ位置と実際の伝送バッファ位置とが一致するように制御する。
図9は、第1の実施形態に係る動画像符号化装置の符号化処理時の制御の概要を、伝送バッファ位置の観点から説明するための図である。図9に示すように、レートコントローラ305で算出された1SOPの先頭の仮の伝送バッファ位置と、実際の伝送バッファ位置とは一致していたものの、符号化順序が0番目のフレームの符号化処理が行われた時点で、誤差が発生したとする。
このような場合でも、第1の実施形態に係る動画像符号化装置120では、1SOPの終端で仮の伝送バッファ位置と実際の伝送バッファ位置とが一致するように、1フレームの符号化処理が完了するごとに、次のフレームの目標符号量を逐次補正する。
これにより、第1の実施形態に係る動画像符号化装置120によれば、1SOPの終端で仮の伝送バッファ位置と、実際の伝送バッファ位置とを一致させることができる(図9の符号900参照)。この結果、第1の実施形態に係る動画像符号化装置120によれば、SOP間で誤差が累積していくことがなくなり、伝送バッファにおいてアンダフローまたはオーバフローが発生することを回避することができる。
なお、第1の実施形態に係る動画像符号化装置120では、目標符号量の補正を、スライス単位で行う。このため、第1の実施形態に係る動画像符号化装置120では、目標符号量の補正に際して、
・スライス単位の仮の伝送バッファ位置、
・スライス単位の実際の伝送バッファ位置、
・スライス単位の誤差、
を算出する。以下、第1の実施形態に係る動画像符号化装置の機能の詳細について説明する。
(2−1)第1の実施形態に係る動画像符号化装置の機能構成
はじめに、第1の実施形態に係る動画像符号化装置120の機能構成について説明する。図10は、第1の実施形態に係る動画像符号化装置の機能構成の一例を示す図である。図3に示した比較例の動画像符号化装置300の機能構成とは、制御装置210の機能構成において相違する。
図10に示すように、第1の実施形態に係る動画像符号化装置120の場合、動画像符号化プログラムが実行されることで、制御装置210は、ダウンコンバータ303、先行符号化部304として機能する。また、制御装置210は、レートコントローラ1000、個別制御部1010_1〜1010_3として機能する。つまり、図3とは、制御装置210のレートコントローラ1000の機能と、制御装置210が個別制御部1010_1〜1010_3を有する点とにおいて相違する。
レートコントローラ1000は算出部の一例であり、上述したレートコントローラ305の機能に加えて、1SOPの各フレームの仮の伝送バッファ位置を、個別制御部1010_1〜1010_3に通知する機能を有する。
個別制御部1010_1〜1010_3は補正部の一例であり、レートコントローラ1000から、
・1SOPの各フレームの各スライスの目標符号量、
・1SOPの各フレームの仮の伝送バッファ位置、
を取得する。
また、個別制御部1010_1〜1010_3は、8K60Hzエンコーダ306_1〜306_3がそれぞれ有する各4K60Hzエンコーダから、各フレームの各スライスの符号化処理が完了するごとに、スライス単位の発生符号量を取得する。
また、個別制御部1010_1〜1010_3は、各フレームの各スライスの符号化処理が行われるごとに、次のフレームの各スライスの目標符号量を補正する。また、個別制御部1010_1〜1010_3は、補正後の各スライスの目標符号量を、8K60Hzエンコーダ306_1〜306_3がそれぞれ有する各4K60Hzエンコーダに通知する。
(2−2)第1の実施形態に係る動画像符号化装置の機能構成の詳細
次に、第1の実施形態に係る動画像符号化装置120の機能構成の詳細について説明する。図11は、第1の実施形態に係る動画像符号化装置の機能構成の詳細を示す図である。ただし、図11では、説明の簡略化のため、レートコントローラ1000、個別制御部1010_1、8K60Hzエンコーダ306_1に含まれる4つの4K60Hzエンコーダのうち、スライス[0]を符号化処理する4K60Hzエンコーダのみを示している。
図11に示すように、個別制御部1010_1は、目標符号量保存部1101、発生符号量保存部1102、目標符号量再計算部1103を有する。
目標符号量保存部1101は、レートコントローラ1000から通知される、1SOPの各フレームの各スライスの目標符号量を保存する。また、目標符号量保存部1101は、レートコントローラ1000から通知される、1SOPの各フレームの仮の伝送バッファ位置を保存する。
発生符号量保存部1102は、4K60Hzエンコーダが各フレームのスライス[0]の符号化処理を完了するごとに、各フレームのスライス[0]の発生符号量を、4K60Hzエンコーダより取得し、保存する。
目標符号量再計算部1103は、目標符号量保存部1101より、
・1SOPの各フレームの各スライスの目標符号量と、
・1SOPの各フレームの仮の伝送バッファ位置と、
を読み出し、1SOPの各フレームのスライス[0]の仮の伝送バッファ位置を算出する。なお、“1SOPの各フレームの各スライスの仮の伝送バッファ位置の算出方法”は、下記(2−3)において後述する。
また、目標符号量再計算部1103は、発生符号量保存部1102より、処理対象のフレームの1つ前のフレームのスライス[0]の発生符号量を読み出し、実際の伝送バッファ位置を算出する。なお、“実際の伝送バッファ位置の算出方法”は、下記(2−4)において後述する。
また、目標符号量再計算部1103は、
・処理対象のフレームのスライス[0]について符号化処理を開始する前の時点での仮の伝送バッファ位置と、
・処理対象のフレームのスライス[0]について符号化処理を開始する前の時点での実際の伝送バッファ位置と、
に基づいて、スライス[0]の誤差を算出する。なお、“誤差の算出方法”は、下記(2−4)において後述する。
また、目標符号量再計算部1103は、算出したスライス[0]の誤差を用いて、SOP内においてまだ符号化処理が行われていないフレームのスライス[0]の目標符号量を補正し、補正後のスライス[0]の目標符号量を、4K60Hzエンコーダに通知する。
また、図11に示すように、4K60Hzエンコーダは、レート制御部1111、差分画像生成部1112、直交変換/量子化部1113、可変長符号化部1114を有する。また、4K60Hzエンコーダは、逆直交変換/逆量子化部1115、加算部1116、復号画像生成部1117、動き探索部1118、予測画像生成部1119を有する。
差分画像生成部1112は、時空間分割部302より、8K・120Hzの動画像の各フレームのスライス[0]をSOP単位で取得する。また、差分画像生成部1112は、処理対象のフレームのスライス[0]と、予測画像生成部1119にて生成された予測画像(フレームごとに予め定められた参照先(図4))との差分を算出し、予測残差信号を生成する。
レート制御部1111は、目標符号量再計算部1103より通知された、処理対象のフレームについての補正後のスライス[0]の目標符号量のもとで、量子化ステップを調整する。
直交変換/量子化部1113は、予測残差信号に対して直交変換処理を実行するとともに、調整された量子化ステップのもとで、直交変換処理を実行した予測残差信号を量子化し、量子化信号を生成する。
可変長符号化部1114は、量子化信号を可変長符号化することで、ビットストリームを生成する。可変長符号化部1114は、生成したビットストリームを、ストリーム結合部307に出力するとともに、レートコントローラ1000、個別制御部1010_1に出力する。
逆直交変換/逆量子化部1115は、量子化信号を逆量子化したうえで、逆直交変換処理を実行する。
加算部1116は、逆直交変換/逆量子化部1115より出力された信号に対して、予測画像生成部1119にて生成された予測画像を加算することで、復号画像を生成する。
復号画像生成部1117は、生成された復号画像に対して各種フィルタ処理を行い、動き探索部1118、予測画像生成部1119に通知する。
動き探索部1118は、時空間分割部302より、8K・120Hzの動画像の各フレームのスライス[0]をSOP単位で取得し、復号画像を用いて、フレーム間で動き補償を行う。
予測画像生成部1119は、復号画像に基づいてフレーム内予測を行う。また、予測画像生成部1119は、復号画像に基づいてフレーム間予測を行う。更に、予測画像生成部1119は、フレーム内予測を行うことで得た予測画像またはフレーム間予測を行うことで得た予測画像のいずれか一方を、差分画像生成部1112及び加算部1116に出力する。
(2−3)各スライスの仮の伝送バッファ位置の算出方法
次に、1SOPに含まれる各フレームの各スライスの仮の伝送バッファ位置の算出方法について説明する。図12は、各スライスの仮の伝送バッファ位置の算出方法を説明するための図である。
上述したように、目標符号量再計算部1103では、目標符号量保存部1101から、
・1SOPの各フレームの各スライスの目標符号量、
・1SOPの各フレームの仮の伝送バッファ位置、
を読み出す。目標符号量再計算部1103では、図12に示すように、各フレームにおいて、読み出した各スライスの目標符号量の比率に基づいて、読み出した各フレームの仮の伝送バッファ位置から、各フレームの各スライスの仮の伝送バッファ位置を算出する。具体的には、下式に基づいて、各フレームの各スライスの仮の伝送バッファ位置を算出する。
Figure 2020127120
ここで、kはスライスの番号であり、0〜3の値をとる。また、SliceTarget[k]は、k番目のスライスの目標符号量である。また、EstFrameCpbBocは、フレーム単位の仮の伝送バッファ位置であり、EstSliceCpbBoc[k]は、k番目のスライスの仮の伝送バッファ位置である。
上式に示すように、目標符号量再計算部1103では、スライス単位の仮の伝送バッファ位置を算出するにあたり、フレーム単位の仮の伝送バッファ位置を4等分しない。これは、空間分割された4スライスの画像(絵柄)の複雑さには、ばらつきがあるからである。4スライスの画像の複雑さにばらつきがあるにも関わらず、フレーム単位の仮の伝送バッファ位置を4等分して、各スライスの仮の伝送バッファ位置を算出することとすると、スライス単位のレート制御を正確に実行することが困難になることが考えられる。そこで、目標符号量再計算部1103では、フレーム内の各スライスの目標符号量の比率に基づいて、各スライスの仮の伝送バッファ位置を算出する。
(2−4)実際の伝送バッファ位置の算出方法及び誤差の算出方法
次に、目標符号量再計算部1103による、スライス単位の実際の伝送バッファ位置の算出方法及びスライス単位の誤差の算出方法について説明する。
上述したように、実際の伝送バッファ位置を算出するにあたっては、発生符号量とバッファ回復量が用いられる。このため、目標符号量再計算部1103では、スライス単位の実際の伝送バッファ位置を算出するにあたり、スライス単位の発生符号量と、スライス単位のバッファ回復量とを取得する。
ここで、目標符号量再計算部1103では、スライス単位のレート制御を正確にするために、スライス単位のバッファ回復量を、フレーム内の各スライスの目標符号量の比率に従って計算する(下式参照)。
Figure 2020127120
上式において、(R/P)frameは、フレーム単位のバッファ回復量を示しており、(R/P)slice[k]は、k番目のスライスのバッファ回復量を示している。
そして、目標符号量再計算部1103では、上式に基づいて算出したスライス単位のバッファ回復量のもと、スライス単位の発生符号量を用いて、下式に基づいて、スライス単位の実際の伝送バッファ位置を算出する。
Figure 2020127120
ここで、nは符号化順序を表し、1〜8の値をとる。また、SliceBits[n−1]は、符号化順序が(n−1)番目のフレームのスライス[0]について符号化処理が行われた際の発生符号量を示す。なお、上式に示すように、ここでは、1SOPの先頭のスライス[0]の仮の伝送バッファ位置と、1SOPの先頭のスライス[0]の実際の伝送バッファ位置とが一致していることを前提としている。
続いて、スライス単位の誤差の算出方法について説明する。目標符号量再計算部1103では、スライス単位の仮の伝送バッファ位置とスライス単位の実際の伝送バッファ位置とに基づき、下式を用いて、スライス単位の誤差(SliceError[n])を算出する。
Figure 2020127120
次に、目標符号量再計算部1103が算出した実際の伝送バッファ位置の具体例及び誤差の具体例について説明する。図13は、スライス[0]の実際の伝送バッファ位置の具体例及びスライス[0]の誤差の具体例を示す図であり、
・符号化順序が0番目のフレームのスライス[0]について符号化処理が行われ、
・符号化順序が1番目のフレームのスライス[0]について符号化処理が開始される前、
の様子を示している。
図13の例では、スライス[0]の先頭の仮の伝送バッファ位置(EstSliceCpbBoc[0])と、スライス[0]の先頭の実際の伝送バッファ位置(SliceCpbBoc[0])とが一致している。
また、図13の例では、符号化順序が0番目のフレームのスライス[0]について符号化処理が行われた際の発生符号量がSliceBits[0]であるとしている。このため、符号化順序が0番目のフレームのスライス[0]について符号化処理が行われた時点で、実際の伝送バッファ位置は、符号1401で示す位置となる。
また、図13の例では、符号化順序が1番目のフレームのスライス[0]について符号化処理が開始されるまでの間に、スライス[0]の実際の伝送バッファ位置は、スライス[0]のバッファ回復量である(R/P)slice[0]だけ上がっている。このため、図13の例では、符号化順序が1番目のフレームのスライス[0]について符号化処理が開始される前の時点で、スライス[0]の実際の伝送バッファ位置は、SliceCpbBoc[1]となっている。
一方で、目標符号量再計算部1103では、符号化順序が1番目のフレームのスライス[0]について符号化処理が開始される前の時点での、スライス[0]の仮の伝送バッファ位置については既に算出済みである。具体的には、目標符号量再計算部1103では、上記(2−3)で示した式に基づいて、スライス[0]の仮の伝送バッファ位置(EstSliceCpbBoc[1])を算出している。
このため、目標符号量再計算部1103では、符号化順序が1番目のフレームのスライス[0]について符号化処理が開始される前の時点で、スライス[0]の誤差を、
SliceError[1]=EstSliceCpbBoc[1]−SliceCpbBoc[1]
として算出する。
(2−5)目標符号量の補正方法
次に、目標符号量再計算部1103によるスライス単位の目標符号量の補正方法について説明する。上述したとおり、目標符号量再計算部1103では、スライス単位の誤差を解消するために、各フレームの各スライスについて符号化処理が行われるごとに、まだ符号化処理が行われていない残りのフレームの各スライスの目標符号量を補正する。なお、目標符号量再計算部1103による、各スライスの目標符号量の補正方法として、ここでは2通りの補正方法について説明する。
第1の補正方法は、処理対象のフレームの1つ前のフレームのスライス[0]の符号化処理が行われ、処理対象のフレームのスライス[0]の符号化処理が開始される前の時点での誤差を、処理対象のフレームのスライス[0]の目標符号量から減算する方法である。
第1の補正方法によれば、処理対象のフレームのスライス[0]の符号化処理が行われることで、処理対象のフレームのスライス[0]の符号化処理が開始される前の時点での誤差を解消することができる。
ただし、第1の補正方法の場合、減算する誤差が大きいと、処理対象のフレームのスライス[0]の目標符号量がゼロになる可能性があるという問題がある。
一方、第2の補正方法は、処理対象のフレームのスライス[0]の目標符号量がゼロになることがないよう、誤差を、まだ符号化処理が行われていない残りの各フレームのスライス[0]の目標符号量に分配する方法である。
具体的には、目標符号量再計算部1103では、下式に基づいて、誤差分配後の各フレームのスライス[0]の目標符号量であるSliceTarget’[m+1]を算出する(mは処理対象のフレームの1つ前のフレームの符号化順序を表す)。
Figure 2020127120
上記第2の補正方法を図14を用いて更に詳細に説明する。図14は、スライス単位の目標符号量の第2の補正方法を示す図である。目標符号量再計算部1103では、図14に示すように、算出したスライス[0]の誤差を、1SOP内の各フレームのうち、符号化処理が行われていない残りのフレームのスライス[0]の目標符号量に分配する。これにより、第2の補正方法によれば、1SOPの終端で、スライス[0]の仮の伝送バッファ位置と実際の伝送バッファ位置とを一致させることができるとともに、残りのフレームのスライス[0]の目標符号量がゼロになることを回避することができる。
(2−6)目標符号量の補正処理の具体例
次に、目標符号量再計算部1103による、スライス単位の目標符号量の第2の補正方法による補正処理の具体例について説明する。図15は、スライス単位の目標符号量の第2の補正方法による補正処理の具体例を示す第1の図である。このうち、図15(a)は、m=3の場合の目標符号量の補正処理の具体例を示している。
図15(a)に示すように、符号化順序が3番目のフレームの符号化処理が行われ、処理対象のフレームとして、符号化順序が4番目のフレームの符号化処理が開始される前の時点で、スライス[0]の誤差がSliceError[3]であったとする。
一方で、目標符号量再計算部1103により算出された、符号化順序が4番目のフレームのスライス[0]の目標符号量が、SliceTarget[4]であったとする。また、目標符号量再計算部1103により算出された、符号化順序が5番目、6番目、7番目のフレームのスライス[0]の目標符号量が、それぞれ、SliceTarget[5]〜SliceTarget[7]であったとする。
この場合、例えば、符号化順序が4番目のフレームについての、補正後のスライス[0]の目標符号量であるSliceTarget’[4]は、
SliceTarget[4]−SliceError[3]×(SliceTarget[4]/(SliceTarget[5]〜[7]の和))
により算出される。
なお、符号化順序が5番目〜7番目のフレームについての、補正後のスライス[0]の目標符号量であるSliceTarget’[5]〜[7]についても同様の方法により算出される。
図15(b)は、表示順序及び符号化順序と発生符号量との関係を示した図である。図15(b)に示すように、表示順序が0、2、4、6番目のフレーム(符号化順序が1、3、5、7番目のフレーム)は、符号化処理が行われた際の発生符号量が小さい。一方、表示順序が3、7番目のフレーム(符号化順序が0、2番目のフレーム)は、符号化処理が行われた際の発生符号量が大きい。
このように、発生符号量は符号化順序ごとに異なる。このため、誤差を分配するにあたっては、分配先のフレームの符号化順序を考慮する必要がある。一方で、上記第2の補正方法によれば、残りのフレームのスライス[0]同士の目標符号量の比率に応じて誤差が分配される。つまり、第2の補正方法によれば、もともとの目標符号量が小さいものについては、減算量を小さくし、もともとの目標符号量が大きいものについては、減算量を大きくするように誤差を分配することができる。この結果、第2の補正方法によれば、分配先のフレームの符号化順序を考慮した適切な補正を実現することができる。
(2−7)第1の実施形態に係る動画像符号化装置による符号化処理の流れ
次に、第1の実施形態に係る動画像符号化装置120による符号化処理全体の流れについて説明する。図16は、第1の実施形態に係る動画像符号化装置による符号化処理の流れを示すフローチャートである。
ステップS1601において、受信部301は、8K・120Hzの1SOP分の動画像を受信し、ダウンコンバータ303は、1SOP分の動画像をダウンコンバートし、4K・60Hzの動画像を生成する。また、先行符号化部304は、ダウンコンバートされた動画像について先行符号化処理を行う。
ステップS1602において、先行符号化部304は、先行符号化処理の結果に基づき、4K・60Hzの動画像の1SOPに含まれる各フレームについて、スライス単位のGCMを算出する。更に、先行符号化部304は、算出したスライス単位のGCMに基づいて、8K・120Hzの動画像の1SOPに含まれる各フレームについて、スライス単位のGCMを推定する。
ステップS1603において、レートコントローラ1000は、8K・120Hzの動画像の1SOPの各フレームの目標符号量を算出するとともに、1SOPの各フレームの仮の伝送バッファ位置を算出する。
ステップS1604において、レートコントローラ1000は、8K・120Hzの動画像の1SOPの各フレームのスライス単位の目標符号量を算出する。
ステップS1605において、個別制御部1010_1〜1010_3は、フレーム内の各スライスの目標符号量の比率によって、1SOPの各フレームの各スライスの仮の伝送バッファ位置を算出する。
ステップS1606において、個別制御部1010_1〜1010_3は、フレーム内の各スライスの目標符号量の比率によって、1SOPの各フレームのスライス単位のバッファ回復量を計算する。
ステップS1607において、個別制御部1010_1〜1010_3は、処理対象のフレームの1つ前のフレームの各スライスについて、各4K60Hzエンコーダにより符号化処理が行われた際の、各スライスの発生符号量を取得する。
ステップS1608において、個別制御部1010_1〜1010_3は、取得した各スライスの発生符号量に基づいて、処理対象のフレームの各スライスについて符号化処理が開始される前の時点での、各スライスの実際の伝送バッファ位置を算出する。
ステップS1609において、個別制御部1010_1〜1010_3は、処理対象のフレームの各スライスについて符号化処理が開始される前の時点での、各スライスの誤差を算出する。
ステップS1610において、個別制御部1010_1〜1010_3は、ステップS1609において算出した各スライスの誤差を、SOP内においてまだ符号化処理が行われていない各フレームの、対応するスライス同士の目標符号量の比率で分配する。
ステップS1611において、個別制御部1010_1〜1010_3は、符号化処理が行われていない各フレームの各スライスの目標符号量を、分配した誤差に基づいて補正する。
ステップS1612において、各4K60Hzエンコーダは、処理対象のフレームの各スライスについて、補正後の各スライスの目標符号量のもとで符号化処理を行う。また、個別制御部1010_1〜1010_3は、符号化処理が行われたフレームの次のフレームを処理対象のフレームとする。
なお、ステップS1607からステップS1612の各処理は、1SOPに含まれる全てのフレームについて実行され、1SOPに含まれる全てのフレームについて各処理が実行されると、1SOP分の符号化処理が終了する。
以上の説明から明らかなように、第1の実施形態に係る動画像符号化装置120では、8K・120Hzの動画像をダウンコンバートし、1SOPごとに先行符号化することで、1SOPの各フレームの各スライスの目標符号量を算出する。また、第1の実施形態に係る動画像符号化装置120では、1SOPに含まれる各フレームについて、スライス単位の符号化処理が行われるごとに、実際の伝送バッファの位置と仮の伝送バッファの位置との誤差を、スライス単位で算出する。更に、第1の実施形態に係る動画像符号化装置120では、算出したスライス単位の誤差を、1SOP内においてまだ符号化処理が行われていないフレームの、対応するスライス同士の目標符号量の比率に基づいて分配し、スライス単位の目標符号量を補正する。
これにより、第1の実施形態に係る動画像符号化装置120では、1SOPの終端のフレームの符号化処理が行われた時点で、仮の伝送バッファの位置と実際の伝送バッファの位置とを一致させることができる。
この結果、第1の実施形態に係る動画像符号化装置120によれば、伝送バッファにおいてアンダフローまたはオーバフローが発生することを回避することができる。
[第2の実施形態]
上記第1の実施形態では、フレーム単位の仮の伝送バッファ位置から、スライス単位の仮の伝送バッファ位置を算出するにあたり、フレーム内の各スライスの目標符号量の比率を用いるものとして説明した。しかしながら、1SOP内において符号化処理が進むにつれて、各スライスの目標符号量は、順次、補正されていく。そこで、第2の実施形態では、各スライスの仮の伝送バッファ位置を算出するにあたり、フレーム内の補正後の各スライスの目標符号量の比率を用いる。
また、上記第1の実施形態では、スライス単位のバッファ回復量を算出するにあたり、フレーム内の各スライスの目標符号量の比率を用いるものとして説明した。しかしながら、1SOP内において符号化処理が進むにつれて、各スライスの目標符号量は、順次、補正されていく。そこで、第2の実施形態では、スライス単位のバッファ回復量を算出するにあたり、フレーム内の補正後の各スライスの目標符号量の比率を用いる。
以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
(1)各スライスの仮の伝送バッファ位置の算出方法
はじめに、各スライスの仮の伝送バッファ位置の算出方法について説明する。上記第1の実施形態で説明したように、各フレームの各スライスについて符号化処理が行われるごとに、目標符号量再計算部1103では、スライス単位の誤差を算出する。そして、目標符号量再計算部1103では、SOP内においてまだ符号化処理が行われていない各フレームの各スライスの目標符号量を補正する。
一方で、上記第1の実施形態で説明したように、目標符号量再計算部1103では、目標符号量保存部1101から、
・1SOPの各フレームの各スライスの目標符号量、
・1SOPの各フレームの仮の伝送バッファ位置、
を読み出し、フレーム内の各スライスの目標符号量の比率に基づいて各スライスの仮の伝送バッファ位置を算出する。
このとき、第2の実施形態では、各スライスの目標符号量が補正されていた場合には、フレーム内の補正後の各スライスの目標符号量の比率を用いて、各スライスの仮の伝送バッファ位置を算出する。具体的には、下式に基づいて、各スライスの仮の伝送バッファ位置を算出する。
Figure 2020127120
(2)スライス単位のバッファ回復量の算出方法
次に、スライス単位のバッファ回復量の算出方法について説明する。上記第1の実施形態で説明したように、1フレームの各スライスについて符号化処理が行われるごとに、目標符号量再計算部1103では、スライス単位の誤差を算出する。そして、目標符号量再計算部1103では、SOP内においてまだ符号化処理が行われていない各フレームの各スライスの目標符号量を補正する。
一方で、上記第1の実施形態で説明したように、目標符号量再計算部1103では、各フレームにおいてスライス単位のバッファ回復量を、フレーム内の各スライスの目標符号量の比率に従って算出する。
このとき、第2の実施形態では、各スライスの目標符号量が補正されていた場合には、フレーム内の補正後の各スライスの目標符号量の比率を用いて、各スライスのバッファ回復量を算出する。具体的には、下式に基づいて、各スライスのバッファ回復量を算出する。
Figure 2020127120
(3)仮の伝送バッファ位置の具体例及び実際の伝送バッファ位置の具体例
次に、スライス[0]の仮の伝送バッファ位置の具体例及びスライス[0]の実際の伝送バッファ位置の具体例について説明する。図17は、スライス[0]の仮の伝送バッファ位置の具体例及びスライス[0]の実際の伝送バッファ位置の具体例を示す図である。
このうち、図17(a)は、符号化順序が1番目のフレームのスライス[0]について符号化処理が開始される前の伝送バッファ位置を示している。ここで、スライス[0]の先頭の仮の伝送バッファ位置(EstSliceCpbBoc[0])と、スライス[0]の先頭の実際の伝送バッファ位置(SliceCpbBoc[0])とは一致している。
このため、図17(a)の時点で、目標符号量再計算部1103では、
・スライス[0]の仮の伝送バッファ位置(EstSliceCpbBoc[1])を算出するにあたり、符号化順序が0番目のフレーム内の各スライスの目標符号量の比率を用いる。
・スライス[0]の実際の伝送バッファ位置(SliceCpbBoc[1])を算出するにあたり、符号化順序が0番目のフレーム内の各スライスの目標符号量の比率に基づく、バッファ回復量(R/P)slice[0]を用いる。
一方、図17(b)は、符号化順序が2番目のフレームのスライス[0]について符号化処理が開始される前の伝送バッファ位置を示している。ここで、符号化順序が1番目のフレームのスライス[0]について符号化処理が開始される前の時点で、誤差(SliceError[1])が発生しているため、符号化順序が1番目のフレームのスライス[0]については目標符号量が補正されている。
このため、図17(b)の時点で、目標符号量再計算部1103は、
・スライス[0]の仮の伝送バッファ位置(EstSliceCpbBoc[2])を算出するにあたり、符号化順序が1番目のフレーム内の補正後の各スライスの目標符号量の比率を用いる。
・スライス[0]の実際の伝送バッファ位置(SliceCpbBoc[2])を算出するにあたり、符号化順序が1番目のフレーム内の補正後の各スライスの目標符号量の比率に基づく、バッファ回復量(R/P)slice[1]を用いる。
(4)第2の実施形態に係る動画像符号化装置による符号化処理の流れ
次に、第2の実施形態に係る動画像符号化装置120による符号化処理全体の流れについて説明する。図18は、第2の実施形態に係る動画像符号化装置による符号化処理の流れを示すフローチャートである。図16を用いて説明した符号化処理との相違点は、ステップS1801とステップS1802である。
ステップS1801において、個別制御部1010_1〜1010_3は、フレーム内の各スライスの目標符号量の比率を用いて、処理対象のフレームの1つ前のフレームのスライス単位のバッファ回復量を計算する。このとき、個別制御部1010_1〜1010_3では、処理対象のフレームについて、スライス単位の目標符号量が補正されていた場合には、フレーム内の補正後の各スライスの目標符号量の比率を用いて、バッファ回復量を計算する。
ステップS1802において、個別制御部1010_1〜1010_3は、フレーム内の各スライスの目標符号量の比率を用いて、処理対象のフレームの各スライスについて符号化処理を開始する前の時点での、各スライスの仮の伝送バッファ位置を算出する。このとき、個別制御部1010_1〜1010_3では、スライス単位の目標符号量が補正されていた場合には、フレーム内の補正後の各スライスの目標符号量の比率を用いて、各スライスの仮の伝送バッファ位置を算出する。
以上の説明から明らかなように、第2の実施形態に係る動画像符号化装置では、各スライスの仮の伝送バッファ位置を算出するにあたり、フレーム内の補正後の各スライスの目標符号量の比率を用いる。また、第2の実施形態に係る動画像符号化装置では、スライス単位のバッファ回復量を算出するにあたり、フレーム内の補正後の各スライスの目標符号量の比率を用いる。
これにより、第2の実施形態に係る動画像符号化装置によれば、仮の伝送バッファ位置と実際の伝送バッファ位置との誤差を、より的確に算出することが可能となる。
[第3の実施形態]
上記第1及び第2の実施形態では、目標符号量の補正を、SOP内において符号化処理が行われていない残りの全てのフレームの各スライスについて行うものとして説明した。一方で、上述したように、SOP内の各フレームは、階層ごとに発生符号量が異なる。
このため、仮の伝送バッファ位置と実際の伝送バッファ位置との誤差が大きいときに、発生符号量の小さいフレーム(階層が深いフレーム)の各スライスの目標符号量を補正すると、補正後の各スライスの目標符号量がゼロになる可能性がある。
そこで、第3の実施形態では、目標符号量の補正を、SOP内において符号化処理が行われていない残りのフレームのうち、階層の浅いフレームの各スライスについて行う。以下、第3の実施形態について、上記第1及び第2の実施形態との相違点を中心に説明する。
(1)第3の実施形態に係る動画像符号化装置の機能構成の詳細
はじめに、第3の実施形態に係る動画像符号化装置120の機能構成の詳細について説明する。図19は、第3の実施形態に係る動画像符号化装置の機能構成の詳細を示す図である。図10と同様、図19では、レートコントローラ1000、個別制御部1010_1、8K60Hzエンコーダ306_1に含まれる4つの4K60Hzエンコーダのうち、スライス[0]を符号化処理する4K60Hzエンコーダのみを示している。
図10との相違点は、個別制御部1010_1が階層情報取得部1901を有する点である。階層情報取得部1901は、時空間分割部302より、8K・120Hzの動画像の各フレームのスライス[0]をSOP単位で取得する。また、階層情報取得部1901は、取得した各フレームのスライス[0]のうち、所定の符号化順序のフレーム(例えば、符号化順序が偶数番目のフレーム)のスライス[0]を、目標符号量再計算部1103に通知する。符号化順序が偶数番目のフレームは、階層が浅いため、当該フレームのスライス[0]を符号化処理した場合、発生符号量が大きいからである。
(2)第3の実施形態に係る動画像符号化装置による符号化処理の流れ
次に、第3の実施形態に係る動画像符号化装置120による符号化処理の流れについて説明する。図20は、第3の実施形態に係る動画像符号化装置による符号化処理の流れを示すフローチャートである。図16を用いて説明した符号化処理との相違点は、ステップS2001とステップS2002である。
ステップS2001において、個別制御部1010_1〜1010_3は、ステップS1609で算出した各スライスの誤差を、SOP内においてまだ符号化処理が行われていない階層の浅い各フレームの、対応するスライス同士の目標符号量の比率で分配する。
ステップS2002において、個別制御部1010_1〜1010_3は、SOP内においてまだ符号化処理が行われていない、階層の浅いフレームの各スライスの目標符号量を、分配した各スライスの誤差に基づいて補正する。
以上の説明から明らかなように、第3の実施形態に係る動画像符号化装置では、目標符号量の補正を、符号化処理が行われていない残りのフレームのうち、階層の浅いフレームの各スライスについて行う。
これにより、第3の実施形態に係る動画像符号化装置によれば、スライス単位の目標符号量を適切に補正することが可能となる。
[第4の実施形態]
上記第1の実施形態では、SOP内においてまだ符号化処理が行われていない残りのフレームのスライス単位の目標符号量を補正するにあたり、残りのフレームの対応するスライス同士の目標符号量の比率に応じて誤差を分配するものとして説明した。
しかしながら、残りのフレームには、階層の浅いフレームと階層の深いフレームとが含まれ、階層の浅いフレームの方が、符号化処理の際に、より多くのフレームから参照される(以下、このようなフレームを参照フレームと称す)。一方、階層の深いフレームは、符号化処理の際に、他のフレームから参照されない(以下、このようなフレームを非参照フレームと称す)。
一般に、符号化処理においては、参照フレームの画質を向上させることで、動画像全体の画質が向上する。このため、第4の実施形態では、まだ符号化処理が行われていない残りのフレームの各スライスの目標符号量を補正するにあたり、参照フレームか否かに応じて、補正量を調整する。以下、第4の実施形態について、上記第1の実施形態との相違点を中心に説明する。
図21は、スライス単位の目標符号量の第2の補正方法による補正処理の具体例を示す第2の図である。図21(a)に示すように、符号化順序が3番目のフレームについて符号化処理が行われ、符号化順序が4番目のフレームの符号化処理が開始される前の時点で、スライス[0]の誤差がSliceError[3]であったとする。
一方で、目標符号量再計算部1103により算出された、符号化順序が4番目のフレームのスライス[0]の目標符号量が、SliceTarget[4]であったとする。また、個別制御部1010_1により算出された、符号化順序が5番目、6番目、7番目のフレームのスライス[0]の目標符号量が、それぞれ、SliceTarget[5]〜SliceTarget[7]であったとする。
ここで、図21(b)に示すように、符号化順序が4番目から7番目のフレームのうち、4番目のフレームと6番目のフレームは参照フレームであり、5番目のフレームと7番目のフレームは非参照フレームである。
そこで、目標符号量再計算部1103では、4番目のフレームのスライス[0]の目標符号量と、6番目のフレームのスライス[0]の目標符号量を補正するにあたり、目標符号量を減算する場合にあっては、誤差の分配を少なくする。具体的には、目標符号量の比率に、1未満の補正係数を乗算したうえで、スライス[0]の目標符号量を補正する。
また、目標符号量再計算部1103では、4番目のフレームのスライス[0]の目標符号量と、6番目のフレームのスライス[0]の目標符号量を補正するにあたり、目標符号量を加算する場合にあっては、誤差の分配を多くする。具体的には、目標符号量の比率に、1以上の補正係数を乗算したうえで、スライス[0]の目標符号量を補正する。
また、目標符号量再計算部1103では、5番目のフレームのスライス[0]の目標符号量と、7番目のフレームのスライス[0]の目標符号量を補正するにあたり、目標符号量を減算する場合にあっては、誤差の分配を多くする。具体的には、目標符号量の比率に、1以上の補正係数を乗算したうえで、スライス[0]の目標符号量を補正する。
また、目標符号量再計算部1103では、5番目のフレームのスライス[0]の目標符号量と、7番目のフレームのスライス[0]の目標符号量を補正するにあたり、目標符号量を加算する場合にあっては、誤差の分配を少なくする。具体的には、目標符号量の比率に、1未満の補正係数を乗算したうえで、スライス[0]の目標符号量を補正する。
以上の説明から明らかなように、第4の実施形態に係る動画像符号化装置では、SOP内においてまだ符号化処理が行われていない残りのフレームのスライス単位の目標符号量を補正するにあたり、参照フレームか否かに応じて、補正量を調整する。
これにより、第4の実施形態に係る動画像符号化装置によれば、復号後の動画像の画質を向上させることができる。
[その他の実施形態]
上記第1乃至第4の実施形態では、8K60Hzエンコーダ306_1〜306_3が、それぞれ、4つの4K60Hzエンコーダを有するものとして説明した。また、上記第1乃至第4の実施形態では、4つの4K60Hzエンコーダが、それぞれ、8K・120Hzの動画像の1SOP分の各フレームの1スライス分を符号化処理するものとして説明した。
しかしながら、8K60Hzエンコーダ306_1〜306_3が、それぞれ、8K・120Hzの動画像の1SOP分の各フレームを符号化処理するようにしてもよい。この場合、時空間分割部302では、時分割のみを行い、空間分割を行う必要はなくなる。
つまり、上記第1乃至第4の実施形態では、符号化処理の処理単位を1スライスとして説明したが、符号化処理の処理単位は1フレームであってもよい。具体的には、個別制御部1010_1〜1010_3は、処理対象のフレームの符号化処理が行われるごとに、フレーム単位の実際の伝送バッファ位置と仮の伝送バッファ位置との誤差を算出してもよい。また、個別制御部1010_1〜1010_3は、フレーム単位の誤差に基づいて、SOP内において符号化処理が行われていない残りの各フレームの目標符号量を補正してもよい。これにより、スライス単位で目標符号量を補正する場合と同様の効果が得られる。
また、上記第1乃至第4の実施形態では、4K60Hzエンコーダが符号化処理する際の符号化方式について特に言及しなかったが、符号化方式は任意である(例えば、H.265/HEVCであってもよいし、H.264/MPEG4 AVCであってもよい)。
なお、開示の技術では、以下に記載する付記のような形態が考えられる。
(付記1)
時間方向に分割されたSOP単位の動画像をダウンコンバートし、先行して符号化処理を行う先行符号化部と、
前記先行して符号化処理を行った結果に基づいて、前記SOP単位の動画像に含まれる各処理単位の目標符号量を算出し、算出した目標符号量に基づいて各処理単位について符号化処理が行われた場合の仮のバッファ位置を算出する算出部と、
前記SOP単位の動画像において、各処理単位について符号化処理が行われるごとに、実際の伝送バッファの位置と仮のバッファ位置との誤差を算出し、まだ符号化処理が行われていない各処理単位の目標符号量を補正する補正部と
を有する動画像符号化装置。
(付記2)
前記補正部は、前記SOP単位の動画像において、まだ符号化処理が行われていない各処理単位の目標符号量の比率に基づいて、前記誤差を、各処理単位の目標符号量に分配することで、まだ符号化処理が行われていない各処理単位の目標符号量を補正する、付記1に記載の動画像符号化装置。
(付記3)
前記補正部は、前記SOP単位の動画像において、まだ符号化処理が行われていない各処理単位の目標符号量の比率と、まだ符号化処理が行われていない各処理単位の階層とに基づいて、前記誤差を、各処理単位の目標符号量に分配することで、まだ符号化処理が行われていない各処理単位の目標符号量を補正する、付記1に記載の動画像符号化装置。
(付記4)
前記処理単位は、前記SOP単位の動画像に含まれるフレームである、付記1乃至3のいずれかの付記に記載の動画像符号化装置。
(付記5)
前記処理単位は、前記SOP単位の動画像に含まれる各フレームを、空間方向に分割したスライスである、付記1乃至3のいずれかの付記に記載の動画像符号化装置。
(付記6)
前記先行符号化部は、前記時間方向及び前記空間方向に分割された動画像をダウンコンバートし、先行して符号化処理を行うことで、前記SOP単位の動画像に含まれる各フレームの各スライスの符号化難易度を推定し、
前記算出部は、推定された各フレームの各スライスの符号化難易度に基づいて、各フレームの目標符号量を算出し、算出した各フレームの目標符号量に基づいて各フレームの仮のバッファ位置を算出する、付記5に記載の動画像符号化装置。
(付記7)
前記算出部は、推定された各フレームの各スライスの符号化難易度に基づいて、各フレームの各スライスの目標符号量を算出し、
前記補正部は、前記算出部により算出された各フレームの仮のバッファ位置と、フレーム内の各スライスの目標符号量の比率とに基づいて、各スライスの仮のバッファ位置を算出する、付記6に記載の動画像符号化装置。
(付記8)
前記補正部は、各スライスについて符号化処理が行われるごとに取得した各スライスの発生符号量と、各スライスのバッファ回復量とに基づいて、各スライスの実際のバッファ位置を算出する、付記7に記載の動画像符号化装置。
(付記9)
前記補正部は、算出した各スライスの仮のバッファ位置と、算出した各スライスの実際のバッファ位置とに基づいて、各スライスの誤差を算出する、付記8に記載の動画像符号化装置。
(付記10)
前記補正部は、前記SOP単位の動画像において、まだ符号化処理が行われていない各フレームについて、対応するスライス同士の目標符号量の比率に基づいて、対応するスライスの誤差を分配することで、まだ符号化処理が行われていない各フレームについて、対応するスライスの目標符号量を補正する、付記9に記載の動画像符号化装置。
(付記11)
前記補正部は、前記算出部により算出された各フレームの仮のバッファ位置と、フレーム内の補正後の各スライスの目標符号量の比率とに基づいて、各スライスの仮のバッファ位置を算出する、付記10に記載の動画像符号化装置。
(付記12)
前記補正部は、前記各スライスのバッファ回復量を、フレーム内の補正後の各スライスの目標符号量の比率に基づいて算出する、付記10に記載の動画像符号化装置。
(付記13)
前記補正部は、前記SOP単位の動画像において、まだ符号化処理が行われていない各フレームのうち、所定の符号化順序のフレームについて、対応するスライス同士の目標符号量の比率に基づいて、対応するスライスの誤差を分配することで、該所定の符号化順序のフレームについて、対応するスライスの目標符号量を補正する、付記9に記載の動画像符号化装置。
(付記14)
前記補正部は、前記SOP単位の動画像において、まだ符号化処理が行われていない各フレームについて、対応するスライス同士の目標符号量の比率に基づいて、対応するスライスの誤差を分配する際、参照フレームであるか否かに応じて異なる補正係数を乗算して分配することで、まだ符号化処理が行われていない各フレームについて、対応するスライスの目標符号量を補正する、付記9に記載の動画像符号化装置。
(付記15)
時間方向に分割されたSOP単位の動画像をダウンコンバートし、先行して符号化処理を行い、
前記先行して符号化処理を行った結果に基づいて、前記SOP単位の動画像に含まれる各処理単位の目標符号量を算出し、算出した目標符号量に基づいて各処理単位について符号化処理が行われた場合の仮のバッファ位置を算出し、
前記SOP単位の動画像において、各処理単位について符号化処理が行われるごとに、実際の伝送バッファの位置と仮のバッファ位置との誤差を算出し、まだ符号化処理が行われていない各処理単位の目標符号量を補正する、
処理をコンピュータが実行する動画像符号化方法。
(付記16)
時間方向に分割されたSOP単位の動画像をダウンコンバートし、先行して符号化処理を行い、
前記先行して符号化処理を行った結果に基づいて、前記SOP単位の動画像に含まれる各処理単位の目標符号量を算出し、算出した目標符号量に基づいて各処理単位について符号化処理が行われた場合の仮のバッファ位置を算出し、
前記SOP単位の動画像において、各処理単位について符号化処理が行われるごとに、実際の伝送バッファの位置と仮のバッファ位置との誤差を算出し、まだ符号化処理が行われていない各処理単位の目標符号量を補正する、
処理をコンピュータに実行させるための動画像符号化プログラム。
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
120 :動画像符号化装置
210 :制御装置
220 :信号変換装置
230 :符号化装置
240 :再構成装置
301 :受信部
302 :時空間分割部
303 :ダウンコンバータ
304 :先行符号化部
305 :レートコントローラ
306 :8K120Hzエンコーダ
306_1〜306_3 :8K60Hzエンコーダ
307 :ストリーム結合部
1001_1〜1001_3 :個別制御部
1101 :目標符号量保存部
1102 :発生符号量保存部
1103 :目標符号量再計算部
1901 :階層情報取得部

Claims (16)

  1. 時間方向に分割されたSOP単位の動画像をダウンコンバートし、先行して符号化処理を行う先行符号化部と、
    前記先行して符号化処理を行った結果に基づいて、前記SOP単位の動画像に含まれる各処理単位の目標符号量を算出し、算出した目標符号量に基づいて各処理単位について符号化処理が行われた場合の仮のバッファ位置を算出する算出部と、
    前記SOP単位の動画像において、各処理単位について符号化処理が行われるごとに、実際の伝送バッファの位置と仮のバッファ位置との誤差を算出し、まだ符号化処理が行われていない各処理単位の目標符号量を補正する補正部と
    を有する動画像符号化装置。
  2. 前記補正部は、前記SOP単位の動画像において、まだ符号化処理が行われていない各処理単位の目標符号量の比率に基づいて、前記誤差を、各処理単位の目標符号量に分配することで、まだ符号化処理が行われていない各処理単位の目標符号量を補正する、請求項1に記載の動画像符号化装置。
  3. 前記補正部は、前記SOP単位の動画像において、まだ符号化処理が行われていない各処理単位の目標符号量の比率と、まだ符号化処理が行われていない各処理単位の階層とに基づいて、前記誤差を、各処理単位の目標符号量に分配することで、まだ符号化処理が行われていない各処理単位の目標符号量を補正する、請求項1に記載の動画像符号化装置。
  4. 前記処理単位は、前記SOP単位の動画像に含まれるフレームである、請求項1乃至3のいずれか1項に記載の動画像符号化装置。
  5. 前記処理単位は、前記SOP単位の動画像に含まれる各フレームを、空間方向に分割したスライスである、請求項1乃至3のいずれか1項に記載の動画像符号化装置。
  6. 前記先行符号化部は、前記時間方向及び前記空間方向に分割された動画像をダウンコンバートし、先行して符号化処理を行うことで、前記SOP単位の動画像に含まれる各フレームの各スライスの符号化難易度を推定し、
    前記算出部は、推定された各フレームの各スライスの符号化難易度に基づいて、各フレームの目標符号量を算出し、算出した各フレームの目標符号量に基づいて各フレームの仮のバッファ位置を算出する、請求項5に記載の動画像符号化装置。
  7. 前記算出部は、推定された各フレームの各スライスの符号化難易度に基づいて、各フレームの各スライスの目標符号量を算出し、
    前記補正部は、前記算出部により算出された各フレームの仮のバッファ位置と、フレーム内の各スライスの目標符号量の比率とに基づいて、各スライスの仮のバッファ位置を算出する、請求項6に記載の動画像符号化装置。
  8. 前記補正部は、各スライスについて符号化処理が行われるごとに取得した各スライスの発生符号量と、各スライスのバッファ回復量とに基づいて、各スライスの実際のバッファ位置を算出する、請求項7に記載の動画像符号化装置。
  9. 前記補正部は、算出した各スライスの仮のバッファ位置と、算出した各スライスの実際のバッファ位置とに基づいて、各スライスの誤差を算出する、請求項8に記載の動画像符号化装置。
  10. 前記補正部は、前記SOP単位の動画像において、まだ符号化処理が行われていない各フレームについて、対応するスライス同士の目標符号量の比率に基づいて、対応するスライスの誤差を分配することで、まだ符号化処理が行われていない各フレームについて、対応するスライスの目標符号量を補正する、請求項9に記載の動画像符号化装置。
  11. 前記補正部は、前記算出部により算出された各フレームの仮のバッファ位置と、フレーム内の補正後の各スライスの目標符号量の比率とに基づいて、各スライスの仮のバッファ位置を算出する、請求項10に記載の動画像符号化装置。
  12. 前記補正部は、前記各スライスのバッファ回復量を、フレーム内の補正後の各スライスの目標符号量の比率に基づいて算出する、請求項10に記載の動画像符号化装置。
  13. 前記補正部は、前記SOP単位の動画像において、まだ符号化処理が行われていない各フレームのうち、所定の符号化順序のフレームについて、対応するスライス同士の目標符号量の比率に基づいて、対応するスライスの誤差を分配することで、該所定の符号化順序のフレームについて、対応するスライスの目標符号量を補正する、請求項9に記載の動画像符号化装置。
  14. 前記補正部は、前記SOP単位の動画像において、まだ符号化処理が行われていない各フレームについて、対応するスライス同士の目標符号量の比率に基づいて、対応するスライスの誤差を分配する際、参照フレームであるか否かに応じて異なる補正係数を乗算して分配することで、まだ符号化処理が行われていない各フレームについて、対応するスライスの目標符号量を補正する、請求項9に記載の動画像符号化装置。
  15. 時間方向に分割されたSOP単位の動画像をダウンコンバートし、先行して符号化処理を行い、
    前記先行して符号化処理を行った結果に基づいて、前記SOP単位の動画像に含まれる各処理単位の目標符号量を算出し、算出した目標符号量に基づいて各処理単位について符号化処理が行われた場合の仮のバッファ位置を算出し、
    前記SOP単位の動画像において、各処理単位について符号化処理が行われるごとに、実際の伝送バッファの位置と仮のバッファ位置との誤差を算出し、まだ符号化処理が行われていない各処理単位の目標符号量を補正する、
    処理をコンピュータが実行する動画像符号化方法。
  16. 時間方向に分割されたSOP単位の動画像をダウンコンバートし、先行して符号化処理を行い、
    前記先行して符号化処理を行った結果に基づいて、前記SOP単位の動画像に含まれる各処理単位の目標符号量を算出し、算出した目標符号量に基づいて各処理単位について符号化処理が行われた場合の仮のバッファ位置を算出し、
    前記SOP単位の動画像において、各処理単位について符号化処理が行われるごとに、実際の伝送バッファの位置と仮のバッファ位置との誤差を算出し、まだ符号化処理が行われていない各処理単位の目標符号量を補正する、
    処理をコンピュータに実行させるための動画像符号化プログラム。
JP2019018157A 2019-02-04 2019-02-04 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム Active JP7238441B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019018157A JP7238441B2 (ja) 2019-02-04 2019-02-04 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
US16/775,310 US10958905B2 (en) 2019-02-04 2020-01-29 Information processing apparatus, moving image encoding method, and computer-readable recording medium recording moving image encoding program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019018157A JP7238441B2 (ja) 2019-02-04 2019-02-04 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム

Publications (2)

Publication Number Publication Date
JP2020127120A true JP2020127120A (ja) 2020-08-20
JP7238441B2 JP7238441B2 (ja) 2023-03-14

Family

ID=71835809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019018157A Active JP7238441B2 (ja) 2019-02-04 2019-02-04 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム

Country Status (2)

Country Link
US (1) US10958905B2 (ja)
JP (1) JP7238441B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021199374A1 (ja) * 2020-04-01 2021-10-07 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、映像システムおよびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH114445A (ja) * 1997-06-11 1999-01-06 Sony Corp 画像符号化装置および方法
US20060126728A1 (en) * 2004-12-10 2006-06-15 Guoyao Yu Parallel rate control for digital video encoder with multi-processor architecture and picture-based look-ahead window
US20080304564A1 (en) * 2007-06-11 2008-12-11 Samsung Electronics Co., Ltd. Bitrate control method and apparatus for intra-only video sequence coding

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000232644A (ja) 1999-02-10 2000-08-22 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法および装置およびそのプログラムを記憶した記憶媒体
JP4203707B2 (ja) 2001-01-31 2009-01-07 日本電気株式会社 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。
JP4358215B2 (ja) 2006-09-27 2009-11-04 株式会社東芝 動画像符号化装置及びその方法
JP4582141B2 (ja) * 2007-11-27 2010-11-17 カシオ計算機株式会社 符号量制御装置、符号量制御方法、符号量制御プログラム、動画記録装置
CN102138327B (zh) * 2009-06-23 2014-09-24 松下电器产业株式会社 运动图像编码方法、运动图像编码装置以及集成电路
JP5640371B2 (ja) * 2009-12-18 2014-12-17 ソニー株式会社 カメラシステム及び画像処理方法
JP2016092837A (ja) * 2014-10-30 2016-05-23 株式会社東芝 映像圧縮装置、映像再生装置および映像配信システム
WO2018090367A1 (en) * 2016-11-21 2018-05-24 Intel Corporation Method and system of video coding with reduced supporting data sideband buffer usage
WO2018140158A1 (en) * 2017-01-30 2018-08-02 Euclid Discoveries, Llc Video characterization for smart enconding based on perceptual quality optimization
US10743032B2 (en) * 2017-05-24 2020-08-11 Qualcomm Incorporated Substream multiplexing for display stream compression
US10979747B2 (en) * 2017-12-21 2021-04-13 Arris Enterprises Llc Statistical multiplexing system for variable bit rate encoding with constant bit rate encoder

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH114445A (ja) * 1997-06-11 1999-01-06 Sony Corp 画像符号化装置および方法
US20060126728A1 (en) * 2004-12-10 2006-06-15 Guoyao Yu Parallel rate control for digital video encoder with multi-processor architecture and picture-based look-ahead window
JP2008523720A (ja) * 2004-12-10 2008-07-03 タット・システムズ・インコーポレイテッド マルチプロセッサアーキテクチュア並びにピクチュアベースの先読みウィンドウを具備したデジタルビデオエンコーダのためのパラレルレートコントロール
US20080304564A1 (en) * 2007-06-11 2008-12-11 Samsung Electronics Co., Ltd. Bitrate control method and apparatus for intra-only video sequence coding
JP2008306705A (ja) * 2007-06-11 2008-12-18 Samsung Electronics Co Ltd イントラピクチャーのみを利用した動画シーケンスの符号化時のビット率制御方法及び装置

Also Published As

Publication number Publication date
US20200252607A1 (en) 2020-08-06
US10958905B2 (en) 2021-03-23
JP7238441B2 (ja) 2023-03-14

Similar Documents

Publication Publication Date Title
US10218995B2 (en) Moving picture encoding system, moving picture encoding method, moving picture encoding program, moving picture decoding system, moving picture decoding method, moving picture decoding program, moving picture reencoding system, moving picture reencoding method, moving picture reencoding program
KR101329860B1 (ko) 효과적인 레이트 제어 및 비디오 인코딩 품질의 향상을 위한 ρ-도메인 프레임 레벨 비트 할당 방법
WO2011105337A1 (ja) 多視点映像符号化方法、多視点映像復号方法、多視点映像符号化装置、多視点映像復号装置、及びプログラム
US9025664B2 (en) Moving image encoding apparatus, moving image encoding method, and moving image encoding computer program
US20060203904A1 (en) Video processing and recording apparatuses and methods
KR20080056248A (ko) 더 정확한 모션 정보를 이용한 프레임 보간
US20170111652A1 (en) Low-complexity method for generating synthetic reference frames in video coding
WO2010056333A1 (en) Multiple thread video encoding using bit overshooting compensation
US20170099491A1 (en) Apparatus, method and non-transitory medium storing program for encoding moving picture
US11159799B2 (en) Encoding a plurality of signals
JP2019140575A (ja) 画像符号化装置及びその制御方法及びプログラム
CN116916066A (zh) 一种视频转码方法及装置、电子设备及存储介质
JP7238441B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
US10171807B2 (en) Picture-level QP rate control for HEVC encoding
JP5746370B2 (ja) 予測値を形成するための方法および装置
US20200059657A1 (en) Image processing apparatus and method
JP2006340183A (ja) 画像符号化装置及び画像符号化方法
US20100272170A1 (en) Image encoding apparatus, image encoding method and medium on which image encoding program is recorded
US20150358630A1 (en) Combined Parallel and Pipelined Video Encoder
US11563935B2 (en) Image decoding device, image decoding method, and image decoding program
JP2009111762A (ja) 画像符号化装置及び画像復号装置
KR20150045951A (ko) 수신 장치, 송신 장치 및 화상 송신 방법
JP4243286B2 (ja) 符号化方法
KR20100023781A (ko) 동영상 인코더와 동영상 디코더에서의 분산적 움직임 예측 방법
JP2006324888A (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230213

R150 Certificate of patent or registration of utility model

Ref document number: 7238441

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150