JP2023124387A - ビットレート決定装置、符号化装置、およびプログラム - Google Patents

ビットレート決定装置、符号化装置、およびプログラム Download PDF

Info

Publication number
JP2023124387A
JP2023124387A JP2022028123A JP2022028123A JP2023124387A JP 2023124387 A JP2023124387 A JP 2023124387A JP 2022028123 A JP2022028123 A JP 2022028123A JP 2022028123 A JP2022028123 A JP 2022028123A JP 2023124387 A JP2023124387 A JP 2023124387A
Authority
JP
Japan
Prior art keywords
bit rate
unit
image
spatial scalable
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022028123A
Other languages
English (en)
Inventor
雄一 近藤
Yuichi Kondo
泰子 森田
Yasuko Morita
敦郎 市ヶ谷
Atsuro Ichigaya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2022028123A priority Critical patent/JP2023124387A/ja
Publication of JP2023124387A publication Critical patent/JP2023124387A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】効率のよい空間スケーラブル符号化を行うためのビットレートを適切に決定することのできるビットレート決定装置、符号化装置、およびプログラムを提供する。【解決手段】先行空間スケーラブル符号化部は、先行して符号化および復号を行い、符号化画像と対応する前記ビットレートとの対を出力する。精細感領域情報導出部は、入力画像の中で精細感に関与する領域を表す情報である精細感領域情報を求める。歪み算出部は、先行空間スケーラブル符号化部から出力される符号化画像の、求められた精細感領域情報が示す領域における歪み度合いを算出する。割り当てビットレート算出部は、前記ビットレートと、対応する前記歪み度合いと、の対を基に定まるRD曲線における、所定の傾きを有する位置に対応するビットレートに基づいて定まる割り当てビットレートを求める。【選択図】図1

Description

本発明は、ビットレート決定装置、符号化装置、およびプログラムに関する。
複数の異なる解像度の映像を効率的に符号化する方法として、空間スケーラブル符号化の手法がある。空間スケーラブル符号化の手法では、相対的に低解像度映像の符号化情報であるベースレイヤー(BL)と、高解像度映像と低解像度映像の差分の符号化情報であるエンハンスメントレイヤー(EL)とを階層的に符号化する。なお、エンハンスメントレイヤーの符号化を行う際には、ベースレイヤーの符号に基づく階層間処理を行う。復号する際には、ベースレイヤーから低解像度映像を復号し、ベースレイヤーおよびエンハンスメントレイヤーの両方から高解像度映像を復号することができる。
空間スケーラブル符号化を利用すると、一例として、2K映像をベースレイヤーで符号化し、4K映像をベースレイヤーおよびエンハンスメントレイヤーで符号化する。一般的には、エンハンスメントレイヤーが複数存在していてもよい。最新の符号化方式VVC(Versatile Video Coding)では、空間スケーラブル符号化を行うMultilayer main 10プロファイルが第一版から規定されており、放送および通信による映像サービスにおいてその利用が期待されている。なお、空間スケーラブル符号化に対して、レイヤー数が1である通常の符号化をシングルレイヤー符号化と呼ぶ。
一般的に、映像符号化では、限られた伝送帯域で高品質に符号化を行うために符号化制御が行われている。ビットレート割当処理と、RD最適化(レート歪み最適化)との2つの処理で行われる。ビットレート割当処理は、GOP(group of pictures)単位、フレーム単位、ブロック単位といった単位で適切にビットレートを割り当てる処理(ビット割り当て)である。ビットレート割当処理では、全体の目標ビットレートを超えないように、消費ビットレートを監視しながら、所定単位ごとにビットレートを割り当てる。RD最適化は、ビットレート割当処理によって割り当てられたビットレートの範囲内で画質を最大化する予測モードの選択を行う処理である。つまり、RD最適化処理では、割り当てられたビットレートにおいて、歪みを最小化する予測モードの選択を行う。
HEVC(High Efficiency Video Codec)やVVCなど近年の映像符号化規格の参照ソフトウェアであるHM(HEVCテストモデル)やVTM(VVCテストモデル)のRD最適化では、コスト関数J=D+λRを最小化する予測モードを選択する。ここで、Dは歪み、Rはビットレート、λはラグランジュ乗数(Lagrange multiplier)である。ラグランジュ乗数λは、映像や量子化パラメーター(QP,quantization parameter)に依存して算出される値である。VTMでは、λの値は、量子化パラメーターQPとビット深度bとを用いて、下の関係式によって求められる。
Figure 2023124387000002
ただし、この式において、aは、予測モードごとに決定される定数である。λの値が決まると、予測モードごとにDおよびRに基づいてコストJを計算し、Jが最小となる予測モードを採用して符号化を行う。
以上の符号化制御手法によって、目標ビットレートを超えないように効率的な符号化を行うことができる。
非特許文献1には、H.265/HEVCについて記載されている。
非特許文献2には、VVCについて記載されている。
大久保榮・監修,インプレス標準教科書シリーズ H.265/HEVC教科書」,初版,インプレスジャパン,2013年10月21日発行. Benjamin Bross 他,Overview of the Versatile Video Coding (VVC) Standard and Its Applications,IEEE Transactions on Circuits and Systems for Video Technology, VOL. 31, NO. 10, October 2021.
シングルレイヤー符号化では、目標ビットレートを決めれば上で述べた手法により効率的な符号化を行うことができる。一方で、空間スケーラブル符号化では目標ビットレートを各レイヤーに適切に割り当てる処理が必要となる。
ベースレイヤーとエンハンスメントレイヤーのそれぞれに割り当てるビットレート(RBL,REL)を適切に定めることができれば、シングルレイヤー符号化と同様の符号化制御を行うことが可能である。このとき、符号化する映像および割当てビットレートRBL,RELの値に応じて符号化品質が変動する。このため、限られた帯域で品質を最大化するようにRBL,RELを決める処理が必要となる。
しかしながら、解像度の異なるベースレイヤーとエンハンスメントレイヤーの品質をPSNR(peak signal-to-noise ratio,ピーク信号対雑音比)等の客観指標で評価することは困難である。一例としてベースレイヤーとエンハンスメントレイヤーとで合わせて20Mbps(メガビット毎秒)で符号化する際に、RBL=15Mbps,PSNRBL=42,REL=5Mbps,PSNREL=40の場合と、RBL=18Mbps,PSNRBL=45,REL=2Mbps,PSNREL=37の場合とで、どちらの品質が高いかを単純に求めることはできない。そこで、効率的な空間スケーラブル符号化を行うための各レイヤーのビットレート(RBL,REL)を決める方法の開発が求められる。
本発明は、上記の課題認識に基づいて行なわれたものであり、効率のよい空間スケーラブル符号化を行うためのビットレートを適切に決定することのできるビットレート決定装置、符号化装置、およびプログラムを提供しようとするものである。
[1]上記の課題を解決するため、本発明の一態様によるビットレート決定装置は、入力画像を基に、複数のレイヤーへの所定のビットレートでの空間スケーラブル符号化を行うとともに、空間スケーラブル符号化の結果の符号を復号し、復号した結果である符号化画像と、前記符号化画像に対応するビットレートと、の対を出力する先行空間スケーラブル符号化部と、前記入力画像の中で精細感に関与する領域を表す情報である精細感領域情報を、前記入力映像から求める精細感領域情報導出部と、前記先行空間スケーラブル符号化部から出力される前記符号化画像の、求められた前記精細感領域情報が示す領域における歪み度合いを算出する歪み算出部と、前記先行空間スケーラブル符号化部が出力する前記ビットレートと、対応する前記歪み度合いと、の対を基に定まるRD曲線における、所定の傾きを有する位置に対応するビットレートに基づいて定まる割り当てビットレートを求める割り当てビットレート算出部と、を備える。
この構成によると、ビットレート決定装置は、先行空間スケーラブル符号化部が実際の符号化に先行して行う符号化および復号の結果に基づいて、ビットレートと歪みとの関係を取得する。また、ビットレート決定装置は、この関係に基づいて、最適な(あるいはほぼ最適な)ビットレートを求める。
[2]また、本発明の一態様は、上記のビットレート決定装置において、前記割り当てビットレート算出部は、空間スケーラブル符号化における最下位のベースレイヤー以外の1つまたは複数のレイヤーのそれぞれのための前記割り当てビットレートを求める、というものである。
この構成によると、ビットレート決定装置は、最下位のベースレイヤー以外の1つまたは複数のレイヤー(実施形態で説明するエンハンスメントレイヤー)のビットレートを定めることができる。
[3]また、本発明の一態様は、上記のビットレート決定装置において、前記精細感領域情報導出部は、前記入力画像を縮小した後で拡大することによって得られる画像と、前記入力画像との差分画像を作成する差分画像作成部と、前記差分画像作成部が作成した前記差分画像に基づく各画素の画素値を所定の閾値に基づいて二値化した二値化画像を、前記精細感領域情報として生成する二値化部と、を備えるものである。
[4]また、本発明の一態様は、上記のビットレート決定装置において、前記精細感領域情報導出部は、前記差分画像におけるノイズを除去するノイズ除去部、をさらに備え、前記二値化部は、前記ノイズ除去部がノイズを除去した後の前記差分画像に基づいて、前記二値化画像を、前記精細感領域情報として生成する、というものである。
[5]また、本発明の一態様は、上記のビットレート決定装置において、前記精細感領域情報導出部は、前記入力画像に所定の帯域通過フィルター処理を行った画像を二値化して得られる二値化画像を、前記精細感領域情報として生成する、というものである。
[6]また、本発明の一態様は、上記のビットレート決定装置において、割り当てビットレート算出部は、前記RD曲線における前記所定の傾きの値を、空間スケーラブル符号化における最下位のベースレイヤーの量子化パラメーターの値に基づいて算出する、ものである。
[7]また、本発明の一態様は、上記のビットレート決定装置において、前記割り当てビットレート算出部が求めた前記割り当てビットレートを補正するビットレート補正部、をさらに備え、前記ビットレート補正部は、(1)前記最下位のベースレイヤーのためのビットレートとしての下限値が確保できるように、前記割り当てビットレートを補正し、あるいは、(2)前記最下位のベースレイヤー以外の1つまたは複数のレイヤーのための前記割り当てビットレートが上限値を超えないように、前記割り当てビットレートを補正する、というものである。
この構成によると、ビットレート決定装置は、割り当てビットレート算出部が求めた割り当てビットレートを、上記下限値あるいは上記上限値に基づいて補正できる。
[8]また、本発明の一態様による符号化装置は、上記[1]から[7]までのいずれか一項に記載のビットレート決定装置と、前記入力画像の空間スケーラブル符号化を行う空間スケーラブル符号化部と、を備える符号化装置であって、前記空間スケーラブル符号化部は、空間スケーラブル符号化における最下位のベースレイヤー以外の1つまたは複数のレイヤーについては、前記ビットレート決定装置が求めた前記割り当てビットレートを目標とする符号化を行う、ものである。
この構成によると、ビットレート決定装置が決定するビットレートを用いて、符号化装置は、空間スケーラブル符号化を行うことができる。
[9]また、本発明の一態様は、入力画像を基に、複数のレイヤーへの所定のビットレートでの空間スケーラブル符号化を行うとともに、空間スケーラブル符号化の結果の符号を復号し、復号した結果である符号化画像と、前記符号化画像に対応するビットレートと、の対を出力する先行空間スケーラブル符号化部と、前記入力画像の中で精細感に関与する領域を表す情報である精細感領域情報を、前記入力映像から求める精細感領域情報導出部と、前記先行空間スケーラブル符号化部から出力される前記符号化画像の、求められた前記精細感領域情報が示す領域における歪み度合いを算出する歪み算出部と、前記先行空間スケーラブル符号化部が出力する前記ビットレートと、対応する前記歪み度合いと、の対を基に定まるRD曲線における、所定の傾きを有する位置に対応するビットレートに基づいて定まる割り当てビットレートを求める割り当てビットレート算出部と、を備えるビットレート決定装置、としてコンピューターを機能させるためのプログラムである。
本発明によれば、先行空間スケーラブル符号化部が実際の符号化に先行して行う符号化および復号の結果に基づいて、ビットレートを決定することができる。
本発明の実施形態による符号化装置(ビットレート決定装置を内部に含む)の概略機能構成を示すブロック図である。 同実施形態による符号化装置内の精細感領域情報導出部の詳細な機能構成を示すブロック図である。 同実施形態における精細感領域情報導出部に入力されるフレーム画像(原画)の一例を示す概略図である。 同実施形態において、図3に示した画像を精細感領域情報導出部が処理した結果として出力される画像(精細感領域情報)の例を示す概略図である。 同実施形態による割り当てビットレート算出部の概略機能構成を示すブロック図である。 同実施形態においてビットレートを求めるための、精細感領域でのRD曲線を示すグラフの一例である。 同実施形態の第6変形例による符号化装置の概略機能構成を示すブロック図である。 同実施形態(変形例を含む)による符号化装置の内部構成の例を示すブロック図である。
次に、本発明の一実施形態について、図面を参照しながら説明する。本実施形態のビットレート決定装置は、空間スケーラブル符号化を効率的に行うために各レイヤーに割り当てるビットレートを決定する。また、符号化装置は、決定されたビットレートにより空間スケーラブル符号化を行う装置である。
本実施形態では、まずエンハンスメントレイヤーのビットレートRELを適切に決定し、その後にベースレイヤーのビットレートRBLを決定する。この手順により、効率的な符号化を実現できる。その理由は、次の通りである。
放送信号だけを用いて空間スケーラブル符号化した映像を伝送する場合を想定すると、全体のビットレートを固定とすることができる。即ち、(RBL+REL)が一定であるとすることができる。このとき、RELが大きいほど、エンハンスメントレイヤーの品質が向上し高解像度の映像を高品質に符号化できるが、ベースレイヤーの品質は低下する。逆にRELとして最低限必要なビットレートを決定することができれば、残りのビットレートをすべてRBLとすることができる。これにより、無駄に多くのビットレートをRELに割いてベースレイヤーの品質が劣化することを防ぎ、限られた帯域を効率的に使用することができる。
通信を用いて伝送する映像を伝送する場合を想定すると、全体のビットレートは可変であり得る(可変ビットレート)。4K映像あるいは8K映像のような高解像度映像の場合や、動きが多く符号化の難しい映像の場合には、画質にほとんど差がないにも関わらず膨大なデータ量が発生して帯域が無駄になったり、データ量が膨大になってネットワークが不安定化する原因となったりすることも起こり得る。このとき、エンハンスメントレイヤーの品質を十分改善できるビットレートとしてRELを決めることができれば、無駄に多くのデータの伝送を発生させず、帯域を効率的に利用し、安定して映像サービスを行うことが可能となる。
上記の通り、RELを適切に決定することができれば、全体の伝送レートが固定ビットレートか可変ビットレートかに依らず、効率的な符号化を実現することができる。以下では、ビットレートを適切に決定するための装置の機能構成を説明する。
空間スケーラブル符号化において、ベースレイヤーの映像は高周波数成分を失っている。このため、どれほどRBLを高くしても本来エンハンスメントレイヤーが保持していた高周波数成分(精細感)を再現することはできない。本実施形態では、ベースレイヤーで再現できないエンハンスメントレイヤーの信号を基に、エンハンスメントレイヤーに必要なビットレートRELを導出する。そして、導出結果であるその値を基に、ベースレイヤーに割り当てるビットレートRBL、およびエンハンスメントレイヤーに割り当てるビットレートRELを決定する。
本実施形態の構成における重要なポイントは、画像の中から精細感を再現する信号を取り出すことと、その信号の歪みを用いて作成したRD曲線(レート対歪み曲線,rate distortion curve)を基にして適正なビットレートを算出すること、の2つである。本実施形態においては、画像の中から精細感を再現する信号を取り出すことは、精細感領域情報導出部21が導出する精細感領域情報(画素ごとの精細感の有無の度合いを表す情報)に基づいて行える。信号の歪みを用いてRD曲線を作成することは、傾き算出部231が行う。RD曲線を基に適正なビットレートを算出することは、ビットレート算出部232が行う。なお、変形例として後で説明するように、ビットレート補正部24がそのビットレートを補正してもよい。
横軸をビットレート、縦軸を歪み度合い(例えば歪みの量のMSE値)としたときに、ここでのRD曲線の特徴は、次の通りである。即ち、第1の特徴は、ビットレートの増加に対して歪み度合いが単調に減少する単調減少曲線である(着目するビットレート領域の全体にわたって、1次微分係数が負である)こと、である。また、第2の特徴は、下に凸な曲線である(着目するビットレート領域の全体にわたって、2次微分係数が非負である)こと、である。このようなRD曲線において最適なビットレートを求める方法の一つは、所定の傾きを有する直線がRD曲線に接するときに、その接点を求めることであり、その接点に対応するビットレートが、最適な(あるいはほぼ最適な)ビットレートである。
言い換えれば、上記のようなRD曲線において、上記所定の傾きを有する位置に対応するビットレートが、最適な(あるいはほぼ最適な)ビットレートである。なお、歪みの量のMSE値以外の画質指標を用いた場合には、ビットレートの増加に対して歪み度合いを表す値のRD曲線が単調減少曲線とはならない場合もある。例えば、PSNR等を画質指標(歪み度合い)として用いた場合には、単調増加曲線(着目するビットレート領域の全体にわたって、1次微分係数が正である)となる。また、用いる画質指標によっては、RD曲線は必ずしも下に凸な曲線とはならない場合もある。これらの場合においても、RD曲線の傾きに応じて最適なビットレートを求めることができる。また、RD曲線と直線との接点に基づいて、ビットレートを決定できる場合がある。
図1は、本実施形態による符号化装置の概略機能構成を示すブロック図である。図示するように、符号化装置1は、符号化部11と、復号部12と、精細感領域情報導出部21と、歪み算出部22と、割り当てビットレート算出部23と、空間スケーラブル符号化部31と、を含むように構成される。これらの機能部の少なくとも一部は、例えば、コンピューターと、プログラムとで実現することが可能である。また、各機能部は、必要に応じて、記憶手段を有する。記憶手段は、例えば、プログラム上の変数や、プログラムの実行によりアロケーションされるメモリーである。また、必要に応じて、磁気ハードディスク装置やソリッドステートドライブ(SSD)といった不揮発性の記憶手段を用いるようにしてもよい。また、各機能部の少なくとも一部の機能を、プログラムではなく専用の電子回路として実現してもよい。
符号化装置1は、適切なビットレートによるスケーラブル空間符号化を行うものである。この符号化装置1に入力される映像は、符号化対象の映像であり、高解像度映像である。映像は、時系列に並ぶフレーム画像のシリーズである。つまり、本実施形態において映像を符号化することは、映像を構成するフレーム画像を符号化する処理に還元される。
符号化装置1の構成のうち、符号化部11と、復号部12と、精細感領域情報導出部21と、歪み算出部22と、割り当てビットレート算出部23とを含む部分の構成を、ビットレート決定装置2と捉えることができる。つまり、ビットレート決定装置2は、入力される映像に基づいて、適切なビットレートを決定する。
ビットレート決定装置2は、ビットレートを決定するための処理の一部として、入力される映像の符号化および復号を先行して行う。つまり、符号化装置1の構成のうち、符号化部11と、復号部12とを含む部分の構成を、先行空間スケーラブル符号化部3と呼んでもよい。
符号化部11は、入力される映像の空間スケーラブル符号化を行う。符号化部11は、既存技術による空間スケーラブル符号化を行える。
復号部12は、符号化部11によって符号化された映像を復号する。復号部12による復号も、既存技術によって行える。
先行空間スケーラブル符号化部3は、符号化結果の情報として、ビットレートと符号化映像(復号部12によって復号された映像)との対を出力する(歪み算出部22に渡す)。
精細感領域情報導出部21は、入力映像(高解像度映像)の中の、精細感領域の情報を導出する。ここで精細感領域とは、映像の中の精細感を有する領域であり、ベースレイヤーでは再現できないエンハンスメントレイヤーの情報を有する領域である。
つまり、精細感領域情報導出部21は、入力画像の中で精細感に関与する領域を表す情報である精細感領域情報を、入力映像を基に求める。
言い換えれば、精細感領域情報導出部21は、ベースレイヤーの符号だけでは再現できないエンハンスメントレイヤーの情報が存在する領域についての情報(精細感領域情報)を導出する。
歪み算出部22は、入力画像(入力映像)における精細感領域の歪みを計算する。具体的には、歪み算出部22は、先行空間スケーラブル符号化部3から出力される符号化画像の、精細感領域情報導出部21によって求められた精細感領域情報が示す領域における歪み度合いを算出する。
具体的には、歪み算出部22は、次のような処理を行う。歪み算出部22は、エンハンスメントレイヤーのビットレートRELを変えて、複数のRELのそれぞれについて符号化画像を作成する。このとき、ベースレイヤーのビットレートRBLは任意である。次に、歪み算出部22は、それぞれのRELに対応する符号化画像に対して、精細感領域における歪みを算出する。具体的には、歪み算出部22は、歪みの平均二乗誤差(MSE,mean squared error)やPSNR(ピーク信号対雑音比)などの指標を算出する。なお、歪み算出部22は、このとき、精細感領域情報導出部21が出力する精細感領域情報の画像を参照することによって、画像内の精細感領域を把握する。歪み算出部22は、エンハンスメントレイヤーのビットレートRELと算出された歪みの数値との対の集合を、割り当てビットレート算出部23に渡す。
割り当てビットレート算出部23は、符号化映像と精細感領域情報とを基にして、レートと歪みの関係を解析し、その解析結果から割り当てビットレートを算出する。なお、割り当てビットレート算出部23は、空間スケーラブル符号化における最下位のベースレイヤー以外の1つまたは複数のレイヤー(即ち、1つまたは複数のエンハンスメントレイヤー)のそれぞれのための前記割り当てビットレートを求めるものであってよい。
より具体的には、割り当てビットレート算出部23は、先行空間スケーラブル符号化部3が出力するビットレートと、そのビットレートに対応する歪み度合いと、の対を基に、RD曲線を定める。そして、割り当てビットレート算出部23は、所定の傾き(λdif)を有する位置に対応するビットレート(r)に基づいて定まる割り当てビットレートを求める。割り当てビットレート算出部23は、上記の方法でエンハンスメントレイヤーのビットレートRELを決定する。割り当てビットレート算出部23は、ベースレイヤーのビットレートRBLを任意に決定してよい。ただし、割り当てビットレート算出部23は、例えば、伝送路全体のビットレートが固定レートである場合などには、決定されたRELに基づいてRBLを決定してもよい。
割り当てビットレート算出部23のさらに詳細な機能構成については、後で図5を参照しながら説明する。
空間スケーラブル符号化部31は、割り当てビットレート算出部23によって決定されたビットレートで、入力画像の空間スケーラブル符号化を行う。空間スケーラブル符号化部31は、特に、空間スケーラブル符号化における最下位のベースレイヤー以外の1つまたは複数のレイヤー(即ちエンハンスメントレイヤー)については、割り当てビットレート算出部23が求めた割り当てビットレートを目標とする符号化を行う。
ただし、後述する第6変形例の場合には、割り当てビットレート算出部23によって決定されたビットレートは、ビットレート補正部24によって補正される。
符号化装置1内において、前述のビットレート決定装置2は、入力される映像(画像)に基づいてビットレートを決定する。
また、符号化装置1内において、前述の先行空間スケーラブル符号化部3は、入力画像を基に、複数のレイヤーへの所定のビットレートでの空間スケーラブル符号化を行うとともに、空間スケーラブル符号化の結果の符号を復号し、復号した結果である符号化画像と、その符号化画像に対応するビットレートと、の対を出力する。
図2は、本実施形態による精細感領域情報導出部21の概略機能構成を示すブロック図である。図示するように、精細感領域情報導出部21は、縮小処理部211と、拡大処理部212と、差分画像作成部213と、ノイズ除去部214と、二値化部215と、を含んで構成される。精細感領域情報導出部21には、前述の入力映像(高解像度映像)が入力される。
縮小処理部211は、入力映像の各フレーム画像(原画)を、縮小する。つまり、縮小処理部211は、入力される高解像映像を、相対的に低解像の映像に変換する。具体的には、縮小処理部211は、高解像映像を、ベースレイヤーの画素数の映像に変換する。縮小処理部211は、縮小後の映像を拡大処理部212に渡す。
拡大処理部212は、縮小処理部211から渡される映像を拡大する。具体的には、拡大処理部212は、渡される映像の画素の補間を行うことにより、縮小前の解像度(入力映像の解像度)に変換する。拡大処理部212は、拡大後の映像を差分画像作成部213に渡す。
縮小処理部211および拡大処理部212がそれぞれ縮小処理および拡大処理に用いるフィルターは、既存技術によるものでよく、任意に選択可能である。例えば、Bi-Cubicフィルター(バイキュービックフィルター)やLanczosフィルター(ランチョスフィルター)などを用いることができる。縮小処理部211および拡大処理部212が映像を縮小してから拡大する処理を行うことによって、入力映像が持っていた精細感は失われる。
差分画像作成部213は、入力映像(原画)と、拡大処理部212から渡される映像(縮小後に拡大した映像)との差分を計算して、差分画像を作成する。言い換えれば、差分画像作成部213は、入力画像を縮小した後で拡大することによって得られる画像(拡大処理部212からの出力)と、入力画像(原画)との差分画像を作成する。具体的には、差分画像作成部213は、両映像で対応する画素間での画素値の差分を算出する。差分画像は、精細感の度合いを各画素の画素値として表す画像であると考えてよい。差分画像作成部213は、生成した差分画像を、ノイズ除去部214に渡す。
ノイズ除去部214は、差分画像作成部213から渡される差分画像に含まれるノイズを除去する処理を行う。差分画像作成部213から渡される差分画像には、カメラノイズなど高周波成分のノイズが含まれると考えられるため、このノイズ除去部214によるノイズ除去を行う。ノイズ除去部214は、ノイズ除去の処理のためにノイズ除去用の任意のフィルターを用いてよい。ノイズ除去用のフィルターとしては、既存技術によるものを用いることができる。ノイズ除去部214は、例えば、中央値フィルターや低域通過フィルターなどを用いてノイズ除去の処理を行うことができる。また、ノイズ除去部214は、低域通過フィルター後に中央値フィルターをかけるなど、複数のフィルターを組み合わせてノイズ除去を行ってもよい。また、ノイズ除去部214は、ノイズ除去処理の過程で併せてその他の画像処理を行ってもよい。ノイズ除去部214は、処理後の映像を、二値化部215に渡す。
なお、ノイズ除去が不要な場合には、ノイズ除去部214によるノイズ除去処理を省略するようにしてもよい。
二値化部215は、差分画像作成部213が作成した差分画像に基づく各画素の画素値を所定の閾値に基づいて二値化した二値化画像を生成する。この二値化画像が、精細感領域情報である。つまり、二値化画像は、精細感に関する領域の情報を表す。ノイズ除去部214がノイズ除去の処理を行う場合には、二値化部215は、ノイズ除去部214がノイズを除去した後の差分画像に基づいて、上記の二値化画像を生成する。
つまり、二値化部215は、ノイズ除去部214から渡される映像(あるいは、ノイズ除去部214による処理を省略する場合には、差分画像作成部213から直接渡される映像であってもよい)を二値化する処理を行う。二値化部215は、例えば、10ビットの映像の輝度信号を、画素ごとに任意に定められる閾値に基づき、0と1023に二値化してよい。また、二値化部215は、ノイズ除去部214から渡される差分画像に所定のフィルターをかける処理を行ったうえで所定の閾値に基づく二値化画像を生成してもよい。二値化部215が出力する画像は、原画の中の、空間スケーラブル符号化においてベースレイヤーでは再現できない精細感を持つ領域を表す情報である。
つまり、二値化部215が生成する画像は、精細感領域情報導出部21(図1)が出力する画像である。精細感領域情報については、次の図3および図4を参照しながら説明する。
図3は、精細感領域情報導出部21に入力されるフレーム画像(原画)の一例を示す概略図である。ここでの原画は、マラソン大会のスタート地点を撮影した画像であり、元はカラー画像である。
図4は、図3に示した画像を精細感領域情報導出部21が処理した結果として出力される画像を示す概略図である。ここでは、精細感領域情報導出部21内の二値化部215は、ノイズ除去部214から渡される差分画像の輝度信号(画素値は0以上且つ1023以下の範囲)を閾値20で二値化し、3×3の中央値フィルターの処理を3回行い、閾値700で二値化した。図4の二値化画像は、画素ごとに白と黒との2値で表わされている。両図を見てわかるように、精細感領域情報導出部21は、原画の中の精細感の高い領域を良好に抽出している。
次に、導出された精細感領域情報に基づいて各レイヤーに割り当てるビットレートを決定する割り当てビットレート算出部23の処理の詳細について説明する。
図5は、本実施形態による割り当てビットレート算出部の概略機能構成を示すブロック図である。図示するように、割り当てビットレート算出部23は、傾き算出部231と、ビットレート算出部232と、を含んで構成される。
傾き算出部231は、エンハンスメントレイヤーのビットレートRELとそのビットレートに対応する精細感領域における歪みに基づいて、所定のビットレートRELの位置における曲線の傾きを求める。具体的には、傾き算出部231は、前述の歪み算出部22から、ビットレートRELとそれに対応する歪みの平均二乗誤差の値との対の集合を受け取る。そして、傾き算出部231は、それらの値の対の集合に基づき、該当する点をプロットすることによって特定の曲線を求める。この曲線は、求められている精細感領域におけるRD曲線である。なお、回帰の手法を用いてRD曲線を求めるようにしてもよい。この曲線の例については、後で図6を参照しながら説明する。
ベースレイヤーの符号化結果を用いて傾きを算出する例は、次の通りである。複数の符号化画像を作成する際のベースレイヤー符号化結果より、ベースレイヤーでの量子化パラメーター(QPBL)がわかっている。RD最適化に関する先行研究より、効率的な符号化を行うためのベースレイヤーのラグランジュ乗数λBLは、QPBLを用いて下の式で求められることが知られている。なお、aおよびbについては、上で説明した通りである。
Figure 2023124387000003
求める傾きλdifを、下の式の通りとする。
Figure 2023124387000004
なお、wは、重みを表す係数である。wの値を事前に決めておいてもよいし、映像ごとに適応的にwの値を決定してもよい。一般的にベースレイヤーとエンハンスメントレイヤーとの間でRD曲線の関数は異なるため、重み係数wを掛けてλdifを求めることには妥当性がある。なお、例えば、0.80≦w≦1.20の範囲内のwを用いてよい。また、一例として、w=1.00としてよい。
上記の通り、割り当てビットレート算出部23の傾き算出部231は、前記RD曲線における所定の傾きの値(λdif)を、空間スケーラブル符号化における最下位のベースレイヤーの量子化パラメーターの値(QPBL)に基づいて算出するようにしてよい。
ビットレート算出部232は、上で求めた精細感領域のRD曲線上で、接線の傾きがλdifとなる点のビットレートrを算出する。ビットレート算出部232が求めるビットレートrについては、次に図6を参照しながら説明する。
図6は、精細感領域でのRD曲線を示すグラフの一例である。前述の通り、本実施形態の傾き算出部231が、複数のビットレートRELで算出された歪みに基づいてRD曲線を求める。同図において、横軸はエンハンスメントレイヤーのビットレートREL(単位は、Mbps(メガビット毎秒))であり、縦軸は精細感領域での歪みに相当する平均二乗誤差(MSE)である。同図に示すRD曲線301は、ビットレートRELと平均二乗誤差との対の集合に基づいて定まるものである。接線302は、上の説明の通り求められるλdifの傾きを持ち、RD曲線301に接する直線である。RD曲線301と接線302との接点Pの横軸方向の値が、ビットレート算出部232が求めるべきビットレートrである。このビットレートrは、RD曲線301が表す条件下における最適値として求められるビットレートである。
以上、実施形態を説明したが、本発明はさらに次のような変形例でも実施することが可能である。ここでは複数の変形例を説明する。なお、2個以上の変形例を組み合わせて実施してもよい。なお、以下では、各変形例における特徴的な構成や機能のみについて説明する。
[第1変形例]
上で説明した構成では、符号化装置1に入力される映像が高解像度映像であることを前提としていた。入力映像が低解像度映像である場合には、第1変形例として、符号化装置1への入力の前にアップコンバーターの処理を行い、入力映像の画素数を増加させる。アップコンバーターの処理としては、任意の既存技術を用いることができる。
[第2変形例]
上記の実施形態では、精細感領域情報導出部21は、画像間の差分を取る(差分画像作成部213の処理)ことによって、精細感領域情報を導出した。第2変形例においては、精細感領域情報導出部21は、代わりに、帯域通過フィルターを用いて精細感領域に関する情報を導出する。一般的に、精細感に関与する情報は原画の高周波数成分である。したがって、本変形例では、精細感領域情報導出部21は、原画の縮小処理および拡大処理を行って原画との差分画像を生成する代わりに、原画に対して帯域通過フィルターの処理を行うことによって、フィルター画像を作成する。帯域通過フィルターは、所定の閾値の周波数よりも高い周波数の成分を通過させるハイパスフィルターであってもよい。本変形例による精細感領域情報導出部21がフィルター画像を出力した後は、既に説明した方法と同様に、ノイズ除去処理(ノイズ除去部214)および二値化処理(二値化部215)を行うことによって、精細感領域情報を作成することができる。
つまり、第2変形例においては、精細感領域情報導出部21は、入力画像に所定の帯域通過フィルター処理を行った画像を二値化して得られる二値化画像を、精細感領域情報として生成する。
[第3変形例]
上記実施形態において、エンハンスメントレイヤーのビットレートRELの決定方法を示すとともに、ベースレイヤーのビットレートRBLを任意に決定してよい場合を説明した。一方、この第3変形例においては、ビットレートRBLの決定方法を次の通りとする。例えば、ベースレイヤーのビットレートの目標値が予め決まっている場合には、そのビットレートをRBLとして決定する。これにより、より効果的なエンハンスメントレイヤーのビットレートの割り当てを期待できる。あるいは、ベースレイヤーのビットレートを十分に高くする。つまり、ベースレイヤーのビットレートを、所定の下限値以上とする。これにより、ベースレイヤーの符号化劣化の影響を無視する程度に抑えることができる。例えば、2K映像に関して、ベースレイヤーのビットレートRBLを20Mbps以上となるようにする。あるいは、4K映像に関して、ベースレイヤーのビットレートRBLを50Mbps以上となるようにする。
[第4変形例]
上記の実施形態においては、傾き算出部231は、傾きλdifを求めるために、ベースレイヤーでの量子化パラメーターQPBLに基づく計算を行った。また、λBLに所定の重み係数wを乗じることによって、傾きλdifを求めた。一方で、第4変形例においては、傾きλdifの値を、予め定めておいた定数とする。この方法でも、良好なビットレートrを求められる場合がある。
[第5変形例]
上記の実施形態においては、ビットレート算出部232は、精細感領域のRD曲線と傾きλdifの直線との接点を求めることによってそのビットレートrを求めた。ただし、精細感領域のRD曲線上で接線の傾きがλdifとなる点が存在しない場合もあり得る。そこで、第5変形例においては、ビットレート算出部232は、rのデフォールト値(初期値と呼んでもよい)を予め定めておく。ビットレート算出部232は、RD曲線上で接線の傾きがλdifとなる点が存在しない場合には、そのデフォールト値を、ビットレートrの値として決定する。また、ビットレート算出部232は、RD曲線上で接線の傾きがλdifとなる点が存在する場合には、上で説明した通り、傾きがλdifとなる接点に基づいてその接点に対応するビットレートrを決定する。
[第6変形例]
第6変形例においては、符号化装置がビットレート補正部24を備える。ビットレート補正部24は、割り当てビットレート算出部23が算出したビットレートを補正する処理を行う。
図7は、本変形例による符号化装置4の概略機能構成を示すブロック図である。図示するように、本変形例による符号化装置4は、符号化部11と、復号部12と、精細感領域情報導出部21と、歪み算出部22と、割り当てビットレート算出部23と、ビットレート補正部24と、空間スケーラブル符号化部31と、を含むように構成される。即ち、符号化装置4は、図1を参照しながら説明した符号化装置1が持つ機能に加えて、さらに、ビットレート補正部24の機能を持つ。本変形例において、空間スケーラブル符号化部31は、割り当てビットレート算出部23が算出したビットレートについて、ビットレート補正部24による補正を行った後のビットレートを使用しながら、空間スケーラブル符号化の処理を行う。その他の機能については、符号化装置4は、前述の符号化装置1と同様に機能する。
本変形例に特有の機能を持つビットレート補正部24は、利用可能帯域に応じて、ビットレートを補正する処理を行う。つまり、割り当てビットレート算出部23によって算出されたビットレートは、ビットレート補正部24によって補正される。空間スケーラブル符号化部31は、補正後のビットレートを用いて、空間スケーラブル符号化を行う。具体的な補正処理は、次に説明する通りである。
ビットレート補正部24による補正処理は、次の通りである。
伝送に用いる全体的なビットレートが固定ビットレートRであるとき、決定されるエンハンスメントレイヤーのビットレートRELが大きすぎると、ベースレイヤーのビットレートRBLが小さくなる。つまり、ベースレイヤーの品質が劣化する場合があり得る。こういったベースレイヤーの品質劣化を防ぐために、RBLの下限としてRBL minを決定しておき、あるいはRELの上限としてREL maxを決定しておく。割り当てビットレート算出部23がRELの値としてrを決定したときに、RELの値が上記の上限値REL maxを超えないように、ビットレート補正部24は補正処理を行う。ビットレート補正部24による補正後のRELは、下の数式(1)により決定される。
Figure 2023124387000005
これにより、RBL minあるいはREL maxに基づいてRELを決定することができ、その結果、RBLの十分な値を確保することができる。
伝送に用いる全体的なビットレートが可変ビットレートであるとき、エンハンスメントレイヤーのビットレートRELが大きすぎると、伝送路(通信ネットワーク)の不安定化の原因にもなり得る。また可変ビットレートであっても利用可能な帯域の上限が存在する場合もある。そこで、RELの上限としてREL maxを決定しておく。割り当てビットレート算出部23がRELの値としてrを決定したときに、RELの値が上記の上限値REL maxを超えないように、ビットレート補正部24は補正処理を行う。ビットレート補正部24による補正後のRELは、下の数式(2)により決定される。
Figure 2023124387000006
つまり、第6変形例とする場合には、ビットレート補正部24は、割り当てビットレート算出部23が求めた前記割り当てビットレートを補正する。その補正のしかたは、次の通りである。即ち、ビットレート補正部24は、前記最下位のベースレイヤー(BL)のためのビットレートとしての下限値RBL minが確保できるように、エンハンスメントレイヤーへの割り当てビットレートRELを補正する。あるいは、ビットレート補正部24は、前記最下位のベースレイヤー以外の1つまたは複数のレイヤー(EL)のための割り当てビットレートが上限値REL maxを超えないように、割り当てビットレートを補正する。
[第7変形例]
上で説明した実施形態については、ビットレート算出および決定の頻度について特に定めていなかった。第7変形例としては、割り当てビットレート算出部23がビットレートを算出する頻度(第6変形例とする場合には、ビットレート補正部24がビットレートを補正する頻度も同様)について、適切に定めるようにする。例えば、ビットレートを算出する頻度(補正する頻度も同様。以下においても同様。)を、入力される映像の1フレーム毎としてもよい。あるいは、ビットレートを算出する頻度を、入力される映像の所定数の複数フレーム毎としてもよい(一例として、30フレーム毎)。
また、符号化装置1が入力映像のシーンチェンジの箇所を検出して、シーンチェンジが検出された際に新たなシーンに属するフレームを基に、ビットレートを算出するようにしてもよい。シーンチェンジの検出自体は、既存技術を用いて行うことが可能である。シーンチェンジのタイミングの一例は、スタジオ収録の番組において、スタジオでの映像から、中継先の映像に切り替わるタイミングである。
上記のシーンチェンジは、連続するフレーム画像が持つ所定の特徴量に基づいて検出されるものである。これを一般化して、シーンチェンジに限らず、入力映像におけるフレーム画像ごとの特徴量(時間に依存する特徴量)あるいは画像内の領域(空間)ごとの特徴量(画像内の領域に依存する特徴量)に基づいて、ビットレートを算出しなおすタイミングを定めてもよい。この場合には、シーンチェンジに限らず、映像の特徴に基づいて、適切なタイミングでビットレートを再算出することができる。
また、第7変形例のさらなる変形例として、次のようにしてもよい。即ち、割り当てビットレート算出部23(および、ビットレートを補正する場合にはビットレート補正部24)は、1枚のフレーム画像に基づいてビットレートを決定するのではなく、複数のフレーム画像に基づいてそれぞれ決定したビットレートに基づくビットレート(例えば、それらのビットレートの平均値)を決定するようにしてもよい。
[第8変形例]
上で説明した実施形態では、ベースレイヤーと、1個のエンハンスメントレイヤーとの、2レイヤーの情報の符号化を行っていた。そのために、RBLとRELという2種類のビットレートを決定していた。第8変形例においては、符号化装置1は、3レイヤー以上の符号化において同様の処理を行い、各レイヤーのビットレートを決定する。レイヤー数が増える場合には、さらなる上位のレイヤーごとに同様の処理を行うことによって、各レイヤーのビットレートの割り当てを行うようにする。
つまり、第8変形例においては、複数のエンハンスメントレイヤーのそれぞれについて、精細感領域情報を導出してRD曲線を求める。そして、各レイヤーについて、RD曲線に対して所定の傾きで接する接線を求め、その接点におけるビットレートに基づいて、そのレイヤーの符号化ビットレートを決定するようにする。
第8変形例を用いることにより、任意の(2以上の)レイヤー数での空間スケーラブル符号化において、適切なビットレートを決定することができるようになる。
[第9変形例]
上で説明した実施形態では、符号化した情報を伝送する場合を説明した。符号化した映像を伝送する場合に限らず、空間スケーラブル符号化の手法で符号化した映像を記録媒体(例えば、ブルーレイディスク、半導体メモリー、磁気ハードディスク等)に記録する場合にも、同様に、上で説明したビットレート決定手法を適用することができる。
[第10変形例]
第10変形例として、符号化装置1の内部のビットレート決定装置2の機能のみを独立した装置として実現してもよい。この場合には、ビットレート決定装置2は、ビットレートを決定し、決定したビットレートの情報を外部に出力することができる。空間スケーラブル符号化を行う機能は、ビットレート決定装置2が決定したビットレートの情報を参照し、そのビットレートを目標レートとして、対応するレイヤーの符号化を行うことができる。
図8は、上記実施形態(変形例を含む)の符号化装置1あるいは符号化装置4の内部構成の例を示すブロック図である。符号化装置1や符号化装置4は、コンピューターを用いて実現され得る。図示するように、そのコンピューターは、中央処理装置901と、RAM902と、入出力ポート903と、入出力デバイス904や905等と、バス906と、を含んで構成される。コンピューター自体は、既存技術を用いて実現可能である。中央処理装置901は、RAM902等から読み込んだプログラムに含まれる命令を実行する。中央処理装置901は、各命令にしたがって、RAM902にデータを書き込んだり、RAM902からデータを読み出したり、算術演算や論理演算を行ったりする。RAM902は、データやプログラムを記憶する。RAM902に含まれる各要素は、アドレスを持ち、アドレスを用いてアクセスされ得るものである。なお、RAMは、「ランダムアクセスメモリー」の略である。入出力ポート903は、中央処理装置901が外部の入出力デバイス等とデータのやり取りを行うためのポートである。入出力デバイス904や905は、入出力デバイスである。入出力デバイス904や905は、入出力ポート903を介して中央処理装置901との間でデータをやりとりする。バス906は、コンピューター内部で使用される共通の通信路である。例えば、中央処理装置901は、バス906を介してRAM902のデータを読んだり書いたりする。また、例えば、中央処理装置901は、バス906を介して入出力ポートにアクセスする。
上述した実施形態(変形例を含む)における符号化装置1や符号化装置4の少なくとも一部の機能をコンピューターで実現することができる。その場合、この機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM、DVD-ROM、USBメモリー等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。つまり、「コンピューター読み取り可能な記録媒体」とは、非一過性の(non-transitory)コンピューター読み取り可能な記録媒体であってよい。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、一時的に、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリーのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
以上説明したように、上記の実施形態(変形例を含む)によると、先行空間スケーラブル符号化部が先行して符号化を行い、その際のビットレートと符号化画像との歪みとの関係を得ることができる。そして、そのビットレートと符号化画像との歪みとの関係に基づいて、割り当てるビットレートを最適化することができる。つまり、先行空間スケーラブル符号化において、効率のよい符号を生成することができるようになる。
以上、この発明の実施形態(変形例を含む)について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
本発明は、例えば、映像を符号化して伝送あるいは記録する作業において利用することができる。但し、本発明の利用範囲はここに例示したものには限られない。
1 符号化装置
2 ビットレート決定装置
3 先行空間スケーラブル符号化部
4 符号化装置
5 ビットレート決定装置
11 符号化部
12 復号部
21 精細感領域情報導出部
22 歪み算出部
23 割り当てビットレート算出部
24 ビットレート補正部
31 空間スケーラブル符号化部
211 縮小処理部
212 拡大処理部
213 差分画像作成部
214 ノイズ除去部
215 二値化部
231 傾き算出部
232 ビットレート算出部
301 RD曲線
302 接線(傾きλdif
901 中央処理装置
902 RAM
903 入出力ポート
904,905 入出力デバイス
906 バス

Claims (9)

  1. 入力画像を基に、複数のレイヤーへの所定のビットレートでの空間スケーラブル符号化を行うとともに、空間スケーラブル符号化の結果の符号を復号し、復号した結果である符号化画像と、前記符号化画像に対応するビットレートと、の対を出力する先行空間スケーラブル符号化部と、
    前記入力画像の中で精細感に関与する領域を表す情報である精細感領域情報を、前記入力画像から求める精細感領域情報導出部と、
    前記先行空間スケーラブル符号化部から出力される前記符号化画像の、求められた前記精細感領域情報が示す領域における歪み度合いを算出する歪み算出部と、
    前記先行空間スケーラブル符号化部が出力する前記ビットレートと、対応する前記歪み度合いと、の対を基に定まるRD曲線における、所定の傾きを有する位置に対応するビットレートに基づいて定まる割り当てビットレートを求める割り当てビットレート算出部と、
    を備えるビットレート決定装置。
  2. 前記割り当てビットレート算出部は、空間スケーラブル符号化における最下位のベースレイヤー以外の1つまたは複数のレイヤーのそれぞれのための前記割り当てビットレートを求める、
    請求項1に記載のビットレート決定装置。
  3. 前記精細感領域情報導出部は、
    前記入力画像を縮小した後で拡大することによって得られる画像と、前記入力画像との差分画像を作成する差分画像作成部と、
    前記差分画像作成部が作成した前記差分画像に基づく各画素の画素値を所定の閾値に基づいて二値化した二値化画像を、前記精細感領域情報として生成する二値化部と、
    を備える、
    請求項1または2に記載のビットレート決定装置。
  4. 前記精細感領域情報導出部は、
    前記差分画像におけるノイズを除去するノイズ除去部、
    をさらに備え、
    前記二値化部は、前記ノイズ除去部がノイズを除去した後の前記差分画像に基づいて、前記二値化画像を、前記精細感領域情報として生成する、
    請求項3に記載のビットレート決定装置。
  5. 前記精細感領域情報導出部は、前記入力画像に所定の帯域通過フィルター処理を行った画像を二値化して得られる二値化画像を、前記精細感領域情報として生成する、
    請求項1または2に記載のビットレート決定装置。
  6. 割り当てビットレート算出部は、前記RD曲線における前記所定の傾きの値を、空間スケーラブル符号化における最下位のベースレイヤーの量子化パラメーターの値に基づいて算出する、
    請求項1から5までのいずれか一項に記載のビットレート決定装置。
  7. 前記割り当てビットレート算出部が求めた前記割り当てビットレートを補正するビットレート補正部、
    をさらに備え、
    前記ビットレート補正部は、
    (1)前記最下位のベースレイヤーのためのビットレートとしての下限値が確保できるように、前記割り当てビットレートを補正し、
    あるいは、
    (2)前記最下位のベースレイヤー以外の1つまたは複数のレイヤーのための前記割り当てビットレートが上限値を超えないように、前記割り当てビットレートを補正する、
    請求項2に記載のビットレート決定装置。
  8. 請求項1から7までのいずれか一項に記載のビットレート決定装置と、
    前記入力画像の空間スケーラブル符号化を行う空間スケーラブル符号化部と、
    を備える符号化装置であって、
    前記空間スケーラブル符号化部は、空間スケーラブル符号化における最下位のベースレイヤー以外の1つまたは複数のレイヤーについては、前記ビットレート決定装置が求めた前記割り当てビットレートを目標とする符号化を行う、
    符号化装置。
  9. 入力画像を基に、複数のレイヤーへの所定のビットレートでの空間スケーラブル符号化を行うとともに、空間スケーラブル符号化の結果の符号を復号し、復号した結果である符号化画像と、前記符号化画像に対応するビットレートと、の対を出力する先行空間スケーラブル符号化部と、
    前記入力画像の中で精細感に関与する領域を表す情報である精細感領域情報を、前記入力画像から求める精細感領域情報導出部と、
    前記先行空間スケーラブル符号化部から出力される前記符号化画像の、求められた前記精細感領域情報が示す領域における歪み度合いを算出する歪み算出部と、
    前記先行空間スケーラブル符号化部が出力する前記ビットレートと、対応する前記歪み度合いと、の対を基に定まるRD曲線における、所定の傾きを有する位置に対応するビットレートに基づいて定まる割り当てビットレートを求める割り当てビットレート算出部と、
    を備えるビットレート決定装置、としてコンピューターを機能させるためのプログラム。
JP2022028123A 2022-02-25 2022-02-25 ビットレート決定装置、符号化装置、およびプログラム Pending JP2023124387A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022028123A JP2023124387A (ja) 2022-02-25 2022-02-25 ビットレート決定装置、符号化装置、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022028123A JP2023124387A (ja) 2022-02-25 2022-02-25 ビットレート決定装置、符号化装置、およびプログラム

Publications (1)

Publication Number Publication Date
JP2023124387A true JP2023124387A (ja) 2023-09-06

Family

ID=87886034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022028123A Pending JP2023124387A (ja) 2022-02-25 2022-02-25 ビットレート決定装置、符号化装置、およびプログラム

Country Status (1)

Country Link
JP (1) JP2023124387A (ja)

Similar Documents

Publication Publication Date Title
US10194150B2 (en) Method and device for coding image, and method and device for decoding image
JP6351040B2 (ja) 層状の信号品質階層のおける信号処理およびインヘリタンスの方法、プログラム、及び、コンピュータシステム
TWI323131B (en) Method for reducing noise of pictures
US9911179B2 (en) Image decontouring in high dynamic range video processing
US9712834B2 (en) Hardware efficient sparse FIR filtering in video codec
CN112929670A (zh) 自适应色度下采样和色彩空间转换技术
TW201448571A (zh) 用以移除編碼視頻數據中的編碼瑕疵之自適應過濾機構
US9503751B2 (en) Method and apparatus for simplified depth coding with extended prediction modes
JP6391680B2 (ja) 符号化する方法及び復号する方法並びに対応する符号器及び復号器
WO2021228513A1 (en) Learned downsampling based cnn filter for image and video coding using learned downsampling feature
US20150365698A1 (en) Method and Apparatus for Prediction Value Derivation in Intra Coding
TW201941608A (zh) 影像處理設備、濾波方法、非暫態電腦可讀取記錄媒體以及影像裝置
US8145006B2 (en) Image processing apparatus and image processing method capable of reducing an increase in coding distortion due to sharpening
WO2022261838A1 (zh) 残差编码和视频编码方法、装置、设备和系统
CN114747212A (zh) 用于视频滤波中的偏移的方法和设备
CN115552905A (zh) 用于图像和视频编码的基于全局跳过连接的cnn滤波器
CN115398899A (zh) 视频滤波方法和装置
US20200120349A1 (en) Optimization of downsampling occurring before encoding images during compression
US10728557B2 (en) Embedded codec circuitry for sub-block based entropy coding of quantized-transformed residual levels
JP2022503990A (ja) ビデオ画像成分予測方法および装置、コンピュータ記憶媒体
JP2023124387A (ja) ビットレート決定装置、符号化装置、およびプログラム
WO2022077490A1 (zh) 一种帧内预测方法、编码器、解码器及存储介质
KR20160040930A (ko) 이미지 재부호화 방법 및 그 장치
CN116250240A (zh) 图像编码方法、图像解码方法及相关装置
JP2017073135A (ja) ビデオエピトメを用いて画像からノイズを除去する方法及び装置