JP6616592B2 - 符号化装置及びそのプログラム - Google Patents

符号化装置及びそのプログラム Download PDF

Info

Publication number
JP6616592B2
JP6616592B2 JP2015103165A JP2015103165A JP6616592B2 JP 6616592 B2 JP6616592 B2 JP 6616592B2 JP 2015103165 A JP2015103165 A JP 2015103165A JP 2015103165 A JP2015103165 A JP 2015103165A JP 6616592 B2 JP6616592 B2 JP 6616592B2
Authority
JP
Japan
Prior art keywords
region
unit
predetermined
block
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015103165A
Other languages
English (en)
Other versions
JP2016220040A (ja
Inventor
慎平 根本
康孝 松尾
慎一 境田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2015103165A priority Critical patent/JP6616592B2/ja
Publication of JP2016220040A publication Critical patent/JP2016220040A/ja
Application granted granted Critical
Publication of JP6616592B2 publication Critical patent/JP6616592B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、動画像の符号化処理技術に関し、特に、短視距離を対象とする視聴環境下に適した符号化制御を行う符号化装置及びそのプログラムに関する。
近年、ディスプレイやビデオカメラ画像の大型化に伴い、臨場感・実物感が得られるよう動画像の高解像度化が行われている。いわゆる8Kと呼ばれるスーパーハイビジョン(SHV)のような超高精細動画像は、ある程度の短視距離、例えば0.75H(1H:モニタ画面高)程度の視距離で視聴することで、視聴者は映像に包み込まれるような臨場感を楽しむことができる。
ところで、超高精細・大画面テレビの映像の画面サイズと“好ましい観視距離”との関係に関して、視野内の情報受容特性についての報告が為されている(例えば、非特許文献1参照)。
また、広い視野で画像を観たときの臨場感に関連する心理的な効果を定量化して示した報告もある(例えば、非特許文献2参照)。
成田長人、金澤勝、岡野文男、"超高精細・大画面映像システムの画面パラメータ"、一般社団法人映像情報メディア学会、映像情報メディア学会誌、Vol. 56, No. 3, pp. 437〜446、2002年3月1日発行 映像情報メディア学会 卓越研究データベース、"視野角に対する画像の臨場感の客観測定"、[online]、[平成27年4月6日検索]、インターネット〈URL:http://dbnst.nii.ac.jp/pro/detail/1147〉
スーパーハイビジョン(SHV)のような超高精細動画像では、1フレームあたりの情報量も多くなり、符号化効率及び符号化速度の向上が求められる。
また、短視距離を前提とした視聴環境では、画面中央部の画素に比べると、周辺領域では画素に対する距離や角度が生じる。このため周辺領域の重要性が中央部分に比べて相対的に低くなり、動画像の画面全体を同一の符号化方式及び圧縮率で処理することは、符号化効率の観点から望ましくない。
本発明の目的は、上述の問題に鑑みて、短視距離を対象とする視聴環境下に適した符号化制御を行う符号化装置及びそのプログラムを提供することにある。
本発明では、短視距離を対象とする視聴環境下に適した符号化制御として、画面の中央部と周辺部で異なる符号化制御を行うことによって符号化効率及び符号化速度を改善する。
本発明の符号化装置は、動画像の符号化処理を行う符号化装置であって、動画像のフレームを所定のブロックサイズの単位ブロックにブロック分割するブロック分割手段と、前記単位ブロックを基に変換ブロックを決定し、該変換ブロックに対して所定の直交変換処理を施す直交変換手段と、前記直交変換処理が施された変換ブロックに対して所定の量子化処理を施し、符号化信号を生成する量子化手段と、前記フレームに対して短視距離を考慮して予め定めた領域基準を基に、当該ブロック分割の対象とする単位ブロックが属する領域を判定する手段と、当該所定の量子化処理の対象とする変換ブロックが属する領域を判定する手段のいずれか一方、又は双方を有し、当該判定結果に基づいて、前記短視距離にて前記フレームに対して中央部の領域よりも、周辺部の領域の符号データ量を抑制するよう所定の符号化パラメータを制御する領域判定・制御手段と、を備え、前記領域判定・制御手段は、前記領域基準として、前記フレームの中央部の中心画素を基準に、前記中心画素の法線方向上の視点からの視角度により、前記フレームを構成する各画素に対する水平方向の水平縮小率をSxとし垂直方向の垂直縮小率をSyとしたときに前記フレームの画素毎に縮小率S=Sx×Syを求め、該縮小率Sが前記中心画素に対して所定の割合以下になる画素群を、前記符号データ量を抑制する領域とし、該領域を区分するように定められた1以上の第1の境界線と、前記中心画素の法線方向上の当該視点から、臨場感を引き起こすとされる予め定められた誘導視野又は予め定められた安定注視野の範囲の外側の領域を区分するように定められた1以上の第2の境界線とを定め、前記中心画素を基準にして、前記フレームの中央部を含む前記1以上の第1の境界線より内側の領域を前記中央部の領域とし、前記1以上の第1の境界線より外側、且つ前記1以上の第2の境界線より内側の領域を、前記符号データ量を抑制する第1の領域とし、前記1以上の第2の境界線より外側の領域を、前記符号データ量を抑制する第2の領域として判定する領域判定部と、前記所定の符号化パラメータの制御として、前記フレームに対して中央部の領域よりも、周辺部の領域の符号データ量を抑制するよう、前記1以上の第1の境界線及び前記1以上の第2の境界線で定まる領域毎に、前記量子化手段により予め定めた符号化処理に基づく量子化制御値を補正する量子化補正部と、を有することを特徴とする。
また、本発明の符号化装置において、前記量子化手段によって量子化され符号化された結果を所定の検証基準に基づいて、符号化歪が所定値内の歪み量であるか否かを検証し、符号化歪が所定値内であればそのまま出力し、符号化歪が所定値内でなければ前記領域判定・制御手段に対して異なる領域設定、又は異なる符号化パラメータで、前記中央部の領域と比して前記周辺部の領域の符号データ量を抑制し、且つ符号化歪が所定値内となるよう繰り返し制御する符号化検証手段を更に備えることを特徴とする。
更に、本発明のプログラムは、コンピュータを、本発明の符号化装置として機能させるためのプログラムであることを特徴とする。
本発明によれば、短視距離を考慮した動画像の符号化効率を改善することができる。
本発明による第1実施形態の符号化装置の概略構成を示すブロック図である。 (a),(b)は、それぞれ本発明による第1実施形態の符号化装置に係る基本ブロック(CTU)及び変換ブロック(TU)の例を示す説明図である。 本発明による第1実施形態の符号化装置の符号化処理例を示すフローチャートである。 本発明による第1実施形態の符号化装置に係る短視距離の説明図である。 (a)は、本発明による第1実施形態の符号化装置に係る視野内の情報受容特性の説明図であり、(b)はその計算値である。 本発明による第1実施形態の符号化装置に係る視野内の情報受容特性と臨場感に関する誘導視野範囲と境界線を示す画面境界の一例を示す説明図である。 本発明による第1実施形態の符号化装置に係る視野内の情報受容特性と臨場感に関する誘導視野範囲と境界線を示す画面境界の別例を示す説明図である。 本発明による第1実施形態の符号化装置に係る視野内の情報受容特性と臨場感に関する誘導視野範囲と境界線を示す画面境界の更なる別例を示す説明図である。 本発明による第2実施形態の符号化装置の概略構成を示すブロック図である。 本発明による第2実施形態の符号化装置の符号化処理例を示すフローチャートである。
以下、図面を参照して、本発明による各実施形態の符号化装置1を順に説明する。
〔第1実施形態〕
(装置構成)
図1は、本発明による第1実施形態の符号化装置1の概略構成を示すブロック図である。符号化装置1は、動画像の各フレームの画面について、その中央部の領域と周辺領域とを詳細に後述する所定の領域基準に基づいて定義し、画面の中央部と周辺部で異なる符号化制御を行うことによって符号化効率及び符号化速度を改善する装置であり、ブロック分割部11、直交変換部12、量子化部13、領域判定部14、量子化補正部15、及び分割補正部16を備える。ここで、ブロック分割部11、直交変換部12及び量子化部13は、それぞれ入力される複数フレームからなる動画像について予め定めた符号化処理でのブロック分割処理、直交変換処理、及び量子化処理が予定されているものとし、領域判定部14、量子化補正部15及び分割補正部16は、この予定されていた符号化処理に対する補正を行うよう機能する。
ブロック分割部11は、領域判定部14及び分割補正部16による制御下で、入力される複数フレームからなる動画像の映像信号を入力し、フレームごとに所定のブロックサイズの単位ブロックに分割し、この単位ブロックから更なる所定のブロックサイズの変換ブロックへの分割を許容した態様で、各単位ブロックを予め定めた順序で直交変換部12に出力する。尚、単位ブロックから変換ブロックへの分割を行わないときは、この単位ブロックを変換ブロックとして扱うことができる。
例えば、H.265/HEVCの場合では、フレームを分割するCTU(Coding Tree Unit、符号化ツリーユニット)、CTUを繰り返し利用可能に(再帰的に)分割するCU(Coding Unit、符号化ユニット)、CUを予測処理用に分割するPU(Prediction Unit、予測ユニット)、及びCUを変換処理用に分割するTU(Transform Unit、変換ユニット)がブロック分割処理に含まれる。このため、「単位ブロック」は、CTU、或いはCTUから分割又は非分割されたCUとすることができる。また、「変換ブロック」は、CUから量子化変換のために分割又は非分割されたTUとすることができる。例えば、図2(a)に示すように、フレームFをCTUに分割すると、このCTUを更に分割したCUとし、このCUを単位ブロックとして量子化変換のために更に分割した変換ブロック(TU)とすることができる。或いは、図2(b)に示すように、フレームFをCTUに分割すると、このCTUを更に分割したCUとし、このCUを単位ブロックとするとともに、このCUを量子化変換のためのTUとすることができる。更には、フレームFをCTUに分割して単位ブロックとし、このCTUを量子化変換のためのTUとすることもできる。
或いはまた、H.264/AVCの場合では、フレームを分割するマクロブロックを「単位ブロック」とし、マクロブロックから量子化変換のために分割されたサブマクロブロックを「変換ブロック」とすることができる。
直交変換部12は、順次得られる単位ブロックを基に変換ブロックを決定し、変換ブロックに対して所定の直交変換処理を施して、量子化部13に出力する。
量子化部13は、領域判定部14及び量子化補正部15による制御下で、直交変換処理が施された変換ブロックに対して所定の量子化処理を施し、符号化信号を生成して外部に出力する。尚、ブロック分割や量子化に係る制御値(量子化パラメータなど)は、符号化パラメータとして符号化信号のヘッダ情報に含めて出力することができる。このため、復号側は、符号化パラメータを参照して復号処理するものであればよく、既存の復号装置により復号することができる。
領域判定部14は、ブロック分割部11から得られる単位ブロックの位置情報(単位ブロック位置情報)により、所定の領域基準に基づいて、当該単位ブロックが動画像の各フレームの画面におけるいずれの領域に属するかを判定し、その判定結果を「単位ブロックの領域情報」として分割補正部16に出力する。更に、領域判定部14は、直交変換部12から得られる変換ブロックの位置情報(変換ブロック位置情報)により、当該所定の領域基準に基づいて、当該変換ブロックが動画像の各フレームの画面におけるいずれの領域に属するかを判定し、その判定結果を「変換ブロックの領域情報」として量子化補正部15に出力する。
量子化補正部15及び分割補正部16は、それぞれ「変換ブロックの領域情報」及び「単位ブロックの領域情報」を基に、フレームFに関して短視距離にて中央部よりも、周辺部の符号データ量を抑制するよう量子化に係る制御値(例えば、量子化パラメータqP)及びブロック分割の補正を行うよう制御する。
より具体的には、量子化補正部15は、「変換ブロックの領域情報」を基に、量子化部13による所定の量子化処理における制御値(例えば、量子化パラメータ)を補正するか否かを判別して量子化部13に対して補正制御する。一例として、量子化部13は、所定の量子化処理を施す前に補正前制御値(例えば、補正前の量子化パラメータqP)を量子化補正部15に出力し、量子化補正部15は、「変換ブロックの領域情報」を基に補正前制御値(例えば、補正前の量子化パラメータqP)を補正するか否かを判別し、補正する際にはその補正後制御値(補正後の量子化パラメータqP)を量子化部13に返す。量子化部13は、この補正後制御値を用いて、当該直交変換処理が施された変換ブロックに対して所定の量子化処理を施し、符号化信号を生成して外部に出力する。
分割補正部16は、「単位ブロックの領域情報」を基に、ブロック分割部11によるブロック分割に係る単位ブロックのブロックサイズの補正の要否を判定制御し、補正の要否を示す分割補正情報をブロック分割部11に出力する。一例として、ブロック分割部11は、予め定めた符号化処理に基づき分割する単位ブロックを直交変換部12に出力する前に、当該単位ブロックの位置情報を領域判定部14に出力し、領域判定部14は、領域判定の後に「単位ブロックの領域情報」を生成し、分割補正部16は、「単位ブロックの領域情報」を基に分割補正情報をブロック分割部11に出力する。そして、ブロック分割部11は、この分割補正情報が、当該単位ブロックのブロックサイズの補正を示すときは、その分割補正情報が示すブロックサイズで単位ブロックを決定して直交変換部12に出力し、この分割補正情報が、当該単位ブロックのブロックサイズの補正を示さないときは、当該予め定めた符号化処理に基づき分割する単位ブロックをそのまま直交変換部12に出力する。
尚、領域判定部14及び分割補正部16によるブロック分割の補正制御に関して、H.265/HEVCの場合では、フレームFからCTUへのブロックサイズは補正しないようにし、CTUからCUへのブロック分割、或いはこのCUからTUへのブロック分割について補正を行うようにするのが簡便である。同様に、H.264/AVCの場合では、フレームFからマクロブロックへのブロックサイズは補正しないようにし、マクロブロックからサブマクロブロックへのブロック分割について補正を行うようにするのが簡便である。
尚、量子化補正部15、及び分割補正部16は、そのいずれか一方のみを備えるよう構成することもできる。
(装置動作)
以下、図3を参照して、H.265/HEVCの場合を基に、本発明による第1実施形態の符号化装置1に関する動作例をより具体的に説明する。図3は、本発明による第1実施形態の符号化装置1の符号化処理例を示すフローチャートである。
ここで、モニタ画面高H=4320ライン×横7680画素のいわゆる8Kと呼ばれるスーパーハイビジョン(SHV)の超高精細動画像を符号化処理して生成する例について説明する。このとき、例えば図4に示すように、或る程度の短視距離、例えば0.75H程度の視距離で視聴することで、視聴者は映像に包み込まれるような臨場感を楽しむことができる。図4に示す画面例で、例えばフレームFの画面に対する法線方向のZ軸上の視点から当該画面の中央部Oまでの視距離を0.75Hとすると、画面のY軸方向の上下端F1の視野角は±33°、画面のX軸方向の左右端F2の視野角は±50°となる。
まず、符号化装置1は、ブロック分割部11により、入力される複数フレームからなる動画像の映像信号を入力し、予め定めた符号化処理に基づき単位ブロックに分割するが、この単位ブロックを直交変換部12に出力する前に、当該単位ブロックの位置情報を領域判定部14に出力し、領域判定部14による判定を待機する(ステップS11)。
続いて、符号化装置1は、領域判定部14により、ブロック分割部11から得られる単位ブロック位置情報(CTU/CUの位置情報)から、予め定義された領域基準を基に、当該単位ブロックが動画像の各フレームの画面におけるいずれの領域に属するかを判定し、その判定結果を「単位ブロックの領域情報」として生成する(ステップS12)。
フレームFの画面に関する領域基準に関して、例えば、当該画面の中央部の定義、或いは周辺部の定義は、視聴者が一人か複数かで異なるものとすることができるが、ここでは複数の視聴者であっても通常は画面中央を注視することを考量して、一人の視聴者が画面中央で視距離0.75Hから視聴する際の領域基準で、中央部と周辺部を定め、更にはこの周辺部のうち誘導視野範囲、或いは安定注視野の領域を定めて、各領域別の符号化処理を行う例を説明する。
領域基準は、「視距離と視角度に依存する幾何学的な縮小率」と、「視野内の情報受容特性」のうちいずれか一方、好適にはその双方を考量して、動画像の各フレームの画面について、その中央部の領域と周辺領域とを1つ又は複数の境界線にて区分するよう定義するものである。特に、本実施形態の符号化装置1は、画面の中央部の領域に比して、周辺領域の分割ブロックのブロックサイズを大きくしたりその量子化ビット数を粗くしたりすることで、或る程度の符号化歪と引き換えに、フレーム画面全体として符号データ量を抑制させ、符号化速度の向上を可能とする。
「視距離と視角度に依存する幾何学的な縮小率」は、動画像の或るフレームFの画面について、中心画素(0,0)の法線方向に距離zから視聴した際の、中心画素(0,0)に対する画素A(x,y)の水平縮小率をSx、垂直縮小率をSyとすると、次式で求めることができる。
例えば、画素A(x,y=0)のときの水平縮小率をSxは、図5(a)に示すように、Sx=a’/aより得られる。そして、z=0.75Hを代入して得られる±50°の視角度における縮小率のグラフを図5(b)に示している。
このように、フレームFの画素毎に「縮小率S=Sx×Sy」を求め、縮小率Sが中心画素(0,0)に対して50%以下になる画素群を、データ量を抑制する領域として定め、図6に示す境界線Laを定めることができる。例えばこの数値を40%や60%、75%と定めてもよいし、複数の境界線Laを定めることもできる。また、符号化データ量が或る閾値以上になる場合にこの数値を変動させて周辺領域の符号化データ量を減少させ、或る瞬間の画面全体の符号化データ合計量を抑制させるよう適応的に境界線Laを定めてもよい。このような幾何学的な縮小率から求まる境界線を境界線Laとすると、図6に示すように、境界線Laに囲まれる領域を中央部とする領域A、境界線Laの外側部分を周辺部とし領域Bとし区分することができる。
また、「視野内の情報受容特性」については、中心画素(0,0)の法線方向(距離0.75H)に視点がある場合、臨場感を引き起こすとされる誘導視野範囲(水平:±50°、上:35°、下:50°)を用いて、その外側の領域を、データ量を抑制する画素範囲に定める。ただし、この臨場感を考量する範囲を例えば安定注視野(水平:±45°、上:30°、下:40°)などとしてもよい。この情報受容特性に基づく境界線を境界線Lbとすると、図6に示すように、領域Bのうち境界線Lbの外側部分を領域Cとし区分する。
このようにして、短視距離を対象とする視聴環境下に適した動画像の各フレームに対する領域基準を定めることができる。
続いて、符号化装置1は、分割補正部16により、領域判定部14によって得られる単位ブロックの領域情報を基に、ブロック分割の補正を行うか否かを判定し(ステップS13)、例えば、ブロック分割部11によるCTUからCUへの分割の要否を判定して、判定対象のCTUが周辺領域(領域B或いは領域C)に属しているときは(ステップS13:Yes)、CTUからCUへの分割を行わないようブロック分割部11に対して補正制御する(ステップS14)。一方、判定対象のCTUが中央部の領域(領域A)に属しているときは(ステップS13:No)、ステップS15に移行する。この処理によって、周辺領域の或る程度の符号化歪と引き換えに、データ量を削減し符号化時間の短縮を図ることができる。尚、分割補正部16を設けていない構成とするときは、ステップS11からステップS15に直接移行する。
続いて、符号化装置1は、直交変換部12により、順次得られる単位ブロック(CTU/CU)を基に変換ブロック(TU)を決定し、TUに対して所定の直交変換処理を施す(ステップS15)。このとき、符号化装置1は、領域判定部14により、直交変換部12から得られる変換ブロック位置情報(TUの位置情報)から、当該予め定義された領域基準を基に、当該変換ブロック(TU)が動画像の各フレームの画面におけるいずれの領域に属するかを判定し、その判定結果を「変換ブロックの領域情報」として生成する。
続いて、符号化装置1は、量子化補正部15により、領域判定部14によって得られる変換ブロックの領域情報を基に、量子化部13による所定の量子化処理における制御値(例えば、量子化パラメータ)を補正するか否かを判別して量子化部13に対して補正制御することで、量子化部13が領域判定に応じた可変制御で符号化対象の変換ブロック(TU)を量子化するよう制御する(ステップS16)。例えば、量子化補正部15は、判定対象のTUが中央部の領域(領域A)に属しているときは、予め定めた符号化処理に基づく量子化パラメータqPのままとして、量子化パラメータqPを補正しないよう量子化部13を制御し、判定対象のTUが周辺領域(領域B又は領域C)に属しているときは、視点からの立体角が中心画素(0, 0 )に比べて半分以下になるため、量子化パラメータqPの値を「+6(量子化ステップを2倍)」に補正するよう量子化部13を制御する。例えばこの量子化パラメータqPの増加分は、他の数値にしてもよいし、複数の境界線La,Lbを定めた場合には別個の値で定めた複数のqP値の中から選ぶことができる。特に、領域Cの画素は、領域Bにある画素よりも重要性が低くなるため、更に量子化パラメータqPの値を増加させる処理を行ってもよい。例えばこのときの量子化パラメータqPの値の増加分は更に「+6」とすることができる。尚、ブロック分割の補正のみを行うよう構成するときは、ステップS15における変換ブロックの判定処理やステップS16における領域判定に応じた量子化パラメータqPの可変制御は省略することができる。
以上のように構成することにより、本発明に係る符号化装置1は、短視距離を対象とする視聴環境下に適した符号化制御として、画面の中央部と周辺部で異なる符号化制御を行うことによって符号化効率及び符号化速度を改善することができる。
また、図6に示す例では、「視距離と視角度に依存する幾何学的な縮小率」に基づく境界線Laにより中央部を定める例を示したが、例えば「視距離と視角度に依存する幾何学的な縮小率」に基づく境界線Laを複数設定するとともに、「視野内の情報受容特性」に基づく境界線Lbを複数設定して、各境界線La,Lbで区分される領域のうち、中心部Oに最も近い境界線内を中央部とし、中央部から遠ざかる周辺部の領域ほどデータ量の減少及び処理速度を向上させるよう符号化パラメータを定めてもよい。例えば、図7に示す例では、臨場感を引き起こすとされる「視野内の情報受容特性」に基づく境界線Lb‐1内の誘導視野範囲(水平:±50°、上:35°、下:50°)で、更に別の「視野内の情報受容特性」に基づく境界線Lb‐2、「視距離と視角度に依存する幾何学的な縮小率」に基づく縮小率30%,50%の2つの境界線La‐1,La‐2を設定している。そして、それぞれの境界線によって区切られる領域A,B,C,D,Eを、それぞれ中央部を示す有効視野の領域、周辺部を示す誘導視野範囲内の第1の領域、周辺部を示す誘導視野範囲内の第2の領域、及び周辺部を示す誘導視野範囲外の領域として定め、中心部Oに最も近い境界線内(領域A)を中央部とし、中央部から遠ざかる周辺部の領域ほどデータ量の減少及び処理速度の向上を伴うような符号化パラメータ(ブロックサイズや量子化パラメータ等)の補正を行うよう構成することができる。
また、「視野内の情報受容特性」に基づく境界線Lbのみを複数設定してもよい。例えば図8に示すように、境界線Lb‐1,境界線Lb‐2,境界線Lb‐3により領域A,B,Cを設け、中心部Oに最も近い境界線Lb‐1内の領域Aは中央部を示す有効視野の領域とし、領域Bは周辺部を示す安定注視野(水平:±45°、上:30°、下:40°)の領域、領域Cは周辺部を示す誘導視野範囲(水平:±50°、上:35°、下:50°)の領域として設定し、中央部から遠ざかる周辺部の領域ほどデータ量の減少及び処理速度の向上を伴うような符号化パラメータ(ブロックサイズや量子化パラメータ等)の補正を行うよう構成することができる。
そして、このような「視野内の情報受容特性」に基づく境界線を利用して領域基準を定めることにより、誘導視野又は安定視野をフレームFの画面上方よりも下方の視野を重視させることができるため、フレームFの下方に字幕が付されることが多いことを考慮すると、実用性の高い領域別符号化処理を実現することができる。
〔第2実施形態〕
(装置構成)
図9は、本発明による第2実施形態の符号化装置1の概略構成を示すブロック図である。尚、第1実施形態と同様な構成要素には同一の参照番号を付している。第2実施形態の符号化装置1は、動画像の各フレームの画面について、その中央部の領域と周辺領域とを前述した所定の領域基準に基づいて定義し、画面の中央部と周辺部で異なる符号化制御を行うことによって符号化効率及び符号化速度を改善する装置であり、ブロック分割部11、直交変換部12、量子化部13、領域判定部14、量子化補正部15、及び分割補正部16を備える点で第1実施形態と同様であるが、符号化検証部17を更に備える点で相違する。ブロック分割部11、直交変換部12、量子化部13、量子化補正部15、及び分割補正部16の動作は第1実施形態と同様であり、その詳細な説明は省略するが、ここでは主に、量子化部13による量子化後の符号化結果を検証する符号化検証部17と、これに係る領域判定部14の動作について、図10を参照して説明する。
図10は、第2実施形態の符号化装置1の符号化処理例を示すフローチャートである。ステップS11〜S16は第1実施形態と同様であり、ステップS16にて、量子化部13は、領域判定に応じた可変制御で符号化対象の変換ブロック(TU)を量子化する。
続いて、符号化検証部17は、量子化部13によって量子化され符号化された結果を例えば客観的指標のひとつであるピーク信号対雑音比を表わすPSNR(Peak Signal to Noise Ratio)などの検証基準により、符号化歪が所定値内の歪み量であるか否かを検証し(ステップS17)、符号化歪が所定値内であれば(ステップS17:Yes)、そのまま出力し、符号化歪が所定値内でなければ(ステップS17:No)、データ量の減少及び処理速度の向上作用が高すぎると判定し、領域判定部14に対して符号化パラメータの領域設定、又は分割補正部16や量子化補正部15による補正処理の変更を指示する(ステップS18)。この指示に応じて領域判定部14は境界線の設定の変更を行うことができ、これに伴いブロック分割の補正、及び量子化パラメータの補正など、データ量の減少及び処理速度の向上作用を損なわないよう再設定し、符号化歪が所定値内となるまで繰り返すようにする。分割補正部16や量子化補正部15による補正処理の変更によっても同様にデータ量の減少及び処理速度の向上作用を損なわないよう再設定し、符号化歪が所定値内となるまで繰り返すようにする。これにより、データ量の減少及び処理速度の向上作用を損なうことなく、一定量の符号化品質を維持することができる。
以上、特定の実施形態の例及び実施例を挙げて本発明を説明したが、本発明は前述の例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。
例えば、上述した例では、周辺領域の分割ブロックサイズを大きくしたり量子化ビット数を粗くしたりする例を説明したが、これ以外にも、周辺領域では、デブロッキング・フィルタ処理の省略を行うなど、画面(フレーム)の中央部の領域に比して、周辺部の領域の符号化処理における一部の処理を省略することで、或る程度の符号化劣化と引き換えに、データ量の減少及び処理速度を向上させることができる。
更には、周辺領域の符号化処理における一部の処理を省略する他の例として、周辺領域では予め定めた符号化処理に基づく画面内予測の方向性予測数を減少させてもよい。周辺領域では例えば非方向性予測の2種と水平・垂直の方向性予測とを合わせた4通りとするよう定めてもよい。この場合も、デブロッキング・フィルタ処理の省略と同様に、或る程度の符号化劣化と引き換えに処理速度を向上させることができる。
そして、各実施形態の符号化装置1をコンピュータとして機能させることができ、当該コンピュータに、本発明に係る各構成要素を実現させるためのプログラムは、当該コンピュータの内部又は外部に備えられるメモリ(図示せず)に記憶される。コンピュータに備えられる中央演算処理装置(CPU)などの制御で、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、メモリから読み込んで、各実施形態の符号化装置1の各構成要素の機能をコンピュータに実現させることができる。ここで、各構成要素の機能をハードウェアの一部で実現してもよい。
本発明によれば、短視距離を考慮した動画像の符号化効率を改善することができるので、動画像の符号化処理を要する用途に有用である。
1 符号化装置
11 ブロック分割部
12 直交変換部
13 量子化部
14 領域判定部
15 量子化補正部
16 分割補正部
17 符号化検証部

Claims (3)

  1. 動画像の符号化処理を行う符号化装置であって、
    動画像のフレームを所定のブロックサイズの単位ブロックにブロック分割するブロック分割手段と、
    前記単位ブロックを基に変換ブロックを決定し、該変換ブロックに対して所定の直交変換処理を施す直交変換手段と、
    前記直交変換処理が施された変換ブロックに対して所定の量子化処理を施し、符号化信号を生成する量子化手段と、
    前記フレームに対して短視距離を考慮して予め定めた領域基準を基に、当該ブロック分割の対象とする単位ブロックが属する領域を判定する手段と、当該所定の量子化処理の対象とする変換ブロックが属する領域を判定する手段のいずれか一方、又は双方を有し、当該判定結果に基づいて、前記短視距離にて前記フレームに対して中央部の領域よりも、周辺部の領域の符号データ量を抑制するよう所定の符号化パラメータを制御する領域判定・制御手段と、を備え
    前記領域判定・制御手段は、
    前記領域基準として、前記フレームの中央部の中心画素を基準に、前記中心画素の法線方向上の視点からの視角度により、前記フレームを構成する各画素に対する水平方向の水平縮小率をSxとし垂直方向の垂直縮小率をSyとしたときに前記フレームの画素毎に縮小率S=Sx×Syを求め、該縮小率Sが前記中心画素に対して所定の割合以下になる画素群を、前記符号データ量を抑制する領域とし、該領域を区分するように定められた1以上の第1の境界線と、前記中心画素の法線方向上の当該視点から、臨場感を引き起こすとされる予め定められた誘導視野又は予め定められた安定注視野の範囲の外側の領域を区分するように定められた1以上の第2の境界線とを定め、前記中心画素を基準にして、前記フレームの中央部を含む前記1以上の第1の境界線より内側の領域を前記中央部の領域とし、前記1以上の第1の境界線より外側、且つ前記1以上の第2の境界線より内側の領域を、前記符号データ量を抑制する第1の領域とし、前記1以上の第2の境界線より外側の領域を、前記符号データ量を抑制する第2の領域として判定する領域判定部と、
    前記所定の符号化パラメータの制御として、前記フレームに対して中央部の領域よりも、周辺部の領域の符号データ量を抑制するよう、前記1以上の第1の境界線及び前記1以上の第2の境界線で定まる領域毎に、前記量子化手段により予め定めた符号化処理に基づく量子化制御値を補正する量子化補正部と、を有することを特徴とする符号化装置。
  2. 前記量子化手段によって量子化され符号化された結果を所定の検証基準に基づいて、符号化歪が所定値内の歪み量であるか否かを検証し、符号化歪が所定値内であればそのまま出力し、符号化歪が所定値内でなければ前記領域判定・制御手段に対して異なる領域設定、又は異なる符号化パラメータで、前記中央部の領域と比して前記周辺部の領域の符号データ量を抑制し、且つ符号化歪が所定値内となるよう繰り返し制御する符号化検証手段を更に備えることを特徴とする、請求項に記載の符号化装置。
  3. コンピュータを、請求項1又は2に記載の符号化装置として機能させるためのプログラム。
JP2015103165A 2015-05-20 2015-05-20 符号化装置及びそのプログラム Active JP6616592B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015103165A JP6616592B2 (ja) 2015-05-20 2015-05-20 符号化装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015103165A JP6616592B2 (ja) 2015-05-20 2015-05-20 符号化装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2016220040A JP2016220040A (ja) 2016-12-22
JP6616592B2 true JP6616592B2 (ja) 2019-12-04

Family

ID=57581686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015103165A Active JP6616592B2 (ja) 2015-05-20 2015-05-20 符号化装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP6616592B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112313954A (zh) 2018-06-28 2021-02-02 苹果公司 视频编码系统
CN112335244B (zh) 2018-06-28 2022-12-23 苹果公司 基于优先级的视频编码和传输
JP7249364B2 (ja) * 2018-06-28 2023-03-30 アップル インコーポレイテッド 低レイテンシ動画符号化及び送信のレート制御

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09233475A (ja) * 1996-02-23 1997-09-05 Tsushin Hoso Kiko 画像符号化装置
JPH11146367A (ja) * 1997-11-06 1999-05-28 Matsushita Electric Ind Co Ltd モバイルビデオフォン
JP2002232888A (ja) * 2001-01-30 2002-08-16 Ntt Docomo Inc 映像信号符号化方法、その装置、そのプログラム及びその記録媒体
EP2805523B1 (en) * 2012-01-19 2019-03-27 VID SCALE, Inc. Methods and systems for video delivery supporting adaption to viewing conditions

Also Published As

Publication number Publication date
JP2016220040A (ja) 2016-12-22

Similar Documents

Publication Publication Date Title
KR102525578B1 (ko) 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
JP6886528B2 (ja) 映像コーディングシステムにおけるイントラ予測による映像のデコーディング方法及び装置
US9544616B2 (en) Video transmission apparatus
US11438591B2 (en) Video coding method and apparatus
TWI717776B (zh) 應用於視訊內容編碼之多重參考鄰邊之畫面內預測之自適應性濾波方法、使用上述方法的視訊編碼裝置及視訊解碼裝置
KR101621358B1 (ko) Hevc 부호화 장치 및 그 인트라 예측 모드 결정 방법
US20200236361A1 (en) Intra prediction mode based image processing method, and apparatus therefor
CN111131837B (zh) 运动补偿修正方法、编码方法、编码器及存储介质
JP7283024B2 (ja) 画像の符号化方法、復号化方法、エンコーダ、およびデコーダ
JP6616592B2 (ja) 符号化装置及びそのプログラム
US20200228831A1 (en) Intra prediction mode based image processing method, and apparatus therefor
US20220417517A1 (en) Image decoding method using cclm prediction in image coding system, and apparatus therefor
US20230179794A1 (en) Image decoding method and apparatus based on motion prediction using merge candidate list in image coding system
US20190230374A1 (en) Moving-image decoder, moving-image decoding method, moving-image encoder, moving-image encoding method, and computer readable recording medium
KR20200047723A (ko) 영상 코딩 시스템에서 블록 사이즈에 따른 변환을 사용하는 영상 디코딩 방법 및 그 장치
US20180027249A1 (en) Image decoding apparatus, image decoding method, and storage medium
US20230099405A1 (en) Image data transfer apparatus, image display system, and image data transfer method
US10743011B2 (en) Method and apparatus for accelerating inverse transform, and method and apparatus for decoding video stream
US10341674B2 (en) Method and device for distributing load according to characteristic of frame
EP2725801A1 (en) Image coding method, image decoding method, image coding device, image decoding device, image coding program, and image decoding program
KR20210047337A (ko) 시각 미디어 인코딩 및 디코딩을 위한 평면 예측 모드
JP6694902B2 (ja) 映像符号化装置及び映像符号化方法
JP2018107692A (ja) 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
KR20180028870A (ko) 고화질의 vr 컨텐츠의 스트리밍 제공 방법, 단말 및 서버
KR20200004348A (ko) 타겟 영역 수정을 통해 비디오 신호를 처리하는 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191015

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191108

R150 Certificate of patent or registration of utility model

Ref document number: 6616592

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250