JP2020141378A - 画像符号化装置及びその制御方法及びプログラム - Google Patents

画像符号化装置及びその制御方法及びプログラム Download PDF

Info

Publication number
JP2020141378A
JP2020141378A JP2019037776A JP2019037776A JP2020141378A JP 2020141378 A JP2020141378 A JP 2020141378A JP 2019037776 A JP2019037776 A JP 2019037776A JP 2019037776 A JP2019037776 A JP 2019037776A JP 2020141378 A JP2020141378 A JP 2020141378A
Authority
JP
Japan
Prior art keywords
image
block
prediction
prediction mode
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019037776A
Other languages
English (en)
Other versions
JP2020141378A5 (ja
JP7256658B2 (ja
Inventor
小林 幸史
Yukifumi Kobayashi
幸史 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019037776A priority Critical patent/JP7256658B2/ja
Publication of JP2020141378A publication Critical patent/JP2020141378A/ja
Publication of JP2020141378A5 publication Critical patent/JP2020141378A5/ja
Application granted granted Critical
Publication of JP7256658B2 publication Critical patent/JP7256658B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 線状のノイズの発生を抑制しつつ、画像の符号化を行う。【解決手段】 方向性予測モードを含む複数のイントラ予測モードのうちいずれかを用いて画像を符号化する画像符号化装置であって、画像データにおける符号化対象のブロックが所定の特徴を有するか否かを判定する判定部と、画像データが高ダイナミックレンジの画像データであり、且つ、判定部によりブロックが所定の特徴を有すると判定された場合、ブロックに対する利用可能なイントラ予測モードを制限する制限部とを有する。【選択図】 図1

Description

本発明は画像の符号化技術に関するものである。
動画像の国際標準符号化規格にHEVC(High Efficiency Video Coding)符号化方式がある。このHEVC符号化方式において、新たに静止画プロファイルというものが導入された(非特許文献1参照)。これは動画像符号化方式のHEVCで、静止画を符号化するためのプロファイルである。
また、広く普及しているJPEGは、1色成分が8ビットで表される画像を符号化対象とするものである。これに対し、HEVCでは10ビットや12ビット等の多ビット画像を扱うこともでき、HDR(High Dynamic Range)画像への対応も可能となる。これにより、今後HEVCを用いたHDR画像の静止画ファイルが普及するものと期待されている。
HEVCで静止画の符号化を行う場合、イントラ予測符号化が用いられることになる。イントラ予測は、符号化を行うブロックに対して、復号済みの周辺の画素値を用いて予測画像を生成する。このイントラ予測の種類として、DC予測、Planar予測、および33種類の方向性予測が用いられる。
H.265/HEVC教科書、大久保 榮[監修]、鈴木輝彦、高村誠之、中条健[共編]、2013年10月21日発行
しかしながら、HDR画像に対してイントラ予測を用いて符号化した場合、方向性予測により線状にノイズが発生し、画質が劣化するケースがある。HDR画像が画質劣化した場合、ほんの少しの画素値の変化でもHDR出力のための変換により劣化が増幅してしまう。また、線状に劣化した場合、周辺の画素値との関係により視覚的に劣化が目立つ場合がある。
本発明はかかる問題に鑑みなされたものであり、線状のノイズの発生を抑制しながら、画像の符号化を行う技術を提供しようとするものである。
この課題を解決するため、例えば本発明の画像符号化装置は以下の構成を備える。すなわち、
方向性予測モードを含む複数のイントラ予測モードのうちいずれかを用いて画像を符号化する画像符号化装置であって、
画像データにおける符号化対象のブロックが所定の特徴を有するか否かを判定する判定手段と、
前記画像データが高ダイナミックレンジの画像データであり、且つ、前記判定手段により前記ブロックが前記所定の特徴を有すると判定された場合、前記ブロックに対する利用可能なイントラ予測モードを制限する制限手段とを有する。
本発明によれば、線状のノイズの発生を抑制しながら、画像の符号化を行うことが可能になる。
実施形態で適用する撮像装置のブロック構成図。 HDR画像の記録時の入力値と出力値の関係を示す図。 HDR画像の表示時の入力値と出力値の関係を示す図。 水平方向予測時の予測画像の例を示す図。 予測画像の画素劣化の例を示す図。 第1の実施形態における符号化処理の手順を示すフローチャート。 第2の実施形態における符号化処理の手順を示すフローチャート。
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
[第1の実施形態]
図1は本実施形態の画像符号化装置が適用する撮像装置のブロック構成図である。ここでは、撮像して得た画像をHEVC符号化方式で符号化する構成を示している。以下、図1の動作を説明する。
制御部150は、CPU、CPUが実行するプログラムを格納したROM、CPUのワークエリアとして利用するRAMで構成される。そして、制御部150は、ユーザが操作する各種スイッチやボタン、タッチパネル等で構成される操作部151からの指示に従い、以下に説明する各処理部の制御を行い、撮像装置全体の制御を司るものである。
レンズ101は撮影対象の被写体像を撮像部102の撮像面に結像する。撮像部102はその表面にR,G,Bの各色成分のフィルタが配列され、これらフィルタを介して受光した光の強度を示す電気信号を生成する。更に、撮像部102は、生成した電気信号をデジタルデータに変換し、現像処理部103に出力する。上記のフィルタ配列の2×2個のフィルタに着目したとき、その対角関係にある2つのフィルタはG成分フィルタ(一般に区別するためG1,G2と表記される)であり、残りの2つはR,B成分のフィルタである。そして、この2×2個の関係が繰り返し配列されている。この配列は、一般にベイヤ配列と呼ばれる。よって、撮像部102で撮像して得たデジタル画像データもまた1画素1色成分のベイヤ配列の画素データの集合となり、一般に、RAW画像データと呼ばれる。
現像処理部103は、入力したRAW画像データを、ディベイヤ処理(1画素がRGB3成分で表現される画像データへの変換)、キズ補正、ノイズ除去、RGB→YCbCr形式への色変換などの画像処理が行われる。そして、現像処理部103は、画像処理後の画像データを符号化対象の画像データとして符号化フレームバッファ104に格納する。なお、実施形態では、符号化対象の画像はHDR画像としているので、Y,Cb、Crはそれぞれ8ビットを超えるビット数(例えば10ビット)であるものとする。
特徴検出部105は、符号化フレームバッファ104に格納された符号化対象画像データからブロックごとの画像(以下、ブロック画像)を取得し、そのブロック画像の特徴を検出する。そして特徴検出部105は、検出した特徴情報を予測モード設定部106に出力する。
予測モード設定部106は、イントラ予測に使用可能な予測モードの設定を行う。具体的には、予測モード設定部106は、特徴検出部105から入力した特徴情報、およびHDR画像データやLog画像データであるかなどの画像情報から、イントラ予測に使用可能な予測モードを決定する。
イントラ予測部107は、符号化フレームバッファ104から符号化画像を取得し、イントラ予測を行う。HEVCのイントラ予測モードには、DC予測モード、Planar予測モード、および、水平方向、垂直方向、斜め方向などの33種類の方向性を用いたAngular予測モード(方向性予測モード)がある。また、VVC(Versatile Video Codec)のイントラ予測モードには、DC予測モード、Planar予測モード、および、65種類のAngular予測モード(方向性予測モード)がある。予測モード設定部106は、これらの35種類の予測モードから使用可能な予測モードを決定し、イントラ予測部107に設定する。イントラ予測部107は、予測モード設定部106から設定された予測モードのうち最も符号化効率の良い予測モードを決定する。
イントラ予測部107は、符号化対象のブロック画像と、決定した予測モードに基づく予測画像との間の画素毎の差分である差分画像を求め、その差分画像、及び、予測画像を予測選択部109に出力する。
インター予測部108は、まず符号化フレームバッファ104から符号化対象のブロック画像データを取得する。また、インター予測部108は、参照フレームバッファ120から参照画像データを取得し、ブロック画像と参照画像との間でブロックマッチングをとり、動きベクトル検出を行う。そして、インター予測部108は、ブロック画像と、検出された動きベクトル位置の予測画像との間の画素毎の差分である差分画像を求め、その差分画像、および予測画像を予測選択部109に出力する。
予測選択部109は、イントラ予測の結果とインター予測の結果を比較し、どちらの予測を採用するか選択する。そして、予測選択部109は、選択した方の差分画像を直交変換部110に出力する。また、予測選択部109は、ローカルデコード画像作成用に、選択した方の予測画像を動き補償部117に出力する。更に、予測選択部109は、イントラ、インターのいずれを選択したのかを示す情報や動きベクトルを可変長符号化部113に出力する。
直交変換部110は、予測選択部109から入力した差分画像に対して離散コサイン変換を行うことで変換係数を生成し、その変換係数を量子化部111に出力する。
量子化部111は、直交変換部110から入力した変換係数を、量子化制御部112から設定される量子化パラメータで特定される量子化ステップを用いて量子化を行う。そして、量子化部111は、量子化後の変換係数を、符号化ストリーム作成のため可変長符号化部113、ならびに、ローカルデコード画像作成のため逆量子化部115に出力する。
可変長符号化部113は、量子化後の変換係数に対してジグザグスキャン、オルタネートスキャン等を行い、可変長符号化を行い、符号化データを生成する。可変長符号化部113は、この符号化データに、動きベクトルや量子化ステップサイズ、マクロブロック分割情報、適応オフセット処理用パラメータなどの符号化方式情報を可変長符号化したものを付加し、符号化ストリームを生成する。そして、可変長符号化部113は、生成された符号化ストリームを、記録メディア114に記録する。更に、可変長符号化部113は、符号化の際に、マクロブロックごとの発生符号量を算出し、算出した発生符号量を示す情報を量子化制御部112に出力する。
量子化制御部112では、可変長符号化部113から送られてくる発生符号量を用いて、目標符号量に近づくように量子化パラメータを更新し、量子化部111に設定することになる。
逆量子化部115は、量子化部111から送られてきた量子化後の変換係数に対して逆量子化を行い、ローカルデコード用の変換係数を生成する。そして、逆量子化部115は、得られた変換係数を逆直交変換部116に出力する。
逆直交変換部116は、逆量子化部115から入力した変換係数に対して逆離散コサイン変換を行い、ブロック画像の差分画像を生成する。そして、逆直交変換部116は、生成された差分画像を動き補償部117に出力する。
動き補償部117は、予測選択部109から送られてきた予測画像と、逆直交変換部116から送られてきた差分画像とを加算することにより、ローカルデコード用のブロック画像の画像データを生成する。そして、動き補償部117は、生成された画像データをデブロッキングフィルタ部118に出力する。
デブロッキングフィルタ部118は、送られてきた画像データに対してデブロッキングフィルタをかける。そして、デブロッキングフィルタ部118は、デブロッキングフィルタ後の画像データを、適応オフセット処理部119に出力する。
適応オフセット処理部119は、バンドオフセット処理、エッジオフセット処理、もしくは何も処理をしない、のいずれかの選択を行い、適応オフセット処理を行うバンド位置、エッジ方向、オフセット値などを決定する。そして、適応オフセット処理部119は、デブロッキングフィルタ後の画像データに対して適応オフセット処理を行い、その結果の画像データをローカルデコード画像として参照フレームバッファ120に格納する。また、適応オフセット処理部119は、適応オフセット処理としてどの処理を選択したか、バンド位置、エッジ方向、オフセット値などの適応オフセット処理用のパラメータを可変長符号化部113に出力する。可変長符号化部113、ブロック画像の符号化データに、適応オフセット処理部119から入力したパラメータ、予測選択部109からの予測に係るパラメータを統合し、符号化ストリームを生成することになる。
次に、イントラ予測時の特徴検出部105、および予測モード設定部106の動作について説明する。
特徴検出部105は、符号化フレームバッファ104から、これからイントラ予測を行うブロック画像を受け取り、このブロック画像に対して特徴検出を行う。ここで検出するのは、イントラ予測を行ったときに劣化が目立ちやすくなる特徴である。そのような性質を持つ画像の特徴の一つとして、平坦度合いがある。
平坦度合いの検出方法にはいろいろな方法が考えられるが、ここではブロック画像の分散値を使用する方法について説明する。例えばブロックサイズが16×16画素で、個々の画素の輝度値YをPk(ただし、k=1、2、…、256)と定義したとき、画素の平均値Pmean、および画素の分散値Varは以下の式(1)、(2)により算出することができる。
Figure 2020141378
Figure 2020141378
画像の分散値は画素値のばらつき具合を示すものである。故に、分散値が小さければ小さいほどその画像内には互いに近似する値の画素の個数が多いことを示し、平坦な画像であるとの推定が成り立つ。逆に、分散値が大きい場合、その画像内の各画素は互いに差分が大きく、複雑な画像を表すことになる。平坦かどうかを判定するため、予め分散の大小を判定するための所定の閾値(Vth)を決めておく。そして、求めた分散値Varが閾値以下の場合(Var≦Vthの場合)は、そのブロックの画像は平坦であると判定することとした。
なお、上記では輝度Yの分散を求めるものとしたが、色差であるCb,Crそれぞれの分散値を求め、輝度Y、色差Cb,Crの全て分散値がそれぞれの閾値以下である場合に、該当するブロックが平坦であると判定しても良い。
特徴検出部105は、上記のようにして、符号化対処のブロック画像が平坦か否かを判定し、その判定結果を予測モード設定部106に渡す。
予測モード設定部106は、平坦かどうかの判定結果を特徴検出部105から受け取る。また、予測モード設定部106は、撮影時の画像の種別を示す情報を受け取る。この画像の種別を示す情報として、実施形態ではHDR画像であるかSDR画像かの情報とする。なお、これ以外に、予測モード設定部106は、Log画像かどうかの情報を受け取る。
ここで、Log画像とは、通常のBT.709などの規格で定められたガンマカーブとは異なり、より広いダイナミックレンジ(高ダイナミックレンジ)を記録できるようにメーカごとに独自に規定したガンマカーブを用いて撮影された画像を言う。
HDR画像、もしくはLog画像は、モニタの出力時に規定されたガンマカーブで変換されて表示される。そのため輝度値によって、画素値の変化に対する明るさの変化の幅が異なる。輝度値においては画素値が高いほど、画素値幅1の変化に対する明るさの変化の幅が大きくなる。
HDR画像の記録時の入力輝度値(撮影時の実際の明るさ)と出力画素値(符号化時の画素値)の関係を図2に示す。
水平方向が入力輝度値、垂直方向が出力画素値で、入力値と出力値の関係がガンマカーブ201で規定されている。入力値が小さい部分では、カーブが垂直方向に急峻であり入力値の幅に対して画素値が多く割り当てられている。入力値が大きい部分では、カーブがゆるやかであり、入力値に対する画素値の割り当ては少なくなっている。
このように画素値を割り当てることにより、ダイナミックレンジの広い画像の記録を可能にしている。
HDR画像の表示時の入力値(符号化時の画素値)と出力値(実際にモニタに表示される明るさ)の関係を図3に示す。水平方向が入力画素値、垂直方向が実際に表示される出力値で、入力値と出力値の関係がガンマカーブ301で規定されている。これは、ガンマカーブ201と逆の関係になっている。
入力値が大きい部分、すなわち高い輝度値を表している部分では、画素値の変化量に対して、実際に表示される明るさの変化量が大きくなっている。表示時にこのようなカーブをかけることにより、正しい明るさで表示を行うことができる。
このように、HDR画像やLog画像は通常のSDR画像と比較して、符号化時の画素値の変化量に対して実際の明るさの変化量が多くなっている。すなわち、符号化時の画素の劣化がより増幅されて表示されることになる。この傾向は輝度値の高い部分でより顕著になる。
HEVCにおけるイントラ予測では、33種類の方向性予測モードと、DC予測モード及びPlanar予測モードを用いることができる。また、VVCにおけるイントラ予測では、65種類の方向性予測モードと、DC予測モード、Planar予測モードを用いることができる。方向性予測モードを用いた場合、設定された方向の参照画素を用いて予測画像を作成する。
予測画像の例を図4に示す。ここでは4×4画素のブロックに対して水平方向の予測を行うものとする。
水平方向の予測における予測画像401は左側に位置する符号化済みの画素402、403、404、405の参照画素を用いて作られる。
予測画像の1行目は参照画素402をコピーしたものとなる。同様に予測画像の2、3、4行目は、それぞれ参照画素403、404、405をコピーしたものとなる。
ここで、予測画像の劣化の例を、図5を参照して説明する。予測画像501は、その左側に位置する符号化済みの画素502、503、504、505の参照画素を用いて作られる。
ここで参照画素504のみ、符号化により画素値の劣化が起きたとする。この場合、3行目の予測画像506は、この画素劣化した参照画素504をコピーして作成される。そのため予測画像501は、3行目の予測画像506のみが劣化したものとなる。
このように水平方向予測を用いた場合、水平方向の線状に劣化した予測画像となる場合がある。このような予測画像を用いてイントラ予測を行った場合、符号化後の画像も同様に線状の劣化を起こす可能性が高くなる。他の方向性予測でも同様に、線状の劣化が起こってしまう可能性があるのは理解できよう。
また線状の劣化は、平坦な画像で特に目立ち易い。この線状の劣化を防ぐために、実施形態の予測モード設定部106は、平坦、かつ、画像がHDR画像もしくはLog画像のときに、イントラ予測に使用可能な予測モードを制限する、という動作を行う。具体的には、かかる条件となった場合、予測モード設定部106は、利用可能なイントラ予測モードとしてDC予測、およびPlanar予測に制限する。すなわち、方向性予測モードを全く使わないようにすることで、線状のノイズ発生を抑制する。なお、DC予測とは、符号化対象のブロックの各画素の予測値として、周囲の隣接ブロックのローカルデコード画素値の平均値を用いる手法である。また、Planar予測とは、H.264/AVCの平面予測と同様、隣接ブックにローカルデコード画素から平面近似より予測値を生成する手法である。なお、詳しくはHEVCの規格に示されているので、そちらを参照されたい。
以下、実施形態におけるイントラフレームにおける予測モードの決定処理を図6のフローチャートを参照して説明する。
S601にて、特徴検出部105は、制御部150の制御の下で、符号化対象のブロック画像を符号化フレームバッファ104より取得する。また、予測モード設定部106は、符号化対象のフレームがHDR画像かSDR画像かを示す情報、及び、Log画像かどうかの情報を取得する。
S602にて、特徴検出部105は、取得したブロック画像の特徴検出処理を行う。実施形態の特徴検出部105は、着目ブロック画像の分散値を検出し、着目ブロックが平坦か否かの判定を行う。
S603にて、予測モード設定部106は、制御部150の制御下にて、符号化を行う画像がHDR画像もしくはLog画像のいずれかであり、且つ、着目ブロック画像が平坦であるという条件を満たすか否かを判定する。予測モード設定部106は、この条件を満たすと判定した場合、処理をS604bに進める。このS604bにて、予測モード設定部106は、着目ブロックのイントラ予測に用いる全予測モード中、方向性予測モード(Angular予測モード)を利用不可として決定し、残りのDC予測モード及びPlanar予測モードのいずれかを用いてイントラ予測するよう、イントラ予測部107に設定する。
また、S603にて、予測モード設定部106が上記の条件を満たさないと判定した場合、処理をS604aに進める。このS604aにて、予測モード設定部106は、全予測モードが利用可として、イントラ予測部107に設定する。
S605にて、イントラ予測部107は、S604aまたS604bにて設定された予測モードの中から、予測誤差が最小となる予測モードを決定し、その差分画像を予測選択部109に供給する。
S606にて、制御部150は、符号化対象のフレームの最終ブロックの予測処理を終えたか否かを判定し、否と判定した場合には、後続するブロック画像の予測モードを決定するため、処理をS602に戻す。そして、制御部150は、符号化対象のフレームの最終ブロックの予測モードの決定処理を終えたと判断した場合は、本処理を終了する。
以上のように、符号化対象画像をイントラ符号化する場合において、その符号化対象画像がHDR画像もしくはLog画像で、かつ、符号化対象のブロック画像が平坦である場合には、方向性予測を用いないように制限をかけた上で予測モードを決定する。この結果、劣化の目立ちやすい平坦なブロックの線状のノイズの発生を防ぎ、画質劣化を抑制できるようになる。
上記実施形態では、動画像の符号化処理におけるイントラフレーム(イントラピクチャ)に着目して説明したが、HDR(又はLog)静止画画像に適用するようにしても良い。HDR静止画の場合、ユーザはその画像を注視し続けることになり、線状ノイズはより目立ち易いからである。ユーザは、操作部151を介して、HDR静止画撮影モードを選択できる。そして、HDR静止画撮影モードにて、ユーザがレリーズボタン(不図示)を押下した場合、静止画撮影で全ブロックの符号化を行っている間、制御部150は、予測選択部109を制御してイントラ予測部107からの差分画像を直交変換、量子化、及び、可変長符号化を行い、静止画の符号化データを生成し、HDR静止画のファイルを記録メディアに記録する。
[第2の実施形態]
上記第1の実施形態では、ブロック毎の画像の特徴として平坦の度合いを求める例を説明したが、本第2の実施形態では、平坦度に加え、輝度値の高さを加味して予測モードに制限をかける例を説明する。それ故、以下の説明では、第1の実施形態との差異についてのみ詳細に説明する。
本第2の実施形態における特徴検出部105は、上記の通り、平坦度合いに加え、ブロック全体の輝度値の高さの検出も行う。
図3に示すように、HDR画像やLog画像においては表示の際の入力画素値と出力値の関係がガンマカーブ301で規定されている。このカーブからわかるように、入力値が大きい部分、すなわち高輝度値領域(ハイライト領域)では、画素値の変化量に対して、実際に表示される輝度値の変化量が大きい。
したがって、輝度値の高い部分ほど符号化の際の画素値の劣化が増幅されることになる。かかる点に着目し、本第2の実施形態では、平坦度に加え、劣化が目立ち易い高輝度であることを更なる条件とする。
ブロックの輝度値の高さの検出方法としては、様々な方法が考えらえるが、ここではブロック内の画素の輝度値の平均値を算出するものとした。そして、高輝度ブロックか否かを判定するための閾値を決めておき、輝度平均値が閾値よりも大きい場合には、符号化対象のブロック画像は高輝度ブロックであると判定するものとする。そして、本第2の実施形態の特徴検出部105は、着目ブロックが平坦かどうかの判定結果に加え、着目ブロック画像が高輝度ブロックかどうかの判定結果も、予測モード設定部106に供給する。
予測モード設定部106は、イントラ符号化対象の画像がHDR画像、もしくはLog画像であり、且つ、符号化対象の着目ブロック画像が平坦、かつ高輝度のブロックであるという条件を満たす場合、イントラ予測に使用可能な予測モードを制限する。
本第2の実施形態では、予測モードの制限方法として、水平方向予測モードと垂直方向予測モードを使用しないように制限する。これは、水平方向予測モードと垂直方向予測モードは、方向性予測のなかでも特に線状の劣化が目立ちやすいからである。また、符号化効率を考えた場合、予測モードの制限する数は少ない方が望ましいからでもある。
本第2の実施形態におけるイントラフレームにおける予測モードの決定処理を図7のフローチャートを参照して説明する。
S701にて、特徴検出部105は、制御部150の制御の下で、符号化対象のブロック画像を符号化フレームバッファ104より取得する。また、予測モード設定部106は、符号化対象のフレームがHDR画像かSDR画像かを示す情報、及び、Log画像かどうかの情報を取得する。
S702にて、特徴検出部105は、取得したブロック画像の特徴検出処理を行う。実施形態の特徴検出部105は、着目ブロック画像の分散値を検出し、着目ブロックが平坦か否かの判定を行う。更に、特徴検出部105は、着目ブロック画像の輝度平均値を求め、高輝度か否かを判定するための閾値と比較し、輝度平均値が閾値以上の場合に着目ブロックが高輝度ブロックであると判定する。
S703にて、予測モード設定部106は、制御部150の制御下にて、符号化を行う画像がHDR画像もしくはLog画像のいずれかであり、且つ、着目ブロックが平ブロックであり、且つ、高輝度ブロックであるという条件を満たすか否かを判定する。予測モード設定部106は、この条件を満たすと判定した場合、処理をS704bに進める。このS704bにて、予測モード設定部106は、HEVCにおけるイントラ予測では、着目ブロックのイントラ予測に用いる35個の予測モード中、水平方向予測モードと垂直方向予測モードの2つを利用不可として決定し、残りの33個の予測モードのいずれかを用いてイントラ予測するよう、イントラ予測部107に設定する。なお、VVCにおけるイントラ予測では、着目ブロックのイントラ予測に用いる67個の予測モード中、水平方向予測モードと垂直方向予測モードの2つを利用不可として決定し、残りの65個の予測モードのいずれかを用いてイントラ予測するよう、イントラ予測部107に設定する。
また、S703にて、予測モード設定部106が上記の条件を満たさないと判定した場合、処理をS704aに進める。このS704aにて、予測モード設定部106は、全予測モードが利用可として、イントラ予測部107に設定する。
S705にて、イントラ予測部107は、S704aまたS704bにて設定された予測モードの中から、予測誤差が最小となる予測モードを決定し、その差分画像を予測選択部109に供給する。
S706にて、制御部150は、符号化対象のフレームの最終ブロックの予測処理を終えたか否かを判定し、否と判定した場合には、後続するブロック画像の予測モードを決定するため、処理をS702に戻す。そして、制御部150は、符号化対象のフレームの最終ブロックの予測モードの決定処理を終えたと判断した場合は、本処理を終了する。
以上説明したように、本第2の実施形態によれば、画像情報を取得し、ブロックごとに画像の特徴の検出を行い、HDR画像、もしくはLog画像で、かつ着目ブロックが表す画像が平坦かつ高輝度である場合に、水平予測モードと垂直予測モードを利用不可とすることで、イントラ予測の予測方向に制限をかける。この結果、劣化の目立ちやすいブロックに対して線状の劣化を防ぐことができ、且つ、第1の実施形態と比較して、生成される符号量をより少なくできるようになる。
なお、符号化効率をある程度犠牲にしても良い場合には、第1の実施形態と同様、33個の方向性予測モードを利用不可に設定しても良い。制限対象を、水平方向予測と垂直方向予測の2つに限るのか、全方向性予測モードとするかは、ユーザが不図示の操作部から選択するようにしても構わない。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
101…レンズ、102…撮像部、103…現像処理部、104…符号化フレームバッファ、105…特徴検出部、106…予測モード設定部、107…イントラ予測部、108…インター予測部、109…予測選択部、110…直交変換部、111…量子化部、112…量子化制御部

Claims (13)

  1. 方向性予測モードを含む複数のイントラ予測モードのうちいずれかを用いて画像を符号化する画像符号化装置であって、
    画像データにおける符号化対象のブロックが所定の特徴を有するか否かを判定する判定手段と、
    前記画像データが高ダイナミックレンジの画像データであり、且つ、前記判定手段により前記ブロックが前記所定の特徴を有すると判定された場合、前記ブロックに対する利用可能なイントラ予測モードを制限する制限手段と
    を有することを特徴とする画像符号化装置。
  2. 前記判定手段は、前記ブロックが表す画像が平坦な画像である場合に前記所定の特徴を有すると判定することを特徴とする請求項1に記載の画像符号化装置。
  3. 前記判定手段は、前記ブロック内の画素値の分散値を算出し、当該分散値が予め設定された閾値以下である場合、前記ブロックが表す画像が平坦な画像であると判定することを特徴とする請求項1に記載の画像符号化装置。
  4. 前記制限手段は、複数のイントラ予測モードにおいて、方向性予測モードを利用不可に設定することを特徴とする請求項1乃至3のいずれか1項に記載の画像符号化装置。
  5. 前記判定手段は、前記ブロックが表す画像が平坦でかつ高輝度の画像である場合に前記所定の特徴を有すると判定することを特徴とする請求項1に記載の画像符号化装置。
  6. 前記判定手段は、前記ブロック内の画素の輝度値の平均値と分散値とを算出し、前記分散値が第1の閾値以下であり、且つ、前記平均値が第2の閾値以上である場合に、前記ブロックが表す画像が平坦でかつ高輝度の画像であると判定することを特徴とする請求項5に記載の画像符号化装置。
  7. 前記制限手段は、複数のイントラ予測モードにおける垂直、水平方向の方向性予測モードを利用不可に設定することを特徴とする請求項1、4乃至6のいずれか1項に記載の画像符号化装置。
  8. 前記高ダイナミックレンジの画像データは、Log画像データを含むことを特徴とする請求項1乃至7のいずれか1項に記載の画像符号化装置。
  9. 前記制限手段の制限の下で、前記画像データの全ブロックについて、イントラ予測モードで得られる予測画像との差分を示す差分画像を、直交変換、量子化、及び、可変長符号化を行うことで、静止画の符号化データを生成する符号化手段を更に有することを特徴とする請求項1乃至8のいずれか1項に記載の画像符号化装置。
  10. 前記既に符号化済みのフレームが表すローカルデコード画像を記憶するためのバッファと、
    該バッファを参照して前記ブロックが示す画像の予測画像との差分を示す差分画像を生成するインター予測手段と、
    前記制限手段の制限の下で、前記ブロックが示す画像の予測画像との差分を示す差分画像を生成するイントラ予測手段と、
    前記インター予測手段、前記イントラ予測手段からの差分画像のいずれかを選択し、直交変換、量子化、及び、可変長符号化を行うことで、符号化データを生成する符号化手段と
    を更に有することを特徴とする請求項1乃至8のいずれか1項に記載の画像符号化装置。
  11. 撮像手段を更に有し、当該撮像手段で得た画像データを符号化対象とすることを特徴とする請求項1乃至10のいずれか1項に記載の画像符号化装置。
  12. 方向性予測モードを含む複数のイントラ予測モードのうちいずれかを用いて画像を符号化する画像符号化装置の制御方法であって、
    画像データにおける符号化対象のブロックが所定の特徴を有するか否かを判定する判定工程と、
    前記画像データが高ダイナミックレンジの画像データであり、且つ、前記判定手段により前記ブロックが前記所定の特徴を有すると判定された場合、前記ブロックに対する利用可能なイントラ予測モードを制限する制限工程と
    を有することを特徴とする画像符号化装置の制御方法。
  13. コンピュータが読み込み実行することで、前記コンピュータに、請求項1乃至11のいずれか1項に記載の画像符号化装置の各手段として機能させるためのプログラム。
JP2019037776A 2019-03-01 2019-03-01 画像符号化装置及びその制御方法及びプログラム Active JP7256658B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019037776A JP7256658B2 (ja) 2019-03-01 2019-03-01 画像符号化装置及びその制御方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019037776A JP7256658B2 (ja) 2019-03-01 2019-03-01 画像符号化装置及びその制御方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2020141378A true JP2020141378A (ja) 2020-09-03
JP2020141378A5 JP2020141378A5 (ja) 2022-03-09
JP7256658B2 JP7256658B2 (ja) 2023-04-12

Family

ID=72280663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019037776A Active JP7256658B2 (ja) 2019-03-01 2019-03-01 画像符号化装置及びその制御方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7256658B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023286314A1 (ja) * 2021-07-16 2023-01-19 ソニーグループ株式会社 撮像装置および撮像方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05316360A (ja) * 1992-05-14 1993-11-26 Fuji Xerox Co Ltd 画像信号の符号化復号装置
JP2007142771A (ja) * 2005-11-17 2007-06-07 Sharp Corp 画像処理方法、画像処理装置、画像形成装置及びコンピュータプログラム
JP2009525637A (ja) * 2006-01-31 2009-07-09 トムソン ライセンシング ビデオ符号化器及びビデオ復号化器における削減分解能更新モード及び計算量スケーラビリティのための条件付き予測の方法及び装置
JP2015080004A (ja) * 2012-01-30 2015-04-23 三菱電機株式会社 カラー動画像符号化装置、カラー動画像復号装置、カラー動画像符号化方法及びカラー動画像復号方法
JP2018101863A (ja) * 2016-12-19 2018-06-28 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
WO2018208349A1 (en) * 2017-05-09 2018-11-15 Google Llc Directional intra-prediction coding

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05316360A (ja) * 1992-05-14 1993-11-26 Fuji Xerox Co Ltd 画像信号の符号化復号装置
JP2007142771A (ja) * 2005-11-17 2007-06-07 Sharp Corp 画像処理方法、画像処理装置、画像形成装置及びコンピュータプログラム
JP2009525637A (ja) * 2006-01-31 2009-07-09 トムソン ライセンシング ビデオ符号化器及びビデオ復号化器における削減分解能更新モード及び計算量スケーラビリティのための条件付き予測の方法及び装置
JP2015080004A (ja) * 2012-01-30 2015-04-23 三菱電機株式会社 カラー動画像符号化装置、カラー動画像復号装置、カラー動画像符号化方法及びカラー動画像復号方法
JP2018101863A (ja) * 2016-12-19 2018-06-28 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
WO2018208349A1 (en) * 2017-05-09 2018-11-15 Google Llc Directional intra-prediction coding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023286314A1 (ja) * 2021-07-16 2023-01-19 ソニーグループ株式会社 撮像装置および撮像方法

Also Published As

Publication number Publication date
JP7256658B2 (ja) 2023-04-12

Similar Documents

Publication Publication Date Title
JP6158998B2 (ja) 映像復号化装置
JP6084735B2 (ja) 映像復号化装置
JP5982612B2 (ja) イントラ予測モード復号化方法
US8199818B2 (en) Intra prediction system of video encoder and video decoder
JP4650173B2 (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
US8780994B2 (en) Apparatus, method, and computer program for image encoding with intra-mode prediction
WO2008020687A1 (en) Image encoding/decoding method and apparatus
KR20070077609A (ko) 인트라 예측 모드 결정 방법 및 장치
JP2014075652A (ja) 画像符号化装置及び方法
JP7256658B2 (ja) 画像符号化装置及びその制御方法及びプログラム
JP7229682B2 (ja) ループフィルタ制御装置、画像符号化装置、画像復号装置、及びプログラム
JP5171658B2 (ja) 画像符号化装置
JP2022158242A (ja) 符号化装置及び方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220301

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230331

R151 Written notification of patent or utility model registration

Ref document number: 7256658

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151