JP6822122B2 - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP6822122B2
JP6822122B2 JP2016245999A JP2016245999A JP6822122B2 JP 6822122 B2 JP6822122 B2 JP 6822122B2 JP 2016245999 A JP2016245999 A JP 2016245999A JP 2016245999 A JP2016245999 A JP 2016245999A JP 6822122 B2 JP6822122 B2 JP 6822122B2
Authority
JP
Japan
Prior art keywords
image
unit
transfer function
image processing
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016245999A
Other languages
English (en)
Other versions
JP2018101866A5 (ja
JP2018101866A (ja
Inventor
孝明 渕江
孝明 渕江
広瀬 正樹
正樹 広瀬
敦雄 矢田
敦雄 矢田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2016245999A priority Critical patent/JP6822122B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to CN201780076637.0A priority patent/CN110050463A/zh
Priority to PCT/JP2017/037597 priority patent/WO2018116604A1/ja
Priority to KR1020197016935A priority patent/KR20190097012A/ko
Priority to BR112019011922-1A priority patent/BR112019011922A2/pt
Priority to US16/468,954 priority patent/US20190349581A1/en
Priority to EP17885012.9A priority patent/EP3557868B1/en
Publication of JP2018101866A publication Critical patent/JP2018101866A/ja
Publication of JP2018101866A5 publication Critical patent/JP2018101866A5/ja
Application granted granted Critical
Publication of JP6822122B2 publication Critical patent/JP6822122B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Description

本開示は、画像処理装置、画像処理方法及びプログラムに関する。
従来、映像を効率的に符号化するための多くの映像符号化方式が標準化されている。例えば、ITU−T及びISO/IECが共同で開発したH.264/AVC(Advanced Video Coding)は、MPEG−2の後継の標準符号化方式である(非特許文献1参照)。H.264/AVCは、予測、直交変換、量子化及びエントロピー符号化といった様々な要素技術を用いて、改善された符号化効率で画像信号をビットストリームへと符号化する。さらに、H.264/AVCの後継の標準符号化方式であるH.265/HEVC(High Efficiency Video Coding)は、MPEG−2と比較すると約4倍、H.264/AVCと比較すると約2倍の符号化効率を達成すると言われている(非特許文献2参照)。
高い符号化効率を追求することとは別に、近年、実世界の様子をより忠実に再現し又はより豊富な明るさ及び色彩で映像を表示することを可能とするための、映像信号表現の拡張が進められている。HDR(High Dynamic Range)は、従来の標準的なダイナミックレンジであるSDR(Standard Dynamic Range)よりも広い輝度ダイナミックレンジで画像又は映像を表現しようとする概念である。例えば、HLG(Hybrid Log-Gamma)、ST2084又はS−Log3といった伝達関数(トーンカーブともいう)で光を画像信号へと変換(及び、画像信号を光へと変換)することにより、100nitよりも高い輝度を有する実世界の光をディスプレイ上で再現することが可能となることが知られている(HLGについては非特許文献3参照)。他の例として、ITU−Rにより標準化されたBT.2020は、これまで多くのアプリケーションで使用されてきたBT.709の色域と比較して、より鮮やかな色彩を表現することを可能とする色域を定義している。
ITU-T, "H.264: Advanced video coding for generic audiovisual services", ITU-T Recommendation H.264, 2007年11月 ITU-T, "H.265: High efficiency video coding", ITU-T Recommendation H.265, 2014年10月 Association of Radio Industries and Businesses,"ESSENTIAL PARAMETER VALUES FOR THE EXTENDED IMAGE DYNAMIC RANGE TELEVISION (EIDRTV) SYSTEM FOR PROGRAMME PRODUCTION ARIB STANDARD",ARIB STD-B67 Version 1.0,July 3, 2015,[online],[2016年11月24日検索],インターネット<URL: http://www.arib.or.jp/english/html/overview/doc/2-STD-B67v1_0.pdf>
映像(若しくは映像を構成する個々の画像)の符号化、復号、又は撮像若しくは再生の際の信号変換、に関与する既存の装置は、多様化しつつある映像信号表現に必ずしも十分に適応できていない。静止画の画像処理についても同様の状況が考えられる。
信号表現の方式に関わらず、良好な画質を提供することのできる仕組みが提供されることが望ましい。
本開示によれば、光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、前記伝達関数に基づいて、前記符号化部において前記画像の各部分領域に割り当てられる符号量を制御する制御部と、を備える画像処理装置が提供される。
また、本開示によれば、光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化することと、前記伝達関数に基づいて、前記符号化の際に前記画像の各部分領域に割り当てられる符号量を制御することと、を含む画像処理方法が提供される。
また、本開示によれば、画像処理装置のプロセッサを、光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、前記伝達関数に基づいて、前記符号化部において前記画像の各部分領域に割り当てられる符号量を制御する制御部と、として機能させるためのプログラムが提供される。
また、本開示によれば、100nitより高い輝度での表示を可能とするための光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、前記符号化部において前記画像の各部分領域に割り当てられる符号量を、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御する制御部と、を備える画像処理装置が提供される。
また、本開示によれば、100nitより高い輝度での表示を可能とするための光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化することと、前記符号化の際に前記画像の各部分領域に割り当てられる符号量を、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御することと、を含む画像処理方法が提供される。
また、本開示によれば、画像処理装置のプロセッサを、100nitより高い輝度での表示を可能とするための光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、前記符号化部において前記画像の各部分領域に割り当てられる符号量を、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御する制御部と、として機能させるためのプログラムが提供される。
また、本開示によれば、光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、前記伝達関数に基づいて、前記符号化部において前記画像を符号化する際のモード選択のための予測残差符号量又はモード符号量を制御する制御部と、を備える画像処理装置が提供される。
また、本開示によれば、光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化することと、前記伝達関数に基づいて、前記画像を符号化する際のモード選択のための予測残差符号量又はモード符号量を制御することと、を含む画像処理方法が提供される。
また、本開示によれば、画像処理装置のプロセッサを、光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、前記伝達関数に基づいて、前記符号化部において前記画像を符号化する際のモード選択のための予測残差符号量又はモード符号量を制御する制御部と、として機能させるためのプログラムが提供される。
本開示に係る技術によれば、信号表現の方式に関わらず、良好な画質を提供することができる。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果と共に、又は上記の効果に代えて、本明細書に示されたいずれかの効果、又は本明細書から把握され得る他の効果が奏されてもよい。
SDR映像の輝度ダイナミックレンジについて説明するための説明図である。 HDR映像の輝度ダイナミックレンジについて説明するための説明図である。 SDR映像の画像信号のコーデック歪みについて説明するための説明図である。 HDR映像の画像信号のコーデック歪みについて説明するための説明図である。 HDR−SDR変換を経て拡大されるコーデック歪みについて説明するための説明図である。 SDR用の信号フォーマット及びHDR用の信号フォーマットのOETFの例を示す説明図である。 SDR用のBT.709に対してHDR用のS−Log3が画像情報をどの程度圧縮しているかを表すグラフを示している。 BT.709及びBT.2020により定義されている色域について説明するための説明図である。 一実施形態に係る画像処理システムの構成の第1の例を示す説明図である。 一実施形態に係る画像処理システムの構成の第2の例を示す説明図である。 第1の実施形態に係る画像処理装置の概略的な構成の第1の例を示すブロック図である。 第1の実施形態に係る画像処理装置の概略的な構成の第2の例を示すブロック図である。 第1の実施形態に係る制御部及び符号化部の詳細な構成の一例を示すブロック図である。 高輝度部分を保護するための保護比の第1の例について説明するための説明図である。 高輝度部分を保護するための保護比の第2の例について説明するための説明図である。 高色差部分として保護されるべき符号値について説明するための説明図である。 高色差部分を保護するための保護比の一例について説明するための説明図である。 第1の実施形態に係る符号化制御処理の流れの一例を示すフローチャートである。 高輝度部分の階調を保護するための量子化制御処理の流れの一例を示すフローチャートである。 高色差部分の階調を保護するための量子化制御処理の流れの一例を示すフローチャートである。 高輝度部分及び高色差部分の双方の階調を保護するための量子化制御処理の流れの一例を示すフローチャートである。 第1の実施形態に係る画像処理装置の構成の一変形例を示すブロック図である。 図14を用いて説明した変形例に係る符号化制御処理の流れの一例を示すフローチャートである。 モード選択への伝達関数の違いの影響について説明するための第1の説明図である。 モード選択への伝達関数の違いの影響について説明するための第2の説明図である。 第2の実施形態に係る画像処理装置の概略的な構成の第1の例を示すブロック図である。 第2の実施形態に係る画像処理装置の概略的な構成の第2の例を示すブロック図である。 第2の実施形態に係る制御部及び符号化部の詳細な構成の一例を示すブロック図である。 伝達関数の種別に基づくモード符号量の切り替えの一例について説明するための説明図である。 第2の実施形態に係る符号化制御処理の流れの一例を示すフローチャートである。 装置のハードウェア構成の一例を示すブロック図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、以下の順序で説明を行う。
1.関連技術の説明
1−1.SDR及びHDR
1−2.コーデック歪み
1−3.伝達関数
1−4.色域
2.第1の実施形態
2−1.導入
2−2.システムの概要
2−3.画像処理装置の概略的な構成
2−4.符号化部及び制御部の詳細な構成
2−5.処理の流れ
2−6.変形例
2−7.第1の実施形態のまとめ
3.第2の実施形態
3−1.導入
3−2.システムの概要
3−3.画像処理装置の概略的な構成
3−4.符号化部及び制御部の詳細な構成
3−5.処理の流れ
3−6.第2の実施形態のまとめ
4.ハードウェア構成例
5.総括
<1.関連技術の説明>
[1−1.SDR及びHDR]
近年、実世界の様子をより忠実に再現し又はより豊富な明るさ及び色彩で映像を再生することを可能とするための、映像信号表現の拡張が進められている。HDRは、従来の標準的なダイナミックレンジであるSDRよりも広い輝度ダイナミックレンジで画像又は映像を表現しようとする概念である。
図1Aは、SDR映像の輝度ダイナミックレンジについて説明するための説明図である。図1Aの縦軸は輝度[nit]を表す。自然界の最大輝度は20000nitに達することがあり、一般的な被写体の輝度は例えば最大で12000nit程度である。イメージセンサのダイナミックレンジの上限は、自然界の最大輝度よりも低く、例えば4000nitであり得る。デジタルカメラ又はデジタルカムコーダといった撮像装置は、イメージセンサにおいて入射光を光電変換することにより生成される電気信号を、イメージセンサの後段の信号処理回路において例えば10ビットのデジタル画像信号へと変換する。旧来のSDR映像の信号フォーマットでは、こうした変換の際に100nitを上回る高輝度部分の階調が失われる。撮像装置により生成されたデジタル画像信号は、例えば伝送又は記録といったアプリケーションの目的に応じて、所定の映像符号化方式(ビデオコーデックともいう)で符号化され、符号化ビットストリームへと変換される。そして、SDR映像を表示する際には、符号化ビットストリームを復号することにより取得されるデジタル画像信号が表示装置へと提供され、上限100nitの表示輝度で映像が再生される。
図1Bは、HDR映像の輝度ダイナミックレンジについて説明するための説明図である。SDRのケースと同様に、撮像装置は、イメージセンサへの入射光をアナログ電気信号へと変換し、さらにアナログ電気信号を例えば10ビットのデジタル画像信号へと変換する。HDR映像の信号フォーマットは、こうした変換の際に、100nitを上回る高輝度部分の階調を維持し、数百又は数千nitという上限までの輝度で映像を再生することを可能とする。撮像装置により生成されたデジタル画像信号は、やはりアプリケーションの目的に応じて所定の映像符号化方式で符号化され、符号化ビットストリームへと変換される。HDR映像を表示する際には、符号化ビットストリームを復号することにより取得されるデジタル画像信号が表示装置へと提供され、100nitより高い表示輝度を含む輝度ダイナミックレンジで映像が再生される。
なお、SDRとHDRとを分類する基準として、ここでは輝度ダイナミックレンジの上限が100nitに等しいか又はそれを下回るケースをSDR、上限が100nitを上回るケースをHDRと仮定している。しかしながら、将来のある時点において、100nitではなくより高い基準値によって、その時点で普及している(即ち、標準的となった)ダイナミックレンジと、より新しい(より高い上限を有する)ダイナミックレンジとがそれぞれHDR及びSDRとして分類されることがあってもよい。本開示に係る技術は、概して、2種類のダイナミックレンジが互いに異なる上限を有するケースに広く適用可能であり、それらダイナミックレンジがどういった基準値によって分類されるかには限定されない。SDRは、HDRとの対比において、LDR(Low Dynamic Range)と呼ばれることもある。
[1−2.コーデック歪み]
SDR映像かHDR映像かに関わらず、画像信号を非可逆圧縮を含む映像符号化方式で符号化すると、復号される画像信号に基づいて再生される画像に、画質の劣化が生じる。こうした画質の劣化を、本明細書ではコーデック歪みという。コーデック歪みの度合いは、PSNR(Peak Signal-to-Noise Ratio)という指標で評価され得る。概して、符号化効率を同等とした場合、H.264/AVCで符号化/復号された画像の画質は、MPEG−2で符号化/復号された画像の画質よりも高く、H.265/HEVCで符号化/復号された画像の画質はH.264/AVCよりも高い。しかしながら、通常、コーデック歪みの評価は、エンコーダへ入力される原画像とデコーダから出力される復号画像とを比較することにより行われる。HDR映像の撮像若しくは表示の際に行われる信号変換、又はダイナミックレンジの縮減若しくは拡張がコーデック歪みにどのように作用するかは、あまり知られていない。
発明者らは、多数のサンプル映像をHDR用の信号フォーマットで画像信号へと変換し、H.264/AVCに準拠するエンコーダ及びデコーダによる符号化及び復号の後に、復号後の画像信号から再生されるHDR映像の画質を検証する実験を行った。その結果、同一のサンプルでSDR映像では感知されなかった画質の劣化が、ビデオコーデックを経たHDR映像において視認されるケースがあることが認識された。画質の劣化は、主にブロックノイズ又はモスキートノイズといった形で、画像全体に散在すると共に、画像内の一部分において顕著に生じていた。
同じ10ビットの画像信号を同じ映像符号化方式で符号化する際に生じる劣化の度合いは、通常は同程度である。それでもSDR映像では感知されない(又は感知されにくい)歪みがHDR映像において検出されたのは、復号後の画像信号のダイナミックレンジを拡張する際にコーデック歪みが一緒に拡大されたからであると考えられる。
図2Aには、SDR映像の画像信号に、符号化及び復号を経てコーデック歪みが生じる様子が示されている。コーデック歪みはSDR映像を再生する際には拡大されないため、歪みが十分に小さければ主観的に歪みが感知されることはない。一方、図2Bには、HDR映像の画像信号にやはりコーデック歪みが生じる様子が示されている。HDR映像を再生する際には、ダイナミックレンジの拡張に伴ってコーデック歪みが拡大される結果、ブロックノイズ又はモスキートノイズといった画質の劣化が主観的に感知される可能性が高まる。
コーデック歪みは、HDR用の信号フォーマットで表現されている画像信号についてHDRからSDRへのフォーマット変換が実行される際にも拡大され得る。図2Cには、HDRからSDRへのフォーマット変換、即ちHDR−SDR変換を経てコーデック歪みが拡大される様子が示されている。HDR−SDR変換は、概して、HDR用の信号フォーマットに対応する伝達関数の逆関数で(例えば符号化ビットストリームを復号することにより得られる)画像信号をイメージセンサの出力に相当する原信号へと復元する処理と、復元された原信号からSDR用の信号フォーマットに対応する伝達関数でSDR用の画像信号へと再変換する処理とを含む。これら処理のうちの前者において拡大されたコーデック歪みは、SDR用の信号フォーマットへの再変換において縮小されない。そのため、HDR−SDR変換後の画像信号に基づいてSDR映像を再生すると、拡大されたコーデック歪みが主観的に感知される結果となり得る。
上述したようなコーデック歪みが、映像符号化方式自体の性能に起因するのであれば、歪みは均一に生じるはずである。しかし、上述したサンプル映像の検証では、画像全体に散在する歪みに加えて、以下に例示するような特徴的な部分領域において歪みが顕著となっていることが確認された:
−輝度の高い領域(例えば、空の中の雲)
−色の鮮やかな領域(例えば、赤色又は青色に光るランプ)
これらの部分領域において歪みが顕著となる原因は、HDR用の信号フォーマットの信号伝達関数に関連する。
[1−3.伝達関数]
一般に、撮像装置における光から画像信号への信号変換の特性は、OETF(Opto-Electronic Transfer Function;光電気伝達関数)でモデル化される。図3は、典型的なSDR用の信号フォーマットのOETF及びHDR用の信号フォーマットのOETFのそれぞれの例を示している。図3において、横軸は、変換前の光の輝度ダイナミックレンジを表し、100%が100nitの輝度に相当する。縦軸は、変換後の画像信号の符号値を表し、10bitの場合には符号値は0から1023までの値をとり得る。図中に破線で示したSDR用の信号フォーマット(例えば、BT.709)のOETFと実線で示したHDR用のOETF(例えば、HLG、ST2084又はS−Log3)とを比較すると、特に符号値が相対的に大きい部分において伝達関数の傾きの違いが顕著である。これは、こうした部分において、HDRのケースではSDRと比較して画像情報がより高い圧縮比で圧縮されていること、即ち符号値の同程度の変化がHDRのケースではSDRのケースよりも大きい階調の変化を表すことを意味している。RGB表色系において赤色(R)成分、緑色(G)成分及び青色(B)成分の各々の伝達関数を解析した場合にも、図3に示したグラフに類似したHDRとSDRとの間の信号伝達特性の違いが確認された。
図4は、SDR用のBT.709に対してHDR用のS−Log3が画像情報をどの程度圧縮しているかを表すグラフを示している。図4の横軸は、10ビットの画像信号の符号値を表す。縦軸は、BT.709の圧縮比に対するS−Log3の圧縮比の比率を表す。輝度ダイナミックレンジの100%に相当するS−Log3の符号値“600”付近において、S−Log3の圧縮比はBT.709の圧縮比に対して約4倍であり、符号値が大きくなるほどS−Log3の圧縮比は相対的により高くなっている。このグラフからも、符号値が相対的に大きい部分において、HDRのケースではSDRのケースと比較して画像情報がより強く圧縮されることが理解される。
HDR映像を再生する際には、多くの場合、図3に実線で示したようなOETFの逆関数であるEOTF(Electro-Optical Transfer Function;電気光伝達関数)を画像信号の符号値に適用することにより、表示素子へ供給すべき電圧レベルが決定され得る。そして、HDR映像を構成する個々の画像が、EOTFの適用によって拡張された輝度ダイナミックレンジで表示される。撮像から表示までを含むシステム全体の伝達関数をOOTFといい、OOTFはシステムガンマと呼ばれることもある。本明細書において、「伝達関数」とは、特段の言及の無い限り、OETF、EOTF及びOOTFのいずれか1つ又は2つ以上の組合せをいう。これら伝達関数は、トーンカーブと呼ばれることもある。
[1−4.色域]
実世界の様子をより忠実に再現し又はよりリッチな映像表現を可能とする技術として、HDRと共に色域もまた重要な概念である。ITU−Rにより標準化されたBT.2020は、これまで多くのアプリケーションで使用されてきたBT.709の色域と比較して、より鮮やかな色彩を表現することを可能とする色域を定義している。図5は、BT.709及びBT.2020により定義されている色域について説明するための説明図である。図5を参照すると、所定の拘束条件を用いて3次元の色空間を2次元平面へマッピングした色域グラフが示されている。グラフ中の十字マークは、白色がマッピングされる位置を示す。グラフ中の破線は、BT.709に従って表現することのできる色の範囲を示す。グラフ中の実線は、BT.2020に従って表現することのできる色の範囲を示す。グラフ中の点線は、人間の視覚が識別することのできる色の範囲を示す。図5から理解されるように、BT.2020は、BT.709よりも多彩な色を表現することを可能とする。BT.709が実世界に存在する色の約75%を表現可能であるのに対し、BT.2020は99%以上の色を表現可能であると言われている。BT.2020は、SDR映像の色域として利用されてもよく、又はHDR映像の色域として利用されてもよい。
<2.第1の実施形態>
[2−1.導入]
HDR用の信号フォーマットを用いた場合に画像内の部分領域において顕著となる上述したコーデック歪みのうちのいくつかは、特に画像信号の各色成分のダイナミックレンジのうち相対的に大きい符号値に対応するサブレンジにおいて、原信号の階調を表現するための割り当て符号量が不足することを原因としている。MPEG−2、H.264/AVC又はH.265/HEVCといった映像符号化方式に準拠するエンコーダは、所要の圧縮率を達成するために、画像信号を周波数ドメインにおいて量子化する。通常は、イントラ予測又はインター予測といった予測技術を適用した後の予測残差を直交変換することにより得られる変換係数が量子化される。しかし、SDR映像の符号化のために最適化されたそれらエンコーダにより使用される量子化ステップは、HDR用の信号フォーマットが使用される場合にはしばしば大き過ぎる。これは、大きい符号値に対応するサブレンジにおいて、既に信号変換の際に階調情報が(SDRのケースよりも)強く圧縮されているという事実を、既存のエンコーダが考慮していないからである。
そこで、本節では、HDR用の信号フォーマットが使用される場合に画像内で階調が強く圧縮されている部分領域により多くの符号量を割り当てて階調を良好に保全し、画質の劣化を軽減するための実施形態について説明する。
[2−2.システムの概要]
図6Aは、本実施形態に係る画像処理システムの構成の第1の例を示す説明図である。図6Aに示した画像処理システム10aは、撮像装置11、信号処理装置14、及びサーバ装置15を含む。
撮像装置11は、例えば、デジタルビデオカメラ若しくはデジタルスチルカメラ、又は映像撮影機能を有する任意の種類の装置(例えば、監視カメラ、Webカメラ又は情報端末など)であってよい。撮像装置11は、イメージセンサを用いて実世界の様子を撮影して、原始的な画像信号を生成する。信号処理装置14は、例えばBPU(Baseband Processing Unit)であってよく、撮像装置11と接続される。信号処理装置14は、撮像装置11により生成された原始的な画像信号についてAD変換及びデジタル信号処理を実行し、所定の信号フォーマットで画像信号を生成する。信号処理装置14により実行されるデジタル信号処理は、例えばガンマ補正及び色変換を含み得る。信号処理装置14は、撮像装置11と一体的に構成されてもよい。
撮像装置11へ入射する光から信号処理装置14により生成される画像信号への信号変換の特性は、OETFにより表される。例えば、信号処理装置14は、何らかのユーザインタフェースを介してユーザにより複数の候補から選択される伝達関数(又は信号フォーマット)で画像信号を生成してもよい。一例として、複数の候補は、1つのSDR用の信号フォーマット(例えば、BT.709)と1つのHDR用の信号フォーマット(例えば、BT.2020と、HLG又はS−Log3との組合せ)とを含んでもよい。他の例として、複数の候補は、複数のHDR用の信号フォーマットを含んでもよい。一変形例として、信号処理装置14は、単一のHDR用の信号フォーマットのみで画像信号を生成可能であってもよい。
信号処理装置14は、信号変換の結果として生成される画像信号に、必要に応じて音声信号及びメタデータを含む補助信号を多重化し、多重化されたそれら信号をサーバ装置15へと出力する。サーバ装置15は、例えばSDI(Serial Digital Interface)又はHD−SDIなどの伝送プロトコルに準拠する信号線を介して信号処理装置14と接続される画像処理装置である。サーバ装置15は、信号処理装置14から送信される画像信号を取得し、所定の映像符号化方式で画像を符号化して符号化ビットストリーム17aを生成する。符号化ビットストリーム17aは、サーバ装置15の内部若しくは外部の記憶装置に記憶されてもよく、又はサーバ装置15へ接続される他の装置(例えば、表示装置)へ伝送されてもよい。
図6Bは、本実施形態に係る画像処理システムの構成の第2の例を示す説明図である。図6Bに示した画像処理システム10bは、撮像装置12、記憶装置13、及び端末装置16を含む。
撮像装置12は、例えば、デジタルビデオカメラ、デジタルカムコーダ若しくはデジタルスチルカメラ、又は映像撮影機能を有する任意の種類の装置であってよい。撮像装置12は、イメージセンサを用いて実世界の様子を撮影して、原始的な画像信号を生成する。また、撮像装置12は、AD変換と、信号処理装置14に関連して上で説明したようなデジタル信号処理とを実行し、所定の信号フォーマットで画像信号を生成する。撮像装置12は、信号処理装置14と同様に、何らかのユーザインタフェースを介してユーザにより複数の候補から選択される伝達関数で画像信号を生成してもよく、又は、単一のHDR用の伝達関数のみで画像信号を生成可能であってもよい。
撮像装置12は、信号変換の結果として生成される画像信号に基づき、所定の映像符号化方式で画像を符号化して、符号化ビットストリーム17bを生成する。符号化ビットストリーム17bは、例えば、映像ファイルとして記憶されてもよく、又はネットワークを介して記憶装置13若しくは端末装置16へ提供されてもよい。
記憶装置13は、様々な映像データを記憶するデータストレージである。記憶装置13は、例えば、所定の映像符号化方式で画像を符号化することにより生成された映像ファイル17cを記憶してもよい。映像ファイルのヘッダ領域には、例えば、映像ファイルに含まれる映像コンテンツに適用された光と画像信号との間の変換に関する伝達関数の種別、色域の種別、及び映像符号化方式をそれぞれ識別するパラメータが含められ得る。記憶装置13は、符号化前(又は信号変換前)の画像信号をRAWデータとして記録するRAW映像ファイル18を記憶してもよい。記憶装置13は、例えば端末装置16からのリクエストに応じて、ユーザが再生し又は編集することを望むファイルをネットワークを介して端末装置16へと提供する。
端末装置16は、撮像装置12により生成され又は記憶装置13により記憶されている映像ファイルを再生し又は編集する機能を有する画像処理装置である。端末装置16は、例えば、撮像装置12又は記憶装置13から取得される映像ファイル17b又は17cに含まれる符号化ビットストリームを復号して復号画像信号を生成してもよい。また、端末装置16は、そのように生成される復号画像についてダイナミックレンジ変換(例えば、HDR−SDR変換又はSDR−HDR変換)を実行してもよい。さらに、端末装置16は、RAW映像ファイル18に含まれる画像信号、又はダイナミックレンジ変換後の復号画像信号を所定の映像符号化方式で符号化して、符号化ビットストリーム17dを生成してもよい。
図6Aの例におけるサーバ装置15、並びに図6Bの例における撮像装置12及び端末装置16は、いずれも画像を符号化する画像処理装置(即ち、エンコーダ)としての機能を有する。本実施形態では、これら画像処理装置が画像を符号化する際に、伝達関数に基づいて(例えば、伝達関数の種別又は他の属性に基づいて)画像の各部分領域に割り当てられる符号量を制御することにより、HDR用の信号フォーマットが使用される場合の画質の劣化を軽減する。次項より、そうした画像処理装置の具体的かつ例示的な構成について詳しく説明する。
[2−3.画像処理装置の概略的な構成]
図7Aは、本実施形態に係る画像処理装置の概略的な構成の第1の例を示すブロック図である。図7Aに示した画像処理装置100aは、例えば、図6Aの例におけるサーバ装置15、又は図6Bの例における撮像装置12若しくは端末装置16(又は、それら装置のいずれかに搭載される画像処理モジュール)であってよい。画像処理装置100aは、信号取得部101、情報取得部103、符号化部110及び制御部140を備える。
信号取得部101は、光と画像信号との間の変換に関する伝達関数に基づいて生成された入力画像信号を取得する。信号取得部101は、伝送インタフェースを介して外部の装置から入力画像信号を取得してもよく、又は画像処理装置100aと一体的に構成される撮像モジュール及び信号処理モジュール(図示せず)から入力画像信号を取得してもよい。
情報取得部103は、符号化部110により符号化される画像に適用された伝達関数に関する入力情報を取得する。一例として、情報取得部103は、画像処理装置100aが有するユーザインタフェースを介して入力情報を取得してもよい。ユーザインタフェースは、画像処理装置100aの筐体に設けられる例えばタッチパネル、ボタン又はスイッチのような物理的な入力デバイスにより提供されてもよい。その代わりに、ユーザインタフェースは、通信インタフェースを介して遠隔的に接続される端末装置上でGUI(Graphical User Interface)として提供されてもよい。本実施形態において、入力情報は、少なくとも符号化すべき画像に適用された伝達関数の種別を示す伝達関数種別を含む。ユーザインタフェースは、例えば、「SDR」及び「HDR」という2つの選択肢のうち画像に適用すべき1つをユーザに選択させてもよい。この場合、SDR用の予め定義される1つの伝達関数、又はHDR用の予め定義される1つの伝達関数が画像に適用されたものと判定される。また、ユーザインタフェースは、複数の伝達関数の候補(例えば、BT.709、HLG、ST2084及びS−Log3)から、画像に適用すべき伝達関数をユーザに選択させてもよい。
他の例として、情報取得部103は、入力画像信号と多重化される補助信号から入力情報を取得してもよい。例えば、補助信号は、信号線上で画像信号が伝送されていない期間(例えば、ブランキング期間)において信号取得部101により受信される。そして、情報取得部103は、信号取得部101において分離される補助信号から、画像に適用された伝達関数の種別を示す伝達関数種別を含む入力情報を取得し得る。また、情報取得部103は、外部のデータソースへアクセスして必要とされる入力情報を取得してもよい。
符号化部110は、信号取得部101により取得される画像信号により表現される画像を符号化して、符号化ビットストリームを生成する。符号化部110は、例えばMPEG−2、H.264/AVC又はH.265/HEVCなどのいかなる映像符号化方式に従って符号化処理を実行してもよい。符号化部110により実行される符号化処理は、典型的には、予測、直交変換、量子化及びエントロピー符号化といった様々な演算処理を含み、中でも量子化は所要の圧縮率を達成するための非可逆圧縮を含む処理である。
制御部140は、情報取得部103により取得される入力情報により示される伝達関数に基づいて、符号化部110において画像の各部分領域に割り当てられる符号量を制御する。より具体的には、制御部140は、HDRに対応する第1の伝達関数(HDR用の伝達関数)及びSDRに対応する第2の伝達関数(SDR用の伝達関数)のうちのHDR用の伝達関数が画像に適用されている場合に、HDR映像の画質の劣化を軽減するための量子化制御処理を有効化する。当該量子化制御処理は、伝達関数又は信号フォーマットに関わらず実行される量子化処理の処理パラメータを、HDR用の伝達関数が適用されている場合に符号量の割り当てを調整するために修正する処理を含み得る。なお、ここでは主に伝達関数の種別に基づいて割り当て符号量が制御される例を説明するが、伝達関数に関連付けられるダイナミックレンジの上限値など、伝達関数の他の属性に基づいて符号量が制御されてもよい。
図7Bは、本実施形態に係る画像処理装置の概略的な構成の第2の例を示すブロック図である。図7Bに示した画像処理装置100bもまた、例えば、図6Aの例におけるサーバ装置15、又は図6Bの例における撮像装置12若しくは端末装置16(又は、それら装置のいずれかに搭載される画像処理モジュール)であってよい。画像処理装置100bは、信号処理部102、情報取得部104、記憶部107、符号化部110及び制御部140を備える。
信号処理部102は、何らかの伝送インタフェース若しくは装置内部の信号線を介して撮像装置から入力される原始的な画像信号を取得し、又は記憶部107により記憶されている映像ファイルから画像信号を取得する。そして、信号処理部102は、原始的な画像信号について例えばガンマ補正及び色変換を含み得るデジタル信号処理を実行し、所定の信号フォーマットで符号化の対象とされる画像信号を生成する。信号処理部102により画像に適用される信号フォーマット及び対応する伝達関数は、情報取得部104により取得される入力情報に基づいて決定される。そして、信号処理部102は、生成した画像信号を符号化部110へ出力する。
情報取得部104は、符号化部110により符号化される画像に適用される伝達関数に関する入力情報を取得する。例えば、情報取得部104は、画像処理装置100bが有する(物理的な入力デバイスにより提供され又はGUIとして提供される)ユーザインタフェースを介して入力情報を取得してよい。上述したように、入力情報は、少なくとも符号化すべき画像に適用される伝達関数の種別を示す伝達関数種別を含む。ユーザインタフェースは、例えば、「SDR」及び「HDR」という2つの選択肢のうち画像に適用すべき1つをユーザに選択させてもよい。また、ユーザインタフェースは、複数の伝達関数の候補から、画像に適用すべき伝達関数をユーザに選択させてもよい。
記憶部107は、様々な映像データを記憶するための記憶デバイスである。記憶部107は、例えば、信号変換前のデジタル画像信号を記録する映像ファイルを記憶してもよい。ユーザは、画像処理装置100bが有する入出力インタフェース(図示せず)を介して、外部記憶媒体から取得される映像ファイルを記憶部107に記憶させてもよい。また、記憶部107は、符号化部110により実行される符号化処理の結果として生成される符号化ビットストリームを含む映像ファイルを記憶してもよい。映像ファイルは、リクエストに応じて外部の装置へと出力されてもよい。
図7Aを用いて説明した第1の例と同様に、符号化部110は、信号処理部102により取得される画像信号により表現される画像を符号化して、符号化ビットストリームを生成する。制御部140は、情報取得部104により取得される入力情報により示される伝達関数の種別に基づいて、符号化部110において画像の各部分領域に割り当てられる符号量を制御する。符号化部110により生成される符号化ビットストリームは、画像処理装置100bの外部の装置へと伝送されてもよく、又は記憶部107により映像ファイルとして記憶されてもよい。
[2−4.符号化部及び制御部の詳細な構成]
本項では、図7A及び図7Bに示した符号化部110及び制御部140のより具体的な構成について詳しく説明する。図8は、第1の実施形態に係る符号化部及び制御部の詳細な構成の一例を示すブロック図である。
(1)符号化部
図8を参照すると、符号化部110は、並び替えバッファ111、ブロック設定部112、減算部113、直交変換部114、量子化部115、可逆符号化部116、逆量子化部121、逆直交変換部122、加算部123、ループフィルタ124、フレームメモリ126、スイッチ127、モード選択部128、イントラ予測部130及びインター予測部135を備える。
並び替えバッファ111は、信号取得部101又は信号処理部102により取得される画像信号により表現される一連の画像の画像データを、GOP(Group of Pictures)構造に応じて並び替える。並び替えバッファ111は、並び替え後の画像データをブロック設定部112、イントラ予測部130及びインター予測部135へ出力する。
ブロック設定部112は、ピクチャに相当する画像の各々を複数のブロックへと分割する。MPEG−2及びH.264/AVCでは、ピクチャは固定的なサイズを有する複数のマクロブロックへと格子状に分割され、各マクロブロックを処理単位として符号化処理が実行される。量子化処理は、各マクロブロックに設定されるより小さいサブブロックを処理単位として実行され得る。H.265/HEVCでは、ピクチャは可変的なサイズを有する複数の符号化単位(Coding Unit)へと四分木状に分割され、各CUを処理単位として符号化処理が実行される。量子化処理は、各CUに設定されるより小さい変換単位(Transform Unit)を処理単位として実行され得る。
減算部113は、ブロック設定部112から入力される画像データと予測画像データとの差分である予測残差データを算出し、予測残差データを直交変換部114へ出力する。
直交変換部114は、減算部113から入力される予測残差データを、空間領域の画像データから周波数領域の変換係数データへと変換する。直交変換部114により実行される直交変換は、例えば離散コサイン変換又は離散サイン変換などであってよい。そして、直交変換部114は、変換係数データを量子化部115へ出力する。
量子化部115は、直交変換部114から入力される変換係数データを、所要の圧縮率が達成されるように決定される量子化ステップで量子化する。例えば、出力される符号化ビットストリームのサイズに対してバッファ又は伝送路の空き容量が多い場合には量子化ステップは小さく設定され、逆に空き容量が少ない場合には量子化ステップは大きく設定され得る。量子化ステップは、概して、画像内の部分領域ごとに決定される。3つの色成分の各々について異なる量子化ステップが使用されてもよい。ある部分領域について使用される量子化ステップがより小さいほど、当該部分領域の変換係数は精細に量子化される。これは、より多くの符号量が当該部分領域に割り当てられること、即ち当該部分領域の画像の階調がより損なわれることなく維持されることを意味する。量子化部115は、量子化行列を用いて変換係数のうち異なる周波数成分に異なる量子化ステップを適用してもよい。そして、量子化部115は、量子化後の変換係数データ(以下、量子化データという)を可逆符号化部116及び逆量子化部121へ出力する。
入力画像信号にHDR用の伝達関数が適用された場合、量子化部115には、各部分領域について使用される量子化ステップを調整(スケーリング)するためのパラメータが、制御部140から提供される。量子化部115は、制御部140から提供されるこのパラメータで除算(又は乗算)することにより量子化ステップをスケーリングして、スケーリング後の量子化ステップで変換係数データを量子化する。なお、いくつかの映像符号化方式では、デコーダ側での逆量子化のために要する制御値として量子化ステップを直接的に符号化する代わりに、量子化ステップとは対数関数的な関係を有する量子化パラメータ(QP)が符号化される。量子化ステップのスケーリングは、何らかの係数で量子化ステップを除算(又は乗算)する代わりに、何らかのオフセットを量子化パラメータに加算(又は減算)することにより実現されてもよい。
可逆符号化部116は、量子化部115から入力される量子化データを符号化することにより、符号化ビットストリームを生成する。また、可逆符号化部116は、デコーダにより参照される様々なパラメータを符号化して、符号化されたパラメータを符号化ビットストリームへ挿入する。可逆符号化部116により符号化されるパラメータは、伝達関数に関する情報、色域に関する情報、及び上述した量子化パラメータに関する情報を含み得る。可逆符号化部116は、生成した符号化ビットストリームを、アプリケーションの目的に応じた出力先へと出力する。
逆量子化部121、逆直交変換部122及び加算部123は、ローカルデコーダを構成する。ローカルデコーダは、符号化されたデータから原画像を再構築する役割を有する。
逆量子化部121は、量子化部115により使用されたものと同じ量子化ステップで量子化データを逆量子化し、変換係数データを復元する。入力画像信号にHDR用の伝達関数が適用された場合には、制御部140から提供されるパラメータを用いてスケーリングされた量子化ステップが、各部分領域について使用され得る。そして、逆量子化部121は、復元した変換係数データを逆直交変換部122へ出力する。
逆直交変換部122は、逆量子化部121から入力される変換係数データについて逆直交変換処理を実行することにより、予測残差データを復元する。そして、逆直交変換部122は、復元した予測残差データを加算部123へ出力する。
加算部123は、逆直交変換部122から入力される復元された予測残差データとイントラ予測部130又はインター予測部135により生成される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部123は、生成した復号画像データをループフィルタ124及びフレームメモリ126へ出力する。
ループフィルタ124は、復号画像の画質の向上を目的とするインループフィルタである。ループフィルタ124は、例えば、復号画像に現れるブロック歪みを軽減するためのデブロックフィルタを含んでもよい。また、ループフィルタ124は、復号画像にエッジオフセット又はバンドオフセットを加えるための適応オフセットフィルタを含んでもよい。ループフィルタ124は、フィルタリング後の復号画像データをフレームメモリ126へ出力する。
フレームメモリ126は、加算部123から入力されるフィルタリング前の復号画像データ、及びループフィルタ124から入力されるインループフィルタの適用後の復号画像データを記憶する。
スイッチ127は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ126から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部130に供給する。また、スイッチ127は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ126から読み出し、読み出した復号画像データを参照画像データとしてインター予測部135に供給する。
モード選択部128は、イントラ予測部130及びインター予測部135から入力されるコストの比較に基づいて、ブロックごとに予測手法を選択する。モード選択部128は、イントラ予測を選択したブロックについては、イントラ予測部130により生成される予測画像データを減算部113へ出力すると共に、イントラ予測に関する情報を可逆符号化部116へ出力する。また、モード選択部128は、インター予測を選択したブロックについては、インター予測部135により生成される予測画像データを減算部113へ出力すると共に、インター予測に関する情報を可逆符号化部116へ出力する。
イントラ予測部130は、原画像データ及び復号画像データに基づいて、イントラ予測処理を実行する。例えば、イントラ予測部130は、探索範囲に含まれる複数の候補モードの各々について、発生すると推定されるコストを評価する。次に、イントラ予測部130は、コストが最小となる予測モードを最良の予測モードとして選択する。また、イントラ予測部130は、選択した最良の予測モードに従って予測画像データを生成する。そして、イントラ予測部130は、最良の予測モードを示す予測モード情報を含むイントラ予測に関する情報、対応するコスト、及び予測画像データを、モード選択部128へ出力する。
インター予測部135は、原画像データ及び復号画像データに基づいて、インター予測処理(動き補償)を実行する。例えば、インター予測部135は、探索範囲に含まれる複数の候補モードの各々について、発生すると推定されるコストを評価する。次に、インター予測部135は、コストが最小となる予測モードを最良の予測モードとして選択する。また、インター予測部135は、選択した最良の予測モードに従って予測画像データを生成する。そして、インター予測部135は、インター予測に関する情報、対応するコスト、及び予測画像データを、モード選択部128へ出力する。
(2)制御部
図8を参照すると、制御部140は、統計演算部141及び符号量制御部143を備える。
統計演算部141は、画像に設定される部分領域の各々について、輝度成分及び色差成分のうちの少なくとも一方の強さに関する統計を算出する。統計演算部141により算出される統計は、1つ以上の色成分についての部分領域内の画素値(符号値)の代表値(例えば、平均、中央値若しくは最頻値)又はヒストグラムであってよい。そして、統計演算部141は、算出した統計を符号量制御部143へ出力する。
なお、ここでの部分領域は、典型的には、量子化処理の処理単位に相当するブロックに相当し得る。例えば、MPEG−2若しくはH.264/AVCにおけるマクロブロック若しくはサブブロック、又はH.265/HEVCにおけるCU若しくはTUといった部分領域ごとに統計が算出され、次に説明する符号量制御部により量子化ステップが制御されてよい。また、かかる例に限定されず、他の形状を有する部分領域(1画素であってもよい)ごとに、ここで説明される量子化制御処理が実行されてもよい。
符号量制御部143は、符号化される画像に適用される伝達関数の種別を、情報取得部103又は104から入力される入力情報に基づいて判定する。そして、符号量制御部143は、HDR用の伝達関数及びSDR用の伝達関数のうちのSDR用の伝達関数が適用されている場合には、以下に説明する量子化制御処理をスキップし得る。一方、符号量制御部143は、符号化される画像にHDR用の伝達関数が適用されている場合には、各部分領域に割り当てられる符号量を、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御する。より具体的には、符号量制御部143は、各部分領域について量子化部115により使用される量子化ステップを、1つ以上の色成分の強さに依存してスケーリングする(又は量子化部115にスケーリングさせる)ことにより、各部分領域に割り当てられる符号量を制御する。以下、第1の実施例として輝度成分の強さに依存する制御、第2の実施例として色差成分の強さに依存する制御、第3の実施例として輝度成分及び色差成分の双方の強さに依存する制御について説明する。
(3)第1の実施例−高輝度部分の保護
第1の実施例において、符号量制御部143は、輝度成分の強さがより強い部分領域(即ち、高輝度部分)により多くの符号量が割り当てられるように、各部分領域について使用される量子化ステップをスケーリングする。各部分領域の輝度成分の強さは、統計演算部141により算出される部分領域ごとの統計から把握される。ここでは、符号量制御部143は、量子化ステップを各部分領域の輝度成分の強さに依存する保護比で除算することにより、量子化ステップをスケーリングするものとする。保護比は、部分領域の画質をどの程度保護するかを表すパラメータである。保護比の値が大きいほど、量子化ステップの値は小さくなり、当該量子化ステップが適用される部分領域の画質はより強く保護される。なお、保護比での実際の除算は、保護比を提供される量子化部115において行われてよい。
図9Aは、高輝度部分を保護するための保護比の第1の例について説明するための説明図である。図9Aの横軸は、輝度成分の符号値を表す。縦軸は、保護比を表す。ここで示したように、保護比は、各部分領域の輝度成分の強さを引き数とする所定の関数を用いて算出されるパラメータであってもよい。図9Aには一例として一次関数が示されているが、より高次の関数、又は例えば対数関数などの他の種類の関数が使用されてもよい。この例のように、輝度成分の強さがより強い部分領域の保護比をより高くすることで、そうした部分領域の量子化ステップがより小さい値へとスケーリングされる。それにより、光から電気信号への変換の際に既に強く圧縮されている高輝度部分の画像情報が過剰に損なわれることを回避することができる。
図9Bは、高輝度部分を保護するための保護比の第2の例について説明するための説明図である。図9Bに示したように、保護比は、各部分領域の輝度成分の強さがどのサブレンジに属するかによって選択的に決定されるパラメータであってもよい。第2の例によれば、各部分領域の輝度成分の強さが200nit未満、200nit以上300nit未満、300nit以上400nit未満、400nit以上500nit未満、500nit以上600nit未満及び600nit以上という6つのサブレンジに分類されており、各サブレンジに対応する保護比が定義される。符号量制御部143は、このようなサブレンジと対応する保護比とをマッピングするマッピングテーブルを予め記憶するメモリを有していてもよい。第2の例においても、第1の例と同様に、輝度成分の強さがより強い部分領域の保護比がより高く設定されるため、光から電気信号への変換の際に既に強く圧縮されている高輝度部分の画像情報が過剰に損なわれることを回避することができる。
なお、第2の例によれば、ダイナミックレンジの中央部分において、保護比(又は量子化ステップ)が精細に制御される一方、ダイナミックレンジの端部においては保護比は固定的である。保護比をこのように設定することで、人間の視覚を通じて主観的に感知される画質に影響を与えやすいダイナミックレンジの中央部分の保護を、符号化効率の犠牲を抑制しながら効率的に強化することができる。
(4)第2の実施例−高色差部分の保護
第2の実施例において、符号量制御部143は、色差成分の強さがより強い部分領域(即ち、高色差部分)により多くの符号量が割り当てられるように、各部分領域について使用される量子化ステップをスケーリングする。
図10は、高色差部分として保護されるべき符号値について説明するための説明図である。図10の横軸は、2つの色差成分のうちの一方であるCb成分の符号値を表す。縦軸は、2つの色差成分のうちの他方であるCr成分の符号値を表す。図中の点P1は、RGB空間においてR成分及びG成分の符号値が1000を上回る所謂「黄色」に該当する特定の点の、YCbCr空間のCbCr平面上の対応する位置を示している。点P2は、RGB空間においてG成分及びB成分の符号値が1000を上回る所謂「シアン」に該当する特定の点の、YCbCr空間のCbCr平面上の対応する位置を示している。点P3は、RGB空間においてG成分の符号値が1000を上回る所謂「緑色」に該当する特定の点の、YCbCr空間のCbCr平面上の対応する位置を示している。点P4は、RGB空間においてR成分及びB成分の符号値が1000を上回る所謂「マゼンタ」に該当する特定の点の、YCbCr空間のCbCr平面上の対応する位置を示している。点P5は、RGB空間においてR成分の符号値が1000を上回る所謂「赤色」に該当する特定の点の、YCbCr空間のCbCr平面上の対応する位置を示している。点P6は、RGB空間においてB成分の符号値が1000を上回る所謂「青色」に該当する特定の点の、YCbCr空間のCbCr平面上の対応する位置を示している。
これら点の色成分値の分析によれば、図中で破線枠HLの内部にある点P1、P2及びP3はYCbCr空間において相対的に高いY成分値(例えば、700以上)を有するのに対し、破線枠HLの外部にある点P4、P5及びP6は相対的に低いY成分値(例えば、700未満)を有する。これは、色の鮮やかな部分の中でも「黄色」、「シアン」及び「緑色」の部分は輝度成分を考慮すれば保護され得るのに対し、「マゼンタ」、「赤色」及び「青色」の部分はそうではないことを意味する。そのため、高色差部分について符号量の割り当てを増加させることもまた有益である。各部分領域の色差成分の強さは、統計演算部141により算出される部分領域ごとの統計から把握される。ここでは、符号量制御部143は、量子化ステップを各部分領域の色差成分の強さに依存する保護比で除算することにより、(輝度成分と共通の又は色差成分に固有の)量子化ステップをスケーリングするものとする。なお、実際の除算は、保護比を提供される量子化部115において行われてよい。
高色差部分を保護するための保護比は、図9Aに示した第1の例と同様に、各部分領域の色差成分の強さを引き数とする所定の関数を用いて算出されるパラメータであってもよい。代替的に、高色差部分を保護するための保護比は、図9Bに示した第2の例と同様に、各部分領域の色差成分の強さがどのサブレンジに属するかに依存して決定されるパラメータであってもよい。符号量制御部143は、色差成分のサブレンジと対応する保護比とをマッピングするマッピングテーブルを予め記憶するメモリを有していてもよい。
図11は、高色差部分を保護するための保護比の一例について説明するための説明図である。図11には、図9Bに例示した6つのサブレンジに対応する輝度成分の保護比(実線)に加えて、同じ6つのサブレンジに対応する色差成分の保護比(破線)が示されている。このように色差成分の強さがより強い部分領域の保護比をより高く設定することで、光から電気信号への変換の際に既に強く圧縮されている高色差部分の画像情報が過剰に損なわれることを回避することができる。また、ダイナミックレンジの中央部分において保護比を精細に設定することで、主観的に感知される画質に影響を与えやすいダイナミックレンジの中央部分の保護を、符号化効率の犠牲を抑制しながら効率的に強化することができる。
(5)第3の実施例−高輝度部分及び高色差部分の保護
図10の点P1、P2及びP3(「黄色」、「シアン」及び「緑色」)は、上述したように、色の鮮やかな(R成分、G成分及びB成分のうちの1つ以上が強い)領域に属し且つ高輝度(Y成分が強い)領域にも属する。このような色を有する部分領域を高輝度部分として保護しながら高色差部分としても保護すると、割り当て符号量が不適切なほど多くなってしまう可能性がある。そこで、符号量制御部143は、輝度成分及び色差成分のうちの一方の強さに応じて量子化ステップがスケーリングされた部分領域の当該量子化ステップを、輝度成分及び色差成分のうちの他方の強さに応じてスケーリングしなくてもよい。
一例として、符号量制御部143は、各部分領域について統計演算部141により色成分ごとに算出されるヒストグラムに基づいて、各部分領域を2つのグループに分類する。より具体的には、例えば、符号量制御部143は、あるCb基準値を上回るCb成分を有する画素の割合が閾値を上回り、又はあるCr基準値を上回るCr成分を有する画素の割合が閾値を上回る部分領域を第1のグループに、そうではない(双方の割合が閾値を下回る)部分領域を第2のグループに分類し得る。第1のグループは、図10の破線枠HLの外部に位置する画素の多い部分領域を含み、第2のグループは、破線枠HLの内側に位置する画素の多い部分領域を含むことになる。符号量制御部143は、第1のグループに属する部分領域には第2の実施例に従って高色差部分の保護を、第2のグループに属する部分領域には第1の実施例に従って高輝度部分の保護を適用してもよい。
こうした保護手法の切り替えにより、冗長的な量子化ステップの制御を回避して処理コストを低減すると共に、画像内で局所的に割り当て符号量が過剰となることを防止することができる。
[2−5.処理の流れ]
(1)符号化制御処理
図12は、本実施形態に係る符号化制御処理の流れの一例を示すフローチャートである。ここで説明する符号化制御処理は、映像を構成する個々の画像について繰り返されてよい。複数の画像にわたって変化しないパラメータを取得し又は設定するための処理ステップは、2回目以降の繰り返しにおいてスキップされてもよい。なお、ここでは、説明の簡明さのために、符号量の制御に直接的に関連しない処理ステップについての説明は省略される。
図12を参照すると、まず、信号取得部101又は信号処理部102は、光と画像信号との間の変換に関する伝達関数に基づいて生成された画像信号を取得する(ステップS110)。ここで取得される画像信号は、符号化部110へ出力される。
次に、情報取得部103又は104は、符号化部110により符号化される画像に適用された伝達関数に関する入力情報を、ユーザインタフェースを介して又は入力画像信号と多重化される補助信号から取得する(ステップS112)。ここで取得される入力情報は、制御部140へ出力される。
次に、符号量制御部143は、上述した入力情報により示される伝達関数の種別に基づいて、個々の部分領域に保護比を設定する際に使用される保護比テーブル又は関数を設定する(ステップS114)。ここで設定される保護比テーブル又は関数は、HDR用の複数の伝達関数にわたって共通的であってもよく、又はHDR用の複数の伝達関数のうちのいずれが適用されるかに依存して異なってもよい。
その後の処理は、処理対象の画像に設定される複数の部分領域のうちの各々について繰り返される。各繰り返しにおける処理対象の部分領域を、ここでは注目部分領域という。
まず、符号化部110の量子化部115は、どのような伝達関数が適用されたかに関わらず、所要の圧縮率が達成されるように注目部分領域の量子化ステップを決定する(ステップS130)。
次に、符号量制御部143は、適用された伝達関数の種別を、入力情報に基づいて判定する(ステップS132)。そして、符号量制御部143は、符号化される画像にHDR用の伝達関数が適用されたと判定される場合には、後に詳しく説明する量子化制御処理を実行する(ステップS140)。一方、符号化される画像にSDR用の伝達関数が適用されたと判定される場合には、符号量制御部143は、量子化制御処理をスキップする。
次に、量子化部115は、直交変換部114から入力される注目部分領域の変換係数データを、スケーリング後の(又はSDR映像であるためにスケーリングされない)量子化ステップで量子化する(ステップS160)。
次に、可逆符号化部116は、量子化部115から入力される量子化データと量子化パラメータとを符号化して、符号化ビットストリームを生成する(ステップS170)。
ステップS130〜ステップS170は、ピクチャ内の全ての部分領域について処理が終了するまで繰り返される(ステップS180)。そして、全てのピクチャについて処理が終了すると、図12に示した符号化制御処理は終了する(ステップS190)。
(2)量子化制御処理(第1の実施例)
図13Aは、図12のステップS140において実行され得る量子化制御処理の流れの第1の例を示すフローチャートである。第1の例は、画像内の高輝度部分の階調を保護するための量子化制御処理の流れの一例を示している。
図13Aを参照すると、まず、統計演算部141は、注目部分領域の輝度成分の強さに関する統計を算出する(ステップS141)。ここで算出される統計は、例えば、輝度成分についての部分領域内の画素値の平均、中央値又は最頻値を含み得る。そして、統計演算部141は、算出した統計を符号量制御部143へ出力する。
次に、符号量制御部143は、統計演算部141から入力される注目部分領域の輝度統計に対応する保護比を、保護比テーブルを参照し又は保護比算出用の関数を用いることにより決定する(ステップS144)。そして、符号量制御部143は、決定した保護比を、量子化部115へ出力する。
次に、量子化部115は、符号量制御部143から入力される保護比に従って、図12のステップS130にて決定した量子化ステップをスケーリングする(ステップS146)。例えば、量子化部115は、符号量制御部143から入力される1より大きい保護比で量子化ステップを除算することにより量子化ステップを縮小し、又は1より小さい保護比で量子化ステップを除算することにより量子化ステップを拡大する。なお、ここでは、所要の圧縮率が達成されるように暫定的に決定された量子化ステップを保護比でスケーリングする例を説明しているが、所要の圧縮率及び保護比の双方を同時に考慮して量子化ステップが決定されてもよい。以下に説明する他の実施例についても同様である。
(3)量子化制御処理(第2の実施例)
図13Bは、図12のステップS140において実行され得る量子化制御処理の流れの第2の例を示すフローチャートである。第2の例は、画像内の高色差部分の階調を保護するための量子化制御処理の流れの一例を示している。
図13Bを参照すると、まず、統計演算部141は、注目部分領域の色差成分の強さに関する統計を算出する(ステップS142)。ここで算出される統計は、例えば、色差成分についての部分領域内の画素値の平均、中央値又は最頻値を含み得る。そして、統計演算部141は、算出した統計を符号量制御部143へ出力する。
次に、符号量制御部143は、統計演算部141から入力される注目部分領域の色差統計に対応する保護比を、保護比テーブルを参照し又は保護比算出用の関数を用いることにより決定する(ステップS145)。そして、符号量制御部143は、決定した保護比を、量子化部115へ出力する。
次に、量子化部115は、符号量制御部143から入力される保護比に従って、図12のステップS130にて決定した量子化ステップをスケーリングする(ステップS147)。例えば、量子化部115は、符号量制御部143から入力される1より大きい保護比で量子化ステップを除算することにより量子化ステップを縮小し、又は1より小さい保護比で量子化ステップを除算することにより量子化ステップを拡大する。
(4)量子化制御処理(第3の実施例)
図13Cは、図12のステップS140において実行され得る量子化制御処理の流れの第3の例を示すフローチャートである。第3の例は、画像内の高輝度部分及び高色差部分の双方の階調を保護するための量子化制御処理の流れの一例を示している。
図13Cを参照すると、まず、統計演算部141は、注目部分領域の輝度成分の強さに関する統計を算出する(ステップS141)。また、統計演算部141は、注目部分領域の色差成分の強さに関する統計を算出する(ステップS142)。そして、統計演算部141は、算出した統計を符号量制御部143へ出力する。
次に、符号量制御部143は、統計演算部141から入力される注目部分領域の統計(例えば、色差成分のヒストグラム)に基づいて、注目部分領域に輝度に依存する保護を適用するか又は色差に依存する保護を適用するかを判定する(ステップS143)。
次に、符号量制御部143は、注目部分領域に輝度に依存する保護を適用すると判定した場合には、注目部分領域の輝度統計に対応する保護比を、保護比テーブルを参照し又は保護比算出用の関数を用いることにより決定する(ステップS144)。そして、量子化部115は、輝度統計に基づく符号量制御部143から入力される保護比に従って量子化ステップをスケーリングする(ステップS148)。
一方、符号量制御部143は、注目部分領域に色差に依存する保護を適用すると判定した場合には、注目部分領域の色差統計に対応する保護比を、保護比テーブルを参照し又は保護比算出用の関数を用いることにより決定する(ステップS145)。そして、量子化部115は、色差統計に基づく符号量制御部143から入力される保護比に従って量子化ステップをスケーリングする(ステップS149)。
[2−6.変形例]
ここまで、画像を符号化する機能を有する画像処理装置が、画像に適用された伝達関数の種別に基づいて、部分領域ごとの割り当て符号量を制御する処理のオン/オフを切り替える例について説明した。しかしながら、本実施形態のアイディアは、伝達関数の種別の判定を経ることなく、部分領域ごとの割り当て符号量の制御が実行されるケースにも適用可能である。本項では、そうした一変形例について説明する。
(1)画像処理装置の構成
図14は、第1の実施形態に係る画像処理装置の構成の一変形例を示すブロック図である。図14に示した画像処理装置100cは、例えば、図6Aの例におけるサーバ装置15、又は図6Bの例における撮像装置12若しくは端末装置16(又は、それら装置のいずれかに搭載される画像処理モジュール)であってよい。画像処理装置100cは、信号取得部101、符号化部110及び制御部140cを備える。
図7Aを用いて説明した例と同様、信号取得部101は、光と画像信号との間の変換に関する伝達関数に基づいて生成された入力画像信号を取得する。本変形例において信号取得部101により取得される入力画像信号は、HDR用の伝達関数によって光から変換され、HDR用の信号フォーマットで生成された信号である。ここでのHDR用の伝達関数は、例えば、100nitより高い輝度での映像の表示を可能とするための、HLG、ST2084又はS−Log3といった伝達関数であってよい。符号化部110は、信号取得部101から入力される画像信号により表現される画像を符号化して、符号化ビットストリームを生成する。なお、画像処理装置100cは、信号取得部101の代わりに、図7Bを用いて説明した信号処理部102を備えていてもよい。
本変形例において、制御部140cは、符号化される画像にHDR用の伝達関数が適用されたことを前提として、符号化部110において画像の各部分領域に割り当てられる符号量を、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御する。より具体的には、制御部140cは、伝達関数の種別を判定することなく、図13A〜図13Cを用いて説明した実施例のうちのいずれかに従って、各部分領域について使用される量子化ステップを、輝度成分及び色差成分のうちの少なくとも一方に依存してスケーリングすることにより、各部分領域に割り当てられる符号量を制御し得る。
量子化ステップのスケーリングは、例えば図9Aを用いて説明したような色成分の符号値を引き数とする関数を用いて決定されるパラメータの乗算又は除算(例えば、保護比での除算)によって実現されてもよい。その代わりに、量子化ステップのスケーリングは、例えば図9Bを用いて説明したような色成分の符号値と予めマッピングされる(マッピングテーブルを参照して取得される)パラメータの乗算又は除算によって実現されてもよい。色成分の強さがより強い部分領域の量子化ステップを縮小することにより、より多くの符号量をそれら部分領域に割り当てて、コーデック歪みに起因する画質の劣化を軽減することができる。
(2)符号化制御処理
図15は、図14を用いて説明した変形例に係る符号化制御処理の流れの一例を示すフローチャートである。ここで説明する符号化制御処理は、映像を構成する個々の画像について繰り返されてよい。複数の画像にわたって変化しないパラメータを取得し又は設定するための処理ステップは、2回目以降の繰り返しにおいてスキップされてもよい。なお、ここでは、説明の簡明さのために、符号量の制御に直接的に関連しない処理ステップについての説明は省略される。
図15を参照すると、まず、信号取得部101又は信号処理部102は、光と画像信号との間の変換に関するHDR用の伝達関数が適用された画像信号を取得する(ステップS111)。ここで取得される画像信号は、符号化部110へ出力される。
次に、制御部140cは、個々の部分領域に保護比を設定する際に使用される保護比テーブル又は関数を設定する(ステップS115)。ここで設定される保護比テーブル又は関数は、HDR用の複数の伝達関数にわたって共通的であってもよく、又はHDR用の複数の伝達関数のうちのいずれが適用されるかに依存して異なってもよい。
その後の処理は、処理対象の画像に設定される複数の部分領域のうちの各々について繰り返される。まず、符号化部110の量子化部115は、所要の圧縮率が達成されるように注目部分領域の量子化ステップを決定する(ステップS130)。
次に、制御部140cは、図13A〜図13Cを用いて説明した量子化制御処理のうちの1つを実行する(ステップS140)。それにより、ステップS130において決定された注目部分領域の量子化ステップがスケーリングされる。
次に、量子化部115は、直交変換部114から入力される注目部分領域の変換係数データを、スケーリング後の量子化ステップで量子化する(ステップS160)。
次に、可逆符号化部116は、量子化部115から入力される量子化データと量子化パラメータとを符号化して、符号化ビットストリームを生成する(ステップS170)。
ステップS130〜ステップS170は、ピクチャ内の全ての部分領域について処理が終了するまで繰り返される(ステップS180)。そして、全てのピクチャについて処理が終了すると、図15に示した符号化制御処理は終了する(ステップS190)。
[2−7.第1の実施形態のまとめ]
ここまで、図6A〜図15を用いて、本開示に係る技術の第1の実施形態について説明した。上述した実施形態では、光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する際に、伝達関数に基づいて、画像の各部分領域に割り当てられる符号量が制御される。かかる構成によれば、どういった伝達関数が画像に適用されるかに依存して部分領域ごとに割り当て符号量を変化させることができる。それにより、伝達関数の選択の結果として原信号の階調を表現するための割り当て符号量が不足することを原因として、画像の部分領域においてコーデック歪みが顕著となることを防止することが可能となる。
また、上述した実施形態では、第1のダイナミックレンジに対応する第1の伝達関数及び第1のダイナミックレンジよりも狭い第2のダイナミックレンジに対応する第2の伝達関数のうちの第1の伝達関数が画像に適用されている場合に、各部分領域に割り当てられる符号量が、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御され得る。かかる構成によれば、伝達関数に関わらず決定される割り当て符号量を、より広いダイナミックレンジに対応する伝達関数が適用されている場合に、少なくとも1つの色成分の強さに依存して部分領域ごとに調整することができる。それにより、特定のダイナミックレンジを前提として設計され又はチューニングされたエンコーダの構成を、拡張されたダイナミックレンジのために活用しながら、割り当て符号量を最適化して画質の劣化を軽減することができる。
一例として、上記第1のダイナミックレンジは、100nitより高い輝度での表示を可能とするためのダイナミックレンジであってよく、上記第2のダイナミックレンジは、100nitの輝度を上限とするダイナミックレンジであってよい。それにより、既存のSDR映像のために設計されたエンコーダを、画質の劣化を防止しつつ例えばHLG、ST2084又はS−Log3といった伝達関数が適用されたHDR映像を符号化するために活用することが可能となる。
また、上述した実施形態では、各部分領域に割り当てられる符号量は、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して量子化ステップをスケーリングすることにより制御される。例えば、アプリケーションの要件(所要の圧縮率など)に応じて決定される量子化ステップをより小さい値へとスケーリングすることで、画像の階調をより良好に保全することができる。また、割り当て符号量に相対的に余裕のある部分領域について量子化ステップをより大きい値へとスケーリングすることで、符号化効率の低下を補うことができる。
一例として、個々の映像符号化方式において定義されている量子化処理の処理単位に相当するブロックごとに量子化ステップのスケーリングを行うという構成を採用すれば、それら映像符号化方式をサポートするエンコーダを拡張して、上述した実施形態に係る技術を低コストで容易に実装することができる。
また、上述した実施形態では、各部分領域について使用される量子化ステップは、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方の強さがより強い部分領域により多くの符号量が割り当てられるようにスケーリングされる。上述したように、例えばHDRのケースでは、特に符号値が相対的に大きい部分において、SDRのケースと比較して画像情報がより高い圧縮比で圧縮されており、これがHDR映像の表示の際に画像内の高輝度部分及び高色差部分においてコーデック歪みが拡大する原因となっていた。これに対し、色成分の強さがより強い部分領域において量子化ステップを縮小して割り当て符号量を引き上げることで、コーデック歪みを軽減し、原画像における階調の変化を適切に再現することが可能となる。
また、上述した実施形態では、画像に適用される伝達関数に関する入力情報に基づいて、伝達関数が判定され得る。上記入力情報がユーザインタフェースを介して取得される場合には、入力信号から伝達関数を判別できない場合にもユーザが望む通りに伝達関数に基づく制御を実行することができる。上記入力情報が入力画像信号と多重化される補助信号から取得される場合には、ユーザ入力を要することなく自動的に伝達関数に基づく制御を実行することができる。
また、一変形例によれば、光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する際に、画像の各部分領域に割り当てられる符号量が、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御される。それにより、原信号の階調を表現するための割り当て符号量が不足することを原因として画像の部分領域においてコーデック歪みが顕著になることを防止することができる。
<3.第2の実施形態>
[3−1.導入]
多くの映像符号化方式において、エンコーダは、画像を符号化する際に、選択可能な複数のモードから符号化効率の観点で最良のモードを選択し、選択したモードを示すモード情報を符号化してデコーダへ伝送する。そうしたモード選択は、例えば、イントラ予測における予測モード(例えば、予測方向及び予測ブロックサイズ)の選択、インター予測における予測モード(例えば、動きベクトル、予測ブロックサイズ及び参照ピクチャ)の選択、並びにイントラ予測モードとインター予測モードとの間の予測手法の選択を含み得る。モード選択は、通常、原画像データから予測画像データを減算して残る予測残差から発生する符号量とオーバヘッドとしてのモード情報から発生する符号量との和に相当し得るコストを、複数の候補モードにわたって評価することにより行われる。しかし、SDR映像のために設計され又はチューニングされたコスト評価式は、必ずしもHDR映像のために最適ではない。なぜなら、HDR映像の画像信号においては、SDR映像と比較して画像情報がより強く圧縮されており、同じ評価式が使用される場合には予測残差から発生する符号量のモード間の差異が過小評価されがちだからである。
発明者らは、HDR用の信号フォーマットで表現されたサンプル映像の画像信号をH.264/AVCに準拠する既存のエンコーダで符号化した場合に、選択される予測モードにしばしば不自然な偏りが生じることを認識している。例えば、ある画像についてイントラ予測の結果として予測ブロックごとに選択された予測モードを分析すると、画像全体にわたって、不自然なほど多くのブロックでDC予測(平均値予測ともいう)が選択されているケースがあった。こうした予測モードの偏りは、予測精度を悪化させ、所要の圧縮率の下で画像全体に散在する歪みをもたらす。予測モードの偏りが生じる原因は、モード選択のための画一的なコスト評価式がHDR映像のために適していないことである。特に、HDRのケースでは、画像情報の強い圧縮の結果として、コスト評価式における予測残差の寄与が小さくなり、モード情報の寄与が過剰に支配的になっていると推測される。
一般に、複数の候補モードから最良のモードを選択するための手法として、ラグランジュの未定乗数法に基づくRD(Rate Distortion)最適化が知られている。RD最適化において、i番目の候補モードについて符号化コストJは、次式のように記述され得る:
Figure 0006822122
式(1)において、Dは、i番目の候補モードにおいて画像に生じる歪み(以下、予測残差符号量という)を表し、通常は原画像と予測画像との間の差分絶対値総和(SAD)に等しい。Rは、i番目の候補モードにおいて生じるオーバヘッドビット(例えば、予測モードを表すモード情報)の符号量を表す。λは、量子化パラメータQPに依存する係数である。式(1)の右辺において、係数λの代わりに、QPに依存するオフセット値が加算(又は減算)されてもよい。また、予測残差符号量Dとして、差分絶対値総和をアダマール変換した値が使用されてもよい。
式(1)のようなコスト評価式をエンコーダに実装する際、例えば十分な処理速度を確保し又は実装の複雑さを低減するために、オーバヘッドビットの符号量の項R(以下、モード符号量という)として、候補モードごとに予め定義される固定的な値を使用することが有益である。一方、信号変換前の画像における同程度の階調の差は、SDRのケースと比較してHDRのケースではより小さい符号値の差へと圧縮される。すると、SDR映像のために最適化されたモード符号量Rは、HDR映像において生じる予測残差符号量Dと共にコスト評価式へ算入するには大き過ぎることになる。
図16A及び図16Bは、モード選択への伝達関数の違いの影響について説明するための説明図である。図16Aの上段に示したグラフの横軸は、画像の1ライン上の水平方向の画素位置を表す。縦軸は、そのライン上の画素列のある色成分の符号値を表す。グラフの実線は、原画像の符号値を表し、図示した例では、符号値はラインの左半分において大きい値をとり、ラインの中央において減少し、ラインの右半分において小さい値をとる。左のグラフの破線は、イントラ予測の予測モードの1つであるDC予測に従って生成され得る予測画像の符号値を表す。右のグラフの破線は、イントラ予測の予測モードの他の1つである対角方向予測に従って生成され得る予測画像の符号値を表す。原画像の符号値の軌跡(実線)と予測画像の符号値の軌跡(破線)とで囲まれた部分の面積(図中の斜線網掛け部分)は、それぞれの予測モードが選択された場合の予測誤差に相当する。図16Aの例では、DC予測の予測誤差が、対角方向予測の予測誤差よりも大きい。一方、例えばモード番号のより小さいDC予測には、対角方向予測よりも小さいモード符号量(図中のドット網掛け部分)が付与されているものとする。しかし、図16Aの例では、予測誤差符号量とモード符号量との和、即ちコストを2つの予測モードの間で比較すると、DC予測よりも対角方向予測の方が低いコスト値を示す。従って、この場合には、イントラ予測の予測モードとして、対角方向予測が選択され得る。
図16Bの上段に示したグラフにおいても、実線は原画像の符号値を表す。但し、図16Aの例ではSDR用の伝達関数が画像に適用されたのに対し、図16Bの例ではHDR用の伝達関数が画像に適用された結果として、本来同程度であったはずの階調の差が、より小さい符号値の差へと圧縮されている。そのため、原画像の符号値の軌跡(実線)と予測画像の符号値の軌跡(破線)とで囲まれた部分の面積、即ち予測誤差(図中の斜線網掛け部分)をDC予測と対角方向予測とで比較すると、それら予測誤差の差は小さくなっている。そして、予測誤差符号量にそれぞれモード符号量(図中のドット網掛け部分)を加算すると、総コストは対角方向予測よりもDC予測の方が低い値を示す。従って、本来の画像は同じであるにも関わらず、この場合には、イントラ予測の予測モードとしてDC予測が選択され得る。
このように伝達関数の違いがモード選択に影響を与える結果として画像に望ましくないコーデック歪みが生じることを防止するために、本節において、第2の実施形態として、コスト評価式に算入される予測残差符号量及びモード符号量のうちの一方を、伝達関数に基づいて制御する手法を提案する。
[3−2.システムの概要]
本実施形態に係る画像処理システムは、第1の実施形態における画像処理システム10a又は10bと同様に構成されてよい。例えばシステム内の撮像装置、サーバ装置若しくは端末装置、又はそれら装置のいずれかに搭載される画像処理モジュールは、光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する画像処理装置(即ち、エンコーダ)としての機能を有する。本実施形態では、エンコーダが画像を符号化する際に、伝達関数に基づいて、モード選択のための予測残差符号量又はモード符号量が制御される。それにより、HDR用の信号フォーマットが使用される場合の不適切なモードの選択が回避され、画質の劣化が軽減される。次項より、そうした画像処理装置の具体的かつ例示的な構成について詳しく説明する。
[3−3.画像処理装置の概略的な構成]
図17Aは、本実施形態に係る画像処理装置の概略的な構成の第1の例を示すブロック図である。図17Aに示した画像処理装置200aは、信号取得部201、情報取得部203、符号化部210及び制御部240を備える。
信号取得部201は、光と画像信号との間の変換に関する伝達関数に基づいて生成された入力画像信号を取得する。信号取得部201は、伝送インタフェースを介して外部の装置から入力画像信号を取得してもよく、又は画像処理装置200aと一体的に構成される撮像モジュール及び信号処理モジュール(図示せず)から入力画像信号を取得してもよい。
情報取得部203は、符号化部210により符号化される画像に適用された伝達関数に関する入力情報を取得する。一例として、情報取得部203は、画像処理装置200aが有するユーザインタフェースを介して入力情報を取得してもよい。ユーザインタフェースは、画像処理装置200aの筐体に設けられる例えばタッチパネル、ボタン又はスイッチのような物理的な入力デバイスにより提供されてもよい。その代わりに、ユーザインタフェースは、通信インタフェースを介して遠隔的に接続される端末装置上でGUIとして提供されてもよい。本実施形態において、入力情報は、少なくとも符号化すべき画像に適用された伝達関数の種別を示す伝達関数種別を含む。ユーザインタフェースは、例えば、「SDR」及び「HDR」という2つの選択肢のうち画像に適用すべき1つをユーザに選択させてもよい。この場合、SDR用の予め定義される1つの伝達関数、又はHDR用の予め定義される1つの伝達関数が画像に適用されたものと判定される。また、ユーザインタフェースは、複数の伝達関数の候補から、画像に適用すべき伝達関数をユーザに選択させてもよい。
他の例として、情報取得部203は、入力画像信号と多重化される補助信号から入力情報を取得してもよい。例えば、補助信号は、信号線上で画像信号が伝送されていない期間において信号取得部201により受信される。そして、情報取得部203は、信号取得部201において分離される補助信号から、画像に適用された伝達関数の種別を示す伝達関数種別を含む入力情報を取得し得る。
符号化部210は、信号取得部201により取得される画像信号により表現される画像を符号化して、符号化ビットストリームを生成する。符号化部210は、例えばMPEG−2、H.264/AVC又はH.265/HEVCなどのいかなる映像符号化方式に従って符号化処理を実行してもよい。符号化部210により実行される符号化処理は、典型的には、予測、直交変換、量子化及びエントロピー符号化といった様々な処理を含み、それら処理において多様なモード選択が実行される。ここでは主にイントラ予測及びインター予測におけるモード選択について説明するが、本実施形態のアイディアは、例えば変換ブロックサイズの選択、又はスケーラブル符号化のためのインターレイヤ予測の予測モードの選択など、いかなる種類のモード選択のために活用されてもよい。
制御部240は、情報取得部203により取得される入力情報により示される伝達関数に基づいて、符号化部210において画像を符号化する際のモード選択のための予測残差符号量又はモード符号量を制御する。典型的には、制御部240は、モード選択のためのコスト評価式において予測残差及びモード符号量の一方が他方に対して過小にも過大にも評価されないように、コスト評価式に算入される少なくとも1つの項を伝達関数に基づいて切り替える。なお、ここでは主に伝達関数の種別に基づいてコスト評価が制御される例を説明するが、伝達関数に関連付けられるダイナミックレンジの上限値など、伝達関数の他の属性に基づいてコスト評価が制御されてもよい。
図17Bは、本実施形態に係る画像処理装置の概略的な構成の第2の例を示すブロック図である。図17Bに示した画像処理装置200bは、信号処理部202、情報取得部204、記憶部207、符号化部210及び制御部240を備える。
信号処理部202は、何らかの伝送インタフェース若しくは装置内部の信号線を介して撮像装置から入力される原始的な画像信号を取得し、又は記憶部207により記憶されている映像ファイルから画像信号を取得する。そして、信号処理部202は、原始的な画像信号について例えばガンマ補正及び色変換を含み得るデジタル信号処理を実行し、所定の信号フォーマットで符号化の対象とされる画像信号を生成する。信号処理部202により画像に適用される信号フォーマット及び対応する伝達関数は、情報取得部204により取得される入力情報に基づいて決定される。そして、信号処理部202は、生成した画像信号を符号化部210へ出力する。
情報取得部204は、符号化部210により符号化される画像に適用される伝達関数に関する入力情報を取得する。例えば、情報取得部204は、画像処理装置200bが有するユーザインタフェースを介して入力情報を取得してよい。上述したように、入力情報は、少なくとも符号化すべき画像に適用される伝達関数の種別を示す伝達関数種別を含む。ユーザインタフェースは、例えば、「SDR」及び「HDR」という2つの選択肢のうち画像に適用すべき1つをユーザに選択させてもよい。また、ユーザインタフェースは、複数の伝達関数の候補から、画像に適用すべき伝達関数をユーザに選択させてもよい。
記憶部207は、様々な映像データを記憶するための記憶デバイスである。記憶部207は、例えば、信号変換前のデジタル画像信号を記録する映像ファイルを記憶してもよい。ユーザは、画像処理装置200bが有する入出力インタフェース(図示せず)を介して、他の記憶媒体に記憶されている映像ファイルを記憶部207に記憶させてもよい。また、記憶部207は、符号化部210により実行される符号化処理の結果として生成される符号化ビットストリームを含む映像ファイルを記憶してもよい。映像ファイルは、リクエストに応じて外部の装置へと出力されてもよい。
図17Aを用いて説明した第1の例と同様に、符号化部210は、信号処理部202により取得される画像信号により表現される画像を符号化して、符号化ビットストリームを生成する。制御部240は、情報取得部204により取得される入力情報により示される伝達関数の種別に基づいて、符号化部210において画像を符号化する際のモード選択のための予測残差符号量又はモード符号量を制御する。符号化部210により生成される符号化ビットストリームは、画像処理装置200bの外部の装置へと伝送されてもよく、又は記憶部207により映像ファイルとして記憶されてもよい。
[3−4.符号化部及び制御部の詳細な構成]
本項では、図17A及び図17Bに示した符号化部210及び制御部240のより具体的な構成について詳しく説明する。図18は、第2の実施形態に係る符号化部及び制御部の詳細な構成の一例を示すブロック図である。
(1)符号化部
図18を参照すると、符号化部210は、並び替えバッファ211、ブロック設定部212、減算部213、直交変換部214、量子化部215、可逆符号化部216、逆量子化部221、逆直交変換部222、加算部223、ループフィルタ224、フレームメモリ226、スイッチ227、モード選択部228、イントラ予測部230及びインター予測部235を備える。
並び替えバッファ211は、入力される画像信号により表現される一連の画像の画像データを、GOP構造に応じて並び替える。並び替えバッファ211は、並び替え後の画像データをブロック設定部212、イントラ予測部230及びインター予測部235へ出力する。
ブロック設定部212は、ピクチャに相当する画像の各々を複数のブロックへと分割する。MPEG−2及びH.264/AVCでは、ピクチャは固定的なサイズを有する複数のマクロブロックへと格子状に分割される。H.265/HEVCでは、ピクチャは可変的なサイズを有する複数の符号化単位へと四分木状に分割される。これらブロックは、さらに予測処理において1つ以上の予測ブロックへと分割され得る。
減算部213は、ブロック設定部212から入力される画像データと予測画像データとの差分である予測残差データを算出し、予測残差データを直交変換部214へ出力する。
直交変換部214は、減算部213から入力される予測残差データを、空間領域の画像データから周波数領域の変換係数データへと変換する。直交変換部214により実行される直交変換は、例えば離散コサイン変換又は離散サイン変換などであってよい。そして、直交変換部214は、変換係数データを量子化部215へ出力する。
量子化部215は、直交変換部214から入力される変換係数データを、所要の圧縮率が達成されるように決定される量子化ステップで量子化する。そして、量子化部215は、量子化後の変換係数データ(以下、量子化データという)を可逆符号化部216及び逆量子化部221へ出力する。
可逆符号化部216は、量子化部215から入力される量子化データを符号化することにより、符号化ビットストリームを生成する。また、可逆符号化部216は、デコーダにより参照される様々なパラメータを符号化して、符号化されたパラメータを符号化ビットストリームへ挿入する。可逆符号化部216により符号化されるパラメータは、伝達関数に関する情報、色域に関する情報、イントラ予測に関する情報及びインター予測に関する情報を含み得る。可逆符号化部216は、生成した符号化ビットストリームを、アプリケーションの目的に応じた出力先へと出力する。
逆量子化部221、逆直交変換部222及び加算部223は、ローカルデコーダを構成する。ローカルデコーダは、符号化されたデータから原画像を再構築する役割を有する。
逆量子化部221は、量子化部215により使用されたものと同じ量子化ステップで量子化データを逆量子化し、変換係数データを復元する。そして、逆量子化部221は、復元した変換係数データを逆直交変換部222へ出力する。
逆直交変換部222は、逆量子化部221から入力される変換係数データについて逆直交変換処理を実行することにより、予測残差データを復元する。そして、逆直交変換部222は、復元した予測残差データを加算部223へ出力する。
加算部223は、逆直交変換部222から入力される復元された予測残差データとイントラ予測部230又はインター予測部235により生成される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部223は、生成した復号画像データをループフィルタ224及びフレームメモリ226へ出力する。
ループフィルタ224は、復号画像の画質の向上を目的とするインループフィルタである。ループフィルタ224は、例えば、復号画像に現れるブロック歪みを軽減するためのデブロックフィルタを含んでもよい。また、ループフィルタ224は、復号画像にエッジオフセット又はバンドオフセットを加えるための適応オフセットフィルタを含んでもよい。ループフィルタ224は、フィルタリング後の復号画像データをフレームメモリ226へ出力する。
フレームメモリ226は、加算部223から入力されるフィルタリング前の復号画像データ、及びループフィルタ224から入力されるインループフィルタの適用後の復号画像データを記憶する。
スイッチ227は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ226から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部230に供給する。また、スイッチ227は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ226から読み出し、読み出した復号画像データを参照画像データとしてインター予測部235に供給する。
モード選択部228は、イントラ予測部230及びインター予測部235から入力されるコストの比較に基づいて、ブロックごとに予測手法を選択する。モード選択部228は、イントラ予測を選択したブロックについては、イントラ予測部230により生成される予測画像データを減算部213へ出力すると共に、イントラ予測に関する情報を可逆符号化部216へ出力する。また、モード選択部228は、インター予測を選択したブロックについては、インター予測部235により生成される予測画像データを減算部213へ出力すると共に、インター予測に関する情報を可逆符号化部216へ出力する。
イントラ予測部230は、原画像データ及び復号画像データに基づいて、イントラ予測処理を実行する。例えば、イントラ予測部230は、探索範囲に含まれる複数の候補モードの各々について、発生すると推定されるコストを評価する。コストの評価は、例えば上で説明したコスト評価式(1)又は類似する評価式に従って行われる。典型的には、コスト評価式は、予測残差符号量の項とモード符号量の項とを含む。本実施形態では、これら予測残差符号量の項及びモード符号量の項の少なくとも一方が、後述するコスト制御部241により伝達関数の種別に基づいて制御される。イントラ予測部230は、複数の候補モードにわたるコストの評価結果に基づいて、コストが最小となる予測モードを最良の予測モードとして選択する。また、イントラ予測部230は、選択した最良の予測モードに従って予測画像データを生成する。そして、イントラ予測部230は、最良の予測モード(予測方向及び予測ブロックサイズなど)を示す予測モード情報を含むイントラ予測に関する情報、対応するコスト、及び予測画像データを、モード選択部228へ出力する。
インター予測部235は、原画像データ及び復号画像データに基づいて、インター予測処理(動き補償)を実行する。例えば、インター予測部235は、探索範囲に含まれる複数の候補モードの各々について、発生すると推定されるコストを評価する。イントラ予測のケースと同様、コストの評価は、典型的に予測残差符号量の項とモード符号量の項とを含むコスト評価式に従って行われる。本実施形態では、これら予測残差符号量の項及びモード符号量の項の少なくとも一方が、後述するコスト制御部241により伝達関数の種別に基づいて制御される。インター予測部235は、複数の候補モードにわたるコストの評価結果に基づいて、コストが最小となる予測モードを最良の予測モードとして選択する。また、インター予測部235は、選択した最良の予測モードに従って予測画像データを生成する。そして、インター予測部235は、最良の予測モード(動きベクトル、参照ピクチャ及び予測ブロックサイズなど)を示す予測モード情報を含むインター予測に関する情報、対応するコスト、及び予測画像データを、モード選択部228へ出力する。
(2)制御部
図18を参照すると、制御部240は、コスト制御部241及び設定値記憶部243を備える。コスト制御部241は、符号化される画像に適用される伝達関数の種別を、情報取得部203又は204から入力される入力情報に基づいて判定する。そして、コスト制御部241は、判定した伝達関数の種別に基づいて、符号化部210の1つ以上のセクションにおけるモード選択のためのコストの評価を制御する。より具体的には、コスト制御部241は、例えば、コスト評価式に算入される予測残差符号量及びモード符号量のうちの一方をスケーリングすることにより、コスト評価における予測残差の寄与とモード情報の寄与との間のバランスを調整することができる。コスト評価の際に、複数の候補モードにわたる予測残差符号量の変動に対してモード符号量の変動が大きい場合、モード選択へのモード符号量の寄与が予測残差符号量の寄与と比較して過剰となり、結果的に予測残差符号量の変動を過小評価した状態で最適なモードが決定される。逆に、複数の候補モードにわたる予測残差符号量の変動に対してモード符号量の変動が小さい場合、モード選択へのモード符号量の寄与が予測残差符号量の寄与と比較して過少となり、結果的にモード符号量の変動を過小評価した状態で最適なモードが決定される。そのため、これら符号量の寄与を良好に調整して両者の間のバランスを最適化し、適正なコスト評価を行うことが有益である。
第1の例として、符号量のスケーリングは、予め定義されるコスト値の複数のセットのうちコスト評価において使用すべきセットを伝達関数の種別に依存して設定することにより行われてもよい。予測残差は予め定義されることができないため、第1の例では、モード符号量(例えば、式(1)におけるRの項)が候補モードごとに定義され得る。画像に第1の伝達関数が適用されている場合にはコスト値の第1のセットが設定され、画像に第2の伝達関数が適用されている場合にはコスト値の第2のセットが設定され得る。典型的には、第1のダイナミックレンジに対応する第1の伝達関数(例えば、HDR用の伝達関数)が画像に適用されている場合に設定されるコスト値のセットは、より狭い第2のダイナミックレンジに対応する第2の伝達関数(SDR用の伝達関数)が画像に適用されている場合に設定されるコスト値のセットと比較して、より小さいモード符号量を定義する。それにより、推定される予測残差の縮小に合わせてモード符号量をも小さくして、良好なバランスで適正なコスト評価を行うことができる。
第2の例として、符号量のスケーリングは、伝達関数の種別に対応するオフセットの加算(若しくは減算)、又は伝達関数の種別に対応する係数の乗算(又は減算)によって行われてもよい。この場合、オフセット又は係数は、予測残差符号量及びモード符号量のいずれに適用されてもよい。例えば、コスト制御部241は、HDR用の伝達関数が画像に適用されている場合に、予測誤差符号量を増加させ又はモード符号量を減少させてもよい。また、コスト制御部241は、SDR用の伝達関数が画像に適用されている場合に、予測誤差符号量を減少させ又はモード符号量を増加させてもよい。
図19は、上述した第1の例に係る、伝達関数の種別に基づくモード符号量の切り替えの一例について説明するための説明図である。図19の左上に示したコスト値セットC1は、SDR用の伝達関数が適用されている場合にコスト評価式に算入されるべき、M個の候補モードのそれぞれのモード符号量Ri,SDR(i=0,…,M−1)を含む。コスト値セットC2は、HDR用の伝達関数が適用されている場合にコスト評価式に算入されるべき、M個の候補モードのそれぞれのモード符号量Ri,HDR(i=0,…,M−1)を含む。設定値記憶部243は、予め定義されるこのようなコスト値セットC1及びC2を記憶する。図示したように、i番目の候補モードについて、コスト値セットC2に含まれるモード符号量Ri,HDRは、コスト値セットC1に含まれるモード符号量Ri,SDRよりも小さい。設定値記憶部243は、3つ以上の伝達関数の種別にそれぞれ関連付けられる3つ以上のコスト値セットを記憶してもよい。コスト制御部241は、このように異なる複数の伝達関数にそれぞれ関連付けられる複数のコスト値セットのうちの伝達関数の種別に対応する1つを、モード選択を行う符号化部210の1つ以上のセクションX1〜Xnに設定し得る。
なお、図19の例に限定されず、設定値記憶部243は、予測残差符号量若しくはモード符号量をスケーリングする際に使用されるパラメータ(例えば、オフセット又は係数)を1つ以上の伝達関数に関連付けて予め記憶してもよい。
上述したように、符号化部210は、イントラ予測を実行するイントラ予測部230を含む。コスト制御部241により制御される予測残差符号量又はモード符号量は、イントラ予測部230により、イントラ予測における複数の候補モードからのモード選択の際に使用されてもよい。また、符号化部210は、インター予測を実行するインター予測部235を含む。コスト制御部241により制御される予測残差符号量又はモード符号量は、インター予測部235により、インター予測における複数の候補モードからのモード選択の際に使用されてもよい。また、符号化部210は、イントラ予測又はインター予測である予測手法の選択を実行するモード選択部228を含む。コスト制御部241により制御される予測残差符号量又はモード符号量は、モード選択部228により、こうした予測手法の選択の際に使用されてもよい。
[3−5.処理の流れ]
図20は、本実施形態に係る符号化制御処理の流れの一例を示すフローチャートである。ここで説明する符号化制御処理は、映像を構成する個々の画像について繰り返されてよい。複数の画像にわたって変化しないパラメータを取得し又は設定するための処理ステップは、2回目以降の繰り返しにおいてスキップされてもよい。なお、ここでは、説明の簡明さのために、モード選択の制御に直接的に関連しない処理ステップについての説明は省略される。
図20を参照すると、まず、信号取得部201又は信号処理部202は、光と画像信号との間の変換に関する伝達関数に基づいて生成された画像信号を取得する(ステップS210)。ここで取得される画像信号は、符号化部210へ出力される。
次に、情報取得部203又は204は、符号化部210により符号化される画像に適用された伝達関数に関する入力情報を、ユーザインタフェースを介して又は入力画像信号と多重化される補助信号から取得する(ステップS212)。ここで取得される入力情報は、制御部240へ出力される。
次に、コスト制御部241は、上述した入力情報により示される伝達関数の種別に基づいて、符号化部210におけるモード選択の際に使用すべきパラメータを設定する(ステップS214)。ここで設定されるパラメータは、候補モードごとに予め定義されるモード符号量のセットであってもよく、又は予測残差符号量若しくはモード符号量に適用されるオフセット若しく係数であってもよい。
その後の処理は、処理対象の画像に設定される複数のブロックのうちの各々について繰り返される。各繰り返しにおける処理対象のブロックを、ここでは注目ブロックという。
符号化部210のイントラ予測部230は、注目ブロックについて複数の候補モードにわたってコストを評価し、それら候補モードのコスト評価に基づいて最良のイントラ予測モードを選択する(ステップS220)。ここでのコスト評価は、予測残差符号量及びモード符号量を算入するコスト評価式を用いて行われ得る。ある例において、モード符号量は、コスト制御部241により設定されるコスト値のセットから選択される。他の例において、予測残差符号量及びモード符号量の一方は、コスト制御部241により設定されるパラメータを用いてスケーリングされる。
インター予測部235は、注目ブロックについて複数の候補モードにわたってコストを評価し、それら候補モードのコスト評価に基づいて最良のインター予測モードを選択する(ステップS230)。ここでのコスト評価もまた、予測残差符号量及びモード符号量を算入するコスト評価式を用いて行われ得る。ある例において、モード符号量は、コスト制御部241により設定されるコスト値のセットから選択される。他の例において、予測残差符号量及びモード符号量の一方は、コスト制御部241により設定されるパラメータを用いてスケーリングされる。
次に、モード選択部228は、注目ブロックについて、イントラ予測及びインター予測のうちより良好な符号化効率を実現する予測手法を選択する(ステップS240)。ここでの予測手法の選択もまた、コスト評価に基づいて行われる。但し、モード選択部228は、イントラ予測部230及びインター予測部235において導出されたコスト評価を再利用してよい。代替的に、モード選択部228は、イントラ予測とインター予測との比較のためのコスト値を再計算してもよい。また、モード選択部228によるコスト値の再計算のために、ステップS220及びステップS230において使用されたものとは異なるコスト値のセットが採用されてもよい。
ステップS220〜ステップS240は、ピクチャ内の全てのブロックについて処理が終了するまで繰り返される(ステップS280)。そして、全てのピクチャについて処理が終了すると、図20に示した符号化制御処理は終了する(ステップS290)。
[3−6.第2の実施形態のまとめ]
ここまで、図16A〜図20を用いて、本開示に係る技術の第2の実施形態について説明した。上述した実施形態では、光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する際に、伝達関数に基づいて、画像を符号化する際のモード選択のための予測残差符号量又はモード符号量が制御される。かかる構成によれば、画一的ではなく、どういった伝達関数が画像に適用されるかに依存して異なる評価式でモード選択のためのコスト評価を行うことができる。それにより、不自然な予測モードの偏りが生じることを防止し、予測精度を改善して画像の歪みを軽減することが可能となる。
また、ある実施例では、第1のダイナミックレンジに対応する第1の伝達関数が画像に適用されている場合に、第1のダイナミックレンジよりも狭い第2のダイナミックレンジに対応する第2の伝達関数が画像に適用されている場合よりもモード符号量が少なくなるように、モード符号量が制御され得る。かかる構成によれば、特定のダイナミックレンジを前提としてチューニングされたコスト評価式を、拡張されたダイナミックレンジのために簡易に再利用することができる。特に、候補モードの数は、映像符号化方式に固有であって変化しない。そのため、候補モードそれぞれのモード符号量を複数セット予め定義しておいて使用すべきセットを伝達関数に基づいて切り替えるという、処理コストの少ない手法を採用することができる。
他の実施例では、第1のダイナミックレンジに対応する第1の伝達関数が画像に適用されている場合に予測残差符号量又はモード符号量をスケーリングすることにより、モード符号量が制御され得る。かかる構成によれば、第1の伝達関数(例えば、HDR用の伝達関数)が適用されるケースでの画質の劣化を防止する一方で、第1の伝達関数とは異なる第2の伝達関数が適用されるケースにおいて、第2の伝達関数のために最適化された処理(例えば、SDR用の伝達関数について最適化された既存の評価式でのコスト評価)を改変することなく実行することができる。
一例として、上記第1のダイナミックレンジは、100nitより高い輝度での表示を可能とするためのダイナミックレンジであってよく、上記第2のダイナミックレンジは、100nitの輝度を上限とするダイナミックレンジであってよい。それにより、既存のSDR映像のために設計されたエンコーダを、画質の劣化を防止しつつ例えばHLG、ST2084又はS−Log3といった伝達関数が適用されたHDR映像を符号化するために活用することが可能となる。
<4.ハードウェア構成例>
前節までに説明した実施形態は、ソフトウェア、ハードウェア、及びソフトウェアとハードウェアとの組合せのいずれを用いて実現されてもよい。画像処理装置100a、100b、100c、200a又は200bがソフトウェアを使用する場合、ソフトウェアを構成するプログラムは、例えば、装置の内部又は外部に設けられる記憶媒体(非一時的な媒体:non-transitory media)に予め格納される。そして、各プログラムは、例えば、実行時にRAM(Random Access Memory)に読み込まれ、CPU(Central Processing Unit)などのプロセッサにより実行される。
図21は、上述した実施形態のうちの1つ以上を適用可能な装置のハードウェア構成の一例を示すブロック図である。図21を参照すると、画像処理装置900は、システムバス910、画像処理チップ920及びオフチップメモリ990を備える。画像処理チップ920は、n個(nは1以上)の処理回路930−1、930−2、…、930−n、参照バッファ940、システムバスインタフェース950及びローカルバスインタフェース960を含む。
システムバス910は、画像処理チップ920と外部モジュール(例えば、中央制御機能、アプリケーション機能、通信インタフェース又はユーザインタフェースなど)との間の通信路を提供する。処理回路930−1、930−2、…、930−nは、システムバスインタフェース950を介してシステムバス910と接続され、及びローカルバスインタフェース960を介してオフチップメモリ990と接続される。処理回路930−1、930−2、…、930−nは、オンチップメモリ(例えば、SRAM)に相当し得る参照バッファ940にもアクセスすることができる。オフチップメモリ990は、例えば、画像処理チップ920により処理される画像データを記憶するフレームメモリであってよい。一例として、処理回路930−1は画像信号の変換のために利用されてもよく、処理回路930−2は画像信号の符号化のために利用されてもよい。なお、これら処理回路は、同一の画像処理チップ920ではなく、別個のチップ上に形成されてもよい。
<5.総括>
本開示に係る技術は、ここまでに詳しく説明した仕組みに従って、多様化しつつある信号表現に必ずしも十分に適応できていない例えばデジタルビデオカメラ、デジタルカムコーダ、ビデオエンコーダ、又はエンコード機能を有する任意の種類の既存の装置に対する改善を提供する。本開示に係る技術によれば、HDR映像を再生する際にダイナミックレンジの拡張に伴って拡大されるコーデック歪みが軽減され、良好な画質でHDR映像を再生することが可能となる。本開示に係る技術は、静止画の符号化へと応用されてもよい。
本明細書では、説明の簡明さのために、特定の映像符号化方式に固有の専門用語を一部で使用しているが、本開示に係る技術は、そうした用語には限定されず、任意の映像符号化方式に準拠するエンコーダに広く適用可能である。例えば、輝度(luminance/luma)及び色差(chrominance/chroma)との語は、利用される表色系に依存して、明度(brightness)及び彩度(saturation)などの他の語にそれぞれ置き換えられてもよい。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
また、本明細書に記載された効果は、あくまで説明的又は例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果と共に、又は上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏し得る。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、
前記伝達関数に基づいて、前記符号化部において前記画像の各部分領域に割り当てられる符号量を制御する制御部と、
を備える画像処理装置。
(2)
前記制御部は、第1のダイナミックレンジに対応する第1の伝達関数及び前記第1のダイナミックレンジよりも狭い第2のダイナミックレンジに対応する第2の伝達関数のうちの前記第1の伝達関数が前記画像に適用されている場合に、各部分領域に割り当てられる前記符号量を当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御する、前記(1)に記載の画像処理装置。
(3)
前記制御部は、各部分領域について使用される量子化ステップを、前記輝度成分及び前記色差成分のうちの前記少なくとも一方に依存して調整することにより、各部分領域に割り当てられる前記符号量を制御する、前記(2)に記載の画像処理装置。
(4)
前記制御部は、前記輝度成分及び前記色差成分のうちの前記少なくとも一方の強さがより強い部分領域により多くの符号量が割り当てられるように、各部分領域について使用される前記量子化ステップをスケーリングする、前記(3)に記載の画像処理装置。
(5)
前記第1のダイナミックレンジは、100nitより高い輝度での表示を可能とするためのダイナミックレンジである、前記(2)〜(4)のいずれか1項に記載の画像処理装置。
(6)
前記制御部は、前記輝度成分及び前記色差成分のうちの一方のみの強さに応じて、各部分領域の前記量子化ステップをスケーリングする、前記(4)に記載の画像処理装置。
(7)
前記制御部は、前記画像に適用される前記伝達関数に関する入力情報に基づいて、前記伝達関数の種別を判定し、判定した前記種別に基づいて各部分領域に割り当てられる前記符号量を制御する、前記(1)〜(6)のいずれか1項に記載の画像処理装置。
(8)
前記入力情報は、ユーザインタフェースを介して取得された情報である、前記(7)に記載の画像処理装置。
(9)
前記入力情報は、前記画像を表現する入力画像信号と多重化される補助信号から取得される、前記(7)に記載の画像処理装置。
(10)
前記部分領域は、量子化処理の処理単位に相当するブロックである、前記(1)〜(9)のいずれか1項に記載の画像処理装置。
(11)
光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化することと、
前記伝達関数に基づいて、前記符号化の際に前記画像の各部分領域に割り当てられる符号量を制御することと、
を含む画像処理方法。
(12)
画像処理装置のプロセッサを、
光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、
前記伝達関数に基づいて、前記符号化部において前記画像の各部分領域に割り当てられる符号量を制御する制御部と、
として機能させるためのプログラム。
(13)
100nitより高い輝度での表示を可能とするための光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、
前記符号化部において前記画像の各部分領域に割り当てられる符号量を、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御する制御部と、
を備える画像処理装置。
(14)
前記制御部は、各部分領域について使用される量子化ステップを、前記輝度成分及び前記色差成分のうちの前記少なくとも一方に依存して調整することにより、各部分領域に割り当てられる前記符号量を制御する、前記(13)に記載の画像処理装置。
(15)
前記制御部は、前記輝度成分及び前記色差成分のうちの前記少なくとも一方の強さがより強い部分領域により多くの符号量が割り当てられるように、各部分領域について使用される前記量子化ステップをスケーリングする、前記(14)に記載の画像処理装置。
(16)
前記制御部は、各部分領域について所要の圧縮率に基づいて決定される前記量子化ステップを、前記輝度成分及び前記色差成分のうちの前記少なくとも一方に依存してスケーリングし、
前記符号化部は、スケーリングされた前記量子化ステップで各部分領域の変換係数を量子化する、
前記(15)に記載の画像処理装置。
(17)
前記制御部は、前記輝度成分及び前記色差成分のうちの一方のみの強さに応じて、各部分領域の前記量子化ステップをスケーリングする、前記(15)又は前記(16)に記載の画像処理装置。
(18)
前記部分領域は、量子化処理の処理単位に相当するブロックである、前記(13)〜(17)のいずれか1項に記載の画像処理装置。
(19)
100nitより高い輝度での表示を可能とするための光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化することと、
前記符号化の際に前記画像の各部分領域に割り当てられる符号量を、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御することと、
を含む画像処理方法。
(20)
画像処理装置のプロセッサを、
100nitより高い輝度での表示を可能とするための光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、
前記符号化部において前記画像の各部分領域に割り当てられる符号量を、当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御する制御部と、
として機能させるためのプログラム。
100a,100b,100c 画像処理装置
101 信号取得部
102 信号処理部
103,104 情報取得部
107 記憶部
110 符号化部
115 量子化部
140,140c 制御部
200a,200b 画像処理装置
201 信号取得部
202 信号処理部
203,204 情報取得部
207 記憶部
210 符号化部
228 モード選択部
230 イントラ予測部
235 インター予測部
240 制御部

Claims (20)

  1. 光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、
    前記伝達関数に基づいて、前記符号化部において前記画像の各部分領域に割り当てられる符号量を、前記各部分領域のうち、輝度成分及び色差成分のうちの少なくとも一方の強さがより強い前記部分領域により多くの前記符号量が割り当てられるように、制御する制御部と、
    を備える画像処理装置。
  2. 前記制御部は、第1のダイナミックレンジに対応する第1の伝達関数及び前記第1のダイナミックレンジよりも狭い第2のダイナミックレンジに対応する第2の伝達関数のうちの前記第1の伝達関数が前記画像に適用されている場合に、前記各部分領域に割り当てられる前記符号量を当該部分領域の輝度成分及び色差成分のうちの少なくとも一方に依存して制御する、請求項1に記載の画像処理装置。
  3. 前記制御部は、前記各部分領域について使用される量子化ステップを、前記輝度成分及び前記色差成分のうちの前記少なくとも一方に依存して調整することにより、前記各部分領域に割り当てられる前記符号量を制御する、請求項2に記載の画像処理装置。
  4. 前記制御部は、前記輝度成分及び前記色差成分のうちの前記少なくとも一方の強さがより強い前記部分領域により多くの符号量が割り当てられるように、前記各部分領域について使用される前記量子化ステップをスケーリングする、請求項3に記載の画像処理装置。
  5. 前記第1のダイナミックレンジは、100nitより高い輝度での表示を可能とするためのダイナミックレンジである、請求項2〜4のいずれか1項に記載の画像処理装置。
  6. 前記制御部は、前記輝度成分及び前記色差成分のうちの一方のみの強さに応じて、前記各部分領域の前記量子化ステップをスケーリングする、請求項4に記載の画像処理装置。
  7. 前記制御部は、前記画像に適用される前記伝達関数に関する入力情報に基づいて、前記伝達関数の種別を判定し、判定した前記種別に基づいて前記各部分領域に割り当てられる前記符号量を制御する、請求項1〜6のいずれか1項に記載の画像処理装置。
  8. 前記入力情報は、ユーザインタフェースを介して取得された情報である、請求項7に記載の画像処理装置。
  9. 前記入力情報は、前記画像を表現する入力画像信号と多重化される補助信号から取得される、請求項7に記載の画像処理装置。
  10. 前記部分領域は、量子化処理の処理単位に相当するブロックである、請求項1〜9のいずれか1項に記載の画像処理装置。
  11. 光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化することと、
    前記伝達関数に基づいて、前記符号化の際に前記画像の各部分領域に割り当てられる符号量を、前記各部分領域のうち、輝度成分及び色差成分のうちの少なくとも一方の強さがより強い前記部分領域により多くの前記符号量が割り当てられるように、制御することと、
    を含む画像処理方法。
  12. 画像処理装置のプロセッサを、
    光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、
    前記伝達関数に基づいて、前記符号化部において前記画像の各部分領域に割り当てられる符号量を、前記各部分領域のうち、輝度成分及び色差成分のうちの少なくとも一方の強さがより強い前記部分領域により多くの前記符号量が割り当てられるように、制御する制御部と、
    として機能させるためのプログラム。
  13. 100nitより高い輝度での表示を可能とするための光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、
    前記符号化部において前記画像の各部分領域に割り当てられる符号量を、前記各部分領域のうち、輝度成分及び色差成分のうちの少なくとも一方の強さがより強い前記部分領域により多くの前記符号量が割り当てられるように、制御する制御部と、
    を備える画像処理装置。
  14. 前記制御部は、前記各部分領域について使用される量子化ステップを、前記輝度成分及び前記色差成分のうちの前記少なくとも一方に依存して調整することにより、前記各部分領域に割り当てられる前記符号量を制御する、請求項13に記載の画像処理装置。
  15. 前記制御部は、前記輝度成分及び前記色差成分のうちの前記少なくとも一方の強さがより強い前記部分領域により多くの符号量が割り当てられるように、前記各部分領域について使用される前記量子化ステップをスケーリングする、請求項14に記載の画像処理装置。
  16. 前記制御部は、前記各部分領域について所要の圧縮率に基づいて決定される前記量子化ステップを、前記輝度成分及び前記色差成分のうちの前記少なくとも一方に依存してスケーリングし、
    前記符号化部は、スケーリングされた前記量子化ステップで前記各部分領域の変換係数を量子化する、
    請求項15に記載の画像処理装置。
  17. 前記制御部は、前記輝度成分及び前記色差成分のうちの一方のみの強さに応じて、前記各部分領域の前記量子化ステップをスケーリングする、請求項15又は請求項16に記載の画像処理装置。
  18. 前記部分領域は、量子化処理の処理単位に相当するブロックである、請求項13〜17のいずれか1項に記載の画像処理装置。
  19. 100nitより高い輝度での表示を可能とするための光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化することと、
    前記符号化の際に前記画像の各部分領域に割り当てられる符号量を、前記各部分領域のうち、輝度成分及び色差成分のうちの少なくとも一方の強さがより強い前記部分領域により多くの前記符号量が割り当てられるように、制御することと、
    を含む画像処理方法。
  20. 画像処理装置のプロセッサを、
    100nitより高い輝度での表示を可能とするための光と画像信号との間の変換に関する伝達関数に基づいて取得される画像を符号化する符号化部と、
    前記符号化部において前記画像の各部分領域に割り当てられる符号量を、前記各部分領域のうち、輝度成分及び色差成分のうちの少なくとも一方の強さがより強い前記部分領域により多くの前記符号量が割り当てられるように、制御する制御部と、
    として機能させるためのプログラム。
JP2016245999A 2016-12-19 2016-12-19 画像処理装置、画像処理方法及びプログラム Active JP6822122B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2016245999A JP6822122B2 (ja) 2016-12-19 2016-12-19 画像処理装置、画像処理方法及びプログラム
PCT/JP2017/037597 WO2018116604A1 (ja) 2016-12-19 2017-10-17 画像処理装置、画像処理方法及びプログラム
KR1020197016935A KR20190097012A (ko) 2016-12-19 2017-10-17 화상 처리 장치, 화상 처리 방법 및 프로그램
BR112019011922-1A BR112019011922A2 (pt) 2016-12-19 2017-10-17 dispositivo de processamento de imagem, método de processamento de imagem, e programa.
CN201780076637.0A CN110050463A (zh) 2016-12-19 2017-10-17 图像处理设备、图像处理方法和程序
US16/468,954 US20190349581A1 (en) 2016-12-19 2017-10-17 Image processing device, image processing method, and program
EP17885012.9A EP3557868B1 (en) 2016-12-19 2017-10-17 Image processing device, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016245999A JP6822122B2 (ja) 2016-12-19 2016-12-19 画像処理装置、画像処理方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2018101866A JP2018101866A (ja) 2018-06-28
JP2018101866A5 JP2018101866A5 (ja) 2020-01-30
JP6822122B2 true JP6822122B2 (ja) 2021-01-27

Family

ID=62627159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016245999A Active JP6822122B2 (ja) 2016-12-19 2016-12-19 画像処理装置、画像処理方法及びプログラム

Country Status (7)

Country Link
US (1) US20190349581A1 (ja)
EP (1) EP3557868B1 (ja)
JP (1) JP6822122B2 (ja)
KR (1) KR20190097012A (ja)
CN (1) CN110050463A (ja)
BR (1) BR112019011922A2 (ja)
WO (1) WO2018116604A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018025466A1 (ja) * 2016-08-04 2018-02-08 ソニー株式会社 画像処理装置、及び画像処理方法
EP3497925B1 (en) 2016-08-09 2022-11-23 Contrast, Inc. Real-time hdr video for vehicle control
JP6822121B2 (ja) * 2016-12-19 2021-01-27 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
JP6852411B2 (ja) * 2017-01-19 2021-03-31 ソニー株式会社 映像信号処理装置、映像信号処理方法およびプログラム
US10453221B2 (en) * 2017-04-10 2019-10-22 Intel Corporation Region based processing
US10951888B2 (en) * 2018-06-04 2021-03-16 Contrast, Inc. Compressed high dynamic range video
US11638019B2 (en) * 2020-07-29 2023-04-25 Alibaba Group Holding Limited Methods and systems for prediction from multiple cross-components
CN112837788A (zh) * 2021-02-26 2021-05-25 西安万像电子科技有限公司 医学图像传输方法、装置及存储介质
CN113923318B (zh) * 2021-12-16 2022-03-04 成都索贝数码科技股份有限公司 一种实现hd和4k hdr视频信号同传输的方法以及sdi设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8175158B2 (en) * 2008-01-04 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction parameter determination
CN103891294B (zh) * 2011-04-28 2017-09-01 皇家飞利浦有限公司 用于hdr图像编码和解码的装置与方法
JP6202330B2 (ja) * 2013-10-15 2017-09-27 ソニー株式会社 復号装置および復号方法、並びに符号化装置および符号化方法
KR102414567B1 (ko) * 2014-02-25 2022-06-29 애플 인크. 비디오 인코딩 및 디코딩을 위한 적응형 전달 함수
US10136133B2 (en) * 2014-11-11 2018-11-20 Dolby Laboratories Licensing Corporation Rate control adaptation for high-dynamic range images
US20160309154A1 (en) * 2015-04-17 2016-10-20 Qualcomm Incorporated Dynamic range adjustment for high dynamic range and wide color gamut video coding
WO2016172361A1 (en) * 2015-04-21 2016-10-27 Vid Scale, Inc. High dynamic range video coding
CN107852512A (zh) * 2015-06-07 2018-03-27 夏普株式会社 基于亮度转换函数或视频色彩分量值的优化视频编码的系统及方法
US10244245B2 (en) * 2015-06-08 2019-03-26 Qualcomm Incorporated Content-adaptive application of fixed transfer function to high dynamic range (HDR) and/or wide color gamut (WCG) video data
JP6822121B2 (ja) * 2016-12-19 2021-01-27 ソニー株式会社 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
EP3557868A1 (en) 2019-10-23
WO2018116604A1 (ja) 2018-06-28
CN110050463A (zh) 2019-07-23
EP3557868A4 (en) 2019-11-13
KR20190097012A (ko) 2019-08-20
JP2018101866A (ja) 2018-06-28
EP3557868B1 (en) 2024-01-24
US20190349581A1 (en) 2019-11-14
BR112019011922A2 (pt) 2019-10-29

Similar Documents

Publication Publication Date Title
JP6822122B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6822123B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6822121B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN109155848B (zh) 用于高动态范围及宽色域视频译码的环路内样本处理
JP6882198B2 (ja) 高ダイナミックレンジ(hdr)および/または広色域(wcg)ビデオデータへの固定伝達関数のコンテンツ適応型適用
TWI601417B (zh) 可適性色彩空間轉換寫碼
US8213503B2 (en) Skip modes for inter-layer residual video coding and decoding
KR101311402B1 (ko) 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
US9571838B2 (en) Image processing apparatus and image processing method
TW201924336A (zh) 利用內容適應性空間變化量化之視訊寫碼
KR20200037272A (ko) 비디오 코딩에서 크로스-성분 동적 범위 조정 (cc-dra) 의 시스템 및 방법
WO2012153578A1 (ja) 画像処理装置及び画像処理方法
CA2615299A1 (en) Image encoding device, image decoding device, image encoding method, and image decoding method
KR20080015592A (ko) 영상의 부호화, 복호화 방법 및 장치
KR20110025888A (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 프로그램, 및 집적 회로
KR20070096737A (ko) 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
CN1695381A (zh) 在数字视频信号的后处理中使用编码信息和局部空间特征的清晰度增强
CN111937384A (zh) 视频编码中基于变换的量化与动态范围调整尺度推导的协调
TWI765903B (zh) 用於循環樣本處理之視訊寫碼工具
WO2019003676A1 (ja) 画像処理装置と画像処理方法およびプログラム
JP6269431B2 (ja) 画像処理装置、画像処理方法及び画像処理システム
CN114205586A (zh) 基于多色彩空间进行率失真优化的视频处理方法及应用
Gommelet et al. Optical-flow based nonlinear weighted prediction for SDR and backward compatible HDR video coding
AU2016200566B2 (en) Image processing device and method
CN114449279A (zh) 基于视频质量度量的视频编码

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190208

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190214

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190222

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190515

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191212

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201221

R151 Written notification of patent or utility model registration

Ref document number: 6822122

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151