JP6822121B2 - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP6822121B2
JP6822121B2 JP2016245983A JP2016245983A JP6822121B2 JP 6822121 B2 JP6822121 B2 JP 6822121B2 JP 2016245983 A JP2016245983 A JP 2016245983A JP 2016245983 A JP2016245983 A JP 2016245983A JP 6822121 B2 JP6822121 B2 JP 6822121B2
Authority
JP
Japan
Prior art keywords
image
unit
processing
image processing
transfer function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016245983A
Other languages
English (en)
Other versions
JP2018101863A5 (ja
JP2018101863A (ja
Inventor
孝明 渕江
孝明 渕江
広瀬 正樹
正樹 広瀬
敦雄 矢田
敦雄 矢田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2016245983A priority Critical patent/JP6822121B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to US16/469,020 priority patent/US11006113B2/en
Priority to PCT/JP2017/037600 priority patent/WO2018116605A1/ja
Priority to CN201780076634.7A priority patent/CN110050465B/zh
Priority to KR1020197016706A priority patent/KR20190097004A/ko
Priority to EP17885014.5A priority patent/EP3641315A4/en
Priority to BR112019011927-2A priority patent/BR112019011927A2/pt
Publication of JP2018101863A publication Critical patent/JP2018101863A/ja
Publication of JP2018101863A5 publication Critical patent/JP2018101863A5/ja
Application granted granted Critical
Publication of JP6822121B2 publication Critical patent/JP6822121B2/ja
Priority to US17/226,556 priority patent/US20210235089A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/642Adapting to different types of images, e.g. characters, graphs, black and white image portions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/10Cameras or camera modules comprising electronic image sensors; Control thereof for generating image signals from different wavelengths

Description

本開示は、画像処理装置、画像処理方法及びプログラムに関する。
近年、実世界の様子をより忠実に再現し又はより豊富な明るさ及び色彩で映像を表示することを可能とするための、映像信号表現の拡張が進められている。HDR(High Dynamic Range)は、従来の標準的なダイナミックレンジであるSDR(Standard Dynamic Range)よりも広い輝度ダイナミックレンジで画像又は映像を表現しようとする概念である。例えば、HLG(Hybrid Log-Gamma)、ST2084又はS−Log3といった伝達関数(トーンカーブともいう)で光を画像信号へと変換(及び、画像信号を光へと変換)することにより、100nitよりも高い輝度を有する実世界の光をディスプレイ上で再現することが可能となることが知られている(非特許文献1参照)。他の例として、ITU−Rにより標準化されたBT.2020は、これまで多くのアプリケーションで使用されてきたBT.709と比較して、より鮮やかな色彩を表現することを可能とする色域を定義している。
Association of Radio Industries and Businesses,"ESSENTIAL PARAMETER VALUES FOR THE EXTENDED IMAGE DYNAMIC RANGE TELEVISION (EIDRTV) SYSTEM FOR PROGRAMME PRODUCTION ARIB STANDARD",ARIB STD-B67 Version 1.0,July 3, 2015,[online],[2016年11月24日検索],インターネット<URL: http://www.arib.or.jp/english/html/overview/doc/2-STD-B67v1_0.pdf>
映像(若しくは映像を構成する個々の画像)を符号化し若しくは復号し、又はそうした映像を利用する既存の装置は、多様化しつつある映像信号表現に必ずしも十分に適応できていない。特定の表現手法を前提として最適化された処理パラメータは、必ずしも他の表現手法で表現される画像信号の処理のために適していない。静止画の画像処理についても同様の状況が考えられる。
従って、多様な表現手法で表現され得る画像を扱う場合に不適切な処理パラメータが使用されることを防止する仕組みが提供されることが望ましい。
本開示によれば、画像に適用される光と画像信号との間の変換に関する伝達関数及び前記画像に適用される色域の組み合わせに基づいて、前記画像に対する画像処理のための処理パラメータを決定する制御部と、前記制御部により決定される前記処理パラメータを用いて、前記画像処理を実行する処理部と、を備え、前記制御部が決定する前記処理パラメータは、前記伝達関数及び前記色域の組み合せごとに定義される、画像処理装置が提供される。
また、本開示によれば、画像に適用される光と画像信号との間の変換に関する伝達関数及び前記画像に適用される色域の組み合わせに基づいて、前記画像に対する画像処理のための処理パラメータを決定することと、決定される前記処理パラメータを用いて、前記画像処理を実行することと、を含み、前記決定することが決定する前記処理パラメータは、前記伝達関数及び前記色域の組み合せごとに定義される、画像処理方法が提供される。
また、本開示によれば、画像処理装置のプロセッサを、画像に適用される光と画像信号との間の変換に関する伝達関数及び前記画像に適用される色域の組み合わせに基づいて、前記画像に対する画像処理のための処理パラメータを決定する制御部と、前記制御部により決定される前記処理パラメータを用いて、前記画像処理を実行する処理部と、として機能させ、前記制御部が決定する前記処理パラメータは、前記伝達関数及び前記色域の組み合せごとに定義される、ためのプログラムが提供される。
本開示に係る技術によれば、多様な表現手法で表現され得る画像を扱う場合に不適切な処理パラメータが使用されることを防止することができる。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果と共に、又は上記の効果に代えて、本明細書に示されたいずれかの効果、又は本明細書から把握され得る他の効果が奏されてもよい。
SDR映像の輝度ダイナミックレンジについて説明するための説明図である。 HDR映像の輝度ダイナミックレンジについて説明するための説明図である。 SDR映像の画像信号のコーデック歪みについて説明するための説明図である。 HDR映像の画像信号のコーデック歪みについて説明するための説明図である。 HDR−SDR変換を経て拡大されるコーデック歪みについて説明するための説明図である。 SDR用の信号フォーマット及びHDR用の信号フォーマットのOETFの例を示す説明図である。 SDR用のBT.709に対してHDR用のS−Log3が画像情報をどの程度圧縮しているかを表すグラフを示している。 BT.709及びBT.2020により定義されている色域について説明するための説明図である。 伝達関数の種別の違いが符号化難易度に与える影響について説明するための説明図である。 一実施形態に係る画像処理システムの構成の第1の例を示す説明図である。 一実施形態に係る画像処理システムの構成の第2の例を示す説明図である。 第1の実施形態に係る画像処理装置の概略的な構成の第1の例を示すブロック図である。 第1の実施形態に係る画像処理装置の概略的な構成の第2の例を示すブロック図である。 第1の実施形態に係る制御部及び符号化部の詳細な構成の一例を示すブロック図である。 符号化難易度の高いブロック及び符号化難易度の低いブロックの例を示す説明図である。 SDRのケースでの量子化ステップの調整の一例について説明するための説明図である。 既存の手法に係るHDRのケースでの量子化ステップの調整の一例について説明するための説明図である。 第1の実施形態に係る量子化ステップの調整の一例について説明するための説明図である。 第1の実施形態に係る符号化制御処理の流れの一例を示すフローチャートである。 SDRにおける画素分類処理への色域の影響の一例について説明するための説明図である。 HDRにおける画素分類処理への伝達関数の影響の一例について説明するための第1の説明図である。 HDRにおける画素分類処理への伝達関数の影響の一例について説明するための第2の説明図である。 HDRにおける画素分類処理への色域の影響の一例について説明するための説明図である。 第2の実施形態に係る画像処理装置の概略的な構成の一例を示すブロック図である。 第2の実施形態に係る制御部及び符号化部の詳細な構成の一例を示すブロック図である。 第2の実施形態に係る符号化制御処理の流れの一例を示すフローチャートである。 第2の実施形態の一変形例に係る画像処理装置の構成の一例を示すブロック図である。 図19を用いて説明した変形例に係る画像処理の流れの一例を示すフローチャートである。 装置のハードウェア構成の一例を示すブロック図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、以下の順序で説明を行う。
1.関連技術の説明
1−1.SDR及びHDR
1−2.コーデック歪み
1−3.伝達関数
1−4.色域
2.第1の実施形態
2−1.導入
2−2.システムの概要
2−3.画像処理装置の概略的な構成
2−4.符号化部及び制御部の詳細な構成
2−5.処理の流れ
2−6.第1の実施形態のまとめ
3.第2の実施形態
3−1.導入
3−2.システムの概要
3−3.画像処理装置の概略的な構成
3−4.符号化部及び制御部の詳細な構成
3−5.処理の流れ
3−6.変形例
3−7.第2の実施形態のまとめ
4.ハードウェア構成例
5.総括
<1.関連技術の説明>
[1−1.SDR及びHDR]
近年、実世界の様子をより忠実に再現し又はより豊富な明るさ及び色彩で映像を再生することを可能とするための、映像信号表現の拡張が進められている。HDRは、従来の標準的なダイナミックレンジであるSDRよりも広い輝度ダイナミックレンジで画像又は映像を表現しようとする概念である。
図1Aは、SDR映像の輝度ダイナミックレンジについて説明するための説明図である。図1Aの縦軸は輝度[nit]を表す。自然界の最大輝度は20000nitに達することがあり、一般的な被写体の輝度は例えば最大で12000nit程度である。イメージセンサのダイナミックレンジの上限は、自然界の最大輝度よりも低く、例えば4000nitであり得る。デジタルカメラ又はデジタルカムコーダといった撮像装置は、イメージセンサにおいて入射光を光電変換することにより生成される電気信号を、イメージセンサの後段の信号処理回路において例えば10ビットのデジタル画像信号へと変換する。旧来のSDR映像の信号フォーマットでは、こうした変換の際に100nitを上回る高輝度部分の階調が失われる。撮像装置により生成されたデジタル画像信号は、例えば伝送又は記録といったアプリケーションの目的に応じて、所定の映像符号化方式(ビデオコーデックともいう)で符号化され、符号化ビットストリームへと変換される。そして、SDR映像を表示する際には、符号化ビットストリームを復号することにより取得されるデジタル画像信号が表示装置へと提供され、上限100nitの表示輝度で映像が再生される。
図1Bは、HDR映像の輝度ダイナミックレンジについて説明するための説明図である。SDRのケースと同様に、撮像装置は、イメージセンサへの入射光をアナログ電気信号へと変換し、さらにアナログ電気信号を例えば10ビットのデジタル画像信号へと変換する。HDR映像の信号フォーマットは、こうした変換の際に、100nitを上回る高輝度部分の階調を維持し、数百又は数千nitという上限までの輝度で映像を再生することを可能とする。撮像装置により生成されたデジタル画像信号は、やはりアプリケーションの目的に応じて所定の映像符号化方式で符号化され、符号化ビットストリームへと変換される。HDR映像を表示する際には、符号化ビットストリームを復号することにより取得されるデジタル画像信号が表示装置へと提供され、100nitより高い表示輝度を含む輝度ダイナミックレンジで映像が再生される。
なお、SDRとHDRとを分類する基準として、ここでは輝度ダイナミックレンジの上限が100nitに等しいか又はそれを下回るケースをSDR、上限が100nitを上回るケースをHDRと仮定している。しかしながら、将来のある時点において、100nitではなくより高い基準値によって、その時点で普及している(即ち、標準的となった)ダイナミックレンジと、より新しい(より高い上限を有する)ダイナミックレンジとがそれぞれHDR及びSDRとして分類されることがあってもよい。本開示に係る技術は、概して、2種類のダイナミックレンジが互いに異なる上限を有するケースに広く適用可能であり、それらダイナミックレンジがどういった基準値によって分類されるかには限定されない。SDRは、HDRとの対比において、LDR(Low Dynamic Range)と呼ばれることもある。
[1−2.コーデック歪み]
SDR映像かHDR映像かに関わらず、画像信号を非可逆圧縮を含む映像符号化方式で符号化すると、復号される画像信号に基づいて再生される画像に、画質の劣化が生じる。こうした画質の劣化を、本明細書ではコーデック歪みという。コーデック歪みの度合いは、PSNR(Peak Signal-to-Noise Ratio)という指標で評価され得る。概して、符号化効率を同等とした場合、H.264/AVCで符号化/復号された画像の画質は、MPEG−2で符号化/復号された画像の画質よりも高く、H.265/HEVCで符号化/復号された画像の画質はH.264/AVCよりも高い。しかしながら、通常、コーデック歪みの評価は、エンコーダへ入力される原画像とデコーダから出力される復号画像とを比較することにより行われる。HDR映像の撮像若しくは表示の際に行われる信号変換、又はダイナミックレンジの縮減若しくは拡張がコーデック歪みにどのように作用するかは、あまり知られていない。
発明者らは、多数のサンプル映像をHDR用の信号フォーマットで画像信号へと変換し、H.264/AVCに準拠するエンコーダ及びデコーダによる符号化及び復号の後に、復号後の画像信号から再生されるHDR映像の画質を検証する実験を行った。その結果、同一のサンプルでSDR映像では感知されなかった画質の劣化が、ビデオコーデックを経たHDR映像において視認されるケースがあることが認識された。画質の劣化は、主にブロックノイズ又はモスキートノイズといった形で、画像内の一部分において顕著に生じていた。
同じ10ビットの画像信号を同じ映像符号化方式で符号化する際に生じる劣化の度合いは、通常は同程度である。それでもSDR映像では感知されない(又は感知されにくい)歪みがHDR映像において検出されたのは、復号後の画像信号のダイナミックレンジを拡張する際にコーデック歪みが一緒に拡大されたからであると考えられる。
図2Aには、SDR映像の画像信号に、符号化及び復号を経てコーデック歪みが生じる様子が示されている。コーデック歪みはSDR映像を再生する際には拡大されないため、歪みが十分に小さければ主観的に歪みが感知されることはない。一方、図2Bには、HDR映像の画像信号にやはりコーデック歪みが生じる様子が示されている。HDR映像を再生する際には、ダイナミックレンジの拡張に伴ってコーデック歪みが拡大される結果、ブロックノイズ又はモスキートノイズといった画質の劣化が主観的に感知される可能性が高まる。
コーデック歪みは、HDR用の信号フォーマットで表現されている画像信号についてHDRからSDRへのフォーマット変換が実行される際にも拡大され得る。図2Cには、HDRからSDRへのフォーマット変換、即ちHDR−SDR変換を経てコーデック歪みが拡大される様子が示されている。HDR−SDR変換は、概して、HDR用の信号フォーマットに対応する伝達関数の逆関数で(例えば符号化ビットストリームを復号することにより得られる)画像信号をイメージセンサの出力に相当する原信号へと復元する処理と、復元された原信号をSDR用の信号フォーマットに対応する伝達関数でSDR用の画像信号へと再変換する処理とを含む。これら処理のうちの前者において拡大されたコーデック歪みは、SDR用の信号フォーマットへの再変換において縮小されない。そのため、HDR−SDR変換後の画像信号に基づいてSDR映像を再生すると、拡大されたコーデック歪みが主観的に感知される結果となり得る。
上述したようなコーデック歪みが、映像符号化方式自体の性能に起因するのであれば、歪みは均一に生じるはずである。しかし、上述したサンプル映像の検証では、以下に例示するような特徴的な部分領域において歪みが顕著となっていることが確認された:
−特定色領域(例えば、肌色領域)
−平坦な領域(例えば、模様の無い建物の壁)
これらの部分領域において歪みが顕著となる原因は、HDR用の信号フォーマットの信号伝達関数及び色域の選択に依存して、色成分の個々の符号値が意味する実世界における階調又は色に違いがあることである。
[1−3.伝達関数]
一般に、撮像装置における光から画像信号への信号変換の特性は、OETF(Opto-Electronic Transfer Function;光電気伝達関数)でモデル化される。図3は、典型的なSDR用の信号フォーマットのOETF及びHDR用の信号フォーマットのOETFのそれぞれの例を示している。図3において、横軸は、変換前の光の輝度ダイナミックレンジを表し、100%が100nitの輝度に相当する。縦軸は、変換後の画像信号の符号値を表し、10bitの場合には符号値は0から1023までの値をとり得る。図中に破線で示したSDR用の信号フォーマット(例えば、BT.709)のOETFと実線で示したHDR用のOETF(例えば、HLG、ST2084又はS−Log3)とを比較すると、特に符号値が相対的に大きい部分において伝達関数の傾きの違いが顕著である。これは、こうした部分において、HDRのケースではSDRと比較して画像情報がより高い圧縮比で圧縮されていること、即ち符号値の同程度の変化がHDRのケースではSDRのケースよりも大きい階調の変化を表すことを意味している。RGB表色系において赤色(R)成分、緑色(G)成分及び青色(B)成分の各々の伝達関数を解析した場合にも、図3に示したグラフに類似したHDRとSDRとの間の信号伝達特性の違いが確認された。
図4は、SDR用のBT.709に対してHDR用のS−Log3が画像情報をどの程度圧縮しているかを表すグラフを示している。図4の横軸は、10ビットの画像信号の符号値を表す。縦軸は、BT.709の圧縮比に対するS−Log3の圧縮比の比率を表す。輝度ダイナミックレンジの100%に相当するS−Log3の符号値“600”付近において、S−Log3の圧縮比はBT.709の圧縮比に対して約4倍であり、符号値が大きくなるほどS−Log3の圧縮比は相対的により高くなっている。このグラフからも、符号値が相対的に大きい部分において、HDRのケースではSDRのケースと比較して画像情報がより強く圧縮されることが理解される。
HDR映像を再生する際には、多くの場合、図3に実線で示したようなOETFの逆関数であるEOTF(Electro-Optical Transfer Function;電気光伝達関数)を画像信号の符号値に適用することにより、表示素子へ供給すべき電圧レベルが決定され得る。そして、HDR映像を構成する個々の画像が、EOTFの適用によって拡張された輝度ダイナミックレンジで表示される。撮像から表示までを含むシステム全体の伝達関数をOOTFといい、OOTFはシステムガンマと呼ばれることもある。本明細書において、「伝達関数」とは、特段の言及の無い限り、OETF、EOTF及びOOTFのいずれか1つ又は2つ以上の組合せをいう。これら伝達関数は、トーンカーブと呼ばれることもある。
[1−4.色域]
実世界の様子をより忠実に再現し又はよりリッチな映像表現を可能とする技術として、HDRと共に色域もまた重要な概念である。ITU−Rにより標準化されたBT.2020は、これまで多くのアプリケーションで使用されてきたBT.709の色域と比較して、より鮮やかな色彩を表現することを可能とする色域を定義している。図5は、BT.709及びBT.2020により定義されている色域について説明するための説明図である。図5を参照すると、所定の拘束条件を用いて3次元の色空間を2次元平面へマッピングした色域グラフが示されている。グラフ中の十字マークは、白色がマッピングされる位置を示す。グラフ中の破線は、BT.709に従って表現することのできる色の範囲を示す。グラフ中の実線は、BT.2020に従って表現することのできる色の範囲を示す。グラフ中の点線は、人間の視覚が識別することのできる色の範囲を示す。図5から理解されるように、BT.2020は、BT.709よりも多彩な色を表現することを可能とする。BT.709が実世界に存在する色の約75%を表現可能であるのに対し、BT.2020は99%以上の色を表現可能であると言われている。BT.2020は、SDR映像の色域として利用されてもよく、又はHDR映像の色域として利用されてもよい。
<2.第1の実施形態>
[2−1.導入]
HDR用の信号フォーマットを用いた場合に画像内の部分領域において顕著となる上述したコーデック歪みは、それら部分領域において原信号の階調を表現するための割り当て符号量が不足することを原因としている。MPEG−2、H.264/AVC又はH.265/HEVCといった映像符号化方式に準拠するエンコーダは、所要の圧縮率を達成するために、画像信号を周波数ドメインにおいて量子化する。通常は、イントラ予測又はインター予測といった予測技術を適用した後の予測残差を直交変換することにより得られる変換係数が量子化される。しかし、SDR映像の符号化のために最適化されたそれらエンコーダにより使用される量子化ステップの決定方式は、HDR用の信号フォーマットが使用される場合にはしばしば非最適となる。
いくつかのエンコーダにおいて採用されている量子化ステップの決定方式は、次の式(1)のように表現され得る。
Figure 0006822121
ここで、Qは、画像の内容に関わらず、アプリケーションの目的に応じた所要の圧縮率が達成されるように決定される、画像内のi番目のブロックの暫定的な量子化ステップを表す。Q´は、ブロックごとの符号化難易度に基づいて調整される調整後の量子化ステップを表す。ActBiは、i番目のブロックについて統計的に算出されるアクティビティを表す。アクティビティとは、符号化難易度の指標の1つであり、例えばブロック内の複数のサブブロックについてそれぞれ算出される分散のうちの最小値に等しい。アクティビティの代わりに、最大符号値と最小符号値との差(これも「ダイナミックレンジ」と呼ばれる場合がある)又は調整前の量子化ステップ自体といった他のパラメータが、符号化難易度の指標として用いられてもよい。関数F(ActBi)は、ブロックごとのアクティビティ(又は符号化難易度の他の指標)を引き数とし、量子化ステップの調整係数を返す関数である。関数F(ActBi)の2つの例を、F及びFとして以下に示す:
Figure 0006822121
ActPICは、画像全体にわたるアクティビティの代表値(例えば、平均、中央値又は最大値など)を表す。式(2)によれば、Gは、アクティビティActBiが画像全体のアクティビティActPICに等しい場合の、暫定量子化ステップQに対する調整後量子化ステップQ´の比率に相当する。アクティビティActBiがゼロから無限大の間で変化すると、関数F(ActBi)の返り値はG/2から2Gの間で変化する。式(2)の右辺のGを除く残りの項は、アクティビティActBiを正規化する役割を有する。式(3)によれば、Gは、アクティビティActBiがゼロに等しい場合(即ち、i番目のブロックが全く平坦である場合)の調整利得に相当する。アクティビティActBiがゼロから無限大の間で変化すると、関数F(ActBi)の返り値は1/GからGの間で変化する。本明細書において、これらGを基本調整利得という。式(3)のケースでは、Gは最大調整利得又は最大保護比率などと呼ばれてもよい。
式(2)又は式(3)によれば、i番目のブロックBの画像が他のブロックに対して相対的に平坦である場合、調整後量子化ステップQ´はより小さい値へと調整される。あるブロックについて使用される量子化ステップがより小さいほど、当該ブロックの変換係数は精細に量子化される。これは、より多くの符号量が当該ブロックに割り当てられること、即ち当該ブロックの画像の階調がより損なわれることなく維持されることを意味する。
しかしながら、HDRのケースでは、SDRのケースと比較すると信号変換の際に階調情報がより強く圧縮される。そのため、実世界における見た目の複雑さ(又は、逆の意味で平坦度)が同程度であれば、HDRのケースで画像信号の符号値から算出される符号化難易度は、SDRのケースよりも小さくなる。図6の上段には、一例としての画像Im1が示されている。ブロックBは、画像Im1に設定されるi番目のブロックである。ブロックBについて、SDR用の伝達関数が適用された場合の画像信号から算出される符号化難易度(図左下の矢印D1)よりも、HDR用の伝達関数が適用された場合の画像信号から算出される符号化難易度(図右下の矢印D2)の方が小さい。このような情報圧縮の度合いの異なる2つの画像信号について同程度の主観的画質の保護を提供するためには、式(1)の関数Fが包含する利得(例えば、式(2)又は式(3)の基本調整利得G)は、情報の圧縮に伴う統計値の変動を打ち消すように可変的に設定されることが望ましい。
図5を用いて説明したBT.2020の色域のようにより広い色域が使用されるケースでも、例えばBT.709のようにより狭い色域が使用されるケースと比較して、色情報がより強く圧縮される。従って、適用された伝達関数ではなく適用された色域が異なる2つの画像信号についても、同程度の主観的画質の保護を提供するためには、量子化ステップの決定の際に情報の圧縮分を補償するような柔軟な制御が行われることが望ましい。
そこで、本節では、どういった種別の伝達関数又は色域が画像に適用されるかに基づいて量子化ステップを柔軟に決定し、主観的な画質について改善された保護を提供するための実施形態について説明する。
[2−2.システムの概要]
図7Aは、本実施形態に係る画像処理システムの構成の第1の例を示す説明図である。図7Aに示した画像処理システム10aは、撮像装置11、信号処理装置14、及びサーバ装置15を含む。
撮像装置11は、例えば、デジタルビデオカメラ若しくはデジタルスチルカメラ、又は映像撮影機能を有する任意の種類の装置(例えば、監視カメラ、Webカメラ又は情報端末など)であってよい。撮像装置11は、イメージセンサを用いて実世界の様子を撮影して、原始的な画像信号を生成する。信号処理装置14は、例えばBPU(Baseband Processing Unit)であってよく、撮像装置11と接続される。信号処理装置14は、撮像装置11により生成された原始的な画像信号についてAD変換及びデジタル信号処理を実行し、所定の信号フォーマットで画像信号を生成する。信号処理装置14により実行されるデジタル信号処理は、例えばガンマ補正及び色変換を含み得る。信号処理装置14は、撮像装置11と一体的に構成されてもよい。
信号処理装置14は、何らかのユーザインタフェースを介してユーザにより複数の候補から選択される伝達関数及び色域で画像信号を生成してもよい。一例として、伝達関数の候補は、SDR用としてBT.709、HDR用としてHLG、ST2084及びS−Log3を含み得る。また、色域の候補は、BT.709、BT.2020及びS−Gamutを含み得る。
信号処理装置14は、信号変換の結果として生成される画像信号に、必要に応じて音声信号及びメタデータを含む補助信号を多重化し、多重化されたそれら信号をサーバ装置15へと出力する。サーバ装置15は、例えばSDI(Serial Digital Interface)又はHD−SDIなどの伝送プロトコルに準拠する信号線を介して信号処理装置14と接続される画像処理装置である。サーバ装置15は、信号処理装置14から送信される画像信号を取得し、所定の映像符号化方式で画像を符号化して符号化ビットストリーム17aを生成する。符号化ビットストリーム17aは、サーバ装置15の内部若しくは外部の記憶装置に記憶されてもよく、又はサーバ装置15へ接続される他の装置(例えば、表示装置)へ伝送されてもよい。
図7Bは、本実施形態に係る画像処理システムの構成の第2の例を示す説明図である。図7Bに示した画像処理システム10bは、撮像装置12、記憶装置13、及び端末装置16を含む。
撮像装置12は、例えば、デジタルビデオカメラ、デジタルカムコーダ若しくはデジタルスチルカメラ、又は映像撮影機能を有する任意の種類の装置であってよい。撮像装置12は、イメージセンサを用いて実世界の様子を撮影して、原始的な画像信号を生成する。また、撮像装置12は、AD変換と、信号処理装置14に関連して上で説明したようなデジタル信号処理とを実行し、所定の信号フォーマットで画像信号を生成する。撮像装置12は、信号処理装置14と同様に、何らかのユーザインタフェースを介してユーザにより複数の候補から選択される伝達関数及び色域で画像信号を生成してよい。
撮像装置12は、信号変換の結果として生成される画像信号に基づき、所定の映像符号化方式で画像を符号化して、符号化ビットストリーム17bを生成する。符号化ビットストリーム17bは、例えば、映像ファイルとして記憶されてもよく、又はネットワークを介して記憶装置13若しくは端末装置16へ提供されてもよい。
記憶装置13は、様々な映像データを記憶するデータストレージである。記憶装置13は、例えば、所定の映像符号化方式で画像を符号化することにより生成された映像ファイル17cを記憶してもよい。映像ファイルのヘッダ領域には、例えば、映像ファイルに含まれる映像コンテンツに適用された光と画像信号との間の変換に関する伝達関数の種別、色域の種別、及び映像符号化方式をそれぞれ識別するパラメータが含められ得る。記憶装置13は、符号化前(又は信号変換前)の画像信号をRAWデータとして記録するRAW映像ファイル18を記憶してもよい。記憶装置13は、例えば端末装置16からのリクエストに応じて、ユーザが再生し又は編集することを望むファイルをネットワークを介して端末装置16へと提供する。
端末装置16は、撮像装置12により生成され又は記憶装置13により記憶されている映像ファイルを再生し又は編集する機能を有する画像処理装置である。端末装置16は、例えば、撮像装置12又は記憶装置13から取得される映像ファイル17b又は17cに含まれる符号化ビットストリームを復号して復号画像信号を生成してもよい。また、端末装置16は、そのように生成される復号画像についてダイナミックレンジ変換(例えば、HDR−SDR変換又はSDR−HDR変換)を実行してもよい。さらに、端末装置16は、RAW映像ファイル18に含まれる画像信号、又はダイナミックレンジ変換後の復号画像信号を所定の映像符号化方式で符号化して、符号化ビットストリーム17dを生成してもよい。
図7Aの例におけるサーバ装置15、並びに図7Bの例における撮像装置12及び端末装置16は、いずれも画像を符号化する画像処理装置(即ち、エンコーダ)としての機能を有する。本実施形態では、これら画像処理装置が画像を符号化する際に、当該画像に適用される伝達関数及び色域の少なくとも一方に基づいて(例えば、それらの種別又は他の属性に基づいて)量子化処理に関するパラメータが制御され、それにより画質の劣化が軽減される。次項より、そうした画像処理装置の具体的かつ例示的な構成について詳しく説明する。
[2−3.画像処理装置の概略的な構成]
図8Aは、本実施形態に係る画像処理装置の概略的な構成の第1の例を示すブロック図である。図8Aに示した画像処理装置100aは、例えば、図7Aの例におけるサーバ装置15、又は図7Bの例における撮像装置12若しくは端末装置16(又は、それら装置のいずれかに搭載される画像処理モジュール)であってよい。画像処理装置100aは、信号取得部101、情報取得部103、符号化部110及び制御部140を備える。
信号取得部101は、光と画像信号との間の変換に関する伝達関数に基づいて生成された入力画像信号を取得する。信号取得部101は、伝送インタフェースを介して外部の装置から入力画像信号を取得してもよく、又は画像処理装置100aと一体的に構成される撮像モジュール及び信号処理モジュール(図示せず)から入力画像信号を取得してもよい。
情報取得部103は、符号化部110へと入力される画像に適用された伝達関数及び色域に関する入力情報を取得する。一例として、情報取得部103は、画像処理装置100aが有するユーザインタフェースを介して入力情報を取得してもよい。ユーザインタフェースは、画像処理装置100aの筐体に設けられる例えばタッチパネル、ボタン又はスイッチのような物理的な入力デバイスにより提供されてもよい。その代わりに、ユーザインタフェースは、通信インタフェースを介して遠隔的に接続される端末装置上でGUI(Graphical User Interface)として提供されてもよい。本実施形態において、入力情報は、少なくとも符号化すべき画像に適用された伝達関数の種別を示す伝達関数種別と、当該画像に適用された色域の種別を示す色域種別とを含む。ユーザインタフェースは、例えば、SDR用としてBT.709、HDR用としてHLG、ST2084及びS−Log3を含み得る複数の伝達関数種別の候補のうちの1つをユーザに選択させてもよい。また、ユーザインタフェースは、BT.709、BT.2020及びS−Gamutを含み得る複数の色域種別の候補のうちの1つをユーザに選択させてもよい。
他の例として、情報取得部103は、入力画像信号と多重化される補助信号から入力情報を取得してもよい。例えば、補助信号は、信号線上で画像信号が伝送されていない期間(例えば、ブランキング期間)において信号取得部101により受信される。そして、情報取得部103は、信号取得部101において分離される補助信号から、伝達関数種別及び色域種別を含む入力情報を取得し得る。また、情報取得部103は、外部のデータソースへアクセスして必要とされる入力情報を取得してもよい。
符号化部110は、信号取得部101により取得される画像信号により表現される画像を符号化して、符号化ビットストリームを生成する。符号化部110は、例えばMPEG−2、H.264/AVC又はH.265/HEVCなどのいかなる映像符号化方式に従って符号化処理を実行してもよい。符号化部110により実行される符号化処理は、典型的には、予測、直交変換、量子化及びエントロピー符号化といった様々な演算処理を含み、中でも量子化は所要の圧縮率を達成するための非可逆圧縮を含む処理である。
制御部140は、情報取得部103により取得される入力情報により示される伝達関数種別及び色域種別の少なくとも一方に基づいて、符号化部110において実行される量子化処理を制御する。例えば、制御部140は、どういった種別の伝達関数が画像に適用されるかに依存して異なる調整利得で、符号化部110に量子化処理における量子化ステップを調整させてもよい。また、制御部140は、どういった種別の色域が画像に適用されるかに依存して異なる調整利得で、符号化部110に量子化処理における量子化ステップを調整させてもよい。なお、ここでは主に伝達関数及び色域の種別に基づいて量子化ステップなどの処理パラメータが決定される例を説明するが、他の属性に基づいて処理パラメータが決定されてもよい。後述する第2の実施形態においても同様である。
図8Bは、本実施形態に係る画像処理装置の概略的な構成の第2の例を示すブロック図である。図8Bに示した画像処理装置100bもまた、例えば、図7Aの例におけるサーバ装置15、又は図7Bの例における撮像装置12若しくは端末装置16(又は、それら装置のいずれかに搭載される画像処理モジュール)であってよい。画像処理装置100bは、信号処理部102、情報取得部104、記憶部107、符号化部110及び制御部140を備える。
信号処理部102は、何らかの伝送インタフェース若しくは装置内部の信号線を介して撮像装置から入力される原始的な画像信号を取得し、又は記憶部107により記憶されている映像ファイルから画像信号を取得する。そして、信号処理部102は、原始的な画像信号について例えばガンマ補正及び色変換を含み得るデジタル信号処理を実行し、所定の信号フォーマットで符号化の対象とされる画像信号を生成する。信号処理部102により画像に適用される伝達関数及び色域は、情報取得部104により取得される入力情報に基づいて決定される。そして、信号処理部102は、生成した画像信号を符号化部110へ出力する。
情報取得部104は、符号化部110により符号化される画像に適用される伝達関数及び色域に関する入力情報を取得する。例えば、情報取得部104は、画像処理装置100bが有する(物理的な入力デバイスにより提供され又はGUIとして提供される)ユーザインタフェースを介して入力情報を取得してよい。上述したように、入力情報は、少なくとも伝達関数種別と色域種別とを含む。ユーザインタフェースは、例えば、SDR用としてBT.709、HDR用としてHLG、ST2084及びS−Log3を含み得る複数の伝達関数種別の候補のうちの1つをユーザに選択させてもよい。また、ユーザインタフェースは、BT.709、BT.2020及びS−Gamutを含み得る複数の色域種別の候補のうちの1つをユーザに選択させてもよい。
記憶部107は、様々な映像データを記憶するための記憶デバイスである。記憶部107は、例えば、信号変換前のデジタル画像信号を記録する映像ファイルを記憶してもよい。ユーザは、画像処理装置100bが有する入出力インタフェース(図示せず)を介して、外部記憶媒体から取得される映像ファイルを記憶部107に記憶させてもよい。また、記憶部107は、符号化部110により実行される符号化処理の結果として生成される符号化ビットストリームを含む映像ファイルを記憶してもよい。映像ファイルは、リクエストに応じて外部の装置へと出力されてもよい。
図8Aを用いて説明した第1の例と同様に、符号化部110は、信号処理部102から入力される画像信号により表現される画像を符号化して、符号化ビットストリームを生成する。制御部140は、情報取得部104により取得される入力情報により示される伝達関数種別及び色域種別の少なくとも一方に基づいて、符号化部110において実行される量子化処理を制御する。符号化部110により生成される符号化ビットストリームは、画像処理装置100bの外部の装置へと伝送されてもよく、又は記憶部107により映像ファイルとして記憶されてもよい。
[2−4.符号化部及び制御部の詳細な構成]
本項では、図8A及び図8Bに示した符号化部110及び制御部140のより具体的な構成について詳しく説明する。図9は、第1の実施形態に係る符号化部及び制御部の詳細な構成の一例を示すブロック図である。
(1)符号化部
図9を参照すると、符号化部110は、並び替えバッファ111、ブロック設定部112、減算部113、直交変換部114、量子化部115、可逆符号化部116、逆量子化部121、逆直交変換部122、加算部123、ループフィルタ124、フレームメモリ126、スイッチ127、モード選択部128、イントラ予測部130及びインター予測部135を備える。
並び替えバッファ111は、信号取得部101又は信号処理部102により取得される画像信号により表現される一連の画像の画像データを、GOP(Group of Pictures)構造に応じて並び替える。並び替えバッファ111は、並び替え後の画像データをブロック設定部112、イントラ予測部130及びインター予測部135へ出力する。
ブロック設定部112は、ピクチャに相当する画像の各々を複数のブロックへと分割する。MPEG−2及びH.264/AVCでは、ピクチャは固定的なサイズを有する複数のマクロブロックへと格子状に分割され、各マクロブロックを処理単位として符号化処理が実行される。量子化処理は、各マクロブロックに設定されるより小さいサブブロックを処理単位として実行され得る。H.265/HEVCでは、ピクチャは可変的なサイズを有する複数の符号化単位(Coding Unit)へと四分木状に分割され、各CUを処理単位として符号化処理が実行される。量子化処理は、各CUに設定されるより小さい変換単位(Transform Unit)を処理単位として実行され得る。
減算部113は、ブロック設定部112から入力される画像データと予測画像データとの差分である予測残差データを算出し、予測残差データを直交変換部114へ出力する。
直交変換部114は、減算部113から入力される予測残差データを、空間領域の画像データから周波数領域の変換係数データへと変換する。直交変換部114により実行される直交変換は、例えば離散コサイン変換又は離散サイン変換などであってよい。そして、直交変換部114は、変換係数データを量子化部115へ出力する。
量子化部115は、直交変換部114から入力される変換係数データを量子化する。例えば、出力される符号化ビットストリームのサイズに対してバッファ又は伝送路の空き容量が多い場合には量子化ステップは小さく設定され、逆に空き容量が少ない場合には量子化ステップは大きく設定され得る。より具体的には、量子化部115は、所要の圧縮率が達成されるようにブロックごとに暫定的に量子化ステップを決定し、さらにブロックごとの符号化難易度に応じて量子化ステップを調整する。そして、量子化部115は、調整後の量子化ステップで変換係数データを量子化する。量子化後の変換係数データ(以下、量子化データという)は、可逆符号化部116及び逆量子化部121へ出力される。
量子化部115における量子化ステップの調整は、上で説明した式(1)に従って行われてよい。式(1)の関数F(ActBi)は、量子化ステップの調整利得を表す処理パラメータを含む。調整利得が大きいほど量子化ステップはより小さい値へと調整され、結果的に当該ブロックへの符号量の割り当てが増加する。調整利得を表すパラメータの一例は、式(2)及び式(3)に含まれる基本調整利得Gである。この場合、量子化部115は、基本調整利得Gと各ブロックの符号化難易度ActBiとに基づいて調整される調整後の量子化ステップで、各ブロックについて量子化処理を実行する。量子化部115において、色成分ごとに異なる量子化ステップが使用されてもよい。また、量子化ステップの調整が色成分ごとに異なる処理パラメータを用いて行われてもよい。
可逆符号化部116は、量子化部115から入力される量子化データを符号化することにより、符号化ビットストリームを生成する。また、可逆符号化部116は、デコーダにより参照される様々なパラメータを符号化して、符号化されたパラメータを符号化ビットストリームへ挿入する。可逆符号化部116により符号化されるパラメータは、伝達関数に関する情報、色域に関する情報、及び量子化パラメータに関する情報を含み得る。可逆符号化部116は、生成した符号化ビットストリームを、アプリケーションの目的に応じた出力先へと出力する。
逆量子化部121、逆直交変換部122及び加算部123は、ローカルデコーダを構成する。ローカルデコーダは、符号化されたデータから原画像を再構築する役割を有する。
逆量子化部121は、量子化部115により使用されたものと同じ量子化ステップで量子化データを逆量子化し、変換係数データを復元する。そして、逆量子化部121は、復元した変換係数データを逆直交変換部122へ出力する。
逆直交変換部122は、逆量子化部121から入力される変換係数データについて逆直交変換処理を実行することにより、予測残差データを復元する。そして、逆直交変換部122は、復元した予測残差データを加算部123へ出力する。
加算部123は、逆直交変換部122から入力される復元された予測残差データとイントラ予測部130又はインター予測部135により生成される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部123は、生成した復号画像データをループフィルタ124及びフレームメモリ126へ出力する。
ループフィルタ124は、復号画像の画質の向上を目的とするインループフィルタである。ループフィルタ124は、例えば、復号画像に現れるブロック歪みを軽減するためのデブロックフィルタを含んでもよい。また、ループフィルタ124は、復号画像にエッジオフセット又はバンドオフセットを加えるための適応オフセットフィルタを含んでもよい。ループフィルタ124は、フィルタリング後の復号画像データをフレームメモリ126へ出力する。
フレームメモリ126は、加算部123から入力されるフィルタリング前の復号画像データ、及びループフィルタ124から入力されるインループフィルタの適用後の復号画像データを記憶する。
スイッチ127は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ126から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部130に供給する。また、スイッチ127は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ126から読み出し、読み出した復号画像データを参照画像データとしてインター予測部135に供給する。
モード選択部128は、イントラ予測部130及びインター予測部135から入力されるコストの比較に基づいて、ブロックごとに予測手法を選択する。モード選択部128は、イントラ予測を選択したブロックについては、イントラ予測部130により生成される予測画像データを減算部113へ出力すると共に、イントラ予測に関する情報を可逆符号化部116へ出力する。また、モード選択部128は、インター予測を選択したブロックについては、インター予測部135により生成される予測画像データを減算部113へ出力すると共に、インター予測に関する情報を可逆符号化部116へ出力する。
イントラ予測部130は、原画像データ及び復号画像データに基づいて、イントラ予測処理を実行する。例えば、イントラ予測部130は、探索範囲に含まれる複数の候補モードの各々について、発生すると推定されるコストを評価する。次に、イントラ予測部130は、コストが最小となる予測モードを最良の予測モードとして選択する。また、イントラ予測部130は、選択した最良の予測モードに従って予測画像データを生成する。そして、イントラ予測部130は、最良の予測モードを示す予測モード情報を含むイントラ予測に関する情報、対応するコスト、及び予測画像データを、モード選択部128へ出力する。
インター予測部135は、原画像データ及び復号画像データに基づいて、インター予測処理(動き補償)を実行する。例えば、インター予測部135は、探索範囲に含まれる複数の候補モードの各々について、発生すると推定されるコストを評価する。次に、インター予測部135は、コストが最小となる予測モードを最良の予測モードとして選択する。また、インター予測部135は、選択した最良の予測モードに従って予測画像データを生成する。そして、インター予測部135は、インター予測に関する情報、対応するコスト、及び予測画像データを、モード選択部128へ出力する。
(2)制御部
図9を参照すると、制御部140は、統計演算部141及び量子化制御部143を備える。
統計演算部141は、画像全体にわたる符号化難易度、及び画像に設定されるブロックの各々についての符号化難易度を算出する。例えば、統計演算部141は、符号化難易度として、上で説明したアクティビティActBi及びActPICを算出し得る。そして、統計演算部141は、算出したこれら統計値を量子化制御部143へ出力する。
量子化制御部143は、符号化される画像に適用される伝達関数及び色域を、情報取得部103又は104から入力される入力情報に基づいて判定する。そして、量子化制御部143は、伝達関数若しくは色域、又はそれらの組合せに基づいて、量子化ステップの調整のために使用すべき基本調整利得を決定する。より具体的には、量子化制御部143は、伝達関数及び色域の一方又は双方の相違に起因する画像信号の符号値の変化が量子化処理に与える影響を打ち消すように、基本調整利得を決定し得る。ここでの影響は、典型的には量子化の結果として生じるコーデック歪みの程度の変動として現れ、主観的な画質の劣化としても感知され得る。コーデック歪みの程度は、上述したPSNRという指標を用いて評価されることができる。例えば、事前のチューニングにおいて調整利得を変化させながらPSNRの変化を評価し又は主観的な画質を検証することにより、伝達関数ごと若しくは色域ごと又はそれらの組合せごとに、上述した影響を打ち消すための基本調整利得の値を決定することができ、そのように決定された基本調整利得の値が記憶部107に記憶され得る。そして、量子化制御部143は、例えば、伝達関数若しくは色域、又はそれらの組合せに対応する、それら予め決定された値のうちの1つを記憶部107から読み出して、量子化ステップの調整のために使用すべき基本調整利得の値として決定し得る。
以下、図10〜図13を用いて、基本調整利得の動的な決定の意義を説明する。図10には、図6に例示したものと同様の画像Im1が示されている。ブロックB1は、画像Im1の中で相対的に複雑な画像内容を有する領域に位置し、ブロックB2は、画像Im1の中で相対的に平坦な画像内容を有する領域に位置する。図11は、SDRのケース(例えば、伝達関数がBT.709である)での量子化ステップの調整の一例を示している。ここでは、仮にブロックB1及びB2について暫定的に決定される量子化ステップが共にQに等しいものとする。符号化難易度のより高い(アクティビティのより大きい)ブロックB1の量子化ステップは、Q´B1へと調整される。一方、符号化難易度のより低い(アクティビティのより小さい)ブロックB2の量子化ステップは、Q´B1よりもより小さいQ´B2へと調整される。これら調整の幅は、SDRのケースについて良好に設計された基本調整利得GSDRにより左右される。
図12は、既存の手法に係るHDRのケース(例えば、伝達関数がHLGである)での量子化ステップの調整の一例を示している。既存の手法によれば、画像に適用される伝達関数及び色域に関わらず固定的な基本調整利得が使用される。一方、同じ被写体を映した画像について算出される符号化難易度は、信号変換の際に画像情報がより強く圧縮されていればより小さい値となり、それに応じて量子化ステップの調整式(1)における調整幅もまたより小さくなる。結果的に、図12のケースにおいて、ブロックB1の量子化ステップはQ´B1よりも大きいQ´´B1へと調整され、ブロックB2の量子化ステップはQ´B2よりも大きいQ´´B2へと調整され得る。特に符号化難易度の低い平坦なブロックB2については、図11のSDRのケースでのQ´B2に対して図12のHDRのケースにおいてQ´´B2は格段に大きい。これが、HDRのケースで平坦な領域において割り当て符号量が不足し、画像の劣化が顕著となっていた原因である。
図13は、本実施形態に係る量子化ステップの調整の一例を示している。本実施形態においては、上述したように、量子化制御部143が、画像に適用される伝達関数及び色域のうちの少なくとも一方に基づいて、量子化ステップの調整の際に使用される基本調整利得を切り替える。図13の例では、HDRのケースで画像情報の圧縮の度合いに応じてそれぞれ設計されたSDR用の基本調整利得GSDR及びHDR用の基本調整利得GHDRのうちの基本調整利得GHDRが使用される。その結果、ブロックB1の量子化ステップはQ´B1へと調整され、ブロックB2の量子化ステップはQ´B2へと調整され得る。このような処理パラメータの切り替えによって、画像情報の圧縮に伴う符号化難易度の統計値上の変動が補償され、割り当て符号量の不足に起因する画質の劣化が軽減される。
量子化制御部143は、このように決定される基本調整利得と、統計演算部141により算出される(画像全体の及び各ブロックの)符号化難易度とを用いて調整係数を算出し、算出した調整係数を量子化部115へ提供してもよい。その代わりに、量子化制御部143により決定される基本調整利得及び統計演算部141により算出される符号化難易度が量子化部115へ提供され、量子化部115において式(2)又は式(3)に従って調整係数が算出されてもよい。記憶部107は、伝達関数及び色域のうちの一方又は双方に関連付けられる基本調整利得の値を記憶していてもよい。基本調整利得の値は、伝達関数ごとに定義され、色域ごとに定義され、又は伝達関数と色域との組合せごとに定義され得る。
こうした量子化ステップの制御は、典型的には、MPEG−2若しくはH.264/AVCにおけるマクロブロック若しくはサブブロック、又はH.265/HEVCにおけるCU若しくはTUといった矩形のブロックごとに行われる。しかしながら、本実施形態のアイディアは、矩形ではない形状を有する部分領域ごとに量子化制御処理が実行されるケースにも適用可能である。
[2−5.処理の流れ]
図14は、本実施形態に係る符号化制御処理の流れの一例を示すフローチャートである。ここで説明する符号化制御処理は、映像を構成する個々の画像について繰り返されてよい。複数の画像にわたって変化しないパラメータを取得し又は設定するための処理ステップは、2回目以降の繰り返しにおいてスキップされてもよい。なお、ここでは、説明の簡明さのために、量子化処理の制御に直接的に関連しない処理ステップについての説明は省略される。
図14を参照すると、まず、信号取得部101又は信号処理部102は、光と画像信号との間の変換に関する伝達関数に基づいて生成された画像信号を取得する(ステップS110)。ここで取得される画像信号は、符号化部110へ出力される。
次に、情報取得部103又は104は、符号化部110へと入力される画像に適用された伝達関数及び色域を示す入力情報を、ユーザインタフェースを介して又は入力画像信号と多重化される補助信号から取得する(ステップS112)。ここで取得される入力情報は、制御部140へ出力される。
次に、量子化制御部143は、上述した入力情報により示される伝達関数及び色域のうち少なくとも一方に基づいて、基本調整利得を決定する(ステップS114)。また、統計演算部141は、ピクチャ全体の符号化難易度を算出し、算出した符号化難易度を量子化制御部143へ出力する(ステップS116)。
その後の処理は、処理対象の画像に設定される複数のブロックのうちの各々について繰り返される。各繰り返しにおける処理対象のブロックを、ここでは注目ブロックという。
まず、符号化部110の量子化部115は、どのような伝達関数及び色域が適用されたかに関わらず、所要の圧縮率が達成されるように注目ブロックの暫定量子化ステップを決定する(ステップS120)。
また、統計演算部141は、注目ブロックの符号化難易度を算出し、算出した符号化難易度を量子化制御部143へ出力する(ステップS130)。量子化制御部143は、ステップS114において決定した基本調整利得及び統計演算部141により算出された符号化難易度を用いて、注目ブロックについての調整係数を決定する(ステップS140)。
量子化部115は、量子化制御部143から提供される調整係数を用いて、ステップS120において決定した量子化ステップを調整する(ステップS150)。そして、量子化部115は、直交変換部114から入力される注目ブロックの変換係数データを、調整後の量子化ステップで量子化する(ステップS160)。なお、ここでは、所要の圧縮率が達成されるように暫定的に決定された量子化ステップを調整係数を用いて調整する例を説明しているが、所要の圧縮率及び調整係数の双方を同時に考慮して量子化ステップが決定されてもよい。
次に、可逆符号化部116は、量子化部115から入力される量子化データと量子化パラメータとを符号化して、符号化ビットストリームを生成する(ステップS170)。
ステップS120〜ステップS170は、ピクチャ内の全てのブロックについて処理が終了するまで繰り返される(ステップS180)。そして、全てのピクチャについて処理が終了すると、図14に示した符号化制御処理は終了する(ステップS190)。
[2−6.第1の実施形態のまとめ]
ここまで、図6〜図14を用いて、本開示に係る技術の第1の実施形態について説明した。上述した実施形態では、光と画像信号との間の変換に関する伝達関数及び色域のうちの少なくとも一方に基づいて、画像を符号化する際の量子化処理に関する処理パラメータが決定される。かかる構成によれば、伝達関数の相違、又は色域の相違に起因して不適切な量子化ステップが使用されることを防止することができる。それにより、画像を符号化する際に原信号の階調を表現するために十分な割り当て符号量を確保して、画質の劣化を防止することができる。
また、上述した実施形態では、画像の部分領域ごとの符号化難易度に応じて量子化ステップを調整する際に使用される基本調整利得が、伝達関数及び色域のうちの少なくとも一方に基づいて決定される。かかる構成によれば、伝達関数又は色域の選択に依存して符号化難易度が統計値上で小さくなるケースでは相対的に大きい基本調整利得を使用し、逆に符号化難易度が統計値上で大きくなるケースでは相対的に小さい基本調整利得を使用することができる。それにより、画像信号の表現手法に影響されない一貫した量子化ステップの調整が実現される。
また、上述した実施形態では、伝達関数及び色域に関する入力情報に基づいて、伝達関数及び色域が判定され得る。上記入力情報がユーザインタフェースを介して取得される場合には、入力信号からこれら種別を判別できない場合にもユーザが望む通りの制御を実行することができる。上記入力情報が入力画像信号と多重化される補助信号から取得される場合には、ユーザ入力を要することなく自動的に適切な種別を判定することができる。
<3.第2の実施形態>
[3−1.導入]
前節で説明したように、HDRのケースではSDRと比較して画像情報がより高い圧縮比で圧縮されている。色域が異なる場合にも、画像情報の圧縮比は相違する。画像情報の圧縮比が相違すれば、画像信号の同一の符号値は、実世界における異なる明るさ又は色を表す。前節においては、従来画一的に決定されていた量子化ステップをこうした符号値の意味の相違を考慮に入れて柔軟に決定することを提案した。しかし、量子化ステップの調整に関するパラメータ以外にも、符号値の意味の相違を考慮に入れて決定されるべき処理パラメータは存在する。画像処理の様々な場面で実行される画素分類処理に関するパラメータもまた、そうした処理パラメータに該当する。
ここでは、画素分類処理の一例として、図15A〜図15Dを用いて、ある画素が肌色領域に属するか否かを分類する処理について検討する。これら図において、横軸は2つの色差成分のうちの一方であるCb成分の符号値を表し、縦軸は2つの色差成分のうちの他方であるCr成分の符号値を表す。
図15Aの矩形領域R11は、人間により主観的に肌色であると認識される実世界の色の集合を、SDR用の伝達関数及びBT.709の色域でCb−Cr平面上にマッピングした結果としての、マッピング後の肌色の集合を含む領域である。矩形領域R11の左辺及び右辺は、画素が肌色領域に属するか否かを分類する際にCb成分の符号値と比較される閾値に対応し、下辺及び上辺は、画素が肌色領域に属するか否かを分類する際にCr成分の符号値と比較される閾値に対応する。実世界の同じ肌色の集合をSDR用の伝達関数及びBT.2020の色域でCb−Cr平面上にマッピングすると、マッピング後のそれら肌色の集合は、矩形領域R12内に位置する。これら2つの矩形領域R11及びR12を比較すると、SDRのケースにおいて、種別の異なる色域が画像に適用されている場合には、画素を肌色か否かに分類する画素分類処理において異なる閾値を使用すべきであることが理解される。
図15Bの矩形領域R2は、実世界の同じ肌色の集合を、HDR用の伝達関数であるS−Log3及びBT.2020の色域でCb−Cr平面上にマッピングした結果としての、マッピング後の肌色の集合を含む領域である。図15Cの矩形領域R3は、実世界の同じ肌色の集合を、HDR用の伝達関数であるHLG及びBT.2020の色域でCb−Cr平面上にマッピングした結果としての、マッピング後の肌色の集合を含む領域である。矩形領域R3は、Cb−Cr平面上で矩形領域R2とは異なる領域を占める。これは、色域が同じであっても種別の異なる伝達関数が画像に適用されている場合には、画素を肌色か否かに分類する画素分類処理において異なる閾値を使用すべきであることを意味している。
図15Dの矩形領域R4は、実世界の同じ肌色の集合を、HDR用の伝達関数であるS−Log3及びS−Gamutという色域でCb−Cr平面上にマッピングした結果としての、マッピング後の肌色の集合を含む領域である。矩形領域R4は、Cb−Cr平面上で矩形領域R2とは異なる領域を占める。これは、HDRのケースにおいて、伝達関数が同じであっても種別の異なる色域が画像に適用されている場合には、画素を肌色か否かに分類する画素分類処理において異なる閾値を使用すべきであることを意味している。
これら考察は、肌色に限らず他の色にも当てはまる。概して、色成分の符号値を何らかの閾値と比較することにより画素を分類する画素分類処理を実装しようとする場合、ある伝達関数及び色域の組合せについて適切な閾値は、必ずしも伝達関数及び色域の他の組合せについて適切ではない。そこで、本節において、第2の実施形態として、画素分類のために画一的な閾値を用いる代わりに、伝達関数及び色域の一方又は双方に基づいて柔軟に閾値を切り替える手法を提案する。
[3−2.システムの概要]
本実施形態に係る画像処理システムは、第1の実施形態における画像処理システム10a又は10bと同様に構成されてもよい。一例として、システム内のいずれかの装置が画像を符号化するエンコーダとしての機能を有し、エンコーダにおいて特定の領域(例えば、肌色領域)の画質の保護を強化するために領域検出処理が実行されてもよい。他の例として、本実施形態に係る画像処理システムは画像信号を取得する任意の種類の装置を含み、その装置において顔認識、ジェスチャ認識、生体認証又は拡張現実などの様々な目的のために画素分類処理が実行されてもよい。本実施形態では、そうした画素分類処理において伝達関数及び色域の少なくとも一方に基づいて画素分類のための処理パラメータが制御される。それにより、画一的な処理パラメータが使用される例と比較して、より正確な画素分類結果を得ることが可能とされる。
[3−3.画像処理装置の概略的な構成]
図16は、第2の実施形態に係る画像処理装置の概略的な構成の一例を示すブロック図である。図16に示した画像処理装置200aは、信号取得部201、情報取得部203、符号化部210及び制御部240を備える。
信号取得部201は、光と画像信号との間の変換に関する伝達関数に基づいて生成された入力画像信号を取得する。信号取得部201は、伝送インタフェースを介して外部の装置から入力画像信号を取得してもよく、又は画像処理装置200aと一体的に構成される撮像モジュール及び信号処理モジュール(図示せず)から入力画像信号を取得してもよい。
情報取得部203は、符号化部210へと入力される画像に適用された伝達関数及び色域に関する入力情報を取得する。一例として、情報取得部203は、画像処理装置200aが有するユーザインタフェースを介して入力情報を取得してもよい。ユーザインタフェースは、画像処理装置200aの筐体に設けられる例えばタッチパネル、ボタン又はスイッチのような物理的な入力デバイスにより提供されてもよい。その代わりに、ユーザインタフェースは、通信インタフェースを介して遠隔的に接続される端末装置上でGUIとして提供されてもよい。本実施形態において、入力情報は、少なくとも符号化すべき画像に適用された伝達関数の種別を示す伝達関数種別と、当該画像に適用された色域の種別を示す色域種別とを含む。ユーザインタフェースは、例えば、SDR用としてBT.709、HDR用としてHLG、ST2084及びS−Log3を含み得る複数の伝達関数種別の候補のうちの1つをユーザに選択させてもよい。また、ユーザインタフェースは、BT.709、BT.2020及びS−Gamutを含み得る複数の色域種別の候補のうちの1つをユーザに選択させてもよい。
他の例として、情報取得部203は、入力画像信号と多重化される補助信号から入力情報を取得してもよい。例えば、補助信号は、信号線上で画像信号が伝送されていない期間において信号取得部201により受信される。そして、情報取得部203は、信号取得部201において分離される補助信号から、伝達関数種別及び色域種別を含む入力情報を取得し得る。
符号化部210は、信号取得部201により取得される画像信号により表現される画像を符号化して、符号化ビットストリームを生成する。符号化部210は、例えばMPEG−2、H.264/AVC又はH.265/HEVCなどのいかなる映像符号化方式に従って符号化処理を実行してもよい。符号化部210により実行される符号化処理は、所要の圧縮率を達成するための非可逆圧縮を含む量子化処理を包含する。
制御部240は、情報取得部203により取得される入力情報により示される伝達関数種別及び色域種別の少なくとも一方に基づいて画素分類処理を実行し、画素分類の結果に依存して符号化部210における量子化処理を制御する。例えば、制御部240は、どういった伝達関数及び色域の組合せが画像に適用されるかに依存して異なる閾値を用いて画像内の特定領域を検出する。そして、制御部240は、検出した特定領域に適用される量子化ステップをスケーリングすることにより、特定領域の画質の保護を強化する。
[3−4.符号化部及び制御部の詳細な構成]
本項では、図16に示した符号化部210及び制御部240のより具体的な構成について詳しく説明する。図17は、第2の実施形態に係る符号化部及び制御部の詳細な構成の一例を示すブロック図である。
(1)符号化部
図17を参照すると、符号化部210は、並び替えバッファ111、ブロック設定部112、減算部113、直交変換部114、量子化部215、可逆符号化部116、逆量子化部221、逆直交変換部122、加算部123、ループフィルタ124、フレームメモリ126、スイッチ127、モード選択部128、イントラ予測部130及びインター予測部135を備える。
量子化部215は、直交変換部114から入力される変換係数データを量子化する。より具体的には、量子化部215は、所要の圧縮率が達成されるようにブロックごとに暫定的に量子化ステップを決定し、さらに画素分類の結果に応じて量子化ステップを調整する。そして、量子化部215は、調整後の量子化ステップで変換係数データを量子化し、量子化データを可逆符号化部116及び逆量子化部221へ出力する。
量子化部215における量子化ステップの調整は、制御部240により提供される調整利得を暫定量子化ステップに適用する(例えば、調整係数を暫定量子化ステップに乗算する)ことにより行われてよい。調整利得が大きいほど量子化ステップはより小さい値へと調整され、結果的に対象ブロックへの符号量の割り当てが増加する。例えば、肌色領域に属するブロックについて符号量の割り当てを増加させることで、人間の顔や手などが映る領域の画質の保護が強化され得る。量子化部215は、色成分ごとに異なる量子化ステップを使用してもよい。
逆量子化部221は、量子化部215により使用されたものと同じ量子化ステップで量子化データを逆量子化し、変換係数データを復元する。そして、逆量子化部221は、復元した変換係数データを逆直交変換部122へ出力する。
(2)制御部
図17を参照すると、制御部240は、閾値制御部241、画素分類部243及び量子化制御部245を備える。
閾値制御部241は、符号化される画像に適用される伝達関数及び色域を、情報取得部203から入力される入力情報に基づいて判定する。そして、閾値制御部241は、伝達関数若しくは色域、又はそれらの組合せに基づいて、画素分類処理において使用されるべき、色成分の符号値と比較される閾値を決定する。例えば、画素分類処理は、各画素が特定の色を表すか否かを分類して特定の色領域を検出するための領域検出処理であってもよい。また、画素分類処理は、各画素が特定の明るさを表すか否かを分類して特定の明るさ領域を検出するための領域検出処理であってもよい。これらの例に限定されず、画素を何らかのカテゴリへと分類する任意の画素分類処理が採用されてよい。閾値制御部241は、例えば、伝達関数若しくは色域、又はそれらの組合せに関連付けられる閾値を記憶するメモリ(図示せず)を参照し、入力情報により示される種別に関連付けられている閾値を、使用すべき閾値として決定してもよい。典型的には、伝達関数及び色域のうちの少なくとも一方の相違に起因する画像信号の符号値の変化が画素分類処理に与える影響を打ち消すように、伝達関数ごと、色域ごと、又はそれらの組合せごとに異なる閾値が使用され得る。
画素分類部243は、閾値制御部241により決定される閾値を用いて、入力画像信号により表現される画像について画素分類処理を実行する。例えば、画素分類処理が肌色領域検出処理である場合、閾値制御部241により決定される閾値は、肌色判定閾値を含む。肌色判定閾値は、図15A〜図15Dに例示した矩形領域R11、R12、R2、R3又はR4の境界に対応し、左辺及び右辺がCb成分と比較される2つの閾値に、下辺及び上辺がCr成分と比較される2つの閾値にそれぞれ対応する。例えば、SDR用の伝達関数及びBT.709の色域が適用されるケースでは、画素分類部243は、閾値判定の結果として各画素がCb−Cr平面上で矩形領域R11内に位置すると判定される場合に、当該画素が肌色を表すと判定し得る。SDR用の伝達関数及びBT.2020の色域が適用されるケースでは、画素分類部243は、閾値判定の結果として各画素がCb−Cr平面上で矩形領域R12内に位置すると判定される場合に、当該画素が肌色を表すと判定し得る。他の伝達関数及び色域が適用されるケースでも、対応する領域検出閾値を用いて同様の判定が行われ得る。画素分類部243は、こうした画素分類の結果を量子化制御部245へ出力する。なお、ここでは単純な閾値判定での画素分類の例を主に説明しているが、画素分類の手法はかかる例に限定されない。例えば、矩形ではない形状の領域に各画素が位置するかを判定するために、1つ以上の色成分の符号値を引き数とする領域判定用関数が利用されてもよい。そして、領域判定用関数に含まれる係数又は定数などのパラメータが、伝達関数及び色域のうちの一方又は双方の組合せに依存して切り替えられてもよい。代替的に、異なる識別情報が付与された複数の領域判定用関数が予め定義され、伝達関数及び色域のうちの一方又は双方の組合せに依存して選択される識別情報により識別される領域判定用関数が利用されてもよい。
量子化制御部245は、画素分類部243から入力される画素分類の結果に基づいて、量子化部215において実行される量子化処理を制御する。例えば、量子化制御部245は、制御対象の画素又はブロックが画質の保護を強化することが望まれる特定の領域に属すると分類された場合には、その画素又はブロックについて、暫定量子化ステップよりも小さい値へと調整した量子化ステップを量子化部215に使用させてよい。また、量子化制御部245は、ある程度の画質の劣化が許容される領域に属する画素又はブロックについて、暫定量子化ステップよりも大きい値へと調整した量子化ステップを量子化部215に使用させてもよい。上述したように柔軟に設定される処理パラメータを用いて行われた画素分類の結果に基づいて調整される量子化ステップで量子化部215が量子化処理を実行することで、画像信号の表現手法に影響されない一貫した画質の保護が実現される。
[3−5.処理の流れ]
図18は、本実施形態に係る符号化制御処理の流れの一例を示すフローチャートである。ここで説明する符号化制御処理は、映像を構成する個々の画像について繰り返されてよい。複数の画像にわたって変化しないパラメータを取得し又は設定するための処理ステップは、2回目以降の繰り返しにおいてスキップされてもよい。なお、ここでは、説明の簡明さのために、画素分類に関連しない処理ステップについての説明は省略される。
図18を参照すると、まず、信号取得部201は、光と画像信号との間の変換に関する伝達関数に基づいて生成された画像信号を取得する(ステップS210)。ここで取得される画像信号は、符号化部210へ出力される。
次に、情報取得部203は、符号化部210へと入力される画像に適用された伝達関数及び色域を示す入力情報を、ユーザインタフェースを介して又は入力画像信号と多重化される補助信号から取得する(ステップS212)。ここで取得される入力情報は、制御部240へ出力される。
次に、閾値制御部241は、上述した入力情報により示される伝達関数及び色域のうち少なくとも一方に基づいて、画素分類のための閾値を決定する(ステップS214)。
その後の処理は、処理対象の画像に設定される複数のブロックのうちの各々について繰り返される。各繰り返しにおける処理対象のブロックを、ここでは注目ブロックという。
まず、画素分類部243は、閾値制御部241により決定された閾値を用いて、注目ブロックについて画素分類を実行する(ステップS220)。例えば、特定領域検出のケースにおいて、画素分類部243は、ブロック内の各画素がCb−Cr平面上で閾値に囲まれた特定領域内に位置するか否かを分類する。画素分類部243は、ブロック内の全画素数に対する特定領域内に位置する画素数の割合を算出する。そして、画素分類部243は、算出した割合が所定の閾値を上回る場合に、注目ブロックが特定領域に属すると判定し得る。
量子化部215は、どのような伝達関数及び色域が適用されたかに関わらず、所要の圧縮率が達成されるように注目ブロックの暫定量子化ステップを決定する(ステップS230)。次に、量子化部215は、画素分類の結果に基づいて量子化制御部245により決定される調整係数を用いて、ステップS230において決定した量子化ステップを調整する(ステップS240)。そして、量子化部215は、直交変換部214から入力される注目ブロックの変換係数データを、調整後の量子化ステップで量子化する(ステップS250)。
次に、可逆符号化部216は、量子化部215から入力される量子化データと量子化パラメータとを符号化して、符号化ビットストリームを生成する(ステップS260)。
ステップS220〜ステップS260は、ピクチャ内の全てのブロックについて処理が終了するまで繰り返される(ステップS280)。そして、全てのピクチャについて処理が終了すると、図18に示した符号化制御処理は終了する(ステップS290)。
[3−6.変形例]
ここまで、画素分類の結果をエンコーダにおいて割り当て符号量の制御のために利用する例について主に説明した。しかしながら、本実施形態のアイディアは、画素分類の結果を他の用途に利用するケースにも適用可能である。本項では、そうした一変形例について説明する。
(1)画像処理装置の構成
図19は、第2の実施形態に係る画像処理装置の構成の一変形例を示すブロック図である。図19に示した画像処理装置200bは、信号取得部201、情報取得部203、閾値制御部250、画素分類部260及び出力信号生成部270を備える。
閾値制御部250は、画像に適用される伝達関数及び色域を、情報取得部203から入力される入力情報に基づいて判定する。そして、閾値制御部250は、伝達関数若しくは色域、又はそれらの組合せに基づいて、画素分類処理において使用されるべき、色成分の符号値と比較される閾値を決定する。閾値制御部250は、例えば、伝達関数若しくは色域、又はそれらの組合せに関連付けられる閾値を記憶するメモリ(図示せず)を参照し、入力情報により示される種別に関連付けられている閾値を、使用すべき閾値として決定してもよい。閾値制御部250は、決定した閾値を画素分類部260へ出力する。
画素分類部260は、閾値制御部250により決定される閾値を用いて、入力画像信号により表現される画像について画素分類処理を実行する。例えば、画素分類処理が肌色領域検出処理である場合、閾値制御部250により決定される閾値は、肌色判定閾値を含む。例えば、SDR用の伝達関数及びBT.709の色域が適用されるケースでは、画素分類部260は、閾値判定の結果として各画素がCb−Cr平面上で矩形領域R11内に位置すると判定される場合に、当該画素が肌色を表すと判定し得る。SDR用の伝達関数及びBT.2020の色域が適用されるケースでは、画素分類部260は、閾値判定の結果として各画素がCb−Cr平面上で矩形領域R12内に位置すると判定される場合に、当該画素が肌色を表すと判定し得る。他の伝達関数及び色域が適用されるケースでも、対応する肌色判定閾値を用いて同様の判定が行われ得る。画素分類部260は、こうした画素分類の結果を出力信号生成部270へ出力する。
出力信号生成部270は、画素分類部260から入力される画素分類の結果に基づいて出力信号を生成する。例えば、出力信号生成部270は、画素分類の結果として検出される特定領域の位置を画像上で指し示す標識(例えば、領域を囲む枠)を表示するための出力信号を生成してもよい。また、出力信号生成部270は、肌色領域検出の結果を用いて顔認識を実行し、顔認識の結果を示す出力信号を生成してもよい。出力信号生成部270は、ジェスチャ認識の結果、生体認証の結果、又は拡張現実において出力画像に重畳される表示オブジェクトなどを表示するための出力信号を生成してもよい。
(2)処理の流れ
図20は、図19を用いて説明した変形例に係る画像処理の流れの一例を示すフローチャートである。
図20を参照すると、まず、信号取得部201は、光と画像信号との間の変換に関する伝達関数に基づいて生成された画像信号を取得する(ステップS210)。ここで取得される画像信号は、画素分類部260へ出力される。
次に、情報取得部203は、画素分類部260により処理される画像に適用された伝達関数及び色域を示す入力情報を、ユーザインタフェースを介して又は入力画像信号と多重化される補助信号から取得する(ステップS212)。ここで取得される入力情報は、閾値制御部250へ出力される。
次に、閾値制御部250は、上述した入力情報により示される伝達関数及び色域のうち少なくとも一方に基づいて、画素分類のための閾値を決定する(ステップS214)。
次に、画素分類部260は、閾値制御部250により決定された閾値を用いて、画像内の各画素について画素分類を実行する(ステップS225)。画素分類は、画像内で処理すべき画素が無くなるまで繰り返される(ステップS270)。
次に、出力信号生成部270は、ステップS225において実行された画素分類の結果に基づいて、出力信号を生成する(ステップS285)。
上述した処理は、一連の画像の各々について繰り返される(ステップS290)。次の画像が無い場合、図20に示した符号化制御処理は終了する。
[3−7.第2の実施形態のまとめ]
ここまで、図15A〜図20を用いて、本開示に係る技術の第2の実施形態について説明した。上述した実施形態では、光と画像信号との間の変換に関する伝達関数及び色域のうちの少なくとも一方に基づいて、多様な目的で行われ得る画素分類処理に関する処理パラメータが決定される。かかる構成によれば、伝達関数の相違、又は色域の相違に起因して不適切な基準で画素が分類されることを防止し、画素分類の結果に基づく処理の適正な実行を保証することができる。
また、上述した実施形態では、画素分類処理において色成分の符号値と比較される閾値が、伝達関数及び色域のうちの少なくとも一方に基づいて決定される。かかる構成によれば、実世界における同一の明るさ又は色が伝達関数又は色域の選択に依存して異なる符号値で表現される場合にも、それら画像信号の表現手法に影響されない一貫した閾値判定を提供することができる。
例えば、画素分類処理は画像内の特定領域を検出するための領域検出処理であってよく、上記閾値は領域検出閾値であってよい。この場合、伝達関数又は色域の選択に依存して本来検出されるべきではない領域が特定領域として誤って検出されるといった事態が防止され得る。ある実施例によれば、上述した領域検出処理の結果に基づいて調整される量子化ステップで、画像の符号化の際の量子化処理が実行される。この場合、画質の保護を強化することが望まれる特定領域を正確に検出し、その特定領域の割り当て符号量を増加させることができる。
上述した実施形態においても、伝達関数及び色域に関する入力情報に基づいて、伝達関数及び色域が判定され得る。上記入力情報がユーザインタフェースを介して取得される場合には、入力信号から伝達関数又は色域を判別できない場合にもユーザが望む通りの制御を実行することができる。上記入力情報が入力画像信号と多重化される補助信号から取得される場合には、ユーザ入力を要することなく自動的に適切な種別を判定することができる。
<4.ハードウェア構成例>
前節までに説明した実施形態は、ソフトウェア、ハードウェア、及びソフトウェアとハードウェアとの組合せのいずれを用いて実現されてもよい。画像処理装置100a、100b、200a又は200bがソフトウェアを使用する場合、ソフトウェアを構成するプログラムは、例えば、装置の内部又は外部に設けられる記憶媒体(非一時的な媒体:non-transitory media)に予め格納される。そして、各プログラムは、例えば、実行時にRAM(Random Access Memory)に読み込まれ、CPU(Central Processing Unit)などのプロセッサにより実行される。
図21は、上述した実施形態のうちの1つ以上を適用可能な装置のハードウェア構成の一例を示すブロック図である。図21を参照すると、画像処理装置900は、システムバス910、画像処理チップ920及びオフチップメモリ990を備える。画像処理チップ920は、n個(nは1以上)の処理回路930−1、930−2、…、930−n、参照バッファ940、システムバスインタフェース950及びローカルバスインタフェース960を含む。
システムバス910は、画像処理チップ920と外部モジュール(例えば、中央制御機能、アプリケーション機能、通信インタフェース又はユーザインタフェースなど)との間の通信路を提供する。処理回路930−1、930−2、…、930−nは、システムバスインタフェース950を介してシステムバス910と接続され、及びローカルバスインタフェース960を介してオフチップメモリ990と接続される。処理回路930−1、930−2、…、930−nは、オンチップメモリ(例えば、SRAM)に相当し得る参照バッファ940にもアクセスすることができる。オフチップメモリ990は、例えば、画像処理チップ920により処理される画像データを記憶するフレームメモリであってよい。一例として、処理回路930−1は画像信号の変換のために利用されてもよい。処理回路930−2は画像信号の符号化のために利用されてもよい。他の処理回路は画素の分類のために利用されてもよい。なお、これら処理回路は、同一の画像処理チップ920ではなく、別個のチップ上に形成されてもよい。
<5.総括>
本開示に係る技術は、ここまでに詳しく説明した仕組みに従って、多様化しつつある映像信号表現に必ずしも十分に適応できていない例えばデジタルビデオカメラ、デジタルカムコーダ、ビデオエンコーダ、又はエンコード機能若しくは画素分類機能を有する任意の種類の既存の装置に対する改善を提供する。本開示に係る技術によれば、HDR映像を扱う場合に不適切な処理パラメータが使用されることが防止され得る。
本明細書では、説明の簡明さのために、特定の映像符号化方式に固有の専門用語を一部で使用しているが、本開示に係る技術は、そうした用語によっては限定されない。例えば、輝度(luminance/luma)及び色差(chrominance/chroma)との語は、利用される表色系に依存して、明度(brightness)及び彩度(saturation)などの他の語にそれぞれ置き換えられてもよい。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
また、本明細書に記載された効果は、あくまで説明的又は例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果と共に、又は上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏し得る。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
画像に適用される光と画像信号との間の変換に関する伝達関数及び前記画像に適用される色域のうちの少なくとも一方に基づいて、前記画像に対する画像処理のための処理パラメータを決定する制御部と、
前記制御部により決定される前記処理パラメータを用いて、前記画像処理を実行する処理部と、
を備える画像処理装置。
(2)
前記制御部は、前記伝達関数及び前記色域の組合せに基づいて、前記処理パラメータを決定する、前記(1)に記載の画像処理装置。
(3)
前記制御部は、前記伝達関数及び前記色域のうちの前記少なくとも一方の相違に起因する画像信号の符号値の変化が前記画像処理に与える影響を打ち消すように、前記処理パラメータを決定する、前記(1)又は前記(2)に記載の画像処理装置。
(4)
前記処理部は、前記画像の部分領域ごとの符号化難易度に応じて調整される量子化ステップで各部分領域について量子化処理を実行し、
前記処理パラメータは、前記量子化処理に関するパラメータである、
前記(1)〜(3)のいずれか1項に記載の画像処理装置。
(5)
前記量子化処理に関するパラメータは、前記画像についての前記量子化ステップの調整利得を含む、前記(4)に記載の画像処理装置。
(6)
前記制御部は、前記伝達関数及び前記色域のうちの前記少なくとも一方に基づいて、前記画像についての前記量子化ステップの基本調整利得を決定する、前記(5)に記載の画像処理装置。
(7)
前記処理部は、前記基本調整利得と各部分領域の符号化難易度とに基づいて調整される調整後の量子化ステップで、各部分領域について前記量子化処理を実行する、前記(6)に記載の画像処理装置。
(8)
前記処理部は、前記処理パラメータを用いて前記画像について画素分類処理を実行する、前記(1)又は前記(2)に記載の画像処理装置。
(9)
前記処理パラメータは、前記画素分類処理において色成分の符号値と比較される閾値を含む、前記(8)に記載の画像処理装置。
(10)
前記画素分類処理は、前記画像内の特定の領域を検出するための領域検出処理を含み、
前記閾値は、領域検出閾値を含む、
前記(9)に記載の画像処理装置。
(11)
前記特定の領域は、特定の色の領域であり、
前記領域検出閾値は、色判定閾値を含む、
前記(10)に記載の画像処理装置。
(12)
前記特定の色は、肌色であり、
前記色判定閾値は、肌色判定閾値を含む、
前記(11)に記載の画像処理装置。
(13)
前記画像処理装置は、前記領域検出処理の結果に基づいて調整される量子化ステップで前記画像について量子化処理を実行する量子化部、をさらに備える、前記(12)に記載の画像処理装置。
(14)
前記画像処理装置は、前記伝達関数及び前記色域のうちの一方又は双方に関連付けられる前記処理パラメータの値を記憶する記憶部、をさらに備える、前記(1)〜(13)のいずれか1項に記載の画像処理装置。
(15)
前記制御部は、前記伝達関数及び前記色域のうちの前記少なくとも一方に関する入力情報に基づいて前記伝達関数及び前記色域のうちの前記少なくとも一方の種別を判定し、判定した前記種別に基づいて前記画像処理のための前記処理パラメータを決定する、前記(1)〜(14)のいずれか1項に記載の画像処理装置。
(16)
前記入力情報は、ユーザインタフェースを介して取得された情報である、前記(15)に記載の画像処理装置。
(17)
前記入力情報は、前記画像を表現する入力画像信号と多重化される補助信号から取得された情報である、前記(15)に記載の画像処理装置。
(18)
画像に適用される光と画像信号との間の変換に関する伝達関数及び前記画像に適用される色域のうちの少なくとも一方に基づいて、前記画像に対する画像処理のための処理パラメータを決定することと、
決定される前記処理パラメータを用いて、前記画像処理を実行することと、
を含む画像処理方法。
(19)
画像処理装置のプロセッサを、
画像に適用される光と画像信号との間の変換に関する伝達関数及び前記画像に適用される色域のうちの少なくとも一方に基づいて、前記画像に対する画像処理のための処理パラメータを決定する制御部と、
前記制御部により決定される前記処理パラメータを用いて、前記画像処理を実行する処理部と、
として機能させるためのプログラム。
100a,100b 画像処理装置
101 信号取得部
102 信号処理部
103,104 情報取得部
107 記憶部
110 符号化部
115 量子化部(処理部)
140 制御部
200a,200b 画像処理装置
201 信号取得部
203 情報取得部
210 符号化部
240 制御部
241,250 閾値制御部
243,260 画素分類部(処理部)
270 出力信号生成部

Claims (18)

  1. 画像に適用される光と画像信号との間の変換に関する伝達関数及び前記画像に適用される色域の組み合わせに基づいて、前記画像に対する画像処理のための処理パラメータを決定する制御部と、
    前記制御部により決定される前記処理パラメータを用いて、前記画像処理を実行する処理部と、
    を備え
    前記制御部が決定する前記処理パラメータは、前記伝達関数及び前記色域の組み合せごとに定義される、
    画像処理装置。
  2. 前記制御部は、前記伝達関数及び前記色域のうちの前記少なくとも一方の相違に起因する画像信号の符号値の変化が前記画像処理に与える影響を打ち消すように、前記処理パラメータを決定する、請求項1に記載の画像処理装置。
  3. 前記処理部は、前記画像の部分領域ごとの符号化難易度に応じて調整される量子化ステップで各部分領域について量子化処理を実行し、
    前記処理パラメータは、前記量子化処理に関するパラメータである、
    請求項1または請求項2に記載の画像処理装置。
  4. 前記量子化処理に関するパラメータは、前記画像についての前記量子化ステップの調整利得を含む、請求項に記載の画像処理装置。
  5. 前記制御部は、前記伝達関数及び前記色域のうちの前記少なくとも一方に基づいて、前記画像についての前記量子化ステップの基本調整利得を決定する、請求項に記載の画像処理装置。
  6. 前記処理部は、前記基本調整利得と各部分領域の符号化難易度とに基づいて調整される調整後の量子化ステップで、各部分領域について前記量子化処理を実行する、請求項に記載の画像処理装置。
  7. 前記処理部は、前記処理パラメータを用いて前記画像について画素分類処理を実行する、請求項1に記載の画像処理装置。
  8. 前記処理パラメータは、前記画素分類処理において色成分の符号値と比較される閾値を含む、請求項に記載の画像処理装置。
  9. 前記画素分類処理は、前記画像内の特定の領域を検出するための領域検出処理を含み、
    前記閾値は、領域検出閾値を含む、
    請求項に記載の画像処理装置。
  10. 前記特定の領域は、特定の色の領域であり、
    前記領域検出閾値は、色判定閾値を含む、
    請求項に記載の画像処理装置。
  11. 前記特定の色は、肌色であり、
    前記色判定閾値は、肌色判定閾値を含む、
    請求項10に記載の画像処理装置。
  12. 前記画像処理装置は、前記領域検出処理の結果に基づいて調整される量子化ステップで前記画像について量子化処理を実行する量子化部、をさらに備える、請求項11に記載の画像処理装置。
  13. 前記画像処理装置は、前記伝達関数及び前記色域のうちの一方又は双方に関連付けられる前記処理パラメータの値を記憶する記憶部、をさらに備える、請求項1〜12のいずれか1項に記載の画像処理装置。
  14. 前記制御部は、前記伝達関数及び前記色域のうちの前記少なくとも一方に関する入力情報に基づいて前記伝達関数及び前記色域のうちの前記少なくとも一方の種別を判定し、判定した前記種別に基づいて前記画像処理のための前記処理パラメータを決定する、請求項1〜13のいずれか1項に記載の画像処理装置。
  15. 前記入力情報は、ユーザインタフェースを介して取得された情報である、請求項14に記載の画像処理装置。
  16. 前記入力情報は、前記画像を表現する入力画像信号と多重化される補助信号から取得された情報である、請求項14に記載の画像処理装置。
  17. 画像に適用される光と画像信号との間の変換に関する伝達関数及び前記画像に適用される色域の組み合わせに基づいて、前記画像に対する画像処理のための処理パラメータを決定することと、
    決定される前記処理パラメータを用いて、前記画像処理を実行することと、
    を含み、
    前記決定することが決定する前記処理パラメータは、前記伝達関数及び前記色域の組み合せごとに定義される、
    画像処理方法。
  18. 画像処理装置のプロセッサを、
    画像に適用される光と画像信号との間の変換に関する伝達関数及び前記画像に適用される色域の組み合わせに基づいて、前記画像に対する画像処理のための処理パラメータを決定する制御部と、
    前記制御部により決定される前記処理パラメータを用いて、前記画像処理を実行する処理部と、
    として機能させ
    前記制御部が決定する前記処理パラメータは、前記伝達関数及び前記色域の組み合せごとに定義される、
    ためのプログラム。
JP2016245983A 2016-12-19 2016-12-19 画像処理装置、画像処理方法及びプログラム Active JP6822121B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2016245983A JP6822121B2 (ja) 2016-12-19 2016-12-19 画像処理装置、画像処理方法及びプログラム
PCT/JP2017/037600 WO2018116605A1 (ja) 2016-12-19 2017-10-17 画像処理装置、画像処理方法及びプログラム
CN201780076634.7A CN110050465B (zh) 2016-12-19 2017-10-17 图像处理设备、图像处理方法和程序
KR1020197016706A KR20190097004A (ko) 2016-12-19 2017-10-17 화상 처리 장치, 화상 처리 방법 및 프로그램
US16/469,020 US11006113B2 (en) 2016-12-19 2017-10-17 Image processing device, method, and program deciding a processing parameter
EP17885014.5A EP3641315A4 (en) 2016-12-19 2017-10-17 IMAGE PROCESSING DEVICE, IMAGE PROCESSING METHOD AND PROGRAM
BR112019011927-2A BR112019011927A2 (pt) 2016-12-19 2017-10-17 dispositivo de processamento de imagem, método de processamento de imagem, e, programa.
US17/226,556 US20210235089A1 (en) 2016-12-19 2021-04-09 Image processing device, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016245983A JP6822121B2 (ja) 2016-12-19 2016-12-19 画像処理装置、画像処理方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2018101863A JP2018101863A (ja) 2018-06-28
JP2018101863A5 JP2018101863A5 (ja) 2020-01-30
JP6822121B2 true JP6822121B2 (ja) 2021-01-27

Family

ID=62626130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016245983A Active JP6822121B2 (ja) 2016-12-19 2016-12-19 画像処理装置、画像処理方法及びプログラム

Country Status (7)

Country Link
US (2) US11006113B2 (ja)
EP (1) EP3641315A4 (ja)
JP (1) JP6822121B2 (ja)
KR (1) KR20190097004A (ja)
CN (1) CN110050465B (ja)
BR (1) BR112019011927A2 (ja)
WO (1) WO2018116605A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018025466A1 (ja) * 2016-08-04 2018-02-08 ソニー株式会社 画像処理装置、及び画像処理方法
JP6822121B2 (ja) * 2016-12-19 2021-01-27 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
JP6822122B2 (ja) * 2016-12-19 2021-01-27 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
SG11202105604UA (en) * 2018-11-27 2021-06-29 Op Solutions Llc Block-based spatial activity measures for pictures cross-reference to related applications
KR20210094030A (ko) * 2018-11-27 2021-07-28 오피 솔루션즈, 엘엘씨 컨텍스트 세그먼트화 및 처리를 위한 블록-기반 픽처 융합
US10986320B2 (en) 2019-01-31 2021-04-20 Coretronic Corporation Projector and method for projecting image light beam
US11095861B2 (en) 2019-01-31 2021-08-17 Coretronic Corporation Projector and method for projecting image light beam
JP7256658B2 (ja) * 2019-03-01 2023-04-12 キヤノン株式会社 画像符号化装置及びその制御方法及びプログラム
EP3754978A1 (en) * 2019-06-18 2020-12-23 Coretronic Corporation Projector and method for projecting image light beam
CN110400308B (zh) * 2019-07-30 2022-01-28 青岛海信医疗设备股份有限公司 一种图像显示方法、装置、设备及存储介质
CN110781932B (zh) * 2019-10-14 2022-03-11 国家广播电视总局广播电视科学研究院 一种多类别图像转换与对比的超高清片源色域检测方法
US11638019B2 (en) * 2020-07-29 2023-04-25 Alibaba Group Holding Limited Methods and systems for prediction from multiple cross-components
US11330196B2 (en) * 2020-10-12 2022-05-10 Microsoft Technology Licensing, Llc Estimating illumination in an environment based on an image of a reference object
CN116630305B (zh) * 2023-07-18 2024-02-13 北京阿丘机器人科技有限公司 电池盖板外观检测方法、装置、设备及存储介质

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4791483A (en) * 1987-11-20 1988-12-13 The Grass Valley Group, Inc. Adaptive differential pulse code modulation video encoder
KR100307618B1 (ko) * 1994-05-31 2001-11-30 윤종용 영상부호화방법및장치
US6343141B1 (en) * 1996-10-08 2002-01-29 Lucent Technologies Inc. Skin area detection for video image systems
US6452970B1 (en) * 1997-10-28 2002-09-17 Siemens Aktiengesellschaft Method and device for processing a digitized image
US6882685B2 (en) * 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
US8315466B2 (en) * 2006-12-22 2012-11-20 Qualcomm Incorporated Decoder-side region of interest video processing
US8503521B2 (en) * 2007-01-16 2013-08-06 Chih-Ta Star SUNG Method of digital video reference frame compression
US20080198932A1 (en) * 2007-02-21 2008-08-21 Nucore Technology Inc. Complexity-based rate control using adaptive prefilter
US8787445B2 (en) * 2007-03-15 2014-07-22 Nvidia Corporation Allocation of available bits to represent different portions of video frames captured in a sequence
US8363719B2 (en) * 2007-10-29 2013-01-29 Canon Kabushiki Kaisha Encoding apparatus, method of controlling thereof, and computer program
US8175158B2 (en) 2008-01-04 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction parameter determination
EP2094016A1 (en) * 2008-02-19 2009-08-26 Thomson Licensing Method and device for compressing an image and storage medium carrying an image compressed by said method
TWI538473B (zh) * 2011-03-15 2016-06-11 杜比實驗室特許公司 影像資料轉換的方法與設備
CN103891294B (zh) 2011-04-28 2017-09-01 皇家飞利浦有限公司 用于hdr图像编码和解码的装置与方法
US8792550B2 (en) * 2011-08-04 2014-07-29 Qualcomm Incorporated Color/gray patch prevention for video coding
WO2013108685A1 (ja) * 2012-01-17 2013-07-25 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、プログラム
KR102070622B1 (ko) * 2012-11-23 2020-01-29 삼성전자주식회사 동영상을 위한 양자화 테이블 추정 방법 및 장치
US9307256B2 (en) * 2013-01-21 2016-04-05 The Regents Of The University Of California Method and apparatus for spatially scalable video compression and transmission
CN105009580B (zh) 2013-02-21 2017-09-29 杜比实验室特许公司 高动态范围视频的显示管理
US20150016509A1 (en) * 2013-07-09 2015-01-15 Magnum Semiconductor, Inc. Apparatuses and methods for adjusting a quantization parameter to improve subjective quality
US20150063461A1 (en) * 2013-08-27 2015-03-05 Magnum Semiconductor, Inc. Methods and apparatuses for adjusting macroblock quantization parameters to improve visual quality for lossy video encoding
JP6202330B2 (ja) * 2013-10-15 2017-09-27 ソニー株式会社 復号装置および復号方法、並びに符号化装置および符号化方法
US20150181168A1 (en) * 2013-12-20 2015-06-25 DDD IP Ventures, Ltd. Interactive quality improvement for video conferencing
KR102414567B1 (ko) * 2014-02-25 2022-06-29 애플 인크. 비디오 인코딩 및 디코딩을 위한 적응형 전달 함수
KR102361927B1 (ko) 2014-02-26 2022-02-11 인터디지털 브이씨 홀딩스 인코포레이티드 Hdr 이미지들을 인코딩 및 디코딩하기 위한 방법 및 장치
WO2016017236A1 (ja) 2014-07-28 2016-02-04 株式会社J-オイルミルズ 飼料原料及びその用途
US10136133B2 (en) * 2014-11-11 2018-11-20 Dolby Laboratories Licensing Corporation Rate control adaptation for high-dynamic range images
US20160309154A1 (en) * 2015-04-17 2016-10-20 Qualcomm Incorporated Dynamic range adjustment for high dynamic range and wide color gamut video coding
WO2016172361A1 (en) * 2015-04-21 2016-10-27 Vid Scale, Inc. High dynamic range video coding
WO2016172394A1 (en) * 2015-04-21 2016-10-27 Arris Enterprises Llc Adaptive perceptual mapping and signaling for video coding
CN107852512A (zh) * 2015-06-07 2018-03-27 夏普株式会社 基于亮度转换函数或视频色彩分量值的优化视频编码的系统及方法
US10397585B2 (en) * 2015-06-08 2019-08-27 Qualcomm Incorporated Processing high dynamic range and wide color gamut video data for video coding
US10244245B2 (en) * 2015-06-08 2019-03-26 Qualcomm Incorporated Content-adaptive application of fixed transfer function to high dynamic range (HDR) and/or wide color gamut (WCG) video data
WO2017015564A1 (en) * 2015-07-22 2017-01-26 Arris Enterprises Llc System for coding high dynamic range and wide color gamut sequences
KR102140083B1 (ko) * 2015-09-23 2020-07-31 애리스 엔터프라이지즈 엘엘씨 높은 동적 범위 및 넓은 컬러 색역 시퀀스들을 재형성하고 코딩하기 위한 시스템
US10491895B2 (en) * 2016-05-23 2019-11-26 Intel Corporation Fast and robust human skin tone region detection for improved video coding
JP6822121B2 (ja) * 2016-12-19 2021-01-27 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
JP6822122B2 (ja) * 2016-12-19 2021-01-27 ソニー株式会社 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
CN110050465A (zh) 2019-07-23
US11006113B2 (en) 2021-05-11
EP3641315A1 (en) 2020-04-22
EP3641315A4 (en) 2020-05-06
US20190320187A1 (en) 2019-10-17
CN110050465B (zh) 2022-06-17
JP2018101863A (ja) 2018-06-28
WO2018116605A1 (ja) 2018-06-28
KR20190097004A (ko) 2019-08-20
US20210235089A1 (en) 2021-07-29
BR112019011927A2 (pt) 2019-10-29

Similar Documents

Publication Publication Date Title
JP6822121B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6822122B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6822123B2 (ja) 画像処理装置、画像処理方法及びプログラム
CA2615299C (en) Image encoding device, image decoding device, image encoding method, and image decoding method
JP6882198B2 (ja) 高ダイナミックレンジ(hdr)および/または広色域(wcg)ビデオデータへの固定伝達関数のコンテンツ適応型適用
EP2357826B1 (en) Image encoding device, image decoding device, image encoding method, and image decoding method
US20130107956A1 (en) Generation of high dynamic range images from low dynamic range images
TW201924336A (zh) 利用內容適應性空間變化量化之視訊寫碼
US20100021071A1 (en) Image coding apparatus and image decoding apparatus
US10735724B2 (en) Method and device for compressing image on basis of photography information
KR20190008205A (ko) 화상 처리 장치 및 방법
JP2018533867A (ja) Qp値の決定
TW201445982A (zh) 可適性色彩空間轉換寫碼
RU2628133C2 (ru) Кодирование и декодирование слайсов в изображениях видеопотока
CN108156461A (zh) 一种Bayer图像压缩方法及装置
US20080187043A1 (en) Method and apparatus for encoding/decoding image using adaptive quantization step
Lee et al. A new intra prediction method using channel correlations for the H. 264/AVC intra coding
US11032547B2 (en) Image encoding apparatus, control method thereof, and non-transitory computer-readable storage medium
AU2016200566B2 (en) Image processing device and method
JP2020109923A (ja) 画像符号化装置及びその制御方法及びプログラム
Kikuchi et al. Adaptive color space transforms for 4: 4: 4 video coding considering uncorrelated noise among color components
Luo et al. Subjective Quality Based Optimization for JPEG XR Encoding Algorithm
JP2006271002A (ja) 符号化装置及び符号化方法
Li et al. Human visual system based adaptive inter quantization

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190208

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190214

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190222

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190515

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191212

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201221

R151 Written notification of patent or utility model registration

Ref document number: 6822121

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151