JP6484347B2 - ハイダイナミックレンジ画像のためのコンテンツ適応的な知覚的量子化器 - Google Patents
ハイダイナミックレンジ画像のためのコンテンツ適応的な知覚的量子化器 Download PDFInfo
- Publication number
- JP6484347B2 JP6484347B2 JP2017546223A JP2017546223A JP6484347B2 JP 6484347 B2 JP6484347 B2 JP 6484347B2 JP 2017546223 A JP2017546223 A JP 2017546223A JP 2017546223 A JP2017546223 A JP 2017546223A JP 6484347 B2 JP6484347 B2 JP 6484347B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- input
- bit depth
- generating
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003044 adaptive effect Effects 0.000 title claims description 24
- 238000000034 method Methods 0.000 claims description 60
- 238000013139 quantization Methods 0.000 claims description 42
- 238000013507 mapping Methods 0.000 claims description 29
- 230000000873 masking effect Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000001186 cumulative effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 22
- 230000000007 visual effect Effects 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 241000023320 Luma <angiosperm> Species 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 230000004301 light adaptation Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- GGCZERPQGJTIQP-UHFFFAOYSA-N sodium;9,10-dioxoanthracene-2-sulfonic acid Chemical compound [Na+].C1=CC=C2C(=O)C3=CC(S(=O)(=O)O)=CC=C3C(=O)C2=C1 GGCZERPQGJTIQP-UHFFFAOYSA-N 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000003945 visual behavior Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/156—Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/98—Adaptive-dynamic-range coding [ADRC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
- Picture Signal Circuits (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
本願は、2015年3月2日付け出願の米国仮特許出願第62/126,925号に基づく優先権を主張するものであり、この出願の開示内容を全て本願に援用する。
本発明は、広く画像に関する。より詳細には、本発明のある実施形態は、ハイダイナミックレンジを備える画像の、コンテンツ適応的な知覚的量子化に関する。
本明細書において、用語「ダイナミックレンジ」(DR)は、人間の視覚システム(HVS)が画像においてある範囲の強度(例えば、輝度、ルマ)(例えば、最暗部(黒)から最も明るい白(ハイライト)まで)を知覚する能力に関連し得る。この意味では、DRはシーン−リファード(scene−referred)の強度に関する。DRはまた、ディスプレイデバイスが特定の幅を有する強度範囲を妥当にまたは近似的に描画する能力にも関連し得る。この意味では、DRは、ディスプレイ−リファード(display−referred)の強度に関する。本明細書中の任意の箇所において、ある特定の意味が特に明示的に指定されている場合を除いて、この用語はどちらの意味としても(例えば、区別なく)使用できるものとする。
ハイダイナミックレンジ(HDR)画像の知覚的量子化のための、コンテンツ適応的技術を本明細書に記載する。以下の説明においては、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明を実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
本明細書に記載の実施形態例は、画像の適応的な知覚的量子化に関する。コンテンツ適応的な量子化器プロセッサは、ある入力ビット深度を有する入力画像を受け取る。入力画像に対しノイズマスク生成プロセスを適用することにより、入力画像中の各画素を量子化ノイズのマスキングの際におけるその知覚的重要度(perceptual relevance)に関して特徴づける、ノイズマスク画像を生成する。入力画像およびノイズマスク画像に基づいて、ノイズマスクヒストグラムが生成される。ノイズマスクヒストグラムに対しマスキングノイズレベル−ビット深度関数を適用することにより、ノイズマスクヒストグラム中の各ビンについての最小ビット深度値群を生成する。入力ビット深度、ターゲットビット深度、および最小ビット深度値群に基づき、符号語マッピング関数を生成する。符号語マッピング関数を入力画像に適用することにより、入力ビット深度よりも低いターゲットビット深度において出力画像を生成する。
図1Aは、従来の映像供給パイプライン(100)のプロセス例を示しており、映像のキャプチャから映像コンテンツの表示までの、様々な段を示している。画像生成ブロック(105)を用い、映像フレームのシーケンス(102)をキャプチャまたは生成する。映像フレームは、デジタル的にキャプチャされるか(例えばデジタルカメラにより)またはコンピュータ(例えばコンピュータアニメーションを用いて)によって生成されることにより、映像データ(107)が得られる。あるいは映像フレーム(102)は、銀塩カメラによってフィルム上に取得されてもよい。フィルムがデジタルフォーマットに変換されることによって、映像データ(107)が得られる。プロダクションフェーズ(110)において、映像データ(107)は編集され、映像プロダクションストリーム(112)を得る。
現在、映像供給用のほとんどのデジタルインターフェース、例えばSerial Digital Interface(SDI)などは、各成分につき画素あたり12ビットに制限されている。さらに、ほとんどの圧縮規格、例えばH.264(またはAVC)およびH.265(またはHEVC)などは、各成分につき画素あたり10ビットに制限されている。したがって、既存のインフラストラクチャおよび圧縮規格内において、約0.001から10,000cd/m2(またはニト)のダイナミックレンジを有するHDRコンテンツをサポートするためには、効率的な符号化および/または量子化が必要である。
図2は、本発明の一実施形態による、コンテンツ適応的な知覚的量子化のプロセス例を示す。図2に示すように、画像のシーケンス(例えば映像フレーム)(117)を与えられると、ブロック(205)を用いて、入力画像中の各画素を量子化ノイズのマスキングの際におけるその知覚的重要度に関して特徴づける、ノイズマスク画像を生成する。ノイズマスク画像は、元の画像データとともにステップ(210)で使用されることによりノイズマスクヒストグラムを生成する。ブロック(215)は、ステップ(210)で生成されたヒストグラムの各ビンに必要な最小ビット数を推定し、最終的に、符号語マッピングブロック(220)が入力信号(117)をその量子化された出力に変換するためのマッピング関数を算出する。これらのステップの各々を、次により詳細に説明する。
適応的PQの基本的な考え方は、画像のうちのノイズが多いかあるいはハイテクスチャを有するような領域にはより少ないビットを割り当て、一方、画像のうちのノイズを有しないかあるいはより滑らかであると知覚されるような領域にはより多くのビットを割り当てることである。入力画像(117)を与えられると、ノイズマスク生成ブロック(205)は、画像中の各画素に対してマスキングノイズの見込み値を生成する。いくつかの実施形態において、入力(117)はガンマまたはPQ系の量子化器を用いて既に符号化されていてもよい。他のいくつかの実施形態において、入力画像(117)は線形空間に存在してもよい。図3は、一実施形態による、ノイズマスク生成のプロセス例を示す。他のいくつかの実施形態においてノイズマスクは、当該分野において公知であるような、画像中の局所エントロピーを測定するための他の方法を用いて生成してもよい。例えば、移動窓(moving window)に対してのエントロピーフィルタリング、移動窓に対しての標準偏差フィルタリング、または移動窓に対してのレンジフィルタリングなどである。
次に、ブロック(310)の出力を、第2のローパスフィルタ(315)を用いて再びフィルタリングすることにより、ノイズマスク(H)を生成する。これは、HVSマスキングの低位相精度に対応することである(すなわちマスキング信号のゼロクロス点において、まだマスキングが存在している)。ある実施形態において、第2のLPFもまた、
すると、ノイズマスク(H)は、
BIが入力画像(117)のビット深度を示すとし(例えばBI=16)、K=2BIとすれば、ダイナミックレンジ0〜K−1は、等しい画素間隔値WのM個のビンに区分けされ得る。すなわちW=K/Mである。ある実施形態において、j番目のフレームについて、ノイズヒストグラムbj(m)(ここでmはm番目のヒストグラムビンを表す(m=0,1,2,…M−1))は、以下のように生成され得る。
a)元の画像(Iji,i∈Ωj)中において、
b)これらの画素のうち最小のHj(i)を選択する。前述のようにマスキング高さは2Dマップではないためである。
すなわち、
ここで、時として特定のビンが空であることがあり得ることに留意されたい。これは、そのビンの画素範囲内には画像画素が存在しないかもしれないためである。これらのビンのインデックスを格納しておき、それらの状態は後で扱われる(addressed)。
ノイズマスクヒストグラム中の各ビンのノイズレベルbmが与えられたとき、次のステップは各ビンに対して割り当てられるべきビット数を決定することである。ある実施形態において、そのようなマッピングは、実験的なユーザー調査結果に基づいて決定され得る。例えば、そのような調査の一つにおいて、ユーザーに対して異なるビット深度に量子化されたテスト画像を見せ(量子化の前に画像に対しガウスノイズを加えている)これを評価させたものがある。一例として、図5は
BTが再量子化された信号(152)(例えば各色成分につきBT=10ビット/画素)のターゲットビット深度を表すとすれば、出力は2BT個の符号語を用いてマッピングされることになる。ある実施形態において、符号語の範囲を1に正規化するので、
i)比例的割り当て
この条件においては、入力vL≦i≦vHについて追加的な符号語が、既存の分布に基づき割り当てられる。すなわち、
ii)定オフセット割り当て
この条件下において、余剰の符号語は均一に配分される、すなわち、入力vL≦i≦vHについて、
iii)ヒストグラムに基づく割り当て
hiが元の入力画像のヒストグラムを表すとする。すなわち、vL≦i≦vHについて、hi=kは、P個の画素のうち、値iを有する画素がk個存在することを表す。すると、この条件下において、符号語は、ヒストグラム値に従って割り当てられる。すなわち、入力vL≦i≦vHについて、
一変形例において、入力範囲をM個のサブ範囲(例えばM=3の場合、黒、ミッドトーン、ハイライト)に分割し、m番目のサブ範囲内における入力画素の総数を表すヒストグラムHm(m=1,2,…,M)を算出してもよい。すると、m番目の画素のサブ範囲に属するiについて、
iv)スカラーに基づく割り当て
これは、ヒストグラムに基づく割り当て(例えば、暗部に対する1つとハイライトに対する1つの、2つのビンだけを有するヒストグラムを考える)と、定オフセット割り当てとの組み合わせと考えることができる。αが0と1の間の「暗部」対「ハイライト」の重要性の関係を示すパラメータを表すとすると、入力vL≦i≦vHについて、本基準において、
前述のように、式(7)に従い、ある実施形態において、適応的量子化は、シーン中の複数のフレームにわたって集められたノイズマスキングヒストグラムデータに基づいていてもよい。データを複数のフレームにわたって集めることは、リアルタイムで適応的量子化を行う必要がある環境においては容認しがたいような、有意な遅延を引き起こし得る。別の実施形態において、符号語マッピング(あるいは再構成)を、シーン中の最初のフレームからのデータを用いて行ってもよい。ただし、このマッピングは、シーンのフレーム群内における小さな変動に対応するために、周期的に調節され得る。そのようなプロセスを、表1に擬似コードで記述する。
いくつかの実施形態において、順方向再構成(150)の効果を逆転させるために、逆方向再構成(160)を適用してもよい。ある実施形態において、逆量子化のためのルックアップテーブルを、以下のように構築してもよい。
a)量子化ドメイン(sc)中の各符号語について、FL(vi)=scであるような全ての入力符号語(vi)を特定する。このグループをω(sc)={vi|FL(vi)=sc}と表す。このとき、
b)逆方向再構成関数(BL(sc))を、ω(sc)の関数として構築する。
例えば、ある実施形態において、限定されないが、BL(sc)を、ω(sc)に属する全ての符号語の平均として構築してもよい。すなわち、
もし |ω(sc)| > 0 ならば、
ここで|ω(sc)|は、集合ω(sc)中の要素の数を表す。もし任意のsc値群について|ω(sc)|=0ならば、ある実施形態において、これらの値は、その近隣の非ゼロ値から補間されてもよい。
前述のように、一実施形態において、既存のコーデックが有するビット深度に関連する制限に対応するために、符号化(圧縮)ステップ(120)の前に本提案による適応的量子化が行われてもよい。量子化の後、再構成マッピング関数(630)に関連するデータ(例えば逆マッピング関数)を、メタデータとして(例えばマルチセグメントの線形または2次多項式の係数として、またはルックアップテーブルとして)埋め込むことにより、デコーダが逆マッピングを行うことを可能にしてもよい。あるいは、ターゲットビット深度制限内で動作し得る適切な再構成関数が存在しない場合は、ある実施形態において、画像の元の滑らかな領域に対し当該分野において公知のノイズまたはディザリングを加えることにより、量子化エラーのマスキングを改善してもよい。そのようなノイズは、ノイズマスクヒストグラム生成ステップ(210)の出力にしたがって加えられてもよい。
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載のようなエンハンストダイナミックレンジを有する画像の適応的な知覚的量子化に関する命令を行い、制御し、または実行し得る。このコンピュータおよび/またはICは、本明細書に記載の適応的な知覚的量子化プロセスに関する様々なパラメータまたは値のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
HDR画像の効率的な適応的な知覚的量子化に関する実施形態例を上述した。この明細書中において、各実装毎に異なり得る多数の具体的な詳細に言及しながら本発明の実施形態を説明した。従って、本発明が如何なるものかおよび出願人は本発明が如何なるものであると意図しているかについての唯一且つ排他的な指標は、後の訂正を含む、これら請求項が生じる具体的な形態の、本願から生じる1組の請求項である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項に明示的に記載されていない限定事項、構成要素、特性、特徴、利点または属性は、いかなる形であれ請求の範囲を限定するものではない。従って、本明細書および図面は、限定的ではなく、例示的であると認識されるべきものである。
Claims (21)
- プロセッサを用いた、画像の知覚的量子化のための方法であって、
ある入力ビット深度にある入力画像に、プロセッサを用いてアクセスすることと、
前記入力画像にノイズマスク生成プロセスを適用することによりノイズマスク画像を生成することであって、前記ノイズマスク画像は、前記入力画像中の画素を、量子化ノイズをマスキングする際におけるその知覚的重要度に関して特徴づけ、
前記入力画像および前記ノイズマスク画像に基づき、ノイズマスクヒストグラムを生成することと、
前記ノイズマスクヒストグラム中の1つ以上のビンについて、マスキングノイズレベル−ビット深度関数を適用することにより、前記1つ以上のビンに対し最小ビット深度値群を生成することと、
前記入力ビット深度、前記最小ビット深度値群、およびターゲットビット深度に基づき、符号語マッピング関数を生成することと、
前記入力画像に前記符号語マッピング関数を適用することにより、前記ターゲットビット深度において出力画像を生成し、前記ターゲットビット深度は前記入力ビット深度よりも小さいこと、
を包含し、
前記ノイズマスク生成プロセスは、
前記入力画像に第1のフィルタを適用して、第1のフィルタリングされた画像を生成することと、
前記入力画像と前記第1のフィルタリングされた画像との差の絶対値を算出することにより、第2の画像を生成することと、
前記第2の画像に第2のフィルタを適用することにより、前記ノイズマスク画像を生成することと、
を包含する、方法。 - 前記第1のフィルタはローパスガウスフィルタである、請求項1に記載の方法。
- 前記第2のフィルタはローパスガウスフィルタである、請求項1に記載の方法。
- 前記ノイズマスク画像に画素選択プロセスを適用することにより、量子化プロセスにおいて重要でないとみなされる画素を排除すること
をさらに包含する、請求項1に記載の方法。 - 前記ノイズマスクヒストグラムを生成することは、
前記入力ビット深度に基づいて、前記入力画像のダイナミックレンジを算出することと、
前記ダイナミックレンジをM個のサブ範囲に分割することであって、ここでMは1より大きい整数であり、
i番目のサブ範囲について、
前記入力画像において、前記i番目のサブ範囲内に画素値を有しているすべての画素を特定することと、
前記i番目のサブ範囲内の各画素について、
前記ノイズマスク画像におけるその対応するノイズマスク値を決定すること、および
前記i番目のサブ範囲内のすべての画素について、前記ノイズマスク値の最小値を決定することと、
前記ノイズマスクヒストグラム中のi番目のビンに対し、前記i番目のサブ範囲内の前記画素についての前記ノイズマスク値の最小値を割り当てることと、
を包含する、請求項1に記載の方法。 - 前記入力画像は、ガンマ符号化またはSMPTE ST 2084にしたがって符号化されたハイダイナミックレンジ画像である、請求項1に記載の方法。
- 前記マスキングノイズレベル−ビット深度関数は、知覚的ユーザー調査の結果にしたがって生成される、請求項1に記載の方法。
- 前記符号語マッピング関数を生成することは、
前記最小ビット深度値群、前記入力ビット深度、および前記ターゲットビット深度に基づいて、前記ターゲットビット深度にある正規化された必要符号語数の下限を生成することと、
ある割り当て方式にしたがって、前記入力画像のダイナミックレンジ全体に対して未使用の正規化された符号語を割り当てることにより、新しく更新した正規化された必要な符号語数群を生成することと、
前記新しく更新した正規化された必要な符号語数群の累積和を算出することにより、前記符号語マッピング関数を生成することと、
をさらに包含する、請求項1に記載の方法。 - 前記符号語マッピング関数を生成するよりも前に、前記新しく更新した正規化された必要な符号語数群をローパスフィルタによってフィルタリングすること
をさらに包含する、請求項8に記載の方法。 - 前記ローパスフィルタは、Nが正の整数である(2N+1)タップの平均化フィルタを包含する、請求項9に記載の方法。
- 前記最小ビット深度値群は、前記入力画像を含む映像シーン中の複数の連続フレーム群にわたって算出された最小ビット深度値群に基づいて算出される、請求項1に記載の方法。
- 前記ターゲットビット深度が前記割り当てステップによって満足されないと判断したとき、前記ノイズマスク画像にしたがってノイズまたはディザリングを前記入力画像に加え、かつ、正規化された必要符号語数の新たな下限を生成することにより、正規化された必要符号語数の下限を置き換えることを包含する、請求項8に記載の方法。
- 適応的量子化のためのシステムであって、
入力フレーム群を受け取り、請求項1の方法にしたがって再量子化されたフレーム群を生成する、プロセッサと、
前記再量子化されたフレーム群を符号化することにより、符号化フレーム群を生成する、プロセッサと、
前記符号化フレーム群を復号化することにより、復号化フレーム群を生成する、プロセッサと、
前記復号化フレーム群に逆方向再構成関数を適用することにより、出力フレーム群を生成する、プロセッサと、
を備える、システム。 - プロセッサを備え、請求項1〜18に記載の方法のうちいずれかを行うように構成された装置。
- コンピュータ読み取り可能な非一時的記憶媒体であって、請求項1〜18のうちいずれかにしたがって方法を実行するための、コンピュータにより実行可能な命令を格納した、記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562126925P | 2015-03-02 | 2015-03-02 | |
US62/126,925 | 2015-03-02 | ||
PCT/US2016/020230 WO2016140954A1 (en) | 2015-03-02 | 2016-03-01 | Content-adaptive perceptual quantizer for high dynamic range images |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018509708A JP2018509708A (ja) | 2018-04-05 |
JP6484347B2 true JP6484347B2 (ja) | 2019-03-13 |
Family
ID=55910328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017546223A Active JP6484347B2 (ja) | 2015-03-02 | 2016-03-01 | ハイダイナミックレンジ画像のためのコンテンツ適応的な知覚的量子化器 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10419762B2 (ja) |
EP (1) | EP3266208B1 (ja) |
JP (1) | JP6484347B2 (ja) |
KR (1) | KR101939012B1 (ja) |
CN (1) | CN107409213B (ja) |
BR (1) | BR112017018893B1 (ja) |
RU (1) | RU2678483C1 (ja) |
WO (1) | WO2016140954A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11356623B2 (en) | 2020-06-01 | 2022-06-07 | City University Of Hong Kong | System and method for processing an image |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6374614B2 (ja) | 2015-03-20 | 2018-08-15 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 信号再整形近似 |
WO2016164235A1 (en) | 2015-04-06 | 2016-10-13 | Dolby Laboratories Licensing Corporation | In-loop block-based image reshaping in high dynamic range video coding |
US10735755B2 (en) | 2015-04-21 | 2020-08-04 | Arris Enterprises Llc | Adaptive perceptual mapping and signaling for video coding |
WO2017003525A1 (en) | 2015-06-30 | 2017-01-05 | Dolby Laboratories Licensing Corporation | Real-time content-adaptive perceptual quantizer for high dynamic range images |
US10116938B2 (en) | 2015-07-22 | 2018-10-30 | Arris Enterprises Llc | System for coding high dynamic range and wide color gamut sequences |
EP3338243B1 (en) * | 2015-09-23 | 2022-04-20 | ARRIS Enterprises LLC | High dynamic range adaptation operations at a video decoder |
US10311558B2 (en) * | 2015-11-16 | 2019-06-04 | Dolby Laboratories Licensing Corporation | Efficient image processing on content-adaptive PQ signal domain |
US10165275B2 (en) | 2016-01-26 | 2018-12-25 | Dolby Laboratories Licensing Corporation | Content-adaptive reshaping for high dynamic range images |
US10032262B2 (en) * | 2016-02-02 | 2018-07-24 | Dolby Laboratories Licensing Corporation | Block-based content-adaptive reshaping for high dynamic range images |
US10223774B2 (en) | 2016-02-02 | 2019-03-05 | Dolby Laboratories Licensing Corporation | Single-pass and multi-pass-based polynomial approximations for reshaping functions |
US10701375B2 (en) | 2016-03-23 | 2020-06-30 | Dolby Laboratories Licensing Corporation | Encoding and decoding reversible production-quality single-layer video signals |
US10397586B2 (en) | 2016-03-30 | 2019-08-27 | Dolby Laboratories Licensing Corporation | Chroma reshaping |
US10645403B2 (en) | 2016-05-19 | 2020-05-05 | Dolby Laboratories Licensing Corporation | Chroma reshaping for high dynamic range images |
GB201611253D0 (en) | 2016-06-29 | 2016-08-10 | Dolby Laboratories Licensing Corp | Efficient Histogram-based luma look matching |
EP3510772B1 (en) | 2016-09-09 | 2020-12-09 | Dolby Laboratories Licensing Corporation | Coding of high dynamic range video using segment-based reshaping |
WO2018049335A1 (en) * | 2016-09-09 | 2018-03-15 | Dolby Laboratories Licensing Corporation | Coding of high dynamic range video using segment-based reshaping |
JP6740866B2 (ja) * | 2016-11-07 | 2020-08-19 | 株式会社デンソー | 画像出力装置 |
JP6876822B2 (ja) | 2017-03-21 | 2021-05-26 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ルミナンス情報を用いた量子化パラメーター予測 |
DE202018006406U1 (de) | 2017-08-09 | 2020-04-23 | Sharkninja Operating Llc | Kochgerät und Komponenten davon |
US10609372B2 (en) | 2017-09-29 | 2020-03-31 | Dolby Laboratories Licensing Corporation | Up-conversion to content adaptive perceptual quantization video signals |
CA3142715A1 (en) | 2018-02-14 | 2019-08-22 | Dolby Laboratories Licensing Corporation | Image reshaping in video coding using rate distortion optimization |
WO2019210294A1 (en) * | 2018-04-27 | 2019-10-31 | Carnegie Mellon University | Perturbative neural network |
JP7015967B2 (ja) * | 2018-09-24 | 2022-02-03 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Sdr-hdr画像変換における画像ノイズ除去 |
WO2020072651A1 (en) * | 2018-10-03 | 2020-04-09 | Dolby Laboratories Licensing Corporation | Reducing banding artifacts in backward-compatible hdr imaging |
EP3900335B1 (en) * | 2018-12-19 | 2024-08-21 | Dolby Laboratories Licensing Corporation | Image debanding using adaptive sparse filtering |
CN115623208A (zh) | 2019-05-28 | 2023-01-17 | 杜比实验室特许公司 | 用信号发送量化参数 |
CN115803802A (zh) * | 2020-06-30 | 2023-03-14 | 杜比实验室特许公司 | 用于使用pq偏移进行环境光补偿的系统和方法 |
US11657523B2 (en) * | 2021-03-17 | 2023-05-23 | The Trustees Of Princeton University | Microlens amplitude masks for flying pixel removal in time-of-flight imaging |
WO2022245695A1 (en) | 2021-05-21 | 2022-11-24 | Dolby Laboratories Licensing Corporation | Patch-based reshaping and metadata for volumetric video |
CN115908157A (zh) * | 2021-09-30 | 2023-04-04 | 想象技术有限公司 | 渲染3d场景的图像 |
WO2023215108A1 (en) | 2022-05-05 | 2023-11-09 | Dolby Laboratories Licensing Corporation | Stereoscopic high dynamic range video |
CN114881877B (zh) * | 2022-05-06 | 2024-11-05 | 苏州法兰克曼医疗器械有限公司 | 一种基于图像空域的降噪方法 |
CN116385316B (zh) * | 2023-06-01 | 2023-08-08 | 深圳市嘉润原新显科技有限公司 | 多目标图像动态捕捉方法及相关装置 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU544259B2 (en) * | 1980-04-16 | 1985-05-23 | Sony Corporation | Detecting + correcting errors in digital video signals |
JPH02131038A (ja) | 1988-11-10 | 1990-05-18 | Pioneer Electron Corp | 信号伝送装置 |
EP0757334A3 (en) | 1995-07-07 | 1997-07-02 | Imec Vzw | Data compression method and apparatus |
KR100355375B1 (ko) | 1995-11-01 | 2002-12-26 | 삼성전자 주식회사 | 영상부호화장치에있어서양자화간격결정방법및회로 |
KR100316764B1 (ko) | 1996-01-19 | 2002-02-28 | 윤종용 | 시감특성을 이용한 영상 부호화방법 및 장치 |
KR100203695B1 (ko) | 1996-03-22 | 1999-06-15 | 전주범 | 물체 기반 부호화에 있어서의 텍스쳐 분류를 위한 전처리 장치 |
US6807298B1 (en) | 1999-03-12 | 2004-10-19 | Electronics And Telecommunications Research Institute | Method for generating a block-based image histogram |
KR100344807B1 (ko) | 2000-01-12 | 2002-07-20 | 엘지전자주식회사 | 영상 신호 보정 장치 및 방법 |
KR100750138B1 (ko) | 2005-11-16 | 2007-08-21 | 삼성전자주식회사 | 인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및장치 |
US8503536B2 (en) | 2006-04-07 | 2013-08-06 | Microsoft Corporation | Quantization adjustments for DC shift artifacts |
US7639893B2 (en) | 2006-05-17 | 2009-12-29 | Xerox Corporation | Histogram adjustment for high dynamic range image mapping |
US8711926B2 (en) | 2007-02-08 | 2014-04-29 | Qualcomm Incorporated | Distortion estimation for quantized data |
JP4155328B2 (ja) | 2007-03-29 | 2008-09-24 | 株式会社日立製作所 | 映像表示装置 |
BRPI0721839A2 (pt) * | 2007-06-29 | 2013-05-21 | Thomson Licensing | equipamento e mÉtodo para reduzir distorÇÕes em imagens |
US8064517B1 (en) | 2007-09-07 | 2011-11-22 | Zenverge, Inc. | Perceptually adaptive quantization parameter selection |
JP2009224854A (ja) | 2008-03-13 | 2009-10-01 | Toshiba Corp | 画像符号化装置及び方法 |
US8189933B2 (en) | 2008-03-31 | 2012-05-29 | Microsoft Corporation | Classifying and controlling encoding quality for textured, dark smooth and smooth video content |
EP2329487B1 (en) * | 2008-09-30 | 2016-05-25 | Dolby Laboratories Licensing Corporation | Systems and methods for applying adaptive gamma in image processing for high brightness and high dynamic range displays |
US8761247B2 (en) | 2008-12-17 | 2014-06-24 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive quantization based on spatial activity histogram |
WO2010100609A1 (en) | 2009-03-06 | 2010-09-10 | Koninklijke Philips Electronics N.V. | Method for converting input image data into output image data, image conversion unit for converting input image data into output image data, image processing apparatus, display device |
US8761268B2 (en) | 2009-04-06 | 2014-06-24 | Intel Corporation | Selective local adaptive wiener filter for video coding and decoding |
US10897625B2 (en) | 2009-11-20 | 2021-01-19 | Texas Instruments Incorporated | Block artifact suppression in video coding |
KR101751270B1 (ko) | 2010-01-25 | 2017-07-11 | 고려대학교 산학협력단 | 이미지 처리장치 및 방법 |
JP2012022021A (ja) * | 2010-07-12 | 2012-02-02 | Sony Corp | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム |
EP2654294A4 (en) | 2010-12-16 | 2015-11-11 | Univ Beihang | WAVELET COEFFICIENT QUANTIFICATION METHOD WITH A HUMAN VISUAL MODEL IN IMAGE COMPRESSION |
PL2681710T3 (pl) | 2011-03-02 | 2019-03-29 | Dolby Laboratories Licensing Corporation | Lokalny wieloskalowy operator mapowania tonowego |
TWI521973B (zh) * | 2011-04-15 | 2016-02-11 | 杜比實驗室特許公司 | 高動態範圍影像的編碼、解碼及表示 |
TWI575933B (zh) | 2011-11-04 | 2017-03-21 | 杜比實驗室特許公司 | 階層式視覺動態範圍編碼中之層分解技術 |
MX337802B (es) | 2011-11-29 | 2016-03-18 | Thomson Licensing | Enmascaramiento de textura para medicion de calidad de video. |
ES2584681T3 (es) * | 2011-12-06 | 2016-09-28 | Dolby Laboratories Licensing Corporation | Dispositivo y procedimiento para mejorar el intercambio de datos de imágenes basado en una no linealidad de luminancia perceptual a través de diferentes capacidades de visualización |
KR20130078569A (ko) | 2011-12-30 | 2013-07-10 | 광운대학교 산학협력단 | 관심영역 기반의 화질 향상을 위한 스크린 콘텐츠 비디오 부호화/복호화 방법 및 그 장치 |
KR102014127B1 (ko) | 2012-03-26 | 2019-08-26 | 코닌클리케 필립스 엔.브이. | Hdr 이미지 인코딩 및 디코딩을 위한 밝기 영역-기반 장치들 및 방법들 |
US8953882B2 (en) | 2012-05-31 | 2015-02-10 | Apple Inc. | Systems and methods for determining noise statistics of image data |
BR112014008513B1 (pt) * | 2012-08-08 | 2021-08-17 | Dolby Laboratories Licensing Corporation | Método para codificar uma imagem hdr, dispositivo de circuito integrado e meio de armazenamento legível por processador não transitório |
EP2941872B1 (en) | 2013-01-02 | 2018-09-26 | Dolby Laboratories Licensing Corporation | Backward-compatible coding for ultra high definition video signals with enhanced dynamic range |
WO2014160705A1 (en) * | 2013-03-26 | 2014-10-02 | Dolby Laboratories Licensing Corporation | Encoding perceptually-quantized video content in multi-layer vdr coding |
EP3011741B1 (en) * | 2013-06-17 | 2018-03-07 | Dolby Laboratories Licensing Corporation | Adaptive reshaping for layered coding of enhanced dynamic range signals |
JP5639228B2 (ja) | 2013-06-18 | 2014-12-10 | トムソン ライセンシングThomson Licensing | 重み付け符号化する方法及びシステム |
CN107079137B (zh) | 2014-09-26 | 2019-08-13 | 杜比实验室特许公司 | 感知量化视频内容的编码和解码 |
-
2016
- 2016-03-01 EP EP16720208.4A patent/EP3266208B1/en active Active
- 2016-03-01 WO PCT/US2016/020230 patent/WO2016140954A1/en active Application Filing
- 2016-03-01 KR KR1020177024378A patent/KR101939012B1/ko active IP Right Grant
- 2016-03-01 BR BR112017018893-7A patent/BR112017018893B1/pt active IP Right Grant
- 2016-03-01 RU RU2017130927A patent/RU2678483C1/ru active
- 2016-03-01 US US15/555,047 patent/US10419762B2/en active Active
- 2016-03-01 JP JP2017546223A patent/JP6484347B2/ja active Active
- 2016-03-01 CN CN201680013230.9A patent/CN107409213B/zh active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11356623B2 (en) | 2020-06-01 | 2022-06-07 | City University Of Hong Kong | System and method for processing an image |
Also Published As
Publication number | Publication date |
---|---|
EP3266208A1 (en) | 2018-01-10 |
US10419762B2 (en) | 2019-09-17 |
US20180041759A1 (en) | 2018-02-08 |
CN107409213B (zh) | 2020-10-30 |
EP3266208B1 (en) | 2019-05-08 |
JP2018509708A (ja) | 2018-04-05 |
CN107409213A (zh) | 2017-11-28 |
BR112017018893A2 (pt) | 2018-04-24 |
KR20170113608A (ko) | 2017-10-12 |
WO2016140954A1 (en) | 2016-09-09 |
RU2678483C1 (ru) | 2019-01-29 |
KR101939012B1 (ko) | 2019-01-15 |
BR112017018893B1 (pt) | 2023-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6484347B2 (ja) | ハイダイナミックレンジ画像のためのコンテンツ適応的な知覚的量子化器 | |
US10032262B2 (en) | Block-based content-adaptive reshaping for high dynamic range images | |
JP6846442B2 (ja) | ハイダイナミックレンジ画像のためのクロマ再構成 | |
US10015491B2 (en) | In-loop block-based image reshaping in high dynamic range video coding | |
CN107771392B (zh) | 用于高动态范围图像的实时内容自适应感知量化器 | |
CN109416832B (zh) | 高效的基于直方图的亮度外观匹配 | |
EP3176749B1 (en) | Efficient image processing on content-adaptive pq signal domain | |
JP6684971B2 (ja) | ハイダイナミックレンジ映像を符号化するためのセグメントベース再構成 | |
US10223774B2 (en) | Single-pass and multi-pass-based polynomial approximations for reshaping functions | |
US10165275B2 (en) | Content-adaptive reshaping for high dynamic range images | |
US20200126509A1 (en) | Methods and apparatuses for tone mapping and inverse tone mapping | |
US10742986B2 (en) | High dynamic range color conversion correction | |
US11895416B2 (en) | Electro-optical transfer function conversion and signal legalization | |
US10715772B2 (en) | High dynamic range color conversion correction | |
WO2019071045A1 (en) | HIGH DYNAMIC RANGE COLORING CORRECTION |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6484347 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |