JP6738645B2 - 広色域映像符号化用の知覚色変換 - Google Patents

広色域映像符号化用の知覚色変換 Download PDF

Info

Publication number
JP6738645B2
JP6738645B2 JP2016087894A JP2016087894A JP6738645B2 JP 6738645 B2 JP6738645 B2 JP 6738645B2 JP 2016087894 A JP2016087894 A JP 2016087894A JP 2016087894 A JP2016087894 A JP 2016087894A JP 6738645 B2 JP6738645 B2 JP 6738645B2
Authority
JP
Japan
Prior art keywords
component
color
chromaticity
color space
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016087894A
Other languages
English (en)
Other versions
JP2016213828A (ja
JP2016213828A5 (ja
Inventor
ルージンブール,ダニエル
エイディン,トゥンク,オザン
スモリック,アルジョサ
ステファノスキ,ニコルチェ
Original Assignee
ディズニー エンタープライゼス インコーポレイテッド
ディズニー エンタープライゼス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ディズニー エンタープライゼス インコーポレイテッド, ディズニー エンタープライゼス インコーポレイテッド filed Critical ディズニー エンタープライゼス インコーポレイテッド
Publication of JP2016213828A publication Critical patent/JP2016213828A/ja
Publication of JP2016213828A5 publication Critical patent/JP2016213828A5/ja
Application granted granted Critical
Publication of JP6738645B2 publication Critical patent/JP6738645B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/67Circuits for processing colour signals for matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • H04N9/8045Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction using predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Description

(関連出願の相互参照)
本出願は、2015年5月1日出願の米国仮特許出願第62/156,124号の権利を主張し、参照によりその内容全体をここに援用する。
本開示は概して映像符号化に関する。
ハイダイナミックレンジ(HDR)及び広色域(WCG)を有する映像やその他のビジュアルコンテンツは、従来の標準的ダイナミックレンジ(SDR)及び標準色域(SCG)のコンテンツと比べてより高度な視聴体験を提供できるため、その配信に関心が高まっている。SDRコンテンツは一般に明るさがたとえば0.1〜100nitsであり、人間の実生活における視覚的明るさよりかなり範囲が低い。しかし、HDRやWCGで撮影または再録された映像は情報量が多いため、ビットレートとともにファイルサイズを大きくする必要がある。
様々な実施形態が目的としているのは、画像コンテンツをほぼ知覚的に均等な輝度/クロミナンス(Y/U’V’)色空間に変換する定輝度符号化パイプラインを用いることにより、固定ビットレートでのコンテンツの質(たとえば画質)を高めることである。さらに、この符号化パイプラインに用いられる(輝度変換とはまったく別の色度専用変換を用いて行う)様々な色度変換を開示している。
本開示の一実施形態によれば、コンピュータにより実行される方法は、加法色モデル信号を色度成分及び輝度成分を有する均等色空間信号に変換する工程を含む。本コンピュータにより実行される方法はさらに、前記色度成分に色度専用変換を適用し、かつ、前記輝度成分に輝度専用変換を適用して、前記色度成分及び前記輝度成分を変換する工程を含む。さらにまた、本コンピュータにより実行される方法は、変換された前記色度成分及び前記輝度成分を量子化する工程と、量子化された前記色度成分及び前記輝度成分を符号化(エンコード)する工程とを含む。
本開示の別の実施形態によれば、非一時的コンピュータ可読媒体が、前記媒体上にコンピュータにより実行可能なプログラムコードを体現されており、前記コンピュータにより実行可能なプログラムコードは、プロセッサに、明るさ成分及び色成分を有する第1色空間モデルにより表される画像信号を伝搬する入力ビットストリームの量子化色成分及び量子化明るさ成分を復号化させ、前記量子化色成分及び量子化明るさ成分を非量子化させ、前記非量子化色成分に第1逆変換を適用させ、前記非量子化明るさ成分に第2逆変換を適用させ、第1色空間モデルにより表される前記画像信号を、加法色空間モデルである第2色空間モデルにより表される画像信号に変換させるよう構成される。
本開示のさらに別の実施形態によれば、システムが、第1色空間モデルにより表される画像信号を、明るさ成分及び色成分を有する第2色空間モデルにより表される画像信号に変換するコンバータを備える。本システムはさらに、前記色成分に第1変換を適用する第1変換器と、前記明るさ成分に第2変換を適用する光電気伝達関数エンコーダと、変換された前記色成分及び前記明るさ成分を量子化する量子化器と、量子化された前記色成分及び前記明るさ成分を符号化してビットストリームを出力するエンコーダとを備える。
以下の図面を参照し、本開示を1つまたは複数の様々な実施形態に従って詳述する。これら図面は例示のみを目的としており、典型的な実施形態または実施例を図示するに過ぎない。
色度専用変換を用いた定輝度符号化パイプラインを実現するために様々な実施形態に従って行うことができる工程例を示すフローチャートである。
図1の色度専用変換を用いた定輝度符号化パイプラインを様々な実施形態に従って実施することができる、映像処理パイプラインの概略図である。
図2Aの映像処理パイプラインに利用することができる、図1の色度専用変換を用いた定輝度符号化パイプラインの概略図である。
従来の非定輝度パイプラインの概略図である。
図1の色度専用変換を用いた定輝度符号化パイプラインに利用することができる色度変換の概念図である。
図1の色度専用変換を用いた定輝度符号化パイプラインに利用することができる色度変換に適用するために色空間をメッシュに細分化する一例を示す図である。
メッシュの各頂点に変換を適用するときの、規則的な格子を形成する一例を示す図である。
色度値変換に用いられる直接変換のストレッチング工程の一例を示す図である。
多角形の境界点に接続された頂点の一例を示す図である。
単位正方形にマッピングされた色空間三角形の等間隔点の一例を示す図である。
図1の色度専用変換を用いた定輝度符号化パイプラインに適用することができる最小二乗色度変換の非最適化例を示す図である。
図1の色度専用変換を用いた定輝度符号化パイプラインに適用することができる最小二乗色度変換の最適化例を示す図である。
本開示に記載される実施形態の様々な機能の実施に用いることができるコンピュータ構成要素の一例である。
これらの図面は本開示のすべてを表すものではなく、本開示はここに示した形態そのものに限定されない。
従来の非定輝度方式の映像符号化パイプラインとは対照的に、本明細書で開示する様々な実施形態は、色度専用変換を用いた定輝度方式の符号化パイプラインを提供するものである。上述したように、HDRやWCGで撮影または再録された映像はSDRより情報量がより多いため、その配信にはビットレートとともにファイルサイズを大きくする必要がある。配信チャンネルによってはビットレートが高すぎるために、圧縮効率を高める必要が生じる場合がある。
図1は、色度専用変換を用いた定輝度符号化パイプラインを用いることで、より効率的な(SCGだけでなくWCGの)カラー映像符号化を実現するために、様々な実施形態に従って行われる処理例を示す。このような符号化パイプラインの概略図である図2Bを併用し、図1を説明する。符号化パイプライン201は、前処理部209及び符号化部(エンコーダ210により実行)を備えるものと考えることができる。
工程100において、加法色モデル信号を、色度成分またはチャンネル及び輝度成分またはチャンネルを有する均等色空間信号に変換する(図2Bのコンバータ202により実行)。加法色モデルの例としては、赤、緑、青の光を多様に加法混色して複数のその他の色を作成する赤、緑、青(RGB)のカラーモデルがある。RGBカラーモデルは、モニタやテレビなどの電子装置における画像の検出、表現、表示に用いることができる。ビデオカメラ、イメージスキャナ、ビデオゲームコンソール、デジタルカメラなどの入力装置が、テレビ、モニタ、プロジェクタ、その他の表示装置などの出力装置にRGB信号を入力することができる。均等色空間は、カラー画像パイプラインで用いられるCIE色空間またはYUV色空間と呼ぶことができる。これにより、(画像または映像をRGBで“直接”表現するのとは異なり)カラー画像や映像を人間の知覚を考慮して符号化することができ、クロミナンス成分により伝送エラーや圧縮アーティファクトを隠すことができる。変換の結果、輝度成分またはチャンネルY(明るさを表す)及び色度成分またはチャンネルU及びV(色を表す)を含む信号となる。
留意すべきは、上で述べたように、RGB色空間からYUV色空間への変換を、RGBからYUV成分またはチャンネルに“直接”行うことができる点である。しかし、他の実施形態のように、中間的な変換(図示せず)を行ってRGB成分またはチャンネルをXYZ色空間に変換し、次いでXYZ成分を上述のYUV成分に変換してもよい。
工程102で、色度専用変換を色度成分に適用し、また、輝度専用変換を輝度成分に適用することにより、色度成分及び輝度成分を変換する(色度変換及び輝度変換をそれぞれ図2Bの変換器206、204により実行)。図2Bに示すように、Uチャンネル及びVチャンネルは、様々な実施形態に従って、色度変換により知覚的均等性を維持するようにU’チャンネル及びV’チャンネルに変換される(これは、従来の符号化パイプラインで用いられる従来の変換では不可能であった)。ここで留意すべきは、輝度成分またはチャンネルが、たとえば光電気伝達関数(OETF)により(図2BのOETF符号化器204により実行)別個に処理されて、ガンマ圧縮またはガンマ符号化されたルマ成分Y’が得られる点である。輝度成分及び色度成分を別々に処理することは、圧縮の高効率化にも役立つ。
工程104にて、ルマY’及び色度成分U’、V’を量子化(図2Bの量子化器208により実行)し、DY’、DU’、DV’成分またはチャンネルを含む信号を得る。量子化とは、ある範囲の値、この場合ではルマ成分及び色度成分の値を、単一の量子値に圧縮することにより、画像表現に用いられる色の数を減らす非可逆圧縮技術であると言える。
工程106にて、色度成分DU’、DV’を符号化する(図2Bのエンコーダ210により実行)。量子化されたルマ成分DY’についても同様である。エンコーダ210は、H.264としても知られるAdvanced Video Coding(AVC)の後続規格であるHigh Efficiency Video Coding(HEVC)コーデックなどのビデオコーデックをプロセッサに適用させるよう構成されたコンピュータコードを有するメモリ部を備えることができる。なお、HEVCはもともとSDR及びSCGコンテンツ用に設計されたもので、従来の使用例ではHDRまたはWCGビデオシーケンスの符号化には圧縮効率において最適とは言えない。しかし、本開示中で開示される上述の色度変換は、色度成分(U,V)を、圧縮用にもっと効率のよい別の値(U’,V’)に変換する(たとえばHEVCなどのコーデックレベルに合わせてコードワードをより有効に活用する)。さらに、上でも述べた通り、変換された色度成分は、CIEまたはYUV色空間の知覚順応を維持するために、可能な限り知覚的に均等化される。
図2Aは、様々な実施形態を実行することができるエンコーダ/デコーダアーキテクチャシステム200の一例を示す。システム200は、エンコーダ210、デコーダ218、及び、デコーダ218及びエンコーダ210の双方が通信可能に接続されるネットワークまたは配信チャンネル216を有することができる。エンコーダ210は、メモリ212及びプロセッサ214を含み、デコーダ218もまたメモリ220及びプロセッサ222を含むことができる。デコーダ218としてはセットトップボックスやチューナなどがあり得る。動作時には、エンコーダ210のプロセッサ214が、ビデオシーケンスを符号化するためのコンピュータ指令など、メモリ212に記憶されたコンピュータ指令を実行することができる。すなわち、HDRまたはWCGフォーマットの映像コンテンツがエンコーダ210に供給され、記憶及び/または送信するための準備として圧縮される。たとえば、エンコーダ210のプロセッサ214は、上述のHEVCコーデックを用いてビデオシーケンスを符号化する処理を実行し、符号化されたビデオシーケンスをネットワーク216を介してデコーダ218に送信することができる。デコーダ218はセットトップボックス、チューナといったなんらかの受信装置として体現され、符号化されたHDRまたはWCGビデオシーケンスを受信し、復号化及び表示装置224への表示が可能となる。すなわち、デコーダ218のプロセッサ222は、受信したHEVC形式のビデオシーケンスを復号化するコンピュータ指令などの、メモリ220に記憶されたコンピュータ指令を実行することができる。
すでに示唆したように、システム200は前処理部209及び後処理部223も備え、様々な実施形態に従って、1つまたは複数のアルゴリズムが実行される(コンバータ202、OETF符号化器204、色度変換器206、量子化器208に対して)。これらの構成要素は別個のハードウェア及び/またはソフトウェア要素または同一のハードウェア/ソフトウェア要素の機能面であってもよい。後処理部223の対応する構成要素は図示していないが、符号化されたビデオシーケンスに非量子化及び逆色変換を行う同様のハードウェア及び/またはソフトウェアを含むことは理解されよう。すなわち、入力されたビットストリームをデコーダ218により復号化することができる。入力ビットストリームを復号化することにより、デコーダ218は入力ビットストリームを一連の変換係数、空間予測モード、及び動き補償ベクトルに変換することができる。符号化パイプラインの符号化及び復号化の態様は、必ずしも改変コーデック(たとえばHEVC)を含まなくてもよいことに留意すべきである。
また、すでに示唆したように、従来の符号化パイプラインは非定輝度方式の符号化に依っている。図3は、従来技術と本明細書で開示される様々な実施形態との違いを理解できるよう、従来の符号化パイプライン301の一例を示している。従来の符号化パイプライン301は、入力された通りのRGB色空間で画像を得る。入力ビデオシーケンスはフレーム毎に個別に処理する必要があり、標準パイプラインの各工程が各フレームに順次適用される。入力RGB画像はまず、範囲[0,1]内の倍精度に変換される。こうして、ガンマエンコーダ302によって非線形伝達関数TFが適用されることによりR、G、Bチャンネルの線形輝度が他のコードレベルに再分配され、R’、G’、B’で示す非線形RGB成分が得られる。輝度変化の小さなものは、高明度域より低明度域の方が知覚されやすいことが分かる。さらに、従来の符号化パイプライン300における後続の処理のうち少なくともいくつかは非可逆的であり、記憶用のビット数が限られる。TFでは低明度値用にビットスペースをより多く使うことで低明度域の貴重な情報を維持する。画像の顕著な符号化エラーがRGBに導入された場合、視聴者にとっては高明度域より低明度域の方がこのようなエラーを知覚しやすい。また、このようなエラーがR’G’B’領域に存在する場合は、画像をRGBに変換し直すと、すべての明度において等しく顕著となる。したがって、低明度域の値は拡張され、高明度域の値は一斉に圧縮される。
コンバータ304はBT.2020仕様に従いR’G’B’成分をY’C’bC’r色空間に変換する。Y’C’bC’r色空間は、ルマ成分Y’と、クロマ成分である青の色差成分C’b及び赤の色差成分C’rとを表す。量子化器306は、CY’、DC’r、DC’bで示すY’成分、C’r成分、C’b成分を量子化するよう働く。エンコーダ308は(たとえばAVC/H.264コーデックを適用し)、量子化された成分を符号化し、上述のように記憶及び/または送信できる符号化ビットストリームを出力する。
符号化パイプライン201とは対照的に、ルマ成分Y’は、ガンマ補正されたRGB三原色に基づき非線形符号化された光強度を表す。ルマに導入された符号化エラーは色度に漏れ、明暗だけでなくディスプレイに表れる色においても認識できる偏差につながる。このために、符号化パイプライン300のような従来の符号化パイプラインは非定輝度という特徴を有する。この非定輝度方式の符号化パイプラインはSDR信号(たとえばBT.709色空間内の100nitsまでのRGB)の符号化用に設計されているが、HDR及びWCG信号(たとえばBT.2020色空間内の10000nitsまでのRGB)の符号化目的に用いることもできる。しかしそれでも、この従来の符号化パイプラインは、非定輝度で符号化し続けるため、不向きであることに変わりない。HDRコンテキストの場合、エラーの符号化はより顕著なものになる(たとえば色域の符号化アーティファクトは、SDRコンテンツよりHDRコンテンツの方がはっきり現れる)。
図2Bに戻ると、従来の符号化パイプライン301とは対照的に、輝度成分Yは、定輝度符号化パイプライン201では(色度成分U,Vとは別個に)明確に表されている。したがって、ルマ成分Y’の量子化及びこれに導入される符号化エラーは輝度Yにしか影響を与えない。特に、圧縮エラーが色度に漏れることがない。
特に、RGB色空間から(従来の符号化パイプライン301のように)Y’C’bC’r色空間に画像を変換する代わりに、RGB信号をたとえばXYZ色空間に変換し(式1)、次いで、YUV色空間に変換する(式2)。RGB色空間に復元するには(システム200の後処理部223における復号化中に)、式1の逆行列を用いることができる(式3):
[式1]
[式2]
[式3]
符号化パイプライン201は定輝度方式であるのに加え、色度圧縮を改良するとともに全体の圧縮効率の改善も可能とするために、色度専用変換が設けられている。色度専用変換(図1の工程102において図2Bの変換器206が適用)は、圧縮用符号語の分布領域を拡大することにより、固定ビットレートでのクロマチャンネル内の符号化エラーを低減する。これから分かる通り、色度専用変換は色度成分U、Vにしか影響を与えない。色度変換はこれら2つの成分をとり、チャンネル(U’,V’)=T(U,V)を返す。Tは以下で説明する変換である。
ここで留意すべきは、本色度変換は、画像を低ビット深度に量子化する際に適用してもよい点である。加えて、HEVCなどのコーデックを用いて画像を圧縮する前に固定ビットレートで画質を高めるために本変換を用いてもよい。従来の変換では、同一ビットレートでビデオシーケンスの質を高める同様の効果は得られない。
色度変換の全体目標を図4に示す。同図は(赤、緑、青の三原色を角とし、あらゆる色の組み合わせをこれらの角間に有する三角形として表す)色を概念的四角形に変換(無駄になる符号語数を低減)した場合の概念図である。
説明上、色空間内のすべての色の色度座標はYUV色空間(三角形402)のCIE図形内にある。三角形402の角は色空間(たとえばBT.2020)の三原色RGB座標を示す。この色空間内で定義される色度値はすべて、この三角形402内に存在する。色空間の三原色RGBは色域、すなわちその色空間で可能なすべての色の範囲を決定する。図形の境界線に近ければ近いほど、色の飽和度は高い。したがって、色空間の三角形が大きければ大きいほど、三原色の飽和度は高く、また色域も大きい。なお、BT.2020の三原色で撮影、記憶された映像は最大色域を有し、(SCG色空間の一例であるたとえばBT.709に対し)WCGと呼ばれる。
ダイナミックレンジとは、光強度の最大値と最小値との比率と定義される。ダイナミックレンジが高いほど、光強度の最大値と最小値との差は大きくなる。SDR映像は一般に輝度範囲が0.1〜100nits(cd/m)である。しかし実生活では、光源が200cd/mよりはるかに高く、また夜の空は0.1cd/mよりかなり低い。HDRコンテンツでは、最小値が0.005cd/mと低くも、10,000cd/mと高くもなり得る。
符号化パイプライン201への入力としてRGB画像が用いられるため、RGB画像のピクセルの色度成分はすべて、頂点R、G、Bで定義される三角形402のU?V色度空間内に位置する。しかし、U−V色度空間内で符号化を行うと、三角形402の外側に何対もの無効な色度値が表されてしまう。このような無駄になる符号語を減らすため、本開示の様々な実施形態では、すべての(U,V)対を長方形(たとえば単位正方形404)にマッピングする。上述の、圧縮用U−V空間の知覚的均等性を有効利用するため、三角形402から単位正方形404へのマッピングにおいては大きな局所的変形が起こらないようにする。(u,v)対はピクセルの色度値と定義するこができ、u∈U、v∈Vである。ある画像の各ピクセルの(u,v)値はこの三角形内またはその線上に存在することになる。
すでに示唆した通り、本明細書に開示の色度変換の1つの目的は、符号語の範囲を拡大させたコーデック(たとえばHEVC)を提供することである。量子化工程では、画像を範囲[0,1]の倍精度フォーマットとし、最小入力値(0)を0、最大入力値(1)を4095にマッピングし、範囲[0,4095]の12ビット整数値に量子化する。このように、U成分及びV成分のそれぞれが範囲[0,1]を有効利用することができる。各画像ピクセルの色度値(u,v)は、点(0,0)、(0,1)、(1,0)、(1,1)で定義される単位正方形404内のどの値でもとり得る。しかし、YUV色空間のデカルト座標系での収まり方に基づくと、この限りではない。三角形402は単位正方形の比較的“小さな”部分しか占めていないことに留意すべきである。
したがって、所望の変換Tは、(たとえばBT.2020の)三原色により定義される三角形402内にあり得る値のそれぞれを、単位正方形404の面積を最大限利用して――言い換えると、三角形を四角形に変形させて――単位正方形404の中のいずれかの点にマッピングする。各ピクセルの変換後の色度値(u’,v’)と、この変換の一定の制約について以下に説明する。
上述のように、図2の後処理工程223において、逆変換T−1を実行する必要がある。つまり、変換値(u’,v’)はそれぞれ、T−1を適用するとき元の値(u,v)にマッピングし直さなければならない。言い換えると、下の式4で示される属性が成り立つ必要がある。すなわち、Tは可逆性であり、本色度変換は符号化パイプライン201において無損失の処理ということである。
[式4.1]
ここで理解すべきは、変換Tは大きな全体的歪みをもたらし、三角形の形を劇的に変えてしまう点である。色度変換が符号化パイプライン201に組み込まれると、符号化及び復号化は非可逆性でありエラーが発生するため、U’チャンネル及びV’チャンネルは変更される。すなわち、(urec,vrec)=(u,v)+εであり、εは任意の方向の小さなエラーベクトルである。YUV色空間はほぼ知覚的に均等であるため、(urec,vrec)と(u,v)との間の知覚的差異は方向ではなくεの長さにのみ依存するはずである。これは、Tにより発生する局所的歪みが最小限となることを意味し、すなわち、ある値(u,v)に極めて近接する色度値はすべて、変換後の値(u’,v’)までの距離が新たに増大したり減少したりするが、それらの距離はすべて、ほぼ等しくなるはずである。
一実施形態においては、以下で述べるように、色度変換は直接変換に基づいていてもよい。別の実施形態においては、同じく以下で述べるように、色度変換は最小二乗変換に基づいていてもよい。その他の実施形態に従って、さらに他の変換を用いてもよいことは言うまでもない。
図5は、様々な実施形態に従い色度値を変換する準備として図4の三角形402を細分化する方法の例を示す。三角形402は、3つの頂点で描かれる小さな三角形からなるメッシュに細分化することができる。三角形を細分化するには、三角形の3つの角と角の中間点に印をつけこれらを接続し、4つの小さな三角形を作る。小さな三角形それぞれに対して2回目の細分化を行うことで、合計16の三角形ができる。この細分化工程を繰り返すと、新しく細分化するごとに三角形の数は4倍ずつ増えるので、n回の細分化で4のn乗の三角形ができる(n∈N、n≧1)。三角形502及び504はそれぞれ、3回と4回細分化された主三角形の例を示す。三角形502は3回の細分化後、64個の小さな三角形を有し、三角形504は細分化を4回行った結果256個の小さな三角形を有する。この結果、三角形のリストが得られる。各三角形はメッシュ内の3つの頂点を記憶することで保存することができる。頂点a、b、cで定められる三角形をTr(a,b,c)で示す。
nが選ばれると、4のn乗の小さな三角形それぞれが単位正方形404内にマッピングされる。この結果、歪みが生じる。三角形Tr(a,b,c)のそれぞれについて、マッピングされた対応する三角形Tr(a’,b’,c’)が記憶される。マッピング後の三角形は互いに重複してはならない。
1つの色度値(u,v)をマッピングするとき、(u,v)の各値はYUV色空間の主三角形402内に存在する(主とは細分化されていない大きな三角形を指す)ので、三角形402(502)を細分化後にできた小さな三角形のうちの1つの中にも存在する。この三角形Tr(a,b,c)を見つければ、点(u,v)の位置pは、その重心座標λ、λ、λを用いて、Tr(a,b,c)について次のように表すことができる。
[式4.2]
したがって、マッピング後の三角形Tr(a’,b’,c’)における正しい位置p’は、次の式を用いて見つけることができる。
[式4.3]
この処理を各点について個別に行う。重心座標は次の式を用いて算出する。
[式4.4]
ここで、各点の下付き文字はその点のu成分またはv成分を表す。
[式4.5]
重心座標を用いて行うマッピングには、可逆性であるという特性がある。すなわち、位置p’にある点(u’,v’)を逆マッピングすると、その点は元の位置pに戻される。上述のように、画像信号の適正な復号化には変換が可逆性である方がよい。
色度点(u,v)を含む三角形の検出は“妥当な”時間内に行うべきで、たとえばライブ放送中には、タイムラグが生じないほどの短時間で符号化を行うべきである。一実施形態に従って、各三角形の3つの重心座標を算出し、式4.2が成立するかどうか判定することができる。もし成立するなら、色度点は三角形内にあることになる。前述の細分化により得られた三角形のそれぞれについて個別に判定するのは効率が悪い。したがって、様々な実施形態では、次式により定数時間検査に依っている。
ある色度値(u,v)を変換する線形変換を考える。
[式4.6]
上式において、R、G、Bは三原色(三角形402の3つの角)を表す。この変換をメッシュの各頂点に適用すると、主三角形は、単位正方形404の左下半分を占める。図6から分かるように、小さい三角形は2つの短辺が水平か垂直のどちらかになるように配列される(本例ではn=3)。2つの隣接する三角形を合体させて正方形600を作ると、規則的な格子が形成される。
点(u,v)に対応する三角形を見つけるには、メッシュそのものではなく(u,v)に式4.3を適用する。ある特定の細分化の値nに対して、変換後の点(u,v)transが存在する規則的な格子の正方形はごく小さい。すべての三角形に指標が付され各正方形は2つの三角形からなるため、残る処理はどちらの三角形が点(u,v)を含有するかを見出だすことである。これは、2つの三角形について(u,v)の重心座標を算出し、式4.2が成立するかどうかを判定することで可能である。
後処理223において(図2A)、マッピングされた色度値(u’,v’)それぞれの位置を元の(たとえば図5のような)メッシュ内に位置づけする必要がある。これには、一実施形態に従い、ルックアップテーブルを用いる。すなわち、変換後のメッシュ内にあり得る値のそれぞれにつき、その値が元のメッシュのどの位置にマッピングされるかをルックアップテーブルが特定する。次いで、変換Tの属性に従いつつ、個々の三角形を単位正方形にマッピングする。
上述のように、色度値の変換に用いるのは直接変換であってもよい。直接変換を用いる際は、メッシュは頂点の集合であると考えることができ、各頂点は複写され単位正方形内の新たな位置にマッピングされる。この種の変換では、主三角形の境界線上から4つの頂点を選択し、これらの頂点を正方形の4つの角に“引っ張る”ことによる“ストレッチング”が行われる。三角形の3つの角、すなわち引っ張る頂点のうちの3つとして三原色RGBを選ぶのは理にかなっている。4つ目の頂点も、三角形の線上から選ぶとよい。本開示の一態様に従って、点/頂点RとBをつなぐ線上にある中間頂点Pを選んでもよい。n≧1のため、Pが存在することは知られている。
図7Aはこの概念的ストレッチングの一例で、4つの頂点R、G、B、Pを主三角形702上に示し、どのようにマッピングされるかを示している。単位正方形704の、Rは右上、Gは左上、Bは左下、Pは右下の角に引っ張ることができる。さらに、主三角形の境界線に沿う残りの頂点にも印を付している(黒点で強調)。これらmの頂点すべてが合わさって、凸多角形Pの境界線を形成している。これらmの頂点は、4つの頂点R、G、B、Pのいずれか2つの間の直線上にあるため、単位正方形704の対応する境界線上に、互いに等間隔にマッピングされる。たとえば、v∈GBで略されるG−B間の頂点の1つは、単位正方形の左の縁上にマッピングされ、B−P間の3つの頂点は単位正方形の下の縁上にマッピングされる。単位正方形の四縁上にあるこれらmの頂点もまた、凸多角形P’を形成する。そして残りの頂点は、平均値座標(Mean Value Coordinates:MVC)を用いてPからP’へマッピングされる。
MVCは、重心座標の一般化座標と考えることができる。(上で示唆した)重心座標は三角形に用いられるが、三角形は実質、3つの頂点を有する多角形である。しかし、MVCは任意の数の頂点を有する多角形に同じ目的で用いることができる。したがって、多角形P内の頂点vは、Pに関するMVCのλを用いて次式により、多角形P’内の新たな位置にマッピングされる。
[式4.7]
ただし、p及びf(p)は、多角形P及びP’の境界線上の頂点を表す。図7Bは、半時計回りに順に並ぶ多角形の境界線上の点と結ばれた頂点vを(MVCの角度定義とともに)示す。頂点vのMVCのλは次式から求められる。
[式4.8]
ただし
[式4.9]
かつ、αは、角度∠p,v,pi+1を示す。
式4.7で表されるマッピングにもまた(変換Tについて)可逆性であるという特性があり、このため、頂点をT’からTに再マッピングすると、元の位置に戻る。再び図7Aを参照すると、主三角形502の内部頂点をMVCを用いてマッピングして得られる三角形が示されている。当業者であれば理解する通り、右下の頂点Pに近い小さな三角形の方が、頂点G付近のものよりはるかに大きく歪んでいる。人間の眼は青や赤の色調より緑の色調のわずかな変化に敏感であるため、頂点G付近はなるべく歪みが小さいのが望ましい。このために、4つ目の頂点Pを主三角形502のこの縁に沿うよう選択している。また、この縁は三角形の一番長い辺であるので、別の縁から頂点を選ぶと、全体として歪みが大きくなる可能性がある。
まとめると、色度変換処理に直接変換を実行するには、小さな三角形を形成する頂点及び縁からなるメッシュを色空間の主三角形(たとえば三角形702)内に作成する。4つの頂点を選び、単位正方形、たとえば単位正方形704の角に向けて引っ張って、主三角形をストレッチングする。内部頂点のマッピングにはMVCを用いることができる。小さい三角形Tr(a,b,c)に関する色度値(u,v)の重心座標を用いて、(u,v)を対応する三角形Tr(a’,b’,c’)にマッピングする。図7Cは、本明細書に記載の直接変換を用いて単位正方形にマッピングされた等間隔点の一例を示す。図7Cは、(主三角形702の)等間隔点がどのように単位正方形704にマッピングされるかと、起こりえる歪みのパターンを示している。頂点を“最適に”分布させることで、可能な限り知覚的に均等なクロミナンスが得られる。
別の実施形態に従い、色度値の変換に利用する色度変換は最小二乗変換に基づいていてもよい。図8Aは色空間三角形802内の色度値を単位正方形804に変換する一例(非最適化例)を示す。
直接変換を用いる際の手順と同様に、主三角形802上から同様の4つの頂点R、G、B、Pを選び、メッシュを作成する。本変換には、メッシュの変形に適用される3組の制約がある。主三角形802を強制的になるべく大きくストレッチングする制約もあれば、小さい三角形の形を維持しようとする制約もある。すべての制約を完全に満たすことができるわけではないため、最小二乗変換はトレードオフを伴うと理解すべきである。
これらの制約群は、エネルギーの総計が最小限であるべきエネルギーE、E、Eを単位として表すことができる。エネルギーEiが小さければ小さいほど、i番目の制約がよく満たされる。図8の例では、細分化の回数値n=3であり、後述するパラメータα=β=γ=1を用いている。
第1の制約は、4つの頂点が直接変換で用いたのと同じ単位正方形の4つの角にマッピングされるよう特定するアンカー制約と呼ぶことができる。数式で表すと次のようになる:
[式4.10]
第1のエネルギー項Eは次式で表される:
[式4.11]
第2の制約は、直接変換でも行われたように、主三角形802の境界線上の頂点(黒点で強調)が、単位正方形804の境界線上のどこかに配されるよう特定する、境界線制約と呼ぶことができる。たとえば、点B−G間の頂点vは単位正方形804の左縁上にマッピングされ、u座標vがゼロとなるようにする。すべての境界線上の頂点について、これらの制約は次式により与えられる:
[式4.12]
エネルギーEは次式から得られる:
[式4.13]
最初の2組の制約(アンカー及び境界線)は、主三角形を直接変換と同様に引っ張ろうとする。しかし、主三角形内部の頂点については、第3組目の制約(均等性制約と呼ぶ)は、より小さい三角形(主三角形の細分化後)の“形”をなるべく維持し変形しないようにすることを目標とする。各三角形Tr(a,b,c)は外心crmを有し、これは頂点a、b、cからの距離が等しい特有の点である。したがってこれら3つの頂点はcrmを中心とする円上にある。マッピング後の三角形Tr(a’,b’,c’)の頂点からの新たな外心への距離は同等に最小化されなければならない。したがってこれらの制約により、類似の三角形ができる。三角形群T内のすべての三角形について、総エネルギーEは、マッピング後の三角形の外心への各頂点からの距離の二乗の合計に等しくなる。
[式4.14]
外心crmは次式より、重心座標λ、λ、λを用いて表すことができる:
[式4.15]
ただし
[式4.16]

は2つの頂点間のユークリッド距離を表す。これら3つの座標の総計が必ず1となるように、それぞれを3つの値の総計で除算して正規化する。均等性制約はメッシュ内の三角形形状を必ずしも維持するものではなく、ただその形状を“硬く”(変形し難く)保つ。同じ外心を有する三角形は無限に存在するため、均等性制約を満たしつつも三角形が大幅に変形する可能性はある。しかし、他の2つの制約との組み合わせにより、三角形は形が崩れることなく元の形状に近いままとなる。
メッシュは、単位正方形の全面積を利用するように変形するのが理想的である(コーデックの符号語範囲を大きくするため)。これを達成するために境界線及びアンカー制約を定義しているが、同時に、均等性制約を定義することによって、局所的変形を最小限にとどめている。このために、式4.11、式4.13、式4.14で導かれる3つのエネルギー項E、E、Eが先に述べたトレードオフの関係となる。最適な結果を得るためには、総エネルギーEの合計を次式により最小化する:
[式4.17]
追加のパラメータα、β、γは、式4を解く際にエネルギー項に付すべき重みを特定するために導入される。最初、これら3つのパラメータはすべて1に等しい。たとえばもしEの境界線制約を強めるのが望ましく、境界線上頂点を単位正方形の縁近傍に配したい場合は、β値を増加することができる。3組の制約はすべて線形であることが分かる。このため、非線形であった場合より式4.17を簡単に解くことができる。この特性のため、式4.17は行列表記法で再公式化することができ、最終的に解くべき問題は、連立一次方程式により与えられる:
[式4.18]
これは最小二乗法として解くことができる。ここで、xはマッピング後頂点の値を含む解ベクトルである。k個の頂点に対してxは各頂点のu座標及びv座標を含まなければならないため、x∈R2kである。この解により、頂点分布は最大限知覚的に均等となる。マッピング後頂点v’はx内で次のように並べられる:
[式4.19]
個々の制約の合計がlのときA∈Rl×2kかつb∈Rであり、x内の各値について個々の制約が成り立つ。各頂点は複数の制約下にあるため、l≧2kであり、方程式系は過剰方程式となる。
本明細書で検討される最小二乗変換により得られる形状を単位正方形804内に示す。歪んだ三角形が単位正方形の大部分を占めているが、全域ではない。直接変換を最小二乗変換と比べると、両者間のトレードオフが理解できる。直接変換を用いることで単位正方形の全体を活用できるが、メッシュ内の三角形は歪みが激しい。最小二乗変換では、単位正方形の全面積を利用できるわけではないが、マッピングされた三角形における歪みは少ない。
式4.17について述べた通り、結果として得られる変換は、ユーザが最適化したい制約に従ってパラメータα、β、γを変更することにより改変することができる。これらの値を改変しない場合、最小二乗変換は最適化されているとは言えない。たとえばユーザが、単位正方形に占める面積を大きくしたければ、均等性制約を切り捨てればよい。そのためには、α値及びβ値を増大すればよい。いわゆる最適化最小二乗変換と呼ばれるこの変換例を単位正方形806として示している。パラメータはα=β=3、γ=1とした。非最適化最小二乗変換(単位正方形804として示す)を、最適化したもの(単位正方形806として示す)と比べると、メッシュがどのように形状変化するかが分かる。
P3またはBT.2020のようなWCGの映像または画像コンテンツは広色域を有するため、記憶及び送信に必要なビット数が大きい。様々な実施形態によるシステム及び方法により、所定の固定ビットレートでの画質を高めたり、または、所定の画質を選択しビットレートを下げることにより、ある所望の画質を選ぶことができるようになる。2つの色度チャンネルU、Vの変換を伴ういわゆる色度変換を用いることによりこのような最適化を実現することができる。符号化にYUV色空間を用いる場合は、コーデックに実際の受容可能数より少ない符号語が与えられる。U及びVの符号語分布領域が拡大されれば、再構築後の信号では符号化エラーが目立たなくなると予想され、本明細書に開示の色度変換によって、映像及び画像コンテンツの画質は改善する。しかし、符号語分布領域を拡大する(すなわちコーデックにより多くの情報を与えることと同義)にも関らず、圧縮効率は高まり、ビットレートを上げる影響は打ち消され(たとえば同一ビットレートで1/2dB以上分の色の改善が可能)、コンテンツの色の維持や全体の色質改善につながる。
図9は本明細書で開示するシステム及び方法の様々な特徴、たとえば映像符号化パイプライン200の前処理部209及び後処理部223の1つまたは複数の態様の上述の特徴や機能などを実施するのに用いることができるコンピュータの構成要素の一例を示す。
本明細書で用いる場合の「構成要素」という用語は、本願の1つまたは複数の実施形態に従って実行することができる機能のうちのあるユニットを指す場合がある。本明細書で用いる場合の構成要素は、ハードウェア、ソフトウェア、またはそれらの組み合わせのいずれかを利用して実施してもよい。たとえば、プロセッサ、コントローラ、ASICs、PLAs、PALs、CPLDs、FPGAs、論理要素、ソフトウェアルーチン、その他の機構を実施して構成要素を構成してもよい。実施にあたって、本明細書に記載の様々な構成要素は、それぞれ個々の構成要素として実施してもよいし、または、記載した機能や特徴が、部分的または全体的に1つまたは複数の構成要素間で共有されていてもよい。言い換えると、本明細書を読めば当業者には明らかな通り、本明細書に記載の様々な特徴及び機能は、いかなる用途に実施してもよいし、様々な組み合わせ及び順序で、1つまたは複数の個別のまたは共有の構成要素にて実施することができる。機能の様々な特徴や要素が別々に記載されていたり、または別個の構成要素として主張されているとしても、これらの特徴や機能は1つまたは複数の一般的なソフトウェア要素とハードウェア要素間で共有でき、このような記載があるからといって、これらの特徴や機能を実施するのに別個のハードウェアまたはソフトウェア構成要素を用いることが必要とは限らず、また、その使用を示唆するものではないことは、当業者には理解されるであろう。
構成要素、または本願の構成要素が全体的または部分的にソフトウェアを用いて実施される場合、一実施形態においては、これらのソフトウェア要素は、これらに関して記載された機能を実行可能なコンピュータまたはプロセッサ要素とともに動作するよう実施することができる。このようなコンピュータ構成要素の一例を図9に示す。このコンピュータ構成要素例900について様々な実施形態を説明する。この説明を読めば、他のコンピュータ構成要素またはアーキテクチャを用いて本願を実施する方法が当業者には明らかとなるはずである。
図9を参照すると、コンピュータ構成要素900は、たとえば、自動調整型ディスプレイ内に見られる計算または処理能力、デスクトップ、ラップトップ、ノートブック、タブレット型コンピュータ;(タブレット、PDA、スマートフォン、携帯電話、パームトップなどの)携帯型コンピュータ装置;ディスプレイ付きのワークステーションまたはその他の装置;サーバ;ある用途または環境に望ましいまたはふさわしいその他の種類の特定用途または汎用コンピュータ、を表すと考えることができる。コンピュータ構成要素900はまた、ある装置内に組み込まれた、またはその他の方法で使用可能な、計算能力を表しているとも言える。コンピュータ構成要素はたとえば、その他の電子機器、たとえばナビゲーションシステム、携帯コンピュータ装置、なんらかの処理能力形式を備えるその他の電子装置などに設けられる場合がある。
コンピュータ構成要素900はたとえば、プロセッサ904など、1つまたは複数のプロセッサ、コントローラ、制御構成要素、その他の処理装置を含んでもよい。プロセッサ904は、たとえばマイクロプロセッサ、コントローラ、またはその他の処理ロジックなどの汎用または特定用途の処理エンジンを用いて実施してもよい。図示例では、プロセッサ904はバス902に接続されているが、コンピュータ構成要素900とその他の構成要素とのやりとりや外部との通信を容易にするためにいかなる通信媒体を用いてもよい。
コンピュータ構成要素900はまた、1つまたは複数のメモリ構成要素を備えていてもよく、ここでは単にメインメモリ908と称する。たとえば、情報やプロセッサ904が実行する指令の記憶には、ランダムアクセスメモリ(RAM)またはその他のダイナミックメモリを用いるのがよい。メインメモリ908はまた、一時的変数や、その他、プロセッサ904の指令実行中の中間情報の記憶に用いてもよい。コンピュータ構成要素900は同様に、プロセッサ904用の静的情報及び指令の記憶用に、バス902に接続されたリードオンリメモリ(ROM)またはその他の静的記憶装置を備えてもよい。
コンピュータ構成要素900はまた、1つまたは複数の様々な形式の情報記憶機構910を備えてもよく、かかる機構はたとえばメディアドライブ912及び記憶部インターフェース920を備えてもよい。メディアドライブ912は、固定または取り外し可能な記憶媒体914に対応するドライブまたはその他の機構を含むことができる。たとえば、ハードディスクドライブ、半導体ドライブ、磁気テープドライブ、光ディスクドライブ、コンパクトディスク(CD)またはデジタルビデオディスク(DVD)ドライブ(RまたはRW)、その他の取り外し可能または固定のメディアドライブを備えることができる。したがって記憶媒体914は、メディアドライブ912により読み取り、書き込みまたはアクセス可能な、たとえばハードディスク、集積回路アセンブリ、磁気テープ、カートリッジ、光ディスク、CDまたはDVD、その他の固定または取り外し可能な媒体を含むことができる。これらの例が示すように、記憶媒体914には、コンピュータソフトウェアまたはデータを記憶した、コンピュータで使用可能な記憶媒体も含むことができる。
代替的実施形態では、情報記憶機構910が、コンピュータ構成要素900に、コンピュータプログラムあるいはその他の指令またはデータを読み込むためのその他同様の手段を備えていてもよい。このような手段はたとえば、固定または取り外し可能な記憶部922及びインターフェース920を備えることができる。このような記憶部922及びインターフェース920の例としては、プログラムカートリッジとカートリッジインターフェース、リムーバブルメモリ(たとえばフラッシュメモリまたはその他の取り外し可能なメモリ構成要素)とメモリスロット、PCMCIAスロットとカード、及び、記憶部922からコンピュータ構成要素900にソフトウェア及びデータを転送可能なその他の固定または取り外し可能な記憶部922及びインターフェース920が挙げられる。
コンピュータ構成要素900はまた、通信インターフェース924を備えることができる。通信インターフェース924は、ソフトウェア及びデータをコンピュータ構成要素900と外部装置との間で転送するのに用いることができる。通信インターフェース924の例としては、モデムあるいはソフトモデム、ネットワークインターフェース(イーサネット(登録商標)、ネットワークインターフェースカード、WiMedia、IEEE 802.XXまたはその他のインターフェース)、通信ポート(たとえばUSBポート、IRポート、RS232ポート、Bluetooth(登録商標)インターフェース、その他のポート)、またはその他の通信インターフェースが挙げられる。通信インターフェース924を介して転送されるソフトウェアまたはデータは一般に、電子信号、電磁信号(光信号を含む)または、所定の通信インターフェース924により交換可能なその他の信号により伝達される。これらの信号はチャンネル928を介して通信インターフェース924に供給することができる。このチャンネル928は信号を伝達することができ、有線または無線通信媒体を用いて実施することができる。チャンネルの例としては、電話線、セルラーリンク、RFリンク、光リンク、ネットワークインターフェース、ローカル/ワイドエリアネットワーク、その他の有線/無線通信チャンネルが挙げられる。
本明細書において、「コンピュータプログラム媒体」「コンピュータで使用可能な媒体」という用語は、たとえばメモリ908、記憶部920、媒体914、及びチャンネル928などの、概して一時的または非一時的媒体を指すのに用いている。これらのまたはその他の様々な形式のコンピュータプログラム媒体またはコンピュータで使用可能な媒体は、処理装置に実行させるための1つまたは複数の指令の1つまたは複数のシーケンスの伝達に関与することができる。媒体上に体現されるこのような指令は概して(コンピュータプログラムの形で、またはその他の様式にまとめられて)「コンピュータプログラムコード」または「コンピュータプログラム製品」と呼ばれる。このような指令が実行されると、コンピュータ構成要素900は本明細書に記載の本願の特徴または機能を実行することができる。
以上、様々な実施形態や実施態様の例について述べたが、1つまたは複数の個々の実施形態中で述べた様々な特徴、態様、機能は、それらについて述べた特定の実施形態のみにその適用が限定されるのではなく、単独または様々な組み合わせで、本願の1つまたは複数の様々な実施形態に適用することができ、このような実施形態が記述されているか否かや、また、このような特徴が、記載されている実施形態の一部として示されているか否かに関らないものとする。したがって、本願の範囲は、上述のいずれの実施形態例にも限定されるべきではない。
本明細書中で用いる用語や語句及びその変化形は、別段明示しない限り、限定的ではない、制限を設けないものと解釈すべきである。これらの例を挙げると、「含む(include)」という用語は「含むがこれに限られない」などを意味すると理解すべきである。「例(example)」という用語は、検討中の項目の典型的な例を挙げるために用いられ、それ以外には無い、またはそれしかないという意味ではない。「1つの(a、an)」という用語は「少なくとも1つ」「1つまたは複数」などを意味すると理解すべきである。「従来の(conventional)」「伝統的な(traditional)」「通常の(normal)」「標準的な(standard)」「既知の(known)」といった形容詞や似たような意味の用語は、記載の項目をある期間に限定するもの、またはある時点において入手可能な項目に限定するものと解釈すべきではなく、現在または将来のある時に入手可能となる、または知られる可能性がある、従来の、伝統的な、通常の、または標準的な技術を包括するものと理解すべきである。同様に、本明細書で当業者には明らかまたは知られた技術と言う場合は、現在または将来のある時において、当業者に明らかとなる、または知られる技術を包括するものである。
「1つまたは複数の」「少なくとも」「〜に限定されない」といった、意味を広げる言葉や語句が場合によって存在するからといって、これらの意味を広げる語句が存在しない場合に、意味を狭くすることが意図される、または必要とされると理解すべきではない。「構成要素(component)」という用語を用いていても、その構成要素の一部として記載または主張される態様または機能がすべて共通のパッケージ内に構成されていることを示唆するものではない。実際、制御ロジックであれその他の要素であれ、ある構成要素の様々な態様は、そのいずれかまたはすべてを単一のパッケージ内に結合してもよく、別々に維持してもよく、また、複数のグループあるいはパッケージ、または複数の場所に分配することもできる。
さらに、本明細書に記載の様々な実施形態について、典型例としてのブロック図、フローチャート、その他の図解の観点から説明した。本明細書を読めば当業者には明らかとなるが、図示した実施形態やその様々な代替例は、図示例に制限されることなく実施が可能である。たとえばブロック図やこれに付随する説明から、特定のアーキテクチャまたは構成が必須のものであると解釈すべきではない。

Claims (17)

  1. 加法色モデル信号を、色度成分及び輝度成分を有する、YUV色空間信号からなる均等色空間信号に変換する工程と、
    前記色度成分に色度専用変換を適用することにより、前記色度成分を変換する工程と、
    前記色度成分とは別々に、前記輝度成分に輝度専用変換を適用することにより、前記輝度成分を変換する工程と、
    変換された前記色度成分及び前記輝度成分を量子化する工程と、
    量子化された前記色度成分及び前記輝度成分を符号化する工程と、を備え、
    前記色度成分を変換する工程は、前記YUV色空間信号内の前記色度成分を表す主三角形表示を、複数の二次三角形を含むメッシュに細分化する工程を含む、コンピュータにより実行される方法。
  2. 前記加法色モデル信号が赤/緑/青(RGB)カラーモデル信号からなる、請求項1に記載のコンピュータにより実行される方法。
  3. 前記主三角形表示の頂点のそれぞれが、前記加法色モデルの三原色のうちの1つを含む、請求項1に記載のコンピュータにより実行される方法。
  4. 前記加法色モデルの前記三原色のうち2つの間に中間頂点を定義する工程をさらに備える、請求項3に記載のコンピュータにより実行される方法。
  5. 前記主三角形表示の頂点の各々、及び、定義された前記中間頂点を、前記YUV色空間内の前記色度成分を表す四角形表示にマッピングする工程をさらに備える、請求項4に記載のコンピュータにより実行される方法。
  6. 前記四角形表示が単位正方形からなる、請求項5に記載のコンピュータにより実行される方法。
  7. 前記複数の二次三角形それぞれの各頂点が、平均値座標を用いて、前記YUV色空間内の前記色度成分を表す前記四角形表示にマッピングされる、請求項5に記載のコンピュータにより実行される方法。
  8. 前記YUV色空間内の前記色度成分それぞれの値が、前記色度成分それぞれの前記値に対応する重心座標を用いて、前記色度成分の前記四角形表示にマッピングされる、請求項7に記載のコンピュータにより実行される方法。
  9. 前記主三角形表示の頂点それぞれ、及び定義された前記中間頂点を、前記YUV色空間内の前記色度成分を表す四辺多角形表示にマッピングする工程をさらに備える、請求項4に記載のコンピュータにより実行される方法。
  10. 前記主三角形表示の頂点それぞれ、前記複数の二次三角形の前記頂点のそれぞれ、及び定義された前記中間頂点の、前記四辺多角形表示へのマッピングに影響を及ぼす複数の制約のうち少なくとも1つを適用する工程をさらに備える、請求項9に記載のコンピュータにより実行される方法。
  11. 前記複数の制約のうち少なくとも1つの特性を調整して、前記色度専用変換を改変する工程をさらに備える、請求項10に記載のコンピュータにより実行される方法。
  12. 前記輝度専用変換が光電気伝達関数からなる、請求項1に記載のコンピュータにより実行される方法。
  13. コンピュータにより実行可能なプログラムコードが体現された非一時的コンピュータ可読媒体であって、プロセッサが、
    明るさ成分及び色成分を有する第1色空間モデルにより表される画像信号を伝搬する入力ビットストリームの量子化色成分及び量子化明るさ成分を復号化し、
    前記量子化色成分及び量子化明るさ成分を非量子化し、
    前記非量子化色成分に第1逆変換を適用し、
    前記非量子化色成分に第1逆変換を適用することとは別々に、前記非量子化明るさ成分に第2逆変換を適用し、
    第1色空間モデルにより表される前記画像信号を、加法色空間モデルである第2色空間モデルにより表される画像信号に変換するように、前記コンピュータにより実行可能なプログラムコードが構成され、
    前記第1逆変換は、直接変換の逆変換及び最小二乗変換の逆変換のうちの1つを含み、前記色成分及び明るさ成分が予め変換されて前記画像信号を圧縮するためのビデオコーデックが使用可能な符号語の数が増大されている、非一時的コンピュータ可読媒体。
  14. 前記第1色空間モデルがYUV色空間モデルからなり、前記第2色空間モデルが赤/緑/青(RGB)色空間モデルからなり、前記ビデオコーデックが高効率映像符号化(High Efficiency Video Coding:HEVC)コーデックからなる、請求項13に記載の非一時的コンピュータ可読媒体。
  15. 前記画像信号が、標準ダイナミックレンジ(SDR)画像信号、ハイダイナミックレンジ(HDR)画像信号、標準色域(SCG)画像信号、広色域(WCG)画像信号のうちの1つからなる、請求項13に記載の非一時的コンピュータ可読媒体。
  16. 広色域の知覚色変換のシステムであって、
    赤/緑/青(RGB)色空間モデルにより表される画像信号を、明るさ成分及び色成分を有するYUV色空間モデルにより表される画像信号に変換するコンバータと、
    前記色成分に第1変換を適用する第1変換器と、
    前記色成分に第1変換を適用することとは別々に、前記明るさ成分に第2変換を適用する光電気伝達関数エンコーダと、
    変換された前記色成分及び前記明るさ成分を量子化する量子化器と、
    量子化された前記色成分及び前記明るさ成分を符号化してビットストリームを出力するエンコーダと、
    を備え、
    前記色成分への第1変換は、YUV色空間内の前記色成分を表す主三角形表示を、複数の二次三角形を含むメッシュに細分化することを含む、システム。
  17. 前記第1変換が可逆性である、請求項16に記載のシステム。
JP2016087894A 2015-05-01 2016-04-26 広色域映像符号化用の知覚色変換 Active JP6738645B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562156124P 2015-05-01 2015-05-01
US62/156,124 2015-05-01
US14/862,027 2015-09-22
US14/862,027 US10257526B2 (en) 2015-05-01 2015-09-22 Perceptual color transformations for wide color gamut video coding

Publications (3)

Publication Number Publication Date
JP2016213828A JP2016213828A (ja) 2016-12-15
JP2016213828A5 JP2016213828A5 (ja) 2019-05-16
JP6738645B2 true JP6738645B2 (ja) 2020-08-12

Family

ID=57136014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016087894A Active JP6738645B2 (ja) 2015-05-01 2016-04-26 広色域映像符号化用の知覚色変換

Country Status (5)

Country Link
US (1) US10257526B2 (ja)
JP (1) JP6738645B2 (ja)
KR (1) KR102566291B1 (ja)
CN (1) CN106101708B (ja)
DE (1) DE102016207230A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10043237B2 (en) * 2015-08-12 2018-08-07 Gopro, Inc. Equatorial stitching of hemispherical images in a spherical image capture system
US11087644B2 (en) 2015-08-19 2021-08-10 E Ink Corporation Displays intended for use in architectural applications
CN108141507B (zh) * 2015-10-02 2020-02-07 Vid拓展公司 利用查找表进行颜色校正
US10750173B2 (en) * 2016-03-07 2020-08-18 Koninklijke Philips N.V. Encoding and decoding HDR videos
EP3446486B1 (en) * 2016-04-22 2021-12-08 Dolby Laboratories Licensing Corporation Coding of hdr video signals in the ictcp color format
US10163030B2 (en) * 2016-05-20 2018-12-25 Gopro, Inc. On-camera image processing based on image activity data
PL3465628T3 (pl) 2016-05-24 2020-12-14 E Ink Corporation Sposób renderowania barwnych obrazów
WO2018006390A1 (en) * 2016-07-08 2018-01-11 SZ DJI Technology Co., Ltd. System and method for image processing
WO2018070822A1 (ko) * 2016-10-14 2018-04-19 엘지전자 주식회사 적응적 영상 재생을 위한 데이터 처리 방법 및 장치
JP2018107580A (ja) * 2016-12-26 2018-07-05 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
EP3386198A1 (en) * 2017-04-07 2018-10-10 Thomson Licensing Method and device for predictive picture encoding and decoding
CN108024110B (zh) * 2017-12-15 2019-06-21 四川长虹电器股份有限公司 一种高色域液晶电视的色彩调试方法
CN112995615B (zh) * 2019-12-13 2022-05-31 澜至电子科技(成都)有限公司 图像处理方法、装置以及存储介质
EP4217996A1 (en) 2020-09-24 2023-08-02 Edward M. Granger Image transformation system and method
WO2022081851A1 (en) * 2020-10-14 2022-04-21 Dolby Laboratories Licensing Corporation Color transformation for hdr video with a coding-efficiency constraint

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6100998A (en) * 1996-11-29 2000-08-08 Fuji Xerox Co., Ltd. Print processor with efficient memory use
KR100467600B1 (ko) * 2002-07-30 2005-01-24 삼성전자주식회사 컬러 정정 방법
KR100938846B1 (ko) * 2003-05-22 2010-01-26 삼성전자주식회사 색변환장치 및 그 방법
JP3791848B2 (ja) 2003-10-28 2006-06-28 松下電器産業株式会社 画像表示装置、画像表示システム、撮影装置、画像表示方法、およびプログラム
KR101058125B1 (ko) * 2004-02-23 2011-08-24 삼성전자주식회사 화상 표시 방법 및 표시 장치와, 이의 구동 장치 및 방법
US7692663B2 (en) * 2005-10-19 2010-04-06 Canon Kabushiki Kaisha Multi-shelled gamut boundary descriptor for an RGB projector
US8085438B2 (en) * 2007-04-23 2011-12-27 Ecole Polytechnique Federale De Lausanne (EPPL) Printing color images visible under UV light on security documents and valuable articles
JP2009278538A (ja) * 2008-05-16 2009-11-26 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記録媒体
US8289344B2 (en) * 2008-09-11 2012-10-16 Apple Inc. Methods and apparatus for color uniformity
US8233705B2 (en) * 2008-10-03 2012-07-31 Eastman Kodak Company Potential field-based gamut mapping
EP2406943B1 (en) 2009-03-10 2016-06-15 Dolby Laboratories Licensing Corporation Extended dynamic range and extended dimensionality image signal conversion
CN102388612B (zh) 2009-03-13 2014-10-08 杜比实验室特许公司 高动态范围、可视动态范围和宽色域视频的分层压缩
GB2469794B (en) * 2009-04-24 2014-02-19 Photonstar Led Ltd High colour quality luminaire
RU2013149856A (ru) 2011-04-08 2015-05-20 Конинклейке Филипс Н.В. Кодирование и декодирование видео
US11640656B2 (en) 2011-09-27 2023-05-02 Koninklijke Philips N.V. Apparatus and method for dynamic range transforming of images
KR20130141920A (ko) * 2012-06-18 2013-12-27 삼성디스플레이 주식회사 색역 변환 시스템 및 방법
US9445109B2 (en) 2012-10-16 2016-09-13 Microsoft Technology Licensing, Llc Color adaptation in video coding
CN105324997B (zh) * 2013-06-17 2018-06-29 杜比实验室特许公司 用于增强动态范围信号的分层编码的自适应整形
US9948916B2 (en) * 2013-10-14 2018-04-17 Qualcomm Incorporated Three-dimensional lookup table based color gamut scalability in multi-layer video coding
JP5940039B2 (ja) * 2013-10-31 2016-06-29 京セラドキュメントソリューションズ株式会社 色変換テーブル作成装置、画像形成装置、色変換テーブル作成方法、及び色変換テーブル作成プログラム
JP2017512393A (ja) * 2014-02-21 2017-05-18 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 高解像度及び高ダイナミックレンジを可能とするビデオデコーダ
CN111654697B (zh) * 2015-01-30 2022-07-19 交互数字Vc控股公司 对彩色画面进行编码和解码的方法和装置
US20160309154A1 (en) * 2015-04-17 2016-10-20 Qualcomm Incorporated Dynamic range adjustment for high dynamic range and wide color gamut video coding

Also Published As

Publication number Publication date
JP2016213828A (ja) 2016-12-15
KR20160130163A (ko) 2016-11-10
DE102016207230A1 (de) 2016-11-03
CN106101708B (zh) 2019-11-05
US10257526B2 (en) 2019-04-09
CN106101708A (zh) 2016-11-09
KR102566291B1 (ko) 2023-08-10
US20160323556A1 (en) 2016-11-03

Similar Documents

Publication Publication Date Title
JP6738645B2 (ja) 広色域映像符号化用の知覚色変換
CN106488246B (zh) 用于增强动态范围信号的分层编码的自适应整形的方法
JP6302600B2 (ja) 知覚的量子化されたビデオコンテンツの符号化および復号化
RU2607618C2 (ru) Устройство и способ улучшения обмена данными изображения на основе нелинейности восприятия яркости между разными возможностями отображения
CN105744277B (zh) 分层vdr编译码中的层分解
JP2018525883A (ja) カラー・ピクチャを符号化および復号する方法およびデバイス
JP2021193806A (ja) カラー・ピクチャを符号化および復号する方法および装置
RU2737507C2 (ru) Способ и устройство для кодирования изображения высокого динамического диапазона, соответствующий способ декодирования и устройство декодирования
KR102509504B1 (ko) 코딩 및 디코딩 방법과 대응하는 디바이스
WO2015007510A1 (en) Method and apparatus to create an eotf function for a universal code mapping for an hdr image, method and process to use these images
JP2019515562A (ja) 高ダイナミックレンジ画像を符号化ビットストリームへ符号化/復号する方法と装置
KR102449634B1 (ko) 적응적 컬러 그레이드 보간 방법 및 디바이스
CN114205586A (zh) 基于多色彩空间进行率失真优化的视频处理方法及应用
AU2015243117A1 (en) Method, apparatus and system for encoding and decoding image data
CN110999300A (zh) 用于图像/视频处理的单通道逆映射
Myszkowski et al. HDR Image, Video, and Texture Compression

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20160705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190404

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190404

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200720

R150 Certificate of patent or registration of utility model

Ref document number: 6738645

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250