JP6401777B2 - 合成画像の送信および受信 - Google Patents

合成画像の送信および受信 Download PDF

Info

Publication number
JP6401777B2
JP6401777B2 JP2016505885A JP2016505885A JP6401777B2 JP 6401777 B2 JP6401777 B2 JP 6401777B2 JP 2016505885 A JP2016505885 A JP 2016505885A JP 2016505885 A JP2016505885 A JP 2016505885A JP 6401777 B2 JP6401777 B2 JP 6401777B2
Authority
JP
Japan
Prior art keywords
encoded
transmission mask
binary
mask
foreground image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016505885A
Other languages
English (en)
Other versions
JP2016519501A (ja
JP2016519501A5 (ja
Inventor
ムラク,マルタ
ナッカリ,マッテオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Broadcasting Corp
Original Assignee
British Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Broadcasting Corp filed Critical British Broadcasting Corp
Publication of JP2016519501A publication Critical patent/JP2016519501A/ja
Publication of JP2016519501A5 publication Critical patent/JP2016519501A5/ja
Application granted granted Critical
Publication of JP6401777B2 publication Critical patent/JP6401777B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/21Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with binary alpha-plane coding for video objects, e.g. context-based arithmetic encoding [CAE]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/272Means for inserting a foreground image in a background image, i.e. inlay, outlay

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、一般に、合成画像の送信および受信に関し、最も重要な例においては、ビデオ放送システムに、特に、ビデオシーケンスの撮影後編集および/または合成に役立つ追加情報の送信を可能にするフレームワークに関する。このフレームワークを用いれば、デジタルビデオ放送のコンテキストにおけるコンテンツ制作の柔軟性を実現することができる。
本発明の実施形態は、放送チェーンによってビデオコンテンツを配信することを目的とするデジタルビデオ放送分野を対象とし、放送チェーンは、大まかに、以下の4つの段階、すなわち、ビデオコンテンツ制作、撮影後編集、ビデオコンテンツ送信、および可能なさらなる処理を伴う受信側受信に存する。撮影後編集段階および受信側処理段階において、ビデオは、ビデオの品質を高め、いくつかの画像領域を挿入または削除し、ビデオを他のビデオと合成するなどのために操作される。さらに、受信側において、特定の視聴者のための追加情報を搬送するセカンダリストリームを埋め込むための何らかの処理を行うこともできる。この追加情報の一例は、聴覚障碍者が放送番組を理解するのに役立つように、手話通訳者ビデオによって表すことができる。前述の操作中に実行される処理は、放送配信チェーンに関与する様々な当事者間で共有される必要のある何らかの情報を必要とする場合もある。したがって、コンテンツ操作の柔軟性および無理のない帯域幅での送信を可能にするために、この情報の効率的な表現を提供することが重要である。
撮影後処理および/または受信側処理に必要なそうした情報の一例が、いわゆるアルファチャンネルによって表される透過マスクである。アルファチャンネルは、特定のビデオコンテンツに関連付けられた信号であり、典型的には、異なるビデオを併せて合成し、またはビデオにオブジェクトを挿入するのに使用される。しかし、本発明の透過マスクは、任意の形態のアルファチャンネルを包含することができることに留意すべきである。特に、アルファチャンネルを、同数のフレームを有するビデオシーケンスとして表すことができ、それによって、各フレームは、アルファチャンネルと関連付けられたビデオコンテンツに関連するフレームと同じ幅および高さを有するものになる。アルファチャンネル信号内の各画素は、当該の特定の画素についての不透過度(すなわち透過度)を表す範囲[vmin,vmax]内の値を取る。特定のアルファチャンネルの1フレームの一例が図1に示されている。白い画素は不透過画素に対応し、黒い画素は透過画素に対応する。関連付けられたアルファチャンネルが透過であるビデオコンテンツ内の画素はユーザ画面上に表示されず、不透過画素は表示されることになる。図1から分かるように、アルファチャンネル信号のフレームは、空間変換、量子化、動き補償、イントラ予測などとして、最新技術のビデオ圧縮法を用いて、圧縮することができる。
本発明の目的は、1つの典型的なビデオ放送配信チェーンの様々な段階において行われるビデオ編集および撮影後処理に役立つ情報の送信を可能にすることである。
1つの態様において、本発明は、少なくとも1つの前景画像および透過マスクを含む合成画像を送信する方法であって、前景画像を符号化するステップと、透過マスクを画像として符号化するステップと、符号化された前景画像および符号化された透過マスクを、符号化された透過マスクが、各画素がただ2つの値を取ることができるバイナリ透過マスクとして復号されるべきであるか否かを示すフラグと共に送信するステップと、を含む方法に存する。画素値は、透過マスクにおいて、バイナリ透過マスクを導出するために閾値と比較することができる。復号されたバイナリ透過マスクのクリッピングにおいて使用するために復号器にクリップ値をシグナリングすることができる。
バイナリ透過マスクは、各マスクを区切ってブロックの非重複グリッドにし、各ブロックのすべての画素が同じ値を共有する場合には当該ブロックの画素値を送信し、または、当該ブロックがさらに分割されるべきであることをシグナリングする分割フラグを送信することによって符号化し、このプロセスを再帰的に続けることによって符号化することができる。最小許容ブロックサイズを決定することができ、ブロック分割のプロセスは、最小許容ブロックサイズに達するまで再帰的に続く。すべて等しいとは限らない値を有する画素を含む最小サイズを有するブロックは、予測符号化法およびエントロピー符号化法を用いて符号化することができる。
好ましくは、本方法は、透過マスクがビデオシーケンス内の前の画像の透過マスクと同じであるかどうか判定するステップと、透過マスクが前の画像の透過マスクと同じでない場合にのみ、透過マスクを画像として符号化するステップと、任意の符号化された透過マスクを、前の画像のための符号化された透過マスクが、現在の画像の符号化された前景画像と関連付けて使用されるべきであるかどうかを示すフラグと共に送信するステップと、をさらに含む。
適切には、本方法は、符号化された前景画像を、合成画像における前景画像のサイズや位置といった合成情報と共に送信するステップをさらに含む。合成情報は、合成画像のフレームを形成する画素の色を含むことができる。
別の態様において、本発明は、合成画像を復号する方法であって、符号化された前景画像および符号化された透過マスクをフラグと共に受信するステップと、符号化された前景画像を復号するステップと、上記フラグによって指示される場合に、符号化された透過マスクを、各画素がただ2つの値を取ることができるバイナリ透過マスクとして復号するステップと、合成画像を形成するに際して、前景画像をバイナリ透過マスクと関連付けて使用するステップと、を含む方法に存する。符号化された透過マスクをバイナリ透過マスクとして復号するステップは、画素がただ2つの値を取るように制約されない予備の透過マスクを生成するための復号ステップと、画素がただ2つの値を取るように制約されるバイナリ透過マスクを生成するためのクリッピングステップとを含むことができる。クリッピングステップは、符号器によって復号器にシグナリングされるクリップ値を利用することができる。
符号化されたバイナリ透過マスクはブロックへと区切ることができ;受信された値はブロックごとに読み取られ、受信された値が上記2つの許容される値のどちらかと等しい場合には、現在のブロックの画素は受信された値に設定され;そうでない場合には、現在のブロックは低減されたサイズを有するブロックへと分割され、プロセスは再帰的に繰り返される。分割プロセスが最小許容値と等しいサイズを有するブロックに至った場合には、画素の値は、受信された差分δと前に復号された画素の値とを加算することによって得られる値に設定される。
好ましくは、本方法は、フラグを受信するステップと、上記フラグによって指示される場合に、合成画像を形成するに際して、前景画像を前の画像のための透過マスクと関連付けて使用するステップと、をさらに含む。
適切には、本方法は、符号化された前景画像を合成情報と共に受信するステップと、前景画像を合成情報と関連付けて使用して合成画像を形成するステップと、をさらに含む。前景画像は、合成情報内のサイズ情報に従って変倍することができる。前景画像は、合成情報内の位置情報に従って合成画像において位置決めすることができる。合成画像のフレームは、合成情報によって指定される色を呈することができる。
合成画像は、プライマリ符号化ピクチャを形成する前景画像に関連する符号化データと同じアクセスユニットにおいてセカンダリピクチャとして送信される透過マスクに関連する符号化データを用いて、画像のビデオシーケンスの一部を形成することができる。前景画像および透過マスクは、H.264/AVCやHEVCといったビデオ符号化規格に従って符号化することができる。各フラグは、H.264/AVC規格またはHEVC規格の構文ヘッダ要素シーケンス・パラメータ・セット(Sequence Parameter Set(SPS))において表すことができる。
合成情報は、H.264/AVC規格およびHEVC規格によって指定される付加拡張情報(Supplementary Enhanced Information(SEI))メッセージにおいて編成することができる。フレーム合成を目的としてSEIメッセージに含まれる情報は、SEIメッセージが受信される時間にわたってのみ持続することができ、または新しいSEIメッセージが受信されるまで持続することができる。
以下の説明において、アルファチャンネルという用語は、透過マスクの一例を記述するのに使用される。
1つの構成によれば、主放送番組に対応するビデオシーケンスは、H.264/AVCまたは新しい高効率ビデオ符号化(High Efficiency Video Coding(HEVC))規格によって標準化されている動き補償予測ビデオ符号化法を用いて符号化されるフレームへ分割される。H.264/AVC規格でもHEVC規格でも、1つのフレームに関連する符号化データは、1組のネットワーク抽象化層(Network Abstraction Layer(NAL))ユニットを含むアクセスユニットへと編成される。各NALユニットは、符号化ビデオシーケンスに関連する符号化データを含む。これらのデータは、ビデオ・シーケンス・パラメータ(例えば、フレームの幅および高さ)に関連するヘッダとすることもでき、フレーム画素自体に関連するデータとすることもできる。主放送番組と、主放送番組と関連付けられたアルファチャンネルとを一緒に保持するために、アルファ・チャンネル・ピクチャ(以後、セカンダリピクチャともいう)の存在は、主ビデオ放送番組ビデオに関連する符号化ピクチャ(以後、前景画像またはプライマリピクチャともいう)の同じアクセスユニットにおいてシグナリングされる。フレーム合成、復号後のアルファチャンネル処理、およびアルファチャンネルを用いて合成されたフレームの後処理のためのデータをシグナリングすることも有益となりうる。最後に、ただ2つだけの値(vtransparentおよびvopaque)を取り、バイナリ・アルファ・チャンネルとも呼ばれるアルファチャンネル信号のための簡略化された符号化アルゴリズムも提供される。
主ビデオシーケンスの1つのフレームに関連付けられたアルファチャンネルの一例を示す図である。 1つの特定の色のフレーム後景との2つの主ピクチャ(フレーム0およびフレーム1)からのフレーム合成の一例を示す図である。 H.264/AVC規格およびHEVC規格に従ったビットストリームにおけるプライマリピクチャおよびセカンダリピクチャの編成の一例を示す図である。 すべてのフレームに固定されたアルファチャンネルを使用する放送用途の一例を示す図である。 アルファチャンネル値のためのクリッピングの一例を示す図である。 アルファチャンネル値のためのバイナリクリッピングの一例を示す図である。 バイナリ・アルファ・チャンネルの値のDPCM符号化の一例を示す図である。
次に、本発明を、撮影後編集およびフレーム合成の分野に関連したいくつかの例によって説明する。これらの例は、編集および処理を容易にするためのセカンダリピクチャを使用したビデオビットストリームにおけるアルファチャンネル信号の埋め込みを伴う。また、これらの例は、ビデオ処理に役立つ情報を搬送する構文要素である付加拡張情報(SEI)メッセージの概念も使用する。最後に、これらの例は、クラシス(classis)および一般的なビデオ符号化法に対して計算量が少なくて済むバイナリ・アルファ・チャンネルのための簡略化された符号化アルゴリズムも提供するものでもある。
プライマリ符号化ピクチャとアルファチャンネルとに関連付けられたデータを一緒に保持するために、プライマリピクチャに関連する各アクセスユニットにおいてアルファチャンネル圧縮データの存在をシグナリングすることが提案される。図3に、1つのアクセスユニットがプライマリ符号化ピクチャのためのアルファ・チャンネル・データを含むのに対して、この編成の概略図を示す。「背景技術」の項で説明したように、アルファチャンネル信号は、H.264/AVCおよびHEVCと同じビデオ符号化規格によって標準化された符号化ツールを用いて圧縮することができる。さらに、アルファチャンネルは画素ごとの不透過度を指定するため、アルファチャンネルは、単色画像(すなわち輝度のみのピクチャ)のように見える。アルファチャンネルが存在する場合、透過値および不透過値が送信される必要がある。さらに、アルファチャンネルがバイナリであるか否かを送信する必要がある。最後に、アルファチャンネル内の画素ごとのビット数も送信される。というのは、アルファチャンネル内の画素ごとのビット数は、主符号化ビデオのビット数と異なりうるからである。以上の情報は、シーケンスレベルのパラメータを搬送する符号化ビデオの構文構造において送ることができる。一例では、全シグナリングフレームワークを、H.264/AVC規格およびHEVC規格のSPS(Sequence Parameter Set)に、以下のように配置することができる。
Figure 0006401777
フラグsecondary_picture_presentは、プライマリピクチャの同じアクセスユニット内に、アルファチャンネルの符号化データが存在するかどうかを指定する。フラグis_binary_secondary_pictureは、透過マスクがバイナリピクチャであり、したがって、ただ2つの値(透過および不透過)を取りうるかどうかを指定する。量bit_depth_secondary_pictureは、アルファチャンネル内の画素のビット深度を指定する。バイナリ透過マスクの場合には、この量は1と等しい。量value_opaque_pixelsは、不透過と分類されるアルファチャンネル内の画素の値を指定し、それと対をなして、量value_transparent_pixelsは、透過画素の値を指定する。
いくつかの用途においては、必要とされるアルファチャンネルは、バイナリ値、すなわち、αtransparentまたはαopaqueのみを取りうる。いくつかの用途の例は、ロゴ挿入広告放送や、聴覚障碍者が番組を理解するのに役立つニュースにおける手話通訳者の挿入である。バイナリチャンネルだけしか必要とされないため、送信すべき値が2つだけであることによって符号化プロセスが簡略化される。バイナリ・アルファ・チャンネルの使用はフラグによって表示される。バイナリ・アルファ・チャンネルの一例が図1に示されている。バイナリ・アルファ・チャンネルは、前景オブジェクトを後景オブジェクトと分離するためのマスクのように見える。
アルファチャンネルはフレーム合成時に使用されうると想定すると、アルファチャンネルの鋭いエッジの正確な符号化は重要である。事実、従来の非可逆圧縮アルゴリズムは、バイナリ・アルファ・チャンネルのエッジを平滑化し、不鮮明にし、最終的な合成フレーム内に不快なアーチファクトを生じさせることにもなりうる。さらに、図1を見ると、アルファチャンネル信号は、すべての画素が透過か不透過のどちらかでしかない大きな均質の領域を特徴とすることが分かる。本発明の1つの形態では、Nが範囲[Nmin,Nmax]内の値を取るサイズN×Nの正方形領域を用いてバイナリ・アルファ・チャンネルを近似することによって、バイナリ・アルファ・チャンネルを符号化することが提案される。特に、アルファチャンネルの所与のフレームが、Nmax×Nmaxの正方形ブロックの非重複グリッドへと区切られる。正方形Bごとに、内部の各画素の値が評価される。Bに属するすべての画素がαtransparentまたはαopaqueと等しい値を有する場合、その値は送信され、符号化アルゴリズムは、Nmax×Nmaxの寸法を有する次の正方形ブロックへ移動する。逆に、すべての画素がαtransparentまたはαopaqueと等しい値を取るとは限らない場合には、ブロックBは、各々が(Nmax/2)×(Nmax/2)の寸法を有する4つのブロックへ分割される。この分割によって得られた各ブロックにわたって、すべての画素がαtransparentまたはαopaqueと等しい値を取るかどうかチェックするために、各ブロックに属する画素が再度評価される。分割操作は、ブロックサイズがNminの最小サイズに達するまで続く。サイズNmin×Nminを有する1つのブロックが、すべてがαtransparentまたはαopaqueと等しいとは限らない値を含む場合には、ブロック内部の値は、差分パルス符号変調(Differential Pulse Code Modulation(DPCM))法を用いて符号化される。特に、図7に、画素値αごとに、差分δが計算され、送信されるのに対して、DPCMプロセスを示す。送信は、文献においてハフマン符号化、算術符号化などとして提案されている任意のエントロピー符号化法を使用することができる。考察されているブロックが分割される必要があるかどうかの信号は、αtransparentおよびαopaqueとは異なる従来の値(αsplitなど)が送信される。したがって、復号器は、最初の正方形Nmax×Nmaxブロックの送信された値を読み取ることから復号を開始する。受信された値がαtransparentまたはαopaqueである場合には、復号器は、現在のブロックに属するすべての画素の値を受信された値に設定し、次のNmax×Nmax正方形ブロックへ移動する。そうでない場合には、復号器は、現在のブロックを、サイズ(Nmax/2)×(Nmax/2)の4つのブロックに分割し、次に受信された値を読み取る。分割は、ブロックサイズが許容される最小サイズNminに達するまで続く。この場合、復号器が受け取ることになる値は、DPCMを用いて符号化されているアルファチャンネル値を指す。
送信されたアルファチャンネル信号が復号されるときに、アルファチャンネル信号の値は、範囲[αtransparent,αopaque]内に留まるようにクリップされる必要が生じうる。さらに、いくつかのビデオ放送用途については、必要とされるアルファチャンネルはバイナリであるが、送信側は、アルファチャンネルの圧縮を改善することができるようにアルファチャンネルを軽減/平滑化するための何らかの処理を適用する場合がある。受信側において、復号されたアルファチャンネルは、バイナリ・アルファ・チャンネルに戻される必要がある。この場合には、適切な閾値が復号されたアルファチャンネル値に適用される必要がある。必要とされる閾値は、シーケンスレベルのパラメータのための情報を搬送する符号化ビデオの構文構造においてシグナリングすることができる。一例では、閾値は、SPSにおいて以下のようにシグナリングされる。
Figure 0006401777
量alpha_clipping_typeは、どの種類のクリッピングがアルファチャンネル値に適用されうるかを指定する。好都合なクリッピング操作の例が図5および図6に示されている。特に、図5に示されているクリッピングは、αtransparentより小さいアルファチャンネル値をαtransparentに設定し、αopaqueより大きいアルファチャンネル値をαopaqueに設定する。逆に、図6に示されているクリッピングは、アルファチャンネル値がαtransparentより小さいか、それともαopaqueより大きいかに応じて、それぞれ、アルファチャンネル値を、αtransparentまたはαopaqueに設定する。量alpha_clipping_typeは、3つの値、0、1、または2を取る。値0は、アルファチャンネル値にクリッピングが適用されないという信号に対応する。値1は、図5に示されているクリッピングがアルファチャンネル値に適用されるという信号に対応し、値2は、図6のクリッピングが適用されるという信号に対応する。最後に、量alpha_clipping_binaryは、クリッピング操作のバイナリ閾値を、図6に示されている閾値として指定する。
図4に、ただ1つのフレームを有し、よって、すべてのビデオフレームについて繰り返されるアルファチャンネルを必要とする1つの放送用途を示す。この場合、前項で説明した構成は最初のフレームについてしか必要とされず、よって、最初のアルファ・チャンネル・フレームの繰り返しをシグナリングすることができる。アルファチャンネルの再利用は、ピクチャレベルのパラメータのための情報を搬送する符号化ビデオの構文構造においてシグナリングすることができる。一例では、アルファチャンネルの再利用は、H.264/AVC規格およびHEVC規格のピクチャ・パラメータ・セット(Picture Parameter Set(PPS))構文要素において、以下のようにシグナリングすることができる。
Figure 0006401777
フラグsecondary_picture_statusは、以下の意味を有する4つの値を有する。
・0=セカンダリピクチャが存在せず、アルファチャンネルは、前に復号されたフレームから再利用される。
・1=セカンダリピクチャが存在し、前のセクションで指定された構成に従って圧縮される。
・2=セカンダリピクチャが存在せず、すべての画素が透過値と等しいピクチャで代用される。
・3=セカンダリピクチャが存在せず、すべての画素が不透過値と等しいピクチャで代用される。
クロマキー合成法は、輝度または任意の他の適切な色空間表現(例えば、赤、緑、青など)の(普通はキーと呼ばれる)1つの特定の値と異なる1つのピクチャからの画素を抽出することに存する。普通、コンテンツ取得プロセスにおけるカメラノイズおよび他の不都合点が与えられた場合、画像画素は、キー値を有するはずであるにもかかわらず、キーとわずかに異なる値を提示し、それがクロマキー合成法によって誤って解釈されるおそれがある。この欠点を克服するために、いくつかのロバストなクロマキー合成法が文献において考案されており、これらの方法は、相当量の計算処理リソースを必要とする。これらの種類のクロマキー合成法は、処理が復号器側で行われなければならない場合には不都合となりうる。したがって、1つの代替の手法は、キー合成を、計算処理リソースの制限がより小さい送信側で行い、次いで、キー値を有することになる画素を、厳密にこのキー値に設定するものである。キーは次いでビデオと共に送信され、その場合、受信側では、クロマキー合成プロセスは、単純なバイナリ分類(後景/前景)である。送信される画像には非可逆符号化が適用されうるため、キー値を有する画素は、元のキーと異なる値を有する可能性がある。この場合には、区間値を送って、その区間内に入るすべての画素値が引き続き後景に属するものとみなされるようにすることができる。一例では、この区間値は、D=|V−K|<Tである場合に、画素が引き続き後景に属するような許容差値によって表すことができ、式中、Vは画素値であり、Kはキーの値であり、Tは許容差であり、|・|は絶対差を表す。キーおよび区間の値は、シーケンスレベルのパラメータのための情報を搬送する符号化ビデオの構文構造において送信することができる。一例では、構文構造は、以下のようなH.264/AVC規格およびHEVC規格のSPSとすることができる。
Figure 0006401777
フラグkey_value_presentは、符号化ビデオが規定のキー値を有する画素を含むかどうかを指示する。量key_value_component_1、…、key_value_component_nは、ビデオシーケンス内の画素の成分ごとのキー値を指定する。最後に、量tolerance_value_component_1、…、tolerance_value_component_nは、キーとの差がどれほどであれば画素値を引き続き後景に属するとみなすことができるかを指定する。
図2に、フレーム0およびフレーム1からの2つのピクチャおよびアルファチャンネルを用いたフレーム合成の一例を示す。フレームを合成し、一例として、フレーム0とフレーム1の画素の最終的なアスペクト比などの何らかの情報を送信することは有益である。この情報は、放送番組全体に沿って変動しうることに留意すべきである。フレーム合成情報を伝えるための有益なファシリティが、付加拡張情報(SEI)メッセージによって表される。SEIメッセージは、H.264/AVC規格とHEVC規格の両方で指定されている、表示のために役立つ何らかの情報を搬送するための構文要素である。SEIメッセージは、符号化フレームと非同期的に送信することができ、1つのSEIメッセージにおいて指定される情報は、タイムラインにおいて前のメッセージの後に続く別のメッセージによって書き換えることができる。図2に概略的に表されているフレーム合成の問題について、可能なSEIメッセージ構成は以下のとおりである。
Figure 0006401777
フラグframe_comp_info_persistence_flagは、現在のSEIメッセージが、前に受信されたフレーム合成のための情報を書き換えるかどうかを指定する。値に応じて、フラグは、情報が、SEIメッセージが受信されるのと同時のフレームについてのみ書き換えられること、または、新しいSEIメッセージが受信されるまで、SEIメッセージが受信されるときから開始するすべての後続フレームについて書き換えられることを指示することができる。量composite_frame_background_colour_1、…、composite_frame_background_colour_nは、合成フレーム内の後景画素のすべての成分が呈する色を指定する。量frame_0_offset_leftおよびframe_0_offset_topは、フレーム0の左上隅の合成フレームにおける位置を指定する。同様に、量frame_1_offset_leftおよびframe_1_offset_topは、フレーム1の合成フレームにおける位置を指定する。量frame_0_widthおよびframe_0_heightは、合成フレームにおけるフレーム0の幅および高さを指定する。フレーム1のframe_1_widthおよびframe_1_heightも同様の意味を表す。

Claims (10)

  1. 少なくとも1つの前景画像および透過マスクを含む合成画像を送信する方法であって、
    前記前景画像を符号化するステップと、
    前記透過マスクを画像として符号化するステップと、
    前記符号化された前景画像および前記符号化された透過マスクを、前記符号化された透過マスクが、画素が2値のみを取るように制約されていない予備の透過マスクを生成する復号ステップの後に、各画素が2値のみを取り得るバイナリ透過マスクを生成するクリッピングステップを受けるか否かを示すフラグと共に送信するステップとを含む、
    方法。
  2. クリップ値を、復号されたバイナリ透過マスクのクリッピングにおいて使用するために復号器にシグナリングするステップをさらに含む、
    請求項1に記載の方法。
  3. 前記符号化された前景画像を、前記合成画像における前記前景画像のサイズまたは位置、及び前記合成画像の背景を形成する画素の色を含むグループから選択された少なくとも1つを含む合成情報と共に送信するステップをさらに含む、
    請求項1または2に記載の方法。
  4. 合成画像を復号する方法であって、
    符号化された前景画像および符号化された透過マスクをフラグと共に受信するステップと、
    前記符号化された前景画像を復号するステップと、
    前記フラグによって指示される場合に、
    画素が2値のみを取るように制約されていない予備の透過マスクを生成する復号ステップと、
    画素が2値のみを取るように制約されたバイナリ透過マスクを生成するクリッピングステップと、
    によって、前記符号化された透過マスクを、前記バイナリ透過マスクとして復号するステップと、
    合成画像を形成するに際して、前記前景画像を前記バイナリ透過マスクと関連付けて使用するステップとを含む
    方法。
  5. 前記クリッピングステップは、符号器によって復号器にシグナリングされるクリップ値を利用する、
    請求項に記載の方法。
  6. 前記合成画像は、前記透過マスクに関連する符号化データが、プライマリ符号化ピクチャを形成する前記前景画像に関連する符号化データと同じアクセスユニットにおいてセカンダリピクチャとして送信される、画像のビデオシーケンスの一部を形成する、
    請求項1からのいずれか一項に記載の方法。
  7. 前記前景画像および前記透過マスクは、前記フラグが、H.264/AVC規格またはHEVC規格の構文ヘッダ要素シーケンス・パラメータ・セット(SPS)において表される、前記H.264/AVC規格または前記HEVC規格のビデオ符号化規格に従って符号化される、
    請求項6に記載の方法。
  8. 任意の合成情報が、前記H.264/AVC規格および前記HEVC規格によって指定される付加拡張情報(Supplementary Enhanced Information(SEI))メッセージにおいて編成される、
    請求項7に記載の方法。
  9. フレーム合成を目的として前記SEIメッセージに含まれる前記情報は、前記SEIメッセージが受信される時間にわたってのみ持続することができ、または新しいSEIメッセージが受信されるまで持続することができる、
    請求項8に記載の方法。
  10. 少なくとも1つの前景画像および透過マスクを含む少なくとも1つの合成画像を含むビデオシーケンスの送信および受信において使用するためのシステムであって、
    前記前景画像を符号化し、前記透過マスクを画像として符号化し、前記符号化された前景画像および前記符号化された透過マスクを、前記符号化された透過マスクが、画素が2値のみを取るように制約されていない予備の透過マスクを生成する復号ステップの後に、各画素が2値のみを取り得るバイナリ透過マスクを生成するクリッピングステップを受けるか否かを示すフラグと共に送信するためのビデオ符号器と、
    前記符号化された前景画像および前記符号化された透過マスクをフラグと共に受信し、前記符号化された前景画像を復号し、前記フラグによって指示される場合に、画素が2値のみを取るように制約されていない予備の透過マスクを生成する復号ステップと、画素が2値のみを取るように制約されたバイナリ透過マスクを生成するクリッピングステップとによって、前記符号化された透過マスクを、前記バイナリ透過マスクとして復号し、合成画像を形成するに際して、前記前景画像を前記バイナリ透過マスクと関連付けて使用するするのためのビデオ復号器とを含む、
    システム。
JP2016505885A 2013-04-05 2014-03-31 合成画像の送信および受信 Active JP6401777B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1306209.6 2013-04-05
GB1306209.6A GB2512658B (en) 2013-04-05 2013-04-05 Transmitting and receiving a composite image
PCT/GB2014/051010 WO2014162118A1 (en) 2013-04-05 2014-03-31 Transmitting and receiving a composite image

Publications (3)

Publication Number Publication Date
JP2016519501A JP2016519501A (ja) 2016-06-30
JP2016519501A5 JP2016519501A5 (ja) 2017-05-18
JP6401777B2 true JP6401777B2 (ja) 2018-10-10

Family

ID=48483426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016505885A Active JP6401777B2 (ja) 2013-04-05 2014-03-31 合成画像の送信および受信

Country Status (6)

Country Link
US (1) US20160029030A1 (ja)
EP (1) EP2982114A1 (ja)
JP (1) JP6401777B2 (ja)
KR (1) KR20160003689A (ja)
GB (1) GB2512658B (ja)
WO (1) WO2014162118A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105959724B (zh) * 2016-05-24 2020-08-25 腾讯科技(深圳)有限公司 一种视频数据处理方法以及装置
JP6695826B2 (ja) * 2017-05-19 2020-05-20 ヤフー株式会社 情報表示プログラム、情報表示装置、情報表示方法および配信装置
CN107770618B (zh) * 2017-11-02 2021-03-02 腾讯科技(深圳)有限公司 一种图像处理方法、装置及存储介质
TWI692743B (zh) * 2018-01-08 2020-05-01 國立高雄科技大學 以調色盤壓縮為基礎的彩色影像驗證方法與電腦程式產品
EP4035069A4 (en) * 2019-09-23 2023-10-11 Alibaba Group Holding Limited LOSSLESS ENCODING OF VIDEO DATA
EP3937492A1 (en) * 2020-07-07 2022-01-12 Google LLC Alpha channel post processing in image coding
CN115297312A (zh) * 2022-08-04 2022-11-04 深圳市瑞云科技有限公司 一种传输图像透明度信息的方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08140085A (ja) * 1994-11-04 1996-05-31 Matsushita Electric Ind Co Ltd 多値信号符号化方法および多値信号復号化方法
JP4034380B2 (ja) * 1996-10-31 2008-01-16 株式会社東芝 画像符号化/復号化方法及び装置
US6259738B1 (en) * 1996-10-31 2001-07-10 Kabushiki Kaisha Toshiba Video encoding apparatus and video decoding apparatus
JP3413720B2 (ja) * 1998-06-26 2003-06-09 ソニー株式会社 画像符号化方法及び装置、並びに画像復号方法及び装置
KR100382516B1 (ko) * 1999-01-15 2003-05-01 주식회사 팬택앤큐리텔 물체 단위 영상신호 부호화/복호화 장치 및 방법
CA2388095A1 (en) * 1999-10-22 2001-05-03 Activesky, Inc. An object oriented video system
US6421386B1 (en) * 1999-12-29 2002-07-16 Hyundai Electronics Industries Co., Ltd. Method for coding digital moving video including gray scale shape information
US20020198724A1 (en) * 2001-06-20 2002-12-26 Paul Peterson Methods and apparatus for producing a lenticular novelty item interactively via the internet
DE602004017689D1 (de) * 2003-11-21 2008-12-24 Samsung Electronics Co Ltd Vorrichtung und Methode zur Erzeugung von kodierten Blockanordnungen für ein Alpha-Kanalbild sowie Alpha-Kanalkodierungs und -dekodierungsvorrichtung und -methode.
EP1571850A3 (en) * 2004-03-05 2006-12-13 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding image containing grayscale alpha channel image
US7561620B2 (en) * 2004-08-03 2009-07-14 Microsoft Corporation System and process for compressing and decompressing multiple, layered, video streams employing spatial and temporal encoding
US7852353B1 (en) * 2005-03-31 2010-12-14 Apple Inc. Encoding a transparency (alpha) channel in a video bitstream
JP2007172765A (ja) * 2005-12-22 2007-07-05 Toshiba Corp 情報再生装置及び情報再生装置の状況表示方法
US20070253630A1 (en) * 2006-04-26 2007-11-01 International Business Machines Corporation Method and apparatus for fast and flexible digital image compression using programmable sprite buffer
KR101508599B1 (ko) * 2008-03-18 2015-04-03 삼성전자주식회사 2×2 블록 기반 이진 영상 압축 방법
JP4753397B1 (ja) * 2010-11-30 2011-08-24 株式会社アクセル エンコードシステムおよびデコードシステム
US8437581B2 (en) * 2011-03-04 2013-05-07 General Instrument Corporation Method and system for interpolating fractional video pixels
US20130100248A1 (en) * 2011-05-11 2013-04-25 Shinya Kadono Video transmitting apparatus and video transmitting method
US11496760B2 (en) * 2011-07-22 2022-11-08 Qualcomm Incorporated Slice header prediction for depth maps in three-dimensional video codecs
AU2012232992A1 (en) * 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit

Also Published As

Publication number Publication date
EP2982114A1 (en) 2016-02-10
US20160029030A1 (en) 2016-01-28
GB201306209D0 (en) 2013-05-22
JP2016519501A (ja) 2016-06-30
GB2512658A (en) 2014-10-08
WO2014162118A1 (en) 2014-10-09
GB2512658B (en) 2020-04-01
KR20160003689A (ko) 2016-01-11

Similar Documents

Publication Publication Date Title
JP6401777B2 (ja) 合成画像の送信および受信
US20230269396A1 (en) Adaptive switching of color spaces, color sampling rates and/or bit depths
KR102377426B1 (ko) 소스 색 볼륨 정보 메시징
AU2014388185B2 (en) Adjusting quantization/scaling and inverse quantization/scaling when switching color spaces
JP6530854B2 (ja) Hdrおよび広色域の信号のための信号整形および符号化
US20160316215A1 (en) Scalable video coding system with parameter signaling
CN112511832A (zh) 视频解码方法、装置和可读存储介质
US20240098320A1 (en) Custom data indicating nominal range of samples of media content
JP2008545351A (ja) 画像系列及びロゴを含むビデオコンテンツを符号化する方法及び装置
CN109479150B (zh) 用于显示器调适的色彩重映射信息sei消息发信号
US20160073124A1 (en) Transmitting and receiving a composite image
CN113454998A (zh) 视频编码中的跨分量量化
GB2512657A (en) Transmitting and receiving a composite image
CN113545060A (zh) 视频编码中的空瓦片编码
Naccari et al. Binary alpha channel compression for coding of supplementary video streams
GB2539760A (en) HDR compression method and application to viewers

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170330

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180123

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180417

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180907

R150 Certificate of patent or registration of utility model

Ref document number: 6401777

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250