JP2017536027A - 符号化されたビデオデータ処理方法及びその装置、符号化されたビデオデータ生成方法及びその装置 - Google Patents

符号化されたビデオデータ処理方法及びその装置、符号化されたビデオデータ生成方法及びその装置 Download PDF

Info

Publication number
JP2017536027A
JP2017536027A JP2017520400A JP2017520400A JP2017536027A JP 2017536027 A JP2017536027 A JP 2017536027A JP 2017520400 A JP2017520400 A JP 2017520400A JP 2017520400 A JP2017520400 A JP 2017520400A JP 2017536027 A JP2017536027 A JP 2017536027A
Authority
JP
Japan
Prior art keywords
picture
metadata information
random access
video data
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017520400A
Other languages
English (en)
Other versions
JP6776229B2 (ja
Inventor
リ,タミー
ハン,スン−フン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2017536027A publication Critical patent/JP2017536027A/ja
Application granted granted Critical
Publication of JP6776229B2 publication Critical patent/JP6776229B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23614Multiplexing of additional data and video streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ランダムアクセスのための符号化されたビデオデータ処理方法及びその装置、並びにランダムアクセスのための符号化されたビデオデータ生成方法及びその装置を開示する。

Description

本発明は、符号化されたビデオデータ処理方法及びその装置、並びに符号化されたビデオデータ生成方法及びその装置に係わる。
高解像度または高画質のビデオコンテンツを再生、保存することができるハードウェアの開発及び普及によって、高解像度または高画質のビデオコンテンツを効果的に符号化したり復号するビデオコーデックの必要性が増大している。既存のビデオコーデックによれば、ビデオは、ツリー構造の符号化単位に基づいて、制限された符号化方式によって符号化されている。
周波数変換を利用して、空間領域の映像データは、周波数領域の係数に変換される。該ビデオコーデックは、周波数変換の迅速な演算のために、映像を所定サイズのブロックに分割し、ブロックごとにDCT(discrete cosine transformation)変換を行い、ブロック単位の周波数係数を符号化する。カラー映像間の重複性除去のために、既存の圧縮システムは、ブロック基盤の予測を行う。既存の圧縮システムは、ビデオ符号化及びビデオ復号に使用されるパラメータをピクチャ単位で生成する。
ランダムアクセス(random access)のための符号化されたビデオデータ処理方法及びその装置、並びにランダムアクセスのための符号化されたビデオデータ生成方法及びその装置を提供する。本実施形態がなす技術的課題は、前述のような技術的課題に限定されるものではなく、以下の実施形態から、他の技術的課題が類推される。
第1側面による符号化されたビデオデータ処理方法は、符号化されたビデオデータのビットストリームを獲得する段階、前記ビットストリーム内のランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を獲得する段階、及び前記ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち復号されたビデオデータに対して、前記メタデータ情報に基づいて、ビデオ処理を行う段階を含んでもよい。
また、前記メタデータ情報を獲得する段階は、前記ビットストリームの所定位置において、メタデータ情報に係わる識別情報を獲得する段階、及びメタデータ情報のデータベースから、前記獲得したメタデータ情報に係わる識別情報とマッチングする前記メタデータ情報を獲得する段階を含んでもよい。
また、前記ビットストリームを獲得するチャネルと別個のチャネルを介して、前記メタデータ情報のデータベースを獲得する段階をさらに含んでもよい。
また、前記メタデータ情報を獲得する段階は、前記ビットストリームにおいて、前記ランダムアクセスポイントピクチャの位置と、前記ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カット(scene cut)の位置とに基づいて、前記メタデータ情報を獲得することができる。
また、前記メタデータ情報を獲得する段階は、前記ランダムアクセスポイントピクチャが、復号可能なリーディングピクチャと同じ場面に属する場合、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に基づいて、前記ランダムアクセスポイントピクチャ、及び前記復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を獲得することができる。
また、前記メタデータ情報を獲得する段階は、前記ランダムアクセスポイントピクチャが、復号可能なリーディングピクチャと異なる場面に属する場合、前記ランダムアクセスポイントピクチャの位置と、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置とに基づいて、前記ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報、及び前記復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を獲得することができる。
また、前記場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で最初ピクチャの位置に該当する。
第2側面による符号化されたビデオデータ生成方法は、ビデオデータを符号化する段階、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を生成する段階、及び前記メタデータ情報、または前記メタデータ情報に係わる識別情報を含む、符号化されたビデオデータのビットストリームを生成する段階を含んでもよい。
また、前記ビットストリームを生成する段階は、前記ビットストリームの所定位置に、前記メタデータ情報に係わる識別情報を含め、前記ビットストリームを生成することができる。
また、前記メタデータ情報に係わる識別情報を含んだビットストリームと、前記生成されたメタデータ情報を含むメタデータ情報のデータベースとを別個のチャネルを介してそれぞれ伝送する段階をさらに含んでもよい。
また、前記ビットストリームを生成する段階は、前記ランダムアクセスポイントピクチャの位置と、前記ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とに前記メタデータ情報を挿入し、前記ビットストリームを生成することができる。
また、前記ビットストリームを生成する段階は、前記ランダムアクセスポイントピクチャが、復号可能なリーディングピクチャと同じ場面に属する場合、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に、前記ランダムアクセスポイントピクチャ、及び前記復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を挿入し、前記ビットストリームを生成することができる。
また、前記ビットストリームを生成する段階は、前記ランダムアクセスポイントピクチャが、復号可能なリーディングピクチャと異なる場面に属する場合、前記ランダムアクセスポイントピクチャの位置に、前記ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を挿入し、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に、前記復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を挿入し、前記ビットストリームを生成することができる。
また、前記場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で最初ピクチャの位置に該当する。
第3側面によって、前記符号化されたビデオデータ処理方法、または前記符号化されたビデオデータ生成方法をコンピュータで実行させるためのプログラムが記録されたコンピュータで読取り可能な記録媒体が提供される。
第4側面によるビデオデータ処理装置は、符号化されたビデオデータのビットストリームを獲得するビットストリーム獲得部、前記ビットストリームを復号するビデオ復号部、及び前記ビットストリーム内のランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を獲得し、前記ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち復号されたビデオデータに対して、前記メタデータ情報に基づいて、ビデオ処理を行うビデオ処理プロセッサを含んでもよい。
また、前記ビデオ処理プロセッサは、前記ビットストリームの所定位置において、メタデータ情報に係わる識別情報を獲得し、メタデータ情報のデータベースから、前記獲得したメタデータ情報に係わる識別情報とマッチングする前記メタデータ情報を獲得することができる。
また、前記ビデオ処理プロセッサは、前記ビットストリームにおいて、前記ランダムアクセスポイントピクチャの位置と、前記ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とに基づいて、前記メタデータ情報を獲得することができる。
第5側面によるビデオデータ生成装置は、ビデオデータを符号化し、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を生成するビデオ符号化部、及び前記メタデータ情報、または前記メタデータ情報に係わる識別情報を含む、符号化されたビデオデータのビットストリームを生成を生成するビットストリーム生成部を含んでもよい。
また、前記ビットストリーム生成部は、前記ランダムアクセスポイントピクチャの位置と、前記ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とに前記メタデータ情報を挿入し、前記ビットストリームを生成することができる。
本発明によれば、ランダムアクセスが生じる状況において、ビデオビットストリームの適する処理が可能である。
ビデオデータ処理システムについて説明するための図面である。 ビデオデータについて説明するための図面である。 符号化されたビデオデータについて説明するための図面である。 一実施形態によるビデオデータ生成装置の構成について説明するためのブロック図である。 一実施形態によるビデオデータ処理装置の構成について説明するためのブロック図である。 一実施形態によるメタデータ情報に係わる識別情報を利用した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。 メタデータ情報に係わる識別情報を伝送するメッセージのフォーマットを示した図面である。 メタデータ情報に係わる識別情報を伝送するメッセージのフォーマットを示した図面である。 一実施形態による、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。 他の実施形態による、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。 さらに他の実施形態による、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。 一実施形態による、符号化されたビデオデータ生成方法に係わるフローチャートである。 一実施形態による、符号化されたビデオデータ処理方法に係わるフローチャートである。
第1側面による符号化されたビデオデータ処理方法は、符号化されたビデオデータのビットストリームを獲得する段階、前記ビットストリーム内のランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を獲得する段階、及び前記ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち復号されたビデオデータに対して、前記メタデータ情報に基づいて、ビデオ処理を行う段階を含んでもよい。
以下、添付された図面を参照しながら、ただ例示のための実施形態によって、発明について詳細に説明する。下記実施形態、は発明を具体化するためのものであり、発明の権利範囲を制限したり限定したりするものではないということは、言うまでもない。詳細な説明及び実施形態から、発明が属する技術分野の当業者が容易に類推することができることは、発明の権利範囲に属すると解釈される。
本明細書で使用される「構成される」または「含む」というような用語は、明細書上に記載されたさまざまな構成要素、またはさまざまな段階を必ずしもいずれも含むものであると解釈されるものではなく、そのうち一部の構成要素、または一部の段階は、含まれないこともあり、またはさらなる構成要素または段階をさらに含んでもよいとに解釈されなければならない。
また、本明細書で使用される「第1」または「第2」というように序数を含む用語は、多様な構成要素についての説明に使用することができるが、前記構成要素は、前記用語によって限定されるものではない。前記用語は、1つの構成要素を他の構成要素から区別する目的のみに使用される。
本実施形態は、符号化されたビデオデータ処理方法及びその装置、並びに符号化されたビデオデータ生成方法及びその装置に係わるものであり、以下の実施形態が属する技術分野において当業者に周知である事項については、詳細な説明を省略する。
図1は、ビデオデータ処理システム10について説明するための図面である。図1を参照すれば、ビデオデータ処理システム10は、ビデオデータ生成装置100とビデオデータ処理装置200とを含んでもよい。
ビデオデータ生成装置100は、ビデオ符号化装置にもなる。ビデオデータ生成装置100は、入力された映像、すなわち、ビデオデータを符号化し、符号化されたビデオデータを生成することができる。
ビデオデータ処理装置200は、ビデオ復号装置にもなる。ビデオデータ処理装置200は、符号化されたビデオデータを復号し、復号されたビデオデータを生成することができる。
ビデオデータ生成装置100は、符号化されたビデオデータのビットストリーム(以下、ビデオビットストリーム)をビデオデータ処理装置200に伝送し、ビデオデータ処理装置200は、ビデオビットストリームを受信することができる。
図2Aは、ビデオデータについて説明するための図面である。
該ビデオデータは、ビデオフレーム、言い換えれば、ピクチャの連続である。ビデオデータは、ビデオシーケンス(video sequence)とも呼ばれる。
ピクチャのグループ(GOP:group of pictures)は、ディスプレイ順序(display order)によって羅列されたピクチャのうち少なくとも1つのピクチャの連続を意味する。
該ピクチャは、ビデオブロック、言い換えれば、LCUs(largest coding units)またはCTUs(coding treeblock units)の連続である。該ビデオブロックは、輝度(luminance)コンポーネントと彩度(chroma)コンポーネントとを有することができる。
該ビデオ符号化装置は、1つのピクチャを複数個のスライスに分けることができる。このとき、スライスは、Iスライス、PスライスまたはBスライスにもなる。該Iスライスは、イントラ予測モード(intra prediction mode)を利用して予測されたものであり、Pスライスは、インタ予測モード(inter prediction mode)を利用して予測されたものであり、Bスライスは、双方向インタ予測モード(bi-directional inter prediction mode)を利用して予測されたものを意味する。
図2Aを参照すれば、ビデオデータは、第1ピクチャから第8ピクチャまで複数個のピクチャを含んでいる。該ビデオデータに含まれたピクチャは、ディスプレイ順序による連続的なピクチャでもある。第1ピクチャから第4ピクチャまで、第1 GOPであり、第5ピクチャから第8ピクチャまで、第2 GOPである。
任意のピクチャは、複数個のスライスに分けられ、そのスライスは、複数個のビデオブロックを含んでもよい。図2Aを参照すれば、第3ピクチャは、第1スライスと第2スライスとに区分され、それぞれのスライスは、複数個のビデオブロック、すなわち、LCUを含んでもよい。
ビデオ符号化時に、ビデオデータ、GOP、ピクチャ、スライス、CU(coding unit)それぞれは、ビデオ符号化属性を示すシンタックスデータ(syntax data)と係わる。ビデオ復号装置は、ビデオデータを復号するために、かようなシンタックスデータを利用することができる。該シンタックスデータは、シンタックスエレメント(syntax elements)を含むシンタックス構造(syntax structure)であり、パラメータ集合であると見ることができる。例えば、HEVC(high efficiency video coding)においては、VPS(video parameter set)、SPS(sequence parameter set)、PPS(picture parameter set)、APS(adaptive parameter set)などのパラメータ集合を定義している。
図2Bは、符号化されたビデオデータについて説明するための図面である。
符号化されたビデオデータは、復号順序(decoding order)または符号化順序(coding order)によるピクチャの連続である。符号化されたビデオデータは、符号化されたビデオシーケンス(coded video sequence)だも呼ばれる。
図2Bを参照すれば、符号化されたビデオデータ(coded video data)は、第1ピクチャから第8ピクチャまで、複数個のピクチャを含んでいる。符号化されたビデオデータに含まれたピクチャは、復号順序による連続的なピクチャでもある。すなわち、符号化されたビデオデータは、ディスプレイ順序ではない復号順序によるピクチャの連続であるので、図2Bに図示されているように、第5ピクチャと第6ピクチャとの順序が、図2Aのビデオデータでの第5ピクチャと第6ピクチャとの順序と異なってもよい。言い替えれば、第6ピクチャは、第5ピクチャより先に復号される。
図2Bを参照すれば、任意の1つのピクチャは、1つのアクセスユニット(access unit)に対応する。該アクセスユニットは、複数個のNAL(network abstraction layer)ユニットを含んでもよく、1つの符号化されたピクチャを含んでもよい。NALユニットは、VCL NALユニットと、non−VCL NALユニットとに区分される。該VCL NALユニットには、ビデオデータの1つのピクチャを構成するスライスに係わるデータが含まれてもよい。該non−VCLユニットには、スライスに係わるデータ以外の情報、例えば、パラメータ集合に係わるデータが含まれてもよい。
図2Bを参照すれば、第3ピクチャは、ヘッダ(header)とNALユニットとの連続からなるということが分かる。従って、符号化されたビデオデータのビットストリーム、すなわち、該ビデオビットストリームは、復号順序による複数個のアクセスユニットの連続であると見ることができ、さらに詳細には、複数個のNALユニットの連続であると見ることができる。
一方、本発明の一実施形態によるビデオデータ生成装置100は、ビデオビットストリームにメタデータ情報を含めることができる。本発明の一実施形態によるビデオデータ処理装置200は、該ビデオビットストリームからメタデータ情報を獲得し、復号されたビデオデータに対して、ディスプレイのためのビデオ処理を行うことができる。該メタデータ情報は、ビデオ処理に利用される情報であり、映像品質を高め、オリジナル映像に符合させるために、復号されたビデオデータにも適用されるデータを意味する。例えば、該メタデータ情報は、場面係わる情報であり、場面カット(scene cut)、場面分類(scene classification)、コンテンツの色空間(color space of contents)、色ボリューム(color volume)などに係わる情報にもなる。
一方、該メタデータ情報は、それぞれの識別情報を有することができる。同じ識別情報を有するメタデータ情報が伝送される場合、最近伝送されたメタデータ情報が、以前に伝送されたメタデータ情報を部分的に更新したり全体的に代替したりすることができる。また、該メタデータ情報は、以前に伝送されたメタデータ情報を取り消す情報を含んでもよい。該メタデータ情報は、当該メタデータ情報をどのくらい持続させて適用するかということに係わる情報を含んでもよい。該メタデータ情報は、当該メタデータをビデオ処理に利用するとき、適用することができる所定値や条件などを含む少なくとも1つのパラメータを含んでもよい。
該メタデータ情報は、SEI(supplemental enhancement information)メッセージまたはSEI NALユニットに含まれ、ビデオビットストリームに挿入される。該メタデータ情報は、各場面の開始部分に挿入され、その場面に含まれた複数個のピクチャに対応するビデオ処理時に適用される。このとき、ある場面の開始部分ではない部分にランダムアクセスが発生すれば、その場面に係わるメタデータ情報がなく、映像の品質が低下する。
ランダムアクセスが発生しても、各場面に係わるメタデータ情報の損失がないようにするために、ビデオビットストリームに含まれた全てのピクチャの位置に、各ピクチャが属した場面のメタデータ情報を含めることができる。しかし、かような方式は、ビットレートにおいて、オーバーヘッドが発生してしまう。他の方式は、受信したビデオビットストリームを始めから最後まで分析し、ビデオビットストリームに含まれた各ピクチャのメタデータ情報を把握してメモリに保存しておき、ビデオ処理時に活用する方式である。しかし、かような方式は、リアルタイムストリーミングには適用し難く、ビデオビットストリームの受信がすでに完了した場合にのみ適用することができる。
以下、ランダムアクセスが発生する状況を考慮し、メタデータ情報を含むビデオビットストリームの生成及び処理について説明する。
図3Aは、一実施形態によるビデオデータ生成装置100の構成について説明するためのブロック図である。ビデオデータ生成装置100には、図3Aに図示された構成以外にも、他の汎用的なハードウェア構成が含まれてもよいという点は、当該技術分野の当業者であるならば、理解することができるであろう。
図3Aを参照すれば、ビデオデータ生成装置100は、ビデオ符号化部110とビットストリーム生成部130とを含んでもよい。
ビデオ符号化部110は、ビデオデータを符号化することができる。ビデオ符号化部110は、ビデオデータ生成装置100に入力されたビデオを、符号化順序(coding order)による符号化されたビデオデータに生成することができる。
ビデオ符号化部110は、符号化されたビデオデータが、ビデオデータ処理装置200で復号された後でビデオ処理されるとき、復号されたビデオデータに適用されるメタデータ情報を生成することができる。かようなメタデータ情報は、符号化されたビデオデータに対して、ランダムアクセスが発生する場合にも、ランダムアクセスが発生した地点後、復号順序を有するピクチャが復号された後、ビデオ処理が行われるように準備される。このとき、ランダムアクセスは、符号化されたビデオデータに対して、順次に復号してディスプレイせず、復号及びディスプレーする地点をジャンプしたり、ビデオを付け合せ(splicing)たりする場合などを意味する。
言い替えれば、ビデオ符号化部110は、各場面の開始部分に挿入され、ビデオ処理に利用されるメタデータ情報を生成したり、ランダムアクセスポイントピクチャ(random access point picture)後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を生成したりすることができる。
該ランダムアクセスポイントピクチャは、ランダムアクセスが起きた地点のピクチャを意味する。ランダムアクセスが可能なランダムアクセスポイントにもなるIRAP(intra random access point)ピクチャは、ランダムアクセス時、ビデオビットストリームにおいて復号順序上最初のピクチャであり、Iスライスのみを含んでもよい。IRAPピクチャは、CRA(clean random access)ピクチャ、BLA(broken link access)ピクチャ、またはIDR(instantaneous decoding refresh)ピクチャでもある。
CRAピクチャは、ピクチャのグループ(GOP)が開かれた(open)構造を有するとき、ランダムアクセスポイントにもなるピクチャである。CRAピクチャも、IRAPピクチャであるので、Iスライスのみを含み、ビデオビットストリームにおいて、復号順序上最初のピクチャにもなり、ビデオビットストリーム中間になってもよい。ビデオビットストリームが中間で断絶(cut)されたり、損失されたり、またはピクチャのスプライシングが発生したりし、CRAピクチャにおいてランダムアクセスが発生すれば、復号順序がCRAピクチャに先行する先行ピクチャは可用ではなくなる(unavailable)。リーディングピクチャの参照ピクチャにもなる先行ピクチャが可用ではなくなれば、可用ではないピクチャを参照するリーディングピクチャは、正常に復号されない。
BLAピクチャは、符号化されたピクチャがスプライシングされたり、ビデオビットストリームが中間で断絶されたりするとき、ランダムアクセスポイントとして、ビデオビットストリーム中間に存在するピクチャを意味する。BLAピクチャは、CRAピクチャと類似した機能及び性質を有する。ただし、ランダムアクセスが発生したとき、BLAピクチャは、新たなシーケンスの始まりと見なされるために、CRAピクチャと異なり、BLAピクチャがデコーダに受信されるとき、映像に係わるパラメータ情報が再びいずれも受信される。BLAピクチャは、ビデオ符号化装置100からも決まり、ビデオ符号化装置100から、ビデオビットストリームを受信した外部装置において、CRAピクチャをBLAピクチャに変更することもできる。例えば、ビデオビットストリームがスプライシングされる場合、ビデオビットストリームを受信した外部装置は、CRAピクチャをBLAピクチャに変更して映像を復号するビデオ復号装置200に提供し、このとき、映像に係わるパラメータ情報も、外部装置からビデオ復号装置200に新たに提供される。
一方、ビデオ符号化部110は、ビデオデータ処理装置200において、ランダムアクセスが発生しても、ビデオ処理に利用される各場面のメタデータ情報が損失されないように、ビデオビットストリームの各場面に属する全てのピクチャ位置に含めるためのメタデータ情報に係わる識別情報を生成することもできる。
ビットストリーム生成部130は、メタデータ情報を含む、符号化されたビデオデータのビットストリームを生成することができる。ビットストリーム生成部130は、メタデータ情報を各場面の開始部分に挿入したり、ランダムアクセスが起こるランダムアクセスポイントピクチャ、及び周辺ピクチャを考慮し、メタデータ情報を適切なところに挿入したりすることにより、メタデータ情報を含むビデオビットストリームを生成することができる。ランダムアクセスが起こる場合、飛ばした一部ピクチャとメタデータ情報とは復号されないために、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャに対して、復号後にビデオ処理を行うように、ビデオビットストリームに、メタデータ情報が挿入される位置が重要である。
ビットストリーム生成部130は、ランダムアクセスポイントピクチャの位置と、ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とにメタデータ情報を挿入し、ビットストリームを生成することができる。このとき、該場面カットは、複数個のピクチャからなるある場面が、複数個のピクチャからなる他の場面に転換される部分を意味する。該ランダムアクセスポイントピクチャの位置が、任意の場面に対する場面カットの位置に該当すれば、ビットストリーム生成部130は、場面カットに対応する場面に係わるメタデータ情報でもって、ランダムアクセスポイントピクチャの位置に挿入するメタデータ情報の代わりをすることができる。同一メタデータ情報を重複して挿入しないようにするためである。
場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で最初ピクチャの位置に該当する。任意の場面に係わるメタデータ情報は、その任意の場面以前の場面に対応する場面カット位置に挿入することができる。それは、メタデータの復号に必要となる時間を考慮し、実際メタデータが適用される場面より以前の場面に対応する場面カット位置に挿入することにより、メタデータの復号によるディレイを最小化したりなくしたりするためである。
一方、ビデオビットストリームにおいて、ランダムアクセスポイントピクチャの位置によって、ランダムアクセスポイントピクチャよりディスプレイ順序では先行するが、復号順序では後になるリーディングピクチャ(leading picture)もある。該リーディングピクチャは、正常に復号可能なリーディングピクチャ(decodable leading picture)と、復号不可能なリーディングピクチャとに分けることができる。ランダムアクセスポイントピクチャの位置によって、復号可能なリーディングピクチャが存在しなかったり、ランダムアクセスポイントピクチャと同じであるか、あるいは異なる場面に属する少なくとも1つの復号可能なリーディングピクチャが存在したりする。
ビットストリーム生成部130は、ランダムアクセスポイントピクチャに対して、リーディングピクチャが存在せず、ランダムアクセスポイントピクチャ位置が、場面カットの位置ではなければ、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャ位置に挿入し、ビットストリームを生成することができる。
ビットストリーム生成部130は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャがいずれもランダムアクセスポイントピクチャと異なる場面に属すれば、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャ位置に挿入し、復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に挿入し、ビットストリームを生成することができる。
ビットストリーム生成部130は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャがいずれもランダムアクセスポイントピクチャと同じ場面に属すれば、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に、複数個の復号可能なリーディングピクチャが含まれた場面に係わるメタデータ情報を挿入し、ビットストリームを生成することができる。ただし、復号可能なリーディングピクチャにもかかわらず、復号されないか、あるいはビデオビットストリームから除去される場合がある場合に備え、復号可能なリーディングピクチャが、ランダムアクセスポイントピクチャと同じ場面に属するとき、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置と、ランダムアクセスポイントピクチャの位置とのいずれにもメタデータ情報を挿入し、ビットストリームを生成することもできる。また、復号可能なリーディングピクチャが除去される場合、そのピクチャの位置に含まれていたメタデータ情報を、同じ場面に属したランダムアクセスポイントピクチャの位置に移すこともできる。ビデオ復号過程またはビデオ出力過程において、復号不可能なリーディングピクチャ及び/または復号可能なリーディングピクチャが除去される場合があるからである。
一方、ビットストリーム生成部130は、メタデータ情報に係わる識別情報を含む、符号化されたビデオデータのビットストリームを生成することもできる。ビデオ符号化部110において、メタデータ情報に係わる識別情報を生成した場合、メタデータの代わりに、メタデータ情報に係わる識別情報が含まれるように、ビデオビットストリームを生成することができる。メタデータ情報を直接含めるより、ファイルサイズを小さくし、オーバーヘッドが発生しないように、メタデータに係わる識別情報をビデオビットストリームの所定位置に含めるのである。ただし、ビットストリーム生成部130がメタデータ情報に係わる識別情報を含むビデオビットストリームを生成する場合、当該メタデータを除いた当該メタデータをビデオ処理に利用するとき、適用することができる所定値や条件などを含むパラメータを含めてもよい。
メタデータ情報を含むメタデータ情報のデータベースは、メタデータ情報に係わる識別情報が含まれたビデオビットストリームと独立した別個のチャネルを介して、ビデオデータ生成装置100からビデオデータ処理装置200に伝送される。該メタデータ情報のデータベースは、ビデオデータ処理装置200の所定保存空間に保存された少なくとも1つのメタデータ情報を意味する。該メタデータ情報のデータベースは、1回または複数回にわたって、ビデオデータ生成装置100からビデオデータ処理装置200に伝送され、ビデオデータ処理装置200に保存される。ビデオデータ処理装置200は、メタデータ情報に係わる識別情報を利用して、ビデオデータ処理に使用されるメタデータ情報を、メタデータ情報のデータベースから探し出すことができる。該メタデータ情報のデータベースは、ビデオデータ生成装置100からビデオビットストリームが伝送される以前に、ビデオデータ処理装置200に伝送されるか、あるいは別個のチャネルを介して共に伝送される。
図3Bは、一実施形態によるビデオデータ処理装置200の構成について説明するためのブロック図である。ビデオデータ処理装置200には、図3Bに図示された構成以外にも、他の汎用的なハードウェア構成が含まれてもよいという点は、当該技術分野の当業者であるならば、理解することができるであろう。
ビデオデータ処理装置200は、ビットストリーム獲得部210、ビデオ復号部230及びビデオ処理プロセッサ250を含んでもよい。
ビットストリーム獲得部210は、ビデオビットストリームを獲得することができる。ビットストリーム獲得部210は、ビデオデータ処理装置200に受信されたビデオビットストリームを獲得し、ビデオ復号部230に伝達することができる。
ビデオ復号部230は、ビデオビットストリームを復号することができる。ビデオ復号部230は、符号化されたビデオデータが復号された後、ビデオ処理されるとき、復号されたビデオデータに利用されるメタデータ情報を、ビデオビットストリームから抽出することができる。かようなメタデータ情報は、符号化されたビデオデータに対して、ランダムアクセスが発生する場合、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャが復号された後、ビデオ処理が行われるように、ランダムアクセスポイントピクチャ以後の復号されたビデオデータから抽出することができる。
ビデオ処理プロセッサ250は、ビデオビットストリームにおいて、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を獲得することができる。
ビデオ処理プロセッサ250は、ビデオビットストリームにおいて、ランダムアクセスポイントピクチャの位置と、ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カット(scene cut)の位置とに基づいて、メタデータ情報を獲得することができる。このとき、ランダムアクセスポイントピクチャの位置が、任意の場面に対する場面カットの位置に該当すれば、ビデオ処理プロセッサ250は、場面カットに対応する場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャの位置から獲得するメタデータ情報として使用することができる。
該場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で最初ピクチャの位置に該当する。任意の場面に係わるメタデータ情報は、任意の場面以前の場面に対応する場面カット位置で獲得することができる。それは、メタデータの復号によるディレイを最小化するか、あるいはなくするために、メタデータの復号に必要となる時間を考慮し、実際メタデータが適用される場面より以前の場面に対応する場面カット位置にメタデータが挿入された場合である。
一方、ランダムアクセスポイントピクチャの位置によって、復号可能なリーディングピクチャが存在しないか、あるいはランダムアクセスポイントピクチャと同じであるか、あるいは異なる場面に属する少なくとも1つの復号可能なリーディングピクチャが存在することができる。
ビデオ処理プロセッサ250は、ランダムアクセスポイントピクチャに対して、リーディングピクチャが存在せず、ランダムアクセスポイントピクチャ位置が、場面カットの位置ではなければ、ランダムアクセスポイントピクチャ位置に基づき、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を獲得することができる。
ビデオ処理プロセッサ250は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャがいずれもランダムアクセスポイントピクチャと異なる場面に属すれば、ランダムアクセスポイントピクチャ位置に基づき、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を獲得し、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に基づき、復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を獲得することができる。ビデオ処理プロセッサ250は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャがいずれもランダムアクセスポイントピクチャと同じ場面に属すれば、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に基づき、複数個の復号可能なリーディングピクチャが含まれた場面に係わるメタデータ情報を獲得することができる。ただし、復号可能なリーディングピクチャにもかかわらず、復号されないか、あるいはビデオビットストリームから除去される場合がある場合に備え、復号可能なリーディングピクチャがランダムアクセスポイントピクチャと同じ場面に属するとき、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置と、ランダムアクセスポイントピクチャの位置とのいずれにもメタデータ情報が含まれてもよいので、2つの位置いずれにも基づき、メタデータ情報を獲得することができる。また、復号可能なリーディングピクチャが除去される場合、そのピクチャの位置に含まれていたメタデータ情報が同じ場面に属したランダムアクセスポイントピクチャの位置に移されるので、そのときは、ランダムアクセスポイントピクチャの位置に基づき、メタデータ情報を獲得することができる。
ビデオ処理プロセッサ250は、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち復号されたビデオデータに対して、獲得したメタデータ情報に基づいて、ビデオ処理を行うことができる。
一方、ビデオ処理プロセッサ250は、ビデオデータ生成装置100において、ビデオビットストリームの所定位置にメタデータ情報に係わる識別情報を含め、ビデオビットストリームを伝送した場合、メタデータ情報に係わる識別情報として、メタデータ情報のデータベースからメタデータ情報を獲得することもできる。例えば、メタデータ情報に係わる識別情報は、ビデオビットストリームの各場面に属する全てのピクチャ位置に含まれてもよい。メタデータ情報に係わる識別情報とマッチングするメタデータ情報を、メタデータ情報のデータベースから獲得することができる。メタデータ情報のデータベースは、ビデオビットストリームが受信されるチャネルと別個のチャネルでビデオデータ生成装置100から受信され、ビデオビットストリームより事前に受信されたものでもある。
以下、符号化されたビデオデータのビットストリーム生成する過程と、符号化されたビデオデータのビットストリーム処理する過程とについて具体的な例を挙げて説明する。図4、並びに図5A及び図5Bでは、ランダムアクセスに備え、メタデータ情報に係わる識別情報を利用するビデオビットストリームについて詳細に説明し、図6Aないし図6Cでは、ランダムアクセスに備え、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮するビデオビットストリームについて詳細に説明する。
図4は、一実施形態による、メタデータ情報に係わる識別情報を利用した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。
図4を参照すれば、ビデオデータ生成装置100は、ビデオデータ処理装置200にビデオビットストリームを伝送することができる。ビデオビットストリームは、ビデオデータ処理装置200でランダムアクセスが発生しても、ビデオ処理に利用される各場面のメタデータ情報が損失されないように、ビデオビットストリームの各場面に属する全てのピクチャ位置に、メタデータ情報に係わる識別情報を含んでもよい。メタデータ情報に係わる識別情報は、メタデータ情報のID(identification)、メタデータ情報の位置情報などにもなる。各場面に属する全てのピクチャ位置に、メタデータ情報を直接含めるよりファイルサイズを小さくし、オーバーヘッドが発生しないように、メタデータに係わる識別情報を含めたのである。メタデータ情報に係わる識別情報は、メタデータ情報のデータベースにおいてメタデータ情報を問い合わせ、メタデータ情報を獲得するのに利用される。
一方、各場面に属する全てのピクチャに、メタデータ情報に係わる識別情報を含めてもよいが、さらにファイルサイズを小さくするために、メタデータ情報に係わる識別情報の伝送頻度をさらに低めることもできる。例えば、同じ場面に属したピクチャに対して、所定数のピクチャごとに、メタデータ情報に係わる識別情報を伝送することもできる。
該メタデータ情報は、メタデータ情報に係わる識別情報が含まれたビデオビットストリームと独立したビデオデータ生成装置100から、ビデオデータ処理装置200に伝送される。全てのメタデータ情報を有するデータベースの一部または全部が、ビデオデータ生成装置100からビデオデータ処理装置200に伝送される。該メタデータ情報は、ビデオビットストリームが伝送されるチャネルと別個のチャネルで伝送され、ビデオビットストリームより事前に送られる。例えば、SPS(sequence parameter set)またはPPS(picture parameter set)のようなシンタックスデータ(syntax data)が伝送される安全なチャネルを介して、メタデータ情報が伝送される。一部または全てのメタデータ情報は、長ターム(long term)を有して周期的に伝送される。メタデータ情報に係わる識別情報の伝送頻度は、メタデータ情報を問い合わせることができるメタデータ情報のデータベースの伝送頻度より高い。
図5A及び図5Bは、メタデータ情報に係わる識別情報を伝送するメッセージのフォーマットを示した図面である。
図5Aのメッセージフォーマットは、メタデータ情報に係わる識別情報と、メタデータ情報とをいずれも含む形態であり、メッセージフォーマット内の条件文によって、メタデータ情報が含まれるか否かということが決定される。図5Aにおいて、「meta_data_info_present_flag」値が「true」であるならば、メタデータ情報を含んで伝送することができ、「meta_data_info_present_flag」値が「false」であるならば、メタデータ情報に係わる識別情報だけ含まて伝送することができる。従って、各ピクチャごとに、メタデータ情報に係わる識別情報を含めて伝送させるときは、「meta_data_info_present_flag」値を「false」に設定して伝送することができる。
図5Bのメッセージフォーマットは、図5Aのように、条件文によって伝送するデータ種類を区分せず、メタデータ情報と、メタデータ情報に係わる識別情報とをそれぞれ伝送するために、別途のメッセージフォーマットに作ったものである。図5Bにおいて、「meta_data_info」メッセージフォーマットが、メタデータ情報を伝送することができる形態であり、「meta_data_pointer」メッセージフォーマットが、メタデータ情報に係わる識別情報を伝送することができる形態である。従って、各ピクチャごとに、メタデータ情報に係わる識別情報を含めて伝送させるときは、「meta_data_pointer」メッセージフォーマットで伝送することができる。
図6Aは、一実施形態による、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。
図6Aを参照すれば、ディスプレイ順序と復号順序とが異なる、ビデオデータの一部分を確認することができる。ディスプレイ順序または出力順序(output order)を見れば、第26ピクチャから第32ピクチャに該当し、第26ピクチャから順次にディスプレイされるピクチャの連続であると見ることができる。一方、復号順序(decoding order)を見れば、ディスプレイ順序上で、第27ピクチャに該当するピクチャが、最も早い復号順序24に該当し、ディスプレイ順序上で、第32ピクチャに該当するピクチャが、最も遅い復号順序34に該当するということが分かる。
図6Aに図示されているように、ランダムアクセスが、ディスプレイ順序上で、第31ピクチャに該当するピクチャに発生すると仮定する場合、ランダムアクセスポイントピクチャは、ディスプレイ順序上で、第31ピクチャに該当するピクチャになる。ディスプレイ順序上で、第31ピクチャに該当するピクチャの復号順序は、28であるために、復号順序が28以後のピクチャだけ復号される。従って、ディスプレイ順序上で、第26ピクチャと第27ピクチャは、復号順序がそれぞれ27及び24であるために、復号されることがない。
図6Aを参照すれば、ディスプレイ順序上で、第28ピクチャ、第29ピクチャ、第30ピクチャは、ランダムアクセスポイントピクチャである第31ピクチャよりディスプレイ順序は先立つが、復号順序が遅れるので、リーディングピクチャに該当する。特に、それらは、復号可能なリーディングピクチャに該当する。一方、ディスプレイ順序と復号順序とがいずれもランダムアクセスポイントピクチャより遅れるピクチャをトレーリングピクチャ(trailing picture)という。図6Aを参照すれば、ディスプレイ順序上で第32ピクチャは、ランダムアクセスポイントピクチャである第31ピクチャより、ディスプレイ順序と復号順序とがいずれも遅れるので、トレーリングピクチャに該当する。かようなビデオデータを符号化し、ビデオビットストリームに生成する場合、各場面に対応するメタデータ情報を挿入したビデオビットストリームは、ランダムアクセスを考慮し、次のように生成することができる。
図6Aを参照すれば、復号順序が28であるピクチャにランダムアクセスが発生したので、復号順序が28以後のピクチャのためのメタデータ情報が、ビデオビットストリーム生成時に挿入されなければならない。図6Aに図示されているように、復号順序上で29、30、31であるピクチャは、復号可能なリーディングピクチャであり、ランダムアクセスポイントピクチャが属した第2場面と異なる第1場面に該当するピクチャであるので、第1メタデータ情報m1が挿入されなければならない。復号順序上で28、34であるピクチャは、第2場面に該当するピクチャであるので、第2メタデータ情報m2が挿入されなければならない。ただし、ビデオビットストリーム生成時、ディスプレイ順序や場面の順序と係わりなく、復号順にピクチャが羅列されるので、メタデータ情報は、復号順序を考慮し、メタデータ情報が最も先に必要なピクチャの位置を優先させ、メタデータ情報を挿入するが、一度挿入されたメタデータ情報については、重複的に含まれないようにしなければならない。
図6Aに図示されているように、ランダムアクセスが発生し、復号順序が28であるピクチャがランダムアクセスポイントピクチャになる場合、ランダムアクセスポイントピクチャが属した場面である第2場面に係わる第2メタデータ情報がランダムアクセスポイントピクチャの位置に挿入される。このとき、ランダムアクセスポイントピクチャの位置は、ランダムアクセスポイントピクチャの前後位置にもなり、図6Aに図示されているように、ランダムアクセスポイントピクチャの前に位置するように、第2メタデータ情報を挿入することができる。
次に、復号順序が29、30、31であるピクチャは、第1場面に該当するピクチャであり、第1場面に係わる第1メタデータ情報が、第1場面の場面カットの位置に挿入される。このとき、第1場面の場面カットの位置は、第1場面に属したピクチャの前後位置にもなり、特に、第1場面に属したピクチャのうち、ディスプレイ順序上で最初ピクチャの位置にもなる。図6Aに図示されているように、第1場面に属したピクチャのうち、復号順序が30であるピクチャがディスプレイ順序上で、最初ピクチャの位置になるので、復号順序が30であるピクチャの前に位置するように、第1メタデータ情報を挿入することができる。一方、復号順序が29、31であるピクチャは、復号順序が30であるピクチャの前に挿入された第1メタデータ情報を活用することができるので、第1メタデータ情報を重複して挿入する必要がない。
次に、復号順序が32以後のピクチャについても、各ピクチャが属する場面に該当するメタデータ情報を、その場面のカットの位置に挿入するが、すでに挿入されたメタデータ情報は、重複して挿入しない。図6Aに図示されているように、復号順序が34であるピクチャは、第2場面に該当するピクチャであるが、第2メタデータ情報は、ランダムアクセスポイントピクチャの前に位置するように、すでに挿入されているので、第2メタデータ情報を重複して挿入しない。
このように、ランダムアクセスを考慮して生成された、メタデータ情報を含むビデオビットストリームは、ビデオデータ処理装置200において、ランダムアクセスが発生する場合、ビデオビットストリームの生成過程の逆過程に基づいて処理される。言い替えれば、ビデオデータ処理装置200は、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち、復号可能なピクチャが属する各場面に係わるメタデータ情報が、ビデオビットストリームに最初に挿入された位置に基づき、メタデータ情報を獲得し、復号されたピクチャに対して、獲得したメタデータ情報に基づき、ビデオ処理を行うことができる。
図6Bは、他の実施形態による、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。
図6Bに図示されたビデオデータの一部分は、図6Aで説明したビデオデータの一部分と、ディスプレイ順序と復号順序とが一致する。ただし、第0場面に該当するピクチャと、第1場面に該当するピクチャとが異なる。言い替えれば、復号可能なリーディングピクチャが、ランダムアクセスポイントピクチャが属した場面と異なる複数個の場面にそれぞれ属する場合である。ディスプレイ順序上で、第28ピクチャに該当するピクチャが、図6Aに図示されたところと異なり、第1場面ではない第0場面に属する場合、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式の差異について以下で説明する。
図6Bに図示されているように、ランダムアクセスポイントピクチャは、ディスプレイ順序上で、第31ピクチャに該当するピクチャであり、ディスプレイ順序上で、第31ピクチャに該当するピクチャの復号順序が28であるために、復号順序が28以後のピクチャだけ復号される。ディスプレイ順序上で、第28ピクチャ、第29ピクチャ、第30ピクチャは、復号可能なリーディングピクチャに該当する。ディスプレイ順序上で、第32ピクチャは、トレーリングピクチャに該当する。かようなビデオデータを符号化し、ビットストリームに生成する場合、各場面に対応するメタデータ情報を挿入したビデオビットストリームは、ランダムアクセスを考慮し、次のように生成することができる。
図6Bを参照すれば、復号順序が28であるピクチャに、ランダムアクセスが発生したので、復号順序が28以後のピクチャのためのメタデータ情報が、ビデオビットストリーム生成時に挿入されなければならない。復号順序上で29、30、31であるピクチャは、復号可能なリーディングピクチャである。このうち、復号順序上で30であるピクチャは、第0場面に該当するピクチャであるので、第0メタデータ情報m0が、ビデオビットストリーム生成時に挿入されなければならない。復号順序上で29、31であるピクチャは、第1場面に該当するピクチャであるので、第1メタデータ情報m1が、ビデオビットストリーム生成時に挿入されなければならない。復号順序上で28、34であるピクチャは、第2場面に該当するピクチャであるので、第2メタデータ情報m2が挿入されなければならない。
図6Bに図示されているように、ランダムアクセスが発生し、復号順序が28であるピクチャが、ランダムアクセスポイントピクチャになる場合、ランダムアクセスポイントピクチャが属した場面である第2場面に係わる第2メタデータ情報m2が、ランダムアクセスポイントピクチャの前に位置するように、ビデオビットストリームに挿入される。
次に、復号順序が29であるピクチャは、第1場面に該当するピクチャであり、第1場面に係わる第1メタデータ情報m1が第1場面の場面カットの位置に挿入される。図6Bに図示されているように、第1場面に属したピクチャのうち、復号順序が29であるピクチャがディスプレイ順序上で最初ピクチャの位置になるので、第1メタデータ情報m1は、復号順序が29であるピクチャの前に位置するように、ビデオビットストリームに挿入される。
次に、復号順序が30であるピクチャは、第0場面に該当するピクチャであり、第0場面に係わる第0メタデータ情報m0が、ビデオビットストリームに挿入される必要がある。ただし、図6Bに図示されているように、第0場面に属したピクチャのうち復号順序が30であるピクチャが、唯一復号可能であるので、第0メタデータ情報m0は、復号順序が30であるピクチャの前に位置するように、ビデオビットストリームに挿入される。
次に、復号順序が31であるピクチャは、復号順序が29であるピクチャの前にすでに挿入された第1メタデータ情報を活用することができるので、第1メタデータ情報m1を重複して挿入する必要がない。
次に、復号順序が32以後のピクチャについても、各ピクチャが属する場面に該当するメタデータ情報を、その場面のカットの位置に挿入するが、すでに挿入されたメタデータ情報は、重複して挿入しない。図6Bに図示されているように、復号順序が34であるピクチャは、第2場面に該当するピクチャであるが、第2メタデータ情報m2は、ランダムアクセスポイントピクチャの前に位置するように、すでに挿入されているので、第2メタデータ情報を重複して挿入しない。
そのように、ランダムアクセスを考慮して生成された、メタデータ情報を含むビデオビットストリームは、ビデオデータ処理装置200でランダムアクセスが発生する場合、ビデオビットストリームの生成過程の逆過程に基づいて処理される。言い替えれば、ビデオデータ処理装置200は、ランダムアクセスが発生したランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち、復号可能なピクチャが属する各場面に係わるメタデータ情報が初めて挿入された位置に基づき、メタデータ情報を獲得し、復号されたピクチャに対して、獲得したメタデータ情報に基づき、ビデオ処理を行うことができる。
図6Cは、さらに他の実施形態による、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。
図6Cを参照すれば、ディスプレイ順序が、第26ピクチャから第36ピクチャに該当し、第26ピクチャから順次にディスプレイされるピクチャの連続であると見ることができる。一方、ピクチャ間の関係を示した矢印によって、復号順序(decoding order)を見れば、ディスプレイ順序と異なるということが分かる。
図6Cに図示されているように、ランダムアクセスがディスプレイ順序上で、第35ピクチャに該当するピクチャに発生すると仮定する場合、ランダムアクセスポイントピクチャは、ディスプレイ順序上で、第35ピクチャに該当するピクチャになる。ディスプレイ順序上で、第26ピクチャと第27ピクチャとに該当するピクチャは、ランダムアクセスポイントピクチャより先立つ符号化順序を有するので、第35ピクチャに対するランダムアクセスを考慮したビデオビットストリームに該当しない。図6Cを参照するとき、第35ピクチャに対するランダムアクセス発生を考慮したビデオビットストリームには、第35ピクチャ後の復号順序を有するピクチャだけ該当する。すなわち、復号順序によって、ディスプレイ順序上のピクチャを並べれば、第35ピクチャ、第31ピクチャ、第29ピクチャ、第28ピクチャ、第30ピクチャ、第33ピクチャ、第32ピクチャ、第34ピクチャ及び第36ピクチャが、第35ピクチャに対するランダムアクセス発生を考慮したビデオビットストリームに該当する。ただし、ディスプレイ順序上の第28ピクチャないし第30ピクチャは、復号不可能なリーディングピクチャであり、復号が不可能であるので、第28ピクチャないし第30ピクチャのためのメタデータ情報は、ビデオビットストリームに挿入する必要がない。
一方、図6Cでは、復号可能なリーディングピクチャのうち、第1場面に属する第32ピクチャ、第33ピクチャ及び第34ピクチャに対する第1メタデータ情報m1を、ビデオビットストリームのいずれの位置に入れるかということに係わる2つの方式をいずれも示している。
まず、オプション1のビデオビットストリーム(video bitstream of option1)は、メタデータ情報を各場面に属するピクチャのディスプレイ順序上、最初ピクチャの位置に挿入する方式である。それによれば、第1場面に属する第32ピクチャ、第33ピクチャ及び第34ピクチャのうち第32ピクチャが、ディスプレイ順序上、最初ピクチャに該当するので、第32ピクチャの前の位置に、第1メタデータm1を挿入したということが分かる。前述の図6A及び図6Bの場合、各場面に属するピクチャのディスプレイ順序上、最初のピクチャの位置に各場面に対応するメタデータを挿入させた方式であるということが分かる。
次に、オプション2のビデオビットストリーム(video bitstream of option 2)は、メタデータ情報を、各場面に属するピクチャの符号化順序上、最初ピクチャの位置に挿入する方式である。それによれば、第1場面に属する第32ピクチャ、第33ピクチャ及び第34ピクチャのうち第33ピクチャが、復号順序上、最初ピクチャに該当するので、第33ピクチャの前の位置に、第1メタデータm1を挿入したということが分かる。前述の図6A及び図6Bの場合、各場面に属するピクチャの復号順序上、最初のピクチャの位置に、各場面に対応するメタデータを挿入させた方式に撚ることも可能である。
一方、ランダムアクセスに備えたビデオビットストリーム生成及びビデオビットストリーム処理について、図4及び図5で説明したメタデータ情報に係わる識別情報を利用して、ビットレートを減らす方式と、図6Aないし図6Cで説明したメタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮する方式とを融合し、ビットストリーム内の最適位置にメタデータ情報に係わる識別情報を伝送する方式を使用することもできる。
図7Aは、一実施形態による、符号化されたビデオデータ生成方法に係わるフローチャートである。先に、ビデオデータ生成装置100について説明した内容は、以下省略されるにしても、符号化されたビデオデータ生成方法についても、そのまま適用される。
段階710において、ビデオデータ生成装置100は、ビデオデータを符号化することができる。ビデオデータ生成装置100は、入力されたビデオを、符号化順序(coding order)による符号化されたビデオデータを生成することができる。
段階720において、ビデオデータ生成装置100は、各場面の開始部分に挿入され、ビデオ処理に利用されるメタデータ情報を生成するか、あるいはランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を生成することができる。ビデオデータ生成装置100は、符号化されたビデオデータが復号された後、ビデオ処理に利用されるメタデータ情報を生成することができる。かようなメタデータ情報は、符号化されたビデオデータに対してランダムアクセスが発生する場合にも、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャが復号された後、ビデオ処理が行われるように準備することができる。
一方、ビデオデータ生成装置100は、ビデオデータ処理装置200でランダムアクセスが発生しても、ビデオ処理に利用される各場面のメタデータ情報が損失されないように、ビデオビットストリームの各場面に属する全てのピクチャ位置に含めるためのメタデータ情報に係わる識別情報を生成することもできる。
段階730において、ビデオデータ生成装置100は、メタデータ情報、またはメタデータ情報に係わる識別情報を含む、符号化されたビデオデータのビットストリームを生成することができる。ビデオデータ生成装置100は、メタデータ情報を、各場面の開始部分に挿入するか、あるいはランダムアクセスが起こりうるランダムアクセスポイントピクチャと、周辺のピクチャとを考慮し、メタデータ情報を適切なところに挿入させることにより、メタデータ情報を含むビデオビットストリームを生成することができる。
ビデオデータ生成装置100は、ランダムアクセスポイントピクチャの位置と、ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とにメタデータ情報を挿入し、ビットストリームを生成することができる。このとき、ランダムアクセスポイントピクチャの位置が、任意の場面に係わる場面カットの位置に該当すれば、ビデオデータ生成装置100は、場面カットに対応する場面に係わるメタデータ情報でもって、ランダムアクセスポイントピクチャの位置に挿入するメタデータ情報の代わりをすることができる。同一メタデータ情報を重複して挿入しないようにするためである。
場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で、最初ピクチャの位置に該当する。任意の場面に係わるメタデータ情報はそ、の任意の場面以前の場面に対応する場面カット位置に挿入することができる。それは、メタデータの復号に必要となる時間を考慮し、実際メタデータが適用される場面より以前の場面に対応する場面カット位置に挿入することにより、メタデータの復号によるディレイを最小化したりなくしたりするためである。
一方、ランダムアクセスポイントピクチャの位置によって復号可能なリーディングピクチャが存在しないか、ランダムアクセスポイントピクチャと同じであるか、あるいは異なる場面に属する複数個の復号可能なリーディングピクチャが存在することがある。
ビデオデータ生成装置100は、ランダムアクセスポイントピクチャに対して、リーディングピクチャが存在せず、ランダムアクセスポイントピクチャ位置が、場面カットの位置ではなければ、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャ位置に挿入し、ビットストリームを生成することができる。
ビデオデータ生成装置100は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャが、いずれもランダムアクセスポイントピクチャと異なる場面に属すれば、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャ位置に挿入し、復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に挿入し、ビットストリームを生成することができる。
ビデオデータ生成装置100は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャが、いずれもランダムアクセスポイントピクチャと同じ場面に属すれば、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に、複数個の復号可能なリーディングピクチャが含まれた場面に係わるメタデータ情報を挿入し、ビットストリームを生成することができる。ただし、復号可能なリーディングピクチャにもかかわらず、復号されないか、あるいはビデオビットストリームから除去される場合がある場合に備え、復号可能なリーディングピクチャが、ランダムアクセスポイントピクチャと同じ場面に属するとき、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置と、ランダムアクセスポイントピクチャの位置とのいずれにもメタデータ情報を挿入し、ビットストリームを生成することもできる。また、復号可能なリーディングピクチャが除去される場合、そのピクチャの位置に含まれていたメタデータ情報を、同じ場面に属したランダムアクセスポイントピクチャの位置に移すようにすることもできる。
一方、ビデオデータ生成装置100は、メタデータ情報に係わる識別情報を含む、符号化されたビデオデータのビットストリームを生成することもできる。ビデオデータ生成装置100において、メタデータ情報に係わる識別情報を生成した場合、メタデータの代わりに、メタデータ情報に係わる識別情報が含まれるように、ビデオビットストリームを生成することができる。ビデオデータ生成装置100は、メタデータに係わる識別情報が、ビデオビットストリームの所定位置に含まれるように、ビデオビットストリームを生成することができる。メタデータ情報を含むメタデータ情報のデータベースは、メタデータ情報に係わる識別情報が含まれたビデオビットストリームと独立した別個のチャネルを介して、ビデオデータ生成装置100から、ビデオデータ処理装置200に伝送される。
図7Bは、一実施形態による、符号化されたビデオデータ処理方法に係わるフローチャートである。先に、ビデオデータ処理装置200について説明した内容は、以下で省略されるにしても、符号化されたビデオデータ処理方法についても、そのまま適用される。
段階810において、ビデオデータ処理装置200は、ビデオビットストリームを獲得することができる。ビデオデータ処理装置200は、獲得したビデオビットストリームを復号することができる。ビデオデータ処理装置200は、符号化されたビデオデータが復号された後でビデオ処理されるとき、復号されたビデオデータに利用されるメタデータ情報を、ビデオビットストリームから抽出することができる。かようなメタデータ情報は、符号化されたビデオデータに対して、ランダムアクセスが発生する場合、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャが復号された後、ビデオ処理が行われるように、ランダムアクセスポイントピクチャ以後の復号されたビデオデータから抽出することができる。
段階820において、ビデオデータ処理装置200は、ビデオビットストリームにおいて、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を獲得することができる。
ビデオデータ処理装置200は、ビデオビットストリームにおいて、ランダムアクセスポイントピクチャの位置と、ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カット(scene cut)の位置とに基づいて、メタデータ情報を獲得することができる。このとき、ランダムアクセスポイントピクチャの位置が、任意の場面に係わる場面カットの位置に該当すれば、ビデオデータ処理装置200は、場面カットに対応する場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャの位置から獲得するメタデータ情報として使用することができる。
場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で、最初ピクチャの位置に該当する。任意の場面に係わるメタデータ情報は、任意の場面以前の場面に対応する場面カット位置で獲得することができる。それは、メタデータの復号によるディレイを最小化したりなくしたりするために、メタデータの復号に必要となる時間を考慮し、実際メタデータが適用される場面より以前の場面に対応する場面カット位置に、メタデータが挿入された場合である。
一方、ランダムアクセスポイントピクチャの位置によって復号可能なリーディングピクチャが存在しないとか、ランダムアクセスポイントピクチャと同じであるか、あるいは異なる場面に属する少なくとも1つの復号可能なリーディングピクチャが存在することがある。
ビデオデータ処理装置200は、ランダムアクセスポイントピクチャに対して、リーディングピクチャが存在せず、ランダムアクセスポイントピクチャ位置が、場面カットの位置ではなければ、ランダムアクセスポイントピクチャ位置に基づき、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を獲得することができる。
ビデオデータ処理装置200は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャが、いずれもランダムアクセスポイントピクチャと異なる場面に属すれば、ランダムアクセスポイントピクチャ位置に基づき、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を獲得し、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に基づき、復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を獲得することができる。
ビデオデータ処理装置200は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャがいずれもランダムアクセスポイントピクチャと同じ場面に属すれば、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に基づき、複数個の復号可能なリーディングピクチャが含まれた場面に係わるメタデータ情報を獲得することができる。ただし、復号可能なリーディングピクチャにもかかわらず、復号されないか、あるいはビデオビットストリームから除去される場合がある場合に備え、復号可能なリーディングピクチャが、ランダムアクセスポイントピクチャと同じ場面に属するとき、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置と、ランダムアクセスポイントピクチャの位置とのいずれにも、メタデータ情報が含まれてもよいので、2つの位置いずれにも基づき、メタデータ情報を獲得することができる。また、復号可能なリーディングピクチャが除去される場合、そのピクチャの位置に含まれていたメタデータ情報が、同じ場面に属したランダムアクセスポイントピクチャの位置に移されるので、そのときは、ランダムアクセスポイントピクチャの位置に基づき、メタデータ情報を獲得することができる。
一方、ビデオデータ処理装置200は、ビデオデータ生成装置100において、ビデオビットストリームの所定位置に、メタデータ情報に係わる識別情報を含めてビデオビットストリームを伝送した場合、メタデータ情報に係わる識別情報として、メタデータ情報のデータベースから、メタデータ情報を獲得することもできる。例えば、メタデータ情報に係わる識別情報は、ビデオビットストリームの各場面に属する全てのピクチャ位置に含まれてもよい。ビデオデータ処理装置200は、メタデータ情報に係わる識別情報とマッチングするメタデータ情報を、メタデータ情報のデータベースから獲得することができる。メタデータ情報のデータベースは、ビデオビットストリームが受信されるチャネルと別個のチャネルで、ビデオデータ生成装置100から受信され、ビデオビットストリームより事前に受信されたものでもある。
段階830において、ビデオデータ処理装置200は、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち復号されたビデオデータに対して、獲得したメタデータ情報に基づいて、ビデオ処理を行うことができる。
一方、前述の本発明の実施形態による符号化されたビデオデータ処理方法、及び符号化されたビデオデータ生成方法は、コンピュータで実行されるプログラムに作成可能であり、コンピュータで読取り可能な記録媒体を利用して、かようなプログラムを動作させる汎用デジタルコンピュータで具現される。かようなコンピュータで読取り可能な記録媒体は、マグネチック記録媒体(例えば、ROM(read-only memory)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM(compact disc read only memory)、DVD(digital versatile disc)など)のような記録媒体を含む。
以上、実施形態を中心に説明した。開示された実施形態が属する技術分野において当業者であるならば、開示された実施形態が、本質的な特性から外れない範囲で変形された形態に具現されるということを理解することができるであろう。従って、開示された実施形態は、限定的な観点ではなく、説明的な観点から考慮されなければならない。本実施形態による発明の範囲は、前述の説明ではなく、特許請求の範囲に示されており、それと同等な範囲内にある全ての差異は、発明の範囲に含まれているものと理解するものである。

Claims (20)

  1. 符号化されたビデオデータのビットストリームを獲得する段階と、
    前記ビットストリーム内のランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を獲得する段階と、
    前記ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち復号されたビデオデータに対して、前記メタデータ情報に基づいて、ビデオ処理を行う段階と、を含む符号化されたビデオデータ処理方法。
  2. 前記メタデータ情報を獲得する段階は、
    前記ビットストリームの所定位置において、メタデータ情報に係わる識別情報を獲得する段階と、
    メタデータ情報のデータベースから、前記獲得したメタデータ情報に係わる識別情報とマッチングする前記メタデータ情報を獲得する段階と、を含むことを特徴とする請求項1に記載の符号化されたビデオデータ処理方法。
  3. 前記ビットストリームを獲得するチャネルと別個のチャネルを介して、前記メタデータ情報のデータベースを獲得する段階をさらに含むことを特徴とする請求項2に記載の符号化されたビデオデータ処理方法。
  4. 前記メタデータ情報を獲得する段階は、
    前記ビットストリームにおいて、前記ランダムアクセスポイントピクチャの位置と、前記ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とに基づいて、前記メタデータ情報を獲得することを特徴とする請求項1に記載の符号化されたビデオデータ処理方法。
  5. 前記メタデータ情報を獲得する段階は、
    前記ランダムアクセスポイントピクチャが、復号可能なリーディングピクチャと同じ場面に属する場合、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に基づいて、前記ランダムアクセスポイントピクチャ、及び前記復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を獲得することを特徴とする請求項4に記載の符号化されたビデオデータ処理方法。
  6. 前記メタデータ情報を獲得する段階は、
    前記ランダムアクセスポイントピクチャが、復号可能なリーディングピクチャと異なる場面に属する場合、前記ランダムアクセスポイントピクチャの位置と、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置とに基づいて、前記ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報、及び前記復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を獲得することを特徴とする請求項4に記載の符号化されたビデオデータ処理方法。
  7. 前記場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で最初ピクチャの位置に該当することを特徴とする請求項4に記載の符号化されたビデオデータ処理方法。
  8. ビデオデータを符号化する段階と、
    ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を生成する段階と、
    前記メタデータ情報、または前記メタデータ情報に係わる識別情報を含む、符号化されたビデオデータのビットストリームを生成する段階と、を含む符号化されたビデオデータ生成方法。
  9. 前記ビットストリームを生成する段階は、
    前記ビットストリームの所定位置に、前記メタデータ情報に係わる識別情報を含め、前記ビットストリームを生成することを特徴とする請求項8に記載の符号化されたビデオデータ生成方法。
  10. 前記メタデータ情報に係わる識別情報を含んだビットストリームと、前記生成されたメタデータ情報を含むメタデータ情報のデータベースとを別個のチャネルを介してそれぞれ伝送する段階をさらに含むことを特徴とする請求項9に記載の符号化されたビデオデータ生成方法。
  11. 前記ビットストリームを生成する段階は、
    前記ランダムアクセスポイントピクチャの位置と、前記ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とに前記メタデータ情報を挿入し、前記ビットストリームを生成することを特徴とする請求項8に記載の符号化されたビデオデータ生成方法。
  12. 前記ビットストリームを生成する段階は、
    前記ランダムアクセスポイントピクチャが、復号可能なリーディングピクチャと同じ場面に属する場合、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に、前記ランダムアクセスポイントピクチャ、及び前記復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を挿入し、前記ビットストリームを生成することを特徴とする請求項11に記載の符号化されたビデオデータ生成方法。
  13. 前記ビットストリームを生成する段階は、
    前記ランダムアクセスポイントピクチャが、復号可能なリーディングピクチャと異なる場面に属する場合、前記ランダムアクセスポイントピクチャの位置に、前記ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を挿入し、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に、前記復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を挿入し、前記ビットストリームを生成することを特徴とする請求項11に記載の符号化されたビデオデータ生成方法。
  14. 前記場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で最初ピクチャの位置に該当することを特徴とする請求項11に記載の符号化されたビデオデータ生成方法。
  15. 請求項1ないし14のうちいずれか1項に記載の方法を具現するためのプログラムが記録されたコンピュータで判読可能な記録媒体。
  16. 符号化されたビデオデータのビットストリームを獲得するビットストリーム獲得部と、
    前記ビットストリームを復号するビデオ復号部と、
    前記ビットストリーム内のランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を獲得し、前記ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち復号されたビデオデータに対して、前記メタデータ情報に基づいて、ビデオ処理を行うビデオ処理プロセッサと、を含むビデオデータ処理装置。
  17. 前記ビデオ処理プロセッサは、
    前記ビットストリームの所定位置において、メタデータ情報に係わる識別情報を獲得し、メタデータ情報のデータベースから、前記獲得したメタデータ情報に係わる識別情報とマッチングする前記メタデータ情報を獲得することを特徴とする請求項16に記載のビデオデータ処理装置。
  18. 前記ビデオ処理プロセッサは、
    前記ビットストリームにおいて、前記ランダムアクセスポイントピクチャの位置と、前記ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とに基づいて、前記メタデータ情報を獲得することを特徴とする請求項16に記載のビデオデータ処理装置。
  19. ビデオデータを符号化し、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を生成するビデオ符号化部と、
    前記メタデータ情報、または前記メタデータ情報に係わる識別情報を含む、符号化されたビデオデータのビットストリームを生成を生成するビットストリーム生成部と、を含むビデオデータ生成装置。
  20. 前記ビットストリーム生成部は、
    前記ランダムアクセスポイントピクチャの位置と、前記ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とに前記メタデータ情報を挿入し、前記ビットストリームを生成することを特徴とする請求項19に記載の符号化されたビデオデータ生成装置。
JP2017520400A 2014-10-16 2015-10-15 ビデオデータ処理方法及び装置並びにビデオデータ生成方法及び装置 Active JP6776229B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462064557P 2014-10-16 2014-10-16
US62/064,557 2014-10-16
US201462077471P 2014-11-10 2014-11-10
US62/077,471 2014-11-10
PCT/KR2015/010895 WO2016060494A1 (ko) 2014-10-16 2015-10-15 부호화된 비디오 데이터 처리 방법 및 장치, 부호화된 비디오 데이터 생성 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2017536027A true JP2017536027A (ja) 2017-11-30
JP6776229B2 JP6776229B2 (ja) 2020-10-28

Family

ID=55746953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017520400A Active JP6776229B2 (ja) 2014-10-16 2015-10-15 ビデオデータ処理方法及び装置並びにビデオデータ生成方法及び装置

Country Status (6)

Country Link
US (2) US10542063B2 (ja)
EP (1) EP3200460A4 (ja)
JP (1) JP6776229B2 (ja)
KR (1) KR102370372B1 (ja)
CN (1) CN107005704B (ja)
WO (1) WO2016060494A1 (ja)

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030163477A1 (en) * 2002-02-25 2003-08-28 Visharam Mohammed Zubair Method and apparatus for supporting advanced coding formats in media files
US8194997B2 (en) 2006-03-24 2012-06-05 Sharp Laboratories Of America, Inc. Methods and systems for tone mapping messaging
WO2009114111A2 (en) * 2008-03-12 2009-09-17 Packetvideo Corp. System and method for reformatting digital broadcast multimedia for a mobile device
KR20110106465A (ko) 2009-01-28 2011-09-28 노키아 코포레이션 비디오 코딩 및 디코딩을 위한 방법 및 장치
US9706227B2 (en) * 2011-03-10 2017-07-11 Qualcomm Incorporated Video coding techniques for coding dependent pictures after random access
US20130170561A1 (en) * 2011-07-05 2013-07-04 Nokia Corporation Method and apparatus for video coding and decoding
WO2013030458A1 (en) 2011-08-31 2013-03-07 Nokia Corporation Multiview video coding and decoding
KR20140110881A (ko) * 2011-11-25 2014-09-17 톰슨 라이센싱 장면 컷 결함들을 고려한 비디오 품질 평가
US9532055B2 (en) 2012-04-16 2016-12-27 Microsoft Technology Licensing, Llc Constraints and unit types to simplify video random access
US9736476B2 (en) 2012-04-27 2017-08-15 Qualcomm Incorporated Full random access from clean random access pictures in video coding
JP6787667B2 (ja) 2012-09-21 2020-11-18 ノキア テクノロジーズ オサケユイチア ビデオコーディングのための方法と装置
GB2516824A (en) * 2013-07-23 2015-02-11 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
CN111901599B (zh) * 2014-06-27 2024-05-14 松下知识产权经营株式会社 再现装置
US9800898B2 (en) * 2014-10-06 2017-10-24 Microsoft Technology Licensing, Llc Syntax structures indicating completion of coded regions

Also Published As

Publication number Publication date
US20170244776A1 (en) 2017-08-24
US10542063B2 (en) 2020-01-21
EP3200460A1 (en) 2017-08-02
US11115452B2 (en) 2021-09-07
WO2016060494A1 (ko) 2016-04-21
KR102370372B1 (ko) 2022-03-04
US20200137135A1 (en) 2020-04-30
JP6776229B2 (ja) 2020-10-28
EP3200460A4 (en) 2017-08-23
KR20170072209A (ko) 2017-06-26
CN107005704A (zh) 2017-08-01
CN107005704B (zh) 2020-07-24

Similar Documents

Publication Publication Date Title
US20210120236A1 (en) Image coding method using history-based motion information and apparatus for the same
KR102079803B1 (ko) 영상 디코딩 방법 및 이를 이용하는 장치
US20220070498A1 (en) Syntax design method and apparatus for performing coding by using syntax
JP7450747B2 (ja) 混成nalユニットタイプに基づく画像符号化/復号化方法及び装置、並びにビットストリームを伝送する方法
JP5170708B2 (ja) 動画像ストリーム加工方法及び装置、それを用いた動画像再生装置並びに動画像配信装置
US20230045490A1 (en) Image or video coding based on nal unit-associated information
US11973989B2 (en) Method and apparatus for decoding imaging related to sign data hiding
TWI789661B (zh) 用於虛擬參考解碼器和輸出層集的視頻資料流、視頻編碼器、裝置及方法
JP2023516375A (ja) 混成nalユニットタイプに基づく画像符号化/復号化方法及び装置、並びにビットストリームを伝送する方法
KR20220101712A (ko) 슬라이스 또는 픽처에 대한 nal 유닛 타입 기반 영상 또는 비디오 코딩
KR102482702B1 (ko) 움직임 제한 타일 집합 기반 360도 영상 스트리밍 방법 및 장치
JP6776229B2 (ja) ビデオデータ処理方法及び装置並びにビデオデータ生成方法及び装置
CN114747215B (zh) 调色板编码或变换单元的基于量化参数信息的图像或视频编码
JP7494315B2 (ja) Gdr又はirpaピクチャに対する利用可能スライスタイプ情報に基づく画像符号化/復号化方法及び装置、並びにビットストリームを保存する記録媒体
US11805264B2 (en) NAL unit type-based image or video coding
US11973947B2 (en) Image or video coding based on signaling of quantization parameter offset-related information
RU2806784C1 (ru) Способ и устройство кодирования/декодирования изображений на основе смешанного типа nal-единицы и способ для передачи потока битов
RU2812029C2 (ru) Способ и устройство кодирования/декодирования изображений на основе смешанного типа nal-единицы и способ для передачи потока битов
US20220417498A1 (en) Method for coding image on basis of tmvp and apparatus therefor
JP7375198B2 (ja) ピクチャ分割情報をシグナリングする方法及び装置
RU2814221C2 (ru) Кодирование изображения или видео на основе режима палитры
US20230171419A1 (en) Image or video coding on basis of information related to picture output
US20220394302A1 (en) Image or video coding based on quantization-related information
US20220408104A1 (en) Image or video coding based on chroma quantization parameter offset information
US20220368907A1 (en) Image or video coding based on signaling of quantization parameter-related information

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170619

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200908

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201007

R150 Certificate of patent or registration of utility model

Ref document number: 6776229

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150