JP5144522B2 - スケーラブルビデオ符号化でroiを定義し、再構成するための装置および方法 - Google Patents

スケーラブルビデオ符号化でroiを定義し、再構成するための装置および方法 Download PDF

Info

Publication number
JP5144522B2
JP5144522B2 JP2008533236A JP2008533236A JP5144522B2 JP 5144522 B2 JP5144522 B2 JP 5144522B2 JP 2008533236 A JP2008533236 A JP 2008533236A JP 2008533236 A JP2008533236 A JP 2008533236A JP 5144522 B2 JP5144522 B2 JP 5144522B2
Authority
JP
Japan
Prior art keywords
roi
layer
identification number
slice group
sei message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008533236A
Other languages
English (en)
Other versions
JP2009510888A (ja
Inventor
チュン−ウォン カン
チェ−ゴン キム
ジン−ウー ホン
ヨン−マン ロ
テ−モン べ
コン−ツァン チュオン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Korea Advanced Institute of Science and Technology KAIST
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Korea Advanced Institute of Science and Technology KAIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI, Korea Advanced Institute of Science and Technology KAIST filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2009510888A publication Critical patent/JP2009510888A/ja
Application granted granted Critical
Publication of JP5144522B2 publication Critical patent/JP5144522B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2362Generation or processing of Service Information [SI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4345Extraction or processing of SI, e.g. extracting service information from an MPEG stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4621Controlling the complexity of the content stream or additional data, e.g. lowering the resolution or bit-rate of the video stream for a mobile client with a small screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、スケーラブルビデオ符号化(SVC:scalable video coding)で多重関心領域(multiple ROI:multiple region of interest)を符号化および復号化する新たな機能をサポートする方法に関し、より詳細には、SVCで多重ROIを定義し、SVCで提供されるスケーラビリティを有する多重ROIを単独で復号化する方法に関する。
動画コーデックで実装されるROIの例として、H.263ベースの符号化およびMPEG−4オブジェクトベースの符号化がある。特定の領域をH.263で単独で復号化する方法を提供するISD(independent segment decoding)モードは、単独で復号化すべき領域をその符号化における1つの完全なイメージとして取り扱うという観点からすると、MPEG−4オブジェクトベースの復号化と同じである。しかし、ISDモードは、MPEG−4オブジェクトベースの復号化とは以下の点で異なる。
(1.H.263のISDモード)
H.263ベースの符号化では、イメージ内の特定の領域を単独で復号化する方法は、オプション(H.263のAnnex R)として提供される。特に、H.263ベースの符号化では、スケーラブル階層符号化を使用することによって、空間スケーラビリティ、時間スケーラビリティ、および品質スケーラビリティを提供することができる。
H.263では、品質スケーラビリティは、SVCのCGS(coarse grain scalability)に対応する方法を使用することによって提供され、時間スケーラビリティは、FGS(fine grain scalability)に対応し可変フレーム(variable frame)をサポートする方法を使用することによって提供される。さらに、空間スケーラビリティの場合、スケーラブルビデオ復号化(SVD:scalable video decoding)と同様に、解像度に関してコード化が実行され、低解像度のイメージを使用することによって階層間コード化が実行される。
(2.MPEG−4オブジェクトベースのコーダ)
MPEG−4オブジェクトベースのコード化では、任意の形状を有するオブジェクト領域は、VOP(video object plane)によって定義される長方形の領域にコード化される。この方法によると、ROIと類似のイメージ内の特定の領域は、単独で復号化することができるようなやり方でコード化される。
H.264ベースの符号化に基づくSVCは、H.263およびMPEG−4より高いコード化効率を有し、SVCのコード化スキーマは、H.263およびMPEG−4のコード化スキーマとは異なる。
本発明は、SVCに適したROIを表す方法を提供する。
本発明の一形態に従って、少なくとも1つまたは複数のROIを設定し、ROI識別番号をそれぞれのROIに割り当てるROI設定ユニットと、少なくとも1つまたは複数のスライスグループ識別番号を、少なくとも1つまたは複数のROI識別番号に割り当てるマッピングユニットと、ROI関連情報、スライスグループ関連情報、少なくとも1つまたは複数のスライスグループ識別番号へのROI識別番号のマッピングに関するマッピング情報、およびスケーラビリティ情報を含むメッセージを生成するメッセージ生成ユニットとを備える、多重ROI(関心領域)設定装置(multiple ROI setting apparatus)を提供する。
多重ROI設定装置は、特定のスケーラビリティを伴う特定のROIを有する1つのビットストリームを、複数のビットストリームからメッセージに基づいて選択する選択ユニットをさらに備えることができる。
さらに、ROI間でオーバーラップ領域があると、マッピングユニットは、スライスグループ識別番号のそれぞれを、オーバーラップ領域、および他のROIとオーバーラップしないROIの領域に割り当てることができる。
さらに、選択ユニットは、特定のROI識別番号にマップされるスライスグループ識別番号に対応するスライスグループを、ビットストリームからメッセージ内の情報に基づいて検出することができ、検出されるスライスグループが存在しないNALユニットを除去し、特定のスケーラビリティより高いスケーラビリティを有するNALユニットを除去する。
本発明の別の態様に従って、少なくとも1つまたは複数のスライスグループを少なくとも1つまたは複数の設定されたROIに割り当てるマッピング情報、ROI関連情報、スライスグループ関連情報、およびスケーラビリティ情報を含むメッセージを有するビットストリームを受信する受信ユニットと、特定のスケーラビリティを有する特定のROIに対応する1つのビットストリームを、複数のビットストリームからメッセージに基づいて選択する選択ユニットとを備える、ROI選択装置を提供する。
マッピング情報は、少なくとも1つまたは複数のROIへのROI識別番号の割り当てに関する情報と、ROI識別番号への少なくとも1つまたは複数のスライスグループを表すスライスグループ識別番号の割り当てに関する情報とを含むことができる。
さらに、ROI間でオーバーラップ領域があると、スライスグループ識別番号を、オーバーラップ領域、および他のROIとオーバーラップしないROIの領域に割り当てることができる。
本発明の別の態様に従って、少なくとも1つまたは複数のスライスグループを少なくとも1つまたは複数の設定されたROIに割り当てるマッピング情報、ROI関連情報、スライスグループ関連情報、およびスケーラビリティ情報を含むメッセージを有するビットストリームを受信する受信ユニットと、特定のスケーラビリティを有する特定のROIに対応する1つのビットストリームを、複数のビットストリームからメッセージに基づいて選択する選択ユニットと、選択されたビットストリームを復号化する復号化ユニットとを備える、選択的ROI再構成装置(selective ROI reconstructing apparatus)を提供する。
本発明の別の態様に従って、(a)少なくとも1つまたは複数のROIを設定し、ROI識別番号をそれぞれのROIに割り当てることと、(b)少なくとも1つまたは複数のスライスグループ識別番号を、少なくとも1つまたは複数のROI識別番号にマッピングすることと、(c)ROI関連情報、スライスグループ関連情報、少なくとも1つまたは複数のスライスグループ識別番号へのROI識別番号のマッピングに関するマッピング情報、およびスケーラビリティ情報を含むメッセージを生成することとを含む、多重ROI(関心領域)設定方法(multiple ROI setting method)を提供する。
多重ROI設定方法は、(d)特定のスケーラビリティを伴う特定のROIを有する1つのビットストリームを、複数のビットストリームからメッセージに基づいて選択することをさらに含むことができる。
本発明の別の態様に従って、(a)少なくとも1つまたは複数のスライスグループを少なくとも1つまたは複数の設定されたROIに割り当てるマッピングに関するマッピング情報、ROI関連情報、スライスグループ関連情報、およびスケーラビリティ情報を含むメッセージを有するビットストリームを受信することと、(b)特定のスケーラビリティを有する特定のROIに対応する1つのビットストリームを、複数のビットストリームからメッセージに基づいて選択することとを含む、ROI選択方法(ROI selecting method)を提供する。
本発明の別の態様に従って、(a)少なくとも1つまたは複数のスライスグループを少なくとも1つまたは複数の設定されたROIに割り当てるマッピングに関するマッピング情報、ROI関連情報、スライスグループ関連情報、およびスケーラビリティ情報を含むメッセージを有するビットストリームを受信することと、(b)特定のスケーラビリティを有する特定のROIに対応する1つのビットストリームを、複数のビットストリームからメッセージに基づいて選択することと、(c)選択されたビットストリームを復号化することとを含む、選択的ROI再構成方法(selective ROI reconstructing method)を提供する。
近年SVCは、異機種環境(heterogeneous environment)でビデオ(video)を伝送するための重要な技術として使用されている。SVCでは、特定の部分を、ユーザー端末またはネットワークの状況に従って、符号化されたビットストリームから除去し、その結果、異なる空間的、時間的、および品質的特性を有するビットストリームを生成することができる。
本発明は、既存のSVCの前述した特徴に加え、1つまたは複数のROIを有するスケーラブルビデオストリームで、特定のROIを有する新しいビットストリームを抽出する方法(method of extracting)を提供する。
この方法により、ユーザーは、解像度およびディスプレイサイズが制限される携帯電話またはPDAなどの自己の装置にとって最高の解像度で、ビデオを見ることができる。
ネットワークまたは端末がサイズに関して制限されると、ビデオ内で重要な意味を有するROIのみが伝送され、その結果、QoS(quality of server)を保証することができるビデオストリーミングサービスを提供することができる。ここで、その一例を、図1を参照して説明する。
図1は、本発明の一実施形態による、携帯電話またはPDAの画面に表示される交通監視ウィンドウ(traffic monitoring window)を示す。
このような低解像度の携帯電話またはPDAの場合、元のイメージの解像度が低くなるように処理されたものを受信する。しかし、本実施形態では、110または120として定義されるROIのみを受信して出力し、その結果、端末に適したROIを表示することができる。
(SVCでの多重ROIの実装)
1つまたは複数のROIを定義する場合、ROIを表すために2つの要因(factor)を考慮する。
1)スケーラブルビデオビットストリームにおいて、異なるスケーラビリティを有するために、1つまたは複数のROIを提供することがある。
2)オーバーラップ領域が2つのROIの間に存在することがあり、オーバーラップ領域は、符号化効率(encoding rate)を低下させることがある。本発明の実施形態では、独立したROIは、H.264/AVCに従ってフレキシブルなマクロブロックの順番(FMO:flexible macroblock ordering)を使用することによって構成される。
(1.FMOを使用することによるROIの符号化および復号化)
ここで、本発明の一実施形態による、SVCでのROIの実装について説明することとする。本発明の実施形態では、ROIは、様々なスライスグループのタイプの中のタイプ2のスライスグループマップに従ってFMOを使用することによって、スライスグループとして定義される。図2は、タイプ2のスライスグループマップで定義される4つのスライスグループを示す。前述のタイプは単に例示にすぎず、本発明はこれらの変形および変更を全て含むことを認識されたい。
図3は、1つのROIが存在する例を示す。
フレーム内のROIの外側に存在するマクロブロックは、別のスライスグループとして定義される。1つのROIのみが存在する場合、ROI310はスライスグループ1となり、その背景はスライスグループ2となる。
フレーム内のマクロブロックはそれぞれ、自己が含まれるスライスグループのスライスグループIDに割り当てられる。マクロブロックはそれぞれ、1つのスライスグループIDに割り当てられる。SVCでは、フレームの符号化は、スライスグループのユニット内で行われる。
特定のスライスグループが符号化されると、この特定のスライスグループの同じスライスグループIDを有するフレーム内のマクロブロックのみが符号化される。この符号化では、ピクチャパラメータセットで、スライスグループの総数およびスライスグループIDが表わされ、それぞれのスライスグループの左上隅および右下隅にマクロブロックのアドレスが記録される。この情報は、スライス単位で実行される復号化に使用される。
(2.FMOを使用することによる多重ROIの実装)
図4は、オーバーラップ領域を有する2つのROIが存在する例を示す。
1つのフレーム内に1つのROIが存在する図3に示される場合とは異なり、多重ROI(multiple ROI)の場合は、複数のROIが存在する。したがって、ROI間のオーバーラップ領域を考慮する必要がある。
例えば、図4に示されるように、ROI_1 400、およびROI_2 440を定義することができる。この場合、FMOを使用することによって、ROI_1 400、およびROI_2 440を別個のスライスグループとして定義する。したがって、ROI_1 400およびROI_2 440に含まれるオーバーラップ領域は、ROI_1 400またはROI_2 440が含まれるスライスグループの1つに含まれることがある。
この場合、以下の問題がある。オーバーラップ領域420は、ROI_1 400およびROI_2 440の中で低い方のスライスグループIDを有するスライスグループに含まれる。例えば、ROI_1 400のスライスグループIDが0であり、ROI_2 440のスライスグループIDが1である場合、オーバーラップ領域内のマクロブロックは、ROI_1 400に含まれる。
結果として起こる符号化では、ROI_1 400は、元の領域410および420を維持するために符号化される。しかし、ROI_2 440は、オーバーラップ領域を除く領域430のみがROI_2として割り当てられるように符号化される。このような状況では、ユーザーが、ROI_2 440のみを符号化されたビットストリームから復号化すると、オーバーラップ領域を除くROI_2 440の領域430のみが、デコーダで表示されるように復号化される。
この問題を解決するために、本発明の一実施形態に従って、ROI_1 400とROI_2 440の間のオーバーラップ領域OR420が、1つの独立のスライスグループとして定義される。したがって、オーバーラップ領域420を、単独で符号化し、復号化することができる。しかし、FMOで定義される規則を満たすために、オーバーラップ領域のスライスグループIDは、ROI_1 400およびROI_2 440のスライスグループIDより低いものである必要がある。
ユーザーがROI_1 400を表示したい場合、オーバーラップ領域420、およびオーバーラップ領域420を除くROI_1 400の領域410が符号化され、復号化される。ユーザーがROI_2 440を表示したい場合、オーバーラップ領域420、およびオーバーラップ領域420を除くROI_2 440の領域430が符号化され、復号化される。結果として、適切なビデオを表示することができる。
図5Aは、図4に示されるROIを、FMOを使用することによって実装する例を示す。
一例として、元のビデオは、共通イメージフォーマット(CIF:common image format)サイズであるが、ユーザーは、ROI_1 500をその元のサイズすなわちCIFサイズで、ROI_2を、元のサイズ(解像度)の半分すなわち4分の1のCIF(QCIF:quarter CIF)サイズで表示したいことがある。この場合、ROI_1 500およびROI_2 540を符号化するために、エンコーダは、全てのスケーラビリティ層(QCIF、CIF、4CIF)で符号化を実行する。より詳細には、エンコーダは、オーバーラップ領域を除くROI_1 500の領域ROI_1−OR 510、オーバーラップ領域を除く領域ROI_2−OR 530、およびオーバーラップ領域OR 520を、3つの独立のスライスグループとして符号化する。
それぞれのスライスグループは、長方形の形である。ROIおよびオーバーラップ領域ORを、タイプ2のスライスグループマップを使用することによって符号化することができる。本実施形態では、そのスケーラビリティは、2の整数倍で増減する。
一例として、図5Aに示されるように、オーバーラップ領域ORを考慮することによって復号化を実行するために、オーバーラップ領域ORのスライスグループIDは、ROI_1 500およびROI_2 540のスライスグループIDより低いものである必要がある。したがって、オーバーラップ領域OR、ROI_1、およびROI_2のスライスグループIDに、それぞれ0、1、2を割り当てることができる。
(3.ROIビットストリームを抽出するためのメタデータ)
図4および図5Aに示されるように、オーバーラップ領域を有する多重ROIが、FMOを使用することによってビデオ内で定義されると、1つのROIを、1つまたは複数のスライスグループで構成することができる。したがって、特定のROIを有するビットストリームを抽出するために、スライスグループのROIそれぞれが含まれることを示す情報が必要である。
例えば、図4および図5Aに示されるROI(ROI_1およびROI_2)それぞれを有する2つのビットストリームを、元のビットストリームから抽出することができる。それぞれのROIを、復号化して、ユーザーの端末で表示することができる。この場合、ROIを単独でまたは同時に、1つのディスプレイユニットまたはいくつかのディスプレイユニット上に表示することができる。
本発明の一実施形態では、特定のROIを有するビットストリームを抽出するために、ROI情報を表すメタデータを、SEI(supplemental enhancement information)として定義して、スケーラブルビデオストリームに提供する。ROI関連情報を含むSEIメッセージは、ROIの位置およびサイズ、ならびにROIのスケーラビリティを含む。必要なメタデータは、SEIで表されるので、ROIの抽出に必要とされる情報を、ビットストリームエクストラクタまたはデコーダに伝送することができる。ROIを表すメタデータ構造の構造に含まれる主な情報は、以下である。
*ROIの数:ビットストリームに含まれるROIの数
*ROI ID:ROI固有の値であって、ユーザーはその値を使用して特定のROIを選択することができる。
以下の情報は、対応する空間層(spatial layer)に使用される。
*スライスグループID:スライスグループ固有のID
*スライスグループのサイズおよび位置:スライスグループのサイズおよび位置に関する情報であって、その情報を使用してROIのサイズおよび位置を、特定のスケーラビリティで認識することができる。
*ROIへのスライスグループのマッピング:スライスグループIDを特定のROI IDにマッピングすることに関する情報。
現在のSVCでは、ROI関連情報を、3つのSEI、すなわち、スケーラブル情報のSEI、サブピクチャスケーラブル層情報のSEI、および動作制約(motion-constrained)スライスグループセットのSEIを使用することによって表す。
図5Bは、ROIを含むSEIメッセージのための操作を生成するSEIメッセージを示す。
ピクチャパラメータセット(PPS:picture parameter set)は、スライスグループに関する情報を含むFMO情報を使用することによって生成される。スライスグループに対応する層を、SEIの形式で記載する。このとき、ROI IDを複数の層の中のROI関連層にマッピングするのに使用される情報を含むSEIが、生成される。次に、スライスグループIDにリンクされるlayer_IDに関する情報を表すメタデータを含むSEIが生成され、符号化すべきビットストリームに挿入される。
(4.ROIを有するビットストリームの抽出)
図6は、本発明の一実施形態による、ROIベースのビデオ通信、ビデオ符号化および復号化の操作を示す概略図である。
エンコーダ610では、入力ビデオデータは、SVC NAL(Network Abstraction Layer:ネットワーク抽象化レイヤ)ユニットに符号化される(611)。SEIメッセージに含まれるSVCビットストリーム内のROI関連情報、およびスケーラビリティ情報も、SEI NALユニットに符号化される(612)。伝送においては、符号化されたSEI NALユニットは、符号化されたビデオデータを包含するSVC NALユニットに先行する。
選択ユニット620では、エンコーダ610で符号化されたスケーラブルビデオビットストリームから選択された特定のROIを有するビットストリームが、抽出される。デコーダ630では、抽出されたNALユニットで構成されるビットストリームが、復号化される。ここで、選択ユニット620で実行される、ROIを有するビットストリームを抽出する方法を、図7および図8を参照して詳細に説明することとする。
図7は、本発明の一実施形態による、多重ROI設定装置700の構成を示す図である。多重ROI設定装置700は、SVCでの多重ROIの設定、設定されたROIの符号化、ROIを復号化するためのSEIメッセージの生成を実行する。さらに、多重ROI設定装置700は、特定のROIが有するビットストリームのみを抽出する機能を実行することができる。
多重ROI設定装置700には、ROI設定ユニット710、マッピングユニット720、およびメッセージ生成ユニット730が含まれる。多重ROI設定装置700は、選択ユニット740をさらに含むことができる。
ROI設定ユニット710は、少なくとも1つまたは複数のROIを設定し、その結果、マクロブロックは、H.264多重スライスグループ(H.264 multiple slice group)のFMOを使用することによって、少なくとも1つまたは複数のROIとして設定され、ROI IDをROIに割り当てる。
マッピングユニット720は、少なくとも1つまたは複数のスライスグループIDを、少なくとも1つまたは複数のROI IDに割り当てる。マッピングユニット720は、図3および図4に示される操作に従って、ROI IDをスライスグループIDにマップする。
1つまたは複数のROIがビデオに存在するとき、IDは、ROIを識別するために使用される。ROIは、重要な意味のある領域であるので、空間的な解像度に関係なく特定の空間領域を指定する方法が必要である。SVCでは、特定のスケーラビリティの特定のフレームレートを表すことができるスライスグループのみを、layer_IDで指定することができる。ビットストリームエクストラクタでは、ROI IDは、スケーラビリティおよびフレームレートに関係なく特定のROIを指定するように設定され、スライスグループID、特定のスケーラビリティの特定のフレームレートを表すように設定される。次いで、マッピングが実行される。
メッセージ生成ユニット730は、ROI関連情報、スライスグループ関連情報、1つまたは複数のスライスグループIDへのROI IDのマッピングに関するマッピング情報、およびスケーラビリティ情報を含むメッセージを生成する。メッセージは、H.264/AVCのSVCのSEIメッセージであり、エンコーダのビットストリームに含まれるように符号化される。SEIメッセージは、上記の(3.ROIビットストリームを抽出するためのメタデータ)のセクションで説明されているので、SEIメッセージについての詳細な説明は省略する。
選択ユニット740は、特定のスケーラビリティを伴う特定のROIを有するビットストリームを、元のビットストリームから、メッセージ生成ユニット730により生成されるSEIメッセージに基づいて抽出する。ここで選択ユニット740を、図8を参照して詳細に説明することとする。
図8は、本発明の一実施形態によるROI選択装置800の構成を示す図である。
ROI選択装置800には、受信ユニット810、および選択ユニット820が含まれる。受信ユニット810は、(少なくとも1つまたは複数のスライスグループを、少なくとも1つまたは複数の設定されたROIに割り当てる)マッピングに関するマッピング情報、ROI関連情報、スライスグループ関連情報、およびスケーラビリティ情報を含むメッセージを有するビットストリームを受信する。
選択ユニット820は、特定のスケーラビリティを伴う特定のROIを有するビットストリームを、入力スケーラブルビデオストリームから抽出することができる。選択ユニット820は、特定のスケーラビリティを有する特定のROIに対応する1つのビットストリームを複数のビットストリームからSEIメッセージに基づいて抽出するように、元のビットストリーム内の1つのROIを抽出するために、SEIメッセージの解析を実行する。ROIに関する情報は、メタデータの形式でSEIメッセージに含まれ、特定のROIを抽出するために必要とされる情報は、SEIメッセージに含まれる。
端末またはネットワークの制限、あるいはユーザー選択に従って、抽出されるべき外部または所定ROIのROI IDとスケーラビリティとが入力され、スケーラビリティ層に対応する抽出されるべきスライスグループが、解析の対象であるSEIメッセージ内のROI IDとスライスグループIDとの間のマッピングに関するマッピング情報を使用することによって、識別される。
次いで、要求されたROIに含まれるスライスグループが、受信したNALユニットのいずれにも存在しない場合、対応するNALユニットは除去される。さらに、NALユニットが、要求されたROIのスケーラビリティより高い解像度を有する場合、そのNALユニットは除去される。
選択ユニット820からのビットストリーム出力は、前述の操作で除去されないNALユニットで構成される。選択ユニット820により抽出されたROIを含むビットストリームも、スケーラブルビットストリームである。
図9Aは、本発明の一実施形態による選択的ROI再構成装置900の構成を示す図である。
選択的ROI再構成装置900には、図8に関して説明した受信ユニット810および選択ユニット820と実質的に同一または類似である、受信ユニット910および選択ユニット920が含まれる。さらに、選択的ROI再構成装置900には、復号化ユニット930が含まれる。受信ユニット910および選択ユニット920は、図8に示される受信ユニットおよび選択ユニットと同一または類似であるので、これらの詳細な説明は省略する。
復号化ユニット930は、選択ユニット820または920によって抽出されたROIを有するビットストリームを復号化し、その結果、多重ROIを、最終的にSVCで復号化することができる。
図9Bは、本発明の一実施形態による選択的ROI再構成装置のROI抽出操作を示す。
スライスグループの数および形状の情報を、PPSから取得する。次に、スライスグループを表す層のROI ID情報を、ROI IDへのlayer_IDのマッピングに関するマッピング情報を含むSEIから取得する。次に、スライスグループIDとlayer_IDの間の関係を表す情報を、スライスグループIDに関連づけられるlayer_IDに関する情報を含むSEIから取得し、その結果、抽出されるべきROI IDに対応する入力ROI_IDに関連付けられるスライスグループを、スライスグループIDを使用することによって識別することができる。結果として、関連ビットストリームを抽出することができる。
図10Aから図10Cは、本発明の一実施形態によるSEIメッセージのシンタックス(syntax)を示す。
スケーラビリティ情報SEIは、ビットストリームのスケーラビリティ情報を提供する。ビットストリームを構成する層は、そのスケーラビリティに従ってスケーラブル層に分類される。
スケーラブル層は、特定のスライスグループを示す。スケーラブル層の情報をスケーラビリティ情報SEIに記述することにより、ビットストリームの抽出に必要な情報を提供することができる。本発明の一実施形態では、ROI IDが特定のROIのスケーラブル層に割り当てられることにより、特定のROIを有するビットストリームを抽出することができる。
sub_pic_layer_flag値1で表されるスケーラブル層は、あるスライスグループがROIを表すスライスグループであることを示す。sub_pic_layer_flag値が1である場合、ROI IDが記録され、その結果、あるROIが特定のスライスグループのROIとなる。
図11は、情報に関連するROIを包含する代替的なスケーラビリティ情報SEIを示す。ビットストリーム内にROIが存在する場合、roi_flagをsub_pic_layer_flagの代わりに信号として使用することができる。roi_flag値は、ROIがビットストリームに存在することを示すように、1に設定される。さらに、ROIの数−1の値が、num_rois_minus_1に設定される。ROIが定義されると、2つまたはそれ以上のスライスグループが1つのビデオに存在する。
この場合、ROIに対応する層がグループ化され、その結果、サブストリームを定義することができる。ROIに対応するサブストリームの数−1が、nun_component_substreams_minus_1に設定される。IDはサブストリームに割り当てられ、component_substream_idアレイに格納される。
サブストリームを構成するスケーラブル層に関する情報をさらに記述することにより、実際のスライスグループのスケーラビリティ情報を提供することができる。本発明の一実施形態では、roi_flag、サブストリーム、nun_component_substreams_minus_1、およびcomponent_substream_idは、ROI情報として格納される。
図12は、SVCで多重ROIを実装するための操作を示すフローチャートである。
SVCでの多重ROIの実装は、次のように実行される。
少なくとも1つまたは複数のROIを、多重スライスグループを使用することによって設定し、ROI IDを、ROIに割り当てる(操作 S1210およびS1220)。
次に、少なくとも1つまたは複数のスライスグループIDを、少なくとも1つまたは複数のROI IDにマップする(操作 S1230)。ROI間にオーバーラップ領域があると、スライスグループIDを、オーバーラップ領域、および他のROIとオーバーラップしないROIの領域に割り当てる(操作 S1230)。
スライスグループIDへのROI IDのマッピングが完了した後、ROI関連情報、スライスグループ関連情報、1つまたは複数のスライスグループIDへのROI IDのマッピングに関するマッピング情報、およびスケーラビリティ情報を含むSEIメッセージを生成する(操作 S1240)。
特定のスケーラビリティを伴う特定のROIを有する1つのビットストリームを、複数のビットストリームからSEIメッセージに基づいて選択する(操作 S1250)。より詳細には、特定のROI IDにマップされるスライスグループIDに対応するスライスグループを、ビットストリームからSEIメッセージ内の情報に基づいて検出する。
検出されたスライスグループが存在しないNALユニットを除去し、特定のスケーラビリティより高いスケーラビリティを有するNALユニットを除去する。その後、残っているNALユニットは、ビットストリームとして抽出される。抽出されたビットストリームを復号化する(操作 S1260)。
本発明は、コンピュータ読み取り可能な記録媒体においてコンピュータ読み取り可能コードとして具現化することもできる。コンピュータ読み取り可能な記録媒体は、コンピュータシステムによって読み取ることができるデータを格納することができる任意のデータストレージデバイスである。コンピュータ読み取り可能な記録媒体の例には、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データストレージデバイス、および搬送波(インターネットを介するデータ伝送など)が含まれる。コンピュータ読み取り可能な記録媒体を、コンピュータに結合されたネットワーク上に分散することができ、その結果、コンピュータ読み取り可能コードは、分散方式で格納され、実行される。
本発明を、特に例示的実施形態に関連して示し、説明してきたが、添付の特許請求の範囲により定義される本発明の精神および範囲から逸脱することなく、形態およびの詳細の様々な変更を行うことができることを、当業者であれば理解するであろう。
本発明の一実施形態による、携帯電話またはPDAの画面に表示される交通監視ウィンドウを示す図である。 タイプ2のスライスグループマップで定義される4つのスライスグループを示す図である。 1つの関心領域(ROI)が存在する一例を示す図である。 オーバーラップ領域を有する2つのROIが存在する一例を示す図である。 図4のROIを、FMOを使用することによって実装する一例を示す図である。 本発明の一実施形態による、ROIを含むSEIメッセージのためのSEIメッセージ生成操作を示す図である。 本発明の一実施形態による、ROIベースのビデオ通信、ビデオ符号化および復号化操作を示す図である。 本発明の一実施形態による多重ROI設定装置の構成を示す図である。 本発明の一実施形態によるROI選択装置の構成を示す図である。 本発明の一実施形態による選択的ROI再構成装置の構成を示す図である。 本発明の一実施形態による、選択的ROI再構成装置でのROI抽出操作を示す図である。 本発明の一実施形態によるSEIメッセージのシンタックスを示す図である。 本発明の一実施形態によるSEIメッセージのシンタックスを示す図である。 本発明の一実施形態によるSEIメッセージのシンタックスを示す図である。 本発明の一実施形態によるSEIメッセージのシンタックスの例を示す図である。 SVCで多重ROIを実装する操作を示すフローチャートである。

Claims (15)

  1. フレーム内に少なくとも1つの多重関心領域(ROI)を設定し、前記ROIにROI識別番号を割り当てる段階と、
    前記ROI識別番号をLayer識別番号とマッピングする段階と、
    前記Layer識別番号に少なくとも1つ以上のスライスグループ識別番号をマッピングする段階と、
    を含み、この場合、前記ROI識別番号と前記Layer識別番号とのマッピング情報、及び前記ROI識別番号と前記1つ以上のスライスグループ識別番号とのマッピング情報は、SEIメッセージに含まれることを特徴とするスケーラブルビデオのためのROI情報設定方法。
  2. 前記SEIメッセージは、
    スケーラビリティ情報SEIメッセージ、サブピクチャスケーラビリティ層(Sub−picture Scalable Layer)SEIメッセージ、動作制約スライスグループセット(Motion−Constrained Slice Group Set)SEIメッセージを含むことを特徴とする請求項1に記載のROI情報設定方法。
  3. 前記ROI識別番号をLayer識別番号とマッピングする段階において、
    マッピングされた前記ROI識別番号と前記Layer識別番号との情報を示すメタデータは、スケーラビリティ情報SEIメッセージに含まれることを特徴とする請求項1に記載のROI情報設定方法。
  4. 前記割り当てる段階において、
    割り当てられた前記Layer識別番号と、それに割り当てられた少なくとも1つ以上のスライスグループ識別番号の情報とを示すメタデータは、それぞれサブピクチャスケーラビリティ層情報SEIメッセージ、動作制約スライスグループセットSEIメッセージに含まれることを特徴とする請求項1に記載のROI情報設定方法。
  5. フレーム内に少なくとも1つのROIを設定する時、
    H.264多重スライスグループ(FMO)を用いて、マクロブロックに少なくとも1つ以上のROIを設定することを特徴とする請求項1に記載のROI情報設定方法。
  6. SEIメッセージからROI識別番号とLayer識別番号とのマッピング関係を確認する段階と、
    SEIメッセージから前記Layer識別番号に対応する少なくとも1つ以上のスライスグループ識別番号を把握する段階と、
    前記少なくとも1つ以上のスライスグループ識別番号に基づいて、ピクチャパラメータセット(PPS)で当該スライスグループの位置を把握する段階と
    を含むことを特徴とするスケーラブルビデオのためのROI解析方法。
  7. 前記確認する段階で使われる前記SEIメッセージ内に含まれたsub_pic_Layer_flag値を把握し、sub_pic_Layer_flag値が1である層に対してのみ、前記ROI識別番号と前記Layer識別番号とのマッピング関係を確認することを特徴とする請求項6に記載のROI解析方法。
  8. 前記確認する段階で使われる前記SEIメッセージは、
    スケーラビリティ情報SEIメッセージであることを特徴とする請求項7に記載のROI解析方法。
  9. 前記sub_pic_Layer_flag値は、各層ごとに記述され、sub_pic_Layer_flag値が1である場合にのみ、当該層にROIが存在することを特徴とする請求項7に記載のROI解析方法。
  10. 前記スライスグループ識別番号を把握する段階で使われる前記SEIメッセージは、サブピクチャスケーラビリティ層情報SEIメッセージと、動作制約スライスグループセットSEIメッセージであることを特徴とする請求項6に記載のROI解析方法。
  11. 前記位置を把握する段階において、
    前記少なくとも1つ以上のスライスグループ識別番号に基づいて、各スライスグループの左側上端及び右側下端のマクロブロックのアドレスを把握することを特徴とする請求項6に記載のROI解析方法。
  12. スケーラビリティ情報SEIメッセージでROIが含まれた層のLayer識別番号とROI識別番号とのマッピング関係を確認する段階と、
    サブピクチャスケーラビリティ層情報SEIメッセージと、動作制約スライスグループセットSEIメッセージとを用いて、前記Layer識別番号に対応する少なくとも1つ以上のスライスグループ識別番号を把握する段階と、
    前記少なくとも1つ以上のスライスグループ識別番号に基づいて、ピクチャパラメータセット(PPS)で当該スライスグループの位置を把握する段階と
    を含むことを特徴とするROI解析方法。
  13. 前記スケーラビリティ情報SEIメッセージ内に含まれたsub_pic_Layer_flag値を把握し、sub_pic_Layer_flag値が1である層に対してのみ、前記ROI識別番号と前記Layer識別番号とのマッピング関係を確認することを特徴とする請求項12に記載のROI解析方法。
  14. 前記sub_pic_Layer_flag値は、各層ごとに記述され、sub_pic_Layer_flag値が1である場合にのみ、当該層にROIが存在することを特徴とする請求項13に記載のROI解析方法。
  15. 前記位置を把握する段階において、
    前記少なくとも1つ以上のスライスグループ識別番号に基づいて、各スライスグループの左側上端及び右側下端のマクロブロックのアドレスを把握することを特徴とする請求項12に記載のROI解析方法。
JP2008533236A 2005-09-26 2006-09-25 スケーラブルビデオ符号化でroiを定義し、再構成するための装置および方法 Active JP5144522B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR10-2005-0089463 2005-09-26
KR20050089463 2005-09-26
US72545405P 2005-10-11 2005-10-11
US60/725,454 2005-10-11
KR10-2006-0092368 2006-09-22
KR1020060092368A KR101255226B1 (ko) 2005-09-26 2006-09-22 스케일러블 비디오 코딩에서 다중 roi 설정, 복원을위한 장치 및 방법
PCT/KR2006/003794 WO2007035065A1 (en) 2005-09-26 2006-09-25 Method and apparatus for defining and reconstructing rois in scalable video coding

Publications (2)

Publication Number Publication Date
JP2009510888A JP2009510888A (ja) 2009-03-12
JP5144522B2 true JP5144522B2 (ja) 2013-02-13

Family

ID=37889071

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008533236A Active JP5144522B2 (ja) 2005-09-26 2006-09-25 スケーラブルビデオ符号化でroiを定義し、再構成するための装置および方法

Country Status (5)

Country Link
US (2) US8471902B2 (ja)
EP (2) EP1929781A4 (ja)
JP (1) JP5144522B2 (ja)
KR (1) KR101255226B1 (ja)
WO (1) WO2007035065A1 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101255226B1 (ko) * 2005-09-26 2013-04-16 한국과학기술원 스케일러블 비디오 코딩에서 다중 roi 설정, 복원을위한 장치 및 방법
CN101507281B (zh) 2006-07-12 2013-06-05 诺基亚公司 媒体文件中的兴趣区域可缩放性信息的信号发送
CA2681197C (en) 2007-04-24 2014-01-07 Nokia Corporation Signaling of multiple decoding times in media files
CN101690228B (zh) * 2007-06-29 2012-08-08 汤姆森许可贸易公司 视频编索引方法和视频编索引设备
EP2890149A1 (en) 2008-09-16 2015-07-01 Intel Corporation Systems and methods for video/multimedia rendering, composition, and user-interactivity
US9584819B2 (en) 2011-10-24 2017-02-28 Qualcomm Incorporated Grouping of tiles for video coding
US10349077B2 (en) * 2011-11-21 2019-07-09 Canon Kabushiki Kaisha Image coding apparatus, image coding method, image decoding apparatus, image decoding method, and storage medium
PT2842313T (pt) 2012-04-13 2016-12-22 Ge Video Compression Llc Fluxo de dados escaláveis e entidade de rede
EP2868103B1 (en) * 2012-06-29 2016-12-07 GE Video Compression, LLC Video data stream concept
JP6214235B2 (ja) * 2012-07-02 2017-10-18 キヤノン株式会社 ファイル生成方法、ファイル生成装置、及びプログラム
KR102088801B1 (ko) 2013-03-07 2020-03-13 삼성전자주식회사 가변블록 사이즈 코딩 정보를 이용한 관심영역 코딩 방법 및 장치
KR101852669B1 (ko) * 2013-04-08 2018-04-26 소니 주식회사 Shvc를 이용한 관심 영역 확장성
CN105144768B (zh) * 2013-04-26 2019-05-21 英特尔Ip公司 频谱共享情境中的共享频谱重新分配
JP2016523015A (ja) * 2013-06-19 2016-08-04 エルジー エレクトロニクス インコーポレイティド 信号送受信装置及び信号送受信装置の制御方法
GB2516224A (en) * 2013-07-11 2015-01-21 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
JP6271888B2 (ja) * 2013-07-12 2018-01-31 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
EP3008896B1 (en) * 2013-07-15 2021-03-31 Sony Corporation Extensions of motion-constrained tile sets sei message for interactivity
GB2516824A (en) 2013-07-23 2015-02-11 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
US10200353B2 (en) 2013-07-25 2019-02-05 Convida Wireless, Llc End-to-end M2M service layer sessions
GB2520310A (en) * 2013-11-15 2015-05-20 Sony Corp A method, server, client and software
WO2015074273A1 (zh) * 2013-11-25 2015-05-28 华为技术有限公司 处理视频的设备和方法
WO2015126144A1 (ko) 2014-02-18 2015-08-27 엘지전자 주식회사 파노라마 서비스를 위한 방송 신호 송수신 방법 및 장치
JPWO2016098280A1 (ja) * 2014-12-16 2017-11-16 日本電気株式会社 映像符号化装置、映像復号装置および映像配信システム
EP3416392A4 (en) 2016-02-09 2019-09-18 Sony Interactive Entertainment Inc. VIDEO DISPLAY SYSTEM
EP3226561A1 (en) * 2016-03-31 2017-10-04 Thomson Licensing Method and apparatus for coding a video into a bitstream carrying region-based post processing parameters into an sei nesting message
US10554981B2 (en) * 2016-05-10 2020-02-04 Qualcomm Incorporated Methods and systems for generating regional nesting messages for video pictures
WO2017196670A1 (en) 2016-05-13 2017-11-16 Vid Scale, Inc. Bit depth remapping based on viewing parameters
US11503314B2 (en) 2016-07-08 2022-11-15 Interdigital Madison Patent Holdings, Sas Systems and methods for region-of-interest tone remapping
US9924131B1 (en) 2016-09-21 2018-03-20 Samsung Display Co., Ltd. System and method for automatic video scaling
MX2022004795A (es) 2016-10-12 2022-12-16 Fraunhofer Ges Forschung Transmisión continua espacialmente desigual.
CN109891772B (zh) 2016-11-03 2022-10-04 康维达无线有限责任公司 Nr中的帧结构
CN110301136B (zh) 2017-02-17 2023-03-24 交互数字麦迪逊专利控股公司 在流传输视频中进行选择性感兴趣对象缩放的系统和方法
JP6936018B2 (ja) * 2017-02-21 2021-09-15 ソニーセミコンダクタソリューションズ株式会社 映像送信装置および映像受信装置
EP3593536A1 (en) * 2017-03-07 2020-01-15 PCMS Holdings, Inc. Tailored video streaming for multi-device presentations
US11297349B2 (en) * 2017-05-31 2022-04-05 Sharp Kabushiki Kaisha Video decoding device and video encoding device
CN115883882A (zh) * 2018-09-19 2023-03-31 中兴通讯股份有限公司 图像处理方法、装置、系统、网络设备、终端及存储介质
KR20210066856A (ko) 2018-09-27 2021-06-07 콘비다 와이어리스, 엘엘씨 새로운 라디오의 비허가 스펙트럼들에서의 부대역 동작들
WO2020263817A1 (en) * 2019-06-25 2020-12-30 Intel Corporation Sub-pictures and sub-picture sets with level derivation
JP7425185B2 (ja) * 2019-09-24 2024-01-30 華為技術有限公司 指定されたレイヤのためのスケーラブル・ネスティングseiメッセージ
KR20220147641A (ko) * 2020-02-28 2022-11-03 엘지전자 주식회사 영상 특징 정보 시그널링을 위한 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6023301A (en) 1995-07-14 2000-02-08 Sharp Kabushiki Kaisha Video coding device and video decoding device
US6507618B1 (en) 2000-04-25 2003-01-14 Hewlett-Packard Company Compressed video signal including independently coded regions
GB2382940A (en) 2001-11-27 2003-06-11 Nokia Corp Encoding objects and background blocks
US20040006575A1 (en) * 2002-04-29 2004-01-08 Visharam Mohammed Zubair Method and apparatus for supporting advanced coding formats in media files
US8019175B2 (en) 2005-03-09 2011-09-13 Qualcomm Incorporated Region-of-interest processing for video telephony
US20060256863A1 (en) 2005-04-13 2006-11-16 Nokia Corporation Method, device and system for enhanced and effective fine granularity scalability (FGS) coding and decoding of video data
CA2604203A1 (en) 2005-04-13 2006-10-19 Nokia Corporation Coding, storage and signalling of scalability information
KR100931871B1 (ko) 2005-04-13 2009-12-15 노키아 코포레이션 비디오 데이터의 효과적인 fgs 부호화 및 복호화를 위한방법, 장치, 시스템
CN101313578B (zh) * 2005-09-26 2011-10-19 韩国电子通信研究院 用于在可伸缩视频编码中定义和重构感兴趣区域的方法和装置
KR101255226B1 (ko) * 2005-09-26 2013-04-16 한국과학기술원 스케일러블 비디오 코딩에서 다중 roi 설정, 복원을위한 장치 및 방법

Also Published As

Publication number Publication date
US8878928B2 (en) 2014-11-04
US20120201306A1 (en) 2012-08-09
JP2009510888A (ja) 2009-03-12
US8471902B2 (en) 2013-06-25
WO2007035065A1 (en) 2007-03-29
EP1929781A1 (en) 2008-06-11
EP3076672A1 (en) 2016-10-05
KR101255226B1 (ko) 2013-04-16
EP1929781A4 (en) 2013-01-23
KR20070034943A (ko) 2007-03-29
US20130294506A1 (en) 2013-11-07

Similar Documents

Publication Publication Date Title
JP5144522B2 (ja) スケーラブルビデオ符号化でroiを定義し、再構成するための装置および方法
US8184153B2 (en) Method and apparatus for defining and reconstructing ROIs in scalable video coding
KR100904444B1 (ko) 비디오 신호의 디코딩/인코딩 방법 및 장치
JP6329246B2 (ja) 画像復号装置
KR102304687B1 (ko) 정보 처리 장치 및 방법
JP7472292B2 (ja) ビデオ符号化およびビデオ復号のための方法、装置、およびコンピュータプログラム製品
WO2015152608A2 (ko) 서브블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치
JP7148637B2 (ja) 映像圧縮における複数ラインイントラ予測の方法、装置及びコンピュータ・プログラム
JP2017508417A (ja) 映像の復号化方法及びこれを利用する装置
KR20200008637A (ko) 360도 비디오의 영역 기반 처리 방법 및 장치
JP2022553599A (ja) サブピクチャ、スライス、およびタイルをサポートするビデオ符号化
CN101395925A (zh) 用于解码/编码视频信号的方法及装置
CN115668936A (zh) 时间运动向量预测、层间参考和时间子层指示的视频编码方面
WO2015098713A1 (ja) 画像復号装置および画像符号化装置
CN114641988A (zh) 改进的用信号表示亮度块的增量角度的方法
CN118235405A (zh) 基于模板匹配的分区模式导出
CN117296326A (zh) 用于视频编码和视频解码的方法、装置和计算机程序产品
JP2015126507A (ja) 画像復号装置、画像符号化装置、及び符号化データ

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20100118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110516

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110523

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110615

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120113

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120413

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120420

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120514

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121026

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5144522

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250