JP4833296B2 - 多階層を基盤としたスケーラブルビデオコーディング方法および装置 - Google Patents

多階層を基盤としたスケーラブルビデオコーディング方法および装置 Download PDF

Info

Publication number
JP4833296B2
JP4833296B2 JP2008543173A JP2008543173A JP4833296B2 JP 4833296 B2 JP4833296 B2 JP 4833296B2 JP 2008543173 A JP2008543173 A JP 2008543173A JP 2008543173 A JP2008543173 A JP 2008543173A JP 4833296 B2 JP4833296 B2 JP 4833296B2
Authority
JP
Japan
Prior art keywords
block
discardable
video
layer
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008543173A
Other languages
English (en)
Other versions
JP2009517959A (ja
Inventor
マシュー,マニュ
リー,キョ−ヒョク
ハン,ウー−ジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2009517959A publication Critical patent/JP2009517959A/ja
Application granted granted Critical
Publication of JP4833296B2 publication Critical patent/JP4833296B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • H04N21/4126The peripheral being portable, e.g. PDAs or mobile phones
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J19/00Accessories fitted to manipulators, e.g. for monitoring, for viewing; Safety devices combined with or specially adapted for use in connection with manipulators
    • B25J19/02Sensing devices
    • B25J19/021Optical sensing devices
    • B25J19/023Optical sensing devices including video camera means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J19/00Accessories fitted to manipulators, e.g. for monitoring, for viewing; Safety devices combined with or specially adapted for use in connection with manipulators
    • B25J19/06Safety devices
    • B25J19/061Safety devices with audible signals
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/0009Constructional details, e.g. manipulator supports, bases
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/10Programme-controlled manipulators characterised by positioning means for manipulator elements
    • B25J9/12Programme-controlled manipulators characterised by positioning means for manipulator elements electric
    • B25J9/126Rotary actuators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25825Management of client data involving client display capabilities, e.g. screen resolution of a mobile phone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities

Description

本発明は、ビデオコーディング技術に関するものであって、多階層を基盤としたスケーラブルビデオコーディング方法および装置に関するものである。
インターネットを含む情報通信技術の発達にともない文字、音声だけではなく画像通信が増加している。既存の文字中心の通信方式ではユーザの多様な欲求を充足させるには不足し、これに伴い文字、映像、音楽など多様な形態の情報を収容できるマルチメディア サービスが増加している。マルチメディアデータはその量が膨大で、大容量の保存媒体を必要とし伝送時に広い帯域幅を必要とする。したがって、文字、映像、オーディオを含むマルチメディアデータを伝送するためには圧縮コーディング技法を使用することが必須的である。
データを圧縮する基本的な原理はデータの重複(redundancy)要素を除去する過程である。イメージにおいて、同一な色やオブジェクトが反復されるような空間的重複や、動画ピクチャで隣接ピクチャがほとんど変化しない場合や音声で同じ音が継続して反復されるような時間的重複、またはである間の視覚および知覚能力が高い周波数に鈍感なことを考慮した知覚的重複を除去することによってデータを圧縮することができる。一般的なビデオコーディング方法において、時間的重複はモーション補償に基づいた時間的フィルタリング(temporal filtering)によって除去し、空間的重複は空間的変換(spatial transform)によって除去する。
データの重複を除去した後に生成されるマルチメディアを伝送するためには、伝送媒体が必要であるがその性能は伝送媒体別に差異がある。現在使用される伝送媒体は秒当たり数十メガビットのデータを伝送できる超高速通信網から秒当たり384キロビットの伝送速度を有する移動通信網などのように多様な伝送速度を有する。このような環境で、多様な速度の伝送媒体を支援するため、または伝送環境に応じてこれに適した伝送率でマルチメディアを伝送できるようにする、すなわちスケーラブルビデオコーディング(scalable video coding)方法がマルチメディア環境により適しているといえる。
スケーラブルビデオコーディングとは、すでに圧縮されたビットストリーム(bit−stream)に対して伝送ビット率、伝送エラー率、システム資源などの周辺条件に応じて前記ビットストリームの一部を取って、ビデオの解像度、フレーム率、およびSNR(Signal−to−Noise Ratio)などを調節できるようにする符号化方式、すなわち多様なスケーラビリティ(scalability)をサポートする符号化方式を意味する。
現在、MPEG (Moving Picture Experts Group)とITU (International Telecommunication Union)の共同作業グループ(working group)であるJVT (Joint Video Team)ではH.264を基本とした多階層(multi−layer)形態でスケーラビリティを具現するための標準化作業(以下、SVC(scalable video coding)標準という)を行っている。
図1は従来のトランスコーディング(transcoding)によるサイマルキャスティング(simulcasting)過程を示す図である。最初にエンコーダ11はスケーラブルではないビットストリーム(非スケーラブルビットストリーム)を生成し、これをストリーミングサーバ役割をする各々のルータまたはトランスコーダ12、13、14に提供する。そうすれば、最終のクライアント機器15、16、17、18と接続されたトランスコーダ13、14は、前記クライアント機器の性能またはネットワーク帯域幅に応じて該当品質のビットストリームを伝送する。ところが、トランスコーダ12、13、14で行われるトランスコーディング過程は、入力されたビットストリームをデコーディングした後、また他の条件のビットストリームに再エンコーディングする過程を含むため、時間の遅れが生じるだけではなくビデオ品質の低下をもたらす。
前記SVC標準ではこのような問題点を考慮して空間的次元(空間的スケーラビリティ)、フレーム率(時間的スケーラビリティ)、ビット率(SNRスケーラビリティ)などの観点からスケーラブルなビットストリームを提供する。このようなスケーラブルの特徴は、複数のクライアントが同一なビデオを受信する場合、非常に有用であるが、互いに異なる空間的/時間的/品質条件を有する。スケーラブルビデオコーディングをするためにトランスコーダ(transcoder)を必要としないため、効率的なマルチキャスティングが可能である。
SVC標準によれば、図2に示すように、エンコーダ11は最初からスケーラブルビットストリームを生成し、これの提供を受けたルータまたは抽出器(extractor)22、23、24は単純に前記生成されたビットストリームの一部を抽出する方式でビットストリームの品質を変化させる。したがって、ルータまたは抽出器22、23、24は、ストリーミングされているコンテンツに関するより良い制御ができ、これは可用した帯域幅の効率的な使用につながる。
スケーラブルコーディングは、通常多階層(multiple layers)および埋め込みコーディング(embedded coding)を使用して行われる。このようなスキームで、低い階層は低い品質(空間的/時間的/SNR)のビデオを提供する。向上階層はより多い情報を伝送することによってビデオ品質を増加させる。
図3は多階層を用いたスケーラブルビデオコーディング構造を示している。ここで、第1階層をQCIF(Quarter Common Intermediate Format)、15Hz(フレーム率)と定義し、第2階層をCIF(Common Intermediate Format)、30hzとし、第3階層をSD(Standard Definition)、60hzと定義する。仮にCIF 0.5Mbpsストリーム(stream)を望むであれば、第2階層のCIF_30Hz_0.7Mでビット率(bit−rate)が0.5Mとなるようにビットストリームを切り取れば良い。このような方式で空間的、時間的、SNRスケーラビリティを具現することができる。ところが、階層間にはある程度の類似性が存在するため、各階層を符号化することにおいては、他の階層から予測された情報(テクスチャデータ、モーションデータなど)を利用することで符号化の効率を高めることができる。
しかし、このようなスケーラビリティ(scalability)によって時々オーバーヘッドが生じる。図4はH.264に応じてコーディングした非スケーラブルビットストリームの品質と、SVC標準に応じたスケーラブルビットストリームの品質を比較したグラフである。スケーラブルビットストリームにおいてPSNR損失は約0.5 dB程度にみられる。図5のような極端な場合では、PSNRの損失はほぼ1 dBに至る。図4および図5の分析結果、SVC標準コーデックの性能(空間的スケーラビリティ設定の場合)はH.264に比べて性能が低いMPEG−4に近いか多少上回る程度である。この場合、スケーラビリティによって約20%のビット率オーバーヘッドが生じる。
また図2を参照すれば、最後のリンク(最終ルータ及びクライアントとの間のリンク)もまたスケーラブルビットストリームを使用することが分かる。しかし、多くの場合において、このようなリンクでは前記ビットストリームを受信する単なる一つのクライアントのみが存在するため、スケーラビリティの特徴は必要とされない。したがって、前記最終リンクで帯域幅オーバーヘッドが生じる。したがって、スケーラビリティを必要としない時、このようなオーバーヘッドを適応的に除去できる技術を考案する必要がある。
本発明が解決しようとする課題は、多階層を基盤としたビデオコーデックのコーディング性能を向上させるものにある。
本発明が解決しようとするまた他の技術的課題は、スケーラブルビットストリームでスケーラビリティを必要としない場合に、前記スケーラブルビットストリームのオーバーヘッドを除去するものにある。
本発明の技術的課題は、前記技術的課題に制限されず、言及されていないまた他の技術的課題は次の記載から当業者に明確に理解できるであろう。
前述した技術的課題を解決するために、多階層で形成されるビデオシーケンスを符号化するビデオエンコーディング方法は、(a)前記多階層のうち第1階層に存在する第1ブロックの残差をコーディングする段階と、(b)前記多階層のうち第2階層に存在し、前記第1ブロックと対応する第2ブロックが、前記第1ブロックを用いコーディングされる場合、前記コーディングされた第1ブロックの残差をビットストリームのうち廃棄不可能領域に記録する段階、および(c)前記第2ブロックが前記第1ブロックを用いずコーディングされる場合、前記コーディングされた第1ブロックの残差を前記ビットストリームのうち廃棄可能領域に記録する段階と、を含む。
前述した技術的課題を解決するために、多階層のうち少なくとも一つの以上の階層が廃棄不可能領域と廃棄可能領域で形成されるビデオビットストリームを復号化するビデオデコーディング方法は、(a)前記廃棄不可能領域で第1ブロックを判読する段階と、(b)前記第1ブロックのデータが存在すれば、前記第1ブロックのデータをデコーディングする段階と、(c)前記第1ブロックのデータが存在しなければ、前記廃棄可能領域で前記第1ブロックと同一な識別字を有する第2ブロックのデータを判読する段階、および(d)前記判読された第2ブロックのデータをデコーディングする段階と、を含む。
前述した技術的課題を解決するために、多階層で形成されるビデオシーケンスを符号化するビデオエンコーダは、前記多階層のうち第1階層に存在する第1ブロックの残差をコーディングする手段と、前記多階層のうち第2階層に存在し、前記第1ブロックと対応する第2ブロックが、前記第1ブロックを用いコーディングされる場合、前記コーディングされた第1ブロックの残差をビットストリームのうち廃棄不可能領域に記録する手段、および前記第2ブロックが前記第1ブロックを用いずコーディングされる場合、前記コーディングされた第1ブロックの残差を前記ビットストリームのうち廃棄可能領域に記録する手段と、を含む。
前述した技術的課題を解決するために、多階層のうち少なくとも一つの以上の階層が廃棄不可能領域と廃棄可能領域で形成されるビデオビットストリームを復号化するビデオデコーダは、前記廃棄不可能領域で第1ブロックを判読する手段と、前記第1ブロックのデータが存在すれば、前記第1ブロックのデータをデコーディングする手段と、前記第1ブロックのデータが存在しなければ、前記廃棄可能領域で前記第1ブロックと同一な識別字を有する第2ブロックのデータを判読する手段、および前記判読された第2ブロックのデータをデコーディングする手段と、を含む。
前述したように、スケーラビリティはオーバーヘッドを伴う。しかし、ストリーミングシステムでは、クライアントがスケーラブルビットストリームを必要としなければ、ビットストリームを前記クライアントに伝送するルータは低いビット率を有する非スケーラブルビットストリームを伝送することができる。
前述した本発明によれば、多階層基盤のビデオコーデックのコーディング性能が向上することができる。
また、前述した本発明によれば、スケーラブルビットストリームでスケーラビリティを必要としない場合に、前記スケーラブルビットストリームのオーバーヘッドを除去することができる。
図6は本発明の一実施形態によるビットストリーム伝送方法を示す図である。最初にエンコーダ11は、スケーラブルビットストリームを生成してこれをストリーミングサーバ役割をする各々のルータまたは抽出器32、33、34に提供する。そうすれば、最終クライアント機器15、16、17、18と接続された抽出器13、14は、抽出器に提供されたスケーラブルビットストリームを該当クライアント機器またはネットワーク帯域幅に適した非スケーラブルビットストリームに変換して伝送する。前記変換過程でスケーラビリティを維持するためのオーバーヘッドは除去されるためクライアント機器のビデオ品質は向上できる。
このような種類のクライアントの必要によるビットストリームの変換は時々“多重適応(multiple adaptation)”と呼ばれる。このような変換のためには、スケーラブルビットストリームが簡単に非スケーラブルビットストリームに変換できるフォーマットであることが要求される。本明細書で使用される次の用語を定義する。
−廃棄可能情報(Discardable information):現在階層をデコーディングするには必要であるが、上位階層をデコーディングには必要ではない情報。
−廃棄不可能情報(Non−discardable information):上位階層をデコーディングするに必要な情報。
本発明でスケーラブルビットストリームは、廃棄不可能情報および廃棄可能情報で構成されるが、前記二つの種類の情報は簡単に分離されなければならない。すなわち、この情報は二つの互いに異なるコーディングユニット(例:H.264で使用されるNALユニット)で分離されなければならない。最終ルータはクライアントが必要としないと判断すれば、ビットストリームの廃棄可能情報を捨てることを選択する。
このような本発明によるビットストリームを“スイッチングスケーラブルビットストリーム(switched scalable bitstream)”と称する。スイッチングスケーラブルビットストリームは廃棄可能ビットおよび廃棄不可能ビットが分離され得る一つの形態となっている。ビットストリーム抽出器(bitstream extractor)は、クライアントが必要としないことと判断する時には、廃棄可能情報を簡単に捨てることができる。したがって、スケーラブルビットストリームから非スケーラブルビットストリームへの転換が非常に容易となる。
図7は従来のH.264標準またはSVC標準によるビットストリームの構成を示す図である。H.264標準またはSVC標準において、一つのビットストリーム70は複数のNALユニット71、72、73、74で形成され、抽出器(extractor)はNALユニット単位で前記ビットストリーム70のうち一部を抽出することによってビデオ品質を変化させる。一つのNALユニットは、実際圧縮されたビデオデータが記録されるNALデータフィールド76と、前記圧縮されたビデオデータに対する付加情報が記録されるNALヘッダー75で形成される。
一般的にNALデータフィールド76のサイズは固定されておらず、そのサイズがNALヘッダー75に記録される。NALデータフィールド76は、少なくとも一つ以上(n個)のマクロブロック(MB、MB、MB)で構成され得、一つのマクロブロックはモーションデータ(モーションベクター、マクロブロックパターン、参照フレーム番号など)とテクスチャデータ(量子化された残差(residual)など)を含む。
図8は本発明の一実施形態によるビットストリームの構成を示す図である。本発明の一実施形態によるビットストリーム100は、廃棄不可能なNALユニット80と廃棄可能なNALユニット90で形成される。廃棄不可能な各々のNALユニット81、82、83、84のNALヘッダーには廃棄可能の可否を表すフラグであるdiscardable_flagが0と設定され、廃棄可能な各々のNALユニット91、92、93、94のNALヘッダーには前記discardable_flagが1と設定される。
前記discardable_flagが0ということは、NALユニットのNALデータフィールドに記録されたデータは上位階層のデコーディング過程で使われることを意味する。これに対し、前記discardable_flagが1ということはF、NALユニットのNALデータフィールドに記録されたデータが上位階層のデコーディング過程で使われないことを意味する。
SVC標準ではテクスチャデータを圧縮的に表現するために4つの予測方法を開示している。前記予測方法には、既存のH.264標準に含まれているインター予測(inter prediction)、方向的イントラ予測(directional intra prediction)(以下、イントラ予測という)だけではなく、図3のような多階層構造でのみ使用可能なイントラベース予測(intra base prediction)および残差予測(residual prediction)も含まれる。前記「予測」とは、エンコーダおよびビデオデコーダで共通に利用可能な情報から生成された予測データを用い、オリジナルデータを圧縮して表示する技法を意味する。
図9はインター予測、イントラ予測およびイントラベース予測の概念を説明する図である。
インター予測は、既存の単一階層構造を有するビデオコーデックでも一般的に使用される予測モードである。インター予測は、図9に示すように、参照ピクチャから現在ピクチャのどのようなブロック(現在ブロック)と最も類似なブロックを探索して、これから現在ブロックを最もよく表現できる予測ブロックを得た後、前記現在ブロックと前記予測ブロックとの差分を量子化する方式である。インター予測は、参照ピクチャを参照する方式に従い、二つの参照ピクチャが使われる両方向予測(bi−directional prediction)と、以前の参照ピクチャが使用される前方予測(forward prediction)と、以後参照ピクチャが使用される後方予測(backward prediction)などがある。
一方、イントラ予測は、現在ブロックの周辺ブロックのうち現在ブロックと隣接したピクセルを用い現在ブロックを予測する方式である。イントラ予測は現在ピクチャ内の情報のみを用い同一階層内の他のピクチャや他の階層のピクチャを参照しない点から他の予測方式と差がある。
イントラベース予測(intra base prediction)は、現在ピクチャが同一な時間的位置を有する下位階層のピクチャを有する場合に使用され得る。図2で示すように、現在ピクチャのマクロブロックは前記マクロブロックと対応する前記基礎ピクチャのマクロブロックから効率的に予測され得る。すなわち、現在ピクチャのマクロブロックと前記基礎ピクチャのマクロブロックとの差分が量子化される。
仮に、下位階層の解像度と現在階層の解像度が互いに異なる場合には、前記差分を求める前に前記基礎ピクチャのマクロブロックは前記現在階層の解像度にアップサンプリングされる。このようなイントラベース予測はインター予測の効率が高くない場合、例えば、動きが非常にはやい映像や場面の転換が生じる映像で特に効果的である。
最後に、残差予測は(図9には図示せず)既存の単一階層でのインター予測を多階層の形態で拡張したものである。すなわち、現在階層のインター予測過程で生成された差分を直接量子化するのではなく、前記差分と下位階層のインター予測過程で生成された差分をまた差し引き、その結果を量子化する技法である。
前記discardable_flagは、現在マクロブロックと対応する上位階層のマクロブロックが前記4つの予測技法のうちどのような技法でエンコーディングされたのかを基準に設定され得る。例えば、前記上位階層のマクロブロックがイントラ予測またはインター予測によってエンコーディングされたのであれば、現在マクロブロックはスケーラビリティをサポートするための用途に使われるだけであり、前記上位階層のマクロブロックをデコーディングするためには使われない。したがって、この場合には現在マクロブロックは廃棄可能なNALユニットに含まれ得る。これに対し、前記上位階層のマクロブロックがイントラベース予測または残差予測によってエンコーディングされたのであれば、現在マクロブロックは前記上位階層のマクロブロックをデコーディングするために必ず必要である。したがって、この場合には現在マクロブロックは廃棄不可能なNALユニットに含まれ得る。
上位階層のマクロブロックがどのような予測方式でエンコーディングされたのかはSVC標準によるintra_base_flagおよびresidual_prediction_flagを読み取ることで分かる。すなわち、上位階層のマクロブロックのintra_base_flagが1であれば、前記上位階層のマクロブロックをエンコーディングにイントラベース予測が使われたことが分かり、前記上位階層のマクロブロックのresidual_prediction_flagが1であれば、前記上位階層のマクロブロックをエンコーディングに残差予測が使われたことが分かる。イントラベース予測、残差予測のようにあるマクロブロックのエンコーディングにおいて、他の階層のマクロブロック情報を用いる予測技法を階層間予測(inter−layer prediction)であるともいう。
図10は、本発明の一実施形態によるビデオエンコーディング過程を示すフローチャートである。先ず、現在マクロブロックの残差(residual)が入力されれば(S1)、ビデオエンコーダは前記残差をコーディングする必要があるのかを判断する(S2)。一般的に、前記残差のエネルギー(残差の絶対値の合計または自乗の合計)が所定の臨界値より小さい場合には、コーディングする必要がないものと見なし、すなわち、前記残差を0と見なしてエンコーディングしない。
S2の判断結果、コーディングする必要がなければ(S2のいいえ)、前記現在マクロブロックのCBP(Coded Block Pattern)フラグを0と設定する(S7)。SVC標準では各マクロブロックに対してCBPフラグを記載することによって、該当マクロブロックがコーディングされたかの可否を表わし、ビデオデコーダ端では前記記載されたCBPフラグを読み該当マクロブロックのデコーディングの可否を判断する。
S2の判断結果、コーディングする必要があれば(S2のはい)、ビデオエンコーダは前記現在マクロブロックの残差をコーディングする(S3)。ここで、コーディングは空間的変換(DCT、ウェーブレット変換)、量子化、およびエントロピ符号化(可変の長さ符号化、算術符号化など)を含み得る。
その後、ビデオエンコーダは現在マクロブロックと対応する上位階層のマクロブロックが階層間予測されたのかを判断する(S4)。前述したように、階層間予測されたかの可否はintra_base_flagおよびresidual_prediction_flagを読み取ることで分かる。
S4の判断結果、階層間予測された場合(S4のはい)、ビデオエンコーダは現在マクロブロックに対するCBPフラグを1と設定して(S5)、前記コーディングされた現在マクロブロックの残差を廃棄不可能なNALユニット80に記録する(S6)。
S4の判断結果、階層間予測されなかった場合(S4のいいえ)、ビデオエンコーダは現在マクロブロックに対するCBPフラグを0と設定して、廃棄不可能なNALユニット80に記録する(S8)。そして、前記コーディングされた残差を廃棄可能なNALユニット90に記録し、これに対するCBPフラグを1と設定する(S9)。
図11は図10のフローチャートに従いコーディングされたマクロブロックの残差、すなわちマクロブロックデータ(MBn)を記録したビットストリーム100の例を図示する図である。ここで、一つのNALユニットはMBないしMBの5個のマクロブロックデータを含むものとする。
例えば、MBは、残差をコーディングする必要がない場合(図10のS2のいいえ)であり、MBおよびMBは対応する上位階層のマクロブロックが階層間予測された場合(図10のS4の例)であり、MBおよびMBは対応する上位階層のマクロブロックが階層間予測されない場合(図10のS4のいいえ)であると仮定する。
先ず、NALユニット81のNALヘッダーには廃棄不可能なNALユニットという情報が表示される。このような表示は、例えばNALヘッダーにdiscardable_flagを0と設定することで行われ得る。
前記MBのCBPフラグは0と設定されてMBはコーディングされず、記録されない(すなわち、CBPフラグ情報を含むマクロブロックヘッダーおよびモーション情報のみがNALユニット81に記録される)。そして、MBおよびMBはNALユニット81に記録されて各々CBPフラグ1と設定される。
MBおよびMBも実際に記録されるべきマクロブロックデータであるため、CBPフラグは1と設定されなければならないが、本発明で提案するスイッチングスケーラブルビットストリームを具現するため、前記MBおよびMBのCBPフラグは0と設定され、NALユニット81には記録されない。ビデオデコーダの立場から見れば、MBおよびMBは、コーディングされたマクロブロックデータが存在しないもののように見なされるであろう。しかし、本発明によってもMBおよびMBは無条件で削除されるのではなく、廃棄可能なNALユニット91に記録されて保存される。したがって、NALユニット91のNALヘッダーには廃棄可能なNALユニットという情報が表示される。このような表示は、例えばNALヘッダーにdiscardable_flagを1と設定することで行われ得る。
NALユニット91はNALユニット81に含まれるマクロブロックデータのうち少なくとも廃棄可能なデータを含む。すなわち、前記MBおよびMBはNALユニット91に記録される。この時、CBPフラグは1と設定されるのが好ましいが、廃棄可能なNALユニット91にはCBPフラグが0であるマクロブロックデータが記録される必要がないという点を考慮すればどのように設定されても構わない。
図11のビットストリーム100は従来のビットストリーム70に比べて廃棄可能情報および廃棄不可能情報に分離される特徴があり、この特徴を具現するために特別なオーバーヘッドが生じないことが分かる。ビデオエンコーダで生成されるこのような構造のビットストリーム100を伝送する途中にスケーラビリティをそのまま維持しなければならない時には、これに含まれた廃棄可能情報および廃棄不可能情報をそのまま維持すれば良い。これに対し、スケーラビリティを維持する必要がない時(例:伝送ルータが最終リンクに位置する場合)には前記廃棄可能情報は削除すれば良い。なぜなら、そのようにしてもスケーラビリティの特性のみがなくなるだけであって、上位階層のマクロブロックを復元することには全く支障がないからである。
図12は図11のようなビットストリーム100を受信したビデオデコーダが行うビデオデコーディング過程を示すフローチャートである。ビデオデコーダが受信するビットストリーム100が廃棄不可能な情報と廃棄可能な情報を含んでいる場合は、これに含まれた階層すなわち、現在階層が最上位の階層である場合である。本発明によれば、現在階層の上位階層のビットストリームをビデオデコーダがデコーディングする場合であれば、現在階層のビットストリームで廃棄可能なNALユニットは除去されたものであるからである。
ビデオデコーダはビットストリーム100の入力を受け(S11)、前記ビットストリーム100で廃棄不可能なNALユニットに含まれた現在マクロブロックのCBPフラグを読み込む(S21)。NALユニットが廃棄可能であるかの可否はNALユニットのNALヘッダーに記録されたdiscardable_flagを読み取ることで分かる。
前記読み込んだCBPフラグが1であれば(S22のいいえ)、ビデオデコーダは現在マクロブロックに記録されたデータを読み込み(S26)、これをデコーディングすることで現在マクロブロックに該当する映像を復元する(S25)。
前記CBPフラグが0である場合には、実際にコーディングされたデータがなく、0と記録された場合と、実際にはコーディングされたデータがあるが、そのデータが廃棄可能なNALユニットに移動されて記録された場合があり得る。したがって、ビデオデコーダは前記現在マクロブロックと同一な識別字を有するマクロブロックが廃棄可能なNALユニットに存在するかを判断する(S23)。前記識別字はマクロブロックを識別する番号を意味する。図11でNALユニット82のMB(識別字=3)は、そのCBPフラグが0と記録されているが、実際のデータはNALユニット91のMB(識別字=3)に記録されている。
したがって、S23の判断結果、ユニットに存在する場合(S23のはい)、ビデオデコーダは前記廃棄可能なNALユニットに存在するマクロブロックのデータを読み込む(S24)。そして、前記読み込んだデータをデコーディングすることで(S25)現在マクロブロックに該当する映像を復元する(S25)。
もちろん、S23の判断結果、ユニットが存在しない場合(S23のいいえ)は、現在マクロブロックに対して実際にコーディングされたデータがない場合である。
一方、ビデオエンコーダで実際に現在階層のマクロブロックをエンコーディングする時は、これに対応する上位階層のマクロブロックが予測過程で前記現在階層のマクロブロックを使うかの可否が分かり難い。したがって、既存のビデオコーディングスキームに何分の修正を加える必要がある。このような解決策として次の2種類の方法がある。
(解決策1:エンコーディング過程の修正)
最初の解決策は、エンコーディング過程を多少変更することである。図13はビデオシーケンスが三つの階層で形成されるシナリオの例を示すものである。重要なポイントは、上位階層の予測過程(インター予測、イントラ予測、イントラベース予測、残差予測など)を経た以後に現在階層をエンコーディングできるということである。
図13を参照すれば、ビデオエンコーダは先ず、所定の予測過程(インター予測またはイントラ予測)によって階層0のマクロブロック121に対する残差(residual)を求め、前記求めた残差を量子化/逆量子化する。次に、所定の予測過程(インター予測、イントラ予測、イントラベース予測、または残差予測)によって階層1のマクロブロック122に対する残差(residual)を求め、前記求めた残差を量子化/逆量子化する。その後、前記階層0のマクロブロック121をエンコーディングする。このように、前記階層0のマクロブロック121のエンコーディング前に階層1のマクロブロック122が予測過程を経たので、前記予測過程で階層0のマクロブロック121が使われたのかが分かる。これにしたがって、階層0のマクロブロック121を廃棄可能な情報で記録するのか、廃棄不可能な情報で記録するのかを決定することができる。
同様に、所定の予測過程(インター予測、イントラ予測、イントラベース予測、または残差予測)によって階層2のマクロブロック123に対する残差(residual)を求め、前記求めた残差を量子化/逆量子化する。次に、階層1のマクロブロック122をエンコーディングし、最後に階層2のマクロブロック123をエンコーディングする。
(解決策2:残差エネルギーの利用)
次の解決策は、現在マクロブロックの残差エネルギーを計算し、これを所定のしきい値と比較する方法である。マクロブロックの残差エネルギーはマクロブロック内の係数の絶対値の合計または前記係数の自乗の合計などで計算され得る。このような残差エネルギーが大きいほどコーディングされるデータの量が多いことを意味する。
仮に、現在マクロブロックの残差エネルギーが所定のしきい値より小さければ、対応する上位階層のマクロブロックは階層間予測を使用できないように制限する。この場合、現在マクロブロックの残差は廃棄可能なNALユニットでコーディングされる。これに対し、現在マクロブロックの残差エネルギーが所定のしきい値より大きければ、現在マクロブロックの残差は廃棄不可能NALユニットでコーディングされる。
解決策2は解決策1に比べてPSNRが多少減少させ得る短所がある。
本発明で提案するように、いくつかの残差情報を捨てることはビデオデコーダ端での計算の複雑性を減少することにつながる。これはその残差が捨てられたすべてのマクロブロックに対してパーシングおよび逆変換を行う必要がないからである。異なる方法で、マクロブロックでの付加的フラグをコーディングせず、このような計算の複雑性の得することも可能である。この方法で、SEI(Supplemental Enhancement Information)は上位階層の残差予測過程で使われないマクロブロックを示すため、エンコーダによってビデオデコーダに伝送される。前記SEIはビデオビットストリームには含まれないが、前記ビデオビットストリームと共に伝送される付加情報またはメタデータとしてSVC標準に含まれている。
現在SVC標準は、現在階層を推定するあいだ基礎階層情報のレート歪み費用(RD cost)を考慮しない。これは基礎階層情報が捨てられず、いつでも存在するものと見なされるため現在は必要とされない。
しかし、本発明のように、現在階層(上位階層を基準とした時の基礎階層)の残差情報が捨てられ得る状況では、上位階層で残差予測が行われるあいだ現在階層の残差をコーディングに必要なRD費用を考慮する必要がある。これはRD推定のあいだ現在マクロブロックビットに基礎階層残差ビットを加算することで成される。このようなRD推定は、基礎階層残差が捨てられた後に現在階層でのより高いRD性能につながるであろう。
本発明の概念を拡張して、多重レート歪み(multiple rate−distortion、MLRD)を用いたFGS階層のデッドサブストリーム(dead−substream)の最適化を考慮することができる。デッドサブストリームは上位階層をデコーディングするために必要なサブストリームである。SVC標準では、デッドサブストリームは不必要なピクチャまたは廃棄可能なサブストリームと呼ばれる。SVC標準でデッドサブストリームはNALヘッダーにあるdiscardable_flagによって識別される。サブストリームがデッドサブストリームであるのかを確認するまた他の間接的な方法はすべての上位階層のbase_id_plus1値をチェックし、その値がこのサブストリームを参照するのか確認することである。
次の図14はデッドサブストリームの例として多重適応が不可能なビットストリームを示している。FGS階層0は階層0および階層1をデコーディングに必要であるからである。ここで、CGS階層はFGS具現に必須の基礎品質階層を意味し、離散階層(discrete layer)とも呼ばれる。
一方、図15は多重適応に適したビットストリームを示す図である。図15で、FGS階層は階層間予測のために使われないため、ビデオデコーダまたはクライアントが単に階層1のみをデコーディングする必要があれば捨てられ得る。簡単に言えば、FGS階層0は階層1に適応したビットストリームでは捨てられ得る。しかし、クライアントが階層1および階層0をすべてデコーディングするオプションを必要とすれば、FGS階層0は捨てられない。
これは、多重適応が必要な場合にはレート歪みに対する折衝(trade−off)につながる。予測される階層のRD最適選択をするために多重階層RD予測で記述される原則を使うことも可能である。
段階1:基礎品質レベル(CGS階層0)から階層間予測を使用する。
前記フレームに対してRD費用を計算する。FrameRd0 = FrameDistortion + Lambda*FrameBits
段階2:基礎品質レベル1(CGS階層0)から階層間予測を使用する。
前記フレームに対してRD費用を計算する。FrameRd1 = FrameDistortion + Lambda*(FrameBits + FGSLayer0Bits)
本発明では多重適応を可能とするために、FGS階層から階層間予測にペナルティを与えているということに注目する必要がある。
段階3:RD費用を計算し最上を選択する。FrameRD1がFrameRD0より小さければ、このフレームは、階層1のみのビットストリームに対するビット率を減少させるために多重適応(本例では階層1に対する適応)を使用することができる。
一方、デッドサブストリームおよび多重RD費用を時間的レベルに対して概念を拡張することも可能である。次の図16は時間的レベルを用いた多重適応の例として階層的B(hierarchical B)構造およびSVCの階層間予測の概念を示している。
これに対し、本発明の一実施形態による概念を示す図17において、階層間予測は階層0の最上位の時間的レベルから使用されない。これは、階層1のみのビットストリーム(すなわち、階層1のみのデコーディングのために適応したビットストリーム)で、階層0の最上位の時間的レベルは不必要であり、捨てられ得ることを意味する。階層間予測を使うかの可否に関する決定は多重RD推定を使用しなされ得る。
図18のビットストリームは階層0でデコーディングされ得る。これは階層0が時間的予測のためにFGS階層を使用しないからである。すなわち、階層1に適応されたビットストリームは階層0で相変らずデコーディングが可能である。しかし、これはすべての状況でデコーディングが可能とは限らない。
階層0は時間的予測のためにクローズループ予測を使用する。これはFGS階層0を切り取ったり捨てたりするのは階層0がデコーディングされる時、ドリフト/歪みを生じさせることを意味する。このような状況で、前記ビットストリームが階層1に適応されていれば(フレーム1のFGS階層0を捨てることによって)、このように適応されたビットストリームを用い、階層0をデコーディングする場合、問題(ドリフト/ PSNRの低下)となり得る。
一般的に、クライアントは階層1のために適応されたビットストリームから階層0をデコーディングしようとしない。しかし、ビットストリームで階層1に適応されているという事実が表示されなければ、このような状況も生じ得るものである。したがって、本発明では別途のSEIメッセージの部分で次のような情報を追加することを提案する。
scalability_info( payloadSize ) {
...
multiple_adaptation_info_flag[i]
...
if (multiple_adaptation_info_flag[ i ]) {
can_decode_layer[i]
if(can_decode_layer[i])

decoding_drift_info[i]


ここで、「can_decode_layer[i]」フラグは前記階層がデコーディング可能であるかの可否を示す。前記階層がデコーディング可能であれば、前記階層がデコーディング可能な場合に生じ得るドリフトに関する情報を伝送することが可能である。
SVCは品質階層情報SEIメッセージを使用しFGS階層のRD性能を示す。これは接近ユニットのFGS階層がどれほど敏感であるのかを示し得る。例えば、階層的BでIおよびPピクチャは切り取りに非常に敏感である。さらに高い時間的レベルは切り取りにそれほど敏感ではないであろう。したがって抽出器はこの情報を使用し多様な接近ユニットで最適にFGS階層を切り取ることができる。本発明で提案する品質階層情報SEIメッセージのフォーマットは次のとおりである。
quality_layers_info( payloadSize ) {
dependency_id
num_quality_layers
for( i = 0と、i < num_quality_layersと、i++ ) {
quality_layer[ i ]
delta_quality_layer_byte_offset[ i ]

現在品質階層のメッセージは、現在階層のためにすなわち、現在階層のFGS階層が捨てられる時の品質/レート性能で定義される。しかし、前述したように、多重適応の場合に基礎階層のFGS階層は切り取ることができる。したがって、次のような階層間の品質階層SEIメッセージを伝送することが可能である。前記FGS階層を切り取ることによって生じるドリフトは時間的予測に関する階層間予測の性能にかかっている。
interlayer_quality_layers_info( payloadSize ) {
dependency_id
base_dependency_id
num_quality_layers
for( i = 0; i < num_quality_layers; i++ ) {
interlayer_quality_layer[ i ]
interlayer_delta_quality_layer_byte_offset[ i ]

ビットストリーム抽出器は、ビットストリームを切り取らなければならない時、quality_layers_info、およびinterlayer_quality_layers_info SEIメッセージに依存して現在階層FGSまたは基礎階層のFGSを切り取るかの可否を決定することができる。
図20は本発明の一実施形態によるビデオエンコーダ300の構成を図示するブロック図である。
先ず、階層0のマクロブロック(MB)は予測部110で、前記マクロブロック(MB)に対応する(時間的、空間的に対応する)階層1のマクロブロック(MB)は予測部210に入力される。
予測部110は、インター予測またはイントラ予測によって予測ブロックを求め、前記MBで前記予測ブロックを差し引きして残差(residual:R0)を求める。前記インター予測はモーションベクターおよびマクロブロックパターンを求めるモーション推定過程と、前記モーションベクターによって参照されるフレームをモーション補償するモーション補償過程を含む。
コーディング判断部120は、前記求めた残差(R0)をコーディングする必要があるかを判断する。すなわち、前記残差(R0)のエネルギーが所定の臨界値より小さい場合には前記残差(R0)に属する値をすべて0と見なしてビットストリーム生成部に通知する。この時、前記残差(R0)はコーディング部130でコーディングされない。前記判断結果、コーディングする必要がある場合には前記求めた残差(R0)をコーディング部130に提供する。
コーディング部130は、前記提供されていた残差(R0)をエンコーディングする。これのためにコーディング部130は空間的変換部131、量子化部132、およびエントロピ符号化部133を含み構成され得る。
空間的変換部131は、前記残差(R0)に対して、空間的変換を行い変換係数を生成する。このような空間的変換方法では、DCT(Discrete Cosine Transform)、ウェーブレット変換(wavelet transform)などが使用され得る。DCTを使用する場合前記変換係数はDCT係数となり、ウェーブレット変換を使用する場合前記変換係数はウェーブレット係数となる。
量子化部132は、前記変換係数を量子化(quantization)する。前記量子化(quantization)は任意の実数値で表現される前記変換係数を不連続的な値(discrete value)で示す過程を意味する。例えば、量子化部125は、任意の実数値で表現される前記変換係数を所定の量子化ステップ(quantization step)で分け、その結果を整数値で四捨五入する方法で量子化を行うことができる。
エントロピ符号化部133は、量子化部132から提供される量子化結果を無損失符号化する。このような無損失符号化方法では、ハフマンコーディング(Huffman coding)、算術符号化(arithmetic coding)、可変長符号化(variable length coding)、その他多様な方法が利用される。
一方、量子化部132で量子化された結果は、階層1の予測部210での階層間予測で使用され得るように逆量子化部134によって逆量子化過程および逆空間的変換部135による逆変換過程を経る。
MBは対応する下位階層のマクロブロックMBが存在するため、予測部210はインター予測、イントラ予測以外にもイントラベース予測、残差予測のような階層間予測も使用することができる。予測部210は、多様な予測技法のうちRD費用を最小とする予測技法を選択し、選択された予測技法によってMBに対する予測ブロックを求めた後、前記MBで前記予測ブロックを差し引きして、残差(R1)を求める。この時、予測部210はイントラベース予測を用いた場合にはintra_base_flagを1とし(予測を用いない場合は0と設定する)、残差予測を用いた場合にはresidual_prediction_flagを1(予測を用いない場合は0と設定する)と設定する。
階層0でのようにコーディング部230も前記残差(R1)をエンコーディングし、これのために空間的変換部231、量子化部232、およびエントロピ符号化部233で構成され得る。
ビットストリーム生成部140は、本発明の実施形態によるスイッチングスケーラブルビットストリームを生成する。これのために、ビットストリーム生成部140はコーディング判断部120で現在マクロブロックの残差(R0)をコーディングする必要がないと判断されれば、CBPフラグを0と設定して前記残差をビットストリームに含まない。一方、実際に残差(R0)がコーディング部130でコーディングされて提供されれば、ビットストリーム生成部140は予測部210で前記MBが階層間予測(イントラベース予測または残差予測)されたのかを判断する。このような判断は、予測部210から提供されるresidual_prediction_flagまたはintra_base_flagを読み取ることで可能である。
ビットストリーム生成部140は、前記判断結果、階層間予測された場合、コーディングされたマクロブロックデータを廃棄不可能なNALユニットに記録し、階層間予測されなかった場合、前記コーディングされたマクロブロックデータは廃棄可能なNALユニットに記録して、廃棄不可能なNALユニットには前記コーディングされたマクロブロックデータのCBPフラグを0と設定する。この時、廃棄不可能なNALユニットはdiscarable_flagが0と設定されて、廃棄不可能なNALユニットはdiscardable_flagが1と設定される。ビットストリーム生成部140はこのような過程を通して図11のような階層0のビットストリームを生成して、コーディング部230から提供されるコーディングされたデータから階層1のビットストリームを生成する。生成された階層0のビットストリームと生成された階層1のビットストリームは結合されて一つのビットストリームが出力される。
図21は、本発明の一実施形態によるビデオデコーダ400の構成を図示するブロック図である。ここで入力されるビットストリームは図11のような廃棄不可能情報と廃棄可能情報を含む。
ビットストリームパーザ410は前記ビットストリームで廃棄不可能なNALユニットに含まれた現在マクロブロックのCBPフラグを読み込む。NALユニットが廃棄可能であるかの可否はNALユニットのNALヘッダーに記録されたdiscardable_flagを読み取ることで分かる。前記読み込んだCBPフラグが1であれば、ビットストリームパーザ410は現在マクロブロックに記録されたデータを読み込みデコーディング部420に提供する。
前記CBPフラグが0である場合には、ビットストリームパーザ410は前記現在マクロブロックと同一な識別字を有するマクロブロックが廃棄可能なNALユニットに存在するかを判断する。前記判断結果、存在した場合には、ビットストリームパーザ410は前記廃棄可能なNALユニットに存在するマクロブロックのデータを読み込み、これをデコーディング部420に提供する。
仮に、前記現在マクロブロックと同一な識別字を有するマクロブロックが廃棄可能なNALユニットに存在しない場合には、現在マクロブロックデータが存在しないこと(データがすべて0である)を逆予測部424に通知する。
デコーディング部420は、ビットストリームパーザ410から提供されたマクロブロックデータをデコーディングし、所定階層のマクロブロックに対する映像を復元する。これのためにデコーディング部420はエントロピ復号化部421、逆量子化部422、逆空間的変換部423、および逆予測部424を含み得る。
エントロピ復号化部421は提供されたビットストリームに対して無損失復号化を行う。前記無損失復号化は、ビデオエンコーダ300段での無損失復号化過程の逆に行われる過程である。
逆量子化部422は、前記無損失復号化されたデータを逆量子化する。このような逆量子化過程はビデオエンコーダ300での量子化過程で使われたものと同一な量子化テーブルを用い、量子化過程で生成されたインデックスからそれにマッチされる値を復元する過程である。
逆空間的変換部423は、前記逆量子化された結果に対して逆変換を行う。このような逆変換は、ビデオエンコーダ300での空間的変換過程の逆に行われ、具体的に逆DCT変換、逆ウェーブレット変換などが使用され得る。前記逆変換結果、残差信号(R0)が復元される。
前記残差信号(R0)は、逆予測部424でビデオエンコーダ300の予測部110と対応する方式で逆予測される。前記逆予測は、予測部110と同様に求めた予測ブロックと前記残差信号(R0)を加算する方式で行われる。
前記図20および図21に記載された各構成要素は、メモリ上の所定領域で行われるタスク、クラス、サブルーチン、プロセス、オブジェクト、実行スレッド、プログラムのようなソフトウェア(software)や、FPGA(field−programmable gate array)やASIC(application−specific integrated circuit)のようなハードウェア(hardware)で具現され得、また前記ソフトウェアおよびハードウェアの組み合わせで形成され得る。前記構成要素は、コンピュータで判読可能な保存媒体に含まれ得、複数のコンピュータにその一部が分散して分布され得る。
以上添付された図面を参照し、本発明の実施形態について説明したが、本発明が属する技術分野における通常の知識を有する者は、本発明を、その技術的思想や必須の特徴を変更しない範囲で、他の具体的な形態において実施されうることを理解することができる。したがって、上記実施形態はすべての面で例示的なものであり、限定的なものではないと理解しなければならない。
従来のトランスコーディングによるサイマルキャスティング(simulcasting)過程を示す図である。 従来のSVC標準によるビットストリームの伝送過程を示す図である。 多階層を用いたスケーラブルビデオコーディング構造を示す図である。 非スケーラブルビットストリームの品質とスケーラブルビットストリームの品質を比較したグラフである。 非スケーラブルビットストリームの品質とスケーラブルビットストリームの品質を比較したグラフである。 本発明の一実施形態によるビットストリームの伝送方法を示す図である。 従来のH.264標準またはSVC標準によるビットストリームの構成を示す図である。 本発明の一実施形態によるビットストリーム構成を示す図である。 インター予測、イントラ予測およびイントラベース予測の概念を説明する図面である。 本発明の一実施形態によるビデオエンコーディング過程を示すフローチャートである。 図8のビットストリームのより詳しい構造の例を図示する図面である。 ビデオデコーダが行うビデオデコーディング過程を示すフローチャートである。 ビデオシーケンスが3個の階層で形成される場合を示す図面である。 FGSでデッドサブストリームの例で多重適応が不可能なビットストリームを示す図である。 FGSにおいて多重適応に適したビットストリームを示す図である。 時間的レベルを用いた多重適応の例を示す図である。 本発明の一実施形態による時間的レベルを用いた多重適応の例を示す図である。 CGS階層間には時間的予測が形成される例を示す図である。 CGS階層とFGS階層間に時間的予測が形成される例を示す図である。 本発明の一実施形態によるビデオエンコーダの構成を図示するブロック図である。 本発明の一実施形態によるビデオデコーダの構成を図示するブロック図である。
符号の説明
110、210 予測部
120 コーディング判断部
130、230 コーディング部
131、231 空間的変換部
132、232 量子化部
133、233 エントロピ符号化部
134、422 逆量子化部
135、423 逆空間的変換部
140 ビットストリーム生成部
300 ビデオエンコーダ
400 ビデオデコーダ
410 ビットストリームパーザ
421 エントロピ復号化部
424 逆予測部

Claims (21)

  1. 多階層で形成されるビデオシーケンスを符号化するビデオエンコーディング方法であって、
    (a)前記多階層のうち第1階層に存在する第1ブロックの残差をコーディングする段階と、
    (b)前記多階層のうち第2階層に存在し、前記第1ブロックと対応する第2ブロックが、前記第1ブロックを用いコーディングされる場合、前記コーディングされた第1ブロックの残差をビットストリームのうちデータフィールドに設けた、廃棄不可能であることを示すフラグを設けたコーディングユニットよりなる廃棄不可能領域に記録する段階、および
    (c)前記第2ブロックが前記第1ブロックを用いずコーディングされる場合、前記コーディングされた第1ブロックの残差を前記ビットストリームのうちデータフィールドに設けた、廃棄可能であることを示すフラグを設けたコーディングユニットよりなる廃棄可能領域に記録する段階とを含むビデオエンコーディング方法。
  2. 前記第1ブロックおよび前記第2ブロックはマクロブロックである請求項1に記載のビデオエンコーディング方法。
  3. 前記廃棄不可能領域は、discardable_flagが0と設定された複数のNALユニットで構成され、前記廃棄可能領域は、discardable_flagが1と設定された複数のNALユニットで構成される請求項1に記載のビデオエンコーディング方法。
  4. 前記(a)段階は、
    空間的変換過程、量子化過程、およびエントロピ符号化過程を含む請求項1に記載のビデオエンコーディング方法。
  5. 前記(b)段階は、
    前記記録された第1ブロックの残差に対してCBPフラグを1と設定する段階を含む請求項1に記載のビデオエンコーディング方法。
  6. 前記(c)段階は、
    前記記録された第2ブロックの残差に対するCBPフラグを0と設定して、前記廃棄不可能領域に記録する段階を含む請求項1に記載のビデオエンコーディング方法。
  7. 前記第2ブロックが前記第1ブロックを用いコーディングされる場合は、
    前記第2ブロックが前記第1ブロックに基づいた階層間予測によってコーディングされる場合である請求項1に記載のビデオエンコーディング方法。
  8. 前記第2ブロックが前記第1ブロックを用いずコーディングされる場合は、
    前記第2ブロックがインター予測またはイントラ予測によってコーディングされる場合である請求項1に記載のビデオエンコーディング方法。
  9. 前記廃棄不可能領域および前記廃棄可能領域は、
    SEIメッセージ(Supplemental Enhancement Information)によって表示される請求項1に記載のビデオエンコーディング方法。
  10. 多階層のうち少なくとも一つの以上の階層が廃棄不可能領域と廃棄可能領域で形成されるビデオビットストリームを復号化するビデオデコーディング方法であって、
    (a)前記ビデオビットストリームのデータフィールドに設けられた、廃棄不可能であることを示すフラグを設けたコーディングユニットよりなる前記廃棄不可能領域で第1ブロックを判読する段階と、
    (b)前記第1ブロックのデータが存在すれば、前記第1ブロックのデータをデコーディングする段階と、
    (c)前記第1ブロックのデータが存在しなければ、前記ビデオビットストリームのデータフィールドに設けられた、廃棄可能であることを示すフラグを設けたコーディングユニットよりなる前記廃棄可能領域で前記第1ブロックと同一な識別字を有する第2ブロックのデータを判読する段階、および
    (d)前記判読された第2ブロックのデータをデコーディングする段階とを含むビデオデコーディング方法。
  11. 前記第1ブロックのデータが存在するかは、
    前記第1ブロックのCBPフラグによって判断する請求項10に記載のビデオデコーディング方法。
  12. 前記第1ブロックおよび前記第2ブロックはマクロブロックである請求項10に記載のビデオデコーディング方法。
  13. 前記識別字は、
    マクロブロックを識別する番号である請求項12に記載のビデオデコーディング方法。
  14. 前記第1ブロックのデータが存在する場合、前記廃棄不可能領域に記録された前記第1ブロックのCBPフラグは1であり、前記第1ブロックのデータが存在しない場合、前記廃棄不可能領域に記録された前記第1ブロックのCBPフラグは0である請求項10に記載のビデオデコーディング方法。
  15. 前記少なくとも一つ以上の階層は多階層のうち最上位階層を含む請求項10に記載のビデオデコーディング方法。
  16. 前記廃棄不可能領域はdiscardable_flagが0と設定された複数のNALユニットで構成され、前記廃棄可能領域はdiscardable_flagが1と設定された複数のNALユニットで構成される請求項10に記載のビデオデコーディング方法。
  17. 前記廃棄不可能領域および前記廃棄可能領域は、
    SEIメッセージ(Supplemental Enhancement Information)によって表示される請求項10に記載のビデオデコーディング方法。
  18. SEIメッセージは、
    ビデオエンコーダによって作成される請求項17に記載のビデオデコーディング方法。
  19. 前記(b)段階および前記(d)段階は、
    エントロピ復号化過程、逆量子化過程、逆空間的変換過程、および逆予測過程を含む請求項10に記載のビデオデコーディング方法。
  20. 多階層で形成されるビデオシーケンスを符号化するビデオエンコーダであって、
    前記多階層のうち第1階層に存在する第1ブロックの残差をコーディングする手段と、
    前記多階層のうち第2階層に存在し、前記第1ブロックと対応する第2ブロックが、前記第1ブロックを用いコーディングされる場合、前記コーディングされた第1ブロックの残差をビットストリームのうちデータフィールドに設けた、廃棄不可能であることを示すフラグを設けたコーディングユニットよりなる廃棄不可能領域に記録する手段、および
    前記第2ブロックが前記第1ブロックを用いずコーディングされる場合、前記コーディングされた第1ブロックの残差を前記ビットストリームのうちデータフィールドに設けた、廃棄可能であることを示すフラグを設けたコーディングユニットよりなる廃棄可能領域に記録する手段とを含むビデオエンコーダ。
  21. 多階層のうち少なくとも一つの以上の階層が廃棄不可能領域と廃棄可能領域で形成されるビデオビットストリームを復号化するビデオデコーダであって、
    前記ビデオビットストリームのデータフィールドに設けられた、廃棄不可能であることを示すフラグを設けたコーディングユニットよりなる前記廃棄不可能領域で第1ブロックを判読する手段と、
    前記第1ブロックのデータが存在すれば、前記第1ブロックのデータをデコーディングする手段と、
    前記第1ブロックのデータが存在しなければ、前記ビデオビットストリームのデータフィールドに設けられた、廃棄可能であることを示すフラグを設けたコーディングユニットよりなる前記廃棄可能領域で前記第1ブロックと同一な識別字を有する第2ブロックのデータを判読する手段、および
    前記判読された第2ブロックのデータをデコーディングする手段とを含むビデオデコーダ。
JP2008543173A 2005-11-29 2006-10-26 多階層を基盤としたスケーラブルビデオコーディング方法および装置 Expired - Fee Related JP4833296B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US74025105P 2005-11-29 2005-11-29
US60/740,251 2005-11-29
US75789906P 2006-01-11 2006-01-11
US60/757,899 2006-01-11
US75996606P 2006-01-19 2006-01-19
US60/759,966 2006-01-19
KR10-2006-0026603 2006-03-23
KR1020060026603A KR100772868B1 (ko) 2005-11-29 2006-03-23 복수 계층을 기반으로 하는 스케일러블 비디오 코딩 방법및 장치
PCT/KR2006/004392 WO2007064082A1 (en) 2005-11-29 2006-10-26 Scalable video coding method and apparatus based on multiple layers

Publications (2)

Publication Number Publication Date
JP2009517959A JP2009517959A (ja) 2009-04-30
JP4833296B2 true JP4833296B2 (ja) 2011-12-07

Family

ID=38354583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008543173A Expired - Fee Related JP4833296B2 (ja) 2005-11-29 2006-10-26 多階層を基盤としたスケーラブルビデオコーディング方法および装置

Country Status (6)

Country Link
US (1) US20070121723A1 (ja)
EP (1) EP1955546A4 (ja)
JP (1) JP4833296B2 (ja)
KR (1) KR100772868B1 (ja)
CN (1) CN101336549B (ja)
WO (1) WO2007064082A1 (ja)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8442108B2 (en) * 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
US8374238B2 (en) * 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
JP2009507450A (ja) 2005-09-07 2009-02-19 ヴィドヨ,インコーポレーテッド 高信頼性基本層トランクに関するシステムおよび方法
US7956930B2 (en) * 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
KR20070108434A (ko) * 2006-01-09 2007-11-12 한국전자통신연구원 SVC(Scalable Video Coding)파일포맷에서의 데이터 공유 개선방법
US8619865B2 (en) * 2006-02-16 2013-12-31 Vidyo, Inc. System and method for thinning of scalable video coding bit-streams
JP2009540625A (ja) * 2006-02-16 2009-11-19 ヴィドヨ,インコーポレーテッド スケーラブルビデオコーディングビットストリームのシニングのためのシステムおよび方法
FR2903556B1 (fr) * 2006-07-04 2008-10-03 Canon Kk Procedes et des dispositifs de codage et de decodage d'images, un systeme de telecommunications comportant de tels dispositifs et des programmes d'ordinateur mettant en oeuvre de tels procedes
US8422555B2 (en) 2006-07-11 2013-04-16 Nokia Corporation Scalable video coding
WO2008042852A2 (en) * 2006-09-29 2008-04-10 Vidyo, Inc. System and method for multipoint conferencing with scalable video coding servers and multicast
KR100773761B1 (ko) * 2006-09-14 2007-11-09 한국전자통신연구원 동영상 부호화 장치 및 방법
US7991236B2 (en) 2006-10-16 2011-08-02 Nokia Corporation Discardable lower layer adaptations in scalable video coding
US20080095235A1 (en) * 2006-10-20 2008-04-24 Motorola, Inc. Method and apparatus for intra-frame spatial scalable video coding
US8315466B2 (en) * 2006-12-22 2012-11-20 Qualcomm Incorporated Decoder-side region of interest video processing
MX2009007696A (es) * 2007-01-18 2009-09-04 Nokia Corp Carro de mensajes de informacion de mejoramiento suplementario en formato de carga util de protocolo de transporte en tiempo real.
US20080181298A1 (en) * 2007-01-26 2008-07-31 Apple Computer, Inc. Hybrid scalable coding
WO2008130500A2 (en) 2007-04-18 2008-10-30 Thomson Licensing Coding systems
US20140072058A1 (en) 2010-03-05 2014-03-13 Thomson Licensing Coding systems
RU2010102823A (ru) * 2007-06-26 2011-08-10 Нокиа Корпорейшн (Fi) Система и способ индикации точек переключения временных уровней
US8526489B2 (en) * 2007-09-14 2013-09-03 General Instrument Corporation Personal video recorder
CN101415114B (zh) * 2007-10-17 2010-08-25 华为终端有限公司 视频编解码方法和装置以及视频编解码器
EP2225882A2 (fr) * 2007-11-30 2010-09-08 France Telecom Procede de codage d'un flux video echelonnable a destination d'utilisateurs de differents profils
KR101375663B1 (ko) * 2007-12-06 2014-04-03 삼성전자주식회사 영상을 계층적으로 부호화/복호화하는 방법 및 장치
US8126054B2 (en) * 2008-01-09 2012-02-28 Motorola Mobility, Inc. Method and apparatus for highly scalable intraframe video coding
US8953673B2 (en) * 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US8386271B2 (en) * 2008-03-25 2013-02-26 Microsoft Corporation Lossless and near lossless scalable audio codec
US20110110436A1 (en) * 2008-04-25 2011-05-12 Thomas Schierl Flexible Sub-Stream Referencing Within a Transport Data Stream
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
IT1394245B1 (it) * 2008-09-15 2012-06-01 St Microelectronics Pvt Ltd Convertitore per video da tipo non-scalabile a tipo scalabile
KR101377660B1 (ko) * 2008-09-30 2014-03-26 에스케이텔레콤 주식회사 복수 개의 움직임 벡터 추정을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR100970388B1 (ko) * 2008-10-31 2010-07-15 한국전자통신연구원 네트워크 흐름기반 스케일러블 비디오 코딩 적응 장치 및 그 방법
EP2194717A2 (en) * 2008-12-08 2010-06-09 Electronics and Telecommunications Research Institute Method for generating and processing hierarchical PES packet for digital satellite broadcasting based on SVC video
KR101220175B1 (ko) 2008-12-08 2013-01-11 연세대학교 원주산학협력단 Svc 비디오 기반의 디지털 위성 방송을 위한 계층 분리형 pes 패킷 생성 및 처리 방법
KR101597987B1 (ko) * 2009-03-03 2016-03-08 삼성전자주식회사 계층 독립적 잔차 영상 다계층 부호화 장치 및 방법
US9485299B2 (en) * 2009-03-09 2016-11-01 Arris Canada, Inc. Progressive download gateway
US9197677B2 (en) * 2009-03-09 2015-11-24 Arris Canada, Inc. Multi-tiered scalable media streaming systems and methods
EP2257073A1 (en) * 2009-05-25 2010-12-01 Canon Kabushiki Kaisha Method and device for transmitting video data
WO2011005303A1 (en) 2009-07-06 2011-01-13 Thomson Licensing Methods and apparatus for spatially varying residue coding
US8566393B2 (en) * 2009-08-10 2013-10-22 Seawell Networks Inc. Methods and systems for scalable video chunking
KR20180028430A (ko) * 2010-02-17 2018-03-16 한국전자통신연구원 초고해상도 영상을 부호화하는 장치 및 방법, 그리고 복호화 장치 및 방법
US8654768B2 (en) * 2010-02-26 2014-02-18 Cisco Technology, Inc. Source specific transcoding multicast
US8190677B2 (en) 2010-07-23 2012-05-29 Seawell Networks Inc. Methods and systems for scalable video delivery
CN103098472A (zh) * 2010-09-14 2013-05-08 三星电子株式会社 用于分层图像编码和解码的方法和设备
CN108848379A (zh) 2010-12-07 2018-11-20 韩国电子通信研究院 视频编解码方法、生成比特流的方法和存储比特流的介质
US9118939B2 (en) * 2010-12-20 2015-08-25 Arris Technology, Inc. SVC-to-AVC rewriter with open-loop statistical multiplexer
TWI473503B (zh) * 2011-06-15 2015-02-11 Nat Univ Chung Cheng Mobile forecasting method for multimedia video coding
CN103200399B (zh) * 2012-01-04 2016-08-31 北京大学 基于可伸缩视频编码的控制视频质量波动的方法及装置
KR20130080324A (ko) * 2012-01-04 2013-07-12 한국전자통신연구원 실감형 방송을 위한 스케일러블 비디오 코딩 장치 및 방법
US9712887B2 (en) 2012-04-12 2017-07-18 Arris Canada, Inc. Methods and systems for real-time transmuxing of streaming media content
WO2014000168A1 (en) 2012-06-27 2014-01-03 Intel Corporation Cross-layer cross-channel residual prediction
US9906786B2 (en) * 2012-09-07 2018-02-27 Qualcomm Incorporated Weighted prediction mode for scalable video coding
WO2014047877A1 (en) 2012-09-28 2014-04-03 Intel Corporation Inter-layer residual prediction
CN104717501A (zh) * 2012-09-28 2015-06-17 英特尔公司 层间像素样本预测
US10085017B2 (en) * 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
US9357211B2 (en) * 2012-12-28 2016-05-31 Qualcomm Incorporated Device and method for scalable and multiview/3D coding of video information
KR102539065B1 (ko) 2013-01-04 2023-06-01 지이 비디오 컴프레션, 엘엘씨 효율적인 확장가능한 코딩 개념
JP6449241B2 (ja) 2013-04-08 2019-01-09 ジーイー ビデオ コンプレッション エルエルシー 効率的なマルチビュー/レイヤ符号化を可能とする符号化コンセプト
US10284858B2 (en) * 2013-10-15 2019-05-07 Qualcomm Incorporated Support of multi-mode extraction for multi-layer video codecs
US9591316B2 (en) * 2014-03-27 2017-03-07 Intel IP Corporation Scalable video encoding rate adaptation based on perceived quality
US20180027244A1 (en) * 2016-07-21 2018-01-25 Mediatek Inc. Video encoding apparatus with video encoder adaptively controlled according to at least transmission status of communication link and associated video encoding method
US11140445B1 (en) 2020-06-03 2021-10-05 Western Digital Technologies, Inc. Storage system and method for storing scalable video
CN114499765B (zh) * 2022-04-14 2022-08-16 航天宏图信息技术股份有限公司 一种基于北斗短报文的数据传输方法和系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008544615A (ja) * 2005-07-13 2008-12-04 ノキア コーポレイション スケーラブルビデオ符号化における符号化依存性の表示

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5883893A (en) * 1996-09-10 1999-03-16 Cisco Technology, Inc. ATM voice transport protocol
US6104998A (en) * 1998-03-12 2000-08-15 International Business Machines Corporation System for coding voice signals to optimize bandwidth occupation in high speed packet switching networks
KR20010105361A (ko) * 1999-12-28 2001-11-28 요트.게.아. 롤페즈 Snr 스케일가능 비디오 엔코딩 방법 및 대응 디코딩 방법
US7095782B1 (en) * 2000-03-01 2006-08-22 Koninklijke Philips Electronics N.V. Method and apparatus for streaming scalable video
US6925120B2 (en) * 2001-09-24 2005-08-02 Mitsubishi Electric Research Labs, Inc. Transcoder for scalable multi-layer constant quality video bitstreams
EP1442602A1 (en) * 2001-10-26 2004-08-04 Koninklijke Philips Electronics N.V. Spatial scalable compression scheme using adaptive content filtering
FI114433B (fi) * 2002-01-23 2004-10-15 Nokia Corp Otossiirtymän koodaaminen videokoodauksessa
CN100568964C (zh) * 2003-02-18 2009-12-09 诺基亚有限公司 图像解码方法
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
KR20050090302A (ko) * 2004-03-08 2005-09-13 경희대학교 산학협력단 비디오 인코더/디코더, 비디오 인코딩/디코딩 방법, 그방법을 수행하는 프로그램이 기록된 컴퓨터 판독가능한기록매체
US20060008009A1 (en) * 2004-07-09 2006-01-12 Nokia Corporation Method and system for entropy coding for scalable video codec
US20060062312A1 (en) * 2004-09-22 2006-03-23 Yen-Chi Lee Video demultiplexer and decoder with efficient data recovery
US7725593B2 (en) * 2005-07-15 2010-05-25 Sony Corporation Scalable video coding (SVC) file format

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008544615A (ja) * 2005-07-13 2008-12-04 ノキア コーポレイション スケーラブルビデオ符号化における符号化依存性の表示

Also Published As

Publication number Publication date
KR100772868B1 (ko) 2007-11-02
CN101336549B (zh) 2011-01-26
KR20070056896A (ko) 2007-06-04
JP2009517959A (ja) 2009-04-30
US20070121723A1 (en) 2007-05-31
EP1955546A4 (en) 2015-04-22
CN101336549A (zh) 2008-12-31
WO2007064082A1 (en) 2007-06-07
EP1955546A1 (en) 2008-08-13

Similar Documents

Publication Publication Date Title
JP4833296B2 (ja) 多階層を基盤としたスケーラブルビデオコーディング方法および装置
KR100703724B1 (ko) 다 계층 기반으로 코딩된 스케일러블 비트스트림의비트율을 조절하는 장치 및 방법
US8351502B2 (en) Method and apparatus for adaptively selecting context model for entropy coding
US7262721B2 (en) Methods of and apparatuses for adaptive entropy encoding and adaptive entropy decoding for scalable video encoding
JP4991699B2 (ja) ビデオ信号のスケーラブルなエンコーディング方法およびデコーディング方法
US8155181B2 (en) Multilayer-based video encoding method and apparatus thereof
JP5179484B2 (ja) マルチレイヤ・ビットストリームデータを情報伝達するための方法およびシステム
KR100621581B1 (ko) 기초 계층을 포함하는 비트스트림을 프리디코딩,디코딩하는 방법, 및 장치
US8619854B2 (en) Scalable video encoding and decoding method using switching pictures and apparatus thereof
US20060088094A1 (en) Rate adaptive video coding
CA2543947A1 (en) Method and apparatus for adaptively selecting context model for entropy coding
MXPA06011817A (es) Metodo de indicadores de codificacion por capa usando la correlacion entre capas, metodo y aparato para descodificar indicadores codificadas.
US10455241B2 (en) Image encoding/decoding method and device
JP2009544176A (ja) スケーラブルビデオコーデックと非スケーラブルビデオコーデックとの間でトランスコードを行うためのシステム及び方法
JP2006507745A (ja) 可変長コード化されたデータ・ストリーム用のトランスコーダ
KR20050090308A (ko) 가변 gop 사이즈를 갖는 스케일러블 비디오 코딩방법및 이를 위한 스케일러블 비디오 인코더
US20080013624A1 (en) Method and apparatus for encoding and decoding video signal of fgs layer by reordering transform coefficients
WO2013145021A1 (ja) 画像復号方法及び画像復号装置
JP2007266750A (ja) 符号化方法
WO2006080655A1 (en) Apparatus and method for adjusting bitrate of coded scalable bitsteam based on multi-layer
Zhang et al. Adaptive multiple description video coding and transmission for scene change

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110823

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110921

R150 Certificate of patent or registration of utility model

Ref document number: 4833296

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees