JP2008523679A - ビデオストリームを処理する方法及び装置 - Google Patents

ビデオストリームを処理する方法及び装置 Download PDF

Info

Publication number
JP2008523679A
JP2008523679A JP2007545025A JP2007545025A JP2008523679A JP 2008523679 A JP2008523679 A JP 2008523679A JP 2007545025 A JP2007545025 A JP 2007545025A JP 2007545025 A JP2007545025 A JP 2007545025A JP 2008523679 A JP2008523679 A JP 2008523679A
Authority
JP
Japan
Prior art keywords
video stream
discrete cosine
cosine transform
bit rate
transform coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007545025A
Other languages
English (en)
Inventor
ワン,ジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008523679A publication Critical patent/JP2008523679A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、第一のビットレートを有するビデオストリームを処理する方法を開示するものであり、ビデオストリームの空間情報を取得するステップ、空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するためにビデオストリームのDCT係数を処理するステップを含んでおり、第二のビットレートは第一のビットレートよりも低い。本発明によれば、ビデオデータの視覚的な品質の低下が防止される。

Description

本発明は、信号処理に関し、より詳細には、ビデオ離散コサイン変換(DCT)領域のデータを処理する方法及び装置に関する。
ビデオ電話会議、ビデオオンデマンド、及びディスタンスラーニングのような様々なマルチメディアサービスは、技術及び社会経済の発展の出現に合わせて現れている。一般に、これらのマルチメディアサービスは、それらの目的地に到達する前に、非同期転送モード(ATM)ネットワーク、インターネット、ワイヤレスネットワーク、公衆交換電話網(PSTN)のような異なるネットワークを通過するために必要とされる。したがって、以下のシナリオが現れる。ATMネットワークのような幾つかのネットワークは、マルチメディアのサービス要件を満たすための保証された帯域幅を有しており、PSTNネットワークのような他のネットワークは、かかる帯域幅の保証を提供しない。したがって、到来する信号のビットレートが流出するネットワークの利用可能な帯域幅に一致するために調整されるように、ビットレートを動的に調節するのを可能にする装置が必要とされる。
たとえば、プログラムプロバイダは、サテライトリンクにわたり圧縮されたフォーマットでデジタルビデオ信号を送信することが想定される。デジタルビデオ信号をその最終的な目的地に伝達するため、ケーブルネットワークが利用されて、デジタルビデオ信号を中継する。勿論、中継されたデジタルビデオ信号は、圧縮されたフォーマットである。たとえば、サテライトリンクのデジタルビデオ信号のビットレートはR1 Mbit/sであり、ケーブルネットワークが制限された帯域幅のキャパシティを有することが想定される。到来するデジタルビデオ信号は、到来するデジタルビデオ信号のビットレートがR2 Mbit/s又はこれ以下であるときにのみ中継される。
したがって、装置は、あるビットレートで圧縮された信号を、送信のために低いビットレートで圧縮された信号に変換可能である必要がある。圧縮されたフォーマットを別の圧縮されたフォーマットに変換する動作は、トランスコーディングと呼ばれる。この変換を実行する装置又はユニットは、トランスコーダと呼ばれる。
図1は、従来技術におけるトランスコーダを有するエンコード及びデコードシステムの例示的な図である。図1に示されるように、エンコーダ11は、R1 Mbit/sのビットレートで到来するビデオ信号をはじめに圧縮する。次いで、トランスコーダ12は、圧縮された信号を、低いビットレートR2 Mbit/sで別の圧縮された信号に変換する。次いで、デコーダ13は、圧縮された信号を伸張し、伸張されたビデオ信号を出力する。
一般に、トランスコーダは、カスケードのデコーダ及びエンコーダを含む。図1に示されるように、トランスコーダ12は、デコーダ14及びエンコーダ15を有する。デコーダ14は、エンコーダ11の圧縮された信号を伸張するために使用され、再構成されたビデオ信号を生成し、エンコーダ15は、新たな圧縮された信号を形成するために再構成されたビデオ信号を圧縮するために使用される。
トランスコーダを構成するカスケードのデコーダ及びエンコーダの従来の方法は、より複雑なトランスコーダ構造となり、エンコーダ及びデコーダの両者が使用されるので高い実現のコストとなる。
一般に、ビデオ信号の圧縮処理において、オリジナルビデオデータは、はじめにブロックに分割される。次いで、分割されたブロックに離散コサイン変換(DCT)が実行され、したがって空間領域から周波数領域にデータ表現が変化する。最後に、これらDCT係数に量子化及び符号化の動作が実行される。一般に、エンコードのために可変長符号化(VLE)が使用される。逆に、ビデオ信号の伸張処理は、DCT係数を生成するため、可変長復号化及び逆量子化の動作で始まる。次いで、逆離散コサイン変換(IDCT)が実行され、ビデオデータブロックが周波数領域から空間領域に変換され、したがってビデオ信号の再構成が完了される。
図2は、デジタルビデオ信号をトランスコードする従来のトランスコーダを例示するためのブロック図である。
図2に示されるように、はじめに、トランスコーダ20の可変長デコーダ21がMPEG2(Moving Picture Experts Group 2)ストリームのような到来するデジタルビデオストリームをデコードする。つぎに、逆量子化器22は、デコードされた信号を逆量子化し、DCT係数を取得する。つぎに、ロウパスフィルタ23は、CT係数の高周波成分をフィルタリングする。それぞれのフレームにおける全てのブロックに対して、ロウパスフィルタ23のカットオフ周波数が変化しない。つぎに、量子化器24は、ロウパスフィルタ23を通過したDCT係数を再び量子化する。最後に、可変長エンコーダ25は、再び量子化されたDCT係数をエンコードする。
かかるプロセスを実行することで、トランスコードの目的が実現される。可変長エンコーダ25から出力されたビデオ信号のビットレートは、可変長デコーダ21に到来するビデオ信号のビットレートよりも低く、したがってトランスコードされたビデオストリームは、送信のために別のネットワークに送信することができる。
さらに、図2に示されるトランスコーダにおいて、離散コサイン変換器及び逆離散コサイン変換器は、これ以上必要とされない。したがって、非常に簡略化された構成をもつトランスコーダで、コストが著しく低減される。
しかし、ロウパスフィルタ23のカットオフ周波数はフレームにおける全てのブロックで変化しないので、ビデオ信号の視覚的な品質が低下する。これは、人間の目の作用が異なるブロックについて異なるためである。たとえば、幾つかのブロックにおけるDCT係数の高周波成分は、視覚的な作用への重要な影響を有する。
したがって、ビデオ信号の品質を改善するためにビデオデータを処理する方法及び装置が必要とされている。
本発明の目的は、ビデオストリームを処理する方法を提供することにある。
本発明の別の目的は、ビデオストリームを処理する装置を提供することにある。
上述された目的を実現するため、本発明は、ビデオストリームを処理する方法を提供するものであり、ビデオストリームは、第一のビットレートを有しており、当該方法は、ビデオストリームの空間情報を得るステップ、空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するため、ビデオストリームのDCT係数を処理するステップを含み、第二のビットレートは、第一のビットレートよりも低い。
本発明は、ビデオストリームを処理する装置を提供するものであり、ビデオストリームは、第一のビットレートを有しており、当該装置は、ビデオストリームの空間情報を取得する画像コンテンツ分析手段、及び、空間情報に従い第二のビットレートを有する圧縮されたビデオストリームを取得するため、ビデオストリームのDCT係数を処理するエンコーダを有しており、第二のビットレートは、第一のビットレートよりも低い。
本発明によれば、ビデオデータの視覚的な品質の低下は、画像の空間情報に基づいて効果的に回避される。
本発明の他の目的及び効果は、添付図面及び請求項の内容と組み合わせて、以下の記載を通して明らかとなるであろう。添付図面は明細書に組み込まれ、明細書の一部を構成するものであり、本発明の実施の形態を例示するものであり、説明と共に、本発明の原理を説明する役割を果たす。
本発明は、異なる好適な実施の形態について添付図面を参照して詳細に説明される。添付図面では、同じ参照符号は、同じ又は類似のコンポーネントを表す。
明確な説明を提供するため、以下の説明がビデオ信号に基づいている。当業者であれば、本発明がこれに限定されないことを明らかに理解されるであろう。また、本発明は、画像信号にも適用される。
MPEG2はビデオ圧縮分野において最も広く使用されている規格であるので、以下の説明はMPEG2に基づいている。当業者は、本発明がこれに限定されず、全ての他の圧縮フォーマットに等しく適用されるころを理解すべきである。
MPEG2規格によれば、ビデオ信号の圧縮のメインの手順は、はじめに、ビデオ信号を複数の8×8画素ブロックに分割することを含む。次いで、空間領域から周波数領域に変えるため、DCT変換をそれぞれの画素ブロックにおける8×8画素に実行し、8×8のDCT係数を取得する。最後に、DCT係数を量子化及びエンコードする。伸張プロセスは、圧縮プロセスに対応する。
図3は、8×8画素ブロックの例示的な図である。図3に示されるように8×8の画素ブロックでは、異なる画素は、ビデオ信号の異なるルミナンス、クロミナンス及びサチュレーションを有する。異なるルミナンス、クロミナンス及びサチュレーションは、異なるビデオ信号を表す。以下に提供される好適な実施の形態の説明は、ビデオ信号のルミナンスに基づいている。すなわち、8×8画素ブロックは、ビデオ信号のルミナンスブロックを表している。当業者にとって、本発明がこれに限定されないことを理解されるであろう。この8×8画素ブロックは、ビデオ信号のクロミナンスブロック又はサチュレーションブロックとすることもできる。
図3は、8×8画素ブロックの図である。しかし、当業者は、本発明がこれに限定されないことを理解するであろう。本発明では、画素ブロックを分割する他の方法も使用することができる。たとえあ、ビデオ符号化規格H.264では、それぞれのビデオ信号は4×4画素ブロックに分割される。
図4は、本発明の実施の形態に係るデジタルビデオストリームをトランスコードするプロセスのフローチャートである。
はじめに、ステップS41で、到来するMPEG2ストリームへの可変長復号化を実行する。
つぎに、ステップS42で、デコードされたビットストリームに逆量子化を実行し、DCT係数を取得する。
つぎに、ステップS43で、DCT係数について、不要な高周波成分を除くためにフィルタリングを実行する。
本発明によれば、低域通過フィルタのカットオフ周波数は、フレームにおけるそれぞれのブロックについて不変ではない。
本発明の実施の形態によれば、フレームにおけるそれぞれのブロックについて、低域通過フィルタの遮断周波数は、たとえば画素間の分散、標準偏差又は勾配といった、それぞれのブロックのそれぞれの画素の間で空間領域の画像空間情報に関連する。
分散又は標準偏差は、画像の平坦領域及び移動領域の情報を主に反映し、勾配は、画像のエッジ情報を主に反映する。言い換えれば、画像の画素の分散は、画像の詳細、すなわち画像の色の階層の豊富な程度を反映する。
たとえば、図3に示される8×8画素ブロックについて、その標準偏差の計算式は、以下に示される。
Figure 2008523679
ここでf(i,j)は(i,j)での画素値であり、Δhは水平方向における標準偏差を表し、Δvは垂直方向における標準偏差を表し、Δnはn番目のブロックの標準偏差を表す。
本発明の明確な説明を提供するため、以下の記載は画素の分散に基づいている。当業者であれば、これが本発明の制限とならないことを理解される。
図3に示される8×8画素ブロックについて、以下が示される。
Figure 2008523679
ここでf(i,j)は(i,j)での画素値であり、
[外1]
Figure 2008523679
はn番目のブロックにおける画素の平均値であり、varnはn番目のブロックの分散である。
それぞれのブロックの低域通過フィルタの遮断周波数とそれぞれの画素ブロックの画素の分散との間の関係は、以下に示される。
Figure 2008523679
ここで
[外2]
Figure 2008523679
はフレームにおける全てのブロックの分散の平均値であり、varnはn番目の画素ブロックの分散であり、C(varn)はn番目のブロックの低域通過フィルタの遮断周波数である。λは拡張ファクタであり、その値は次の基準:0≦λ≦63に一致する。
ここで、n番目のDCT係数ブロックでは、保持されるべきDCT係数は、以下に示される。
Figure 2008523679
ここでmは、左から右へ、上から下に図3に示されるような8×8DCT係数ブロックの64DCT係数をアレイにした後のm番目のDCT係数を表しており、ACmはm番目のDCT係数の値を表す。
本発明の別の実施の形態によれば、フレームにおけるそれぞれのブロックについて、低域通過フィルタの遮断周波数は、それぞれのブロックのそれぞれの画素間の空間領域の分散のみならず、ネットワークの現在の帯域幅にも関連する。
それぞれのブロックの低域通過フィルタの遮断周波数とそれぞれの画素ブロックの画素の分散との間の関係、ネットワークの現在の帯域幅は、以下のように示される。
Figure 2008523679
ここで、n番目のDCT係数ブロックにおいて、保持されるべきDCT係数は、以下に示される。
Figure 2008523679
ここで、C(varn,B)はn番目のブロックの低域通過フィルタの遮断周波数であり、Bはネットワークの現在の帯域幅であり、BTはネットワークが提供することができる最も広い帯域幅であり、他のパラメータの意味は、先に記載されたパラメータと同じである。
ステップS43の後、フローはステップS44に進む。ステップS44で、フィルタリングされたDCT係数に量子化が実行される。最後に、フローはステップS45に進む。ステップS45で、量子化されたDCT係数に可変長符号化が実行される。
したがって、先に記載されたステップにより、周波数領域におけるDCT係数のフィルタリングが実現され、次いで、簡略化されたトランスコーディングの動作を提供するという目的が達成される。
図5は、本発明の実施の形態に係るデジタルビデオデータをトランスコードするトランスコーダの例示的なブロック図である。
図5に示されるように、トランスコーダ50は、デコーダ51、画像コンテンツ分析ユニット52、エンコーダ53、帯域幅抽出ユニット54及び離散コサイン変換器55を有する。
デコーダ51は、可変長デコーダ511、逆量子化器512及び逆離散コサイン変換513を有する。
画像コンテンツ分析ユニット52は、画像の画素分散を抽出するために使用される、分散抽出ユニット521である。当業者であれば、画像コンテンツ分析ユニット52が、画像の情報を抽出する、標準偏差抽出ユニット又は勾配抽出ユニット(図示せず)であることを理解される。
エンコーダ53は、遮断周波数取得ユニット531、低域通過フィルタ532、量子化器533及び可変長エンコーダ534を有する。
可変長デコーダ511は、所定のビットレートを有する、受信されたMPEG2ストリームをデコードし、量子化されたDCT係数を取得する。つぎに、逆量子化器512は、量子化されたDCT係数を逆量子化し、DCT係数ブロックを取得する。次いで、逆量子化器512は、DCT係数ブロックを逆離散コサイン変換器513、及びエンコーダ53の遮断周波数取得ユニット531に送出する。逆離散コサイン変換器513は、DCT係数ブロックを画素ブロックに変換し、変換された画素ブロックを画像コンテンツ分析ユニット52に送出する。
本発明によれば、逆離散コサイン変換器513から出力されたビデオストリームの画素ブロックは、圧縮されていないビデオストリームと類似する。
上述された実施の形態では、到来するビデオ信号が圧縮されたビデオストリームである状況に基づいている。したがって、デコーディングは、圧縮されたビデオストリームをデコードして、デコードされたビデオストリームを取得するためにはじめに実行される。デコードされたビデオストリームは、更なる処理のために画像コンテンツ分析ユニット52に供給される。本発明はこれに限定されないことが理解される。また、プロセスは、圧縮されていないオリジナルのビデオストリームを直接的に処理することに適用され、すなわちオリジナルビデオストリームの画素ブロックが画像コンテンツ分析ユニット52に直接供給される。勿論、オリジナルのビデオストリームの画素ブロックは、8×8又は4×4である。画素ブロックのサイズは、例としてのみ示され、本発明の制限として考慮されるべきではない。
オリジナルビデオストリームの画素ブロックが画像コンテンツ分析ユニット52に直接送出されるので、デコーダ51を使用して圧縮されたビデオストリームをデコードする必要がない。画像コンテンツ分析ユニット52は、画像の情報を取得するため、画像の画素分散を抽出する。ここで、図5に示されるユニットはエンコーダであり、オリジナルビデオストリームを処理するため、画像コンテンツ分析ユニット52、エンコーダ53、帯域幅抽出ユニット54及び離散コサイン変換器55を有する。
画像コンテンツ分析ユニット52は、画素ブロックにおけるそれぞれの画素の空間情報を抽出する。たとえば、分散抽出ユニット521は、画素ブロックにおけるそれぞれの画素の分散を抽出し、次いで、抽出された結果を遮断周波数取得ユニット531に送出する。遮断周波数取得ユニット531は、たとえば、分散抽出ユニット521から送出された分散、帯域幅抽出ユニット54により検出されたネットワークの現在の帯域幅といった、画像コンテンツ分析ユニット52から送出された空間情報の抽出結果に基づいて、低域通過フィルタ532の遮断周波数を決定する。
遮断周波数取得ユニット531により決定された遮断周波数に基づいて、低域通過フィルタ532は、逆量子化器512から送出されるか、離散コサイン変換器55を介した逆離散コサイン変換器513から送出される、DCT係数ブロックの高周波成分をフィルタリングし、フィルタリングされたDCT係数ブロックを量子化器533に送出する。量子化器533は、低域通過フィルタ532から送出されたDCT係数ブロックを量子化し、可変長エンコーダ534に量子化の結果を送出する。可変長エンコーダ534は、量子化されたDCT係数ブロックをエンコードし、エンコードされたビットストリームをネットワークに送出する。
本実施の形態では、エンコーダ53から出力されたビデオストリームのビットレートは、デコーダ51に入力するMPEG2ストリームのビットレートよりも低い。圧縮されたフォーマットから別の圧縮されたフォーマットへの変換が完了される。
当業者であれば、上述されたトランスコーダはまさに簡略化された例であることを理解されるであろう。このトランスコーダは、動き予測ユニット等のような、他のユニットを含む。
図6は、本発明の別の実施の形態に係る、単一レイヤのビデオ圧縮されたデータを2つのレイヤに分割するプロセスのフローチャートである。
はじめに、ステップS61で、到来する単一レイヤのビデオに可変長デコードを実行する。
つぎに、ステップS62で、デコードされたビットストリームに逆量子化を実行し、DCT係数を取得する。
つぎに、ステップS63で、データパーティショニングを実行する。すなわち、DCT係数の決定された優先度のブレイクポイントに従って、どのDCT係数が比較的低いビットエラーレートによりベースレイヤチャネルで送信され、どのDCT係数が比較的高いビットエラーレートによりエンハンスメントチャネルで送信されるかを判定する。
一般に、DCT領域で、量子化された係数にジグザグスキャニングが実行される。データパーティショニングは、ジグザグスキャニングに基づく。詳細の状態は、図7に示される。優先度のブレイクポイントのポジションは、低いビットエラーレートによりベースレイヤチャネルに送信されるDCT係数の数を決定する。優先度のブレイクポイントの右下に位置するDCT係数、すなわち高周波成分は、高いビットエラーレートによりあるチャネルで送信される。
本発明の実施の形態によれば、プライオリティブレイクポイントは、あるフレームにおけるそれぞれのブロックについて可変である。プライオリティブレイクポイントは、それぞれのブロックのそれぞれの画素間の空間領域の空間情報、すなわち分散、標準偏差又は勾配に関連する。
さらに、明確な説明のため、以下の説明が分散に基づいて示される。当業者であれば、これが本発明を制限するものではないことを理解するべきである。
あるフレームにおけるそれぞれのブロックについてプライオリティブレイクポイントとく空間領域におけるそれぞれの画素ブロックの画素の分散の間の関係は、以下に示される。
Figure 2008523679
ここで、mは、図7に示される方式に従ってスキャンされる64DCT係数のm番目のDCT係数を表し、ACmはm番目のDCT係数の値を表す。C(varn)は、プライオリティブレイクポイントであり、その値は、上述されたC(varn)と同じである。
本発明の別の実施の形態によれば、あるフレームにおけるそれぞれのブロックについて、プライオリティブレイクポイントは、それぞれのブロックのそれぞれの画素間の空間領域の分散のみならず、ネットワークの現在の帯域幅にも関連する。
Figure 2008523679
ここで、mは、図7に示される方式に従ってスキャンされる64DCT係数のm番目のDCT係数を表し、ACmは、m番目のDCT係数の値を表す。C(varn,B)はプライオリティブレイクポイントを表し、その値は上述されたC(varn,B)と同じである。
したがって、ステップS63を通して、単一のレイヤデータは2つのレイヤに区分される。次いで、フローはステップS64に進む。ステップS64は、ベースレイヤとエンハンスメントレイヤのそれぞれのDCT係数を量子化する。
つぎに、ステップS65で、可変長符号化の方式で、ベースレイヤ及びエンハンスメントレイヤのそれぞれの量子化されたDCT係数をエンコードする。
上述されたステップにより、単一レイヤのビデオ圧縮データを2つのレイヤのビデオ圧縮データに分割することが達成される。
図8は、本発明の実施の形態に係る、単一レイヤのビデオ圧縮データを2つのレイヤのビデオ圧縮データに分割するためのデータ分割ユニットの例示的な図である。
図8に示されるように、データ分割ユニット80は、デコーダ81、画像コンテンツ分析ユニット82、エンコーダ83、帯域幅抽出ユニット84及び離散コサイン変換器85を有する。
デコーダ81は、可変長デコーダ811、逆量子化器812及び逆離散コサイン変換器813を有する。
画像コンテンツ分析ユニット82は、画像の画素分散を抽出するために使用される、分散抽出ユニット821である。当業者であれば、画像コンテンツ分析ユニット82は、画像の情報を抽出するための、標準偏差抽出ユニット又は勾配抽出ユニット(図示せず)とすることができることを理解されたい。
エンコーダ83は、ブレイクポイント取得ユニット831、分割ユニット832、第一のエンコーダ833及び第二のエンコーダ834を有する。
図8に示されるように、はじめに、デコーダ81の可変長デコーダ811は、MPEG2ストリームのような、受信された単一レイヤのビデオ圧縮データをデコードし、量子化されたDCT係数を取得する。つぎに、逆量子化器812は、可変長デコーダ811によりデコードされる量子化されたDCT係数を逆量子化し、DCT係数ブロックを取得する。逆量子化器812は、DCT係数ブロックをエンコーダ83のブレイクポイント取得ユニット831及び逆離散コサイン変換器813に送出する。逆離散コサイン変換器813は、DCT係数ブロックを画素ブロックに変換し、変換された画素ブロックを画像コンテンツ分析ユニットに送出する。
画像コンテンツ分析ユニット82は、画素ブロックにおけるそれぞれの画素の空間情報を抽出し、たとえば、分散抽出ユニット821は、画素ブロックにおけるそれぞれの画素の分散を抽出し、次いで、抽出された結果をブレイクポイント取得ユニット831に送出する。ブレイクポイント取得ユニット831は、たとえば、分散抽出ユニット821から送出された分散、及び帯域幅抽出ユニット84により検出されたネットワークの現在の帯域幅といった、画像コンテンツ分析ユニット82から送出された空間情報抽出結果に基づいて、分割ユニット832のブレイクポイントを決定する。
ブレイクポイント取得ユニット831により決定されたブレイクポイントに基づいて、分割ユニット832は、逆量子化器812から送出されるか、離散コサイン変換器85を介して逆離散コサイン変換器813から送出される、DCT係数ブロックを分割し、ベースレイヤで送信すべきDCT係数を第一のエンコーダ833の量子化器8331に送出し、エンハンスメントレイヤで送信すべきDCT係数を第二のエンコーダ834の量子化器8341に送出する。量子化器8331及び8341は、分割ユニット832から送出されたDCt係数をそれぞれ量子化し、可変長エンコーダ8332及び8342に量子化の結果をそれぞれ送出する。可変長エンコーダ8332及び8342は、量子化されたDCT係数ブロックをそれぞれエンコードし、エンコードされたビットストリームをネットワークに送出する。
本発明の実施の形態では、逆離散コサイン変換813から出力されたビデオストリームの画素ブロックは、圧縮されていないビデオストリームの画素ブロックに類似する。
上述された実施の形態では、圧縮されたビデオストリームは、伸張されたビデオストリームを取得するためにはじめにデコードされる。次いで、伸張されたビデオストリームの画素ブロックは、更なる処理のために画像コンテンツ分析ユニット82に送出される。しかし、本発明はこれに限定されない。本発明の装置及び方法は、圧縮されていないオリジナルビデオストリームに適用される。たとえば、オリジナルビデオストリームの画素ブロックは、画像コンテンツ分析ユニット82に直接に送出される。さらに、オリジナルビデオストリームの画素ブロックは、8×8又は4×4である。画素ブロックのサイズは、説明のためにのみ提供され、本発明を制限するものとして意図されない。
オリジナルビデオストリームの画素ブロックは画像コンテンツ分析ユニット82に直接送出されるので、デコーダ81は、圧縮されたビデオストリームをこれ以上デコードするために必要とされない。画像コンテンツ分析ユニット82は、画像の情報を取得するため、画像の画素の分散を直接に抽出する。ここで、図8に示されるユニットは、エンコーダユニットであり、オリジナルビデオストリームを処理するため、画像コンテンツ分析ユニット82、エンコーダ83、帯域幅抽出ユニット84及び離散コサイン変換器85を含んでいる。
当業者であれば、上述されたデータ分割ユニットはまさに例示的な実現であり、動き予測器及び動き補償器のような他のユニットは、実用的なシステムの応用のために必要とされる場合があることを理解されるであろう。
本発明が好適な実施の形態を参照して説明されたが、上述された説明に従って、当業者にとって多くの置き換え、変更及び変形が明らかである。したがって、本発明は、特許請求の範囲のコンセプト及び範囲に含まれる全ての係る置き換え、変更及び変形を含む。
従来技術におけるトランスコーダを有するエンコード及びデコードシステムの例示的な図である。 デジタルビデオストリームをトランスコードするための従来のトランスコーダを例示するブロック図である。 8×8画素ブロックの例示的な図である。 本発明の実施の形態に係るデジタルビデオストリームをトランスコードするプロセスのフローチャートである。 本発明の実施の形態に係るデジタルビデオストリームをトランスコードするためのトランスコーダの例示的なブロック図である。 本発明の別の実施の形態に係る2つのレイヤに単一レイヤのビデオ圧縮データを分割するプロセスのフローチャートである。 DCT係数をジグザグスキャンするための例示的なシナリオを示す図である。 本発明の別の実施の形態に係る2つのレイヤに単一レイヤのビデオ圧縮データを分割するデータ分割ユニットの例示的な図である。

Claims (20)

  1. 第一のビットレートを有するビデオストリームを処理する方法であって、
    (a)前記ビデオストリームの空間情報を取得するステップと、
    (b)前記空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するために前記ビデオストリームの離散コサイン変換の係数を処理するステップと
    を含み、
    前記第二のビットレートは前記第一のビットレートよりも低い、方法。
  2. 前記第一のビットレートを有する前記ビデオストリームは、圧縮されたビデオストリームであり、前記ステップ(a)の前に、
    (c)再構成されたビデオストリームを取得するため、前記第一のビットレートを有する前記圧縮されたビデオストリームを伸張するステップを更に含む、
    請求項1記載の方法。
  3. 前記ステップ(c)は、
    (d)前記離散コサイン変換係数を取得するため、前記再構成されたビデオストリームに離散コサイン変換を実行するステップを更に含む、
    請求項2記載の方法。
  4. 前記ステップ(c)は、
    (i)前記第一のビットレートを有する前記圧縮されたビデオストリームに可変長復号化を実行するステップと、
    (ii)対応する離散コサイン変換係数を取得するため、可変長復号化されたビデオストリームに逆量子化を実行するステップと、
    (iii)前記再構成されたビデオストリームを取得するため、前記離散コサイン変換係数に逆離散コサイン変換を実行するステップと、
    を含む請求項2記載の方法。
  5. 前記ステップ(b)におけるビデオストリームの前記離散コサイン変換係数は、前記ステップ(ii)において対応する離散コサイン変換係数から得られる、
    請求項4記載の方法。
  6. 前記ステップ(a)は、前記ビデオストリームのそれぞれのブロックに含まれるそれぞれの画素の分散を取得するステップを含み、前記分散は、前記空間情報の富裕度を反映する、
    請求項1記載の方法。
  7. 前記ステップ(b)は、
    前記空間情報に従って遮断周波数を決定するステップと、
    前記離散コサイン変換係数をフィルタリングして、前記遮断周波数に従って前記離散コサイン変換係数の特定の部分をフィルタリングするステップと、
    前記第二のビットレートを有する前記圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の残りの部分を処理するステップと、
    を含む請求項1記載の方法。
  8. 前記ステップ(b)は、
    (i)前記空間情報に従ってブレイクポイントを決定するステップと、
    (ii)前記ブレイクポイントに従って前記離散コサイン変換係数の特定の部分を取得するため、前記離散コサイン変換係数を区分するステップと、
    (iii)前記第二のビットレートを有する前記圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の特定の部分を処理するステップと、
    を含む請求項1記載の方法。
  9. 第三のビットレートを有する別の圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の残りの部分を処理するステップを更に含み、前記第三のビットレートは前記第一のビットレートよりも低い、
    請求項8記載の方法。
  10. (e)前記第二のビットレートを有する前記圧縮されたビデオストリームを送信するために使用されるネットワークの利用可能な帯域幅を取得するステップを更に含み、
    前記ステップ(b)は、
    前記空間情報及び前記ネットワークの利用可能な帯域幅に従って前記第二のビットレートを有する前記圧縮されたビデオストリームを取得するために前記離散コサイン変換係数を処理するステップを含む、
    請求項1記載の方法。
  11. 第一のビットレートを有するビデオストリームを処理する装置であって、
    前記ビデオストリームの空間情報を取得する画像コンテンツ分析手段と、
    前記空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するため、前記ビデオストリームの離散コサイン変換係数を処理するエンコーダとを有し、
    前記第二のビットレートは、前記第一のビットレートよりも低い、装置。
  12. 前記第一のビットレートを有する前記ビデオストリームは、圧縮されたビデオストリームであり、
    再構成されたビデオストリームを取得するため、前記第一のビットストリームを有する前記圧縮されたビデオストリームを伸張するデコーダを更に含む、
    請求項11記載の装置。
  13. 前記エンコーダにより処理された離散コサイン変換係数を取得するため、前記再構成されたビデオストリームに離散コサイン変換を実行する離散コサイン変換器を更に含む、
    請求項12記載の装置。
  14. 前記デコーダは、
    前記第一のビットレートを有する前記圧縮されたビデオストリームに可変長復号化を実行する可変長デコーダと、
    対応する離散コサイン変換係数を取得するため、可変長復号化されたビデオストリームを逆量子化する逆量子化器と、
    前記再構成されたビデオストリームを取得するため、前記離散コサイン変換係数に逆離散コサイン変換を実行する逆離散コサイン変換器と、
    を含む、請求項12記載の装置。
  15. 前記エンコーダにより処理された離散コサイン変換係数は、前記逆量子化器により得られた対応する離散コサイン変換係数である、
    請求項14記載の方法。
  16. 前記画像コンテンツ分析手段は、前記ビデオストリームのそれぞれのブロックに含まれるそれぞれの画素の分散を取得するための分散取得手段を有し、前記分散は、前記空間情報の富裕度を反映する、
    請求項11記載の装置。
  17. 前記エンコーダは、
    前記空間情報に従って遮断周波数を決定する遮断周波数取得手段と、
    前記遮断周波数に従って前記離散コサイン変換係数の特定の部分をフィルタリングするために、前記離散コサイン変換係数をフィルタリングする低域通過フィルタと、
    を有する請求項11記載の装置。
  18. 前記エンコーダは、
    前記空間情報に従ってブレイクポイントを決定するブレイクポイント取得手段と、
    前記ブレイクポイントに従って前記離散コサイン変換係数の特定の部分を取得するために前記離散コサイン変換係数を区分する区分手段と、
    前記第二のビットレートを有する圧縮されたビデオストリームを取得するため、離散コサイン変換係数の特定の部分を処理する第一のエンコーダと、
    を有する請求項11記載の装置。
  19. 第三のビットレートを有する別の圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の残りの部分を処理する第二のエンコーダを更に有し、前記第三のビットレートは前記第一のビットレートよりも低い、
    請求項18記載の装置。
  20. 前記第二のビットレートを有する圧縮されたビデオストリームを送信するために使用されるネットワークの利用可能な帯域幅を取得するための帯域幅取得手段を更に有し、
    前記エンコーダは、前記空間情報及び前記ネットワークの利用可能な帯域幅に従って前記第二のビットレートを有する圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数を処理するために使用される、
    請求項11記載の装置。
JP2007545025A 2004-12-07 2005-11-30 ビデオストリームを処理する方法及び装置 Pending JP2008523679A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200410097118 2004-12-07
PCT/IB2005/053959 WO2006061734A2 (en) 2004-12-07 2005-11-30 A method and apparatus for processing video streams

Publications (1)

Publication Number Publication Date
JP2008523679A true JP2008523679A (ja) 2008-07-03

Family

ID=36578286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007545025A Pending JP2008523679A (ja) 2004-12-07 2005-11-30 ビデオストリームを処理する方法及び装置

Country Status (3)

Country Link
JP (1) JP2008523679A (ja)
KR (1) KR20070090185A (ja)
WO (1) WO2006061734A2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10015506B2 (en) * 2013-05-20 2018-07-03 Cinova Media Frequency reduction and restoration system and method in video and image compression
US10462477B2 (en) 2015-02-25 2019-10-29 Cinova Media Partial evaluator system and method
US10460700B1 (en) 2015-10-12 2019-10-29 Cinova Media Method and apparatus for improving quality of experience and bandwidth in virtual reality streaming systems
US10944971B1 (en) 2017-05-22 2021-03-09 Cinova Media Method and apparatus for frame accurate field of view switching for virtual reality
CN112887512A (zh) * 2021-01-26 2021-06-01 长威信息科技发展股份有限公司 一种视频流高分可视化系统

Also Published As

Publication number Publication date
WO2006061734A3 (en) 2006-11-23
KR20070090185A (ko) 2007-09-05
WO2006061734A2 (en) 2006-06-15

Similar Documents

Publication Publication Date Title
RU2350040C1 (ru) Способ и устройство для указания параметров квантователя в системе видеокодирования
EP2535870B1 (en) Video-information decoding apparatus and method
KR0129558B1 (ko) 적응적 가변길이 부호화 방법 및 장치
JP2016026426A (ja) 適応可変長符号化
US20040252900A1 (en) Spatial scalable compression
JP4226172B2 (ja) 適応的変換方法を用いる映像圧縮符号化装置および復号化装置ならびにその方法
KR20020014770A (ko) 코드화된 신호를 분리 및 합병하는 방법과 그 장치 및컴퓨터 프로그램 제품
JP2004531924A (ja) 信号圧縮装置及び方法
EP2201770A1 (en) Method, medium, and apparatus for encoding and/or decoding video
US20080212682A1 (en) Reduced resolution video transcoding with greatly reduced complexity
US6785330B1 (en) Flexible video encoding/decoding method
US7502415B2 (en) Range reduction
EP0671102A4 (en) PICTURE IN PICTURE TELEVISION WITH INSERTING A AVERAGE PICTURE IN A FULL-FORMAT PICTURE.
US8243798B2 (en) Methods and apparatus for scalable video bitstreams
JPH06225285A (ja) ディジタル信号を符号化する少なくとも1つの符号器とディジタル信号を復号する少なくとも1つの復号器とを備えるシステムおよび、本発明によるシステムに使用される符号器と復号器
JPH07312756A (ja) 圧縮動画像符号信号の情報量変換回路、装置、及び方法
JP2008523679A (ja) ビデオストリームを処理する方法及び装置
WO2008007929A1 (en) Method and apparatus for encoding and decoding video signal of fgs layer by reordering transform coefficients
US20090034634A1 (en) Differential coding with lossy embedded compression
JPH07107464A (ja) 画像符号化装置および復号化装置
KR100192778B1 (ko) Ptsvq를 이용한 호환 부호기 및 복호기
KR20040046890A (ko) 동영상 코덱의 공간 스케일러빌리티 구현방법
KR0171749B1 (ko) 호환 부호기
KR100530566B1 (ko) 적응적 변환방법을 이용하는 영상압축 부호화 및 복호화 장치및 그 방법
KR20030006641A (ko) 트랜스코더 및 그의 트랜스 코딩 방법