JP2008523679A

JP2008523679A - ビデオストリームを処理する方法及び装置

Info

Publication number: JP2008523679A
Application number: JP2007545025A
Authority: JP
Inventors: ワン，ジン
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2004-12-07
Filing date: 2005-11-30
Publication date: 2008-07-03
Also published as: WO2006061734A3; KR20070090185A; WO2006061734A2

Abstract

本発明は、第一のビットレートを有するビデオストリームを処理する方法を開示するものであり、ビデオストリームの空間情報を取得するステップ、空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するためにビデオストリームのＤＣＴ係数を処理するステップを含んでおり、第二のビットレートは第一のビットレートよりも低い。本発明によれば、ビデオデータの視覚的な品質の低下が防止される。

Description

本発明は、信号処理に関し、より詳細には、ビデオ離散コサイン変換（ＤＣＴ）領域のデータを処理する方法及び装置に関する。

ビデオ電話会議、ビデオオンデマンド、及びディスタンスラーニングのような様々なマルチメディアサービスは、技術及び社会経済の発展の出現に合わせて現れている。一般に、これらのマルチメディアサービスは、それらの目的地に到達する前に、非同期転送モード（ＡＴＭ）ネットワーク、インターネット、ワイヤレスネットワーク、公衆交換電話網（ＰＳＴＮ）のような異なるネットワークを通過するために必要とされる。したがって、以下のシナリオが現れる。ＡＴＭネットワークのような幾つかのネットワークは、マルチメディアのサービス要件を満たすための保証された帯域幅を有しており、ＰＳＴＮネットワークのような他のネットワークは、かかる帯域幅の保証を提供しない。したがって、到来する信号のビットレートが流出するネットワークの利用可能な帯域幅に一致するために調整されるように、ビットレートを動的に調節するのを可能にする装置が必要とされる。

たとえば、プログラムプロバイダは、サテライトリンクにわたり圧縮されたフォーマットでデジタルビデオ信号を送信することが想定される。デジタルビデオ信号をその最終的な目的地に伝達するため、ケーブルネットワークが利用されて、デジタルビデオ信号を中継する。勿論、中継されたデジタルビデオ信号は、圧縮されたフォーマットである。たとえば、サテライトリンクのデジタルビデオ信号のビットレートはＲ１Ｍｂｉｔ／ｓであり、ケーブルネットワークが制限された帯域幅のキャパシティを有することが想定される。到来するデジタルビデオ信号は、到来するデジタルビデオ信号のビットレートがＲ２Ｍｂｉｔ／ｓ又はこれ以下であるときにのみ中継される。

したがって、装置は、あるビットレートで圧縮された信号を、送信のために低いビットレートで圧縮された信号に変換可能である必要がある。圧縮されたフォーマットを別の圧縮されたフォーマットに変換する動作は、トランスコーディングと呼ばれる。この変換を実行する装置又はユニットは、トランスコーダと呼ばれる。

図１は、従来技術におけるトランスコーダを有するエンコード及びデコードシステムの例示的な図である。図１に示されるように、エンコーダ１１は、Ｒ１Ｍｂｉｔ／ｓのビットレートで到来するビデオ信号をはじめに圧縮する。次いで、トランスコーダ１２は、圧縮された信号を、低いビットレートＲ２Ｍｂｉｔ／ｓで別の圧縮された信号に変換する。次いで、デコーダ１３は、圧縮された信号を伸張し、伸張されたビデオ信号を出力する。

一般に、トランスコーダは、カスケードのデコーダ及びエンコーダを含む。図１に示されるように、トランスコーダ１２は、デコーダ１４及びエンコーダ１５を有する。デコーダ１４は、エンコーダ１１の圧縮された信号を伸張するために使用され、再構成されたビデオ信号を生成し、エンコーダ１５は、新たな圧縮された信号を形成するために再構成されたビデオ信号を圧縮するために使用される。

トランスコーダを構成するカスケードのデコーダ及びエンコーダの従来の方法は、より複雑なトランスコーダ構造となり、エンコーダ及びデコーダの両者が使用されるので高い実現のコストとなる。

一般に、ビデオ信号の圧縮処理において、オリジナルビデオデータは、はじめにブロックに分割される。次いで、分割されたブロックに離散コサイン変換（ＤＣＴ）が実行され、したがって空間領域から周波数領域にデータ表現が変化する。最後に、これらＤＣＴ係数に量子化及び符号化の動作が実行される。一般に、エンコードのために可変長符号化（ＶＬＥ）が使用される。逆に、ビデオ信号の伸張処理は、ＤＣＴ係数を生成するため、可変長復号化及び逆量子化の動作で始まる。次いで、逆離散コサイン変換（ＩＤＣＴ）が実行され、ビデオデータブロックが周波数領域から空間領域に変換され、したがってビデオ信号の再構成が完了される。

図２は、デジタルビデオ信号をトランスコードする従来のトランスコーダを例示するためのブロック図である。
図２に示されるように、はじめに、トランスコーダ２０の可変長デコーダ２１がＭＰＥＧ２（Moving Picture Experts Group 2）ストリームのような到来するデジタルビデオストリームをデコードする。つぎに、逆量子化器２２は、デコードされた信号を逆量子化し、ＤＣＴ係数を取得する。つぎに、ロウパスフィルタ２３は、ＣＴ係数の高周波成分をフィルタリングする。それぞれのフレームにおける全てのブロックに対して、ロウパスフィルタ２３のカットオフ周波数が変化しない。つぎに、量子化器２４は、ロウパスフィルタ２３を通過したＤＣＴ係数を再び量子化する。最後に、可変長エンコーダ２５は、再び量子化されたＤＣＴ係数をエンコードする。

かかるプロセスを実行することで、トランスコードの目的が実現される。可変長エンコーダ２５から出力されたビデオ信号のビットレートは、可変長デコーダ２１に到来するビデオ信号のビットレートよりも低く、したがってトランスコードされたビデオストリームは、送信のために別のネットワークに送信することができる。

さらに、図２に示されるトランスコーダにおいて、離散コサイン変換器及び逆離散コサイン変換器は、これ以上必要とされない。したがって、非常に簡略化された構成をもつトランスコーダで、コストが著しく低減される。

しかし、ロウパスフィルタ２３のカットオフ周波数はフレームにおける全てのブロックで変化しないので、ビデオ信号の視覚的な品質が低下する。これは、人間の目の作用が異なるブロックについて異なるためである。たとえば、幾つかのブロックにおけるＤＣＴ係数の高周波成分は、視覚的な作用への重要な影響を有する。

したがって、ビデオ信号の品質を改善するためにビデオデータを処理する方法及び装置が必要とされている。
本発明の目的は、ビデオストリームを処理する方法を提供することにある。
本発明の別の目的は、ビデオストリームを処理する装置を提供することにある。

上述された目的を実現するため、本発明は、ビデオストリームを処理する方法を提供するものであり、ビデオストリームは、第一のビットレートを有しており、当該方法は、ビデオストリームの空間情報を得るステップ、空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するため、ビデオストリームのＤＣＴ係数を処理するステップを含み、第二のビットレートは、第一のビットレートよりも低い。

本発明は、ビデオストリームを処理する装置を提供するものであり、ビデオストリームは、第一のビットレートを有しており、当該装置は、ビデオストリームの空間情報を取得する画像コンテンツ分析手段、及び、空間情報に従い第二のビットレートを有する圧縮されたビデオストリームを取得するため、ビデオストリームのＤＣＴ係数を処理するエンコーダを有しており、第二のビットレートは、第一のビットレートよりも低い。

本発明によれば、ビデオデータの視覚的な品質の低下は、画像の空間情報に基づいて効果的に回避される。
本発明の他の目的及び効果は、添付図面及び請求項の内容と組み合わせて、以下の記載を通して明らかとなるであろう。添付図面は明細書に組み込まれ、明細書の一部を構成するものであり、本発明の実施の形態を例示するものであり、説明と共に、本発明の原理を説明する役割を果たす。

本発明は、異なる好適な実施の形態について添付図面を参照して詳細に説明される。添付図面では、同じ参照符号は、同じ又は類似のコンポーネントを表す。
明確な説明を提供するため、以下の説明がビデオ信号に基づいている。当業者であれば、本発明がこれに限定されないことを明らかに理解されるであろう。また、本発明は、画像信号にも適用される。

ＭＰＥＧ２はビデオ圧縮分野において最も広く使用されている規格であるので、以下の説明はＭＰＥＧ２に基づいている。当業者は、本発明がこれに限定されず、全ての他の圧縮フォーマットに等しく適用されるころを理解すべきである。

ＭＰＥＧ２規格によれば、ビデオ信号の圧縮のメインの手順は、はじめに、ビデオ信号を複数の８×８画素ブロックに分割することを含む。次いで、空間領域から周波数領域に変えるため、ＤＣＴ変換をそれぞれの画素ブロックにおける８×８画素に実行し、８×８のＤＣＴ係数を取得する。最後に、ＤＣＴ係数を量子化及びエンコードする。伸張プロセスは、圧縮プロセスに対応する。

図３は、８×８画素ブロックの例示的な図である。図３に示されるように８×８の画素ブロックでは、異なる画素は、ビデオ信号の異なるルミナンス、クロミナンス及びサチュレーションを有する。異なるルミナンス、クロミナンス及びサチュレーションは、異なるビデオ信号を表す。以下に提供される好適な実施の形態の説明は、ビデオ信号のルミナンスに基づいている。すなわち、８×８画素ブロックは、ビデオ信号のルミナンスブロックを表している。当業者にとって、本発明がこれに限定されないことを理解されるであろう。この８×８画素ブロックは、ビデオ信号のクロミナンスブロック又はサチュレーションブロックとすることもできる。

図３は、８×８画素ブロックの図である。しかし、当業者は、本発明がこれに限定されないことを理解するであろう。本発明では、画素ブロックを分割する他の方法も使用することができる。たとえあ、ビデオ符号化規格Ｈ．２６４では、それぞれのビデオ信号は４×４画素ブロックに分割される。

図４は、本発明の実施の形態に係るデジタルビデオストリームをトランスコードするプロセスのフローチャートである。
はじめに、ステップＳ４１で、到来するＭＰＥＧ２ストリームへの可変長復号化を実行する。
つぎに、ステップＳ４２で、デコードされたビットストリームに逆量子化を実行し、ＤＣＴ係数を取得する。
つぎに、ステップＳ４３で、ＤＣＴ係数について、不要な高周波成分を除くためにフィルタリングを実行する。

本発明によれば、低域通過フィルタのカットオフ周波数は、フレームにおけるそれぞれのブロックについて不変ではない。
本発明の実施の形態によれば、フレームにおけるそれぞれのブロックについて、低域通過フィルタの遮断周波数は、たとえば画素間の分散、標準偏差又は勾配といった、それぞれのブロックのそれぞれの画素の間で空間領域の画像空間情報に関連する。

分散又は標準偏差は、画像の平坦領域及び移動領域の情報を主に反映し、勾配は、画像のエッジ情報を主に反映する。言い換えれば、画像の画素の分散は、画像の詳細、すなわち画像の色の階層の豊富な程度を反映する。

たとえば、図３に示される８×８画素ブロックについて、その標準偏差の計算式は、以下に示される。

ここでｆ（ｉ，ｊ）は（ｉ，ｊ）での画素値であり、Δ_hは水平方向における標準偏差を表し、Δ_vは垂直方向における標準偏差を表し、Δ_nはｎ番目のブロックの標準偏差を表す。

本発明の明確な説明を提供するため、以下の記載は画素の分散に基づいている。当業者であれば、これが本発明の制限とならないことを理解される。
図３に示される８×８画素ブロックについて、以下が示される。

ここでｆ（ｉ，ｊ）は（ｉ，ｊ）での画素値であり、
[外１]

はｎ番目のブロックにおける画素の平均値であり、ｖａｒ_nはｎ番目のブロックの分散である。

それぞれのブロックの低域通過フィルタの遮断周波数とそれぞれの画素ブロックの画素の分散との間の関係は、以下に示される。

ここで
[外２]

はフレームにおける全てのブロックの分散の平均値であり、ｖａｒ_nはｎ番目の画素ブロックの分散であり、Ｃ（ｖａｒ_n）はｎ番目のブロックの低域通過フィルタの遮断周波数である。λは拡張ファクタであり、その値は次の基準：０≦λ≦６３に一致する。

ここで、ｎ番目のＤＣＴ係数ブロックでは、保持されるべきＤＣＴ係数は、以下に示される。

ここでｍは、左から右へ、上から下に図３に示されるような８×８ＤＣＴ係数ブロックの６４ＤＣＴ係数をアレイにした後のｍ番目のＤＣＴ係数を表しており、ＡＣ_mはｍ番目のＤＣＴ係数の値を表す。

本発明の別の実施の形態によれば、フレームにおけるそれぞれのブロックについて、低域通過フィルタの遮断周波数は、それぞれのブロックのそれぞれの画素間の空間領域の分散のみならず、ネットワークの現在の帯域幅にも関連する。

それぞれのブロックの低域通過フィルタの遮断周波数とそれぞれの画素ブロックの画素の分散との間の関係、ネットワークの現在の帯域幅は、以下のように示される。

ここで、ｎ番目のＤＣＴ係数ブロックにおいて、保持されるべきＤＣＴ係数は、以下に示される。

ここで、Ｃ（ｖａｒ_n，Ｂ）はｎ番目のブロックの低域通過フィルタの遮断周波数であり、Ｂはネットワークの現在の帯域幅であり、Ｂ_Tはネットワークが提供することができる最も広い帯域幅であり、他のパラメータの意味は、先に記載されたパラメータと同じである。

ステップＳ４３の後、フローはステップＳ４４に進む。ステップＳ４４で、フィルタリングされたＤＣＴ係数に量子化が実行される。最後に、フローはステップＳ４５に進む。ステップＳ４５で、量子化されたＤＣＴ係数に可変長符号化が実行される。

したがって、先に記載されたステップにより、周波数領域におけるＤＣＴ係数のフィルタリングが実現され、次いで、簡略化されたトランスコーディングの動作を提供するという目的が達成される。

図５は、本発明の実施の形態に係るデジタルビデオデータをトランスコードするトランスコーダの例示的なブロック図である。
図５に示されるように、トランスコーダ５０は、デコーダ５１、画像コンテンツ分析ユニット５２、エンコーダ５３、帯域幅抽出ユニット５４及び離散コサイン変換器５５を有する。

デコーダ５１は、可変長デコーダ５１１、逆量子化器５１２及び逆離散コサイン変換５１３を有する。
画像コンテンツ分析ユニット５２は、画像の画素分散を抽出するために使用される、分散抽出ユニット５２１である。当業者であれば、画像コンテンツ分析ユニット５２が、画像の情報を抽出する、標準偏差抽出ユニット又は勾配抽出ユニット（図示せず）であることを理解される。
エンコーダ５３は、遮断周波数取得ユニット５３１、低域通過フィルタ５３２、量子化器５３３及び可変長エンコーダ５３４を有する。

可変長デコーダ５１１は、所定のビットレートを有する、受信されたＭＰＥＧ２ストリームをデコードし、量子化されたＤＣＴ係数を取得する。つぎに、逆量子化器５１２は、量子化されたＤＣＴ係数を逆量子化し、ＤＣＴ係数ブロックを取得する。次いで、逆量子化器５１２は、ＤＣＴ係数ブロックを逆離散コサイン変換器５１３、及びエンコーダ５３の遮断周波数取得ユニット５３１に送出する。逆離散コサイン変換器５１３は、ＤＣＴ係数ブロックを画素ブロックに変換し、変換された画素ブロックを画像コンテンツ分析ユニット５２に送出する。

本発明によれば、逆離散コサイン変換器５１３から出力されたビデオストリームの画素ブロックは、圧縮されていないビデオストリームと類似する。
上述された実施の形態では、到来するビデオ信号が圧縮されたビデオストリームである状況に基づいている。したがって、デコーディングは、圧縮されたビデオストリームをデコードして、デコードされたビデオストリームを取得するためにはじめに実行される。デコードされたビデオストリームは、更なる処理のために画像コンテンツ分析ユニット５２に供給される。本発明はこれに限定されないことが理解される。また、プロセスは、圧縮されていないオリジナルのビデオストリームを直接的に処理することに適用され、すなわちオリジナルビデオストリームの画素ブロックが画像コンテンツ分析ユニット５２に直接供給される。勿論、オリジナルのビデオストリームの画素ブロックは、８×８又は４×４である。画素ブロックのサイズは、例としてのみ示され、本発明の制限として考慮されるべきではない。

オリジナルビデオストリームの画素ブロックが画像コンテンツ分析ユニット５２に直接送出されるので、デコーダ５１を使用して圧縮されたビデオストリームをデコードする必要がない。画像コンテンツ分析ユニット５２は、画像の情報を取得するため、画像の画素分散を抽出する。ここで、図５に示されるユニットはエンコーダであり、オリジナルビデオストリームを処理するため、画像コンテンツ分析ユニット５２、エンコーダ５３、帯域幅抽出ユニット５４及び離散コサイン変換器５５を有する。

画像コンテンツ分析ユニット５２は、画素ブロックにおけるそれぞれの画素の空間情報を抽出する。たとえば、分散抽出ユニット５２１は、画素ブロックにおけるそれぞれの画素の分散を抽出し、次いで、抽出された結果を遮断周波数取得ユニット５３１に送出する。遮断周波数取得ユニット５３１は、たとえば、分散抽出ユニット５２１から送出された分散、帯域幅抽出ユニット５４により検出されたネットワークの現在の帯域幅といった、画像コンテンツ分析ユニット５２から送出された空間情報の抽出結果に基づいて、低域通過フィルタ５３２の遮断周波数を決定する。

遮断周波数取得ユニット５３１により決定された遮断周波数に基づいて、低域通過フィルタ５３２は、逆量子化器５１２から送出されるか、離散コサイン変換器５５を介した逆離散コサイン変換器５１３から送出される、ＤＣＴ係数ブロックの高周波成分をフィルタリングし、フィルタリングされたＤＣＴ係数ブロックを量子化器５３３に送出する。量子化器５３３は、低域通過フィルタ５３２から送出されたＤＣＴ係数ブロックを量子化し、可変長エンコーダ５３４に量子化の結果を送出する。可変長エンコーダ５３４は、量子化されたＤＣＴ係数ブロックをエンコードし、エンコードされたビットストリームをネットワークに送出する。

本実施の形態では、エンコーダ５３から出力されたビデオストリームのビットレートは、デコーダ５１に入力するＭＰＥＧ２ストリームのビットレートよりも低い。圧縮されたフォーマットから別の圧縮されたフォーマットへの変換が完了される。
当業者であれば、上述されたトランスコーダはまさに簡略化された例であることを理解されるであろう。このトランスコーダは、動き予測ユニット等のような、他のユニットを含む。

図６は、本発明の別の実施の形態に係る、単一レイヤのビデオ圧縮されたデータを２つのレイヤに分割するプロセスのフローチャートである。
はじめに、ステップＳ６１で、到来する単一レイヤのビデオに可変長デコードを実行する。
つぎに、ステップＳ６２で、デコードされたビットストリームに逆量子化を実行し、ＤＣＴ係数を取得する。
つぎに、ステップＳ６３で、データパーティショニングを実行する。すなわち、ＤＣＴ係数の決定された優先度のブレイクポイントに従って、どのＤＣＴ係数が比較的低いビットエラーレートによりベースレイヤチャネルで送信され、どのＤＣＴ係数が比較的高いビットエラーレートによりエンハンスメントチャネルで送信されるかを判定する。

一般に、ＤＣＴ領域で、量子化された係数にジグザグスキャニングが実行される。データパーティショニングは、ジグザグスキャニングに基づく。詳細の状態は、図７に示される。優先度のブレイクポイントのポジションは、低いビットエラーレートによりベースレイヤチャネルに送信されるＤＣＴ係数の数を決定する。優先度のブレイクポイントの右下に位置するＤＣＴ係数、すなわち高周波成分は、高いビットエラーレートによりあるチャネルで送信される。

本発明の実施の形態によれば、プライオリティブレイクポイントは、あるフレームにおけるそれぞれのブロックについて可変である。プライオリティブレイクポイントは、それぞれのブロックのそれぞれの画素間の空間領域の空間情報、すなわち分散、標準偏差又は勾配に関連する。

さらに、明確な説明のため、以下の説明が分散に基づいて示される。当業者であれば、これが本発明を制限するものではないことを理解するべきである。
あるフレームにおけるそれぞれのブロックについてプライオリティブレイクポイントとく空間領域におけるそれぞれの画素ブロックの画素の分散の間の関係は、以下に示される。

ここで、ｍは、図７に示される方式に従ってスキャンされる６４ＤＣＴ係数のｍ番目のＤＣＴ係数を表し、ＡＣ_mはｍ番目のＤＣＴ係数の値を表す。Ｃ（ｖａｒ_n）は、プライオリティブレイクポイントであり、その値は、上述されたＣ（ｖａｒ_n）と同じである。

本発明の別の実施の形態によれば、あるフレームにおけるそれぞれのブロックについて、プライオリティブレイクポイントは、それぞれのブロックのそれぞれの画素間の空間領域の分散のみならず、ネットワークの現在の帯域幅にも関連する。

ここで、ｍは、図７に示される方式に従ってスキャンされる６４ＤＣＴ係数のｍ番目のＤＣＴ係数を表し、ＡＣ_mは、ｍ番目のＤＣＴ係数の値を表す。Ｃ（ｖａｒ_n，Ｂ）はプライオリティブレイクポイントを表し、その値は上述されたＣ（ｖａｒ_n，Ｂ）と同じである。

したがって、ステップＳ６３を通して、単一のレイヤデータは２つのレイヤに区分される。次いで、フローはステップＳ６４に進む。ステップＳ６４は、ベースレイヤとエンハンスメントレイヤのそれぞれのＤＣＴ係数を量子化する。

つぎに、ステップＳ６５で、可変長符号化の方式で、ベースレイヤ及びエンハンスメントレイヤのそれぞれの量子化されたＤＣＴ係数をエンコードする。
上述されたステップにより、単一レイヤのビデオ圧縮データを２つのレイヤのビデオ圧縮データに分割することが達成される。

図８は、本発明の実施の形態に係る、単一レイヤのビデオ圧縮データを２つのレイヤのビデオ圧縮データに分割するためのデータ分割ユニットの例示的な図である。
図８に示されるように、データ分割ユニット８０は、デコーダ８１、画像コンテンツ分析ユニット８２、エンコーダ８３、帯域幅抽出ユニット８４及び離散コサイン変換器８５を有する。

デコーダ８１は、可変長デコーダ８１１、逆量子化器８１２及び逆離散コサイン変換器８１３を有する。
画像コンテンツ分析ユニット８２は、画像の画素分散を抽出するために使用される、分散抽出ユニット８２１である。当業者であれば、画像コンテンツ分析ユニット８２は、画像の情報を抽出するための、標準偏差抽出ユニット又は勾配抽出ユニット（図示せず）とすることができることを理解されたい。
エンコーダ８３は、ブレイクポイント取得ユニット８３１、分割ユニット８３２、第一のエンコーダ８３３及び第二のエンコーダ８３４を有する。

図８に示されるように、はじめに、デコーダ８１の可変長デコーダ８１１は、ＭＰＥＧ２ストリームのような、受信された単一レイヤのビデオ圧縮データをデコードし、量子化されたＤＣＴ係数を取得する。つぎに、逆量子化器８１２は、可変長デコーダ８１１によりデコードされる量子化されたＤＣＴ係数を逆量子化し、ＤＣＴ係数ブロックを取得する。逆量子化器８１２は、ＤＣＴ係数ブロックをエンコーダ８３のブレイクポイント取得ユニット８３１及び逆離散コサイン変換器８１３に送出する。逆離散コサイン変換器８１３は、ＤＣＴ係数ブロックを画素ブロックに変換し、変換された画素ブロックを画像コンテンツ分析ユニットに送出する。

画像コンテンツ分析ユニット８２は、画素ブロックにおけるそれぞれの画素の空間情報を抽出し、たとえば、分散抽出ユニット８２１は、画素ブロックにおけるそれぞれの画素の分散を抽出し、次いで、抽出された結果をブレイクポイント取得ユニット８３１に送出する。ブレイクポイント取得ユニット８３１は、たとえば、分散抽出ユニット８２１から送出された分散、及び帯域幅抽出ユニット８４により検出されたネットワークの現在の帯域幅といった、画像コンテンツ分析ユニット８２から送出された空間情報抽出結果に基づいて、分割ユニット８３２のブレイクポイントを決定する。

ブレイクポイント取得ユニット８３１により決定されたブレイクポイントに基づいて、分割ユニット８３２は、逆量子化器８１２から送出されるか、離散コサイン変換器８５を介して逆離散コサイン変換器８１３から送出される、ＤＣＴ係数ブロックを分割し、ベースレイヤで送信すべきＤＣＴ係数を第一のエンコーダ８３３の量子化器８３３１に送出し、エンハンスメントレイヤで送信すべきＤＣＴ係数を第二のエンコーダ８３４の量子化器８３４１に送出する。量子化器８３３１及び８３４１は、分割ユニット８３２から送出されたＤＣｔ係数をそれぞれ量子化し、可変長エンコーダ８３３２及び８３４２に量子化の結果をそれぞれ送出する。可変長エンコーダ８３３２及び８３４２は、量子化されたＤＣＴ係数ブロックをそれぞれエンコードし、エンコードされたビットストリームをネットワークに送出する。

本発明の実施の形態では、逆離散コサイン変換８１３から出力されたビデオストリームの画素ブロックは、圧縮されていないビデオストリームの画素ブロックに類似する。
上述された実施の形態では、圧縮されたビデオストリームは、伸張されたビデオストリームを取得するためにはじめにデコードされる。次いで、伸張されたビデオストリームの画素ブロックは、更なる処理のために画像コンテンツ分析ユニット８２に送出される。しかし、本発明はこれに限定されない。本発明の装置及び方法は、圧縮されていないオリジナルビデオストリームに適用される。たとえば、オリジナルビデオストリームの画素ブロックは、画像コンテンツ分析ユニット８２に直接に送出される。さらに、オリジナルビデオストリームの画素ブロックは、８×８又は４×４である。画素ブロックのサイズは、説明のためにのみ提供され、本発明を制限するものとして意図されない。

オリジナルビデオストリームの画素ブロックは画像コンテンツ分析ユニット８２に直接送出されるので、デコーダ８１は、圧縮されたビデオストリームをこれ以上デコードするために必要とされない。画像コンテンツ分析ユニット８２は、画像の情報を取得するため、画像の画素の分散を直接に抽出する。ここで、図８に示されるユニットは、エンコーダユニットであり、オリジナルビデオストリームを処理するため、画像コンテンツ分析ユニット８２、エンコーダ８３、帯域幅抽出ユニット８４及び離散コサイン変換器８５を含んでいる。

当業者であれば、上述されたデータ分割ユニットはまさに例示的な実現であり、動き予測器及び動き補償器のような他のユニットは、実用的なシステムの応用のために必要とされる場合があることを理解されるであろう。

本発明が好適な実施の形態を参照して説明されたが、上述された説明に従って、当業者にとって多くの置き換え、変更及び変形が明らかである。したがって、本発明は、特許請求の範囲のコンセプト及び範囲に含まれる全ての係る置き換え、変更及び変形を含む。

従来技術におけるトランスコーダを有するエンコード及びデコードシステムの例示的な図である。デジタルビデオストリームをトランスコードするための従来のトランスコーダを例示するブロック図である。８×８画素ブロックの例示的な図である。本発明の実施の形態に係るデジタルビデオストリームをトランスコードするプロセスのフローチャートである。本発明の実施の形態に係るデジタルビデオストリームをトランスコードするためのトランスコーダの例示的なブロック図である。本発明の別の実施の形態に係る２つのレイヤに単一レイヤのビデオ圧縮データを分割するプロセスのフローチャートである。ＤＣＴ係数をジグザグスキャンするための例示的なシナリオを示す図である。本発明の別の実施の形態に係る２つのレイヤに単一レイヤのビデオ圧縮データを分割するデータ分割ユニットの例示的な図である。

Claims

第一のビットレートを有するビデオストリームを処理する方法であって、
（ａ）前記ビデオストリームの空間情報を取得するステップと、
（ｂ）前記空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するために前記ビデオストリームの離散コサイン変換の係数を処理するステップと
を含み、
前記第二のビットレートは前記第一のビットレートよりも低い、方法。
前記第一のビットレートを有する前記ビデオストリームは、圧縮されたビデオストリームであり、前記ステップ（ａ）の前に、
（ｃ）再構成されたビデオストリームを取得するため、前記第一のビットレートを有する前記圧縮されたビデオストリームを伸張するステップを更に含む、
請求項１記載の方法。
前記ステップ（ｃ）は、
（ｄ）前記離散コサイン変換係数を取得するため、前記再構成されたビデオストリームに離散コサイン変換を実行するステップを更に含む、
請求項２記載の方法。
前記ステップ（ｃ）は、
（ｉ）前記第一のビットレートを有する前記圧縮されたビデオストリームに可変長復号化を実行するステップと、
（ｉｉ）対応する離散コサイン変換係数を取得するため、可変長復号化されたビデオストリームに逆量子化を実行するステップと、
（ｉｉｉ）前記再構成されたビデオストリームを取得するため、前記離散コサイン変換係数に逆離散コサイン変換を実行するステップと、
を含む請求項２記載の方法。
前記ステップ（ｂ）におけるビデオストリームの前記離散コサイン変換係数は、前記ステップ（ｉｉ）において対応する離散コサイン変換係数から得られる、
請求項４記載の方法。
前記ステップ（ａ）は、前記ビデオストリームのそれぞれのブロックに含まれるそれぞれの画素の分散を取得するステップを含み、前記分散は、前記空間情報の富裕度を反映する、
請求項１記載の方法。
前記ステップ（ｂ）は、
前記空間情報に従って遮断周波数を決定するステップと、
前記離散コサイン変換係数をフィルタリングして、前記遮断周波数に従って前記離散コサイン変換係数の特定の部分をフィルタリングするステップと、
前記第二のビットレートを有する前記圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の残りの部分を処理するステップと、
を含む請求項１記載の方法。
前記ステップ（ｂ）は、
（ｉ）前記空間情報に従ってブレイクポイントを決定するステップと、
（ｉｉ）前記ブレイクポイントに従って前記離散コサイン変換係数の特定の部分を取得するため、前記離散コサイン変換係数を区分するステップと、
（ｉｉｉ）前記第二のビットレートを有する前記圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の特定の部分を処理するステップと、
を含む請求項１記載の方法。
第三のビットレートを有する別の圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の残りの部分を処理するステップを更に含み、前記第三のビットレートは前記第一のビットレートよりも低い、
請求項８記載の方法。
（ｅ）前記第二のビットレートを有する前記圧縮されたビデオストリームを送信するために使用されるネットワークの利用可能な帯域幅を取得するステップを更に含み、
前記ステップ（ｂ）は、
前記空間情報及び前記ネットワークの利用可能な帯域幅に従って前記第二のビットレートを有する前記圧縮されたビデオストリームを取得するために前記離散コサイン変換係数を処理するステップを含む、
請求項１記載の方法。
第一のビットレートを有するビデオストリームを処理する装置であって、
前記ビデオストリームの空間情報を取得する画像コンテンツ分析手段と、
前記空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するため、前記ビデオストリームの離散コサイン変換係数を処理するエンコーダとを有し、
前記第二のビットレートは、前記第一のビットレートよりも低い、装置。
前記第一のビットレートを有する前記ビデオストリームは、圧縮されたビデオストリームであり、
再構成されたビデオストリームを取得するため、前記第一のビットストリームを有する前記圧縮されたビデオストリームを伸張するデコーダを更に含む、
請求項１１記載の装置。
前記エンコーダにより処理された離散コサイン変換係数を取得するため、前記再構成されたビデオストリームに離散コサイン変換を実行する離散コサイン変換器を更に含む、
請求項１２記載の装置。
前記デコーダは、
前記第一のビットレートを有する前記圧縮されたビデオストリームに可変長復号化を実行する可変長デコーダと、
対応する離散コサイン変換係数を取得するため、可変長復号化されたビデオストリームを逆量子化する逆量子化器と、
前記再構成されたビデオストリームを取得するため、前記離散コサイン変換係数に逆離散コサイン変換を実行する逆離散コサイン変換器と、
を含む、請求項１２記載の装置。
前記エンコーダにより処理された離散コサイン変換係数は、前記逆量子化器により得られた対応する離散コサイン変換係数である、
請求項１４記載の方法。
前記画像コンテンツ分析手段は、前記ビデオストリームのそれぞれのブロックに含まれるそれぞれの画素の分散を取得するための分散取得手段を有し、前記分散は、前記空間情報の富裕度を反映する、
請求項１１記載の装置。
前記エンコーダは、
前記空間情報に従って遮断周波数を決定する遮断周波数取得手段と、
前記遮断周波数に従って前記離散コサイン変換係数の特定の部分をフィルタリングするために、前記離散コサイン変換係数をフィルタリングする低域通過フィルタと、
を有する請求項１１記載の装置。
前記エンコーダは、
前記空間情報に従ってブレイクポイントを決定するブレイクポイント取得手段と、
前記ブレイクポイントに従って前記離散コサイン変換係数の特定の部分を取得するために前記離散コサイン変換係数を区分する区分手段と、
前記第二のビットレートを有する圧縮されたビデオストリームを取得するため、離散コサイン変換係数の特定の部分を処理する第一のエンコーダと、
を有する請求項１１記載の装置。
第三のビットレートを有する別の圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の残りの部分を処理する第二のエンコーダを更に有し、前記第三のビットレートは前記第一のビットレートよりも低い、
請求項１８記載の装置。
前記第二のビットレートを有する圧縮されたビデオストリームを送信するために使用されるネットワークの利用可能な帯域幅を取得するための帯域幅取得手段を更に有し、
前記エンコーダは、前記空間情報及び前記ネットワークの利用可能な帯域幅に従って前記第二のビットレートを有する圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数を処理するために使用される、
請求項１１記載の装置。