JP2008523679A - ビデオストリームを処理する方法及び装置 - Google Patents
ビデオストリームを処理する方法及び装置 Download PDFInfo
- Publication number
- JP2008523679A JP2008523679A JP2007545025A JP2007545025A JP2008523679A JP 2008523679 A JP2008523679 A JP 2008523679A JP 2007545025 A JP2007545025 A JP 2007545025A JP 2007545025 A JP2007545025 A JP 2007545025A JP 2008523679 A JP2008523679 A JP 2008523679A
- Authority
- JP
- Japan
- Prior art keywords
- video stream
- discrete cosine
- cosine transform
- bit rate
- transform coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/36—Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/164—Feedback from the receiver or from the transmission channel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/34—Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本発明は、第一のビットレートを有するビデオストリームを処理する方法を開示するものであり、ビデオストリームの空間情報を取得するステップ、空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するためにビデオストリームのDCT係数を処理するステップを含んでおり、第二のビットレートは第一のビットレートよりも低い。本発明によれば、ビデオデータの視覚的な品質の低下が防止される。
Description
本発明は、信号処理に関し、より詳細には、ビデオ離散コサイン変換(DCT)領域のデータを処理する方法及び装置に関する。
ビデオ電話会議、ビデオオンデマンド、及びディスタンスラーニングのような様々なマルチメディアサービスは、技術及び社会経済の発展の出現に合わせて現れている。一般に、これらのマルチメディアサービスは、それらの目的地に到達する前に、非同期転送モード(ATM)ネットワーク、インターネット、ワイヤレスネットワーク、公衆交換電話網(PSTN)のような異なるネットワークを通過するために必要とされる。したがって、以下のシナリオが現れる。ATMネットワークのような幾つかのネットワークは、マルチメディアのサービス要件を満たすための保証された帯域幅を有しており、PSTNネットワークのような他のネットワークは、かかる帯域幅の保証を提供しない。したがって、到来する信号のビットレートが流出するネットワークの利用可能な帯域幅に一致するために調整されるように、ビットレートを動的に調節するのを可能にする装置が必要とされる。
たとえば、プログラムプロバイダは、サテライトリンクにわたり圧縮されたフォーマットでデジタルビデオ信号を送信することが想定される。デジタルビデオ信号をその最終的な目的地に伝達するため、ケーブルネットワークが利用されて、デジタルビデオ信号を中継する。勿論、中継されたデジタルビデオ信号は、圧縮されたフォーマットである。たとえば、サテライトリンクのデジタルビデオ信号のビットレートはR1 Mbit/sであり、ケーブルネットワークが制限された帯域幅のキャパシティを有することが想定される。到来するデジタルビデオ信号は、到来するデジタルビデオ信号のビットレートがR2 Mbit/s又はこれ以下であるときにのみ中継される。
したがって、装置は、あるビットレートで圧縮された信号を、送信のために低いビットレートで圧縮された信号に変換可能である必要がある。圧縮されたフォーマットを別の圧縮されたフォーマットに変換する動作は、トランスコーディングと呼ばれる。この変換を実行する装置又はユニットは、トランスコーダと呼ばれる。
図1は、従来技術におけるトランスコーダを有するエンコード及びデコードシステムの例示的な図である。図1に示されるように、エンコーダ11は、R1 Mbit/sのビットレートで到来するビデオ信号をはじめに圧縮する。次いで、トランスコーダ12は、圧縮された信号を、低いビットレートR2 Mbit/sで別の圧縮された信号に変換する。次いで、デコーダ13は、圧縮された信号を伸張し、伸張されたビデオ信号を出力する。
一般に、トランスコーダは、カスケードのデコーダ及びエンコーダを含む。図1に示されるように、トランスコーダ12は、デコーダ14及びエンコーダ15を有する。デコーダ14は、エンコーダ11の圧縮された信号を伸張するために使用され、再構成されたビデオ信号を生成し、エンコーダ15は、新たな圧縮された信号を形成するために再構成されたビデオ信号を圧縮するために使用される。
トランスコーダを構成するカスケードのデコーダ及びエンコーダの従来の方法は、より複雑なトランスコーダ構造となり、エンコーダ及びデコーダの両者が使用されるので高い実現のコストとなる。
一般に、ビデオ信号の圧縮処理において、オリジナルビデオデータは、はじめにブロックに分割される。次いで、分割されたブロックに離散コサイン変換(DCT)が実行され、したがって空間領域から周波数領域にデータ表現が変化する。最後に、これらDCT係数に量子化及び符号化の動作が実行される。一般に、エンコードのために可変長符号化(VLE)が使用される。逆に、ビデオ信号の伸張処理は、DCT係数を生成するため、可変長復号化及び逆量子化の動作で始まる。次いで、逆離散コサイン変換(IDCT)が実行され、ビデオデータブロックが周波数領域から空間領域に変換され、したがってビデオ信号の再構成が完了される。
図2は、デジタルビデオ信号をトランスコードする従来のトランスコーダを例示するためのブロック図である。
図2に示されるように、はじめに、トランスコーダ20の可変長デコーダ21がMPEG2(Moving Picture Experts Group 2)ストリームのような到来するデジタルビデオストリームをデコードする。つぎに、逆量子化器22は、デコードされた信号を逆量子化し、DCT係数を取得する。つぎに、ロウパスフィルタ23は、CT係数の高周波成分をフィルタリングする。それぞれのフレームにおける全てのブロックに対して、ロウパスフィルタ23のカットオフ周波数が変化しない。つぎに、量子化器24は、ロウパスフィルタ23を通過したDCT係数を再び量子化する。最後に、可変長エンコーダ25は、再び量子化されたDCT係数をエンコードする。
図2に示されるように、はじめに、トランスコーダ20の可変長デコーダ21がMPEG2(Moving Picture Experts Group 2)ストリームのような到来するデジタルビデオストリームをデコードする。つぎに、逆量子化器22は、デコードされた信号を逆量子化し、DCT係数を取得する。つぎに、ロウパスフィルタ23は、CT係数の高周波成分をフィルタリングする。それぞれのフレームにおける全てのブロックに対して、ロウパスフィルタ23のカットオフ周波数が変化しない。つぎに、量子化器24は、ロウパスフィルタ23を通過したDCT係数を再び量子化する。最後に、可変長エンコーダ25は、再び量子化されたDCT係数をエンコードする。
かかるプロセスを実行することで、トランスコードの目的が実現される。可変長エンコーダ25から出力されたビデオ信号のビットレートは、可変長デコーダ21に到来するビデオ信号のビットレートよりも低く、したがってトランスコードされたビデオストリームは、送信のために別のネットワークに送信することができる。
さらに、図2に示されるトランスコーダにおいて、離散コサイン変換器及び逆離散コサイン変換器は、これ以上必要とされない。したがって、非常に簡略化された構成をもつトランスコーダで、コストが著しく低減される。
しかし、ロウパスフィルタ23のカットオフ周波数はフレームにおける全てのブロックで変化しないので、ビデオ信号の視覚的な品質が低下する。これは、人間の目の作用が異なるブロックについて異なるためである。たとえば、幾つかのブロックにおけるDCT係数の高周波成分は、視覚的な作用への重要な影響を有する。
したがって、ビデオ信号の品質を改善するためにビデオデータを処理する方法及び装置が必要とされている。
本発明の目的は、ビデオストリームを処理する方法を提供することにある。
本発明の別の目的は、ビデオストリームを処理する装置を提供することにある。
本発明の目的は、ビデオストリームを処理する方法を提供することにある。
本発明の別の目的は、ビデオストリームを処理する装置を提供することにある。
上述された目的を実現するため、本発明は、ビデオストリームを処理する方法を提供するものであり、ビデオストリームは、第一のビットレートを有しており、当該方法は、ビデオストリームの空間情報を得るステップ、空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するため、ビデオストリームのDCT係数を処理するステップを含み、第二のビットレートは、第一のビットレートよりも低い。
本発明は、ビデオストリームを処理する装置を提供するものであり、ビデオストリームは、第一のビットレートを有しており、当該装置は、ビデオストリームの空間情報を取得する画像コンテンツ分析手段、及び、空間情報に従い第二のビットレートを有する圧縮されたビデオストリームを取得するため、ビデオストリームのDCT係数を処理するエンコーダを有しており、第二のビットレートは、第一のビットレートよりも低い。
本発明によれば、ビデオデータの視覚的な品質の低下は、画像の空間情報に基づいて効果的に回避される。
本発明の他の目的及び効果は、添付図面及び請求項の内容と組み合わせて、以下の記載を通して明らかとなるであろう。添付図面は明細書に組み込まれ、明細書の一部を構成するものであり、本発明の実施の形態を例示するものであり、説明と共に、本発明の原理を説明する役割を果たす。
本発明の他の目的及び効果は、添付図面及び請求項の内容と組み合わせて、以下の記載を通して明らかとなるであろう。添付図面は明細書に組み込まれ、明細書の一部を構成するものであり、本発明の実施の形態を例示するものであり、説明と共に、本発明の原理を説明する役割を果たす。
本発明は、異なる好適な実施の形態について添付図面を参照して詳細に説明される。添付図面では、同じ参照符号は、同じ又は類似のコンポーネントを表す。
明確な説明を提供するため、以下の説明がビデオ信号に基づいている。当業者であれば、本発明がこれに限定されないことを明らかに理解されるであろう。また、本発明は、画像信号にも適用される。
明確な説明を提供するため、以下の説明がビデオ信号に基づいている。当業者であれば、本発明がこれに限定されないことを明らかに理解されるであろう。また、本発明は、画像信号にも適用される。
MPEG2はビデオ圧縮分野において最も広く使用されている規格であるので、以下の説明はMPEG2に基づいている。当業者は、本発明がこれに限定されず、全ての他の圧縮フォーマットに等しく適用されるころを理解すべきである。
MPEG2規格によれば、ビデオ信号の圧縮のメインの手順は、はじめに、ビデオ信号を複数の8×8画素ブロックに分割することを含む。次いで、空間領域から周波数領域に変えるため、DCT変換をそれぞれの画素ブロックにおける8×8画素に実行し、8×8のDCT係数を取得する。最後に、DCT係数を量子化及びエンコードする。伸張プロセスは、圧縮プロセスに対応する。
図3は、8×8画素ブロックの例示的な図である。図3に示されるように8×8の画素ブロックでは、異なる画素は、ビデオ信号の異なるルミナンス、クロミナンス及びサチュレーションを有する。異なるルミナンス、クロミナンス及びサチュレーションは、異なるビデオ信号を表す。以下に提供される好適な実施の形態の説明は、ビデオ信号のルミナンスに基づいている。すなわち、8×8画素ブロックは、ビデオ信号のルミナンスブロックを表している。当業者にとって、本発明がこれに限定されないことを理解されるであろう。この8×8画素ブロックは、ビデオ信号のクロミナンスブロック又はサチュレーションブロックとすることもできる。
図3は、8×8画素ブロックの図である。しかし、当業者は、本発明がこれに限定されないことを理解するであろう。本発明では、画素ブロックを分割する他の方法も使用することができる。たとえあ、ビデオ符号化規格H.264では、それぞれのビデオ信号は4×4画素ブロックに分割される。
図4は、本発明の実施の形態に係るデジタルビデオストリームをトランスコードするプロセスのフローチャートである。
はじめに、ステップS41で、到来するMPEG2ストリームへの可変長復号化を実行する。
つぎに、ステップS42で、デコードされたビットストリームに逆量子化を実行し、DCT係数を取得する。
つぎに、ステップS43で、DCT係数について、不要な高周波成分を除くためにフィルタリングを実行する。
はじめに、ステップS41で、到来するMPEG2ストリームへの可変長復号化を実行する。
つぎに、ステップS42で、デコードされたビットストリームに逆量子化を実行し、DCT係数を取得する。
つぎに、ステップS43で、DCT係数について、不要な高周波成分を除くためにフィルタリングを実行する。
本発明によれば、低域通過フィルタのカットオフ周波数は、フレームにおけるそれぞれのブロックについて不変ではない。
本発明の実施の形態によれば、フレームにおけるそれぞれのブロックについて、低域通過フィルタの遮断周波数は、たとえば画素間の分散、標準偏差又は勾配といった、それぞれのブロックのそれぞれの画素の間で空間領域の画像空間情報に関連する。
本発明の実施の形態によれば、フレームにおけるそれぞれのブロックについて、低域通過フィルタの遮断周波数は、たとえば画素間の分散、標準偏差又は勾配といった、それぞれのブロックのそれぞれの画素の間で空間領域の画像空間情報に関連する。
分散又は標準偏差は、画像の平坦領域及び移動領域の情報を主に反映し、勾配は、画像のエッジ情報を主に反映する。言い換えれば、画像の画素の分散は、画像の詳細、すなわち画像の色の階層の豊富な程度を反映する。
たとえば、図3に示される8×8画素ブロックについて、その標準偏差の計算式は、以下に示される。
本発明の明確な説明を提供するため、以下の記載は画素の分散に基づいている。当業者であれば、これが本発明の制限とならないことを理解される。
図3に示される8×8画素ブロックについて、以下が示される。
図3に示される8×8画素ブロックについて、以下が示される。
それぞれのブロックの低域通過フィルタの遮断周波数とそれぞれの画素ブロックの画素の分散との間の関係は、以下に示される。
[外2]
はフレームにおける全てのブロックの分散の平均値であり、varnはn番目の画素ブロックの分散であり、C(varn)はn番目のブロックの低域通過フィルタの遮断周波数である。λは拡張ファクタであり、その値は次の基準:0≦λ≦63に一致する。
ここで、n番目のDCT係数ブロックでは、保持されるべきDCT係数は、以下に示される。
本発明の別の実施の形態によれば、フレームにおけるそれぞれのブロックについて、低域通過フィルタの遮断周波数は、それぞれのブロックのそれぞれの画素間の空間領域の分散のみならず、ネットワークの現在の帯域幅にも関連する。
それぞれのブロックの低域通過フィルタの遮断周波数とそれぞれの画素ブロックの画素の分散との間の関係、ネットワークの現在の帯域幅は、以下のように示される。
ステップS43の後、フローはステップS44に進む。ステップS44で、フィルタリングされたDCT係数に量子化が実行される。最後に、フローはステップS45に進む。ステップS45で、量子化されたDCT係数に可変長符号化が実行される。
したがって、先に記載されたステップにより、周波数領域におけるDCT係数のフィルタリングが実現され、次いで、簡略化されたトランスコーディングの動作を提供するという目的が達成される。
図5は、本発明の実施の形態に係るデジタルビデオデータをトランスコードするトランスコーダの例示的なブロック図である。
図5に示されるように、トランスコーダ50は、デコーダ51、画像コンテンツ分析ユニット52、エンコーダ53、帯域幅抽出ユニット54及び離散コサイン変換器55を有する。
図5に示されるように、トランスコーダ50は、デコーダ51、画像コンテンツ分析ユニット52、エンコーダ53、帯域幅抽出ユニット54及び離散コサイン変換器55を有する。
デコーダ51は、可変長デコーダ511、逆量子化器512及び逆離散コサイン変換513を有する。
画像コンテンツ分析ユニット52は、画像の画素分散を抽出するために使用される、分散抽出ユニット521である。当業者であれば、画像コンテンツ分析ユニット52が、画像の情報を抽出する、標準偏差抽出ユニット又は勾配抽出ユニット(図示せず)であることを理解される。
エンコーダ53は、遮断周波数取得ユニット531、低域通過フィルタ532、量子化器533及び可変長エンコーダ534を有する。
画像コンテンツ分析ユニット52は、画像の画素分散を抽出するために使用される、分散抽出ユニット521である。当業者であれば、画像コンテンツ分析ユニット52が、画像の情報を抽出する、標準偏差抽出ユニット又は勾配抽出ユニット(図示せず)であることを理解される。
エンコーダ53は、遮断周波数取得ユニット531、低域通過フィルタ532、量子化器533及び可変長エンコーダ534を有する。
可変長デコーダ511は、所定のビットレートを有する、受信されたMPEG2ストリームをデコードし、量子化されたDCT係数を取得する。つぎに、逆量子化器512は、量子化されたDCT係数を逆量子化し、DCT係数ブロックを取得する。次いで、逆量子化器512は、DCT係数ブロックを逆離散コサイン変換器513、及びエンコーダ53の遮断周波数取得ユニット531に送出する。逆離散コサイン変換器513は、DCT係数ブロックを画素ブロックに変換し、変換された画素ブロックを画像コンテンツ分析ユニット52に送出する。
本発明によれば、逆離散コサイン変換器513から出力されたビデオストリームの画素ブロックは、圧縮されていないビデオストリームと類似する。
上述された実施の形態では、到来するビデオ信号が圧縮されたビデオストリームである状況に基づいている。したがって、デコーディングは、圧縮されたビデオストリームをデコードして、デコードされたビデオストリームを取得するためにはじめに実行される。デコードされたビデオストリームは、更なる処理のために画像コンテンツ分析ユニット52に供給される。本発明はこれに限定されないことが理解される。また、プロセスは、圧縮されていないオリジナルのビデオストリームを直接的に処理することに適用され、すなわちオリジナルビデオストリームの画素ブロックが画像コンテンツ分析ユニット52に直接供給される。勿論、オリジナルのビデオストリームの画素ブロックは、8×8又は4×4である。画素ブロックのサイズは、例としてのみ示され、本発明の制限として考慮されるべきではない。
上述された実施の形態では、到来するビデオ信号が圧縮されたビデオストリームである状況に基づいている。したがって、デコーディングは、圧縮されたビデオストリームをデコードして、デコードされたビデオストリームを取得するためにはじめに実行される。デコードされたビデオストリームは、更なる処理のために画像コンテンツ分析ユニット52に供給される。本発明はこれに限定されないことが理解される。また、プロセスは、圧縮されていないオリジナルのビデオストリームを直接的に処理することに適用され、すなわちオリジナルビデオストリームの画素ブロックが画像コンテンツ分析ユニット52に直接供給される。勿論、オリジナルのビデオストリームの画素ブロックは、8×8又は4×4である。画素ブロックのサイズは、例としてのみ示され、本発明の制限として考慮されるべきではない。
オリジナルビデオストリームの画素ブロックが画像コンテンツ分析ユニット52に直接送出されるので、デコーダ51を使用して圧縮されたビデオストリームをデコードする必要がない。画像コンテンツ分析ユニット52は、画像の情報を取得するため、画像の画素分散を抽出する。ここで、図5に示されるユニットはエンコーダであり、オリジナルビデオストリームを処理するため、画像コンテンツ分析ユニット52、エンコーダ53、帯域幅抽出ユニット54及び離散コサイン変換器55を有する。
画像コンテンツ分析ユニット52は、画素ブロックにおけるそれぞれの画素の空間情報を抽出する。たとえば、分散抽出ユニット521は、画素ブロックにおけるそれぞれの画素の分散を抽出し、次いで、抽出された結果を遮断周波数取得ユニット531に送出する。遮断周波数取得ユニット531は、たとえば、分散抽出ユニット521から送出された分散、帯域幅抽出ユニット54により検出されたネットワークの現在の帯域幅といった、画像コンテンツ分析ユニット52から送出された空間情報の抽出結果に基づいて、低域通過フィルタ532の遮断周波数を決定する。
遮断周波数取得ユニット531により決定された遮断周波数に基づいて、低域通過フィルタ532は、逆量子化器512から送出されるか、離散コサイン変換器55を介した逆離散コサイン変換器513から送出される、DCT係数ブロックの高周波成分をフィルタリングし、フィルタリングされたDCT係数ブロックを量子化器533に送出する。量子化器533は、低域通過フィルタ532から送出されたDCT係数ブロックを量子化し、可変長エンコーダ534に量子化の結果を送出する。可変長エンコーダ534は、量子化されたDCT係数ブロックをエンコードし、エンコードされたビットストリームをネットワークに送出する。
本実施の形態では、エンコーダ53から出力されたビデオストリームのビットレートは、デコーダ51に入力するMPEG2ストリームのビットレートよりも低い。圧縮されたフォーマットから別の圧縮されたフォーマットへの変換が完了される。
当業者であれば、上述されたトランスコーダはまさに簡略化された例であることを理解されるであろう。このトランスコーダは、動き予測ユニット等のような、他のユニットを含む。
当業者であれば、上述されたトランスコーダはまさに簡略化された例であることを理解されるであろう。このトランスコーダは、動き予測ユニット等のような、他のユニットを含む。
図6は、本発明の別の実施の形態に係る、単一レイヤのビデオ圧縮されたデータを2つのレイヤに分割するプロセスのフローチャートである。
はじめに、ステップS61で、到来する単一レイヤのビデオに可変長デコードを実行する。
つぎに、ステップS62で、デコードされたビットストリームに逆量子化を実行し、DCT係数を取得する。
つぎに、ステップS63で、データパーティショニングを実行する。すなわち、DCT係数の決定された優先度のブレイクポイントに従って、どのDCT係数が比較的低いビットエラーレートによりベースレイヤチャネルで送信され、どのDCT係数が比較的高いビットエラーレートによりエンハンスメントチャネルで送信されるかを判定する。
はじめに、ステップS61で、到来する単一レイヤのビデオに可変長デコードを実行する。
つぎに、ステップS62で、デコードされたビットストリームに逆量子化を実行し、DCT係数を取得する。
つぎに、ステップS63で、データパーティショニングを実行する。すなわち、DCT係数の決定された優先度のブレイクポイントに従って、どのDCT係数が比較的低いビットエラーレートによりベースレイヤチャネルで送信され、どのDCT係数が比較的高いビットエラーレートによりエンハンスメントチャネルで送信されるかを判定する。
一般に、DCT領域で、量子化された係数にジグザグスキャニングが実行される。データパーティショニングは、ジグザグスキャニングに基づく。詳細の状態は、図7に示される。優先度のブレイクポイントのポジションは、低いビットエラーレートによりベースレイヤチャネルに送信されるDCT係数の数を決定する。優先度のブレイクポイントの右下に位置するDCT係数、すなわち高周波成分は、高いビットエラーレートによりあるチャネルで送信される。
本発明の実施の形態によれば、プライオリティブレイクポイントは、あるフレームにおけるそれぞれのブロックについて可変である。プライオリティブレイクポイントは、それぞれのブロックのそれぞれの画素間の空間領域の空間情報、すなわち分散、標準偏差又は勾配に関連する。
さらに、明確な説明のため、以下の説明が分散に基づいて示される。当業者であれば、これが本発明を制限するものではないことを理解するべきである。
あるフレームにおけるそれぞれのブロックについてプライオリティブレイクポイントとく空間領域におけるそれぞれの画素ブロックの画素の分散の間の関係は、以下に示される。
あるフレームにおけるそれぞれのブロックについてプライオリティブレイクポイントとく空間領域におけるそれぞれの画素ブロックの画素の分散の間の関係は、以下に示される。
本発明の別の実施の形態によれば、あるフレームにおけるそれぞれのブロックについて、プライオリティブレイクポイントは、それぞれのブロックのそれぞれの画素間の空間領域の分散のみならず、ネットワークの現在の帯域幅にも関連する。
したがって、ステップS63を通して、単一のレイヤデータは2つのレイヤに区分される。次いで、フローはステップS64に進む。ステップS64は、ベースレイヤとエンハンスメントレイヤのそれぞれのDCT係数を量子化する。
つぎに、ステップS65で、可変長符号化の方式で、ベースレイヤ及びエンハンスメントレイヤのそれぞれの量子化されたDCT係数をエンコードする。
上述されたステップにより、単一レイヤのビデオ圧縮データを2つのレイヤのビデオ圧縮データに分割することが達成される。
上述されたステップにより、単一レイヤのビデオ圧縮データを2つのレイヤのビデオ圧縮データに分割することが達成される。
図8は、本発明の実施の形態に係る、単一レイヤのビデオ圧縮データを2つのレイヤのビデオ圧縮データに分割するためのデータ分割ユニットの例示的な図である。
図8に示されるように、データ分割ユニット80は、デコーダ81、画像コンテンツ分析ユニット82、エンコーダ83、帯域幅抽出ユニット84及び離散コサイン変換器85を有する。
図8に示されるように、データ分割ユニット80は、デコーダ81、画像コンテンツ分析ユニット82、エンコーダ83、帯域幅抽出ユニット84及び離散コサイン変換器85を有する。
デコーダ81は、可変長デコーダ811、逆量子化器812及び逆離散コサイン変換器813を有する。
画像コンテンツ分析ユニット82は、画像の画素分散を抽出するために使用される、分散抽出ユニット821である。当業者であれば、画像コンテンツ分析ユニット82は、画像の情報を抽出するための、標準偏差抽出ユニット又は勾配抽出ユニット(図示せず)とすることができることを理解されたい。
エンコーダ83は、ブレイクポイント取得ユニット831、分割ユニット832、第一のエンコーダ833及び第二のエンコーダ834を有する。
画像コンテンツ分析ユニット82は、画像の画素分散を抽出するために使用される、分散抽出ユニット821である。当業者であれば、画像コンテンツ分析ユニット82は、画像の情報を抽出するための、標準偏差抽出ユニット又は勾配抽出ユニット(図示せず)とすることができることを理解されたい。
エンコーダ83は、ブレイクポイント取得ユニット831、分割ユニット832、第一のエンコーダ833及び第二のエンコーダ834を有する。
図8に示されるように、はじめに、デコーダ81の可変長デコーダ811は、MPEG2ストリームのような、受信された単一レイヤのビデオ圧縮データをデコードし、量子化されたDCT係数を取得する。つぎに、逆量子化器812は、可変長デコーダ811によりデコードされる量子化されたDCT係数を逆量子化し、DCT係数ブロックを取得する。逆量子化器812は、DCT係数ブロックをエンコーダ83のブレイクポイント取得ユニット831及び逆離散コサイン変換器813に送出する。逆離散コサイン変換器813は、DCT係数ブロックを画素ブロックに変換し、変換された画素ブロックを画像コンテンツ分析ユニットに送出する。
画像コンテンツ分析ユニット82は、画素ブロックにおけるそれぞれの画素の空間情報を抽出し、たとえば、分散抽出ユニット821は、画素ブロックにおけるそれぞれの画素の分散を抽出し、次いで、抽出された結果をブレイクポイント取得ユニット831に送出する。ブレイクポイント取得ユニット831は、たとえば、分散抽出ユニット821から送出された分散、及び帯域幅抽出ユニット84により検出されたネットワークの現在の帯域幅といった、画像コンテンツ分析ユニット82から送出された空間情報抽出結果に基づいて、分割ユニット832のブレイクポイントを決定する。
ブレイクポイント取得ユニット831により決定されたブレイクポイントに基づいて、分割ユニット832は、逆量子化器812から送出されるか、離散コサイン変換器85を介して逆離散コサイン変換器813から送出される、DCT係数ブロックを分割し、ベースレイヤで送信すべきDCT係数を第一のエンコーダ833の量子化器8331に送出し、エンハンスメントレイヤで送信すべきDCT係数を第二のエンコーダ834の量子化器8341に送出する。量子化器8331及び8341は、分割ユニット832から送出されたDCt係数をそれぞれ量子化し、可変長エンコーダ8332及び8342に量子化の結果をそれぞれ送出する。可変長エンコーダ8332及び8342は、量子化されたDCT係数ブロックをそれぞれエンコードし、エンコードされたビットストリームをネットワークに送出する。
本発明の実施の形態では、逆離散コサイン変換813から出力されたビデオストリームの画素ブロックは、圧縮されていないビデオストリームの画素ブロックに類似する。
上述された実施の形態では、圧縮されたビデオストリームは、伸張されたビデオストリームを取得するためにはじめにデコードされる。次いで、伸張されたビデオストリームの画素ブロックは、更なる処理のために画像コンテンツ分析ユニット82に送出される。しかし、本発明はこれに限定されない。本発明の装置及び方法は、圧縮されていないオリジナルビデオストリームに適用される。たとえば、オリジナルビデオストリームの画素ブロックは、画像コンテンツ分析ユニット82に直接に送出される。さらに、オリジナルビデオストリームの画素ブロックは、8×8又は4×4である。画素ブロックのサイズは、説明のためにのみ提供され、本発明を制限するものとして意図されない。
上述された実施の形態では、圧縮されたビデオストリームは、伸張されたビデオストリームを取得するためにはじめにデコードされる。次いで、伸張されたビデオストリームの画素ブロックは、更なる処理のために画像コンテンツ分析ユニット82に送出される。しかし、本発明はこれに限定されない。本発明の装置及び方法は、圧縮されていないオリジナルビデオストリームに適用される。たとえば、オリジナルビデオストリームの画素ブロックは、画像コンテンツ分析ユニット82に直接に送出される。さらに、オリジナルビデオストリームの画素ブロックは、8×8又は4×4である。画素ブロックのサイズは、説明のためにのみ提供され、本発明を制限するものとして意図されない。
オリジナルビデオストリームの画素ブロックは画像コンテンツ分析ユニット82に直接送出されるので、デコーダ81は、圧縮されたビデオストリームをこれ以上デコードするために必要とされない。画像コンテンツ分析ユニット82は、画像の情報を取得するため、画像の画素の分散を直接に抽出する。ここで、図8に示されるユニットは、エンコーダユニットであり、オリジナルビデオストリームを処理するため、画像コンテンツ分析ユニット82、エンコーダ83、帯域幅抽出ユニット84及び離散コサイン変換器85を含んでいる。
当業者であれば、上述されたデータ分割ユニットはまさに例示的な実現であり、動き予測器及び動き補償器のような他のユニットは、実用的なシステムの応用のために必要とされる場合があることを理解されるであろう。
本発明が好適な実施の形態を参照して説明されたが、上述された説明に従って、当業者にとって多くの置き換え、変更及び変形が明らかである。したがって、本発明は、特許請求の範囲のコンセプト及び範囲に含まれる全ての係る置き換え、変更及び変形を含む。
Claims (20)
- 第一のビットレートを有するビデオストリームを処理する方法であって、
(a)前記ビデオストリームの空間情報を取得するステップと、
(b)前記空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するために前記ビデオストリームの離散コサイン変換の係数を処理するステップと
を含み、
前記第二のビットレートは前記第一のビットレートよりも低い、方法。 - 前記第一のビットレートを有する前記ビデオストリームは、圧縮されたビデオストリームであり、前記ステップ(a)の前に、
(c)再構成されたビデオストリームを取得するため、前記第一のビットレートを有する前記圧縮されたビデオストリームを伸張するステップを更に含む、
請求項1記載の方法。 - 前記ステップ(c)は、
(d)前記離散コサイン変換係数を取得するため、前記再構成されたビデオストリームに離散コサイン変換を実行するステップを更に含む、
請求項2記載の方法。 - 前記ステップ(c)は、
(i)前記第一のビットレートを有する前記圧縮されたビデオストリームに可変長復号化を実行するステップと、
(ii)対応する離散コサイン変換係数を取得するため、可変長復号化されたビデオストリームに逆量子化を実行するステップと、
(iii)前記再構成されたビデオストリームを取得するため、前記離散コサイン変換係数に逆離散コサイン変換を実行するステップと、
を含む請求項2記載の方法。 - 前記ステップ(b)におけるビデオストリームの前記離散コサイン変換係数は、前記ステップ(ii)において対応する離散コサイン変換係数から得られる、
請求項4記載の方法。 - 前記ステップ(a)は、前記ビデオストリームのそれぞれのブロックに含まれるそれぞれの画素の分散を取得するステップを含み、前記分散は、前記空間情報の富裕度を反映する、
請求項1記載の方法。 - 前記ステップ(b)は、
前記空間情報に従って遮断周波数を決定するステップと、
前記離散コサイン変換係数をフィルタリングして、前記遮断周波数に従って前記離散コサイン変換係数の特定の部分をフィルタリングするステップと、
前記第二のビットレートを有する前記圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の残りの部分を処理するステップと、
を含む請求項1記載の方法。 - 前記ステップ(b)は、
(i)前記空間情報に従ってブレイクポイントを決定するステップと、
(ii)前記ブレイクポイントに従って前記離散コサイン変換係数の特定の部分を取得するため、前記離散コサイン変換係数を区分するステップと、
(iii)前記第二のビットレートを有する前記圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の特定の部分を処理するステップと、
を含む請求項1記載の方法。 - 第三のビットレートを有する別の圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の残りの部分を処理するステップを更に含み、前記第三のビットレートは前記第一のビットレートよりも低い、
請求項8記載の方法。 - (e)前記第二のビットレートを有する前記圧縮されたビデオストリームを送信するために使用されるネットワークの利用可能な帯域幅を取得するステップを更に含み、
前記ステップ(b)は、
前記空間情報及び前記ネットワークの利用可能な帯域幅に従って前記第二のビットレートを有する前記圧縮されたビデオストリームを取得するために前記離散コサイン変換係数を処理するステップを含む、
請求項1記載の方法。 - 第一のビットレートを有するビデオストリームを処理する装置であって、
前記ビデオストリームの空間情報を取得する画像コンテンツ分析手段と、
前記空間情報に従って第二のビットレートを有する圧縮されたビデオストリームを取得するため、前記ビデオストリームの離散コサイン変換係数を処理するエンコーダとを有し、
前記第二のビットレートは、前記第一のビットレートよりも低い、装置。 - 前記第一のビットレートを有する前記ビデオストリームは、圧縮されたビデオストリームであり、
再構成されたビデオストリームを取得するため、前記第一のビットストリームを有する前記圧縮されたビデオストリームを伸張するデコーダを更に含む、
請求項11記載の装置。 - 前記エンコーダにより処理された離散コサイン変換係数を取得するため、前記再構成されたビデオストリームに離散コサイン変換を実行する離散コサイン変換器を更に含む、
請求項12記載の装置。 - 前記デコーダは、
前記第一のビットレートを有する前記圧縮されたビデオストリームに可変長復号化を実行する可変長デコーダと、
対応する離散コサイン変換係数を取得するため、可変長復号化されたビデオストリームを逆量子化する逆量子化器と、
前記再構成されたビデオストリームを取得するため、前記離散コサイン変換係数に逆離散コサイン変換を実行する逆離散コサイン変換器と、
を含む、請求項12記載の装置。 - 前記エンコーダにより処理された離散コサイン変換係数は、前記逆量子化器により得られた対応する離散コサイン変換係数である、
請求項14記載の方法。 - 前記画像コンテンツ分析手段は、前記ビデオストリームのそれぞれのブロックに含まれるそれぞれの画素の分散を取得するための分散取得手段を有し、前記分散は、前記空間情報の富裕度を反映する、
請求項11記載の装置。 - 前記エンコーダは、
前記空間情報に従って遮断周波数を決定する遮断周波数取得手段と、
前記遮断周波数に従って前記離散コサイン変換係数の特定の部分をフィルタリングするために、前記離散コサイン変換係数をフィルタリングする低域通過フィルタと、
を有する請求項11記載の装置。 - 前記エンコーダは、
前記空間情報に従ってブレイクポイントを決定するブレイクポイント取得手段と、
前記ブレイクポイントに従って前記離散コサイン変換係数の特定の部分を取得するために前記離散コサイン変換係数を区分する区分手段と、
前記第二のビットレートを有する圧縮されたビデオストリームを取得するため、離散コサイン変換係数の特定の部分を処理する第一のエンコーダと、
を有する請求項11記載の装置。 - 第三のビットレートを有する別の圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数の残りの部分を処理する第二のエンコーダを更に有し、前記第三のビットレートは前記第一のビットレートよりも低い、
請求項18記載の装置。 - 前記第二のビットレートを有する圧縮されたビデオストリームを送信するために使用されるネットワークの利用可能な帯域幅を取得するための帯域幅取得手段を更に有し、
前記エンコーダは、前記空間情報及び前記ネットワークの利用可能な帯域幅に従って前記第二のビットレートを有する圧縮されたビデオストリームを取得するため、前記離散コサイン変換係数を処理するために使用される、
請求項11記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200410097118 | 2004-12-07 | ||
PCT/IB2005/053959 WO2006061734A2 (en) | 2004-12-07 | 2005-11-30 | A method and apparatus for processing video streams |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008523679A true JP2008523679A (ja) | 2008-07-03 |
Family
ID=36578286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007545025A Pending JP2008523679A (ja) | 2004-12-07 | 2005-11-30 | ビデオストリームを処理する方法及び装置 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2008523679A (ja) |
KR (1) | KR20070090185A (ja) |
WO (1) | WO2006061734A2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10015506B2 (en) * | 2013-05-20 | 2018-07-03 | Cinova Media | Frequency reduction and restoration system and method in video and image compression |
US10462477B2 (en) | 2015-02-25 | 2019-10-29 | Cinova Media | Partial evaluator system and method |
US10460700B1 (en) | 2015-10-12 | 2019-10-29 | Cinova Media | Method and apparatus for improving quality of experience and bandwidth in virtual reality streaming systems |
US10944971B1 (en) | 2017-05-22 | 2021-03-09 | Cinova Media | Method and apparatus for frame accurate field of view switching for virtual reality |
CN112887512A (zh) * | 2021-01-26 | 2021-06-01 | 长威信息科技发展股份有限公司 | 一种视频流高分可视化系统 |
-
2005
- 2005-11-30 KR KR1020077012830A patent/KR20070090185A/ko not_active Application Discontinuation
- 2005-11-30 JP JP2007545025A patent/JP2008523679A/ja active Pending
- 2005-11-30 WO PCT/IB2005/053959 patent/WO2006061734A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2006061734A3 (en) | 2006-11-23 |
KR20070090185A (ko) | 2007-09-05 |
WO2006061734A2 (en) | 2006-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2350040C1 (ru) | Способ и устройство для указания параметров квантователя в системе видеокодирования | |
EP2535870B1 (en) | Video-information decoding apparatus and method | |
KR0129558B1 (ko) | 적응적 가변길이 부호화 방법 및 장치 | |
JP2016026426A (ja) | 適応可変長符号化 | |
US20040252900A1 (en) | Spatial scalable compression | |
JP4226172B2 (ja) | 適応的変換方法を用いる映像圧縮符号化装置および復号化装置ならびにその方法 | |
KR20020014770A (ko) | 코드화된 신호를 분리 및 합병하는 방법과 그 장치 및컴퓨터 프로그램 제품 | |
JP2004531924A (ja) | 信号圧縮装置及び方法 | |
EP2201770A1 (en) | Method, medium, and apparatus for encoding and/or decoding video | |
US20080212682A1 (en) | Reduced resolution video transcoding with greatly reduced complexity | |
US6785330B1 (en) | Flexible video encoding/decoding method | |
US7502415B2 (en) | Range reduction | |
EP0671102A4 (en) | PICTURE IN PICTURE TELEVISION WITH INSERTING A AVERAGE PICTURE IN A FULL-FORMAT PICTURE. | |
US8243798B2 (en) | Methods and apparatus for scalable video bitstreams | |
JPH06225285A (ja) | ディジタル信号を符号化する少なくとも1つの符号器とディジタル信号を復号する少なくとも1つの復号器とを備えるシステムおよび、本発明によるシステムに使用される符号器と復号器 | |
JPH07312756A (ja) | 圧縮動画像符号信号の情報量変換回路、装置、及び方法 | |
JP2008523679A (ja) | ビデオストリームを処理する方法及び装置 | |
WO2008007929A1 (en) | Method and apparatus for encoding and decoding video signal of fgs layer by reordering transform coefficients | |
US20090034634A1 (en) | Differential coding with lossy embedded compression | |
JPH07107464A (ja) | 画像符号化装置および復号化装置 | |
KR100192778B1 (ko) | Ptsvq를 이용한 호환 부호기 및 복호기 | |
KR20040046890A (ko) | 동영상 코덱의 공간 스케일러빌리티 구현방법 | |
KR0171749B1 (ko) | 호환 부호기 | |
KR100530566B1 (ko) | 적응적 변환방법을 이용하는 영상압축 부호화 및 복호화 장치및 그 방법 | |
KR20030006641A (ko) | 트랜스코더 및 그의 트랜스 코딩 방법 |